报告题目:视觉迁移学习与应用
主讲人简介:李文,电子科技大学教授,博士生导师。2015年获新加坡南洋理工大学博士,其后在瑞士苏黎世联邦理工学院计算机视觉实验室从事研究工作,2019年入选国家海外高层次人才计划。主要研究方向为计算机视觉与迁移学习,专注于开放场景下的视觉模型泛化性难题,提出多个有影响力的跨领域的目标检测、语义分割等计算机视觉算法模型,在T-PAMI、IJCV、CVPR、ICCV、ECCV等在内的领域重要国际期刊和国际会议论文70余篇,Google Scholar的总引用次数9500余次。担任领域内重要学术期刊和国际会议审稿人或程序委员会委员、CVPR 2024、ACM MM 2024、AAAI 2023、AAAI 2021、WACV 2024、WACV 2023领域主席、ACM Computing Surveys编委(Associate Editor)等。带领团队荣获国内外多项人工智能竞赛奖项,并承担国家自然基金、四川省重点研发计划等项目。
报告摘要:近年来,以深度学习为代表的数据驱动的机器学习方法在计算机视觉任务中取得令人瞩目的成功,但同时也存在数据依赖的现象。在实际开放场景下的视觉应用中,常面临数据覆盖不足、场景动态变化等挑战,深度学习模型表现不佳、泛化性不足。在本报告中,我将结合计算机视觉的任务来讨论泛化性问题以及解决泛化性问题的主要思路,分享当前迁移学习在解决计算机视觉任务泛化性问题的一些案例。