多模态大模型前沿论坛
多模态大模型前沿论坛聚焦多模态人工智能的前沿课题,探讨如何通过多模态大模型与基础模型,从文本、图像、视频等多模态数据中高效理解、生成与优化内容,以支持多模态感知、智能交互和复杂认知任务。凭借强大的感知、推理与生成能力,以及通用性和领域适配性,多模态大模型已在教育、医疗、媒体、金融等领域展现广泛应用潜力,成为推动产业创新和技术发展的核心动力。论坛汇聚学术界顶尖专家,分享最新研究成果、应用实践与发展趋势,涵盖跨模态生成、表征学习、鲁棒性与安全性、复杂场景推理等方向,深入解析技术挑战与创新机遇。论坛旨在促进多模态人工智能理论与实践的交流与融合,为未来智能系统的高效应用提供前沿指导和策略参考。
凌海滨
西湖大学教授
简介:凌海滨教授于1997年和2000年分别获北京大学学士和硕士学位,2006年获美国马里兰大学帕克分校博士学位。其职业经历包括:微软亚洲研究院助理研究员(2000–2001)、加州大学洛杉矶分校博士后研究员(2006–2007)、西门子研究院科学家(2007–2008)。2008年起任教于天普大学,先后担任助理教授(2008–2014)和副教授(2014–2019)。2019至2025年任纽约州立大学石溪分校Empire Innovation教授,2025年加入西湖大学任人工智能讲席教授。研究领域涵盖计算机视觉、增强现实、医学图像分析、机器学习及AI for Science。曾获ACM UIST最佳学生论文奖(2003)、美国自然科学基金CAREER奖(2014)、雅虎教授研究发展奖(2019)、亚马逊机器学习研究奖(2019)及IEEE VR最佳期刊论文奖(2021)。现任/曾任《IEEE模式分析与机器智能汇刊》(PAMI)、《IEEE可视化与计算机图形学汇刊》(TVCG)、《计算机视觉与图像理解》(CVIU)及《模式识别》(PR)等期刊编委,并长期担任CVPR、ICCV、ECCV等会议领域主席。现为IEEE会士。
报告题目:Visual Intelligence for Enhancing Optical Coherence Tomography Imagery
报告摘要:The rapid advancement of imaging techniques and artificial intelligence has revolutionized research and applications in visual intelligence (VI). In this talk, I will present our recent studies on improving Optical Coherence Tomography (OCT) imagery, a pivotal technology with extensive applications in both preclinical and clinical diagnoses. While recent advancements in machine learning have shown promising progress in OCT, current solutions still face significant challenges, such as (1) the absence of accurate ground truth data typically required for supervised training and (2) the difficulty of integrating nuanced yet informative raw signals. In this talk, I will introduce our recent studies aimed at addressing these challenges to improve OCT imagery. First, I will present a self-supervised approach for removing 2D bulk motion artifacts in Optical Coherence Tomography Angiography (OCTA), followed by a self-supervised 3D OCTA image denoising framework. Additionally, I will discuss our work on self-supervised 3D skeleton completion for data extracted from Optical Coherence Doppler Tomography (ODT), as well as our latest exploration of sparse ODT reconstruction using alternative state-space model and attention mechanism.
叶茫
武汉大学教授
简介:叶茫,武汉大学计算机学院教授、智能科学系主任、国家高层次青年人才,科睿唯安高被引科学家。长期从事多模态计算、联邦学习、医学人工智能等领域研究,以第一/通讯作者发表 CCF-A 类论文100余篇,谷歌学术引用 14000余次。担任CCF-A类IEEE TIP、IEEE TIFS等期刊编委,CVPR、ICLR、NeurIPS、ICML、AAAI等会议领域主席等学术职务。主持国自科-香港联合基金、科技部重点研发计划课题等10余项科研项目。连续入选斯坦福排行榜“全球前2%顶尖科学家”,百度AI华人青年学者等荣誉。
报告题目:多模态大模型高效微调与安全
报告摘要:多模态大模型因其强大的跨模态理解和生成能力,成为人工智能领域的核心研究方向。然而,多模态大模型在面向垂直领域的实际应用时面临两大挑战:如何在微调过程中平衡通用知识的保留与专业知识的注入,以及如何应对其在数据安全、模型安全等方面的潜在风险。本报告将分享我们团队在面向多模态大模型微调场景下的通用能力保持以及模型安全性方面的相关进展。
韩锴
香港大学助理教授
简介:韩锴,香港大学计算与数据科学学院助理教授,IEEE 高级会员,领导香港大学Visual AI Lab。其主要研究方向涵盖计算机视觉、机器学习与人工智能,当前聚焦于开放世界学习、3D 视觉、生成式人工智能、基础模型及相关前沿领域。此前,他曾在谷歌研究院(英国&美国)担任研究员,在英国布里斯托大学计算机科学系担任助理教授,并在英国牛津大学著名的VGG组担任博士后研究员。他在香港大学计算机科学系获得博士学位。在攻读博士期间,他还在法国巴黎Inria和巴黎高等师范学院(ENS)的WILLOW团队从事研究工作。他在顶级学术期刊和会议,如TPAMI, IJCV, TIP, CVPR, ICCV, ECCV, NeurIPS, ICLR等发表论文70余篇。主持过多项政府科研项目,包括香港研究资助局–优配研究金(RGC GRF)、香港研究资助局–杰出青年学者计划(RGC ECS)、国家自然科学基金青年项目等;以及多项工业界科研合作项目,包括CCF-腾讯犀牛鸟基金等。入选人工智能领域全球前2%顶尖科学家,并担任计算机视觉和机器学习旗舰会议的领域主席,如CVPR, ECCV, ICLR等。
报告题目:Taming foundation models for visual concept learning and 4D modeling
报告摘要:In this talk, I will present our recent work on leveraging foundation models for open-world visual concept learning and 4D modeling. First, I will discuss how we repurpose vision foundation models for continual category discovery by learning a flexible Gaussian mixture prompt pool. Next, I will introduce our approach to automatically extracting visual concepts, both at the object and intrinsic levels, using Stable Diffusion models. Finally, I will share our work on high-quality 4D generation by effectively harnessing video diffusion models, enabling temporally and spatially consistent content creation with 4D Gaussian splatting.
陈隆
香港科技大学助理教授
简介:陈隆,香港科技大学计算机科学及工程学系助理教授、博士生导师。主要研究方向为计算机视觉、多媒体计算、机器学习等。以第一/通讯作者身份发表多篇CCF-A类期刊和会议,谷歌学术引用共7000余次。目前担任期刊IEEE Transactions on Image Processing (TIP) 和ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM) 编委,并多次担任CCF-A类会议领域主席,包括CVPR、NeurIPS、ICML、ACMMM、AAAI等。主持多项科研项目包括香港RGC优配研究金(GRF)、香港RGC杰出青年学者计划(ECS)、和国家自然科学基金青年基金等。
报告题目:The Interplay of Understanding and Generation in Multimodal AI
报告摘要:The fields of multimodal understanding and generation have advanced independently, yet their true potential lies in synergy. This talk explores the critical interplay between these two capabilities. I will first outline the distinct challenges faced by modern multimodal understanding models (e.g., reasoning, hallucination) and visual generation models (e.g., controllability). I will then present our recent work that leverages generative models to enhance perception tasks, demonstrating that generation can be a powerful tool for robust understanding. Finally, I will discuss our vision and initial steps towards a unified model architecture capable of seamless both-tasking, arguing that this convergence is the next frontier for general-purpose multimodal intelligence.
傅朝友
南京大学助理教授、研究员
简介:傅朝友,南京大学研究员、助理教授、博导,入选中国科协“青年人才托举工程”。研究方向为多模态智能,谷歌学术总引用5000余次,一作单篇引用破千次,作为Owner的开源项目累计获得2万余次GitHub Stars,代表性工作包括VITA系列多模态大模型,MME系列评测基准和Awesome-MLLM社区等。担任CSIG青工委委员、CCF-AI执行委员、ICLR领域主席。曾获中科院院长特别奖、世界人工智能大会WAIC云帆奖、IEEE Biometrics Council最佳博士学位论文、北京市优秀博士学位论文、中科院优秀博士学位论文、小米青年学者-科技创新奖、南京大学紫金学者、CVPR-22023杰出审稿人等。
报告题目:多模态大语言模型研究与展望
报告摘要:近年来,多模态大语言模型因其强大的泛化和推理能力,受到了国内外学者以及工业界的广泛关注。本报告将简要回顾多模态大语言模型的发展历程,并围绕多模态大语言模型的数据、评测、架构、训练和应用等方面展开阐述,探讨多模态大语言模型中存在的问题以及未来的发展方向。
杨思蓓
中山大学副教授
简介:杨思蓓,中山大学计算机学院副教授,博士生导师,逸仙学者。分别于2020年和2016年在香港大学和浙江大学取得博士和学士学位。其主要研究领域为跨模态视觉感知、理解、生成与交互。迄今为止在TPAMI、CVPR、ICCV等期刊或会议发表CCF A类/中科院一区论文50余篇,其中以第一作者和通讯作者发表CCF A类论文近40余篇,引用2500余次。入选全球前2%顶尖科学家榜单。主持国家自然科学基金面上项目、青年项目,以及浦江人才计划、上海领军人才海外计划等。担任ICCV、ICLR等顶会领域主席。
报告题目:多模态大模型机制洞察驱动鲁棒表征与生成
报告摘要:本报告从多模态大模型 LVLM 的内部机制出发,洞察其表征与生成的缺陷,探讨鲁棒且高效的提升路径。首先,从外部分析 LVLM 视觉编码器 ViT 的表征局限,结合内部对视觉信号处理机制的理解,揭示类人的视觉功能层次,实现内外协同以增强视觉-语言表征能力。其次,揭示单步组合型推理、短回答与长回答中幻觉现象的差异,从而全面提升不同上下文下的生成鲁棒性。最后,提升 LVLM 在现实环境中的复杂推理能力,包括多模态深度研究的初步尝试以及动态环境下的主动探索与交互。
李冠彬
中山大学教授
简介:李冠彬,中山大学计算机学院教授,博士生导师,国家优秀青年基金获得者。主要研究领域为人工智能领域的图像视频内容理解与生成。迄今为止累计发表计算机学会A类/中科院一区论文 200 余篇,谷歌学术引用近18000次,入选全球前0.05%顶尖科学家榜单。曾获得中国图象图形学学会青年科学家奖、吴文俊人工智能优秀青年奖、ACM 中国新星提名奖、中国图象图形学学会科学技术一等奖、ICCV2019 最佳论文提名奖、CVPR2024最佳论文候选、ICMR2021 最佳海报论文奖等荣誉。主持了包括国家自然科学基金优青、面上、青年、广东省杰青、 CCF-腾讯犀牛鸟科研基金、CCF-快手科研基金、华为科研合作基金、美团北斗科研合作基金等 10 多项科研项目。担任广东省大数据分析与处理重点实验室副主任、广东省图象图形学会计算机视觉专委会主任、中国图象图形学学会青工委副秘书长、中国计算机学会青年科技论坛广州主席、广州计算机学会副秘书长。担任人工智能领域顶级会议CVPR、ECCV、AAAI等领域主席或高级程序委员,获得8项人工智能领域国际顶级会议竞赛冠军,研究成果应用于智能交通分析、智慧医疗诊断、数字人驱动的智慧教育等。
吴庆耀
华南理工大学教授
简介:吴庆耀,华南理工大学软件学院教授、博士生导师,入选中组部万人计划青年拔尖人才;曾担任华南理工大学软件学院副院长,现担任大数据与智能机器人教育部重点实验室副主任,广州市机器人软件及复杂信息处理重点实验室主任,Service Oriented Computing and Applications 与 Software Impacts 期刊副主编,IEEE 电子商务工程国际会议2021年大会主席与 2022 年及2023 年程序主席,连续多年入选美国斯坦福大学发布的全球前 2%顶尖科学家榜单;主持了国家自然面上、青年、广东省新一代人工智能重点研发、广东省特支计划等 10 多项科研项目。主要研究方向为大模型垂域应用与计算机视觉,迄今为止发表 CCF A 类/中科院一区论文近百篇。获 2025 教育部自然科学奖二等奖、2018 年度广东省自然科学奖二等奖、2016 年度深圳市自然科学奖二等奖。
杨思蓓
中山大学副教授
简介:杨思蓓,中山大学计算机学院副教授,博士生导师,逸仙学者。分别于2020年和2016年在香港大学和浙江大学取得博士和学士学位。其主要研究领域为跨模态视觉感知、理解、生成与交互。迄今为止在TPAMI、CVPR、ICCV等期刊或会议发表CCF A类/中科院一区论文50余篇,其中以第一作者和通讯作者发表CCF A类论文近40余篇,引用2500余次。入选全球前2%顶尖科学家榜单。主持国家自然科学基金面上项目、青年项目,以及浦江人才计划、上海领军人才海外计划等。担任ICCV、ICLR等顶会领域主席。
声纹识别论坛
声纹识别论坛是一个专注于探讨声纹建模技术及其应用的学术交流平台。本次论坛聚焦于该领域的创新突破,邀请了五位在声纹生物特征技术领域具有深厚造诣的专家。
南方科技大学的王中秋副教授将探讨一种基于人工起始提示的目标说话人提取方法(Listen to Extract),该方法以其极简的结构和高效的性能,为解决多说话人场景下的语音提取挑战提供了全新思路。 南京大学的王帅副教授将分享其团队在面向真实场景的目标语音提取算法上的研究工作,旨在提升系统的鲁棒性,并介绍了为该领域研究提供基准与平台的开源工具包WeSep。 昆山杜克大学的苗晓晓助理教授将回顾语音匿名化技术的发展历程,结合VoicePrivacy挑战赛,深入分析该技术在多语言、多说话人场景下的最新进展、挑战与未来方向。 广东技术师范大学的杨继臣教授将介绍其在回放语音检测方面的创新研究,提出基于β-阶谱线能量加权的新型特征,显著提升了检测系统的区分能力与性能。 厦门大学的洪青阳教授将分享其在声纹识别噪声标签过滤方面的研究,通过基于向量相似度和高斯混合模型的样本选择策略,有效解决了训练数据中的噪声问题,显著降低了模型的等错误率。
期待本次论坛能够为与会者提供一个交流和学习的平台,促进专家学者之间的深入合作和学术交流,推动声纹识别技术的进步和产业化进程。
王中秋
南方科技大学副教授
简介:王中秋,博士,国家级青年人才(海外),现任南方科技大学计算机科学与工程系副教授,曾在美国三菱电机研究院任访问研究员、在卡内基梅隆大学语言技术研究所任博士后研究员。王博士的研究课题集中于人工智能和计算听觉中对于声学信号的感知、理解与生成,迄今已在人工智能、语音及音频信号处理领域发表顶级期刊和会议论文70余篇,曾获信号处理旗舰会议ICASSP 2018最佳学生论文奖。详见https://zqwang7.github.io/。
报告题目:Listen to Extract:基于人工起始提示的目标说话人提取方法
报告摘要:在多说话人语音混合的场景中,如何快速准确地提取目标说话人始终是语音处理的核心挑战。现有方法通常依赖定长或变长说话人表征,但往往存在说话人表征与混合信号表征不匹配或计算复杂度高的问题。我们提出一种极其简洁但高效的目标说话人提取方法:Listen to Extract (LExt)。其核心思想是将目标说话人注册语音片段直接拼接到混合语音之前,人为地构造一个“语音起始提示”,让机器先听一听目标说话人是谁,再去完成提取任务。由于拼接后的语音在同一网络中处理,LExt无需额外的说话人表征提取模块。我们在 WSJ0-2mix、WHAM!和WHAMR!等多个公开数据集上进行了验证,实验结果表明,LExt在保持极简结构的同时,显著优于现有基线系统,达到了当前最优的目标说话人提取性能。此外,研究还表明,LExt 在仅需0.25秒甚至更短的注册语音条件下,仍能取得较高的提取效果,展示了其在实际应用中的潜力。
王帅
南京大学副教授
简介:王帅,南京大学智能科学与技术学院副教授,特聘研究员,博士生导师。专注于智能音频信号处理研究,涵盖语音、音频事件及音乐等多模态声学信号。2020年于上海交通大学获博士学位。曾任深圳市大数据研究院副研究员;亦曾任腾讯光子工作室高级研究员,领导团队负责面向游戏场景的语音技术的研发与应用。荣获VoxSRC2019、DIHARD2019等国际竞赛冠军及ISCSLP2024最佳论文、最佳学生论文奖。发起开源工具WeSpeaker与WeSep,提供的预训练模型在HuggingFace平台下载量月均超千万次,在学术界与工业界获得广泛应用。
报告题目:面向真实场景的目标语音提取算法
报告摘要:目标说话人提取(Target Speaker Extraction)技术因其广阔的应用前景,已成为语音处理领域的研究热点。然而,当前研究成果与真实应用场景的性能需求之间仍存在显著差距。为弥合这一鸿沟,本报告将阐述我们为提升系统鲁棒性所开展的算法研究工作。此外,我们构建了一套面向真实场景的TSE测试集Real-T,并发布了专为该任务设计的开源工具包WeSep,旨在为该领域的进一步研究提供坚实的基准与便利的平台。
苗晓晓
昆山杜克大学助理教授
简介:苗晓晓,现任昆山杜克大学自然与应用科学学部助理教授。2015-2021中国科学院声学研究所,中国科学院大学博士,2021-2023日本国立信息学研究所博士后,2023-2025新加坡理工大学信息处理学院助理教授。主要研究方向包括语音隐私保护,说话人及语种识别。先后主持日本自然科学基金,新加坡教育部科学研究基金。在国内外期刊会议上发表论文三十余篇。参与组织 voiceprivacy challenge 2022,2024 及 attacker challenge。作为第一作者的研究成果获 odyssey2022,NCMMSC2017 最佳论文提名奖,MIT MGB-5 Challenge 2019 阿拉伯方言国际竞赛第二名。其部分语音隐私保护相关研究成果已成功应用于日本广播电台,转化为专利。
报告题目:从VoicePrivacy Challenge看语音匿名化技术的发展
杨继臣
广东技术师范大学教授
简介:杨继臣,2010年博士毕业于华南理工大学毕业,研究方向为语音信号处理。随后在华南理工大学、新加坡资讯通讯研究院和新加坡国立大学跟随贺前华教授、Kong-Aik Lee和李海洲教授做博士后研究。2022年加入广东技术师范大学网络空间安全学院,现为广东技术师范大学教授、硕士生导师、IEEE高级会员、CCF高级会员和CCF语音对话与听觉专委会委员。先后主持过国家自然科学基金、博士后科学基金和广东省自然科学基金等项目。进几年以第一作者或通讯作者发表SCI论文30篇,其中8篇发表在TASLP、TIFS和TMM上。
报告题目:基于β-阶的谱线能量加权的回放语音检测研究
洪青阳
厦门大学教授
简介:洪青阳,厦门大学信息学院教授,主要研究方向为声纹识别、语音识别,先后主持国家自然科学基金三项,科技部创新基金两项。牵头组建厦门大学智能语音实验室,带领XMUSPEECH团队获东方语种识别(OLR)、基于多模态信息的语音处理(MISP)等竞赛佳绩,成功研发闽南语识别与合成系统。与华为、海思、海信、声云等知名企业合作,成果落地华为智能手机、说咱闽南话App、声云语音转写和全国多个省市的司法/证券/电力系统。发布声纹识别开源工具ASV-Subtools,助力学术研究和产业落地。出版专著《语音识别:原理与应用》,累计发行超1万册。担任中文信息学会语音信息专委会副主任等职。获电子工业出版社“优秀作者奖”和华为“优秀技术合作成果奖”。
报告题目:面向声纹识别的噪声标签过滤研究
王帅
南京大学副教授
简介:王帅,南京大学智能科学与技术学院副教授,特聘研究员,博士生导师。专注于智能音频信号处理研究,涵盖语音、音频事件及音乐等多模态声学信号。2020年于上海交通大学获博士学位。曾任深圳市大数据研究院副研究员;亦曾任腾讯光子工作室高级研究员,领导团队负责面向游戏场景的语音技术的研发与应用。荣获VoxSRC2019、DIHARD2019等国际竞赛冠军及ISCSLP2024最佳论文、最佳学生论文奖。发起开源工具WeSpeaker与WeSep,提供的预训练模型在HuggingFace平台下载量月均超千万次,在学术界与工业界获得广泛应用。
智能数字人论坛
随着人工智能与计算机图形学的深度融合,智能数字人作为人机交互、虚拟现实与元宇宙场景中的关键角色,正面临重建精度、驱动自然性、生成可控性与物理真实感等多重技术挑战。如何实现从感知到生成、从外观建模到行为表达的端到端闭环,成为当前研究的热点与难点。本次智能数字人论坛聚焦数字人构建与驱动的核心议题,邀请多位在三维视觉、计算机视觉与生成模型方向持续探索的专家学者,开展深入的技术交流。论坛内容涵盖基于稀疏视点与视频的端到端重建、融合情感信号的虚拟人驱动、高保真数字人的建模与交互机制、多模态条件下的可控视觉内容生成与编辑,以及物理建模在动态生成中的应用探索,系统呈现从“视觉真实”向“物理真实”与“行为合理”演进的技术路径。通过多维度的技术分享与跨领域观点碰撞,论坛旨在促进智能数字人在算法创新、模型优化与实际应用场景间的深度融合,推动其在虚拟交互、智慧服务、具身智能等方向的持续发展与落地实践,为相关研究与产业合作提供交流平台。
许威威
浙江大学教授
简介:许威威,浙江大学计算机科学与技术学院CAD&CG国家重点实验室长聘教授,教育部长江学者,中国图象图形学学会智能图形专委会副主任。曾任日本立命馆大学博士后,微软亚洲研究院网络图形组研究员, 杭州师范大学浙江省钱江学者特聘教授。主要研究方向为智能三维感知、重建和仿真。发表ACM TOG, IEEE TVCG、IEEE CVPR、AAAI等CCF-A类论文80余篇。获中国和美国授权专利30余项。所开发的高精度、高真实感三维重建技术在先临高精度扫描仪、百度阿波罗自动驾驶仿真平台、华为河图和徐工机械远程驾驶舱中得到应用。2014年受国家自然科学基金优秀青年基金资助,主持国家自然科学基金重点项目一项,获浙江省自然科学二等奖一项。
报告题目:端到端的数字人重建与驱动技术
报告摘要:数字人重建和驱动技术可为元宇宙提供自然的交互入口,其高效便捷的构建与驱动备受关注。本报告将介绍如何利用端到端的神经渲染技术从稀疏视点中重建高质量的三维数字人,采用RGBD相机提升动态人体重建算法的效率和结果质量,并进一步介绍从视频构建可驱动数字人的技术进展。
吕科
中国科学院大学教授
简介:吕科,中国科学院大学特聘教授、博士生导师,国家级科技领军人才,科技部创新人才推进计划“中青年科技创新领军人才”,鹏城国家实验室双聘教授,国家自然科学基金委创新研究研究群体(A类)项目负责人,国家重点研发计划“基础科研条件与重大科学仪器设备研发”专项项目首席科学家,享受国务院政府特殊津贴专家。主要研究方向为图像处理、智能信息处理技术。中国图像图形学会交通视频专委会副主任,中国计算机学会多媒体专委会常委。
报告题目:高保真数字人技术研究进展与展望
报告摘要:2024年中国科协发布的十大前沿科技问题中,“情智兼备数字人与机器人”位列重大科学问题之首,充分彰显了国家在数字人技术发展领域的战略布局和高度重视。作为新一代智能交互的核心载体,高保真数字人技术正在深刻重塑通讯、教育、传媒等关键领域的应用范式。高真实感数字人技术通过深度融合计算机图形学、人工智能、多模态交互与物理仿真等前沿技术,构建出在外观形态、动作表现、情感表达及行为逻辑等维度全方位逼近真实人类的数字实体。本报告将探讨数字人技术的关键突破与核心挑战,重点围绕数据构建、基座模型、控制编辑及沉浸交互等核心技术领域的最新研究进展展开论述,并对数字内容创作、智能客服与数字营销、人形机器人驱动等典型应用场景的落地挑战进行深入分析。
徐枫
清华大学副教授
简介:徐枫,清华大学软件学院长聘副教授,博士生导师,入选国家级青年人才。研究方向包括人工智能、虚拟/增强现实、智慧医疗等。相关工作发表在Nature Medicine, Nature Biomedical Engineering, NEJM AI,Lancet Digital Health, ACM Siggraph, CVPR等国际权威期刊和会议上。担任CCF A类IEEE TVCG编委, Siggraph、Siggraph Asia程序委员,ICCV领域主席。论文入选Cell Press中国年度最佳论文、Siggraph最佳论文,获中国图象图形学学会技术发明一等奖(序1)。
报告题目:数字人中的物理
张盛平
哈尔滨工业大学教授
简介:张盛平,哈尔滨工业大学教授、鹏城国家实验室访问教授、如本科技首席科学家,入选国家级青年人才计划,布朗大学和香港浸会大学博士后、加州大学伯克利分校访问学者。主要研究方向为机器学习与计算机视觉。主持国家自然科学基金4项、华为公司项目10余项,被华为授予2021年“HUAWEI Ascend Expert”和 2022年“昇腾众智星光奖”荣誉称号,荣获2022年度教育部-华为“智能基座”栋梁之师。研究成果获省部级科研奖励4项。已发表学术论文100余篇(包括PNAS、IEEE T-PAMI、IJCV、ICML、NeurIPS、CVPR、ICCV、SIGGRAPH等)。
报告题目:超写实虚拟数字人驱动技术
李冠彬
中山大学教授
简介:李冠彬,中山大学计算机学院教授,博士生导师,国家优秀青年基金获得者。主要研究领域为图像视频内容理解与生成。累计发表CCF A类/中科院一区论文 200 余篇,谷歌学术引用超过 18000次,入选全球前0.05%顶尖科学家榜单。曾获得中国图象图形学学会青年科学家奖、吴文俊人工智能优秀青年奖、ACM 中国新星提名奖、中国图象图形学学会科学技术一等奖、ICCV2019 最佳论文提名奖、CVPR2024最佳论文候选等荣誉。主持了包括国家自然科学基金优青、面上、青年、重点研发课题、广东省杰青、 CCF-腾讯犀牛鸟科研基金、CCF-快手科研基金等20多项科研项目。担任广东省大数据分析与处理重点实验室副主任、广东省图象图形学会计算机视觉专委会主任、中国图象图形学学会青工委副秘书长等职务。担任人工智能领域顶级会议CVPR、ICCV等顶会领域主席,获得10余项人工智能领域国际顶级会议竞赛冠军。
报告题目:可控视觉内容生成与编辑
高永彬
上海工程技术大学教授
简介:高永彬,上海工程技术大学电子电气工程学院教授,副院长,博士生导师,CCF多媒体专委会执行委员,中国图象图形学学会生物特征识别专委会副秘书长,上海市计算机学会计算机视觉专委会副秘书长,上海市数据智能技术及其应用协同创新中心副主任,工业互联网产业联盟民用飞机制造与运维大数据分析实验室常务副主任。以一作/通讯发表包括IEEE TIP、IEEE TCSVT、IEEE TITS, IEEE IOTJ, ACM TOMM、ICME、ICCV等知名期刊/会议论文50余篇。主持国家级项目/省部级项目6项,主要技术骨干参与科技创新2030-新一代人工智能重大专项/工信部项目/国家基金委重点项目5项。获得上海市科技进步二等奖和中国图象图形学会科技进步二等奖。研究方向:三维视觉。
方志军
复旦大学特聘教授,博士生导师
简介:方志军,二级教授,博士生导师,复旦大学特聘教授,国家级人才,上海市数据智能技术及其应用协同创新中心主任,上海市制造业数字化转型设计与验证专业技术服务平台主任。近年来,在IEEE TIP, TCSVT, TITS, TII, TVT, TSMC, ICCV等知名学术期刊和会议上发表学术论文近百篇。作为项目负责人主持科技部科技创新2030-“新一代人工智能”重大项目,国家基金委民航联合基金重点项目等十余项,获中国产学研合作创新奖、上海市技术发明一等奖等5项科技进步奖项,担任HHME、ISITC、ICMeCG等10余个国内、国际学术会议的组织委员会主席或共同主席。研究方向:计算机视觉,具身智能。
面部生物特征识别论坛
面部生物特征识别论坛是一个专注于探讨面部生物特征识别技术及其应用的学术交流平台。本次论坛聚焦于该领域的创新突破,邀请了五位在面部生物特征识别技术领域具有深厚造诣的专家。深圳大学沈琳琳教授将围绕人脸识别身份(知人)、属性分析(知面)、情感识别(知心),介绍团队在数据集构建、模型框架、多模态细粒度人脸分析此大模型方面的创新工作。北京航天航空大学黄迪教授将分别从数据利用和模型设计两个层面系统介绍其团队在基于几何表示学习的三维人脸表情识别方面的最新进展。四川大学赵启军教授将探讨人脸图像融合攻击和深度伪造攻击中的通用防伪特征学习问题,提升人脸防伪模型的泛化性和应对未知攻击的能力。中国科学院自动化所朱翔昱研究员将分享在AIGC时代下,针对持续伪造检测任务提出的一种基于持续学习框架的模型动态增长新方案。大湾区大学的余梓彤副教授将介绍在面部生物特征识别任务中检测和解码“面部微弱视觉信号”的基础模型和方法。期待本次论坛能够为与会者提供一个交流和学习的平台,促进专家学者之间的深入合作和学术交流,推动面部生物特征识别技术的进步。
沈琳琳
深圳大学教授
简介:沈琳琳,教授,上海交通大学学士、硕士,英国诺丁汉大学博士。入选ScholarGPS“全球前0.05%顶尖学者”,2015-2025连续11年被爱思唯尔出版社评为计算机学科“中国高被引学者”,2020-2025连续入围斯坦福大学“科学影响力全球前2%科学家榜单”。鹏城学者,深圳大学人工智能学院副院长,英国诺丁汉大学计算机学院荣誉教授、宁波诺丁汉大学计算机系访问教授;大数据系统计算技术国家工程实验室副主任、深圳大学计算机视觉研究所所长。期刊《Cognitive Computation and Systems》常务副主编(Co-Editor-in-Chief)、《IEEE Trans. on Image Processing》资深领域编辑(Senior Area Editor)、《Expert Systems with Applications》资深编辑(Senior Editor)、《Pattern Recognition》《Scientific Data》副编辑(AE),AAAI/ IJCAI Senior PC,ACM Multimedia / ICASSP / PRCV领域主席(Area Chair)。基于人脸视频的抑郁分析论文获情感计算顶刊《IEEE Trans. on Affective Computing》最佳论文亚军,人脸识别论文曾获国际期刊《Image and Vision Computing》最多他引论文奖,CT图像脊柱分割论文获 Wiley出版社高被引论文奖(Wiley Top Cited Article)。2023年5月带领团队开源首个中文百亿参数大模型“伶荔”,被金融等垂直行业广泛使用。
报告题目:从知人、知面到知心
报告摘要:报告将主要围绕人脸的识别分析任务展开,包括从人脸识别身份(知人)、人脸属性分析(知面),以及基于人脸的表情和抑郁、性格等情感识别(知心)。围绕这些任务,介绍团队在2D、3D人脸识别的UniFace,PointFace等工作,能够将各种属性分析、图文生成任务统一的Talk2Face框架,含八千万人脸描述图文对数据集Flip、200个细粒度属性分析问答数据集FaceBench,人脸多模态细粒度分析大模型Face-LLaVA,以及用于情感识别和人脸反应生成的个性化网络,最后介绍针对人机交互场景的人脸动作感知和交互反应动作生成智能体等工作。
黄迪
北京航空航天大学教授
简介:黄迪,北京航空航天大学计算机学院教授、博士生导师;长期从事计算机视觉、多模态感知、表示学习等方面的理论与方法研究;主持国家重点研发计划、国家自然科学基金优青等研究项目20余项;发表包括国际高水平期刊和会议论文120余篇,谷歌学术引用14,400余次,获国内外学术会议论文奖项6项;曾获ICRA机器人抓取与操作竞赛冠军、MM情感计算竞赛冠军;获吴文俊人工智能自然科学一等奖、中国图象图形学学会自然科学二等奖2项。
报告题目:基于几何表示学习的三维人脸表情识别
报告摘要:多表情是人类日常传递情绪的重要方式,让计算机“读懂”这些表情,对于发展更自然的人机交互和促进相关应用的普及至关重要。传统基于二维图像、视频的方法易受光照、姿态等因素干扰,难以满足实际需求。随着三维采集设备的革新,基于几何信息的表情识别逐渐成为领域内的研究热点,其中如何从非结构化的三维数据中有效提取刻画表情的判别特征是核心挑战。近年来,几何表示学习作为新兴范式,能够直接基于点云、网格等数据形式端到端构建更优的特征,将三维表情识别带入了新阶段。本次报告将分别从数据利用与模型设计两个层面系统介绍研究团队的最新进展。主要内容包括:通过自监督学习充分挖掘大规模未标注数据价值;采用身份解耦策略消除身份信息干扰;以及利用提示学习实现多模态信息的充分融合。这些方法有助于提升三维表情识别模型的准确率和鲁棒性,为相关技术的实际应用提供基础支持。
赵启军
四川大学教授
简介:赵启军,四川大学计算机学院(软件学院、智能科学与技术学院)教授、博士生导师、副院长,四川省学术和技术带头人后备人选。长期从事模式识别与图像处理领域的教学与科研工作,近年来主持相关的国家自然科学基金项目、科技部重点研发计划项目子课题、省部级项目和企业合作项目等10余项,已在国内外学术会议和期刊上发表学术论文近200篇,获授权发明专利20多项,出版专著和译著4部。曾获上海市自然科学奖二等奖、四川省科技进步奖三等奖、日内瓦国际发明奖银奖、国际计算机视觉与模式识别会议(CVPR)杰出评审专家称号、《中国图象图形学报》优秀编委、四川大学十佳关爱学生教师奖和未来教学名师奖、教育部-华为智能基座“栋梁之师”称号等。
报告题目:人脸图像的通用防伪特征学习
朱翔昱
中国科学院自动化研究所研究员
简介:中国科学院自动化研究所项目研究员,从事生物特征识别、数字人、人工智能基础理论的研究与应用。国际模式识别协会(IAPR)生物特征青年学者奖(YBIA)获得者(两年一次,每次从全球范围内评选40岁以下学者一名),获2024中国图象图形学学会自然科学二等奖(第一完成人)。共发表论文100余篇,发表文章的Google Scholar总引用次数为10000余次。获得三次国际竞赛冠军以及四项最佳论文及提名奖。授权国家发明专利16项。入选IEEE Senior Member,百度学术全球华人AI青年学者榜单(全球25人)。任生物特征识别国际期刊IEEE Transactions on Information Forensics & Security (T-IFS, CCF:A类) 、模式识别国际知名期刊Pattern Recognition (PR, CCF:B) Associate Editor,国际生物特征识别大会 IJCB 2025 Program Chair, 中国图象图形学学会青托俱乐部副主席,中国人工智能学会模式识别专委会副秘书长。
报告题目:人脸鉴伪持续攻防:一种模型增长方案
余梓彤
大湾区大学副教授
简介:余梓彤,大湾区大学长聘副教授,研究员,博导,国家高层次青年人才,国家优秀海外留学生奖获得者,IEEE/CCF高级会员,CCF东莞分部秘书长,CSIG生物特征识别专业委员会(筹)副秘书长,东莞市智能信息技术重点实验室副主任。南洋理工大学博后,博士毕业于奥卢大学,牛津大学访问学者, 研究方向为微视觉计算。发表Cell子刊、TPAMI等高水平文章50篇,谷歌总引用7600次,获4项国际学术竞赛冠亚军,授权国家发明专利14项。主持国自然优青(海外)/面上/青年项目、CCF-腾讯犀牛鸟项目等。获ACM SIGWEB中国新星奖,IEEE芬兰最佳学生会议论文奖,IEEE芬兰SP/CAS最佳论文奖亚军,ICME 24最佳论文候选,连续三年入选斯坦福全球前2%顶尖科学家榜单,指导学生获IAPR最佳学生论文奖、CCBR 24最佳论文提名奖、CSIG英文会刊首个封面文章。担任国际期刊IEEE TIFS编委,曾担任ACM MM 25、ICME 23、BMVC 24/25、IJCB 24领域主席、IJCAI 25 SPC、CCBR 25论坛主席。相关成果落地应用于中国疾控中心、广电运通集团等,以第一完成人获广东省图象图形学会科技进步一等奖。
报告题目:微弱面部视觉计算
单彩峰
南京大学教授
简介:单彩峰,南京大学教授、博士生导师,国家海外高层次人才, “长江学者”讲席教授。现任南京大学智能科学与技术学院副院长、南京大学-中国移动联合研究院副院长。先后获得中国科学技术大学学士、中国科学院自动化研究所硕士、英国伦敦大学玛丽女王学院博士,之后在荷兰飞利浦研究院工作十余年,担任资深科学家和团队负责人,并兼任荷兰埃因霍温理工大学研究员。主要从事计算机视觉、模式识别、医学图像计算等方面的研究,先后承担多个欧盟和荷兰的研究项目、国家自然科学基金原创探索项目等。发表论文180多篇(引用1万余次)、授权各国专利100多项(其中美国欧洲日本专利60余项)。荣获飞利浦公司发明奖,入选全球前2%顶尖科学家、飞利浦公司“High Potential”人才等。先后担任10余个国际期刊的编委,组织了多个国际研讨会。
李琦
中科院自动化所副研究员
简介:李琦,中国科学院自动化研究所副研究员,中国科学院青促会会员,中国科学院特聘研究骨干,北京市科协青年人才托举。现任中国图象图形学学会生物特征识别专委会(筹建)秘书长、北京图象图形学学会理事、中国计算机学会计算机视觉专委会执行委员。近五年发表CCF推荐A类期刊和会议共20多篇,其中含第一作者/通讯作者8篇TPAMI/IJCV。代表作AnyFace被评选为CVPR最佳论文候选,并入选TPAMI专刊Best of CVPR。撰写Springer专著1部。申请人多次担任国内生物特征识别旗舰会议CCBR论坛主席、出版主席等,担任ICLR 2025、ICLR 2026的领域主席。主持国家重点研发计划青年科学家项目一项,科技创新2030“新一代人工智能”重大项目课题一项,国家自然科学基金两项。研究成果获2022年中国图象图形学学会技术发明奖二等奖、2023年中国产学研合作创新成果二等奖等。所研发的生物特征识别系统、人工智能安全系统已在国家多个部委成功应用,为国家信息安全与管理提供了有力支持。
李慧斌
西安交通大学教授
简介:李慧斌,教授,博导。现任西安交通大学数学与统计学院院长助理,西安大数据与人工智能研究院常务副院长,国家生物安全证据基地—生物特征识别中心主任。2013年获法国里昂中央理工大学博士学位。主要从事应用数学、三维视觉、生物特征识别等方面的研究,先后主持科技部、基金委、校企等20余项研究项目。在学术期刊和会议如IEEE TPAMI/TIP/TVCG/TIFS/IJCV/ NeurIPS发表高水平论文70余篇(引用4000多次),申请/授权发明专利30项。曾获欧盟生物特征识别奖、陕西省自然科学奖一等奖等奖项,“高精度三维人脸识别产品研发及产业化”获陕西高等学校优秀成果奖一等奖。参与撰写了公安部 《安全防范三维人脸识别设备技术规范》标准。
行为生物特征识别论坛
行为生物特征识别是通过分析个体的行为模式(如步态、动作习惯、打字节奏等)进行身份认证的技术,已广泛应用于视频监控、金融安全和在线身份认证等领域。随着人工智能与大数据技术的进步,该技术的识别性能显著提升,未来将在智能监控、自然人机交互及无缝身份验证等领域发挥更大作用。本论坛特邀领域专家,深入探讨其技术动态与未来趋势,以促进该技术的创新与应用落地。
魏秀参
东南大学教授
简介:东南大学计算机科学与工程学院教授、博士生导师,国家基金委青年科学基金项目B类(原优青)获得者、国家重点研发计划首席青年科学家、江苏省杰青。主要从事计算机视觉、机器学习和机器人方面研究,带领团队开源“PyRetri”、“Hawkeye”等细粒度图像分析算法库(均入选ACM Multimedia开源竞赛Winner Entry)。在国际顶级期刊和会议发表论文六十余篇,相关研究工作获得“江苏省自然科学百篇优秀学术成果”以及含CVPR iNaturalist在内的国际权威学术评测等10余项世界冠军。担任IEEE TIP/TMM编委,CVPR、ICCV、AAAI、IJCAI等国际会议的领域主席、研讨会主席、讲习班主席等10余次,并任Fundamental Research/电子学报(英文版)青年编委、CSIG青托俱乐部主席、CCF-CV/CSIG-青工委副秘书长等。曾入选CSIG青年科学家奖、吴文俊人工智能优秀青年奖、中国科协青年人才托举工程等。主编教材《解析深度学习》已重印7次并入选“十四五”国家重点出版物出版规划、2025年度CCF推荐教材和省部级重点教材,另出版学术专著1部。
报告题目:细粒度图像分析及其应用初探
报告摘要:细粒度图像分析是视觉感知学习的基础研究课题,在智能新经济和工业互联网等方面具有巨大应用价值。随着细粒度图像分析的应用场景向多维领域快速扩展,其处于静态封闭环境的经典假定不再成立,不可避免地将面临开放动态环境挑战。本报告将针对监督信息匮乏、样本分布长尾、检索数据庞杂等现实频发问题,介绍在细粒度图像分析领域本课题组的相关研究成果,及面向人民生命健康和国家重大需求方面的应用实践。
徐婧林
北京科技大学副教授
简介:徐婧林,北京科技大学智能科学与技术学院副教授,北京图象图形学学会理事、副秘书长,中国图象图形学学会青托俱乐部副主席。主要研究方向为计算机视觉、视频理解、细粒度运动分析,已发表TPAMI、IJCV、CVPR等ACM/IEEE Trans.和CCF A类论文30余篇。主持国家自然科学基金青年基金B类(原优青)、C类、面上、北京市自然科学基金面上等项目;主持腾讯犀牛鸟专项研究计划;作为合作单位负责人参与国家自然科学基金重点(序2)、北京市自然科学基金联合基金重点(序2)等项目。入选中国科协青年人才托举工程,获中国图象图形学学会石青云女科学家奖、优秀博士学位论文奖,获中国自动化学会自然科学奖一等奖(4/5)、中国图象图形学学会自然科学奖二等奖(3/5)等奖励。担任《Chinese Journal of Electronics》青年编委、《电子与信息学报》编委等。
报告题目:面向行为理解的细粒度运动分析
报告摘要:细粒度运动分析旨在通过对人体动作序列的精细化分析,实现动作的识别、定位以及质量评价。本报告首先介绍细粒度运动分析的研究背景,重点介绍细粒度动作识别、定位、质量评价,回答如何在时间和空间维度上捕捉边界模糊的细粒度动作,以及如何从细粒度层面更精确地评估人体动作质量。该研究工作将在运动康复、体能测试、数字传媒等领域发挥重要作用。
汪婧雅
上海科技大学信息研究员
简介:汪婧雅,现任上海科技大学信息科学与技术学院研究员、助理教授、博导。研究兴趣侧重于以人为中心的三维交互与具身智能。在计算机视觉顶级会议和期刊上发表论文50余篇,其中CCF-A类论文40余篇。担任CVPR、NeurIPS、ICML、ICCV、ECCV、ACM MM等会议的领域主席。入选上海市海外领军人才计划,上海市扬帆计划,主持国家自然科学基金等。荣获2018 CVPR Doctoral Consortium Award,第一作者论文入选Computer Vision News Magazine评比的2018 Best of CVPR Paper。2023年入选百度AI华人女性青年学者榜。获得2024年ACM Design Automation Conference最佳论文提名,2024年ACM Multimedia最佳论文提名,ICLR 2025生成式理论研讨会杰出论文奖。
报告题目:面向开放世界的多模态行人重识别
张顺利
北京交通大学教授
简介:张顺利,北京交通大学软件学院教授、博导。主要研究方向包括视频图像处理与分析、计算机视觉、智能决策、深度学习等。主持国家自然科学基金项目2项、北京市自然科学基金项目2项,企业合作科技项目多项,取得了较好的研究成果。在CVPR、ICCV、ACM MM、TIP、TMM等国际著名会议期刊发表论文60余篇,带领研究团队多次获得国际步态识别大赛、ICME雨天场景语义分割挑战赛等国际学术竞赛第1名。
报告题目:步态识别的前沿技术创新与挑战
侯赛辉
北京师范大学副教授
简介:侯赛辉,北京师范大学副教授,主要从事以人为中心的计算机视觉和多模态大模型等相关研究。目前在TPAMI、IJCV、TIFS和CVPR、ICCV、ECCV等期刊和会议发表50余篇论文,其中CCF-A/ECCV/IEEE Transactions论文47篇,Google引用次数4000余次。申明专利20余项,主持国家自然科学基金青年基金和中央高校基本科研业务费专项资助项目,参与国家自然科学基金重点项目、面上项目以及多个企业横向合作项目。获中国科学技术大学优秀博士论文和中国科学院院长奖优秀奖,入选2023-2025北京市科协青年人才托举工程。
于仕琪
南方科技大学副教授
简介:于仕琪,主要研究领域为生物特征识别。在生物特征识别的步态识别方面,创建的CASIA-B步态数据库目前被作为本领域的评估标准,是使用最广泛的评估库之一;所创建的OpenGait开源项目已经成为步态识别领域主要的算法评估框架。在目标检测方面,人脸检测算法被世界排名前100的多家上市公司采用,同时也被众多的中小企业广泛使用。在遥感图像处理方面获2021年度广东省科学技术奖自然科学奖二等奖。他在IEEE TPAMI、IEEE TIFS、IEEE TBIOM、PR、CVPR、AAAI、ECCV、ICB等发表论文近100篇。于仕琪曾担任CCBR2017、ICB2021和CCBR2024程序委员会主席,以及CCBR2023大会主席;他并作为主要组织人,自2018年开始每年1月份在深圳组织IAPR/lEEE Winter School on Biometrics。
以人为中心的AIGC论坛
以人为中心的AIGC论坛是一个专注于探讨人工智能生成内容(AIGC)技术及其应用的学术交流平台,本次论坛聚焦于该领域的创新突破,邀请了五位在相关领域具有深厚造诣的专家。华中科技大学的王兴刚教授将从扩散模型和自回归模型两个角度围绕高效可控图像生成展开探讨,介绍研究团队近期最新研究成果VA-VAE和LightningDiT(CVPR 2025 Oral),DiG(CVPR 2025)和ControlAR(ICLR 2025)。西安电子科技大学的王楠楠教授将从架构设计、推理步数和参数量化三个方面,探索图像生成模型中神经网络规模压缩和稳定训练方法,实现绿色低碳的大模型轻量化技术。南京理工大学的舒祥波教授将围绕多样化场景下的人体行为理解任务展开探讨,重点介绍课题组近年来在边云协同中的模型预训练与微调、全局模型聚合次优性优化、客户端数据无损浓缩、运动学信息高效学习、以及全局模型训练策略改进等方面的研究进展与技术方案。北京大学的余肇飞教授将介绍团队在脉冲视觉传感器原理、脉冲神经网络在时空信息处理中的应用等方面的研究进展,并讨论以神经形态视觉为代表的“类人感知计算”如何成为连接人类与AIGC系统的重要桥梁。北京航空航天大学的盛律教授将分享利用扩散模型先验构建高精度、可编辑三维视觉内容的系列工作,并进一步介绍面向精准具身感知任务的学习框架,借助高精度的三维物体和可编辑三维场景构造海量数据,有效提升具身智能体对复杂动态具身感知任务的学习效率。期待本次论坛能够为与会者提供一个交流和学习的平台,促进专家学者之间的深入合作和学术交流,推动以人为中心的AIGC技术的进步和发展。
王兴刚
华中科技大学教授
简介:王兴刚,华中科技大学电信学院教授,主要从事视觉表征学习、多模态基础模型、自动驾驶等领域研究,谷歌学术引用4.5万次,H-index 84。担任Image and Vision Computing期刊共同主编,IEEE TPAMI副编辑,CVPR、ICCV、NeurIPS、AAAI等顶会领域主席。入选了国家万人计划青年拔尖人才、中国科协青年人才托举工程。获湖北青年五四奖章、CSIG青年科学家奖,CVMJ最佳论文奖,MIR期刊最高引用论文奖等。
报告题目:图像生成中的高效可控表征学习方法
报告摘要:图像视频生成等AIGC技术近年来取得了飞速的发展,其基本范式主要有两种:扩散模型和自回归模型。本次报告将从扩散模型和自回归模型两个角度围绕高效可控图像生成展开探讨,介绍三个工作:(1)VA-VAE和LightningDiT(CVPR 2025 Oral)通过将视觉分词器的潜在空间与预训练视觉基础模型对齐,显著提升高维潜在空间中扩散模型的重建-生成性能与训练效率,在ImageNet 256上以1.35的FID达到SOTA,并实现超过21倍的收敛加速。(2)DiG(CVPR 2025)将门控线性注意力(GLA)引入扩散模型以实现亚二次复杂度,在保持生成质量的同时显著提升高分辨率图像生成的训练与推理效率。(3)ControlAR(ICLR 2025)提出了一种面向自回归图像生成模型的高效控制框架,通过轻量控制编码器与基于条件解码的token级融合机制,显著提升AR模型在边缘、深度、分割等空间控制下的生成质量与可控性,性能超越现有可控扩散模型如ControlNet++。
王楠楠
西安电子科技大学教授
简介:王楠楠,教授,博士生导师,西安电子科技大学空天地一体化综合业务网全国重点实验室副主任。近年来从事图像跨域重建与可信鉴别方面的研究,具体包括图像跨域重建,目标身份分析,以及模型可信学习等。在IEEE TPAMI、IJCV等国际学术期刊和CVPR、ICCV、ECCV、ICML、NeurIPS等国际学术会议上发表论文200余篇,授权国家发明专利30余项,其中7项实现专利技术转让,软件著作权3项,相关成果获教育部自然科学一等奖、陕西省科学技术一等奖、中国图象图形学学会自然科学奖一等奖、中国人工智能学会优秀博士学位论文、陕西省优秀博士学位论文奖等荣誉。主持国家自然科学基金优秀青年基金、联合基金重点、面上、青年项目,科技创新2030-“新一代人工智能”重大项目子课题,教育部联合基金项目等。担任国际期刊《Visual Computer》的共同主编(Co-Editor-in-Chief)及Neural Networks编委等。
报告题目:面向边端高效推理的模型轻量化
报告摘要:针对大模型高计算复杂度引起的高能耗和高碳排放问题,本报告从架构设计、推理步数和参数量化三个方面,探索神经网络规模压缩和稳定训练方法,实现绿色低碳的大模型轻量化技术。具体包括:(1) 优化网络架构,以降低模型参数规模或降低参数激活量;(2) 生成模型推理阶段的单步算法设计,以降低模型推理时延;(3) 模型的低比特量化,以实现模型的进一步缩小以及稳定训练。本报告的三项研究内容相辅相成,有望构建面向边端需求的大模型轻量化完备解决方案,实现资源消耗与模型性能之间的极佳平衡。
舒祥波
南京理工大学教授
简介:舒祥波,南京理工大学计算机科学与工程学院/人工智能学院副院长、教授、社会安全信息感知与系统工信部重点实验室副主任。研究方向为人体行为计算,在TPAMI、CVPR、ICCV、MM、NeurIPS等期刊/会议上发表论文100余篇,其中ESI高被引论文8篇;获中国电子学会自然科学一等奖、ACM MM 2015最佳论文提名、MMM 2016最佳学生论文奖、江苏省优博、中国人工智能学会优博、2024年度江苏自然科学百篇优秀学术成果论文;入选全球前2%顶尖科学家(2021-2024年);承担国家重点研发课题、国家自然科学基金仪器项目课题、国家自然科学基金优青/面上/青年项目、江苏省杰出青年等项目。担任CSIG青工委副秘书长,以及TNNLS、TCSVT、Pattern Recognition等期刊编委。
报告题目:面向联邦聚合优化的人体行为计算
余肇飞
北京大学研究员
简介:余肇飞,北京大学人工智能研究院研究员、博士生导师,北京大学博雅青年学者,高层次国家级青年人才。主要研究方向为类脑计算、神经形态计算,担任类脑脉冲大模型北京市重点实验室副主任、中国图象图形学会类脑视觉专委会秘书长。在Nature Biomedical Engineering、Science Advance、IEEE Transaction汇刊和NeurIPS、ICML、CVPR等顶级会议上发表论文80余篇,主持国家自然科学基金联合重点、优青青年基金、北京市科技新星等项目,担任ICML、NeurIPS、ICLR等会议领域主席,曾获中国自动化学会自然科学奖一等奖、教育部科学研究优秀成果奖发明一等奖。
报告题目:神经形态脉冲视觉感知计算与应用
盛律
北京航空航天大学教授
简介:盛律,北京航空航天大学教授,博导,入选国家级青年人才、小米青年学者、斯坦福2024-2025年度全球前2%顶尖科学家排行榜单。主要研究方向为三维视觉、多模态大模型和具身智能。在IEEE TPAMI/IJCV以及CVPR/ICCV/NeurIPS/ICLR/ECCV等重要国际期刊和会议发表论文70余篇,Google Scholar显示被引用数超7500次。组织ICML 2024 Multimodal Foundation Models Meet Embodied AI和ICCV 2021 SenseHuman等多个国际会议研讨会。现任ACM Computing Surveys编委,CVPR/ICLR/ECCV/ACM Multimedia/AAAI等领域主席,以及多个领域顶会顶刊审稿人和程序委员。任CCF和CSIG多个专委会执行委员,VALSE执行领域主席。主持或参与多项国家自然科学基金、科技部重点研发计划和省部级重点研发计划项目。
报告题目:基于生成式视觉先验的三维内容高效生成
胡建芳
中山大学副教授
简介:胡建芳,中山大学副教授,博士生导师。主要从事视频时空特征学习理论及应用研究在相关会议和期刊发表学术论文近70篇,以第一作者在国际人工智能顶级期刊IEEE TPAMI发表长文3篇。主持广东省杰出青年基金(2022)项目和国家自然科学基金面上(2020和2025)等项目十余项,曾获广东省自然科学奖二等奖,中国图象图形学会优秀博士学位论文奖等荣誉,多次参加视频理解领域的国际学术竞赛获第一名或第二名。
齐勇刚
北京邮电大学副教授
简介:齐勇刚,北京邮电大学人工智能学院副教授,博士生导师,海南省高层次人才,博士生导师,中国计算机学会高级会员,英国萨里大学视觉语音与信号处理研究中心(CVSSP)国家公派访问学者。研究方向为计算机视觉与模式识别,重点研究抽象视觉感知与生成相关理论及应用。主持或参与国家自然基金、北京市自然科学基金、海南省自然科学基金等多项课题,发表了包括国际顶级学术会议CVPR、NeurIPS、ICLR、ICCV、AAAI、ACM MM及期刊IJCV、TIP等在内的40余篇学术论文。担任中国图象图形学学会文档图像与识别专委会委员;ICLR 2026领域主席等。
郑伟诗
中山大学教授
简介:郑伟诗,教育部“长江学者奖励计划”特聘教授、英国皇家学会牛顿高级学者,现任教育部机器智能与先进计算重点实验室主任。长期研究协同与交互分析理论与方法,解决人体建模和机器人行为的视觉计算问题。发表CCF-A/中科院1区/Nature子刊,论文150多篇。担任国际人工智能顶级期刊IEEE T-PAMI、Artificial Intelligence Journal等期刊的编委。主持承担国家级重点类项目和人才项目5项、以及广东省自然科学基金委卓越青年团队(负责人)项目等。获中国图象图形学学会自然科学奖一等奖、广东省自然科学奖一等奖、国家教学成果奖二等奖等。
视觉基础模型论坛
“视觉基础模型论坛”聚焦视觉智能的最新进展与应用,汇聚来自学界与产业界的专家学者,共同探讨从图像视频理解到具身感知操作的核心问题。今年论坛重点关注面向开放世界可泛化的具身连续学习、面向具身智能应用的视频行为理解、具身场景下视觉基础模型的挑战与对策、人类视觉系统启发下的多媒体计算。论坛内容涵盖连续学习、视频理解、无人系统视觉感知等多个前沿领域,展现了视觉基础模型在具身智能、多媒体计算中的最新探索与突破,推动视觉基础模型在实际应用中的落地与创新。
王瑞平
中科院计算所研究员
简介:王瑞平,中科院计算所研究员、博导,研究领域为计算机视觉与模式识别,重点关注真实开放环境下的视觉场景理解问题。发表国际期刊和会议论文100余篇,Google Scholar引用10,000余次,获授权国家发明专利9项。带领研究生6次获得本领域主流国际学术竞赛冠亚军,获得CVPR2021 CLVISION Workshop最佳论文奖。担任Pattern Recognition、Neurocomputing等国际期刊编委,十余次担任IEEE CVPR(2021/2022/2026)、ICCV(2021/2025)、ECCV(2022/2024)、WACV(2018~2026)等国际会议领域主席,获得IEEE CVPR2019&2025/ICCV2019/FG2019/ECCV2020/NeurIPS2020/ICML2022等国际会议杰出审稿人荣誉,先后在CVPR2015、ECCV2016、ICCV2019等国际会议合作组织并主讲Tutorial。研究成果获得2015年度国家自然科学奖二等奖(第4完成人)、2022年度中国图象图形学学会自然科学奖一等奖(第1完成人)、2019年度国家自然科学基金委优青项目资助。
报告题目:面向开放世界可泛化的具身连续学习
报告摘要:具身智能从封闭专用逐步向开放通用迈进,面临从被动到主动、从闭集到开集、从静态到动态的挑战,一次训练、终身受用为特点的传统学习范式面临较大局限,需建立系统性的具身连续学习范式,实现智能体知识和技能的日益精进,提升在开放环境下的泛化效果。报告将介绍本课题组在具身连续学习方面开展的初步探索及取得的一些具体进展,包括:动态环境下的3D高斯自适应场景表示方法GS-LTS、基于棋盘格表示的具身交互框架R2C、示教视频指导的机械臂操作代码生成框架RoboPro、基于空间网格表示的机械臂动作序列生成框架GAS-Robo、以及面向动态任务的模仿学习方法DBC-TFP。
秦杰
南京航空航天大学教授
简介:秦杰,南京航空航天大学人工智能学院教授、博士生导师、院长助理,脑机智能技术教育部重点实验室副主任,国家级青年人才,江苏省杰青,南航“长空英才”,中国科协海智特聘专家,中国图学学会数字媒体专委会副主任。本科/博士毕业于北京航空航天大学,博士后师从“马尔奖”得主Luc Van Gool教授。目前主要从事人工智能、计算机视觉、具身智能和多媒体等领域的基础理论与关键技术研究。已在国际权威期刊和会议上发表论文100余篇,其中CCF A类国际顶级期刊和会议论文50余篇,Google Scholar引用5900余次,H指数39。获中国图象图形学学会自然科学奖二等奖(排名1)、CCF A类会议ACM MM 2023唯一荣誉提名奖(1/3072)、CCF B类会议ICME 2024最佳论文提名、CCF T1类期刊《计算机研究与发展》优秀论文奖等。担任CCF A类期刊IJCV客座编委、CCF B类期刊Neural Networks副主编、CCF A类会议NeurIPS/AAAI/IJCAI/ACM MM领域主席等。主持国家海外高层次人才引进计划青年项目、国家自然科学基金面上项目、江苏省杰出青年基金项目等国家级/省部级课题。
报告题目:面向具身智能应用的视频行为理解
报告摘要:视频行为理解是视觉内容分析的关键问题,在具身智能、智能安防、智慧体育、自动驾驶等领域有着重要的应用价值。本报告首先聚焦时序动作检测、分割与定位等任务的难点问题,分别介绍团队在上述方面的研究成果,主要包括基于上下文感知的动作检测网络ACGNet,基于预测对比编码的动作分割网络PACE,以及提名无关的动作定位优化框架RefineTAD;在此基础上,进一步发掘上述任务间的共性与互补性,介绍团队近期在视频动作检测-分割-预测一体化方法研究方面的一些初步尝试。最后总结和展望视频行为理解未来可能的发展趋势。
张鼎文
西北工业大学自动化学院教授
简介:张鼎文,西北工业大学自动化学院教授、博导,国家优秀青年科学基金获得者、科睿唯安“全球高被引科学家”,2015赴美国卡耐基梅隆大学进行为期2年的访问研究,致力于建立面向开放环境下、具备动态学习能力的新一代计算机视觉学习框架。迄今为止,作为第一作者/通讯作者在领域内国际重要期刊及会议发表学术论文60余篇,其中包含T-PAMI, IJCV, IEEE SPM, T-IP, CVPR, ICCV, Science China: Information Science等,曾入选中国博士后创新人才计划、AI 华人青年学者榜单, 获吴文俊人工智能优秀青年奖、2021 IEEE TCSVT最佳论文奖、中国图象图形学学会优秀博士论文奖等奖励。担任中国图象图形学学会青年工作委员会副秘书长、中国图象图形学学会优博俱乐部副主席,任IEEE TMM、TCSVT、PR等刊物(客座)编辑。
报告题目:浅析具身场景下视觉基础模型的挑战与对策
蒋铼
北京航空航天大学副教授
简介:蒋铼,北京航空航天大学副教授,中国图象图形学学会青工委副秘书长。学士、博士毕业于北京航空航天大学,博士后期间工作于加拿大英属哥伦比亚大学。主要研究方向为视觉感知模型、多媒体计算、医学图像处理等。主持国家自然科学基金、启元国家实验室、国家互联网应急中心、华为、阿里等科研项目。在国际权威期刊和会议上发表论文40余篇,其中第一或通讯作者论文30余篇,包括TPAMI、IJCV、TIP、TMI等。谷歌学术引用2300余次,单篇最高引用320余次。入选中国科协青年人才托举工程、中组部海外博后引才专项、华为卓越青年学者等,获北京市/CSIG优秀博士学位论文、CVPR质量增强/ECCV立体匹配大赛冠军等多个荣誉。
报告题目:人类视觉系统启发下的多媒体计算
严锐
南京理工大学副教授
简介:严锐,南京理工大学计算机科学与工程学院教授。主要从事人体行为分析、视频内容理解等研究,先后在华为、新加坡国立大学、腾讯、字节跳动、南京大学从事研究工作。目前共发表CCF A类和IEEE/ACM Trans.论文30余篇,其中3篇论文入选ESI高被引/热点论文。主持国家自然科学基金面上/青年、博后“特别资助”和“面上”等项目10余项。曾入选中国图象图形学学会(CSIG)优秀博士论文奖(2024)、江苏省青年科技人才托举工程(2024)、江苏省计算机学会优秀博士论文奖(2024)、南京理工大学优秀博士论文奖(2024)、国家资助博士后计划(2023)、江苏省卓越博士后计划(2023)。此外,担任国际会议如CVPR/ICCV/ECCV/NeurIPS等审稿人,国际期刊如IEEE TPAMI、IJCV等审稿人,中国图象图形学学会多媒体专委会委员。
徐婧林
北京科技大学副教授
简介:徐婧林,北京科技大学智能科学与技术学院副教授,国家自然科学基金青年科学基金B类(原优青)获得者,北京图象图形学学会理事、副秘书长,中国图象图形学学会青托俱乐部副主席。主要研究方向为视频理解、细粒度运动分析,已发表ACM/IEEE Trans.和CCF A类论文30余篇。主持国家自然科学基金面上、青年基金、北京市自然科学基金面上、中国博士后科学基金面上等项目;主持腾讯犀牛鸟专项研究计划;作为合作单位负责人参与国家自然科学基金重点(序2)、北京市自然科学基金联合基金重点(序2)等项目。入选中国科协青年人才托举工程,获中国图象图形学学会石青云女科学家奖、优秀博士学位论文奖,获中国自动化学会自然科学奖一等奖(4/5)、中国图象图形学学会自然科学奖二等奖(3/5)等荣誉。担任《Chinese Journal of Electronics》青年编委、《电子与信息学报》编委等。
刘凡
河海大学教授
简介:刘凡,河海大学教授、博士生导师,计算机与软件学院副院长,兼任水利部水利大数据重点实验室副主任、江苏省计算机学会常务理事、江苏省人工智能学会常务理事、江苏省信息技术应用学会理事,SCI 期刊 KSII TIIS 编委,Frontiers in Computer Science、Remote Sensing等期刊客座编辑。主持国家自然科学基金面上和青年项目、装备预研教育部联合基金、航空科学基金等科研项目20多项,获中国博士后基金特别资助、面上一等资助。发表论文100多篇,ESI高被引论文5篇、热点论文2篇,单篇最高引用5800余次,入选江苏省自然科学百篇优秀学术论文成果,获IEEE ICME 2021最佳演示奖、IJCAI 2021 LTDL最佳数据集论文奖,获第一发明人授权专利23项,出版规划教材2部、专著1部。获江苏省高等学校科学技术研究成果奖二等奖、江苏省自动化学会青年科技奖。入选全球前2%顶尖科学家榜单、江苏省优青、江苏省“青蓝工程”优秀青年骨干教师、江苏省科协青年科技人才托举工程。
舒祥波
南京理工大学教授
简介:舒祥波,南京理工大学计算机科学与工程学院/人工智能学院副院长、教授、博士生导师、社会安全信息感知与系统工信部重点实验室副主任。研究方向为人体行为计算,在TPAMI、CVPR、ICCV、MM、NeurIPS等期刊/会议上发表论文100余篇,其中ESI高被引论文8篇;获中国电子学会自然科学一等奖、ACM MM 2015最佳论文提名、MMM 2016最佳学生论文奖、江苏省优博、中国人工智能学会优博、2024年度江苏自然科学百篇优秀学术成果论文;入选全球前2%顶尖科学家(2021-2025年);承担国家重点研发课题、国家自然科学基金仪器项目课题、国家自然科学基金优青/面上/青年项目、江苏省杰出青年等项目。担任CSIG青工委副秘书长,以及TNNLS、TCSVT、Pattern Recognition等期刊编委。
走向通用行人重识别论坛
在计算机视觉与人工智能领域快速发展的背景下,行人重识别技术作为智能安防、智慧交通、自动驾驶等核心应用的关键支撑,正朝着更通用、更鲁棒、更适配复杂真实场景的方向突破。CCBR2025 “走向通用行人重识别” 分论坛聚焦该领域核心技术瓶颈与前沿发展趋势,特邀 5 位来自国内顶尖高校的专家学者,从特征学习、跨域泛化、跨模态融合、任务边界探索及连续场景适配等关键维度,分享最新研究成果与深度思考,为推动行人重识别技术从 “特定场景适用” 迈向 “通用化落地” 搭建高质量学术交流平台。
论坛报告内容紧扣领域核心痛点与前沿方向,兼具理论深度与应用导向。湖南大学刘敏教授将介绍团队在鲁棒行人重识别方面的系列研究进展,涵盖噪声与稀疏标注下的学习机制、黑盒对抗攻击下的鲁棒性评估与防御方法,以及面向遮挡、跨模态与换衣场景的识别新框架。中国科学技术大学常晓军教授将围绕“行人重识别的多层语义特征学习与跨域泛化研究”展开分享,针对不同场景下数据分布差异导致的模型泛化能力不足问题,深入剖析多层语义特征的构建逻辑与跨域适配机制,为提升模型在复杂环境中的鲁棒性提供理论与方法支撑;四川大学胡鹏教授聚焦“开放环境下的跨模态行人重识别”,探讨在光照突变、遮挡严重、模态缺失等开放场景中,如何实现视觉、红外、文本等多模态信息的有效融合与匹配,破解开放环境下行人重识别的技术难题;昆明理工大学李华锋教授则从“行人重识别vs行人检索与定位”的对比视角出发,厘清两项关联任务的技术边界与共性需求,为跨任务技术迁移与协同优化提供新思路;西安电子科技大学程德教授针对 “面向连续场景的无监督多模态行人再识别方法研究”,重点突破连续动态场景下标注数据稀缺、模态信息动态变化等挑战,探索无监督学习框架下多模态信息的高效利用路径;北京交通大学金一教授围绕“模态共性与模态特性:跨模态行人再识别思考”,深入挖掘不同模态数据的本质共性与独特特性,为设计更高效的跨模态特征对齐与匹配模型提供底层理论参考。
本次分论坛汇聚了国内行人重识别领域的核心研究力量,报告内容覆盖从基础理论创新到实际场景适配的全链条探索,不仅将展现该领域的最新研究进展,更将为行业同仁提供思想碰撞与技术交流的重要契机,助力推动我国行人重识别技术向通用化、产业化方向加速迈进。
刘敏
湖南大学教授
简介:刘敏,湖南大学二级教授,人工智能与机器人学院党委书记。国家杰出青年基金获得者,教育部青年长江学者,国家重点研发计划首席科学家。北京大学学士,美国加州大学河滨分校博士,湖南省自动化学会副理事长,机械工业先进制造视觉检测与控制技术重点实验室主任,中国图像图形学会理事、青工委副主任。先后主持国家重点研发计划项目2项、国家自然科学基金重点项目1项,获国家级、省部级科研奖励5项。
报告题目:数据、安全与场景:行人重识别鲁棒性的三重挑战与应对
报告摘要:行人重识别技术旨在实现跨摄像网络下对特定行人的精准检索与匹配,是智能视频分析的核心技术,在公共安全与智能监控等领域具有至关重要的应用价值。但在实际应用场景中,数据标签不完备、模型对抗攻击脆弱性、场景动态复杂的问题普遍存在,显著削弱了识别鲁棒性,严重制约了行人重识别模型的实际部署。本报告围绕以上三大难点介绍我们团队在鲁棒行人重识别方面的系列研究进展,涵盖噪声与稀疏标注下的学习机制、黑盒对抗攻击下的鲁棒性评估与防御方法,以及面向遮挡、跨模态与换衣场景的识别新框架。我们希望通过这些工作,推动行人重识别技术从“实验室优秀”迈向“实战中可靠”,为构建更稳健、实用的视觉智能系统提供思路与路径。
常晓军
中国科学技术大学教授
简介:常晓军,教授,中国科学技术大学讲席教授、国家级高层次人才,曾获得澳大利亚研究委员会的早期职业研究奖。主要研究方向包括多模态学习、计算机视觉、绿色人工智能及其在社会公益中的应用。先后主持了包括澳大利亚研究委员会在内的十多个国家级项目。其研究成果已在国际顶级期刊(如T-PAMI、TIP)和CCF A类会议上发表超过150篇论文,谷歌学术引用次数超过18,000次,其中21篇论文被选为ESI高被引/热点论文,2019至2023年连续被评为科睿唯安高被引学者。现担任IEEE TCSVT、IEEE TNNLS、ACM TOMM等国际顶级期刊的副主编,以及CCF A类会议的领域主席。
报告题目:行人重识别的多层语义特征学习与跨域泛化研究
报告摘要:行人重识别技术在智能安防、智慧交通等领域应用广泛,但不同场景下数据分布差异大,导致模型泛化能力不足,成为制约技术落地的关键瓶颈。本报告聚焦这一核心问题,深入研究多层语义特征学习与跨域泛化方法。首先,剖析行人图像中从低级视觉特征到高级语义信息的层级结构,构建多层语义特征提取框架,实现对行人关键信息的全面捕捉;其次,针对跨域场景数据分布偏移问题,设计有效的跨域适配机制,通过域间特征对齐、迁移学习策略等,降低场景差异对模型性能的影响;最后,通过大量实验验证所提方法在多个公开数据集上的有效性,结果表明该方法能显著提升模型在跨域场景下的识别精度与鲁棒性,为行人重识别技术的通用化应用提供重要理论与方法支撑。
胡鹏
四川大学教授
简介:胡鹏,四川大学计算机学院教授,博士生导师,国家级青年人才。主要研究方向为多模态学习和多媒体分析。已在Nature子刊、TPAMI、IJCV、CVPR、NeurIPS、ICML等国际期刊/会议上发表学术论文90余篇,包括多篇ESI高被引/热点论文。研究成果获得中国图象图形学学会(CSIG)自然科学一等奖、四川省自然科学二等奖、中国人工智能学会教学成果激励计划一类成果等。主持国家自然基金(面上、青年)项目、国家重点研发计划课题、四川省重点研发基金项目等。担任CSIG青工委副秘书长、VALSE执委会副主席等;担任Pattern Recognition等期刊编委;担任NeurIPS、ICML、CVPR、ECCV、ACM MM等多个重要国际学术会议的领域主席;担任TPAMI、IJCV、TIP、TKDE等多个国际重要SCI期刊审稿人。
报告题目:开放环境下的跨模态行人重识别
李华锋
昆明理工大学教授
简介:李华锋,博士,昆明理工大学教授,博士生导师。云南省杰出青年基金获得者、云南省“兴滇英才支持计划”青年拔尖人才, 国际期刊 IEEE TIP 副编辑 (Associate Editor)、Information Fusion 编委(Editorial Board Member)、IEEE SPL 副编辑 (Associate Editor)、AAAI高级程序委员会委员(SPC)、重庆大学学报青年编委。主持国家自然科学基金面上项目、地区基金、青年基金共计4项、云南省杰出青年基金1项、云南省基础研究重点项目1项、青年项目1 项。在 CVPR、ICCV、AAAI、ACMMM、IJCV、 IEEE TPAMI、IEEE TIP、IEEE TIFS等高水平期刊和会议上发表学术论文 60 余篇。获云南省自然科学二等奖1项(排名第1) , 授权国家发明专利 40 余项, 技术转让 10 项。
报告题目:行人重识别 vs 行人检索与定位
金一
北京交通大学教授
简介:金一,北京交通大学计算机学院教授,博导,CCF杰出会员。担任CCF YOCSEF副主席(25-26),多媒体专委会、大数据专委会执委等。任国家重点研发计划重点专项专家组委员,主要研究领域包括:多模态数据融合感知、交通视频语义理解、可信行为分析及多媒体隐私保护等。主持国家级、省部级项目10余项,发表学术论文70余篇,ESI高被引论文5篇,其中包括IEEE/ACM汇刊等领域重要期刊和CCF A类会议CVPR,AAAI,ICCV,ICAI,ACM MM等。授权国家发明专利37项,参编国家、行业标准3项。获IEEE Computer Society年度最佳论文奖提名奖等国际论文奖励3项,第五十届日内瓦国际创新发明银奖、2023年中国产学研合作创新与促进奖创新成果二等奖、2024年通信学会科技进步二等奖、铁道学会科技进步二等奖等奖项,入选2023年度北京市轨道交通学会杰出青年人才。
报告题目:模态共性与模态特性:跨模态行人再识别思考
程德
西安电子科技大学副教授
简介:程德,副教授,博士生导师,空天地一体化综合业务网全国重点实验室(ISN)成员,曾任华为公司主任工程师,美国卡内基梅隆大学(CMU)联合培养博士。研究方向为计算机视觉、机器学习、人工智能等,近年来在CVPR、ICCV、NeurIPS、IJCV、TIP等领域顶级期刊和会议上发表论文100余篇,其中包括第一/通讯作者中科院1区TOP期刊和CCF-A类顶会论文50余篇,个人一作论文单篇最高被引用超过1600余次。目前主持国家自然科学基金面上项目2项、国家重点研发计划子课题、陕西省重点研发计划等多项国家和省部级项目。
报告题目:面向连续场景的无监督多模态行人再识别方法研究
赵才荣
同济大学教授
简介:赵才荣,教授、博士,现任同济大学计算机科学与技术学院教授,博士生导师,计算机智能教研室主任。曾任香港理工大学兼职研究员(2016-2017)。目前担任上海市计算机学会计算机视觉专委会主任,中国图象图形学学会青工委秘书长,中国人工智能学会粒计算与知识发现专委常委,中国计算机学会杰出会员,担任IEEE TMM Guest Editor、《中国图象图形学报》、《计算机科学》青年编委。主要研究领域:计算机视觉,主要聚焦于智能视频行人分析及其隐私安全研究,重点研究高效可信行人再识别、多模态数据驱动的自动驾驶以及垂直领域模型的知识表示与推理问题。已在TPAMI、IJCV、《中国科学.信息科学》、CVPR、ICML、NIPS等发表学术论文50余篇,受理发明专利20余项(授权18项),研究成果获2022年上海市科技进步一等奖(序4/13),研究成果获2023年上海市自然科学二等奖(序1/4),获《中国科学:信息科学》2023年度热点论文奖,获第二届全国人工智能应用场景创新挑战赛总决赛特等奖(序3/16)。
叶茫
武汉大学教授
简介:叶茫,武汉大学计算机学院教授、智能科学系主任、国家高层次青年人才,科睿唯安高被引科学家。长期从事多模态计算、联邦学习、医学人工智能等领域研究,以第一/通讯作者发表 CCF-A 类论文100余篇,谷歌学术引用 14000余次。担任CCF-A类IEEE TIP、IEEE TIFS等期刊编委,CVPR、ICLR、NeurIPS、ICML、AAAI等会议领域主席等学术职务。主持国自科-香港联合基金、科技部重点研发计划课题等10余项科研项目。连续入选斯坦福排行榜“全球前2%顶尖科学家”,百度AI华人青年学者等荣誉。
高赞
天津理工大学教授
简介:高赞,山东省人工智能研究院,教授,博士生导师,国家青年人才、山东省突贡专家、全球前2%顶尖科学家、山东省高等学校优秀青年 “智能媒体分析与视觉感知”创新团队负责人。近年来,主持完成或在研国家基金4项,参与包括国家自然基金重点,国家重点研发计划等省部级以上课题10余项。在国际高水平会议和期刊上发表论文100余篇,IEEE/ACM汇刊或CCF A类会议60余篇,其中包括TPAMI,CVPR等, 6篇论文入选ESI高被引,1篇入选热点论文,2021年获CCF A类会议SIGIR 最佳学生论文。此外,先后获天津市科技进步一等奖、山东省科技进步一等奖、山东省技术发明一等奖和天津市科技进步二等奖各1项,获授权发明专利50余项,其中包括2项国际专利。目前兼任计算机学会杰出会员,中国图形图像学会高级会员,IEEE高级会员,山东省人工智能学会常务理事,计算机学会多媒体技术专委会、计算机视觉专委会和模式识别与人工智能委员会执行委员,中国图形图象学会多媒体技术专委会执行委员。受邀担任20余个国际知名期刊和会议的领域主席、程序委员会委员和审稿人,担任Neural Network等多个国际期刊编委或客座编委。
刘羽
合肥工业大学教授
简介:刘羽,合肥工业大学仪器科学与光电工程学院教授、博士生导师,国家级青年人才计划入选者,科睿唯安全球高被引科学家(2023至今),爱思唯尔中国高被引学者(2020至今)。主要研究方向包括多源图像融合、医学图像处理、计算机视觉等。近年来,在IEEE TPAMI、IJCV、IEEE TIP、INFFUS等国际权威期刊上发表论文100余篇,谷歌学术总被引18000余次,20余篇论文入选ESI高被引论文。获安徽省自然科学二等奖、中国电子学会自然科学二等奖、吴文俊人工智能优秀青年奖、IEEE TIM等两个国际期刊年度最佳论文奖等。担任IEEE TIP、Information Fusion、IEEE SPL、中国图象图形学报等期刊编委。
崔金荣
华南农业大学副教授
简介:崔金荣,副教授,博士,硕士研究生导师;CCF和CSIG会员,YOCSEF广州25-26学术AC,广东省图象图形学会计算机视觉专委会副秘书长,广东省2024年农村科技特派员。博士毕业于哈尔滨工业大学(深圳),主要研究方向是掌纹识别,缺失多视图聚类,计算机视觉,智慧消防等;2019年6月作为访问学者赴英国曼彻斯特大学交流访问一年。发表学术期刊和会议论文40余篇,并以第一作者/通讯作者在TIP、TNNLS、Neural Networks等国际权威期刊和ACM MM、ICME等重要国际会议上发表论文30余篇。先后主持和参与包括国家自然科学基金在内的国家级、省部级以及横向科技项目10余项,获广东省计算机学会优秀论文奖一等奖和二等奖等。
生物特征安全与隐私保护论坛
生物识别技术的发展推动生物信息在身份认证领域蓬勃发展。随着人们对安全性和隐私的持续关注,引发了对生物识别技术进一步应用推广的担忧。安全使用和保护个人生物特征数据的问题亟待解决。本论坛聚焦生物特征安全与隐私保护领域的核心挑战,邀请了六位在生物特征安全与隐私保护领域具有深厚造诣的专家。北京工业大学毋立芳教授将介绍从不同人脸攻击类型的独有特征出发,提出多视角特征学习网络,学习各攻击类型和活体人脸之间的独特差异,以提升不同攻击类型的检测准确率。中科院自动化所万军研究员将探讨人脸防伪的核心挑战,针对多模态数据融合、跨模态转换、灵活模态适配及泛化性提升等问题,提出了一系列创新性防伪算法。西安交通大学李慧斌教授将分享为应对实际跨场景、跨攻击类型部署时,因分布偏移而导致性能急剧下降的问题,从如何学习具有高度泛化能力的特征表示入手,提升了人脸防伪泛化能力。蚂蚁数科产品方案总监张逸轩的报告将聚焦威胁企业安全与用户信任的核心痛点,通过安全数字身份的出海实践,提出以技术创新与合规管理为核心的防御体系。南昌航空大学冷璐教授将全面探讨生物特征系统的安全性和隐私性,并对其进行系统、综合的评估。安徽大学董兴波副教授将重点分析针对生物特征在图像域和特征域的重构攻击以及模板攻击,介绍以生物特征密码系统为代表的隐私保护关键技术。期待本次论坛为广大参会的老师、学生提供一个交流和学习的机会,促进本领域内的专家学者与产业界的深入合作和交流,推动生物特征安全与隐私保护技术的进步和产业化进程。
毋立芳
北京工业大学教授
简介:毋立芳,北京工业大学信息科学技术学院教授、博导,中国计算机学会(CCF)杰出会员,中国图像图形学学会(CSIG)杰出会员,IEEE 高级会员。研究方向包括图像视频内容分析与理解,人脸活体检侧、智能3D打印等。近年来承担科技部重点专项课题、国家自然科学基金、北京市科技计划项目等20余项,在IEEE TMM、TIFS、PR、IJCV、ICCV等期刊和会议发表论文100余篇。获北京市三八红旗奖章、北京市科技进步二等奖等6项,担任CCF理事,CSIG理事,CCF计算机视觉专委会常务委员兼副秘书长。TM、中国图像图形学报、信号处理编委。
报告题目:基于跨域特征学习的人脸活体检测
万军
中国科学院自动化研究所研究员
简介:万军 中科院自动化所多模态人工智能系统全国重点实验室研究员、博导,北京市杰出青年科学基金获得者,重点研发“战略性科技创新合作”重点专项项目负责人,中科院对外合作重点项目负责人,IEEE Senior Member。从事智能视频分析与交互研究,发表学术论著100余篇。受IEEE TPAMI前主编、多伦多大学Sven Dickinson 教授邀请以第一作者撰写首部多模态人脸防伪专著。担任IEEE TPAMI、IJCV和IEEE TBIOM客座编辑、IEEE TIFS和IET Biometrics编委和AAAI/ACM MM/ICME/FG/ICPR等多个领域主席或高级程序委员。以Chair身份在CVPR (2019、2020、2023、2024),ICCV 2021、2025上举办人脸防伪赛事,吸引超1700支国内外队伍参赛,获国内外广泛关注。曾获得2022年度中国图象图形学学会自然科学奖二等奖(第一完成人)、第十三届北京青年优秀科技论文一等奖和国内外重要赛事冠军5项。
报告题目:人工智能安全:物理和数字伪造攻击检测研究
报告摘要:本报告围绕人脸防伪的核心挑战,系统介绍了团队在该方向的研究进展,主要包括三个方面:(1)方法创新:针对多模态数据融合、跨模态转换、灵活模态适配及泛化性提升等问题,提出了一系列创新性防伪算法;(2)数据构建:回顾了近五年发布的多个权威人脸防伪数据库,包括CASIA-SURF、CeFA、HiFiMask、SuHiFiMask和UniAttackData,为领域研究提供了重要的基准资源;(3)学术赛事:通过在国际顶级会议CVPR和ICCV上共举办六次人脸防伪竞赛和研讨会,推动了全球学术界和工业界的技术交流与进步。进一步,针对新型攻击手段的演进,本报告还探讨了数字与物理伪造联合攻击检测的前沿研究,分析了跨域攻击的共性特征与防御策略,为构建更鲁棒的人脸防伪系统提供了新思路。本研究对提升生物识别系统的安全性具有重要意义,并为未来人工智能安全技术的发展提供了参考。
李慧斌
西安交通大学教授
简介:李慧斌,教授,博导。现任西安交通大学数学与统计学院院长助理,西安大数据与人工智能研究院常务副院长,国家生物安全证据基地—生物特征识别中心主任。2013年获法国里昂中央理工大学博士学位。主要从事应用数学、三维视觉、生物特征识别等方面的研究,先后主持科技部、基金委、校企等20余项研究项目。在学术期刊和会议如IEEE TPAMI/TIP/TVCG/TIFS/IJCV/ NeurIPS发表高水平论文70余篇(引用4000多次),申请/授权发明专利30项。曾获欧盟生物特征识别奖、陕西省自然科学奖一等奖等奖项,“高精度三维人脸识别产品研发及产业化”获陕西高等学校优秀成果奖一等奖。参与撰写了公安部 《安全防范三维人脸识别设备技术规范》标准。
报告题目:基于分布最优传输、分布鲁棒优化以及双曲度量学习的人脸防伪泛化方法
报告摘要:人脸防伪技术在实际跨场景、跨攻击类型部署时,常因分布偏移而导致性能急剧下降,其主要挑战在于如何学习具有高度泛化能力的特征表示。为应对此挑战,本报告从多几何空间分布特征学习的角度出发,分享课题组近几年在将分布鲁棒性学习以及最优传输理论应用于人脸防伪泛化问题的研究成果。包括1)基于加权联合分布最优传输的跨场景人脸防伪方法,2)基于分布鲁棒性学习的人脸防伪泛化方法,3)基于双曲度量学习的人脸防伪泛化方法,以及在跨场景、跨攻击类型的领域自适应和领域泛化人脸防伪中的应用。
张逸轩
蚂蚁数科产品方案总监
简介:张逸轩先生现任蚂蚁数科产品方案总监,拥有10年以上全球风控领域实战经验,曾先后任职于平安集团、阿里巴巴集团等头部企业,深度参与国内外金融、科技领域的风险管理体系搭建与创新实践。在身份安全领域,以“AI驱动”为核心,主导设计了多款智能化风控产品及方案,服务全球亿级用户。其主导的深度防伪deepfake产品体系和港澳区域的落地实践方案,被行业视为推动深度防伪技术的先行者。长期聚焦前沿技术落地,其推动的ZOLOZ人脸识别方案,作为亚太唯一厂商入选Gartner 身份验证魔力象限,获得多国金融监管机构的高度好评。
报告题目:抵御AI深度伪造,守护身份安全的最佳出海实践
冷璐
南昌航空大学教授
简介:冷璐,教授、博士,南京航空航天大学和韩国延世大学博士后,美国西弗吉尼亚大学和韩国延世大学访问学者,现任南昌航空大学计算机视觉研究所所长。已发表学术论文150余篇,其中SCI论文80余篇。主持多项课题,包括国家自然科学基金项目6项,担任100多个国际期刊和会议审稿人。研究领域包括计算机视觉、生物特征模板保护、生物特征识别、医学图像处理、信息隐藏等。多次入选全球前2%顶尖科学家榜单,获江西省自然科学奖一等奖1项,获江西青年五四奖章,入选江西省新时代赣鄱先锋、“科创中国”江西省企业“创新达人”杰出代表、江西省“百千万人才工程”人选、江西省“远航工程”人选。
报告题目:从精度到安全:构建生物特征系统的多域分析架构
董兴波
安徽大学副教授
简介:董兴波,安徽大学特聘副教授、博士。入选国家工信部QM计划博士后专项和韩国科学技术信息通信部及韩国研究基金会国际人才引进计划Brain – Pool以及欧盟地平线计划玛丽居里学者。本科毕业于华中农业大学,后于澳大利亚莫纳什大学获博士学位。研究聚焦生物特征识别安全保护算法、图像处理等。主持国家自然科学青年基金、韩国国家研究基金会Brain Pool Program等项目。
报告题目:生物识别隐私保护关键技术
金哲
安徽大学教授
简介:金哲,安徽大学教授,博士生导师、入选安徽省“百人计划”创新项目,欧盟玛丽居里学者,在意大利萨萨里大学(导师:Massimo Tistarelli)、奥地利萨尔斯堡大学(导师:Andreas Uhl)从事博士后研究。研究方向主要包括可信人工智能、计算机视觉、模式识别及多媒体安全等方面的研究。主持国家自然科学基金面上项目、安徽省自然科学基金面上项目等省部级课题和马来西亚教育部多项海外科研项目。发表IEEE/ACM Trans.汇刊和CCF A类论文50余篇。中国图象图形学学会生物特征识别专委会委员。
费伦科
广东工业大学教授
简介:费伦科,广东工业大学教授,博士生导师,计算机学院院长助理,哈尔滨工业大学博士,澳门大学博士后,CCF/CSIG/IEEE高级会员,研究方向主要包括模式识别、计算机视觉、生物特征识别和机器学习等。发表IEEE Trans.汇刊和CCF A类论文50余篇,发表论文Google学术引用8500余次。担任国际期刊《Transactions on Information Forensics & Security》和《Pattern Recognition》编委。主持国家自然科学基金项目3项,获广东省科技进步二等奖1项,获国际/国内学术会议最佳论文/最佳学生论文奖4次,入选2023和2024 年斯坦福大学发布的全球前2%顶尖科学家榜单。
手部特征识别论坛
手部生物特征识别论坛是一个专注于探讨手部生物特征识别技术及其应用的学术交流平台。本次论坛聚焦于该领域的创新突破,邀请了五位在手部生物特征识别技术领域具有深厚造诣的专家。清华大学的冯建江副教授将探讨手部状态感知与交互的创新技术,致力于解决现有输入技术的缺陷,提升手部交互的体验与效率。华南理工大学的康文雄教授将分享其团队在手部生物特征识别领域的创新探索,这些创新研究显著提升了识别精度与用户体验,并增强了识别的鲁棒性与安全性。东南大学的桂杰教授将介绍大规模指静脉合成数据集的构建及其在安全隐私保护方面的创新应用,为指静脉识别技术的大规模应用提供了有力支持。西安交通大学的钟德星教授将分享其在掌纹掌静脉技术在生理心理学领域的创新应用研究,探索该技术在情绪、认知、压力等心理状态监测中的新用途。腾讯优图实验室的张睿欣研究员将介绍掌纹掌静脉技术在实际应用中的现状、问题及研究进展,展望未来的研究方向。期待本次论坛能够为与会者提供一个交流和学习的平台,促进专家学者之间的深入合作和学术交流,推动手部生物特征识别技术的进步和产业化进程。
冯建江
清华大学自动化系长聘副教授
简介:清华大学自动化系长聘副教授,博士生导师。研究方向包括生物特征识别、人机交互、医学影像分析。主持科技部重点研发课题、国自然优秀青年基金等项目。担任IEEE T-IFS、T-BIOM编委、中国生物特征识别会议(2015-2021)程序委员会主席、国际生物特征识别会议(2014-2016,2021,2025)领域主席等。发表IEEE和ACM期刊论文50余篇,合著《Handbook of Fingerprint Recognition》第三版(Springer出版)。获国家技术发明二等奖(2018)、中国电子学会一等奖(2011)、公安部科技进步一等奖(2024)、浙江省自然科学一等奖(2022)、教育部自然科学二等奖(2011和2015)、中国发明专利银奖(2019),六次获得会议最佳论文奖或提名。
报告题目:手部状态感知与交互
康文雄
华南理工大学教授
简介:康文雄,教授、博士生导师,现任华南理工大学自动化科学与工程学院副院长、广东省智能金融企业重点实验室副主任、华工-奔流电力人工智能联合实验室主任。同时,兼任国际模式识别学会生物特征识别技术委员会副主席、广东省中国图象图形学学会理事,为中国计算机学会/中国图象图形学学会杰出会员。近年来,主持并参与国家重点研发计划、173基础加强计划重点项目、国家自然科学基金项目等科研项目。在国内外重要专业期刊及学术会议上发表并被录用论文一百余篇,其中10篇论文荣获最佳论文奖、杰出论文奖和优秀论文奖。已获得授权国际发明专利6项、国家发明专利60多项,其中转让专利19项。部分研究成果已在机场、电网、商超、工厂等应用场景中得到部署与应用,取得了良好的经济与社会效益。
报告题目:手部生物特征识别领域的创新探索研究
报告摘要:本报告聚焦手部生物特征识别领域的创新探索,主要介绍本团队在该领域开展的四项创新研究,包括:反射式指静脉识别系统,通过优化成像模式与核心算法显著提升识别精度与用户体验;三维指静脉识别系统,重构全视角三维指静脉结构以增强识别鲁棒性与安全性;非停留式掌静脉识别系统,有效破解开放动态场景下的识别难题;以及手势认证系统,融合手部行为特征与生理特征提升认证安全性及交互体验。各系统均涵盖数据集构建、算法创新和样机研制,致力于推动手部生物特征识别技术向高效、便捷、安全方向演进,拓展其在安防、金融等多元场景的应用价值,为生物特征识别研究与产业化提供一些有益的参考。
桂杰
东南大学教授
简介:桂杰博士,东南大学青年首席教授、博士生导师,国家青年高层次人才(国家级四青人才)。现任东南大学网络空间安全学院智能安全系主任、区块链应用与监管教育部工程研究中心副主任,曾任东南大学网络空间安全学院教师支部书记。2010年获中国科学技术大学模式识别与智能系统专业博士学位,2012年获得澳大利亚长江研究学者奋进奖学金(全球十人、中国四人),在澳大利亚悉尼科技大学量子计算和智能系统中心进行合作研究。2017年7月至2020年9月,先后在美国罗格斯大学和密西根大学从事研究工作。目前主要从事模式识别、机器学习、图像处理、计算机视觉及人工智能安全等方面的研究,更具体来说,主要包括生成式人工智能、对抗攻击和防御、自监督学习、哈希学习、图像复原等。
报告题目:大规模指静脉合成数据集的构建、应用与安全隐私
报告摘要:指静脉识别(FVR)技术因其活体检测特性和高安全性成为生物特征识别领域的研究热点,但其发展长期受限于训练数据的稀缺性。当前公开指静脉数据集普遍存在瓶颈:1)身份数量有限(<1000个),2)单身份样本稀少(2-12个/指),3)类内变异不足(多为单次采集),4)标注信息缺失(如关节腔位置、ROI区域等)。相比之下,人脸识别领域已拥有超400万身份的公开数据集,指纹识别亦有近万身份数据支撑。指静脉识别一直受到数据集规模小、样本有限的限制,难以充分发挥深度学习的潜力。为此,我们研究了一种多样化指静脉图像的合成框架工具,并基于它构建了FingerVeinSyn-5M,目前规模最大的公开指静脉数据集,通过合成框架生成了500万样本(覆盖5万独特手指身份,每个身份100种类内变化)。该数据集首次提供完整标注(静脉纹理掩膜、手指形状掩膜、关节腔坐标和ROI框),支持指静脉识别领域的深度学习的进一步研究。此外,随着指静脉识别技术逐步走向大规模应用,安全与隐私保护的重要性愈发凸显。生物特征一旦泄露将无法更换,因此在保障识别准确性的同时实现可撤销识别,确保模板的不可逆性、不可链接性与可撤销性,已成为指静脉识别的重要研究。
钟德星
西安交通大学教授
简介:钟德星,西安交通大学自动化学院教授、博士生导师,西安交通大学第一附属医院特聘教授。IEEE Senior Member,中国计算机学会、中国图象图形学学会高级会员。教育部教育质量评估中心、教育部学位与研究生教育发展中心评估专家。主编教材《机器视觉技术及应用》入选工信部“十四五”规划,教育部战略性新兴领域“十四五”高等教育教材体系,参与发表国家出版基金项目《智能生物识别前沿研究》专著。长期从事掌纹掌静脉识别等生物特征识别技术、人工智能辅助诊断等医学图像分析技术的研究工作,担任工信部信通院“掌纹掌静脉识别系统技术要求”和信标委“掌纹掌静脉融合识别系统技术规范”标准编制专家。
报告题目:Beyond Identity Recognition掌纹掌静脉在生理心理学的应用探索
张睿欣
腾讯优图实验室研究员
简介:上海交通大学获得计算机本科与硕士学位。14年加入腾讯优图实验室,主要研究方向为生物识别、场景理解等领域,目前为优图实验室刷掌算法负责人,带领团队完成微信刷掌支付的算法架构设计与工程化落地。参与打造了优图实验室人脸识别等核心算法,相关技术在LFW、KITTI、IMW等国际权威评测中多次刷新世界纪录,在CVPR/ICCV/ECCV/NeurIPS/AAAI等CCF-A类会议及Nature子刊等顶级期刊发表学术论文20余篇。
报告题目:掌纹掌静脉应用与研究
刘凤
深圳大学副教授
简介:2014年在香港理工大学电子计算学系获得博士学位,之后作为海外高层次人才由深圳市政府引进,现为深圳大学副教授,博士生导师。获得深圳市海外高层次人才,深圳市后备人才,南山区领航人才称号。主要研究领域为生物特征识别、医学图像处理等领域。近年来在相关领域(TIP,TIFS, IEEE Transactions on Cybernetics, TNNLS, PR等)JCR1区期刊发表学术论文60余篇,并在ICCV, ECCV,AAAI,IJCB等相关领域国际国内会议上发表论文10余篇,其中一篇论文获得广东省计算机学会优秀论文二等奖。申请发明专利20余项,授权国内发明专利10余件,并完成授权专利转化 1 项。主持包含国家自然科学基金面上,青年基金等项目10余项。承担多个会议及期刊的审稿工作,并担任相关领域会议ICB,CCBR,PRML,WSB的local chair,session chair等工作。
赵淑平
广东工业大学副教授
简介:赵淑平,副教授,广东工业大学青年百人计划A层次人才引进。2020年在澳门大学电脑与信息科学系获得哲学博士学位,随后在清华大学进行访问研究以及在澳门科学技术发展委员会(澳门大学)担任博士后研究员。近年来主要研究集中在生物特征识别、多模态/多视图学习、计算生物学等领域,包括在基础研究领域发表Nature子刊1篇(IF. 56),在基因组学国际权威期刊N.A.R发表AI for药物预测重要成果。此外,在相关领域期刊和会议发表论文90余篇(TIP, TIFS, TNNLS, TSMC, TMM, IJCAI, AAAI, ACM MM等),3篇论文入选ESI高被引及热点论文。主持(PI)包含国家自然科学基金、澳门科技发展基金、广东省自然科学基金等项目10余项。承担多个会议及期刊的审稿工作,曾获得ACM MM 最佳审稿人奖,担任《Electronics》客座编辑。在ICME(法国)以及IJCB(日本)组织了先进生物特征识别及隐私保护特别论坛,以及在IJCAI、CWCN等会议承担的Area Chair工作。
李树一
北京工业大学副研究员
简介:李树一,北京工业大学信息科学技术学院副研究员、博士生导师,入选澳门青年学者、北京市高层次留学人才、北京市青年人才托举工程、BSIG最美女科技工作者、北京工业大学高层次人才队伍建设计划青年优秀人才。主要研究方向为生物特征识别、视觉多模态融合、多视图学习以及联邦学习算法及应用等。在IEEE TIP、TIFS、TMM、TBIOM、TCSVT、INFFusion、PR、AAAI等国内外知名期刊和会议上发表论文50余篇;获IJCB2022、CCBR2022、CCBR2018最佳论文奖和ISCAI2024最佳海报奖;申请国家发明专利12项。主持国家自然科学基金青年项目、北京市自然科学基金面上项目、北京市高层次留学人才回国资助等项目9项;担任CSIG生物特征识别专委会副秘书长。
黄俊端
华南师范大学副研究员
简介:华南师范大学特聘副研究员、硕导。主要研究领域包括生物特征识别、计算机视觉、深度学习、人工智能、智慧农业等。博士毕业于华南理工大学,曾受国家公派至瑞士Idiap研究所/瑞士生物特征研究与测试中心访学一年。合著发表包括IEEE-TIFS/IEEE-TCSVT等国内外权威或知名SCI/EI刊物学术论文二十余篇。担任中国图象图形学学会生物特征识别专委会副秘书长、中国人工智能学会会刊《智能系统学报》青年编委、IEEE Transactions系列、PR、NN、ESWA、COMPAG等国内外权威或重要期刊和会议的审稿人。中国人工智能学会模式识别专委会委员、中国计算机学会计算机视觉/人工智能与模式识别/数字农业专委会委员、中国图象图形学学会生物特征识别/视觉认知与计算专委会,IEEE/CCF/CSIG/CAAI会员。
文杰
哈尔滨工业大学(深圳)青拔副教授
简介:文杰,哈尔滨工业大学(深圳)青拔副教授,博导,IEEE/CCF/CSIG高级会员,CCFAI、CCFMM、CCFCV等专委执行委员,CSIG-MM、CSIG-BVD、CSIG青工委执行委员,CAAI-PR专委委员,CAAI-CCML专委通讯委员,CAA-PRMI专委委员。2019年获评“中国博士后创新人才支持计划”。主持国自然面上、国自然青年、广东省青年提升(省优青)、广东省粤深青年基金、深圳市基础研究面上等十多个项目。主要研究方向包括多模态/多视图学习、异常检测、目标检测等,近年来在TPAMI、NeurIPS、ICML、CVPR、ICCV等期刊和会议上发表论文百余篇,谷歌学术引用7500多次,7篇一作/通讯论文入选ESI高被引论文,一篇通讯作者论文获AAAI 2023优秀论文奖。现担任IEEE TIP、IEEE TIFS、Pattern Recognition、International Journal of Image and Graphics期刊副编辑,担任Information Fusion期刊领域编辑,担任Discover Artificial Intelligence、Mathematics期刊编委,担任中国人工智能学会旗舰SCI期刊CAAI TRIT青年编委,也受邀担任人工智能顶级期刊IEEE TPAMI的副编辑;担任NeurIPS、ICML、ICLR、ACMMM等CCF A类顶会领域主席、担任人工智能顶会AAAI和IJCAI的SPC。
女科学家论坛
在生物特征识别技术高速发展的今天,杰出女性学者正以独特的创新视角突破技术边界,作为CCBR 2025的重要学术单元,女科学家论坛将聚焦认知启发的视觉计算、自然场景下的多目标跟踪、人体动作理解与生成、开放世界机械臂操作技术、跨模态人体动作生成等核心议题,邀请北京科技大学、上海大学、北京邮电大学、南京大学和南京理工大学的顶尖女性学者,不仅展现女科学家在关键技术攻关中的卓越贡献,更将探讨女性科研工作者在跨学科协作中的独特优势,展示她们在人工智能领域的最新研究成果。
马惠敏
北京科技大学教授
简介:马惠敏,北京科技大学领军学者,二级教授,计算机与通信工程学院副院长、鼎新实验室主任、适人协同智能重点学科与技术研究中心主任。将计算机视觉与认知心理学结合,开展智能无人系统感知与认知、复杂环境智能生成、认知与心理智能测评等研究。在视觉认知计算领域取得了原创性成果,作为负责人承担了国家自然科学基金重点项目、国家重点专项等多项项目,作为通讯作者在 TPAMI、TIP、CVPR、NIPS等国际高水平期刊和会议发表论文100余篇,谷歌学术单篇他引4000余次,应用于交通安全、航空航天、医疗健康等领域。作为第一完成人获得北京市自然科学一等奖、吴文俊人工智能科技创新一等奖,中国图象图形学学会技术发明一等奖、教育部技术发明奖二等奖等奖励。
报告题目:认知启发的视觉计算
姚鸿勋
哈尔滨工业大学教授
简介:姚鸿勋,哈尔滨工业大学计算学部长聘教授,中国图象图形学学会常务理事/情感计算与理解专业委员会主任,IEEE TMM 副主编。主要研究领域为计算机视觉智能、多媒体数据分析与理解、情感计算、智慧农业等。已发表ICCV,CVPR,ACM MM 等顶级国际会议及IJCV,TPAMI,TIP,TMM 等高影响因子国际期刊文章学术论文300 余篇,H 指数>50,Google 引用量12000+,入选全球人工智能TOP 2000 学者榜单。担任第一届国际ACII情感计算与智能交互大会智能大会共同主席,第一、二届CEI情感智能大会共同主席,第二届ACM ICIMCS大会主席,第18届青年科学家会议共同主席。主持国家自然基金重点项目、国家科技重大专项等,获国家及省部级自然科学奖项4 项,获中国计算机专业优秀教师奖(2021),已培养 获“国家级高层次人才”、“国家级青年人才”称号学生5名。
报告题目:身份识别中的隐私保护技术进展
报告摘要:身份特征与隐私信息是密切耦合在一起的,因此,在身份识别、疾病诊断及其他APP应用中隐私保护是特别值得关注的,尤其在高度发展的AIGC技术的今天。随着AIGC技术的进步,防伪和隐私保护技术也需水涨船高。这在认知模型的建设上是有冲突的,需要构建可兼顾精准性与安全性的创新范式。我们将从融合了语音、文本、视觉生理信号(如EEG、眼动数据)及行为特征(如运动轨迹、社交互动)的多模态情感大模型中,反向解耦特征,在保护用户隐私的同时提升模型的准确判别率及泛化性,并证明其正确性和科学性。
曾丹
上海大学教授
简介:曾丹,上海大学教授,教育部长江学者特聘教授,研究聚焦计算机视觉领域,重点关注目标探测、检测、识别与测定,解决复杂场景下低质量目标实时智能感知及应用中的关键技术难题,成果及应用获2023上海市科技进步奖一等奖、2023中国产学研创新成果一等奖、2022中国图象图形学学会科技进步一等奖等。
报告题目:自然场景下的多目标跟踪——针对复杂特性目标的跟踪算法研究
报告摘要:在实际的多目标跟踪场景中,目标通常表现出加速或减速的非线性运动,并伴有不规则的方向变化,目前常用的基于卡尔曼滤波器的多目标跟踪器由于其具有线性假设因此在目标呈现非线性运动时无法进行准确的运动预测从而导致跟踪失败。为解决非线性运动场景下的多目标跟踪问题,我们提出了一个实时多目标跟踪器DiffMOT,它具有一个基于解耦扩散模型的运动预测器D2MP,它对训练数据中呈现的各种运动的整体分布建模,并在推理时根据目标个体的历史运动信息预测目标的运动从而准确的跟踪呈现非线性运动的目标。此外,通过特殊的解耦扩散模型的设计,DiffMOT在扩撒模型去噪过程中实现了一步采样从而达到了实时的跟踪速度。
霍静
南京大学副教授
简介:霍静,博士,南京大学计算机学院准聘副教授,博导,分别于2017年,2011年在南京大学计算机科学与技术系获得博士学位以及在南京师范大学强化培养学院获得学士学位。曾分别在英国曼彻斯特大学,香港大学等高校进行学术访问交流。2022年入选国家级青年人才项目,2018年获得江苏省计算机学会优博,2018年获得江苏省科学技术奖二等奖。研究方向为新型机器学习技术,包括生成式模型、小样本学习、强化学习及其智能感知与决策应用。主持国家自然科学基金面上基金、青年基金各1项,江苏省自然科学基金青年基金1项,参与国家自然科学基金重大项目1项,科技部2030新一代人工智能项目2项等。在相关研究领域的期刊会议发表论文70余篇,包括CVPR,ICCV,AAAI,IJCAI,ACM MM,TPAMI,TIP,TMM,TNNLS、TCYB、PR等。
报告题目:开放世界机械臂操作技术
张曼
北京邮电大学教授
简介:张曼, 北京邮电大学人工智能学院副院长、教授、博士生导师,主要研究方向为计算机视觉、模式识别、生物特征识别,已主持国家自然科学基金面上项目、国家重点研发计划课题、北京市科委人工智能专项等多项国家和省部级科研项目的研发工作,成果发表在人工智能本领域知名期刊和会议(IEEE TPAMI、IEEE TIP、CVPR、ICCV、AAAI、ACM MM等)。曾获得首都最美巾帼奋斗者、北京市三八红旗奖章、北京市科技新星、北京市青年骨干、北京市科协青年人才托举、北京图象图形学学会“最美女科技工作者”、海淀青年榜样等奖项。现任全国青联十四届常委、教育界别秘书长,北京青联十二届委员,中国青年科技工作者协会会员,IEEE女工程师协会北京分会主席,中国图象图形学学会女工委秘书长,中国人工智能学会模式识别专委会副秘书长,北京女科协理事,北京图象图形学学会理事。
报告题目:人体动作理解与生成
孙运莲
南京理工大学副教授
简介:孙运莲,副教授、博士,南京理工大学计算机科学与工程学院博士生导师,2014年博士毕业于意大利博洛尼亚大学,之后在中科院自动化所模式识别国家重点实验室从事博士后研究工作。主要研究方向包括生物特征识别与计算机视觉,研究成果以第一作者/通讯作者发表在IEEE TPAMI、IEEE TIFS、IEEE TCSVT、ACM MM、计算机学报等国内外著名期刊和会议上。目前担任领域内多个国际期刊和会议的审稿人。先后主持国家自然科学基金项目3项。
报告题目:跨模态人体动作生成:高质、高效与交互感知
贲晛烨
山东大学教授
简介:中国电子学会信号处理分会委员、通信分会委员,山东大学教授,哈尔滨工程大学信息与通信工程学院院长。主持国家自然科学基金优秀青年科学基金项目、国家重点研发计划项目课题、山东省重大科技创新工程项目等20余项国家级和省部级项目。在IEEE T-PAMI、IEEE T-IP等核心期刊会议上发表学术论文100余篇,授权国家发明专利76项。获山东省自然科学奖二等奖(排名1)、中国图象图形学学会石青云女科学家奖。研究方向为信号与信息处理、图像处理、模式识别、多媒体信息处理、情感计算、人工智能。
宿南
哈尔滨工程大学副教授
简介:哈尔滨工程大学预聘教授、博导,信息与通信工程学院副院长。研究方向多模态遥感图像处理,主持国家自然科学基金面上项目、青年项目、JKW166项目、黑龙江省自然科学基金优青项目、黑龙江省重点研发项目等,发表遥感领域JCR一区重要期刊30余篇,授权发明专利20余项,获中国指挥与控制学会科技进步二等奖,排名第1。
王莹洁
烟台大学教授
简介:CCF杰出会员、CCF服务计算专委会副秘书长/常务委员,教授、博士生导师,烟台大学发展规划与学科建设处副处长。山东省优秀青年基金获得者,山东省青创团队负责人,“天算星座”华东地面站负责人,烟台市“双百计划”拔尖人才。数字服务计算与系统山东省重点实验室副主任,空天信息融合与服务计算山东省高校未来产业工程研究中心主任。主要从事群智感知网络、服务计算、人工智能等领域的研究工作,是山东省高等学校青创科技支持计划创新团队负责人,主持国家自然科学基金面上/青年项目,中国博士后科学基金特别资助/面上项目,山东省自然科学基金优秀青年/面上等项目13项。发表高水平学术论文100余篇,其中,ESI高被引论文5篇,热点论文1篇,会议最佳论文3篇,引用次数近3000次。获山东省人工智能自然科学奖一等奖、山东省巾帼建功标兵、中国计算机学会服务计算青年才俊奖、山东省自然科学奖三等奖等奖项和荣誉称号。IEEE TCSVC多样性主席兼宣传主席,中国人工智能学会智能服务专委会常务委员,中国计算机学会人工智能与模式识别专委会执行委员山东省人工智能学会常务理事/副秘书长,山东计算机学会理事。
生物特征识别中的微视觉计算论坛
微弱视觉信号虽然人眼通常难以察觉,但却蕴含着微妙而关键的信息,能够揭示视觉数据中隐藏的模式。检测和分析细微信号对多个垂域具有深远影响,例如:1)在生物特征防伪领域,发现微小视觉异常可防恶意攻击;2)在情感计算领域,理解人机交互场景下的非接触生理信号、微表情和微手势有助于欺骗、抑郁症等行为症状检测。本次论坛聚焦于生物特征识别任务中检测和解码“微弱视觉信号”的基础模型和方法的创新探索。
贲晛烨
山东大学教授
简介:山东大学教授,国家优青,省杰青。中国电子学会信号处理分会常务委员、高校电子信息学科首届建设专家委员、青年科学家俱乐部理事等。担任《信号处理》、《控制与决策》、《中国图象图形学报》、《智能系统学报》、《电子与信息学报》、《Chinese Journal of Electronics》等编委,及ICIGP 2022大会主席等。作为项目负责人,主持国家自然科学基金优秀青年科学基金项目、国家重点研发计划项目课题等20余项国家级和省部级项目。在IEEE T-PAMI、IEEE T-IP、IEEE T-CSVT、IEEE T-MM、PR、CVPR等国内外核心期刊会议上发表学术论文100余篇,授权国家发明专利78项,转让3项。曾获山东省自然科学奖二等奖(排名1)、中国图象图形学学会石青云女科学家奖(2022,全国4人)等荣誉称号。
报告题目:读脸读心微表情识别:从数据集到算法
赵思成
清华大学副研究员
简介:赵思成,清华大学副研究员,国家级青年人才,ACM/IEEE/CCF/CSIG高级会员,哈尔滨工业大学博士,加州大学伯克利分校和哥伦比亚大学博士后。研究方向为情感计算、多媒体分析、多模态大模型等。发表IEEE/ACM汇刊、CCF推荐A类论文60余篇,谷歌学术引用10000余次,H指数为53。担任CSIG情感计算与理解专委会秘书长、IEEE TIP/IEEE TAFFC等国际期刊编委、IEEE TFS/ACM TOMM/PR等国际期刊首席客座编委、NeurIPS/ICML/ACM MM/CVPR/ECCV等国际会议领域主席。主持国家重点研发计划课题、国家自然科学基金专项课题、北京市自然科学基金联合基金重点项目、CCF-滴滴盖亚学者科研基金等项目。获得北京市自然科学二等奖、CSIG自然科学二等奖、中国电子学会科技进步一等奖、詹天佑铁道科学技术奖高等院校奖青年奖、CSIG优秀博士论文奖、ACM SIGMM中国新星奖等奖励,入选AI 2000人工智能全球最具影响力学者榜单和全球前2%顶尖科学家榜单。
报告题目:情智兼备数字人与机器人的研究
报告摘要:“情智兼备数字人与机器人的研究”入选2024年中国科协十大前沿科学问题并且排名首位。本报告将介绍该科学问题提出的背景、国内外研究进展、面临的关键难题与挑战,阐述该科学问题提出者对相关研究内容与成果的思考,并汇报课题组在多媒体情感计算领域开展的研究工作。
刘昊
宁夏大学教授
简介:刘昊,宁夏大学教授、博士生导师,毕业于清华大学自动化系,现任宁夏大学信息工程学院副院长、自治区重点实验室常务副主任,兼任十三届团宁夏自治区委副书记、十四届全国青联委员、CCF银川秘书长,入选国家信息化领域人才支持计划、宁夏科技创新领军人才、中科协青托人才等。从事多模态模式识别、健康基础模型与具身智能相关研究工作,服务区域数字文旅、智慧水务、智能医疗健康以及网信公共安全等领域。发表国际高水平期刊会议论文60余篇。先后主持国家自然科学基金面上项目(2项)和青年科学基金项目、宁夏重点研发计划、CAAI-华为学术奖励基金、中央引导地方科技专项以及宁夏自然科学基金优青项目等。担任CAAI-TRIT期刊青年编委以及《宁夏大学学报(自然科学版)》副主编。获中国人工智能学会优秀博士论文奖、清华大学优秀博士论文奖,指导研究生获亚洲人工智能技术大会最佳学生论文奖(2次)以及中科协青年托举人才博士生专项。
报告题目:人脸视觉模式不确定性分析与第一性原理
报告摘要:目前基于全监督深度学习的人脸视觉分析方法研究在获得突破性进展的同时也遇到瓶颈,其发展正面临来自真实场景不确定环境的挑战。本报告将从人类认识真实世界过程中表现出的智能和认知获得启发,将不确定性估计作为额外的信息有助于模型做出更好的决策,围绕人脸识别与安全中存在的问题与挑战,以原始数据内含的结构化信息为知识载体,通过准确量化真实环境场景中数据的不确定性,赋予机器模型类人的“格物致知”特性,解决无约束环境下人脸视觉分析的瓶颈问题,建立最少依赖人类指导自主感知未知数据和知识推理的人脸识别模型与安全研究范式。
史金钢
西安交通大学副教授
简介:史金钢,西安交通大学软件学院副教授,曾任中国电子科技集团国家工程研究中心工程师,芬兰奥卢大学机器视觉与信号处理中心(CMVS)博士后研究员。主要从事低质视觉重建、情感计算、远程生理信号测量等研究。已在国际期刊和会议上发表学术论文60余篇,作为负责人承担国自然青年基金、国自然国际交流与合作项目以及多项企事业单位委托课题。曾担任ICME领域主席,并在ICME、ACM Multimedia等国际会议上组织鲁棒多媒体图像理解和微弱视觉计算相关领域研讨会。当前主要研究方向包括图像复原、情感计算和生物医学信号处理。
报告题目:微弱生理信号测量与跨场景泛化性研究
贺登博
香港科技大学(广州)助理教授
简介:贺登博,香港科技大学(广州)智能交通学域助理教授、机器人与自主系统学域助理教授,博士生导师。他的工作集中在人因工程、驾驶员行为分析和自动驾驶人机交互等方面。在分心驾驶、自动驾驶车辆中驾驶员行为引导、道路使用者行为分析和驾驶员状态估算等方面取得丰硕研究成果。在国际高水平期刊和会议上发表论文80余篇。担任IEEE TITS,IEEE THMS,Transportation Research Part D: Transport and Environment,Applied Ergonomics等国际学术期刊的审稿专家。曾获得美国人因和人机功效学协会(HFES)Stephanie Binder Young Professional Award和Jerome H. Ely Human Factors Article Award。在HFES多次获得Technical Group最佳论文提名和最佳学生论文。
报告题目:从泛化到个性化:座舱远程生理信号测量和认知负荷监测
刘阿建
中国科学院自动化研究所助理研究员
简介:刘阿建,中国科学院自动化研究所助理研究员,澳门青年学者,北京市“青年人才托举工程”入选者。近年来在 IEEE Transactions 系列期刊与 CCF-A 类国际顶级会议/期刊发表学术论文 40 余篇,谷歌学术引用次数超过 2000 次。其中以第一作者或通讯作者身份发表论文 13 篇,涵盖计算机视觉顶级会议 CVPR、ACM MM、IJCAI、AAAI,以及生物特征识别与安全领域顶刊 IEEE TPAMI、TIFS、TMM、IJCV 等。相关研究成果获 IET Biometrics 高影响力论文奖与 IEEE TBIOM 最佳论文奖。以第一作者或共同第一作者身份发布 6 个大规模人脸防伪数据集,包括 CASIA-SURF、CASIA-SURF CeFA、HiFiMask 等。基于这些数据集,作为主办方核心成员之一,已在国际顶级计算机视觉会议(CVPR 2019/2020/2023/2024,ICCV 2021/2025)连续六次举办人脸防伪挑战赛与研讨会,累计吸引全球 1800 余支参赛队伍,在学术界与工业界产生了广泛影响。
报告题目:基于多模态自引导提示学习的域泛化人脸活体检测
余梓彤
大湾区大学长聘副教授
简介:余梓彤,大湾区大学长聘副教授,研究员,博导,国家高层次青年人才,国家优秀海外留学生奖获得者,IEEE/CCF高级会员,CCF东莞分部秘书长,CSIG生物特征识别专业委员会(筹)副秘书长,东莞市智能信息技术重点实验室副主任。南洋理工大学博后,博士毕业于奥卢大学,牛津大学访问学者, 研究方向为微视觉计算。发表Cell子刊、TPAMI等高水平文章50篇,谷歌总引用7600次,获4项国际学术竞赛冠亚军,授权国家发明专利15项。主持国自然优青(海外)/面上/青年项目、CCF-腾讯犀牛鸟项目等。获ACM SIGWEB中国新星奖,IEEE芬兰最佳学生会议论文奖,IEEE芬兰SP/CAS最佳论文奖亚军,ICME 24最佳论文候选,连续三年入选斯坦福全球前2%顶尖科学家榜单,指导学生获IAPR最佳学生论文奖、CCBR 24最佳论文提名奖、CSIG英文会刊首个封面文章。担任国际期刊IEEE TIFS编委,曾担任ACM MM 25等领域主席和CCBR 25论坛主席。相关成果落地应用于中国疾控中心、广电运通集团等,以第一完成人获广东省图象图形学会科技进步一等奖。
曾润浩
深圳北理莫斯科大学长聘副教授
简介:曾润浩,深圳北理莫斯科大学长聘副教授,北理工博导。广东省重大人才工程青年拔尖人才,深圳市科技创新人才,深圳市鹏城孔雀人才。研究领域为计算机视觉、多模态数据分析,核心方向包括视频动作识别、情绪识别等,在IEEE TPAMI、IEEE TIP、CVPR等国际顶级期刊和会议发表论文30余篇,谷歌学术总引2000余次,单篇最高引600余次。近三年主持国家自然科学基金项目、广东省教育厅重点领域项目等纵向科研项目7项。获教育部自然科学二等奖(排3),中国图象图形学学会优博提名奖,IEEE计算机学会杰出组织奖,成果入选CVPR 2024最佳论文Final List。受邀担任NeurIPS、CVPR等人工智能领域顶级会议和TPAMI、TIP等权威期刊的程序委员会委员和审稿人。担任多个国际国内会议的本地主席、论坛主席,CSIG多媒体专委会委员,广东图象图形学会青工委、计算机视觉专委会委员。
雷震
中国科学院自动化研究所研究员
简介:雷震,IEEE Fellow,IAPR Fellow,AAIA Fellow。中国科学院自动化研究所研究员,中国科学院大学人工智能学院岗位教授,中国科学院香港创新院人工智能与机器人研究中心教授,香港理工大学客座教授,博士生导师,入选国家青年高层次人才计划。IEEE Biometric Council杰出讲师,CCF杰出会员,CSIG杰出会员,CSIG视频图像与安全专委会常务委员,CSIG机器视觉专委会委员,CCF计算机视觉专委会委员,CAAI模式识别专委会委员,CAA模式识别与机器智能专委会委员,全国安防标委会人体生物特征识别应用技术委员会通讯委员,CCF标准工作委员会委员。主持和参与国家重点研发项目,国家自然科学基金,国家科技支撑计划,中国科学院重点部署项目,工信部物联网专项等项目。获2019年IAPR青年学者奖,“面向公共安全的大规模监控视频智能处理技术及应用”获2019年国家科技进步奖二等奖,“复杂视觉任务的高效表征学习”获2024年吴文俊人工智能自然科学奖一等奖,“多模态高鲁棒细微情感分析关键技术与系统”获2021年中国电子学会技术发明一等奖,2022和2024年两次获得中国图象图形学会自然科学奖二等奖,获2008年北京奥运会/残奥会突出贡献奖。
操晓春
中山大学教授
简介:操晓春,中山大学网络空间安全学院院长、校学术委员会委员,国家杰出青年青年科学基金获得者,主要在人工智能与网络空间安全的交叉领域从事应用基础研究,发表(含接收)Nature Communications、TPAMI、ACM Computing Surveys、CCS、TIFS等论文300余篇。先后担任TPAMI/TIP/TMM/TCSVT/电子学报/计算机科学的编委,NeurIPS/ICML/ICCV/CVPR/IJCAI/AAAI 的Area Chairs。兼任中国电子学会理事、青年科学家俱乐部主席团主席。获2024年中国电子学会自然科学一等奖和2019年中共中央办公厅技术进步一等奖。中国计算机学会优博、中国电子学会优博、中国科学院大学优博指导导师。培养的研究生有6人入选国家级青年人才。
生物特征识别产业应用论坛
生物特征识别技术作为数字经济时代的核心技术之一,正深度融入金融、安防、教育、消费电子等多个领域,推动产业数字化转型与智能化升级。为搭建行业技术交流、经验分享与合作对接的优质平台,“生物特征识别产业应用论坛” 汇聚业内顶尖专家、学者与企业代表,聚焦技术前沿、产业实践、标准化建设及产学研融合等关键议题,共同探讨生物特征识别产业的发展趋势与未来机遇。
本次论坛邀请到5位在生物特征识别及相关领域具备深厚积淀与丰富实践经验的专家,他们将带来精彩的主题报告,为参会者呈现一场兼具专业性、前瞻性与实用性的知识盛宴。公安部第一研究所副研究员尹德森围绕居民身份证指纹采集质量,剖析技术指标及已采数据,为明确采集质量、预判后续发展做支撑。深圳职业技术大学教授杨金锋聚焦手指生物特征识别技术,结合团队研究成果分享多模态融合识别的思考与实践,为从业者提供技术参考。公安部鉴定中心冯磊将探讨步态技术在刑侦领域的研究与应用、可行性与有效性,强调提升技术可解释性,推动其向法庭采信证据转化,为案件侦破提供支撑。睿悦信息NIBIRU创始人曹俊围绕基于自主国产三维引擎构建虚实融合系统展开,探索国产虚实融合交互系统路径,为技术融合创新指引方向;西图之光副总侯宗庆以西图之光为例,解读三维生物识别技术产学研用融合的创新路径与全球市场落地经验,为科技成果转化等提供借鉴。
尹德森
公安部第一研究所副研究员
简介:尹德森,博士,毕业于北京理工大学,从事生物特征识别与居民身份证相关技术研究工作,组织或参与“十二五”、“十三五”多项国家科技支撑计划课题任务。在居民身份证登记指纹信息工作中,作为核心技术人员,组织开展方案制定、技术选型、测试评价等技术保障工作。同时,长期跟踪居民身份证指纹数据采集质量,并对全国各省市居民身份证采集指纹相关工作提供技术支撑。
报告题目:指纹采集质量统计分析技术研究
杨金锋
深圳职业技术大学教授
简介:杨金锋,教授,博士生导师(港理工),主要从事计算机视觉、工业智能化,导航定位和身份鉴别方面的研究工作。深圳市地方级领军人才,入选全球前2%顶尖科学家榜单。现任深圳职业技术大学人工智能本科学院院长、广东省人工智能创新应用工程技术研究中心主任、粤港澳大湾区人工智能应用技术研究院院长。曾任第七届中国人工智能学会理事,现任中国图象图形学学会理事、中国职业技术教育学会人工智能分会常务副主任、广东省人工智能与机器人学会理事、深圳人工智能学会常务理事、深圳电子学会常务理事、深圳计算机学会理事等。曾任中国计算机视觉大会主席(2017年),中国模式识别与计算机视觉大会组织主席、赞助主席。主持国家自然科学基金4项,863重点项目子课题1项,省部级项目4项,市厅级1项。发表高水平学术论文120多篇,多篇论文进入ESI前2.5%。
报告题目:手指生物特征识别技术思考
报告摘要:围绕手指多模态生物特征识别问题,分析总结团队过去的研究成果,以及软硬件实现方法。本报告详细介绍在手指多模态生物特征融合识别过程中,团队成员所做的思考和实践。
冯磊
公安部鉴定中心警务技术序列一级主管
简介:冯磊,博士,警务技术一级主管。入职以来从事现场勘查、痕迹检验、刑事侦查工作,先后办理全国重特大刑事案件现场勘查60余起,如广西梧州“3.21”东航坠机事件、江西上饶“10.14”胡鑫宇失踪事件,累计出具鉴定文书50余份,参与各种课题26项,其中参与“十三五”、“十四五”国家重点研发计划课题任务5项,主持或参与公安部科技强警课题10项,申请或参与专利5项;发表论文7篇,参与4项行业标准制定工作,参加培训学术会议和交流活动15次。荣获个人三等功1次,优秀公务员3次,优秀党员2次,长期从事步态分析、无人机犯罪调查工作。
报告题目:步态技术在刑事侦查中的研究与应用
报告摘要:随着嫌疑人反侦查意识的增强,作案时佩戴口罩、帽子,导致人脸识别失效,步态识别因其远距离、非接触、抗遮挡等优势,在刑事侦查中展现重要应用价值。本报告聚焦步态技术在刑侦领域的研究与应用,探讨其在嫌疑人身份识别中的可行性与有效性。并针对当前深度学习模型存在的“黑箱”问题,强调提升技术可解释性的必要性,提出应深入分析步态步幅、角度等关键特征参数,建立科学的步态检验方法。通过量化比对与结果评估,推动步态识别从辅助侦查手段向可被法庭采信的科学证据转化,为复杂场景下的案件侦破提供有力技术支撑。
曹俊
睿悦信息NIBIRU创始人
简介:曹俊,天津大学博士,睿悦信息NIBIRU创始人,首席技术官,南京雨花台区中青年优秀人才,江苏省工程师学会科学技术奖成果奖“一等奖”,中国电子学会智能人机交互专家委员会首届委员会委员、中国指挥与控制学会虚拟现实与人机交互专委会委员、江苏省计算机学会图形图像专委会副主任委员、天津市虚拟仿真学会副秘书长、江苏省元字宙工程研究中心技术委员会委员、南京市雨花台区青年联合会委员会委员、江苏省青年科技工作者协会会员。在电子信息领域的软硬件研发都有丰富的经验,近10年一直专注于增强/虚拟现实技术领域的研究方向,熟悉XR领域的国际前沿与发展趋势。特别是对XR操作系统以及实时三维开发引擎技术有广泛涉猎和研究,拥有10项授权发明专利,参与5项团体技术标准制定。
报告题目:基于自主国产三维引擎构建虚实融合系统探索
侯宗庆
西安西图之光智能科技有限公司副总经理
简介:侯宗庆,副总经理,西安西图之光智能科技有限公司。拥有计算机科学、数学等多学科背景,并获得加拿大工程学与自然科学双荣誉学位,具备扎实的跨领域知识结构。长期专注于生物识别领域,尤其在三维计算机视觉与机器视觉方面有深入的技术积累,持有多项相关专利,并在人工智能算法的研究及实际应用方面拥有丰富经验。参与制定《安全防范三维人脸识别设备技术规范》和《生物特征识别-掌纹掌静脉融合识别系统技术规范》等标准,积极推动多项生物识别创新技术的实际落地。作为公司技术研发负责人,主导整体技术方向、产品研发与发展战略,并担任西安交通大学校外硕士生导师,致力于促进产学研深度融合。
报告题目:产学研用深度融合:西图之光三维生物识别技术的创新与全球市场落地之路
何召锋
北京邮电大学教授
简介:何召锋,教授,博士生导师,信息网络教育部工程中心副主任,人工智能安全与标准北京市重点实验室副主任,北京市人工智能标准委员会副主任委员,ISO SC3/全国信标委/全国安标委等生物特征识别标准委员会委员,中国指挥控制学会常务理事。长期从事生物特征识别、大模型安全及治理、智能博弈决策等领域技术创新与产业应用研究。主持国家重点研发计划项目、国家自然科学基金、北京市中央引导地方专项等国家级和省部级科研项目20余项,入选北京市委组织部青年拔尖团队(团队负责人)、青年拔尖个人、北京市科技新星。在PAMI、CVPR等期刊和会议上发表论文100余篇,申请发明专利90余项,制定国家标准、行业标准40余项。连续两年担任中国生物特征识别大会大会主席,曾获中国图象图形学会技术发明二等奖、中国产学研合作促进会创新成果一等奖,中国计算机学会优秀博士论文奖、中国科学院优秀博士论文奖、国际生物特征识别大会最佳论文奖、IEEE标准杰出贡献奖等奖励。
李慧斌
西安交通大学教授
简介:李慧斌,教授,博导。现任西安交通大学数学与统计学院院长助理,西安大数据与人工智能研究院常务副院长,国家生物安全证据基地—生物特征识别中心主任。2013年获法国里昂中央理工大学博士学位。主要从事应用数学、三维视觉、生物特征识别等方面的研究,先后主持科技部、基金委、校企等20余项研究项目。在学术期刊和会议如IEEE TPAMI/TIP/TVCG/TIFS/IJCV/ NeurIPS发表高水平论文70余篇(引用4000多次),申请/授权发明专利30项。曾获欧盟生物特征识别奖、陕西省自然科学奖一等奖等奖项,“高精度三维人脸识别产品研发及产业化”获陕西高等学校优秀成果奖一等奖。参与撰写了公安部 《安全防范三维人脸识别设备技术规范》标准。
钟德星
西安交通大学教授
简介:钟德星,西安交通大学自动化学院教授、博士生导师,西安交通大学第一附属医院特聘教授。IEEE Senior Member,中国计算机学会、中国图象图形学学会高级会员。教育部教育质量评估中心、教育部学位与研究生教育发展中心评估专家。主编教材《机器视觉技术及应用》入选工信部“十四五”规划,教育部战略性新兴领域“十四五”高等教育教材体系,参与发表国家出版基金项目《智能生物识别前沿研究》专著。长期从事掌纹掌静脉识别等生物特征识别技术、人工智能辅助诊断等医学图像分析技术的研究工作,担任工信部信通院“掌纹掌静脉识别系统技术要求”和信标委“掌纹掌静脉融合识别系统技术规范”标准编制专家。
眼部特征识别论坛
眼部生物特征识别论坛是一个专注于探讨眼部生物特征识别技术及其应用的学术交流平台。本次论坛聚焦于该领域的创新突破,邀请了三位在眼部生物特征识别技术领域具有深厚造诣的专家。重庆工商大学的秦华锋教授将系统阐述眼动识别的背景与原理、目前技术的前沿进展与挑战,并将分享其团队在端到端场景下的眼动识别的创新方案,这些创新研究将有效提升识别系统的准确率与复杂场景下的鲁棒性。中国科学院微电子研究所的卫建泽副研究员将分享虹膜图像数据、虹膜区域定位分割和虹膜特征识别三个方面研究成果,这些研究成果能系统性地应对虹膜识别中的不确定性,为复杂环境下的稳健虹膜识别提供新的思路。北京建筑大学的王财勇副教授将系统性地梳理2025年度学术界关于虹膜数据获取、虹膜活体检测、虹膜分割和定位、虹膜识别、虹膜合成、虹膜应用等方面的最新进展,并对未来发展趋势进行展望。期待本次论坛能够为与会者提供一个交流和学习的平台,促进专家学者之间的深入合作和学术交流,推动眼部生物特征识别技术的进步和产业化进程。
秦华锋
重庆工商大学教授
简介:秦华锋,教授、博士、博士生导师。新加坡南洋理工大学联合培养博士,巴黎萨克雷大学博士后,重庆工商大学国合基地常务副主任,智能感知与区块链技术重庆市重点实验室主任,RSA Fellow,巴渝学者特聘教授,重庆市学术技术带头人后备人选,重庆市高校创新研究群体负责人,入选重庆市新产品创新青年科技人才、江苏省宿迁市千名领军人才,曾获得重庆市科技进步奖、教育部博士研究生学术新人奖。主持科研项目20余项,其中主持国家自然科学基金项目2 项,重庆市高校创新研究群体项等省部级项目10余项;在IEEE TIFS、IEEE TMC、IEEE TCSVT、ICLR、ECCV等权威期刊和顶级会议上发表论文80余篇;出版专著3部;参与撰写静脉识别国家标准1项;申请专利30余项,获授权发明专利21项,其中五项专利估值580万元并成立公司以作家入股方式进行转化。目前公司获得产业资金支持,投后估值约2000万元,并获批国家高新技术企业。研究成果获得中央电视、重庆电视台等多家媒体的专访报道。
报告题目:基于眼球运动的生物特征识别:进展、未来与挑战
卫建泽
中国科学院微电子研究所副研究员
简介:卫建泽,副研究员,博士,现任职于中国科学院微电子研究所。2022年于中国科学院大学获博士学位,师从孙哲南研究员,长期致力于虹膜识别与多模态表征学习研究,主持有国家级科研项目3项,在IEEE T-MM, T-IFS, T-CSVT等国际权威期刊和会议上发表生物特征识别论文15篇,授权国家发明专利4项,获北京市科协青年人才托举,长期担任国际顶刊IEEE T-PAMI、T-IP等和国际顶会CVPR、ICCV等审稿人。
报告题目:面向真实环境的不确定性虹膜识别
报告摘要:虹膜作为一种稳定且独特的生物特征,在身份认证中具有重要价值。然而在实际应用中,环境、人眼及成像设备等因素带来的不确定性,往往导致识别性能下滑。本报告从 数据、分割和识别三个方面展开研究:在数据层面,构建了高不确定性采集条件下构建的UTIris数据集,并提出不确定性标注策略,更贴近真实应用场景;在分割方法上,设计了不确定性感知的Bilateral Transformer与多源知识驱动的图分割网络,有效提升了模糊和遮挡条件下的分割鲁棒性;在识别方法上,提出关联测度与不确定性表征,不仅显著缓解了高不确定性采集带来的影响,还将虹膜识别扩展至半监督和无监督场景。这些方法系统性地应对了虹膜识别中的不确定性,为复杂环境下的稳健虹膜识别提供了新的思路。
王财勇
北京建筑大学副教授
简介:王财勇,北京建筑大学智能科学与技术学院副教授,硕士生导师,主要研究方向为生物特征识别、计算机视觉、模式识别等。2020年毕业于中国科学院自动化研究所模式识别国家重点实验室,获得工学博士学位。近年来主持国家自然科学基金青年基金项目1项和北京市自然科学基金面上项目1项,入选北京建筑大学金字塔人才培养工程“建大英才”和北京市科协青年人才托举工程。目前在TIFS/TBIOM/PR/SPL、自动化学报、计算机辅助设计与图形学学报和ICB、IJCB、ICASSP等国际国内主流学术期刊和会议上发表论文30余篇,其中1篇论文获第12届IAPR国际生物特征识别大会(ICB 2019)最佳论文提名奖,1篇论文获第7届国际生物特征识别联合会议(IJCB 2023)最佳学生论文奖,授权国家发明专利5项。担任SCI期刊CMC-Computers, Materials & Continua青年编委、北大中文核心期刊《计算机科学与探索》和《工程科学学报》青年编委。
报告题目:虹膜识别2025年度进展梳理
报告摘要:虹膜识别技术因其唯一性、稳定性、非接触性、防伪性等特性,被认为是最具有潜力的生物特征识别技术,可作为万物互联时代的身份入口。然而当虹膜识别技术逐步放松对成像和用户的双重限制,应用在远距离、行进中、移动端、可见光、VR/AR等非约束的场景时,识别性能与安全性方面均会带来一些挑战。本次报告将梳理2025年度学术界关于虹膜数据获取、虹膜活体检测、虹膜分割和定位、虹膜识别、虹膜合成、虹膜应用等方面的最新进展,并对未来发展趋势进行展望。
陈英
南昌航空大学教授
简介:陈英,南昌航空大学教授,博士,硕士生导师,CCF高级会员。本、硕、博均就读于吉林大学计算结科学与技术学院,于2014年获得工学博士学位,主要研究方向为虹膜图像处理及特征识别、医学影像处理、计算机视觉、模式识别、计算机教育等,入选江西省高校骨干教师。近年来主持国家级和省部级项目 10 项。在国际国内主流学术期刊和会议上发表论文 80 余篇(其中高被引 3 篇)、授权国家发明专利 6 项,担任国际期刊 IEEE T-IFS、PR 等审稿人。在育人方面指导学生国家级竞赛奖项 110 余项,其中,指导学生在第十八届和第十九届“挑战杯”全国大学生课外学术科技作品竞赛“揭榜挂帅”专项赛均获得特等奖(发榜单位分别为华为云计算技术有限公司和中国航天科工二院二十三所)。
静脉识别论坛
静脉识别论坛是一个聚焦于静脉生物特征识别前沿技术与应用的高水平学术交流平台。本次论坛邀请了四位在静脉识别及相关领域具有突出贡献的知名专家学者,他们将分享在静脉识别、多模态融合及行为特征认证等方向的最新研究进展与应用探索,旨在推动静脉识别技术的理论创新与产业落地,促进学术界与产业界的深度融合。合肥工业大学的贾伟教授将带来关于掌静脉图像生成的报告,聚焦于如何通过生成方法合成高真实感的掌静脉数据,以突破数据采集受限的瓶颈问题,为掌静脉识别的研究与应用提供丰富的数据资源与技术支撑。重庆大学的李艳涛教授将探讨基于行为特征的移动设备持续认证,深入剖析移动智能设备中用户隐私与机密数据保护的挑战,分享其团队在持续认证系统结构、算法设计与实验验证方面的研究进展,展示行为特征在身份认证中的巨大潜力。山东建筑大学的杨璐教授将介绍面向不同类型采集设备的手指静脉识别,重点展示针对小面积手指静脉识别和跨光源识别的创新方法,提出适应多种采集设备环境的解决方案,以提升识别技术的适应性和鲁棒性。中国矿业大学的潘在宇副教授将分享手部生物特征识别:从单模态到多模态的研究成果,系统介绍其团队在数据库构建、单模态与多模态识别等方面的进展,并对未来手部生物特征识别技术的发展趋势进行展望。本次论坛将为与会者搭建一个开放、前沿的交流平台,汇聚智慧与力量,共同推动静脉识别技术的创新突破与广泛应用。
贾伟
合肥工业大学教授
简介:贾伟,博士,合肥工业大学计算机与信息学院教授,博士生导师,智能科学与技术系系主任。中国图象图形学学会青年工作委员会副主任。中国图象图形学学会生物特征识别专委会(筹)副主任。中国自动化学会模式识别与机器智能专业委员会常务委员。30余次担任国际国内顶级会议的程序主席、组织主席等。已在TPAMI、IJCV、TIP、TIFS、CVPR、ICCV等权威期刊和顶级会议上发表论文CCF A类及中科院1区论文70多篇。H因子41。2020-2025连续6年入选前2%顶尖科学家。主要研究兴趣为人工智能、生物特征识别、计算机视觉、模式识别等。
报告题目:掌静脉图像生成
报告摘要:身份认证已成为数字化和智能化社会的基础服务之一。生物特征识别是进行身份认证最为有效的技术手段之一。在过去的10年中,深度学习成为生物特征识别最为主流的处理技术。深度学习的模型训练需要大量的样本,然而,由于隐私保护等问题,采集真实的生物特征数据并公开发布愈发困难,在这种情况下,使用生成方法合成高真实感的的生物特征数据已经为生物特征识别技术中数据集构建的重要手段。掌静脉识别是非常有前景的生物特征识别技术,但也面临着数据缺乏的瓶颈问题。本报告将介绍研究团队在掌静脉图像生成方面的最新工作。
李艳涛
重庆大学教授
简介:李艳涛,教授、博士生导师,重庆市巴渝青年学者,重庆大学计算机学院。研究领域包括:移动计算安全、深度学习和无线网络等。主持国家自然科学基金面上和青年各一项。获得重庆市自然科学奖一等奖(4/5)和贵州省自然科学三等奖(3/4)。目前在国内国际重要学术刊物上发表相关学术论文140多篇,其中以第一/通讯作者身份发表SCI 检索期刊论文65 篇,IEEE/ACM Trans论文25 篇(CCF A类11篇、中科院1 区15 篇)。获得2023年度ACM Transactions on Computing for Healthcare最佳论文,2020年度IEEE Internet Computing最佳论文,IEEE NAS 2018会议最佳论文入围奖,2014年重庆市优秀博士学位论文,2011年重庆市优秀硕士学位论文。担任"长江学者奖励计划"评审专家,国家自然科学基金通讯评议专家,教育部学位中心学位论文通讯评议专家。担任IEEE Internet of Things Journal期刊的副主编。
报告题目:基于行为特征的移动设备持续认证
报告摘要:移动智能设备发展迅猛、迭代迅速,已从单一的通信设备转变为多功能的社交娱乐工具,给人们的日常生活、社交与工作、健康监测带来了极大的便利。随着移动智能设备在人们日常生活和工作中的深入应用,用户在移动设备上存储的隐私信息和机密数据也越来越多,包括社交网络账号、移动支付账户、健康监测数据等个人隐私信息,甚至企业商业机密数据。因此,如何保障移动设备中个人隐私和机密数据的安全,成为广大用户和企业关注的核心问题。本报告将围绕基于行为特征的移动设备持续认证系统进行讨论,重点介绍认证系统结构、算法设计和实验验证,为持续认证的快速发展提供理论和技术支撑。
杨璐
山东建筑大学教授
简介:杨璐,山东建筑大学教授、博士,硕士生导师,山东省泰山学者青年专家,山东省高校青年创新团队负责人。主要从事手指静脉识别、生物特征识别等领域的研究。主持国家自然科学基金面上项目1项、青年项目1项,已在IEEE TIFS、IEEE TCSVT、PR等国际学术期刊和会议发表论文30余篇,获山东省人工智能自然科学奖二等奖1项。担任中国图象图形学学会生物特征识别专委会委员、山东省人工智能学会理事、中国人工智能学会机器学习专委会通讯委员。
报告题目:面向不同类型采集设备的手指静脉识别
潘在宇
中国矿业大学副教授
简介:潘在宇,中国矿业大学副教授,博士,硕士生导师。中国图象图形学学会生物特征识别专委会委员,第十七届中国生物特征识别大会程序委员会主席。主要研究方向为:生物特征识别、图像复原与增强、多模态医学数据分析。主持或参与国家自然科学基金青年基金项目、中央高校基本科研业务、科技创新2030-“新一代人工智能”重大项目、国家重点研发计划课题等5项、在IEEE TIFS、IEEE TCSVT、ESWA、KBS、IJCB等期刊或会议上发表SCI论文20余篇;出版专著2部,授权PCT专利1项,授权发明专利9项;担任IEEE TIFS、IEEE TMM、IEEE TCSVT、IEEE TIM和ESWA等多个国际高水平期刊审稿人。
报告题目:手部生物特征识别:从单模态到多模态
秦华锋
重庆工商大学教授
简介:秦华锋,教授、博士、博士生导师。新加坡南洋理工大学联合培养博士,巴黎萨克雷大学博士后,重庆工商大学国合基地常务副主任,智能感知与区块链技术重庆市重点实验室主任,RSA Fellow,巴渝学者特聘教授,重庆市学术技术带头人后备人选,重庆市高校创新研究群体负责人,入选重庆市新产品创新青年科技人才、江苏省宿迁市千名领军人才,曾获得重庆市科技进步奖、教育部博士研究生学术新人奖。主持科研项目20余项,其中主持国家自然科学基金项目2 项,重庆市高校创新研究群体项等省部级项目10余项;在IEEE TIFS、IEEE TMC、IEEE TCSVT、ICLR、ECCV等权威期刊和顶级会议上发表论文80余篇;出版专著3部;参与撰写静脉识别国家标准1项;申请专利30余项,获授权发明专利21项,其中五项专利估值580万元并成立公司以作家入股方式进行转化。目前公司获得产业资金支持,投后估值约2000万元,并获批国家高新技术企业。研究成果获得中央电视、重庆电视台等多家媒体的专访报道。
李树一
北京工业大学教授
简介:李树一,北京工业大学信息科学技术学院副研究员、博士生导师,入选澳门青年学者、北京市高层次留学人才、北京市青年人才托举工程、BSIG最美女科技工作者、北京工业大学高层次人才队伍建设计划青年优秀人才。主要研究方向为生物特征识别、视觉多模态融合、多视图学习以及联邦学习算法及应用等。在IEEE TIP、TIFS、TMM、TBIOM、TCSVT、INFFusion、PR、AAAI等国内外知名期刊和会议上发表论文50余篇;获IJCB2022、CCBR2022、CCBR2018最佳论文奖和ISCAI2024最佳海报奖;申请国家发明专利12项。主持国家自然科学基金青年项目、北京市自然科学基金面上项目、北京市高层次留学人才回国资助等项目9项;担任CSIG生物特征识别专委会副秘书长。
黄俊端
华南师范大学副研究员
简介:华南师范大学特聘副研究员、硕导。主要研究领域包括生物特征识别、计算机视觉、深度学习、人工智能、智慧农业等。博士毕业于华南理工大学,曾受国家公派至瑞士Idiap研究所/瑞士生物特征研究与测试中心访学一年。合著发表包括IEEE-TIFS/IEEE-TCSVT等国内外权威或知名SCI/EI刊物学术论文二十余篇。担任中国图象图形学学会生物特征识别专委会副秘书长、中国人工智能学会会刊《智能系统学报》青年编委、IEEE Transactions系列、PR、NN、ESWA、COMPAG等国内外权威或重要期刊和会议的审稿人。中国人工智能学会模式识别专委会委员、中国计算机学会计算机视觉/人工智能与模式识别/数字农业专委会委员、中国图象图形学学会生物特征识别/视觉认知与计算专委会,IEEE/CCF/CSIG/CAAI会员。
胡海龙
重庆工商大学助理研究员
简介:胡海龙,重庆工商大学教师,博士毕业于卢森堡大学,硕士和本科均毕业于西南大学。主要从事可信人工智能和生物特征识别等方向研究。相关成果发表在TIFS、TAI、TOSN、IoT-J等国际知名期刊与会议,并两次获得国际会议最佳论文提名奖(ACSAC 2021和IEEE NAS 2018)。担任TIFS、TDSC、TOPS、PR和CCBR等国际期刊和会议审稿人。
生物特征识别前沿交叉论坛
生物特征识别与情感理解前沿交叉论坛聚焦于人工智能与生命科学的深度融合领域,强调以人为本的技术探索,探讨如何通过先进的传感、计算与建模方法,从生物运动、面部形态、语音韵律、远程脉搏波等多维生物特征中,精准解码人类内在的情感状态与身份信息。这一交叉领域凭借借其深刻的科学洞察力与巨大的应用潜力,已在人机交互、智慧医疗、公共安全、数字内容等多个领域展现出变革性的力量,成为推动下一代人工智能迈向更高阶情感智能的关键驱动力。此次论坛汇集了来自心理学、认知神经科学、计算科学与人工智能领域的顶尖学者,共同探讨情感与生物特征计算领域的最新突破与未来前景。论坛将围绕情感的生物与神经机制、生物特征的数字量化与遗传基础、情感内容的可控生成、新型生物传感技术以及大模型时代下的多模态融合等核心方向,深入解析其中的关键科学问题、技术挑战与未来创新机遇。
王莉
中国科学院心理研究所研究员
简介:中国科学院心理研究所研究员,博士生导师,从事生物运动与面孔情绪信息加工以及社会性注意方面的研究,相关研究成果发表在PNAS, Psychological Science, Trends in Cognitive Science, American Psychologist, National Science Review, JEP General, eLife, Psychological Medicine, Emotion, NeuroImage等具有国际影响力的权威学术期刊。入选中国科学院特聘研究骨干岗位、中国科学院青年创新促进会人才项目、朝阳区“凤凰计划”优秀青年人才,获得魏桥国科校长奖教金,北京市科学技术奖自然科学奖二等奖。主持多项国家自然科学基金面上、青年项目,并承担科技创新2030-“脑科学与类脑研究”重大项目、国家自然科学基金委员会重点项目、中国科学院战略性先导科技专项B类等项目子课题。
报告题目:生物运动情绪信息的加工及其机制
张曼菲
上海交通大学副教授
简介:张曼菲,上海交通大学Bio-X研究院长聘教轨副教授。中国遗传学会青年委员。聚焦东亚人群体质特征的数字化解析与遗传进化机制研究。以颅面特征为例,开发了三维人脸分割算法并系统解析了东亚面部独特性的遗传进化机制。先后主持国自然青年项目、科技部重点研发计划、上海市自然科学基金等,参与科技部基础性工作专项、上海市重大科技专项等项目。相关研究以第一/通讯作者发表于Nature Genetics、PLoS Genetics、JGG 、BMC Oral Health等权威期刊。现任JGG与Phenomics杂志青年编委,曾获CK-Research Award for Skin Physiology等奖励。
报告题目:东亚人群面部特征的数字量化与形成机制研究
报告摘要:人类面部的独特性及其形成机制研究一直是解析人类进化与遗传调控的核心科学问题。报告人融合遗传学、表型组学与信息学等,提出“数字驱动-表型量化-遗传解析”交叉研究范式,系统解析东亚人群面部特征的遗传基础。主要成果包括:①创新表型数字量化技术:开发了三维人脸分割算法和多图谱配准的颅骨颅面融合算法,构建了东亚人群头面部数据库。②系统解析颅面遗传进化机制:揭示东亚面部独特性的遗传基础,开发“面部多基因评分”模型重构古人面部特征。③推动多维表型研究与临床应用:开发耳部标注模型,揭示耳部新基因;构建颅面美学模型优化正畸疗效预测,推动临床应用;利用DNA重构面部三维人脸,推动生物识别技术革新。
郑文明
东南大学教授
简介:郑文明,东南大学首席教授、二级教授、国家级领军人才,儿童发展与学习科学教育部重点实验室主任,主要从事情感计算、人工智能等领域研究。获国家技术发明二等奖1项、省部级二等奖4项。
报告题目:情感可控的高表现力语音生成
报告摘要:语音交互已成为日常生活中不可或缺的组成部分,但现有语音生成系统在韵律自然度与情感多样性方面仍面临显著挑战。本报告将系统梳理高表现力语音生成的关键技术瓶颈,重点探讨预定义类别、可解释数值、参考音频以及文本提示等多种策略在语音情感风格建模与生成中的作用与局限,并展望未来研究方向及其跨领域的应用潜力。
李晓白
浙江大学百人计划研究员
简介:李晓白,浙江大学百人计划研究员,博导,浙江省千人。本科毕业于北京大学,硕士毕业于中科院大学,博士毕业于芬兰奥卢大学。获得芬兰科学院博后奖金,2020年至2023年4月在芬兰奥卢大学担任tenure track助理教授,获奥卢大学2019最具科学领导力的青年学者奖。2023年加入浙江大学网络空间安全学院,兼任奥卢大学客座教授。研究领域包括机器视觉、机器学习、情感计算、生物识别等。具体方向有微表情识别、基于视频的远程生理信号测量、生物特征识别、人脸活体检测、对抗攻击和伪造检测、多模态情感识别和内容生成等等。发表期刊和会议文章80余篇,包括高水平期刊和会议文章如IEEE TPAMI、TAC、SPM、PIEEE、IJCV、ICCV、CVPR等十余篇,谷歌学术检索H指数42,总引用10000,入选2022至2024年全球2%高被引学者。担任IEEE-TCSVT、IEEE-TMM、CVIU等期刊副编辑。关于微表情的研究被麻省理工科技评论报道,远程心率测量文章获IEEE芬兰区2020年最佳学生论文奖。
报告题目:远程脉搏波测量及其在生物识别领域的应用
刘斌
中国科学院自动化研究所副研究员
简介:刘斌,中国科学院自动化研究所副研究员。2015年博士毕业于中国科学院自动化研究所并留所工作至今,主要研究方向为情感计算、语音与音频处理、人机交互。曾获中国电子学会技术发明一等奖、北京市科技进步二等奖、中国专利优秀奖、国科大教育教学成果一等奖。承担或参与多项国家自然科学基金项目、国家重点研发计划项目、中国科学院战略先导科技专项项目等。近5年在IEEE TPAMI、IEEE TNNLS、IEEE TAFFC、IEEE/ACM TALSP等顶级国际期刊和ACM MM、NeurIPS、ICASSP等顶级国际会上发表论文70余篇,连续5年获得国际权威算法竞赛冠军,累计4次获得国内外重要学术会议最佳论文。参与撰写《情感计算理论与方法》专著,获得国科大-华为“智能基座”栋梁之师和国科大朱李月华优秀教师奖。
报告题目:大模型时代下的多模态情感识别技术与应用
李婧婷
中国科学院心理研究所副研究员
简介:李婧婷,中国科学院心理研究所副研究员,博士生导师。获聘中国科学院心理研究所特聘骨干岗位,入选2023年中国科学院青年创新促进会成员。主持国家自然面上、青基等科研项目,于IEEE TPAMI、TAC、TIP、ICCV、ACMMM等国内外期刊、会议发表微表情相关论文多篇,两篇论文进入ESI高被引论文清单。相关研究成果获2023年北京市科学技术奖自然科学奖二等奖。连续五年担任ACMMM 微表情国际挑战赛主席,担任PRL等期刊客座编委、TPAMI、TAC、TIP、TCSVT、Neurocomputing等期刊审稿人。主要研究方向包括计算机视觉、情感计算,特别是智能人脸微表情分析。
朱翔昱
中国科学院自动化研究所项目研究员
简介:中国科学院自动化研究所项目研究员,从事生物特征识别、数字人、人工智能基础理论研究与应用。国际模式识别协会(IAPR)生物特征识别青年学者奖(YBIA)获得者(两年一次,每次从全球范围内评选40岁以下学者一名)。共发表论文100余篇,发表文章的Google Scholar总引用次数为11000余次。获得三次国际竞赛冠军以及四项最佳论文及提名奖。授权国家发明专利16项。获2024中国图象图形学学会自然科学二等奖(第一完成人),2021中国电子学会科技进步二等奖、中国图象图形学学会优秀博士论文提名奖,任CCF:A类期刊T-IFS、CCF:B类期刊PR编委,中国图象图形学学会青托俱乐部副主席。
王甦菁
中国科学院心理研究所研究员
简介:王甦菁,中国科学院心理研究所青年特聘研究员,微表情应用研究中心负责人、博士生导师。主要研究方向为微表情识别、智能辅具、残疾人心理健康。在国内外重要期刊和学术会议上发表一百余篇论文,包括TPAMI、TAC、TIP、TNN、ECCV等。担任中国计算机学会理事、残疾人事业发展研究会理事,中国残疾人康复协会康复工程与辅助技术专业委员会副秘书长等职。获2018年第八届吴文俊人工智能科学技术奖一等奖、2023年度北京市科学技术奖自然科奖二等奖。连续六年(2019-2024年)入选斯坦福全球前2%顶尖科学家榜单。北京2022年冬残奥会火炬手,被新华社称为“中国版霍金”,第七届全国自强模范。
“看见心跳”——远程光电容积描记(rPPG)前沿论坛
远程光电容积描记(remote photoplethysmography, rPPG)是一种视觉非接触式生理信号测量技术,通过RGB相机来捕捉到人体皮肤中微小的血液灌注变化,从而提取心率、心率变异性、血氧饱和度等生理指标。相比传统接触式传感器,rPPG部署简单、成本低,适合连续监测和大规模筛查,在远程医疗、日常健康监测,车载监测、智能健身及心理健康评估等场景有着广泛的应用前景。本次论坛聚焦该领域的前沿热点问题,邀请四位国内在rPPG领域具有深厚造诣的专家。山东大学李可教授将针对运动和光线变化引起的噪声干扰问题,分析其对rPPG信号质量产生的影响,结合皮肤光学模型分析其噪声引入机制,并基于噪声引入机制和脉搏波信号性质,设计rPPG信号噪声抑制算法,提升检测的准确性和鲁棒性。重庆理工大学肖汉光教授将针对rPPG重构方法在深色皮肤个体和运动场景中存在性能显著下降等瓶颈问题,讨论引入生成对抗网络、结合对比学习策略、多尺度时空特征融合方法、以及构建了一个中大型夜间动态光照场景下的rPPG数据集等方法,以提升模型性能。合肥工业大成娟教授将从时域与时频域两个视角介绍基于rPPG的HRV监测方法:时域视角侧重于恢复长时程高质量的血容量脉冲(BVP)信号;而时频域视角则强调获取准确的瞬时频谱表征。合肥工业大学宋仁成教授将围绕可信视频生理参数提取技术,从视频脉搏波无参考质量评价和深度学习方法泛化性增强两个维度开展初步探索。本次论坛旨在为与会者提供一个交流学习平台,围绕rPPG技术在理论研究和实际应用过程中面临的实际问题展开讨论,为促进该技术进一步发展做出积极贡献。
李可
山东大学教授
简介:李可,教授、博士生导师、山东省高层次人才。山东大学控制科学与工程学院医工融合系书记、山东大学智能医学工程研究中心副主任,山东大学生物医学工程专业负责人。现任世界华人生物医学工程学会理事、中国自动化学会动态学习与智能医学专委会副主任委员、香港医学工程研究院会士。主持国家级、省部级重大项目等10余项,发表SCI、EI收录论文100余篇,获国家及国际发明专利50余项,获科研奖励和荣誉10余项。
报告题目:非接触式生理参数检测的抗干扰算法研究
肖汉光
重庆理工大学教授
简介:肖汉光,教授、博士、博士生导师,两江人工智能学院副院长。长期从事医学影像与生理信号智能分析与处理、图像处理与机器视觉、具身智能等领域的相关研究。现为人形机器人具身智能感知与自主学习重庆市重点实验室主任、先进装备智能化重庆市南岸区重点实验室主任、重庆市高校中青年骨干教师、重庆市“图像处理与机器视觉”研究生导师团队负责人,中国人工智能学会青工委委员,中国仿真学会视觉计算与仿真专委会委员,重庆市工业与应用数学学会理事,重庆市机器人与智能装备产业联合会具身智能机器人专家委员会专家,国家自科基金重点专项评审专家、重庆市AI领域重大专项评审专家。主持和参与国家级、省部级项目19项,其中主持国家自然科学基金项目3项。发表高水平论文90余篇,以第一主编出版学术专著和教材6部,已授权国家发明专利24项,多项专利已转移转化。
报告题目:基于机器视觉的rPPG信号重构及其应用研究
报告摘要:rPPG信号重构检测技术具有非接触、快速编辑等优点,在人体健康检测、情绪识别、刑侦等领域具有广泛应用价值。当前基于机器视觉的远程光体积描记信号(rPPG)重构方法在深色皮肤个体和运动场景中存在性能显著下降等瓶颈问题,为此,引入生成对抗网络对少数样本进行扩充,并结合对比学习策略,增强模型对个体差异和运动干扰的鲁棒性,从而缓解了训练数据有限带来的泛化不足。其次,针对视频数据同时蕴含丰富的时间和空间特征,提出一种多尺度时空特征融合方法,以充分利用局部与全局动态信息,显著提升了rPPG信号提取的精度与稳定性。在此基础上,构建了一个中大型夜间动态光照场景下的rPPG数据集,涵盖多种光照强度和位置变化,全面评估了模型在复杂环境中的适用性与可靠性。不仅在数据增强与特征建模方面取得了有效进展,也为rPPG在夜间监测、健康管理及实际应用场景中的推广提供了坚实基础和重要参考价值。
成娟
合肥工业大学教授
简介:成娟,教授、博士,分别于2008年和2013年获得中国科学技术大学学士学位和博士学位。主要研究方向包括视觉非接触智能健康监测等。作为项目负责人承担国家科技部重点研发计划课题/子课题,国家自然科学基金面上项目/青年科学基金等项目。在IEEE TPAMI/JBHI/TIM、《电子学报》等国内外权威期刊上发表论文70余篇,Google学术引用5000余次,入选ESI高被引论文6篇;授权中国发明专利20余项,其中1项技术转让应用于疲劳驾驶的核心技术。个人入选安徽省青年人才计划、全球前2%顶尖科学家榜单(2024,2025),荣获中国电子学会自然科学二等奖。担任中国图象图形学会(CSIG)青工委委员,CSIG女工委委员,CSIG生物特征识别专委会委员。
报告题目:用于心率变异性监测的远程生理传感技术
报告摘要:远程光电容积描记法(rPPG)在心率变异性(HRV)监测方面已展现出巨大潜力。与平均心率相比,HRV能更全面地反映人体自主神经系统的动态调控特征,从而支撑自主神经功能评估、心理压力检测及睡眠状态监测等多元应用。本次报告将从时域与时频域两个视角介绍基于rPPG的HRV监测方法:时域视角侧重于恢复长时程高质量的血容量脉冲(BVP)信号;而时频域视角则强调获取准确的瞬时频谱表征。具体地,时域方面,提出了一种具备时长可扩展能力的全局时空模型LST-rPPG,可生成时长可扩展的高质量BVP信号,实现精确的HRV测量。时频域方面,则提出了一种结合同步压缩小波变换(WSST)与TransUNet 的新方法WSST-UNet,利用WSST获得瞬时频谱表征,并借助TransUNet进行时频表征增强,从而有利于提取清晰的时频脊线,实现瞬时心率(IHR)的精准估计。
宋仁成
合肥工业大学教授
简介:宋仁成,教授,IEEE 高级会员,安徽省数字健康产业研究院技术带头人,中国图象图形学学会生物特征识别专委会(筹)委员。主要从事非接触式智能感知和智能信号处理研究,具体包括视觉、电磁感知、感知不确定度评估和物理驱动深度学习等方向。作为项目负责人承担了国家自然科学基金重点项目(合作单位课题)/面上项目/国家重点研发计划子课题、安徽省重点研发计划、安徽省自然科学基金以及校企合作等多项科研项目。在IEEE TAP/TMTT/JBHI/TGRS/TIM/TCI/SPL等国内外知名学术期刊已发表SCI论文90余篇,5篇论文入选ESI高被引论文。以第一完成人授权国家发明专利11项,美国专利2项。个人入选斯坦福大学全球前2%顶尖科学家(2024,2025),国际期刊IEEE Transactions on Instrumentation and Measurement 年度杰出审稿人(2024年)。
报告题目:可信视频生理参数提取探索
单彩峰
南京大学教授
简介:单彩峰,教授、博导,国家级领军人才。现任南京大学智能科学与技术学院副院长,南京大学-中国移动联合研究院副院长。2001年获中国科学技术大学学士,2004年获中国科学院自动化研究所硕士,2007年获英国伦敦大学博士。之后在荷兰飞利浦研究院工作十余年,担任资深科学家和团队负责人,并兼任荷兰埃因霍温理工大学研究员。主要从事计算机视觉、模式识别、医学图像计算等方面的研究,先后承担多个欧盟Horizon 2020计划项目、国家自然科学基金原创探索项目、工信部揭榜挂帅项目等。发表论文170多篇(引用1万余次)、授权各国专利100多项(其中美国欧洲日本专利60余项)。荣获飞利浦公司发明奖,入选全球前2%顶尖科学家、飞利浦公司“High Potential”人才等。先后担任10余个国际期刊的编委或客座编委(包括多个IEEE汇刊)。
赵昶辰
杭州电子科技大学副教授
简介:赵昶辰,博士,杭电计算机学院副教授,硕士生导师。于2018年6月与12月分别获得台湾中兴大学与北京航空航天大学博士学位。主要研究领域为视觉非接触式生理信号监测,基于视觉的脉搏波、心率、血压、血氧饱和度以及心血管疾病的检测。主持国家自然科学基金面上项目、青年项目、浙江省自然科学基金探索项目、浙江省自然科学基金重点项目、中国博士后科学基金面上资助、北航杭州创新研究院开放基金各1项。参与国家自然科学基金、浙江省重点研发计划以及横向项目若干。近五年以第一作者和通信作者发表SCI期刊论文10篇,其中一篇为高被引论文和热点论文,发表国际会议论文9篇。