论坛主题:医疗知识图谱论坛
论坛时间:2025年9月21日 13:30–17:00
论坛主席

汤步洲(哈尔滨工业大学(深圳))
主席简介:汤步洲,哈尔滨工业大学(深圳),教授、博士生导师,鹏城实验室兼职研究员,深圳市海外高层次人才。曾任美国范德堡大学和德州大学休斯敦健康科学中心博士后研究员。
主要研究方向:人工智能、自然语言处理、医学信息学、医疗时序数据分析、多模态信息处理等。OHDSI中国组核心成员,中国中文信息学会理事,中国中文信息学会“医疗健康与生物信息处理”专业委员会副主任兼秘书长,中国计算机学会青年理事,中国计算机学会YOCSEF深圳主席(2022-2023)。近年来,在国际知名期刊和会议上发表学术论文200+篇,其中SCI检索论文80+篇;获发明专利12项;相关研究成果获省一等奖1项,市科技创新奖1项,中国中文信息学会“钱伟长中文信息处理”青年创新奖,市自然科学技术二等奖1项;组织参加相关研究领域国际评测,15次获得第一名,1次特等奖;牵头构建了国内首个包含任务最多的公开中文临床自然语言处理领域数据集CBLUE,2次获得最佳会议论文奖,多次入选Stanford全球前2%科学家榜单,论文Google scholar引用6500+次,H-index为39。先后承担国家、省市、企业合作项目40+项。
报告一

报告嘉宾:俞声(清华大学统计与数据科学系 长聘副教授)
报告题目:基于大模型的电子病历结构化与医学本体建设
报告摘要:电子病历包含患者诊疗过程中的丰富医学信息,通过自动化信息提取并对术语进行标准化,转化为规范的结构化数据,可以为医学研究与临床自动化提供丰富的数据支持、大幅降低人力成本、提高科研数据采集与医院管理效率。然而,真实的临床病历用语高度个性化、存在大量简称和非标准表达,电子病历的结构化、标准化对自然语言处理工具和基础设施都是巨大挑战。本报告将介绍利用大模型中的庞大背景知识,实现电子病历的准确理解,并在其术语抽取的基础上,利用大模型实现大规模数据驱动的医学本体自动化建设。
嘉宾简介:俞声,清华大学统计与数据科学系长聘副教授。研究方向为医学文本类智能,包括自然语言处理、大型语言模型、知识图谱、搜索引擎、电子病历分析等。俞声与哈佛大学蔡天西教授合作发明的高通量表型提取技术使疾病表型识别算法开发速度提高千倍,应用于“Million Veteran Program”等美国国家级精准医学研究项目以及Mass General Brigham等医院的生物样本库、科研患者注册库建设。俞声主持开发了拥有2210万概念、4602万中英文术语、9985万关系三元组的“生物医学信息学本体系统”BIOS,体量达到美国“统一医学语言系统”UMLS的数倍。俞声与蔡天西教授于2014年发布了电子病历自然语言处理系统NILE,被10个国家和地区的医学研究机构和学者使用;2024年,俞声与蔡天西、Isaac Kohane课题组联合发布中英文电子病历结构化大模型GENIE。俞声获评国家青年拔尖人才,现任JASA Associate Editor。
报告二

报告嘉宾:杜建(北京大学健康医疗大数据国家研究院 助理教授)
报告题目:因果知识图谱构建及其在重大慢病管理中的应用
报告摘要:因果知识图谱(简称因果图)是指导观察性数据因果推断和增强健康决策可解释性的基石。本报告将介绍从知识图谱中自动生成因果图的策略,尤其是基于大语言模型开展健康证据提取和因果强度评估的新方法。在此基础上分享因果图在观察性研究因果建模变量选择、生命历程疾病风险链推理与早期预防策略制定中的应用。
嘉宾简介:杜建,北京大学健康医疗大数据国家研究院助理教授、博士生导师。主要研究方向:医学自然语言处理、医学知识图谱与大语言模型、健康信息治理与循证公共卫生决策。近5年,围绕人工智能+循证医学交叉领域,主持科技部重点研发计划青年科学家项目、国家自然科学基金面上项目各1项。相关工作以第一或通讯作者发表于Nature Communications、Journal of the American Medical Informatics Association (JAMIA)、Science Bulletin、EClinicalMedicine、Scientific Data等。担任Nature 数据科学子刊Scientific Data编委;担任Health Data Science,BMC Medical Informatics and Decision Making编委。
报告三

报告嘉宾:罗凌(大连理工大学计算机科学与技术学院 教授)
报告题目:生物医学文本信息抽取:从预训练语言模型到大语言模型
报告摘要:生物医学文本作为生物医学知识的重要载体,是生物医学研究的核心资源之一,蕴含着丰富且多样的领域知识。结合实际应用需求,利用高效的信息抽取技术,从海量生物医学文本中自动、快速且准确地获取关键信息,将为生物医学领域的研究提供强有力的支撑。本次报告将介绍团队在生物医学文本信息抽取方面的研究工作与最新进展,重点涵盖生物医学命名实体识别与实体关系抽取任务,内容涉及从基于预训练语言模型的方法演进到基于大语言模型的方法探索。
嘉宾简介:罗凌,大连理工大学计算机科学与技术学院教授,博导,美国国立卫生研究院(NIH)博士后,国家级青年人才入选者。主要研究方向为自然语言处理、生物医学文本挖掘和健康计算,已在人工智能、生物信息学等领域发表高水平期刊和会议论文30余篇。主导研发了PhenoTagger、AIONER等生物医学文本挖掘工具以及生物医学大模型“太一”。在国内外生物医学文本挖掘相关挑战赛中多次获得第一名。
报告四

报告嘉宾:谢倩倩(武汉大学人工智能学院 教授)
报告题目:医疗领域知识增强大语言模型与应用
报告摘要:以大语言模型(LLM)为代表的新一代人工智能技术,正推动医疗领域的智能化转型。LLM 在医学文本理解、临床推理与生成方面展现出巨大潜力,但在领域知识覆盖、诊断可靠性和结果可解释性上仍存在不足。医疗领域的结构化与非结构化知识,以及多源异构的临床与科研数据,为提升 LLM 的专业能力提供了重要支撑。如何将领域知识有效注入大语言模型,并在医疗场景中实现更高精度、更强可解释性的分析与决策,是推动该技术落地的核心问题。本报告将结合我们在该领域的研究成果与思考,探讨医疗领域知识增强大语言模型的发展现状、关键技术与应用前景。
嘉宾简介:谢倩倩,武汉大学人工智能学院教授,博士生导师。曾任耶鲁大学副研究员,先后在康奈尔大学、曼彻斯特大学和蒙特利尔大学工作和访问。长期从事自然语言处理相关的研究。研究工作发表在国际顶级会议和期刊NeurIPS/ACL/KDD/Nature Communications/npj Digital Medicine/TKDE等。多次受邀担任NeurIPS、ACL、EMNLP等顶会的领域主席,担任COLING-2025 workshop的大会联合主席。长期担任NeurIPS/ICLR/ICML/ACL/KDD/npj Digital Medicine等顶级会议和期刊的审稿人。入选2024年国家高层次青年人才项目(海外)和2025年CCF-腾讯犀牛鸟基金项目(资助率约9.5%)。曾获得美国国家卫生院资助的青年研究者项目K99/R00: Pathway to Independence Award,CCL亮点英文论文和雷军奖学金。
报告五

报告嘉宾:吴贤(腾讯天衍实验室 主任)
报告题目:从深度网络到大模型,腾讯在医学AI上的探索与落地
报告摘要:介绍腾讯在医疗AI领域的探索与应用实践,从最初基于深度学习网络的研究,到后来的大模型开发,旨在更好地为医生、患者和医疗机构提供支持。报告涵盖医学大模型的构建过程、面临的技术挑战以及实际应用效果。
嘉宾简介:吴贤博士是腾讯天衍实验室主任,专家研究员。吴博士的主要研究兴趣包括医学NLP,医学大模型等。吴博士在Nature子刊,T-PAMI, NeurIPS, ACL, CVPR等国际顶级杂志会议上发表文章一百余篇,被引用超过7000次,有近50项美国和中国专利。吴博士获得过华夏医学科技一等奖,在国际MSCOCO评测中获得过第一名,也在ICDM知识图谱评测中获得了第二名的成绩。在加入腾讯之前,吴博士先后供职于IBM研究院和微软人工智能和研究部门。吴博士在上海交通大学获得计算机博士学位。
报告六

报告嘉宾:李林峰(医渡科技 技术创新副总裁兼AI架构师)
报告题目:大模型技术临床应用的挑战与应对
报告摘要:针对大模型技术在临床应用中遇到的幻觉、医生不信任、执行速度慢等实际问题,介绍相应的应对方案。
嘉宾简介:李林峰,医渡科技技术创新副总裁兼AI架构师。清华大学工程硕士企业导师、中国中医药信息学会中医药健康大数据分会常务理事、中文信息学会医疗健康与生物信息处理专业委员会委员。曾任百度医疗大脑算法负责人。研究方向为医疗大数据挖掘技术及人工智能创新应用,包括医学知识图谱、预测模型、大模型技术,以及基于AI技术的科研平台与临床决策支持系统建设等。在医疗人工智能领域发表论文10余篇并拥有40多项专利,曾获北京市科技进步一等奖与国家专利优秀奖,参与多项国家及省部级课题研发。在临床数据挖掘与创新应用方面有丰富的经验,与多家三甲医院合作并获奖。