日期 | 时间 | 内容 | 讲者 |
---|---|---|---|
9月20日上午 | 08:30-09:30 | 知识图谱与大语言模型协同增强 | 陈永锐(东南大学) |
09:30-10:30 | 大模型幻觉与知识边界 | 田植良(国防科技大学) | |
10:30-10:50 | 茶歇 | ||
10:50-11:50 | 机器心智与大语言模型 | 陈壮(清华大学) | |
9月20日下午 | 14:00-15:00 | 新闻行业大模型研发与落地实践 | 熊飞宇(上海算法创新研究院) |
15:00-16:00 | 大模型时代的知识融合 | 孙泽群(南京大学) | |
16:00-16:20 | 茶歇 | ||
16:20-17:20 | 大模型工具学习与自主智能体初探 | 从鑫(清华大学) |
报告1: 知识图谱与大语言模型协同增强 – 陈永锐 [slide]
报告摘要:
在人工智能的迅猛发展中,知识图谱和大语言模型,如OpenAI的GPT系列,已成为核心技术。知识图谱通过构建实体之间的关系网,为机器提供了一个丰富的世界知词库,这使得机器能够在一个结构化的知识环境中理解和处理信息。另一方面,大语言模型利用这些结构化的知识,进行高效的语言理解和生成,从而实现更深层次的语义理解和交互。本报告将详细探讨如何将知识图谱与大语言模型协同工作,以实现更精准的信息检索、更自然的语言交互以及更智能的决策支持。本报告将从基础概念入手,详细解析它们如何整合和利用知识图谱中的信息。通过具体的案例分析,本报告将展示知识图谱和大语言模型结合的强大能力,如何通过这种技术协同处理复杂的查询,提供基于证据的决策支持,以及生成高质量的自然语言输出。最后,报告将介绍一些最新的研究进展和未来的发展趋势,包括如何通过先进的机器学习技术和算法改进知识图谱的动态更新,以及大模型在处理更复杂语言结构时的创新方法。
专家简介:
陈永锐,东南大学“至善”博士后。本科毕业于东北大学物联网工程专业,自2017年到2024年在东南大学先后取得软件工程硕士、博士学位。在博士就读期间,陈博士师从漆桂林教授,主攻人工智能领域,研究内容广泛,涵盖了包括结构化知识问答,持续学习,与大语言模型等多个前沿方向。截至目前,陈博士已经在NeurIPS、AAAI、 IJCAI、TKDE等国际重要学术期刊及会议上发表了多篇学术论文,并且参与了包括CIKM、EMNLP、VLDB在内的多项国际会议审稿工作。在学校期间、陈博士获得博士新生奖学金、腾讯奖学金、南京人工智能“兴智计划”奖学金等多项荣誉,并在2023年入选腾讯“犀牛鸟精英人才计划”。
报告2: 大模型幻觉与知识边界 – 田植良
报告摘要:
预训练大语言模型在许多领域取得了令人经验的效果,但大模型也常会出现幻觉:在一些问题上犯低级错误。大模型幻觉也是制约大模型发展的棘手问题。研究者在对大模型的许多幻觉样例详细分析后发现,大模型自身对知识掌握程度的分布,对于大模型幻觉的产生有较大影响,大模型对知识掌握的程度可以用知识边界刻化,即,明确了已知知识和未知知识的界限。本次报告旨在介绍大模型幻觉的表现形式、特点分布,浅析大模型幻觉的成因机理,介绍大模型幻觉的一些检测或缓解方法。进一步地,从大模型掌握知识的知识边界角度,深入研讨大模型幻觉与自身掌握知识之间的关系,并介绍该领域的一些代表性工作。最后,总结大模型幻觉的特点,对大模型幻觉的检测或缓解的未来发展方向进行总结分析。
专家简介:
田植良,国防科技大学计算机学院某全国重点实验室技术骨干。本科毕业于哈尔滨工业大学,博士毕业于香港科技大学。致力于大模型、文本生成、隐私保护方面研究。发表NeurIPS、ACL、WWW、EMNLP等人工智能与自然语言处理会议发表论文三十余篇,其中一作或通讯论文二十余篇,获授权国家发明专利二十余项。获微软学者提名、百度最高奖、百度奖学金全球40强等奖励。曾担任ACL、EMNLP领域主席,IJCAI高级程序委员等,中文信息学会青工委执行委员。入选中国科协青年托举人才工程。
报告3: 机器心智与大语言模型 – 陈壮 [slide]
报告摘要:
心智理论(Theory of Mind,ToM)是指人类理解和推断他人心理状态(包括信念、欲望、意图、情感等)的能力,是社交智能的基础和核心。目前,大语言模型已经展现出类人的语言理解和生成能力,人们开始好奇大语言模型是否已经具备机器心智(Machine ToM)。本报告将介绍近期关于大语言模型心智评价的最新研究和进展,并讨论如何结合语言模型和知识图谱以提升机器心智水平。
专家简介:
陈壮,清华大学计算机系博士后,合作导师为黄民烈教授。博士毕业于武汉大学计算机学院,导师为钱铁云教授。主要研究方向为大语言模型、社交智能和计算心理学等,是角色大模型CharacterGLM和心理大模型Emohaa的核心研发成员。在ACL、EMNLP、IJCAI、TASLP等自然语言处理和人工智能顶级会议或期刊上发表论文多篇。担任计算语言学顶会ACL、EMNLP、NAACL的领域主席和顶刊TACL、CL的常任审稿人。主持博士后科学基金面上资助项目。
报告4: 新闻行业大模型研发与落地实践 – 熊飞宇
报告摘要:
通过与新华社、中国电信开展合作研发,我们在新闻场景围绕大模型落地所面临的多个重要问题展开了工作。重点解决了包括大模型行业评估、应用算法开发与提效、行业对齐在内的多项重点事项。本报告讲从新闻行业痛点阐述入手,讲述一个行业大模型从立项、交付到产品化的典型过程。
专家简介:
熊飞宇,华中科技大学本科,美国Drexel University博士。现任上海算法创新研究院大模型中心负责人,带领团队建设了类脑架构忆³大模型,将现有大模型重构成隐性记忆,显性记忆,工作记忆三部分,并使用内置AI数据库塑造显性记忆机制,大幅优化了模型的训练推理成本、性能以及行业适配能力。并与新华社和中国电信一起打造“新语”新闻行业大模型, 在新闻行业诸多任务上达到业界领先水平。之前在阿里巴巴集团先后担任业务中台数据智能负责人,淘宝天猫集团数据平台负责人。在阿里期间主要负责电商核心交易链路商品、用户、交易、营销等系统的智能化建设,完成基于多源、异构、多模态的大数据构建千亿级别数字商业知识图谱的算法应用,和国内首个知识交互的零售行业大模型的建设工作,获得浙江省科技进步奖,杭州市521计划青年人才,杭州市C类人才(省级领军人才),阿里巴巴优秀学术合作奖等奖项,并在人工智能顶级会议和期刊上发表多篇论文。
报告5: 大模型时代的知识融合 – 孙泽群 [slide]
报告摘要:
知识融合是知识图谱领域的重要研究内容,通过对齐不同来源的共指实体或概念,实现多源异构知识图谱的整合,解决知识冗余和冲突等问题。知识融合可以有效提高知识图谱的质量和完备性,从而为大语言模型提供精准和完整的背景知识。本报告将详细介绍知识融合的基本概念和主要方法,尤其是大模型时代的知识融合新挑战与新思路。最后,报告讨论知识融合的未来研究方向,包括知识图谱与大语言模型内部知识的融合计算。
专家简介:
孙泽群,博士,南京大学计算机学院助理研究员、毓秀青年学者。研究方向为知识图谱表示学习和知识增强的大语言模型,在相关领域的CCF-A/B类会议与期刊,如ICML、NeurIPS、AAAI、IJCAI、ACL、SIGMOD、VLDB、ICDE、KDD、TKDE等,发表论文30余篇。研究成果多次被中国科学院院士、图灵奖得主、AAAI/ACL/ACM/IEEE Fellow等海内外同行引用,论文的Google Scholar总引用量达2500余次,两篇IJCAI文章入选Paper Digest高影响力论文。长期担任NeurIPS、ICML、AAAI、IJCAI、ACL等会议的程序委员会委员和TKDE、TNNLS、TASLP等期刊的审稿人。多次入选AI 2000知识工程领域最具影响力学者提名榜单,主持CCF-腾讯犀牛鸟基金、江苏省自然科学青年基金等项目。
报告6: 大模型工具学习与的自主智能体初探 – 从鑫 [slide]
报告摘要:
随着预训练技术的飞速发展,以ChatGPT为代表大模型展现出了惊人的智能水平。然而,大模型在特定领域的任务上仍存在一定的局限性,距离实际应用仍有一段距离。人类社会是高度分工化的,不同专业领域需要有不同的专业知识和技能才能处理领域内的复杂任务。本报告聚焦于大模型工具学习,介绍大模型如何能够理解和使用各种工具来完成任务,内容包括工具学习主要挑战、统一框架、关键技术和未来方向。
专家简介:
从鑫,中国科学院信息工程研究所博士,现于清华大学自然语言处理实验室(THUNLP)担任博士后,主要研究方向为大语言模型、工具学习、自主智能体;合作导师为刘知远教授,曾在ACL、ICLR、SIGIR、EMNLP等自然语言处理、人工智能等相关的国际学术会议或期刊上以第一作者身份发表论文数篇。在工具学习与自主智能体方面,主持发布了大语言模型工具学习框架ToolLLM、大语言模型驱动的自主智能体框架XAgent等工作。其中ToolLLM被ICLR 2024评选为Spotlight论文,XAgent在世界影响力最大的开源平台 Github 上获得超过7.8K颗星标,受到了国内外众多知名学者和企业的高度评价。