讲习班

日 期 时间 题目 主讲人
2021-11-04 9:00 – 10:30 自然语言处理中符号规则方法的神经网络化 屠可伟(上海科大)
10:30 – 12:00 基于深度学习的自然语言语义解析 陈波(中科院软件所)
2021-11-04 14:00 – 17:00 因果启发的学习和推理 崔鹏(清华大学
  2021-11-05 09:00 – 12:00 常识知识的获取与推理 宋阳秋(香港科大)
2021-11-05 14:00 – 15:30 工业级知识图谱构建及实践 张杰(明略数据)
15:30 – 17:00 知识图谱在故障分析场景下的构建与问答应用实践 文辉(达观数据)

T1

屠可伟( 上海科技大学 )

Title: 自然语言处理中符号规则方法的神经网络化

Abstract: 近几年深度学习和神经网络方法已成为自然语言处理领域的主流方法,但传统的符号主义方法仍然具有一些独特的优点。在本次报告中,我将讨论把传统符号规则方法和神经网络方法进行结合,使其相互取长补短的一些近期工作。首先,我将介绍如何把诸如正则表达式这样的符号规则融合入神经网络,得到结合两者优点的模型。其次,我将介绍利用神经网络技术进行句法规则和形式文法的无监督学习的一系列工作。

Bio: 屠可伟,博士,上海科技大学信息科学与技术学院长聘副教授、研究员、博士生导师。美国爱荷华州立大学计算机博士;美国加州大学洛杉矶分校统计系与计算机系博士后。研究方向包括自然语言处理、机器学习、知识表示、计算机视觉等人工智能领域,目前侧重于研究语言结构的表示、学习与应用。发表论文近百篇,主要发表于ACL、EMNLP、NAACL、AAAI、IJCAI、NeurIPS、ICCV等顶级会议。曾担任ACL、EMNLP、NAACL等多个顶级会议程序委员会委员和领域主席。

T2

陈波 ( 中国科学院软件研究所 )

Title: 基于深度学习的自然语言语义解析

Abstract: 自然语言语义解析是实现自然语言理解的关键技术之一,能广泛应用于智能问答、语音助手、智能机器人等人工智能服务。本报告将简要介绍语义解析领域目前主流的基于深度学习的方法、基于大规模预训练的方法,以及热门的语义解析任务(如表格解析)。

Bio: 陈波,博士,现任中国科学院软件研究所副研究员,2018年获得中国科学院大学工学博士学位,并荣获优秀毕业生,2020年获评中科院软件所优秀青年科技人才计划。研究方向为语义解析和自然语言处理。迄今在包括ACL、AAAI、IJCAI、CIKM、COLING、NAACL等在内的国际顶级会议发表学术论文多篇。主持一项国家青年科学基金项目,参与多项国家自然科学基金重点课题以及企业合作科研项目的研发。

T3

崔鹏( 清华大学 )

Title: 因果启发的学习和推理

Abstract: 近年来人工智能技术的发展,在诸多垂直领域取得了性能突破。但当我们将这些技术应用于医疗、司法、工业生产等风险敏感领域时,发现当前人工智能在稳定性、可解释性、公平性、可回溯性等“四性”方面存在严重缺陷。究其深层次原因,当前统计机器学习的基础——关联统计自身不稳定、不可解释、不公平、不可回溯可能是问题的根源。相对于关联统计,因果统计在保证“四性”方面具有更好的理论基础。但如何将因果统计融入机器学习框架,是一个开放并有挑战的基础性问题。本报告中,讲者将重点介绍因果推断的基础原理以及最新进展,因果启发的稳定学习理论和方法,及其在解决OOD泛化问题方面的机会和挑战。

Bio: 崔鹏,清华大学计算机系长聘副教授,博士生导师。研究兴趣聚焦于大数据驱动的因果推理和稳定预测、大规模网络表征学习等。在数据挖掘及人工智能领域顶级国际会议发表论文100余篇,先后5次获得顶级国际会议或期刊论文奖,并先后两次入选数据挖掘领域顶级国际会议KDD最佳论文专刊。担任IEEE TKDE、ACM TOMM、ACM TIST、IEEE TBD等国际顶级期刊编委。曾获得国家自然科学二等奖、教育部自然科学一等奖、电子学会自然科学一等奖、北京市科技进步一等奖、中国计算机学会青年科学家奖、国际计算机协会(ACM)杰出科学家。

T4

宋阳秋 ( 香港科技大学 )

Title: 常识知识的获取与推理

Abstract: 理解人类语言需要复杂的世界知识。近年来,常识知识的获取和推理越来越受到研究界的关注。本报告将简要介绍我们如何获得常识知识并形成知识库或知识图谱,以及最近的基准数据集和在常识问答上的表现 。

Bio: 宋阳秋,现任香港科技大学助理教授,清华大学学士、博士。曾在多家工业界研究机构(Google、IBM、微软、华为)以及学校(香港科技大学、伊利诺伊香槟分校、西弗吉尼亚大学)从事研究工作。在数据挖掘、人工智能、自然语言处理领域发表多篇文章,曾获KDD2017 Data Science Track最佳论文、IUI2015最佳论文提名、KDD2014优选发表TKDD论文(九篇之一)及PAKDD2007最佳论文提名。担任JAIR编委、IJCAI2019 Local Chair等职位。

T5

张杰 ( 明略科学院 )

Title: 工业级知识图谱构建实践

Abstract: 在传统行业纷纷做数字化转型的背景下,如何利用知识图谱技术有效地沉淀和管理知识资产,成为企业保持持续创新力的关键问题。本报告结合明略科技在营销、金融、轨交等多个领域的项目经验,介绍工业级知识图谱构建过程中涉及到的两类用户(知识工程师、知识官)、三类知识(事实知识、原理知识、技能知识)和四项能力(知识抽取、知识管理、知识计算、知识演化),并针对行业应用中的痛点,介绍知识图谱在可视化洞察、搜索、推荐、问答等落地场景中的实践。

Bio: 张杰,明略科学院知识工程实验室主任,天津大学计算机专业博士,曾任职于华为中央研究院、金融科技公司CTO。研究方向为知识工程、自然语言处理,技术专著1部,国家项目8项,学术论文10余篇,发明专利100余项。主持开发推荐引擎、知识问答系统、客服机器人、大数据风控系统、行业知识图谱等多项系统,累计销售额数亿元。

T6

文辉 ( 同济大学 )

Title: 知识图谱在故障分析场景下的构建与问答应用实践

Abstract: 本次分享重点介绍故障分析场景下知识图谱的构建和问答技术算法应用和实践,具体内容包括:1)在少量标注样本下基于开放Bert进行实体抽取效果优化,以及基于触发词的关系抽取效果优化;2)基于失效知识图谱的实体链接和意图识别模型训练,探讨如何基于图谱+模板生成意图识别的样本数据;3)达观知识图谱平台架构演化以及项目实践和经验。

Bio: 文辉,达观数据联合创始人,主要负责达观数据知识图谱方向产品和技术研发。 在知识图谱、搜索推荐、自然语言处理、分布式平台架构设计等方面具备10年的研发和实践经验。熟悉知识图谱构建原理、架构和算法,先后负责多个知识图谱、推荐、搜索相关大型项目,具有丰富的知识图谱应用落地化经验。对图挖掘分析、图谱问答、搜索推荐等关键算法有着深厚理解和丰富实践经验。