报告标题:在大模型时代重新审视知识工程的使命 pdf

报告摘要:
近期ChatGPT、GPT-4等大模型被广泛认为开启了人工智能研究的新阶段,是大数据驱动的连接主义技术路线的关键技术突破。在新的研究时代背景下,本报告回顾和反思符号主义和连接主义经典路线,重新审视知识工程领域研究在未来的研究任务和使命。
专家介绍:
李涓子,博士,清华大学长聘教授,清华大学人工智能研究院知识智能中心主任,中国中文信息学会语言与知识计算专委会主任。研究方向为知识工程、自然语言处理。近年来在重要国际会议和学术期刊上发表论文100余篇,谷歌学术引用1万余次。获得2020年国家科技进步二等奖,2017年北京市科技进步一等奖,2013年人工智能学会科技进步一等奖。

报告标题:知识计算与大语言模型pdf

报告摘要:
知识计算是自然语言处理的关键技术之一,大语言模型时代的到来,给知识计算带来了新的机遇与挑战。本次报告从分析大模型知识能力出发,通过知识图谱和事理图谱提升大模型深层次推理能力,通过因果知识推理提高大模型生成事实性知识的能力,以及通过工具学习获取外部工具提供的知识,进一步扩展大模型的利用外部工具知识的能力。
专家介绍:
秦兵,哈尔滨工业大学计算学部教授,博士生导师,哈尔滨工业大学自然语言处理研究所副所长。国家重点研发课题、国家自然科学基金重点项目负责人。科技部科技创新2030-“新一代人工智能”重大项目管理专家组专家,中国中文信息学会理事/语言与知识计算专委会副主任/情感计算专委会主任。主要研究方向:自然语言处理,知识图谱,情感计算,文本生成。入选“2020年度人工智能全球女性及AI 2000最具影响力学者榜单”和“福布斯中国2020科技女性榜”。

报告标题:认知博弈背景下的社交媒体谣言检测pdf

报告摘要:
社交媒体已成为当前认知博弈的主要战场,其上充斥着大量网络谣言用以引导舆论、破坏国家形象、颠覆民众认知,因此需要针对社交媒体的谣言进行快速、准确的识别。本报告主要介绍课题组近年来基于谣言文本、网络用户、传播过程等信息理解的谣言检测研究,并对未来工作进行展望。
专家介绍:
李斌阳,现为国际关系学院教授,任中国中文信息学会理事、中国中文信息学会社会媒体处理专委会副秘书长。长期从事自然语言处理和社会计算等方向的研究,在相关领域发表学术论文60余篇。主持多项国家自然科学基金、国家重点研发计划、北京市自然科学基金、军委科技委项目等。获2022年国家某部科技进步一等奖、2022年国家某部部级优秀教师、2022年钱伟长中文信息处理技术青年创新奖、2017年教育部科技进步二等奖,长期担任多个国际顶级期刊和学术会议评审、担任多个会议的组织工作。

报告标题:多模态知识图谱的管理与分析pdf

报告摘要:
随着人工智能技术的不断发展,知识图谱作为人工智能领域的知识支柱,以其强大的知识表示和推理能力,在语义搜索、问答、知识管理等领域得到了广泛的应用。多模态知识图谱整合了来自不同数据源的多种类型数据,如文本、图像、音频等,为知识的表示和推理提供了全新的可能性。本报告本报告将结合实际应用,阐述多模态知识图谱的研究背景、以及知识图谱具有的多模态特点。并从多模态为知识图谱带来的新查询和新推荐两个方面,介绍多模态知识图谱管理与分析关键技术。
专家介绍:
袁野,博士,现为北京理工大学计算机学院教授、博士生导师、国家杰青和优青基金获得者。主持国家自然基金重点项目,科技部重点研发项目。曾获中国电子学会自然一等奖,教育部和辽宁省科技进步一等奖、全国优秀博士论文提名奖、中国计算机学会优秀博士论文奖。袁博士是中国计算机学会数据库专业委员会常委、大数据专家委员会委员、中国计算机学会高级会员,IEEE、ACM高级会员。香港科技大学、香港中文大学、英国爱丁堡大学访问学者。主要研究方向为大数据管理与分析,在SIGMOD、VLDB、ICDE、VLDB Journal、IEEE Trans. TKDE、IEEE Trans. TPDS等重要学术会议和期刊上发表CCF A类论文100余篇。

报告标题:用知识增强“小”语言模型:在企业数据仓库环境下构建面向场景的智能应用pdf

报告摘要:
ChatGPT的出现激发了对大语言模型的研发热情。然而,千亿级参数的大型语言模型在训练、微调和推理等方面的成本都相当高昂。与此相对,百亿级参数的”小”语言模型凭借其强大的语言理解和生成能力以及显著的成本优势,正逐渐展现出自身的价值。在实际应用中,通过引入与上下文紧密相关的知识,可以显著地增强语言模型的生成能力,有效解决了即使是千亿级参数大模型也难以避免的”生成幻觉”问题。作为企业数据存储、管理、分析和处理的核心,数据仓库为大型语言模型与企业数据的紧密协同以及面向场景的企业智能应用的构建提供了天然的数据和计算环境。本报告将分享一些基于企业数据仓库和”小”语言模型构建知识增强的企业智能应用的实践经验,以期探索语言模型在企业规模化应用中的一条可行路径。
专家介绍:
杨胜文,清华大学计算机系博士,本科和研究生毕业于东北大学,现任酷克数据首席科学家。曾任百度大数据技术委员会主席、主任架构师、大数据部技术负责人,更早前在EMC、Yahoo Beijing Labs、HP  Labs China从事研发工作。在大数据分析、数据挖掘、数据智能等领域深耕多年,在互联网用户理解、产业数据智能、人工智能行业应用等领域有着丰富的实践经验。曾获得2022年度教育部科学技术进步奖一等奖。

报告标题:传承与变革:大模型浪潮下知识图谱研究之简单思考pdf

报告摘要:
报告将从“传承”和“变革”两个角度出发,探讨在当前的大模型浪潮下,知识图谱研究的现状、挑战和发展趋势。报告首先回顾知识图谱的历史和发展,然后分析当前大模型技术对知识图谱研究的影响和挑战。接着,报告重点讨论知识图谱的传承与变革。最后,报告对未来知识图谱研究的发展趋势进行展望。
专家介绍:
任飞亮,东北大学副教授,博士生导师,计算机科学系主任,“东北大学知识图谱研究组”团队负责人,剑桥大学访问学者。主要研究方向为知识图谱构建、智能问答、会话生成等。以第一作者发表数十篇高水平学术论文,包括清华大学计算机推荐论文A类论文、CCF A、CCF B、CCF C、ACM Transactions等论文多篇。主持多项国家级、省部级科研项目。带领研究团队多次参加国内外智能问答、信息抽取等顶级学术竞赛,并取得多项优秀成绩。带领团队发布了全量微调并开源的大语言模型TechGPT。与当前其他各类大语言模型相比,TechGPT主要强化了对计算机、材料、机械、冶金等十余种垂直专业领域自然语言文本的分析和处理能力。目前,TechGPT支持单轮对话和多轮对话,涵盖了逻辑推理问答、建议咨询问答、文本理解问答、中英文本互译、信息抽取等多项自然语言理解和文本生成能力。TechGPT刚一推出就受到了产业链相关企业的关注,并得到了新华社的报道,相应报道的浏览量目前已突破147万。