工业界论坛

报告1

报告题目:区块链遇上知识图谱

报告人: 尚书 ( 铭识协议 )

报告摘要: 随着近年区块链技术的高速发展,计算和存储两大基础能力越来越强,其应用场景也从共享账本放大到了共享数据库。恰逢此时,基于区块链打造一个共享知识图谱库成为可能。本次分享将重点介绍基于区块链技术搭建共建共享共益知识图谱协作平台的思路与实践,讲述在新机制下的高效率与新挑战 。

报告人简介: 尚书 ,清华大学计算机硕士。前 Nebulas 架构师兼首席研发。Conflux 技术商务总监兼生态总监。EpiK Protocol 知识生态大使。区块链视频专栏《尚书房》主播。

报告2

报告题目:腾讯医疗知识图谱构建与应用

报告人: 陈曦 ( 腾讯 )

报告摘要: 知识图谱可以有效刻画医疗领域大规模复杂专业知识,是基于AI实现医疗智能化的核心能力。本次报告将介绍腾讯医疗知识图谱构建中遇到的主要挑战,着重分享在知识抽取、知识融合及知识校验等关键技术上的算法探索,最后将介绍知识图谱在医疗辅助决策引擎、医疗搜索问答等方向上的应用效果 。

报告人简介: 陈曦 ,浙江大学计算机博士,佐治亚理工学院访问学者,中国中文信息学会语言与知识专委会委员,腾讯PCG内容平台部NLP和知识图谱负责人,曾参与主导电商、金融、医疗等多个领域知识图谱研发工作,已在NIPS、IJCAI、ACL、WWW、EMNLP、NAACL等国际顶级会议及期刊发表论文30余篇,授权专利10余项,先后获得NLP国际竞赛SuperGLUE第二名、CCKS和CHIP实体识别和关系抽取等多个竞赛冠军。

报告3

报告题目:基于知识图谱的认知决策引擎

报告人:胡芳槐(海乂知PlantData)

报告摘要: 知识图谱以其特有的知识表示方式,通过建立特定行业场景的全域、多模态知识图谱,形成行业信息的统一特征表示模型,为上层智能应用提供数据与知识基础。在此基础上通过知识驱动与数据驱动相结合的方法,为复杂场景的决策过程提供智能技术支撑,并通过流程编排引擎可视化决策过程。最终形成以问题建模分析为出发点,依次进行信息收集、分析,最终生成分析结果并提供决策方案参考;从而形成问题驱动的认知决策引擎。

报告人简介:胡芳槐,博士, PlantData CTO。10年知识图谱研究及产业化经验,多个国家级项目骨干成员,ISWC、CCKS2017等国际会议、顶级期刊发表多篇论文,多次受邀参与行业顶级交流报告包括大规模存储实战解析、大规模知识图谱应用、CCKS2017知识图谱实战报告等,参编多项知识图谱标准及专著的编制与撰写。

报告4

报告题目:知识图谱在健康领域的挑战和实践

报告人:陈旭( 卫宁健康 )

报告摘要: 医疗是高度知识密集型的行业,医疗信息系统在医疗决策及医院管理中发挥着关键作用,是医疗智能化革新的基石。医疗相关知识体系是医疗信息系统的核心,具有知识范围广、结构复杂、数量庞大的特点,对知识体系的组织及表示形成挑战。知识图谱由于其系统性及形象化的优势,是知识表示的重要方法,兼具医疗业务逻辑推理的功能。而知识图谱在临床实践中成功应用,从使用者的角度,适时地、合规地、可靠地传达知识,则离不开以信息化系统的数据标准和数据共享为基础的高质量的患者数据。

报告人简介: 陈旭博士,卫宁健康首席科学家,卫宁人工智能实验室主任, 教授级高级工程师,中国医学装备协会磁共振成像装备与技术人工智能学组专委,中国医学影像AI产学研联盟理事。回国前曾参与欧洲电子病历信息标准的设计开发工作,并发表多篇关于生物信息学的论文及标准研究报告。目前主要从事基于人工智能的医疗系统研究和管理工作,研究领域包括医疗信息标准、医疗大数据挖掘、医学影像分析、自然语言处理等。

报告5

报告题目:小米电商和游戏业务场景下的知识图谱构建

报告人: 王鹏程 (小米)

报告摘要: 随着人工智能技术的不断发展,知识图谱不断加速在各类垂直领域落地。本次分享主要介绍在小米电商和游戏业务场景下商品图谱和游戏图谱的构建方法。商品图谱主要介绍商品节点的构建方法,包括商品属性挖掘、商品评论观点抽取、自动文案生成等,场景词节点构建方法以及上位节点的构建方法。游戏图谱着重分享标签抽取、游戏属性挖掘、游戏评论观点抽取以及一些技术落地的思考 。

报告人简介: 王鹏程 ,小米高级算法工程师,目前主要负责小米通用知识图谱流程机制建设以及行业图谱的研究与应用。在知识图谱领域耕耘多年,曾获得过多项机器学习算法竞赛冠军。致力于知识图谱在小爱知识类问答、小米电商、游戏、广告等业务中的落地。

报告6

报告题目:真实世界医疗知识图谱及临床事件图谱构建

报告人: 李林峰 (医渡云)

报告摘要:以电子病历为代表的真实世界数据蕴含有丰富的信息,不同于传统的通过医学文献构建疾病知识图谱的方式,本报告介绍了基于真实世界数据构建疾病知识图谱的系统流程,以及该疾病知识图谱的典型应用。另外,患者的诊疗过程是由一系列的事件组成,包括发病、就诊、诊断,检查,用药等基础事件,对于肿瘤患者会有化疗、放疗、不良反应、随访等高级事件。准确的抽取和表示这些事件对于临床数据应用至关重要。本报告同时也介绍如何通过电子病历数据构建患者临床事件图谱的相关技术,用真实案例说明该事件图谱在临床诊疗、病历书写、科研搜索等场景中的应用。

报告人简介:李林峰,博士,医渡云高级算法总监、技术创新中心负责人。2017年加入医渡云,研究方向为医疗大数据挖掘技术及和人工智能创新应用,包括医学知识图谱构建,医学知识表示及推理方法,预测模型,以及基于AI技术的临床决策支持系统等。拥有多项医疗人工智能领域专利及论文。曾任百度医疗算法负责人,负责知识图谱构建、智能问诊及百度医学的算法工作。

报告7

报告题目:面向直播的新零售多模态知识图谱建设与应用

报告人: 徐国海(阿里小蜜)

报告摘要: 自2012年谷歌提出”Things,NOT Strings”的概念以来,知识图谱在搜索、推荐和决策分析等场景得到了广泛的应用。在过去的4年期间,我们阿里小蜜知识云团队也一直致力于探索知识图谱在问答和直播业务场景的应用。继2018年双11首次在业界落地解决复杂问题的KBQA技术之后,我们重点探索了新零售领域常识知识的建设与应用,沉淀了百万级常识三元组,在店小蜜的导购推荐、卖点生成等场景中取得了良好的业务效果。从2020年上半年开始,我们扩展至多模态领域,建设了千万级包含文本、图片和视频等多种模态的多模态商品素材知识图谱,强有力的支持了虚拟主播的结构化剧本播报和短视频自动生成等新兴业务的发展。在本次Talk中,我们将重点介绍领域常识和多模态商品素材知识的建设与应用,并和大家分享我们团队在知识图谱实践过程中学习到的经验和教训 。

报告人简介: 徐国海,阿里巴巴达摩院高级算法工程师,主要研究方向为知识图谱和多模态理解。参与阿里小蜜多模态知识图谱的构建,并落地问答、推荐、直播等多个应用场景,同时相关研究成果发表在SIGIR、CIKM等国际会议。

报告8

报告题目:基于金融知识图谱打造”数字白领“

报告人: 鲍捷 ( 文因互联 )

报告摘要: 中国金融监管机构在近期发布了多个监管科技建设工作的顶层设计文件,这标志着金融监管科技已进入了大规模实施的阶段,特别是进入了“监管3.0”时代,以大规模的自动化信息处理和人工智能的广泛应用为特征。在这一建设过程中, 各个层面都面临着很大的挑战,主要表现在数据的机器可处理性和知识的机器可处理性。自然语言处理(NLP)技术可以帮助我们极大扩展数据的机器可处理性,知识图谱(KG)技术可以帮助我们实现知识的机器可处理性。通过知识提取技术从文档(招股说明书、债券募集说明书、公告等)中提取出关键数据,这些数据也构成了金融知识图谱的底层数据。基于此,可以在之上构造诸如财务知识图谱、风险图谱等进一步应用,打造”数字白领“。具体可划分为三个方面:自动化手-”搬移“(记录、填表、发送),自动化眼-“识别”(审核、预警、检查)和自动化脑-“管理”(规划、分配、决策),助力产业全面自动化。

报告人简介: 鲍捷博士,文因互联董事长,创始人。爱荷华州立大学(Iowa State University)博士,伦斯勒理工学院(RPI)博士后,麻省理工学院(MIT)分布式信息组(DIG)访问研究员。曾任三星美国研发中心研究员,曾任 W3C OWL(Web本体语言)工作组成员,参与撰写了OWL2 知识图谱语言国际标准。现任W3C(万维网联盟)顾问委员会委员、中国中文信息学会语言与知识计算专业委员会委员、金融知识图谱工作组主席、中文开放知识图谱联盟(OpenKG)发起人之一,国际Data Intelligence杂志编委。

报告9

报告题目:生活服务标签图谱构建与应用实践

报告人: 张鸿志 ( 美团搜索与NLP部NLP中心 )

报告摘要: 本分享主要介绍标签图谱构建方法,以及标签图谱在搜索、推荐和问答中的落地的实践经验。我们以生活服务领域的海量评论数据作为主要知识来源,通过标签挖掘、标签间关系挖掘以及标签-商户关联等关键技术,自底向上梳理用户的需求、场景和主要关注点,完成图谱构建。所构建的标签图谱,一方面可直接应用于知识问答以及搜索和推荐的标签召回;另一方面,我们探索通过知识预训练方法,将图谱知识更好地融入推荐等下游任务中

报告人简介: 张鸿志,博士,主要研究方向为自然语言理解,知识图谱问答等。目前在美团NLP中心知识图谱组负责标签图谱构建与应用落地,深度参与KBQA方案设计和算法实现。研发的知识图谱问答技术曾获得CCKS2020技术创新奖,并于2021年联合组织CCKS相关评测任务

报告10

报告题目:万亿级分布式高性能图数据库的构建

报告人: 沈游人(海致科技集团 )

报告摘要: 本报告将介绍基于Rust语言构建的新一代分布式图数据库AtlasGraph的实践,对核心存储及计算引擎设计进行分享,并对构建图数据库过程中所面临的技术挑战进行总结。基于Rust语言开发的分布式高性能图数据存储引擎,该系统针对高性能存储设备(如NvmeSSD)特性,结合LSM-Tree算法支持高性能数据写入及B-Tree算法支持高性能读取的特点,实现一种新的Bw-Tree算法兼顾高性能读写,支持万亿规模点边数据存储及毫秒级查询;基于Timely-dataflow模型,设计并实现一套分布式并行图计算引擎,支持对低延迟的循环数据流计算,统一流式计算和迭代计算模型,基于代码生成及JIT技术,充分利用多核CPU、SIMD指令集及缓存的优势,实现对图数据的并行向量化计算处理;结合图查询语言的国际标准制定进程,实现GQL(GraphQueryLanguage)语言查询层,支持图数据库的数据管理及查询能力。

报告人简介: 沈游人 ,清华大学计算机系高性能所博士,博士期间主要研究方向为系统安全,曾在ASPLOS上发表一作论文。博士期间的主要工作是Occlum,一个支持高效多任务的SGX的库操作系统。Occlum在工业界有着广泛的应用,包括蚂蚁、阿里和微软的Azure都作为内部可信计算的默认运行环境之一。博士毕业后加入北京海致星图科技有限公司主导图数据库开发工作,目前的主要研究兴趣包括分布式图数据库查询引擎和图原生存储引擎。

报告11

报告题目: 多语言跨行业知识图谱构建与应用

报告人: 蔡超(中译语通)

报告摘要: 世界是广泛互联的,被贴上各行业标签的各个国家的人物、机构、事件等实体之间有着千丝万缕的联系。构建一个跨语言、跨行业的知识图谱有助于我们更方便的开展各类社会问题和经济问题的分析。本次报告中,我们主要分享我们在跨语言知识图谱构建和跨行业应用方面的实践经验。

报告人简介: 蔡超博士,中译语通科技股份有限公司数据科学家兼大数据研究中心总监,带领团队构建“拟上市企业科技评价系统”“城市科技创新服务系统”等,融合全球科技数据、产业数据和企业数据,构建了跨语言的技术经济知识图谱,打通投资与创业、研发与产业化、政府管理与服务等环节。发表论文10余篇,发明专利9项。

报告12

报告题目: 企业图谱在行业中的应用

报告人: 苏嘉(华为云)

报告摘要: 随着AI走向2.0的时代,知识被推向了和数据同等重要的高度。不同行业蕴含大量具有行业属性的知识,其形式和内容差异巨大。如何对行业知识进行有效表征和理解,并进一步进行建模和求解是行业AI落地的关键。本报告围绕行业知识图谱构建、知识图谱参与推理计算展开讨论。同时,知识图谱作为重要的知识表征形式被广泛地应用到行业中,如传统行业医疗健康中的智能疾病诊断和药物推荐、现代行业汽车维修中的知识点搜索和问答等。行业场景给知识图谱的应用提供了机遇和挑战,而华为云在行业内也积累了丰富的经验和可迁移的解决方案。

报告人简介: 苏嘉,哈工大计算机博士,现任华为云语音语义创新Lab算法专家,主要从事NLP算法研究及落地,研究兴趣包括NLP、知识计算、对话机器人、预训练模型、知识图谱应用等。六年以上NLP+产业研发落地经验,发表顶级学术会议/期刊论文10+篇。在医疗智能诊断,智能对话分析等多个技术项目中担任算法专家,负责架构设计与算法创新,已在多个实际项目场景落地。获得2021年中文生物医学语言理解任务CBLUE比赛冠军。

报告13

报告题目: 基于知识图谱的工业APP开发与应用示范

报告人: 茹海燕 ( 智通云联 )

报告摘要:基于知识图谱的工业互联网解决方案以数据-信息-知识-智慧的D-I-K-W模型为基础,实现数据采集、知识提炼的开放工具与服务,形成不同行业的知识图谱,即行业大脑。同时,面向不同应用场景,提供基于知识图谱的智能应用APP。解决方案基于知识图谱这一人工智能领域的重要分支技术,充分发掘事物背后的隐性关系,将隐性关系变成数据,并以可视化的形式展示在人们面前。基于知识图谱智能技术的工业互联网解决方案,将“三不”变为“三可”,即将“过去不可见的要素可见,过去不可计算的要素可计算,过去不可联接的要素可联接”,其推广应用具有重要的现实意义。例如,在石化行业,打造了基于知识图谱的知识中心,并面向勘探开发科研、生产等业务打造了十余个工业APP,帮助实现全面、准确、快速的知识获取与共享应用。

报告人简介: 茹海燕 ,智通云联咨询总监,6sigma黑带、MATRIZ(国际TRIZ协会)三级发明专家、中国创新方法研究会企业分会理事 。在知识图谱构建与应用、技术创新与规划、行业知识管理与知识工程规划等方面具有丰富经验,曾帮助中国石化、蒙牛、国家电网、自然资源部、中船集团等众多领域客户在知识图谱产品方面取得了良好的落地性应用

报告14

报告题目:金融知识图谱在京东科技业务中的探索与实践

报告人: 赵学敏 ( 京东 )

报告摘要: 金融领域在进行投资研究时,分析师需要从新闻、财报、研报等各个渠道充分获取数据,输出可供投资决策的看法和建议。通过构建金融知识图谱,可以帮助投研人员提高信息获取和数据分析的效率。在实际的金融图谱应用中,由于数据来源多、数据量大,有效信息往往容易被淹没在其中,给相关的自然语言任务带来了很大的挑战。由于金融领域的专业性,标注数据的获取成本较高,因此需要提高数据利用效率、提升标注数据的质量,图谱构建过程中也需要通过算法来进行数据质量检测,这些将直接影响到相关应用的算法效果。本报告主要介绍京东科技将金融知识图谱用于智能投研等领域的一些具体探索和实践,对其中用到的核心技术、落地过程中遇到的问题及对应解决方案进行分享 。

报告人简介: 赵学敏 ,目前就职于京东科技自然语言算法团队,博士毕业于中国科学院语言声学与内容理解重点实验室,主要研究方向为知识图谱和口语对话系统。在入职京东前曾在中科院声学所担任副研究员、在阿里巴巴云小蜜团队担任高级算法专家,研发的客服对话系统在中移动、浙江政务等多个系统中上线使用。

报告15

报告题目:翻译X理解:知识图谱辅助机器翻译

报告人: 张凯 (vivo)

报告摘要: 翻译的核心任务是帮助人们理解另一种形式的外界信息,现有的机器翻译能够较好地进行语言的转换,但对于特定领域的实体术语或表达往往理解欠佳例如菜单翻译,本次分享探讨如何通过知识图谱增强机器翻译的领域表现,并帮助用户更好地理解原始信息 。

报告人简介: 张凯 ,高级算法工程师,vivo机器翻译工程团队负责人,主要研究方向包括知识图谱、自然语言处理、对话系统、推荐系统、机器翻译等,拥有多年算法落地经验。业内首本聊天机器人专业书籍作者之一。主导构建了开放通用知识图谱《七律》,参与编写发布了《知识图谱评测标准》以及国内首份《知识图谱白皮书》

报告16

报告题目:时空图谱赋能智慧金融

报告人: 裘靖宇 ( 维智 )

报告摘要: 时空图谱赋能智慧金融,报告摘要改为:时空智能是开放银行场景金融服务的AI底座。通过对银行网点周边空间和社区的数字化,数智化重构,生成银行场景金融的核心数据资产。经由WayzBank 金融沙盘对银行各条业务线赋能,实现场景金融的智能落地 。

报告人简介: 裘靖宇 ,维智科技合伙人。负责管理时空智能的数据资产生产和数据智能赋能等核心业务。美国Rice大学EE硕士,在美国华盛顿大学MBA。他在西雅图微软总部工作十余年,参与了Windows 2000, Windows XP, Office 等多款核心产品的发布,负责Windows Lync的全球合作伙伴生态,两次获得微软最高级别’Gold Star Award’。2011年回国后,历任PPTV的平台产品部和海外事业部总经理,以及两家创业公司的创始合伙人和CEO。