工业界论坛

报告1

报告题目:区块链遇上知识图谱

报告人: 尚书 ( 铭识协议 )

报告摘要: 随着近年区块链技术的高速发展,计算和存储两大基础能力越来越强,其应用场景也从共享账本放大到了共享数据库。恰逢此时,基于区块链打造一个共享知识图谱库成为可能。本次分享将重点介绍基于区块链技术搭建共建共享共益知识图谱协作平台的思路与实践,讲述在新机制下的高效率与新挑战 。

报告人简介: 尚书 ,清华大学计算机硕士。前 Nebulas 架构师兼首席研发。Conflux 技术商务总监兼生态总监。EpiK Protocol 知识生态大使。区块链视频专栏《尚书房》主播。

报告2

报告题目:知识图谱在健康领域的挑战和实践

报告人: 苗喜江 ( 卫宁健康 )

报告摘要: 医疗是高度知识密集型的行业,医疗信息系统在医疗决策及医院管理中发挥着关键作用,是医疗智能化革新的基石。医疗相关知识体系是医疗信息系统的核心,具有知识范围广、结构复杂、数量庞大的特点,对知识体系的组织及表示形成挑战。知识图谱由于其系统性及形象化的优势,是知识表示的重要方法,兼具医疗业务逻辑推理的功能。而知识图谱在临床实践中成功应用,从使用者的角度,适时地、合规地、可靠地传达知识,则离不开以信息化系统的数据标准和数据共享为基础的高质量的患者数据。

报告人简介: 苗喜江 ,卫宁健康产品总监。苗喜江博士于西安工业大学、北京邮电大学及美国南卡罗莱纳大学获得学士、硕士及博士学位,2007加入世界领先的医疗信息系统软件公司Epic Systems从事产品开发,回国后加入卫宁健康科技集团,负责卫宁新一代医院信息化系统的产品架构设计,在医疗行业有丰富的业界经验及洞见 。

报告3

报告题目: 基于知识图谱的工业APP开发与应用示范

报告人: 茹海燕 ( 智通云联 )

报告摘要:基于知识图谱的工业互联网解决方案以数据-信息-知识-智慧的D-I-K-W模型为基础,实现数据采集、知识提炼的开放工具与服务,形成不同行业的知识图谱,即行业大脑。同时,面向不同应用场景,提供基于知识图谱的智能应用APP。解决方案基于知识图谱这一人工智能领域的重要分支技术,充分发掘事物背后的隐性关系,将隐性关系变成数据,并以可视化的形式展示在人们面前。基于知识图谱智能技术的工业互联网解决方案,将“三不”变为“三可”,即将“过去不可见的要素可见,过去不可计算的要素可计算,过去不可联接的要素可联接”,其推广应用具有重要的现实意义。例如,在石化行业,打造了基于知识图谱的知识中心,并面向勘探开发科研、生产等业务打造了十余个工业APP,帮助实现全面、准确、快速的知识获取与共享应用。

报告人简介: 茹海燕 ,智通云联咨询总监,6sigma黑带、MATRIZ(国际TRIZ协会)三级发明专家、中国创新方法研究会企业分会理事 。在知识图谱构建与应用、技术创新与规划、行业知识管理与知识工程规划等方面具有丰富经验,曾帮助中国石化、蒙牛、国家电网、自然资源部、中船集团等众多领域客户在知识图谱产品方面取得了良好的落地性应用

报告4

报告题目:翻译X理解:知识图谱辅助机器翻译

报告人: 张凯 (vivo)

报告摘要: 翻译的核心任务是帮助人们理解另一种形式的外界信息,现有的机器翻译能够较好地进行语言的转换,但对于特定领域的实体术语或表达往往理解欠佳例如菜单翻译,本次分享探讨如何通过知识图谱增强机器翻译的领域表现,并帮助用户更好地理解原始信息 。

报告人简介: 张凯 ,高级算法工程师,vivo机器翻译工程团队负责人,主要研究方向包括知识图谱、自然语言处理、对话系统、推荐系统、机器翻译等,拥有多年算法落地经验。业内首本聊天机器人专业书籍作者之一。主导构建了开放通用知识图谱《七律》,参与编写发布了《知识图谱评测标准》以及国内首份《知识图谱白皮书》

报告5

报告题目:基于金融知识图谱打造”数字白领“

报告人: 宋劼 ( 文因互联 )

报告摘要: 中国金融监管机构在近期发布了多个监管科技建设工作的顶层设计文件,这标志着金融监管科技已进入了大规模实施的阶段,特别是进入了“监管3.0”时代,以大规模的自动化信息处理和人工智能的广泛应用为特征。在这一建设过程中, 各个层面都面临着很大的挑战,主要表现在数据的机器可处理性和知识的机器可处理性。自然语言处理(NLP)技术可以帮助我们极大扩展数据的机器可处理性,知识图谱(KG)技术可以帮助我们实现知识的机器可处理性。通过知识提取技术从文档(招股说明书、债券募集说明书、公告等)中提取出关键数据,这些数据也构成了金融知识图谱的底层数据。基于此,可以在之上构造诸如财务知识图谱、风险图谱等进一步应用,打造”数字白领“。具体可划分为三个方面:自动化手-”搬移“(记录、填表、发送),自动化眼-“识别”(审核、预警、检查)和自动化脑-“管理”(规划、分配、决策),助力产业全面自动化。

报告人简介: 宋劼 ,文因互联首席科学家,西班牙马德里理工大学人工智能博士,曾任瑞士苏黎世联邦理工学院客座研究员。宋劼有丰富的本体工程、语义建模和平台开发经验,其研究主要集中在物联网、语义网、本体工程、语义建模、规则推理,以及知识图谱在智能设备管理的应用,包括物联网领域的语义数据建模、链接数据的信任和隐私管理和工业互联网。曾任ISWC会议组委,中国人工智能学会会员工委会副秘书长等。

报告6

报告题目:万亿级分布式高性能图数据库的构建

报告人: 翟士丹 ( 海致科技集团 )

报告摘要: 本报告将介绍基于Rust语言构建的新一代分布式图数据库AtlasGraph的实践,对核心存储及计算引擎设计进行分享,并对构建图数据库过程中所面临的技术挑战进行总结。基于Rust语言开发的分布式高性能图数据存储引擎,该系统针对高性能存储设备(如NvmeSSD)特性,结合LSM-Tree算法支持高性能数据写入及B-Tree算法支持高性能读取的特点,实现一种新的Bw-Tree算法兼顾高性能读写,支持万亿规模点边数据存储及毫秒级查询;基于Timely-dataflow模型,设计并实现一套分布式并行图计算引擎,支持对低延迟的循环数据流计算,统一流式计算和迭代计算模型,基于代码生成及JIT技术,充分利用多核CPU、SIMD指令集及缓存的优势,实现对图数据的并行向量化计算处理;结合图查询语言的国际标准制定进程,实现GQL(GraphQueryLanguage)语言查询层,支持图数据库的数据管理及查询能力。

报告人简介: 翟士丹 ,海致科技集团算法专家, 主要负责知识图谱构建、知识图谱问答以及图谱动态自适应能力的算法研发,申请了多项相关领域发明专利,全面主导海致科技集团分布式图数据库AtlasGraph、知识图谱分析平台Atlas的研发工作。曾担任搜狐畅游数据开发组负责人,有丰富的知识图谱平台及图数据库构建经验,深度结合行业应用场景,推进知识图谱技术在金融、电力、政府机构等领域的落地

报告7

报告题目:面向直播的新零售多模态知识图谱建设与应用

报告人: 李凤麟 ( 阿里巴巴 )

报告摘要: 自2012年谷歌提出”Things,NOT Strings”的概念以来,知识图谱在搜索、推荐和决策分析等场景得到了广泛的应用。在过去的4年期间,我们阿里小蜜知识云团队也一直致力于探索知识图谱在问答和直播业务场景的应用。继2018年双11首次在业界落地解决复杂问题的KBQA技术之后,我们重点探索了新零售领域常识知识的建设与应用,沉淀了百万级常识三元组,在店小蜜的导购推荐、卖点生成等场景中取得了良好的业务效果。从2020年上半年开始,我们扩展至多模态领域,建设了千万级包含文本、图片和视频等多种模态的多模态商品素材知识图谱,强有力的支持了虚拟主播的结构化剧本播报和短视频自动生成等新兴业务的发展。在本次Talk中,我们将重点介绍领域常识和多模态商品素材知识的建设与应用,并和大家分享我们团队在知识图谱实践过程中学习到的经验和教训 。

报告人简介: 李凤麟 ,意大利特伦托大学博士,阿里巴巴达摩院算法专家,阿里小蜜知识云算法负责人。主要工作内容为自然语言处理和知识图谱方向,负责阿里小蜜家族智能加速器(AIBoost)和知识云(Knowledge Cloud)两款产品的算法工作。目前已经发表国际会议论文20余篇,并申请专利多项。

报告8

报告题目:生活服务标签图谱构建与应用实践

报告人: 张鸿志 ( 美团搜索与NLP部NLP中心 )

报告摘要: 本分享主要介绍标签图谱构建方法,以及标签图谱在搜索、推荐和问答中的落地的实践经验。我们以生活服务领域的海量评论数据作为主要知识来源,通过标签挖掘、标签间关系挖掘以及标签-商户关联等关键技术,自底向上梳理用户的需求、场景和主要关注点,完成图谱构建。所构建的标签图谱,一方面可直接应用于知识问答以及搜索和推荐的标签召回;另一方面,我们探索通过知识预训练方法,将图谱知识更好地融入推荐等下游任务中

报告人简介: 张鸿志,博士,主要研究方向为自然语言理解,知识图谱问答等。目前在美团NLP中心知识图谱组负责标签图谱构建与应用落地,深度参与KBQA方案设计和算法实现。研发的知识图谱问答技术曾获得CCKS2020技术创新奖,并于2021年联合组织CCKS相关评测任务

报告9

报告题目:金融知识图谱在京东科技业务中的探索与实践

报告人: 赵学敏 ( 京东 )

报告摘要: 金融领域在进行投资研究时,分析师需要从新闻、财报、研报等各个渠道充分获取数据,输出可供投资决策的看法和建议。通过构建金融知识图谱,可以帮助投研人员提高信息获取和数据分析的效率。在实际的金融图谱应用中,由于数据来源多、数据量大,有效信息往往容易被淹没在其中,给相关的自然语言任务带来了很大的挑战。由于金融领域的专业性,标注数据的获取成本较高,因此需要提高数据利用效率、提升标注数据的质量,图谱构建过程中也需要通过算法来进行数据质量检测,这些将直接影响到相关应用的算法效果。本报告主要介绍京东科技将金融知识图谱用于智能投研等领域的一些具体探索和实践,对其中用到的核心技术、落地过程中遇到的问题及对应解决方案进行分享 。

报告人简介: 赵学敏 ,目前就职于京东科技自然语言算法团队,博士毕业于中国科学院语言声学与内容理解重点实验室,主要研究方向为知识图谱和口语对话系统。在入职京东前曾在中科院声学所担任副研究员、在阿里巴巴云小蜜团队担任高级算法专家,研发的客服对话系统在中移动、浙江政务等多个系统中上线使用。

报告10

报告题目:小米电商和游戏业务场景下的知识图谱构建

报告人: 王鹏程 (小米)

报告摘要: 随着人工智能技术的不断发展,知识图谱不断加速在各类垂直领域落地。本次分享主要介绍在小米电商和游戏业务场景下商品图谱和游戏图谱的构建方法。商品图谱主要介绍商品节点的构建方法,包括商品属性挖掘、商品评论观点抽取、自动文案生成等,场景词节点构建方法以及上位节点的构建方法。游戏图谱着重分享标签抽取、游戏属性挖掘、游戏评论观点抽取以及一些技术落地的思考 。

报告人简介: 王鹏程 ,小米高级算法工程师,目前主要负责小米通用知识图谱流程机制建设以及行业图谱的研究与应用。在知识图谱领域耕耘多年,曾获得过多项机器学习算法竞赛冠军。致力于知识图谱在小爱知识类问答、小米电商、游戏、广告等业务中的落地。

报告11

报告题目:腾讯医疗知识图谱构建与应用

报告人: 陈曦 ( 腾讯 )

报告摘要: 知识图谱可以有效刻画医疗领域大规模复杂专业知识,是基于AI实现医疗智能化的核心能力。本次报告将介绍腾讯医疗知识图谱构建中遇到的主要挑战,着重分享在知识抽取、知识融合及知识校验等关键技术上的算法探索,最后将介绍知识图谱在医疗辅助决策引擎、医疗搜索问答等方向上的应用效果 。

报告人简介: 陈曦 ,浙江大学计算机博士,佐治亚理工学院访问学者,中国中文信息学会语言与知识专委会委员,腾讯PCG内容平台部NLP和知识图谱负责人,曾参与主导电商、金融、医疗等多个领域知识图谱研发工作,已在NIPS、IJCAI、ACL、WWW、EMNLP、NAACL等国际顶级会议及期刊发表论文30余篇,授权专利10余项,先后获得NLP国际竞赛SuperGLUE第二名、CCKS和CHIP实体识别和关系抽取等多个竞赛冠军。

报告12

报告题目:时空图谱赋能智慧城市

报告人: 裘靖宇 ( 维智 )

报告摘要: 时空智能是城市数字化新基建的底座。通过对整个城市承载空间的数字化,数智化重构,生成城市管理的核心要素数智资产。经由时空图谱赋能平台对各委办局赋能,实现城市治理的场景化和智能化 。

报告人简介: 裘靖宇 ,维智科技合伙人。负责管理时空智能的数据资产生产和数据智能赋能等核心业务。美国Rice大学EE硕士,在美国华盛顿大学MBA。他在西雅图微软总部工作十余年,参与了Windows 2000, Windows XP, Office 等多款核心产品的发布,负责Windows Lync的全球合作伙伴生态,两次获得微软最高级别’Gold Star Award’。2011年回国后,历任PPTV的平台产品部和海外事业部总经理,以及两家创业公司的创始合伙人和CEO。