特邀嘉宾 · 前沿趋势论坛

特邀嘉宾

特邀嘉宾一

徐宗本

个人简介

徐宗本(西安交通大学、琶洲实验室(黄埔)),中国科学院院士,数学家、西安交通大学教授。主要从事应用数学、数据科学、人工智能的基础理论研究。曾提出稀疏信息处理的L(1/2)正则化理论,为稀疏微波成像提供了重要基础;发现并证明机器学习的“徐-罗奇”定理, 解决了神经网络与模拟演化计算中的一些困难问题,为非欧氏框架下机器学习与非线性分析提供了普遍的数量推演准则; 提出基于视觉认知的数据建模新原理与新方法,形成了聚类分析、判别分析、隐变量分析等系列数据挖掘核心算法, 并广泛应用于科学与工程领域。曾获国家自然科学二等奖(2次)、国家科技进步二等奖、陕西省最高科技奖; 国际IAITQM 理查德.普莱斯(Richard Price)数据科学奖; 中国陈嘉庚科学奖、华罗庚数学奖、吴文俊人工智能最高科技成就奖、苏步青应用数学奖;曾在2010年世界数学家大会上作45分钟特邀报告。 曾任西安交通大学副校长,现任鹏城国家实验室广州基地/琶州实验室(黄埔)主任、陕西国家应用数学中心主任、西安交通大学数学与数学技术研究院院长、 大数据算法与分析技术国家工程实验室主任等。是国家大数据专家咨询委员会委员、国家新一代人工智能战略咨询委员会委员。

报告标题

AI:无限维问题 vs 有限维技术 —— 浅析大模型架构的设计原理

报告摘要

AI问题的困难部分本质上都是无限维的,如机器学习、模拟学习方法论(SLeM)、世界模型构建等, 但基于数字技术(特别是冯.诺依曼计算机)实现的AI技术都本质上是有限维的。这一差异导致AI研究有诸多困境,如缺少严密的数学基础、深度架构(大模型架构) 设计原理不清、对AI系统的性能评估靠测试而缺少理论判据等。本报告通过将智能问题描述作无限维函数空间上的优化问题,并将智能问题的任意极小化序列截断定义为AI深度架构,阐明“AI深度架构设计是函数空间上的算子簇公共不动点问题,而不是逼近论问题”,由此揭示并形成大模型架构设计的一个新原理与新方法。基于新原理与新方法,我们提出不同于GPT架构的一个新大模型架构—深度核网络。我们也提出“回到无限维系统来评价有限维技术/AI大模型”的极限论方法。这一方法基于大模型极限架构的存在性与性能来评估大模型,所建立起的理论提供了对大模型智能涌现和尺度律(Scaling Laws)的理论解释与直接判据

特邀嘉宾二

Jeff Pan

个人简介

Jeff Pan教授, 英国爱丁堡大学信息学院终身讲席教授,华为爱丁堡知识图谱实验室主任,长江学者(山西大学特聘教授),英国阿兰·图灵研究院知识图谱主席。他目前的研究主要在探讨显式知识和参数知识之间的互动(H-index: 61)。最近,他领导了一项全球合作,研究大型语言模型和知识图谱互动带来的机遇和挑战。

报告标题

Harmonizing Explicit and Parametric Knowledge: Unveiling the Power of RAG and Beyond

报告摘要

Large Language Models (LLMs) are reshaping Knowledge Representation — and redefining how we think about knowledge itself. Their rapid rise signals a turning point: a shift from traditional symbolic representations to the era of vast, dynamic parametric knowledge. But critical questions remain: Are LLMs reliable knowledge-bases? What should we do if they are not? Can they become reliable knowledge bases in the future? In this talk, I will share initial findings that shed light on these questions and, time permitting, explore the opportunities and future directions opened by this renewed focus on parametric knowledge.

特邀嘉宾三

周俊

个人简介

周俊博士,蚂蚁百灵大模型负责人,目前致力于基础大模型、机器学习等人工智能技术创新,以及模型开源相关工作。周俊在国内外发表AI论文百余篇,H-index为46,并获得3项国际最佳论文奖和41项美国授权专利。作为第一批技术骨干,周俊参与建设了国内首个云计算系统,为云计算大规模商业化奠定基础。作为阿里和蚂蚁AI的创始成员,周俊深度参与并构建了包括双11电商个性化推荐、支付宝智能化在内的多个百亿级AI项目,带领团队在4项国际算法评测中排名第1,并获得CCF科技进步1等奖、吴文俊人工智能科技进步1等奖、电子学会科技进步1等奖和浙江省科技进步1等奖等多个AI领域奖励,帮助提升了核心科技竞争力。

报告标题

百灵通用基座大模型核心技术探索

报告摘要

本次演讲将深入探讨蚂蚁集团自研的百灵基础大模型,该模型兼具语言与全模态能力。我们将基于Scaling Law,深度剖析百灵大模型在架构优化、统一生成与理解等核心技术领域的创新实践与突破。内容将涵盖如何从海量多样化数据中构建高质量预训练语料的关键技术路径与挑战。同时,也将分享一套系统化、科学的评测体系,全面评估模型在语言理解、多模态对齐、通用推理等核心能力上的表现。此外,还将探讨开源实践,以期共同促进AI技术生态的繁荣与发展。