香港大学马毅谈智能本质:现在的大模型只有知识没有智能
先后被上港和泰山击败,澳超球队中央海港水手在亚冠的竞争力真不是一般的弱。这支球队打亚冠的目的,看起来完全是奔着挣钱来的。 但即便面对一个明显缺乏竞争力的对手,上港在主场还是赢的惊心动魄。著....
“过去十年人工智能在技术端上迅速发展,但在‘智能’上并没有界定清楚,把智能跟知识完全混淆在一起,一个系统有知识就有智能了吗?”
12月13日上午,在上海人工智能实验室发起并主办的首届“浦江AI学术年会”上,香港大学计算与数据科学院院长、AI讲座教授马毅进行了一场“探讨智能本质”的演讲。
在演讲过程中,对现在主流定义的“人工智能”打上了问号。他认为,过去十年人工智能在技术端上迅速发展,但在“智能”上并没有界定清楚,把智能跟知识完全混淆在一起。
真正的智能是什么?马毅提到,在1956年的达特茅斯会议(Dartmouth Conference)上提出对人工智能(Artificial Intelligence)的定义,智能应该能自我纠正、改进记忆,并能自主获取新知识。目的就是一定要做人区别于动物特有的智能,比如具备抽象能力、符号运算、逻辑推理、因果分析等能力。但现在的GPT有知识但并没有“智能”。
回看过去十年,马毅认为,“人工智能”在做的工作主要集中在图像识别、图像生成、文本生成、压缩去噪、强化学习。不过,这并不是主流的大模型,现阶段相当于在做 基础层面的工作,包括预测下一个Token(计算机术语,一种用于身份验证和授权的令牌)、下一帧图像。马毅称,Sora的核心原理其实 简单,本科生都可以了解。
马毅说,当前,人们都在讨论单个模型,认为只要模型足够大,就能通过购买芯片和砸训练数据来实现“智能”。但他认为,这并不能 所有问题,因为这连自主学习的能力和机制都没有实现,只是展现出人类记忆中的碎片,无论是识别还是生成,都只具备记忆的局部功能。
马毅表示,过去十年我们在智能这一阶段只做到相当于人类听觉(auditory)这一层,现在必须成系统,把多个闭环组织起来,形成对复杂的外部世界的信息整理和提取系统,这才真正相当于人类类脑的机制。
马毅提出的人工智能发展的三个阶段。
他认为,现在的人工智能可以结合自然智能的发展重新定义。 阶段,类似于DNA阶段,第二阶段,让个体能够有大脑产生记忆,能够自主地学习新的知识,包括纠正现有的知识。“现在个体和动物已经有这个能力,但真正的还没有到这一阶段。”第三个阶段,是掌握人的逻辑,比如符号、抽象、数学和因果推理。
马毅会让学生做一件事, 大模型明不明白数的概念,“很负责任地说,当前没有任何大模型有自然数的概念。”马毅说。
马毅认为,科学的发展确实到了让人兴奋、激动的时刻,大家都对智能产生了兴趣。但“实际上过去十年可能并没有进步,反而有些退步。”在马毅看来,当下的年轻科学家如果想要超越,拿下一个诺贝尔奖,一定不要随大流,要敢于坐冷板凳。1956年达特茅斯会议上一群人选择做和主流不一样的事,后期这些人都获得了图灵奖、诺贝尔奖。
马毅是AI机器视觉知名学者,1995年本科毕业于自动化专业,1997年获加州大学伯克利分校(UCB)电子工程与计算机科学硕士学位,2000年获UCB数学硕士学位和电子工程与计算机科学博士学位。博士毕业后,马毅获美国伊利诺伊大学香槟分校(UIUC)教职。
2009年,马毅正式加入微软亚洲研究院,担任视觉计算组的研究经理和首席研究员,并接手由沈向洋创办的视觉计算组( G),后来国际上知名的计算机视觉专家何恺明、孙剑等都是马毅当时的同事。
2014年,马毅以全职教授身份加入上海科技大学信息科学与技术学院,成为该学院在计算机视觉研究方向的带头人。2017年,他从离职,全职加入加州大学伯克利分校电子工程与计算机系。2023年1月1日,马毅加入香港大学,出任数据科学研究院院长。