本文作者:创意奇才

专家解读DeepSeek:2025是人类比AI聪明的最后一年

创意奇才 今天 50
 专家解读DeepSeek:2025是人类比AI聪明的最后一年摘要: 虽然现在已经成为许多人心目中最棒的之一的赛博朋克实际上经历了许多迭代才能有现在的状态而特别是在游戏发售时游戏的状态非常糟糕甚至由于无法在上完全无法正常运行导致最终被索尼从商店移除出...

虽然现在已经成为许多人心目中最棒的RPG之一的《赛博朋克2077》实际上经历了许多迭代才能有现在的状态。而特别是在游戏发售时,游戏的状态非常糟糕,甚至由于无法在PS4上完全无法正常运行,导致最终被索尼从PS商店移除。

出品 | 科技《态度》栏目

采访|丁广胜

作者 | 崔玉贤

这个春节,DeepSeek爆了,从朋友圈火到了大洋彼岸。

上线三天,逆袭Ch GPT,登顶美区榜首;仅20天就达到了2000万DAU; 数据,DeepSeek日访问量已经超过了谷歌的 Gemini和 Character.AI。

这股“神秘的东方力量”带给了全球不止“亿点点”的震撼,甚至有人将其影响力与瓦特蒸汽机带来的革命性影响相媲美。

那么,DeepSeek有哪些技术特点和产业机会? 科技《Fut e Talk》邀请到了两位专家一起探讨,他们是武汉大学计算机学院教授、中国人工智能学会心智计算专*会副主任蔡恒进教授;标普云总裁、华为前副总裁杨蜀。

蔡恒进教授的核心观点为,DeepSeek是中国式创新的代表,极大推动了AGI的进程,他做出判断,AGI将在几个月或一年之内实现。

杨蜀认为,2025是人类比AI聪明的最后一年,AI革命的拐点已经来临,将对整个产业和普通人造成深远影响。

拐点还是海啸

DeepSeek为何影响巨大

DeepSeek的火爆程度堪比春晚,蔡恒进认为DeepSeek的到来意味着AI的海啸要来了。这一判断基于两点: ,DeepSeek展示了思考过程;第二则是成本需求降低,对算力需求至少降到10倍以上。

蔡恒进认为DeepSeek有着独特的技术路径优势,它可以从底层优化,可以绕开英伟达CUDA生态,在其他芯片,比如华为芯片上实现高性能。可以说 了卡中国脖子的问题。

另外, 重要的一点是DeepSeek的专家混合系统(Mixt e of Experts, MoE)表面上看只是为了节省推理资源,但如果深挖的话,可以将原来完全一锅粥的语料与专家的内容分开了,蔡恒进认为,这点很重要,可以说是分而治之。

DeepSeek开启了深入探索的这条路,完全逆转了Ch GPT的那条路,造成了颠覆性的影响。

与此同时,杨蜀认为AI拐点已经到来了,首先是质量的提升,因为质量不好再便宜也没人会用。DeepSeek回答问题的时候,会对需求做一个思维的展示,这就是技术的很大的进步。

杨蜀针对拐点将至解释说,技术在发展过程中,它到了一个阶段,开始加速发展,这是对拐点的定义。之所以认为拐点到了,首先是质量,然后是效率,再然后是成本。如果质量不好,再便宜大家也不会用,现在到了一个很好的阶段,因为它超出了预期。

杨蜀还提到,拐点也有很多解释,比如它是AI行业的拐点,中美竞争的拐点。

机会还是挑战

DeepSeek产业变革势不可挡

DeepSeek的横冲出世和爆火,让他的朋友圈不断扩大。国内几大主流云 、国产GPU芯片厂商、AI基础设施厂商、应用端企业纷纷接入。国内多家GPU企业宣布支持DeepSeek,正加速完成国产GPU与DeepSeek的适配,比如华为云、腾讯云、阿里云、 智能云等等。

蔡恒进认为DeepSeek的火爆对芯片公司是 大的利好。他反复提到的“海啸”这个词是指推平了很多东西,原来那些小的细节根本不重要了,只有这一件事才最重要,大家都要回到主流上来。

“看到新闻上说在两个月内,DeepSeek的Star量(星标)已经超过了OpenAI。这 不容易,才几个星期就已经超过了搞了两年的OpenAI,可以说是势不可挡,就如海啸一般。”蔡恒进表示。

杨蜀谈到,毫无疑问,英伟达受到了很大的挑战。他认为大厂会重新考虑对训练卡的预算。杨蜀是看好推理卡的,因为大家都知道训练是研发,推理是生产,杨蜀则更倾向于推理的需求会增大,这也是大家讲的普惠AI的过程。杨蜀认为对国产厂商来说比如华为肯定是个利好。

AGI即将到来?

2025年是人类比AI聪明的最后一年

DeepSeek让蔡恒进看到,AI for Science和Science for AI都有机会了。

“我认为AGI一年之内就能到来,我说的到来不是讨论它真的到来还是 到来,而是说大家对AGI基本上形成了共识。”蔡恒进表示,“国外都在谈奇点,我认为奇点就是阿尔法狗问世的时候,之后就再也找不到标志性事件了,我们说棋如人生,人生如棋,它是足够复杂的,机器已经掌握这个了,这是绝对标志性的。之后发生的事情,更多是一项一项的突破而已。”

杨蜀认为,DeepSeek带来的拐点是有意义的。AI提供的是一种智力,一种叠加式的创新,所以在生产力上一定会更进一步。企业可以基于此开发出很多应用场景来做智能体,相当于是提供智能生产力或者数字员工,一旦到了这个拐点,能力才会真正用起来。“他已经不是实验室的东西了。”

“我认为2025年是人类比AI聪明的最后一年。这不是危言耸听。”杨蜀提到。

杨蜀认为,有了DeepSeek的能力加持,智能体爆发会加速。

蔡恒进也持类似看法,他表示,之前对智能体比较怀疑。但是GPT出来之后,他的想法实际上有了改变。当DeepSeek出来之后,可能会将智能体引导到一个更专业的水平上。

开源还是闭源?

开源DeepSeek倒逼闭源

DeepSeek选择开源,而OpenAI坚持闭源。开源是否真能推动技术 化,还是可能加剧安全风险?开源这么强,以后做闭源模型是不是还有意义?

杨蜀认为开源和闭源是个永恒话题,但它有一个关键点,就是谁的质量更好,如果闭源的质量是更好的,那么开源就会一直追赶;如果开源的质量变好了,它就可能倒逼闭源的开源,就是这个逻辑。

开源和闭源它就是一个事情的两面,什么时候才能促进另外一面的发展?是因为这一面质量更好,成本更低,那一面就会发生变化。当然,对我们来说是 乐见开源的,特别是高水平的开源,可以带来真正的智能普惠,AI的 化,科技平权。

开源之后,以后再有比DeepSeek更厉害的大模型出来,这就是开源的意义。就是让大家有机会站在巨人的肩膀上,得以你追我赶。

蔡恒进认为,开源还有另外一个争论就是大家都觉得对人类有风险,有的人支持闭源,因为觉得开源的话,相当于把核弹的技术可能交给那些坏人手里去了。“但在我看来,DeepSeek开源之后就已经回不了头了。”

偏执狂才能改变世界?

为什么不是大厂和六小虎

国内有很多大模型创业公司,有俗称的大模型六小虎,比如Kimi、智谱等等,为什么不是他们做出来?

蔡恒进认为,中美之间最大的 在哪?不是算力不够,也不是数据不够好,而是真的相信能把AGI做出来,这是最大的差别。梁文峰很独特。他本身自己有钱,通过量化赚到了钱,可以放手来做;另外,他有技术上的判断力,两者兼有。但其他团队可能就没有这个独特性。

杨蜀表示,为什么不是大厂呢?其实人才都是那些人才(大厂的优秀人才更多)、课题也都是那些课题,为什么是一个小的创业公司先做出来呢?这确实是一个值得深思的问题。

 专家解读DeepSeek:2025是人类比AI聪明的最后一年

“你看梁文峰的访谈,他提到了信心,他说中国的大厂并不缺钱,那么做AGI缺的是信心。要做技术创新,因为他觉得技术创新比应用创新更重要。他相信AGI的发生,还有一点,他组织了高密度人才,组织了一帮有着同样信念的高密度人才来完成这样的任务。”

乔布斯有一句话,只有那些疯狂到相信能够改变世界的人才能真正的改变世界。我把这句话变一下,就是只有那些真正相信AGI能实现的人,才可能实现AGI。

技术路线之争

实现AGI走哪条路?

DeepSeek为什么能让OpenAI这么紧张?蔡恒进认为,最重要的是DeepSeeek让OpenAI原来的愿景规划失效。关于蒸馏的探讨,他认为指控抄袭或者说完全是蒸馏出来的是不对的,DeepSeek技术上是有创新的,即使有蒸馏可能也是很小的一部分。

杨蜀表示,关于蒸馏的问题,有个网友说的挺有意思,蒸馏不就是把50度的二锅头蒸馏出70度的酒精,从低浓度提纯到高浓度。Deepseek创新在于它蒸馏出了更低算力高智能的模型,用强化学习替代了RLHF人类反馈强化学习。提升了质量,产生了更高的智能,这确实是重要且关键的创新,哪怕是在原有的科技树上。

(所谓蒸馏,是让一个庞大且复杂的预训练AI模型充当“教师”,来训练一个较小的“学生模型”,后者从“教师模型”学习知识,以获得类似性能,但计算成本更低。)

还有人问,现在这条技术路线 LLM+RL(大型语言模型与强化学习)能走到AGI么?

杨蜀认为目前来看, LLM+RL肯定是相当不错的,但接下来GPT5路线因为Scaling Law还能加到多少,大家还有很大疑问。“我对AGI是 有信心的,因为强化学习已经加速了向AGI奔跑。”

蔡恒进认为,很有可能因为DeepSeek促使OpenAI尽快放出GPT5,但是GPT5会不会让大家失望,就不好说了。