vivo:做真正对用户有价值的AI
由美国派拉蒙动画公司和美国孩之宝公司出品的电影《变形金刚:起源》发布中国推广大使宋雨琦与擎天柱配音“锤哥”克里斯·海姆斯沃斯对谈特辑,二人畅聊电影《变形金刚:起源》精彩故事与角色幕后,欢乐氛围点燃粉....
► 文 观察者网 吕栋
市场上“百模大战”激战正酣,vivo作为一家智能手机厂商,为何仍坚持花重金自研?这一决定背后,是vivo真正看清了AI对用户的价值所在。
“大模型应用的本质是什么,哪怕只是交互,如果能让交互更自然、更符合人的直觉,我们就应该不计成本把它做出来,比如我们的手机支持苗语,未来可能会支持壮语、闽南语、藏语等多种方言,这一点点的支持,就能让家里老人也能实现更好的人机交互,这是无价的。”在2024 vivo开发者大会上,vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围对观察者网说道。
大模型和硬件结合会带来新的产业革命,已经是产业共识。但同质化的AI体验难以提升用户粘性,硬件厂商想做出对用户有价值的AI更是难上加难。这考验的不单是大模型参数等单一指标,更是对硬件厂商的软硬件系统创新能力提出极致要求。
作为国内手机市场的长期领跑者,vivo一直选择的是最难的那条路。一年前,vivo推出了自研蓝心大模型矩阵,持续领跑权威榜单,以良好的用户体验收获了众多口碑。尽管自研意味着更高的成本,但vivo每次突破,都是在为AI的落地探路。
一年过去,vivo的AI能力再度迎来重磅升级。在2024 vivo开发者大会上,vivo正式发布全新AI战略:蓝心智能,同时带来了 升级的自研蓝心大模型矩阵、O ginOS 5、蓝河操作系统2,以及在安全、人文、生态合作等领域的 成果。
“大家对AI的预期特别高,认为是不是要创造一些全新的颠覆性功能和场景?不会,我们还是平常心,回归本原去思考,是不是能够让人更温暖、更优雅、更舒适,这是我们坚决大规模投入大模型研发最重要的认知来源。如果只做大模型,而想不出怎么用大模型,我们根本不应该做大模型。”周围坦言。
全新AI战略“蓝心智能”,重构体验是关键
对普通用户来说,AI最大的价值莫过于重构体验,让日常生活和工作变得更加 和便捷。但单一的AI能力或工具,很难给用户体验带来根本改变,AI能力的系统化重构势在必行。
瞄准这个用户刚需,vivo这次推出全新AI战略:蓝心智能。它并不是点状的工具式创新,而是将大模型技术与手机操作系统深度融合后的个人智能,是整体系统能力的跃升。
再通俗点说,操作系统关乎用户核心使用体验,将大模型的智能融入操作系统,最本质的变化是让操作和交互更符合人的直觉和自然习惯,带来更智能、温暖和主动的体验。
根据vivo的规划,这一全新的AI战略将从三个方向落地:
一是重构人与设备的交互体验,让交互更自然、更符合直觉。人机交互曾深刻影响着终端行业的发展,vivo通过将大模型能力和OS交互深度融合,首先带来了人机沟通方式的新革命。
例如在 发布的O ginOS 5中,vivo将“Jovi语音”和基于大模型能力的“蓝心小V”深度融合,支持多种语言互译和更情感化的人机自然对话。“小V圈搜”支持长按导航条呼出,可以将图片、文件、文字直接以向下拖拽的方式交给其处理。除支持已有的语音和文字指令外,还能用最自然的指尖圈选方式,把想要了解的内容发给小V,本地搜索也相当 。
“以前蓝心小V更多是问答和知识供给,是以闲聊为主,但今年蓝心小V完全不一样,今年我们有大模型去猜测用户意图,并且主动推测出可能的选择,拖一个地址(手机)就知道拖了一个地址,上面就会弹出几个选择,弹出一个标签,你可能要保存,弹出一个高德导航,你可能要去导航,但是去年我们是无感的。”周围对观察者网介绍道。
二是重构人与数字世界的服务体验,让智能更加个人化。
这其中又可以细分为三点。
点是已有功能的AI化。依托AI技术对手机基础功能进行 升级,重构标准文生文、文生图的编辑能力,让输入法、电话、笔记、扫描等15项刚需焕然一新,这些能力vivo不仅会做在本机的赋能上,还会做成行业的公共赋能。
第二点是搭建连接服务的框架和 ,包括为伙伴和开发者搭建的集开发和分发于一体的蓝心智能体开放 ,O ginOS 5这次还全新上线了蓝心小V智能体广场,以及针对轻量化和原子化的服务构建的完整的意图框架体系,让人找服务更方便,服务找人更贴心。
第三点是构建个人智能系统框架,让手机成为专属个人助理。在这个框架里,主动服务成为核心。例如外地出差时,从出门时的打车建议,到机场后的登机口提醒、抵达后的城市攻略、抵达酒店前的入住提醒等,“小V建议”都能提前预知并给出最合适建议,“原子岛”、“小V记忆”、“小V跨端生态”等,也都能为用户提供最贴心的服务。
科技平权,一直是vivo的追求。因此vivo把“蓝心智能”AI战略的第三个方向,定位成重构人与物理世界的沟通体验,让沟通更顺畅和温暖。
今年借助蓝心大模型,vivo看见、vivo听说和手语翻译官的体验都更上一层楼,让手机成为视障人士的眼睛,听障人士的耳朵,帮助他们可以独自安全的走到更远的地方,屏幕朗读和博物馆导览等功能,也能让用户在更多场景中感受到智慧温暖的科技体验。
把原来听得见变成听得懂,把原来的被动服务变成主动服务。vivo的“蓝心智能”AI战略,把系统交互做的越来越自然和符合直觉,而这一切都为了给用户创造价值。在强大的AI能力加持下,即将上市的vivo X200系列和iQOO 13系列更加令人期待。
大模型和OS能力全新升级,底层能力再进化
所有AI战略的顺利落地,都离不开底层能力的高度协同,vivo也不例外。去年的VDC上,vivo首次推出自研蓝心大模型矩阵,包含十亿、百亿、千亿三个参数量级的五款大模型,拉开了手机行业AI快速发展的序幕。今年vivo对蓝心大模型矩阵 升级,能力继续领跑。
在云端大模型能力上,vivo重点优化意图理解与分发、任务规划能力。相比去年,千亿参数蓝心大模型云端能力提升30%,并在CM U和SuperCLUE的榜单上继续领跑国内 梯队。
端侧模型部署,对技术能力的要求同样很高。如要考虑模型如何压缩,如何平衡算力、能耗和内存,如何端云协同,如何在底层打通模型、系统和应用,以及保护隐私安全等等。
vivo在端云两侧均厚积薄发。 推出的30亿参数蓝心端侧大模型3B,在对话写作、摘要总结、信息抽取等能力上越级比肩行业7B-9B模型,相比蓝心7B极致性能提升300%,甚至还打破了“模型小、能力强、功耗低”的不可能三角定律,实现了以小搏大的效果。
在SuperCLUE和南开大学端侧5B小模型综合能力评测中,vivo蓝心大模型3B均排名 ,并且同时获得泰尔实验室端侧大模型综合能力认证,以及AIIA安全防范能力认证。
“3B模型可以满足很多场景需求,我们去年定下要做一个行业 的3B的目标,不仅是模型好,而是整体体验好,效果好,性能好,内存好,功耗好,回归到体验的本原思考是核心关键。我们发现6月苹果也发布了3B,这是用户导向和设计驱动的不谋而合。”vivo AI系统中心高级总监熊官敬对观察者网说道。
在个人智能时代,AI的端侧化具有无可取代的优势,但同时也给厂商们带来了不少难题。周围坦言,审核要做到端侧,整个图谱、决策、执行等有数十处都要端侧化,这些都是我们工作量的一个组成部分,如果要完全展开的话,真的是一个很长的课题。
端侧模型外,vivo还同步带来了可以准确理解自然语义,模拟人声的全新自研蓝心语音大模型,强化中国特色与东方美学的融合生成能力的蓝心图像大模型以及升级视觉感知理解能力的蓝心多模态大模型,它们都是vivo“蓝心智能”AI战略落地的关键所在。
基于全方位的大模型能力,vivo展示了AI系统化的 探索——vivo手机智能体PhoneGPT,它是可以基于用户意图拆解需求,主动规划路径,并实时环境识别和动态反馈决策的多模态助理。它不仅可以对于屏幕界面进行识别和操作,也能通过接管音频进行自主对话,以完成用户任务。不夸张地说,PhoneGPT将带领智能手机进入“自动驾驶”时代。
不同于一些厂商借助第三方云端大模型推销AI概念,vivo是真正通过自研大模型深入系统底层,将大模型和操作系统进行了深度融合,vivo的“蓝心智能”AI战略清晰明了。而vivo不仅在自研大模型领域有深厚积累,在自研操作系统领域也走在行业前列。
去年VDC上,vivo推出了蓝河操作系统BlueOS,它面向通用人工智能时代自主研发,引入了蓝心大模型能力,支持复杂的意图识别和声音、图片、手势等自由交互方式。
时隔一年,vivo重磅推出了基于Rust语言编写的实时操作系统内核——蓝河内核,其具备安全、通用、高性能的特性,能够兼容不同的嵌入式 ,具备完整的系统调度、内存管理、文件系统、网络和设备管理能力,同时兼容Posix,并且提供极简异步运行时。
蓝河内核的发布,让蓝河操作系统2成为行业首个全栈由Rust语言编写的操作系统,体现了vivo对操作系统核心技术的深厚积累。而vivo还坚持利他之心、合作共赢的理念,将蓝河实时内核进行开源,旨在为行业提供更多基于Rust编程语言学习和讨论的阵地。
在蓝河内核加持下,蓝河操作系统2拥有更智慧的系统架构,分为三层。最底层是由vivo自研的蓝心大模型和 AP推理计算加速 共同构成的底座。在这个底座上,拥有全新的服务引擎,它包含数据服务、意图感知和决策服务等,为意图框架提供了能力支撑。
vivo还创新性地把意图框架和应用框架融合,帮助开发者更低成本地接入意图框架。而生态繁荣也是操作系统可持续发展的重中之重,蓝河操作系统2兼容了开放原子开源基金会孵化的hapjs快应用标准,随着快应用升级到2.0,将为用户带来更加智慧的服务生态。
从蓝心大模型到蓝河操作系统,再到其背后的整个蓝科技体系,vivo持续打磨AI时代的核心能力,这不仅为用户极致体验打下坚实基础,也为新一轮上升周期奠定领先之势。
持续领跑背后,是不断埋头种因、厚积薄发
今年是vivo的另一个收获之年。在连续三年蝉联国产手机市场份额 后,vivo今年继续领跑。根据Counterpoint数据,今年上半年,vivo手机销量同比增长5%,高于行业平均水平,在过去6个月里,vivo始终稳居市场 名。高端也在持续破局,vivo X100系列在4000-6000 格段表现优异,二季度vivo X Fold3在中国折叠屏市场销量排名第二。
耀眼成绩背后,是vivo对“蓝科技”的长期积累和厚积薄发,其中涵盖蓝晶芯片技术栈、蓝海续航系统、蓝心大模型、蓝河操作系统、蓝图影像等多项创新技术。
以蓝心大模型为例,vivo埋头种因,从2017年就已开始布局研究人工智能,组建了Al全球研究院,是首批设立专攻人工智能方向研究院的中国手机公司之一,2021年vivo就已有超600人专注研发大模型。7年来,正是vivo始终坚持在人才、数据、算法、算力、安全等方面进行战略投入,才有了今天的大模型能力领跑行业的成就。
vivo对研发的坚决投入难能可贵,但更重要的是这些投入并非以炫技为出发点,而是坚持用户导向型创新,让每一项技术突破和产品设计都能真正贴近用户, 实际问题。
例如在用户最关心的系统流畅性上,vivo的O ginOS长期广受好评,但vivo从未替用户感到满足,坚持为用户打造极致流畅的体验。 推出的O ginOS 5,引入了安卓领域首创的Ledger内存账本机制,并升级了不公平调度机制3.0和虚拟显卡2.0,通过在存储、计算效率及显示体验等方面的整体优化,让用户能更轻松应对大型手游等重载场景,体验更加丝滑流畅。
“虽然我们比的是体验,但是我认为比的更多是认知能力和方 ,认知不到位,我们根本不知道为什么要努力,而方 不到位,不管我们怎么努力,它终究有短板,我认为这几年vivo在O ginOS上的体验提升,得益于我们系统性的提升,系统性的认知能力提升和系统性的规划、完整方 的提升,这是我们过去三年进步特别快的原因。”周围说道。
不可否认,在市场的长期波动周期中,通过技术投资和研发的连续性,建立用户对品牌的心智认可,是一家企业立于不败之地的不二法则。vivo也用不胜枚举的例子和成绩证明,坚持埋头种因,做真正对用户有价值的创新,才是不断穿越行业周期的根本之道。
企业发展的终极问题,最终还是在能否满足用户需求上。大模型这波技术浪潮,恰好带来了用户体验重构的机会,而vivo的厚积簿发,势必会让自身的领跑之势更加稳固。