本文作者:创意奇才

Sam Altman发布2025年技术愿景,你想OpenAI怎么做?

创意奇才 昨天 29
Sam Altman发布2025年技术愿景,你想OpenAI怎么做?摘要: 直播吧月日讯阿森纳在本轮英超客场大胜水晶宫赖斯替补分钟内贡献传射他也在赛后通过社媒晒出自己的庆祝动作并配文睡觉觉值得一提的是这一庆祝动作也是球星库里的经典庆祝动作不知道赖斯作出这一...

直播吧12月22日讯阿森纳在本轮英超客场5-1大胜水晶宫,赖斯替补32分钟内贡献传射。他也在赛后通过社媒晒出自己的庆祝动作,并配文:“睡觉觉”。值得一提的是,这一庆祝动作也是NBA球星库里的经典庆祝动作,不知道赖斯作出这一动作是否和前者有关。

声明:本文来自于微信公众号AIGC开放社区,授权 转载发布。

发布了新的一年,并在社交 上征求网友的意见,希望发布哪些技术同时优化哪些功能。

用户对这个 感兴趣,评论已经超过8300,浏览量破270万,算是Sam今年最高的推文之一了,比前几天的连续12天直播热闹很多。

对于用户的反馈,Sam回复也 积极,并且还肯定了一些意见 不错,基本上已经安排上很快就会实现。

下面「AIGC开放社区」就挑选一些Sam基本确定的技术路线,以及比较好的意见。

更强的GPT-4o替换品,GPT/o系列模型/文生图模型Sora可以无缝集成到 Ch GPT中(也就是说要求Ch GPT更强的多模态能力)

50/70美元的计划,中间价位?(最近200美元的Pro太贵了)更长的上下文窗口。当然,终极愿望还是AGI,相信你们会实现的。

Sam 喜欢这个建议,明年会完善的。

希望可以添加家庭账户。这样可以为我的孩子增加带保护功能的账号,这样可以放心的让他们发挥自己的想象,但又在设定的合理范围之内,同时也能根据他们对Ch GPT的使用,来了解孩子的想法。

棒的建议。

更好的语音聊天轮流检测。现在比较烦人的是,我还没安静地思考5秒呢,就会被AI打断。(就是认为语音模式下AI回复太快了,应该更人性化一点停顿时间长一些。)

Sam认为这是一个 好的建议,未来OpenAI会修复这个问题。

当我使用高级语音模式时,我希望它能更好地记住我之前的对话,即便只是一个 RAG 系统。我喜欢在通勤时进行对话和头脑风暴,但我发现不得不详细重复之前的内容!

这位老哥的问题给Sam干懵圈了,没搞懂他的需求。其实,他的意思是就想让语音模式的Ch GPT能像文本那样,记住他们之前的对话。估计现在语音模式还不具备记忆的能力。这个应该以后也会修复。

可拖放式用户界面,能将多个 的聊天/模型串联在一起,生成和优化输出。(这简直就是大锅炖,不敢想真实现了能有多香。)

Sam认为,这个想法 有趣,我们还没认真考虑过呢。

说实话,现在的非思考模式的 GPT-4o有点不行了,甚至mini也不太好。

这个问题确实存在。

发布GPT-4o的图像生成功能。

希望会实现的。

高级语音模式的本地存储功能。我经常遇到这样的情况:我在手机上说了3分钟,然后连接失败,我的整个输入就消失了。

其实他的这个需求和上面那个人差不多,基本都是要求Ch GPT的高级语音模式新增“记忆”功能。

能够在使用语音模式时同时看到文本。有时候阅读回复更快,但仍希望能够以语音方式回应。

看来OpenAI的高级语音模式优化空间相当大,明年肯定会再更新一波吧。

更好的AI Gent功能用于研究城市中的本地事,例如,公共交通、活动、电影时间、景点、门票等。这些通常涉及多步骤的工作流程,以进行研究并获得 。希望可以一键完成。

我希望能够将 ail 和 Google 日历等API 与Ch GPT相结合,这样它就能随时了解我的日程安排和工作内容。(其实谷歌的Gemini模型已经实现了)

新的用户界面类型,例如,思想连接可视化的空间界面、AI和人类共同构建的协作Canvas、根据上下文变化的流动工作空间,以及在应用之间自然传递的AI Agent功能。

Sam Altman发布2025年技术愿景,你想OpenAI怎么做?

关于AI Agent用户关心的也比较多,明年OpenAI肯定会上线一款的,前不久已经公布在研发了。

目前,网友的积极性 高,估计这周末评论轻松破1万。看来大家对OpenAI还是相当期待的,而这次Sam搞的大会也相当成功,2025年OpenAI的主要动力之一便是完善用户的需求。