每经记者 郑雨航 实习记者 岳楚鹏 每经编辑 兰素英
传说中的 AI 模型草莓(Strawberry)要落地了?
当地时间9月10日,外媒援引对草莓模型进行过测试的两位知情人士的消息称,OpenAI计划在未来两周内将草莓模型作为ChatGPT服务的一部分发布。时间上比两周前所传的“秋季发布”(9月至11月)更早。
这一最新模型的定价问题也引发了外界的兴趣。此前有报道称,新模型的订阅费将高达2000美元/月,但有人声称已经出现200美元/月的ChatGPT Pro,并猜测称这是在为草莓模型的发布铺路。然而,这一消息的真实性还无法确定。
另外,外媒的最新报道称,草莓模型的初始版本只能处理文本,这可能是OpenAI在越来越多的竞争压力下作出的匆忙决定。值得注意的是,这条消息曝出前三小时,OpenAI的GPT-4o和GPT-5研究负责人Alexis Conneau在X平台上宣布将离开 OpenAI自行创业。
发布进程正在加速
今年8月底,有外媒援引知情人士的消息透露,OpenAI的草莓模型预计最早将于今年秋季作为聊天机器人的一部分推出。但最新消息显示,OpenAI计划在未来两周内将其作为ChatGPT的一部分推出,发布进程正在加速。ChatGPT的现有订阅者可能有机会在免费用户之前抢先使用草莓模型。
据外媒报道,虽然草莓模型将集成在ChatGPT中,但它将是一个独立选项。目前尚不清楚用户如何访问它,但有猜测称,用户只需在ChatGPT界面的可用模型列表中选择草莓模型即可。
知情人士透露称,OpenAI上个月就开始专注研发草莓模型,并表示草莓模型与其他生成式AI模型的区别在于它更专注于推理:与现有模型几乎即时的回应不同,草莓模型通常需要10到20秒来考虑对任何问题或提示的回应。
根据他们的解释,草莓模型的额外思考有助于避免犯错,也让其更有可能知道何时需要向客户询问后续问题,从而知道如何全面回答他们的问题。这一有目的性的延迟让草莓模型能够以更有条理的方式处理每个查询,从而减少出错的概率。通过花时间思考,OpenAI希望草莓模型能够提供更好的响应质量。这意味着草莓模型不仅在数学问题和编码方面表现更佳,在完成更主观的商业任务方面也将更好,比如说制定产品营销策略。
草莓模型定价引关注
外媒报道同时称,草莓模型的定价模式也可能有所不同。草莓模型的定价结构预计将限制用户每小时可发送的消息数量。而且,定价可能与响应速度挂钩。对于那些希望获得更快响应的用户,草莓模型可能还会提供更高价位的套餐。
之前报道曾透露,在OpenAI的早期内部讨论中,新模型每月高达2000美元的订阅价格已经摆在桌面上,但公司管理层并没有作出最终决定。不过大部分人并不相信这一消息的真实性,只是将之视为OpenAI的一次营销炒作。有网友评价道,OpenAI泄露这个价格,是为了之后推出200美元的价格时,让人们感觉占便宜了。
无独有偶,有人声称已经见到200美元的ChatGPT Pro,并且还体验了一下,但目前并没有新的功能,也没有新模型,唯一的区别是,GPT-4o使用次数基本等于无限。该人士猜测,ChatGPT Pro会员是为草莓模型的发布提前作准备。
暂时抛开定价不谈,对于用户来讲,高额的订阅费应该匹配良好的用户体验。但据知情人士表示,一些使用过草莓原型的人抱怨说,与OpenAI目前发布的GPT-4o相比,草莓模型的响应质量稍好一些,但不值得额外等待10到20秒。
而且,尽管草莓模型的推理能力被外界认为会很先进,但消息人士表示,新模型仍存在一些局限性。
一些早期测试人员报告称,尽管理论上草莓模型能够在用户询问简单问题时跳过思考步骤,但实践中它并不总是如此。它可能会错误地识别一个很简单的问题而导致思考过久,而OpenAI的其他模型却可以在很短的时间内反应过来。
另外,尽管草莓模型能够记住之前的对话,以便提供更加个性化的回应,但在实际体验中,它有时也会突然忘记一些事情。
不仅如此,外媒预计,草莓模型发布的初始版本只能接收和生成文本,而不能接收和生成图像,这意味着它还不支持多模态。而如今发布的大多数大型语言模型都是多模态的。
公司关键人物离职
外媒分析称,将草莓模型以纯文本形式提前发布,可能是OpenAI在越来越多的竞争压力下作出的匆忙决定。上个月,谷歌抢先推出了一款AI语音助手Gemini Live。这一新工具灵活性十足,能够应对用户的打断和突然的主题转换。
除了来自竞争对手的压力,OpenAI的人员流失似乎也还在继续。
在有关草莓模型发布的最新消息曝出前三小时,OpenAI首席研究员、GPT-4o背后的关键人物Alexis Conneau宣布离开OpenAI。
Conneau在X上发帖称:“我决定创办一家新公司。”他还邀请那些对“创造一些神奇事物”感兴趣的人与他联系,新公司正在招聘。
在OpenAI发布的GPT-4o致谢名单中可以看到,Conneau具体领导了GPT- 4o Audio Pre-Training、Encoders和Interruptions团队的研究工作,其中Interruptions团队的研究内容,就是让GPT-4o可以像人一样在讲话中被打断的关键。
GPT-4o在5月发布时曾凭借在文本、视觉和音频方面的“全方位”功能赢得业界青睐,尤其是Her模式(GPT-4o Voice)的出现。这一模式使得AI模型能够实时响应人类的语言互动。
不过惊艳亮相之后,GPT-4o Voice却再无音讯。而Conneau的离开,为GPT-4o Voice的前景增添了一丝不确定性。而更值得一说的是,Conneau还是GPT-5的研究负责人。
对此,有网友问道:“实话实说,如果GPT-5真的具有突破性并且具有彻底的革命性,为什么会有这么多人离开OpenAI?”
除此之外,另一重量级模型Sora似乎也面临研发困境。当地时间9月9日,CNBC爆料称,今年2月份就官宣了的Sora模型还处于研究阶段,今年内可能无法推出。一方面是政治原因,另一方面是技术上还没有准备好。
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:[email protected]
发表评论