首页 » 软件开发 » 前身为Q*,能实现高级推理(人工智能模型草莓推理路透社)

前身为Q*,能实现高级推理(人工智能模型草莓推理路透社)

少女玫瑰心 2024-07-24 06:31:06 0

扫一扫用手机浏览

文章目录 [+]

编辑:张倩、陈陈

还记得 OpenAI 的秘密项目 Q 吗?它现在叫「草莓」。

刚刚,路透社独家发布称,OpenAI 内部正在一个代号为「草莓(Strawberry)」的项目中开发一种新的人工智能模型。
该项目的细节此前从未被发布过,而 OpenAI 正努力证明其提供的各类模型能够提供高级推理能力。

前身为Q*,能实现高级推理(人工智能模型草莓推理路透社) 软件开发
(图片来自网络侵删)

根据路透社 5 月份看到的一份 OpenAI 内部文件副本,OpenAI 内部团队正在开发「草莓」。
路透社无法确定这份文件的确切日期,该文件详细介绍了 OpenAI 打算如何使用草莓进行研究的计划。
消息人士向路透社描述说,该计划还在进行中。
路透社无法确定 「草莓」距离公开发布还有多远。

该人士说,「草莓」的工作原理即使在 OpenAI 内部也是被严格保密的。

消息人士称,该文件描述了一个使用草莓模型的项目,其目的是让公司的人工智能不仅能生成查询答案,还能提前规划,以便自主、可靠地浏览互联网,进行 OpenAI 所称的「深度研究」。

根据对十多位人工智能研究人员的采访判断,这是迄今为止人工智能模型一直无法实现的。

在被问及「草莓」的细节时,OpenAI 公司的一位发言人在一份声明中说道:「我们希望我们的人工智能模型能像我们一样看待和理解这个世界。
不断研究新的人工智能能力是业界的普遍做法,我们都相信这些系统的推理能力会随着时间的推移而不断提高。

发言人没有直接回答有关「草莓」的问题。

「草莓」项目的前身是 Q,该项目在公司内部已被视为一项突破。

据两位消息人士描述,今年早些时候,他们观看了 OpenAI 工作人员告诉他们为 Q demo 的演示,Q 能够回答棘手的科学和数学问题,而这些问题是目前市面上的模型无法企及的。

据彭博社发布,在本周二的一次内部全员会议上,OpenAI 展示了一个研究项目的演示,并声称该项目拥有类似人类的新推理能力。

OpenAI 发言人证实了这次会议,但拒绝透露会议内容的细节。
无法确定演示的项目是否为「草莓」。

据发布,在这次会议上,OpenAI 提出了一套五个等级来追踪其在开发能够超越人类的人工智能软件方面的进展,范围从目前可用的可以用对话语言与人互动的人工智能(第 1 级)到可以完成组织工作的人工智能(第 5 级)。

OpenAI 高管告诉员工,该公司认为自己目前处于第一级,但即将达到第二级,即所谓的「推理者」,这指的是可以完成基本问题解决任务的系统,以及拥有博士学位但无法使用任何工具的人。
此外,根据 OpenAI 提出的级别,AGI 的第三级被称为「智能体」,指的是可以花几天时间代表用户采取行动的人工智能系统。
第四级描述的是可以提出新创新的人工智能。
而最先进的级别被称为「组织」。

知情人士表示,OpenAI 希望「草莓」这项创新能显著提高其人工智能模型的推理能力,并补充说,「草莓」涉及一种专门处理人工智能模型的方法,在此之前,该模型已在非常大的数据集上进行过预训练。

接受采访的研究人员表示,推理是人工智能实现人类或超人级智能的关键。

虽然大型语言模型已经可以比人类更快地概括密密麻麻的文本和撰写优雅的散文,但在常识性问题上,这种技术往往存在不足,因为这些问题的解决方案在人们看来是直观的,比如识别逻辑谬误和玩井字棋。
当模型遇到这类问题时,往往会出现「幻觉」。

接受采访的人工智能研究人员普遍认为,就人工智能而言,推理是指形成一个模型,使人工智能能够提前规划,反映物理世界的运作方式,并可靠地解决具有挑战性的多步骤问题。

提高人工智能模型的推理能力被认为是开启模型能力的关键,使其能够完成从重大科学发现到规划和构建新软件应用程序的所有工作。

OpenAI 首席执行官 Sam Altman 今年早些时候说过,在人工智能领域,「最重要的进步将围绕推理能力展开。

谷歌、Meta 和微软等其他公司也在尝试使用不同的技术来改进人工智能模型的推理能力,大多数从事人工智能研究的学术实验室也是如此。
然而,对于大型语言模型(LLM)是否能够将想法和长期规划纳入其预测方式,研究人员的看法却不尽相同。
例如,现代人工智能的先驱之一、就职于 Meta 公司的 Yann LeCun 就经常说,大型语言模型不具备像人类一样的推理能力。

「草莓」成为克服众多挑战的关键

知情人士称,代号为「草莓」的技术是 OpenAI 克服这些挑战计划的关键组成部分。
路透社看到的文件描述了「草莓」想要实现的目标,但没有说明如何实现。

据四位知情人士称,近几个月来,OpenAI 一直在私下向开发者和其他外部各方发出信号,称其即将发布具有更先进推理能力的技术,不过这四人拒绝透露姓名。

其中一位消息人士称,「草莓」用到了后训练(post-training)方法,即在对大量通用数据进行训练后,调整基础模型以特定方式优化其性能。

后训练阶段涉及微调等方法,这是当今几乎所有语言模型都采用的一种方法,它有多种形式,例如让人类根据模型的响应向模型提供反馈,并为模型提供好答案和坏答案样例。

另据一位知情人士称,「草莓」与斯坦福大学 2022 年开发的一种名为 STaR(Self-Taught Reasoner)的方法有相似之处。
STaR 的创建者之一、斯坦福大学教授 Noah Goodman 告诉路透社,STaR 方法使 AI 模型能够通过迭代创建自己的训练数据将自己「引导」到更高的智能水平,理论上可以用来让语言模型超越人类水平的智能。

Goodman 教授表示,「草莓」的出现让他既兴奋又恐惧…… 如果事情继续朝这个方向发展,人类就需要认真思考一些问题了。

「草莓」瞄准的功能之一是执行长期任务 (LHT,long-horizon tasks),指的是需要模型提前规划并在较长时间内执行一系列操作的复杂任务,其中一位消息人士解释说。

根据 OpenAI 内部文件,该公司正在利用名为「deep-research」的数据集创建、训练和评估模型。
不过路透社无法确定该数据集中包含哪些内容,也无法确定长期任务意味着什么。

根据该文件和其中一位消息人士的说法,OpenAI 特别希望其模型能够利用这些功能进行研究,即在 CUA(computer-using agent)的帮助下自主浏览网页,并根据其发现采取行动。
OpenAI 还计划测试「草莓」在软件和机器学习工程师工作方面的能力。

参考链接:https://www.reuters.com/technology/artificial-intelligence/openai-working-new-reasoning-technology-under-code-name-strawberry-2024-07-12/

https://www.bloomberg.com/news/articles/2024-07-11/openai-sets-levels-to-track-progress-toward-superintelligent-ai

相关文章

语言中的借用,文化交融的桥梁

自古以来,人类社会的交流与发展离不开语言的传播。在漫长的历史长河中,各民族、各地区之间的文化相互碰撞、交融,产生了许多独特的语言现...

软件开发 2025-01-01 阅读1 评论0

机顶盒协议,守护数字生活的新卫士

随着科技的飞速发展,数字家庭逐渐走进千家万户。在这个时代,机顶盒成为了连接我们与丰富多彩的数字世界的重要桥梁。而机顶盒协议,作为保...

软件开发 2025-01-01 阅读1 评论0

语言基础在现代社会的重要性及方法步骤

语言是人类沟通的桥梁,是社会发展的基础。语言基础作为语言学习的基石,对于个人、社会乃至国家的发展具有重要意义。本文将从语言基础在现...

软件开发 2025-01-01 阅读2 评论0

粤语电影,传承文化,点亮时代之光

粤语电影,作为中国电影产业的一朵奇葩,以其独特的地域特色、丰富的文化内涵和鲜明的艺术风格,赢得了广大观众的喜爱。本文将从粤语电影的...

软件开发 2025-01-01 阅读5 评论0

苹果游戏语言,塑造未来娱乐体验的基石

随着科技的飞速发展,游戏产业逐渐成为全球娱乐市场的重要支柱。在我国,游戏产业更是蓬勃发展,吸引了无数玩家和投资者的目光。而在这其中...

软件开发 2025-01-01 阅读1 评论0