订、阅 | 010-86092062
近年来,大模型的发展可谓是突飞猛进,它的崛起引领了一场技术革命。从最初的自然语言处理领域,拓展到了机器视觉、多模态交互等多个领域,同时,它也使得Agent能够更好地理解和生成自然语言,处理更复杂的任务。
4月16日,百度智能云发布了新一代智能计算操作系统“万源”。它通过对AI原生时代的智能计算平台进行抽象与封装设计,为用户屏蔽掉云原生系统与异构算力的复杂性,提升AI原生应用开发效率与体验。

✦
✧
从大模型Agent到大模型OS
✦
大模型在指令遵循、知识检索、推理问答、人机交互等方面性能强大。但它本身也存在幻觉、安全隐私、知识更新等问题。当面对多样化的应用场景时,单纯依赖大模型能力并不是一个好的解决方案。为此,大模型Agent应运而生,它以大模型为驱动,具有自主理解感知、规划、记忆和使用工具的能力,能自动化执行完成复杂任务的系统。
然而,随着Agent应用日益增多,研究人员开始发现,如何高效管理和调度这些Agent成了主要问题,尤其是底层宝贵的显卡资源该如何充分使用?
就在前不久,学术界,罗格斯大学提出了一个基于大模型的Agent操作系统架构:AIOS,旨在解决多Agent并行计算问题,展示了其优化算力资源利用的能力。罗格斯大学的研究为我们打开了一种新思路,将大模型嵌入到操作系统中,让它变成一个“有脑子”的操作系统。
可以看到,大模型与操作系统融合将成为一个重要趋势。通过融合大模型的能力,操作系统有望进一步缩小人机之间的交互距离,开启新的用户-计算机交互时代。
近日,国内产业界带来了大模型与操作系统融合创新的又一进展。4月16日,百度智能云发布了新一代智能计算操作系统:万源。
“万源”或将颠覆传统的云计算系统。与上一代云计算时代的操作系统不同,在大模型时代,操作系统的内核发生了很大变化,首先底层硬件从以CPU为主变成以GPU为主,其次新增了被大模型压缩的世界知识。操作系统管理的对象也有了本质变化,从管理进程、管理微服务变为管理智能。时代变了,大模型时代,需要全新的操作系统,取代云计算系统成为主角,「万源」由此诞生。
它也改变了人类与操作系统的交互方式。传统操作系统交互需要依赖编程语言,例如:C/C++、Java、Python等,而「万源」让开发者只需通过自然语言就可构建出自己的应用,现在只要开发者有想法,就可以很快将应用落地。
✦
✧
“万源”技术架构
✦
对比操作系统的核心组件,比如底层硬件设备、管理软硬件资源的内核层、与用户交互的 Shell 层和集成各类工具程序的应用层,万源的整体框架是这样的:
Kernel(内核)层包含百度百舸・AI 异构计算平台和百度文心大模型,满足模型训练算力需求和多样化大模型使用需求。
内核层之上的 Shell(外壳)层为千帆 ModelBuilder 平台,让开发者按需和细分场景来定制、精调模型。
最上面为 Toolkit(工具)层,千帆 AppBuilder 和 AgentBuilder 支持了各类应用和 Agent 的快速开发。
智能计算操作系统万源的三层组成
自下往上,万源要在底层屏蔽掉云原生系统与异构算力的复杂性、并强化大模型这一能力引擎,在中层对大模型进行部署精调,在上层为 AI 原生应用和 Agent 的快速开发提供支撑和保障。
也就是说,借助操作系统这个完整载体,百度智能云将高效的异构算力、智能的系统内核和敏捷的应用开发“打包”,为业界加速 AI 原生应用布局提供一个新选择。
可以看到,大模型出现以来提出的全新人机交互需求、人们对开发体验的更多样性诉求以及传统云计算向智能计算的转变,让万源的出现有了必要性和合理性。
那么,万源各层组成有哪些新的、独特之处呢?先从 Kernel(内核)层看起,算力和大模型是两大组成部分。作为 AI 三要素之一,算力重要性无需多言。
在万源中,百度百舸・AI 异构计算平台是将现有算力资源发挥到极致的基座。该平台针对大模型训练、推理任务,分别在智算集群设计、调度和容错等环节优化。目前,百舸在万卡集群上的模型有效训练时长占比超过了 98.8%,线性加速比和带宽有效性均达到了 95%,实现业界领先算力效能,为内核层提供高效的算力保障。
此外还有一个问题,国内芯片供应存在不确定性,这必然会导致多芯片并存的格局(即国内和国内品牌芯片共存),这为智算集群中模型推理和单一任务训练提出了挑战。百舸不仅兼容了昆仑芯、昇腾、海光 DCU、英伟达、英特尔等国内外主流 AI 芯片,更实现百卡和千卡规模、单一训练任务下,不同厂商芯片的混合训练,其中百卡规模性能损失不超过 3%,千卡规模性能损失不超过 5%,实现业界领先。
正如沈抖会上所言,“百舸为大家屏蔽掉了芯片之间的差异,提供了自由选择不同芯片组合的权利。”
内核层的另一主角是 77 个精选大模型,包括百度 ERNIE 4.0、ERNIE 3.5 大语言模型、近期发布的 ERNIE Speed/Lite/Tiny 系列轻量模型、文心视觉大模型和各种第三方大模型。它们压缩并封装了庞大的世界知识,是更上层运行简单接口和 AI 原生应用的能力源泉。
来到外壳层,主角是千帆 ModelBuilder,负责大模型管理、调度和二次开发。有了它,开发者不用从头开始训练大模型,付出很少数据、资源即可在基础大模型上快速精调出适合自身业务和场景的模型。
再往上为 ToolKit(工具)层,集成了产业级 AI 原生应用开发平台 AppBuilder 和基于文心大模型的智能体构建平台 AgentBuilder。有了内核层和外壳层的算力和模型铺垫,万源要在此层让开发者切身体验到不一样的 AI 原生应用开发。
其中,AppBuilder 支持工作流编排。开发者选择使用预置模板和组件或者集成、扩建特色组件,轻松定制自己的业务流程。经过 ModelBuilder 精调的模型也可以直接调用,怎么方便怎么来。开发完的应用支持一键发布到百度搜索等其他平台,并通过 API 或 SDK 在用户系统中直接集成。
AgentBuilder 则致力于零门槛,让不会编程的用户通过 prompt 输入和操作调优,快速创建专属于自己的智能体,在使用场景中自动提供服务。
此外,万源还提供了完善的模型 & 数据管理以及模型安全服务,为 AI 原生应用的繁荣保驾护航。
至此,从内核层、外壳层到工具层,百度在我们面前展现出了新一代智能计算操作系统的全貌。
万源的发布,不仅展示了百度在AI技术领域的深厚实力,也凸显了百度对于AI原生时代的深刻洞察和坚定布局。随着AI技术的不断发展,智能计算操作系统作为连接硬件和应用的桥梁,将发挥着越来越重要的作用。而百度万源系统的诞生,无疑为这一领域的发展注入了新的活力。
未来,随着万源系统的广泛应用和不断优化,无论是对于开发者而言,还是对于各行各业的企业而言,万源都将成为推动创新发展的重要力量。我们期待着万源在未来的发展中,能够带来更多惊喜和突破,引领AI原生时代迈向新的高度。