从需求理解到代码调试:AI程序员的全流程自动化
传统的软件开发流程往往繁琐而冗长,从需求分析、代码编写、调试到最终发布,通常需要多个开发者协同工作,耗费大量时间。然而,阿里云的AI程序员通过多智能体协同工作,将这一过程大大简化。不同于目前市场上的Copilot等AI工具,AI程序员并不是简单地根据提示续写代码,而是能够真正理解需求,独立完成任务。
多智能体协同工作模式

阿里云AI程序员的核心在于其多智能体协同工作模式。这一模式下,AI程序员并不是“一个人”,而是多个智能体的集合。每个智能体分别负责需求理解、任务拆解、代码编写、测试、问题修复、提交发布等软件开发任务。这种分工合作的方式不仅提高了效率,还使得每个智能体能够专注于特定任务,优化整体系统的工作效果。
在这个体系中,编码智能体首创了代码仓库知识图结构,不仅能理解用户需求,还能精准定位代码对应的修改位置并自动给出修改方案。这样一来,传统软件开发中繁琐的修改和调试工作得以大大简化,开发效率显著提升。
三种人机协同模式的演进
阿里云资深技术专家神秀指出,“人机协同模式的改变”是大模型给软件研发带来的最重要变化,并预测这种变化将基于以下三种模式演进:
1. LLM as Copilot:在这一模式下,AI工具通过与人协同工作提升开发效率,解决单点事务性工作效率问题。通义灵码便是基于这一模式。
2. LLM as Agent:随着AI能力的升级,AI Agent作为单一领域职能专家,能够自主使用工具完成预定任务。在这一模式中,人类主要负责给定上下文和完成知识对齐。
3. LLM as Multi-Agent:多智能体协同模式的出现,使多个Agent能够相互协作完成复杂任务。人类在这一过程中主要负责创意、纠偏和确认。阿里云此次推出的AI程序员正处于这一阶段。
与通义灵码主要作为IDE插件存在不同,AI程序员并不依赖于IDE,交互入口可以是网页,也可以是Devops平台。执行任务的主体从人类程序员变成了AI本身,这使得开发过程更加灵活高效。
阿里云的AI程序员已经在内部取得了显著成效。每天生成超过3000万次代码,AI代码生成占比达到26%,大大超过了此前预计的20%目标。企业客户反馈也显示,通义灵码大概能实现10%-15%的综合人效提升。
神秀还提到,在检验大模型开发能力的SWE-bench上,多智能体架构下AI展现的编程能力正在飞速进步。SOTA模型已经实现超过30%的问题解决率,相比年初的10+%甚至不到10%的成绩,进展显著。预计多智能体在SWE-bench上的问题解决率有望很快突破50%,在一些简单、重复的编码场景下,AI程序员这样的产品将完全可用。
阿里云AI程序员的产品架构分为三层:第一层是多智能体协同的产品和工程框架;中间层是针对编码场景的数据训练;最底层是通义大模型。阿里云已经构建好了工程基础,随着基础模型能力的提升,预计几个月内将推出邀测版本。
尽管AI程序员已经取得了显著的进展,但神秀坦言,目前讨论“AI程序员能否通过阿里面试”这样的论题有点“预期过高”。AI程序员现在能够端到端地完成一个需求,并在这个过程中跟人类进行多轮交互。它能够使用工具,使用编译器,完成自我调试,但这还只是第一步。
未来发展的关键在于基础模型的理解力、对全局代码的分析能力,以及工程方面的执行效率和成本性能。搭建起工程框架的意义在于,一旦学术界实现了整体突破,作为产品建设方,阿里云可以以最快的速度将最新的技术转化为工程。
阿里云通义大模型业务负责人徐栋在阿里云上海AI峰会现场表示,软件应用的开发范式正在发生改变。通过AI编程助手和AI程序员的加持,每一位人类程序员都将成为“超级个体”,在减少重复性工作的同时,更专注于创新和价值创造。
结论阿里云的AI程序员通过多智能体协同工作,展示了人工智能在软件开发领域的巨大潜力。它不仅提高了开发效率,还为未来的开发模式提供了新的思路。随着技术的不断进步,AI程序员有望在不久的将来成为软件开发的重要助手,推动整个行业迈向新的高度。