重磅发布！“大模型+Agent” AI 原生应用来了！

依托强大的基座模型和创新研发的 AI Agents 技术，面壁智能正式推出基于群体智能的AI原生应用——“面壁智能 ChatDev”智能软件开发平台。

这是业内首次将 AI Agents 群体智能协作技术应用于软件开发的 SaaS 平台产品，也是让软件开发者和创新创业者以极低的成本和门槛高效完成软件开发工作 的开端。

ChatDev 申请试用地址：https://chatdev.modelbest.cn

与此同时，面壁智能也将其CPM系列基座模型升级为全新一代千亿参数大模型“面壁智能 CPM-Cricket ”，带来更强劲的逻辑推理和语言理解等能力，为“大模型+Agent”落地应用提供基础保障。

经权威测试，CPM-Cricket 在逻辑、代码、知识、语言、安全性等方面全面超越 LLaMA2。在公考行测和 GMAT 试题的测试表现中，其核心能力与 GPT-4 相当。

SaaS版ChatDev：最快3分钟搞定软件开发

不到两月星标超 1.6 万，屡次登顶 GitHub Trending，并创造出“用一杯可乐的时间和钱开发一款软件”的智能生产力神话，这是“ChatDev 智能体协作开发框架“自开源以来取得的耀眼成绩，持续引爆国内外软件开发和创业者社区的关注和热议。

在此期间，面壁智能产研团队快速响应构建面向用户实际需求的应用原型，首次提出并打造出基于“大模型+Agent”技术能力的应用平台，将 ChatDev 产品化，以 SaaS 服务的形式面向广大用户开放。

SaaS 版 ChatDev 将原始版本的核心能力浓缩成一个更加简洁高效、应用门槛更低的可视化交互平台，即便没有编程经验的普通用户，也能轻松使用。此外，面壁智能还对其流程进行了优化升级，正式发布版本将带来更高的运行效率。

只需三步走，即可实现软件开发革新：

➤ 第一步

登录后，用户只需输入项目名称，进行简单设置，并通过“自定义链”定义公司中的角色、工作流程，就可以启动开发工作。

➤ 第二步

在收到用户的软件需求指令后，ChatDev 中的智能体们就会根据各自的角色各司其事、统一协作，如同现实世界中软件公司工作情景真实上演。

➤ 第三步

最快 3 分钟，ChatDev 就能生成可直接运行的应用程序。从“红包雨”这种颇受大众欢迎的营销神器，到“电子名片生成器”这类实用的商务工具，再到“五子棋”、“贪吃蛇”、“太空大战”等各种休闲小游戏……ChatDev 实现了“1 个人+多个 AI Agents”的革新软件开发模式。

ChatDev 软件开发平台究竟哪里好？🤔

效率高：无需进行专业复杂的 prompt 探索，只需简单的需求说明就能后台自动完成整套工作流，让软件开发“降本提效”。
可共创：用户不仅可以通过上帝视角监督开发过程，还能直接和智能体 “人机共创”，让软件开发“一步到位”。
定制化：用户可根据个人喜好，增加、删除、调换、改变部分功能与设计，让软件开发实现“私人订制”。

SaaS 版本 ChatDev 的推出真正建立起大模型与应用的创新闭环，形成“数据飞轮”，促进平台功能持续迭代，推动 AI Agent 技术广泛应用。

超强模型能力提升，助推“大模型+Agent”生产力跃迁

大模型作为当今科技界“顶流”，如何改变生产方式、提高生产力，进而为社会经济带来真正价值，才是其迷人之处。

面壁智能希望以“大模型 + Agent”战略，布局大模型技术应用之路，不断打造高价值产品系列，驱动新一轮AI原生应用的爆发，迎接 AGI 时代的到来。

然而，应用的创新离不开基础模型能力的提升，面壁智能在基座模型方面也在持续攻坚，不断为产品和应用输送强劲的基础能力保障。

本次全新升级的 CPM-Cricket 是继 CPM-Ant、CPM-Bee 之后的第三代基座模型，在逻辑、代码、知识、指令理解等方面均有大幅提升。

根据在 HumanEval、C-Eval、MMLU、MBPP、CMMLU、BBH 等权威 LLM 评测集的结果，CPM-Cricket 在逻辑、代码、知识、语言、安全性等方面已全面超越 LLaMA2。

伴随 CPM-Cricket 的推出，面壁智能基于 CPM 的多模态智能对话助手「面壁露卡Luca」也在快速成长，升级为 3.0 版本，其逻辑推理能力较首次发布提升了 163.9%，综合能力提升 61.5%。近期，Luca 也已正式面向公众开放服务。

为了测试模型的逻辑推理和语言理解在实践中的真实表现，面壁智能给 Luca 进行了公考行测能力测评。

结果显示，在包括常识判断、数量关系、资料分析、判断推理、语言理解与表达等多种题型的 425 道试题中，Luca 的总成绩表现优异，综合能力与 GPT-4 相当，在判断推理题目的正确率方面优于 GPT-4。

为了考察 Luca 的全面性，面壁智能还对其进行了英文的 GMAT 模拟测试。结果显示，Luca 在英文环境中的阅读理解和逻辑推理方面与 GPT-4 能力接近。

模型能力的提升取决于底层研发技术的综合实力。面壁智能探索出更为低成本、高效率的模型训练方法，让大模型不仅能 “训出来”，还能 “训得好”、“用起来”。

为此，面壁智能构建了一整套大模型创新研发体系，包括自研的高效训练框架、高效推理框架，大模型压缩工具，以及增量微调、指令微调、提示学习工具包等。此外，面壁智能还原创打造出大模型工具学习引擎，并已集成超过 16000 多个真实 API，可实现一键接入，调用工具解决更多复杂任务。不仅如此，面壁智能还部署了 Int8 量化模型，让模型推理成本降低 50%。

作为国内最早开展大模型研发的公司之一，面壁智能团队不仅早在 2020 年就发布了国内首个中文大语言模型 CPM-1，同时也是最早在 AI Agent 技术取得突破的大模型公司之一。2023 年 5 月，面壁智能就陆续推出并开源了 AI Agent “三驾马车”：AgentVerse、ChatDev、XAgent。

通过这些智能体的连接，我们会进入一个全新的 Internet of Agents（IoA） 时代。正如面壁智能的愿景“智周万物”，AI Agent 不仅能够创造新的交互方式，还将带来生产力的跃迁，为行业和用户带来更多想象空间，彻底改变人与人、人与物、物与物的万物交互方式。

ChatDev 产品版本的发布展现并验证了“大模型+Agent”赋能生产力提升和创新交互体验的清晰路径。然而其应用场景绝不局限于软件开发领域，它还可以是拟人的原生智能体，也可以是现实中的人和物的数字孪生智能体。

面壁智能联合创始人、CEO 李大海表示，“大模型+Agent”将会引起新一轮的应用爆发，为行业和用户带来更多新的能力与服务，推动 AI 大模型的场景落地。

目前，面壁智能大模型技术已为数百家企业提供商用服务，覆盖金融、商业、工业、医疗、教育、法律、媒体等多个行业和领域。未来，面壁智能将坚持通过领先的基础模型和高效易用的 Agent 技术与产品应用，打造清晰的 AI 大模型场景化落地路径，为千行百业的可持续发展打造源源不断的新价值高地。

面壁智能打造首个“大模型+Agent” SaaS级产品ChatDev

SaaS版ChatDev：最快3分钟搞定软件开发

超强模型能力提升，助推“大模型+Agent”生产力跃迁