面壁智能打造首个“大模型+Agent” SaaS级产品ChatDev

作者:modelbest
2024-01-16 11:01:32

重磅发布!“大模型+Agent” AI 原生应用来了!

依托强大的基座模型和创新研发的 AI Agents 技术,面壁智能正式推出基于群体智能的AI原生应用——“面壁智能 ChatDev”智能软件开发平台。

这是业内首次将 AI Agents 群体智能协作技术应用于软件开发的 SaaS 平台产品,也是让软件开发者和创新创业者 极低的成本和门槛高效完成软件开发工作 的开端。

ChatDev 申请试用地址:https://chatdev.modelbest.cn

与此同时,面壁智能也将其CPM系列基座模型升级为全新一代千亿参数大模型“面壁智能 CPM-Cricket ”,带来更强劲的逻辑推理和语言理解等能力,为“大模型+Agent”落地应用提供基础保障。

经权威测试,CPM-Cricket 在逻辑、代码、知识、语言、安全性等方面全面超越 LLaMA2。在公考行测和 GMAT 试题的测试表现中,其核心能力与 GPT-4 相当。

SaaS版ChatDev:最快3分钟搞定软件开发

不到两月星标超 1.6 万,屡次登顶 GitHub Trending,并创造出“用一杯可乐的时间和钱开发一款软件”的智能生产力神话,这是“ChatDev 智能体协作开发框架“自开源以来取得的耀眼成绩,持续引爆国内外软件开发和创业者社区的关注和热议。

在此期间,面壁智能产研团队快速响应构建面向用户实际需求的应用原型,首次提出并打造出基于“大模型+Agent”技术能力的应用平台,将 ChatDev 产品化,以 SaaS 服务的形式面向广大用户开放。

SaaS 版 ChatDev 将原始版本的核心能力浓缩成一个更加简洁高效、应用门槛更低的可视化交互平台,即便没有编程经验的普通用户,也能轻松使用。此外,面壁智能还对其流程进行了优化升级,正式发布版本将带来更高的运行效率。

只需三步走,即可实现软件开发革新:

 ➤  第一步 

登录后,用户只需输入项目名称,进行简单设置,并通过“自定义链”定义公司中的角色、工作流程,就可以启动开发工作。

 ➤  第二步 

在收到用户的软件需求指令后,ChatDev 中的智能体们就会根据各自的角色各司其事、统一协作,如同现实世界中软件公司工作情景真实上演。

 ➤ 第三步 

最快 3 分钟,ChatDev 就能生成可直接运行的应用程序。从“红包雨”这种颇受大众欢迎的营销神器,到“电子名片生成器”这类实用的商务工具,再到“五子棋”、“贪吃蛇”、“太空大战”等各种休闲小游戏……ChatDev 实现了“1 个人+多个 AI Agents”的革新软件开发模式。

ChatDev 软件开发平台究竟哪里好?🤔
  • 效率高:无需进行专业复杂的 prompt 探索,只需简单的需求说明就能后台自动完成整套工作流,让软件开发“降本提效”。
  • 可共创:用户不仅可以通过上帝视角监督开发过程,还能直接和智能体 “人机共创”,让软件开发“一步到位”。
  • 定制化:用户可根据个人喜好,增加、删除、调换、改变部分功能与设计,让软件开发实现“私人订制”。

SaaS 版本 ChatDev 的推出真正建立起大模型与应用的创新闭环,形成“数据飞轮”,促进平台功能持续迭代,推动 AI Agent 技术广泛应用。

超强模型能力提升,助推“大模型+Agent”生产力跃迁

大模型作为当今科技界“顶流”,如何改变生产方式、提高生产力,进而为社会经济带来真正价值,才是其迷人之处。

面壁智能希望以“大模型 + Agent”战略,布局大模型技术应用之路,不断打造高价值产品系列,驱动新一轮AI原生应用的爆发,迎接 AGI 时代的到来。

然而,应用的创新离不开基础模型能力的提升,面壁智能在基座模型方面也在持续攻坚,不断为产品和应用输送强劲的基础能力保障。

本次全新升级的 CPM-Cricket 是继 CPM-Ant、CPM-Bee 之后的第三代基座模型,在逻辑、代码、知识、指令理解等方面均有大幅提升。

根据在 HumanEval、C-Eval、MMLU、MBPP、CMMLU、BBH 等权威 LLM 评测集的结果,CPM-Cricket 在逻辑、代码、知识、语言、安全性等方面已全面超越 LLaMA2。

伴随 CPM-Cricket 的推出,面壁智能基于 CPM 的多模态智能对话助手「面壁露卡Luca」也在快速成长,升级为 3.0 版本,其逻辑推理能力较首次发布提升了 163.9%,综合能力提升 61.5%。近期,Luca 也已正式面向公众开放服务。

为了测试模型的逻辑推理和语言理解在实践中的真实表现,面壁智能给 Luca 进行了公考行测能力测评。

结果显示,在包括常识判断、数量关系、资料分析、判断推理、语言理解与表达等多种题型的 425 道试题中,Luca 的总成绩表现优异,综合能力与 GPT-4 相当,在判断推理题目的正确率方面优于 GPT-4。

 

为了考察 Luca 的全面性,面壁智能还对其进行了英文的 GMAT 模拟测试。结果显示,Luca 在英文环境中的阅读理解和逻辑推理方面与 GPT-4 能力接近。

模型能力的提升取决于底层研发技术的综合实力。面壁智能探索出更为低成本、高效率的模型训练方法,让大模型不仅能 “训出来”,还能 “训得好”、“用起来”。

为此,面壁智能构建了一整套大模型创新研发体系,包括自研的高效训练框架、高效推理框架,大模型压缩工具,以及增量微调、指令微调、提示学习工具包等。此外,面壁智能还原创打造出大模型工具学习引擎,并已集成超过 16000 多个真实 API,可实现一键接入,调用工具解决更多复杂任务。不仅如此,面壁智能还部署了 Int8 量化模型,让模型推理成本降低 50%。

 

 

作为国内最早开展大模型研发的公司之一,面壁智能团队不仅早在 2020 年就发布了国内首个中文大语言模型 CPM-1,同时也是最早在 AI Agent 技术取得突破的大模型公司之一。2023 年 5 月,面壁智能就陆续推出并开源了 AI Agent “三驾马车”:AgentVerse、ChatDev、XAgent。

通过这些智能体的连接,我们会进入一个全新的 Internet of Agents(IoA) 时代。正如面壁智能的愿景“智周万物”,AI Agent 不仅能够创造新的交互方式,还将带来生产力的跃迁,为行业和用户带来更多想象空间,彻底改变人与人、人与物、物与物的万物交互方式。

ChatDev 产品版本的发布展现并验证了“大模型+Agent”赋能生产力提升和创新交互体验的清晰路径。然而其应用场景绝不局限于软件开发领域,它还可以是拟人的原生智能体,也可以是现实中的人和物的数字孪生智能体。

面壁智能联合创始人、CEO 李大海表示,“大模型+Agent”将会引起新一轮的应用爆发,为行业和用户带来更多新的能力与服务,推动 AI 大模型的场景落地。

目前,面壁智能大模型技术已为数百家企业提供商用服务,覆盖金融、商业、工业、医疗、教育、法律、媒体等多个行业和领域。未来,面壁智能将坚持通过领先的基础模型和高效易用的 Agent 技术与产品应用,打造清晰的 AI 大模型场景化落地路径,为千行百业的可持续发展打造源源不断的新价值高地。