重磅发布!“大模型+Agent” AI 原生应用来了!
依托强大的基座模型和创新研发的 AI Agents 技术,面壁智能正式推出基于群体智能的AI原生应用——“面壁智能 ChatDev”智能软件开发平台。
ChatDev 申请试用地址:https://chatdev.modelbest.cn
与此同时,面壁智能也将其CPM系列基座模型升级为全新一代千亿参数大模型“面壁智能 CPM-Cricket ”,带来更强劲的逻辑推理和语言理解等能力,为“大模型+Agent”落地应用提供基础保障。
经权威测试,CPM-Cricket 在逻辑、代码、知识、语言、安全性等方面全面超越 LLaMA2。在公考行测和 GMAT 试题的测试表现中,其核心能力与 GPT-4 相当。
不到两月星标超 1.6 万,屡次登顶 GitHub Trending,并创造出“用一杯可乐的时间和钱开发一款软件”的智能生产力神话,这是“ChatDev 智能体协作开发框架“自开源以来取得的耀眼成绩,持续引爆国内外软件开发和创业者社区的关注和热议。
在此期间,面壁智能产研团队快速响应构建面向用户实际需求的应用原型,首次提出并打造出基于“大模型+Agent”技术能力的应用平台,将 ChatDev 产品化,以 SaaS 服务的形式面向广大用户开放。
SaaS 版 ChatDev 将原始版本的核心能力浓缩成一个更加简洁高效、应用门槛更低的可视化交互平台,即便没有编程经验的普通用户,也能轻松使用。此外,面壁智能还对其流程进行了优化升级,正式发布版本将带来更高的运行效率。
只需三步走,即可实现软件开发革新:
➤ 第一步
登录后,用户只需输入项目名称,进行简单设置,并通过“自定义链”定义公司中的角色、工作流程,就可以启动开发工作。
➤ 第二步
在收到用户的软件需求指令后,ChatDev 中的智能体们就会根据各自的角色各司其事、统一协作,如同现实世界中软件公司工作情景真实上演。
➤ 第三步
最快 3 分钟,ChatDev 就能生成可直接运行的应用程序。从“红包雨”这种颇受大众欢迎的营销神器,到“电子名片生成器”这类实用的商务工具,再到“五子棋”、“贪吃蛇”、“太空大战”等各种休闲小游戏……ChatDev 实现了“1 个人+多个 AI Agents”的革新软件开发模式。
SaaS 版本 ChatDev 的推出真正建立起大模型与应用的创新闭环,形成“数据飞轮”,促进平台功能持续迭代,推动 AI Agent 技术广泛应用。
大模型作为当今科技界“顶流”,如何改变生产方式、提高生产力,进而为社会经济带来真正价值,才是其迷人之处。
面壁智能希望以“大模型 + Agent”战略,布局大模型技术应用之路,不断打造高价值产品系列,驱动新一轮AI原生应用的爆发,迎接 AGI 时代的到来。
然而,应用的创新离不开基础模型能力的提升,面壁智能在基座模型方面也在持续攻坚,不断为产品和应用输送强劲的基础能力保障。
根据在 HumanEval、C-Eval、MMLU、MBPP、CMMLU、BBH 等权威 LLM 评测集的结果,CPM-Cricket 在逻辑、代码、知识、语言、安全性等方面已全面超越 LLaMA2。
伴随 CPM-Cricket 的推出,面壁智能基于 CPM 的多模态智能对话助手「面壁露卡Luca」也在快速成长,升级为 3.0 版本,其逻辑推理能力较首次发布提升了 163.9%,综合能力提升 61.5%。近期,Luca 也已正式面向公众开放服务。
为了测试模型的逻辑推理和语言理解在实践中的真实表现,面壁智能给 Luca 进行了公考行测能力测评。
结果显示,在包括常识判断、数量关系、资料分析、判断推理、语言理解与表达等多种题型的 425 道试题中,Luca 的总成绩表现优异,综合能力与 GPT-4 相当,在判断推理题目的正确率方面优于 GPT-4。
为了考察 Luca 的全面性,面壁智能还对其进行了英文的 GMAT 模拟测试。结果显示,Luca 在英文环境中的阅读理解和逻辑推理方面与 GPT-4 能力接近。
模型能力的提升取决于底层研发技术的综合实力。面壁智能探索出更为低成本、高效率的模型训练方法,让大模型不仅能 “训出来”,还能 “训得好”、“用起来”。
作为国内最早开展大模型研发的公司之一,面壁智能团队不仅早在 2020 年就发布了国内首个中文大语言模型 CPM-1,同时也是最早在 AI Agent 技术取得突破的大模型公司之一。2023 年 5 月,面壁智能就陆续推出并开源了 AI Agent “三驾马车”:AgentVerse、ChatDev、XAgent。
通过这些智能体的连接,我们会进入一个全新的 Internet of Agents(IoA) 时代。正如面壁智能的愿景“智周万物”,AI Agent 不仅能够创造新的交互方式,还将带来生产力的跃迁,为行业和用户带来更多想象空间,彻底改变人与人、人与物、物与物的万物交互方式。
ChatDev 产品版本的发布展现并验证了“大模型+Agent”赋能生产力提升和创新交互体验的清晰路径。然而其应用场景绝不局限于软件开发领域,它还可以是拟人的原生智能体,也可以是现实中的人和物的数字孪生智能体。
面壁智能联合创始人、CEO 李大海表示,“大模型+Agent”将会引起新一轮的应用爆发,为行业和用户带来更多新的能力与服务,推动 AI 大模型的场景落地。