OpenBMB:构建技术创新生态,降低大模型使用门槛

作者:modelbest
2024-01-16 15:36:38

较早前,诗人、艺术家和学者经常聚集在一起,进行文艺创作和学术讨论,这样的集会称为“雅集”;古希腊有各种学派,如柏拉图的学园和亚里士多德的吕克昂学园,这些地方是思想交流和哲学讨论的中心;在中国,书院是传授知识和学术讨论的地方,学者和学生们聚集于此,共同研究儒家经典和各种学问。

而如今,技术交流很大程度上已经转移到线上,开源技术社区就是其中一个重要的平台,通过这些线上平台,技术社区的成员可以无视地理界限,随时随地共享知识、解决问题、展示成果与协同合作。

2023 年 12 月,以“科技文化共创美好生活”为主题的首届 751 科技文化节在北京盛大开幕。面壁智能副总裁、OpenBMB 开源社区联合发起人贾超受邀参加并发表主题演讲,分享 OpenBMB 在大模型驱动的 AI Agent(智能体)技术方向的创新成果与生态构建思路,得到本届文化节中大模型与 Agent 技术开发者、用户的热情关注与赞誉。

OpenBMB,全称“Open Lab for Big Model Base”,是由面壁智能联合清华大学 THUNLP 实验室共同支持发起的大模型开源社区。社区核心使命是打造大规模预训练语言模型库与相关生产力技术、工具,旨在降低大模型使用门槛,推动技术的标准化、普及化和实用化,通过这一努力,OpenBMB 力图推动大模型技术不仅局限于专业领域,而是普及到每一个角落,成为普通人生活中不可或缺的一部分。

自成立以来,面壁智能联合清华大学 THUNLP 实验室在 OpenBMB 社区陆续开源了一系列世界顶级科研成果和创新技术范式,其中包括面壁智能自研的一整套“大模型全流程优化加速平台”。该平台集合了大模型高效训练框架 BMTrain、高效推理框架 BMInf、高效压缩框架 BMCook,以及各种高效微调框架工具包,可针对大模型的“生产”环节进行降本提效,如模型训练成本节省 90%,推理速度提升 10 倍以上等。

OpenBMB工具架构

不仅如此,伴随大模型技术的极速发展,学术和产业届都在持续探索其落地应用的潜力和价值机会。人们逐渐认识到,以大模型驱动的 AI Agent 拥有更为广阔的想象与创新空间。在这一领域,面壁智能与清华大学的研究团队走在前沿,自今年6月以来,陆续联合推出包括 AgentVerse、XAgent、ChatDev 等在内的一系列 AI Agent 创新成果,并在 OpenBMB 社区开源,赢得众多开发者的认可,这些成果不仅标志着新技术的突破,也为探索AI在更多领域的应用开启了更多新可能。

致力于成为学术界、产业界与开发者之间的关键纽带和平台,OpenBMB 携手面壁智能与清华大学THUNLP实验室共同构建了一个以企业为核心,学术研究和社区支持为双翼的创新生态系统。迄今为止,OpenBMB 开源社区已吸引超过 4 万关注者,其在 GitHub 的开源项目更是累积了超过 4.8 万的星标。

2023 年 11 月,OpenBMB 开源的两个大规模、高质量微调数据集 UltraFeedbackUltraChat还得到了 NLP 大牛、HuggingFace 联合创始人 Thomas Wolf 的点赞,称通过其训练出来的模型能力非常强大。

过去一年里,OpenBMB 成功吸引了清华大学、北京航空航天大学等十余所顶尖高校的优秀开发者加入,并赢得了全球大模型领域顶级技术团队和人才的广泛关注与合作。通过定期举办学术分享会,OpenBMB 正在构建一个创新、开放、共建的大模型技术生态系统。

正如贾超在演讲最后所号召,无论你正在研究大模型、开发其应用,还是对大模型技术抱有浓厚兴趣,都欢迎使用 OpenBMB 开源技术、工具和模型库。我们诚邀志同道合的你加入,共同为大模型应用落地添砖加瓦,早日让大模型飞入千家万户,这正如面壁智能公司创办的初心。