原创大模型时代的AI之变与开发之根

原标题：大模型时代的AI之变与开发之根

自2018年谷歌发布Bert以来，预训练大模型以强大的算法效果，席卷了NLP为代表的各大AI榜单与测试数据集。随着产学研各界的深入研究，大模型在AI产学研各界的地位得到不断加强。到2021年，我们可以看到各大学术机构、科技企业都在打造自己的大模型，并且将其能力边界、技术路径进行了极大拓展。

有人认为，AI大模型的到来让这项技术完成了从实验室到工业化集成的转变。如果说过去的AI开发需要手工作坊模式的调参、调优、数据积累，那么大模型则预先集成了海量数据的训练效果，企业与科研用户拿到手中就是一个“智力”强大、效果客观的完成品。于是极大程度节省了重复开发成本，降低了开发门槛。

大模型的价值涌现出来，下一个问题随之诞生：打造大模型需要人工智能算力、网络、框架等一系列条件形成有效支撑，才能让大模型真正“大”起来。大模型能够持续发展的前提，是必须打造强壮的AI根技术，在框架、算力等层面满足大模型的“建造”需求。

不久之前，中科院自动化所发布了全球首个三模态大模型——紫东.太初。

而这项技术成果的背后，是中科院自动化所与华为携手，利用全场景AI框架MindSpore对大模型开发进行了一系列支撑。9月25日，在华为全联接2021上，MindSpore中文名“昇思”发布，同时推出昇思1.5版本。这一版本强化全场景能力、原生支持大模型，并新增AI科学计算新范式，发布电磁仿真套件和分子模拟套件，促进AI应用于科学计算领域。

展开全文

不久之前，中科院自动化所发布了全球首个三模态大模型——紫东.太初。

责任编辑：

Thenews.cc

每日头条

时事新闻兴趣百科

原创大模型时代的AI之变与开发之根