盘古大模型究竟是什么? 盘古大模型是什么

李盛

1、2021年4月,华为云发布盘古系列超大规模预训练模型,包括30亿参数的全球最大视觉(CV)预训练模型之一,以及与循环智能、鹏城实验室联合开发的千亿参数、40TB训练数据的全球最大中文语言(NLP)预训练模型。后续,华为云还将陆续发布多模态、科学计算等多领域预训练模型。

2、盘古的设计有三个核心准则:其一,超大神经网络,可以吸收海量的数据;其二,强壮的网络架构,能达到性能的极致;其三,优秀泛化能力,让全场景覆盖率达到10倍以上,达到全能冠军。