Apertus – 瑞士开源的首个大规模语言模型

AI工具7天前发布
13 0

Apertus是什么

Apertus是瑞士EPFL、ETH Zurich和瑞士国家超级计算中心(CSCS)联合推出的瑞士首个大规模开放、多语言的大型语言模型,有70B和8B两个参数版本,用大规模语言进行训练,其中40%的数据为非英语,包括瑞士德语、罗曼什语等此前在LLM中被低估的语言。Apertus用解码器仅的Transformer架构,基于新的xIELU激活函数和AdEMAMix优化器。模型完全开放,模型权重、数据和训练细节,用户能在自己的服务器上使用,保持数据控制权。

Apertus – 瑞士开源的首个大规模语言模型

Apertus的主要功能

  • 文本生成:根据用户输入的提示生成连贯、相关的文本。

© 版权声明

相关文章