LucaVirus – 阿里开源的病毒基础大模型

AI工具2天前发布
4 0

LucaVirus是什么

LucaVirus 是阿里巴巴云 LucaGroup 研发的专为病毒设计的统一核酸 – 蛋白质语言模型。在 254 亿个核苷酸和氨基酸标记上训练,涵盖几乎所有已知病毒。模型可学习核苷酸和氨基酸序列间的关系等生物学上有意义的表示,基于此开发的下游模型能应对病毒学关键挑战,如识别基因组“暗物质”中的病毒、表征未知蛋白质酶活性、预测病毒进化能力、发现针对新病毒的抗体药物等,在相关任务上表现出色。其蛋白质嵌入能高分辨率区分蛋白质家族,嵌入距离与遗传距离相关性强,进化信息丰富,在抗体 – 抗原结合预测上性能优异,准确率等指标超过现有模型和基于结构的预测方法。

LucaVirus – 阿里开源的病毒基础大模型

LucaVirus的主要功能

  • 病毒发现:能识别隐藏在基因组“暗物质”中的病毒,帮助科学家在复杂的基因组数据中发现新的病毒序列,拓展对病毒种类的认知。

© 版权声明

相关文章