6月26日,谷歌DeepMind官方博客发布博文,宣布推出AlphaGenome模型,这一全新的人工智能工具能够在多种基因调控过程中更全面、更精准地预测人类DNA序列中的单个变异或突变的影响。该模型计划通过API预览版向全球科研界开放使用。
AlphaGenome的独特之处在于其强大的处理能力和预测精度。该模型能够处理长达100万碱基对的DNA序列,并预测数千个与基因调控相关的分子特征,从而全面表征其功能特性。通过对比突变序列和未突变序列的预测结果,AlphaGenome能够准确评估遗传变异或突变对生物学功能的影响。
在训练过程中,AlphaGenome采用了来自多个大型公共联盟的数据,包括ENCODE、GTEx、4D Nucleome和FANTOM5等。这些数据涵盖了数百种人类和小鼠细胞类型及组织的基因调控模式,为模型提供了丰富的学习材料。
技术方面,AlphaGenome采用了多层神经网络结构:卷积层用于识别基因组序列中的短距离模式,变压器架构负责处理序列中各个位置的信息交互,而后续的输出层则将这些模式转化为对不同分子特征的预测。
AlphaGenome具有四大显著优势。首先,它能够处理长达100万碱基对的超长DNA序列,并实现单碱基分辨率的精准预测;其次,该模型能够同时预测多种基因调控模式;再次,其高效的突变评估能力为研究者提供了有力工具;最后,AlphaGenome还是首个成功建模剪接位点的AI系统。
这一创新工具在疾病机制研究、合成生物学和基础科研等领域展现出广阔的应用前景。尽管AlphaGenome已经取得显著技术突破,但在准确捕捉远端调控元件的影响等复杂问题上仍面临挑战,这为未来的优化方向提供了重要启示。
© 版权声明
文章版权归作者所有,未经允许请勿转载。