西安交大的叶凯团队在基因注释上，整出了个新法子，这事儿最近在西安交通大学传开了。

话说西安交大的叶凯团队在基因注释上，整出了个新法子，这事儿最近在西安交通大学传开了。大伙都知道，基因注释就是把测出的基因组变成读懂的基因组的那个关键环节，现在国际上的数据量这么大，谁要是能把这一步做好，以后搞功能研究和应用转化就顺溜多了。以前咱们做基因注释，都得靠RNA测序或者同源蛋白这些外部证据，这就导致数据需求量大、算起来费劲，而且要是碰到数据少的物种根本没法搞。叶凯他们这次就想了个招儿，提出了一个叫ANNEVO的基因组语言模型。这个模型厉害就厉害在它能同时学习不同生物的进化规律和远距离的序列关系。这下好了，只要有DNA序列就行，压根儿不用再费劲去弄那些RNA或者同源蛋白的数据。这可是把国外那帮人给比下去了，咱们终于在这个领域把技术垄断给打破了。不管是保家卫国的生物安全战略，还是AI跟生命科学的交叉融合发展，这事儿都有很大的意义。吕扬记者告诉咱们，叶凯团队其实早就一直在琢磨怎么用人工智能去解读基因组了。这次的成果补上了之前研究链条上的最后一环，不光能识别变异，还能把功能都给标注清楚。现在的大计划里都在用他们这套办法了。