近两年特别是2022年以来最激动人心的科技突破应该是:谷歌旗下的一间公司釆用人工智能方法开发系统工具AlphaFold,短期内把人类数以万计的蛋白质3D结构大多测定清楚存入数据库!这将对精准药品开发及基础科学研究带来全新的革命!
过去人工方式十分耗时,一个实验室一年完不成几种蛋白质结构的测定,并且使用的高端冷冻电镜十分昂贵,动则造价几千万美元!这类研究结果通常可以直接发到Nature,Science等顶尖期刊的正刊!成就了不少结构生物学家的名望。
人工智能AI设备运行最大特质是对人类智慧加以模拟和综合推理。一台AI机器人能够与冠军棋手对奕并轻松取胜,原理不难理解: 因为AI机器人可以根据对手初始出棋风格及方式准确推理出之后的棋路,这好比打桥牌,对方全程偷看底牌你还不输么?同样的原理,一个大于1000 KDa的蛋白质大分子,谷歌的AlphaFold系统根据其起始片段的排列规则自动推算出整个蛋白质的四级空间结构,并且与人工测定的结果基本无异!
以上所述并非离题,人工智能如此的“无所不能”,在基础科学及各个应用领域的研究发展不断取得成功!而AI技术应用于生物分类起步也不晚,早期开发的Java软件包就可以对上万种哺乳动物进行分类识别,而完整人工智能分类(AI分类)功能则要深刻得太多,特别是对那些微小或细微类群如昆虫等节肢动物。
笔者根据现有的资料及发展趋势对未来AI分类应用可以作出大胆分析和推断。
AI分类将通过对形态特征全方位扫描并同时对DNA甚至某些蛋白质及酶类的测定,以所谓integrated taxonomy方法进行综合运算推理得出生物种类鉴定结果,这种鉴定结果包含的信息也将更加全面和深刻。除了名称之外,物种近缘关系,分布地理,珍稀度,甚至群落特证生态作用等等等,当然也将包括物种的DNA, 蛋白质种类及结构信息,快速而精准!
AI分类应该通过智能机器人来实现,包括一个物种标本安放装置以利对其多方位特征进行扫描及识别。而DNA,蛋白质等大分子分析的取样及测定也完全可以在同一台机器上完成。科学发展一旦获得理论上的重大突破,尖端设备的设计及制造总是在较短时期内得到完善。硬件的开发,初始性研究已取得成果,由德国自动化专家联合意大利及新加坡生物学者共同在 Molecular Ecology Resources发表 “Diversity Scanner: Robotic discovery of small invertebrates with machine learning methods”一文,那是非常有意义的研究进展!
AI分类当然应该包括类似谷歌的AlphaFold系统,更包括生物地理区系及涉及全球全部已知物种资料的数据库。最初的应用有所局限,综合标本形态扫描及DNA,蛋白质等分子测定,然后与全球已知物种数据库进行对比分析可以得到是或者不是哪一个物种的结果,并在应用中使物种数据库信息更加完善。
很显然,任何人工智能的发展离不开人类本身的初始性工作。自18世纪林奈氏创立生物双名法起,过去250多年间共描述了大约180多万个物种(包括动物,植物及微生物),由过去250多年的积累组建的超庞大数据库将是未来AI分类的基础。这一数据库的综合组建及使用将涉及非常复杂的版权等法律问题,可能需要生物物种方面的多个国际性机构协作协调。
特别需要提示的是,以上所述之AI分类仅仅是对所获标本的鉴定与分析。如何更加有效地从野外调查获取未知生物多样性种类实物更加重要!当然人工智能运用于野外调查与釆集也在同步研究与发展。最近开发的标本釆集无人机,利用昆虫假死性通过碰触枝叶有效釆获活动于高大树木上的种类,智能遥感技术应用于野外生物多样性调查也已经取得很大进展。人工智能技术已介入生物分类研究的每一个环节,人类对地球生物多样性的调查及认识将进入一个新的阶段!
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!