有了它,做生信分析更容易了

我们一般做数据挖掘时都是通过BLAST或其它相似工具在数据库中寻找大量相似的序列,然而因为搜索得到的序列结果与数据库中的主题序列存在部分匹配,大大增加我们翻译、解释这些结果的难度。

在今年7月来自捷克的Schwarz课题组在Frontiers in Genetics发表了著作,他们开发了rboAnalyzer软件,主要针对非编码RNA,以自动化工作流程取代手动工作,可有助于解释序列搜索结果。

这是rboAnalyzer 的操作流程图:

(图片来自于:

https://doi.org/10.3389/fgene.2020.00675)

rboAnalyzer 软件操作步骤简单地分为三步

1) 把部分匹配扩展到其可能的全长序列。

2) 识别主题RNA的同源性。

3) 预测二级结构。

所有信息都会集合到HTML输出里。

rboAnalyzer 在Linux系统上运行,利用具有Biopython、NumPy、Pandas、matplotlib和Jinja2的Bash和Python 3操作。

Schwarz课题组用该软件对放线菌的分歧杆菌ms1 RNA的同源性分析做了示范,你看:

(图片来自于

https://doi.org/10.3389/fgene.2020.00675)

他们选取3个不同质量的高分值片段对HSP,图5A代表的是高质量HSP,HSP 覆盖了查询序列的很大一部分,但间隙相对较少,表明查询序列与主题RNA具有很强的相似性,从而表明它们的同源性。高序列相似性导致精确扩展的全匹配,使得能够预测由 Turbofold 和 rfam-Rc 预测最好表示的准确二级结构。

图5B代表的是同源性RNA,5C代表的是非同源性RNA。rboAnalyzer 软件能够准确地识别同源性。事实上,ms1 RNA是个唯一的细菌RNA,而非同源性HSP的存在于真核细胞。

? END ?

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年7月6日
下一篇 2020年7月6日

相关推荐