新聞中心
NEWS
三代測序在病毒基因組測序中已有較出色的表現(xiàn),但準確率方面還需進一步的提升。盡管現(xiàn)有的Polish工具取得了令人滿意的結果,但仍有改進糾錯性能的空間,以實現(xiàn)更精確的基因組組裝。
本文介紹一款在病毒RNA編碼區(qū)的Polish軟件,可對已知RNA病毒組裝前和組裝后的序列進行Polish。軟件文章HMMPolish:a coding region polishing tool for TGS-sequenced RNA viruses發(fā)表在Briefings in Bioinformatics (IF=9.5)上,可下載閱讀。
軟件安裝
該軟件需要安裝以下依賴軟件:
Biopython:conda install conda-forge::biopython
HMMER:conda install bioconda::hmmer
pandas:conda install conda-forge::pandas
上述軟件安裝完成后,安裝HMMPolish,這里直接下載即可:
git clone--recursive https://github.com/rainyrubyzhou/HMMPolish HMMPolish
cd HMMPolish/src
python HMMPolish.py -h
下載過程中可能遇到“Empty reply from server”等字樣,不用擔心,多試幾次就好了!
python HMMPolish.py –h后出現(xiàn)幫助文檔信息,表明軟件完成安裝,可以正常使用。
軟件使用
01
軟件運行環(huán)境
需要在python3.0以上,經過嘗試在python2.7中無法使用。
02
找到示例數(shù)據(jù)
位于HMMPolish/src/test目錄中。
03
運行命令
python HMMPolish.py--read test/test_noro.fa--seed test/canu_ass.fa –hmm test/7_noro_profile.hmm -o polished.fa
polished.fa的文件即為編碼區(qū)域polish之后的文件。
04
參數(shù)詳解
--read:輸入的reads文件;
--seed:可以是組裝軟件組裝出來的序列,也可以是原始的序列;
--hmm:.hmm格式的配置文件。
軟件優(yōu)勢
與多個Polish軟件進行對比時,還是展現(xiàn)出較好的糾錯能力[1],如果大家感興趣,可以在自己的科學研究中進行嘗試。此外,該軟件也有一定的局限性,目前只能應用在部分已知的病毒中。
參考文獻
[1] Yu R, Abdullah SMU, Sun Y. HMMPolish: a coding region polishing tool for TGS-sequenced RNA viruses. Brief Bioinform. 2023 Sep 20;24(5):bbad264.