个人简介:
读研时候使用了上百种生信软件/数据库,主要工作就是评估生信软件,靠比比软件就发了paper毕业了。
本期评测软件:xHLA;
Fast and accurate HLA typing from short-read next-generation sequence data with xHLA 发表期刊:PNAS; 发表时间: 2017年; 单位: humanlongevity公司;
作者: 通讯是生物界大佬、科学狂人,J. Craig Venter,学生物必然都认识,在PNAS一般也就挂名。一作Chao Xie是humanlongevity公司的研究员。在github上,我们可以看到一个论文作者上没有在论文上署名的大佬,Haibao Tang(百度百科)是植物学和基因组学的大佬,看起来也是顺手搞了搞免疫学的软件。。
论文地址:http://www.pnas.org/content/114/30/8059
Github源码:[https://github.com/humanlongevity/HLA] (https://github.com/humanlongevity/HLA)
软件简介:从二代测序数据快速获得个人的HLA型的生信软件。
生物学背景:
HLA是编码人类主要组织相容性复合体(MHC)的基因簇。HLA复合体位于6号染色体短臂上的21.31区(6p21.31),由360万个碱基对组成,是目前已知的人类染色体中基因密度最高,也是多态性最为丰富的区域。不同的HLA型决定了每个病人的免疫特异性,因此,确定个人的HLA型是制定针对个人的精准免疫治疗的必要条件。
满分5分
用户体验:5分。
在Github上,xHLA推荐安装方式为Docker。Docker作为Win, Linux, Mac三系统兼容软件,不存在系统兼容的瓶颈,并且在Win和Mac上安装非常简单(Docker安装教程)。安装好Docker后,软件安装命令如下:
docker pull humanlongevity/hla
稍等片刻便完成安装。
如果实在不喜欢Docker,或者喜欢从源码编译,命令如下:
cd docker
make build
make deploy
xHLA的安装可以说是生信软件中非常快的。而使用xHLA依旧非常方便。命令如下:
docker run -v `pwd`:`pwd` -w `pwd` humanlongevity/hla \
--sample_id test --input_bam_path tests/test.bam \
--output_path test
对于常规WES数据基本一次成功。
综上,xHLA在用户体验上可谓满分。
软件功能:4.5分。
软件流程功能示意图:
HLA分型是一个比较直接基础的任务,并没有太过复杂的流程。xHLA软件处理常规GATK流程的BAM文件无任何问题,速度和性能上也不错,占用资源较多,但是也可以用Docker自身命令去根据所用电脑去限制。
xHLA有一个小小的缺陷,在软件Github的README中也有提到,即只支持hg38,并且是没有contigs的genome,对于其他的hg38的reference genome会报错。官方给了一个shell脚本用于处理其他的hg38genome回帖的BAM文件的解决方案。但是在实际测试中,个人在用华大的hg38(UCSC)版的测序结果用shell脚本也会报错。解决方案为:
(1) 手动调整reference重新mapping
(2)用其他软件(比如很老的polysolver)
这意味着很多直接从科研服务公司取得BAM原始文件和分析文件的科研用户不一定能使用这个软件。
由于这个软件很好装,也很好跑,就算不能用时间也花很少,因此此处评分4.5。
领域创新:无法评价。
HLA typing功能很基础,可选的生信软件其实很多。比如综述:Comparison of exome-based HLA class I genotyping tools: identification of platform-specific genotyping errors,总结了大概过去的七八个软件,功能都一样,准确性上略有差别。
xHLA原文中benchmark了其算法准确性很高,然而非第三方benchmark可信程度有待检验。并且个人并不擅长HLA领域的算法,只是一个软件使用用户,对于这个基本功能,好用、结果准确比软件有多创新可能更为实际。
小结:
xHLA 软件是两位国人大佬创作的HLA分型的优秀作品,安装和使用皆很方便,软件也很新,对于有此需求的生信用户值得一试。
沙湿兄评软件持续更新中~ 欢迎大家拍砖指正错误~ 也欢迎大家提出最新生信软件/数据库评测需求~
附:个人软件比较工作