網站首頁 編程語言 正文
GATK 變異分析
對于大數據樣本可能會比較慢,因此可以按照染色體拆分后進行多線程并行計算。
下面是我寫的一個python多線程腳本,僅供參考,拙劣之處敬請指正。
#!/usr/bin/python3
import _thread
import os
import threading
import time
muthreads=[]
bam_file="a.mkdup.bam"
out_file_prefix="flower"
chr_list=["CHR01","CHR02","CHR03","CHR04","CHR05","CHR06","CHR07","CHR08","CHR09","CHR10","CHR11","CHR12","CHR13"]
for chr in chr_list:
threads_comonder_name= "gatk HaplotypeCaller --intervals " + chr +" -R /mnt/j/BSA/02-read-align/Tifrunner2.fasta -I " + bam_file + " -ERC GVCF -O "+ out_file_prefix +"-"+chr+".erc.g.vcf"
muthreads.append(threads_comonder_name)
exitFlag = 0
class myThread (threading.Thread):
def __init__(self, threadID, name, counter, comander):
threading.Thread.__init__(self)
self.threadID = threadID
self.name = name
self.counter = counter
self.comander = comander
def run(self):
print ("開始線程:" + self.name)
print_time(self.name, self.counter, 5, self.comander)
print ("退出線程:" + self.name)
def print_time(threadName, delay, counter,comander):
# while counter:
if exitFlag:
threadName.exit()
time.sleep(delay)
print(comander)
os.system(comander)#調用操作系統命令行處理數據
# counter -= 1
# 創建新線程
threadlist=[]
for i, threadsnu in enumerate(muthreads[0:11]):
print(i)
print(threadsnu)
threadsnew=myThread(1, "Thread-" + str(i), 2, threadsnu)
threadlist.append(threadsnew)
# 開啟新線程
for threads in threadlist:
threads.start()
for threads in threadlist:
threads.join()
print ("運行結束退出主線程")
下面的來自網絡未驗證
多條染色體的同樣本的vcf文件合并
# for i in {1..22} X Y ;do echo "-I final_chr$i.vcf" '\';done
# for i in {10..19} {1..9} M X Y ;do echo "-I final_chr$i.vcf" '\';done
module load java/1.8.0_91
GATK=/home/jianmingzeng/biosoft/GATK/gatk-4.0.3.0/gatk
$GATK GatherVcfs \
-I final_chr1.vcf \
-I final_chr2.vcf \
-I final_chr3.vcf \
-I final_chr4.vcf \
-I final_chr5.vcf \
-I final_chr6.vcf \
-I final_chr7.vcf \
-I final_chr8.vcf \
-I final_chr9.vcf \
-I final_chr10.vcf \
-I final_chr11.vcf \
-I final_chr12.vcf \
-I final_chr13.vcf \
-I final_chr14.vcf \
-I final_chr15.vcf \
-I final_chr16.vcf \
-I final_chr17.vcf \
-I final_chr18.vcf \
-I final_chr19.vcf \
-I final_chr20.vcf \
-I final_chr21.vcf \
-I final_chr22.vcf \
-I final_chrX.vcf \
-I final_chrY.vcf \
-O merge.vcf
合并的時候需要注意,vcf文件的順序跟每個vcf文件里面頭文件順序是相同的。
原文鏈接:https://www.jianshu.com/p/b5fff4d47474
- 上一篇:C++深入講解函數重載_C 語言
- 下一篇:C++深入淺出講解缺省參數_C 語言
相關推薦
- 2023-10-09 對Uni-app進行原生開發
- 2022-05-05 R語言因子類型的實現_R語言
- 2022-08-14 python中matplotlib調整圖例位置的方法實例_python
- 2022-11-12 docker修改容器內存大小的實現方式_docker
- 2023-10-12 React實現Tab欄切換
- 2023-03-23 Python?eval()與exec()函數使用介紹_python
- 2022-10-31 Python+Selenium實現網站滑塊拖動操作_python
- 2022-04-24 解決redis在linux上的部署的問題_Redis
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支