網站首頁編程語言正文

自學python求已知DNA模板的互補DNA序列_python

作者：天明豆豆 ? 更新時間： 2022-08-23 編程語言

DNA序列

ACTGATCGATTACGTATAGTATTTGCTATCATACATATATATCGATGCGTTCAT

求其互補DNA序列。

在生物上DNA互補序列簡述表達可以表示為：A與T，C與G互補，可以理解為將上述序列中現有的A用T代替，C用G代替，T用A代替，G用C代替，則其互補序列為：

TGACTAGCTAATGCATATCATAAACGATAGTATGTATATATAGCTACGCAAGTA

根據上述表述，我可以利用replace（）函數進行替換，將A用T替換，T用A替換，C用G替換，G用C替換，

簡述其代碼

my_dna = "ACTGATCGATTACGTATAGTATTTGCTATCATACATATATATCGATGCGTTCAT"
# replace A with T
sequence1 = my_dna.replace('A', 'T')
# replace T with A
sequence2 = sequence1.replace('T', 'A')
# replace C with G
sequence3 = sequence2.replace('C', 'G')
# replace G with C
sequence4 = sequence3.replace('G', 'C')
# print the result of the final replacement
print(sequence1)
print(sequence2)
print(sequence3)
print(sequence4)

其輸出結果如下：

TCTGTTCGTTTTCGTTTTGTTTTTGCTTTCTTTCTTTTTTTTCGTTGCGTTCTT
ACAGAACGAAAACGAAAAGAAAAAGCAAACAAACAAAAAAAACGAAGCGAACAA
AGAGAAGGAAAAGGAAAAGAAAAAGGAAAGAAAGAAAAAAAAGGAAGGGAAGAA
ACACAACCAAAACCAAAACAAAAACCAAACAAACAAAAAAAACCAACCCAACAA

原始序列上進行替換

顯然結果是不正確的，我們在sequence1到sequence2中就已經出現錯誤，誤把sequence1中A被替換之后變為T的序列，在sequence2中又被替換掉了，因此我們要轉變思路，保持只替換原本的序列，不進行多次替換，避免錯誤，我們可以嘗試每次只在原始序列上進行替換，嘗試代碼如下：

my_dna = "ACTGATCGATTACGTATAGTATTTGCTATCATACATATATATCGATGCGTTCAT"
# replace A with T
sequence = my_dna.replace('A', 'T')
# replace T with A
sequence2 = my_dna.replace('T', 'A')
# replace C with G
sequence3 = my_dna.replace('C', 'G')
# replace G with C
sequence4 = my_dna.replace('G', 'C')
print(sequence1)
print(sequence2)
print(sequence3)
print(sequence4)

其輸出結果如下：

TCTGTTCGTTTTCGTTTTGTTTTTGCTTTCTTTCTTTTTTTTCGTTGCGTTCTT
ACAGAACGAAAACGAAAAGAAAAAGCAAACAAACAAAAAAAACGAAGCGAACAA
AGTGATGGATTAGGTATAGTATTTGGTATGATAGATATATATGGATGGGTTGAT
ACTCATCCATTACCTATACTATTTCCTATCATACATATATATCCATCCCTTCAT

顯然結果也是不正確的，因此，我們要引入中間變量，最后再把它做一個回環，

也就是說引入四個臨時字母，然后每個變換2次，最后把最終結果輸出，其代碼可以為：

my_dna = "ACTGATCGATTACGTATAGTATTTGCTATCATACATATATATCGATGCGTTCAT"
sequence1 = my_dna.replace('A', 'H')
sequence2 = sequence1.replace('T', 'J')
sequence3 = sequence2.replace('C', 'K')
sequence4 = sequence3.replace('G', 'L')
sequence5 = sequence4.replace('H', 'T')
sequence6 = sequence5.replace('J', 'A')
sequence7 = sequence6.replace('K', 'G')
sequence8 = sequence7.replace('L', 'C')
print(sequence8)

其結果為：

TGACTAGCTAATGCATATCATAAACGATAGTATGTATATATAGCTACGCAAGTA

利用upper()輸出大寫結果

至此得到了我們想要的結果，但這種方法顯然是有些復雜了，我們可以利用字符的大小寫來完成我們的工作，也就是利用小寫字母為臨時變量，最終利用upper()輸出大寫的結果就行了，其代碼和結果如下：

my_dna = "ACTGATCGATTACGTATAGTATTTGCTATCATACATATATATCGATGCGTTCAT"
sequence1 = my_dna.replace('A', 't')
print(sequence1)
sequence2 = sequence1.replace('T', 'a')
print(sequence2)
sequence3 = sequence2.replace('C', 'g')
print(sequence3)
sequence4 = sequence3.replace('G', 'c')
print(sequence4)
print(sequence4.upper())

其結果為：

tCTGtTCGtTTtCGTtTtGTtTTTGCTtTCtTtCtTtTtTtTCGtTGCGTTCtT
tCaGtaCGtaatCGatatGataaaGCataCtatCtatatataCGtaGCGaaCta
tgaGtagGtaatgGatatGataaaGgatagtatgtatatatagGtaGgGaagta
tgactagctaatgcatatcataaacgatagtatgtatatatagctacgcaagta
TGACTAGCTAATGCATATCATAAACGATAGTATGTATATATAGCTACGCAAGTA

至此我們的互補DNA序列得到了，也許有更好更簡潔的代碼。

結尾

原文鏈接：https://www.jianshu.com/p/09bddf9a8ebe

上一篇：python數據分析繪圖可視化_python
下一篇：Python一階馬爾科夫鏈生成隨機DNA序列實現示例_pyt

日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

網站首頁編程語言正文

自學python求已知DNA模板的互補DNA序列_python

目錄

DNA序列

簡述其代碼

原始序列上進行替換

利用upper()輸出大寫結果

結尾

相關推薦

日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

網站首頁 編程語言 正文

自學python求已知DNA模板的互補DNA序列_python

目錄

DNA序列

簡述其代碼

原始序列上進行替換

利用upper()輸出大寫結果

結尾

相關推薦

網站首頁編程語言正文