計算序列的 GC
在分子生物學和遺傳學中,GC 含量(或鳥嘌呤 - 胞嘧啶含量,簡稱 GC%)是 DNA 分子中含氮鹼基的百分比,即鳥嘌呤或胞嘧啶(來自四種不同的可能性,也包括腺嘌呤和腺嘌呤)。胸腺嘧啶)。
使用 BioPython:
>>> from Bio.Seq import Seq
>>> from Bio.Alphabet import IUPAC
>>> from Bio.SeqUtils import GC
>>> my_seq = Seq('GATCGATGGGCCTATATAGGATCGAAAATCGC', IUPAC.unambiguous_dna)
>>> GC(my_seq)
46.875
使用 BioRuby:
bioruby> require 'bio'
bioruby> seq = Bio::Sequence::NA.new("atgcatgcaaaa")
==> "atgcatgcaaaa"
bioruby> seq.gc_percent
==> 33
使用 R:
# Load the SeqinR package.
library("seqinr")
mysequence <- s2c("atgcatgcaaaa")
GC(mysequence)
# [1] 0.3333333
使用 Awk:
echo atgcatgcaaaa |\
awk '{dna=$0; gsub(/[^GCSgcs]/,""); print dna,": GC=",length($0)/length(dna)}'
# atgcatgcaaaa : GC= 0.333333