Biopython-genome-analysis
Biopython-ゲノム解析
ゲノムは、そのすべての遺伝子を含むDNAの完全なセットです。 ゲノム解析とは、個々の遺伝子とその遺伝における役割の研究を指します。
ゲノム図
ゲノム図は、遺伝情報をチャートとして表します。 BiopythonはBio.Graphics.GenomeDiagramモジュールを使用してGenomeDiagramを表します。 GenomeDiagramモジュールには、ReportLabのインストールが必要です。
ダイアグラムを作成する手順
図を作成するプロセスは、一般的に以下の単純なパターンに従います-
- 表示する機能の個別のセットごとにFeatureSetを作成し、Bio.SeqFeatureオブジェクトをそれらに追加します。
- 表示するグラフごとにGraphSetを作成し、グラフデータを追加します。
- ダイアグラム上で必要な各トラックのトラックを作成し、必要なトラックにGraphSetsとFeatureSetsを追加します。
- ダイアグラムを作成し、それにトラックを追加します。
- 画像を描画するようにダイアグラムに指示します。
- 画像をファイルに書き込みます。
入力GenBankファイルの例を見てみましょう-
[[1]] 以下で説明します、
以下に示すように、最初にすべてのモジュールをインポートします-
>>> from reportlab.lib import colors
>>> from reportlab.lib.units import cm
>>> from Bio.Graphics import GenomeDiagram
今、データを読み取るためにSeqIOモジュールをインポートします-
>>> from Bio import SeqIO
record = SeqIO.read("example.gb", "genbank")
ここでは、レコードはgenbankファイルからシーケンスを読み取ります。
次に、空の図を作成して、トラックと機能セットを追加します-
>>> diagram = GenomeDiagram.Diagram(
"Yersinia pestis biovar Microtus plasmid pPCP1")
>>> track = diagram.new_track(1, name="Annotated Features")
>>> feature = track.new_set()
今、私たちは以下に定義されているように緑から灰色への代替色を使用して色のテーマの変更を適用することができます-
>>> for feature in record.features:
>>> if feature.type != "gene":
>>> continue
>>> if len(feature) % 2 == 0:
>>> color = colors.blue
>>> else:
>>> color = colors.red
>>>
>>> feature.add_feature(feature, color=color, label=True)
これで、画面に以下の応答が表示されます-
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dc90>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d3dfd0>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x1007627d0>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57290>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57050>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57390>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57590>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57410>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d57490>
<Bio.Graphics.GenomeDiagram._Feature.Feature object at 0x105d574d0>
上記の入力レコードの図を描きましょう-
>>> diagram.draw(
format = "linear", orientation = "landscape", pagesize = 'A4',
... fragments = 4, start = 0, end = len(record))
>>> diagram.write("orchid.pdf", "PDF")
>>> diagram.write("orchid.eps", "EPS")
>>> diagram.write("orchid.svg", "SVG")
>>> diagram.write("orchid.png", "PNG")
上記のコマンドを実行すると、Biopythonディレクトリに次の画像が保存されます。
* *Result* *
genome.png
また、以下の変更を行うことにより、円形形式で画像を描くことができます-
>>> diagram.draw(
format = "circular", circular = True, pagesize = (20*cm,20*cm),
... start = 0, end = len(record), circle_core = 0.7)
>>> diagram.write("circular.pdf", "PDF")
染色体の概要
DNA分子は、染色体と呼ばれる糸状の構造にパッケージ化されています。 各染色体は、その構造をサポートするヒストンと呼ばれるタンパク質の周りに何度もしっかりとコイル状に巻かれたDNAで構成されています。
細胞が分裂していない場合、染色体は細胞の核では見えません。顕微鏡でも見えません。 ただし、染色体を構成するDNAは細胞分裂中により密に詰まり、顕微鏡で見ることができます。
ヒトでは、各細胞には通常23組の染色体が含まれており、合計46組です。 常染色体と呼ばれるこれらのペアの22は、男性と女性の両方で同じように見えます。 23番目のペアである性染色体は、男性と女性で異なります。 女性はX染色体のコピーを2つ持っていますが、男性はX染色体とY染色体を1つ持っています。