Biopython-motif-objects
Biopython-Motifオブジェクト
配列モチーフは、ヌクレオチドまたはアミノ酸の配列パターンです。 配列モチーフは、隣接していない可能性のあるアミノ酸の三次元配列によって形成されます。 Biopythonは、以下に指定されているように、配列モチーフの機能にアクセスするための独立したモジュールBio.motifsを提供します-
単純なDNAモチーフの作成
以下のコマンドを使用して簡単なDNAモチーフ配列を作成しましょう-
シーケンス値をカウントするには、以下のコマンドを使用します-
次のコードを使用して、シーケンス内の「A」をカウントします-
あなたがカウントの列にアクセスしたい場合は、以下のコマンドを使用します-
シーケンスロゴの作成
次に、シーケンスロゴの作成方法について説明します。
以下のシーケンスを考慮してください-
次のリンクを使用して独自のロゴを作成できます-http://weblogo.berkeley.edu/
上記のシーケンスを追加して新しいロゴを作成し、seq.pngという名前の画像をbiopythonフォルダーに保存します。
イメージを作成した後、次のコマンドを実行します-
このDNA配列モチーフは、LexA結合モチーフの配列ロゴとして表されます。
JASPARデータベース
JASPARは最も人気のあるデータベースの1つです。 シーケンスの読み取り、書き込み、スキャンのためのモチーフ形式のいずれかの機能を提供します。 各モチーフのメタ情報を保存します。 モジュールBio.motifsには、メタ情報の属性を表す特別なクラスjaspar.Motifが含まれています。
次の注目すべき属性タイプがあります-
- matrix_id-一意のJASPARモチーフID
- name-モチーフの名前
- tf_family-モチーフのファミリー、例えば 「ヘリックス-ループ-ヘリックス」
- data_type-モチーフで使用されるデータのタイプ。
biopythonフォルダーのsample.sitesにあるJASPARサイト形式を作成しましょう。 以下に定義されています-
上記のファイルでは、モチーフインスタンスを作成しました。 さて、上記のインスタンスからモチーフオブジェクトを作成しましょう-
ここで、データは、sample.sitesファイルからすべてのモチーフインスタンスを読み取ります。
データからすべてのインスタンスを印刷するには、以下のコマンドを使用します-
以下のコマンドを使用して、すべての値をカウントします-