Biopython-introduction

提供:Dev Guides
移動先:案内検索

Biopython-はじめに

Biopythonは、Python用の最大かつ最も人気のあるバイオインフォマティクスパッケージです。 一般的なバイオインフォマティクスタスク用のさまざまなサブモジュールが含まれています。 主にPythonで書かれたChapmanとChangによって開発されました。 また、ソフトウェアの複雑な計算部分を最適化するCコードも含まれています。 Windows、Linux、Mac OS Xなどで実行されます。

基本的に、Biopythonは、DNA文字列の逆補完、タンパク質配列のモチーフの検索など、DNA、RNAおよびタンパク質配列の操作を処理する機能を提供するPythonモジュールのコレクションです。 GenBank、SwissPort、FASTAなどのすべての主要な遺伝的データベースを読み取るための多くのパーサーと、Python環境内でNCBI BLASTN、Entrezなどの他の一般的なバイオインフォマティクスソフトウェア/ツールを実行するためのラッパー/インターフェイスを提供します。 BioPerl、BioJava、BioRubyなどの兄弟プロジェクトがあります。

特徴

Biopythonは移植性があり、明確で、構文を習得しやすいです。 顕著な特徴のいくつかを以下に示します-

  • 解釈されたインタラクティブなオブジェクト指向。
  • FASTA、PDB、GenBank、Blast、SCOP、PubMed/Medline、ExPASy関連の形式をサポートしています。
  • シーケンス形式を処理するオプション。
  • タンパク質構造を管理するツール。
  • BioSQL-シーケンスと機能および注釈を保存するためのSQLテーブルの標準セット。
  • NCBIサービス(Blast、Entrez、PubMed)およびExPASYサービス(SwissProt、Prosite)を含むオンラインサービスおよびデータベースへのアクセス。
  • Blast、Clustalw、EMBOSSなどのローカルサービスへのアクセス。

目標

Biopythonの目標は、Python言語を介したバイオインフォマティクスへのシンプルで標準的な広範なアクセスを提供することです。 Biopythonの具体的な目標は以下のとおりです-

  • バイオインフォマティクスリソースへの標準化されたアクセスを提供します。
  • 高品質で再利用可能なモジュールとスクリプト。
  • クラスタコード、PDB、NaiveBayes、およびマルコフモデルで使用できる高速配列操作。
  • ゲノムデータ分析。

利点

Biopythonは必要なコードが非常に少なく、次の利点があります-

  • クラスタリングで使用されるマイクロアレイデータタイプを提供します。
  • ツリービュータイプのファイルを読み書きします。
  • PDBの解析、表現、分析に使用される構造データをサポートします。
  • Medlineアプリケーションで使用されるジャーナルデータをサポートします。
  • すべてのバイオインフォマティクスプロジェクトで広く使用されている標準データベースであるBioSQLデータベースをサポートします。
  • バイオインフォマティクスファイルを_format固有のレコードオブジェクトまたはシーケンスと機能の汎用クラスに解析するモジュールを提供することにより、パーサー開発をサポートします。
  • クックブックスタイルに基づく明確なドキュメント。

サンプルケーススタディ

私たちはいくつかのユースケース(集団遺伝学、RNA構造など)をチェックし、この分野でBiopythonがどのように重要な役割を果たしているかを理解してみましょう-

集団遺伝学

集団遺伝学は、集団内の遺伝的変異の研究であり、空間および時間にわたる集団の遺伝子および対立遺伝子の頻度の変化の調査およびモデリングを伴います。

Biopythonは、集団遺伝学用のBio.PopGenモジュールを提供します。 このモジュールには、古典的な集団遺伝学に関する情報を収集するために必要なすべての機能が含まれています。

RNA構造

私たちの生活に不可欠な3つの主要な生体高分子は、DNA、RNA、タンパク質です。 タンパク質は細胞の働き者であり、酵素として重要な役割を果たします。 DNA(デオキシリボ核酸)は、細胞の「青写真」と見なされます。 細胞が成長し、栄養素を取り込み、増殖するために必要なすべての遺伝情報が含まれています。 RNA(リボ核酸)は、細胞内で「DNAコピー」として機能します。

Biopythonは、ヌクレオチド、DNAおよびRNAのビルディングブロックを表すBio.Sequenceオブジェクトを提供します。