Biopython-machine-learning

提供:Dev Guides
移動先:案内検索

Biopython-機械学習

バイオインフォマティクスは、機械学習アルゴリズムを適用する優れた分野です。 ここには、多数の生物の遺伝情報があり、これらすべての情報を手動で分析することはできません。 適切な機械学習アルゴリズムを使用すると、これらのデータから多くの有用な情報を抽出できます。 Biopythonは、教師付き機械学習を行うための有用なアルゴリズムセットを提供します。

教師あり学習は、入力変数(X)と出力変数(Y)に基づいています。 アルゴリズムを使用して、入力から出力へのマッピング関数を学習します。 以下に定義されています-

Y = f(X)

このアプローチの主な目的は、マッピング関数を近似することです。新しい入力データ(x)がある場合、そのデータの出力変数(Y)を予測できます。

ロジスティック回帰モデル

ロジスティック回帰は、教師あり機械学習アルゴリズムです。 予測変数の加重和を使用してKクラス間の差を見つけるために使用されます。 イベント発生の確率を計算し、癌の検出に使用できます。

Biopythonは、ロジスティック回帰アルゴリズムに基づいて変数を予測するBio.LogisticRegressionモジュールを提供します。 現在、Biopythonは2つのクラス(K = 2)に対してのみロジスティック回帰アルゴリズムを実装しています。

k最近傍

k最近傍も教師あり機械学習アルゴリズムです。 最近傍に基づいてデータを分類することにより機能します。 Biopythonは、k最近傍アルゴリズムに基づいて変数を予測するBio.KNNモジュールを提供します。

ナイーブベイズ

単純ベイズ分類器は、ベイズの定理に基づいた分類アルゴリズムのコレクションです。 それは単一のアルゴリズムではなく、すべてが共通の原則を共有するアルゴリズムのファミリーです。 分類されるフィーチャのペアはすべて互いに独立しています。 Biopythonは、Naive Bayesアルゴリズムで動作するBio.NaiveBayesモジュールを提供します。

マルコフモデル

マルコフモデルは、確率変数の集合として定義される数学的システムであり、特定の確率的ルールに従って、ある状態から別の状態への遷移を経験します。 Biopythonは、マルコフモデルで動作する* Bio.MarkovModelおよびBio.HMM.MarkovModelモジュールを提供します*。