Biometrics-voice-recognition
提供:Dev Guides
音声認識
音声認識バイオメトリックモダリティは、生理学的モダリティと行動モダリティの両方の組み合わせです。 音声認識は音声認識に他なりません。 それは次の影響を受ける機能に依存しています-
- 生理学的コンポーネント-人の声帯、唇、歯、舌、および口腔の物理的形状、サイズ、および健康。
- 行動コンポーネント-話している間の人の感情的な状態、アクセント、トーン、ピッチ、話すペース、つぶやきなど
音声認識システム
音声認識は、スピーカー認識とも呼ばれます。 登録時に、ユーザーは単語またはフレーズをマイクに向かって話す必要があります。 これは、候補者の音声サンプルを取得するために必要です。
マイクからの電気信号は、アナログ-デジタル(ADC)コンバーターによってデジタル信号に変換されます。 デジタル化されたサンプルとしてコンピューターのメモリに記録されます。 次に、コンピューターは、候補の入力音声を保存されているデジタル化された音声サンプルと比較して照合し、候補を識別します。
音声認識モダリティ
音声認識には、*スピーカー依存*と*スピーカー非依存*の2つのバリエーションがあります。
話者依存の音声認識は、候補者の特定の音声特性の知識に依存しています。 このシステムは、音声トレーニング(または登録)を通じてこれらの特性を学習します。
- システムは、発言内容を認識するために採用する前に、特定のアクセントとトーンに慣れるようにユーザーでトレーニングする必要があります。
- システムを使用するユーザーが1人だけの場合は、適切なオプションです。
話者に依存しないシステムは、単語やフレーズなどの音声のコンテキストを制限することにより、さまざまなユーザーからの音声を認識できます。 これらのシステムは、自動化された電話インターフェイスに使用されます。
- 個々のユーザーごとにシステムをトレーニングする必要はありません。
- 各候補者の発話特性を認識する必要がない場合、さまざまな個人が使用するのに適しています。
音声認識と音声認識の違い
話者認識と音声認識は誤って同じものと見なされます。しかし、それらは異なる技術です。 見てみましょう、どのように-
Speaker Recognition (Voice Recognition) | Speech Recognition |
---|---|
The objective of voice recognition is to recognize WHO is speaking. | The speech recognition aims at understanding and comprehending WHAT was spoken. |
It is used to identify a person by analyzing its tone, voice pitch, and accent. | It is used in hand-free computing, map, or menu navigation. |
音声認識のメリット
- 実装は簡単です。
音声認識のデメリット
- マイクの品質とノイズの影響を受けやすくなっています。
- 入力システムに影響する要因を制御できないと、パフォーマンスが大幅に低下する可能性があります。
- 一部のスピーカー検証システムは、録音された音声によるスプーフィング攻撃の影響も受けやすくなっています。
音声認識の応用
- 電話およびインターネット取引の実行。
- Interactive Voice Response(IRV)ベースの銀行および医療システムでの作業。
- デジタルドキュメントにオーディオ署名を適用します。
- エンターテインメントおよび緊急サービス。
- オンライン教育システム。