Natural-language-processing-inception

提供:Dev Guides
移動先:案内検索

自然言語処理-インセプション

この章では、自然言語処理における自然言語の始まりについて説明します。 まず、自然言語文法とは何かを理解しましょう。

自然言語文法

言語学では、言語は任意の音声記号のグループです。 言語は創造的であり、ルールに支配され、生得的であると同時に普遍的であると言えます。 一方で、それも人間的です。 言語の性質は人によって異なります。 言語の性質について多くの誤解があります。 そのため、あいまいな用語 _ ’grammar’ _ の意味を理解することが非常に重要です。 言語学では、文法という用語は、どの言語が機能するかの助けを借りて、規則または原則として定義される場合があります。 広義には、文法を2つのカテゴリに分けることができます-

記述文法

言語学と文法学が話者の文法を定式化する規則のセットは、記述文法と呼ばれます。

パースペクティブ文法

それは言語の正確さの標準を維持しようとする、非常に異なる文法の感覚です。 このカテゴリは、言語の実際の動作とはほとんど関係ありません。

言語のコンポーネント

学習言語は相互に関連するコンポーネントに分割されます。これらのコンポーネントは、言語調査の従来の部分と任意の部分です。 これらのコンポーネントの説明は次のとおりです-

音韻論

言語の最初の構成要素は音韻論です。 特定の言語の音声の研究です。 単語の起源はギリシャ語に由来し、「電話」は音または音声を意味します。 音韻論、音韻論の下位区分は、人間の言語の発話音を、その生成、知覚、または物理的特性の観点から研究することです。 IPA(International Phonetic Alphabet)は、音韻を研究しながら人間の音を定期的に表現するツールです。 IPAでは、書かれたすべての記号は1つの音声のみを表し、その逆も同様です。

音素

言語内のある単語と他の単語を区別する音の単位の1つとして定義できます。 言語学では、音素はスラッシュの間に書かれています。 たとえば、音素 /k/ は、キット、スキットなどの単語で発生します。

形態学

これは、言語の2番目のコンポーネントです。 特定の言語の単語の構造と分類の研究です。 単語の起源はギリシャ語に由来し、「形態」という言葉は「形」を意味します。 形態学では、言語の単語形成の原則を考慮します。 つまり、音がプレフィックス、サフィックス、ルートなどの意味のあるユニットにどのように結合するか。 また、単語を品詞にグループ化する方法も考慮します。

語彙素

言語学では、単一の単語がとる一連の形式に対応する形態素解析の抽象的な単位は語彙素と呼ばれます。 語彙素が文で使用される方法は、その文法上のカテゴリによって決まります。 語彙素は、個々の単語または複数単語にすることができます。 たとえば、単語talkは個々の単語の語彙素の例であり、talks、talked、talkingのような多くの文法的な変形があります。 複数語の語彙素は、複数の正字法の単語で構成できます。 たとえば、声を上げたり、引き抜いたりします。 マルチワード語彙素の例です。

構文

これは、言語の3番目のコンポーネントです。 それは、より大きな単位への単語の順序と配置の研究です。 この言葉はギリシャ語に由来し、サンタセインという言葉は「整理する」という意味です。 文の種類とその構造、句、句の研究を行います。

意味論

これは、言語の4番目のコンポーネントです。 それは、意味がどのように伝えられるかについての研究です。 意味は、外の世界に関連する場合もあれば、文の文法に関連する場合もあります。 単語はギリシャ語にまでさかのぼることができます。ここで、semaineinは「意味する」、「ショー」、「シグナル」を意味します。

語用論

これは、言語の5番目のコンポーネントです。 それは言語の機能と文脈におけるその使用の研究です。 単語の起源はギリシャ語に由来し、「プラグマ」という言葉は「行為」、「関係」を意味します。

文法カテゴリー

文法カテゴリは、言語の文法内のユニットまたは機能のクラスとして定義できます。 これらのユニットは言語の構成要素であり、共通の特性セットを共有しています。 文法カテゴリは、文法機能とも呼ばれます。

文法カテゴリのインベントリは以下に説明されています-

これは最も単純な文法カテゴリです。 このカテゴリに関連する2つの用語-単数と複数があります。 単数形は「1」の概念ですが、複数形は「複数」の概念です。 たとえば、dog/dogs、this/these。

性別

文法上の性別は、人称代名詞と3人称の違いによって表現されます。 文法的な性別の例は単数です-彼、彼女、それ。一人称と二人称形式-私、私たちとあなた;彼らの三人称複数形は、一般的な性別または中性の性別です。

別の簡単な文法カテゴリは人です。 これの下で、次の3つの用語が認識されます-

  • 一人称-話している人は一人称として認識されます。
  • * 2人目*-聞き手または話された人は2人目として認識されます。
  • * 3人目-私たちが話している人または物は3人目として認識されます。

Case

これは、最も難しい文法カテゴリの1つです。 これは、名詞句(NP)の機能、または名詞句と動詞または文の他の名詞句との関係を示すものとして定義できます。 私たちは、個人および疑問代名詞で表現された次の3つのケースを持っています-

  • 主格の場合-それは主題の機能です。 たとえば、私、私たち、あなた、彼、彼女、それ、彼ら、そして誰が主格です。
  • Genative case -それは所有者の機能です。 例えば、私の/私の、私たちの/私たちの、彼の、彼女の/彼女の、その、彼らの/彼らの、それらは属格です。
  • 客観的なケース-それはオブジェクトの機能です。 例えば、私、私たち、あなた、彼、彼女、彼ら、客観的です。

この文法カテゴリは、形容詞と副詞に関連しています。 次の3つの用語があります-

  • ポジティブ度-品質を表します。 たとえば、大きく、速く、美しいというのは正の学位です。
  • 比較次数-2つの項目のいずれかで、品質のより高い程度または強度を表します。 たとえば、大きく、速く、美しいほど、相対的な学位は高くなります。
  • 最上級-3つ以上の項目のいずれかで、品質の最大の程度または強度を表します。 たとえば、最大、最速、最も美しいのは最上級です。

確定性と不確定性

これらの概念は両方とも非常に単純です。 私たちが知っている明確さは、話し手または聞き手が知っている、よく知っている、または識別できる指示対象を表します。 一方、不定性は、知られていない、またはなじみのない指示対象を表します。 概念は名詞との記事の共起で理解することができます-

  • 定冠詞-the
  • 無期限の記事-a/an

時制

この文法カテゴリは動詞に関連しており、アクションの時間を言語的に示すものとして定義できます。 時制が関係を確立するのは、それが話す瞬間に対するイベントの時間を示すからです。 広く、それは次の3つのタイプのものです-

  • 現在時制-現在の瞬間のアクションの発生を表します。 たとえば、Ramは一生懸命働いています。
  • 過去時制-現在の瞬間の前のアクションの発生を表します。 たとえば、雨が降った。
  • 未来時制-現在の瞬間の後のアクションの発生を表します。 たとえば、雨が降るでしょう。

側面

この文法カテゴリは、イベントの撮影ビューとして定義できます。 それは次のタイプにすることができます-

  • 完璧なアスペクト-ビューは全体として取られ、アスペクトで完全です。 たとえば、英語で*昨日友達に会った*のような単純な過去形は、イベントを完全かつ全体として見ているので、面では完璧です。
  • 不完全な側面-視点は継続的で不完全であると見なされます。 たとえば、英語の*私はこの問題に取り組んでいます*のような現在の分詞の時制は、イベントを不完全で継続していると見なしているため、アスペクトが不完全です。

Mood

この文法のカテゴリを定義するのは少し難しいですが、話者が話していることに対する話者の態度の指標として簡単に言うことができます。 また、動詞の文法的な特徴でもあります。 文法上の時制や文法的な側面とは異なります。 ムードの例は、指示、疑問、命令、差止、仮差、潜在、オプティティブ、動名詞、分詞です。

契約

コンコードとも呼ばれます。 単語が関連する他の単語に応じて変化するときに起こります。 言い換えれば、いくつかの文法カテゴリの値を異なる単語または品詞間で一致させることを意味します。 以下は、他の文法カテゴリに基づいた合意です-

  • 個人に基づく同意-これは、主語と動詞の間の同意です。 たとえば、常に「私は」と「彼は」を使用しますが、「彼は」と「私は」は使用しません。
  • 番号に基づく合意-この合意は主語と動詞の間です。 この場合、一人称単数、二人称複数などの特定の動詞形式があります。 たとえば、1人称単数:私は本当に、2人称複数:私たちは本当に、3人称単数:少年が歌います、3人称複数:少年たちが歌います。
  • 性別に基づく合意-英語では、代名詞と先行詞の間で性別の合意があります。 たとえば、彼は目的地に到着しました。 船は彼女の目的地に到着しました。
  • ケースに基づく契約-この種類の契約は、英語の重要な特徴ではありません。 たとえば、誰が最初に来ましたか-彼または彼の妹?

音声言語の構文

書かれた英語の文法と話された英語の文法には多くの共通の特徴がありますが、それに加えて、それらは多くの面でも異なります。 次の機能は、話し言葉と書き言葉の文法を区別します-

非流動性と修理

この印象的な機能により、話し言葉と書き言葉の文法は互いに異なります。 それは個々に非流動性の現象として、また集合的に修復の現象として知られています。 非流動性には、次の使用が含まれます-

  • フィラー語-文の間に時々、フィラー語を使用します。 それらは、フィラー休止のフィラーと呼ばれます。 そのような単語の例は、uhとumです。
  • 補遺と修復-文の間に繰り返される単語のセグメントは、補欠と呼ばれます。 同じセグメントで、変更された単語は修復と呼ばれます。 これを理解するために次の例を検討してください-
  • ABCの航空会社は片道5000ルーピーの片道運賃を提供していますか?*

上記の文では、片道は補欠であり、片道は修理です。

再起動

フィラーが一時停止すると、再起動が発生します。 たとえば、上記の文では、スピーカーが片道フライトについて尋ね始めてから停止し、フィラーの一時停止によって自分自身を修正してから、片道運賃について尋ね始めるときに再開が発生します。

単語の断片

時には、単語の小さな断片で文章を話します。 たとえば、* wwha-what is the time?では、単語 *w-wha は単語の断片です。