Artificial-intelligence-agents-and-environments

提供:Dev Guides
移動先:案内検索

AI-エージェントと環境

AIシステムは、エージェントとその環境で構成されます。 エージェントはそれぞれの環境で行動します。 環境には他のエージェントが含まれる場合があります。

エージェントと環境とは何ですか?

  • エージェント*は、*センサー*を介して環境を認識できるものであり、*エフェクター*を介してその環境に作用します。
  • *人間のエージェント*には、目、耳、鼻、舌、皮膚などの感覚器官がセンサーと平行であり、その他の器官(エフェクター、手、脚、口など)があります。
  • *ロボットエージェント*は、センサー用のカメラと赤外線距離計、およびエフェクター用のさまざまなモーターとアクチュエータに取って代わります。
  • *ソフトウェアエージェント*は、プログラムおよびアクションとしてビット文字列をエンコードしています。

エージェントと環境

エージェントの用語

  • エージェントのパフォーマンス測定-これは、エージェントの成功度を決定する基準です。
  • エージェントの行動-これは、エージェントが特定の知覚シーケンスの後に実行するアクションです。
  • 知覚-特定のインスタンスでのエージェントの知覚入力です。
  • 知覚シーケンス-これは、エージェントが日付まで知覚したすべての履歴です。
  • エージェント機能-教訓シーケンスからアクションへのマップです。

合理性

合理性とは、合理的で分別があり、判断力が高いというステータスに他なりません。

合理性は、エージェントが認識した内容に応じて予想されるアクションと結果に関係します。 有用な情報を取得する目的でアクションを実行することは、合理性の重要な部分です。

理想的なRational Agentとは何ですか?

理想的な合理的なエージェントは、に基づいて、パフォーマンスの測定値を最大化するために予想されるアクションを実行できるエージェントです-

  • その知覚シーケンス
  • 組み込みのナレッジベース

エージェントの合理性は以下に依存します-

  • 成功の程度を決定する*パフォーマンス測定値*。
  • これまでのエージェントの*知覚シーケンス*。
  • エージェントの*環境に関する事前知識*。
  • エージェントが実行できる*アクション*。

合理的なエージェントは常に正しいアクションを実行します。正しいアクションとは、与えられた知覚シーケンスでエージェントを最も成功させるアクションを意味します。 エージェントが解決する問題の特徴は、パフォーマンス測定、環境、アクチュエーター、センサー(PEAS)です。

インテリジェントエージェントの構造

エージェントの構造は次のように見ることができます-

  • エージェント=アーキテクチャ+エージェントプログラム
  • アーキテクチャ=エージェントが実行される機械。
  • エージェントプログラム=エージェント機能の実装。

シンプルな反射エージェント

  • 彼らは現在の知覚のみに基づいて行動を選択します。

  • それらは、現在の教訓に基づいてのみ正しい決定がなされた場合にのみ合理的です。

  • 彼らの環境は完全に観察可能です。

    *Condition-Action Rule* -状態(条件)をアクションにマッピングするルールです。

単純な反射エージェント

モデルベースの反射エージェント

彼らは世界のモデルを使用して自分の行動を選択します。 内部状態を維持します。

モデル-「世界で物事がどのように起こるか」についての知識。

内部状態-知覚履歴に応じて、現在の状態の観察されていない側面の表現です。

  • 状態を更新するには、-*に関する情報が必要です
  • 世界がどのように進化するか。
  • エージェントの行動が世界に与える影響。

モデルベースの反射エージェント

目標ベースのエージェント

彼らは目標を達成するために行動を選択します。 意思決定をサポートする知識が明示的にモデル化されるため、目標ベースのアプローチは反射エージェントよりも柔軟性があり、それにより修正が可能になります。

目標-それは望ましい状況の説明です。

目標ベースの反射エージェント

ユーティリティベースのエージェント

彼らは、各状態の設定(ユーティリティ)に基づいてアクションを選択します。

次の場合、目標は不十分です-

  • 矛盾する目標がありますが、達成できる目標はわずかです。
  • 目標には達成の不確実性があり、成功の可能性と目標の重要性を比較検討する必要があります。

ユーティリティベースのエージェント

環境の性質

一部のプログラムは、キーボード入力、データベース、コンピューターファイルシステム、および画面上の文字出力に限定された完全に*人工的な環境*で動作します。

対照的に、一部のソフトウェアエージェント(ソフトウェアロボットまたはソフトボット)は、豊富で無制限のソフトボットドメインに存在します。 シミュレータには、*非常に詳細で複雑な環境*があります。 ソフトウェアエージェントは、さまざまなアクションからリアルタイムで選択する必要があります。 顧客のオンライン設定をスキャンし、興味深いアイテムを顧客に表示するように設計されたソフトボットは、*実際の*環境と*人工の*環境で動作します。

最も有名な*人工環境*は* Turing Test環境*であり、1つの実際のエージェントと他の人工エージェントが同じ場所でテストされます。 これは、ソフトウェアエージェントが人間と同様に実行することが非常に難しいため、非常に困難な環境です。

チューリング試験

システムのインテリジェントな動作の成功は、チューリングテストで測定できます。

2人と評価対象のマシンがテストに参加します。 2人のうち、1人がテスターの役割を果たします。 それぞれが異なる部屋に座っています。 テスターは、誰が機械であり、誰が人間であるかを知りません。 彼は質問を入力して両方のインテリジェンスに送信し、入力された応答を受け取ります。

このテストは、テスターをだますことを目的としています。 テスターが人間の応答からマシンの応答を判断できない場合、そのマシンはインテリジェントであると言われます。

環境の特性

環境には複数のプロパティがあります-

  • 離散/連続-明確に定義された明確な環境の状態の数が限られている場合、環境は離散的です(たとえば、チェス)。それ以外の場合は連続的です(たとえば、運転)。
  • 観察可能/部分的に観察可能-知覚から各時点で環境の完全な状態を判断できる場合、それは観察可能です。それ以外の場合、部分的にしか観察できません。
  • 静的/動的-エージェントが行動している間に環境が変化しない場合、それは静的です。それ以外の場合は動的です。
  • 単一エージェント/複数エージェント-環境には、エージェントと同じまたは異なる種類の他のエージェントが含まれる場合があります。
  • アクセス可能/アクセス不可-エージェントの感覚器が環境の完全な状態にアクセスできる場合、そのエージェントは環境にアクセスできます。
  • 決定性/非決定性-環境の次の状態が現在の状態とエージェントのアクションによって完全に決定される場合、環境は決定性です。それ以外の場合は、非決定的です。
  • エピソード/非エピソード-エピソード環境では、各エピソードはエージェントが知覚してから行動することで構成されます。 アクションの品質は、エピソード自体に依存します。 後続のエピソードは、前のエピソードのアクションに依存しません。 エージェントは先を考える必要がないため、エピソード環境ははるかに単純です。