Spark SQL-データソース

DataFrameインターフェースにより、さまざまなデータソースをSpark SQLで動作させることができます。これは一時テーブルであり、通常のRDDとして操作できます。 DataFrameをテーブルとして登録すると、そのデータに対してSQLクエリを実行できます。

この章では、異なるSparkデータソースを使用してデータをロードおよび保存する一般的な方法について説明します。その後、組み込みデータソースで使用可能な特定のオプションについて詳しく説明します。

SparkSQLで利用可能なデータソースにはさまざまな種類があり、その一部を以下に示します-