Big-data-analytics-introduction-to-sql
ビッグデータ分析-SQLの概要
SQLは、構造化照会言語の略です。 これは、従来のデータウェアハウスおよびビッグデータテクノロジーのデータベースからデータを抽出するために最も広く使用されている言語の1つです。 SQLの基本を示すために、例を使って作業します。 言語自体に焦点を合わせるために、R内でSQLを使用します。 SQLコードの記述に関しては、これはデータベースで行われるのとまったく同じです。
SQLのコアは、SELECT、FROM、およびWHEREの3つのステートメントです。 次の例では、SQLの最も一般的な使用例を使用しています。 bda/part2/SQL_introduction フォルダーに移動し、 SQL_introduction.Rproj ファイルを開きます。 次に、01_select.Rスクリプトを開きます。 RでSQLコードを作成するには、次のコードに示すように sqldf パッケージをインストールする必要があります。
selectステートメントは、テーブルから列を取得し、それらに対して計算を行うために使用されます。 最も簡単なSELECTステートメントは、 ej1 で示されています。 ej2 に示すように、新しい変数を作成することもできます。
SQLで最もよく使用される機能の1つは、group byステートメントです。 これにより、別の変数の異なるグループの数値を計算できます。 スクリプト02_group_by.Rを開きます。
SQLの最も便利な機能は結合です。 結合とは、1つの列を使用して両方のテーブルの値を一致させる1つのテーブルでテーブルAとテーブルBを結合することを意味します。 実際には、さまざまな種類の結合がありますが、開始するにはこれらが最も有用なものになります。内部結合と左外部結合です。