R-database

提供:Dev Guides
移動先:案内検索

R-データベース

データは、リレーショナルデータベースシステムが正規化された形式で保存されます。 したがって、統計計算を実行するには、非常に高度で複雑なSqlクエリが必要になります。 しかし、RはMySql、Oracle、Sqlサーバーなどの多くのリレーショナルデータベースに簡単に接続できます。 それらからレコードをデータフレームとして取得します。 R環境でデータが使用可能になると、通常のRデータセットになり、すべての強力なパッケージと機能を使用して操作または分析できます。

このチュートリアルでは、Rに接続するための参照データベースとしてMySqlを使用します。

RMySQLパッケージ

Rには「RMySQL」という名前の組み込みパッケージがあり、MySqlデータベースとのネイティブ接続を提供します。 次のコマンドを使用して、このパッケージをR環境にインストールできます。

install.packages("RMySQL")

RをMySqlに接続する

パッケージをインストールしたら、Rに接続オブジェクトを作成してデータベースに接続します。 ユーザー名、パスワード、データベース名、ホスト名を入力として受け取ります。

# Create a connection Object to MySQL database.
# We will connect to the sampel database named "sakila" that comes with MySql installation.
mysqlconnection = dbConnect(MySQL(), user = 'root', password = '', dbname = 'sakila',
   host = 'localhost')

# List the tables available in this database.
 dbListTables(mysqlconnection)

上記のコードを実行すると、次の結果が生成されます-

 [1] "actor"                      "actor_info"
 [3] "address"                    "category"
 [5] "city"                       "country"
 [7] "customer"                   "customer_list"
 [9] "film"                       "film_actor"
[11] "film_category"              "film_list"
[13] "film_text"                  "inventory"
[15] "language"                   "nicer_but_slower_film_list"
[17] "payment"                    "rental"
[19] "sales_by_film_category"     "sales_by_store"
[21] "staff"                      "staff_list"
[23] "store"

テーブルのクエリ

関数* dbSendQuery()*を使用して、MySqlのデータベーステーブルをクエリできます。 クエリはMySqlで実行され、R * fetch()*関数を使用して結果セットが返されます。 最後に、データフレームとしてRに保存されます。

# Query the "actor" tables to get all the rows.
result = dbSendQuery(mysqlconnection, "select *from actor")

# Store the result in a R data frame object. n = 5 is used to fetch first 5 rows.
data.frame = fetch(result, n = 5)
print(data.fame)

上記のコードを実行すると、次の結果が生成されます-

        actor_id   first_name    last_name         last_update
1        1         PENELOPE      GUINESS           2006-02-15 04:34:33
2        2         NICK          WAHLBERG          2006-02-15 04:34:33
3        3         ED            CHASE             2006-02-15 04:34:33
4        4         JENNIFER      DAVIS             2006-02-15 04:34:33
5        5         JOHNNY        LOLLOBRIGIDA      2006-02-15 04:34:33

フィルター句を使用したクエリ

有効な選択クエリを渡して結果を取得できます。

result = dbSendQuery(mysqlconnection, "select* from actor where last_name = 'TORN'")

# Fetch all the records(with n = -1) and store it as a data frame.
data.frame = fetch(result, n = -1)
print(data)

上記のコードを実行すると、次の結果が生成されます-

        actor_id    first_name     last_name         last_update
1        18         DAN            TORN              2006-02-15 04:34:33
2        94         KENNETH        TORN              2006-02-15 04:34:33
3       102         WALTER         TORN              2006-02-15 04:34:33

テーブルの行を更新する

更新クエリをdbSendQuery()関数に渡すことで、Mysqlテーブルの行を更新できます。

dbSendQuery(mysqlconnection, "update mtcars set disp = 168.5 where hp = 110")

上記のコードを実行すると、MySql環境で更新されたテーブルを確認できます。

テーブルへのデータの挿入

dbSendQuery(mysqlconnection,
   "insert into mtcars(row_names, mpg, cyl, disp, hp, drat, wt, qsec, vs, am, gear, carb)
   values('New Mazda RX4 Wag', 21, 6, 168.5, 110, 3.9, 2.875, 17.02, 0, 1, 4, 4)"
)

上記のコードを実行すると、MySql環境のテーブルに挿入された行が表示されます。

MySqlでテーブルを作成する

関数* dbWriteTable()*を使用して、MySqlにテーブルを作成できます。 テーブルが既に存在する場合は上書きし、データフレームを入力として受け取ります。

# Create the connection object to the database where we want to create the table.
mysqlconnection = dbConnect(MySQL(), user = 'root', password = '', dbname = 'sakila',
   host = 'localhost')

# Use the R data frame "mtcars" to create the table in MySql.
# All the rows of mtcars are taken inot MySql.
dbWriteTable(mysqlconnection, "mtcars", mtcars[, ], overwrite = TRUE)

上記のコードを実行すると、MySql環境で作成されたテーブルが表示されます。

MySqlでのテーブルの削除

テーブルからデータをクエリするのに使用したのと同じ方法で、ドロップテーブルステートメントをdbSendQuery()に渡して、MySqlデータベースのテーブルをドロップできます。

dbSendQuery(mysqlconnection, 'drop table if exists mtcars')

上記のコードを実行すると、MySql環境でテーブルが削除されていることがわかります。