Python-pandas-introduction

提供:Dev Guides
移動先:案内検索

Pythonパンダ-はじめに

Pandasは、強力なデータ構造を使用して高性能のデータ操作および分析ツールを提供するオープンソースのPythonライブラリです。 パンダの名前は、多次元データからの計量経済学というパネルデータという言葉に由来しています。

2008年、開発者のWes McKinneyは、データ分析のための高性能で柔軟なツールが必要なときにパンダの開発を開始しました。

パンダ以前は、Pythonはデータの改ざんと準備に主に使用されていました。 データ分析にはほとんど貢献していません。 パンダはこの問題を解決しました。 Pandasを使用すると、データの出所に関係なく、データの処理と分析の5つの典型的なステップ(ロード、準備、操作、モデリング、分析)を実行できます。

Python with Pandasは、金融、経済、統計、分析などの学術および商業分野を含む幅広い分野で使用されています。

パンダの主な機能

  • デフォルトおよびカスタマイズされたインデックス付けを備えた高速で効率的なDataFrameオブジェクト。
  • さまざまなファイル形式からインメモリデータオブジェクトにデータをロードするためのツール。
  • データのアライメントと欠落データの統合処理。
  • 日付セットの形状変更とピボット。
  • 大きなデータセットのラベルベースのスライス、インデックス作成、サブセット化。
  • データ構造から列を削除または挿入できます。
  • 集計および変換のためにデータごとにグループ化します。
  • データの高性能なマージと結合。
  • 時系列機能。