Pythonパンダ-はじめに

Pandasは、強力なデータ構造を使用して高性能のデータ操作および分析ツールを提供するオープンソースのPythonライブラリです。パンダの名前は、多次元データからの計量経済学というパネルデータという言葉に由来しています。

2008年、開発者のWes McKinneyは、データ分析のための高性能で柔軟なツールが必要なときにパンダの開発を開始しました。

パンダ以前は、Pythonはデータの改ざんと準備に主に使用されていました。データ分析にはほとんど貢献していません。パンダはこの問題を解決しました。 Pandasを使用すると、データの出所に関係なく、データの処理と分析の5つの典型的なステップ（ロード、準備、操作、モデリング、分析）を実行できます。