コード一覧

【Python】データを効率的に扱うためのライブラリPandasの使い方

Pandasライブラリーをインポート

PandasはPythonでデータを効率的に扱うためのライブラリです。Pandasを使うことで、表形式のデータを扱ったり、データを集計したり、データを操作したりすることができます。

まず、Pandasを使うには、次のようにしてライブラリをインポートします。

import pandas as pd

DataFrameの作り方

Pandasでは、データを扱うための主要なオブジェクトとして、「DataFrame」というものがあります。DataFrameは、行と列を持つ2次元の表形式のデータを表します。DataFrameは、NumPyの配列やPythonの辞書型などを使って作成することができます。

例えば、次のようにして、辞書型からDataFrameを作成することができます

data = {'name': ['Alice', 'Bob', 'Charlie', 'Dave', 'Eve'],
        'age': [25, 30, 35, 40, 45],
        'city': ['NY', 'SF', 'LA', 'NY', 'SF']}

df = pd.DataFrame(data)

DataFrameの表示方法

この例では、辞書型には、5つの人の名前、年齢、所在地が含まれています。これを使って、DataFrameを作成しています。DataFrameを作成した後は、次のようにして、DataFrameを表示することができます

print(df)

これで、次のような表が表示されます

   name  age city
0 Alice   25   NY
1   Bob   30   SF
2 Charlie 35   LA
3   Dave   40   NY
4   Eve   45   SF

DataFrameを操作するには、様々なメソッドを使うことができます。例えば、次のようにして、DataFrameの先頭の5行を表示することができます

print(df.head())

また、次のようにして、DataFrameの指定した列を取り出すことができます

print(df['name'])