[Python] pandas

Pandas

pandas を使って CSV ファイルを読み込む。

通常、utf-8 で読み込まれるが、読み込みの際、エラーになることがある。下記は、マネーフォワード ME からダウンロードした CSV ファイルの場合。読み込み時にエラーになってしまったため、encoding に sjis を指定。

import pandas as pd

df = pd.read_csv('./収入・支出詳細_2021-05-01_2021-05-31.csv', encoding='sjis')

head() で先頭5行を表示することが可能。同じく、tail() で末尾5行を表示することが可能。

引数に表示する行数を指定することができる。head(10) で先頭10行を表示することができる。tail() も同様。

df.head()
df.tail()

df.columns でカラムを表示することができる。

df.columns
Index(['計算対象', '日付', '内容', '金額(円)', '保有金融機関', '大項目', '中項目', 'メモ', '振替', 'ID'], dtype='object')

ここから ‘ID’ の列を消したい場合は、下記のようにカラムを指定(’ID’ を外す)せばOK

先頭行を削除したい場合は、[1:] をつける。

df = df[['計算対象', 
'日付', 
'内容', 
'金額(円)', 
'保有金融機関', 
'大項目', 
'中項目', 
'メモ', 
'振替', 
]][1:]

dtypes で各列のデータ型、shape でデータフレームのサイズを表示。

df.dtypes
df.shape