PythonでPandasライブラリを用いてcsvファイルを読み込む方法

投稿日：2020年11月3日

＜目次＞

(１) PythonでPandasライブラリを用いてcsvファイルを読み込む方法
　 (１-１) 構文
　 (１-２) サンプルプログラム
　 (１-３) read_csvの主要なオプションご紹介
　 (１-４) 読み込んだcsvのカラム名やレコードを取得する方法

(１) PythonでPandasライブラリを用いてcsvファイルを読み込む方法

(１-１) 構文

１行目でpandasのライブラリをインポートし、２行目の「pd.read_csv()」でcsvを読み込んでいます。
read_csvの第一引数は読み込むcsvのパス（[FilePath]）を指定します。第二引数以降はオプションの指定をカンマ区切りで行います。

import pandas as pd
df = pd.read_csv([FilePath],[Option1],[Option2],[Option3],...)

＞目次にもどる

(１-２) サンプルプログラム

実際に上記の構文を用いたサンプルプログラムをご紹介します。

（読み込むcsv）
↓このデータは2020年10月23時点での男子テニスシングルスの世界ランキングTop10位までの情報です。今回のデータは読み込み対象のデータがチルダ「~」を区切り文字にしています。

Ranking~Move~Country~Player~Age~Points~TournPlayed
1~-~SRB~Novak Djokovic~33~11740~18
2~-~ESP~Rafael Nadal~34~9850~18
3~-~AUT~Dominic Thiem~27~9125~21
4~-~SUI~Roger Federer~39~6630~16
5~-~GRE~Stefanos Tsitsipas~22~5925~27
6~-~RUS~Daniil Medvedev~24~5890~24
7~-~GER~Alexander Zverev~23~4855~26
8~↑2~RUS~Andrey Rublev~22~3429~25
9~↓1~ARG~Diego Schwartzman~28~3180~24
10~↓1~ITA~Matteo Berrettini~24~3075~21

（サンプルプログラム）
上記のcsvを読み込むサンプルプログラムです。

import pandas as pd

def main():
    # 第一引数＝ファイルパス
    # 第二引数＝delimiter＝区切り文字はチルダ「~」を指定
    df = pd.read_csv(r"C:\Users\Rainbow\Desktop\tennis_ranking_20201023.csv",delimiter="~")
    print(df)

if __name__ == '__main__':
    main()

（図１２１）プログラム実行結果（例）

＞目次にもどる

(１-３) read_csvの主要なオプションご紹介

(１-３-１) 主要オプションの概要

read_csvで頻繁に使用する代表的なオプションについて表にまとめました。一部のオプションに関しては(１-３-２)以降で実機の確認画像を貼っているので、必要に応じてご覧頂けたらと思います
（表）

オプション（=以降はデフォルト値）	型	備考
sep=’,’	str	・「区切り文字」の指定・デフォルトはカンマ「,」
encoding	str	・エンコーディング方式を指定します。（例） encoding = ‘utf-8’
delimiter=None	str	・sepの別名
header=’infer’	int list of int	・カラム名として利用する行の番号（一つor複数）・デフォルトでは推測（infer）します。・複数行あるケースは配列で指定も可能（例：[0,1,3]）。
names	array-like	・使用するカラム名を明示的に宣言する場合に使います。・この場合は「header」と競合しないよう「header=0」を記載する必要があります。
index_col	int, str sequence of int / str	・行ラベルとして使用する列を指定します。・複数列を指定したら、マルチインデックスになります。
skiprows	int 範囲指定（rangeなど）	・読み込みをSkipする行を指定します。 ①特定行の例 skiprows=1 ②範囲指定の例： skiprows=range(1,2000000)