Pandas read_csv() 関数

Suraj Joshi 2023年1月30日 Pandas Pandas Core

pandas.read_csv() の構文
コード例：pandas.read_csv() 関数を用いて CSV ファイルを読み込む
コード例：pandas.read_csv() 関数で usecols パラメータを設定する
コード例：pandas.read_csv() ヘッダー付き関数
コード例：行をスキップする pandas.read_csv() 関数

Pandas read_csv() メソッドは、指定したカンマ区切り値(CSV)ファイルを DataFrame に読み込みます。

`pandas.read_csv()` の構文

pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~ AnyStr]],
                sep=',',
                delimiter=None,
                header='infer',
                names=None,
                index_col=None,
                usecols=None,
                squeeze=False,
                prefix=None,
                mangle_dupe_cols=True,
                dtype=None,
                engine=None,
                converters=None,
                true_values=None,
                false_values=None,
                skipinitialspace=False,
                skiprows=None,
                skipfooter=0,
                nrows=None,
                na_values=None,
                keep_default_na=True,
                na_filter=True,
                verbose=False,
                skip_blank_lines=True,
                parse_dates=False,
                infer_datetime_format=False,
                keep_date_col=False,
                date_parser=None,
                dayfirst=False,
                cache_dates=True,
                iterator=False,
                chunksize=None,
                compression='infer',
                thousands=None,
                decimal: str='.',
                lineterminator=None,
                quotechar='"',
                quoting=0,
                doublequote=True,
                escapechar=None,
                comment=None,
                encoding=None,
                dialect=None,
                error_bad_lines=True,
                warn_bad_lines=True,
                delim_whitespace=False,
                low_memory=True,
                memory_map=False,
                float_precision=None)

パラメータ


`filepath_or_buffer`	インポートする `csv` ファイルの場所
`delimiter`	ファイル `csv` の内容を解析する際に使用するデリミタ
`usecols`	ファイル `csv` から `DataFrame` を形成する際にのみ含まれるカラム名。
`header`	ヘッダのカラム名として使用する行/行を指定します。
`squeeze`	解析したデータに 1 列しか含まれていない場合、Pandas の系列を返します。
`skiprows`	どの行をスキップするか

リターン

ラベル付きの軸を持つ CSV ファイルから Dataframe を作成します。

コード例：`pandas.read_csv()` 関数を用いて `CSV` ファイルを読み込む

import pandas as pd
df = pd.read_csv("dataset.csv")
print(df)

出力：

       Country      Item Type Sales Channel Order Priority
0       Tuvalu      Baby Food       Offline              H
1   East Timor           Meat        Online              L
2       Norway      Baby Food        Online              L
3     Portugal      Baby Food        Online              H
4     Honduras         Snacks        Online              L
5  New Zealand         Fruits        Online              H
6     Moldova   Personal Care        Online              L

このメソッドは CSV ファイルを DataFrame にロードします。ここでは、絶対パスと相対パスの両方を利用して pandas.read_csv() 関数の引数として file path を指定することができます。

この場合、dataset.csv はプログラムファイルと同じディレクトリにあり、csv ファイルの名前をファイルパスとして利用することができます。

コード例：`pandas.read_csv()` 関数で `usecols` パラメータを設定する

import pandas as pd
df = pd.read_csv("dataset.csv",usecols=["Country","Sales Channel","Order Priority"])
print(df)

出力：

       Country Sales Channel Order Priority
0       Tuvalu       Offline              H
1   East Timor        Online              L
2       Norway        Online              L
3     Portugal        Online              H
4     Honduras        Online              L
5  New Zealand        Online              H
6     Moldova         Online              L

このケースでは、CSV ファイルを DataFrame にロードし、usecols パラメータに指定された列のみを含めます。

Country、Sales Channel, および Order Priority はパラメータとして渡されるだけなので、DataFrame にのみ含まれます。

コード例：`pandas.read_csv()` ヘッダー付き関数

import pandas as pd
df = pd.read_csv("dataset.csv",header=1)
print(df)

出力：

        Tuvalu      Baby Food Offline  H
0   East Timor           Meat  Online  L
1       Norway      Baby Food  Online  L
2     Portugal      Baby Food  Online  H
3     Honduras         Snacks  Online  L
4  New Zealand         Fruits  Online  H
5     Moldova   Personal Care  Online  L

このプロセスは、1 行目をヘッダとして設定して CSV ファイルを DataFrame にロードします。

ここでは、1 行目の要素が DataFrame 全体のカラム名となります。

コード例：行をスキップする `pandas.read_csv()` 関数

import pandas as pd
df = pd.read_csv("dataset.csv",skiprows=3)
print(df)

出力：

        Norway      Baby Food  Online  L
0     Portugal      Baby Food  Online  H
1     Honduras         Snacks  Online  L
2  New Zealand         Fruits  Online  H
3     Moldova   Personal Care  Online  L

この手続きは、最初の 3 行をスキップして CSV ファイルを DataFrame にロードします。

チュートリアルを楽しんでいますか？ <a href="https://www.youtube.com/@delftstack/?sub_confirmation=1" style="color: #a94442; font-weight: bold; text-decoration: underline;">DelftStackをチャンネル登録</a> して、高品質な動画ガイドをさらに制作するためのサポートをお願いします。 Subscribe

著者： Suraj Joshi

Suraj Joshi is a backend software engineer at Matrice.ai.

pandas.read_csv() の構文

パラメータ

リターン

コード例：pandas.read_csv() 関数を用いて CSV ファイルを読み込む

コード例：pandas.read_csv() 関数で usecols パラメータを設定する

コード例：pandas.read_csv() ヘッダー付き関数

コード例：行をスキップする pandas.read_csv() 関数

関連記事 - Pandas Core

`pandas.read_csv()` の構文

コード例：`pandas.read_csv()` 関数を用いて `CSV` ファイルを読み込む

コード例：`pandas.read_csv()` 関数で `usecols` パラメータを設定する

コード例：`pandas.read_csv()` ヘッダー付き関数

コード例：行をスキップする `pandas.read_csv()` 関数