Pandasのrenameを徹底解説!データフレームの列名変更で作業効率UP

「rename」の使い方 Pandas

Pythonでデータ分析や処理を行う際に欠かせないライブラリ「Pandas」。

その中でも、データフレームやシリーズの列名やインデックスを変更する方法は頻繁に利用されます。

特にrenameメソッドは、その柔軟性と使いやすさから多くの場面で役立ちます。

本記事では、Pandasのrenameを徹底解説し、その使い方や注意点、活用例を紹介します。

これを読めば、renameをマスターして、データ操作の効率が格段に上がるはずです。

ゆーや
ゆーや

「DataFrame」って何?という方は、
次の記事をご覧ください!

Pandasのrenameメソッドとは?

Pandasのrenameは、DataFrameやSeriesの列名やインデックスを柔軟に変更できるメソッドです。このメソッドを使うと、以下のような操作が可能です!

  • 列名の一部または全体を変更する
  • インデックスの名前を変更する
  • のデータフレームを保持したまま、新しいデータフレームを作成する
  • 関数を使って一括で名前を変更する
ユーや
ユーや

このように、データの可読性を高めたり、目的に応じた名前に変更したりする際に役立ちます!

renameの基本的な使い方

列名を変更する

import pandas as pd

# サンプルデータ
data = {
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35],
    'city': ['New York', 'Los Angeles', 'Chicago']
}

# データフレームの作成
df = pd.DataFrame(data)

# 列名を変更
df_renamed = df.rename(columns={'name': 'Name', 'age': 'Age'})

# 出力
print(df_renamed)
ゆーや
ゆーや

ここで、columns引数を使って辞書形式で「元の列名」と「新しい列名」を指定します。複数の列を同時に変更できる点が便利です。

インデックスを変更する

import pandas as pd

# サンプルデータ
data = {
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35],
    'city': ['New York', 'Los Angeles', 'Chicago']
}

# データフレームの作成
df = pd.DataFrame(data)

# インデックスを変更
df_renamed = df.rename(index={0: 'A', 1: 'B', 2: 'C'})

# 出力
print(df_renamed)
ゆーや
ゆーや

インデックス名を変更する場合も、renameを使用できます!

元のデータフレームを保持するか上書きするか

import pandas as pd

# サンプルデータ
data = {
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35],
    'city': ['New York', 'Los Angeles', 'Chicago']
}

# データフレームの作成
df = pd.DataFrame(data)

# 元のデータを直接変更
df.rename(columns={'name': 'Name', 'age': 'Age'}, inplace=True)

# 出力
print(df)

renameの応用

ゆーや
ゆーや

ただし、inplace=Trueは推奨されなくなる可能性があるため、新しい変数に代入する方法が一般的です!

関数で列名やインデックスを一括変更

import pandas as pd

# サンプルデータ
data = {
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35],
    'city': ['New York', 'Los Angeles', 'Chicago']
}

# データフレームの作成
df = pd.DataFrame(data)

# すべての列名を大文字に変換
df_renamed = df.rename(columns=str.upper)

# 出力
print(df_renamed)
ゆーや
ゆーや

renameでは、関数を使って名前を一括変更することもできます。

ラムダ関数を使った柔軟な変更

import pandas as pd

# サンプルデータ
data = {
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35],
    'city': ['New York', 'Los Angeles', 'Chicago']
}

# データフレームの作成
df = pd.DataFrame(data)

# すべての列名に_infoを追加
df_renamed = df.rename(columns=lambda x: x + '_info')

# 出力
print(df_renamed)
ゆーや
ゆーや

ここまで押さえておけば、ほとんど困らないね!

まとめ

Pandasのrenameメソッドは、シンプルながらも非常に強力な機能を持っています。

列名やインデックス名を変更するだけでなく、データの可読性や整合性を向上させるための重要なツールです。

この記事で紹介した基本的な使い方や応用例を参考にして、日々のデータ操作に役立ててください。

コメント

タイトルとURLをコピーしました