Ajouter une colonne vide à Pandas DataFrame

Samreena Aslam 30 janvier 2023
  1. Ajouter des colonnes vides dans Pandas DataFrame à l’aide de l'opérateur d'affectation
  2. Ajouter une colonne vide dans Pandas DataFrame à l’aide de la méthode DataFrame.assign()
  3. Ajouter une colonne vide dans Pandas DataFrame à l’aide de la méthode DataFrame.reindex()
  4. Ajouter une colonne vide dans Pandas DataFrame à l’aide de la méthode DataFrame.insert()
  5. Ajouter une colonne vide dans Pandas DataFrame à l’aide de la méthode DataFrame.apply()
  6. Conclusion
Ajouter une colonne vide à Pandas DataFrame

Les pandas proposent également une fonctionnalité permettant d’ajouter une ou plusieurs colonnes vides au DataFrame (table). Il existe différentes façons d’ajouter facilement des colonnes vides dans le Pandas DataFrame.

Nous allons montrer dans ce tutoriel comment ajouter une ou plusieurs colonnes vides dans Pandas DataFrame en utilisant diverses approches telles que l’utilisation de l'opérateur d'affectation et en utilisant le assign(), insert(), reindex(), et apply() méthodes. Nous montrerons également la mise en œuvre de chaque méthode pour expliquer brièvement le fonctionnement de chaque approche.

Ajouter des colonnes vides dans Pandas DataFrame à l’aide de l'opérateur d'affectation

En utilisant l’opérateur d'affectation ou la chaîne vide, nous pouvons ajouter des colonnes vides dans Pandas DataFrame. Et en utilisant cette approche, les valeurs nulles ou NaN sont attribuées à n’importe quelle colonne du DataFrame.

Dans l’exemple suivant, nous avons créé un DataFrame, puis à l’aide de l'opérateur d'affectation, nous avons attribué des valeurs de chaîne vide et NaN à deux colonnes nouvellement ajoutées comme dans le Pandas DataFrame. Ces colonnes sont Address et Designation. A l’aide de la bibliothèque NumPy, nous allons importer les valeurs NaN dans la colonne DataFrame.

Voyons comment ajouter les colonnes vides au DataFrame dans Pandas à l’aide de l'opérateur d'affectation ou chaîne vide.

Exemple de code :

import pandas as pd
import numpy as np

company_data = {
    "Employee Name": ["Samreena", "Mirha", "Asif", "Raees"],
    "Employee ID": [101, 102, 103, 104],
}
dataframe = pd.DataFrame(company_data)
print("------------ Original DataFrame --------------\n", dataframe)

# Add empty column using Assignment operator
dataframe["Blank_Column"] = " "
dataframe["Address"] = np.nan
dataframe["Designation"] = None
print("------------ After Adding Empty Columns ---------------\n", dataframe)

Production :

------------ Original DataFrame --------------
   Employee Name  Employee ID
0      Samreena          101
1         Mirha          102
2          Asif          103
3         Raees          104
------------ After Adding Empty Columns ---------------
   Employee Name  Employee ID Designation  Address
0      Samreena          101                  NaN
1         Mirha          102                  NaN
2          Asif          103                  NaN
3         Raees          104                  NaN

Ajouter une colonne vide dans Pandas DataFrame à l’aide de la méthode DataFrame.assign()

La méthode DataFrame.assign() est utilisée pour ajouter une ou plusieurs colonnes au DataFrame. L’application de la méthode assign() sur un DataFrame renvoie un nouveau DataFrame après avoir ajouté les nouvelles colonnes vides dans le DataFrame existant de Pandas.

Exemple de code :

import pandas as pd
import numpy as np

company_data = {
    "Employee Name": ["Samreena", "Mirha", "Asif", "Raees"],
    "Employee ID": [101, 102, 103, 104],
}
dataframe1 = pd.DataFrame(company_data)
print("------------ Original DataFrame --------------\n", dataframe1)

# Add empty column into the DataFrame using assign() method
dataframe2 = dataframe1.assign(Designation=" ", Empty_column=np.nan, Address=None)
print("------------ After Adding Empty Columns ---------------\n", dataframe2)

Production :

------------ Original DataFrame --------------
   Employee Name  Employee ID
0      Samreena          101
1         Mirha          102
2          Asif          103
3         Raees          104
------------ After Adding Empty Columns ---------------
   Employee Name  Employee ID Designation  Empty_column Address
0      Samreena          101                       NaN    None
1         Mirha          102                       NaN    None
2          Asif          103                       NaN    None
3         Raees          104                       NaN    None

Ajouter une colonne vide dans Pandas DataFrame à l’aide de la méthode DataFrame.reindex()

La méthode DataFrame.reindex() a attribué des valeurs NaN aux colonnes vides dans le Pandas DataFrame. Cette méthode reindex() prend la liste des colonnes existantes et nouvellement ajoutées. En utilisant cette méthode, nous pouvons ajouter des colonnes vides à n’importe quel emplacement d’index dans le DataFrame.

Dans l’exemple suivant, nous avons créé une nouvelle DataFrame avec des noms à deux colonnes comme Employee Name et Employee ID. Plus tard, nous avons utilisé la méthode dataframe.reindex() pour ajouter deux nouvelles colonnes, Adresse et Désignation, à la liste des colonnes avec les valeurs NaN attribuées.

Exemple de code :

import pandas as pd
import numpy as np

company_data = {
    "Employee Name": ["Samreena", "Mirha", "Asif", "Raees"],
    "Employee ID": [101, 102, 103, 104],
}
dataframe1 = pd.DataFrame(company_data)
print("------------ Original DataFrame --------------\n", dataframe1)

# Pandas Add empty columns to the DataFrame using reindex() method
dataframe2 = dataframe1.reindex(
    columns=dataframe1.columns.tolist() + ["Designation", "Address"]
)
print("------------ After Adding Empty Columns ---------------\n", dataframe2)

Production :

------------ Original DataFrame --------------
   Employee Name  Employee ID
0      Samreena          101
1         Mirha          102
2          Asif          103
3         Raees          104
------------ After Adding Empty Columns ---------------
   Employee Name  Employee ID  Designation  Address
0      Samreena          101          NaN      NaN
1         Mirha          102          NaN      NaN
2          Asif          103          NaN      NaN
3         Raees          104          NaN      NaN

Ajouter une colonne vide dans Pandas DataFrame à l’aide de la méthode DataFrame.insert()

La méthode DataFrame.insert() insère une colonne vide à n’importe quelle position d’index (début, milieu, fin ou emplacement spécifié) dans le Pandas DataFrame.

Exemple de code :

import pandas as pd
import numpy as np

company_data = {
    "Employee Name": ["Samreena", "Mirha", "Asif", "Raees"],
    "Employee ID": [101, 102, 103, 104],
}
dataframe = pd.DataFrame(company_data)
print("------------ Original DataFrame --------------\n", dataframe)

# Pandas Add empty columns to the DataFrame using insert() method
dataframe.insert(1, "Designation", "")
print("------------ After Adding Empty Columns ---------------\n", dataframe)

Production :

------------ Original DataFrame --------------
   Employee Name  Employee ID
0      Samreena          101
1         Mirha          102
2          Asif          103
3         Raees          104
------------ After Adding Empty Columns ---------------
   Employee Name Designation  Employee ID
0      Samreena                      101
1         Mirha                      102
2          Asif                      103
3         Raees                      104

Ajouter une colonne vide dans Pandas DataFrame à l’aide de la méthode DataFrame.apply()

En utilisant la méthode DataFrame.apply() et la fonction Lambda, nous pouvons également ajouter des colonnes vides au Pandas DataFrame. Voir l’exemple suivant pour ajouter des colonnes vides au DataFrame dans Pandas à l’aide de la méthode DataFrame.apply().

Exemple de code :

import pandas as pd
import numpy as np

company_data = {
    "Employee Name": ["Samreena", "Mirha", "Asif", "Raees"],
    "Employee ID": [101, 102, 103, 104],
}
dataframe = pd.DataFrame(company_data)
print("------------ Original DataFrame --------------\n", dataframe)
# Pandas Add empty columns to the DataFrame using apply() method
dataframe["Empty_column"] = dataframe.apply(lambda _: " ", axis=1)
print("------------ After Adding Empty Columns ---------------\n", dataframe)

Production :

------------ Original DataFrame --------------
   Employee Name  Employee ID
0      Samreena          101
1         Mirha          102
2          Asif          103
3         Raees          104
------------ After Adding Empty Columns ---------------
   Employee Name  Employee ID Empty_column
0      Samreena          101             
1         Mirha          102             
2          Asif          103             
3         Raees          104    

Conclusion

Dans ce tutoriel, nous avons introduit différentes méthodes telles que assign(), insert(), apply() et reindex() pour ajouter une ou plusieurs colonnes vides dans le DataFrame des Pandas. Nous avons également montré comment ajouter les colonnes vides au DataFrame à l’aide de l'opérateur d'affectation.

Article connexe - Pandas DataFrame