Pandas y los renombres
Bueno puede llegar a pasar que cuando se este leyendo un csv en pandas se quiera realizar algún renombre de alguna columna, y es posible hacerlo con la función rename. El uso más básico se muestra a continuación:
df.rename(columns={'nombre_columna': 'nuevo_nombre_columna', 'nombre_columna2': 'nuevo_nombre_columna2'},
inplace=True)
No es necesario nombrar a todas las columnas solo a las que se le desea cambiar el nombre, es decir, si se tiene 10 columnas y solo se desea cambiar dos, solo se indica el nombre de la columna, seguido de dos puntos y el nombre nuevo para esa columna. La palabra inplace=True permite que esos cambios se vean reflejado en el dataframe en cuestión.
Suponer que se tiene un dataframe con tres campos en donde tiene por nombre hora, instalados y registrados y se quiere cambiar solo el nombre de registrado a register. Para ello hay que hacer lo siguiente:
- Leer el csv. Mira aquí para hacerlo.
- Ejecutar la sintaxis presentada al inicio, quedaría algo así
df.rename(columns= {'registrados': 'register'}, inplace=True
En la imagen uno se pueden observar unas tres cosas:
- Las lineas de código que se usan para leer un csv y hacer el cambio de nombre de columna.
- La forma en que se recibe el dataframe con el nombre del campo ‘registrados’ (cuadro superior)
- La forma en que se realiza la afectación al nombre de la columna del datagrama (cuadro inferior). Ya con el nombre “register”
Notas:
- Hay que colocar el nombre de la columna que se quiere afectar exactamente cómo se encuentra. Es decir, puede que tenga un espacio en blanco y al ejecutar la función rename de pandas no se vea ningún efecto. O se tenga una letra de más que no se haya visto.
El código fuente de este ejercicio lo encuentras en el git