Python: sumar según categorías con Pandas en 5 líneas

Published by Martín Longo on

Esta pregunta me la hicieron en una entrevista y recuerdo que por alguna razón no la pude responder. Quizás, porque estaba muy bloqueado laboralmente hablando. Sucede, para que mentir.

Supongamos que tenemos un archivo llamado data.csv que tiene la siguiente data:

Quiero saber, en este caso, los goles totales por cada jugador. Claramente y para no renegar demasiado, vamos a usar Pandas para mostrar esta información.

Entonces, el código que retornaría una tabla con ello es:
import pandas as pd
df = pd.read_csv('C:\Python\data.csv')
df2 = df[["Jugador","Goles"]]
df3 = df2.groupby("Jugador").sum()
print(df3)

df es meramente la lectura del archivo. df2 es el subset, sacando las fechas. y df3 es la suma por jugador, que se ve en pantalla. Ideal para llevar una tabla de goleadores con los pibes.

Categories: Blog

Avatar photo

Martín Longo

Director de Ánimadata y Business Intelligence Engineer. Quemadísimo, escribo acá mis opiniones.