On cherche a trouver des méthodes pour classer toutes les parties jouées dans des cases selon quel mode ont-ils pris, le nombre de joueurs, la date etc.
pour faire cela il faudrait donc ouvrir le document, que le logiciel differencie les données qu’il recoit (la date differenciée du nombre de joueurs par exemple)
puis qu’il arrive a créer de nouvelles colones pour trier les parties. d’abord deux grandes colones pour apocalipse et une autre pour origine, une colone pour la date et l’heure puis une colone de valeur 1 pour pouvoir les compter en parties par jour.
h.google.com/drive/1F85HKIH9SzVGADUjnZytJElTsYSYEDfg?usp=sharing mon google colab
import pandas as pd
from google.colab import files
data_to_load = files.upload()
matches= pd.read_csv('BORDEAUX matches.csv',encoding = "ISO-8859-1")
def simplifie_date(val):
return str(val).split('T')[0]
indexNames = matches[matches['startDatetime'].isnull()|matches['game'].isnull()|matches['__v'].isnull()].index
matches.drop(indexNames , inplace=True)
matches['date']=matches['startDatetime'].apply(simplifie_date)
matches['équipe']=1
games = matches.groupby("game")
origine= games.get_group('5fc126fcabc9c6bb54078531')
apocalypse=games.get_group('604743157d0d2804c8abb4f8')
origine_players=origine.groupby(['date'])['__v'].agg('sum').to_frame()
origine_equipe=origine.groupby(['date'])['équipe'].agg('sum').to_frame()
origine_matches=pd.DataFrame()
origine_players_equipe = pd.merge(origine_players,origine_equipe, on='date')
dico={'__v':'players_origine','équipe':'equipe_origine'}
origine_players_equipe.rename(columns=dico,inplace=True)
apocalypse_players=apocalypse.groupby(['date'])['__v'].agg('sum').to_frame()
apocalypse_equipe=apocalypse.groupby(['date'])['équipe'].agg('sum').to_frame()
apocalypse_matches=pd.DataFrame()
apocalypse_players_equipe = pd.merge(apocalypse_players,apocalypse_equipe, on='date')
apocalypse_players_equipe.rename(columns={'__v':'players_apocalypse','équipe':'equipe_apocalypse'},inplace=True)
origine_apocalypse_jour = pd.merge(origine_players_equipe,apocalypse_players_equipe, on='date')
origine_apocalypse_jour['players']=origine_apocalypse_jour['players_origine']+origine_apocalypse_jour['players_apocalypse']
origine_apocalypse_jour['equipes']=origine_apocalypse_jour['equipe_origine']+origine_apocalypse_jour['equipe_apocalypse']
origine_apocalypse_jour.to_excel('1matches_origine_apocalypse_jour.xlsx',sheet_name='bordeaux')
import matplotlib.pyplot as plt
graphiques=['players_origine','players_apocalypse','players','equipe_origine','equipe_apocalypse','equipes']
ax=origine_apocalypse_jour.plot(y=graphiques,grid=True,kind="bar",figsize=(20,10))
ax.set_ylabel('nombre de joueurs par jour')
ax.set_xlabel('date')
plt.show()