20-09-2019, 10:08 AM
Ciao a tutti.
Questo post rischia di essere decisamente ot quindi i mods si sentano liberi di spostarlo. Alla base di quanto segue c’è il fatto che oltre a essere un sucker per il ciclismo lo sono anche per la data science e mi piacerebbe molto mettere insieme le due cose. In questo senso ho abbozzato una serie di progetti che poi per ragioni di tempo, o di altra natura, non ho mai concretizzato. Una delle cose che più mi interesserebbe fare è quella di scrivere degli script che consentano di estrarre informazioni utili dai pdf race analysis prodotti dalla UCI a fine gara, specie per quanto riguarda cx e mtb xc. Nella mia idea si tratterebbe di prendere i pdf passarli a file excel o csv e darli impasto come dataset a uno script di R o python (se preferite anche mathematica ma non tutti hanno la licenza, o ancora c++ però diventa una noia scrivere le classi) per estrarre informazioni. Una buona base di lavoro potrebbe essere quella di iniziare a fare il lavoro che fanno/facevano quelli di cx laps. Chiaramente con l’ipotesi di estendere la cosa, anche perché loro in sostanza prendevano i tempi sul giro dei primi e li graficavano. In questo senso starei cercando altre persone che sono potenzialmente interessate a collaborare a un progetto del genere. Niente di eccessivamente impegnativo, se si conosce giusto un minimo di coding, a cui dedicare un po’ di tempo. Sentitevi liberi di mandarmi un pm se la cosa vi stuzzica.
Questo post rischia di essere decisamente ot quindi i mods si sentano liberi di spostarlo. Alla base di quanto segue c’è il fatto che oltre a essere un sucker per il ciclismo lo sono anche per la data science e mi piacerebbe molto mettere insieme le due cose. In questo senso ho abbozzato una serie di progetti che poi per ragioni di tempo, o di altra natura, non ho mai concretizzato. Una delle cose che più mi interesserebbe fare è quella di scrivere degli script che consentano di estrarre informazioni utili dai pdf race analysis prodotti dalla UCI a fine gara, specie per quanto riguarda cx e mtb xc. Nella mia idea si tratterebbe di prendere i pdf passarli a file excel o csv e darli impasto come dataset a uno script di R o python (se preferite anche mathematica ma non tutti hanno la licenza, o ancora c++ però diventa una noia scrivere le classi) per estrarre informazioni. Una buona base di lavoro potrebbe essere quella di iniziare a fare il lavoro che fanno/facevano quelli di cx laps. Chiaramente con l’ipotesi di estendere la cosa, anche perché loro in sostanza prendevano i tempi sul giro dei primi e li graficavano. In questo senso starei cercando altre persone che sono potenzialmente interessate a collaborare a un progetto del genere. Niente di eccessivamente impegnativo, se si conosce giusto un minimo di coding, a cui dedicare un po’ di tempo. Sentitevi liberi di mandarmi un pm se la cosa vi stuzzica.