24-09-2019, 03:32 PM
(20-09-2019, 03:50 PM)Young Signorino Ha scritto: [ -> ](20-09-2019, 10:08 AM)cyclingchronicles Ha scritto: [ -> ]Ciao a tutti.
Questo post rischia di essere decisamente ot quindi i mods si sentano liberi di spostarlo. Alla base di quanto segue c’è il fatto che oltre a essere un sucker per il ciclismo lo sono anche per la data science e mi piacerebbe molto mettere insieme le due cose. In questo senso ho abbozzato una serie di progetti che poi per ragioni di tempo, o di altra natura, non ho mai concretizzato. Una delle cose che più mi interesserebbe fare è quella di scrivere degli script che consentano di estrarre informazioni utili dai pdf race analysis prodotti dalla UCI a fine gara, specie per quanto riguarda cx e mtb xc. Nella mia idea si tratterebbe di prendere i pdf passarli a file excel o csv e darli impasto come dataset a uno script di R o python (se preferite anche mathematica ma non tutti hanno la licenza, o ancora c++ però diventa una noia scrivere le classi) per estrarre informazioni. Una buona base di lavoro potrebbe essere quella di iniziare a fare il lavoro che fanno/facevano quelli di cx laps. Chiaramente con l’ipotesi di estendere la cosa, anche perché loro in sostanza prendevano i tempi sul giro dei primi e li graficavano. In questo senso starei cercando altre persone che sono potenzialmente interessate a collaborare a un progetto del genere. Niente di eccessivamente impegnativo, se si conosce giusto un minimo di coding, a cui dedicare un po’ di tempo. Sentitevi liberi di mandarmi un pm se la cosa vi stuzzica.
Il risultato che vorresti ottenere sarebbe una cosa simile? https://stackoverflow.com/questions/4547...ebpage-pdf Non so quanto tempo avro´ nel futuro prossimo, ma ci si puo' provare. Dovrei ancora finire un progetto che ho aperto da un po´, ma sono un attimo bloccato.
scusa il ritardo nella risposta ma fino a oggi ero in altre faccende affaccendato. Sì qualcosa di molto simile. Da domani potrei anche mettermi a fare scripting per vedere cosa se ne cava fuori, anche perché io ho l'impressione che la componente di analisi poi richieda non troppo tempo (almeno in principio, poi bisogna andare a vedere come trattare i dati) anche alla luce delle librerie statistiche che ci sono a disposizione.