Login Registrati Connettiti via Facebook



Non sei registrato o connesso al forum.
Effettua la registrazione gratuita o il login per poter sfruttare tutte le funzionalità del forum e rimuovere ogni forma di pubblicità invasiva.

Condividi:
Statistiche avanzate
#81
(20-09-2019, 03:50 PM)Young Signorino Ha scritto:
(20-09-2019, 10:08 AM)cyclingchronicles Ha scritto: Ciao a tutti. 
Questo post rischia di essere decisamente ot quindi  i mods si  sentano liberi di spostarlo. Alla base di quanto segue c’è il fatto che oltre a essere un sucker per il ciclismo lo sono anche per la data science e mi piacerebbe molto mettere insieme le due cose. In questo senso ho abbozzato una serie di progetti che poi per ragioni di tempo, o di altra natura, non ho mai concretizzato. Una delle cose che più mi interesserebbe fare  è quella di scrivere degli script che consentano di estrarre informazioni utili dai pdf race analysis prodotti dalla UCI a fine gara, specie per quanto riguarda cx e mtb xc. Nella mia idea si tratterebbe di prendere i pdf passarli a file excel o csv e darli impasto come dataset a uno script di R o python (se preferite anche mathematica ma non tutti hanno la licenza, o ancora c++ però diventa una noia scrivere le classi) per  estrarre informazioni. Una buona base di lavoro potrebbe essere quella di iniziare a fare il lavoro che fanno/facevano quelli di cx laps. Chiaramente con l’ipotesi di estendere la cosa, anche perché loro in sostanza prendevano i tempi sul giro dei primi e li graficavano. In questo senso starei cercando altre persone che sono potenzialmente interessate a collaborare a un progetto del genere. Niente di eccessivamente impegnativo, se si conosce giusto un minimo di coding, a cui dedicare un po’ di tempo. Sentitevi liberi di mandarmi un pm se la cosa vi stuzzica.

Il risultato che vorresti ottenere sarebbe una cosa simile? https://stackoverflow.com/questions/4547...ebpage-pdf Non so quanto tempo avro´ nel futuro prossimo, ma ci si puo' provare. Dovrei ancora finire un progetto che ho aperto da un po´, ma sono un attimo bloccato.

scusa il ritardo nella risposta ma fino a oggi ero in altre faccende affaccendato. Sì qualcosa di molto simile. Da domani potrei anche mettermi a fare scripting per vedere cosa se ne cava fuori, anche perché io ho l'impressione che la componente di analisi poi richieda non troppo tempo (almeno in principio, poi bisogna andare a vedere come trattare i dati) anche alla luce delle librerie statistiche che ci sono a disposizione.
 
Rispondi
#82
https://public.tableau.com/views/UCIWCYo...share_link

Volevo giusto fare un confronto fra le varie categorie, anche se con i diversi kilometraggi e, in alcuni casi, materiali permessi non si puo' davvero trarre una conclusione oggettiva. Ho preso in considerazione come dato principale solo la velocita' media di gara, il che e' anche discutibile. Sicuro e' che la prova di Dygert ieri e' stata veramente pazzesca, basti vedere nei box plots dove si trova la sua velocita' media. Anche Dennis e Remco hanno fatto due prove ottime se confrontate con il resto dei partenti fra i pro. Le altre prove hanno un andamento piu' o meno lineare, eccetto per coloro condizionati da cadute e/o problemi meccanici.
 
Rispondi


[+] A 4 utenti piace il post di lordkelvin
#83
Una preview veloce veloce (e ancora perfezionabile) di quello di cui parlavo qualche giorno fa qui sopra. Purtroppo l'UCI non mi viene granché incontro e fa dei pdf per la race analysis che hanno una codifica illeggibile da qualsiasi script che ho provato a fare. Se qualcuno con tempo e voglia ci mette mano possiamo vedere se si fanno passi in avanti.

Coooooomunque 


XCO-ALBSTADT-FULL


XCO-ALBSTADT-NSL
 
Rispondi


[+] A 6 utenti piace il post di cyclingchronicles
#84
Ci ho provato pure io a parsare i PDF dell'UCI per l'ultimo mondiale e mi han fatto venire un nervoso...

Volevo fare un plot simile a questo con tutti i tempi intermedi delle varie crono, ma ho lasciato perdere vedendo quanto tempo stavo buttando.

Comunque linka i PDF che provo a darci un occhio anche io nei prossimi giorni.
 
Rispondi
#85

Su questo ci stavo lavorando da un po'. Non il migliore dei temi da affrontare forse, ma interessante vedere il trend degli ultimi anni. Chiaramente, sono conclusioni che uno si aspetta.

Se qualcuno (tipo Paruzzo) vuole dare un occhio allo script per estrarre i dati, qua: https://github.com/idalbo/FirstCycling_c...tion_FC.py
 
Rispondi


[+] A 2 utenti piace il post di lordkelvin
#86
Molto interessante

Cos'è BeautifulSoup?
 
Rispondi
#87
(06-10-2019, 12:03 PM)Paruzzo Ha scritto: Molto interessante

Cos'è BeautifulSoup?

E' il magnifico nome del pacchetto di Python per estrarre i dati da pagine HTML e XML Asd
 
Rispondi
#88
Perdonami eh Asd

Ma è un po' no sense farlo dal 1970 quando nel blocco orientale non esisteva il professionismo. Cioè là il ciclismo c'era eccome e la FIAC gestiva 127 paesi.

Però non correvano tra i pro, ma coi dilettanti nostri.
 
Rispondi
#89
Il fatto e': dove lo trovo un database completo con anche quei dati? Asd

Non so nemmeno se FC ha davvero tutto tutto dentro.
 
Rispondi
#90
No, ti conveniva fare le stats solo dalla caduta del muro in poi Asd
 
Rispondi
#91
Il fatto e' che non sto considerando nemmeno ora i dilettanti, tipo questi dati:

https://firstcycling.com/team.php?d=4&y=2019&vis=1

Diciamo che e' un po' complicato capire come muoversi, viste anche le varie riforme che ci sono state..
 
Rispondi
#92
Non ci siamo capiti.

Oggi NON devi considerare i dilettanti.

Ma i corridori del blocco sovietico NON correvano tra i professionisti fino alla prima parte degli anni '80 perché in URSS e in Germania Est non esisteva lo sport professionistico. Per cui è normale che a un certo momento, nella storia, ci sia stato un impennamento della presenza di certe nazioni in gruppo, ma ciò non corrisponde a reale globalizzazione, perché quei movimenti esistevano già ed erano competitivi ad altissimi livelli in una categoria, i dilettanti, che al tempo era poco lontana dal professionismo.

Per vedere se c'è stata un reale moltiplicarsi della presenza di certe nazioni in gruppo dovresti considerare solo gli ultimi 20/25 anni.
 
Rispondi
#93
Ho letto male il tuo ultimo messaggio. No chiaramente non considererei mai i dilettanti in una cosa del genere.

Comunque ripeto, hai ragione, ma trovare i dati completi e' impossibile. C'e' sicuramente una mancanza considerevole prima degli anni 90, che puo' portare a trarre conclusioni errate.

In ogni caso nella visualizzazione si possono filtrare gli anni, quindi senza dover cambiare nulla si possono vedere gli ultimi 25 anni tranquillamente.
 
Rispondi
#94

Povero Amaury
 
Rispondi
#95

Piccolo esperimento. Volevo fare la visualizzazione in R/Python, ma per ora va cosi.
 
Rispondi


[+] A 12 utenti piace il post di lordkelvin
#96
Ho finito di mettere insieme i dati per la stagione scorsa di MTB maschile (coppa del mondo e campionato mondiale)
https://www.dropbox.com/sh/xbu29lfjm89uh...jPs6a?dl=0

alla cartella si trovano indicativamente (a seconda delle gare può variare qualcosa, in base alla presenza di Start Loop o meno)

XCO_LOCALITÀ_FULL.jpeg
tempi sul giro dei primi 10 della competizione compreso lo start loop se presente o il tratto di lancio. Spesso e volentieri questo grafico perde di risoluzione sulla base del fatto che il giro di lancio è molto più breve, ma offre una prima evoluzione dell'andamento della gara dei singoli atleti. Chiaramente valore (in secondi) basso = velocità alta

XCO_LOCALITÀ_NSL.jpeg
è la zoomata del grafico precedente, si entra nel dettaglio delle prestazioni perché esclude il primo giro (qualora necessario), ed è insieme al prossimo il grafico più indicativo sulle performance. Emergono certi dati che si possono evidenziare (dopo faccio un esempio)

XCO_LOCALITÀ_GAP.jpeg
L'evoluzione dei gap rispetto a colui che poi avrebbe vinto la corsa dei primi 5. Fissando a 0 il valore del vincitore, per gli altri corridori il valore può essere positivo o negativo. Sarà interessante confrontare questi dati con il femminile e con il cx per avere delle indicazioni sull'importanza della partenza.

XCO_LOCALITÀ_STATS
È una tabella con indicazioni su tempo medio per giro (in secondi) deviazione standard -che dà un'idea di quanto costante sia il passo sui diversi giri tenuto da un atleta nella gara (attenzione costante non necessariamente vuol dire buono o cattivo) ma che purtroppo deve tenere conto di guai meccanici cadute etc, velocità media (escluso il lancio) e posizione finale.

2 disclaimer:
1- ogni consiglio critica puntualizzazione sul lavoro fatto è molto più che ben accetta, anzi...
2- mi serve avere oltre che dei feedback, anche una serie di indicazioni su cosa sarebbe interessante mostrare, se i numeri sono a disposizione chiaramente. Ogni vostro suggerimento in tal senso è oro. Anche le cose che su due piedi possono sembrare più sciocche a prima pelle possono essere importanti


vi dovevo un esempio di come può essere sfruttato:
Quest'anno il duello tra Schurter e MVDP si è concluso quasi sempre a favore dell'olandese che fino alla fine della stagione scorsa era la terza forza in campo. In attesa di confrontare l'andamento di gara tra questa stagione e la scorsa per MVDP si intravede in cosa quest'anno l'olandese è stato meglio dello svizzero, e cioè nella capacità di produrre uno sforzo enorme ( di solito ma non sempre a inizio gara), riuscendolo poi a doppiare in una seconda occasione durante l'arco della prova (generalmente il finale). 

Nove Mesto: i 2 fanno gara parallela fino all'attacco di MVDP che sembra spezzi la gara in quel frangente. Dall'analisi dei tempi sul giro risulta che nel 6o di 8 giri avevano fatto un tempo già paragonabile a quello del finale. 

Val di Sole: dopo uno starting loop in cui mettono già in difficoltà tutti MVDP doppia nel finale con un giro spaventoso librandosi di Schurter (e di Flückinger).

Lenzerheide: schema di gara molto simile a quello della Val di Sole. Nello SL (di lunghezza molto simile a un giro completo, c'è solo un piccolissimo taglio per una curva a Lenzerheide) i due mettono da subito pressione sugli altri poi nel penultimo giro MVDP attacca di nuovo e Nino non ne ha per la seconda ondata.

Le vittorie di Schurter
Valnord: Dopo il primo giro si vede che Nino non riesce più a fare quel tempo, anche considerando lo sprint finale in una gara che si è decisa proprio all'ultimo

Les Gets: Stessa identica storia. Nel finale stacca Kerschbaumer ma non è più riuscito a trovare tempi come quelli del suo primo giro

Mt St Anne: Qui il finale è anche più rilassato, ma il trend si conferma.

Una possibile conclusione di questo ragionamento è:
Nino rispetto agli altri biker non viene tanto fuori alla distanza, ma è in grado di offrire una prestazione che è paragonabile a quella dei migliori in partenza (un nome su tutti quest'anno Avancini) e paragonabile a quella dei migliori alla fine (rappresenta in un certo senso l'intersezione dei due insiemi). 
MVDP ha aggiunto qualcosa, cioè un altro giro fatto alla morte messo nel finale di gara (o quando vuole portare il secondo attacco)
 
Rispondi


[+] A 3 utenti piace il post di cyclingchronicles
#97

Anilisi delle volate e dei velocisti di quest'anno! Ho considerato squadre e gare sia WT che PCT. All'interno e' spiegato cosa ho ritenuto essere volata e cosa no, anche se ci sono stati dei casi molto difficili da analizzare.

Come sempre accetto critiche/domande/commenti. E mi scuso se c'e' qualche imprecisione, l'ammontare di dati era abbastanza corposo e posso aver fatto qualche errore negli script che ho scritto per manipolare i dati.
 
Rispondi


[+] A 4 utenti piace il post di lordkelvin
#98
Sto lavorando ad una nuova visualizzazione che prende in considerazione le performance di coloro che si sono concetrati nelle classifiche dei GT e corse a tappe brevi negli ultimi anni. Non ho ancora finito, anche perche' vorrei aggiungerci altre cose (se ci riesco), ma per ora ci sono questi quattro grafici:

   

Chi pensate sia il corridore evidenziato?

I due grafici principali mostrano quanti punti per singolo giorno di corsa ha ottenuto un corridore (usando il database di FC) e quante vittorie per ogni singola stagione fra i pro. I due grafici laterali mostrano il grado di specializzazione (percentuale dei punti nelle corse a tappe rispetto ai punti totatli, prendendo la mediana di tutte le stagioni) e la mediana dei punti totali ottenuti durante la carriera.

Ovviamente gente come Pogacar, Roglic e Valverde e' facilmente visibile. Questo e' un po' piu' impegnativo da indovinare, ma sono sicuro che ci arriverete.

Come sempre, si accettano critiche e commenti.

Vorrei anche provare ad ottenere un modello per stimare i punti per la stagione 2020, ma devo ancora pensarci se e' fattibile.
 
Rispondi


[+] A 3 utenti piace il post di lordkelvin
#99
(02-01-2020, 02:03 PM)Young Signorino Ha scritto: Chi pensate sia il corridore evidenziato?
Quintana?!
 
Rispondi
(02-01-2020, 02:11 PM)Hiko Ha scritto:
(02-01-2020, 02:03 PM)Young Signorino Ha scritto: Chi pensate sia il corridore evidenziato?
Quintana?!

Nope
 
Rispondi
  


Vai al forum:


Utente(i) che stanno guardando questa discussione: 2 Ospite(i)