Login Registrati Connettiti via Facebook



Non sei registrato o connesso al forum.
Effettua la registrazione gratuita o il login per poter sfruttare tutte le funzionalità del forum e rimuovere ogni forma di pubblicità invasiva.

Condividi:
Statistiche avanzate
Avevo pensato a Pinot ma quella ottava stagione mi ha fatto cambiare idea
 
Rispondi
Non e' nemmeno Pinot.

Sveliamo il nome: Richie Porte
 
Rispondi
La visualizzazione completa qui. Lo condivido solo con voi al momento per pareri/commenti/critiche (e anche perche', come potrete notare, mancano molte foto Asd ). Se qualcosa non e' chiaro fatemi sapere! Domani penso di pubblicarlo in altri lidi.
 
Rispondi


[+] A 1 utente piace il post di lordkelvin
(03-01-2020, 05:33 PM)Young Signorino Ha scritto: La visualizzazione completa qui. Lo condivido solo con voi al momento per pareri/commenti/critiche (e anche perche', come potrete notare, mancano molte foto Asd ). Se qualcosa non e' chiaro fatemi sapere! Domani penso di pubblicarlo in altri lidi.

che formula usi per determinare la GT specialisation?
 
Rispondi
(03-01-2020, 05:43 PM)cyclingchronicles Ha scritto:
(03-01-2020, 05:33 PM)Young Signorino Ha scritto: La visualizzazione completa qui. Lo condivido solo con voi al momento per pareri/commenti/critiche (e anche perche', come potrete notare, mancano molte foto Asd ). Se qualcosa non e' chiaro fatemi sapere! Domani penso di pubblicarlo in altri lidi.

che formula usi per determinare la GT specialisation?

La percentuale del numero di punti guadagnati grazie alle classifiche nelle corse a tappe rispetto al totale. Diciamo che non e' una grandezza perfetta, ma fa il suo lavoro. Ovviamente andrebbero considerati anche i punti che vengono guadagnati in alcune tappe di montagna o nelle crono nel calcolo, ma e' difficile discernere quali di queste singole tappe vada ad impattare il conteggio finale e quali no (sarebbe da andare a vedere tappa per tappa, ma e' troppo lavoro, e magari anche inutile alla fine).

Per esempio, un corridore come Ciccone che vince un paio di tappe di montagna ma arriva molto dietro in classifica ha una specializzazione al momento molto bassa, mentre Sivakov (per prendere l'opposto) che magari ottiene meno vittorie, ma si piazza in alto nelle classifiche generali in quasi ogni corsa a tappe a cui partecipa ha una percentuale piu' alta.

Comunque credo funzioni meglio nel grafico in basso, quando si va a vedere il singolo andamento durante la carriera. Tipo si vede come G ad un certo punto abbia iniziato a interessarsi alle corse a tappe abbandonando, di fatto, le corse di un giorno.
 
Rispondi


[+] A 3 utenti piace il post di lordkelvin
Da cell la piattaforma è molto macchinosa.
 
Rispondi
(03-01-2020, 05:56 PM)Luciano Pagliarini Ha scritto: Da cell la piattaforma è molto macchinosa.

Quello e' un problema di Tableau ahime', e' pesantissimo non appena crei piu' di un grafico
 
Rispondi
Complimenti per il lavoro.

Ti segnalo solo che quando selezioni gli insights di un singolo corridore la foto non corrisponde.
 
Rispondi
(03-01-2020, 06:16 PM)Paruzzo Ha scritto: Complimenti per il lavoro.

Ti segnalo solo che quando selezioni gli insights di un singolo corridore la foto non corrisponde.

Grazie mille!

Si si l'unica cosa che mi manca da fare e' finire di aggiornare le foto, delle quali ancora non sono super convinto..
 
Rispondi
Per la gt spec secondo me bisognerebbe trovare un coefficiente che misuri per quante stagioni consecutive un corridore fa la maggioranza dei punti in classifiche generali. Dopo provo a spiegarmi meglio e a fare due conti.


Mi spiego ... il valore che ricavi deve essere moltiplicato per un coefficiente che misura in maniera direttamente proporzionale il numero di anni consecutivi in cui la ratio (punti nelle classifiche generali)/ (punti totali) sorpassa una certa soglia (es 0.45 0.5). Perché così il valore risente tantissimo di small sample size. il fatto che Porte per 10 anni di fila (sto sparando numeri più o meno a caso) tiri fuori la maggioranza dei suoi risultati da classifiche generali è un valore aggiunto rispetto a Sivakov che fa una stagione come la scorsa. Non perché penso che Porte sia meglio di Sivakov per una classifica generale di una qualsiasi corsa, ma perché dimostra una propensione maggiore maturata nel tempo. Un ragazzo di 23 anni da compiere ha chiaramente una carriera davanti in cui le sue caratteristiche possono anche entro certi limiti mutare e può esplorare aspetti diversi del suo essere un ciclista.

Per quanto riguarda invece quello che dicevi su ciccone invece secondo me il dato e coerente. Lui ha comunque vissuto di fughe da lontano in tappe e traguardi parziali. La tenuta giorno dopo giorno su 3 settimane (ma anche 1) è ancora da pesare in via definitiva e ci sta che la risultante lo mostri.

2 cose:
1- chiaramente si sta tentando di combinare euristica a scientificità e rigore e non è una cosa così semplice. Pure quello che dico qui è passibile di correzioni o di essere una cazzata bella e buona.
2- le mie obiezioni sono la classica puntina al c***o. Hai fatto, come sempre quando non ascolti i miei consigli sul fantacross, un lavoro eccezionale
 
Rispondi


[+] A 1 utente piace il post di cyclingchronicles
D'accordissimo, ci avevo pensato anche io a questa cosa, ma non ho voglia/tempo di metterci mano ora Asd Sarebbe comunque interessante da vedere. Come detto, diciamo che e' solo un'indicazione a grandi linee dell'affinita' di un certo corridore alle corse a tappe.

Invece, come scrivevo anche sopra, sto pensando ad un modello per stimare i punti per giorno di corsa per la prossima stagione, ma ho dubbi sulla fattibilita', in primis su quanti e che dati servono.
La mia idea e' di stimare i punti in base alla stagione da pro e ovviamente all'eta'. Ci ho gia' provato a tempo perso con i dati sopra, ovviamente ne esce una polinomiale molto simile ad una gaussiana. Il problema e' come adattare il modello ad ogni singolo corridore poi. Pensavo a calcolare la derivata prima delle precedenti stagioni ed usarla come fatto di correzione, oltre ad usare la distanza media del singolo ciclista dal modello come fattore correttivo per un specifico corridore che performi sopra o sotto la media diciamo. Non ho ancora approfondito eventuali tecniche per farlo, pero' se hai qualche idea e hai voglia di scrivere, sono aperto a qualsiasi input!
 
Rispondi
Ho cambiato un po' di cose nella visualizzazione di ieri. Per prima cosa ho tolto le foto (sostituite con squadra ed eta'). Come seconda cosa, ho perso un po' di tempo per far si che i dati nei primi due grafici possano essere visualizzati con tre diversi assi x (stagione da pro, anno, o eta' del corridore).

 
Rispondi

Appena posso faccio anche quello per le donne. Qua il link per la visualizzazione interattiva. Purtroppo mi si e' rotto il PC quindi al momento questo e' tutto quello che riesco a fare, quindi nulla di complicato questa volta Asd
 
Rispondi


[+] A 1 utente piace il post di lordkelvin
 
Rispondi
 
Rispondi
Pensavo che sarebbe una figata avere un software che permetta di calcolare il rendimento di un corridori in determinati tipi di contesti.

Cerco di spiegarmi: un software che calcoli il rendimento di un corridore, ad esempio, su salite di una lunghezza compresa tra i 3 e 5 chilometri, piuttosto che in gare di 240+ chilometri o su salite che superano i duemila metri di altitudine ecc...

Magari che mi dia oltre alla media dei piazzamenti anche la media dei distacchi dal primo.

Sarebbe interessante per capire come rende un corridore in un determinato contesto e per perfezionare il tipo di analisi che già facciamo qua sopra.
 
Rispondi


[+] A 1 utente piace il post di Luciano Pagliarini
Avendo i dati non sarebbe una cosa difficile. Prova a buttarla la a quelli di FC :)

Tempo fa ero in contatto con Thomas per creare una pagina avanzata di stats da loro, ma poi non si è più fatto nulla.

Penso sia un'ottima idea comunque.
 
Rispondi
(18-09-2020, 10:24 PM)Luciano Pagliarini Ha scritto: Cerco di spiegarmi: un software che calcoli il rendimento di un corridore, ad esempio, su salite di una lunghezza compresa tra i 3 e 5 chilometri, piuttosto che in gare di 240+ chilometri o su salite che superano i duemila metri di altitudine ecc...

Magari che mi dia oltre alla media dei piazzamenti anche la media dei distacchi dal primo.

Sarebbe interessante per capire come rende un corridore in un determinato contesto e per perfezionare il tipo di analisi che già facciamo qua sopra.

ci ho pensato su un momento... un dataframe si potrebbe anche costruire usando il nome del corridore come chiave (tipo il modello iris che si usa per imparare a fare datascience con R o python). La rottura grossa dovrebbe essere il parsing dei risultati dal sito ma se come dice igor ti metti in contatto con chi quei risultati li pubblica diventa tutto molto più sormontabile.

Poi una volta che hai il DF puoi pure usare diversi modelli per il calcolo w/kg o altri dati. Chiaro che rimarresti nel campo delle stime, però è una cosa che se offerta da un sito sarebbe anche una bella pedata nel sedere a PCS e alle stats che pubblicano loro. 

Come ti dicevo però la ratio spesa/resa è alta. se coinvolgi FC che in un certo senso lo fa di mestiere, hanno un bell'incentivo
 
Rispondi


[+] A 2 utenti piace il post di cyclingchronicles
I risultati ce li hanno, basta fare varie classificazioni alle corse/tappe ed è fatto
 
Rispondi
Si, il problema numero uno e' avere i dati: come dicevo e dite anche voi, basarsi sul database di FC e' la cosa migliore. Potenzialmente non e' complicato fare lo scraping di ogni singola pagina di ogni ciclista su FC, pero' non e' molto corretto nei loro confronti, in quanto hanno speso un bel po' di tempo per allestire il database (ok dargli credito, ma qua si parla di scaricare tutti i dati che hanno in pratica).

Secondo, bisogna definire il modo in cui raggruppare il singolo ciclista in ogni categoria. Come dice Giacomo, un dataframe (una tabella) sarebbe la soluzione migliore ovviamente. Avendo il nome del ciclista, esempi di colonne potrebbero essere:
1) tipo di corsa (un giorno, tappa corsa a tappe, altro?)
2) percorso (pianura, collina, montagna, montagna arrivo in salita, ITT, pave', etc)
3) gruppo dislivello (<1000, 1001-2000, etc.)
4) lunghezza tappa (<150, 150-175, etc.)
5) indice di difficolta (per capire quanto distante stanno le salite dal traguardo)
6) altro?
7) il dato che vuoi misurare #1: posizione media (17.1, etc.)
8) il dato che vuoi misurare #2: xxxxx

in questo modo, facendo una query su questa tabella con i seguenti filtri:
1) tappa corsa a tappe - 2) montagna 3) 4000-5000 4) 200-225 5) 2(giusto per sparare un numero)

ti escono tutte le misure in base a questi filtri per ogni corridore (ovvero posizione media, misura #2, etc..)

Ovviamente questi filtri esisterebbero solo nel backend, l'unica cosa che l'utente dovrebbe fare, una volta creato propriamente il database, e' selezionare i filtri che vuole.
 
Rispondi


[+] A 3 utenti piace il post di lordkelvin
  


Vai al forum:


Utente(i) che stanno guardando questa discussione: 1 Ospite(i)