mardi 18 août 2009

Ferrari

Le concassage d'informations provenant des feuilles de match de la LNH a grandement progressé au cours des derniers mois grâce au travail accompli par Vic Ferrari sur son site timeonice.com.

Après avoir, entre autres, mis en ligne une recension pour chaque partie de la ventilation du temps de glace à forces égales, Ferrari s'est lancé dans la compilation des données contenues dans les journaux d'événements des match (voici celui du dernier match de la saison du CH). Ceux-ci constituent une recension de tout les éléments identifiés dans les feuilles de match, en ordre chronologique, avec les joueurs sur la glace au moment de l'événement.

Ferrari s'est donc attaqué à ces données en compilant certaines des informations qu'on y retrouve et en les présentant dans des tableaux synthétiques. Les plus connus sont probablement à ce stade-ci les données recensant les différentiels de tirs vers le filet à 5 contre 5 (nommés CORSI) par match et par saison:

Par match: http://timeonice.com/shots.php?gamenumber=XXXXX [XXXXX représente le numéro de match, allant de 20001 à 21230]

Par saison: http://www.timeonice.com/playershots.php?team=MTL&first=20001&last=21230 [team=MTL peut être remplacé par l'acronyme d'une autre équipe et on peut sélectionner des sous échantillons de saison en modifiant les nombres de first et last]

Puis, je ne sas pas exactement quand, Ferrari a mis sur son site un script recensant, toujours à 5 contre 5, la compilation par joueur des présences aux mises en jeu, ventilées par zones:

Par saison: http://timeonice.com/faceoffsXXX.html [XXX représentant l'identifiant de l'équipe]

Par match: http://timeonice.com/faceoffs.php?gamenumber=20001

Pour ce que j'en ai compris à lire son blogue, les données de Ferrari portent toujours sur les données à 5 contre 5 parce qu'il s'agit tout simplement de la phase la plus importante du jeu; chaque équipe passe autour de 75% de sa saison dans cette situation et une équipe qui en arrache dans cette phase du jeu aura besoin de sapré bonne unités spéciales pour surnager (exemple notable: les Canadiens des dernières années), à moins de bénéficier de remarquable performances devant le filet (exemples: le Canadien de 07-08, les Bruins de 08-09).

C'est à force d'explorer ce qui s'écrit autour de ces questions que j'en suis venu à identifier certaines statistiques que j'ai l'intention d'utiliser systématiquement; je rempilerai donc sur ce que j'ai déjà écrit sur le sujet dans mon prochain billet. Ces statistiques sont le Corsi, que je nommerai +/- des tirs vers le filet (+/-TVF), la qualité des adversaires et des coéquipiers (QualAd et QualCo), simple traduction des Qualcomp/Qualteam de behindthenet.ca, le différentiel [(Mises en jeu en zone offensive) - (Mises en jeu en zone défensive)] et enfin une quelconque version du Zoneshift (je ne me suis pas encore branché sur une traduction; "Changement Zones ; ChangeZ"?) avec lesquels différents blogueurs expérimentent depuis quelque temps.

samedi 1 août 2009

Procrastination 2: La revanche

- Tom Tango est sur la brèche: il y a racisme, et il y a ce qu'il nomme "racial prejudice"; des 10 personnalités sportives les plus mal-aimées selon les lecteurs de Forbes, les 8 premiers ne sont pas des blancs...

- Tom Awad, chez PuckProspectus, nous explique en partie comment sont calculés les GVT (Goals Versus Threshold). PP sont friands de cette mesure parce que, reposant sur les tirs au but pour décliner ses trois composantes (Gardiens, Défensive, Offensive), elle permet de comparer les performances de joueurs de différente époques.

- Une belle discussion s'est déroulée autour du rôle des défenseurs et de l'évaluation qu'on peut faire de leur travail en utilisant certaines données. Un blogueur du site KuklasKorner, PuckStopsHere, a fait une série d'articles sur l'utilisation des CORSI. Outre l'hostilité ouverte (et pittoresque) avec laquelle ces billets ont été accueillis par les usagers commentant directement les articles, les observations faites sur Jan Hejda par PSH ont néanmoins été reprises par MudCrutch79, qui conteste les conclusions de PSH. Le coeur de l'argument de MC79? Hejda a bénéficié, au cours des deux dernières années, de pourcentages favorables, au niveau des arrêts en 07-08, puis des tirs au but en 08-09. PSH exprime son désaccord et une discussion s'en suit dans les commentaires.

- L'évaluation du travail des défenseurs est à la mode cette semaine; Desjardins se fend de trois articles, probablement en réponse indirecte aux discussions sus-nommées: un sur l'influence des défenseurs sur le % d'arrêts à 5 contre 5, l'autre sur leur possible influence sur les pourcentages de réussite des tirs au but et le troisième concluant sur un test WOWY (allez lire pour comprendre).. J'avoue que je ne suis pas sûr de comprendre; les échantillons ont l'air plutôt petits (28 "Top 2" et 27 "6ème défenseur"). Pas sûr qu'on n'est pas en présence de variations saisonnières normales dans les performances des gardiens concernés. En tout cas, pour moi qui suis généralement intéressé à évaluer la performance d'un joueur donné, les démonstrations faites par Desjardins ne sont pas d'une immédiate utilité. Mais bon, c'est toujours intéressant de voir confirmée une impression que tous ont: remplacer un bon défenseur par un mauvais fait baisser le pourcentage de réussite des tirs de l'équipe et fait augmenter celui de l'adversaire. Shades of Ryan O'Byrne.

- Beau retour de Vic Ferrari sur Roger Neilson, surtout sur son rôle d'innovateur. Encore une fois, les commentaires sont à lire; semble que les Shero auraient contribué à l'expansion des statistiques dans la LNH en important des méthodes familières aux Soviétiques.

- En terminant, un petit mot sur Hal Gill. Selon ce que m'a fait suivre Sébastien, Kristopher Letang et Michel Therrien ne seraient pas entichés du gros Hal Gill. Quoi que ça convienne à mes impressions initiales, soit que le gros Gill a essentiellement été utile en séries parce qu'on n'y pénalisait plus l'obstruction, la vérité serait légèrement différente...




Le tableau est un peu bâtard, mais quand même... Corsi/60 indique le différentiel du total des tirs par match, DiffCorsi le différentiel du joueur par rapport à l'équipe, Pts/60 les points, Qualcomp désigne la Qualité des adversaires selon behindthenet.ca, TOI/60 le temps de jeu à forces égales par match et enfin, le batârd pour la fin. TG/MJDZ représente le ration du temps de glace accumulé au cours de la saison sur le nombre de mises en jeu en zone défensives. Ce chiffre nous indique, notamment lorsqu'on le croise avec la qualité des adversaires affrontés, le genre de situations dans lesquelles les coach lancent tel ou tel joueur.

Si le jeune Letang est impressionnant, on doit aussi admettre que Gill n'était pas exactement protégé, tant par Therrien que par Bylsma. Le gros Gill, sans voler la job de Markov, va probablement faire un 3ème gaucher potable si, comme il le semble, Spacek joue principalement à droite.