August 16th, 2016 by Silversurger

In meinem Artikel über Batting-Statistiken von letzter Woche bin ich bereits ein bisschen auf der Frage herumgeritten, wie man die Leistung oder den Wert einzelner Spieler in Form von Runs ausdrücken kann, und letztlich auf den sehr nützlichen Indikator Runs Created (RC) gestoßen. Heute möchte ich eine weitere Möglichkeit vorststellen, Spielereignisse in Runs zu übersetzen: die Anwendung linearer Gewichte.

Der Begriff lineare Gewichte (englisch: linear weights) klingt erstmal furchtbar wissenschaftlich und kompliziert. Tatsächlich stehen dahinter zwei einfache und nachvollziehbare Gedanken. Der erste Gedanke ist, dass jedes Ereignis im Spiel einen messbaren Einfluss auf alle folgenden Ereignisse und somit letztlich auf das Ergebnis hat. Das ist mit Linearität gemeint. Der zweite Gedanke ist, dass der Einfluss unterschiedlicher Ereignisse unterschiedlich groß ist: ein Triple bei voll geladenen Bases und keinem Aus ist mehr wert als ein Walk bei leeren Bases und zwei Aus. Daher muss man die Ereignisse unterschiedlich gewichten. Wendet man beide Grundgedanken an, so erhält man lineare Gewichte, also konkrete Wertangaben in Form von Runs für jedes einzelne Spielereignis in jeder denkbaren Situation. Man kann dann zum Beispiel die Frage beantworten, wie viele Runs ein Double bei einem Aus und mit einem Runner auf der ersten Base wert ist.

Wie berechnet man lineare Gewichte?
Als erstes braucht man eine Erwartungsmatrix für Runs. Das heißt, man legt eine Tabelle an, die in den Zeilen die verschiedenen Besetzungsmöglichkeiten der drei Bases aufführt und in den Spalten die Möglichkeiten, wie viele Spieler innerhalb eines Innings aus sein können (0, 1 oder 2). Dann rechnet man mit Hilfe vorhandener Spielergebnisse (beispielsweise aller MLB-Spiele des letzten Jahres oder der letzten fünf Jahre) aus, wie viele Runs aus den jeweiligen Situationen heraus im Durchschnitt erzielt wurden. Das sieht dann zum Beispiel so aus (Berechnung von Tom Tango für 2010-2015):

Base-Besetzung 0 Aus 1 Aus 2 Aus
leer_leer_leer 0.481 0.254 0.098
1B_leer_leer 0.859 0.509 0.224
leer_2B_leer 1.100 0.664 0.319
1B_2B_leer 1.437 0.884 0.429
leer_leer_3B 1.350 0.950 .0353
1B_leer_3B 1.784 1.130 0.478
leer_2B_3B 1.964 1.376 0.580
1B_2B_3B 2.292 1.541 0.752

Zu Beginn eines Innings (0 Aus, Bases leer) ist mit etwas weniger als einem halben Run zu rechnen. Mit jeder Plate Appearance ändert sich die Erwartung: Nach einem Aus und immer noch leeren Bases ist nur noch mit einem viertel Run zu rechnen. Werden nun ohne weiteres Aus nach und nach die Bases geladen, steigt die Erwartung an und liegt schließlich (1B_2B_3B, 1 Aus) bei gut eineinhalb Runs. Die Erwartung bezieht sich immer auf Runs ab dem jeweiligen Zeitpunkt bis zum Ende des Innings; bereits erzielte Runs in dem Inning spielen dafür keine Rolle.

Auf Basis dieser Erwartungsmatrix kann man im zweiten Schritt für jedes Spielereignis ausrechnen, welchen Wert es durchschnittlich besitzt. Dazu addiert man die durch das Ereignis direkt erzielten Runs mit der (positiven oder negativen) Änderung des Erwartungswertes für den Rest des Innings. Ein Walk ist dann beispielsweise im Durchschnitt 0,33 Runs wert, ein Single 0,46 Runs, ein Homerun 1,4 Runs, eine gestohlene Base 0,2 Runs, beim Basestehlen erwischt zu werden -0,45 Runs, ein Strikeout -0,3 Runs usw. Diese Werte schwanken etwas je nach verwendetem Bezugsrahmen, die Größenordnungen und Relationen sind jedoch relativ stabil.

Beurteilung von Battingleistungen
Es liegt auf der Hand, dass man die aus linearer Gewichtung erlangten Erkenntnisse über den Wert einzelner Spielereignisse nutzen kann, um die Leistung eines Spielers zu bewerten. Ein Beispiel für einen Indikator, der auf diese Weise Battingleistungen beurteilt, ist weighted On-Base Average (wOBA). Diese von dem bereits oben zitierten Baseballanalytiker Tom Tango entwickelte Statistik verwendet die linearen Gewichte für Walks, Hit-by-Pitches und die verschiedenen Arten von Hits. Diese versieht sie zusätzlich mit einem Faktor, der wOBA auf eine mit On-Base Percentage (OBP) vergleichbare Größenordnung überführt, um die Interpretation zu vereinfachen. Hier kann man Details zur Berechnung von wOBA nachlesen und hier kann man sich die wOBA-Rangliste der aktuellen Saison ansehen und über den alten Mann David Ortiz staunen.

Beurteilung von Pitcherleistungen
Da lineare Gewichte auf jedes Spielereignis bezogen werden können, kann man sie auf Pitcher genauso gut anwenden wie auf Batter. Auch für Pitcher hat Tom Tango einen Indikator entwickelt, der in seiner Größenordnung mit einer etablierten Kennzahl – in dem Fall ERA – vergleichbar ist. Es handelt sich um das Fielding Independent Pitching, das ich in einem früheren Artikel über Pitching-Stats schon mal behandelt habe, weshalb ich für weitere Informationen einfach mal dorthin verweise.

Siegwahrscheinlichkeiten
Eine nette Spielerei, die ich gern und häufig nutze, ist die graphische Darstellung sich ändernder Siegwahrscheinlichkeiten auf fangraphs.com. Auch diese Schaubilder, die während laufender Spiele ständig aktualisiert werden, basieren auf linearen Gewichten. Jedes Spiel beginnt unter der Annahme einer 50:50-Wahrscheinlichkeit und entwickelt sich dann in Abhängigkeit von den einzelnen Spielereignissen. Wenn man unter der jeweiligen Grafik auf „Play Log“ klickt, dann kann mehr sehr genau nachvollziehen, welches Ereignis sich wie auf den wahrscheinlichen Spielausgang ausgewirkt hat.

Zum Abschluss ein schönes Beispiel, dass man sich auf Wahrscheinlichkeiten nie zu sehr verlassen sollte und wie schnell es im Baseball manchmal gehen kann: von 98,4% Siegwahrscheinlichkeit auf 4,9% in einem halben Inning.

Posted in MLB, Statistik Tagged with: , , , , , , , , ,