August 7th, 2016 by Silversurger

Hier ist der versprochene zweite Teil meiner Erklärartikel über Batting-Statistiken. Im ersten Teil habe ich mit der klassischen Slashline sowie mit dem direkt daraus ableitbaren Indikator OPS beschäftigt. Heute stelle ich ein paar weitere Möglichkeiten vor, die Fähigkeiten eines Batters oder besser gesagt bestimmte Teilaspekte davon zu messen und seinen Beitrag zum Erfolg des Teams zu beurteilen. Demnächst folgt ein Artikel über Statistiken, die sich dem großen Ganzen über lineare Gewichtung nähern. Weitere bereits veröffentlichte Statistikartikel findet man am einfachsten über die Kategorien-Navigation dieser Seite (oder durch Klick hier).

Walk-to-Strikeout-Ratio (BB/K)
Der Name dieser Kennzahl sagt eigentlich schon alles: Sie misst, in welchem Verhältnis bei dem jeweiligen Batter Walks und Strikeouts zueinander stehen. Ihr Nutzen besteht darin, die Plate Discipline eines Batters und seinen Blick für die Strikezone zu beurteilen. Für diese begrenzte Fragestellung ist BB/K ein sehr nützliches Maß.

In den letzten Jahren sind Walks in der MLB etwas seltener geworden, während die Häufigkeit von Strikeouts deutlich gestiegen ist. Entsprechend sind die Spitzen- und Durchschnittswerte für BB/K gesunken und nur wenige Batter schaffen es heutzutage, mehr Walks als Strikeouts zu erzielen. In diesem Jahr gibt es nur zwei qualifizierte Spieler, denen das für die aktuelle Saison bisher gelungen ist: Ben Zobrist führt die Liste an mit 1.13 B/SO, gefolgt von Bryce Harper. In früheren Zeiträumen wurden weit höhere Werte erzielt. Der unbestrittene historische Meister dieses Faches ist Joe Sewell, der 1932 den Rekord von 18.67 BB/K in einer Saison aufstellte und auch den zweiten und dritten Platz in dieser Liste belegt. Sewell führt auch die Karriere-Rangliste an, mit 7.39 BB/K und großem Abstand auf den zweitplatzierten Monk Cline (6.33). Angesichts dieser Dimensionen nimmt sich die Karriereleistung des besten noch aktiven Spielers geradezu bescheiden aus: Albert Pujols steht bei 1.17 BB/K. In heutigen Relationen betrachtet ist das übrigens alles andere als bescheiden, denn kein anderer aktiver Spieler erreicht derzeit einen Wert von 1 oder höher.

Runners In Scoring Position (RISP)
Der Kürze wegen redet man oft von RISP, gemeint ist eigentlich der Indikator BA/RISP, also Batting Average With Runners In Scoring Position – der Schlagdurchschnitt eines Batters, wenn sich mindestens ein Baserunner bereits auf der zweiten oder dritten Base befindet. Ziel dieser Statistik ist zu beurteilen, wie gut der Batter in Situationen ist, in denen es besonders wichtig oder hilfreich ist, einen Hit zu erzielen (sog. Clutch-Situations). Die Aussagekraft und der Nutzen von RISP-Statistiken sind umstritten und das mit einigem Recht. Tatsächlich hat sich immer wieder, wenn man das Phänomen RISP unter die Lupe genommen hat, zweierlei gezeigt: 1. Die Fähigkeit von Teams und Spielern, Hits mit Runnern in Scoringposition zu erzielen, trägt weit weniger zu Sieg und Niederlage bei als die generelle Fähigkeit, Hits zu erzielen. 2. Ob ein Spieler mehr oder weniger erfolgreich mit RISP ist, hängt eher mit Zufall und Umgebungsfaktoren zusammen als mit einer bestimmten dem Spieler zuzuschreibenden Fähigkeit. Das zeigt sich vor allem daran, dass der Unterschied zwischen RISP- und Nicht-RISP-Werten einzelner Spieler von Saison zu Saison sehr stark schwankt. Gäbe es den sogenannten Clutch-Hitter, so müsste man diesen daran erkennen, dass er einigermaßen konstant höhere RISP-Werte erzielt. Das Thema (oder besser das Nicht-Thema) RISP wäre mal einen eigenen Artikel wert. Einstweilen kann man sich, wenn man es genauer wissen möchte, hier, hier oder hier ein bisschen einlesen.

Runs scored (R), Runs Batted In (RBI), Runs Created (RC)
Im Endeffekt geht es beim Batting immer nur um das Eine, nämlich um das Produzieren von Runs. Deswegen ist die dritte und wichtigste Fragestellung, der ich mich in diesem Artikel widmen möchte: Wie viele Runs trägt ein Batter zum Erfolg seines Teams bei?

Natürlich kann man Runs als einfache Zählstatistik erfassen, also einfach messen, wie oft Batter X die Bases umrundet und somit für sein Team gescort hat. Man stellt dann fest, dass sowohl 2015 als auch bisher in diesem Jahr Josh Donaldson die meisten Runs gescort hat und dass die Allzeit-Rangliste von Rickey Henderson angeführt wird, der in seiner langen Karriere von 1979 bis 2003 insgesamt 2295 Runs gescort hat. Solche Zahlen sind ja irgendwie beeindruckend, vor allem wenn bestimmte Meilensteine erreicht werden (es gibt zum Beispiel nur acht Spieler mit über 2000 Runs, darunter mit Alex Rodriguez nur einen noch aktiven). Wirklich viel sagt uns das aber nicht über den jeweiligen Spieler, denn das Scoren von Runs liegt lediglich beim Homerun in seiner eigenen Hand. Jeder andere Score ist neben der Notwendigkeit, selbst auf Base zu kommen, abhängig von den Fähigkeiten der Mitspieler und/oder Fehlern der Gegenspieler sowie von zusätzlichen Faktoren wie beispielsweise dem eigenen Platz in der Batting Order. Ist man regelmäßig vor dem stärksten Hitter des eigenen Teams an der Reihe, so ist die Wahrscheinlichkeit, dass man selbst viele Runs erzielt, deutlich höher als wenn man als Achter schlägt und danach der schlechteste Batter (in der NL meistens der Pitcher) des Teams kommt.

Mehr Beachtung als die Runs scored finden meistens die Runs Batted In, eine weitere einfache Zählstatistik. Ein RBI liegt dann vor, wenn durch den Schlag eines Batters ein Run erzielt wird (unabhängig davon, ob der Batter selbst dabei auf Base kommt). Auch Runs, die bei vollen Bases durch einen Walk, Hit by Pitch oder Interference Call ausgelöst werden, werden als RBI gezählt. Bei einem Homerun wird für das Umrunden der Bases durch den Batter diesem sowohl ein Run als auch ein RBI angerechnet; im Höchstfall kann man mit einem Homerun bei voll besetzten Bases vier RBI durch einen Schlag – einen Grand Slam – erzielen. RBIs bilden eine der drei Säulen der Triple Crown, das heißt der besonderen Leistung, als Batter die Liga gleichzeitig in Homeruns, Batting Average und RBI anzuführen. In den letzten knapp 50 Jahren ist das nur einem einzigen Spieler gelungen, nämlich Miguel Cabrera im Jahr 2012.

Mit 2297 RBI hat Hank Aaron die meisten Runs in einer Karriere verursacht. Er ist einer von nur vier Spielern mit über 2000 RBI und auch in dieser Statistik ist Alex Rodriguez der einzige Aktive, der jene Grenze geknackt hat. In der aktuellen Saison führt Edwin Encarnacion die MLB an. Obwohl RBI in aller Munde sind, muss man sich auch bei dieser Statistik die Frage nach der Aussagekraft stellen. Im Prinzip trifft die Kritik, dass gescorte Runs kein gutes Maß für die Qualität eines einzelnen Spielers sind, genauso auch auf RBI zu. Denn ob ein ordentlicher Hit drei Runner nach Hause bringt oder gar keinen, ist wieder ein Umstand, den der Batter überhaupt nicht in der Hand hat. Zwei exakt gleich gute Batter werden sehr verschiedene RBI-Zahlen sammeln, wenn der eine in einem insgesamt offensivstarken Team spielt und der andere in einem schwachen oder wenn der eine im Lineup an ungünstigerer Stelle schlägt als der andere. Als Leadoff-Hitter hat man zum Beispiel schlechte Chancen auf viele RBI, weil man beim ersten At-Bat nie jemanden vor sich auf Base hat und bei den weiteren At-Bats in der Regel nach schwachen Hittern an die Reihe kommt; viel besser ist man dran als Cleanup-Hitter, also auf Position vier, weil man dann normalerweise direkt nach den drei Battern dran ist, die am häufigsten auf Base kommen.

Wenn man einerseits der Philosophie folgen möchte, dass Batting-Leistungen am besten in Form von Runs gezählt werden sollten, man andererseits aber die genannten Probleme bei der Aussagekraft von Runs scored und RBI vermeiden will, so gibt es dafür hervorragende Alternativen. Eine solche ist der Indikator Runs Created (RC), erfunden von Sabermetrics-Gott Bill James. Die Grundformel von RC lautet: Situationen, in denen man auf Base kommt, werden multipliziert mit den erzielten Total Bases und das Ergebnis wird geteilt durch die Zahl der Gelegenheiten, also der Plate Appearances. Hier kann man das in ordentlicher Formelschreibweise und in verschiedenen Entwicklungsstufen nachlesen. Runs kommen in dieser Formel überhaupt nicht vor und doch führt sie zu einer verblüffend genauen Aussage über den individuellen Beitrag eines Batters zum Erfolg des Teams in Form von Runs: Dass sie den individuellen Beitrag misst, ist logisch, weil alle Komponenten der Formel auf den Einzelleistungen des Spielers beruhen; dass sie verblüffend genau ist, zeigt sich dadurch, dass sie mit einer Genauigkeit von 99,5% vorhersagt, wie viele Runs ein Team erzielt, wenn man die RC-Werte aller Batter zusammenzählt. RC ist in meinen Augen eine der besten Baseballstatistiken überhaupt und es ist ein Jammer, dass sie nicht halb so bekannt ist wie z. B. RBI. Hier noch eine Leseempfehlung, die die Aussagekraft von RC untermauert.

Die meisten RC in einer Karriere hat Barry Bonds gesammelt, der beste aktive Spieler ist auch in dieser Statistik Alex Rodriguez. Auch die beste Einzelsaison aller Zeiten geht mit 230 RC an Barry Bonds. Und wer ist momentan der wertvollste Batter der MLB? Trommelwirbel, Tusch, es ist: Jose Altuve. Mit 107 RC führt er aktuell (sortieren muss man bei baseball-reference selbst durch Klick auf die Spaltenüberschrift RC) die Liga an, mit etwas Abstand gefolgt von Josh Donaldson und Mike Trout.

Posted in MLB, Statistik Tagged with: , , , , , , , , ,

Juni 28th, 2016 by Silversurger

Wie am Ende meines Rants gegen Pitcher-Wins versprochen, werde ich heute auf ein paar Pitcher-Statistiken eingehen, die ich sinnvoll finde – manche mehr, manche weniger, aber auf jeden Fall alle deutlich mehr als die Win-Loss-Bilanz. Ich konzentriere mich auf Aussagen über starting Pitcher. Einiges davon lässt sich auch auf Reliefer übertragen, aber mit denen beschäftige ich mich ein andermal gründlicher.

Es gibt haufenweise Zahlen, die uns etwas über Pitcher sagen – zum Beispiel die Anzahl von Strikeouts, von erlaubten Walks, Hits und Homeruns sowie diverse Verhältnisse dieser Zahlen zueinander, die Auswahl und Geschwindigkeit der Pitches und so weiter. Das alles sind interessante Informationen, aber im Endeffekt bemisst sich die Leistung eines Pitchers an genau zwei Fakten. Erstens: Wie viele Outs produziert er? Zweitens: Wie viele Runs lässt er dabei zu?

Innings Pitched

Outs werden üblicherweise in Form von Innings Pitched (IP) gezählt. IP sind nichts anderes als die produzierten Outs geteilt durch drei. Dabei werden alle Outs mitgerechnet, die auftreten während der betreffende Pitcher auf dem Mound steht, unabhängig von dessen konkreter Beteiligung. Insbesondere für Starter sind IP eine sehr aussagekräftige Zahl, schließlich ist es deren Hauptaufgabe, ihr Team möglichst lange im Spiel zu halten. Derzeit gilt es als sehr guter Wert, wenn man es pro Saison auf über 200 IP bringt. 2015 gelang dies 28 MLB-Pitchern, angeführt von Clayton Kershaw mit 232.2 IP (.2 bedeutet in dem Fall, dass er zwei Outs mehr als 232 Innings verantwortet hat). Auch für 2016 führt Kershaw in dieser Statistik mit bislang 121.0 IP.

In der Karriere-Rangliste führt, wahrscheinlich für alle Zeiten uneinholbar, der legendäre Cy Young mit 7.356 IP. Dazu muss man sagen, dass zu seiner Zeit um das Jahr 1900 die Pitches mit deutlich geringerer Belastung für den Ellenbogen geworfen wurden, dass Complete Games und kürzere Starterrotationen üblich waren und dass bis 1892 nur 50 Fuß weit gepitcht wurde anstelle der seitdem bis heute üblichen 60 Fuß und 6 Zoll. Angesichts der Entwicklung des Spiels hin zu weniger Innings und längeren Erholungsphasen für die Starter ist es nicht überraschend, dass sich in den historischen Top-200 nur zwei noch aktive Pitcher finden. Es handelt sich um Bartolo Colon mit 3068.2 IP auf Platz 126 und um C. C. Sabathia mit 3058.1 IP auf Platz 128. Die meisten IP in einer Saison gelangen 1879 Will White mit 680.0. Man muss sehr lange blättern, um in der Liste einen Wert aus der „modernen Ära“ des Baseballs zu finden und schließlich bei Wilbur Wood im Jahr 1972 mit 376.2 IP zu landen. Steve Carlton (304.0) war 1980 der bislang letzte Pitcher mit über 300 IP.

(Earned) Run Average

Zugelassene Runs kann man natürlich einfach so zählen, allerdings sind sie für sich genommen wenig aussagekräftig. Das dürfte unmittelbar einleuchten, denn natürlich hat man lieber einen Clayton Kershaw auf dem Mound, der in 121 Innings 25 Runs zugelassen hat, als zum Beispiel seinen Teamkollegen Ross Stripling mit 24 Runs in 45.2 Innings. Man sollte also beide Zahlen, die Runs und die Innings, zueinander ins Verhältnis setzen, um eine gute Aussage über die Qualität eines Pitchers zu erhalten. In der einfachsten Form landet man damit beim Run Average (RA), also der Anzahl von Runs, die der betreffende Pitcher durchschnittlich in 9 Innings zulässt.

Um die Leistung des Pitchers etwas unabhängiger von der Qualität seiner Mitspieler beurteilen zu können, wird üblicherweise eine korrigierte Variante dieses Indikators verwendet, der sogenannte Earned Run Average (ERA). Dieser errechnet sich wie der RA, indem man die erlaubten Runs durch die IP teilt und das ganze mal neun nimmt. Der Unterschied besteht darin, dass in der Berechnung von ERA die Runs nicht mitgezählt werden, die durch Errors oder vom Catcher verpasste Bälle (passed Balls) erzielt werden. Das klingt einerseits sinnvoll, ist andererseits aber mit Recht umstritten, denn die vorgenommene Korrektur unterstellt zwei Dinge: erstens dass der Einfluss der Mitspieler „nur“ in Errors und passed Balls besteht – was nicht stimmt, denn zum Beispiel die Reichweite der Fielder, deren Fähigkeit, Double Plays auszuspielen und Base-Stealer auszuwerfen, spielen ebenfalls eine große Rolle; zweitens dass der Pitcher für Runs nach Errors und passed Balls keine Verantwortung trägt – was ebenfalls oft nicht der Fall ist, denn meistens trägt der Pitcher zu dem Run bei, indem er entweder den scorenden Spieler zuvor per Walk oder Hit auf Base gelassen hat oder indem er zum Beispiel den Hit zulässt, der einen durch Error im Spiel befindlichen Spieler nach Hause bringt. Als drittes Defizit kommt noch hinzu, dass Errors auf einer subjektiven, durchaus unterschiedlich gehandhabten Einstufung der Scorer beruhen. Man kann also mit einigem Recht sagen, dass ERA kaum mehr als eine Scheinkorrektur von RA darstellt. Das ist keine neue Erkenntnis, aber die Baseballwelt ist bekanntlich recht konservativ und so wird ERA trotz bekannter Defizite auf absehbare Zeit der dominierende Indikator für die Leistung von Pitchern bleiben. Das ist für mich O. K., denn alles in allem ist ERA den Nachteilen zum Trotz ein brauchbares Maß.

Auch hier ein kurzer Blick auf aktuelle und historische Resultate: Einen ERA unter 3.0, was im heutigen Baseball als hervorragender Wert gilt, wiesen 2015 lediglich zwölf qualifizierte Pitcher auf (als qualifziert gelten in dem Fall Pitcher mit mindestens so vielen IPs wie Spiele stattgefunden haben, also 162 in einer Saison), angeführt von Zack Greinke (1.66) und Jake Arrieta (1.77), die als einzige unter 2.0 blieben. In der laufenden Saison stehen noch drei qualifizierte Pitcher unter einem ERA von 2.0: Jake Arrieta (1.74), Clayton Kershaw (1.79) und Madison Bumgarner (1.99).

Wie bei den IP ist auch beim ERA in der Karriere-Rangliste zu beobachten, dass die erzielten Werte von der jeweiligen Ära des Spiels abhängen und man deshalb auf den hohen Plätzen nahezu ausschließlich Spieler aus der Dead Ball Era zu Beginn des letzten Jahrhunderts findet. Umso beachtlicher sind die Leistungen von Mariano Rivera (Platz 13 mit 2.209 Karriere-ERA) und Clayton Kershaw (Platz 27 mit 2.385) einzuschätzen, die es als „moderne“ Pitcher so weit nach oben geschafft haben. Kershaw ist der einzige noch aktive Spieler, der in die Top-150 dieser Liste vorgedrungen ist. Betrachtet man hingegen die Einzelsaison-Rekorde, so sticht ein anderer aktiver Pitcher hervor: Die 1.66-ERA-Saison 2015 von Zack Greinke brachte ihn auf Platz 75 dieser Liste und war damit die beste Jahresleistung seit 20 Jahren.

Fielding Independent Pitching

Gehen wir noch mal zurück zu dem Anspruch, der ERA zugrunde liegt, nämlich die Messung der Pitcherleistung ohne den Einfluss der restlichen Defense. ERA erfüllt diesen Anspruch, wie oben aufgezeigt, nicht. Generell scheint es ein aussichtsloses Unterfangen, das Verschulden von Runs trennscharf einem Pitcher zu- oder abzuerkennen. Eines geht aber: Man kann einen Indikator basteln, der nur aus Komponenten zusammen gesetzt ist, die der Pitcher nahezu alleine verantwortet. Das trifft zu für Strikeouts, für Walks und Hit by Pitches sowie für Homeruns – also alle Situationen, bei denen der Ball nicht „in play“ kommt. Aus diesen Einzelteilen besteht der von Tom Tango entwickelte Indikator Fielding Independent Pitching (FIP). Als geschickter kleiner Kniff wird der Formel noch eine Konstante hinzugefügt, mit der FIP auf das gleiche Niveau gehoben wird wie der ERA des betrachteten Zeitraums. Der Ligadurchschnitt für FIP und ERA ist dann also genau gleich und somit hat man es als ERA-gewohnter Beobachter sehr leicht, die Werte zu interpretieren. Geht man nach FIP, so zeigt sich in aktuellen Ranglisten ein leicht anderes Bild als bei der Betrachtung von ERA: Ganz vorne steht aktuell Clayton Kershaw mit 1.65, gefolgt von Noah Syndergaard mit 1.86 und Jose Fernandez mit 1.95. Auch 2015 führte Clayton Kershaw (1.99) als einziger Pitcher mit einem FIP unter 2.0 die Liga an. Zack Greinke mit seinem sensationellen 1.66 ERA brachte es „nur“ auf ein FIP von 2.76 und damit auf Platz 6.

ERA+, ERA-, FIP+, FIP-

Sowohl zu ERA als auch zu FIP gibt es übrigens abgeleitete Indikatoren, die sich am Ligadurchschnitt orientieren. Inhaltlich steckt das gleiche drin wie in den Grundzahlen; diese werden so umgerechnet, dass der Ligadurchschnitt auf 100 gesetzt wird und führen zu neuen Kennzahlen, die sich ERA+, ERA-, FIP+ oder FIP- nennen. ERA+ und FIP+ bedeuten, dass man umso besser ist, je weiter man über 100 liegt, oder umso schlechter, je weiter man darunter landet. Bei ERA- und FIP- ist es genau umgekehrt, hier bedeutet niedrig gut und hoch schlecht. Jake Arrieta steht beispielsweise 2016 bisher bei einem ERA+ von 231, genau in der Mitte liegt Jaime Garcia mit 100 und das Schlusslicht der qualifizierten Pitcher bildet James Shields mit 64. Das Gute an diesen Werten ist, dass sie den Vergleich von Zahlen aus verschiedenen Jahren erleichtern, d. h. jede Pitcherleistung wird ins Verhältnis zu dem zeitlichen Umfeld gesetzt, in dem sie erbracht wurde.

Quality Starts

Zu guter Letzt möchte ich noch eine recht einfache Statistik vorstellen, für die man nicht rechnen muss und die trotzdem ein Maß zur zumindest oberflächlichen Beurteilung von startenden Pitchern liefert: Der Quality Start (QS) wurde 1985 von dem Journalisten John Lowe als Qualitätsmerkmal für einzelne Starts vorgeschlagen. Ein QS liegt dann vor, wenn der startende Pitcher mindestens für sechs Innings auf dem Mound bleibt und dabei höchstens drei earned Runs zulässt.

Auch der QS hat Kritikpunkte, beispielsweise weil er im Extremfall (6 IP und 3 ER) mit einem relativ hohen ERA von 4.5 einhergeht und weil er nicht berücksichtigt, dass beispielsweise ein 9-Inning-Start mit 4 ER objektiv betrachtet die bessere Leistung wäre als ein 6-Inning-Start mit 3 ER, Ersterer aber nicht als QS gezählt wird. Aber der QS ist durch seine Einfachheit eine manchmal hilfreiche „quick and dirty“-Statistik, die jeder schnell versteht. Außerdem sind QS als Instrument zur Schwarz-Weiß-Einstufung jedes einzelnen Starts eine gute Ergänzung zu Indikatoren wie ERA oder FIP, die eher langfristig angelegt sind und wenig Auskunft darüber geben, wie gleichmäßig die Leistungen erbracht werden. Interessanterweise liegt der Anteil von QS ligaweit in den letzten Jahren immer bei ungefähr 50%.

Wenn in der Berichterstattung auf Dauer die übliche Kurzdarstellung „W-L und ERA“ ersetzt würde durch eine Darstellung „QS-GS und ERA“ (GS = Anzahl der gestarteten Spiele), dann wäre das in meinen Augen ein deutliches Upgrade gegenüber dem Status quo. Beispielsweise würde man dann auf einen Blick erfahren, dass dieses Jahr Marco Estrada mit 12 QS in 15 Starts (80%) seinem Team deutlich häufiger die Gelegenheit verschafft hat, mit überschaubarem Offensivaufwand zu gewinnen, als Chris Tillman mit 9 QS in 15 Spielen (56%) – was eine deutlich informativere Aussage über die Pitcherleistung wäre als die 5 Wins von Estrada gegenüber den 10 von Tillman.

Posted in MLB, Statistik Tagged with: , , , , , , ,