Category: Statistik

Mai 17th, 2017 by Dominik

Das Fielding ist ein wichtiger Teil des Baseballsports. Spiele werden nicht nur durch Batting und Pitching sondern auch durch die Abwehrarbeit im Feld gewonnen oder verloren, auch wenn dieser Aspekt des Spiels gegenüber den anderen oft ein wenig im Schatten der Aufmerksamkeit zu stehen scheint – gerade was die Statistiken angeht. An die Prominenz der Batting-Slashline oder des Earned Run Averages kommen die Fielding-Stats nicht heran, aber das macht sie nicht weniger interessant und ich möchte heute ein paar von ihnen vorstellen.

Putouts, Assists
Putouts und Assists sind klar definiert und sehr einfach zu zählen. Für jedes Out des schlagenden Teams wird einem Spieler des verteidigenden Teams der Putout gutgeschrieben. Ihn erhält der Spieler, der den Ball aus der Luft fängt (Flyout), mit ihm den Gegner zum Tagout berührt, die Base zum Forceout betritt oder als Catcher den dritten Strike beim Strikeout fängt. Ein Assist wird dem Spieler zugerechnet, der den Ball vor dem Putout berührt hat. Wenn also zum Beispiel der Shortstop einen Ball aufnimmt und ihn zum Forceout dem First Baseman zuwirft, dann hat der SS den Assist und der 1B den Putout. Ist kein zweiter Spieler involviert, dann ist der Putout „unassisted“. Der Pitcher erhält übrigens keinen Assist dafür, dem Catcher den dritten Strike zuzuwerfen.
Man könnte nun einfach schauen, wer die meisten Putouts und wer die meisten Assists sammelt und diese Spieler dann zu den besten Fieldern erklären. Dieses Vorgehen hinkt aber an mindestens zwei Stellen: Erstens ist die Anzahl der Putouts und Assists stark abhängig von der gespielten Position: Die meisten Putouts gehen üblicherweise auf das Konto des First Basemans, auch wenn dies sicher nicht die anspruchsvollste Defensivposition ist. Man läge somit höchstwahrscheinlich daneben, wenn man einen 1B zum besten Verteidiger des Teams erklärte, nur weil er die meisten Putouts hat. Zweitens hängt die Zahl der Putouts und Assists, die ein Spieler ansammelt, auch ganz wesentlich davon ab, wie viele Gelegenheiten dazu der Stil des jeweiligen Pitchers bietet – produziert er eher Groundballs (mehr Putouts für Infielder), Flyballs (mehr Putouts für Outfielder) oder Strikeouts (mehr Putouts für Catcher)?
Die meisten Putouts in der Saison 2016 erzielte – ebenso wie schon 2015 und 2013 – Paul Goldschmidt von den Arizona Diamondbacks mit 1.378. 2017 führt bislang Wil Myers von den San Diego Padres mit 362 die Rangliste an. Der Rekord für die meisten Putouts in einem Jahr ist schon 110 Jahre alt: Jiggs Donahue stellte ihn 1907 mit 1.846 Putouts auf. Im gleichen Jahr erreichte Jake Beckley die bis heute einzigartige Marke von 23.767 Putouts in seiner Karriere. Die beste Leistung eines noch aktiven Spielers vollbrachte Albert Pujols mit 1.597 Putouts im Jahr 2005 und mit bislang 15.626 in seiner Karriere. Alle genannten Spieler sind oder waren (natürlich) First Basemen.

Errors
Errors sind die wichtigste Defensivstatistik – jedenfalls wichtig in dem Sinne, dass sie standardmäßig in jedem Boxscore und auf jedem Scoreboard dargestellt werden. Ein Error wird einem Spieler zugerechnet, wenn er ein mit „normalem Aufwand“ (ordinary effort) erreichbares Aus verhindert – zum Beispiel, indem er den Ball fallen lässt, beim Fangen oder Aufnehmen daneben greift oder ihn so ungenau wirft, dass der Teamkamerad ihn nicht bekommen kann. Jeder Spieler möchte vermeiden, in der Error-Spalte des Boxscores aufzutauchen und viele Errors sind in der Regel ein Zeichen für schlechtes Defensivspiel. Allerdings sind auch die Errors stark von der Position abhängig: Shortstops und Second Basemen produzieren üblicherweise deutlich mehr Errors als Outfielder. Etwa weil sie schlechtere Abwehrspieler sind? Meistens ist eher das Gegenteil der Fall: Auf diese Posten stellt man gute Abwehrspieler, weil die Bälle im Infield schneller, härter und häufiger ankommen als im Outfield. Deshalb gibt es im Infield viel mehr Gelegenheiten, etwas falsch zu machen, also Errors zu sammeln.
2016 hatte Jonathan Villar von den Milwaukee Brewers die zweifelhafte Ehre, mit 29 Erros die Liste der meisten Abwehrfehler anzuführen, 2017 liegen bislang acht Spieler mit jeweils 7 gleichauf. Die meisten Errors in einer Saison unterliefen 1889 Herman Long und 1890 Billy Shindle mit jeweils 122. Long führt mit 1.096 Errors auch die Karriererangliste an. Nach aktuellen Spielern muss man in diesen Listen recht lange suchen: Auf Platz 259 findet man Adrian Beltre mit 296 Errors in seiner Karriere. In einer einzelnen Saison hatte kein aktiver Spieler je mehr als 35 Errors (welche Marcus Semien 2015 und Mark Reynolds 2008 verursachten).

Fielding Percentage
Betrachtet man die Errors nicht als absolute Zahlen sondern als Anteil erfolgreicher Plays an allen möglichen Plays, dann ist das Problem der unterschiedlichen Anzahl von Möglichkeiten weitgehend ausgeschaltet. Beispiel: Nehmen wir an, während eines Spiels werden zwölf Bälle in Richtung des Third Basemans geschlagen. Zwei davon sausen ihm so schnell um die Ohren, dass man ihm daraus keinen Vorwurf machen kann. Diese beiden fließen nicht in die Berechnung ein. Von den anderen zehn setzt er neun in ein Aus um, indem er sie entweder aus der Luft fängt oder nach Bodenkontakt aufnimmt und zur ersten Base wirft. Den zehnten könnte er locker fangen, aber weil ihn die Sonne blendet greift er daneben, muss sich nach dem Ball bücken und bis er ihn zur ersten Base werfen kann, ist der Batter/Runner dort schon angekommen. Das war ein Error und seine Fielding Percentage (FP) steht damit bei .900 (in Deutschland würden wir sagen: 90%).
Die FP ist bei angemessen großem Stichprobenumfang schon ein recht brauchbares Maß für die Fähigkeit eines Fielders, aber auch sie ist nicht ohne Probleme: Zum einen sind Errors subjektiv, denn es muss ein Mensch – der Scorer – entscheiden, welcher Ball mit „normalem Aufwand“ spielbar ist und welcher nicht. Darüber hinaus berücksichtigt die FP nicht die Reichweite eines Spielers. Das kann zu der paradoxen Situation führen, dass ein besonders guter Spieler mehr Errors und damit eine schlechtere FP hat als ein schlechterer. Denn der bessere Spieler deckt einen größeren Bereich des Feldes ab und übernimmt häufig die schwierigeren Plays im Grenzgebiet der Zuständigkeiten. Bei diesen Plays unterlaufen naturgemäß die meisten Fehler und diese Fehler werden dem guten Fielder zugerechnet, weil er im Gegensatz zum schlechten Fielder eine Chance gehabt hätte, an den Ball heranzukommen.
Auch hierzu ein paar Statistiken: 2016 hatten drei qualifizierte Spieler eine perfekte FP von 1.000: die Outfielder Curtis Granderson (Mets), Hunter Pence (Giants) und Randal Grichuk (Cardinals). Die schlechteste FP hatte 3B Yunel Escobar (Angels) mit .937. 2017 haben bislang noch zahlreiche Spieler eine FP von 1.000, ganz hinten liegt derzeit 3B Nick Castellanos (Tigers) mit .920 und Yunel Escobar ist mit .930 nicht wirklich besser geworden. Die schlechteste FP aller Zeiten hatte übrigens Joe Doyle 1872 als SS der Nationals mit .667.

Neben den bisher geschilderten „klassischen“ Fielding-Statistiken gibt es natürlich auch zu diesem Bereich des Baseballspiels fortgeschrittene Statistiken, sogenannte Sabermetrics. Über jede davon könnte man ohne Weiteres einen eigenen Artikel schreiben, aber ich stelle mal beispielhaft drei davon in aller Kürze vor:

Ultimate Zone Rating
Großer Beliebtheit erfreuen sich Statistiken, die direkt in der „Währung“ des Spiels ausgedrückt werden, also in Runs. In Runs dargestellte Defensivstatistiken sind besonders gut mit Offensivstatistiken vergleich- und kombinierbar, die auf dem gleichen Prinzip basieren, beispielsweise Runs Created oder wRAA. Eine solche Statistik ist das Ultimate Zone Rating (UZR). UZR setzt sich zusammen aus zahlreichen Komponenten des Defensivspiels, die jeweils mit einem Wert von Runs bzw. Anteilen davon versehen werden. Diese Werte werden ermittelt, indem der zu beurteilende Spielzug mit dem durchschnittlichen Ausgang ähnlicher Situationen aus der Vergangenheit verglichen wird. Nehmen wir beispielsweise an, in Richtung des Left Fielders wird ein Ball mit einer bestimmten Geschwindigkeit zu einer bestimmten Stelle geschlagen, aus dem ein durchschnittlicher Fielder in 40% der Fälle ein Aus produziert und der ansonsten üblicherweise zu 0,8 Runs für das gegnerische Teams führt. Wenn der Left Fielder das Play macht, dann hat er 0,48 Runs verhindert (die durchschnittliche Schadenshöhe 0,8 multipliziert mit der Eintrittswahrscheinlichkeit von 0,6) und sein UZR steigt entsprechend an. Die Übersetzung von Plays in Runs geschieht über lineare Gewichte. Wer sich in die Details der UZR-Berechnung einlesen will, dem sei ein sehr guter Artikel von Fangraphs ans Herz gelegt.
UZR kann Werte über oder unter Null annehmen – je nachdem, ob der betreffende Spieler seinem Team mehr oder weniger gegnerische Runs beschert als ein durchschnittlicher Fielder. Überdurchschnittliches Defensivspiel ergibt Werte über Null, die besten Fielder erreichen pro Saison üblicherweise UZR-Werte von über 15.
Der beste Fielder im Jahr 2016 laut UZR war Outfielder Adam Eaton (White Sox) mit 23,1. 2017 liegt bislang OF Odubel Herrera (Phillies) mit 7,7 vorne. Das höchste Karriere-UZR seit Beginn der Messung (2002) hat bislang Adrian Beltre mit 180,8 inne. Die beste defensive Einzelsaison spielte Alfonso Siriano 2007 für die Cubs mit einem UZR von 32.0.

Defensive Runs Saved
UZR und ein anderes verbreitetes Maß für Defensivstärke, Defensive Runs Saved (DRS), sind sich äußerlich betrachtet sehr ähnlich: Auch DRS wird in Form von Runs angegeben, auch DRS bewertet Einzelaktionen des Fielders anhand des Vergleichs mit dem Durchschnitt auf der jeweiligen Position und auch hier stehen Werte über Null für eine überdurchschnittliche Leistung und Werte unter Null für eine unterdurchschnittliche. In den Details der Berechnung weisen die beiden Statistiken ein paar Unterschiede auf. Zum Beispiel verwendet DRS für den Vergleich mit dem Durchschnitt die jeweils letzten zwölf Monate, während UZR immer auf mehreren Jahren basiert. DRS enthält zudem Anpassungen, die sogenannte Videoscouts bei einer Sichtung der Plays festlegen, indem sie Spielzüge als besonders gut oder schlecht einstufen. Diese und andere feine Unterschiede können dazu führen, dass die beiden Statistiken über manche Spieler zu gegensätzlichen Aussagen kommen. Das ist aber eher der Ausnahmefall, in den meisten Fällen kommen UZR und DRS zu sehr ähnlichen Ergebnissen und es ist letztlich Geschmackssache, welches der beiden Maße man bevorzugt. Beide liefern in jedem Fall deutlich bessere und belastbarere Aussagen als die reine Fielding Percentage. Auch zu DRS empfehle ich einen ausführlichen Artikel, der die Berechnungsmethode näher erläutert.
Die meisten DRS der MLB-Saison 2016 hatte Red-Sox-Outfielder Mookie Betts mit 32, 2017 haben bisher 3B Nolan Arenado (Rockies) und SS Addison Russell (Cubs) mit je 8 DRS die Nase vorn. Die Karriererangliste seit Beginn der Darstellung 2002 führt wie bei UZR auch hier Adrian Beltre an mit 206 DRS. Die beste Einzelsaison hatte OF Kevin Kiermaier (Rays) mit 42 DRS im Jahr 2015.

Defensive Wins Above Replacement
Das bekannteste Maß, die Qualität eines Baseballspielers vollständig in einem einzigen Wert auszudrücken, sind Wins Above Replacement (WAR), deren Grundprinzip ich hier mal erklärt habe. WAR berücksichtigt sowohl die defensiven als auch die offensiven Leistungen eines Spielers, bietet aber auch die Möglichkeit, die beiden Komponenten getrennt voneinander zu betrachten. Der defensive Teil von WAR (dWAR) basiert dabei im Wesentlichen auf den beiden gerade vorgestellen Werten. Von den beiden wichtigsten Statistikseiten verwendet Fangraphs UZR für seine Version von WAR, während Baseball Prospectus auf DRS setzt.
Die besten Feldspieler einer MLB-Saison bringen es in der Regel auf 3 bis 5 dWAR. Im Vergleich dazu landen die besten Batter eines Jahres meist bei 7 bis 10 oWAR.
Rays-OF Kevin Kiermaier führte zuletzt zwei Jahre in Folge, 2015 und 2016, mit 5,0 und 2,9 die dWAR-Rangliste der MLB an. 2017 führt bislang SS Addison Russell (Cubs) mit 1,0 dWAR. Die meisten dWAR in einer Karriere gelangen dem legendären Shortstop Ozzie Smith mit 43,4. Bester Aktiver in dieser Liste ist einmal mehr Adrian Beltre mit 27,1 dWAR. Die besten Einzelsaisons hatten mit jeweils 5,4 dWAR in zwei sehr unterschiedlichen Ären Terry Turner im Jahr 1906 und Andrelton Simmons 2013.

Posted in Grundwissen, MLB, Statistik Tagged with: , , , , , , , , , , ,

April 11th, 2017 by Dominik

…aber man kann sie durchaus im April verlieren.“ Diese alte Baseball-Weisheit hört und liest man zurzeit wieder sehr oft. Sie ist das Mantra aller Panikmacher und Überreagierer, denen der Angstschweiß auf der Stirn steht, wenn ihr Team eine oder zwei Wochen nach Saisonstart eine negative Bilanz aufweist. Ich habe mich gefragt, was an dem Sprichwort dran ist.

Gewinnen kann man die World Series nur, indem man in die Playoffs kommt und sich dort in jeder Runde gegen den jeweiligen Gegner durchsetzt. Die früheste Möglichkeit, die World Series zu „verlieren“, besteht darin, sich nicht für die Playoffs zu qualifizieren. Die Behauptung, man könne eine World Series im April verlieren, unterstellt letzten Endes, dass eine schlechte Bilanz im April eine Playoff-Qualifikation unmöglich macht. Auf Basis dieser Überlegung habe ich mir mal für die Jahre 2012 bis 2016 angeschaut, ob und wie oft Teams mit einer schlechten April-Bilanz in die Playoffs gekommen sind – und anders herum, wie die Playoff-Teilnehmer im April abgeschnitten hatten. Das Startjahr 2012 habe ich deswegen gewählt, weil seitdem die bis heute gültige Regel mit zwei Wild Cards je Liga in Kraft ist.

In den fünf Jahren 2012 bis 2016 haben 29 Teams den April mit weniger als 40% Siegen abgeschlossen. Nur zwei von ihnen erreichten am Ende der regulären Saison die Playoffs. Das waren zum einen die Pittsburgh Pirates im Jahr 2014 nach 10 Siegen und 16 Niederlagen (38,5% Winning-Percentage) und zum anderen die Texas Rangers 2015, die nach einem echten Fehlstart mit 7 Siegen und 14 Niederlagen (33,3%) sogar noch ihre Division gewannen. Es gibt solche Fälle also, aber sie sind eindeutig die Ausnahme. Zehn Teams brachten es in den fünf Jahren übrigens zu einer Winning-Percentage von unter 30%. Keines von ihnen schaffte es in die Playoffs.

Um es auch von der anderen Seite her zu betrachten: Den Regeln entsprechend erreichten in jedem der Jahre 2012 bis 2016 zehn Teams die Playoffs. Von diesen 50 Teams wiesen zehn eine negative Aprilbilanz auf (darunter die zwei oben genannten mit weniger als 40% Siegen). Die kombinierte Bilanz der Playoff-Teams 2012 bis 2016 im jeweiligen April beträgt 686-518 (57,0%). Die fünf World-Series-Gewinner der betrachteten Jahre hatten übrigens im Durchschnitt eine April-Bilanz von 65,8%, schwächster World-Series-Sieger im April waren die San Francisco Giants des Jahres 2012 mit 54,6%.

Wenig überraschend zeigt die Betrachtung, dass die meisten Playoff-Teams schon im April des jeweiligen Jahres gut waren und dass die meisten im April schwachen Teams es am Ende nicht in die Playoffs schafften. Dass das Abschneiden im April – wie in jedem anderen Monat der Saison – einen Einfluss auf die Gesamtbilanz der Saison hat, ist logisch. Dennoch bin ich überrascht, wie deutlich das Bild ist: Nimmt man die fünf betrachteten Jahre, eine zugegebenermaßen kleine Stichprobe, zum Maßstab, so kann man sagen, dass an dem eingangs zitierten Sprichwort eine Menge dran ist. Nach einem schlechten April (unter 40% Winning-Percentage) hat man nur noch eine sehr geringe Chance auf den Einzug in die Playoffs und nach einem sehr schlechten April (unter 30%) praktisch gar keine. Man kann davon ausgehen, dass diese Regelmäßigkeiten früher noch eindeutiger galten als heute, da deutlich weniger Teams in die Playoffs kamen – je Liga bis 1969 nur eines, ab 1969 zwei und vier ab 1994. Unvergessen bleiben aber die Oakland Athletics von 2001: Sie beendeten die Saison nach einem 8-17-April noch mit einer Bilanz von sage und schreibe 102-60. Im Baseball ist eben alles möglich, auch wenn manches davon nur äußerst selten passiert.

Posted in MLB, Statistik Tagged with: , ,

Februar 25th, 2017 by Dominik

Das Spring Training ist für den Baseballfan nicht nur die Zeit der Prognosen und großen Erwartungen; es ist auch die Zeit, in der man aktiv werden muss, wenn man in der bald beginnenden Saison Fantasy Baseball spielen möchte. Da ich selbst seit Jahren begeisterter Fantasy-Spieler bin und auch im Rahmen des Wunschkonzerts die Frage aufkam, gibt es von mir heute eine kleine Einführung in diesen spannenden Zeitvertreib.

Das Grundprinzip
Beim Fantasy Baseball geht es darum, erfundene Teams mit echten Statistiken gegeneinander antreten zu lassen. Das funktioniert so, dass mehrere Mitspieler (ideal sind 10-20) sich vor Saisonbeginn zu einer Liga zusammenfinden, sich jeweils einen Teamnamen aussuchen und ihre Teams mit echten Spielern der MLB bestücken. Während der Saison aktualisiert man täglich oder wöchentlich seine Aufstellung und erhält dann Punkte in Abhängigkeit von den Leistungen, die die aufgestellten Spieler in ihren echten Spielen erzielen. Habe ich zum Beispiel Mike Trout in meinem Team und er schlägt in der realen Welt einen Homerun für die Angels, dann wird dieser Homerun gleichzeitig auch meinem Team gutgeschrieben.

In den Anfängen des Fantasy-Sports bedeutete das alles viel Papierkram und Rechnerei und war deshalb auch eher ein Nischenhobby für Statistiknerds. Mit der Verbreitung des Internets entstanden zahlreiche Onlineanbieter von Fantasyspielen, die dadurch einen bis heute anhaltenden Boom erlebten.

Die Verteilung der Spieler
Damit alle ihren Spaß haben, soll die Verteilung der Spieler auf die Teams natürlich möglichst gerecht ablaufen. Die üblichsten Verfahren dafür sind eine Draft oder eine Auktion. Eine Draft läuft üblicherweise so ab, dass eine Reihenfolge der Teams ausgelost wird und in dieser Reihenfolge wählen die Teams dann Runde um Runde abwechselnd ihre Spieler aus, bis jedes Team die vorher festgelegte Spieleranzahl aufweist. Um es etwas fairer zu gestalten, wird meist der Modus einer Snake-Draft gewählt; das bedeutet, die Draftreihenfolge dreht sich in jeder Runde um – wer in Runde 1 als Erster wählt, wählt in Runde 2 als Letzter, in Runde 3 wieder als Erster usw.

Beim Auktionsverfahren gibt es in der Regel ebenfalls eine Reihenfolge, jedoch wählt das Team, das an der Reihe ist, nicht einfach einen Spieler und behält ihn; es wählt nur aus, welcher Spieler als nächstes versteigert wird. Dann können alle Teams um diesen Spieler mitbieten und das meistbietende Team bekommt ihn. Natürlich geht es dabei nicht um echtes Geld sondern um ein für alle einheitlich festgelegtes virtuelles Budget.

Für die Zeit nach der Draft oder Auktion erlauben die meisten Ligen, dass die Teams sich untereinander auf Trades in Form von Tauschgeschäften einigen. Zudem können Spieler entlassen und andere, noch nicht vergebene Spieler neu verpflichtet werden. Das kann nach dem Prinzip „wer zuerst kommt, malt zuerst“ laufen, aber auch nach gerechteren Verfahren wie einer Rangliste, die z. B. dem schlechtesten Team den ersten Zugriff sichert, oder mit einer Mini-Auktion um jeden Spieler, den mehrere Teams verpflichten wollen.

Die Wahl der Kategorien und Positionen
Zu den Modalitäten, auf die man sich vor dem Start einigen muss, gehört neben der Regelung, wie man Spieler in sein Team bekommt, auch die, wie viele und welche Spieler überhaupt auszuwählen sind. In manchen Ligen nimmt man es ganz genau und legt jede Position exakt fest, also zum Beispiel auch, dass das Outfield aus RF, CF und LF zu bestehen hat. Andere Ligen sind da etwas lockerer und verlangen nur drei OF und ermöglichen zusätzlich zu den festen Positionen noch einen flexiblen Platz, auf dem quasi als DH ein beliebiger Batter aufgestellt werden darf. Üblicherweise sind in einem Fantasy-Roster alle Positionen in irgendeiner Weise vertreten, einschließlich Starting Pitchern und Relief Pitchern. Neben den Plätzen in der Aufstellung gibt es meist noch ein paar Benchplätze, auf denen man Spieler parken kann, die an dem Tag nicht spielen oder die man nur als Reserve für den Ausfall eines besseren Spielers an Bord hat.

Ebenfalls einigen muss man sich, welche Kategorien zu bewerten sind. Der Klassiker ist das sogenannte 5×5-Scoring. Es enthält fünf Kategorien für Batter (Runs Scored, Homeruns, Runs Batted In, Stolen Bases, Average) und fünf für Pitcher (Wins, Saves, Strikeouts, Earned Run Average, Walks plus Hits Per Innings Pitched); Defensivleistungen bleiben (leider) meistens unberücksichtigt. Die zunehmende Kritik an bestimmten statistischen Kategorien, die weniger einer Individualleistung zuzurechnen sind als der des umgebenden Teams – zum Beispiel RBI oder Pitcher-Wins – führt dazu, dass sich immer mehr Ligen von dem 5×5-Standard lösen und einzelne Kategorien gegen sinnvollere tauschen – beispielsweise Slugging oder Innings Pitched.

Der Spielmodus
Wir haben Teams, wir haben Regeln für das Lineup und die zu wertenden Kategorien – jetzt müssen wir noch festlegen, wie man gewinnt. Es gibt im Wesentlichen zwei Verfahren, zwischen denen man wählen kann: Head-to-Head oder Rotisserie.

Bei einer Rotisserie- oder kurz Roto-Liga werden die gewählten statistischen Kategorien über das gesamte Jahr hinweg kumuliert. Je nachdem, welchen Rang man in den einzelnen Kategorien belegt, erhält man Punkte und die Punkte von allen Kategorien zusammen bestimmen den Tabellenrang.

Head-to-Head oder kurz: H2H bedeutet, dass die Fantasy-Liga einen Spielplan hat, der jedem Team für jede Woche ein anderes Team als Gegner zuordnet. In dem Fall erzielt man Punkte nicht im Vergleich mit der gesamten Liga sondern im Vergleich mit dem jeweiligen Gegner. Wenn ich in einer 5×5-Liga in einer Woche in sieben Kategorien besser war als der Gegner und in drei Kategorien schlechter, dann erhalte ich für diese Woche sieben Punkte und er drei. H2H-Ligen sehen zudem oft ein Playoff-System am Ende der Saison vor.

Während beim H2H immer ein gewisser Glücksfaktor mitspielt, welches Team man in welcher Woche zum Gegner hat, ist die Roto-Liga in dieser Hinsicht gerechter. Andererseits kann es beim Roto passieren, dass eine Saison schon nach ein, zwei Monaten nur noch so dahinplätschert, weil das eigene Team irgendwo in der Mitte gefangen ist und sich kaum etwas bewegt; beim H2H hat man hingegen auch in einem schlechten Jahr zumindest die Möglichkeit, hin und wieder als Underdog ein Top-Team zu ärgern, zudem bringt ein Playoff-System zusätzliche Spannung ins Spiel. Mir macht das H2H-System deshalb mehr Spaß als Roto.

Langfristig oder immer wieder neu?
Wenn man in den Fantasy-Sport einsteigt, tut man das meistens durch Teilnahme an einer Re-Draft-Liga. Das bedeutet, die Mannschaft besteht am Anfang der Saison nur aus einem Namen und während der Draft oder der Auktion stehen sämtliche Spieler der MLB zur Wahl. Das ist auf jeden Fall sinnvoll, wenn man das Spiel erst mal ausprobieren möchte, wenn die Mitspieler von Jahr zu Jahr stark wechseln oder wenn man großen Wert auf jährlich wiederhergestellte Chancengleichheit legt.

Für einen stabilen Mitspielerkreis kann es seinen Reiz haben, eine bestimmte Anzahl von Keepern festzulegen, das heißt von Spielern, die man sich aus dem eigenen Team des Vorjahres auch für das nächste Jahr sichern kann. Üblich sind in dem Fall zwei oder drei Keeper, es gibt aber auch sogenannte Dynasty-Ligen, bei denen zehn oder noch mehr Spieler über die Saison hinaus im Team bleiben. Das Interessante an solchen Ligen ist, dass man in längeren Zeiträumen denken und Strategien ähnlich wie im echten Baseball entwickeln muss – strebt man beispielsweise ein langfristig erfolgreiches Team an und ist bereit, dafür auch ein paar Prospects ein, zwei Jahre durchzuziehen? Oder setzt man alles darauf, jetzt zu gewinnen und sichert sich statt Talenten lieber solide ältere Spieler, die sofort weiterhelfen, auch wenn sie in ein, zwei Jahren wahrscheinlich deutlich an Wert verlieren oder gar die Karriere beenden?

Ein paar grundlegende Strategien
Ich bin gern bereit, ein bisschen aus dem Nähkästchen zu plaudern und meine Strategien zu teilen, allerdings hängt Vieles sehr stark von den Rahmenbedingungen der jeweiligen Liga ab. Hier ein paar Grundprinzipien, die für jede oder fast jede Liga gelten:

  • In die Draft oder Auktion sollte man stets gut vorbereitet gehen, sie ist definitiv der wichtigste Teil einer erfolgreichen Fantasy-Saison. Gute Vorbereitung bedeutet, dass man sich erstens genau über die Regeln und Abläufe der jeweiligen Liga informiert und das man zweitens ein Ranking aller infrage kommenden Spieler zur Hand hat. Das muss man natürlich nicht komplett selbst verfassen – als Grundlage bedient man sich in der Regel einer der unzähligen Listen aus dem Internet, die man dann an die eigenen Vorlieben und Einschätzungen sowie an die Schwerpunkte der Liga anpasst.
  • In den ersten Draft- oder Auktionsrunden muss die Basis für konstante Punkteproduktion gelegt werden, daher sollte man auf sichere Performer setzen. Risikospieler, die hohes Potenzial versprechen, aber z. B. bekannte Sperrungs- oder Verletzungsgeschichten mitbringen, solltet ihr Anderen überlassen oder zumindest erst in späteren Runden zugreifen, falls sie so tief fallen.
  • Rankings bieten eine wichtige Orientierung, aber ebenso wichtig ist eine gewisse Flexibilität. Manchmal ergibt sich eine Gruppendynamik (ein sogenannter „Run“), in der eine bestimmte Position viel früher abgegrast wird als man gedacht hätte. Manchmal kann es sinnvoll sein, auf den fahrenden Zug aufzuspringen, aber meistens ist es erfolgversprechender zu schauen, welche Position im Gegenzug vernachlässigt wurde und dort zuzuschlagen. Im Idealfall startet ihr damit selbst einen Run und steuert so Tempo und Richtung der Draft.
  • Die Spieler, die ihr in späten Runden bzw. für wenig Geld bekommt, sind meist relativ austauschbar. Greift bevorzugt zu Spielern, die mehrere Positionen ausfüllen können, und traut euch in dieser Phase ruhig, auch Spieler mit hohem Risiko zu holen – zur Not tauscht ihr sie später auf dem Free-Agent-Markt um.
  • Achtet nicht allein auf die Statistiken der einzelnen Spieler sondern auch auf die Dichte der jeweiligen Position – es gibt zum Beispiel viel mehr gute Batting-Statistiken produzierende Outfielder als Shortstops. Das macht einen guten Shortstop wertvoller und es ist meist ratsam, das Middle Infield relativ früh anzugehen. Für die einzelnen Kategorien gilt Dasselbe wie für die Positionen: Stolen Bases beispielsweise sind seltener als Homeruns; wenn man einen Top-Performer will, der Bases stiehlt und gleichzeitig keine Katastrophe in den anderen Kategorien ist, muss man früh zugreifen.
  • Während der Saison lohnt es sich, bei der Aufstellung im Blick zu haben, wo und gegen wen die eigenen Spieler antreten. Einen sonst soliden Pitcher lasse ich vielleicht mal auf der Bank, wenn er bei einem besonders offensivstarken Gegner antreten muss. Auf der anderen Seite lasse ich einen sonst nur mittelmäßigen Batter gerne mal ran, wenn er in einem hitterfreundlichen Ballpark gegen den fünften Pitcher des Gegners antritt.
  • Wo finde ich Mitspieler?
    Wer einen großen baseball-affinen Freundeskreis hat, kann natürlich jederzeit selbst die Initiative ergreifen und eine Liga gründen. Einfacher ist es, nach einer bestehenden Liga zu suchen und sich dieser anzuschließen. Zum einen gibt es bei allen großen Fantasy-Anbietern – z. B. CBS, ESPN und Yahoo – öffentliche Ligen, denen man mit einem Klick beitreten kann. Das Problem dabei ist, dass man nicht weiß, mit wem man es in so einer Liga zu tun hat und es deshalb oft vorkommt, dass Teams wegen Lust- und Erfolglosigkeit während der Saison aufgegeben werden. Die Wahrscheinlichkeit dafür ist geringer, wenn man sich seine Mitspieler in einem Forum sucht. In quasi jedem amerikanischen Baseballforum finden sich regelmäßig Mitglieder zu Fantasy-Ligen zusammen und freuen sich über Neulinge. Dasselbe gilt für die wenigen deutschsprachigen Foren mit Bezug zu US-Sport – auf nfl-talk.net und auf baseball-forum.de werden beispielsweise noch Mitspieler für neue oder bestehende Ligen gesucht.

    Posted in Grundwissen, MLB, Spiele, Statistik Tagged with: , , , ,

    Februar 18th, 2017 by Dominik

    Die meisten Statistiken, mit denen man sich im Baseball beschäftigt, beziehen sich auf die Vergangenheit. Über die Aussagekraft der jeweiligen Maße – seien es Pitcher-Wins, Earned Runs, Runs created oder was auch immer – kann man trefflich streiten. Aber zumindest beruhen all diese Werte auf Fakten, auf nachprüfbar erfolgten Ereignissen. Schwieriger wird es, wenn man etwas über Ereignisse wissen will, die noch nicht passiert sind. Dann braucht man Vorhersagen und wie sagt man so schön? Prognosen sind schwierig, besonders wenn sie die Zukunft betreffen…

    Wofür braucht man überhaupt Vorhersagen?
    Vorhersagen braucht man zum Beispiel, um sich eine fundierte Meinung zu bilden, welchen Spieler man gerne mit einem langen Vertrag ausgestattet bzw. überhaupt im eigenen Team sehen möchte. Natürlich hilft da schon der Blick auf die in der Vergangenheit produzierten Zahlen; aber meistens verändern die sich von einem Jahr zum anderen und selbst wenn man davon ausgeht, dass ein Spieler seine Leistungen von einem Jahr aufs andere nahtlos fortsetzt, dann hat man damit bereits eine Vorhersage getroffen. Prognosen helfen auch ungemein beim Fantasy Baseball und anderen Spielen, in denen man auf Ergebnisse wettet.

    Vorhersagen beruhen in erster Linie auf Vergleichen: auf Vergleichen mit ähnlichen Spielern und auf Vergleichen mit der eigenen Vergangenheit. Eine gute Vorhersage sollte daher möglichst viele Informationen über die Vergangenheit des betreffenden Spielers sammeln und berücksichtigen: angefangen beim Alter über seine Leistungen im College und den Minors bis hin zu denen in der MLB, über Neigungen zu Stabilität oder Schwankung, über Verletzungsgeschichten und Vieles mehr. Wenn ich zum Beispiel weiß, dass ich einen .250-Karriere-Batter vor mir habe, dann kann ich daraus ableiten, dass eine einzelne .320-Saison wahrscheinlich ein statistischer Ausreißer ist und der Spieler sich im nächsten Jahr vermutlich wieder in Richtung der .250 bewegen wird. Zudem sollte die Vorhersage möglichst viele Informationen über die Karriereverläufe anderer Spieler berücksichtigen. Wenn ich weiß, dass die meisten Shortstops mit 35 Jahren nicht mehr die gleiche Leistung bringen wie mit 28, dann kann ich dies als Annahme in meine Prognose darüber einfließen lassen, in welche Richtung sich die Leistung des 30-jährigen Shortstops X in den kommenden fünf Jahren entwickeln wird.

    Welche Vorhersagesysteme gibt es?
    Für die MLB gibt es unzählige Vorhersagesysteme. Jede Statistikseite, jede Fantasy-Baseball-Engine, jeder Wettanbieter hat ein eigenes System und arbeitet ständig daran, dieses in Konkurrenz mit den anderen zu verbessern. Ich greife vier dieser Systeme aus dem Informationsdschungel heraus, um sie als Beispiele vorzustellen: PECOTA, ZiPS, Steamer und Marcel. Ich wähle diese vier, weil ich zu ihnen auf eine gute Vergleichsanalyse gestoßen bin – und auch, weil zumindest die drei erstgenannten Systeme die bekanntesten und verbreitetesten sein dürften.

    Marcel oder ausführlich: „Marcel The Monkey Forecasting System“ ist ein sehr simples, aufs Wesentliche beschränktes Vorhersagesystem, das von Tom Tango entwickelt wurde. Im Gegensatz zu den anderen hier vorgestellten Systemen liegen die verwendeten Formeln komplett offen und werden nicht weiterentwickelt. Das Ziel von Marcel ist ausdrücklich nicht, besser als andere Vorhersagen zu sein; sein Sinn besteht vielmehr darin, eine Vergleichsgröße für andere Systeme zu bieten. Nach dem Motto: Wenn das andere System irgendetwas taugt, dann muss es zumindest bessere Ergebnisse erzielen als dieses hier, welches so einfach ist, dass Marcel der Affe (aus der Fernsehserie „Friends“) es durchführen könnte.
    Marcel prognostiziert eine beliebige Statistikkategorie auf Basis der vom jeweiligen Spieler in den letzten drei Jahren erzielten Werte. Dabei werden die neueren Jahre etwas stärker gewichtet als die älteren Jahre. Als zusätzlicher Faktor wird der Ligadurchschnitt der letzten drei Jahre herangezogen unter der Annahme, dass die Leistung des betrachteten Spielers sich in Richtung dieses Durchschnitts bewegt. Der dritte Schritt ist eine Anpassung an das Alter des Spielers in der Annahme, dass die Leistungen bis zum Alter von 29 Jahren ansteigen und danach nachlassen. Da Marcel nur Werte einbezieht, die in den letzten drei Jahren in der MLB erzeugt wurden, entspricht seine Prognose für Rookies und andere Spieler, die keine MLB-Ergebnisse vorzuweisen haben, automatisch dem Ligadurchschnitt.

    PECOTA ist das Vorhersagesystem von Baseball Prospectus und wurde ursprünglich von Nate Silver entwickelt. Der Name steht für „Player Empirical Comparison and Optimization Test Algorithm“ und ist gleichzeitig eine Anspielung auf den ehemaligen Infielder Bill Pecota. PECOTA geht vom selben Ausgangspunkt aus wie Marcel, also einer Prognose aufgrund der gewichteten Leistungen aus den letzten Jahren. Das Besondere an diesem System sind die anschließenden Anpassungen, die nicht vom Ligadurchschnitt ausgehen sondern von konkreten Vergleichsspielern. Anhand von Daten wie Spielstatistiken, Alter, Körperbau und Feldposition werden aktuelle oder frühere Spieler identifiziert, die dem betrachteten Spieler ähneln. Je größer die ermittelte Ähnlichkeit, umso stärker fließt der Karriereverlauf des Vergleichsspielers in die Prognose für die Entwicklung des betrachteten Spielers ein. Das Ergebnis der Analyse sind nicht nur prognostizierte Werte für die Leistung in der kommenden Saison, sondern auch Wahrscheinlichkeitsaussagen wie „Spieler X wird mit 12% Wahrscheinlichkeit ein Breakout-Jahr haben und zu 45% eine leichte Verbesserung aufweisen“.

    ZiPS nennt sich das Vorhersagesystem von Dan Szymborski, nach dem es – in etwas eigenwilliger Weise – auch benannt ist: sZymborski Projection System. ZiPs wird (neben anderen Systemen) von Fangraphs verwendet. Ähnlich wie die beiden vorgenannten Systeme beginnt auch ZiPS mit den Leistungen des betreffenden Spielers aus den (drei bis vier) Vorjahren, gewichtet nach Aktualität. Und ähnlich wie PECOTA wird bei der Zukunftsprognose die Entwicklung vergleichbarer Spieler berücksichtigt, wobei die Ähnlichkeitskriterien deutlich weiter gefasst sind als bei PECOTA. Auf die Art entsteht ein größerer Pool von Vergleichsspielern und das Gewicht der einzelnen Vergleichsspieler fällt entsprechend geringer aus. Für Pitcher weist ZiPS die Besonderheit auf, dass es stark zwischen defense-unabhängigen und defense-abhängigen Statistiken unterscheidet; dadurch schlägt es stärker als bei anderen System auf die Prognose eines Pitchers durch, wenn dieser das Team wechselt und künftig von einer besseren oder schlechteren Defense oder einem anderen Ballpark umgeben ist.

    Steamer ist aus einem High-School-Projekt hervor gegangen und wird hauptsächlich von Fangraphs und Razzball verwendet. Seinen Namen hat es vom Baseballteam der High School, den Saint Ann’s Steamers. Steamer ist methodisch relativ nah an Marcel in dem Sinne, dass es von der Leistung in vorangegangenen Spielzeiten ausgeht und diese nach typischen Altersentwicklungen und nach angenommener Regression zum Ligadurchschnitt anpasst. Diese Anpassungen werden jedoch in ausgefeilterer Weise vorgenommen, indem zum Beispiel die Gewichtung der einzelnen Jahre sowie das Ausmaß der Regression zum Durchschnitt sich an vorhandenen Entwicklungsdaten früherer Spieler ausrichten.

    Und welche Vorhersage ist die beste?
    Die ehrlichste Antwort auf die Frage nach dem besten Vorhersagesystem ist: Kommt drauf an. Jedes der vorgestellten Systeme hat seine Eigenheiten und damit auch seine Stärken und Schwächen. Aber natürlich hat es auch einen Reiz, einfach mal eine handvoll Statistiken zu nehmen, für die jedes der vorgestellten Systeme eine Prognose erzeugt hat, und diese Prognosen nach Abschluss der Saison nebeneinander zu legen. Henry Druschel hat dies für einen Artikel auf Bexond The Box Score getan und ist zu interessanten Resultaten gekommen. Ich gebe sie hier nur in aller Kürze wieder, für tiefergehende Infos schaut einfach direkt in Druschels lesenswerten Artikel rein.

    Druschel hat die Merkmale Walk Rate (BB%), Strikeout Rate (K%), weighted On-Base-Average (wOBA), On-Base Percentage (OBP) und Slugging (SLG) ausgewählt und für alle Spieler, die in jedem der Systeme berücksichtigt wurden, die Abweichungen zwischen den von jedem einzelnen System prognostizierten Werten für 2016 und den tatsächlichen Leistungen des Jahres 2016 ermittelt. Diese Werte hat er verglichen, um zu sehen, welche Vorhersage der Wirklichkeit im Durchschnitt am nächsten kam.

    Die kompliziertesten Verfahren sind offensichtlich nicht immer die besten, denn der Realität am nächsten kam mit Steamer das einfachste der drei etablierten Systeme. PECOTA landete knapp dahinter, während ZiPS nicht nur durchweg schlechtere Ergebnisse als die beiden anderen lieferte sondern in vier von fünf Kategorien noch hinter Marcel dem Affen landete. OBP sagte Marcel sogar von allen System am besten voraus. Interessant finde ich auch die Erkenntnis, dass wenn man von allen vier Systemen den Durchschnitt bildet, dieser fast durchweg eine bessere Prognose darstellt als jedes System für sich.

    Neben der Betrachtung der Liga insgesamt hat Druschel seine Analyse auch speziell für Rookies sowie für Elite-Spieler (defniert als Top-20 in OPS in mindestens einem der Vorhersagesyteme) durchgeführt. Das überraschendste Ergebnis war für mich, dass Marcel bei den Rookies die besten Ergebnisse in den Kategorien OBP und SLG erzielt. (Zur Erinnerung: Die Methode von Marcel besteht für Rookies darin, dass schlichtweg der Ligadurchschnitt der Vorjahre angenommen wird!) Auch für die Top-Spieler stellt Marcel in diesen beiden Kategorien und zusätzlich noch in wOBA die beste Prognose dar. Während Gesamtsieger Steamer bei der Prognose für junge Spieler deutliche Schwächen zeigt, bringt ZiPS hier deutlich bessere Resultate hervor als bei der Betrachtung der Top-Spieler und der Liga insgesamt.

    Als Fazit lässt sich festhalten, dass die aufwändigen Prognosesysteme sich im Vergleich mit der nach Marcel dem Affen benannten simplen Metohode erstaunlich schwach schlagen. Dies gilt insbesondere für ZiPS. Natürlich sollte man eine solche Analyse nicht überbewerten. Zum einen ist der betrachtete Zeitraum recht kurz, selbst wenn man berücksichtigt, dass die Ergebnisse für 2016 eine ähnliche Analyse für 2015 weitgehend bestätigen. Zum anderen zeigt zum Beispiel die unterschiedliche Performance bei der Prognose für Rookies, dass keines der betrachteten Systeme durchweg besser oder schlechter ist als die anderen.

    Posted in Grundwissen, MLB, Statistik Tagged with: , , , , ,

    September 24th, 2016 by Dominik

    Angesichts von Europameisterschaft, Deutscher Meisterschaft und der heißen Phase der MLB-Saison sind in letzter Zeit meine Statistik-Erklärartikel ein wenig zu kurz gekommen. Das ist nicht schlimm, denn es gibt ja bald wieder eine viel zu lange Offseason. Mit einem Indikator möchte ich mich aber doch schon jetzt beschäftigen, denn er ist besonders interessant in Bezug auf die aktuelle Diskussion, wer dieses Jahr die Titel der Most Valuable Players (MVP) der beiden Ligen erhalten soll.

    Die MVPs werden vom Baseball-Journalistenverband, der Baseball Writers‘ Association of America (BBWA) gewählt. Regelmäßig gibt es flammende Kontroversen darüber, welche Kriterien bei der Auswahl angelegt werden sollen. Da gibt es zum einen die Frage, ob und welche Rolle es spielen soll, ob der betreffende Spieler in einem erfolgreichen Team spielt. Die eine Fraktion sagt, es ist egal, da es um eine individuelle Auszeichnung geht und ein Spieler nicht für den Rest des Teams verantwortlich ist; die andere Fraktion sagt, ein Spieler, der mit seinem Team dauernd verliert, kann nicht der wertvollste der Liga sein. Die andere Frage ist, welche Statistiken am besten Auskunft über die Qualität eines Spielers geben. Traditionalisten schauen in erster Linie auf die Komponenten der Triple Crown: RBI, Batting Average und Homeruns für Batter; Wins, ERA und Strikeouts für Pitcher. Der progressivere Ansatz hingegen besteht darin, über diese Einzelwerte hinaus zu schauen und zu versuchen, den gesamten egenständigen Beitrag des jeweiligen Spielers zum Teamerfolg zu messen.

    Der bekannteste Indikator, der diesen Gesamtbeitrag eines Spielers misst, heißt Wins Above Replacement, kurz: WAR. Das Grundprinzip von WAR besteht darin, dass der Wert des jeweiligen Spielers in Form von Siegen gemessen wird und zwar im Vergleich mit einem Spieler auf Replacement Level. Oder anders formuliert, WAR beantwortet die Frage: Wie viele Siege hat das Team mehr auf dem Konto, weil es den bestimmten Spieler X im Roster hat statt eines beliebigen Spielers Y?

    Das Thema Replacement Level oder „beliebiger Spieler“ muss ich noch etwas näher erläutern: Ein Spieler auf Replacement Level meint einen Spieler, der einem MLB-Team zu minimalen Kosten und mit minimalem Aufwand zur Verfügung steht. Replacement Level ist in jedem Fall weniger als ein durchschnittlicher MLB-Spieler, aber auch mehr als irgend jemand Dahergelaufenes wie Tim Tebow oder ich. Replacement Level ist das Niveau, das ich erwarten kann, wenn ich wegen Verletzungen oder sonstiger Ausfälle eine Lücke mit einem Minor Leaguer oder einem arbeitslosen Profi zum Mindestlohn der MLB fülle. Die beiden führenden Statistikseiten Fangraphs und Baseball-Reference haben sich vor einigen Jahren auf eine gemeinsame Annahme zum Replacement Level geeinigt. Demnach entspricht das Replacement Level einer Siegrate von 29,4%. Ein Team, das nur aus Replacements besteht, würde in einer 162-Spiele-Saison nach dieser Annahme 47,7 Spiele gewinnen.

    WAR ist keine offizielle MLB-Statistik und nicht standardisiert, das heißt unterschiedliche Quellen benutzen unterschiedliche Formeln und kommen zu leicht unterschiedlichen Ergebnissen, obwohl sie im Großen und Ganzen das gleiche messen. Das gilt auch für Fangraphs und Baseball-Reference, die sich zwar auf ein einheitliches Replacement Level geeinigt haben, aber eben nicht auf eine einheitliche Formel für WAR. Mit in die Aufzählung gehört auch Baseball Prospectus, bei denen der Indikator WARP (Wins Above Replacement Player) heißt. Die Grundidee ist bei allen drei Quellen die gleiche, nämlich dass man sich fragt,
    – wie viele Runs ein Spieler für sein Team produziert hat,
    – wie viele Runs der gegnerischen Teams er verhindert hat,
    – wie viele Siege für sein Team diese Anzahl von verursachten oder verhinderten Runs wert ist und
    – welchen Mehrwert gegenüber einem hypothetischen Replacement-Spieler diese Siege darstellen.

    Eine sehr übersichtliche Darstellung der Unterschiede in den Berechnungsweisen kann man bei Baseball-Reference nachlesen. Fürs Erste genügt es zu wissen, dass bei der Bewertung von Pitchern für Baseball-Reference und Baseball Prospectus die Runs Allowed (RA) im Mittelpunkt stehen, für Fangraphs hingegen Fielding Independent Pitching (FIP) und dass bei der Bewertung von Battern alle drei auf unterschiedliche Weise die Leistungen am Schlag, im Feld und beim Baserunning mit einbeziehen und auch Parkfaktoren berücksichtigen. Letzteres bedeutet, dass der Einfluss auf die zählbaren Leistungen eines Spielers, häufiger in einem eher hitter- oder pitcherfreundlichen Ballpark zu spielen, herausgerechnet wird.

    Unterschiedliche Berechnungen führen zu unterschiedlichen Ergebnissen. Das sieht man auf einen Blick, wenn man die WAR-Tabellen von Fangraphs (Spalte ganz rechts), Baseball-Reference (links oben) und Baseball Prospectus (zwei Links für Pitcher und Batter, jeweils Spalte ganz rechts) vergleicht. Immerhin sind sich Fangraphs und Baseball-Reference einig, dass Mike Trout in der aktuellen Saison bisher die meisten Wins für sein Team wert war und alle drei Seiten kommen gleichermaßen zu dem Ergebnis, dass Trout mit 8 bis 10 WAR die American League anführt und Kris Bryant mit 7 bis 9 die National League. Folgt man diesen Zahlen, müssten Trout und Bryant dieses Jahr MVP werden. Ob es wirklich so kommt? Wir werden sehen, aber ich wage es zu bezweifeln – vor allem in Bezug auf Trout, der in keiner der „klassischen“ Kategorien vorne steht und obendrein bei einem wirklich schlechten Team spielt.

    Posted in MLB, Statistik Tagged with: , , , , , ,

    September 14th, 2016 by Dominik

    Dass Zahlen eine magische Anziehung auf mich ausüben, dürfte an der einen oder anderen Stelle in diesem Blog schon aufgefallen sein. In diesem Artikel soll es um eine Zahl gehen, die auch so heißt: Magic Number. Spätestens ab Mitte September ist diese magische Zahl regelmäßig in aller Munde und ich möchte kurz erklären, was es damit auf sich hat.

    Die Magic Number gibt an, wie nah ein Team daran ist, ein bestimmtes Ziel – in der MLB üblicherweise den Divisionstitel oder einen Wild-Card-Platz – hieb- und stichfest zu erreichen. Zum Beispiel haben die Chicago Cubs in Bezug auf den Gewinn der National League Central momentan eine Magic Number von 3. Das heißt, wenn und sobald die Cubs von ihren 18 verbleibenden Spielen 3 gewinnen, ist ihnen der Divisionssieg nicht mehr zu nehmen. Mit jedem Sieg des betreffenden Teams verringert sich die Magic Number um 1 und logischerweise auch mit jeder Niederlage des direkten Verfolgers (wobei als direkter Verfolger immer das Team mit den wenigsten Niederlagen hinter dem Führenden anzusehen ist).

    Die Berechnung der Magic Number ist recht einfach. Man nimmt die Gesamtzahl der Saisonspiele (G), addiert 1 und zieht dann die bereits erzielten Siege des führenden Teams (WA) sowie die erlittenen Niederlagen des direkten Verfolgers (LB) ab:

    G+1-WA-LB

    Beim aktuellen Tabellenstand der NL Central berechnet sich die Magic Number also wie folgt:

    Team W L
    Chicago Cubs 92 52
    St. Louis Cardinals 76 68

    162+1-92-68=3

    Zu Saisonbeginn lautet die Rechnung für jedes MLB-Team

    162+1-0-0=163

    Das heißt, jedes Team hat zum Saisonstart eine Magic Number von 163. Klingt auf den ersten Blick logisch, denn selbst mit 162 Siegen aus 162 Spielen könnte es ja theoretisch sein, dass ein anderes Team das gleiche Kunststück schafft und am Ende Gleichstand herrscht. Bei näherem Hinsehen erweist sich das aber als Irrtum, denn man trifft 19-mal auf jeden Divisionsrivalen. Wenn man 153 Spiele gewinnt, dann hat man den hartnäckigsten Verfolger mindestens zehnmal besiegt und dieser höchstens 152 Spiele gewonnen. Hier zeigt sich eine Unschärfe der Magic Number: Sie berücksichtigt nicht den Spielplan und fällt dadurch manchmal zu hoch aus.

    Eine sinnvolle Magic Number (also eine, die nicht mehr Siege voraussetzt als Spiele übrig sind) haben übrigens nur solche Teams, die den betreffenden (Spitzen- oder Wild-Card-)Platz bereits belegen – wenn man zurückliegt, ist man schließlich neben eigenen Siegen immer auch auf Niederlagen der besser Platzierten angewiesen. Um auch diese Situation in einer Zahl auszudrücken, gibt es als böse Zwillingsschwester der Magic Number die sogenannte Elimination Number.

    Die Elimination Number drückt aus, wie viele Siege des führenden Teams kombiniert mit Niederlagen des verfolgenden Teams dazu führen, dass das verfolgende Team aus dem Rennen ist. Für den direkten Verfolger ist die Elimination Number identisch mit der Magic Number des Führenden. Für jeden weiteren Verfolger ist sie entsprechend höher und kann mit der oben genannten Formel berechnet werden, wobei WA wie gehabt die Siege des Führungsteams sind und LB die Niederlagen des jeweils betrachteten Teams.

    Um im Beispiel zu bleiben, berechnen wir die Elimination Number der Pittsburgh Pirates, die in der NL Central mit 73 Niederlagen Rang 3 belegen:

    162+1-92-73=-2

    Wir erhalten einen negativen Wert und somit wissen wir, dass die Pirates in Bezug auf den Divisionstitel bereits unwiderruflich ausgeschieden sind. Die NL Central ist übrigens die einzige Division, in der der Drittplatzierte keine theoretische Chance mehr auf den Divisionssieg hat. Besonders hoch sind die Elimination Numbers in der heiß umkämpften AL East, in der selbst die viertplatzierten New York Yankees noch einen Wert von 15 aufweisen. Das heißt, erst nach einer Kombination von 15 Siegen der Red Sox und/oder Niederlagen der Yankees, sind Letztere endgültig aus dem Rennen.

    MLB-Tabellen mit Elimination Numbers gibt es zum Beispiel bei CBS, hier in Bezug auf die Divisionstitel und hier in Bezug auf die Wild Cards. Die Magic Numbers werden dort nicht dargestellt. Das macht aber nichts, da wir ja nun wissen, dass die Magic Number des Erstplatzierten immer identisch ist mit der Elimination Number des Zweitplatzierten.

    Posted in MLB, Statistik Tagged with: ,

    September 3rd, 2016 by Dominik

    Ich muss mal wieder fangraphs.com loben. Die für mich – gemeinsam mit baseball-reference.com – beste aller MLB-Statistikseiten hat diese Woche eine interessante Neuerung eingeführt und zwar ein interaktives Splits-Tool. Was kann man damit machen? Nun, wenn ihr zum Beispiel schon immer den Eindruck habt, dass Yoenis Cespedes besonders gut schlägt, wenn er in Auswärtsspielen gegen linkshändige Pitcher antritt und sich Runner auf den Bases befinden, dann könnt ihr das nun mit wenigen Klicks bestätigen oder euch eines Besseren belehren lassen.

    Das funktioniert so: Auf der Seite eines beliebigen Spielers, also zum Beispiel der von Yoenis Cespedes, wählt man in der Navigationsleiste direkt unter dem Infokasten das Splits Tool aus. Das Tool umfasst drei Bereiche, in denen man Einstellungen vornehmen kann: ganz oben die Auswahl, welche Statistiken – Standard, Advanced, Batted Ball – man angezeigt haben möchte. Kernstück des Tools sind die diversen Splits, also Filter, die man in den mittleren Zeilen auswählen kann. Die meisten davon sind selbsterklärend, außer vielleicht „Leverage“: Damit ist gemeint, wie spannend oder wichtig die Spielsituation gerade ist. Fangraphs bildet dazu einen Leverage Index, der in einer durchschnittlichen Spielsituation bei 1 liegt. Liegt er unter 0,85, so gilt die Situation als „Low Leverage“, bei über 2 als „High Leverage“. Besonders anschaulich sieht man die Entwicklung der Leverage während eines Spieles in der kleinen Grafik unter jedem Scoreboard von Fangraphs. Wenn man die gewünschten Filter gewählt hat, kann man unter „Group By“ noch die gewünschte zeitliche Gruppierung festlegen, um sich die Ergebnisse für die Gesamtkarriere oder einzelne Jahre, Monate, Wochen, Spiele anzuschauen.

    Für das oben genannte Beispiel wähle ich auf der Seite von Yoenis Cespedes bei Statistiken „Advanced“, weil ich die Schlagleistung anhand des Wertes OPS beurteilen möchte. Als Splits wähle ich „vs. LHP“, „Away“ und „Runners On“. Mit jeder Aus- und Abwahl einer Option sieht man sofort die angepassten Statistiken. Zu guter Letzt wähle ich noch „Season“ als Gruppierungsvariable, damit ich die Werte nach einzelnen Saisons angezeigt bekomme. Das war schon alles und ich weiß jetzt, dass Cespedes in den gewählten Situationen tatsächlich gut geschlagen hat: 2015 mit einer OPS von 1.008, 2016 mit 1.200. Wähle ich alle drei Splits wieder ab, sehe ich zum Vergleich seine Gesamtwerte der jeweiligen Saison (2015: .870, 2016: .939).

    Ein paar Wünsche lässt das Tool leider offen: Zum einen reichen die Daten nur bis zum Jahr 2002 zurück, für historische Vergleiche taugt es somit nicht. Außerdem vermisse (oder übersehe?) ich eine Möglichkeit, zwischen Pitching- und Batting-Statistiken zu wechseln. Für Pitcher zeigt das Tool Pitching-Stats an, für Batter Batting-Stats, aber wenn ich zum Beispiel etwas über das Batting von Madison Bumgarner herausfinden möchte, lässt es mich im Stich. Super fände ich zudem, wenn man bei Spielern, die das Team gewechselt haben, die Ergebnisse danach filtern könnte, für welches Team sie erzielt wurden. Und wenn man sich einzelne Spiele anzeigen lässt, stehen dort zwar die Spieltermine, aber nicht die Gegner. Aber das ist Jammern auf hohem Niveau und wie ich Fangraphs kenne, wird man in nächster Zeit noch die eine oder andere Verbesserung nachrüsten. Auf jeden Fall ist dieses Tool ein toller Fortschritt für jeden Hobby-Baseballstatistiker und das Ganze komplett kostenlos. Diese (natürlich ebenfalls kostenlose) Werbung von mir haben sich die Leute von Fangraphs redlich verdient.

    Posted in MLB, Statistik Tagged with:

    August 20th, 2016 by Dominik

    Um gleich mal mit der Tür ins Haus zu fallen: Mich hat es ernsthaft überrascht, wie klein der Heimvorteil im Baseball im Vergleich mit den meisten anderen Sportarten ist. Ich habe zu dem Thema einen kleinen Vergleich durchgeführt und stelle die Frage nach möglichen Gründen.

    Meine naive Erwartung war eigentlich, dass der Heimvorteil im Baseball größer sein müsste als in anderen Sportarten. Dafür spricht mindestens zweierlei: erstens dass bei den Ballparks weder die Ausmaße noch die Form des Feldes (genauer gesagt des Outfields) exakt festgelegt sind. Nicht umsonst spricht man bei der Beschäftigung mit Baseball-Statistiken von Ballpark-Effekten, also der Eigenschaft eines Stadions, bestimmte Spielertypen – z. B. Hitter oder Pitcher, Linkshänder oder Rechtshänder – zu bevorteilen. Man sollte meinen, dass das zu einem deutlichen Heimvorteil führt, weil die Vereine ihre Teams natürlich so zusammenstellen, dass deren Stärken möglichst perfekt auf den Ballpark abgestimmt sind, in dem sie die Hälfte ihrer Spiele absolvieren, und weil die Spieler die eigene Spielweise an dem Park ausrichten, in dem ihnen jede Ecke und jede Kurve in Fleisch und Blut übergegangen ist. Zweitens spricht für den Heimvorteil, dass sogar die Regeln des Spiels ausdrücklich die Heimmannschaft bevorzugen. Diese darf immer als zweites schlagen und hat somit als einzige die Chance auf einen Walk-Off-Sieg; sie muss sich nie darum sorgen, eine im neunten oder späteren Inning erzielte Führung noch zu verspielen, während sie ihrerseits bei jedem späten Rückstand noch die Chance erhält, zurückzuschlagen. Bei Interleague-Spielen kommt noch hinzu, dass diese nach den Regeln (mit oder ohne Designated Hitter) der Liga des Heimteams ausgetragen werden.

    So schön kann man erklären, warum der Heimvorteil im Baseball besonders groß ist. Das einzige Problem dabei ist, dass das nicht der Realität entspricht. Ich habe mir mal die Mühe gemacht, den Anteil von Heimsiegen in mehreren Sportarten und Ligen auszuwerten. Um auch in Sportarten mit wenigen Spielen auf brauchbare Fallzahlen zu kommen, beziehen sich alle Daten auf einen Fünf-Jahres-Zeitraum (2011-2015 bzw. 2011/12-2015/16), Unentschieden wurden aus der Betrachtung ausgeschlossen.

    Liga Heimsiege
    Major League Baseball 53,32%
    National Hockey League 54,49%
    Nippon Professional League 54,52%
    Baseball-Bundesliga 55,06%
    National Football League 56,93%
    National Basketball Association 58,84%
    Fußball-Bundesliga 60,03%
    Major League Soccer 67,54%

    Ich war wie gesagt überrascht, als ich diese Ergebnisse gesehen habe. Die betrachteten Baseball-Ligen belegen drei der vordersten vier Plätze, während beim Football, Basketball und ganz besonders beim Fußball der Heimvorteil eine größere Rolle spielt. Wie kommt das? Ein möglicher Faktor könnte die von den Fans übertragene Stimmung sein. Es ist kein Geheimnis, dass beim Fußball im Allgemeinen mehr und lauter angefeuert wird als beim Baseball; auch beim Basketball ist davon auszugehen, dass sich aufgrund des kleineren Feldes und der geschlossenen Hallen die Atmosphäre leichter auf die Spieler überträgt als in den weitläufigen Baseballparks. Vielleicht spielen auch die Reisestrapazen eine Rolle. Beim Fußball trifft man sich zu einzelnen Spielen, auf welche sich die Heimmannschaft eine Woche lang zu Hause vorbereitet, während das Auswärtsteam am Spieltag oder einen Tag davor anreist. Beim Baseball hingegen spielt man mehrtägige Serien und oft kommt die Heimmannschaft selbst erst einen Tag vorher zurück in die Stadt. Die Unterschiede könnten ein Stückweit auch am Wetter liegen, denn während Baseball weitgehend in der Jahreszeit stattfindet, in der es überall warm ist, gibt es beim Football und beim Fußball (vor allem in Amerika) Mannschaften, die zu Hause häufiger mit frostigen Temperaturen zu tun haben und das im Gegensatz zu manchen ihrer Gegner gewohnt sind.

    Was ich aufgezählt habe, sind nichts als ungeprüfte Ideen, aber ich habe natürlich auch nach wissenschaftlichen/statistischen Untersuchungen zu dem Thema gesucht. Gefunden habe ich nicht allzu viel, aber immerhin das sehr interessante Buch „Scorecasting – The Hidden Influences Behind How Sports Are Played and Games Are Won“ (hier eine Leseprobe). Die Autoren Tobias J. Moskowitz und L. John Wertheim gehen darin unter anderem der Frage nach, wie der in allen Sportarten zu beobachtende Heimvorteil zustande kommt. Ihre mit reichlich Zahlen und Erklärungen untermauerte Antwort ist eine Aussage, der kaum ein Sportfan widersprechen wird: Die Schiedsrichter sind schuld!

    Tatsächlich zeigen mehrere in dem Buch zitierte Untersuchungen, dass die Offiziellen dazu neigen, die Heimmannschaften zu bevorzugen: Strafen werden häufiger zum Vorteil des Heimteams ausgesprochen, Nachspielzeiten im Fußball sind deutlicher länger bei knappem Rückstand des Heimteams als bei knapper Führung, im Baseball wird deutlich seltener auf called Strike und entsprechend häufiger auf Ball für die heimischen Batter entschieden. Zu allem Überfluss treten diese Eigenheiten umso stärker zu Tage, je knapper und somit wichtiger die konkreten Spielsituationen sind. Moskowitz und Wertheim betonten, dass nicht von bewussten Ungleichbehandlungen durch die Schiedsrichter auszugehen ist, sondern eher von unbewussten gedanklichen Mechanismen, die Emotion des Heimpublikums aufzunehmen, den Stress unliebsamer Entscheidungen zu vermeiden und somit im Zweifelsfall für die Heimmannschaft zu urteilen.

    Im Zusammenhang damit, dass das Publikum beim Fußball in der Regel lauter und emotionaler ist als beim Baseball und dass der Einfluss von Schiedsrichterentscheidungen auf den Spielausgang im Fußball möglicherweise ebenfalls größer ist, scheinen mir die Erkenntnisse von Moskowitz und Wertheim einen brauchbaren Erklärungsansatz für die beobachteten Unterschiede beim Heimvorteil zu liefern. Als abgeschlossen würde ich den Fall deswegen aber nicht betrachten, dazu sind für mich noch zu viele Fragen offen. Beispielsweise fügt sich der ermittelte Wert für Eishockey meiner Ansicht nach nicht so richtig in das Bild ein, denn diesen Sport hätte ich in Sachen Emotionen und Schiedsrichtereinfluss eher in der Nähe von Basketball oder Fußball gesehen als in der von Baseball. Warum der Heimvorteil in der MLS noch deutlich größer ist als in der Fußball-Bundesliga, scheint mir ebenfalls klärungsbedürftig. Ich schließe daher mit dem klassischen Satz: Further research is needed.

    Posted in Baseball in Deutschland, Baseball international, Bücher, MLB, Statistik Tagged with: , , , ,

    August 16th, 2016 by Dominik

    In meinem Artikel über Batting-Statistiken von letzter Woche bin ich bereits ein bisschen auf der Frage herumgeritten, wie man die Leistung oder den Wert einzelner Spieler in Form von Runs ausdrücken kann, und letztlich auf den sehr nützlichen Indikator Runs Created (RC) gestoßen. Heute möchte ich eine weitere Möglichkeit vorststellen, Spielereignisse in Runs zu übersetzen: die Anwendung linearer Gewichte.

    Der Begriff lineare Gewichte (englisch: linear weights) klingt erstmal furchtbar wissenschaftlich und kompliziert. Tatsächlich stehen dahinter zwei einfache und nachvollziehbare Gedanken. Der erste Gedanke ist, dass jedes Ereignis im Spiel einen messbaren Einfluss auf alle folgenden Ereignisse und somit letztlich auf das Ergebnis hat. Das ist mit Linearität gemeint. Der zweite Gedanke ist, dass der Einfluss unterschiedlicher Ereignisse unterschiedlich groß ist: ein Triple bei voll geladenen Bases und keinem Aus ist mehr wert als ein Walk bei leeren Bases und zwei Aus. Daher muss man die Ereignisse unterschiedlich gewichten. Wendet man beide Grundgedanken an, so erhält man lineare Gewichte, also konkrete Wertangaben in Form von Runs für jedes einzelne Spielereignis in jeder denkbaren Situation. Man kann dann zum Beispiel die Frage beantworten, wie viele Runs ein Double bei einem Aus und mit einem Runner auf der ersten Base wert ist.

    Wie berechnet man lineare Gewichte?
    Als erstes braucht man eine Erwartungsmatrix für Runs. Das heißt, man legt eine Tabelle an, die in den Zeilen die verschiedenen Besetzungsmöglichkeiten der drei Bases aufführt und in den Spalten die Möglichkeiten, wie viele Spieler innerhalb eines Innings aus sein können (0, 1 oder 2). Dann rechnet man mit Hilfe vorhandener Spielergebnisse (beispielsweise aller MLB-Spiele des letzten Jahres oder der letzten fünf Jahre) aus, wie viele Runs aus den jeweiligen Situationen heraus im Durchschnitt erzielt wurden. Das sieht dann zum Beispiel so aus (Berechnung von Tom Tango für 2010-2015):

    Base-Besetzung 0 Aus 1 Aus 2 Aus
    leer_leer_leer 0.481 0.254 0.098
    1B_leer_leer 0.859 0.509 0.224
    leer_2B_leer 1.100 0.664 0.319
    1B_2B_leer 1.437 0.884 0.429
    leer_leer_3B 1.350 0.950 .0353
    1B_leer_3B 1.784 1.130 0.478
    leer_2B_3B 1.964 1.376 0.580
    1B_2B_3B 2.292 1.541 0.752

    Zu Beginn eines Innings (0 Aus, Bases leer) ist mit etwas weniger als einem halben Run zu rechnen. Mit jeder Plate Appearance ändert sich die Erwartung: Nach einem Aus und immer noch leeren Bases ist nur noch mit einem viertel Run zu rechnen. Werden nun ohne weiteres Aus nach und nach die Bases geladen, steigt die Erwartung an und liegt schließlich (1B_2B_3B, 1 Aus) bei gut eineinhalb Runs. Die Erwartung bezieht sich immer auf Runs ab dem jeweiligen Zeitpunkt bis zum Ende des Innings; bereits erzielte Runs in dem Inning spielen dafür keine Rolle.

    Auf Basis dieser Erwartungsmatrix kann man im zweiten Schritt für jedes Spielereignis ausrechnen, welchen Wert es durchschnittlich besitzt. Dazu addiert man die durch das Ereignis direkt erzielten Runs mit der (positiven oder negativen) Änderung des Erwartungswertes für den Rest des Innings. Ein Walk ist dann beispielsweise im Durchschnitt 0,33 Runs wert, ein Single 0,46 Runs, ein Homerun 1,4 Runs, eine gestohlene Base 0,2 Runs, beim Basestehlen erwischt zu werden -0,45 Runs, ein Strikeout -0,3 Runs usw. Diese Werte schwanken etwas je nach verwendetem Bezugsrahmen, die Größenordnungen und Relationen sind jedoch relativ stabil.

    Beurteilung von Battingleistungen
    Es liegt auf der Hand, dass man die aus linearer Gewichtung erlangten Erkenntnisse über den Wert einzelner Spielereignisse nutzen kann, um die Leistung eines Spielers zu bewerten. Ein Beispiel für einen Indikator, der auf diese Weise Battingleistungen beurteilt, ist weighted On-Base Average (wOBA). Diese von dem bereits oben zitierten Baseballanalytiker Tom Tango entwickelte Statistik verwendet die linearen Gewichte für Walks, Hit-by-Pitches und die verschiedenen Arten von Hits. Diese versieht sie zusätzlich mit einem Faktor, der wOBA auf eine mit On-Base Percentage (OBP) vergleichbare Größenordnung überführt, um die Interpretation zu vereinfachen. Hier kann man Details zur Berechnung von wOBA nachlesen und hier kann man sich die wOBA-Rangliste der aktuellen Saison ansehen und über den alten Mann David Ortiz staunen.

    Beurteilung von Pitcherleistungen
    Da lineare Gewichte auf jedes Spielereignis bezogen werden können, kann man sie auf Pitcher genauso gut anwenden wie auf Batter. Auch für Pitcher hat Tom Tango einen Indikator entwickelt, der in seiner Größenordnung mit einer etablierten Kennzahl – in dem Fall ERA – vergleichbar ist. Es handelt sich um das Fielding Independent Pitching, das ich in einem früheren Artikel über Pitching-Stats schon mal behandelt habe, weshalb ich für weitere Informationen einfach mal dorthin verweise.

    Siegwahrscheinlichkeiten
    Eine nette Spielerei, die ich gern und häufig nutze, ist die graphische Darstellung sich ändernder Siegwahrscheinlichkeiten auf fangraphs.com. Auch diese Schaubilder, die während laufender Spiele ständig aktualisiert werden, basieren auf linearen Gewichten. Jedes Spiel beginnt unter der Annahme einer 50:50-Wahrscheinlichkeit und entwickelt sich dann in Abhängigkeit von den einzelnen Spielereignissen. Wenn man unter der jeweiligen Grafik auf „Play Log“ klickt, dann kann mehr sehr genau nachvollziehen, welches Ereignis sich wie auf den wahrscheinlichen Spielausgang ausgewirkt hat.

    Zum Abschluss ein schönes Beispiel, dass man sich auf Wahrscheinlichkeiten nie zu sehr verlassen sollte und wie schnell es im Baseball manchmal gehen kann: von 98,4% Siegwahrscheinlichkeit auf 4,9% in einem halben Inning.

    Posted in MLB, Statistik Tagged with: , , , , , , , , ,

    August 7th, 2016 by Dominik

    Hier ist der versprochene zweite Teil meiner Erklärartikel über Batting-Statistiken. Im ersten Teil habe ich mit der klassischen Slashline sowie mit dem direkt daraus ableitbaren Indikator OPS beschäftigt. Heute stelle ich ein paar weitere Möglichkeiten vor, die Fähigkeiten eines Batters oder besser gesagt bestimmte Teilaspekte davon zu messen und seinen Beitrag zum Erfolg des Teams zu beurteilen. Demnächst folgt ein Artikel über Statistiken, die sich dem großen Ganzen über lineare Gewichtung nähern. Weitere bereits veröffentlichte Statistikartikel findet man am einfachsten über die Kategorien-Navigation dieser Seite (oder durch Klick hier).

    Walk-to-Strikeout-Ratio (BB/K)
    Der Name dieser Kennzahl sagt eigentlich schon alles: Sie misst, in welchem Verhältnis bei dem jeweiligen Batter Walks und Strikeouts zueinander stehen. Ihr Nutzen besteht darin, die Plate Discipline eines Batters und seinen Blick für die Strikezone zu beurteilen. Für diese begrenzte Fragestellung ist BB/K ein sehr nützliches Maß.

    In den letzten Jahren sind Walks in der MLB etwas seltener geworden, während die Häufigkeit von Strikeouts deutlich gestiegen ist. Entsprechend sind die Spitzen- und Durchschnittswerte für BB/K gesunken und nur wenige Batter schaffen es heutzutage, mehr Walks als Strikeouts zu erzielen. In diesem Jahr gibt es nur zwei qualifizierte Spieler, denen das für die aktuelle Saison bisher gelungen ist: Ben Zobrist führt die Liste an mit 1.13 B/SO, gefolgt von Bryce Harper. In früheren Zeiträumen wurden weit höhere Werte erzielt. Der unbestrittene historische Meister dieses Faches ist Joe Sewell, der 1932 den Rekord von 18.67 BB/K in einer Saison aufstellte und auch den zweiten und dritten Platz in dieser Liste belegt. Sewell führt auch die Karriere-Rangliste an, mit 7.39 BB/K und großem Abstand auf den zweitplatzierten Monk Cline (6.33). Angesichts dieser Dimensionen nimmt sich die Karriereleistung des besten noch aktiven Spielers geradezu bescheiden aus: Albert Pujols steht bei 1.17 BB/K. In heutigen Relationen betrachtet ist das übrigens alles andere als bescheiden, denn kein anderer aktiver Spieler erreicht derzeit einen Wert von 1 oder höher.

    Runners In Scoring Position (RISP)
    Der Kürze wegen redet man oft von RISP, gemeint ist eigentlich der Indikator BA/RISP, also Batting Average With Runners In Scoring Position – der Schlagdurchschnitt eines Batters, wenn sich mindestens ein Baserunner bereits auf der zweiten oder dritten Base befindet. Ziel dieser Statistik ist zu beurteilen, wie gut der Batter in Situationen ist, in denen es besonders wichtig oder hilfreich ist, einen Hit zu erzielen (sog. Clutch-Situations). Die Aussagekraft und der Nutzen von RISP-Statistiken sind umstritten und das mit einigem Recht. Tatsächlich hat sich immer wieder, wenn man das Phänomen RISP unter die Lupe genommen hat, zweierlei gezeigt: 1. Die Fähigkeit von Teams und Spielern, Hits mit Runnern in Scoringposition zu erzielen, trägt weit weniger zu Sieg und Niederlage bei als die generelle Fähigkeit, Hits zu erzielen. 2. Ob ein Spieler mehr oder weniger erfolgreich mit RISP ist, hängt eher mit Zufall und Umgebungsfaktoren zusammen als mit einer bestimmten dem Spieler zuzuschreibenden Fähigkeit. Das zeigt sich vor allem daran, dass der Unterschied zwischen RISP- und Nicht-RISP-Werten einzelner Spieler von Saison zu Saison sehr stark schwankt. Gäbe es den sogenannten Clutch-Hitter, so müsste man diesen daran erkennen, dass er einigermaßen konstant höhere RISP-Werte erzielt. Das Thema (oder besser das Nicht-Thema) RISP wäre mal einen eigenen Artikel wert. Einstweilen kann man sich, wenn man es genauer wissen möchte, hier, hier oder hier ein bisschen einlesen.

    Runs scored (R), Runs Batted In (RBI), Runs Created (RC)
    Im Endeffekt geht es beim Batting immer nur um das Eine, nämlich um das Produzieren von Runs. Deswegen ist die dritte und wichtigste Fragestellung, der ich mich in diesem Artikel widmen möchte: Wie viele Runs trägt ein Batter zum Erfolg seines Teams bei?

    Natürlich kann man Runs als einfache Zählstatistik erfassen, also einfach messen, wie oft Batter X die Bases umrundet und somit für sein Team gescort hat. Man stellt dann fest, dass sowohl 2015 als auch bisher in diesem Jahr Josh Donaldson die meisten Runs gescort hat und dass die Allzeit-Rangliste von Rickey Henderson angeführt wird, der in seiner langen Karriere von 1979 bis 2003 insgesamt 2295 Runs gescort hat. Solche Zahlen sind ja irgendwie beeindruckend, vor allem wenn bestimmte Meilensteine erreicht werden (es gibt zum Beispiel nur acht Spieler mit über 2000 Runs, darunter mit Alex Rodriguez nur einen noch aktiven). Wirklich viel sagt uns das aber nicht über den jeweiligen Spieler, denn das Scoren von Runs liegt lediglich beim Homerun in seiner eigenen Hand. Jeder andere Score ist neben der Notwendigkeit, selbst auf Base zu kommen, abhängig von den Fähigkeiten der Mitspieler und/oder Fehlern der Gegenspieler sowie von zusätzlichen Faktoren wie beispielsweise dem eigenen Platz in der Batting Order. Ist man regelmäßig vor dem stärksten Hitter des eigenen Teams an der Reihe, so ist die Wahrscheinlichkeit, dass man selbst viele Runs erzielt, deutlich höher als wenn man als Achter schlägt und danach der schlechteste Batter (in der NL meistens der Pitcher) des Teams kommt.

    Mehr Beachtung als die Runs scored finden meistens die Runs Batted In, eine weitere einfache Zählstatistik. Ein RBI liegt dann vor, wenn durch den Schlag eines Batters ein Run erzielt wird (unabhängig davon, ob der Batter selbst dabei auf Base kommt). Auch Runs, die bei vollen Bases durch einen Walk, Hit by Pitch oder Interference Call ausgelöst werden, werden als RBI gezählt. Bei einem Homerun wird für das Umrunden der Bases durch den Batter diesem sowohl ein Run als auch ein RBI angerechnet; im Höchstfall kann man mit einem Homerun bei voll besetzten Bases vier RBI durch einen Schlag – einen Grand Slam – erzielen. RBIs bilden eine der drei Säulen der Triple Crown, das heißt der besonderen Leistung, als Batter die Liga gleichzeitig in Homeruns, Batting Average und RBI anzuführen. In den letzten knapp 50 Jahren ist das nur einem einzigen Spieler gelungen, nämlich Miguel Cabrera im Jahr 2012.

    Mit 2297 RBI hat Hank Aaron die meisten Runs in einer Karriere verursacht. Er ist einer von nur vier Spielern mit über 2000 RBI und auch in dieser Statistik ist Alex Rodriguez der einzige Aktive, der jene Grenze geknackt hat. In der aktuellen Saison führt Edwin Encarnacion die MLB an. Obwohl RBI in aller Munde sind, muss man sich auch bei dieser Statistik die Frage nach der Aussagekraft stellen. Im Prinzip trifft die Kritik, dass gescorte Runs kein gutes Maß für die Qualität eines einzelnen Spielers sind, genauso auch auf RBI zu. Denn ob ein ordentlicher Hit drei Runner nach Hause bringt oder gar keinen, ist wieder ein Umstand, den der Batter überhaupt nicht in der Hand hat. Zwei exakt gleich gute Batter werden sehr verschiedene RBI-Zahlen sammeln, wenn der eine in einem insgesamt offensivstarken Team spielt und der andere in einem schwachen oder wenn der eine im Lineup an ungünstigerer Stelle schlägt als der andere. Als Leadoff-Hitter hat man zum Beispiel schlechte Chancen auf viele RBI, weil man beim ersten At-Bat nie jemanden vor sich auf Base hat und bei den weiteren At-Bats in der Regel nach schwachen Hittern an die Reihe kommt; viel besser ist man dran als Cleanup-Hitter, also auf Position vier, weil man dann normalerweise direkt nach den drei Battern dran ist, die am häufigsten auf Base kommen.

    Wenn man einerseits der Philosophie folgen möchte, dass Batting-Leistungen am besten in Form von Runs gezählt werden sollten, man andererseits aber die genannten Probleme bei der Aussagekraft von Runs scored und RBI vermeiden will, so gibt es dafür hervorragende Alternativen. Eine solche ist der Indikator Runs Created (RC), erfunden von Sabermetrics-Gott Bill James. Die Grundformel von RC lautet: Situationen, in denen man auf Base kommt, werden multipliziert mit den erzielten Total Bases und das Ergebnis wird geteilt durch die Zahl der Gelegenheiten, also der Plate Appearances. Hier kann man das in ordentlicher Formelschreibweise und in verschiedenen Entwicklungsstufen nachlesen. Runs kommen in dieser Formel überhaupt nicht vor und doch führt sie zu einer verblüffend genauen Aussage über den individuellen Beitrag eines Batters zum Erfolg des Teams in Form von Runs: Dass sie den individuellen Beitrag misst, ist logisch, weil alle Komponenten der Formel auf den Einzelleistungen des Spielers beruhen; dass sie verblüffend genau ist, zeigt sich dadurch, dass sie mit einer Genauigkeit von 99,5% vorhersagt, wie viele Runs ein Team erzielt, wenn man die RC-Werte aller Batter zusammenzählt. RC ist in meinen Augen eine der besten Baseballstatistiken überhaupt und es ist ein Jammer, dass sie nicht halb so bekannt ist wie z. B. RBI. Hier noch eine Leseempfehlung, die die Aussagekraft von RC untermauert.

    Die meisten RC in einer Karriere hat Barry Bonds gesammelt, der beste aktive Spieler ist auch in dieser Statistik Alex Rodriguez. Auch die beste Einzelsaison aller Zeiten geht mit 230 RC an Barry Bonds. Und wer ist momentan der wertvollste Batter der MLB? Trommelwirbel, Tusch, es ist: Jose Altuve. Mit 107 RC führt er aktuell (sortieren muss man bei baseball-reference selbst durch Klick auf die Spaltenüberschrift RC) die Liga an, mit etwas Abstand gefolgt von Josh Donaldson und Mike Trout.

    Posted in MLB, Statistik Tagged with: , , , , , , , , ,