Category: Statistik

Dezember 9th, 2018 by Silversurger

Es ist mal wieder eine neue Statistik auf dem Markt. Deserved Runs Created Plus, kurz DRC+, nennt sich der von Baseball Prospectus entwickelte und diese Woche vorgestellte Indikator. DRC+ liefert eine Gesamtbeurteilung der Leistungen eines Spielers als Batter.

Als wichtigster Beitrag fließen in DRC+ die Resultate der Plate Appearances des betreffenden Spielers ein – Hits, Walks, Strikeouts, Groundouts und alles, was sonst noch passieren kann. Diese Resultate werden dann gewichtet – erstens nach der Höhe des Beitrags, den sie zur Erzielung von Runs leisten (z. B. hat ein Double einen höheren positiven Beitrag als ein Walk, ein Strikeout hingegen hat einen negativen Beitrag und in ein Doubleplay zu grounden einen noch negativeren); zweitens nach dem Ausmaß, zu dem der Batter selbst für sie verantwortlich ist (d. h. man versucht seine Eigenleistung gegenüber den Einflüssen von Zufall, Mitspielern, gegnerischen Feldspielern usw. zu isolieren); drittens nach dem Kontext, in dem sie erzielt wurden (z. B. in welchem Ballpark, gegen welchen Pitcher etc.).

Das Plus in DRC+ kennt man aus anderen Statistiken wie ERA+, OPS+ und so weiter. Es bedeutet, dass der Indikator in eine leicht lesbare Form gebracht wird, indem man einen Wert von 100 als Durchschnitt definiert. So kann man daran, ob der DRC+ eines Batters über oder unter 100 liegt, direkt ablesen, ob es sich um einen über- oder unterdurchschnittlichen Batter handelt. Als Faustregel kann man ab 120 DRC+ von einem guten und ab 145 DRC+ von einem hervorragenden Batter sprechen.

Das klingt interessant, aber natürlich stellt man sich unwillkürlich die Frage, was dieser neue Kennwert anders – und idealerweise besser – macht als bekannte Indikatoren mit vergleichbarem Anspruch, also zum Beispiel wOBA, wRC+ oder OPS+. Tatsächlich weisen alle diese Indikatoren im Vergleich miteinander sowie mit DRC+ relativ hohe statistische Zusammenhänge auf. Sie messen also weitgehend das Gleiche. Laut den von Baseball Prospectus vorgestellten Berechnungen liefert DRC+ im Vergleich mit den anderen Werten genauere Messungen, das heißt einen kleineren anzunehmenden Zufallsfehler und eine größere Vorhersagefähigkeit. Letzteres wird vor allem dadurch erreicht, dass DRC+ einen stärken Schwerpunkt als die anderen Werte darauf legt, zufällige und extern verursachte Einflüsse auf die Leistungen des Batters zu isolieren und herauszurechnen.

Es bleibt abzuwarten, ob es DRC+ gelingt, OPS+ und wRC+ als die meistzitierten Sabermetrics für Batting-Leistungen abzulösen. Der Ansatz ist in jedem Fall vielversprechend und ich bin gespannt, wie die anderen Institutionen der Baseballstatistik – vor allem Fangraphs und Baseball-Reference – auf den Vorstoß von Baseball Prospectus reagieren.

Ich möchte den Artikel natürlich nicht beenden, ohne ein paar konkrete Zahlen genannt zu haben. Der beste Batter der Saison 2018 war laut der neuen Statistik Mike Trout mit 180 DRC+ vor Mookie Betts mit 174 DRC+. Die ersten fünf Plätze der Rangliste sind fest in der Hand der American League, erst auf Rang sechs findet sich mit Christian Yelich (145 DRC+) der erste Akteur aus der National League. Historisch betrachtet war Babe Ruth mit 197 DRC+ über seine Karriere hinweg der beste Batter, gefolgt von Ted Williams (180 DRC+), Barry Bonds (175 DRC+) und Lou Gehrig (168 DRC+). Zu beachten ist, dass DRC+ bisher nur für die Zeit ab 1921 berechnet wurde; daher bleiben zum Beispiel die ersten Jahre von Babe Ruth sowie ein Großteil der Karriere von Ty Cobb unberücksichtigt.

Posted in MLB, Statistik Tagged with: , , ,

September 11th, 2018 by Silversurger

Dass Zahlen eine magische Anziehung auf mich ausüben, dürfte an der einen oder anderen Stelle in diesem Blog schon aufgefallen sein. In diesem Artikel soll es um eine Zahl gehen, die auch so heißt: Magic Number. Spätestens ab Mitte September ist diese magische Zahl regelmäßig in aller Munde. Deshalb möchte ich kurz erklären, was es damit auf sich hat.

Die Magic Number gibt an, wie nah ein Team daran ist, ein bestimmtes Ziel – in der MLB üblicherweise den Divisionstitel oder einen Wild-Card-Platz – hieb- und stichfest zu erreichen. Zum Beispiel haben die Cleveland Indians in Bezug auf den Gewinn der American League Central momentan eine Magic Number von 4. Das heißt, wenn und sobald die Indians von ihren 18 verbleibenden Spielen 4 gewinnen, ist ihnen der Divisionssieg nicht mehr zu nehmen. Mit jedem Sieg des betreffenden Teams verringert sich die Magic Number um 1 und logischerweise auch mit jeder Niederlage des direkten Verfolgers (wobei als direkter Verfolger immer das Team mit den wenigsten Niederlagen hinter dem Führenden anzusehen ist).

Die Berechnung der Magic Number ist recht einfach. Man nimmt die Gesamtzahl der Saisonspiele (G), addiert 1 und zieht dann die bereits erzielten Siege des führenden Teams (WA) sowie die erlittenen Niederlagen des direkten Verfolgers (LB) ab:

G+1-WA-LB

Beim aktuellen Tabellenstand der AL Central berechnet sich die Magic Number also wie folgt:

Team W L
Cleveland Indians 81 63
Minnesota Twins 65 78

162+1-81-78=4

Zu Saisonbeginn lautet die Rechnung für jedes MLB-Team

162+1-0-0=163

Das heißt, jedes Team hat zum Saisonstart eine Magic Number von 163. Klingt auf den ersten Blick logisch, denn selbst mit 162 Siegen aus 162 Spielen könnte es ja theoretisch sein, dass ein anderes Team das gleiche Kunststück schafft und am Ende Gleichstand herrscht. Bei näherem Hinsehen erweist sich das aber als Irrtum. Der Spielplan sieht vor, dass man innerhalb der Division 19-mal auf jeden Divisionsrivalen trifft. Wenn man in einer Saison 153 von 162 Spielen gewinnt, dann hat man seinen hartnäckigsten Verfolger mindestens zehnmal besiegt und dieser somit höchstens 152 Spiele gewonnen. Hier zeigt sich eine Unschärfe der Magic Number: Sie berücksichtigt nicht den Spielplan und fällt dadurch manchmal zu hoch aus.

Eine sinnvolle Magic Number (also eine, die nicht mehr Siege voraussetzt als Spiele übrig sind) haben übrigens nur solche Teams, die den betreffenden (Spitzen- oder Wild-Card-)Platz bereits belegen – wenn man zurückliegt, ist man schließlich neben eigenen Siegen immer auch auf Niederlagen der besser Platzierten angewiesen. Um auch diese Situation in einer Zahl auszudrücken, gibt es als böse Zwillingsschwester der Magic Number die sogenannte Elimination Number.

Die Elimination Number drückt aus, wie viele Siege des führenden Teams kombiniert mit Niederlagen des verfolgenden Teams dazu führen, dass das verfolgende Team aus dem Rennen ist. Für den direkten Verfolger ist die Elimination Number identisch mit der Magic Number des Führenden. Für jeden weiteren Verfolger ist sie entsprechend niedriger und kann mit der oben genannten Formel berechnet werden, wobei WA wie gehabt die Siege des Führungsteams sind und LB die Niederlagen des jeweils betrachteten Teams.

Um im Beispiel zu bleiben, berechnen wir die Elimination Number der Detroit Tigers, die in der AL Central mit 85 Niederlagen Rang 3 belegen:

162+1-92-85=-14

Wir erhalten einen deutlich negativen Wert und somit wissen wir, dass die Tigers in Bezug auf den Divisionstitel bereits seit einiger Zeit unwiderruflich ausgeschieden sind. In den Tabellen tauchen negative Elimination Numbers meistens nicht auf, an ihrer Stelle steht für die ausgeschiedenen Teams ein schlichtes „E“.

Die AL Central ist übrigens die einzige Division, in der der Drittplatzierte keine theoretische Chance mehr auf den Divisionssieg hat. Noch heute könnte die AL East dazu kommen, denn die Elimination Number der Tampa Bay Rays beträgt 1. Das heißt, wenn die Rays heute ihr Spiel gegen Cleveland verlieren oder die Red Sox ihr Spiel gegen Toronto gewinnen, sind die Rays endgültig aus dem Rennen. Deutlich höher als in der AL sind die Elimination Numbers derzeit in der NL. Dort haben in allen drei Divisionen selbst die viertplatzierten Teams noch theoretische Chancen auf Platz eins. Die Mets zum Beispiel haben eine Elimination Number von 6; ihre Saison ist also erst nach einer Kombination von 6 Siegen der Atlanta Braves und/oder eigenen Niederlagen offiziell gelaufen. Realistisch betrachtet ist sie das natürlich schon längst – damit das Wunder geschieht, müssten nicht nur die Braves und die Mets unwahrscheinliche Serien hinlegen, sondern auch die dazwischen stehenden Phillies und Nationals mitspielen. Sobald die Tabellenführung wechselt, ist die Elimination Number der Verfolger natürlich in Bezug auf den neuen Spitzenreiter zu berechnen.

Die Elimination Numbers tauchen bei den gängigen Internatanbietern von MLB-Tabellen über weite Strecken der Saison nicht auf, erst in den letzten paar Wochen jeder Spielzeit finden sie fast überall ihren Platz in den Standings. Auf mlb.com sind sie hier in Bezug auf die Divisionstitel und hier in Bezug auf die Wild Cards zu sehen. Die Magic Numbers werden dort zwar nicht dargestellt. Das macht aber nichts, denn wir wissen: Die Magic Number des Erstplatzierten ist immer identisch mit der Elimination Number des Zweitplatzierten.

 

PS: Nur für den Fall, dass sich jemand wundert: Es handelt sich um einen Artikel, den ich im Original vor zwei Jahren geschrieben und auf die aktuelle Saison angepasst habe.

Posted in MLB, Statistik

Januar 21st, 2018 by Silversurger

Als Baseball- und Statistikfan habe ich mich schon mit einer großen Menge statistischer Kennzahlen über Schlag- und Pitchingleistungen, über Defensivqualitäten und über den Gesamtbeitrag eines Spielers zum Erfolg des Teams auseinandergesetzt. Viele davon habe ich auch in der entsprechenden Kategorie dieses Blogs erklärt und bewertet. Dennoch ist mir kürzlich aufgefallen, dass es einen Bereich des Spiels gibt, über den mir kaum handfestes Zahlenmaterial bekannt war: das Baserunning. Die Zahl der gestohlenen Bases ist das einzige, was mir dazu sofort eingefallen ist. Aber da muss es doch mehr geben, dachte ich mir, schließlich hat man nach dem Erreichen einer Base viel mehr zu tun als nur zu entscheiden, ob und wann man stiehlt. Also habe ich mich ein bisschen eingelesen und möchte mein neues Wissen hier teilen.

Stolen Bases (SB) / Caught Stealing (CS)
Fangen wir an mit der Statistik, die jeder kennt: Wenn es um herausragende Baserunner geht, wird fast immer mit der Anzahl gestohlener Bases argumentiert. Auch im Fantasy Baseball sind Stolen Bases (SB) in der Regel die einzige für das Scoring berücksichtigte Baserunning-Kategorie.

Die Spitze ist in dem Bereich recht schmal: In der Saison 2017 führte Dee Gordon (Miami) die Liste mit 60 gestohlenen Bases an, dicht gefolgt von Billy Hamilton (Cincinnati) mit 59. Zu Platz drei besteht dann schon eine deutliche Lücke, Whit Merrifield (Kansas City) steht dort mit „nur“ 34 Bases. Den Rekord hält Hugh Nicol mit 138 gestohlenen Bases im Jahr 1887 für die Cincinnati Reds. Den höchsten Wert der modernen Ära hat Rickey Henderson mit 130 im Jahr 1982 Oakland Athletics erzielt. Auf die gesamte Karriere hin betrachtet, ist Henderson mit großem Abstand Rekordhalter mit insgesamt 1.406 Steals.

Üblicherweise stehen die Spieler mit den meisten Steals auch in der Kategorie Caught Stealing (CS), also der Anzahl missglückter Steal-Versuche, weit vorne. Das ist logisch, weil Spieler wie sie es sehr viel öfter versuchen als andere und es dann eben auch ab und zu mal schief geht. Es überrascht daher nicht, dass 2017 auch hier Dee Gordon (16) und Billy Hamilton (13) die Liga anführten. Man könnte nun auf die Idee einer Nettobetrachtung gestohlener Bases kommen, also die missglückten Versuche von den gelungenen abzuziehen – tatsächlich habe ich so etwas schon in einer Fantasyliga erlebt. Der Haken an der Sache ist, dass – wie unmittelbar einleuchten dürfte – eine erfolgreich gestohlene Base dem Team zwar hilft, aber nicht so sehr wie ein Aus beim gescheiterten Versuch dem Team schadet. Als Faustregel kann man sagen, dass Steals sich nur dann lohnen, wenn sie mindestens doppelt so häufig gelingen wie sie scheitern. Informativer ist deshalb, nicht auf Absolut- oder Nettowerte zu schauen, sondern die Steals als Anteil an allen Steal-Versuchen darzustellen. Das ist dann die Stolen Base Percentage (SB%).

Wie jede Prozentzahl ist SB% natürlich nur aussagekräftig, wenn sie auch auf einer gewissen Anzahl basiert – eine Erfolgsquote von 100% bei nur einem Versuch verrät nicht viel. Deswegen stellt zum Beispiel baseball-reference diese Zahl nur für Spieler dar, die es in einer einzelnen Saison auf 0,1 Versuche pro Spiel ihres Teams (also 16,2 bei den üblichen 162 Spielen) bringen oder in ihrer Karriere auf 80 Versuche. Byron Buxton (Minnesota) führte 2017 mit 96,7% die MLB an, indem er sich bei 30 versuchten Steals nur einmal erwischen ließ. Zwölfmal gelang es in der Geschichte der MLB Spielern mit der entsprechenden Mindestzahl von Versuchen, eine Erfolgsquote von 100% zu erzielen, zuletzt Alcides Escobar (Kansas City) im Jahr 2013. Über die ganze Karriere betrachtet ist der zuverlässigste Base-Stealer aller Zeiten Alexi Casilla mit 87,9%. Trotz dieser Stärke brachte Casilla es in Minnesota und Baltimore nie über die Rolle eines Ergänzungsspielers hinaus – im Gegensatz zu Chase Utley und Carlos Beltran, die mit 87,6% bzw. 86,4% die Plätze zwei und drei der ewigen Rangliste einnehmen.

weighted Stolen Base Runs (wBS)
Eine sinnvolle Weiterentwicklung der Stolen-Bases-Statistik stellt der Indikator weighted Stolen Base Runs (wBS) dar. Er basiert auf linearen Gewichten und übersetzt den Beitrag, den ein Spieler durch Base-Stealing zum Erfolg seines Teams leistet, in die universelle „Währung“ des Balls: in Runs. Man bekommt durch wSB ein deutlich besseres Gefühl dafür, welche Kombinationen aus gelungenen und missglückten Stealing-Versuchen dem Team wie sehr weiterhelfen und welche mehr schaden als nützen. wSB ist auf Null normiert, das bedeutet dass man für einen durchschnittlichen Spieler von einem Beitrag von 0 Runs ausgeht. Dementsprechend erzielt ein überdurchschnittlicher Base-Stealer Werte über 0 und ein unterdurchschnittlicher Werte unter 0. Die Berechnung von Fangraphs basiert darauf, dass das Resultat jeder Steal-Möglichkeit eines Spielers mit dem durchschnittlichen Resultat einer solchen Möglichkeit in der gesamten Liga verglichen wird. Macht ein Spieler mehr aus der gegebenen Möglichkeit als der Durchschnitt (das heißt, er stiehlt die Base), steigt sein wSB-Wert; macht er weniger daraus (das heißt, er lässt sich erwischen oder probiert es trotz aussichtsreicher Gelegenheit gar nicht), sinkt der Wert.

Die übliche Spannweite, in der MLB-Spieler bei wSB landen, liegt ungefähr zwischen -3 und +6, nur selten werden zweistellige Werte erzielt. Teams insgesamt landen meistens zwischen -7 und +10 wSB pro Saison. Angesichts der Faustregel, dass ungefähr 9 bis 10 Runs einen Win wert sind, ist der Beitrag von Base-Stealing zum Gesamterfolg eines Teams somit relativ gering. 2017 war Billy Hamilton mit 5,9 wSB der wertvollste Base-Stealer der Liga, gefolgt von Byron Buxton mit 5,1 und Dee Gordon mit 4,7. Karriere-Rekordhalter mit 142,7 wSB ist auch hier wieder der oben schon erwähnte Rickey Henderson. Die erfolgreichste Einzelsaison hatte Vince Coleman  (St. Louis) mit 15,7 wSB im Jahr 1986.

Ultimate Base Running (UBR)
Mit Base Stealing haben wir uns nun ausführlich befasst, aber was ist mit dem Rest, den gutes Baserunning ausmacht? Dieser Bereich findet in Standardstatistiken leider wenig Beachtung, obwohl Fangraphs auch hierfür einen guten Indikator bereit hält: Ultimate Base Running (UBR). Der Name ist etwas irreführend, denn UBR ist kein Gesamtindikator für Base Running, sondern betrachtet „nur“ die Base-Running-Leistungen, die nichts mit Steals zu tun haben. Dazu zählen im Einzelnen:

  • Erreicht der Runner nach dem Hit eines Teamkollegen eine Extra-Base, erreicht er sie nicht oder wird er beim Versuch, sie zu holen, ausgeworfen?
  • Wird der Batter beim Versuch, nach eigenem Hit eine Extra-Base zu erreichen, ausgeworfen? (Wenn er sie holt, wird das in UBR nicht erfasst, weil nicht klar ist, ob dafür der Hit oder das Baserunning verantwortlich ist.)
  • Erreicht der Batter eine Extra-Base, erreicht er sie nicht oder wird ausgeworfen, während ein anderer Runner safe oder out wird beim Versuch, vorzurücken?
  • Gelingt es einem Runner, nach einem Flyout und Tagging Up vorzurücken?
  • Gelingt es einem Runner, während eines Groundballs von der ersten die zweite Base zu erreichen, ohne in ein Force-Out oder Double Play zu geraten?
  • Erreicht ein Runner von der zweiten Base bei einem Groundball Richtung SS oder 3B die dritte Base, erreicht er sie nicht oder wird er beim Versuch ausgeworfen?
  • Rückt ein Runner während eines Passed Balls oder Wild Pitches vor oder nicht oder wird er beim Versuch ausgeworfen?
  • Sicher kann man sich problemlos einige Baserunning-Beispiele überlegen, die in dieser Auflistung nicht berücksichtigt sind, aber UBR deckt schon ein großes Spektrum ab und leistet damit einen guten Beitrag zur vollständigeren statistischen Erfassung des Baserunnings. Praktischerweise ist auch UBR ein auf linearen Gewichten basierendes Maß mit Runs als Einheit. Das heißt, jedem der aufgeführten Ereignisse wird ein positiver oder negativer Wert in Form von Runs zugeordnet. Ein Wert von 0 stellt auch für UBR eine durchschnittliche Leistung im jeweiligen Jahr dar, übliche Werte liegen zwischen -6 und +6 je Spieler und zwischen -15 und +15 je Team insgesamt.

    Der beste Baserunner der Saison 2017 jenseits gestohlener Bases war Xander Bogaerts (Red Sox) mit 6,3 UBR. Die beste Einzelsaison hatte 2004 Juan Pierre (Marlins) mit 8,3 UBR. Dabei ist zu berücksichtigen ist, dass die ermittelte Zeitreihe bei Fangraphs nur bis 2002 zurück reicht und für frühere Zeiträume keine UBR-Werte zur Verfügung stehen. Pierre hat mit 47,8 UBR auch den höchsten Wert für eine Karriere insgesamt und das, obwohl seine beiden ersten Spielzeiten 2000 und 2001 nicht gezählt wurden.

    Base Running (BsR)
    Mit wSB für die Fähigkeit des Base-Stealings und UBR für die sonstigen Baserunning-Leistungen haben wir zwei sehr brauchbare Maße. Idealerweise bringt man nun noch beide zu einem umfassenden Indikator zusammen, der die Baserunning-Fähigkeiten insgesamt bewertet. Genau das ist das Ziel einer weiteren Fangraphs-Statistik, die sich schlicht Base Running (BsR) nennt und auch in die Berechnung von Fangraphs‘ WAR einfließt.

    BsR wird wie die beiden gerade vorgestellten Maße in Runs über oder unter dem Durchschnitt ausgedrückt. Gebildet wird BsR durch einfache Addition: UBR plus wSB plus wGDP. Moment mal, wGDP? Ja, tatsächlich zählt Fangraphs als dritte Komponente von BsR den Indikator weighted Grounded Into Double Play Runs (wGDP) hinzu. Das heißt, es wird berücksichtigt, inwiefern es dem Spieler gelingt, keine Double Plays zu verursachen, wenn er mit weniger als zwei Outs und einem Runner an der ersten Base am Schlag ist. An dieser Stelle muss ich sagen, dass ich den Einbezug von wGDP für einen Fehler der von mir sonst sehr geschätzten Kollegen von Fangraphs halte. Natürlich ist die mit wGDP gemessene Fähigkeit relevant, aber sie ist meiner Ansicht nach in erster Linie dem Batting zuzurechnen und nicht dem Baserunning. BsR wäre daher in meinen Augen aussagekräftiger, wenn man es auf die Addition von wSB und UBR beschränken würde.

    Nichtsdestotrotz ein kurzer Blick auf die 2017 erzielten BsR-Werte: Die meisten Spieler liegen im Bereich zwischen -6 und +6 BsR. Das ist interessant, denn wenn man sich im Vergleich dazu die Werte von UBR und wSB anschaut, fallen diese ähnlich hoch aus. Es kommt also selten vor, dass Spieler in beiden Bereichen so gut sind, dass sich starke Effekte durch die Addition der Werte ergeben. Die große Ausnahme davon ist Byron Buxton: Der Outfielder der Twins führt die Rangliste der Saison 2017 mit 11,7 BsR mit großem Abstand an. Ohne den Einbezug von wGDP brächte Buxton es übrigens auf einen Wert von 9,4 und wäre auch damit einsame Spitze in der MLB.

    Geschwindigkeitsmessung mit Statcast
    Eine weitere Baserunning-Statistik liegt im Prinzip auf der Hand, ist aber erst seit kurzem zuverlässig und umfangreich messbar: die Schnelligkeit der Spieler. Erfolgreiches Baserunning lässt sich im Wesentlichen auf die zwei Komponenten Geschwindigkeit und Spielintelligenz reduzieren. Den Beitrag der Spielintelligenz kann man wohl nur durch Maße wie die oben vorgestellten Sabermetrics sinnvoll berücksichtigen. Den anderen der beiden Faktoren kann man seit der letzten Saison direkt erfassen – die MLB-weite Einführung der Statcast-Technologie macht es möglich.

    Dank Statcast wissen wir nun, dass der durchschnittliche MLB-Spieler es auf eine Baserunning-Geschwindigkeit von 27 Fuß pro Sekunde (29,6 km/h) bringt und dass Byron Buxton auch in dieser Rangliste die Liga anführt – mit 30,2 Fuß pro Sekunde (33,1 km/h), dicht gefolgt von Billy Hamilton mit 30,1 Fuß pro Sekunde (33,0 km/h). Der langsamste Spieler der MLB ist übrigens Albert Pujols (Angels) mit 23,0 Fuß pro Sekunde (25,2 km/h). Pitcher werden dabei allerdings nicht berücksichtigt, sonst hätten Bartolo Colon und CC Sabathia sicher gute Chancen, Pujols diesen Titel streitig zu machen. Dargestellt wird in der Tabelle die Geschwindigkeit, die der jeweilige Spieler im seinem schnellsten Eine-Sekunde-Zeitfenster erzielt hat.

    Ein neuer Indikator für Spielintelligenz?
    Nur so als Idee: Will man den anderen Faktor erfolgreichen Baserunnings, die Spielintelligenz, isoliert beziffern, so könnte man versuchen, BsR (bevorzugt allerdings ohne wGDP) um den Beitrag der mit Statcast gemessenen Geschwindigkeit eines Spielers zu bereinigen. Vereinfacht ausgedrückt heißt das, wer unterdurchschnittlich schnell ist und trotzdem gute BsR-Werte erzielt, der verfügt offenbar über eine besonders hohe Spielintelligenz in Bezug auf Baserunning. Geben wir der Sache noch einen schönen Namen – wie wäre es mit Smart Base Running (SBR)? – und schon haben wir eine neue Statistik erfunden. Ich muss noch mal ausführlicher recherchieren, ob es so eine Zahl bereits gibt oder ob die Idee wirklich neu ist und es sich lohnt, sie weiterzuverfolgen.

    Posted in MLB, Statistik Tagged with: , , , , , , , ,

    Mai 17th, 2017 by Silversurger

    Das Fielding ist ein wichtiger Teil des Baseballsports. Spiele werden nicht nur durch Batting und Pitching sondern auch durch die Abwehrarbeit im Feld gewonnen oder verloren, auch wenn dieser Aspekt des Spiels gegenüber den anderen oft ein wenig im Schatten der Aufmerksamkeit zu stehen scheint – gerade was die Statistiken angeht. An die Prominenz der Batting-Slashline oder des Earned Run Averages kommen die Fielding-Stats nicht heran, aber das macht sie nicht weniger interessant und ich möchte heute ein paar von ihnen vorstellen.

    Putouts, Assists
    Putouts und Assists sind klar definiert und sehr einfach zu zählen. Für jedes Out des schlagenden Teams wird einem Spieler des verteidigenden Teams der Putout gutgeschrieben. Ihn erhält der Spieler, der den Ball aus der Luft fängt (Flyout), mit ihm den Gegner zum Tagout berührt, die Base zum Forceout betritt oder als Catcher den dritten Strike beim Strikeout fängt. Ein Assist wird dem Spieler zugerechnet, der den Ball vor dem Putout berührt hat. Wenn also zum Beispiel der Shortstop einen Ball aufnimmt und ihn zum Forceout dem First Baseman zuwirft, dann hat der SS den Assist und der 1B den Putout. Ist kein zweiter Spieler involviert, dann ist der Putout „unassisted“. Der Pitcher erhält übrigens keinen Assist dafür, dem Catcher den dritten Strike zuzuwerfen.
    Man könnte nun einfach schauen, wer die meisten Putouts und wer die meisten Assists sammelt und diese Spieler dann zu den besten Fieldern erklären. Dieses Vorgehen hinkt aber an mindestens zwei Stellen: Erstens ist die Anzahl der Putouts und Assists stark abhängig von der gespielten Position: Die meisten Putouts gehen üblicherweise auf das Konto des First Basemans, auch wenn dies sicher nicht die anspruchsvollste Defensivposition ist. Man läge somit höchstwahrscheinlich daneben, wenn man einen 1B zum besten Verteidiger des Teams erklärte, nur weil er die meisten Putouts hat. Zweitens hängt die Zahl der Putouts und Assists, die ein Spieler ansammelt, auch ganz wesentlich davon ab, wie viele Gelegenheiten dazu der Stil des jeweiligen Pitchers bietet – produziert er eher Groundballs (mehr Putouts für Infielder), Flyballs (mehr Putouts für Outfielder) oder Strikeouts (mehr Putouts für Catcher)?
    Die meisten Putouts in der Saison 2016 erzielte – ebenso wie schon 2015 und 2013 – Paul Goldschmidt von den Arizona Diamondbacks mit 1.378. 2017 führt bislang Wil Myers von den San Diego Padres mit 362 die Rangliste an. Der Rekord für die meisten Putouts in einem Jahr ist schon 110 Jahre alt: Jiggs Donahue stellte ihn 1907 mit 1.846 Putouts auf. Im gleichen Jahr erreichte Jake Beckley die bis heute einzigartige Marke von 23.767 Putouts in seiner Karriere. Die beste Leistung eines noch aktiven Spielers vollbrachte Albert Pujols mit 1.597 Putouts im Jahr 2005 und mit bislang 15.626 in seiner Karriere. Alle genannten Spieler sind oder waren (natürlich) First Basemen.

    Errors
    Errors sind die wichtigste Defensivstatistik – jedenfalls wichtig in dem Sinne, dass sie standardmäßig in jedem Boxscore und auf jedem Scoreboard dargestellt werden. Ein Error wird einem Spieler zugerechnet, wenn er ein mit „normalem Aufwand“ (ordinary effort) erreichbares Aus verhindert – zum Beispiel, indem er den Ball fallen lässt, beim Fangen oder Aufnehmen daneben greift oder ihn so ungenau wirft, dass der Teamkamerad ihn nicht bekommen kann. Jeder Spieler möchte vermeiden, in der Error-Spalte des Boxscores aufzutauchen und viele Errors sind in der Regel ein Zeichen für schlechtes Defensivspiel. Allerdings sind auch die Errors stark von der Position abhängig: Shortstops und Second Basemen produzieren üblicherweise deutlich mehr Errors als Outfielder. Etwa weil sie schlechtere Abwehrspieler sind? Meistens ist eher das Gegenteil der Fall: Auf diese Posten stellt man gute Abwehrspieler, weil die Bälle im Infield schneller, härter und häufiger ankommen als im Outfield. Deshalb gibt es im Infield viel mehr Gelegenheiten, etwas falsch zu machen, also Errors zu sammeln.
    2016 hatte Jonathan Villar von den Milwaukee Brewers die zweifelhafte Ehre, mit 29 Erros die Liste der meisten Abwehrfehler anzuführen, 2017 liegen bislang acht Spieler mit jeweils 7 gleichauf. Die meisten Errors in einer Saison unterliefen 1889 Herman Long und 1890 Billy Shindle mit jeweils 122. Long führt mit 1.096 Errors auch die Karriererangliste an. Nach aktuellen Spielern muss man in diesen Listen recht lange suchen: Auf Platz 259 findet man Adrian Beltre mit 296 Errors in seiner Karriere. In einer einzelnen Saison hatte kein aktiver Spieler je mehr als 35 Errors (welche Marcus Semien 2015 und Mark Reynolds 2008 verursachten).

    Fielding Percentage
    Betrachtet man die Errors nicht als absolute Zahlen sondern als Anteil erfolgreicher Plays an allen möglichen Plays, dann ist das Problem der unterschiedlichen Anzahl von Möglichkeiten weitgehend ausgeschaltet. Beispiel: Nehmen wir an, während eines Spiels werden zwölf Bälle in Richtung des Third Basemans geschlagen. Zwei davon sausen ihm so schnell um die Ohren, dass man ihm daraus keinen Vorwurf machen kann. Diese beiden fließen nicht in die Berechnung ein. Von den anderen zehn setzt er neun in ein Aus um, indem er sie entweder aus der Luft fängt oder nach Bodenkontakt aufnimmt und zur ersten Base wirft. Den zehnten könnte er locker fangen, aber weil ihn die Sonne blendet greift er daneben, muss sich nach dem Ball bücken und bis er ihn zur ersten Base werfen kann, ist der Batter/Runner dort schon angekommen. Das war ein Error und seine Fielding Percentage (FP) steht damit bei .900 (in Deutschland würden wir sagen: 90%).
    Die FP ist bei angemessen großem Stichprobenumfang schon ein recht brauchbares Maß für die Fähigkeit eines Fielders, aber auch sie ist nicht ohne Probleme: Zum einen sind Errors subjektiv, denn es muss ein Mensch – der Scorer – entscheiden, welcher Ball mit „normalem Aufwand“ spielbar ist und welcher nicht. Darüber hinaus berücksichtigt die FP nicht die Reichweite eines Spielers. Das kann zu der paradoxen Situation führen, dass ein besonders guter Spieler mehr Errors und damit eine schlechtere FP hat als ein schlechterer. Denn der bessere Spieler deckt einen größeren Bereich des Feldes ab und übernimmt häufig die schwierigeren Plays im Grenzgebiet der Zuständigkeiten. Bei diesen Plays unterlaufen naturgemäß die meisten Fehler und diese Fehler werden dem guten Fielder zugerechnet, weil er im Gegensatz zum schlechten Fielder eine Chance gehabt hätte, an den Ball heranzukommen.
    Auch hierzu ein paar Statistiken: 2016 hatten drei qualifizierte Spieler eine perfekte FP von 1.000: die Outfielder Curtis Granderson (Mets), Hunter Pence (Giants) und Randal Grichuk (Cardinals). Die schlechteste FP hatte 3B Yunel Escobar (Angels) mit .937. 2017 haben bislang noch zahlreiche Spieler eine FP von 1.000, ganz hinten liegt derzeit 3B Nick Castellanos (Tigers) mit .920 und Yunel Escobar ist mit .930 nicht wirklich besser geworden. Die schlechteste FP aller Zeiten hatte übrigens Joe Doyle 1872 als SS der Nationals mit .667.

    Neben den bisher geschilderten „klassischen“ Fielding-Statistiken gibt es natürlich auch zu diesem Bereich des Baseballspiels fortgeschrittene Statistiken, sogenannte Sabermetrics. Über jede davon könnte man ohne Weiteres einen eigenen Artikel schreiben, aber ich stelle mal beispielhaft drei davon in aller Kürze vor:

    Ultimate Zone Rating
    Großer Beliebtheit erfreuen sich Statistiken, die direkt in der „Währung“ des Spiels ausgedrückt werden, also in Runs. In Runs dargestellte Defensivstatistiken sind besonders gut mit Offensivstatistiken vergleich- und kombinierbar, die auf dem gleichen Prinzip basieren, beispielsweise Runs Created oder wRAA. Eine solche Statistik ist das Ultimate Zone Rating (UZR). UZR setzt sich zusammen aus zahlreichen Komponenten des Defensivspiels, die jeweils mit einem Wert von Runs bzw. Anteilen davon versehen werden. Diese Werte werden ermittelt, indem der zu beurteilende Spielzug mit dem durchschnittlichen Ausgang ähnlicher Situationen aus der Vergangenheit verglichen wird. Nehmen wir beispielsweise an, in Richtung des Left Fielders wird ein Ball mit einer bestimmten Geschwindigkeit zu einer bestimmten Stelle geschlagen, aus dem ein durchschnittlicher Fielder in 40% der Fälle ein Aus produziert und der ansonsten üblicherweise zu 0,8 Runs für das gegnerische Teams führt. Wenn der Left Fielder das Play macht, dann hat er 0,48 Runs verhindert (die durchschnittliche Schadenshöhe 0,8 multipliziert mit der Eintrittswahrscheinlichkeit von 0,6) und sein UZR steigt entsprechend an. Die Übersetzung von Plays in Runs geschieht über lineare Gewichte. Wer sich in die Details der UZR-Berechnung einlesen will, dem sei ein sehr guter Artikel von Fangraphs ans Herz gelegt.
    UZR kann Werte über oder unter Null annehmen – je nachdem, ob der betreffende Spieler seinem Team mehr oder weniger gegnerische Runs beschert als ein durchschnittlicher Fielder. Überdurchschnittliches Defensivspiel ergibt Werte über Null, die besten Fielder erreichen pro Saison üblicherweise UZR-Werte von über 15.
    Der beste Fielder im Jahr 2016 laut UZR war Outfielder Adam Eaton (White Sox) mit 23,1. 2017 liegt bislang OF Odubel Herrera (Phillies) mit 7,7 vorne. Das höchste Karriere-UZR seit Beginn der Messung (2002) hat bislang Adrian Beltre mit 180,8 inne. Die beste defensive Einzelsaison spielte Alfonso Siriano 2007 für die Cubs mit einem UZR von 32.0.

    Defensive Runs Saved
    UZR und ein anderes verbreitetes Maß für Defensivstärke, Defensive Runs Saved (DRS), sind sich äußerlich betrachtet sehr ähnlich: Auch DRS wird in Form von Runs angegeben, auch DRS bewertet Einzelaktionen des Fielders anhand des Vergleichs mit dem Durchschnitt auf der jeweiligen Position und auch hier stehen Werte über Null für eine überdurchschnittliche Leistung und Werte unter Null für eine unterdurchschnittliche. In den Details der Berechnung weisen die beiden Statistiken ein paar Unterschiede auf. Zum Beispiel verwendet DRS für den Vergleich mit dem Durchschnitt die jeweils letzten zwölf Monate, während UZR immer auf mehreren Jahren basiert. DRS enthält zudem Anpassungen, die sogenannte Videoscouts bei einer Sichtung der Plays festlegen, indem sie Spielzüge als besonders gut oder schlecht einstufen. Diese und andere feine Unterschiede können dazu führen, dass die beiden Statistiken über manche Spieler zu gegensätzlichen Aussagen kommen. Das ist aber eher der Ausnahmefall, in den meisten Fällen kommen UZR und DRS zu sehr ähnlichen Ergebnissen und es ist letztlich Geschmackssache, welches der beiden Maße man bevorzugt. Beide liefern in jedem Fall deutlich bessere und belastbarere Aussagen als die reine Fielding Percentage. Auch zu DRS empfehle ich einen ausführlichen Artikel, der die Berechnungsmethode näher erläutert.
    Die meisten DRS der MLB-Saison 2016 hatte Red-Sox-Outfielder Mookie Betts mit 32, 2017 haben bisher 3B Nolan Arenado (Rockies) und SS Addison Russell (Cubs) mit je 8 DRS die Nase vorn. Die Karriererangliste seit Beginn der Darstellung 2002 führt wie bei UZR auch hier Adrian Beltre an mit 206 DRS. Die beste Einzelsaison hatte OF Kevin Kiermaier (Rays) mit 42 DRS im Jahr 2015.

    Defensive Wins Above Replacement
    Das bekannteste Maß, die Qualität eines Baseballspielers vollständig in einem einzigen Wert auszudrücken, sind Wins Above Replacement (WAR), deren Grundprinzip ich hier mal erklärt habe. WAR berücksichtigt sowohl die defensiven als auch die offensiven Leistungen eines Spielers, bietet aber auch die Möglichkeit, die beiden Komponenten getrennt voneinander zu betrachten. Der defensive Teil von WAR (dWAR) basiert dabei im Wesentlichen auf den beiden gerade vorgestellen Werten. Von den beiden wichtigsten Statistikseiten verwendet Fangraphs UZR für seine Version von WAR, während Baseball Prospectus auf DRS setzt.
    Die besten Feldspieler einer MLB-Saison bringen es in der Regel auf 3 bis 5 dWAR. Im Vergleich dazu landen die besten Batter eines Jahres meist bei 7 bis 10 oWAR.
    Rays-OF Kevin Kiermaier führte zuletzt zwei Jahre in Folge, 2015 und 2016, mit 5,0 und 2,9 die dWAR-Rangliste der MLB an. 2017 führt bislang SS Addison Russell (Cubs) mit 1,0 dWAR. Die meisten dWAR in einer Karriere gelangen dem legendären Shortstop Ozzie Smith mit 43,4. Bester Aktiver in dieser Liste ist einmal mehr Adrian Beltre mit 27,1 dWAR. Die besten Einzelsaisons hatten mit jeweils 5,4 dWAR in zwei sehr unterschiedlichen Ären Terry Turner im Jahr 1906 und Andrelton Simmons 2013.

    Posted in Grundwissen, MLB, Statistik Tagged with: , , , , , , , , , , ,

    April 11th, 2017 by Silversurger

    …aber man kann sie durchaus im April verlieren.“ Diese alte Baseball-Weisheit hört und liest man zurzeit wieder sehr oft. Sie ist das Mantra aller Panikmacher und Überreagierer, denen der Angstschweiß auf der Stirn steht, wenn ihr Team eine oder zwei Wochen nach Saisonstart eine negative Bilanz aufweist. Ich habe mich gefragt, was an dem Sprichwort dran ist.

    Gewinnen kann man die World Series nur, indem man in die Playoffs kommt und sich dort in jeder Runde gegen den jeweiligen Gegner durchsetzt. Die früheste Möglichkeit, die World Series zu „verlieren“, besteht darin, sich nicht für die Playoffs zu qualifizieren. Die Behauptung, man könne eine World Series im April verlieren, unterstellt letzten Endes, dass eine schlechte Bilanz im April eine Playoff-Qualifikation unmöglich macht. Auf Basis dieser Überlegung habe ich mir mal für die Jahre 2012 bis 2016 angeschaut, ob und wie oft Teams mit einer schlechten April-Bilanz in die Playoffs gekommen sind – und anders herum, wie die Playoff-Teilnehmer im April abgeschnitten hatten. Das Startjahr 2012 habe ich deswegen gewählt, weil seitdem die bis heute gültige Regel mit zwei Wild Cards je Liga in Kraft ist.

    In den fünf Jahren 2012 bis 2016 haben 29 Teams den April mit weniger als 40% Siegen abgeschlossen. Nur zwei von ihnen erreichten am Ende der regulären Saison die Playoffs. Das waren zum einen die Pittsburgh Pirates im Jahr 2014 nach 10 Siegen und 16 Niederlagen (38,5% Winning-Percentage) und zum anderen die Texas Rangers 2015, die nach einem echten Fehlstart mit 7 Siegen und 14 Niederlagen (33,3%) sogar noch ihre Division gewannen. Es gibt solche Fälle also, aber sie sind eindeutig die Ausnahme. Zehn Teams brachten es in den fünf Jahren übrigens zu einer Winning-Percentage von unter 30%. Keines von ihnen schaffte es in die Playoffs.

    Um es auch von der anderen Seite her zu betrachten: Den Regeln entsprechend erreichten in jedem der Jahre 2012 bis 2016 zehn Teams die Playoffs. Von diesen 50 Teams wiesen zehn eine negative Aprilbilanz auf (darunter die zwei oben genannten mit weniger als 40% Siegen). Die kombinierte Bilanz der Playoff-Teams 2012 bis 2016 im jeweiligen April beträgt 686-518 (57,0%). Die fünf World-Series-Gewinner der betrachteten Jahre hatten übrigens im Durchschnitt eine April-Bilanz von 65,8%, schwächster World-Series-Sieger im April waren die San Francisco Giants des Jahres 2012 mit 54,6%.

    Wenig überraschend zeigt die Betrachtung, dass die meisten Playoff-Teams schon im April des jeweiligen Jahres gut waren und dass die meisten im April schwachen Teams es am Ende nicht in die Playoffs schafften. Dass das Abschneiden im April – wie in jedem anderen Monat der Saison – einen Einfluss auf die Gesamtbilanz der Saison hat, ist logisch. Dennoch bin ich überrascht, wie deutlich das Bild ist: Nimmt man die fünf betrachteten Jahre, eine zugegebenermaßen kleine Stichprobe, zum Maßstab, so kann man sagen, dass an dem eingangs zitierten Sprichwort eine Menge dran ist. Nach einem schlechten April (unter 40% Winning-Percentage) hat man nur noch eine sehr geringe Chance auf den Einzug in die Playoffs und nach einem sehr schlechten April (unter 30%) praktisch gar keine. Man kann davon ausgehen, dass diese Regelmäßigkeiten früher noch eindeutiger galten als heute, da deutlich weniger Teams in die Playoffs kamen – je Liga bis 1969 nur eines, ab 1969 zwei und vier ab 1994. Unvergessen bleiben aber die Oakland Athletics von 2001: Sie beendeten die Saison nach einem 8-17-April noch mit einer Bilanz von sage und schreibe 102-60. Im Baseball ist eben alles möglich, auch wenn manches davon nur äußerst selten passiert.

    Posted in MLB, Statistik Tagged with: , ,

    Februar 25th, 2017 by Silversurger

    Das Spring Training ist für den Baseballfan nicht nur die Zeit der Prognosen und großen Erwartungen; es ist auch die Zeit, in der man aktiv werden muss, wenn man in der bald beginnenden Saison Fantasy Baseball spielen möchte. Da ich selbst seit Jahren begeisterter Fantasy-Spieler bin und auch im Rahmen des Wunschkonzerts die Frage aufkam, gibt es von mir heute eine kleine Einführung in diesen spannenden Zeitvertreib.

    Das Grundprinzip
    Beim Fantasy Baseball geht es darum, erfundene Teams mit echten Statistiken gegeneinander antreten zu lassen. Das funktioniert so, dass mehrere Mitspieler (ideal sind 10-20) sich vor Saisonbeginn zu einer Liga zusammenfinden, sich jeweils einen Teamnamen aussuchen und ihre Teams mit echten Spielern der MLB bestücken. Während der Saison aktualisiert man täglich oder wöchentlich seine Aufstellung und erhält dann Punkte in Abhängigkeit von den Leistungen, die die aufgestellten Spieler in ihren echten Spielen erzielen. Habe ich zum Beispiel Mike Trout in meinem Team und er schlägt in der realen Welt einen Homerun für die Angels, dann wird dieser Homerun gleichzeitig auch meinem Team gutgeschrieben.

    In den Anfängen des Fantasy-Sports bedeutete das alles viel Papierkram und Rechnerei und war deshalb auch eher ein Nischenhobby für Statistiknerds. Mit der Verbreitung des Internets entstanden zahlreiche Onlineanbieter von Fantasyspielen, die dadurch einen bis heute anhaltenden Boom erlebten.

    Die Verteilung der Spieler
    Damit alle ihren Spaß haben, soll die Verteilung der Spieler auf die Teams natürlich möglichst gerecht ablaufen. Die üblichsten Verfahren dafür sind eine Draft oder eine Auktion. Eine Draft läuft üblicherweise so ab, dass eine Reihenfolge der Teams ausgelost wird und in dieser Reihenfolge wählen die Teams dann Runde um Runde abwechselnd ihre Spieler aus, bis jedes Team die vorher festgelegte Spieleranzahl aufweist. Um es etwas fairer zu gestalten, wird meist der Modus einer Snake-Draft gewählt; das bedeutet, die Draftreihenfolge dreht sich in jeder Runde um – wer in Runde 1 als Erster wählt, wählt in Runde 2 als Letzter, in Runde 3 wieder als Erster usw.

    Beim Auktionsverfahren gibt es in der Regel ebenfalls eine Reihenfolge, jedoch wählt das Team, das an der Reihe ist, nicht einfach einen Spieler und behält ihn; es wählt nur aus, welcher Spieler als nächstes versteigert wird. Dann können alle Teams um diesen Spieler mitbieten und das meistbietende Team bekommt ihn. Natürlich geht es dabei nicht um echtes Geld sondern um ein für alle einheitlich festgelegtes virtuelles Budget.

    Für die Zeit nach der Draft oder Auktion erlauben die meisten Ligen, dass die Teams sich untereinander auf Trades in Form von Tauschgeschäften einigen. Zudem können Spieler entlassen und andere, noch nicht vergebene Spieler neu verpflichtet werden. Das kann nach dem Prinzip „wer zuerst kommt, malt zuerst“ laufen, aber auch nach gerechteren Verfahren wie einer Rangliste, die z. B. dem schlechtesten Team den ersten Zugriff sichert, oder mit einer Mini-Auktion um jeden Spieler, den mehrere Teams verpflichten wollen.

    Die Wahl der Kategorien und Positionen
    Zu den Modalitäten, auf die man sich vor dem Start einigen muss, gehört neben der Regelung, wie man Spieler in sein Team bekommt, auch die, wie viele und welche Spieler überhaupt auszuwählen sind. In manchen Ligen nimmt man es ganz genau und legt jede Position exakt fest, also zum Beispiel auch, dass das Outfield aus RF, CF und LF zu bestehen hat. Andere Ligen sind da etwas lockerer und verlangen nur drei OF und ermöglichen zusätzlich zu den festen Positionen noch einen flexiblen Platz, auf dem quasi als DH ein beliebiger Batter aufgestellt werden darf. Üblicherweise sind in einem Fantasy-Roster alle Positionen in irgendeiner Weise vertreten, einschließlich Starting Pitchern und Relief Pitchern. Neben den Plätzen in der Aufstellung gibt es meist noch ein paar Benchplätze, auf denen man Spieler parken kann, die an dem Tag nicht spielen oder die man nur als Reserve für den Ausfall eines besseren Spielers an Bord hat.

    Ebenfalls einigen muss man sich, welche Kategorien zu bewerten sind. Der Klassiker ist das sogenannte 5×5-Scoring. Es enthält fünf Kategorien für Batter (Runs Scored, Homeruns, Runs Batted In, Stolen Bases, Average) und fünf für Pitcher (Wins, Saves, Strikeouts, Earned Run Average, Walks plus Hits Per Innings Pitched); Defensivleistungen bleiben (leider) meistens unberücksichtigt. Die zunehmende Kritik an bestimmten statistischen Kategorien, die weniger einer Individualleistung zuzurechnen sind als der des umgebenden Teams – zum Beispiel RBI oder Pitcher-Wins – führt dazu, dass sich immer mehr Ligen von dem 5×5-Standard lösen und einzelne Kategorien gegen sinnvollere tauschen – beispielsweise Slugging oder Innings Pitched.

    Der Spielmodus
    Wir haben Teams, wir haben Regeln für das Lineup und die zu wertenden Kategorien – jetzt müssen wir noch festlegen, wie man gewinnt. Es gibt im Wesentlichen zwei Verfahren, zwischen denen man wählen kann: Head-to-Head oder Rotisserie.

    Bei einer Rotisserie- oder kurz Roto-Liga werden die gewählten statistischen Kategorien über das gesamte Jahr hinweg kumuliert. Je nachdem, welchen Rang man in den einzelnen Kategorien belegt, erhält man Punkte und die Punkte von allen Kategorien zusammen bestimmen den Tabellenrang.

    Head-to-Head oder kurz: H2H bedeutet, dass die Fantasy-Liga einen Spielplan hat, der jedem Team für jede Woche ein anderes Team als Gegner zuordnet. In dem Fall erzielt man Punkte nicht im Vergleich mit der gesamten Liga sondern im Vergleich mit dem jeweiligen Gegner. Wenn ich in einer 5×5-Liga in einer Woche in sieben Kategorien besser war als der Gegner und in drei Kategorien schlechter, dann erhalte ich für diese Woche sieben Punkte und er drei. H2H-Ligen sehen zudem oft ein Playoff-System am Ende der Saison vor.

    Während beim H2H immer ein gewisser Glücksfaktor mitspielt, welches Team man in welcher Woche zum Gegner hat, ist die Roto-Liga in dieser Hinsicht gerechter. Andererseits kann es beim Roto passieren, dass eine Saison schon nach ein, zwei Monaten nur noch so dahinplätschert, weil das eigene Team irgendwo in der Mitte gefangen ist und sich kaum etwas bewegt; beim H2H hat man hingegen auch in einem schlechten Jahr zumindest die Möglichkeit, hin und wieder als Underdog ein Top-Team zu ärgern, zudem bringt ein Playoff-System zusätzliche Spannung ins Spiel. Mir macht das H2H-System deshalb mehr Spaß als Roto.

    Langfristig oder immer wieder neu?
    Wenn man in den Fantasy-Sport einsteigt, tut man das meistens durch Teilnahme an einer Re-Draft-Liga. Das bedeutet, die Mannschaft besteht am Anfang der Saison nur aus einem Namen und während der Draft oder der Auktion stehen sämtliche Spieler der MLB zur Wahl. Das ist auf jeden Fall sinnvoll, wenn man das Spiel erst mal ausprobieren möchte, wenn die Mitspieler von Jahr zu Jahr stark wechseln oder wenn man großen Wert auf jährlich wiederhergestellte Chancengleichheit legt.

    Für einen stabilen Mitspielerkreis kann es seinen Reiz haben, eine bestimmte Anzahl von Keepern festzulegen, das heißt von Spielern, die man sich aus dem eigenen Team des Vorjahres auch für das nächste Jahr sichern kann. Üblich sind in dem Fall zwei oder drei Keeper, es gibt aber auch sogenannte Dynasty-Ligen, bei denen zehn oder noch mehr Spieler über die Saison hinaus im Team bleiben. Das Interessante an solchen Ligen ist, dass man in längeren Zeiträumen denken und Strategien ähnlich wie im echten Baseball entwickeln muss – strebt man beispielsweise ein langfristig erfolgreiches Team an und ist bereit, dafür auch ein paar Prospects ein, zwei Jahre durchzuziehen? Oder setzt man alles darauf, jetzt zu gewinnen und sichert sich statt Talenten lieber solide ältere Spieler, die sofort weiterhelfen, auch wenn sie in ein, zwei Jahren wahrscheinlich deutlich an Wert verlieren oder gar die Karriere beenden?

    Ein paar grundlegende Strategien
    Ich bin gern bereit, ein bisschen aus dem Nähkästchen zu plaudern und meine Strategien zu teilen, allerdings hängt Vieles sehr stark von den Rahmenbedingungen der jeweiligen Liga ab. Hier ein paar Grundprinzipien, die für jede oder fast jede Liga gelten:

  • In die Draft oder Auktion sollte man stets gut vorbereitet gehen, sie ist definitiv der wichtigste Teil einer erfolgreichen Fantasy-Saison. Gute Vorbereitung bedeutet, dass man sich erstens genau über die Regeln und Abläufe der jeweiligen Liga informiert und das man zweitens ein Ranking aller infrage kommenden Spieler zur Hand hat. Das muss man natürlich nicht komplett selbst verfassen – als Grundlage bedient man sich in der Regel einer der unzähligen Listen aus dem Internet, die man dann an die eigenen Vorlieben und Einschätzungen sowie an die Schwerpunkte der Liga anpasst.
  • In den ersten Draft- oder Auktionsrunden muss die Basis für konstante Punkteproduktion gelegt werden, daher sollte man auf sichere Performer setzen. Risikospieler, die hohes Potenzial versprechen, aber z. B. bekannte Sperrungs- oder Verletzungsgeschichten mitbringen, solltet ihr Anderen überlassen oder zumindest erst in späteren Runden zugreifen, falls sie so tief fallen.
  • Rankings bieten eine wichtige Orientierung, aber ebenso wichtig ist eine gewisse Flexibilität. Manchmal ergibt sich eine Gruppendynamik (ein sogenannter „Run“), in der eine bestimmte Position viel früher abgegrast wird als man gedacht hätte. Manchmal kann es sinnvoll sein, auf den fahrenden Zug aufzuspringen, aber meistens ist es erfolgversprechender zu schauen, welche Position im Gegenzug vernachlässigt wurde und dort zuzuschlagen. Im Idealfall startet ihr damit selbst einen Run und steuert so Tempo und Richtung der Draft.
  • Die Spieler, die ihr in späten Runden bzw. für wenig Geld bekommt, sind meist relativ austauschbar. Greift bevorzugt zu Spielern, die mehrere Positionen ausfüllen können, und traut euch in dieser Phase ruhig, auch Spieler mit hohem Risiko zu holen – zur Not tauscht ihr sie später auf dem Free-Agent-Markt um.
  • Achtet nicht allein auf die Statistiken der einzelnen Spieler sondern auch auf die Dichte der jeweiligen Position – es gibt zum Beispiel viel mehr gute Batting-Statistiken produzierende Outfielder als Shortstops. Das macht einen guten Shortstop wertvoller und es ist meist ratsam, das Middle Infield relativ früh anzugehen. Für die einzelnen Kategorien gilt Dasselbe wie für die Positionen: Stolen Bases beispielsweise sind seltener als Homeruns; wenn man einen Top-Performer will, der Bases stiehlt und gleichzeitig keine Katastrophe in den anderen Kategorien ist, muss man früh zugreifen.
  • Während der Saison lohnt es sich, bei der Aufstellung im Blick zu haben, wo und gegen wen die eigenen Spieler antreten. Einen sonst soliden Pitcher lasse ich vielleicht mal auf der Bank, wenn er bei einem besonders offensivstarken Gegner antreten muss. Auf der anderen Seite lasse ich einen sonst nur mittelmäßigen Batter gerne mal ran, wenn er in einem hitterfreundlichen Ballpark gegen den fünften Pitcher des Gegners antritt.
  • Wo finde ich Mitspieler?
    Wer einen großen baseball-affinen Freundeskreis hat, kann natürlich jederzeit selbst die Initiative ergreifen und eine Liga gründen. Einfacher ist es, nach einer bestehenden Liga zu suchen und sich dieser anzuschließen. Zum einen gibt es bei allen großen Fantasy-Anbietern – z. B. CBS, ESPN und Yahoo – öffentliche Ligen, denen man mit einem Klick beitreten kann. Das Problem dabei ist, dass man nicht weiß, mit wem man es in so einer Liga zu tun hat und es deshalb oft vorkommt, dass Teams wegen Lust- und Erfolglosigkeit während der Saison aufgegeben werden. Die Wahrscheinlichkeit dafür ist geringer, wenn man sich seine Mitspieler in einem Forum sucht. In quasi jedem amerikanischen Baseballforum finden sich regelmäßig Mitglieder zu Fantasy-Ligen zusammen und freuen sich über Neulinge. Dasselbe gilt für die wenigen deutschsprachigen Foren mit Bezug zu US-Sport – auf nfl-talk.net und auf baseball-forum.de werden beispielsweise noch Mitspieler für neue oder bestehende Ligen gesucht.

    Posted in Grundwissen, MLB, Spiele, Statistik Tagged with: , , , ,

    Februar 18th, 2017 by Silversurger

    Die meisten Statistiken, mit denen man sich im Baseball beschäftigt, beziehen sich auf die Vergangenheit. Über die Aussagekraft der jeweiligen Maße – seien es Pitcher-Wins, Earned Runs, Runs created oder was auch immer – kann man trefflich streiten. Aber zumindest beruhen all diese Werte auf Fakten, auf nachprüfbar erfolgten Ereignissen. Schwieriger wird es, wenn man etwas über Ereignisse wissen will, die noch nicht passiert sind. Dann braucht man Vorhersagen und wie sagt man so schön? Prognosen sind schwierig, besonders wenn sie die Zukunft betreffen…

    Wofür braucht man überhaupt Vorhersagen?
    Vorhersagen braucht man zum Beispiel, um sich eine fundierte Meinung zu bilden, welchen Spieler man gerne mit einem langen Vertrag ausgestattet bzw. überhaupt im eigenen Team sehen möchte. Natürlich hilft da schon der Blick auf die in der Vergangenheit produzierten Zahlen; aber meistens verändern die sich von einem Jahr zum anderen und selbst wenn man davon ausgeht, dass ein Spieler seine Leistungen von einem Jahr aufs andere nahtlos fortsetzt, dann hat man damit bereits eine Vorhersage getroffen. Prognosen helfen auch ungemein beim Fantasy Baseball und anderen Spielen, in denen man auf Ergebnisse wettet.

    Vorhersagen beruhen in erster Linie auf Vergleichen: auf Vergleichen mit ähnlichen Spielern und auf Vergleichen mit der eigenen Vergangenheit. Eine gute Vorhersage sollte daher möglichst viele Informationen über die Vergangenheit des betreffenden Spielers sammeln und berücksichtigen: angefangen beim Alter über seine Leistungen im College und den Minors bis hin zu denen in der MLB, über Neigungen zu Stabilität oder Schwankung, über Verletzungsgeschichten und Vieles mehr. Wenn ich zum Beispiel weiß, dass ich einen .250-Karriere-Batter vor mir habe, dann kann ich daraus ableiten, dass eine einzelne .320-Saison wahrscheinlich ein statistischer Ausreißer ist und der Spieler sich im nächsten Jahr vermutlich wieder in Richtung der .250 bewegen wird. Zudem sollte die Vorhersage möglichst viele Informationen über die Karriereverläufe anderer Spieler berücksichtigen. Wenn ich weiß, dass die meisten Shortstops mit 35 Jahren nicht mehr die gleiche Leistung bringen wie mit 28, dann kann ich dies als Annahme in meine Prognose darüber einfließen lassen, in welche Richtung sich die Leistung des 30-jährigen Shortstops X in den kommenden fünf Jahren entwickeln wird.

    Welche Vorhersagesysteme gibt es?
    Für die MLB gibt es unzählige Vorhersagesysteme. Jede Statistikseite, jede Fantasy-Baseball-Engine, jeder Wettanbieter hat ein eigenes System und arbeitet ständig daran, dieses in Konkurrenz mit den anderen zu verbessern. Ich greife vier dieser Systeme aus dem Informationsdschungel heraus, um sie als Beispiele vorzustellen: PECOTA, ZiPS, Steamer und Marcel. Ich wähle diese vier, weil ich zu ihnen auf eine gute Vergleichsanalyse gestoßen bin – und auch, weil zumindest die drei erstgenannten Systeme die bekanntesten und verbreitetesten sein dürften.

    Marcel oder ausführlich: „Marcel The Monkey Forecasting System“ ist ein sehr simples, aufs Wesentliche beschränktes Vorhersagesystem, das von Tom Tango entwickelt wurde. Im Gegensatz zu den anderen hier vorgestellten Systemen liegen die verwendeten Formeln komplett offen und werden nicht weiterentwickelt. Das Ziel von Marcel ist ausdrücklich nicht, besser als andere Vorhersagen zu sein; sein Sinn besteht vielmehr darin, eine Vergleichsgröße für andere Systeme zu bieten. Nach dem Motto: Wenn das andere System irgendetwas taugt, dann muss es zumindest bessere Ergebnisse erzielen als dieses hier, welches so einfach ist, dass Marcel der Affe (aus der Fernsehserie „Friends“) es durchführen könnte.
    Marcel prognostiziert eine beliebige Statistikkategorie auf Basis der vom jeweiligen Spieler in den letzten drei Jahren erzielten Werte. Dabei werden die neueren Jahre etwas stärker gewichtet als die älteren Jahre. Als zusätzlicher Faktor wird der Ligadurchschnitt der letzten drei Jahre herangezogen unter der Annahme, dass die Leistung des betrachteten Spielers sich in Richtung dieses Durchschnitts bewegt. Der dritte Schritt ist eine Anpassung an das Alter des Spielers in der Annahme, dass die Leistungen bis zum Alter von 29 Jahren ansteigen und danach nachlassen. Da Marcel nur Werte einbezieht, die in den letzten drei Jahren in der MLB erzeugt wurden, entspricht seine Prognose für Rookies und andere Spieler, die keine MLB-Ergebnisse vorzuweisen haben, automatisch dem Ligadurchschnitt.

    PECOTA ist das Vorhersagesystem von Baseball Prospectus und wurde ursprünglich von Nate Silver entwickelt. Der Name steht für „Player Empirical Comparison and Optimization Test Algorithm“ und ist gleichzeitig eine Anspielung auf den ehemaligen Infielder Bill Pecota. PECOTA geht vom selben Ausgangspunkt aus wie Marcel, also einer Prognose aufgrund der gewichteten Leistungen aus den letzten Jahren. Das Besondere an diesem System sind die anschließenden Anpassungen, die nicht vom Ligadurchschnitt ausgehen sondern von konkreten Vergleichsspielern. Anhand von Daten wie Spielstatistiken, Alter, Körperbau und Feldposition werden aktuelle oder frühere Spieler identifiziert, die dem betrachteten Spieler ähneln. Je größer die ermittelte Ähnlichkeit, umso stärker fließt der Karriereverlauf des Vergleichsspielers in die Prognose für die Entwicklung des betrachteten Spielers ein. Das Ergebnis der Analyse sind nicht nur prognostizierte Werte für die Leistung in der kommenden Saison, sondern auch Wahrscheinlichkeitsaussagen wie „Spieler X wird mit 12% Wahrscheinlichkeit ein Breakout-Jahr haben und zu 45% eine leichte Verbesserung aufweisen“.

    ZiPS nennt sich das Vorhersagesystem von Dan Szymborski, nach dem es – in etwas eigenwilliger Weise – auch benannt ist: sZymborski Projection System. ZiPs wird (neben anderen Systemen) von Fangraphs verwendet. Ähnlich wie die beiden vorgenannten Systeme beginnt auch ZiPS mit den Leistungen des betreffenden Spielers aus den (drei bis vier) Vorjahren, gewichtet nach Aktualität. Und ähnlich wie PECOTA wird bei der Zukunftsprognose die Entwicklung vergleichbarer Spieler berücksichtigt, wobei die Ähnlichkeitskriterien deutlich weiter gefasst sind als bei PECOTA. Auf die Art entsteht ein größerer Pool von Vergleichsspielern und das Gewicht der einzelnen Vergleichsspieler fällt entsprechend geringer aus. Für Pitcher weist ZiPS die Besonderheit auf, dass es stark zwischen defense-unabhängigen und defense-abhängigen Statistiken unterscheidet; dadurch schlägt es stärker als bei anderen System auf die Prognose eines Pitchers durch, wenn dieser das Team wechselt und künftig von einer besseren oder schlechteren Defense oder einem anderen Ballpark umgeben ist.

    Steamer ist aus einem High-School-Projekt hervor gegangen und wird hauptsächlich von Fangraphs und Razzball verwendet. Seinen Namen hat es vom Baseballteam der High School, den Saint Ann’s Steamers. Steamer ist methodisch relativ nah an Marcel in dem Sinne, dass es von der Leistung in vorangegangenen Spielzeiten ausgeht und diese nach typischen Altersentwicklungen und nach angenommener Regression zum Ligadurchschnitt anpasst. Diese Anpassungen werden jedoch in ausgefeilterer Weise vorgenommen, indem zum Beispiel die Gewichtung der einzelnen Jahre sowie das Ausmaß der Regression zum Durchschnitt sich an vorhandenen Entwicklungsdaten früherer Spieler ausrichten.

    Und welche Vorhersage ist die beste?
    Die ehrlichste Antwort auf die Frage nach dem besten Vorhersagesystem ist: Kommt drauf an. Jedes der vorgestellten Systeme hat seine Eigenheiten und damit auch seine Stärken und Schwächen. Aber natürlich hat es auch einen Reiz, einfach mal eine handvoll Statistiken zu nehmen, für die jedes der vorgestellten Systeme eine Prognose erzeugt hat, und diese Prognosen nach Abschluss der Saison nebeneinander zu legen. Henry Druschel hat dies für einen Artikel auf Bexond The Box Score getan und ist zu interessanten Resultaten gekommen. Ich gebe sie hier nur in aller Kürze wieder, für tiefergehende Infos schaut einfach direkt in Druschels lesenswerten Artikel rein.

    Druschel hat die Merkmale Walk Rate (BB%), Strikeout Rate (K%), weighted On-Base-Average (wOBA), On-Base Percentage (OBP) und Slugging (SLG) ausgewählt und für alle Spieler, die in jedem der Systeme berücksichtigt wurden, die Abweichungen zwischen den von jedem einzelnen System prognostizierten Werten für 2016 und den tatsächlichen Leistungen des Jahres 2016 ermittelt. Diese Werte hat er verglichen, um zu sehen, welche Vorhersage der Wirklichkeit im Durchschnitt am nächsten kam.

    Die kompliziertesten Verfahren sind offensichtlich nicht immer die besten, denn der Realität am nächsten kam mit Steamer das einfachste der drei etablierten Systeme. PECOTA landete knapp dahinter, während ZiPS nicht nur durchweg schlechtere Ergebnisse als die beiden anderen lieferte sondern in vier von fünf Kategorien noch hinter Marcel dem Affen landete. OBP sagte Marcel sogar von allen System am besten voraus. Interessant finde ich auch die Erkenntnis, dass wenn man von allen vier Systemen den Durchschnitt bildet, dieser fast durchweg eine bessere Prognose darstellt als jedes System für sich.

    Neben der Betrachtung der Liga insgesamt hat Druschel seine Analyse auch speziell für Rookies sowie für Elite-Spieler (defniert als Top-20 in OPS in mindestens einem der Vorhersagesyteme) durchgeführt. Das überraschendste Ergebnis war für mich, dass Marcel bei den Rookies die besten Ergebnisse in den Kategorien OBP und SLG erzielt. (Zur Erinnerung: Die Methode von Marcel besteht für Rookies darin, dass schlichtweg der Ligadurchschnitt der Vorjahre angenommen wird!) Auch für die Top-Spieler stellt Marcel in diesen beiden Kategorien und zusätzlich noch in wOBA die beste Prognose dar. Während Gesamtsieger Steamer bei der Prognose für junge Spieler deutliche Schwächen zeigt, bringt ZiPS hier deutlich bessere Resultate hervor als bei der Betrachtung der Top-Spieler und der Liga insgesamt.

    Als Fazit lässt sich festhalten, dass die aufwändigen Prognosesysteme sich im Vergleich mit der nach Marcel dem Affen benannten simplen Metohode erstaunlich schwach schlagen. Dies gilt insbesondere für ZiPS. Natürlich sollte man eine solche Analyse nicht überbewerten. Zum einen ist der betrachtete Zeitraum recht kurz, selbst wenn man berücksichtigt, dass die Ergebnisse für 2016 eine ähnliche Analyse für 2015 weitgehend bestätigen. Zum anderen zeigt zum Beispiel die unterschiedliche Performance bei der Prognose für Rookies, dass keines der betrachteten Systeme durchweg besser oder schlechter ist als die anderen.

    Posted in Grundwissen, MLB, Statistik Tagged with: , , , , ,

    September 24th, 2016 by Silversurger

    Angesichts von Europameisterschaft, Deutscher Meisterschaft und der heißen Phase der MLB-Saison sind in letzter Zeit meine Statistik-Erklärartikel ein wenig zu kurz gekommen. Das ist nicht schlimm, denn es gibt ja bald wieder eine viel zu lange Offseason. Mit einem Indikator möchte ich mich aber doch schon jetzt beschäftigen, denn er ist besonders interessant in Bezug auf die aktuelle Diskussion, wer dieses Jahr die Titel der Most Valuable Players (MVP) der beiden Ligen erhalten soll.

    Die MVPs werden vom Baseball-Journalistenverband, der Baseball Writers‘ Association of America (BBWA) gewählt. Regelmäßig gibt es flammende Kontroversen darüber, welche Kriterien bei der Auswahl angelegt werden sollen. Da gibt es zum einen die Frage, ob und welche Rolle es spielen soll, ob der betreffende Spieler in einem erfolgreichen Team spielt. Die eine Fraktion sagt, es ist egal, da es um eine individuelle Auszeichnung geht und ein Spieler nicht für den Rest des Teams verantwortlich ist; die andere Fraktion sagt, ein Spieler, der mit seinem Team dauernd verliert, kann nicht der wertvollste der Liga sein. Die andere Frage ist, welche Statistiken am besten Auskunft über die Qualität eines Spielers geben. Traditionalisten schauen in erster Linie auf die Komponenten der Triple Crown: RBI, Batting Average und Homeruns für Batter; Wins, ERA und Strikeouts für Pitcher. Der progressivere Ansatz hingegen besteht darin, über diese Einzelwerte hinaus zu schauen und zu versuchen, den gesamten egenständigen Beitrag des jeweiligen Spielers zum Teamerfolg zu messen.

    Der bekannteste Indikator, der diesen Gesamtbeitrag eines Spielers misst, heißt Wins Above Replacement, kurz: WAR. Das Grundprinzip von WAR besteht darin, dass der Wert des jeweiligen Spielers in Form von Siegen gemessen wird und zwar im Vergleich mit einem Spieler auf Replacement Level. Oder anders formuliert, WAR beantwortet die Frage: Wie viele Siege hat das Team mehr auf dem Konto, weil es den bestimmten Spieler X im Roster hat statt eines beliebigen Spielers Y?

    Das Thema Replacement Level oder „beliebiger Spieler“ muss ich noch etwas näher erläutern: Ein Spieler auf Replacement Level meint einen Spieler, der einem MLB-Team zu minimalen Kosten und mit minimalem Aufwand zur Verfügung steht. Replacement Level ist in jedem Fall weniger als ein durchschnittlicher MLB-Spieler, aber auch mehr als irgend jemand Dahergelaufenes wie Tim Tebow oder ich. Replacement Level ist das Niveau, das ich erwarten kann, wenn ich wegen Verletzungen oder sonstiger Ausfälle eine Lücke mit einem Minor Leaguer oder einem arbeitslosen Profi zum Mindestlohn der MLB fülle. Die beiden führenden Statistikseiten Fangraphs und Baseball-Reference haben sich vor einigen Jahren auf eine gemeinsame Annahme zum Replacement Level geeinigt. Demnach entspricht das Replacement Level einer Siegrate von 29,4%. Ein Team, das nur aus Replacements besteht, würde in einer 162-Spiele-Saison nach dieser Annahme 47,7 Spiele gewinnen.

    WAR ist keine offizielle MLB-Statistik und nicht standardisiert, das heißt unterschiedliche Quellen benutzen unterschiedliche Formeln und kommen zu leicht unterschiedlichen Ergebnissen, obwohl sie im Großen und Ganzen das gleiche messen. Das gilt auch für Fangraphs und Baseball-Reference, die sich zwar auf ein einheitliches Replacement Level geeinigt haben, aber eben nicht auf eine einheitliche Formel für WAR. Mit in die Aufzählung gehört auch Baseball Prospectus, bei denen der Indikator WARP (Wins Above Replacement Player) heißt. Die Grundidee ist bei allen drei Quellen die gleiche, nämlich dass man sich fragt,
    – wie viele Runs ein Spieler für sein Team produziert hat,
    – wie viele Runs der gegnerischen Teams er verhindert hat,
    – wie viele Siege für sein Team diese Anzahl von verursachten oder verhinderten Runs wert ist und
    – welchen Mehrwert gegenüber einem hypothetischen Replacement-Spieler diese Siege darstellen.

    Eine sehr übersichtliche Darstellung der Unterschiede in den Berechnungsweisen kann man bei Baseball-Reference nachlesen. Fürs Erste genügt es zu wissen, dass bei der Bewertung von Pitchern für Baseball-Reference und Baseball Prospectus die Runs Allowed (RA) im Mittelpunkt stehen, für Fangraphs hingegen Fielding Independent Pitching (FIP) und dass bei der Bewertung von Battern alle drei auf unterschiedliche Weise die Leistungen am Schlag, im Feld und beim Baserunning mit einbeziehen und auch Parkfaktoren berücksichtigen. Letzteres bedeutet, dass der Einfluss auf die zählbaren Leistungen eines Spielers, häufiger in einem eher hitter- oder pitcherfreundlichen Ballpark zu spielen, herausgerechnet wird.

    Unterschiedliche Berechnungen führen zu unterschiedlichen Ergebnissen. Das sieht man auf einen Blick, wenn man die WAR-Tabellen von Fangraphs (Spalte ganz rechts), Baseball-Reference (links oben) und Baseball Prospectus (zwei Links für Pitcher und Batter, jeweils Spalte ganz rechts) vergleicht. Immerhin sind sich Fangraphs und Baseball-Reference einig, dass Mike Trout in der aktuellen Saison bisher die meisten Wins für sein Team wert war und alle drei Seiten kommen gleichermaßen zu dem Ergebnis, dass Trout mit 8 bis 10 WAR die American League anführt und Kris Bryant mit 7 bis 9 die National League. Folgt man diesen Zahlen, müssten Trout und Bryant dieses Jahr MVP werden. Ob es wirklich so kommt? Wir werden sehen, aber ich wage es zu bezweifeln – vor allem in Bezug auf Trout, der in keiner der „klassischen“ Kategorien vorne steht und obendrein bei einem wirklich schlechten Team spielt.

    Posted in MLB, Statistik Tagged with: , , , , , ,

    September 14th, 2016 by Silversurger

    Dass Zahlen eine magische Anziehung auf mich ausüben, dürfte an der einen oder anderen Stelle in diesem Blog schon aufgefallen sein. In diesem Artikel soll es um eine Zahl gehen, die auch so heißt: Magic Number. Spätestens ab Mitte September ist diese magische Zahl regelmäßig in aller Munde und ich möchte kurz erklären, was es damit auf sich hat.

    Die Magic Number gibt an, wie nah ein Team daran ist, ein bestimmtes Ziel – in der MLB üblicherweise den Divisionstitel oder einen Wild-Card-Platz – hieb- und stichfest zu erreichen. Zum Beispiel haben die Chicago Cubs in Bezug auf den Gewinn der National League Central momentan eine Magic Number von 3. Das heißt, wenn und sobald die Cubs von ihren 18 verbleibenden Spielen 3 gewinnen, ist ihnen der Divisionssieg nicht mehr zu nehmen. Mit jedem Sieg des betreffenden Teams verringert sich die Magic Number um 1 und logischerweise auch mit jeder Niederlage des direkten Verfolgers (wobei als direkter Verfolger immer das Team mit den wenigsten Niederlagen hinter dem Führenden anzusehen ist).

    Die Berechnung der Magic Number ist recht einfach. Man nimmt die Gesamtzahl der Saisonspiele (G), addiert 1 und zieht dann die bereits erzielten Siege des führenden Teams (WA) sowie die erlittenen Niederlagen des direkten Verfolgers (LB) ab:

    G+1-WA-LB

    Beim aktuellen Tabellenstand der NL Central berechnet sich die Magic Number also wie folgt:

    Team W L
    Chicago Cubs 92 52
    St. Louis Cardinals 76 68

    162+1-92-68=3

    Zu Saisonbeginn lautet die Rechnung für jedes MLB-Team

    162+1-0-0=163

    Das heißt, jedes Team hat zum Saisonstart eine Magic Number von 163. Klingt auf den ersten Blick logisch, denn selbst mit 162 Siegen aus 162 Spielen könnte es ja theoretisch sein, dass ein anderes Team das gleiche Kunststück schafft und am Ende Gleichstand herrscht. Bei näherem Hinsehen erweist sich das aber als Irrtum, denn man trifft 19-mal auf jeden Divisionsrivalen. Wenn man 153 Spiele gewinnt, dann hat man den hartnäckigsten Verfolger mindestens zehnmal besiegt und dieser höchstens 152 Spiele gewonnen. Hier zeigt sich eine Unschärfe der Magic Number: Sie berücksichtigt nicht den Spielplan und fällt dadurch manchmal zu hoch aus.

    Eine sinnvolle Magic Number (also eine, die nicht mehr Siege voraussetzt als Spiele übrig sind) haben übrigens nur solche Teams, die den betreffenden (Spitzen- oder Wild-Card-)Platz bereits belegen – wenn man zurückliegt, ist man schließlich neben eigenen Siegen immer auch auf Niederlagen der besser Platzierten angewiesen. Um auch diese Situation in einer Zahl auszudrücken, gibt es als böse Zwillingsschwester der Magic Number die sogenannte Elimination Number.

    Die Elimination Number drückt aus, wie viele Siege des führenden Teams kombiniert mit Niederlagen des verfolgenden Teams dazu führen, dass das verfolgende Team aus dem Rennen ist. Für den direkten Verfolger ist die Elimination Number identisch mit der Magic Number des Führenden. Für jeden weiteren Verfolger ist sie entsprechend höher und kann mit der oben genannten Formel berechnet werden, wobei WA wie gehabt die Siege des Führungsteams sind und LB die Niederlagen des jeweils betrachteten Teams.

    Um im Beispiel zu bleiben, berechnen wir die Elimination Number der Pittsburgh Pirates, die in der NL Central mit 73 Niederlagen Rang 3 belegen:

    162+1-92-73=-2

    Wir erhalten einen negativen Wert und somit wissen wir, dass die Pirates in Bezug auf den Divisionstitel bereits unwiderruflich ausgeschieden sind. Die NL Central ist übrigens die einzige Division, in der der Drittplatzierte keine theoretische Chance mehr auf den Divisionssieg hat. Besonders hoch sind die Elimination Numbers in der heiß umkämpften AL East, in der selbst die viertplatzierten New York Yankees noch einen Wert von 15 aufweisen. Das heißt, erst nach einer Kombination von 15 Siegen der Red Sox und/oder Niederlagen der Yankees, sind Letztere endgültig aus dem Rennen.

    MLB-Tabellen mit Elimination Numbers gibt es zum Beispiel bei CBS, hier in Bezug auf die Divisionstitel und hier in Bezug auf die Wild Cards. Die Magic Numbers werden dort nicht dargestellt. Das macht aber nichts, da wir ja nun wissen, dass die Magic Number des Erstplatzierten immer identisch ist mit der Elimination Number des Zweitplatzierten.

    Posted in MLB, Statistik Tagged with: ,

    September 3rd, 2016 by Silversurger

    Ich muss mal wieder fangraphs.com loben. Die für mich – gemeinsam mit baseball-reference.com – beste aller MLB-Statistikseiten hat diese Woche eine interessante Neuerung eingeführt und zwar ein interaktives Splits-Tool. Was kann man damit machen? Nun, wenn ihr zum Beispiel schon immer den Eindruck habt, dass Yoenis Cespedes besonders gut schlägt, wenn er in Auswärtsspielen gegen linkshändige Pitcher antritt und sich Runner auf den Bases befinden, dann könnt ihr das nun mit wenigen Klicks bestätigen oder euch eines Besseren belehren lassen.

    Das funktioniert so: Auf der Seite eines beliebigen Spielers, also zum Beispiel der von Yoenis Cespedes, wählt man in der Navigationsleiste direkt unter dem Infokasten das Splits Tool aus. Das Tool umfasst drei Bereiche, in denen man Einstellungen vornehmen kann: ganz oben die Auswahl, welche Statistiken – Standard, Advanced, Batted Ball – man angezeigt haben möchte. Kernstück des Tools sind die diversen Splits, also Filter, die man in den mittleren Zeilen auswählen kann. Die meisten davon sind selbsterklärend, außer vielleicht „Leverage“: Damit ist gemeint, wie spannend oder wichtig die Spielsituation gerade ist. Fangraphs bildet dazu einen Leverage Index, der in einer durchschnittlichen Spielsituation bei 1 liegt. Liegt er unter 0,85, so gilt die Situation als „Low Leverage“, bei über 2 als „High Leverage“. Besonders anschaulich sieht man die Entwicklung der Leverage während eines Spieles in der kleinen Grafik unter jedem Scoreboard von Fangraphs. Wenn man die gewünschten Filter gewählt hat, kann man unter „Group By“ noch die gewünschte zeitliche Gruppierung festlegen, um sich die Ergebnisse für die Gesamtkarriere oder einzelne Jahre, Monate, Wochen, Spiele anzuschauen.

    Für das oben genannte Beispiel wähle ich auf der Seite von Yoenis Cespedes bei Statistiken „Advanced“, weil ich die Schlagleistung anhand des Wertes OPS beurteilen möchte. Als Splits wähle ich „vs. LHP“, „Away“ und „Runners On“. Mit jeder Aus- und Abwahl einer Option sieht man sofort die angepassten Statistiken. Zu guter Letzt wähle ich noch „Season“ als Gruppierungsvariable, damit ich die Werte nach einzelnen Saisons angezeigt bekomme. Das war schon alles und ich weiß jetzt, dass Cespedes in den gewählten Situationen tatsächlich gut geschlagen hat: 2015 mit einer OPS von 1.008, 2016 mit 1.200. Wähle ich alle drei Splits wieder ab, sehe ich zum Vergleich seine Gesamtwerte der jeweiligen Saison (2015: .870, 2016: .939).

    Ein paar Wünsche lässt das Tool leider offen: Zum einen reichen die Daten nur bis zum Jahr 2002 zurück, für historische Vergleiche taugt es somit nicht. Außerdem vermisse (oder übersehe?) ich eine Möglichkeit, zwischen Pitching- und Batting-Statistiken zu wechseln. Für Pitcher zeigt das Tool Pitching-Stats an, für Batter Batting-Stats, aber wenn ich zum Beispiel etwas über das Batting von Madison Bumgarner herausfinden möchte, lässt es mich im Stich. Super fände ich zudem, wenn man bei Spielern, die das Team gewechselt haben, die Ergebnisse danach filtern könnte, für welches Team sie erzielt wurden. Und wenn man sich einzelne Spiele anzeigen lässt, stehen dort zwar die Spieltermine, aber nicht die Gegner. Aber das ist Jammern auf hohem Niveau und wie ich Fangraphs kenne, wird man in nächster Zeit noch die eine oder andere Verbesserung nachrüsten. Auf jeden Fall ist dieses Tool ein toller Fortschritt für jeden Hobby-Baseballstatistiker und das Ganze komplett kostenlos. Diese (natürlich ebenfalls kostenlose) Werbung von mir haben sich die Leute von Fangraphs redlich verdient.

    Posted in MLB, Statistik Tagged with: