wOBA의 계수가 어떻게 계산되는지 알아보겠습니다. wOBA는 타격 이벤트 (사사구, 1루타, 2루타, 3루타, 홈런)의 실제 Run Value(득점가치)에 기반해 타석당 타격 생산성을 평가하는 지표입니다. 솔로홈런은 1점의 가치가 있지만 주자가 있으면 4점까지도 낼 수 있습니다. 모든 상황에서 나온 홈런의 결과를 가중평균하면 홈런의 득점가치를 계산해낼 수 있습니다. 정확한 득점가치를 구하려면 PBP데이터가 필요하지만 톰 탱고가 PBP데이터 없이도 득점가치의 근사값을 계산하는 방법을 고안했습니다.
Run Value (득점가치) 근사값
RperOut = R/(IP*3)
runBB = RperOut + 0.14
runHBP = runBB + 0.025
run1B = runBB + 0.13
run2B = run1B + 0.3
run3B = run2B + 0.27
runHR = 1.4
야구고물상님의 블로그 포스팅에 따르면 위가 FanGraphs의 공식이며 톰 탱고의 공식과는 약간 차이가 있습니다. FanGraphs의 공식이 NPB에서도 실제 득점가치에 더 가깝다고 생각되므로 NPB STATS는 FanGraphs과 같은 공식을 쓰고 있습니다.
먼저 득점가치의 근사값을 계산합니다. 득점가치의 근사값을 구하기 위해서는 먼저 아웃당 득점을 알아야 합니다. 아웃당 득점은 리그득점/리그아웃(이닝*3)으로 구할 수 있습니다. 일본프로야구(NPB) 전체를 대상으로 계산할 수도 있지만 NPB STATS는 센트럴리그와 퍼시픽리그를 구분해 계산하고 있습니다. PBP 데이터를 사용할 경우에는 샘플 사이즈를 늘리기 위해 리그 구분하지 않는 쪽이 더 좋다고 보지만 근사값을 쓸 경우에는 구분하는 쪽이 낫다고 생각됩니다. 2019년 센트럴리그는 22987아웃(7762.1이닝) 동안 3607득점이 나왔으므로 1아웃당 득점은 0.157입니다. 볼넷의 득점가치는 아웃당 득점에 0.14점을 더한 0.297점. 몸에맞는공의 득점가치는 볼넷의 득점가치에 0.025점을 더한 0.322점. 1루타의 득점가치는 볼넷의 득점가치에 0.13점을 더한 0.452점. 2루타의 득점가치는 1루타의 득점가치에 0.3점을 더한 0.752점. 3루타의 득점가치는 2루타의 득점가치에 0.27점을 더한 1.022점. 홈런은 1.4점 고정입니다.
wOBAscale
runPLUS = (runBB*(BB-IBB)+runHBP*HBP+run1B*1B+run2B*2 +run3B*3 +runHR*HR)/(H+BB-IBB+HBP)
runMINUS = (runBB*(BB-IBB)+runHBP*HBP+run1B*1B+run2B*2 +run3B*3 +runHR*HR)/(AB-H+SF)
wOBAscale= 1/(runPLUS-runMINUS)
다음은 wOBA가 출루율 스케일의 스탯이므로 출루율 스케일로 변환하기 위한 상수(wOBAscale)가 필요합니다. runPLUS는 출루에 성공했을때의 득점가치, runMINUS는 출루에 실패했을 때의 득점가치(아웃당하지 않은 득점가치)입니다.
위의 공식대로 계산하면 2019년 센트럴리그의 runPLUS는 0.531, runMINUS는 -0.249, wOBAscale은 1.283이 나옵니다.
wOBA 계수
wBB = (runBB+runMINUS)*wOBAscale
wHBP = (runHBP+runMINUS)*wOBAscale
w1B = (run1B+runMINUS)*wOBAscale
w2B = (run2B+runMINUS)*wOBAscale
w3B = (run3B+runMINUS)*wOBAscale
wHR = (runHR+runMINUS)*wOBAscale
각 이벤트의 득점가치에 runMINUS를 더하는 이유는 아웃당하지 않은 가치도 고려해야 하기 때문입니다. 아웃을 당하면 기대득점이 0.249점 감소하게 되는데 홈런은 1.4점의 득점가치가 있지만 아웃당했을 때와 비교하면 1.40+0.249=1.649점이 됩니다. 그리고 wOBA를 출루율 스케일로 변환해주기 위해 wOBAscale 1.283을 곱하면 홈런의 wOBA 계수는 1.649*1.283=2.115가 됩니다.
2008~2010년 PBP데이터로 구한 득점가치와 근사값의 비교
이벤트 | PBP | 근사값 |
BB | 0.298 | 0.298 |
HBP | 0.327 | 0.323 |
1B | 0.446 | 0.453 |
2B | 0.783 | 0.753 |
3B | 1.143 | 1.023 |
HR | 1.411 | 1.4 |
PBP데이터로 구한 득점가치는 데이타스타디움이 집계한 것입니다. 장타(특히 3루타)의 득점가치가 근사값보다 높은 것이 눈에 띕니다. 3년치라 충분하지는 않지만 NPB는 MLB보다 장타의 득점가치가 높을 수도 있다고 생각됩니다. NPB STATS는 FanGraphs의 공식을 그대로 사용하고 있지만 NPB에서 역사적으로 장타의 득점가치가 높은게 사실이라면 수정될 수 있습니다.
참고
http://www.insidethebook.com/ee/index.php/site/comments/woba_year_by_year_calculations/
https://junkstorage.tistory.com/m/22
http://archive.baseball-lab.jp/column_detail/&blog_id=10&id=126