Menu Close

5년 회귀 파크팩터

기본 파크팩터 공식

득점파크팩터 = ((홈득점+홈실점)/홈경기)/((원정득점+원정실점)/원정경기) * 100

파크팩터의 가장 기본이 되는 공식입니다. 공식에 득점 대신 홈런을 쓰면 홈런 파크팩터, 3루타를 쓰면 3루타 파크팩터가 됩니다. 100이면 중립구장, 100보다 크면 타자에게 유리, 100보다 작으면 투수에게 유리한 구장입니다.

 

기본 파크팩터의 해석

공식을 보면 알 수 있듯이 기본 파크팩터는 홈구장과 원정구장을 비교한 것입니다. 여기에서 원정구장은 리그평균을 말하는 것이 아닙니다. 물론 팀이 무한대에 가깝게 많다면 원정구장이 리그평균과 거의 같아지겠지만 일본프로야구는 팀이 리그별로 6개에 불과합니다. 만약 어떤 구장의 홈런 파크팩터가 150 이라면 이 구장은 타구장에 비해 홈런이 50% 더 나오는 것이지 리그평균에 비해 50% 더 나오는게 아닙니다. 실제로 리그평균에 비해 홈런이 50% 나오는 구장의 파크팩터가 어떻게 계산되는지 예를 들어보겠습니다. 팀이 6개인 리그에서 어떤 구장이 홈런이 50% 더 잘나온다면 나머지 5개구장은 홈런이 10% 덜 나와야 합니다.

A: 1.5

B: 0.9

C: 0.9

D: 0.9

E: 0.9

F: 0.9

평균: 1.0

그러면 파크팩터를 계산하면 어떻게 나오는지 보겠습니다.

A구장 홈런 파크팩터: 1.5/0.9 = 1.66

나머지구장 홈런 파크팩터: 0.9/1.02 = 0.88

A구장의 홈런 파크팩터는 166이지만 리그평균보다 홈런이 66% 더 나오는게 아니라 원정구장에 비해 66% 더 나오는 것이며 리그평균과 비교하면 50% 더 잘 나오는 것이 됩니다. 그리고 홈구장에서는 홈런이 50% 더 잘 나왔지만 원정구장에서는 10% 덜 나오므로 경기 전체로는 20% 더 잘 나오는 환경이 됩니다. (1.5*0.5 + 0.9*0.5 = 1.20) 이렇게 원정구장과 비교해 계산된 파크팩터를 과대/과소평가하지 않도록 리그평균에 맞춰 조정하고 원정경기의 파크팩터까지 고려해야합니다.

 

충분한 표본

구장 환경에 변경이 없다면 파크팩터는 매년 똑같아야 하지만 실제로는 매년 편차가 큽니다. 표본이 충분하지 않기 때문입니다. 여러 연도의 파크팩터를 사용할 경우 같은 비중으로  평균할 수도 있고 최근 연도에 따라 가중치를 다르게 할 수 있습니다. NPB STATS는 최대 5년치를 사용하는데 해당년도의 전후로 2년치까지만 사용하며 당해년도 4, 1년전후 2, 2년전후 1의 가중치를 두고 있습니다.

2년전후로 5년치: (2년전*1 + 1년전*2 + 당해*4 +1년후*2 +2년후*1)/(1+2+4+2+1)

최근 3년치: (2년전*1 + 1년전*2 + 당해*4)/(1+2+4)

파크팩터는 1년치는 신뢰도가 낮으며 표본이 많아질수록 신뢰도가 높아집니다.  NPB STATS는 득점 파크팩터의 경우 신뢰도를 1년치 0.5, 2년치 0.8, 3년치 이상 0.9로 설정하고 있습니다. 1년치라면 50%는 평균으로 회귀시킨다는 것입니다.

 

홈 구장을 변경하는 경우

홈구장을 변경하는 경우에는 리셋합니다. 예를 들어 센트럴리그는 2009년 히로시마의 새 홈구장인 마쓰다스타디움이 개장했으므로 2009년부터는 2008년까지의 파크팩터를 사용하지 않습니다.

2009년 센트럴리그 파크팩터: (2009년PF*4+2010년PF*2+2011년PF*1)/(4+2+1)

2010년 센트럴리그 파크팩터: (2009년PF*2+2010년PF*4+2011년PF*2+2012년PF*1)/(2+4+2+1)

2011년 센트럴리그 파크팩터: (2009년PF*1+2010년PF*2+2011년PF*4+2012년PF*2+2013년PF*1)/(1+2+4+2+1)

 

구장 내의 환경에 변화가 있는 경우

펜스높이를 조절하거나, 테라스를 설치하는 것처럼 기존과 같은 구장 안에서 변화가 생기는 경우는 리셋하지 않습니다. 파크팩터는 표본(년수)이 많을수록 신뢰성이 높아지는데 구장 환경의 변화를 모두 반영하면 충분한 표본을 확보하기 어려워지는 경우가 많기 때문입니다. 야쿠르트는 2008년에 진구 구장의 그라운드를 확장하는 리모델링을 했는데 2009년에는 히로시마의 새 홈구장이 개장하였습니다. 구장 환경에 변화가 있을 때마다 파크팩터 리셋을 한다면 2008년은 1년치만 사용하여야 합니다. 그런데 2008년 진구구장의 파크팩터는 투수친화라는 다소 이상한 수치가 나옵니다. 2008년 전후로 대부분 타자 친화구장이었던 진구구장이 2008년에만 투수친화구장이었다고 보기는 어렵습니다.

진구구장의 2006~2010년 득점, 홈런 파크팩터

2006 2007 2008 2009 2010
득점 105.6 106.4 98.8 101.6 104.4
홈런 106.4 115.2 98.0 105.2 108.8

2008년 1년치만 사용할 경우 회귀 파크팩터

득점: 98.8*0.5+100*0.5=99.4

홈런: 98.0*0.5+100*0.5=99.0

2009년 히로시마 신구장이 개장하기전까지 2006~2008년 3년치를 사용할 경우 회귀 파크팩터

득점: (105.6*1+106.4*2+98.8*4)/(1+2+4)*0.9+100*0.1=101.7

홈런: (106.4*1+115.2*2+98.0*4)/(1+2+4)*0.9+100*0.1=103.7

엄밀히 따진다면 구장 환경에 변화가 있을때마다 파크팩터 리셋을 하는 것이 맞지만 그럴 경우 충분한 표본을 확보하지 못 하는 경우가 많고 2008년 진구구장의 예처럼 튀는 수치도 나오기 때문에,  NPB STATS는 구장 환경에 다소 변화가 있더라도 일일이 반영하는 것 보다는 표본을 늘리는 쪽을 선택했습니다. 대신 최근 년도에 가중치를 많이 줘서 구장환경 변화에 따른 오차를 줄이고 있습니다.

 

지방구장의 존재

일본프로야구는 구단에 따라 본거지구장외에도 지방구장을 홈구장으로 갖고 있습니다. 본거지구장이란 주로 쓰는 홈구장을 의미합니다. 요미우리는 도쿄 돔, 한신은 고시엔, 소프트뱅크는 후쿠오카 돔이 본거지구장입니다. 지방구장은 본거지구장을 제외한 홈구장입니다. 야쿠르트의 경우 도쿄를 연고로 하지만 아키타, 시즈오카 등에 있는 지방구장에서도 홈경기를 하고 있습니다. 지바 롯데처럼 지방구장 홈경기가 전혀 없는 구단도 있는 반면에 지방구장 경기가 많은 한신은 2010년에 홈경기 72경기 중에서 60경기만 본거지구장인 고시엔을 썼고 나머지 12경기는 지방구장에서 열렸습니다. 일본프로야구 평균적으로는 경기의 10% 정도를 지방구장에서 하고 있습니다. 실제로는 지방구장도 차이가 있겠지만 경기수가 너무 적어서 파크팩터를 계산할 의미가 없기 때문에 NPB STATS는 지방구장의 파크팩터를 모두 1로 간주하고 있습니다.

홈경기 파크팩터: (본거지구장파크팩터/100*본거지구장홈경기 + 1*지방구장홈경기)/홈경기

본거지구장이 평균보다 20% 더 홈런이 나오는데 본거지구장의 경기수는 90%이고 지방구장 경기수가 10%일 경우

홈경기 파크팩터: 1.2*0.9 + 1*0.1 = 1.18

 

5년 회귀 파크팩터 계산 예시

NPB STATS에서 사용하는 파크팩터의 계산법을 2014년 한신 타이거스의 홈런 파크팩터를 구하는 과정으로 예를 들겠습니다. 계산의 기초가 되는 파크팩터로는 日本プロ野球RCAA&PitchingRunまとめblog에 게시된 파크팩터를 쓰고있습니다. 해당 사이트의 파크팩터는  비교대상이 타구장이 아니라 리그평균 기준으로 조정되어 있습니다.

2014년 한신의 본거지구장 고시엔의 홈런파크팩터는 66입니다. 66의 의미는 리그평균에 비해 홈런이 66%가 나온다는 뜻입니다. 센트럴리그 팀 수는 6개이므로 센트럴리그 6개 홈구장에서 홈런이 600개(팀평균100개)가 나왔다면 고시엔구장에서는 홈런이 66개 나왔다는 것입니다. 나머지 5개 팀의 홈구장에서는 534개(팀평균106.8개)가 나온 것이 됩니다.  그렇다면 2014년 한신 선수는 홈구장에서는 홈런이 66개 나오는 환경, 다른 팀의 홈구장에서는 홈런이 106.8개 나오는 환경에서 경기를 했습니다. 홈과 원정에서 반반씩 출장했다고 하면 66*0.5+106.8*0.5=86.4

똑같이 다른 년도의 파크팩터를 구하면 2012년 88.8, 2013년 87.6, 2014년 86.4, 2015년 89.2, 2016년 92.8

당해 4, 1년전후 2, 2년전후 1의 가중치로 가중평균합니다.

(88.8*1+87.6*2+86.4*4+89.2*2+92.8*1)/(1+2+4+2+1)=88.1

5년치이므로 0.9의 신뢰도가 있고 10%만 평균으로 회귀해줍니다.

88.1*0.9+100*0.1=89.3

한신은 시즌 144경기 중에서 129경기를 고시엔과 다른 팀의 본거지구장에서 했고 나머지 15경기는 지방구장에서 경기했습니다. 지방구장의 파크팩터는 평균으로 간주해서 계산하면

(89.3*129+100*15)/144=90.4

이렇게 한신의 5년 회귀 홈런 파크팩터가 계산되었습니다.

 

파크팩터의 활용법

파크팩터는 구장 차이에 따른 유불리를 제거하기 위해 만들어진 값입니다. 만약 어떤 구장에서 홈런이 평균보다 10% 더 나온다면 그 구장의 홈런 기록은 10% 낮춰서 보는게 적절하다는 것입니다.  홈런이 10% 더 나오는 구장에서 평균적인 구장으로 변경했다고 해서 모든 선수의 홈런수가 10% 줄어들 것임을 뜻하는 건 아닙니다. 선수에 따라서 홈런이 10%보다 더 줄어들 수 도 있고 오히려 늘어날 수도 있습니다. 그러나 그 구장에서 기록된 홈런은 가치적인 면에서 10% 낮춰서 봐야한다는게 파크팩터의 올바른 활용법입니다.