2008년 한국야구 VORP 순위 ver 2.0


어제 후보선수들의 성적을 일일이 종합하여 2008년 성적만으로 계산한 VORP(Value Over Replacement Player)를 말씀드린 적이 있습니다. VORP의 정의를 다시 말하자면 "특정 선수를 제외한 8명의 타자가 리그 평균의 야수라고 가정했을 때, 그 포지션에서 해당 선수가 후보 선수에 비하여 가지는 공격력의 가치"라고 할 수 있습니다. 똑같이 OPS .950을 기록하는 2루수와 1루수가 있다면, 상대적으로 공격력이 약한 선수들이 많은 2루수로 뛰면서 OPS .950을 기록한 선수가 더 가치 있는 선수임을 수치로 증명하는 메트릭입니다.


2008년 한국야구 VORP 순위(1~80위).



이 방법에 대하여 Inning(http://www.inning.co.kr)의 "스태티즈" 님께서 한 시즌만을 표본으로 놓고 VORP를 구할 경우 발생할 수 있는 문제점에 대하여 좋은 의견을 내 주셨고, 제 스스로도 어제 구한 VORP의 문제점에 대하여 생각해 봤습니다. 대략 이런 문제점이 있을 수 있습니다,

1) 어떤 포지션의 후보 선수들은 실제보다 과소평가될 가능성이 있다. 예컨대 1루수는 주전 한 명이 대부분의 경기에 나서고 후보로 투입되는 선수들도 다른 포지션을 주로 맡고 있는 선수들을 임시로 쓰는 경우가 많기 때문에, 퍼스트 포지션이 1루수인 후보 선수들이 실제 경기에서 기록을 남길 가능성이 낮다.

2) 한 해의 기록을 가지고 후보 선수들을 일일이 찾아서 대체 선수를 정의하는 것은 과대평가에 의한 왜곡의 우려가 있다. 예를 들어 올해 조동화나지완은 수비 기록만 보면 분명 후보 좌익수이지만, 실제 공격시간이나 성적은 주전 선수급이다. 모든 포지션의 후보 선수들의 공격력이 대체로 좋지 않은 가운데 이런 선수 1~2명이 끼게 되면 왜곡을 가져올 수 있다.


"스태티즈" 님이 구해 주신 리그 통산자료를 바탕으로 후보 선수의 수준을 재정의해 보았습니다. 자세한 글은 이 링크를 참조하시기 바랍니다. 새로운 방법의 요점만 정리하면,

1) 선수들의 주 포지션을 기준으로 리그 통산성적을 분석해 본 결과 한 포지션의 평균적인 선수와 후보 선수의 차이는 포지션에 관계없이 일정한 경향을 보인다. 예컨대 지금까지 1루수들의 평균 성적은 .275 / .356 / .433이며, 후보 1루수들의 성적은 .229 / .302 / .325이다. 둘의 차이를 구하면 대략 .046 / .054 / .108. 한편 유격수들의 평균 성적과 후보 성적은 각각 .251 / .323 / .352, .209 / .270 / .275로써 그 차이는 .042 / .053 / .077이다.

2) 따라서 KBO의 VORP를 구할 때도 MLB와 마찬가지 방식으로 해당 포지션의 평균 선수들의 성적에서 일정한 수치를 뺌으로써 후보 선수들의 레벨을 결정할 수 있다. 통산 성적을 총체적으로 고려한 후보 선수의 수준은 다음과 같다.

(후보 선수의 타율 / 출루율 / 장타율) ≒ (그 포지션의 통산 타율 / 출루율 / 장타율) - (.040 / .050 / .085)

MLB에서는 평균적인 선수보다 OPS 70포인트 낮은 선수를 후보 선수, 그러니까 출혈이 적은 트레이드나 마이너에서의 콜업을 통해 수혈할 수 있는 선수로 가정합니다. 반면 이 자료를 토대로 하면 한국야구에서 후보 선수의 수준은 평균적인 선수보다 OPS 135포인트가 낮은 선수가 됩니다. 우리 리그의 크기가 작고, 선수층이 얇음을 대변하는 수치라고 할 수 있겠습니다.


선수들의 주 포지션을 바탕으로 한 우리 리그의 1982년~2008년 타격성적은 아래와 같습니다. "스태티즈"님께서 계산해 주셨습니다.


수비하기 어려운 순서(C - SS - 2B - CF - 3B - RF - LF - 1B - DH)와 어느 정도 매치됩니다.


저는 여기에 시즌별 투고타저 / 타고투저 경향을 고려했습니다. 1999년과 같은 엄청난 타고투저의 해에는 후보 선수들의 타격성적도 따라서 올라갈 것입니다. 이 문제는 구하고자 하는 시즌의 OPS를 리그 통산 OPS로 나눈 값을 계수로 활용함으로써 해소할 수 있습니다. 타고투저가 발생하면 후보들의 타격성적도 올라가고, 반대로 투고타저에는 후보들의 타격성적도 따라서 내려가는 메커니즘입니다. 이 방식을 활용하면 서로 다른 시즌의 선수들도 비교할 수 있을 것 같습니다.


따라서 제가 적용한 최종적인 포지션별 대체선수의 수준은 아래와 같습니다.


(후보 선수의 타율 / 출루율 / 장타율)
≒ (해당 시즌의 OPS ÷ 통산 OPS) × (그 포지션의 통산 타율 / 출루율 / 장타율) - (.040 / .050 / .085)



예) 리그 통산 3루수의 타격성적은 .262 / .336 / .395입니다. 이를 바탕으로 기록적인 타고투저의 해였던 1999년의 3루수 후보 선수의 수준을 계산하면 다음과 같습니다. 우선 1999년의 OPS(.793)를 통산 OPS(.723)으로 나누어 계수를 구합니다. 약 1.1정도가 나옵니다. 이 1.1을 .262 / .336 / .395에 곱하면 .288 / .370 / .435가 나옵니다. 여기에서 .040 / .050 / .085를 뺀 값, 즉 .248 / .320 / .350으로 OPS .670 가량을 기록한 선수가 1999년의 3루수 후보 선수 수준이라고 결론을 내릴 수 있습니다. 마찬가지 방법으로 1999년 포수 후보 선수의 수준을 구하면 .230 / .297 / .321이 나옵니다. OPS .618인 선수이군요.


2008년의 리그 OPS는 .724로, 통산 OPS인 .723과 거의 차이가 없습니다. 따라서 계수를 1로 놓고 후보 선수들의 수준을 산정해 보면 다음과 같습니다.

후보들의 수준이 확실히 떨어집니다.


이 선수들을 포지션별 후보 선수로 가정하고 VORP를 다시 계산해 봤더니, 어제 계산했던 VORP에서 볼 수 있었던 2루수와 3루수의 과대평가 현상, 좌익수와 우익수의 과소평가 현상이 어느 정도 해소되었습니다. VORP_1이 올해 시즌 성적만을 바탕으로 계산한 값이고, VORP_2가 지금 설명드린 방식을 이용한 값입니다.


VORP_1과 VORP_2, 어느 쪽에 더 고개가 끄덕여지시는지요?


역대 통산 후보 좌익수들의 기록이 1루수들보다 낮았음이 반영되었습니다. 1위가 김태균에서 김현수로 바뀌었군요. 포수 자리에서 좋은 타격을 보여 준 강민호의 수직상승도 눈에 띕니다. 이대호는 올 시즌 후보 선수들의 기록을 바탕으로 했을 때는 3위였지만, 통산 후보 3루수들과 비교했을 때는 순위가 다소 떨어집니다. 비교하기 편하시도록 각 선수의 타석 수(TPA)와 OPS도 첨가했습니다. 결론적으로 수비가 어려운 포지션에서 많은 타석에 들어가 훌륭한 OPS를 기록하면 VORP는 높아집니다. 이 쪽이 훨씬 그럴 듯하군요. MLB의 경향과도 비슷해 보입니다.


전체 순위가 첨부된 포지션별 top 5를 보시면 이 경향이 더 뚜렷합니다.


포지션별 TOP 5(ver 2.0).
우리 리그에 과거의 A-Rod나 Nomar 같은 대형 유격수가 없다는 것을 보여 줍니다.


즉, 새로 구한 VORP에 대하여 쉽게 말씀드리면 VORP의 본래 의미에 충실하도록 "후보 선수들의 공격력 수준이 낮은 포지션에서 잘 하는 선수들이 높은 평가를 받는, 리그 전체의 통산 기록이라는 넓은 표본을 바탕으로 조정된 주전 선수들의 해당 포지션 후보 선수 대비 가치"라고 할 수 있습니다.


의문나는 점이 있으시면 여쭤 주시면 감사하겠습니다. 아울러 지적이나 의견 제시도 환영합니다. :D


추신 : 위에서 계산한 후보 선수들로 이루어진 팀으로 풀 시즌을 뛰면 어느 정도의 승률을 올릴지 궁금해져서 간단히 계산해 봤습니다. 팀 투수들이 2008년 평균 투수들보다 1점씩 더 실점한다고 가정하면, 이 팀의 경기당 기대득점은 약 2.84점이고 기대실점은 약 5.49점입니다. 그래서 기대승률은 .263이 됩니다. 126경기 기준으로 33승 93패를 하는 팀이라는 뜻입니다. 1999년 쌍방울(.224)보다는 조금 낫고, 2002년 롯데(.265)와 비슷한 팀이 되네요.





※ 모든 기록은 ISTAT(http://www.istat.co.kr)과 Inning(http://www.inning.co.kr)의 도움을 받았습니다.


by Lucid | 2008/12/01 21:23 | Baseball | 트랙백 | 덧글(2)
트랙백 주소 : http://lucidian.egloos.com/tb/3999661
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
Commented by Anakin at 2008/12/01 22:45
아무래도 30개 팀을 상대로 한 VORP 공식을 8개 팀을 대상으로 그대로 적용시키면 매 해마다 Replacement Player의 레벨의 편차때문에 좀더 정확한 답을 찾기 힘들겠죠. 좋은 자료 ㅈ라 봤습니다.
Commented by Lucid at 2008/12/02 01:55
계속 생각하고 있지만, 역시 한 해의 성적만으로는 어렵겠지요. 최근 5년의 자료를 쓰는 것도 나쁘지는 않지만, 기왕 표본을 넓게 잡자는 생각에서 통산 성적을 고려했습니다. 읽어 주셔서 감사합니다.
※ 로그인 사용자만 덧글을 남길 수 있습니다.
<< 이전 다음 >>