타점 : 기회인가? 장타력인가? 운인가? "클러치"인가?


타점(RBI ; Runs Batted In)은 전통적인 관점에서 타자의 팀 내 공헌도를 측정하는 데에 큰 비중을 차지하는 누적 stat입니다. 작년인가에는 Big Leaguer들이 뽑은 "타자에게 가장 중요한 지표"로 꼽히기도 했지요. 타자 개인의 관점에서 보면, 주자가 나가 있을 때 팀의 득점을 위해서 자신이 할 수 있는 최선의 선택이 타점을 올리는 길이니 대체로 맞는 말이라고 할 수 있습니다.


그렇지만 타점을 우수한 타자를 측정하는 데 일반적인 평가지표로 쓰면 이야기가 조금 달라집니다. 자주 얘기하듯이 타점은 맥락의존적인 stat이기 때문입니다. 똑같이 .300 / .400 / .550을 기록하는 4번 타자라도 .400의 출루율을 넘기는 1, 2, 3번 타자와 같은 팀에서 뛰는 선수와 그렇지 못한 팀에서 뛰는 선수의 타점 차이는 존재할 수밖에 없습니다. 또한 예전 이종범처럼 팀 내에서 가장 훌륭한 타자이지만 1번을 주로 맡았던 선수라면, 3번이나 4번 타자의 자리에서 올릴 수 있는 타점과 비교했을 때 상대적으로 적은 타점을 기록하게 됩니다.


그러나 타점을 완전히 맥락 의존적인 성적으로 바라보는 데에도 문제는 있습니다. 아무리 앞 타자들이 출루를 자주 해도 타자 본인의 타격 능력이 낮다면, 차려 준 밥상을 맛있게 먹어 주지 못하기 때문입니다. 따라서 비록 타점을 올리는 상황만큼의 영향력은 아닐지라도, 타점은 타자의 타격 능력과도 어느 정도의 관계는 있습니다. 특히 타점은 타자의 능력 가운데서도 장타력(ISO)과 밀접한 관계가 있다고 해야겠습니다. 장타를 자주 날리는 타자는 득점권 상황이 아닌 경우에도 많은 주자를 홈으로 불러들일 수 있고, 특히 홈런은 주자가 아무도 없어도 최소한 타점 1을 기록할 수 있는 중요한 장타이지요.


그래서 숫자로 야구를 보는 미국 애들은 RBI Machine이 탄생하는 세 가지 중요 요소로 다음과 같은 것들을 꼽습니다.

1) 장타를 자주 날리는 강타자일 것. 특히 홈런타자는 최소한 홈런 개수만큼의 타점을 먹고 들어감.
2) 팀의 중심타선(3~5번)에 배치되어 있을 것. 타점을 올릴 수 있는 상황을 마주칠 가능성이 가장 높음.
3) 팀 동료타자들, 특히 자신의 바로 앞에 있는 2~3명의 타자의 출루율이 높을 것. 항상 장타만 칠 수는 없으니까.

1)과 2)를 만족하더라도 3)이 만족되지 않고, 자신의 뒤 타자가 자신에 비해 명확히 수준이 떨어지는 타자일 경우 가공할 타격 능력을 가지고 있어도 타점을 올리지 못하는 경우가 많습니다. 대표적인 예가 2004년의 Barry Bonds입니다. 1.422라는 가공할 OPS를 남겼지만, 타점은 고작(?) 101점으로 NL 17위에 그쳤지요.


2008년 한국야구를 대상으로 이와 관련된 몇 가지를 조사해 봤습니다. 먼저 타점 랭킹 1~10위입니다.


2008 RBI Machine Top 10.


그렇지만 이 선수들이 기회를 많이 만나서 많은 타점을 올렸는가, 아니면 기회보다는 능력의 요소가 더 중요했는가를 알아보려면 다른 것들도 살펴봐야겠지요. 득점권 타석(TPA_RISP) 1위부터 10위도 뽑아 봤습니다. 200타석 이상 들어선 80명의 타자가 대상입니다.


타점을 올릴 기회를 많이 잡았던 선수들이죠.


타점 랭킹 1~10위에서 볼 수 있었던 선수들이 분명 적지 않습니다만, 그 순위는 많이 뒤바뀌었군요. 한화의 4인방은 모두 사라졌고, 그 자리를 고영민, 홍성흔, 정근우, 박석민이 메우고 있습니다. 그렇다면 한화의 네 선수가 높은 타점을 기록할 수 있었던 비결은 무엇일까요? 이 문제를 알아보기 위해 타자의 순수한 장타력을 측정하는 누적 stat인 장타로 얻은 베이스 개수(XB)를 조사했습니다. 선수의 총 루타수에서 단타의 개수를 빼면 됩니다.


타자라면, 힘!


한화의 4인방이 다시 눈에 띕니다. 타점 10위 랭킹 안에는 보이지 않았던 박재홍, 최형우도 있군요. 부연하자면, 9번째로 많은 타점 기회를 부여받았던 박석민의 XB는 이대호에 이은 11위입니다(113). 그런데 타점 기회 9위에 XB 11위의 성적인데도 타점은 64점으로 14위에 그쳤습니다. 반대로 김동주는 많은 타점 기회를 얻긴 했지만, XB에서는 박석민 - 조성환에 이어 전체 13위(102)였습니다. 그럼에도 불구하고 타점은 100점을 넘겼습니다. 이것을 어떻게 설명할 수 있을까요?


이 문제를 알아보기 위해, 타점을 올릴 기회와 장타력이라는 두 가지 요소를 바탕으로 하여 득점권 타석과 XB라는 두 가지 숫자가 주어졌을 때 그 타자에게 평균적으로 기대할 수 있는 타점을 계산하는 방법을 생각해 봤습니다. 득점권 타석 및 XB를 두 개의 독립변수(x_1, x_2)로 놓고, 타점을 종속변수(y)로 가정하여 80명의 성적을 바탕으로 다중회귀분석을 돌린 결과 머리가 많이 아팠지만 대략 다음과 같은 결과를 얻을 수 있었습니다.


RBIexp = 0.30 × TPA_RISP + 0.37 × XB - 12.47

TPA_RISP : 득점권 타석 수, XB : 장타로 얻은 베이스 개수
RBIexp : 득점권 타석 수와 장타력을 바탕으로 한, 평균적으로 기대할 수 있는 타점.
따라서 특정한 타자의 운, 혹은 "클러치" 요소 배제.


ex) 올해 타점 1위인 가르시아의 득점권 타석은 160타석이고, 장타로 얻은 베이스는 176개입니다. 이 때 운 또는 "클러치"의 요소를 배제하고 가르시아와 같은 개수의 득점권 타석과 XB를 가진 선수에게 기대할 수 있는 타점은 대략 (0.30 × 160) + (0.37 × 176) - 12.47 ≒ 100.65점이 됩니다. 타점에는 소수 이하가 없으니까, 반올림하면 약 101점. 가르시아의 실제 타점은 111점입니다. 10점이 더 많군요.


이렇게 해서 구한 기대 타점과 실제 타점의 차이는 어떤 의미를 가질까요? 크게 보아 대략 두 가지 정도로 나눌 수 있습니다. 1) 운빨 2) (그런 것이 있다면) "클러치" 능력. 모든 선수들의 결과를 구하지 않고서는 쉽게 결론을 내리기 어려웠습니다. 그래서 기대 타점에 비해 실제 더 많은 타점을 올린 10명의 선수를 꼽아 봤습니다.


+24는 대체 뭐냐?


1위를 차지한 김동주가 정말 대단합니다. 기대 타점에 비해 무려 24점이나 더 많은 타점을 실제로 올렸군요. 참고로 위 회귀식의 표준오차(SE)는 약 5.71입니다. 이 말은 (정규분포를 가정하면) 김동주와 동일한 성적을 보이면서, 일반적인 운 또는 "클러치" 능력을 가진 타자가 김동주처럼 기대 타점에 비해 24점이나 더 많은 타점을 올릴 확률은 0.5% 이하라는 뜻입니다. 김동주는 정말 클러치 능력을 가지고 있었던 걸까요? 그렇다면 이성열은? 그것보다는 적지만 80명의 타자 중 10위 안에 들어간 채태인, 차일목, 박현승, 김선빈 등은 어떻게 생각해야 할까요?


기대 타점에 비해 실제로 더 적은 타점을 올리는 데 그친 선수 10명의 결과도 공개합니다.


안습의 박석민.


많은 기회와 좋은 장타력을 가지고도 허접한 타점을 올렸던 박석민의 실체가 드러났습니다. 김동주와 동일한 논리로 설명하자면, 박석민과 같은 성적을 보이는 일반적인 운 또는 "클러치" 능력을 가진 타자가 박석민처럼 기대 타점에 비해 11점이나 더 적은 타점을 올릴 확률은 2.5% 이하입니다. 박석민이 지독히 운이 없었거나, 아니면 득점권 상황에서 엄청난 압박을 받는 선수였거나 둘 중 하나겠죠. 그렇다 해도 왠지 이 쪽에 믿음이 가는 타자들이 많은 듯하군요(10위권 밖이라 잘렸지만, 최정, 장성호, 김태균, 박재홍이 이 바로 밑입니다). 여러분이 KIA 감독이라면, 한 점만 올리면 끝내기 승리를 거둘 수 있는 찬스에서 차일목을 대타로 쓰시겠습니까? 아니면 대타로 남아 있을 가능성도 없지만, 만일 있다면, 이용규를 쓰시겠습니까?


마지막으로 글 서두에 언급한 타점 1~10위 선수들의 기대 타점과 실제 타점, 오차 정도를 소개해 드리면서 글을 마치겠습니다. 조언이나 비판, 의견을 제시하는 답글을 환영합니다. :D


운은 좋을 수도 있고 나쁠 수도 있지요. 그래도 +24는 역시 좀.




추신 : 글 중간부분에 언급한 회귀식의 통계량을 몇 개 말씀드리면 다음과 같습니다.

상관계수 : 0.97 (R-square : 0.94), 표준오차 : 5.71
TPA_RISP의 t 통계량 : 10.91, XB의 t 통계량 : 15.24

플러스 마이너스 4점 정도까지는 오차범위 내로 볼 수 있고, 득점권 타석 수 및 장타로 얻은 베이스 개수와 타점이라는 결과물 사이에 성립되는 관계가 우연일 확률은 굉장히 낮다는 뜻입니다.



※ 모든 기록은 ISTAT(http://www.istat.co.kr)의 도움을 받았습니다.


by Lucid | 2008/12/02 16:15 | Baseball | 트랙백 | 덧글(6)
트랙백 주소 : http://lucidian.egloos.com/tb/4000616
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
Commented by 이세리나 at 2008/12/02 16:24
득점권 타석을 보니 역시 두산과 롯데의 테이블세터진이 튼튼하긴 한가봅니다.
그리고 한화는 밑바닥..ㅜㅜㅜㅜㅜ
한화 테이블세터진이 조금만 더 잘해줬으면 괜찮았을텐데..

그리고 실제보다 적은 타점을 올린 선수들 수치가 좀 이상한거 같은데요? ' '; 기대랑 실제랑 바뀐거 같은데..
Commented by Lucid at 2008/12/02 16:27
실제 RBI와 기대 RBI의 자리를 바꿔 기입했습니다. 죄송합니다. 학교 다닐 때부터 잔실수가 많아서 :D 한화는 장타력으로 커버하니까요. 진짜 눈물나는 건 삼성이죠.
Commented by 이세리나 at 2008/12/02 18:25
확실히 한화는 테이블세터진만 안습하지만 삼성은 다 안습하니까 그쪽이 더 그렇긴하네요-_-;;
Commented by 흑곰 at 2008/12/02 16:26
차일목, 이재주, 김선빈, 흑흑 ㅠㅠ....
Commented by Lucid at 2008/12/02 20:36
제가 응원하는 팀 선수들은 두 명 빼놓고 아예 이름도 없답니다.
Commented by 호앵 at 2008/12/02 20:57
Lucid 님의 stat attack은 언제나 재미있게 보고 있어용 ^^;

그런데 보고 나면 결론은 언제나... "삼성은 어떻게 4위 한거지 -_-;"
※ 로그인 사용자만 덧글을 남길 수 있습니다.
<< 이전 다음 >>