네이버에 들어갔다가
재미있는 기사를 읽었다. 스포츠 섹션 표제기사이던데...
쳤다하면 넘어간다. 팀당 7경기를 치른 11일 현재 총 홈런수는 66개다. 경기당 2.36개가 터졌다. 10, 11일 이틀 동안만 무려 30개가 넘어갔다. 마운드가 '우르르' 무너지는 소리가 들린다.
지난해와 비교해보자. 이맘 때 총 36개의 홈런이 나왔다. 평균 팀타율 2할5푼에 방어율은 3.81. 올해는 평균 팀타율 2할7푼1리, 방어율 4.46이다.
홈런으로 대변되는 확연한 '타고투저'다.보통 시즌 초반에는 투수가 강세를 보인다고 한다. 아직 투수의 스피드에 타자들의 방망이가 못 따라가는 시기다. 하지만 올해는 반대다.
왜? 이유가 많다. 우선
작아진 잠실구장이 한몫을 한다. LG는 홈경기 때 중앙 펜스를 4m 당긴다. 이른바 'X-존'의 탄생이다. 그 결과 올해 잠실에서 15개의 홈런이 터졌다. 지난해 이맘 때에는 9개가 나왔다. 확실히 펜스 효과가 있다.
"마운드 뭇매 2009시즌 초반, 홈런 대박 왜?", <스포츠조선>, 2009년 4월 12일 10:13 기사입력
결론부터 말하면 이것은
잘못된 통계를 가지고 작성한 한심한 기사다. 그것도 잘못된 통계의 전형적인 사례를 아주 잘 보여 주고 있다. 잘못된 야구통계란 아래와 같은 속성을 가지는 분석을 말한다.
1. 작은 표본을 가지고 일반적인 분석을 하려고 시도한다.
2. 그 작은 표본에서 나온 결과를 더 큰 대상에 적용하려 한다.
3. 세세한 측면detail에서 오류와 한계가 있음에도 불구하고 이를 명백히 밝히지 않는다.
1회 시행의 우연성이나 심하게 작은 표본 크기 따위는 전혀 고려하지 않고 이틀간의 경기에서 나온 홈런의 개수만 놓고 마운드가 무너진다느니 하는 표현을 쓴 것은 넘어가고, 이 기사의 핵심인
<시즌 초반 홈런이 많다>와 암묵적인 주장인
<올해는 시원한 타고투저의 해가 될 것>이 도대체 어떤 관계가 있는지 검토해 보면 다음과 같다.
초등학교 3학년 때 공부 잘 한다고 수능 잘 보냐?
물론 첫 7경기도 전체 시즌의 일부이므로 전체 홈런개수에 영향을 미칠 가능성이 있다. 그러나 그보다는 그 다음 7경기에서 그전까지의 평균보다도 홈런이 덜 나올 가능성, 이른바
평균으로의 회귀regression to the mean 확률이 훨씬 높다. 4월 전체 표본도 아니고, 500경기가 넘어가는 전체 시즌경기 중 고작 첫 28경기에서 홈런이 평소보다 꽤 많이 나온 것을 놓고 원인분석 운운하는 자체가 잘못된 것이다.
일단 상식을 벗어난 일이 일어났을 때(특히 야구와 같은 반복시행 게임에서) 가장 먼저 검토해야 하는 가능성은
우연이며, 뭔가 문제가 있다고 판단될 때는
과거의 사례에서 실마리를 찾아야 한다. 표에서 알 수 있듯이 첫 28경기에서 가장 많은 홈런이 나왔던 시즌은 2005년이었다. 전체 시즌의 경기당 홈런도 0.87개로 비교적 많은 것처럼 보인다.
이러한 가설은 그 이후 시즌의 기록을 보면 바로 무너진다. 2006년의 최초 28경기 홈런은 40개로
2007년과 2008년 시즌보다 많았다. 그러나 잘 알다시피
2006년은 1993년 이후 가장 투고타저가 심한 시즌이었고, 경기당 득점과 홈런 개수도 바닥을 친 해였다. 2007년의 첫 28경기에서 나온 홈런은 27개로
최근 5년간 가장 적었지만, 시즌 전체의 경기당 홈런은 0.7개로
그 앞뒤의 해보다 오히려 더 많았다.결국
시즌 초반의 많은 홈런과 그 시즌 전체의 많은 평균홈런/높은 평균득점과는 큰 관계가 없다. 한 마디로 그냥 시즌 초반에
어쩌다가 홈런이 많이 나왔을 가능성이 높다는 뜻이다. 특히 4월 10일과 11일의 경기결과를 놓고 이러쿵저러쿵하는 것은 이 기사의 백미白眉다. 그냥
4월 10일 잠실경기가 특이했던 거라는 생각은 안 들어? 물론 이렇게 사실을 말해 주면 별다른 기사거리도 아니니까, 스포츠신문에서는 특이한 것만 부풀리고 마음대로 통계를 해석해서 야구장으로 많은 사람들을 모으려는 수고를 마다하지 않을지도 모르지만서도.
또한 이 기사에서는 시즌 초반 홈런이 많은 여러 가지 원인을 제시하고 있다. 그러나 소위 그 원인 내지는 가능성이란 것들은 모두 설득력이 그리 강하지 않다. 애초에 별다른 원인이 없을 현상을 억지로 설명하려니까 설명력이 더 떨어지는 것이다. 우선
<보통 시즌 초반에는 투수가 강세를 보인다>는, 마치 정형화된 야구 이론을 이야기하는 양 서술되어 있는 명제를 검토해 보자. 최초 7경기는 너무 적은 표본이므로 4월 경기를 대상으로 하면 다음과 같은 결과를 얻을 수 있다.
딱 봐도 투수가 그리 유리해 보이지는 않는데.
4월의 경기당 득점/홈런과 전체 시즌의 경기당 득점/홈런은 별다른 경향을 잡아낼 수 없을 만큼 왔다갔다하고 있다. 어떤 해는 전체 시즌에 비해 4월에 더 많은 득점/홈런이 나오고, 어떤 해는 그렇지 않다. 특히 경기당 홈런의 경우 2007년을 제외하고는 아주 작은 오차만을 보인다. 어디에서도 시즌 초반에 투수들이 강하다는 증거는 찾을 수 없다. 2005년과 2008년의 자료가 있으니 2006년과 2007년의 경기당 득점을 가지고 4월이 투수에게 더 유리하다는 주장을 펼 수도 없는 노릇이다. 한 마디로
시즌 초반에 투수들이 강하다는 것은 헛소리다.
물론 이런 반박도 가능하다: 잠실구장의 X-zone과 목동구장의 위력을 보지 않았는가, 앞으로도 그곳에서는 홈런이 예전보다 더 많이 나오지 않겠는가? 정말 그럴까?
그럴 수도 있고 그렇지 않을 수도 있다. 비겁한 박쥐 같은 말이지만 현재로서 할 수 있는 말은 이것밖에 없다. 왜냐하면 목동과 잠실의 올 시즌 몇 경기를 가지고 홈런팩터를 설명하기에는 표본의 크기가 너무 딸리기 때문이다. 이것은 말할 나위가 없다. 기자는 이런 기사를 쓸 수 있도록 홈런을 쳐 준 페타지니와 브룸바에게 감사해야 할 것이다.
목동 제트기류나 X-zone보다는 페타지니와 브룸바의 덕을 많이 본 것 같은데.
그런데 2007년 겨울에도 잠실구장에 간이펜스 설치했나요?
기사 뒤쪽에 나오는
"에이스를 빼고는 믿을 만한 선발이 없다" "홈런 증가에 대한 책임을 실책도 면할 수 없다" 운운은 굳이 자료를 제시하면서 반박할 가치도 없는 주장이다. 이런 기사를 쓰고 있을 바에는 그냥 선수나 감독 인터뷰라도 하나 더 따서 현장의 목소리를 팬들에게 정확히 전달해 주는 편이 나을 것이다. 한국야구의 흥행을 돕고 싶으면 스포츠신문끼리 연합해서 이벤트라도 하든가. 한국야구 팬들의 수준은 이런 기사를 무비판적으로 받아들일 만큼 낮지 않다.
※ 모든 자료는 ISTAT(http://www.istat.co.kr)의 도움을 받았습니다.