작성자 | Lyric-ia | ||
---|---|---|---|
작성일 | 2013-01-17 14:32:25 KST | 조회 | 213 |
첨부 | |||
제목 |
(스압)재미로 보는 2012년 GSL 맵 승률 통계분석
|
저는 워3 사이트 때부터 XP의 폭파와 재건을 보며 눈팅만 해오던 늅늅입니다(?!)
제가 통계학 실험 레포트를 쓰면서 썼던 내용을 그대로 컨트롤 cv한 거구요
2012년 맵별 승률 분석 자료를 가지고 분석한 내용입니다.
패치라던가 당시의 경기 양상 등등의 요소를 고려하지 않은 1년 통계이므로 재미로 보는겁네다.
이 내용의 결론은 맨 아래에 쓸게요.
반말이 섞여서 작성 된 점은 죄송하게 생각합니다.
_-------------------------------------------------
첫번째 이미지는 2012년도 Global Starcraft2 League(GSL)에 40경기 이상 쓰인 맵의 경기수와 승률(%) 비교표.
(참조: 곰TV GSL 기록실 통계자료;
http://kr.gomtv.net/gsl/record/search.gom?submod=1010&m=3)
1. 그 아래 세 개의 이미지는 KESS를 이용한 기술통계 분석 결과이다.
정규확률그림의 유의확률에 따르면 세 확률분포 모두 정규성을 가정해도 좋은 것으로 드러났다.
이때, T vs Z의 데이터(첫번째 그림)는 정규분포에 비해 오른쪽으로 길고 평평한 모양을 가지며
Z vs P의 경우 왼쪽으로 길고 뾰족한 모양이고 특히 상자그림에 따르면 보통이상점을 두 개나 가졌다.
P vs T의 경우는 왼쪽으로 길고 뾰족한 모양이다.
분포의 모양을 볼 때 세 종족전 중에 가장 맵의 영향을 받는 종족전은 Z vs P로 드러났고
다른 둘은 맵의 영향이 비슷한 것으로 드러났다.
하지만, 두 이상점의 값을 제공한 자료를 제외한 표준 편차는 차례로 7.82, 7.27, 8.68로
오히려 Z vs P의 표준 편차가 제일 적었다.
즉, 맵이 극단적으로 제작되었을 때는 가장 영향이 크지만, 그렇지 않을 때는 가장 영향이 적은 종족전임이 드러났다.(
다만, 분산분석을 해봐야 정확한 이야기는 할 수 있겠지만, 세 분산에 유의미한 차이는 없을 것으로 예상된다. 즉 맵에 의한 밸런스 영향을 세 종족 모두 비슷하게 받는다고 할 수 있다.)
2. 이 데이터는 40전 미만의 경기 수를 가진 맵(통계 분석하기 힘든 변량) 외의 모든 데이터를 기록했다고 봐도 좋다. 즉, 전수조사라고 해도 무방하다. 때문에 모비율을 굳이 추정하지 않고 가중평균으로 계산된 항을 모비율 p로 생각할 수 있다.
그와 별개로 이제, 맵이 한쪽으로 극단적으로 좋게 만들어졌는지 아닌지를 판별하기 위해 모비율 검정을 실시한다. 유∙불리를 판별하려면 원래는 50%로 판별하는 것이 옳겠지만, 여기서는 모비율 p에 대한 검정을 실시한다. 게임의 밸런스가 원래부터 50:50이 아닐 수 있기 때문에 맵의 영향만을 고려하려면 p를 가지고 계산하는 것이 타당하다고 판단했기 때문이다.
유의수준을 10%로 생각하고 가설을 세운다(아래 계산은 KESS의 모비율검정을 통해 했고 Z-통계량을 직접 계산하지는 않았다. (KESS의 모비율 검정은 기본적으로 양측검정에 맞추어져 있음에 유의한다)
1)T vs Z의 경우.
Atlantis Spaceship, Metropolis, Dual Sight, Ohana에 대해 귀무가설 H0과 대립가설 H1에 대해
H0: p=0.4653, H1: p≠0.4653으로 놓고 검정
유의확률은 차례로 0.4095, 0.4112, 0.2254, 0.1151로 나타났다. 즉 유의수준 0.1에 모두 못 미치는 수준이므로 맵이 원래 상성 이상의 밸런스 붕괴를 일으켰다는 주장을 할 수 없다.
2)Z vs P의 경우
Cloud Kingdom, Metropolis, Dual Sight, Bel'Shir Vestige에 대해 검정
H0: p=0.4847, H1: p≠0.4847
유의확률은 차례로 0.0476, 0.2968, 0.0105, 0.046이었다.
벨시르 잔재의 경우는 표본의 크기가 작아서 속단하기 힘들지도 모르지만
구름왕국과 듀얼사이트는 유의수준 10%, 아니 5%에서도 맵의 유불리가 극명하다고 말할 충분한 근거가 있다.
3)P vs T의 경우
Dual Sight, Crossfire, Daybreak 에 대해 검정
H0: p= 0.4927, H1: p≠0.4927
유의확률은 0.1031, 0.1214, 0.0549였다.
십자포화의 경우 경기 수가 적어서 단정지을 수는 없지만,
유∙불리가 이 유의수준에서는 있다고 말 할 수 없고,
(하지만, 약간의 편향성이 있을 수 있다는 주장을 할 만한 유의확률이다.)
듀얼 사이트의 경우도 유∙불리가 이 유의수준에서는 단정할 수 없었다.
여명의 경우는 유의수준 10%에서 유리함을 이야기 할 수 있는 근거가 충분히 있다고 할 수 있었다.
3.실제로 이 세 종족간에 유∙불리, 즉 게임 밸런스에 오류가 있는가 판단하는 문제이다.
가중평균으로 구한 비율 p와 전체 맵 전적 합계를 통해 얻은 n을 통해
H0: p=0.5, H1: p≠0.5로 놓고 유의확률을 구한다.
T vs Z, Z vs P, P vs T의 순서대로 0.0996, 0.513, 0.7184였다.
T vs Z의 경우에는 밸런스에 약간 문제가 있는지 확인을 해 볼 필요가 있다는 주장에 유의수준 10%에서 충분한 근거가 있었다.(DK sigh)
이 통계가 1년간 이루어진 표본을 통해 조사된 것임을 볼 때
테저전 밸런스가 이 정도로 극명하게 갈린 것은 밸런스 담당자에 문제가 있다는 것을 알 수 있다.
(여기 중요)
결론-
1) 경기가 이루어지는 전장이 경기 양상, 승률 밸런스에 영향을 미치는 것을 알 수 있었다.
(당연한 이야기지만)
2) 경기 수가 그리 많지 않아 제대로 된 검정이 이루어지지 않은 경우도 있었지만,
밸런스가 극명히 갈리는 전장도 있었고 그렇지 않더라도 의심을 해 볼 수 있는 경우도 있었다.
프로게이머들이 전장을 선호하고 기피하고는 개개인에 따라 다를 수도 있지만,
맵의 유불리가 극명히 갈리는 전장이 투입되면 그 전장에 대한 돌파구가 발견되기 전에는
확실히 리그에서 각 종족의 분포가 확 차이가 날 수 있다는 점을 감안하면
이를 빨리 수정하거나 빼버리는 등의 조치가 필요할 수 있다.
(실제로 이런 조치가 일어나서 몇몇 전장은 데이터가 부족했다)
3)2012년에는 테란 대 저그의 밸런스가 맞지 않았다고 주장할 수 있었다.
_________
DK out
이거 시즌별로 계속 분석해보면 의외로 재밌을지도 모르겠네요.;;;;;;;;
© PlayXP Inc. All Rights Reserved.