알파고의 성공을 보고 스타크래프트 얘기가 나오던데... 구글에서 별로 관심 없어보이긴 하지만 그건 차치하고...
스타가 바둑보다 쉬운 게임이지만 인공지능에게 배우기 쉬운 게임인가는 별개의 문제다.
한 화면에 등장할 수 있는 픽셀과 정보량의 경우의 수는 스타가 바둑보다 훨씬 많다. 사람의 경우 여기에서 단순 장식과 같은 불필요한 요소를 이미 알고 있고, 빌드오더 단위로 추상화를 시킬 수 있는 능력을 이미 가지고 있으므로 스타가 바둑보다 전략적 관점에서는 경우의 수가 적다는 것을 아는 것이다.
그러나 신경망 입장에서 현재 보이는 픽셀에서 무엇이 의미있는 정보이고 무엇을 무시해도 되는 정보인지를 구분하는 건 (학습이 완료되기 전에는) 결코 쉬운 일이 아니다. 그리고 스2는 현재 화면에 보이는 정보가 전부가 아니기 때문에 이전 상황으로부터 추론을 해내야 한다. 이는 단순 컨볼루션 네트워크로는 부족하고, 재귀 신경망을 쓰던지 해서 과거 프레임의 정보도 파악해야 한다는 것을 의미한다. 재귀 신경망을 계산하고 학습하려면 한번한번의 평가 자체도 계산량이 크게 늘어나고, 학습을 시키려면 필요한 데이터의 양도 뻥튀기된다. 그리고 신경망의 연산량이 늘면 MCTS 탐색에 사용할 컴퓨팅 파워가 줄어든다. 게다가 실시간 게임이어서 계산의 제한시간은 훨씬 짧은 것이다.
바둑이야 기보를 통해 손쉽게 초기 학습이 가능했지만 스타의 경우 리플레이를 활용한다 하더라도 쓸만한 수준의 초기학습이 가능할지 의문이다. 즉, 신경망 입장에서는 바둑보다 스타를 배우는 것이 더 어렵다.
요컨대 알파고처럼 전 과정을 신경망 하나가 담당하는 형태로 구현하기는 바둑보다 스타가 어렵다.
뭐 불가능한 건 아니겠지만 얼마나 오랜 시간이 필요할지 모른다.
그리고 스타는, 인공지능이 구현되더라도 피지컬 능력을 인간 수준으로 제한한다면 프로게이머가 매번 무력하게 패배만 하지는 않을 것이다.
이는 스타가 불확실성이 큰 게임이어서 실력이 좋은 선수가 항상 이길 수 있는 종목이 아니기 때문이다. 정찰되지 않은 정보에 대해서는 추측을 통해 대처할 수밖에 없고, 이 경우 최선의 수는 결정적이지 않다. 대부분유 경우에 정답인 선택지가 상대의 응수에 따라 최악의 선택이 될 수도 있는 것이다.
제 아무리 뛰어난 인공지능이라도 치팅 없이 순수하게 게임에 대한 정보만 가지고는 가위바위보나 하스스톤에서 매우 압도적 우위를 가지지는 못한다.
스타는 바둑과 가위바위보 사이의 중간에 있으므로 승률 분포 또한 그럴 것으로 예상할 수 있다.