작성자 | MrwK | ||
---|---|---|---|
작성일 | 2016-03-10 18:00:52 KST | 조회 | 468 |
제목 |
알파고의 방식에 대한 간단한 설명
|
알파고의 실력이 오르는 방식은 말 그대로 학습과 유사함.
기존의 대국들로부터 기본적인 전략을 만들고 이를 수행하는 컴퓨터들간의 상호 대국으로 실력의 상승,
즉 특정 상황에서 각각의 수에 따른 승률의 변화 데이터 축적이 일어나고 이를 통해서 결정을 내림
또 이 말은 인간이 기존에 만든 '정석'이라는 것에 구애받지 않는다는 의미이기도 함
기존의 바둑 프로그램이 이 상황에서 이런 수를 둔다면 몇 수 앞에서 집의 수가 이렇게 변화한다고 계산하며 두었다면
알파고는 이 상황에서 이런 수를 두었을 때 최종적으로 어떤 결과와 승률이 나왔는지 떠올리며 두기 때문에
무조건 승리로 다가갈 수밖에 없음
모든 경우의 수를 계산하면서 둔다는 것도 맞는 표현은 아니고,
(계산을 하는 것은 맞지만 '경험'에 의존하여 필요한 예측을 하고, 이를 통해 최종적인 승리에 얼마나 되는지 판단을 함)
그렇다고 인간처럼 몇 수 앞과 큰 그림을 사고하면서 두는 것도 아니고
"내가 몇천만판을 두어 봤는데 이 상황에서 이렇게 두면 승률이 몇 %가 나오더라" 하면서 두는 거라 생각하면 됨
마지막으로 덧붙이자면 알파고는 일반적으로 여겨지는 것보다 훨씬 빠르게 끝내기에 돌입하는 거 같음
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
© PlayXP Inc. All Rights Reserved.