작성자 | ftyyhtd | ||
---|---|---|---|
작성일 | 2018-11-01 22:36:59 KST | 조회 | 1,177 |
첨부 |
|
||
제목 |
딥마인드가 3일뒤 블리즈컨에서 알파고 스타를 공개하려는것 같습니다
|
1.블리즈컨 마지막날 4일 스2 일정 보면 결승전치루고 2시간이나 공백시간이 남습니다
상식적으로 알파고랑 게임하는것 말고 저시간이나 스타2에 쓸 떡밥이 없죠
1년전에 도타2 결승전하고 나서 스페셜매치한다고 뜬금없이 컴퓨터 한대 등장시키더니 인간챔피언이랑 1대1 게임을 했는데
오픈AI에서 만든 도타2 알파고가 인간 챔피언을 이긴적도 있었죠
아마 그때처럼 알파스타를 공개하려는것 같습니다
2.몇달전에 딥마인드가 스타2 논문을 새로 냈습니다
https://deepmind.com/research/publications/relational-deep-reinforcement-learning/
우리는 깊은 강화 학습(RL)의 효율성,generalization 능력, 관습적인 방법의 구조적 인식을 통해 영상 해석 능력을 계승하여 발전한 접근 방식을 소개합니다.그리고 관계 추리 그것은 주체 사이에 장면에서의 관계에 대해 반복적으로 이유와model-free 정책을 가이드에 self-attention을 사용한다. 우리의 결과는 소설을 항해 및 계획 작업 Box-World에 우리의 대행사 샘플 복잡성의 관점에서, 능력에 베이스 라인 정도로 상태가 좋아지는 스타일 해석할 수 있는 해결책을 찾는 것으로 나타났다.더 복잡한 장면보다 훈련 및 전체적인 공연 중에 경험된 것을 일반화하다. 는 스타 크래프트 II학습 환경에서 우리 요원 6놀이에--4에 인간 그랜드 마스터 성능 뛰어넘는 첨단 기능을 수행한다. 구조적 귀납적 편견을 고려하고, 우리의 중요한 일을 극복하기 위한이지만, RL에 stubborn, 도전 새로운 방향을 연다.
|
||
|
|
||
|
|
||
|
|
||
|
|
||
|
© PlayXP Inc. All Rights Reserved.