UPDATED. 2021-03-07 11:34 (일)
2021.03.07(일)
  • 서울
  • B
  • 좋음
  • 경기
  • B
  • 보통
  • 인천
  • B
  • 좋음
  • 광주
  • B
  • 보통
  • 대전
  • B
  • 좋음
  • 대구
  • B
  • 좋음
  • 울산
  • B
  • 좋음
  • 부산
  • B
  • 좋음
  • 강원
  • B
  • 좋음
  • 충북
  • B
  • 좋음
  • 충남
  • B
  • 보통
  • 전북
  • B
  • 보통
  • 전남
  • B
  • 좋음
  • 경북
  • B
  • 좋음
  • 경남
  • B
  • 좋음
  • 제주
  • B
  • 보통
  • 세종
  • B
  • 좋음
평가 방법까지 바꾸다…‘몬테카를로법’ 도입으로 고도화되는 게임 공략 프로그램
평가 방법까지 바꾸다…‘몬테카를로법’ 도입으로 고도화되는 게임 공략 프로그램
  • 이희길 기자
  • 승인 2020.09.11 07:00
  • 댓글 0
이 기사를 공유합니다

인공지능과의 게임 [뉴스1]
인공지능과의 게임 [뉴스1]

지금까지는 게임을 할 때 각각의 말의 수나 위치 관계에 점수를 매겨서 반상을 평가하고 있다. 그러나 그 점수를 매기는 방법이 묘미라서 극단적인 이야기로 어떤 국면을 어떤 식으로 평가하는가에 따라 소프트웨어가 강하다는 것이 결정되고 있었다.

점수를 매기는 방법은 어디까지나 인간이 정하고 있었던 것이다.

그런데 몬테카를로법에서는 180도 발상을 바꿔 어떤 국면까지 오면 말의 수나 위치 관계에 의해 점수 매기기를 포기한다.

눈앞의 반상을 어떻게 평가할 것일지는 그곳에서 번갈아 가며 완전히 랜덤하게 계속 수를 두어 어쨌든 끝내게 되는 것이다.

그 다음에 둘 수가 10수 있다고 하면 10분의 1의 확률로 어딘가에 둔다. 상대도 다음에 놓을 수 있는 수가 10수 있다고 하면 10분의 1의 확률로 어딘가 둔다. 그것을 번갈아 되풀이해 가면 어차피 승부가 결정된다.

최초에는 자신이 이겼지만 다음은 상대가 승리하고 그 다음은 자신이라는 것을 예를 들어 100회 되풀이한다.

그 결과 60승 40패라면 스코어는 60점, 20승 80패라면 20점이라는 식으로 평가하는 것이다.

1초간에 몇 억 수를 읽는 컴퓨터라면 어떤 국면부터 랜덤하게 둬서 어느 쪽이 이길지를 시뮬레이션하는 것은 매우 쉬울 것이다.

그렇게 해서 세세하게 수의 의미를 생각하지 않고 한결같이 랜덤하게 계속 두어 가면서 그 승률에서 반상을 평가하는 것이 인간이 스코어를 매기는 방법을 생각하고 중요성을 부여해서 반상을 평가하는 것보다도 최종적으로 강해진다는 것을 알아 왔다.

아마추어의 판단에서도 자릿수 차이가 많아지면 전문가의 판단에서도 능가한다는 것이다.

이들의 새로운 수법이나 발견에 따라 게임을 공략하는 프로그램도 점점 고도화돼 때로는 인간의 능력을 넘어서고 있다.

그것은 몇 십년 전부터 변하지 않고 있다. 이러한 탐색의 방법은 인간의 사고 방법과 달라서 단순 무식한 방법이라고도 여겨진다.

탐색해야 할 해답의 공간은 변수의 차원에 따라 기하급수적으로 넓어지므로, 이 경우엔 단순무식한 방법이 통용되기 어려운 것이 보통이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.