ICT 레이더

알파고 이후의 세계

kusson 2017. 5. 30. 13:45
반응형
728x170

 지난 23일부터 27일까지 5일간 중국 저장성 우전 국제인터넷컨벤션센터에서 열린 '바둑의 미래 서밋'에서 알파고는 여러가지 대국 방식으로 인간과 바둑대결을 벌였다. 이번 대국에 참가한 알파고는 '알파고 마스터'버전으로 벌써 온라인에서 세계 정상급 기사들과의 대국에서 60전 전승을 거둬 그 실력을 인정받은바 있다. 이번 대국은 커제 9단과 알파고의 세차례 대국, 프로기사 5명이 팀을 꾸려 알파고와 겨루는 대국(상담기), 프로기사와 알파고가 짝을 이뤄 대국하는 페어경기 등 세가지 형식으로 대국이 벌어졌다. 알파고는 이중 페어경기에서만  인간에게 패했을 뿐 다른 모든 대결에서 인간에게 완승을 거두었다. 인간계 바둑 1인자인 커제9단은 2경기를 지고 마지막 3국 대결에서 제한시간이 1시간이나 남았는데도 불구하고 안경을 벗고 고개를 떨군채 한동안 눈물을 흘리는 등 지켜보는 사람들을 안타깝게 했다. 알파고는 이세돌과의 대결에서 1패를 한것을 유일한 패배로 남긴채 바둑계를 은퇴한다고 밝혀 바둑인들을 허탈하게 만들기도 했다.

 

 이제 알파고가 떠나간 이후의 바둑의 세계는어떻게 될까? 더 흥행할까 아니면 체스의 전철을 밟을까? 체스에서는 컴퓨터가 인간 최고수를 꺽은 이후 급격하게 인기가 시들었다고 한다. 내 생각에도 바둑 또한 그 전철을 밟지 않을까 염려가 된다. 인간 최고수 보다 바둑을 더 두는 컴퓨터가 있는데 구지 사람과 바둑을 두고자 할까?

 

인간계 바둑1인자 커제9단과 알파고 마스터의 대국이 성사되었다.                                사진 구글제공

 

 

알파고 마스터는 클라우드TPU를 탑재한 1개 머신을 통해 1년전 알파고에 비해 10분의 1의 컴퓨팅 파워만 소모한다.

클라우드TPU는 프로세서 모듈 1개에 연산성능 45테라플롭스(TFLOPS) 짜리 칩 4개를 얹어 180TFLOPS 성능을 낸다.

                                                                                                                           사진 구글제공

 

 커제와 알파고 마스터와의 1국이 끝난후 딥마인드 알파고팀을 총괄한 데이비드 실버 책임 개발자가 알파고에 사용된 컴퓨팅 파워를 공개해 머시러닝 개발자들을 놀라게 했다. "최신 버전 알파고는 지난 구글I/O에서 공개된 단일 TPU머신을 통해 작동하며 지난해 버전보다 컴퓨팅 파워를 10분의 1수준으로 쓰면서도 더 빨리 배운다." 라고 밝힌 것이다. 알파고 마스터는 1년여 만에 차세대 텐서프로세싱유닛(TPU)인 클라우드TPU를 활용해 수많은 데이터를 학습해 특정한 패턴을 찾아내는 머신러닝, 여러계층을 복잡하게 얹어 더욱 정교한 의사결정을 할 수 있게 도와주는 딥러닝등의 기술을 고도화 했다.

 

 데미스 하사비스 딥마인드 최고경영자(CEO)는 커제 9단과 알파고 마스터의 대결 이후 알파고의 성능 향상의 비결로 '강화학습(Reinforcement Learning)'을 언급했다.

 

기계를 학습시키는 방법인 머신러닝은 크게 지도학습, 비지도학습, 강화학습으로 구분된다. AI 기술문서에 따르면 지도학습은 입력된 데이터에 대한 판단 결과가 명확히 주어진 경우에 사용된다. 예를들어 아이들에게 그림카드를 보여주면서 사과, 자동차, 코끼리 등의 정보를 인식시키면 나중에 그 물건들을 봤을때 아이들이 그것들을 구분할 수 있게 되는 식이다.

 

 이와 달리 비지도학습은 입력된 데이터에 대한 판단 결과가 명확히 주어지지 않은 경우에 사용된다. 예를들어 어떤 마트에서 특정소비자가 물건을 구입하는 행태를 관측해 어느정도 데이터가 쌓이면 그 데이터를 활용해 그 사람의 소비특성, 선호하는 용품, 구입기간, 등등의 특정 패턴을 분류해 내는 것이다.

 

강화학습은 주어진 문제의 답이 명확하게 뭔지 떨어지지는 않지만 결과에 따라 보상과 손실이 주어질 경우 보상을 최대한 많이 받는 방법을 학습하는 방식이다. 예를 들어 바둑의 경우에 처음에는 인간과 바둑을 두면서 어디에 둘지 잘 몰라 헤매다가 여러번 대국을 거치면서 게임의 룰을 스스로 이해하고 조금씩 실력을 향상시켜 가는 것이다. 알파고 마스터는 자신보다 이전버전의 알파고와 수많은 셀프 대국를 펼치면서 실력을 더 높여 간 것으로 생각할 수 있다.

 

 이제 인간과 인공지능간의 바둑 대결은 끝났다. 데미스 하사비스 딥마인드 최고경영자(CEO)는 인간과 알파고와의 바둑대결은 끝났지만 알파고가 인간들에게 선물을 준다면서 그동안 알파고가 자체적으로 대국한 50개의 기보를 공개한다고 밝혔다. 그러면서 인간과 협업할 수 있는 AI를 만드는 것이 알파고의 최종 목표라는 점을 거듭 강조했다.

 

이날 현지에서 해설을 맡았던 김성룡 9단은 가장 인상적이었던 것은 복식전이었다""앞으로의 AI는 인간과 협력 관계 모델이 어떻게 제시되느냐에 따라서 사람들이 공포스러워할 수도 있고, 굉장히 필요한 친구로서 다가갈 수도 있다"고 말했다이번대국으로 인해 한 단계 성장한 AI에 대한 인간의 두려움, 좌절감을 느끼기도 했지만

인간-AI가 협업해 더 나은 세상을 만들 수 있다는 가능성과 그에 대한 희망도 동시에 느끼게 된다. 사람이 알파고의 기보를 공부하면서 인간 바둑의 실력이 조금은 향상 될 수는 있겠지만 인간이 인공지능을 능가할 수는 없을 것이다. 그러나 인간-AI가 협업해 만들어 나갈 미래를 생각하면 조금은 위안이 되고 그 미래가 기다려 지기도 한다.

 

이번에 새로나온 인공지능에 관련된 책 2권을 소개하면서 마무리한다.

 

 

 

 

 

반응형
그리드형