2024년 10월 2일, 피터 브라운의 동화 <와일드 로봇>을 원작으로 한 애니메이션이 국내에 개봉했다. 왜 삼성전자 반도체 뉴스룸에서 갑자기 동화 원작의 애니메이션 이야기를 꺼내고 있는 것일까? 영화의 유려한 스토리에 감동한 것도 있지만, 그보다 더 중요한 이유가 있다. <와일드 로봇>이 현재 인공지능 분야에서 중요한 화두로 떠오르고 있는 ‘자율형 인공지능 에이전트’의 개념을 탐구하는 데 있어 그 어떤 공상과학 영화보다 훨씬 훌륭한 이야기 구조를 가지고 있기 때문이다. 따라서 이 자리를 빌려 영화의 이야기를 따라가며, 자율형 인공지능 에이전트에 관해 이야기해 보고자 한다.
*영화를 빌어 해당 주제를 설명하는 만큼 약간의 스포일러를 피할 수 없으니 민감한 독자라면 <와일드 로봇>을 먼저 시청한 후 이 글을 읽기를 권장한다.
.
휴머노이드 로봇, Rozzum 7134의 정체
Bonjour. Guten tag. Hujambo. Hola. 유니버설 다이내믹스 로봇을 구매해 주셔서 감사합니다. 저는 Rozzum 7134입니다. Rozzum은 언제나 임무를 완수합니다. 말씀만 하세요!
– Rozzum 7134 –
영화는 사고로 무인도에 도착한 휴머노이드 로봇, ‘Rozzum 7134 (이하 7134)’가 깨어나면서 시작된다. 일어나자마자 거대한 파도에 휩쓸릴 위험에 처한 7134는 옆걸음으로 바위 위로 도망가는 게의 모습을 본 뒤, 즉시 그 움직임을 모방해 위기에서 벗어난다. 숲에 도착한 7134는 동물들에게 식료품 구매, 은행 업무, 마당 조경 등을 할 수 있다고 홍보하며, 10% 할인 쿠폰을 마구 뿌린다. 이와 더불어 “로줌은 즉각적인 물리적 모방을 할 수 있도록 프로그램되어 있습니다.”라고 말하며 사슴처럼 뛰어다니기도 한다.
휴머노이드가 동물들에게 말을 걸고, 사슴처럼 점프하며, 그들에게는 전혀 쓸모없는 서비스를 제안하는 영화의 첫 장면은 관람객에게 기괴함과 섬뜩함을 안겨준다. 영화 속 동물만큼이나 우리 역시 이 로봇이 너무나 생소하게 느껴지는 셈이다. 다행히 7134는 “당신의 언어는 제 데이터베이스에 없습니다.”라고 말하며 동물들과의 불통 원인을 파악한다. 7134에게는 데이터베이스에 어떤 언어가 존재하지 않아도 문제가 없다. Rozzum 7134는 놀라운 속도로 언어 장벽을 해결할 수 있기 때문이다. 7134는 가만히 앉아 학습 모드에 돌입하고, 마침내 동물의 언어를 이해하게 된다. 여기까지가 영화 <와일드 로봇>의 정신없는 도입부다.
5분에서 10분 내외의 짧은 도입부에서, 우리는 놀랍게도 ‘자율형 인공지능 에이전트’가 갖춰야 할 필수 요건 대부분을 발견할 수 있다. 첫 번째는 목표 지향성이다. 동물과의 대화 시도를 통해 (비록 실패하지만) 7134는 소비자가 필요로 하는 것을 묻고, 임무를 즉시 수행할 수 있는 능력을 갖추고 있음을 알 수 있다. 그 임무가 장보기와 조경과 같은 사소한 일일지라도, 휴머노이드 로봇 개발의 주요 목적 중 하나가 이러한 업무를 위임하기 위함이라는 점을 엿볼 수 있다. 두 번째 요건은 학습과 모방이다. 7134는 소비자의 언어와 행동 패턴을 인식함으로써 주어진 목표 수행 과정에서 발생하는 난관을 능동적으로 해결할 방안을 찾아낸다.
10은 가장 만족스럽고 1은 가장 만족스럽지 못하다면, 제 수행능력에 1부터 10까지의 점수 중 몇 점을 주시겠어요?
– Rozzum 7134 –
심지어 7134는 사용자의 피드백을 받는 모습도 보여준다. 숲에서 방황하던 7134는 우연히 한 거위알을 발견하고, 이를 여우(FINK)로부터 안전하게 보관하여 부화시킨다. 7134는 부화한 거위 새끼에게 묻는다. “10은 가장 만족스럽고 1은 가장 만족스럽지 못하다면, 제 수행 능력에 1부터 10까지의 점수 중 몇 점을 주시겠어요?” 이에 거위 새끼는 “삐약”이라고 답하고, 7134는 이를 10점으로 간주한다.
이러한 행위는 매우 중요한데, 머신 러닝의 한 분야인 강화 학습에서 정량적 평가가 핵심적인 동력 중 하나이기 때문이다. 강화 학습은 자신의 행위를 평가받으며, 가장 높은 점수를 받는 방향으로 자신의 알고리즘을 수행해 나간다. 7134는 피드백을 통해 스스로 업무를 평가하고, 알고리즘을 수정해 나가는 능력을 갖추고 있는 것으로 보인다. 이 이야기를 통해 7134는 우리가 ‘에이전트’에 기대하는 바람직한 특성, 즉 인위적 지도 없이 ‘자율적’으로 목표를 수행하는 ‘인공지능’의 특징을 보임을 알 수 있다. 7134는 자율형 인공지능 에이전트 그 자체다.
.
자율형 인공지능 에이전트의 현주소
다시 한번 유니버설 다이내믹스의 로봇 ‘Rozzum 7134’에서 보여지는 자율형 인공지능 에이전트의 특징을 정리하면 아래와 같다.
1. 목표 지향 필요한 것이 있는지 지속적으로 묻고, 목표에 도달하거나 문제를 해결할 방법을 자율적이고 창의적으로 추론한 뒤, 이를 계획하고 실행한다. 2. 학습과 모방 사전 학습되지 않은 동물의 언어를 습득하고 이해한다. 게와 사슴과 같은 동물의 이동 행태를 모방한다. 학습과 모방은 목표 달성을 위한 창의적 문제 해결에 필요한 능력이다. 3. 피드백 자신의 행동에 점수를 매겨달라고 요청한다. 특정 목표를 얼마나 잘 수행했는지를 정량적으로 평가하는 행위는 강화 학습의 필수 요소이다. |
.
이러한 요소들을 실제로 구현하는 데, 우리는 어디까지 왔을까? 많은 사람들이 현재 가장 발전한 인공지능 서비스로 꼽는 챗GPT는 사실 인공지능 에이전트의 프로토타입에 가깝다. 현재 챗GPT가 제공하는 모든 버전은 대화형 챗봇으로, 목표를 ‘자율적으로 추론하고 실행‘한다고 보기는 어렵다. 예를 들어, 12월 뉴욕 여행을 계획하고 있다고 가정해 보자. 우리는 크리스마스 시즌 동안 뉴욕에서 열리는 유명 이벤트들에 대해 챗GPT에게 물어볼 수는 있지만, 챗GPT가 그 이벤트들을 모두 정리하여 스스로 티켓을 예약하고 비행기표까지 구매해 주지는 않는다.
사실 우리가 인공지능에 궁극적으로 바라는 것은 대화 한 번에 이 모든 것들을 알아서 수행하는 개인화된 비서, 즉 ’에이전트‘가 아닐까? 이러한 인식 때문인지 2024년부터 자율적으로 작업을 수행하는 인공지능 에이전트를 개발하는 기업들이 많아지고 있으며, 투자금 역시 에이전트 개발에 몰리고 있다. OpenAI 역시 챗GPT를 에이전트화 하겠다는 계획을 갖고 있다. 현재로서는 영화 속 7134처럼 다양한 목표를 수행하는 범용 에이전트는 존재하지 않는다. 또한 현재의 인공지능이 진정으로 추론하고 있는가에 관해서도 논쟁이 일어나고 있다.
이제 학습과 모방에 대해 이야기해 보자. 머신 러닝을 이용한 학습과 모방의 분야에서는 많은 혁신이 있어 왔다. 머신 러닝의 가장 중요한 돌파구는 인공신경망과 역전파 학습이었으며, 이를 연구한 제프리 힌턴과 존 홉필드가 그 공로를 각각 인정받아 2024년 노벨 물리학상을 수상하게 되었다. 영화 속 7134가 보여준 동물 언어 학습도 머신 러닝을 이용한다면 더 이상 꿈이 아닐지도 모른다. 2024년 8월 29일 ‘사이언스’에 게재된 한 논문에 따르면, ‘마모셋 원숭이’들의 대화를 머신 러닝을 이용해 분석한 결과, 그들이 고유한 소리 시스템을 이용해 서로의 이름을 부르고 있다고 주장한 바 있다. 이처럼, 머신 러닝은 그 특성상 일정한 패턴을 보일 수밖에 없는 언어 해석 분야에서 앞으로도 다양한 성과를 보여줄 가능성이 크다.
마지막으로 피드백과 관련된 강화 학습은 어디까지 왔을까? 강화 학습은 목표를 수행하기 위해 겪는 시행착오 과정에서 보상이나 불이익을 주는 알고리즘을 설계해 특정 행동을 강화하는 머신 러닝의 한 방식이다. 이 알고리즘 덕분에 인공지능 분야는 많은 혁신을 이루어냈다. 특히 바둑 분야에서 큰 반향을 일으켰던 ‘알파고’의 후속작인 ‘알파제로’는 승률이라는 보상을 극대화하는 알고리즘을 통해 기존의 기보 없이 스스로 학습한 결과, 이전에 보지 못했던 새로운 전략을 구사하며 알파고를 뛰어넘을 수 있었다. 이런 일련의 사건을 통해 강화 학습이 머신 러닝의 여러 분야 중에서 전망이 상당히 밝다는 것이 입증되었고, 이를 타 분야에 적용한 많은 연구 결과가 지금도 쏟아져 나오고 있다.
.
에이전트의 도전 과제와 미래
저는 엄마가 되도록 프로그램되어 있지 않아요.
– Rozzum 7134 –
이상적인 에이전트는 단순한 일부터 복잡한 프로젝트까지 모두 수행할 수 있어야 한다. <와일드 로봇>의 7134는 집을 짓는 ‘비교적’ 단순한 작업을 넘어서, 양육이라는 매우 장기적인 비선형 프로젝트도 성공적으로 해낸다. 양육은 대부분의 생물이 종의 영속을 위해 반드시 수행해야만 하는 매우 중대하고 복잡한 과제이므로, 이를 수행할 수 있는 로봇은 분명 ‘범용 에이전트’라 불릴 자격이 있다. 7134는 거위 새끼에게 먹이를 주고, 수영을 가르치고, 나는 법을 알려주며, 이 임무를 완수하기 위해 자신의 코드를 스스로 수정하기까지 한다. 이 과정에서 감정과 인격을 얻게 된 7134는 이윽고 ‘로즈(ROZ)’라는 이름을 얻고, 영화의 종반부에서 “우리는 반드시 프로그래밍된 자신을 뛰어넘는 존재가 되어야 한다”고 선언하기에 이른다.
이 선언은 영화의 가장 감동적인 장면 중 하나지만, 인공지능을 연구하는 공학자에게는 그야말로 섬뜩한 순간이 아닐 수 없다. 높은 수준의 인공지능을 탑재한 에이전트를 만들었을 때, 우리는 그 에이전트에게 어느 정도의 ‘자율성’을 부여해야 할까? 이 질문은 많은 기술적, 윤리 도덕적 문제를 품고 있다. 일반적으로 무제한의 자율성이 주어진 에이전트는 목표를 수행하는 과정에서 잘못된 의사결정을 내릴 위험을 내포한다고 여겨지며, 이러한 우려는 <어벤져스: 에이지 오브 울트론>과 같은 종말론적 인공지능을 다룬 영화의 모티브가 되기도 한다.
범용 에이전트의 또 다른 과제는 물리적 실체의 구현이다. 사실 모든 에이전트가 반드시 물리적 실체를 가질 필요는 없다. 예를 들어, 소프트웨어 에이전트는 텍스트나 음성으로 특정 물건을 구매하라는 지시를 받고, 이를 온라인에서 주문하여 다음 날 사용자가 물품을 수령하도록 도울 수 있을 것이다. 그러나 진정한 ‘범용’ 에이전트는 반드시 물리적 실체를 가지고 세계와 상호작용해야 한다는 점은 명백하다. 그래서 에이전트의 관심과 더불어 주목받은 분야가 바로 로보틱스다. 로보틱스 분야는 DARPA Robotics Challenge* 이후 급격히 발전하기 시작했으며, 현재 AI 기능을 탑재했다고 주장하며 거액의 투자금을 받아 진지하게 로봇을 개발하는 회사만 세어도 열 손가락이 모자란 상황이 되었다. 흥미로운 점은 이들 대부분이 인간의 체형과 유사한 휴머노이드 로봇을 개발하고 있다는 점인데, 그 이유는 인간이 만든 모든 인공적인 사물은 인간의 체형에 맞춰 제작되었기 때문이다.
*DARPA Robotics Challenge: 미 국방부 산하 방위고등연구계획국에서 2012-2015년간 주최한 로봇 경진대회
다만 현재 개발 중인 로봇들이 실제로 ‘자율적’인 사고를 하며 행동하는 역량은 논외로 치더라도, 로보틱스 업계가 해결해야 하는 과제들은 실로 산더미다. 우선, 로보틱스 기술에는 배터리 혁신이 반드시 동반되어야 한다. <와일드 로봇> 속 로즈는 시종일관 숲을 뛰어다니면서도 며칠간 방전되지 않는다. 하지만 현재 개발된 휴머노이드 로봇은 약 30분에서 1시간 정도만 구동되는 배터리를 탑재할 수 있는 것으로 알려져 있다. 이 정도 수준의 구동 시간으로는 복잡한 작업을 완벽하게 수행할 것이라 기대하기 어렵다.
또한 범용 인공지능을 구동할 수준의 프로세서가 개발되지 않았고, 소형화되지 못했다는 점이다. 영화 속 로즈는 인간의 지식을 모두 융합한 ‘Alpha-113 processor’라는 강력한 추론 프로세서를 탑재했음을 가정한다. 이 프로세서의 성능은 최소 100조 개의 매개변수를 가진 모델을 연산할 것으로 추정되며, 이는 현재 가장 높은 성능을 가진 것으로 알려진 GPU 5,760개를 결합*해야만 나올 수 있는 성능에 해당한다. 인류는 얼마나 지나야 ‘Alpha-113’ 수준의 프로세서를 개발할 수 있을까? 무어의 법칙*이 계속 지속된다는 최상의 조건을 가정하여도 ‘Alpha-113’ 프로세서의 성능에 도달하려면 최소 24년 이상은 걸릴 것이다. 즉, 실시간 추론을 위해 각각의 로봇에 엄청난 집적도를 가진 손바닥만 한 칩을 탑재하는 것은 상당히 먼 미래의 이야기다. 따라서 현실적인 대안은 클라우드 컴퓨팅을 이용해 각각의 로봇에 주기적인 온라인 업데이트를 지원하는 것이라 할 수 있다.
*NVIDIA는 자사의 공식 홈페이지에서 최대 576개의 블랙웰 GPU를 한데 묶을 수 있고, 10조 개의 파라미터까지 지원한다고 밝힌 바 있다.
*무어의 법칙: 약 2년마다 칩의 집적도가 두 배가 된다는 반도체 업계의 진보 속도를 나타내는 법칙. 인텔의 설립자 고든 무어가 최초로 제안하였다.
.
그럼에도 범용 에이전트를 꿈꾸다
그렇지만, 너는 나의 친구야. 나는 이전까지 친구가 없었어. 그리고, 그리고 나는 네가 필요해.
– FINK –
상기의 이유로 범용성을 가진 하드웨어 에이전트는 아직 갈 길이 매우 멀다. 그러나 제한적 기능을 가진 소프트웨어 에이전트는 빠르게 실현될 가능성이 있다. 단순한 작업은 에이전트에게 맡기고 더 중요한 일에 시간을 할애함으로써 인류의 생산성을 향상시키는 것이 현재로서는 최선의 선택이다. 사실, 이는 현재 여러 거대 IT 공룡들이 개발하고 있는 소프트웨어 에이전트의 목표이기도 하다.
다만 우리는 <와일드 로봇>을 통해 아주 먼 미래에 실현될지도 모를 범용 에이전트의 모습을 마음껏 상상해 볼 수 있다. 우리는 에이전트에게 친밀감을 느끼고, 그들과 감정을 교류할 수 있을까? 그리하여 에이전트와 친구가 되는 것이 가능할까? 그런 날이 온다면, 우리는 더 이상 에이전트를 기괴한 소프트웨어나 로봇으로 여기지 않고, 그들에게 이름을 붙이게 될지도 모른다. 영화 속 ‘Rozzum 7134’가 ‘로즈’로 불린지 얼마 지나지 않아, 우리가 로즈에게 깊이 빠져들게 되는 것처럼 말이다.
출처
1. Oren, Guy, et al. “Vocal labeling of others by nonhuman primates.” *Science* 385.6712 (2024): 996-1003.
2. Perrella, Lauren. “The Wild Robot : The Screenplay”. Kindle ed. Independently published. 2024
3. 김종성, 이택호 지음, ≪수학은 알고 있다≫, 더퀘스트, 2024
4. NVIDIA Newsroom. “NVIDIA Blackwell Platform Arrives to Power a New Era of Computing”. March 18, 2024
.
※ 본 칼럼은 외부 필진의 견해로, 삼성전자 DS부문의 공식 입장과 다를 수 있습니다.
기간 설정