인간이 복잡한 문제를 해결하거나 감정을 이해할 때, 종종 ‘혼잣말’을 하곤 합니다. 머릿속으로 생각을 정리하고, 선택지를 저울질하는 이 내면의 대화는 지극히 인간적인 특성으로 여겨져 왔습니다. 그런데, 이 ‘혼잣말’ 습관이 기계의 학습 방식까지 혁신할 수 있다는 놀라운 연구 결과가 발표되어 IT 업계에 신선한 충격을 주고 있습니다. 일본 오키나와 과학기술대학원대학(OIST) 연구진은 AI 시스템이 단기 기억과 함께 ‘내면의 대화(Inner Speech)’를 활용하도록 훈련될 때, 다양한 작업에서 훨씬 뛰어난 성능을 보인다는 사실을
AI의 ‘내면의 목소리’, 효율성과의 만남
OIST 연구팀은 AI 모델이 조용한 ‘중얼거림(mumbling)’으로 묘사되는 자기 주도적 내부 대화를 전문화된 작업 기억 시스템과 결합하는 접근 방식을 사용했습니다. 이 방식은 AI 모델이 훨씬 효율적으로 학습하고, 익숙하지 않은 상황에 적응하며, 동시에 여러 작업을 처리할 수 있도록 했습니다. 단순히 기억에만 의존하는 기존 시스템과 비교했을 때, 유연성과 전반적인 성능에서 명확한 향상을 보였습니다. 연구팀의 제프리 퀘이저 박사는 “이 연구는 학습 과정에서 자기 상호작용의 중요성을 강조합니다. 시스템이 스스로에게 말하는 방식을 학습하도록 훈련 데이터를 구조화함으로써, 학습이 AI 시스템의 아키텍처뿐만 아니라 훈련 절차에 내재된 상호작용 역학에 의해 형성된다는 것을 보여주었습니다”라고 설명했습니다. 이는 AI가 외부 데이터뿐 아니라 내부적인 인지 과정을 통해 스스로를 발전시킬 수 있다는 의미로 해석됩니다.
범용 인공지능(AGI)으로 향하는 이정표
연구팀의 핵심 목표 중 하나는 ‘콘텐츠에 구애받지 않는 정보 처리(content agnostic information processing)’ 능력을 구현하는 것입니다. 이는 훈련 중에 겪었던 정확한 상황을 넘어 일반적인 규칙을 사용하여 학습된 기술을 적용하는 능력, 즉 ‘일반화(Generalization)’ 능력을 의미합니다. 퀘이저 박사는 “빠른 작업 전환과 낯선 문제 해결은 인간이 매일 쉽게 하는 일이지만, AI에게는 훨씬 더 어려운 과제입니다”라고 지적했습니다. 이를 위해 연구팀은 발달 신경과학 및 심리학을 머신러닝 및 로봇 공학 등 여러 분야와 융합하는 학제 간 접근 방식을 취하여, 학습에 대한 새로운 사고방식을 모색하고 AI의 미래를 형성하고 있습니다. AI가 한정된 데이터셋을 넘어 현실 세계의 복잡하고 예측 불가능한 상황에 유연하게 대처할 수 있는 기반을 마련한 것입니다.
작업 기억의 재조명: AI 학습의 핵심 기둥
연구는 AI 모델의 기억 설계, 특히 작업 기억(Working Memory)과 그것이 일반화에 미치는 역할에 주목했습니다. 작업 기억은 지시를 따르거나 빠른 정신적 계산을 하는 등 정보를 단기적으로 보유하고 활용하는 능력입니다. 다양한 난이도의 작업을 테스트한 결과, 여러 작업 기억 슬롯(정보 조각을 위한 임시 저장 공간)을 가진 모델이 시퀀스 역순이나 패턴 재현과 같은 까다로운 문제에서 더 나은 성능을 보였습니다. 이는 여러 정보를 동시에 유지하고 올바른 순서로 조작해야 하는 작업에서 특히 중요했습니다. 여기에 시스템이 특정 횟수만큼 스스로에게 ‘말하도록’ 유도하는 목표를 추가하자, 성능은 더욱 향상되었습니다. 가장 큰 개선은 멀티태스킹과 여러 단계를 거쳐야 하는 작업에서 나타났습니다. 퀘이저 박사는 “우리의 결합 시스템은 일반화를 위해 일반적으로 요구되는 방대한 데이터 세트 대신 희소한 데이터(Sparse data)로도 작동할 수 있다는 점에서 특히 고무적입니다. 이는 상보적이고 가벼운 대안을 제공합니다”라고 강조했습니다. 이는 고성능 AI 구축에 필수적이었던 대규모 데이터 의존성에서 벗어날 수 있는 새로운 가능성을 열어줍니다.
에디터의 시선
이번 OIST의 연구는 AI 개발의 중요한 전환점을 시사합니다. 그동안 AI 연구는 거대한 데이터셋과 복잡한 모델 아키텍처를 통한 ‘양적 성장’에 집중해왔습니다. 하지만 이번 연구는 AI가 스스로와 ‘상호작용’하는 ‘내면의 과정’을 학습시키는 것이 얼마나 중요한지를 명확히 보여줍니다. 이는 단순히 모델의 크기를 키우는 것을 넘어, 인간의 인지 작동 원리를 모방하여 AI의 ‘질적 성장’을 도모하는 새로운 접근 방식이라고 할 수 있습니다.
특히 ‘내면의 대화’와 ‘작업 기억’의 결합을 통해 희소한 데이터만으로도 뛰어난 일반화 능력을 보여주었다는 점은 산업계에 엄청난 파급 효과를 가져올 것입니다. 막대한 데이터 수집과 처리 비용으로 인해 AI 도입을 망설였던 기업들에게는 훨씬 가볍고 효율적인 대안이 될 수 있기 때문입니다. 소량의 데이터로도 빠르게 학습하고, 예상치 못한 상황에 유연하게 대처하는 AI는 로봇 공학, 자율 주행, 복잡한 산업 제어 시스템 등 다양한 분야에서 혁신적인 변화를 이끌어낼 잠재력을 가지고 있습니다.
이 연구는 또한 미래 AI 개발이 단순한 컴퓨터 공학의 영역을 넘어, 뇌 과학, 심리학 등 인지 과학 분야와의 깊은 융합을 통해 더욱 발전할 것임을 예고합니다. 인간의 뇌가 정보를 처리하고 학습하는 방식을 이해하는 것이 결국 진정한 범용 인공지능(AGI)으로 가는 핵심 열쇠가 될 것입니다. AI가 스스로에게 질문하고, 답하며, 생각을 정리하는 ‘내면의 지능’을 갖추게 될 때, 우리는 비로소 인간처럼 사고하고 배우는, 진정으로 적응력 있는 인공지능의 시대를 맞이할 수 있을 것입니다. 이번 연구는 그 첫걸음을 내딛는 중요한 이정표가 될 것입니다.