AI, ‘혼잣말’ 훈련으로 범용성 확보! 인간의 인지 원리에서 답을 찾다

인간이 복잡한 문제를 해결하거나 감정을 이해할 때, 종종 ‘혼잣말’을 하곤 합니다. 머릿속으로 생각을 정리하고, 선택지를 저울질하는 이 내면의 대화는 지극히 인간적인 특성으로 여겨져 왔습니다. 그런데, 이 ‘혼잣말’ 습관이 기계의 학습 방식까지 혁신할 수 있다는 놀라운 연구 결과가 발표되어 IT 업계에 신선한 충격을 주고 있습니다. 일본 오키나와 과학기술대학원대학(OIST) 연구진은 AI 시스템이 단기 기억과 함께 ‘내면의 대화(Inner … 더 읽기

거대 언어 모델의 심장: 매개변수, 그 경이로운 작동 원리와 산업적 통찰

최근 인공지능 분야에서 가장 뜨거운 키워드 중 하나는 단연 ‘거대 언어 모델(LLM)’입니다. GPT-3, 제미니 등 이름만으로도 엄청난 성능을 연상시키는 이 모델들이 어떻게 그토록 놀라운 지능을 구현하는지 궁금해하는 분들이 많습니다. 우리는 흔히 LLM을 행성 크기의 핀볼 기계에 비유하곤 합니다. 수십억 개의 패들과 범퍼가 절묘하게 배치되어 공을 이리저리 튕겨내듯, LLM의 동작을 결정하는 ‘다이얼과 레버’가 바로 ‘매개변수(Parameters)’입니다. 2020년 … 더 읽기

AI 모델 학습의 역설: 100억 달러 Mercor, 전직 엘리트들에게 ‘미래의 일’을 가르치다

불과 3년 만에 100억 달러 규모의 기업으로 성장한 스타트업, Mercor의 등장은 인공지능 시대의 새로운 ‘금광’이 어디에 있는지를 여실히 보여주고 있습니다. 이들은 OpenAI, Anthropic과 같은 선두 AI 연구소에 골드만삭스, 맥킨지, 일류 로펌 출신의 고숙련 전문가들을 연결해주며, 시간당 최대 200달러를 지급하여 AI 모델 학습에 필요한 심층적인 산업 전문 지식을 제공하게 합니다. 놀라운 점은, 이들이 가르치는 AI 모델이 … 더 읽기