Metadata

source	https://ls.berkeley.edu/news/what%E2%80%99s-really-happening-inside-ai%E2%80%99s-black-box-berkeley-researchers-have-answers
created	2026-04-21
by	openai:gpt-5.4

AI의 블랙박스(black box) 안에서는 실제로 무슨 일이 벌어질까? 버클리 연구진이 답을 제시한다

과학자들은 전통적으로 인공지능의 내부 수학 계층, 즉 흔히 AI의 “블랙박스(black box)”라고 불리는 부분을 인간이 온전히 해석하기에는 지나치게 추상적이고 복잡한 영역으로 여겨 왔다.

하지만 UC 버클리 언어학 교수 가슈페르 베구시(Gašper Beguš), 그의 아내이자 UC 버클리 과학·기술·의학·사회 센터 소속 인공 인문학 연구자 니나 베구시(Nina Beguš), 그리고 예술가 집단 메타헤이븐(Metahaven)의 새로운 공동 프로젝트는 AI의 내부 작동 원리가 인간의 이해를 넘어선다는 생각에 이의를 제기한다.

"블랙박스(black box)" 지도 그리기
신경과학, 언어학, 철학, 인문학, 예술, 문학의 통찰을 바탕으로 한 이들의 라텐트 스페이스크래프트(Latent Spacecraft) 프로젝트는 AI 모델의 내부 “잠재 공간(latent spaces)”이 단순한 추상 수학이 아니라, 인간의 뇌처럼 실제로 탐색하고 지도로 그릴 수 있는 공간임을 보여 준다. “잠재 공간(latent spaces)”은 AI 모델 내부에서 학습이 실제로 일어나는 숨겨진 층을 뜻한다.

가슈페르는 “잠재 공간(latent spaces)은 아무도 제대로 이해하지 못한 채 모든 일을 수행하는 숨은 층”이라고 설명했다. 이어 그는 “이 층들은 데이터를 보면서 학습한다. 인간도 마찬가지다. 처음에는 말하거나 움직이도록 훈련되지 않은 뇌를 가지고 태어나고, 연결이 점차 형성되면서 복잡한 사고와 언어, 자기 인식을 지닌 성인이 된다”라고 말했다.

연구진은 이러한 숨은 층을 조사하기 위해 음성을 생성하는 생성적 적대 신경망(GAN)을 연구했다. GAN은 한 부분이 데이터를 생성하고 다른 부분이 그것을 평가하고 다듬어 결과가 실제처럼 보일 때까지 개선하는 2부 구조의 AI 시스템이다. 연구진은 이 모델들 안의 잠재 공간을 분석한 결과, 오늘날 대부분의 챗봇을 뒷받침하는 거대 언어 모델(LLM)과 달리 GAN은 인간 영아와 더 비슷한 방식으로 언어를 발달시킨다는 사실을 발견했다. 즉, 듣고, 옹알이를 하고, 점차 잡음을 의미 있는 말로 바꿔 간다. 연구진은 이 과정을 “정보적 모방(informative imitation)”이라고 부른다.

인간과 기계를 다시 생각하기
가슈페르는 이러한 발견이 인간과 기계의 관계를 이해하는 방식에도 더 넓은 함의를 지닌다고 말했다.

그는 “기계와 인간의 관계는 애초에 동등한 두 존재의 관계로 상정된 적이 없었다. 하지만 여러 증거를 보면 기계가 결국 인간과 맞먹는 수준에 이를 수도 있다”라며 “우리는 그 상황을 헤쳐 나가야 하며, 인간이라는 것이 무엇을 뜻하는지 다시 정의해야 한다. 어쩌면 생물학적 지능 자체의 가치를 새롭게 배워야 할지도 모른다”라고 말했다.

그는 또 이렇게 덧붙였다. “처음으로 인간이 아닌 무언가가 인간의 언어를 완벽하게 배울 수 있게 됐다. 예전에는 언어를 배우려면 인간이어야 했지만, 이제는 더 이상 그렇지 않다. 인간성(humanity)이라는 개념 자체가 변하고 있다.”

AI를 이해하기 위해 인문학을 활용하기
가슈페르는 지금 이 순간이 학문 간 더 깊은 협력을 요구한다고 본다. 특히 안전하고 책임 있는 AI 시스템을 설계하는 데서 그렇다.

그는 “지금은 인문학이 AI 설계에 엄청난 도움을 줄 수 있는 결정적 순간”이라며 “우리의 유사점과 차이점을 이해하는 일은 안전한 모델을 만드는 데 중요하고, 모델이 더 커질수록 무엇이 새롭게 나타날지 예측하는 데도 필요하다”라고 말했다.

니나는 “이런 모델이 어떻게 작동하는지 이해하면 AI와 인간의 미래에 대해 더 근거 있는 판단을 내릴 수 있다”라고 덧붙였다.

연구진은 이러한 숨은 층을 인간의 눈과 귀에 더 잘 이해되도록 만들기 위해 제임스 조이스의 소설 “피네간의 경야(Finnegan’s Wake)”를 끌어왔다. 이 작품은 “의식의 흐름(stream of consciousness)” 문체와 새로 만들어 낸 단어들로 유명하다. 연구진은 이것이 문장이 되기 전, 생각이 머무는 우리 마음속의 “전언어적(pre-linguistic)” 공간을 비춘다고 말한다.

자신의 저서에서 설명한 바와 같이 “ 인공 인문학(Artificial Humanities)”이라는 새롭게 떠오르는 분야를 연구하는 니나는, 이런 시스템을 이해할 때 코드만큼이나 문학적 도구도 중요하다고 주장한다.

그녀는 “해석, 비교, 은유적 사고, 공간적 사고와 같은 문학적·인문학적 방법은 기계학습 모델의 내부를 탐색하는 정당한 도구다. 그리고 모델을 외부와 내부에서 평가하고 다시 빚어 가는 데 도움을 준다”라고 말했다.

연구팀은 메타헤이븐(Metahaven)과 협력하며 이러한 학제적 접근을 더 확장했다. 메타헤이븐은 가슈페르와 니나의 연구를 긴밀히 반영했고, 미디어 아티스트이자 코더인 리카르도 페트리니(Riccardo Petrini)와 함께 이러한 AI 시스템이 내부에서 어떻게 작동하는지를 시각적·공간적으로 해석해 냈다. 이들은 함께 사람들이 AI 시스템 내부를 “여행”할 수 있게 하는 몰입형 인터랙티브 작품을 만들었다.

메타헤이븐의 예술가 다니엘 판 데르 펠던(Daniel van der Velden)에 따르면, 이 과정은 가슈페르의 첫 번째 GAN 모델인 fiwGAN — Featural InfoWaveGAN — 을 인터랙티브한 시각 풍경으로 번역하는 데서 시작됐다. 이 모델은 군집, 파편, 흐릿한 이미지 형태로 가득 찬 탐색 가능한 추상 환경으로 나타난다. 사용자가 모델의 “잠재 공간(latent space)”을 이동하면 이러한 요소들이 나타났다가 사라진다. 판 데르 펠던은 이것이 GAN이 언어를 모방하고 생성하면서 수행하는 연결(concatenation), 즉 일련의 연산을 표현한다고 설명했다.

이 접근은 이어 두 번째 모델인 피네GAN(FinneGAN)으로 발전했다. 판 데르 펠던에 따르면 이 모델은 “피네간의 경야(Finnegans Wake)”의 꿈같고 새로 만들어진 언어에서 영감을 받았다. 이 버전에서는 부드럽고 구름 같은 층들이 점차 더 구조적인 이미지로 응결된다. 그는 이것이 GAN이 잡음에서 일관된 발화로 나아가는 과정을 나타내도록 설계된 것이라고 말했다.

판 데르 펠던은 “라텐트 스페이스크래프트(Latent Spacecraft)는 말 그대로 잠재 공간(latent space)을 가로지르는 ‘탈것(craft)’이다. 모두가 AI의 출력에만 집착하는 지금, 그 안에서 무슨 일이 일어나는지 들여다보는 일이 중요하다고 우리는 생각한다. 우리는 인공신경망을 복합적인 장소로 이해하는 디자인 철학이 필요하다”라고 말했다.

마지막으로 니나는 AI 개발이 진전될수록 과학자, 예술가, 인문학자 사이의 협력이 더 활발해지기를 바란다고 말했다.

그녀는 “우리의 연구가 학자들에게 자신만의 모델을 만들고, 인문학자와 예술가와 더 많이 협력하도록 북돋기를 바란다. 인문학적 통찰은 AI 개발의 최전선에 있어야 한다”라고 말했다.