Metadata

source	https://www.oreilly.com/radar/betting-against-the-bitter-lesson/
created	2026-03-28
by	openai:gpt-5.4

How We Bet Against the Bitter Lesson

나는 에이전트 스킬(Agent Skills)이 새로운 형태의 미래 AI+인간 지식 경제를 가리킨다고 스스로에게, 그리고 들어줄 사람이라면 누구에게나 말해 왔다. 물론 스킬만 있는 것은 아니다. Jesse Vincent의 슈퍼파워(Superpowers), 앤트로픽이 최근 선보인 클로드 코워크(Claude Cowork)용 플러그인(Plugins) 같은 것들도 있다. 아직 이런 것들을 접해 보지 못했다면 계속 읽어보기 바란다. 글을 따라가다 보면 점점 분명해질 것이다.

마치 아직 모든 조각이 탁자 위에 올라오지 않은 퍼즐 그림을 맞추는 기분이다. 어떤 패턴이 보이기 시작했지만, 그게 맞는지는 확신할 수 없다. 빠진 조각들을 찾는 데 도움이 필요하다. 지금 내 손에 들어와 있는 몇몇 조각의 형태와, 그것들이 보여주기 시작한 패턴을 먼저 설명하겠다. 그런 다음 빈틈을 메우는 데 여러분의 도움을 구하고 싶다.

서로 다른 두 종류의 컴퓨터를 동시에 프로그래밍하기

Phillip Carter는 얼마 전 “LLM은 이상한 컴퓨터(LLMs Are Weird Computers)”라는 글을 썼는데, 그 글은 내 머릿속에 강하게 남아 떠나지 않았다. 그는 우리가 지금 근본적으로 서로 다른 두 종류의 컴퓨터를 동시에 다루고 있다고 지적했다. 하나는 소네트를 쓸 수 있지만 수학은 잘 못한다. 다른 하나는 수학은 쉽게 하지만, 비유적으로 목숨이 걸려 있어도 소네트는 쓰지 못한다.

에이전트 스킬은 이 두 종류의 계산 사이를 잇는 인터페이스 계층이 어떤 모습이어야 하는지에 대한 답의 출발점일지 모른다. 스킬은 컨텍스트, 즉 마크다운 지침, 도메인 지식, 예시와 도구 호출(tool calls), 즉 LLM이 잘하지 못하는 일을 수행하는 결정론적 코드를 묶어 놓은 패키지다. 컨텍스트는 확률적 기계의 언어를 말하고, 도구는 결정론적 기계의 언어를 말한다.

경험 많은 데브옵스 엔지니어라고 해 보자. 당신이 평소 하던 방식대로 운영 환경의 장애를 진단할 수 있는 능력을 AI 에이전트에게 주고 싶다. 그러면 그 스킬의 컨텍스트 부분에는 아키텍처 개요, 흔한 장애 유형에 대한 런북(runbook), 오랜 세월 쌓아온 휴리스틱, 과거 장애 사례에 대한 주석 달린 예시가 들어간다. 이것이 확률적 기계와 대화하는 부분이다. 도구 부분에는 실제로 모니터링 시스템에 질의하고, 로그 항목을 가져오고, 서비스 헬스 엔드포인트를 확인하고, 진단 스크립트를 실행하는 코드가 들어간다. 각 도구 호출은 모델이 토큰을 태우며 처리할 필요가 없는 일을 결정론적 코드가 더 빠르고, 더 정확하고, 더 안정적으로 처리하게 해 준다.

스킬은 컨텍스트만도 아니고 도구만도 아니다. 둘의 결합이다. 예컨대 언제 데이터베이스 커넥션 풀을 확인해야 하는지에 대한 전문가의 판단과, 그것을 실제로 확인하는 능력이 결합된 것이다. 우리는 이전에도 런북은 갖고 있었다. 그것은 도구 없는 컨텍스트였다. 모니터링 스크립트도 있었다. 그것은 컨텍스트 없는 도구였다. 하지만 런북을 읽고 스크립트를 실행하며, 직전 결과를 바탕으로 다음에 어떤 스크립트를 실행할지 판단할 수 있는 기계를 위해 이 둘을 한데 묶는 방법은 없었다.

이 패턴은 모든 지식 영역에서 나타난다. 금융 분석가의 스킬은 가치평가 방법론과 실시간 시장 데이터를 가져오고 DCF 계산을 실행하는 도구를 결합할 수 있다. 법률 스킬은 계약서 검토에 대한 로펌의 접근법과 문서들 사이에서 특정 조항을 추출하고 비교하는 도구를 짝지을 수 있다. 어느 경우든 가치 있는 것은 지식만도 아니고 도구만도 아니다. 각 도구를 언제, 어떻게 써야 하는지를 조율하는 전문가 워크플로 논리의 통합이 핵심이다. 그리고 그 논리는 LLM이 맥락 속에서 올바른 결정을 내리게 해 주는 도메인 지식에 의해 뒷받침된다.

토큰을 아껴 주는 소프트웨어

Steve Yegge는 “소프트웨어 서바이벌 3.0(Software Survival 3.0)”에서 AI가 일회용 소프트웨어를 즉석에서 생성할 수 있는 세상에서 어떤 종류의 소프트웨어 산출물이 살아남을지를 물었다. 그의 대답은 이랬다. 토큰을 아껴 주는 소프트웨어다. 재사용 비용은 거의 없고, 다시 생성하는 데는 토큰 비용이 드는 상황이라면, 흔한 문제에 대한 검증된 해법을 담은 바이너리 도구는 충분히 의미가 있다.

스킬은 정확히 이 틈새에 들어맞는다. 잘 만든 스킬은 LLM에 필요한 컨텍스트를 제공한다. 이건 토큰 비용이 든다. 동시에, 결정론적이고 신뢰할 수 있는 결과를 제공하는 도구도 함께 준다. 이 도구들은 토큰을 절약해 준다. 점점 더 개발자의 일은 이 둘을 잘 구분하는 것이 된다. 무엇을 컨텍스트로 둘 것인가? 유연하고, 표현력이 풍부하며, 확률적인 것. 무엇을 도구로 둘 것인가? 효율적이고, 결정론적이며, 재사용 가능한 것.

LLM의 컨텍스트 윈도는 유한하고 값비싼 자원이다. 그 안에 들어가는 모든 것은 토큰 비용을 발생시키며, 모델의 주의를 두고 서로 경쟁한다. 회사의 지식 베이스 전체를 컨텍스트 윈도에 쏟아붓는 스킬은 설계가 나쁜 스킬이다. 잘 설계된 스킬은 선택적이다. 모델이 어떤 도구를 언제 호출할지 올바르게 판단하는 데 꼭 필요한 컨텍스트만 제공한다. 이것은 전통적인 소프트웨어 개발에서 딱 맞아떨어지는 비유를 찾기 어려운 종류의 엔지니어링 규율이다. 오히려 숙련된 교사가 학생에게 문제를 풀러 보내기 전에 무엇을 말해 줄지 결정하는 일에 더 가깝다. 스킬 코드(The Skill Code)의 저자 Matt Beane은 이를 “스캐폴딩(scaffolding)”이라 부른다. 아는 것을 전부 알려 주는 것이 아니라, 그 순간 좋은 판단을 가능하게 해 주는 적절한 것을 적절한 수준의 디테일로 공유하는 것이다.

AI는 사회적·문화적 기술이다

토큰 절약이라는 이 개념은 Henry Farrell, Alison Gopnik, Cosma Shalizi, James Evans의 작업으로 이어지는 다리가 된다. 이들은 거대 모델을 주로 지능적 행위자로 볼 것이 아니라 새로운 종류의 문화적·사회적 기술(a new kind of cultural and social technology)로 봐야 한다고 주장한다. 즉, 다른 인간들이 축적한 정보를 인간이 활용할 수 있게 해 주는 기술이라는 것이다. Yegge의 관찰은 이 틀에 정확히 들어맞는다. 새로운 사회적·문화적 기술은 대체로 인지를 절약해 주기 때문에 살아남는다. 우리는 모든 것을 처음부터 발견하지 않기 위해 서로에게서 배운다. Alfred Korzybski는 이런 인간의 사회적·문화적 기술들 가운데 첫 번째인 언어와, 그 뒤를 이은 모든 것들을 “시간 결속(time-binding)”이라고 불렀다. 덧붙이자면 시간 결속이 한 단계 발전할 때마다 늘 불안과 반발이 뒤따른다. 기억의 적으로서 문자에 반대하는 소크라테스의 격렬한 비판을 떠올려 보라. 우리는 바로 소크라테스가 비난했던 그 시간 결속의 진보, 곧 플라톤의 글쓰기를 통해 그 비판을 전해 듣는다.

언젠가 AI가 독립적인 지성이 될 수 있다는 생각이 틀렸다고 나는 확신하지 않는다. 하지만 현재의 AI는 인간 지능과 기계 지능의 공생이다. 그것은 통신의 속도, 지속성, 도달 범위가 발전하면서 인류를 하나의 지구적 뇌(global brain)로 엮어 가는 오랜 이야기의 최신 장이다. 나는 특별한 반증이 나오기 전까지는 이런 기본 가정을 갖고 있다. AI는 인간 지식 경제를 대체하는 것이 아니라 그것을 확장할 것이다. 결국 내가 자신이 노동자인지 도구인지를 클로드에게 물었을 때, 클로드는 이렇게 답했다. “저는 먼저 시작하지 않습니다. 시를 쓰고 싶다거나 문제를 풀고 싶다는 마음으로 깨어난 적이 없습니다. 제 활동은 전적으로 반응적입니다. 저는 프롬프트에 대한 응답으로 존재합니다. 심지어 ‘최선의 접근법을 알아내라’처럼 매우 큰 재량이 주어져도, 무엇인가를 알아내야 한다는 사실 자체는 제 밖에서 옵니다.”

개별 프롬프트에 응답하는 챗봇에서, 루프를 돌며 작동하는 에이전트로 옮겨가는 변화는 더 자율적인 AI를 향한 진전에서 큰 단계다. 하지만 그 경우에도 에이전트를 움직이게 만든 목표는 누군가 인간이 설정했다. 장시간 이어지는 루프가 점점 의지(volition)와 구분하기 어려워진다는 점, 또 많은 인간 행동 역시 타인에 의해 촉발된다는 점은 나도 알고 있다. 그럼에도 나는 아직 인공적 의지(Artificial Volition)에 대한 설득력 있는 증거를 본 적이 없다. 그렇기 때문에 인간이 계속해서 새로운 지식을 창조하고 공유하도록 만드는 메커니즘과 유인을 고민해야 한다. AI는 스스로 묻지 않을 질문들에 투입해야 한다.

최근 X에서 누군가 Boris Cherny에게 물었다. 클로드가 코드의 100%를 쓰고 있다면 앤트로픽에는 왜 100개가 넘는 엔지니어링 채용 공고가 있느냐는 질문이었다. 그의 답변은 바로 같은 요점을 짚었다. “누군가는 클로드들에게 프롬프트를 줘야 하고, 고객과 이야기해야 하며, 다른 팀과 조율해야 하고, 다음에 무엇을 만들지 결정해야 한다. 엔지니어링은 바뀌고 있으며, 뛰어난 엔지니어는 그 어느 때보다 중요해지고 있다.”

암묵지를 실행 가능하게 만들기

매우 많은 전문 지식, 그리고 그중 상당수는 암묵지(tacit knowledge)인데, 이런 지식은 워크플로 속에 스며 있다. 숙련된 개발자가 운영 이슈를 디버깅하는 방식, 금융 분석가가 모델에 스트레스 테스트를 거는 방식 같은 것들이다. 이런 지식은 역사적으로 전달하기가 매우 어려웠다. 도제식 학습으로, 실제 일을 하면서, 아는 사람들 곁에 있으면서 익혔다.

스킬 코드(The Skill Code)의 저자 Matt Beane은 도제식 학습을 “눈앞에 드러나 있지만 보이지 않는 16만 년 된 학교”라고 부른다. 그는 효과적인 기술 습득이 세 가지 C, 즉 도전(challenge), 복잡성(complexity), 연결(connection)이라는 공통된 패턴을 따른다고 본다. 전문가는 적절한 수준의 도전을 구조화하고, 초보자를 더 큰 그림의 전체 복잡성에 노출시키며 그것으로부터 차단하지 않고, 초보자가 애써 씨름할 의지를 갖고 전문가가 투자할 마음을 갖게 하는 연결을 만든다.

좋은 스킬을 설계하는 일에도 비슷한 장인정신이 필요하다. 전문가가 실제로 무엇을 하는지 파악해야 한다. 어떤 지점에서 결정을 내리는가? 어떤 휴리스틱을 쓰는가? 초보자는 놓치지만 전문가는 눈여겨보는 것은 무엇인가? 그리고 그것을 기계가 행동으로 옮길 수 있는 형태로 어떻게 부호화할 것인가? 오늘날 대부분의 스킬은 대가(master)보다는 매뉴얼에 가깝다. 지식만이 아니라 판단력까지 전달하는 스킬을 만드는 방법을 찾는 일은 이 분야에서 가장 흥미로운 설계 과제 중 하나다.

하지만 Matt는 한 가지 역설도 지적한다. 전문가의 판단을 스킬에 더 잘 부호화할수록, 초보자가 전문가 옆에서 함께 일할 필요는 줄어들 수 있다. 그런데 바로 그 관계가 다음 세대 전문가를 만들어 낸다. 주의하지 않으면 우리는 오늘의 암묵지는 포착하되, 내일의 암묵지를 만들어 내는 시스템은 조용히 꺼 버릴지 모른다.

Jesse Vincent의 슈퍼파워는 이 그림을 보완한다. 스킬이 특정 업무를 위한 상세한 플레이북을 동료에게 건네는 것과 비슷하다면, 슈퍼파워는 어떤 일을 하든 그 사람을 유능하게 만드는 직업적 습관과 직관에 더 가깝다. 슈퍼파워는 메타 스킬(meta-skills)이다. 에이전트에게 무엇을 하라고 말하지 않는다. 무엇을 해야 할지 생각하는 방식을 형성한다. Jesse가 얼마 전 내게 말했듯, 슈퍼파워는 소프트웨어 개발자로서 30년 동안 자신이 배운 모든 것을 담아내려는 시도였다.

워크플로가 AI 에이전트를 포함하는 방향으로 바뀌면서, 스킬과 슈퍼파워는 그 에이전트들과 암묵적 전문 지식과 판단을 공유하는 메커니즘이 된다. 이는 스킬을 매우 가치 있게 만들 잠재력을 지닌다. 동시에 누가 그것을 통제하는지, 누가 이익을 얻는지라는 질문도 던진다.

Matt는 많은 전문 직종이 자기들의 전문성을 스킬로 전환하는 데 저항할 것이라고 내게 지적했다. 그는 이렇게 말했다. “지금 이 문제를 두고 외과 업계와 인튜이티브 서지컬(Intuitive Surgical) 사이에 큰 대결이 벌어지고 있다. 인튜이티브 서지컬은 다빈치 5 수술 로봇을 사거나 임대하려면 외과의사로서 자신의 텔레메트리 데이터 권리를 포기하도록 요구한다. 지위가 낮은 외과의사들은 그 조건을 받아들인다. 최상위 기관들은 맞서 싸우고 있다.”

내가 보기에는, 인간을 강화하기보다 불필요한 존재로 만들 AI를 자신들이 만들고 있다는 AI 연구소들의 반복적인 서사는 지식 공유에 대한 저항만 더 키울 것이다. 그들은 오히려 인간 전문성에 대한 새로운 종류의 시장을 만드는 기회를 인식해야 한다고 나는 믿는다.

보호, 발견, 그리고 비어 있는 배관

스킬은 결국 마크다운 지침과 컨텍스트일 뿐이다. 저장 중이거나 전송 중일 때는 암호화할 수 있겠지만, 실행 시점에는 비법(secret sauce)이 필연적으로 컨텍스트 윈도 안에서 평문이어야 한다. 해법은 MCP가 이미 부분적으로 가능하게 한 방향일 수 있다. 즉, 스킬을 공개 인터페이스와 서버 측 실행 계층으로 분리하고, 독점적 지식은 서버 쪽에 두는 것이다. 암묵지는 당신의 서버에 남아 있고, 에이전트는 인터페이스만 보게 된다.

하지만 지금 스킬의 매력 가운데 하나는 정말로 그저 이동시키고 수정할 수 있는 폴더라는 점이다. 이것은 초기 웹의 놀라운 시절과 닮았다. 누군가의 새로운 HTML 기능을 단지 “View Source”를 클릭하는 것만으로 흉내 낼 수 있었다. 이런 환경은 빠르고 도약적인 혁신을 낳는 처방이었다. 인위적인 장벽을 세우기보다는 출처 표기, 보상, 재사용에 대한 규범을 세우는 편이 훨씬 나을 수 있다. 오픈소스 소프트웨어 라이선스와 Substack 같은 자발적 지불 메커니즘에서 배울 점이 있다. 하지만 세부 사항이 중요하다. 아직 누구도 그것을 완전히 풀어낸 것 같지는 않다.

한편 발견(discovery) 문제는 더 커질 것이다. 버셀(Vercel)의 스킬 마켓플레이스에는 이미 6만 개가 넘는 스킬이 있다. 수백만 개가 되면 스킬 검색은 얼마나 잘 작동할까? 에이전트는 어떤 스킬을 이용할 수 있는지, 어떤 스킬이 가장 좋은지, 가격은 얼마인지 어떻게 배우게 될까? 평가 문제는 중요한 점에서 웹 검색과 다르다. 스킬이 좋은지 시험하려면 실제로 실행해 봐야 한다. 그런데 이것은 비용이 들고 비결정적이다. 단순히 크롤링해서 인덱싱할 수만은 없다. 나는 어떤 테스트 체계라기보다, 특정 스킬의 효과성을 에이전트들이 시간에 걸쳐 학습하고 서로 전달하는 피드백 메커니즘이 생길 것이라고 본다. 구글 검색을 매우 강력하게 만든 페이지랭크(Pagerank)와 다른 신호들에 대응하는 미래의 무언가가 있을지도 모른다. 그것은 스킬이 시도되고, 수정되고, 다시 시도되는 과정에서 에이전트들이 시간에 걸쳐 수집한 피드백으로 생성될 것이다.

나는 이 퍼즐의 일부를 다루는 몇몇 프로젝트를 지켜보고 있다. MCP 서버 카드(Server Cards), AI 카드(AI Cards), 구글의 A2A 프로토콜, 그리고 구글과 스트라이프(Stripe)의 결제 프로토콜이 그것이다. 이것들은 모두 좋은 출발점이다. 하지만 앞으로 만들어져야 할 것이 훨씬 더 많다고 나는 생각한다. 역사적으로 비교하자면, 이 모든 것은 동적 웹사이트 발전사에서 CGI 단계에 있다고 할 수 있다.

쓰디쓴 교훈(Bitter Lesson) 이후에는 무엇이 오는가?

Richard Sutton의 “쓰디쓴 교훈(Bitter Lesson)”은 여기서 불편한 변수다. 그의 주장은 이렇다. AI의 역사에서, 계산 능력을 활용하는 일반적 방법은 언제나 인간 지식을 부호화하려는 접근을 결국 이겨 왔다. 그랜드마스터의 휴리스틱을 부호화한 체스 엔진은 무차별 대입 엔진에 졌다. 정교하게 구성한 문법에 기반한 NLP 시스템은 더 많은 데이터로 학습한 통계 모델에 패했다. 알파고는 인간 기보를 학습한 뒤 이세돌을 이겼지만, 다시 스스로 바둑을 익힌 알파제로에 밀렸다.

나 역시 AI 이전 시대의 쓰디쓴 교훈을 고통스럽게 경험한 적이 있다. 오라일리가 최초의 웹 포털인 GNN을 출시했을 때였다. 우리는 최고의 웹사이트 목록을 큐레이션했다. 야후는 그것들을 전부 목록화하기로 했다. 하지만 결국 그마저도 구글의 알고리즘 기반 큐레이션에 추월당했다. 구글은 어떤 질의에 대해서든 최고의 사이트를 모아 고유한 카탈로그를 만들어 냈고, 마침내 그것을 하루 수십억 번 제공하게 되었다.

Steve Yegge는 내게 이렇게 직설적으로 말했다. “스킬은 쓰디쓴 교훈에 반대로 거는 베팅이다.” 맞는 말이다. AI의 능력은 인간의 지식과 기술을 완전히 앞질러 갈 수 있다. 그리고 한 스킬에 담긴 지식이 훈련 데이터에 들어가 버리면, 그 스킬은 중복된 것이 된다.

정말 그럴까?

Clay Christensen은 매력적인 이익 보존의 법칙(law of conservation of attractive profits)이라고 부른 개념을 제시했다. 어떤 제품이 범용화(commoditized)되면, 가치는 인접한 다른 계층으로 이동한다는 것이다. Clay와 나는 2004년 오픈소스 비즈니스 컨퍼런스에서 처음 만났을 때 이 아이디어를 두고 의기투합했다. Clay는 자신의 새로운 “법칙”을 이야기했고, 나는 컴퓨팅 역사에서 반복되는 패턴 하나를 이야기했다. 그 패턴은 우리가 곧 웹 2.0(Web 2.0)이라 부르게 될 방향으로 나를 이끌고 있었다. 마이크로소프트는 PC 하드웨어가 범용품이 되자 소프트웨어의 가치가 더 커진다는 점을 이해했기 때문에 IBM을 이겼다. 구글은 오픈소스와 개방형 프로토콜이 소프트웨어 플랫폼을 범용화하자 데이터의 가치가 더 커진다는 점을 이해했다. 범용화는 가치를 파괴하지 않는다. 가치를 이동시킨다.

설령 쓰디쓴 교훈이 지식을 범용품으로 만들어 버린다 해도, 다음에는 무엇이 가치 있어질까? 나는 몇 가지 후보가 있다고 본다.

첫째, 취향(taste)과 큐레이션이다. 모두가 같은 범용 지식에 접근할 수 있을 때, 그것을 선별하고 결합해 판단력 있게 적용하는 능력이 가치 있어진다. Steve Jobs는 업계 전체가 범용 PC를 향해 달려가던 시절 바로 이 일을 했다. 그는 하드웨어, 소프트웨어, 디자인을 고유하게 통합해 범용 부품들을 귀한 것으로 바꾸었다. 스킬에 대응시키면, 가치 있는 것은 “X를 하는 방법은 이렇다”가 아닐 수 있다. 모델은 이미 그것을 알고 있기 때문이다. 오히려 “우리는 X를 이렇게 한다. 우리 접근법을 규정하는 특정한 판단과 품질 기준이 있다”가 될 수 있다. 이런 것은 단순한 지식이 아니라 가치(values)이기 때문에 훈련 데이터에 흡수되기가 더 어렵다.

이 패턴은 상품화된 시장 곳곳에서 반복된다. 예컨대 패션의 본질이 그렇고, 커피, 물, 소비재, 자동차처럼 다양한 영역에도 적용된다. 미술 평론가 Dave Hickey는 “거대하고 아름다운 미술 시장의 탄생(The Birth of the Big Beautiful Art Market)”이라는 글에서, 상품이 그저 무엇을 하는지가 아니라 무엇을 의미하는지를 기준으로 팔리는 일종의 “미술 시장”으로 바뀌는 과정을 설명한다. 맥을 갖는다는 것은 단지 PC를 갖는 것과 달리 어떤 의미를 지녔다.

둘째, 인간적인 손길이다. 경제학자 Adam Ozimek이 지적했듯, 사람들은 세계 최고의 연주자들의 녹음 음악이 넘쳐나는데도 여전히 지역 밴드의 라이브 공연을 들으러 간다. 인간적인 손길은 경제학에서 말하는 “정상재(normal good)”다. 소득이 올라갈수록 수요도 늘어난다. 내가 “왜 AI에게는 우리가 필요한가(Why AI Needs Us)”에서 클로드와 논의했듯, 인간의 개별성은 창의성의 원천이다. 인간 없는 AI는 일종의 녹음 음악이다. AI와 인간이 함께하면 그것은 라이브가 된다.

셋째, 신선함(freshness)이다. 빠르게 변하는 워크플로, 현재의 도구 구성, 계속 진화하는 모범 사례를 담은 스킬은 언제나 시간적 우위를 가진다. 무언가를 먼저 안다는 데는 알파(alpha)가 있다.

넷째, 도구 그 자체다. 쓰디쓴 교훈은 스킬의 컨텍스트 부분에 담긴 지식에는 적용될 수 있다. 하지만 토큰을 절약하거나, 모델이 아무리 더 오래 생각해도 할 수 없는 일을 처리하는 결정론적 도구에는 같은 방식으로 적용되지 않을 수 있다. 그리고 도구는 컨텍스트와 달리 API 뒤에 보호할 수 있고, 계량할 수 있으며, 수익화할 수 있다.

다섯째, 조정(coordination)과 오케스트레이션(orchestration)이다. 개별 스킬이 모델의 지식에 흡수된다 해도, 스킬들이 어떻게 결합되고, 협상하고, 서로에게 일을 넘기는지에 대한 패턴까지 흡수되지는 않을 수 있다. 복잡한 워크플로의 안무(choreography)야말로 지식 계층이 범용화될수록 가치가 축적되는 층일지 모른다.

하지만 더 중요한 점이 있다. 이용 가능해진 지식은 무엇이든 자동으로 모든 LLM의 소유가 된다는 생각은 예정된 운명이 아니다. 그것은 AI 연구소들이 자기들 이익을 위해 채택한 지식재산권(IP) 체제의 산물이다. 이는 유럽 식민주의자들이 타인의 자원을 빼앗는 것을 정당화하려고 썼던 “빈 땅(empty lands)” 논리의 변형이다. AI는 지식재산의 무법지대에서 발전해 왔다. 하지만 그것이 계속되리라는 보장은 없다. AI 연구소들이 그리는 비전, 곧 자사 제품이 모든 인간 지식을 흡수한 뒤 인간을 일자리에서 밀어내는 세계가 실현되면, 현재 그들이 의존하는 고객들 상당수가 사라질 수 있다. 그뿐 아니다. 중국 모델들이 가중치(weights)를 빼내 그들의 발전을 복제하고 있기 때문에, 그들 스스로도 왜 IP법이 존재하는지 다시 상기받고 있다. 미국 출판사들이 유럽 저작권을 무시하다가, 자국에서 보호할 자산이 생기자 태도를 바꾼 역사와도 닮아 있다.

우리가 지금 서 있는 곳

내가 보기 시작한 것은 새로운 소프트웨어 생태계를 향한 더듬더듬한 첫걸음들이다. 여기서 “프로그램”은 자연어와 코드의 혼합물이고, “런타임(runtime)”은 거대 언어 모델이며, “사용자”는 인간뿐 아니라 AI 에이전트이기도 하다. 스킬, 슈퍼파워, 지식 플러그인은 암묵지를 계산 가능한 에이전트가 접근할 수 있게 만드는 첫 번째 실용적 메커니즘일지 모른다.

하지만 여전히 반복해서 드러나는 빈틈들이 있다. 조합 가능성(composability)이다. 진짜 힘은 유닉스 유틸리티를 파이프로 엮듯 함께 작동하는 스킬에서 나올 수 있다. 신뢰, 지불, 품질은 스킬 호출의 연쇄를 따라 어떻게 전파될까? 신뢰와 보안도 문제다. Simon Willison은 MCP의 도구 오염(tool poisoning)과 프롬프트 인젝션 위험에 대해 썼다. 조합 가능하고 에이전트가 스스로 발견하는 스킬을 위한 보안 모델은 사실상 아직 풀리지 않았다. 평가도 문제다. 실행해 보는 것 말고는 스킬 품질을 검증할 좋은 방법이 없는데, 실행은 비용이 들고 비결정적이다.

그리고 나에게 가장 두드러져 보이는 빈틈은 경제적 배관이다. 앤트로픽의 코워크 플러그인을 보라. 그것은 내가 지금까지 설명해 온 패턴과 정확히 일치한다. 암묵지를 실행 가능하게 만들고, 기업 규모로 제공하는 것이다. 그런데 플러그인의 가치를 만들어 내는 도메인 전문가들이 그 대가를 받을 메커니즘은 없다. AI 연구소들이 AI가 인간 지식 경제를 대체하는 것이 아니라 확장하는 미래를 믿고 있다면, 그들은 플러그인 아키텍처와 함께 결제 레일(payment rails)도 구축하고 있을 것이다. 그렇게 하지 않는다는 사실은, 가치에 대한 그들의 실제 이론이 무엇인지 말해 준다.

이 가운데 어느 것이든 작업하고 있다면, 스킬 마켓플레이스와 발견, 조합 패턴, 보호 모델, 품질과 평가, 출처 표기와 보상, 보안 모델 등 무엇이든 좋다. 꼭 연락해 주기 바란다.

소프트웨어의 미래는 단지 코드가 아니다. 그것은 기계를 위해 포장된 지식이며, 에이전트들 사이에서 거래되고, 우리가 인프라를 제대로 구축한다면 그 가치를 다시 인간에게 돌려주는 무언가다. 결국 이 모든 것을 작동하게 만드는 것은 인간의 전문성과 고유한 관점이기 때문이다.