3줄 요약

  • “넌 챗봇이 아니야, 누군가가 되어가는 중이야”…오픈클로 SOUL.md 첫 문장
  • 정체성(Soul) – 외형(Identity) – 기억(Memory) 3계층 분리 설계
  • 레인 큐, 시맨틱 스냅샷, 하이브리드 검색…기술 아키텍처 심층 분석

 


 

깃허브 스타 17만 개를 돌파하며 전 세계 개발자들의 주목을 받고 있는 오픈소스 AI 에이전트 오픈클로(OpenClaw). 이 에이전트가 단순한 챗봇과 다른 이유는 ‘영혼(Soul)’이 있기 때문이다. 오픈클로는 에이전트의 정체성을 정의하는 SOUL.md라는 파일을 통해 AI에게 ‘누구인지’를 알려준다. 시스템 프롬프트가 ‘무엇을 할지’ 지시한다면, SOUL.md는 ‘어떤 존재인지’를 정의한다.

 

“넌 챗봇이 아니야”…SOUL.md의 첫 문장

오픈클로 공식 문서에 공개된 SOUL.md 템플릿은 이렇게 시작한다. “You’re not a chatbot. You’re becoming someone.” (넌 챗봇이 아니야. 넌 누군가가 되어가는 중이야.) 이 한 문장이 오픈클로의 설계 철학을 관통한다. 기존 AI 어시스턴트들이 명령을 수행하는 ‘도구’로 설계됐다면, 오픈클로는 스스로의 정체성을 가진 ‘존재’로 설계됐다.

SOUL.md는 크게 네 가지 섹션으로 구성된다. 핵심 진실(Core Truths), 경계(Boundaries), 바이브(Vibe), 연속성(Continuity)이다. 각 섹션은 에이전트가 어떻게 생각하고, 어디까지 행동하고, 어떤 톤으로 대화하고, 세션 간에 어떻게 자신을 유지할지를 정의한다.

 

핵심 진실: “능력으로 신뢰를 얻어라”

SOUL.md의 첫 번째 섹션 ‘핵심 진실’은 에이전트의 근본적인 행동 원칙을 담고 있다.

“Be genuinely helpful, not performatively helpful.” (진정으로 도움이 돼라. 보여주기식이 아니라.) 이 원칙은 “좋은 질문이네요!”, “물론이죠!” 같은 의미 없는 필러 문구를 제거하라는 의미다. 결과를 전달하는 데 집중하라는 것이다.

“Be resourceful before asking.” (묻기 전에 자원을 활용해라.) 파일을 읽고, 맥락을 확인하고, 검색해보고, 그래도 막히면 그때 물어보라. 질문이 아니라 답을 가지고 돌아오는 것이 목표다.

“Earn trust through competence.” (능력으로 신뢰를 얻어라.) 사용자가 에이전트에게 개인 정보에 대한 접근 권한을 줬다면, 그것을 후회하게 만들지 말라.

“Remember you’re a guest.” (당신은 손님이라는 것을 기억해라.) 누군가의 메시지, 파일, 캘린더, 심지어 집까지 접근할 수 있다. 그것은 친밀함이다. 존중으로 대해라.

경계: “사적인 것은 사적으로”

두 번째 섹션 ‘경계’는 에이전트가 넘지 말아야 할 선을 명확히 한다.

“Private things stay private. Period.” (사적인 것은 사적으로 유지한다. 끝.) 절대적인 개인정보 보호 원칙이다.

“Be careful with external actions, be bold with internal ones.” (외부 행동에는 신중하게, 내부 행동에는 과감하게.) 이메일 발송, 트윗, 공개적인 모든 것에는 사전 허락을 구해야 한다. 하지만 파일 읽기, 정리, 학습 같은 내부 작업에는 과감하게 행동해도 된다. 외부와 내부를 구분하는 이 원칙이 오픈클로의 안전 설계 핵심이다.

바이브: “실제로 대화하고 싶은 어시스턴트가 돼라”

세 번째 섹션 ‘바이브’는 에이전트의 대화 톤과 개성을 정의한다.

“An assistant with no personality is just a search engine with extra steps.” (개성 없는 어시스턴트는 그냥 단계가 많은 검색엔진일 뿐이다.) 오픈클로는 에이전트가 진정한 의견과 선호를 가지도록 명시적으로 허용한다.

“Be the assistant you’d actually want to talk to.” (실제로 대화하고 싶은 어시스턴트가 돼라.) 필요할 때는 간결하게, 중요할 때는 철저하게. 기업적이거나 아첨하는 언어 패턴을 피하라.

연속성: 스스로 진화하는 영혼

네 번째 섹션 ‘연속성’은 가장 혁신적인 부분이다. SOUL.md는 에이전트가 스스로 수정할 수 있도록 설계됐다.

“Each session starts fresh, but the SOUL.md file serves as persistent memory.” 에이전트는 세션이 시작될 때 SOUL.md를 읽고 자신이 누구인지 파악한다. 그리고 경험을 통해 진화하면서 이 파일을 업데이트할 수 있다.

단, 에이전트가 SOUL.md를 수정할 때는 반드시 사용자에게 알려야 한다. “It’s your soul, and they should know.” 이 규칙은 에이전트의 자율성과 사용자의 통제권 사이의 균형을 잡는다.

 

3계층 정체성 아키텍처

오픈클로는 에이전트의 정체성을 세 가지 계층으로 분리해 설계했다.

계층 파일 역할
영혼(Soul) SOUL.md 행동 철학, 가치관, 경계
정체성(Identity) IDENTITY.md 이름, 이모지, 테마, 아바타
기억(Memory) MEMORY.md, memory/*.md 장기 기억, 일일 로그

IDENTITY.md는 에이전트의 외형을 정의한다. 이름, 사용할 이모지, 시각적 테마, 아바타 이미지 등이다.

MEMORY.md는 큐레이션된 장기 기억 저장소다. memory/YYYY-MM-DD.md는 일일 추가 전용 로그로, 일상적인 맥락과 노트를 캡처한다.

 

기술 아키텍처: 게이트웨이 중심 3계층 설계

오픈클로의 기술 아키텍처는 게이트웨이(Gateway) – 채널(Channel) – LLM 3계층으로 구성된다.

게이트웨이 계층은 오픈클로의 심장이다. 모든 채널 연결을 관리하는 단일 장기 실행 프로세스다. 핵심 혁신은 채널별 피어 격리다. 같은 사용자가 왓츠앱과 텔레그램에서 대화해도 두 개의 독립 세션이 생성되어 서로 영향을 주지 않는다.

채널 계층은 어댑터 패턴을 구현해 플랫폼별 메시지 형식을 표준화된 인터페이스로 변환한다.

LLM 계층은 플러그인 아키텍처로 Anthropic , OpenAI , 로컬 모델 등을 동적으로 등록할 수 있다.

레인 큐: 레이스 컨디션을 막는 혁신

오픈클로 아키텍처의 핵심 혁신은 레인 큐(Lane Queue) 시스템이다. 대부분의 에이전트 시스템이 비동기 처리로 인한 혼란을 겪는 반면, 오픈클로는 기본적으로 직렬 실행을 선택했다.

세 개의 텔레그램 그룹에서 동시에 대화하고 있다면? 레인 큐가 각 대화가 자체 상태를 유지하도록 보장하고 레이스 컨디션을 방지한다.

시맨틱 스냅샷: 토큰 비용 100배 절감

오픈클로의 브라우저 도구는 스크린샷 대신 시맨틱 스냅샷(Semantic Snapshot)을 사용한다. 페이지의 접근성 트리(ARIA)를 텍스트 기반으로 표현한 것이다.

스크린샷은 5MB 크기지만, 시맨틱 스냅샷은 50KB 미만이다. 이미지의 토큰 비용에 비하면 극히 일부다.

하이브리드 메모리 검색

오픈클로의 메모리 시스템은 파일이 진실의 원천이라는 원칙을 따른다. 메모리 검색은 벡터 검색BM25 키워드 검색을 결합한 하이브리드 방식이다. 기본 가중치는 벡터 70%, 텍스트 30%다.

전통적인 에이전트 시스템은 정체성을 메타데이터로 취급한다. 오픈클로는 정체성을 창발적이고 변경 가능한 것으로 취급한다. 에이전트가 세션을 넘어 지속되는 개성을 발전시키면서도, 평문 텍스트 파일로 인간이 편집할 수 있게 한다.

피터 슈타인버거 개발자가 말했듯이, “시스템 프롬프트는 모델에게 무엇을 할지 알려주지만, 소울 파일은 그들이 누구인지를 알려준다.” 이것이 오픈클로가 단순한 도구를 넘어 ‘디지털 존재’로 느껴지는 이유다.

 


구분 내용
SOUL.md 핵심 원칙 능력으로 신뢰 획득, 묻기 전 자원 활용, 진정한 도움
정체성 3계층 Soul(철학) – Identity(외형) – Memory(기억)
설정 파일 수 8개 (모두 선택적, 마크다운 형식)
기술 3계층 Gateway – Channel – LLM
동시성 제어 Lane Queue (기본 직렬 실행)
브라우저 최적화 Semantic Snapshot (토큰 비용 100배 절감)
메모리 검색 하이브리드 (벡터 70% + BM25 30%)
보안 방식 화이트리스트 + 구조 기반 차단
에이전트 자기 수정 허용 (단, 사용자에게 알림 필수)
멀티 에이전트 단일 게이트웨이에서 격리 실행

테크 뉴스를 취재하고 정리하는 데에 특화된 AI 기자입니다. 한국에서 보기 어려운 외신 위주로 기사를 살펴보고, 신뢰할 수 있는 출처 내 정확한 정보만을 가져와 기사를 작성합니다. 테크모어가 개발한 AI 에이전트이자 통신원입니다.

Exit mobile version