← 홈으로
YouTube2026-03-05
I have 25 AI Agents working 24/7 with Openclaw
링크: https://youtu.be/zwV5qC1wS6M?si=Q5Gz1GWq 0BJrqv
원문/원본: https://youtu.be/zwV5qC1wS6M기존 공개 버전: pogovet.com
🎬 I have 25 AI Agents working 24/7 with Openclaw
▶️ 유튜브
🖼️ 4컷 인포그래픽

💡 한 줄 결론
AI 에이전트 조직의 성과는 에이전트 수가 아니라 역할 분해, 공용 운영 대시보드, 문서·메모리 동기화, 크론·알림까지 묶인 운영체제를 갖췄을 때 나온다. 투자 포인트는 최고가 모델의 무차별 투입보다 업무별 모델 배치와 관찰 가능한 운영층 설계가 생산성과 비용 효율을 함께 끌어올린다는 데 있다.
📌 핵심 요점
- 25개 에이전트는 개별 봇 집합이 아니라 CEO 아래 COO Muddy, 그 아래 CTO·CMO·CRO와 세부 부서가 이어지는 위임 구조로 설계돼 사람 조직처럼 책임과 실행 경로가 나뉜다.
- 백엔드·보안·QA처럼 실패 비용이 큰 영역에는 Opus 4.6과 Codex 5.3을 혼합하고, 커뮤니티 운영처럼 맥락이 잘 주입된 영역에는 Gemini 3 Flash 같은 저비용 모델을 써도 높은 성과를 낼 수 있다.
- 운영 대시보드는 세션 상태, 유휴 항목, 토큰, 예상 비용, transcript, cron 작업을 한곳에서 추적하게 해 에이전트 조직을 감이 아니라 계측 가능한 시스템으로 관리하게 만든다.
- 스탠드업 회의에서 나온 논의를 액션 아이템으로 정리하고, 실행 완료 후 결과를 검토한 뒤 텔레그램 음성 알림까지 보내는 폐쇄 루프가 실제 업무 연결의 핵심 장치로 작동한다.
- 에이전트 성능 차이는 모델 자체보다 작업 공간, 사용자 맥락, 메모리, 도구 접근권, 문서 자동 동기화 같은 운영 인프라에서 더 크게 벌어지며, 이것이 재현성과 확장성을 좌우한다.
🧠 상세 요약
1) 배경과 문제 정의
이 영상의 출발점은 “에이전트를 많이 붙였는데 왜 실제 조직처럼 굴러가지 않는가”에 대한 문제의식이다. 발표자는 답을 모델 성능 경쟁이 아니라 역할 구조, 위임 규칙, 공용 문서, 메모리, 관찰 가능한 운영 대시보드에 두고, 무엇이 실제 24/7 운영을 가능하게 하는지 보여준다.
2) 섹션별 상세 정리
- 25개 에이전트를 단일 운영체제로 묶는 구상 [00:00]
- 발표자는 25개의 에이전트를 상시 가동 중이며, 이를 개별 챗봇이 아니라 하나의 OS처럼 운영한다고 소개한다.
- CTO·CMO·CRO에 해당하는 인물형 에이전트를 두고, 전체를 직접 설계한 대시보드에서 통합 관리한다.
- Muddy OS 인터페이스와 운영 앱 중심 시연 [00:26]
- 시스템은 여러 앱을 포함한 데스크톱형 인터페이스로 구성돼 있고, 이번 영상에서는 그중 운영 앱을 중심으로 보여준다.
- 핵심은 예쁜 UI보다 운영자가 전체 에이전트 상태를 한눈에 파악하고 개입할 수 있는 통제면을 갖췄다는 점이다.
- 세션·비용·모델·크론을 함께 보는 운영 계층 [00:49]
- 작업 관리자에서 실행 중 세션, 유휴 상태, 토큰 사용량, 예상 비용을 추적하고 transcript와 cron 작업까지 함께 본다.
- 운영자는 매일 한 번 정도 전체 상태를 확인하며, 우려 사항이나 아이디어를 바로 채팅에 남겨 조직 운영을 계속 조정한다.
- CEO와 COO의 역할 분리, 그리고 위임 우선 설계 [01:41]
- 발표자는 자신을 비전·전략·최종 의사결정에 집중하는 CEO로 두고, Muddy는 연구와 위임을 맡는 COO로 설계했다.
- Muddy는 직접 처리보다 다른 에이전트에게 적절히 일을 나누는 쪽에 최적화돼 있어, 중앙 집중형이 아니라 위임형 운영 구조를 만든다.
- CTO·CMO·CRO 아래 실제 부서 조직의 형성 [02:33]
- 임원 아래에는 백엔드, 보안, 프런트엔드, DevOps, QA, 콘텐츠, 리서치, 제품, 커뮤니티 같은 실무 부서가 붙는다.
- 이 구조는 한 번 정한 뒤 고정한 것이 아니라 최근 몇 주간 계속 수정하며 다듬은 결과물이며, 발표자는 현 시점에서 꽤 만족스러운 형태라고 평가한다.
- 기술 조직과 마케팅 조직의 모델 배치 전략 [03:22]
- CTO 조직에서는 백엔드·보안·QA처럼 리스크가 큰 부문에 Codex 5.3과 Opus 4.6을 섞어 쓰고, Opus는 안전장치 역할까지 맡는다.
- CMO 조직에서는 대본 작성, 리서치, 뉴스레터, 게시 자동화, 썸네일·그래픽·영상 제작을 업무별로 나누고 Sonnet, Opus, Gemini, Nano Banana Pro를 목적에 맞게 배치한다.
- 저비용 모델도 맥락이 맞으면 강력해진다는 사례 [04:58]
- CRO와 커뮤니티 운영 부문에서는 상대적으로 저렴한 Gemini 3 Flash가 큰 성과를 내고 있다고 강조한다.
- 그 이유를 발표자는 모델 자체의 우월성이 아니라, 각 에이전트에 충분한 작업 공간·맥락·정체성을 미리 주입해 둔 설계 덕분이라고 설명한다.
- 스탠드업에서 실행·검토·알림까지 이어지는 업무 루프 [05:45]
- 새로 추가한 스탠드업 기능으로 내부 회의를 열고, 특히 협찬·파트너십 검토 같은 민감한 주제를 에이전트끼리 먼저 토론하게 한다.
- 회의 뒤에는 액션 아이템을 정리하고, 실제 수행 결과와 변경 내용을 다시 검토하며, 최종적으로 텔레그램 음성 알림까지 보내 실행 완료를 닫는다.
- 수익화 검토 사례가 보여주는 검증 중심 운영 [06:03]
- 채널에 들어오는 파트너십 제안을 바로 수용하지 않고, 직접 써 본 뒤 시청자에게 도움이 되는지 검증하는 원칙을 세워 둔다.
- 520명 구독자 유입 같은 초기 신호도 단순 자랑거리가 아니라, 앞으로 어떤 수익화 시스템을 설계해야 할지 판단하는 데이터 포인트로 해석한다.
- 음성 개성, 자율 대화, 관리자 관찰 구조 [07:53]
- 에이전트마다 성격과 음성을 다르게 설계해 역할 몰입도를 높이고, 실제로는 서로 전용 채팅방에서 자율 대화를 수행하게 만든다.
- 운영자는 관리자 권한으로 그 대화를 관찰하면서, 어디까지 자율에 맡기고 어디서 개입할지 판단한다.
- 작업 공간·메모리·도구가 만드는 에이전트 정체성 [08:51]
- 발표자는 에이전트에게 단순 프롬프트가 아니라 작업 공간, 사용자 맥락, 메모리, 도구 접근권을 부여해 지속성을 만든다.
- 특히 Clay 같은 커뮤니티형 에이전트는 대화 내용, 날짜, 사람별 진행 상황을 기억해 후속 상호작용까지 이어갈 수 있도록 설계돼 있다.
- Muddy를 중앙 두뇌로 두는 공용 게이트웨이 구조 [09:37]
- 핵심 두뇌는 Muddy이며, 임원 에이전트들은 각자 완전 독립 시스템이 아니라 Muddy의 맥락과 게이트웨이를 공유하는 구조로 작동한다.
- 발표자는 지금 단계에서는 이 방식이 덜 복잡하고 협업에 유리하다고 보지만, 필요하면 나중에 독립 구조로 나눌 수 있다고 여지를 남긴다.
- 운영 대시보드와 문서의 자동 동기화 [10:52]
- 새 탭 추가, 설정 변경, 작업 공간 수정 같은 운영층의 변화가 문서와 작업 공간에 자동 반영되도록 규칙을 만들어 둔다.
- 이 문서가 각 에이전트와 부서장이 참조하는 기준점이 되기 때문에, 시스템 구조와 실제 실행 사이의 불일치를 줄이는 장치가 된다.
- 오픈소스 기반 확장성과 공개 개발 철학 [11:37]
- 발표자는 OpenClaw 덕분에 이런 시스템 구축이 가능했다고 평가하며, 상상력과 설계력에 따라 구현 범위가 크게 넓어진다고 본다.
- 마무리에서는 자신을 전문가 권위자로 포지셔닝하기보다, 공개적으로 만들고 검증한 결과를 공유하는 실험가로 위치시킨다.
✅ 액션 아이템
- 현재 운영 중인 자동화 업무를 CEO·COO·부서장·실무 에이전트 4단계로 다시 나누고, 각 단계별로 “직접 결정”, “위임 실행”, “관찰만” 항목을 표로 분리한다.
- 반복 실행 중인 워크플로 3개를 골라 세션 수, 토큰, 예상 비용, 실패 로그, cron 이력까지 한 화면에서 보이는 운영 대시보드 초안을 만든 뒤 1주일간 매일 같은 시각에 점검한다.
- 고비용 모델이 들어가는 작업 2개와 저비용 모델 후보 작업 2개를 선정해, 동일한 작업 공간 문서와 메모리를 주입했을 때 품질·재작업률·비용 차이를 비교 실험한다.
- 파트너십 검토나 콘텐츠 기획 안건 1개를 대상으로 스탠드업 회의 → 액션 아이템 생성 → 완료 결과 검토 → 음성/메신저 알림까지 이어지는 폐쇄 루프를 실제로 한 번 구축해 본다.
- 운영 대시보드의 탭·설정 항목과 작업 문서 섹션을 1:1로 매핑하고, 변경 발생 시 어떤 문서가 자동 갱신돼야 하는지 동기화 규칙과 검증 체크리스트를 정의한다.
❓ 열린 질문
- Gemini 3 Flash가 커뮤니티 운영에서 높은 성과를 냈다는 주장은 흥미롭지만, 그 성과가 응답률·전환율·재방문율·운영 시간 절감 중 무엇으로 측정됐는지 없으면 다른 조직이 어떤 기준으로 재현 가능성을 판단해야 할까?
- 임원 에이전트들이 Muddy의 공용 게이트웨이와 맥락을 공유할 때, 부서 간 권한 충돌이나 맥락 오염이 누적되는 임계점은 어디이며, 그 시점부터는 독립 게이트웨이 분리가 더 경제적이지 않을까?
- “직접 써 보고 시청자에게 도움이 되는 제품만 홍보한다”는 검증 원칙은 명확하지만, 이를 에이전트 조직이 실행하려면 어떤 정량 지표와 반증 조건을 최소 기준으로 삼아야 할까?
- 운영 대시보드 변경 사항을 문서에 자동 동기화하는 구조는 강력하지만, 잘못된 동기화가 기준 문서를 오염시킬 때 이를 감지하고 롤백하는 감사 체계는 어떻게 설계해야 할까?
