← 홈으로
YouTube2026-03-21·14F 일사에프
피지컬 AI, 노동의 종말이 온다… 우리에게 남은 시간은? (김대식 1부)ㅣ10분 토론 / 14F
생성형 AI의 다음 전장은 ‘행동하는 AI’와 ‘현실에서 일하는 로봇’이며, 승부는 알고리즘 자체보다도 실제 숙련 동작 데이터를 누가 먼저 확보하느냐에서 갈릴 가능성이 크다.
원문/원본: https://youtu.be/LLBuMN1ZRTw기존 공개 버전: pogovet.com
🎬 피지컬 AI, 노동의 종말이 온다… 우리에게 남은 시간은? (김대식 1부)ㅣ10분 토론 / 14F
▶️ 유튜브
![]()
🖼️ 4컷 인포그래픽

💡 한 줄 결론
- 생성형 AI의 다음 전장은 ‘행동하는 AI’와 ‘현실에서 일하는 로봇’이며, 승부는 알고리즘 자체보다도 실제 숙련 동작 데이터를 누가 먼저 확보하느냐에서 갈릴 가능성이 크다.
📌 핵심 요점
- AI 발전의 무게중심이 텍스트·이미지 생성에서 웹을 스스로 조작하는 에이전틱 AI와 현실 공간에서 움직이는 피지컬 AI로 빠르게 이동하고 있다.
- 에이전틱 AI는 단순 답변을 넘어 검색, 비교, 입력, 결제 같은 실행 단계까지 맡으면서 기존 SaaS와 전문직 소프트웨어의 가격 구조를 흔들 수 있다는 문제의식이 제시된다.
- 피지컬 AI의 가장 큰 병목은 모델 구조보다 데이터이며, 인터넷에 풍부한 텍스트·이미지와 달리 로봇 학습에 필요한 관절값·행동 데이터는 거의 축적돼 있지 않다.
- 시뮬레이션만으로 현실의 미세한 마찰, 환경 변수, 숙련 동작을 모두 재현하기 어렵기 때문에 현실 데이터와 시뮬레이션을 결합한 혼합형 접근이 유력한 해법으로 제시된다.
- 한국은 제조업 현장과 숙련 인력이 아직 넓게 남아 있다는 점에서 공장용 피지컬 AI 학습 데이터 확보에 유리할 수 있으며, 향후 5년이 중요한 준비 기간으로 제시된다.
🧩 배경과 문제 정의
- 생성형 AI가 글, 그림, 코드, 영상 영역에서 빠르게 실용화되면서 관심은 이제 “무엇을 만들어내는가”보다 “무엇을 직접 실행하고 움직이는가”로 이동하고 있다.
- 에이전틱 AI는 디지털 환경에서 사람 대신 클릭·입력·예약·결제 같은 행동을 수행하고, 피지컬 AI는 그 흐름이 현실 공간의 노동과 로봇으로 확장된 형태로 제시된다.
- 하지만 생성형 AI가 인터넷에 축적된 막대한 데이터의 수혜를 입은 것과 달리, 피지컬 AI는 학습의 핵심 재료인 실제 동작 데이터가 부족하다는 구조적 한계를 안고 있다.
- 로봇에게 필요한 것은 텍스트나 사진이 아니라 관절값, 힘의 분배, 균형, 마찰 대응 같은 움직임 정보이며, 이는 공개된 형태로 충분히 쌓여 있지 않다.
- 단순한 수식 기반 제어나 시뮬레이션만으로는 현실의 복잡한 변수들을 모두 다루기 어려워, 실제 현장의 숙련 동작을 어떻게 데이터화할지가 핵심 과제로 떠오른다.
- 이 문제는 단지 기술 개발의 범위를 넘어서 노동 대체, 제조업 경쟁력, 숙련 전수, 국가 전략 자산 형성까지 연결되는 중대한 변화로 다뤄진다.
🕒 시간순 섹션별 상세정리
- 에이전틱 AI와 피지컬 AI가 동시에 현실화되는 전환점 [01:46]
- 불과 6개월 전의 AI 기준으로 현재를 설명하기 어려울 만큼 변화 속도가 빨라졌다는 인식이 제시된다.
- 코딩 경험이 없는 사람도 AI에 자연어로 지시해 개발을 수행하는 흐름이 생기며, IT 업계 신입 개발자 수요가 이미 흔들리고 있다는 진단이 나온다.
- 작년 여름과 비교해 지금은 전혀 다른 국면이며, 그 핵심 변화축으로 에이전틱 AI와 피지컬 AI가 함께 지목된다.
- 생성형 AI에서 ‘행동하는 AI’로 이동하는 기준선 [02:25]
- 기존 생성형 AI가 정보 검색과 글·그림·영상 생성에 머물렀다면, 에이전틱 AI는 실제 웹사이트에 들어가 메뉴를 누르고 입력하고 결제까지 수행하는 자율 실행 능력이 핵심으로 설명된다.
- 사용자가 진짜 원하는 것은 단순 추천이 아니라 비교·선택·예약까지 끝내주는 AI라는 관점이 제시된다.
- 작년까지만 해도 공상과학처럼 보였던 수준이 올해 들어 실제 가능한 단계에 근접했다는 점이 강조된다.
- 플러그인형 지식 확장과 SaaS 위기론 [03:14]
- 특정 에이전틱 AI가 새로운 전문 지식을 지속적으로 받아들이며 능력을 넓히고 있고, 그 결과 법률 같은 고부가가치 영역까지 빠르게 잠식할 수 있다는 사례가 제시된다.
- 수천 장 계약서를 검토하는 기존 고가 엔터프라이즈 소프트웨어와 유사한 기능을 훨씬 낮은 비용으로 수행할 수 있다는 비교가 나온다.
- 성능이 약간 낮더라도 가격 차이가 압도적이면 기존 SaaS 기업의 사업성 자체가 흔들릴 수 있다는 논리가 전개된다.
- 기능 하나가 업종 전체를 흔드는 방식 [04:31]
- 법률 지식이 추가된 뒤 관련 소프트웨어 기업 주가가 하락했고, 이후 보안 지식이 들어오자 보안업 주가도 흔들렸다는 사례가 이어진다.
- 미국 정부 시스템에 많이 남아 있는 코볼 같은 레거시 언어 영역까지 AI가 다루기 시작하면, 희소성을 가졌던 유지·업그레이드 사업도 위협받을 수 있다는 분석이 나온다.
- 개별 기능 추가가 단순 편의 개선이 아니라 기존 산업의 가격 구조와 인력 구조를 무너뜨리는 사건으로 읽힌다.
- 피지컬 AI도 더 이상 먼 미래가 아니라는 주장 [06:21]
- 작년 여름까지만 해도 피지컬 AI는 10년, 20년 뒤의 일처럼 보였지만, 올해 들어 자율적으로 움직이는 휴머노이드가 등장하기 시작했다는 평가가 나온다.
- 과거 공개된 로봇 시연 상당수는 뒤에서 원격 조작된 결과였지만, 이제는 자율 행동 능력이 가시화되고 있다는 점이 차이로 제시된다.
- 테슬라 옵티머스와 현대차-보스턴다이내믹스 아틀라스 등이 예시로 언급되며, 공장 자동화가 갑자기 현실적 시간표 안으로 들어왔다는 분위기가 형성된다.
- 피지컬 AI의 본질적 병목은 데이터 종류가 다르다는 점 [07:15]
- 오늘날 AI가 글·그림·코딩·영상에서 강한 이유는 인터넷에 방대한 데이터가 쌓여 있었기 때문이라는 설명이 다시 정리된다.
- 반면 로봇에게 필요한 것은 텍스트나 이미지가 아니라 실제 몸의 움직임을 나타내는 관절값 데이터라는 점이 핵심 문제로 제시된다.
- 피지컬 AI의 성능은 결국 어떤 움직임 데이터를 얼마나 확보하느냐에 크게 달려 있으며, 이 점에서 생성형 AI와 출발선이 전혀 다르다고 본다.
- 왜 로봇의 걷기와 문 열기가 그렇게 어려운가 [08:26]
- 실험실 차원에서도 로봇 연구는 매우 어려웠고, 과거 휴머노이드 경진대회 영상에서는 걷다가 넘어지고 문을 열다 쓰러지는 장면이 반복됐다고 회고한다.
- 사람에게는 당연해 보이는 걷기와 문 열기 같은 동작이 공학적으로는 극도로 복잡한 제어 문제라는 설명이 이어진다.
- 현재 상태의 관절값에서 목표 상태의 관절값으로 이동하는 함수를 안정적으로 찾는 일은 쉽지 않으며, 단순한 수식 접근만으로는 잘 풀리지 않는다고 강조한다.
- 수식과 시뮬레이션만으로는 현실을 못 따라간다 [09:45]
- 인간은 숨 쉬고 걷는 법을 명시적으로 설명하지 못해도 수행하지만, 기계는 이를 계산 가능한 형태로 풀어야 해서 난도가 급격히 높아진다는 비유가 나온다.
- 컴퓨터 시뮬레이션 안에서는 잘 되더라도 실제 바닥의 모래, 미세한 마찰 변화, 예기치 않은 환경 변수 때문에 현실에서는 쉽게 무너질 수 있다고 본다.
- 피지컬 AI가 늦었던 이유는 현실을 충분히 정교하게 모델링하는 것이 거의 불가능했기 때문이라는 문제의식이 드러난다.
- 물체 인식과 언어도 결국 학습이 풀었다는 선례 [10:07]
- 초창기 AI는 고양이를 규칙으로 설명하려 했지만 실패했고, 대량 이미지 데이터를 학습시키는 방식으로 물체 인식이 돌파됐다는 사례가 제시된다.
- 언어 역시 문법 규칙을 오랫동안 가르쳤지만 충분히 해결되지 않았고, 거대한 문장 데이터와 트랜스포머 기반 학습이 돌파구가 됐다고 정리한다.
- 이 선례를 통해 로봇도 결국 사람이 손으로 규칙을 짜기보다 학습 중심으로 전환해야 한다는 논리가 뒷받침된다.
- 로봇공학이 뒤늦게 학습 중심으로 방향을 튼 이유 [11:38]
- 기계공학 기반 로봇 연구자들은 블랙박스 성격이 강한 AI를 불편해해 왔고, 수식으로 완전히 설명 가능한 체계를 선호해 왔다는 평가가 나온다.
- 하지만 기존 방식으로는 한계가 분명해지면서, 작년부터는 인간처럼 실제 움직임을 학습시키는 방향이 본격 시도되기 시작했다고 본다.
- 인간이 실제로 걷고 움직일 수 있다는 사실 자체가, 어딘가에는 그 움직임을 가능하게 하는 정보 구조가 있다는 근거로 제시된다.
- 문제는 학습으로 가도 인터넷에 로봇 데이터가 없다는 점 [12:23]
- 피지컬 AI는 알고리즘을 개발하는 것과 동시에 학습용 데이터 자체를 새로 생산해야 하는 분야로 설명된다.
- 생성형 AI처럼 이미 축적된 공개 데이터에 기대는 것이 아니라, 기업이 직접 동작 데이터를 모으고 정제해야 하는 구조라는 점에서 진입장벽이 높다.
- 결국 누가 더 빨리, 더 많이, 더 적절한 움직임 데이터를 모으느냐가 경쟁력의 핵심으로 제시된다.
- 사람 시연 기반 수집과 시뮬레이션 기반 수집의 갈림길 [12:39]
- 한 방법은 사람에게 장비를 착용시키고 로봇이 그 동작을 따라 하게 하며 데이터를 축적하는 방식으로 설명된다.
- 이 방식은 실제 동작을 반영한다는 장점이 있지만, 사람을 대거 동원해야 하고 축적 속도가 매우 느리다는 한계가 지적된다.
- 다른 한편으로는 게임이나 가상환경처럼 시뮬레이션에서 대규모 학습을 먼저 하자는 방향이 소개된다.
- 시뮬레이션 만능론에 대한 경계 [13:17]
- 시뮬레이션만으로 모든 문제를 풀 수 있다는 주장에 대해, 현실의 아날로그 다양성을 컴퓨터 안에 완전히 옮기는 것은 어렵다는 반론이 제기된다.
- 실제 세계를 정밀하게 복제하려면 지나치게 많은 계산과 가정이 필요하므로, 시뮬레이션은 출발점일 수는 있어도 최종 해법은 아니라는 입장이다.
- 결과적으로 거친 움직임은 시뮬레이션으로, 미세 조정은 현실 학습으로 보완하는 혼합 접근이 더 현실적이라는 방향이 암시된다.
- 젠슨 황의 주장과 이해관계 해석 [14:01]
- 시뮬레이션 중심 해법을 강하게 말하는 인물의 견해는 기술적으로 참고할 가치가 있지만, GPU 판매라는 사업적 이해관계와 분리해서 볼 수 없다는 비판이 나온다.
- 모든 문제의 해법이 더 많은 GPU로 귀결되는 프레임은 공급자 입장에서는 자연스럽지만, 사회 전체의 최적해와 일치하는지는 별개라는 시선이 제시된다.
- 특정 리더의 발언을 미래 예언처럼 받아들이기보다, 어떤 전제와 유인을 갖고 말하는지 함께 봐야 한다는 태도가 강조된다.
- 현실적인 해법은 결국 혼합형 접근 [15:28]
- 기업들이 실제로 선택할 가능성이 높은 방법으로 시뮬레이션과 현실 학습을 병행하는 방식이 제시된다.
- 인터넷 데이터처럼 30년 축적을 기다릴 수 없기 때문에, 빠른 확장을 위해서는 시뮬레이션이 필요하지만 정밀도 확보에는 현실 데이터가 필수라는 설명이다.
- 여기서부터 진짜 경쟁력은 누구의 움직임을 어떤 목적으로 데이터화하느냐로 넘어간다고 본다.
- 가정용보다 먼저 공장용이 오지만, 데이터는 더 어렵다 [15:53]
- 현재 방식으로 훈련된 로봇은 세탁이나 간단한 집안일처럼 비교적 일상적 작업에는 접근할 수 있겠지만, 고난도 산업 작업은 전혀 다른 문제라고 본다.
- 조선소 용접 같은 공장 작업은 숙련된 장인의 수년 경험이 반영된 움직임이 필요하므로, 일반 아르바이트생의 시연 데이터로는 대체하기 어렵다는 지적이 나온다.
- 안전성 문제까지 고려하면 가정용 로봇보다 공장용 도입이 먼저일 가능성이 높지만, 정작 필요한 데이터는 공장 쪽이 훨씬 더 전문적이라는 역설이 제시된다.
- 데이터는 기술만이 아니라 문화와 숙련도까지 담는다 [16:51]
- 미국 학생이 학습시킨 로봇과 한국 학생이 학습시킨 로봇의 물건 건네는 방식이 다르게 나타난다는 사례를 통해, 데이터는 행동 스타일과 문화적 습관까지 반영할 수 있음을 보여준다.
- 이는 피지컬 AI가 단순히 움직임 수집의 문제가 아니라, 어떤 사람과 어떤 현장의 행동을 데이터로 삼느냐의 문제라는 뜻으로 읽힌다.
- 따라서 전문 산업 현장에서 필요한 행동 데이터를 비전문 인력으로 대체해 수집하는 데는 구조적 한계가 있다는 논리로 이어진다.
- 한국 제조업이 피지컬 AI 시대에 갖는 의외의 기회 [17:24]
- 한국은 반도체부터 종이빨대, 김치 공장까지 제조업 스펙트럼이 넓게 남아 있어 비효율적으로 보였지만, 오히려 이것이 피지컬 AI 시대의 자산이 될 수 있다는 해석이 제시된다.
- 산업별 공정 현장마다 수십 년 숙련을 축적한 장인들이 남아 있고, 이들의 움직임은 공장용 로봇 학습에 매우 가치 있는 데이터가 될 수 있다고 본다.
- 미국처럼 제조업 저변이 약해진 나라보다, 다양한 실제 생산 현장이 남아 있는 나라가 거대 액션 모델 구축에서 유리할 수 있다는 관점이 드러난다.
- 향후 5년의 과제와 노동 대체 전망 [18:31]
- 앞으로 5년 안에 현장 장인들의 움직임을 집중적으로 데이터화해야 하며, 이것이 공개 인터넷 데이터와 달리 쉽게 모방당하지 않는 전략 자산이 될 수 있다는 주장이 나온다.
- 한국은 메모리 경쟁력과 현대차-보스턴다이내믹스 같은 로봇 기술 접점을 활용할 여지가 있어, 모든 분야를 다 잘하려 하기보다 강점을 가진 축을 집중해야 한다는 현실론이 제시된다.
- 피지컬 AI가 공장에서 사람을 실질적으로 대체하는 시점은 대략 10년에서 20년 사이로 추정되며, 코딩처럼 설비투자가 덜 필요한 직무부터 먼저 대체가 시작되고 제조 현장으로 확산될 가능성이 언급된다.
🧾 결론
- 이 영상은 AI 발전의 다음 단계가 단순 생성이 아니라 실행과 물리적 노동으로 향하고 있다는 점을 강하게 보여준다.
- 특히 피지컬 AI의 핵심은 더 똑똑한 알고리즘 하나보다도, 실제 현장과 숙련자에게서 나온 동작 데이터를 얼마나 빠르게 확보하고 학습 체계로 전환하느냐에 있다는 문제의식을 제시한다.
- 따라서 앞으로의 경쟁은 모델 경쟁만이 아니라 데이터 수집 인프라, 산업 현장 접근성, 숙련 전수 체계, 제조업 기반의 폭을 둘러싼 경쟁이 될 가능성이 크다.
- 한국처럼 다양한 제조 현장이 살아 있는 국가는 이를 단순 낙후의 상징이 아니라 전략 자산으로 재해석할 필요가 있다는 메시지가 중심에 놓인다.
📈 투자·시사 포인트
- 에이전틱 AI 확산은 기존 SaaS와 전문 소프트웨어 기업의 가격 결정력, 유지보수 매출, 인력 구조를 압박할 가능성이 있다.
- 피지컬 AI 국면에서는 모델 기업뿐 아니라 로봇 하드웨어, 센서, 시뮬레이션 도구, 산업 데이터 수집 장비, 학습 파이프라인을 가진 기업들의 중요성이 커질 수 있다.
- 제조 현장의 숙련 동작을 데이터화할 수 있는 기업이나 국가가 장기적으로 강한 진입장벽을 확보할 수 있다는 관점이 제시된다.
- 한국 제조업은 저부가가치 산업 잔존이 아니라, 다양한 공정 데이터를 보유한 학습 자산 저장소로 재평가될 여지가 있다.
- 다만 실제 상용화 속도는 안전 규제, 설비 투자비, 데이터 수집 비용, 산업별 숙련도 격차에 따라 크게 달라질 수 있다.
⚠️ 불확실하거나 확인이 필요한 부분
- 영상에서 언급된 특정 소프트웨어 기업 주가 하락이 실제로 해당 AI 기능 추가와 직접적으로 인과관계가 있는지는 추가 검증이 필요하다.
- 테슬라 옵티머스, 아틀라스 등 사례가 어느 수준까지 완전 자율 동작을 달성했는지는 별도 기술 검증 자료와 비교가 필요하다.
- 피지컬 AI가 공장에서 사람을 대체하는 시점을 10~20년으로 보는 전망은 인터뷰이의 추정에 가깝고, 산업별 편차가 클 수 있다.
- 한국이 미국보다 거대 액션 모델 구축에 유리할 수 있다는 주장은 제조업 현장 다양성에 기반한 해석이지만, 실제 데이터 인프라·자본·소프트웨어 역량까지 포함한 종합 경쟁력 평가는 추가 확인이 필요하다.
- 시뮬레이션 중심 접근에 대한 비판은 타당한 문제 제기이지만, 실제로 어느 수준의 혼합 비율이 최적인지는 영상만으로 확정하기 어렵다.
✅ 액션 아이템
- 피지컬 AI의 경쟁력을 “모델 성능”이 아니라 “현장 동작 데이터 확보 능력” 관점에서 다시 정리해본다.
- 한국 제조업 내 숙련 데이터가 많은 산업군(조선, 자동차, 반도체, 식품 가공 등)을 우선 후보로 분류해본다.
- 에이전틱 AI가 기존 SaaS를 압박하는 구조를 법률, 보안, 레거시 유지보수 사례 중심으로 따로 메모한다.
- 시뮬레이션 학습과 현실 데이터 학습의 장단점을 비교하는 프레임을 만들어 후속 영상에도 동일하게 적용해본다.
- “노동 대체”를 직무별로 나눠, 설비투자 부담이 낮은 디지털 직무와 높은 제조 직무를 구분해 추적해본다.
❓ 열린 질문
- 숙련 노동의 동작 데이터를 누가 어떤 권리 구조로 수집하고 소유하게 될 것인가?
- 공장 현장의 장인 데이터가 전략 자산이 된다면, 개인 숙련은 임금이 아니라 데이터 자본으로 재평가될 수 있을까?
- 시뮬레이션과 현실 데이터의 최적 조합은 산업별로 얼마나 다를까?
- 한국 제조업의 다양성이 실제 AI 경쟁력으로 이어지려면, 어떤 제도나 기업 협업 구조가 먼저 필요할까?
- 피지컬 AI의 도입이 단순한 노동 대체를 넘어 산업 재배치와 국가 전략까지 바꾸게 될 경우, 어떤 분야가 가장 먼저 수혜 혹은 충격을 받을까?