← 홈으로
YouTube2026-03-04
데이터센터 없는 AI가 온다" 300W급 성능 5W로 구현하는 온디바이스 AI혁신 (김녹원 딥엑스 대표)
🎬 "데이터센터 없는 AI가 온다" 300W급 성능 5W로 구현하는 온디바이스 AI혁신 (김녹원 딥엑스 대표)
원문/원본: https://youtu.be/X47yAfRMqdg기존 공개 버전: pogovet.com
🎬 "데이터센터 없는 AI가 온다" 300W급 성능 5W로 구현하는 온디바이스 AI혁신 (김녹원 딥엑스 대표)
▶️ 유튜브
🖼️ 4컷 인포그래픽

💡 한 줄 결론
딥엑스의 핵심 투자 포인트는 AI 추론의 무게중심을 데이터센터에서 5W급 온디바이스 칩으로 옮겨, 로봇·공장·휴대형 AI까지 확장 가능한 새로운 인프라 표준을 선점하려는 데 있다. 특히 전력·발열·통신지연 한계를 넘기며 실제 고객 양산과 생태계 진입까지 보여줬다는 점이 단순 기술 데모와 다르다.
📌 핵심 요점
- 현대차 로봇 사례는 300W급 GPU 구조가 배터리·발열·통신 안정성 문제로 양산에 부적합하다는 점을 드러냈고, 딥엑스는 이를 5W 미만 칩으로 대체해 피지컬 AI의 실사용 조건을 맞췄다.
- 바이두 응용 알고리즘을 딥엑스 칩에 올렸을 때 300W GPU 대비 약 5배 성능이 나왔다는 대목은, 전성비 개선을 넘어 특정 워크로드에서 구조적 우위가 가능하다는 신호다.
- 중국은 서버 AI 칩은 자립해가고 있지만 5W급 고성능 온디바이스 칩은 공백이 남아 있어, 딥엑스에는 기술 유출 리스크보다 표준 선점 기회가 더 큰 시장으로 제시된다.
- 생성형 AI를 30B~40B급까지 로컬에서 쾌적하게 처리하고 최대 100B까지 겨냥하겠다는 전략은, 데이터센터 증설 대신 로컬 추론으로 인프라 병목을 완화하는 방향에 베팅한 것이다.
- 삼성 5나노 양산과 2나노 프로젝트, 고객사 수상, PaddlePaddle 생태계 계약까지 이어진 흐름은 딥엑스가 칩 설계 회사에 머무르지 않고 글로벌 온디바이스 AI 밑단 표준 사업자로 가려는 그림을 보여준다.
🧠 상세 요약
1) 배경과 문제 정의
이 인터뷰의 출발점은 “AI가 정말 세상을 바꾸려면 왜 서버가 아니라 현장 디바이스 안으로 들어가야 하는가”에 있다. 판단 포인트는 단순 성능이 아니라 전력, 발열, 통신 지연, 양산성, 생태계 편입, 그리고 누가 온디바이스 AI의 표준을 먼저 잡느냐다.
2) 섹션별 상세 정리
- CES와 다보스가 확인해준 딥엑스의 현재 위상 [00:40]
- 딥엑스는 2024·2025년 CES 혁신상을 연속 수상했고 다보스포럼에도 공식 초청되며, 단순 스타트업이 아니라 글로벌 AI 반도체 흐름에서 주목받는 플레이어로 소개된다.
- 올해 수상은 원천기술 자체보다 고객 요구를 반영한 응용 제품과 상용 제품성이 인정받았다는 점에서 한 단계 진화한 성과로 설명된다.
- 기술력보다 더 중요한 시장 검증의 신호 [02:15]
- 미국 산업용 PC 업체가 딥엑스 M.2 모듈을 탑재한 제품으로 CES 베스트 오브 이노베이션을 받은 사례는, 칩 자체보다 고객사 제품 혁신으로 가치가 입증됐다는 점에서 의미가 크다.
- 이는 “좋은 칩”을 넘어서 실제 제품 혁신을 가능하게 하는 부품 공급자로 자리 잡을 수 있음을 보여준다.
- 피지컬 AI 원년과 공장 자동화 흐름 [02:56]
- CES 현장에서는 로봇과 무인화, 다크팩토리 관련 전시가 급증했고, 김녹원 대표는 이를 피지컬 AI가 본격 산업 테마로 올라서는 신호로 해석한다.
- 다보스 역시 AI가 거품이 아니라 현실 산업을 바꾸는 사례를 찾는 방향으로 움직였고, 딥엑스는 현대차 로봇 사례로 이 흐름의 중심에 들어갔다.
- 현대차 로봇이 보여준 온디바이스 AI의 필수 조건 [05:18]
- 현대차는 초기 로봇 개발에 NVIDIA GPU와 서버 연동 구조를 검토했지만, 300W급 전력 소모와 발열, LTE 기반 처리의 지연·끊김 문제 때문에 양산형 로봇 구조로는 맞지 않았다고 한다.
- 딥엑스 칩은 이를 5W 미만 전력으로 대체하면서 유사 성능과 가격 경쟁력까지 맞춰, 피지컬 AI가 현장에서 굴러가기 위한 실질 조건을 충족한 사례로 제시된다.
- 바이두 사례가 증명한 중국 시장의 기회 [06:30]
- 바이두는 기존 인텔·퀄컴·여러 중국 칩을 시험하고도 온디바이스 AI에 회의적이었지만, 딥엑스 칩에 자사 알고리즘을 올린 뒤 GPU 대비 약 5배 성능을 확인하며 태도가 바뀌었다.
- 이후 PaddlePaddle 생태계 공급자 계약과 양산 준비·공급 계약까지 이어지며, 딥엑스는 중국 온디바이스 AI 생태계의 실질 공급자로 들어갈 발판을 마련했다.
- 한국 반도체 생태계와 공급망의 의미 [08:41]
- 딥엑스 칩은 삼성전자 5나노에서 생산되고 패키징·테스트까지 국내 공급망 안에서 이뤄진다고 설명된다.
- 이는 한국이 단지 메모리 강국이 아니라, 팹리스·파운드리·응용 생태계를 결합해 AI 풀스택 국가로 갈 수 있는 가능성을 보여주는 사례로 연결된다.
- 왜 중국 리스크를 감수하면서도 들어가려는가 [12:58]
- 김 대표는 기술 유출 우려를 인정하면서도, 피지컬 AI를 가장 대규모로 밀어붙이는 시장이 현재 중국이라고 본다.
- 신산업 초기에 들어가야 디팩토 스탠더드가 될 수 있고, 중국은 시행착오를 빠르게 흡수하는 테스트베드 역할도 해주기 때문에 전략적 가치가 크다고 판단한다.
- 딥엑스가 노리는 최종 포지션 [16:45]
- 회사는 완제품 브랜드보다 “모든 완제품 안에 들어가는 작은 핵심 부품”이 되려는 전략을 택하고 있다.
- 각국의 소버린 AI 흐름 속에서 온디바이스 AI 밑단의 디팩토 스탠더드를 선점하면, 특정 제품군이 아니라 산업 전체에 걸친 구조적 지위를 얻을 수 있다는 계산이 깔려 있다.
- 딥엑스의 본게임은 생성형 AI의 로컬화 [18:12]
- 신제품 DX-M2, 이른바 DX-Brain 프로젝트의 목표는 ChatGPT류 생성형 AI를 5W급 로컬 디바이스에서 돌리는 것이다.
- 이것이 가능해지면 로봇이 인간 수준의 언어 이해와 복합 작업 수행 능력을 현장에서 갖게 되고, AI PC를 넘어 웨어러블까지 플랫폼이 확장될 수 있다는 청사진이 제시된다.
- 데이터센터 중심 AI의 구조적 한계 비판 [19:26]
- 김 대표는 생성형 AI용 데이터센터에 10조 달러가 투입될 수 있다는 전망에 대해, 환경 부담, 수익화 문제, 전력·메모리 공급 한계 때문에 지속 가능성이 낮다고 본다.
- 원전 건설도 수년이 걸리는 상황에서 데이터센터만 계속 늘리는 방식은 현실적 해법이 아니며, 결국 일부 추론을 로컬로 내리는 구조 전환이 필요하다는 주장으로 이어진다.
- 30B~100B 로컬 추론이 여는 인프라 재편 [20:20]
- 딥엑스는 30B~40B급 모델을 쾌적하게 돌리고 최대 100B까지 겨냥하면서, 전체 요청 중 80% 이상을 로컬이 처리하고 초대형 모델은 정말 필요한 질의만 맡는 구조를 구상한다.
- 이런 구조가 자리 잡으면 데이터센터 인프라의 체감 용량을 사실상 5배 늘리는 효과를 낼 수 있고, 딥시크 이후 확산된 선택적 활성화 아키텍처도 이 논리에 힘을 실어준다.
- 2나노 전환과 제품 로드맵 [23:45]
- 기존 5나노 공정으로는 목표 성능에서 약 10W 수준이 나와 발열·안정성·범용성 측면에서 한계가 있었고, 이를 5W대로 낮추기 위해 삼성 2나노 공정이 필요했다고 설명한다.
- 회사는 올해 하반기 신칩 출시, 연말 오픈 모델 포팅 데모 공개를 예고하며 기술 비전이 실제 제품 일정으로 연결되고 있음을 강조한다.
✅ 액션 아이템
- 삼성 5나노·2나노, 현대차 로봇, 바이두 PaddlePaddle 계약을 기준축으로 두고 딥엑스의 향후 12개월 체크리스트를 만들고, 실제 양산·공개 고객·데모 공개가 일정대로 나오는지 분기별로 검증한다.
- 온디바이스 AI 관련 비교표를 만들어 딥엑스와 NVIDIA Jetson, Qualcomm, Intel, 중국 NPU들의 전력당 성능, 발열, 가격, 배터리 구동 적합성을 로봇·산업용 PC 기준으로 나란히 비교한다.
- 생성형 AI 로컬화 관점에서 30B~40B 모델이 실제로 처리 가능한 업무 범위를 정리하고, “어떤 요청까지 로컬에서 충분한가”를 업무 시나리오별로 분해해 본다.
- 중국 시장 진출 리스크를 투자 메모에 따로 분리해 기술 유출, 보안, 단가 압박, 현지 대체재 출현 가능성을 적고, 그 대신 표준 선점·생태계 진입 이익이 얼마나 큰지 같이 평가한다.
- 데이터센터 증설 수혜주만 볼 게 아니라, 로컬 추론 확산 시 수혜를 받을 반도체·로봇·산업용 디바이스 공급망 기업군을 별도 테마로 묶어 추적한다.
❓ 열린 질문
- 현대차·바이두 사례가 반복 가능한 영업모델인지, 아니면 딥엑스 칩과 특정 알고리즘 궁합이 유난히 좋았던 예외적 성공인지 어떻게 검증할 수 있을까?
- 5W급 생성형 AI가 실제 제품으로 자리 잡으려면 모델 경량화, 메모리 대역폭, 발열 설계 중 어디가 가장 큰 병목이고 딥엑스는 그중 무엇에서 결정적 우위를 갖고 있을까?
- 중국에서 디팩토 표준을 선점하더라도 현지 기업이 빠르게 카피·저가화에 들어올 가능성이 큰데, 딥엑스의 방어력은 칩 설계 자체에 있는가, 소프트웨어 포팅 생태계에 있는가, 고객 통합 경험에 있는가?
- 데이터센터 의존도를 낮추는 로컬 추론 구조가 기술적으로 가능하더라도, 실제 시장에서 수익성이 가장 먼저 입증될 적용처는 로봇·산업용 PC·웨어러블 중 어디일까?
