YouTube2026-03-23·Lex Fridman

Jensen Huang: NVIDIA - The $4 Trillion Company & the AI Revolution

링크: https://youtu.be/vif8NQcjVf0?si=6hH4FKnM29kZTpfa

원문/원본: https://youtu.be/vif8NQcjVf0?si=6hH4FKnM29kZTpfa기존 공개 버전: pogovet.com

🎬 Jensen Huang: NVIDIA - The $4 Trillion Company & the AI Revolution | Lex Fridman Podcast #494

▶️ 유튜브

원본 링크: https://youtu.be/vif8NQcjVf0?si=6hH4FKnM29kZTpfa

🖼️ 4컷 인포그래픽

💡 한 줄 결론

이 대화는 엔비디아를 단순한 칩 회사가 아니라, 분산 AI 시대의 병목을 공동설계·생태계·공급망·조직 운영으로 함께 푸는 ‘AI 인프라 플랫폼 회사’로 규정하며, 앞으로의 핵심 제약이 알고리즘만이 아니라 컴퓨트·전력·제조·설치 기반 전체에 있다는 점을 강조한다.

📌 핵심 요점

젠슨 황은 AI의 핵심 문제가 더 이상 단일 GPU 성능 향상이 아니라, 분산 시스템에서 발생하는 네트워킹·스위칭·메모리·전력·냉각·소프트웨어 병목을 함께 푸는 것이라고 설명한다. 즉, 칩 최적화만으로는 부족하고 데이터센터와 랙, 팟, 공급망까지 포함한 공동설계가 필요하다는 관점이 대화 전반을 관통한다.
엔비디아의 장기 경쟁우위로는 CUDA 설치 기반과 생태계가 반복적으로 제시된다. 기술적으로 더 아름다운 구조보다 실제로 널리 배포된 아키텍처와 개발자 기반이 더 중요하다는 논리 아래, GeForce에 CUDA를 실어 대규모 설치 기반을 먼저 만든 선택이 오늘날 해자의 출발점으로 설명된다.
AI 확장의 다음 국면은 프리트레이닝만이 아니라 테스트타임 스케일링과 에이전틱 스케일링으로 이동하고 있다고 본다. 추론은 단순 실행이 아니라 계획·탐색·도구 사용·하위 에이전트 확장까지 포함하는 무거운 과정이며, 이 순환 구조의 최종 병목은 결국 컴퓨트라는 주장이 나온다.
젠슨 황은 리더십을 ‘결론 선언’보다 ‘신념 형성’과 ‘추론 공유’의 과정으로 묘사한다. 조직 내부와 공급망 파트너, 업계 전반에 미래상을 미리 설명하고 공감대를 축적한 뒤 큰 결정을 실행하는 방식이, 엔비디아의 제품 전략뿐 아니라 제조 투자와 파트너 설득에도 같은 원리로 작동한다고 설명한다.
후반부에서는 AI가 직무를 없애기보다 직무의 과업 구조를 바꾸고, 더 많은 사람에게 문제 해결 능력을 확장시킬 수 있다는 시각이 강조된다. 동시에 자동화로 인한 불안과 고통은 현실적인 문제로 인정하며, 개인은 자신의 일을 ‘과업’이 아니라 ‘목적’ 중심으로 재정의하고 AI 활용 역량을 기본 경쟁력으로 갖춰야 한다는 메시지가 제시된다.

🧩 배경과 문제 정의

단일 GPU나 단일 컴퓨터 안에 더 이상 문제가 들어가지 않는 상황에서, 연산 자체보다 분산 과정에서 생기는 병목이 전체 성능을 제한하는 문제가 전면에 놓인다.
컴퓨터 수를 크게 늘려도 원하는 만큼 속도가 오르지 않기 때문에, 알고리즘 분해·파이프라인 샤딩·데이터 샤딩·모델 샤딩을 전제로 한 시스템 전체 최적화가 중요해진다.
GPU 성능만 잘 만드는 방식으로는 네트워킹, 스위칭, 전력, 냉각, 시스템 소프트웨어까지 얽힌 대규모 AI 인프라 문제를 해결하기 어렵다.
엔지니어링 문제만이 아니라, 이런 복합 설계를 실제로 만들어낼 수 있도록 회사 조직 자체도 제품 구조와 환경 변화에 맞게 설계되어야 한다는 관점이 제시된다.

🕒 시간순 섹션별 상세정리

단일 칩 최적화에서 랙·데이터센터 설계로 확장 [00:33]

과거에는 최고의 GPU를 만드는 일이 중심이었지만, 이제는 GPU·CPU·메모리·네트워킹·스토리지·전력·냉각·랙·팟·데이터센터까지 함께 설계하는 단계로 넘어왔다.
질문의 핵심은 이렇게 많은 부품과 설계 변수가 동시에 얽힌 상황에서 무엇이 가장 어려운지에 맞춰진다.

문제가 한 대의 컴퓨터 안에 더 이상 들어가지 않는 상태 [01:11]

극단적 공동설계가 필요한 이유는 해결하려는 문제가 더 이상 한 대의 컴퓨터, 한 개의 GPU 안에서 처리되지 않기 때문이라고 설명한다.
컴퓨터를 1만 대 늘렸다고 해서 단순히 1만 배가 아니라 훨씬 더 큰 성능 향상을 원하게 되면, 알고리즘 자체를 분산 가능한 형태로 다시 쪼개야 한다.
이 과정에서 파이프라인, 데이터, 모델을 각각 나눠 배치하는 구조적 재설계가 필수 조건이 된다.

Amdahl의 법칙과 분산 병목의 현실 [02:00]

연산만 아무리 빠르게 만들어도 전체 작업에서 차지하는 비중이 제한되어 있으면 총 성능 향상은 크게 늘지 않는다고 짚는다.
연산이 전체의 절반이라면 연산 성능을 극단적으로 올려도 전체 속도는 대략 두 배 수준에 머물 수 있다는 예시가 제시된다.
그래서 분산 환경에서는 계산 장치만이 아니라 연결 방식과 작업 분배 구조 전체가 병목 후보가 된다.

CPU·GPU·네트워킹·스위칭이 모두 동시에 문제인 구조 [02:27]

대규모 분산 컴퓨팅에서는 CPU도 문제이고 GPU도 문제이며, 네트워킹과 스위칭, 그리고 워크로드 분산 자체도 각각 독립적인 난제가 된다.
결국 한 부분만 잘해서는 안 되고, 가능한 모든 기술을 동시에 동원해야 선형 확장에 머무르지 않을 수 있다고 말한다.
무어의 법칙이나 기존 공정 축소만으로는 원하는 수준의 도약을 기대하기 어려운 배경도 함께 언급된다.

전체 스택과 물리 인프라까지 포함하는 공동설계의 범위 [03:51]

공동설계는 아키텍처, 칩, 시스템, 시스템 소프트웨어, 알고리즘, 애플리케이션까지 이어지는 전 스택 최적화를 뜻한다.
여기에 CPU·GPU·네트워킹 칩·스케일업 스위치·스케일아웃 스위치뿐 아니라 전력과 냉각도 포함되어야 한다고 범위를 넓힌다.
개별 장비가 효율적이어도 집합적으로는 막대한 전력을 소비하므로, 물리 인프라 요소를 설계 밖으로 밀어낼 수 없다는 인식이 드러난다.

제품 구조를 따라 회사 구조를 설계하는 방식 [04:47]

회사를 설계할 때도 먼저 무엇을 만들어낼 조직인지부터 생각해야 하며, 회사는 결국 제품을 생산하는 기계이자 메커니즘이어야 한다고 본다.
업종이 달라도 비슷비슷한 조직도를 갖는 관행은 납득하기 어렵다고 말하며, 조직 구조는 산출물과 환경을 반영해야 한다고 주장한다.
직접 보고 체계가 60명 이상이라는 설명은, 기능별 사일로보다 광범위한 연결과 동시 조율을 우선하는 운영 방식을 시사한다.

전문가 집단을 한 방에 넣는 운영 원리 [05:42]

메모리, CPU, 광학, GPU, 아키텍처, 알고리즘, 설계 등 거의 모든 핵심 분야 전문가가 직접 보고 체계 안에 들어와 있다고 말한다.
일대일 미팅을 하지 않는 이유는 문제를 한 사람에게 나눠 맡기는 대신, 모두가 같은 문제를 함께 공격하는 방식이 공동설계에 더 맞기 때문이라고 설명한다.
특정 주제가 냉각이나 전력처럼 일부 영역의 문제로 보이더라도, 다른 분야 전문가가 즉시 제약과 대안을 제시할 수 있는 구조를 유지한다.

가속기 회사에서 컴퓨팅 회사로 넓혀 가는 좁은 길 [07:07]

초창기에는 특정 작업에 강한 가속기 회사로 출발했지만, 지나친 특화는 시장 크기와 연구개발 여력을 제한해 영향력 확대를 막는다고 본다.
반대로 너무 범용적인 컴퓨팅 회사가 되면 핵심 특화 능력이 약해지는 긴장이 생기기 때문에, 두 방향 사이의 아주 좁은 길을 단계적으로 넓혀가야 했다고 말한다.
그 첫 단계로 프로그래머블 픽셀 셰이더를, 다음 단계로 IEEE 호환 FP32를 셰이더에 넣으면서 GPU를 점차 범용 계산에 연결했다.
이 변화 덕분에 기존에 CPU 중심 소프트웨어를 쓰던 연구자들과 스트림 프로세서 계열 개발자들이 GPU를 계산 플랫폼으로 보기 시작한 흐름이 형성된다.

Cg에서 CUDA로 이어진 확장과 GeForce 탑재 결단 [10:04]

C 위에 FP32를 얹는 Cg 경로가 결국 CUDA로 이어졌고, 이는 단계적으로 확장된 결과물로 설명된다.
CUDA를 GeForce에 넣은 결정은 단순 기능 추가가 아니라, 회사를 그래픽 회사가 아니라 컴퓨팅 회사로 만들기 위한 전략적 선택으로 제시된다.
컴퓨팅 회사라면 자체 컴퓨팅 아키텍처가 있어야 하고, 그 아키텍처는 회사가 만드는 모든 칩에서 호환돼야 한다는 논리가 깔려 있다.

존재론적 위협에 가까웠던 첫 전략 결정 [10:42]

인터뷰어는 감당하기 어려울 정도로 비싼 선택을 왜 강행했는지 되묻고, 화자는 이를 사실상 회사 존립을 건 첫 전략 결정으로 회고한다.
뒤늦게 보면 대단한 선택이었지만, 당시에는 결과를 보장받은 승부가 아니라 실패 시 치명타가 될 수 있는 베팅이었다는 긴장감이 강조된다.

개발자를 끌어오려면 성능보다 설치 기반이 먼저라는 논리 [11:27]

CUDA는 가속 가능한 응용 범위를 넓혔지만, 진짜 문제는 어떻게 개발자를 끌어들이느냐였다고 정리된다.
개발자는 흥미로운 기능만 보고 오지 않고, 많은 사용자에게 도달할 수 있는 큰 설치 기반을 보고 플랫폼을 선택한다는 관점이 제시된다.
그래서 컴퓨팅 플랫폼의 핵심은 기술 시연이 아니라 설치 기반이며, 이것이 아키텍처의 가장 중요한 요소라고 못 박는다.

우아한 설계보다 살아남는 아키텍처의 조건 [12:14]

x86은 세련되지 않다는 비판을 많이 받았지만 오늘날을 규정하는 아키텍처가 되었고, 반대로 아름답게 설계된 여러 RISC 계열은 널리 자리 잡지 못했다고 비교한다.
이를 통해 아키텍처의 미학이나 이론적 완성도보다 시장에 깔린 기반과 생태계가 실제 생존을 좌우한다는 점을 강조한다.
CUDA가 나왔을 때도 OpenCL 등 경쟁 구도가 있었지만, 승부처는 기술 비교가 아니라 어떻게 새로운 컴퓨팅 아키텍처를 세상에 넓게 심느냐였다는 식으로 초점이 이동한다.

모든 PC에 CUDA를 심어 설치 기반을 먼저 만든 구상 [13:26]

이미 GeForce가 연간 수백만 대 규모로 팔리고 있었기 때문에, CUDA를 모든 PC에 넣어 사용 여부와 무관하게 설치 기반부터 확보하자는 결정을 내렸다고 설명한다.
동시에 대학을 찾아가 책을 쓰고 수업을 하고 CUDA를 곳곳에 퍼뜨리며 개발자 생태계를 직접 키우려 했다고 말한다.
당시에는 클라우드가 없었기 때문에, 연구자와 학생의 손에 사실상 슈퍼컴퓨터급 도구를 쥐여주면 결국 예상 밖의 혁신이 나올 것이라는 기대가 있었다.

소비자 GPU가 회사 이익을 짊어진 혹독한 구간 [14:15]

문제는 CUDA가 소비자 제품인 GPU의 원가를 크게 올려 회사의 총이익을 사실상 다 빨아들였다는 점이다.
CUDA 출시 후 비용 부담이 너무 커졌고, 회사 시가총액도 크게 내려앉았다고 회상한다.
그럼에도 GeForce에 CUDA를 계속 실었고, NVIDIA는 GeForce가 지은 집이라는 표현까지 쓰며 이 소비자 제품군이 CUDA를 대중에게 퍼뜨린 기반이었다고 평가한다.
연구자와 과학자 상당수가 게이머이거나 직접 PC와 클러스터를 조립하던 사람들이었기 때문에, GeForce는 연구 현장으로 자연스럽게 스며드는 통로가 되었다.

이사회 설득과 수익성 붕괴 위험 사이의 계산 [15:38]

이사회에는 회사가 무엇을 하려는지 분명히 설명해야 했고, 경영진은 총마진이 크게 훼손될 것을 이미 알고 있었다고 한다.
게이머들은 CUDA의 가치를 인정하지 않아도 정해진 가격만 지불할 수 있으므로, 비용만 늘고 보상은 없는 구조가 될 위험이 있었다.
원가를 크게 올린 결정이 기존 수익 구조와 충돌했지만, 장차 워크스테이션과 슈퍼컴퓨터로 확장되면 더 높은 마진을 회수할 수 있다는 논리로 버틸 수 있었다고 설명한다.
다만 그 논리가 실제로 견딜 만한 사업이 되기까지는 10년이 걸렸다고 말한다.

미래를 먼저 믿고 조직의 신념 체계를 쌓는 방식 [17:14]

화자는 큰 결정을 내리는 힘의 출발점을 강한 호기심과 충분한 추론에서 찾으며, 어떤 결과가 반드시 일어날 것이라는 확신에 도달하면 그 미래를 마음속에서 먼저 현실처럼 본다고 말한다.
그 확신만으로 끝내지 않고, 어떻게 그곳에 도달할지 계속 추론하며 경영진과 함께 오랜 시간 논리를 다듬는 과정이 뒤따른다고 설명한다.
리더가 어느 날 갑자기 선언문과 조직개편을 던지는 방식은 택하지 않고, 새 통찰이 생길 때마다 주변 사람들에게 매일 조금씩 그 의미를 설명해 사고방식을 바꿔 간다고 한다.
외부 정보, 새로운 발견, 엔지니어링 진전, 마일스톤을 모두 활용해 이사회·경영진·직원의 신념 체계를 미리 형성해 두고, 나중에 큰 결정을 제안하는 날에는 그것이 이미 자명하게 느껴지도록 만든다는 리더십 방식이 드러난다.

선언 이전에 합의를 만들어내는 방식 [20:00]

중요한 방향 전환은 발표 당일에 처음 등장하는 것이 아니라, 조직 내부에서 이미 여러 조각으로 반복적으로 공유되어 온 상태여야 한다는 관점이 제시된다.
발표 시점에는 구성원들이 상당 부분 이미 받아들인 상태가 되어야 하며, 이상적인 반응은 “왜 이제야 말하느냐”에 가깝다고 본다.
겉으로는 뒤에서 따라가는 것처럼 보여도, 실제로는 오랫동안 인식과 기대를 설계해 왔기 때문에 최종 선언 순간에 높은 수준의 동의를 얻는다고 설명한다.

내부뿐 아니라 산업 전체의 신념도 함께 설계함 [20:43]

딥러닝 같은 큰 전환을 충분한 맥락 없이 선언하면 경영진, 이사회, 직원, 고객 모두가 비현실적이라고 느낄 수 있다는 문제를 짚는다.
GTC 키노트는 단순한 제품 발표가 아니라, 파트너와 업계 전반의 기대를 미리 형성하는 장치로 활용된다고 말한다.
최근 발표 사례 역시 갑작스러운 결단이 아니라 수년간 단계별 발언과 기반 조성을 거쳐 나온 결과라는 점을 강조한다.

플랫폼 기업으로서 미래를 먼저 설득해야 하는 이유 [21:53]

NVIDIA는 컴퓨터나 클라우드를 직접 완성품 형태로 파는 기업이라기보다, 여러 층위에서 다른 회사 제품과 서비스 안에 통합되는 컴퓨팅 플랫폼 기업이라고 규정한다.
수직 통합으로 설계와 최적화는 수행하지만, 동시에 플랫폼 전 계층을 외부 기업들이 활용할 수 있도록 개방한다는 특징을 설명한다.
이런 구조에서는 제품이 준비된 뒤에 설득을 시작할 수 없고, 먼저 미래상을 납득시켜야 생태계 전체가 움직일 수 있다고 본다.

프리트레이닝 병목에 대한 업계의 초기 공포 [22:43]

대형 모델일수록 더 많은 고품질 데이터가 필요하므로, 결국 데이터 부족이 지능의 상한을 결정할 것이라는 우려가 초기에 강했다고 돌아본다.
한때 프리트레이닝이 끝났다는 식의 발언이 업계 전반의 공포를 자극했고, 이를 AI 확장의 종말처럼 받아들이는 분위기도 있었다고 회고한다.
그러나 그는 이런 해석이 과장되었다고 보고, 학습에 투입할 데이터 총량은 계속 늘어날 것이라는 입장을 유지한다.

합성 데이터가 확장을 이어가는 방식 [24:00]

앞으로 늘어나는 데이터의 상당 부분은 합성 데이터가 될 가능성이 크며, 이 지점에서 많은 사람이 혼란을 느낀다고 말한다.
사람들끼리 가르치고 정보를 주고받는 과정 자체도 자연에서 직접 나온 것이 아니라 인간이 만든 산물이라는 점에서 넓게 보면 이미 합성적 성격을 가진다고 해석한다.
AI가 실제 기반 데이터를 증강·개선하고 대량의 새로운 데이터를 생성할 수 있는 수준에 도달했기 때문에, 인간이 직접 만든 데이터 비중은 상대적으로 줄어들 수 있다고 본다.
그 결과 학습의 병목은 데이터 부족에서 점차 연산 자원 부족 쪽으로 이동한다고 주장한다.

추론은 쉽고 값싸질 것이라는 가정에 대한 반박 [25:15]

과거에는 프리트레이닝이 어렵고 추론은 비교적 쉬우므로, 추론용 칩은 작고 범용화되며 상품화되기 쉬울 것이라는 시각이 있었다고 소개한다.
그는 이 가정이 처음부터 비논리적으로 보였다고 말하며, 추론은 단순 실행이 아니라 실제로 생각하는 과정에 가깝다고 본다.
프리트레이닝을 읽기와 패턴 일반화에 비유한다면, 추론은 문제 분해, 계획, 탐색, 새로운 상황 처리까지 포함하므로 훨씬 무거운 과정이라고 설명한다.

테스트타임 스케일링은 곧 사고 과정의 확장 [26:01]

테스트타임 스케일링은 단순 응답 생성이 아니라 추론, 계획, 탐색, 검색 같은 사고 절차를 늘리는 일로 묘사된다.
새로운 경험을 다루고, 문제를 쪼개고, 원리 기반 추론이나 과거 사례, 시행착오를 활용하는 전 과정이 여기에 포함된다고 본다.
따라서 이 단계가 연산 부담이 가벼울 수 없으며, 실제로 매우 높은 계산 집약성을 가진다는 점을 확신 있게 말한다.

다음 단계로서의 에이전틱 스케일링 [27:06]

이제는 단일 에이전트가 데이터베이스를 조회하고 도구를 사용하며 조사 작업을 수행하는 수준을 넘어, 다수의 하위 에이전트를 분기시키는 단계로 나아간다고 본다.
자신 한 명의 능력을 키우는 것보다 직원을 더 채용해 조직 전체 역량을 확장하는 편이 쉬운 것처럼, AI도 개별 모델 하나보다 에이전트 집단으로 더 잘 확장될 수 있다는 비유를 든다.
이 관점에서 다음 스케일링 법칙은 에이전트를 증식시키는 방식이며, 사실상 AI를 곱셈적으로 늘리는 구조로 이해한다.

네 가지 스케일링 법칙이 순환 고리를 이룸 [27:55]

에이전틱 시스템이 더 많은 경험과 데이터를 만들고, 그중 가치 있는 것은 다시 기억할 만한 데이터셋으로 축적된다고 설명한다.
이렇게 생긴 결과물이 다시 프리트레이닝으로 돌아가 일반화되고, 포스트트레이닝과 테스트타임 개선으로 이어지며, 다시 산업 현장으로 퍼지는 순환 구조를 그린다.
이 반복 루프 전체를 지탱하는 최종 공통 변수는 결국 연산 자원이며, 지능의 확장은 본질적으로 컴퓨트 확장 문제라고 정리한다.

하드웨어는 몇 년 앞의 AI를 예측하며 설계해야 함 [28:41]

인터뷰어는 혼합 전문가 구조나 희소성 같은 변화가 등장할 때, 최적 하드웨어 요구도 함께 바뀌므로 이를 선제적으로 읽어야 한다는 점을 짚는다.
이에 대해 모델 아키텍처는 대략 반년 단위로 빠르게 변하지만, 시스템·하드웨어 아키텍처는 훨씬 긴 주기로 움직이기 때문에 2~3년 뒤를 예측해야 한다고 답한다.
이를 위해 내부 기초연구와 응용연구를 모두 수행하고 직접 모델도 만들어 보면서 감각을 확보한다고 설명한다.
동시에 거의 모든 AI 기업과 접점을 갖고 있기 때문에, 가능한 범위에서 업계 곳곳의 어려움과 요구 신호를 읽어 미래 설계에 반영하려 한다고 말한다.

CUDA의 생존력은 유연한 구조에서 나온다 [30:02]

모두에게서 배우고 계속 적응할 수 있어야 한다는 관점이 기술 아키텍처 설계 원칙으로 이어진다.
CUDA는 강력한 가속기이면서도 동시에 유연성을 갖춘 구조라고 설명된다.
CPU를 넘어설 정도의 특화가 필요하지만, 알고리즘 변화에 맞춰 계속 적응할 수 있는 일반성도 함께 확보해야 한다는 균형 논리가 강조된다.
CUDA가 오래 버틴 이유는 고정된 구조가 아니라 빠르게 진화하는 구조였기 때문이며, 최신 알고리즘에 맞춰 계속 확장되고 있다고 말한다.

MoE와 초대형 모델이 랙 구조를 바꿨다 [30:55]

Mixture of Experts가 등장했을 때 NVLink 72 같은 설계가 필요해졌고, 이를 통해 수조~수십조 파라미터 모델을 하나의 연산 도메인처럼 다룰 수 있게 됐다고 설명한다.
Grace Blackwell 랙은 사실상 LLM 처리에 초점을 맞춘 구조였다고 회고한다.
그러나 1년 뒤의 Vera Rubin 랙은 저장소 가속기, 새 CPU, 추가 랙 구성까지 포함하며 완전히 다른 시스템이 되었다고 대비시킨다.
변화의 이유는 이전 세대가 대형 MoE 추론 중심이었다면, 새 세대는 도구를 두드리며 일하는 에이전트를 위한 구조로 바뀌었기 때문이라고 정리한다.

디지털 워커라면 반드시 파일·연구·도구가 필요하다 [32:10]

미래를 예언했다기보다, LLM을 디지털 워커로 놓고 필요한 조건을 논리적으로 따져보면 답이 나온다고 말한다.
실제로 일을 하려면 정답의 근거가 되는 파일 시스템에 접근해야 하고, 모르는 것은 스스로 조사할 수 있어야 한다는 전제가 제시된다.
AI가 모든 것을 완벽히 알 때까지 기다리기보다, 연구를 하게 만들어 즉시 유용하게 쓰는 편이 현실적이라는 판단이 드러난다.
사용자를 돕는 존재라면 결국 사용자의 도구를 써야 하며, 소프트웨어와 도구가 사라질 것이라는 주장은 지나치게 단순한 상상이라고 반박한다.

로봇 비유로 설명하는 에이전트와 도구 사용 [33:25]

미래의 훌륭한 휴머노이드 로봇이 집에 들어온다고 해도, 몸 자체가 모든 도구로 변신하기보다 기존 도구를 활용하는 쪽이 훨씬 개연적이라는 비유가 제시된다.
망치, 메스, 전자레인지 기능이 몸에서 바로 나오는 식의 상상보다, 주변 도구를 배우고 쓰는 방식이 현실적이라는 논리다.
처음에는 전자레인지를 몰라도 인터넷으로 설명서를 읽고 즉시 숙련될 수 있다는 예시를 통해, 학습 가능한 에이전트의 동작 방식을 설명한다.
이 논리를 따라가면 도구 사용, 파일 접근, 리서치, 입출력 체계를 갖춘 에이전트 시스템의 성격이 자연스럽게 도출된다고 주장한다.

에이전트 시스템은 컴퓨터 자체를 다시 정의한다 [34:35]

이런 추론을 끝까지 밀고 가면 미래 컴퓨팅에 미치는 영향이 매우 깊고, 사실상 컴퓨터를 다시 발명한 것과 같다는 결론으로 이어진다.
자신이 GTC에서 사용한 도식에는 이미 2년 전부터 오늘날의 에이전트 시스템과 거의 같은 구조가 담겨 있었다고 회고한다.
다만 이런 전개가 현실이 되려면 모델 자체의 성능 향상, 즉 Claude나 GPT 같은 모델의 돌파가 먼저 필요했다고 짚는다.
여기에 더해 충분히 견고하고 완성도 있는 오픈소스 프로젝트가 등장해야 했고, 그런 조건이 맞물리며 큰 전환점이 만들어졌다고 본다.

대중적 확산의 이유와 보안 균형 문제 [35:51]

해당 에이전트 시스템이 생성형 AI에서 ChatGPT가 했던 역할과 비슷한 전환점을 만들었다는 평가가 나온다.
왜 특히 큰 주목을 받았는지에 대해, 소비자가 실제로 손에 닿는 형태로 접근할 수 있었기 때문이라는 설명이 제시된다.
동시에 사람을 끌어당기는 분위기, 밈, 대표 인물의 인상 같은 비기술적 요소도 확산에 기여했다는 관찰이 덧붙는다.
하지만 강력한 시스템에 데이터를 넘겨 유용한 작업을 맡기는 과정에는 심각한 보안 우려가 따르며, 개인과 사회가 그 균형점을 아직 찾아가는 중이라는 문제의식이 제기된다.

보안은 세 가지 능력을 동시에 주지 않는 방식으로 다룬다 [36:44]

NVIDIA 측은 초기부터 보안 전문가들을 투입했고, 관련 보안 계층이 이미 통합되었다고 설명한다.
안전성 원칙은 민감 정보 접근, 코드 실행, 외부 통신이라는 세 가지 권한을 동시에 모두 주지 않는 데 있다고 정리된다.
어떤 순간에도 세 가지 중 두 가지만 허용하면 상대적으로 안전성을 유지할 수 있다는 운영 원칙이 제시된다.
여기에 기업별 권한 체계와 기존 정책 엔진을 연결해, 조직이 이미 가진 통제 프레임 안에서 에이전트 시스템을 운용하도록 돕겠다는 방향이 설명된다.

앞으로의 병목은 전력·효율·공급망이다 [37:40]

에이전트가 어디에나 존재하게 될 미래를 전제로 할 때, 가장 먼저 제기되는 병목은 결국 컴퓨트 확장 문제라고 질문이 전환된다.
전력은 중요한 걱정거리지만 유일한 문제는 아니며, 이를 완화하기 위해 극단적 공동설계로 토큰당 전력 효율을 해마다 크게 끌어올리고 있다고 설명한다.
지난 10년 동안 일반적인 무어의 법칙 수준을 훨씬 넘어서는 규모로 연산 성능을 확장해 왔고, 그 결과 장비 가격이 올라가도 토큰 비용은 훨씬 빠르게 낮아지고 있다고 주장한다.
동시에 더 많은 전력 자체도 필요하며, ASML·TSMC·SK하이닉스 같은 공급망 병목은 늘 신경 쓰는 문제라고 인정한다.
AI 컴퓨팅 시장에서 점유율까지 늘고 있기 때문에, 상류와 하류를 포함한 공급망 전체 관리가 매우 중요하다고 강조한다.

공급망 CEO들에게 성장 동인을 미리 공유하는 이유 [40:04]

그는 함께 일하는 CEO들에게 앞으로 성장이 왜 계속되거나 더 가속될지 설명하는 데 많은 시간을 쓴다고 말한다.
행사장에 IT 업스트림과 인프라 다운스트림 전반의 CEO 수백 명이 모인 것도, 현재 사업 상황과 가까운 미래의 성장 동인을 직접 듣기 위해서였다고 한다.
단순한 실적 설명이 아니라, 다음에 어디로 갈지까지 알려줘서 상대가 투자 판단에 활용하도록 만드는 것이 목적이라고 설명한다.
이런 정보 공유는 사내 직원들에게 설명하듯 외부 파트너에게도 동일하게 적용된다고 말한다.

비주류 메모리를 데이터센터 주류로 설득한 사례 [41:17]

그는 약 3년 전, 당시엔 슈퍼컴퓨터에서만 드물게 쓰이던 HBM이 미래 데이터센터의 주류 메모리가 될 것이라고 여러 메모리 업계 CEO들을 설득했다고 말한다.
처음에는 터무니없게 들렸지만, 일부 CEO들이 그 전망을 믿고 HBM 생산 투자에 나섰다고 설명한다.
휴대폰용 저전력 메모리를 데이터센터 슈퍼컴퓨터에 맞게 적용하자는 제안도 처음에는 낯설게 받아들여졌다고 회고한다.
하지만 LPDDR과 HBM 계열의 수요 규모가 매우 커졌고, 오래된 메모리 회사들조차 사상 최대 실적을 기록했다고 말하며, 그 판단이 실제 시장 변화로 이어졌음을 시사한다.

NVIDIA를 넘어 공급망 전체의 미래를 설계하는 역할 [42:27]

그는 자신의 역할을 단지 정보를 전달하는 수준이 아니라, 방향을 제시하고 산업 전체를 형성하고 영감을 주는 일로 묘사한다.
인터뷰어는 이를 NVIDIA 내부 엔지니어를 넘어 TSMC, ASML 같은 업스트림과 각종 다운스트림 파트너까지 포함한 공급망의 미래를 함께 만들어가는 일로 해석한다.
Jensen은 업스트림과 다운스트림 모두를 상대한다고 짧게 확인하며, 범위가 반도체 공급망 전체에 걸쳐 있음을 인정한다.

200개 공급업체와 130만 부품 랙의 복잡성 [43:02]

대화는 반도체 산업 전반에 걸친 공학적 난이도와 공급망의 복잡성으로 옮겨간다.
Jensen은 이 산업이 깊은 과학, 고난도 엔지니어링, 고도화된 제조 역량 위에 서 있으며 제조의 상당 부분이 이미 로보틱스화되어 있다고 말한다.
NVIDIA의 랙 하나에는 약 130만~150만 개 수준의 부품이 들어가고, Vera Rubin 랙에는 약 200개 공급업체의 기술이 기여한다고 설명한다.
이렇게 복잡한 구조인데도 불면의 원인으로 직접 꼽지 않는 이유에 대해, 그는 필요한 조치를 계속 해오고 있기 때문에 체크리스트를 지운 상태로 잠들 수 있다고 답한다.

DGX에서 NVLink-72로 바뀌며 제조 위치가 이동함 [44:08]

그는 초기 DGX 세대에서 NVLink-72 기반 랙 스케일 컴퓨팅으로 시스템 아키텍처가 바뀌면서, 소프트웨어·엔지니어링·설계·테스트·공급망 전부의 의미가 달라졌다고 말한다.
가장 큰 변화 중 하나는 원래 데이터센터 현장에서 하던 슈퍼컴퓨터 통합 작업이 공급망 내부의 제조 단계로 이동했다는 점이라고 설명한다.
이전에는 부품 단위로 배송해 데이터센터 안에서 조립할 수 있었지만, NVLink-72는 밀도가 너무 높아 그런 방식이 더는 불가능하다고 한다.
이제는 랙 단위의 거대한 시스템을 완성품에 가깝게 만들어, 한 랙당 2~3톤 규모로 출하하는 방식이 되었다고 설명한다.

대규모 제조는 전력과 설비 투자까지 다시 요구한다 [44:48]

그는 가령 동시에 돌아가는 50기가와트 규모의 슈퍼컴퓨팅 인프라를 만들고, 그 생산에 1주가 걸린다면 공급망 각 단계에서도 막대한 전력이 필요해진다고 계산한다.
즉, 출하 전에 슈퍼컴퓨터를 만들고 테스트하는 공급망 자체가 더 큰 전력 용량을 갖춰야 한다는 뜻이라고 설명한다.
그래서 직접 파트너들을 찾아가 과거 DGX를 어떻게 만들었고 앞으로는 어떻게 만들 것인지, 왜 그 방식이 추론 수요 시대에 더 적합한지 설명한다고 말한다.
그런 다음 각 파트너에게 수십억 달러 규모의 설비투자를 요청하며, 추론 시장의 변곡점이 다가오고 있다는 전망을 근거로 제시한다고 한다.

신뢰와 1원리 설명으로 병목 우려를 선행 해소함 [46:15]

그는 파트너들이 자신을 신뢰하고, 자신도 그들을 존중하기 때문에 충분히 질문할 기회를 준다고 말한다.
설명할 때는 그림을 그려가며 1원리부터 추론해 보여주고, 대화를 마칠 즈음이면 상대가 무엇을 해야 하는지 알게 된다고 설명한다.
인터뷰어가 ASML의 EUV 장비, TSMC의 CoWoS 패키징 같은 병목을 걱정하느냐고 묻자, Jensen은 그렇지 않다고 단언한다.
이미 필요한 것이 무엇인지 전달했고, 상대도 무엇을 하겠다고 말했으며, 그는 그 약속을 믿는다고 답한다.

전력망의 유휴 전력을 데이터센터가 유연하게 쓰는 구상 [47:30]

그는 전력망이 극한 상황을 기준으로 설계되지만, 실제로는 대부분의 시간에 최대 부하에 한참 못 미치는 수준으로 운영된다고 본다.
그래서 전력망에는 상당한 잉여 전력이 놀고 있으며, 이는 병원·공항 같은 필수 인프라를 위해 비상시를 대비해 남겨둔 것이라고 설명한다.
문제는 데이터센터를 그 잉여 전력을 활용하는 구조로 설계할 수 있느냐는 것이며, 사회 인프라가 최대 전력을 필요로 하는 드문 순간에는 데이터센터가 덜 쓰도록 계약·아키텍처를 설계하자는 제안을 내놓는다.
그때는 일부 백업 발전기를 쓰거나, 워크로드를 다른 곳으로 옮기거나, 컴퓨터를 더 느리게 돌려 전력 소비를 낮추고 응답 지연만 조금 늘리는 방식이 가능하다고 말한다.
그는 100% 업타임을 전제로 한 경직된 계약이 전력망에 큰 압박을 준다고 보고, 전력망의 최대치를 더 끌어올리기보다 이미 존재하는 잉여분을 더 잘 활용하고 싶다고 말한다.

완전무결한 가용성 요구가 전력 유연성을 막는 출발점 [49:36]

인터뷰어가 무엇이 이를 가로막느냐고 묻자, Jensen은 이것이 세 주체가 얽힌 문제라고 본다.
그는 출발점으로 최종 고객을 지목하며, 최종 고객이 데이터센터에 절대 멈추면 안 된다는 요구를 건다고 설명한다.
결국 고객이 사실상 완벽한 가용성을 기대하기 때문에, 데이터센터가 전력 상황에 따라 성능을 유연하게 조정하는 계약 구조가 받아들여지기 어려워진다는 문제의식이 드러난다.

완벽한 가동률 요구와 계약 현실의 괴리 [50:00]

거의 완벽한 수준의 서비스 보장을 하려면 백업 발전기와 전력망 공급자가 함께 매우 높은 신뢰도를 맞춰야 한다는 전제가 나온다.
이런 요구가 실제로는 계약 협상 과정에서 관성적으로 굳어지고 있으며, 최고경영진은 자신들이 어떤 수준을 요구하고 있는지 충분히 인지하지 못할 수 있다는 지적이 나온다.
클라우드 사업자도 고객과의 계약 조건을 그대로 전력회사에 요구하게 되면서, 높은 보장 수준이 연쇄적으로 아래 단계에 전가된다.

전력 부족 시에도 버티는 데이터센터 설계 [51:09]

전력망이 공급량을 일부 줄여 달라고 요청하더라도 전체 서비스를 멈추지 않고 받아들일 수 있는 구조가 필요하다고 본다.
이 경우 워크로드를 다른 곳으로 옮기고, 데이터를 잃지 않으면서 계산 속도만 낮추는 식으로 품질을 완만하게 떨어뜨리는 운영이 가능해야 한다고 설명한다.
더 중요한 작업은 즉시 다른 데이터센터로 이동시키고, 전력이 충분한 곳에서 계속 처리하도록 설계하는 방향이 제시된다.
이런 동적 전력·작업 배분은 요구 조건을 명확히 정의할 수 있다면 공학적으로 풀 수 있는 문제라는 입장이 나온다.

전력회사의 공급 약속도 더 세분화돼야 함 [52:04]

전력회사가 단일한 고품질 전력만 제공하는 대신, 보장 수준이 다른 여러 등급의 전력 상품을 제시할 필요가 있다는 관점이 나온다.
예를 들어 높은 보장을 위해 장기간 증설을 기다리게 하는 대신, 보장 수준을 일부 낮추면 더 빠르게 전력을 공급할 수 있다는 식의 선택지를 줄 수 있다고 본다.
이렇게 전력 약속이 세분화되면 수요자들이 각자의 목적에 맞는 운영 전략을 더 현실적으로 설계할 수 있다고 본다.
현재 전력망에는 낭비가 많으며, 그 비효율을 줄이는 방향으로 접근해야 한다는 문제의식이 강조된다.

머스크식 실행: 필요 최소한만 남기고 전부 의심하기 [52:44]

머스크는 여러 분야를 동시에 깊게 이해하면서도 시스템 전체를 한 번에 사고하는 능력이 있다고 평가된다.
어떤 요소가 정말 필요한지, 왜 지금 방식대로 해야 하는지, 왜 그렇게 오래 걸려야 하는지를 계속 묻는 태도가 핵심으로 제시된다.
그 결과 시스템에서 불필요한 요소를 최대한 제거하면서도, 최종적으로 필요한 기능은 유지하는 극단적인 미니멀리즘에 도달한다고 본다.
단순한 부품 단위가 아니라 시스템 전체 규모에서 이런 최소화가 이뤄진다는 점이 특징으로 설명된다.

현장 밀착과 긴급함이 조직 전체 속도를 바꾼다 [54:19]

문제가 생기면 직접 현장으로 가서 보여 달라고 하는 방식이, 관성적 변명이나 부서 간 대기를 줄이는 데 큰 역할을 한다고 본다.
리더가 실제 행동 지점에 उपस्थित하면 기존의 “원래 이렇게 한다”는 관행이 쉽게 흔들리고, 해결 중심의 사고가 강화된다.
개인이 강한 긴급성을 갖고 움직이면 공급업체와 협력사까지도 그 프로젝트를 우선순위로 올리게 만드는 효과가 있다고 본다.
인터뷰어도 케이블 연결 같은 세부 작업까지 직접 이해하려는 태도가 오류를 줄이고 비효율을 발견하는 데 중요하다고 덧붙인다.

NVIDIA의 공동설계와 ‘빛의 속도’ 기준 [56:11]

공동설계는 여러 구성 요소를 함께 최적화해야 하는 궁극적인 시스템 엔지니어링 문제로 규정된다.
이를 위해 NVIDIA 내부에서는 오래전부터 ‘빛의 속도’라는 표현을 일종의 사고 기준으로 써 왔다고 설명한다.
여기서 말하는 기준은 단순한 속도 경쟁이 아니라, 물리 법칙이 허용하는 한계가 어디인지 먼저 묻는 태도에 가깝다.
메모리 속도, 연산 성능, 전력, 비용, 시간, 인력, 제조 리드타임까지 모두 이 한계 기준에 대조해 본다고 한다.

물리 한계로 각 목적함수를 따져보고 절충하기 [57:06]

지연시간과 처리량, 비용과 처리량, 비용과 수용량처럼 서로 긴장 관계에 있는 목표들을 각각 물리적 한계 기준으로 따져봐야 한다고 본다.
매우 낮은 지연시간을 노리는 시스템과 매우 높은 처리량을 노리는 시스템은 구조적으로 다르게 설계될 수밖에 없다는 점을 짚는다.
그래서 먼저 각 목표별로 가능한 최선의 한계를 이해한 뒤, 전체 시스템 차원에서 어떤 절충을 할지 판단해야 한다는 논리가 제시된다.
무엇을 만들기 전에 먼저 물리적 한계와 제약을 보는 습관 자체가 좋은 사고 프레임이라고 강조한다.

점진 개선보다 원점 재설계가 더 강력하다는 주장 [58:13]

화자는 ‘지속적 개선’이라는 말 자체를 부정하지는 않지만, 문제의 출발점으로 삼는 방식에는 한계가 있다고 본다.
이미 오래 걸리는 현재 프로세스를 전제로 며칠 줄이는 접근보다, 애초에 왜 그렇게 오래 걸리는지부터 다시 묻는 편이 더 중요하다고 말한다.
예시로 현재 74일 걸리는 일을 처음부터 새로 설계하면 6일까지 줄어들 가능성도 있으며, 이후의 추가 일수는 비용·타협·운영상 이유로 설명될 수 있다고 본다.
이렇게 가능한 최저 한계를 먼저 파악해야, 기존 방식에서 얼마나 비효율이 쌓였는지 분명해지고 개선 대화도 훨씬 강력해진다는 메시지로 이어진다.

초대형 시스템의 규모와 설계 원칙 [1:00:01]

단일 pod와 NVL72 랙만 해도 엄청난 수의 부품과 칩이 들어가며, 주당 수백 대 규모로 생산해야 할 정도의 산업적 스케일이 언급된다.
이런 시스템에서는 단순함이 이상적인 목표일 수는 있어도, 현실적으로는 필요한 복잡성을 어디까지 허용할지 판단하는 일이 더 중요하게 다뤄진다.
복잡성은 “가능한 한 단순하게”가 아니라 “필요한 만큼만 복잡하게”라는 기준 아래 점검되어야 하며, 그 이상은 군더더기로 본다.

엔지니어링 집약체로서의 NVIDIA [1:01:00]

이 시스템은 세계에서 가장 복잡한 컴퓨터라는 표현으로 묘사되며, 단순한 제품이 아니라 여러 공학 분야의 정점이 한데 모인 결과물로 다뤄진다.
TSMC, ASML 같은 다른 초정밀 산업 플레이어들과 비교해도 NVIDIA의 엔지니어링 팀이 뒤지지 않는다는 평가가 나온다.
중요한 점은 각 분야의 최고 인재가 한곳에 모이는 것만이 아니라, 서로 협력하며 하나의 시스템으로 통합된다는 데 있다.

중국 기술 생태계의 출발 조건 [1:01:41]

중국이 지난 10년 동안 세계적 수준의 기술 기업과 엔지니어링 팀을 많이 만들어낸 배경으로, 우선 대규모 AI 연구자 풀과 강한 과학·수학 교육 기반이 제시된다.
모바일 클라우드와 소프트웨어 중심 시대에 산업이 형성되면서, 현대 소프트웨어 개발 방식에 익숙한 상태로 기술 생태계가 성장했다는 해석이 나온다.
중국 내에 뛰어난 연구자가 여전히 많이 남아 있다는 점도 자체 생태계의 지속성을 뒷받침하는 요소로 언급된다.

내부 경쟁이 혁신을 밀어붙이는 구조 [1:02:52]

중국은 하나의 단일 경제권처럼 보이지만 실제로는 지방과 도시 간 경쟁이 강하고, 이것이 EV·AI 등 다양한 분야에서 기업 난립과 실험을 낳는 배경으로 설명된다.
수많은 기업이 동시에 비슷한 문제를 풀다 보니 내부 경쟁 강도가 매우 높아지고, 그 결과 살아남은 기업은 매우 강한 경쟁력을 갖게 된다는 논리다.
특정 산업만 예외적으로 성장한 것이 아니라, 만들 수 있는 거의 모든 분야에서 다수의 기업이 등장하는 생성력이 특징으로 제시된다.

관계망과 오픈소스가 만드는 지식 확산 [1:03:24]

가족, 친구, 동문 중심의 사회적 연결이 촘촘해 회사 경계를 넘는 대화와 지식 교환이 빠르게 일어난다는 문화적 해석이 제시된다.
이런 환경에서는 기술을 숨기는 실익이 작고, 차라리 오픈소스로 공개해 생태계 전체의 속도를 높이는 쪽이 더 자연스럽다는 인식이 설명된다.
오픈소스 커뮤니티가 다시 혁신을 증폭시키면서, 인재·공유·경쟁이 서로 맞물려 혁신 속도를 더 끌어올리는 구조가 형성된다고 본다.

중국을 ‘빌더 국가’로 보는 시각 [1:04:41]

중국의 빠른 혁신은 일시적 유행이 아니라 교육, 부모의 기대, 문화적 가치관 같은 장기적 토대에서 나온 것으로 정리된다.
엔지니어가 사회적으로 멋진 역할로 받아들여지고, 실제 국가 리더십에도 엔지니어 출신이 많다는 대비가 제시된다.
미국은 법과 제도를 통해 안전과 질서를 유지하는 리더십이 강한 반면, 중국은 빈곤 탈출과 산업 건설 과정에서 공학적 문제 해결 능력이 중심이 되었다는 대조가 나온다.

NVIDIA가 오픈소스 모델을 공개하는 첫 번째 이유 [1:05:45]

오픈소스 비전 질문에 대해, 먼저 NVIDIA가 훌륭한 AI 컴퓨팅 회사가 되려면 모델 아키텍처의 진화를 깊이 이해해야 한다는 점이 강조된다.
Nemotron 3가 순수 트랜스포머가 아니라 다른 구조를 함께 활용한다는 설명을 통해, 회사가 미래 모델 구조를 내다보기 위한 기초 연구를 계속하고 있음을 시사한다.
이런 연구는 단순히 모델을 만드는 데 그치지 않고, 앞으로 어떤 컴퓨팅 시스템이 필요한지 판단하는 극단적 공동설계 전략의 일부로 연결된다.

오픈소스 AI를 확산 인프라로 보는 관점 [1:07:19]

한편으로는 세계 최고 수준의 모델을 제품으로 만들고 proprietary하게 운영할 필요가 있지만, 다른 한편으로는 모든 것이 비공개면 연구와 산업 확산이 어렵다는 문제의식이 제시된다.
오픈소스는 연구자, 학생, 국가, 산업 전반이 AI 혁명에 참여할 수 있게 하는 기반으로 간주되며, NVIDIA는 규모·역량·동기를 모두 갖췄기 때문에 그 역할을 맡아야 한다고 말한다.
AI는 언어 모델에만 머무르지 않고 생물학, 화학, 물리, 유체, 기상처럼 언어로 완전히 표현되지 않는 영역까지 확장될 가능성이 크다고 본다.
그래서 자동차를 직접 만들지 않더라도 자동차 회사가 좋은 모델을 쓰게 하고, 신약을 직접 개발하지 않더라도 제약사가 최고 수준의 biology AI를 쓰게 해야 한다는 식의 생태계 전략이 제시된다.
끝부분에서는 모델, 가중치, 데이터, 생성 방식까지 함께 공개했다는 점이 다시 강조되며, 오픈소스를 부분 공개가 아닌 전면적 개방에 가깝게 이해하고 있음을 드러낸다.

TSMC를 기술회사로만 보는 오해 [1:10:00]

TSMC에 대한 가장 깊은 오해는 뛰어난 트랜지스터나 공정 기술만이 전부라고 여기는 시각이라는 점을 짚는다.
실제 강점으로는 트랜지스터뿐 아니라 금속 배선, 패키징, 3D 패키징, 실리콘 포토닉스까지 포함한 폭넓은 기술 스택이 함께 언급된다.
다만 회사의 특별함은 기술 그 자체만이 아니라, 그 기술을 기반으로 세계의 복잡한 수요를 감당하는 능력까지 포함된다고 강조된다.

세계 수요의 변동성을 공장 운영으로 흡수하는 능력 [1:11:04]

수백 개 기업의 증감하는 주문, 고객별 우선순위 변화, 웨이퍼 시작과 중단, 긴급 생산 요청 같은 복잡한 변동을 동시에 조율하는 역량이 부각된다.
세계 시장이 계속 형태를 바꾸는 상황에서도 높은 처리량, 높은 수율, 좋은 비용 구조, 우수한 고객 서비스를 함께 유지하는 점이 핵심으로 제시된다.
약속한 시점에 웨이퍼를 제공해 고객사가 자기 사업을 정상적으로 운영할 수 있게 만드는 책임감이, 제조 시스템 전체에 대한 신뢰로 이어진다고 본다.

기술 집착과 고객지향을 동시에 유지하는 문화 [1:12:06]

TSMC의 문화는 한쪽에서는 기술 진보에 강하게 집중하면서도, 다른 한쪽에서는 고객 서비스에도 깊이 헌신하는 이중 구조로 설명된다.
많은 회사가 고객지향적이지만 기술적으로 최전선이 아니거나, 반대로 기술은 뛰어나도 고객 서비스가 약하다는 대비가 제시된다.
TSMC는 이 두 축을 모두 세계 최고 수준으로 균형 있게 유지해왔다는 점에서 독보적이라고 평가된다.

계약보다 깊은 신뢰와 30년 관계 [1:12:39]

가장 가치 있게 보는 TSMC의 성취로 무형의 자산인 신뢰가 언급되며, 자기 회사를 그 위에 올려둘 수 있을 정도의 확신이라고 표현된다.
이 신뢰는 단지 성능이나 기술 자료가 아니라, 오랜 기간의 실적과 인간적 관계 속에서 형성된 것으로 이어진다.
수십 년 동안 막대한 규모의 사업을 함께해왔지만 계약서 없이 일해왔다는 언급은, 관계의 깊이를 상징적으로 보여준다.

TSMC CEO 제안을 거절한 이유 [1:13:18]

2013년에 TSMC 창업자 Morris Chang이 최고경영자 자리를 제안했다는 이야기가 사실이라고 확인한다.
그 제안을 가볍게 넘긴 것이 아니라 매우 큰 영광으로 받아들였고, TSMC를 역사적으로도 가장 중대한 기업 중 하나로 인식하고 있었음을 드러낸다.
그럼에도 NVIDIA가 앞으로 어떤 회사가 될지에 대한 자기 확신과, 그 비전을 실현해야 할 책임이 자신에게 있다는 판단 때문에 제안을 수락할 수 없었다고 설명한다.

NVIDIA의 첫 번째 해자, CUDA 설치 기반 [1:15:00]

NVIDIA의 가장 중요한 자산은 컴퓨팅 플랫폼의 설치 기반이며, 현재로서는 CUDA 설치 기반이 그 핵심이라고 못박는다.
과거에는 설치 기반이 없었기 때문에 비슷한 기술 이름의 대체재가 나와도 큰 의미가 없었겠지만, 지금은 상황이 완전히 달라졌다고 본다.
CUDA의 성공은 몇 명의 기술자가 아니라 수만 명의 직원, 그리고 그 위에 소프트웨어를 올리기로 결정한 수백만 개발자의 축적된 선택이 함께 만든 결과로 설명된다.

설치 기반에 실행 속도와 개발자 신뢰가 더해질 때 [1:16:38]

설치 기반은 그 자체로도 강력하지만, 여기에 회사의 실행 속도가 결합될 때 경쟁우위가 훨씬 커진다고 말한다.
역사상 이렇게 복잡한 시스템을 만들고, 그것을 사실상 매년 새로운 세대로 전개하는 일은 매우 이례적이라는 인식이 드러난다.
개발자 입장에서는 CUDA를 지원하면 짧은 주기 안에 성능이 크게 개선되고, 방대한 사용자·산업·국가 단위의 도달 범위를 확보할 수 있으며, NVIDIA가 장기적으로 이를 유지·개선할 것이라는 신뢰까지 얻는다고 정리된다.

두 번째 해자와 AI 팩토리로의 사고 전환 [1:18:16]

두 번째 경쟁우위로는 생태계가 제시되며, 수직적으로 통합한 복잡한 시스템을 다시 수평적으로 거의 모든 회사의 컴퓨팅 환경에 연결해 넣는 구조가 강조된다.
클라우드, 신생 인프라 기업, 슈퍼컴퓨터, 엔터프라이즈, 통신 엣지, 자동차, 로봇, 위성까지 하나의 아키텍처가 광범위하게 확장된 모습이 언급된다.
이어서 컴퓨팅의 단위가 GPU에서 컴퓨터, 클러스터를 거쳐 이제는 AI 팩토리 전체로 이동했다고 설명하며, 이제는 칩 하나를 손에 드는 이미지보다 전력망과 냉각까지 연결된 거대한 설비가 더 정확한 정신적 모델이 되었다고 말한다.

공장이 된 컴퓨트 인프라 [80:01]

대규모 AI 시스템은 엄청난 규모의 시스템·네트워킹 집합체로 묘사되며, 설치와 가동에 수천~수만 명 수준의 인력이 투입되는 현실이 강조된다.
이런 시설을 켜는 일은 단순한 스위치 조작이 아니라, 다수의 엔지니어가 단계적으로 전력을 올리고 전체 상태를 맞춰야 하는 복합 작업으로 설명된다.

칩이 아니라 팟과 행성 규모로 사고하기 [80:22]

연산 단위를 생각할 때 개별 칩보다 랙 묶음, 팟, 더 나아가 전체 인프라를 하나의 계산 단위처럼 바라보는 인식 전환이 나타난다.
다음 단계의 상상으로는 컴퓨터를 행성 규모 시스템처럼 보는 관점까지 언급되며, AI 인프라 사고방식이 급격히 확장되고 있음을 보여준다.

우주 컴퓨트의 가능성과 첫 사례 [80:42]

우주에서 연산을 수행하면 에너지 확장성 측면의 이점이 있을 수 있다는 질문이 제기되지만, 냉각은 결코 간단하지 않다는 반응이 나온다.
NVIDIA GPU가 이미 우주에 들어가 있다는 언급과 함께, 우주는 특히 고해상도 영상 처리 같은 용도에서 의미 있는 장소로 제시된다.

지구 관측 데이터는 현장에서 걸러야 한다 [81:27]

위성은 지구를 지속적으로 스캔하며 매우 높은 해상도의 이미징 데이터를 생성하므로, 이를 전부 지상으로 내려보내는 것은 비현실적이라는 논지가 제시된다.
따라서 이미 본 것, 변하지 않은 것, 필요 없는 것은 현장에서 버리고 필요한 정보만 남기는 형태의 엣지 AI가 필수라고 설명된다.
여기서 AI는 단순 분석 도구가 아니라 데이터 홍수 자체를 감당하기 위한 필터링 메커니즘으로 자리 잡는다.

우주 환경의 물리 제약과 기술적 질문들 [82:09]

극지 궤도 등에서는 거의 상시 태양광을 활용할 수 있다는 가능성이 언급되지만, 열을 전달하는 전도·대류가 없어 사실상 복사에 의존해야 하는 점이 핵심 제약으로 나온다.
큰 방열판 같은 해법이 가능할 수 있다는 식의 언급이 있으나, 이는 여전히 해결해야 할 공학 문제들이 많다는 맥락 속에 놓인다.
우주 컴퓨트의 실현 시점보다는, 먼저 어디에 실제 기회가 있는지 보고 병행 탐색한다는 태도가 더 강하게 드러난다.

방사선·성능 저하·고장 완화 설계 [82:41]

우주용 컴퓨팅 시스템을 위해 방사선 대응, 성능 열화, 지속적 테스트와 결함 검증, 중복성 확보 같은 문제가 구체적으로 열거된다.
목표는 컴퓨터가 갑자기 멈추지 않게 만드는 것이며, 문제가 생겨도 완전히 깨지기보다 점진적으로 느려지도록 설계해야 한다는 관점이 제시된다.
하드웨어뿐 아니라 소프트웨어 차원의 중복성과 성능 관리도 함께 고려 대상임이 드러난다.

당장의 우선순위는 지구상의 낭비 제거 [83:34]

우주 연구는 계속하되, 현재 시점에서 더 실용적인 답은 유휴 전력을 최대한 빨리 회수하고 낭비를 제거하는 것이라는 결론으로 정리된다.
즉, 확장 병목을 풀기 위한 가장 가까운 해법은 새로운 프런티어 개척보다 기존 자원의 비효율을 줄이는 데 있다는 판단이 드러난다.

저장 창고에서 실시간 생성 공장으로 [84:30]

NVIDIA의 성장 가능성을 설명하며, 과거 컴퓨팅은 사람이 미리 만든 파일을 저장하고 검색하는 시스템이었다는 대비가 제시된다.
AI 컴퓨터는 문맥을 이해하고 실시간으로 토큰을 생성해야 하므로, 저장보다 훨씬 더 많은 계산을 요구하는 방향으로 컴퓨팅의 중심이 이동했다고 본다.
이 방식이 효과 없었다면 전망도 달라졌겠지만, 최근 몇 년이 오히려 그 확신을 더 강화했다는 입장이 드러난다.
이어 컴퓨터는 더 이상 창고가 아니라 매출과 직접 연결되는 공장으로 비유되며, 토큰도 무료·프리미엄·중간 단계로 분화되는 가치 있는 상품이 될 수 있다는 관점이 전개된다.
이런 변화가 생산성 향상과 GDP 성장으로 이어지고, 경제에서 계산이 차지하는 비중이 과거보다 훨씬 커질 것이라는 강한 확신으로 연결된다.

물리적 한계보다 상상력의 한계 [1:30:02]

엔비디아가 가까운 미래에 훨씬 더 큰 매출 규모에 도달하는 것이 가능하냐는 질문에 대해, 물리적으로 불가능하다고 볼 이유가 없다고 단언한다.
공급망 부담이 단일 회사가 아니라 수백 개 기업이 함께 나누는 구조이기 때문에 확장 여력이 있다고 본다.
남는 핵심 변수는 에너지이지만, 그 역시 결국 확보 가능한 문제라고 본다.
그래서 특정 숫자는 절대적 한계가 아니라 당시 사람들이 붙여 놓은 이름표에 가깝다고 정리한다.

과거의 불가능 선언들이 틀렸던 이유 [1:30:53]

과거에도 팹리스 반도체 회사가 일정 매출 규모를 넘는 것은 이론적으로 불가능하다는 말을 들었지만 실제로는 그렇지 않았다고 회고한다.
또 다른 사람들은 다른 경쟁사나 산업 구조를 이유로 더 이상의 성장은 어렵다고 말했지만, 그런 판단은 근본 원리에서 출발한 사고가 아니었다고 본다.
진짜 질문은 누가 막고 있느냐가 아니라 무엇을 만들고 있으며 어떤 기회를 새로 열 수 있느냐라는 점으로 돌린다.

시장점유율 논리로 설명되지 않는 성장 [1:31:42]

엔비디아는 기존 시장에서 점유율을 조금씩 빼앗아 몸집을 키우는 회사가 아니라, 아직 없던 영역을 만들어가는 쪽에 가깝다고 말한다.
그래서 투자자나 외부 사람들이 미래 규모를 직관적으로 상상하기 더 어렵다고 짚는다.
비교 대상이 되는 기존 사업자가 없기 때문에, 성장 가능성을 전통적인 계산식으로 설명하기가 어렵다고 본다.
시간이 지나며 GTC 같은 발표를 통해 비전이 점점 더 현실적인 것으로 받아들여질 것이라고 자신한다.

토큰 공장과 AI 수요의 기하급수적 확대 [1:32:34]

토큰을 초당 얼마나, 전력당 얼마나 생산할 수 있는지가 핵심 생산성 지표처럼 제시된다.
토큰은 실제로 사람마다 다른 형태와 크기의 가치를 만들어내는 결과물로 다뤄진다.
이런 관점에서 보면 AI 인프라는 일종의 토큰 공장들의 집합처럼 이해할 수 있다고 본다.
AI가 해결할 수 있는 문제 범위를 전제로 하면, 앞으로 훨씬 더 많은 토큰 공장이 필요해질 것이라는 논리가 자연스럽게 나온다.

에이전트가 만든 전환점 [1:33:06]

에이전트를 두고 토큰 시대의 아이폰 같은 전환점이 도착했다고 표현한다.
이 변화는 역사상 가장 빠르게 성장하는 애플리케이션 흐름처럼 보인다고 평가한다.
특정 시점을 전후해 사람들이 코드 생성과 작업 대행형 AI의 힘을 본격적으로 체감하기 시작한 것 같다는 문제의식이 이어진다.
화자 역시 공항에서 노트북에 말을 걸며 작업을 진행한 경험을 말하면서, 이미 사용 방식이 바뀌고 있음을 체감적으로 드러낸다.

사람이 가장 많이 대화할 상대의 변화 [1:33:52]

사람처럼 AI에게 말을 걸며 작업하는 방식이 다소 어색하게 느껴지지만, 동시에 매우 효율적이라고 인정한다.
앞으로는 사람이 AI를 귀찮게 하는 것보다, 일을 너무 빨리 처리한 AI가 계속 결과를 보고하고 다음 지시를 묻는 일이 더 많아질 수 있다고 본다.
가장 자주 채팅하고 문자하게 되는 상대가 주변 인간이 아니라 자신의 에이전트가 될 것이라는 전망이 제시된다.
생산성의 상승이 단순한 도구 개선이 아니라 일상적 상호작용의 재편으로 이어질 수 있음을 시사한다.

국가·산업·투자자까지 연결된 압박 [1:35:38]

엔비디아의 성공이 미국의 세수, 기술 리더십, 국가안보, 산업 재건과 긴밀히 연결돼 있다는 점을 강하게 의식하고 있다고 말한다.
칩, 컴퓨터, AI 팩토리 같은 생산 기반을 다시 미국 안으로 가져오는 흐름과도 연결된다고 본다.
대형 기관투자자뿐 아니라 교사, 경찰처럼 평범한 개인 투자자들까지 엔비디아의 성과와 연결돼 있다는 점을 무겁게 받아들인다.
자사 뒤와 아래에 있는 विशाल한 생태계 파트너 네트워크의 중심에 있다는 사실도 큰 책임의 일부로 본다.

압박을 견디는 방식: 분해, 위임, 실행 [1:37:16]

압박을 다루는 방식은 감정에 압도되기보다 지금 무슨 일이 벌어지고 있고 무엇이 어려우며 무엇을 해야 하는지로 문제를 분해하는 것이라고 설명한다.
상황을 잘게 나누면 실제로 할 수 있는 관리 가능한 과제들로 바뀌고, 그 뒤에는 직접 하거나 누군가에게 맡겨 실행하면 된다고 본다.
해야 한다고 판단해 놓고도 직접 하지 않았고 누구에게 맡기지도 않았다면 그 문제에 대해 계속 괴로워할 이유가 없다는 식으로 자신에게 엄격한 기준을 적용한다.
회사, 파트너, 산업, 누구에게든 위해가 갈 수 있는 사안은 반드시 알리고 조치 가능한 사람에게 전달해 마음속 짐을 행동으로 전환한다고 말한다.

심리적 저점과 체계적 망각 [1:39:10]

엔비디아를 세우는 긴 여정 동안 심리적으로 낮은 순간이 반복해서 있었다고 거리낌 없이 인정한다.
그럴 때도 결국 문제를 쪼개서 자신이 할 수 있는 조치를 확인하는 방식으로 버틴다고 답한다.
여기에 더해 모든 것을 계속 붙들고 가지 않는 망각의 능력이 중요하다고 말한다.
AI 학습에서도 체계적 망각이 필요하듯, 사람도 모든 부담과 기억을 끝없이 들고 가면 안 되며 적절히 내려놓아야 한다는 인식이 드러난다.

부담을 나누고 다음 지점으로 이동하는 태도 [1:40:01]

걱정을 혼자 붙잡아두지 말고 더 작은 문제들로 쪼개 주변 사람들과 나눠야 한다는 태도가 제시된다.
단순히 감정을 방치하는 대신, 각자 실제로 행동할 수 있는 단위로 분해해 전달하는 방식이 강조된다.
스스로에게는 어느 정도 단호해야 하며, 주저앉아 있기보다 다시 움직이기 시작해야 한다는 자기 통제의 감각이 드러난다.
이미 지나간 일보다 다음 기회, 다음 가능성, 다음 지점을 향해 시선을 옮기는 습관이 회복력의 일부로 묘사된다.

과거보다 미래의 빛에 끌리는 추진력 [1:40:43]

훌륭한 운동선수가 방금 끝난 포인트보다 다음 포인트에 집중하듯, 실패와 당혹감도 뒤로 보내야 한다는 비유가 나온다.
공개적으로 일하는 사람은 순간적으로 던진 말이나 판단이 나중에 덜 좋아 보일 수 있다는 점을 인정한다.
그럼에도 과거의 민망함에 머무르기보다 미래가 끄는 방향으로 계속 걸어가는 태도가 중요하다고 정리된다.
대담한 일을 해낸 사람의 발언처럼 보이는 회고도, 결국은 앞으로 나아가게 만드는 정신 구조와 연결된다.

‘얼마나 어렵겠어’라는 어린 마음의 힘 [1:41:47]

정말 가치 있는 일은 예상보다 훨씬 어렵다는 점을 인정하면서도, 시작 단계에서는 오히려 순진할 정도의 낙관이 필요하다고 말한다.
처음 어떤 문제를 볼 때 “얼마나 어렵겠어”라고 생각하는 마음이 거대한 도전에 들어가게 만드는 힘으로 제시된다.
누구도 해본 적 없고 비용도 막대하며 규모도 압도적이지만, 그런 계산을 전부 앞세우면 시작하지 못하게 된다는 함의가 깔려 있다.
아이 같은 마음이라는 표현은 미숙함보다도, 가능성을 먼저 붙드는 인지적 자세를 가리키는 것으로 읽힌다.

고통을 미리 다 살지 말고, 닥치면 버티는 방식 [1:42:37]

모든 시행착오, 좌절, 굴욕을 미리 정교하게 시뮬레이션하지 말아야 한다는 주장이 나온다.
새로운 경험에 들어갈 때는 완벽하고 즐겁고 대단할 것이라는 기대를 어느 정도 유지하는 편이 오히려 도움이 된다고 본다.
대신 실제 좌절이 닥쳤을 때는 endurance와 grit, 즉 버티는 힘과 끈기가 필요하다고 정리한다.
실망과 굴욕이 예상치 못하게 찾아오더라도 그때는 다시 잊고, 다음으로 이동하는 스위치를 켜야 한다는 이중 구조가 제시된다.

미래 가정이 유지되면 계속 간다는 신념 구조 [1:43:27]

미래에 대한 핵심 가정이 본질적으로 바뀌지 않았다면, 결과 역시 크게 달라지지 않을 것이라고 본다.
그래서 도중의 충격이나 일시적 실패가 있어도, 전제가 유지된다면 자신이 본 미래를 계속 추구하는 것이 합리적이라는 논리로 이어진다.
회복력은 단일 성격 특성보다 여러 인간적 특성의 조합으로 설명된다.
새로운 경험에 신선하게 들어가는 힘, 좌절을 털어내는 힘, 자기 믿음을 유지하는 힘, 그리고 계속 재평가하는 습관이 함께 중요하다고 묶는다.

겸손, 모방, 공감으로 계속 배우는 자세 [1:44:16]

자신은 늘 호기심이 있고, 계속 배우며, 거의 모든 사람에게서 배운다고 말한다.
겸손하기 때문에 타인이 무언가를 잘했을 때 그 내부 사고를 궁금해하고 따라가 보려는 태도가 생긴다고 설명한다.
다른 사람을 관찰할 때 단순 평가보다, 그 사람이 어떻게 그런 선택을 했는지 마음속으로 시뮬레이션하고 모방해 본다는 점이 강조된다.
존중하는 대상의 행동을 공감적으로 따라가 보는 습관이 학습의 원천으로 기능한다.

공개적 작업이 오히려 사람을 겸손하게 만든다 [1:45:10]

세계적으로 큰 성공과 부를 얻은 뒤에도 겸손을 유지하기 어렵지 않느냐는 질문에, 의외로 반대라고 답한다.
자신의 일이 매우 공개적이기 때문에 틀렸을 때 거의 모두가 그것을 보게 되고, 그 자체가 지속적인 겸손의 장치가 된다고 말한다.
외부 발언은 다른 사람에게 영향을 줄 수 있으므로 비교적 확신이 있을 때만 조심스럽게 말하려 한다는 점도 덧붙인다.
반면 내부 회의에서는 결과가 다르게 나올 수 있는 불확실성을 열어둔 채 계속 추론하며 사고를 전개한다고 설명한다.

결론을 강요하지 않고 추론을 공개하는 리더십 [1:46:20]

자신의 관리 방식은 사람들 앞에서 끊임없이 추론하는 것이며, 상대가 결론이 아니라 사고 과정을 이해하도록 만드는 데 초점이 있다.
자신이 어떻게 그 결론에 도달했는지 단계를 보여주면, 상대는 최종 결론 전체를 부정하지 않아도 특정 추론 단계만 반박할 수 있게 된다.
그렇게 되면 한 사람의 결론을 따르는 구조가 아니라, 여러 사람이 중간 단계에서 개입하며 함께 앞으로 reasoning을 밀어가는 집단 탐색 방식이 가능해진다.
성공과 고통을 오래 겪고도 이런 개방성을 유지하는 배경에는, 창피를 견디는 능력과 틀렸음을 인정하며 성장하는 훈련이 깔려 있다는 대화가 이어진다.
이어지는 게임 이야기에서는 GeForce가 여전히 가장 강력한 마케팅 전략이며, 십대 시절 게임으로 NVIDIA를 접한 사람들이 이후 CUDA, Blender, Autodesk 같은 도구 사용자로 이어진다는 장기적 흐름이 제시된다.
DLSS 5 논란과 관련한 게이머들의 우려에 대해서는, 그들의 관점이 이해된다고 받아들이는 반응으로 다음 논의가 열리기 시작한다.

구조를 바꾸지 않는 DLSS 5의 전제 [110:01]

AI 생성물이 획일적으로 느껴진다는 반응에는 공감하지만, DLSS 5는 그런 종류의 결과물을 만들려는 시도가 아니라고 선을 긋는다.
이 시스템은 3D 구조와 지오메트리, 텍스처 같은 실제 데이터에 의해 유도되며, 아티스트가 정한 형상을 프레임마다 유지하는 방향으로 설계됐다고 설명한다.
핵심은 화면을 더 좋게 보이게 만들더라도 원래의 구조를 바꾸지 않는다는 점이며, “향상”과 “변형”을 구분하려는 태도가 분명하다.

아티스트의 스타일을 확장하는 생성형 도구 [111:02]

시스템이 열려 있어서 사용자가 직접 모델을 학습시키거나, 앞으로는 원하는 셰이더 스타일을 프롬프트처럼 지정할 수도 있는 방향을 언급한다.
특정 예시 스타일을 참고해 결과를 만들더라도, 그것은 아티스트의 스타일과 의도 안에서 일관되게 작동해야 한다는 전제가 붙는다.
게임이 완성된 뒤 외부에서 AI로 덧씌우는 개념이 아니라, 제작 과정 안에 통합된 창작 도구로 이해해야 한다고 정리한다.
결국 생성형 AI를 쓸지 말지는 창작자가 결정하며, 목적은 표현력을 넓히는 데 있다는 입장이다.

사람들이 AI 슬롭에 민감해진 이유 [112:01]

사람들은 특히 얼굴처럼 인간적인 대상에 민감하고, 지금은 “AI 슬롭”을 구분해내는 감각이 커진 시기라고 본다.
그 민감함은 오히려 사람들이 완벽한 표면보다 불완전함, 덜 매끈하지만 더 설득력 있는 표현을 원한다는 사실을 비춰준다고 해석한다.
그래서 생성형 모델이 꼭 사진처럼 보이는 방향만을 목표로 할 필요는 없고, 오히려 반대편의 미학도 충분히 유효하다고 본다.
중요한 것은 도구가 세계를 더 설득력 있게 만들도록 돕는지이며, 그 선택권은 여전히 개발자와 아티스트에게 있다고 본다.

게임 그래픽 도구의 진화와 표현력 경쟁 [112:43]

최근 몇 년 동안 피부를 더 피부답게 보이게 하는 셰이더 같은 기술이 이미 게임 개발자들에게 도입돼 왔다고 짚는다.
개발 현장은 더 많은 표현 도구를 꾸준히 원해 왔고, DLSS 계열 역시 그 연장선에 있는 또 하나의 도구로 자리 잡는다.
즉 새로운 그래픽 기술은 기존 미학을 대체하는 것이 아니라, 개발자가 무엇을 채택할지 선택할 수 있는 옵션의 폭을 넓힌다.

가장 영향력 있는 게임과 PC 문화의 전환점 [113:16]

가장 영향력 있는 게임으로는 먼저 Doom을 꼽으며, 그것이 PC를 사무 자동화 기계에서 게임 기기로 전환시키는 상징적 계기였다고 본다.
비행 시뮬레이션 장르는 그보다 먼저 있었지만, 대중적 파급력 면에서는 Doom이 산업과 문화 양쪽에 더 큰 전환점을 만들었다고 평가한다.
순수한 게임 기술 측면에서는 Virtua Fighter를 별도로 언급하며, 문화적 영향과 기술적 영향이 항상 같은 작품에 모이지는 않는다는 관점을 드러낸다.

최신 그래픽, 오래된 게임, 그리고 모드 문화 [114:07]

Cyberpunk 2077 같은 최신 작품의 완전 레이 트레이싱을 언급하며, GPU 가속 그래픽이 몰입감을 강하게 끌어올리는 사례로 받아들인다.
동시에 Skyrim처럼 오래된 게임이 모드를 통해 완전히 다른 경험으로 재탄생하는 점을 높이 평가한다.
이미 사랑하는 세계를 새로운 방식으로 다시 경험하게 만드는 힘이 모딩에 있다고 보며, 단순한 그래픽 업그레이드를 넘어 재플레이 가치를 만든다고 본다.
NVIDIA 역시 오래된 게임에 최신 기술을 주입할 수 있는 RTX Mod 같은 도구를 만들었다고 언급하며, 커뮤니티 창작과 기술 진보를 연결한다.

AGI를 회사 운영 능력으로 볼 수 있는가 [115:15]

AGI의 정의를 “성공적인 기술 회사를 시작하고 성장시키고 운영할 수 있는가”라는 실용적 기준으로 좁혀 묻는다.
이에 대해 이미 AGI는 달성됐다고 답하면서도, 그 판단은 기준을 어디에 두느냐에 달려 있다고 전제한다.
수십억 달러 규모의 지속 가능한 회사를 세우는 일과, 짧은 기간 바이럴한 서비스를 만들어 큰 매출을 내는 일은 다르다는 식으로 문턱을 나눈다.
오늘날의 에이전트도 비교적 단순한 웹 서비스나 앱을 만들어 갑작스러운 대중 반응을 얻을 가능성은 배제하지 않는다.

바이럴 성공 가능성과 일자리 불안에 대한 선 긋기 [116:37]

중국에서는 이미 에이전트에게 일감을 찾게 하거나 돈을 벌도록 시도하는 움직임이 보인다고 하며, 이런 현상이 현실에서 진행 중이라고 말한다.
귀엽거나 사회적 반응을 유도하는 디지털 인플루언서, 가벼운 소셜 앱, 디지털 펫류 서비스가 갑자기 크게 성공했다가 빠르게 사라지는 시나리오는 충분히 가능하다고 본다.
반면 그런 에이전트를 대량으로 풀어도 NVIDIA 같은 회사를 세우는 일은 불가능하다고 못 박으며, 바이럴한 앱 성공과 장기적 기업 구축을 구분한다.
이어 사람들의 일자리 불안을 진지하게 인정하면서, 직무의 목적과 그 직무를 수행하는 도구는 연결돼 있지만 동일한 것은 아니라고 강조한다.
자신의 오랜 CEO 경험을 예로 들며 도구는 수차례 급격히 바뀌었지만 직무 자체는 지속됐다고 설명하고, 방사선 영상 판독 분야에서도 AI가 초인간적 성능을 보여도 역할 전체가 단순히 사라지지는 않았다는 사례를 꺼낸다.

방사선 전문의 사례와 잘못된 자동화 경고 [120:02]

스캔을 더 빠르게 읽을 수 있게 되었는데도 방사선 전문의 수는 줄지 않았고, 오히려 세계적으로 부족해졌다고 말한다.
과거의 과도한 경고가 중요한 직업에 대한 진입을 위축시켜 실제로 사회적 해를 남겼다고 본다.
그 경고가 틀린 이유는 방사선 전문의의 목적이 단순 판독이 아니라 질병 진단을 돕고 환자와 의사를 지원하는 데 있기 때문이라고 설명한다.
판독 속도가 높아지면 더 많은 스캔과 환자를 다루게 되고, 병원 운영도 확대되기 때문에 오히려 더 많은 전문 인력이 필요해진다는 논리로 연결한다.

소프트웨어 엔지니어의 목적은 코딩량이 아니라 문제 해결 [121:03]

NVIDIA의 소프트웨어 엔지니어 수 역시 줄지 않고 늘어날 것이라고 단언한다.
소프트웨어 엔지니어의 목적과 코딩이라는 과업은 연결되어 있지만 동일하지 않다고 선을 긋는다.
중요한 일은 코드 줄 수가 아니라 문제 해결, 협업, 문제 진단, 결과 평가, 새 문제 발굴, 혁신, 연결 짓기 같은 활동이라고 정리한다.
따라서 AI가 코드를 더 잘 쓰게 되더라도 직무의 핵심 역할 자체는 사라지지 않는다는 관점을 제시한다.

코딩의 정의 확장과 참여자 폭증 가능성 [121:45]

코딩을 오늘날 기준으로 보면 컴퓨터에게 무엇을 만들지 명세하고, 필요하면 아키텍처까지 지시하는 행위라고 재정의한다.
이런 정의를 따르면 코딩 가능한 인구가 기존 소수 전문가 집단에서 훨씬 더 넓은 층으로 확대될 수 있다고 본다.
목수도 AI와 함께라면 단순 시공자가 아니라 설계 역량까지 갖춘 사람처럼 가치가 높아질 수 있다고 비유한다.
회계사 역시 재무 분석가나 자문가 역할까지 확장될 수 있다는 식으로, 여러 직업의 서비스 수준이 상승할 가능성을 강조한다.

기존 프로그래머의 직관과 학습의 지속 가치 [123:04]

현재의 프로그래머와 소프트웨어 엔지니어는 자연어로 에이전트와 상호작용해 더 나은 소프트웨어를 설계하는 감각을 먼저 익히고 있는 집단으로 묘사된다.
시간이 지나면 이런 능력이 더 널리 퍼지겠지만, 지금은 여전히 기존 프로그래밍 학습에 실질적 가치가 남아 있다고 본다.
프로그래밍 언어의 특성, 좋은 실천, 대규모 시스템 설계 원칙 같은 기초는 여전히 중요하다고 대화가 이어진다.
즉, 자연어 기반 개발이 확산돼도 전통적 소프트웨어 사고방식이 완전히 무의미해지지는 않는다는 맥락이다.

명세의 예술과 의도적 불완전성 [123:43]

무엇을 얼마나 구체적으로 명세할지는 해결하려는 문제와 함께 일하는 대상에 따라 달라진다고 말한다.
회사 전략을 설명할 때도 사람들이 방향을 이해하고 행동할 수 있을 정도로는 충분히 구체적으로 말하지만, 일부는 의도적으로 덜 규정한다고 밝힌다.
그렇게 해야 많은 인재가 자신의 상상보다 더 나은 해법을 만들어낼 수 있다고 본다.
엔지니어와 일할 때도 같은 원리가 적용되며, 명세 수준과 아키텍처 정의의 깊이는 맥락 의존적이라고 설명한다.

코딩 스펙트럼과 미래의 창의적 상호작용 [124:59]

앞으로 사람들은 코딩의 스펙트럼 어디에 자신을 위치시킬지 배워야 한다고 주장한다.
명세를 작성하는 행위 자체가 이미 코딩이며, 경우에 따라 매우 지시적으로 갈 수도 있고 더 탐색적으로 갈 수도 있다고 본다.
탐색적 상황에서는 일부러 덜 명세해 AI와 왕복하며 자신의 창의성 경계까지 밀어볼 수 있다고 말한다.
결국 미래의 코딩은 정답 하나의 기술이 아니라, 얼마나 규정하고 얼마나 열어둘지를 다루는 예술에 가깝다고 정리한다.

일자리 불안, 고통, 그리고 불안을 다루는 방식 [125:31]

화이트칼라 직군을 포함해 많은 사람들이 일자리 불안을 느끼는 것은 정당한 반응이라고 인정한다.
자동화와 새로운 기술이 들어올 때 개인과 가족이 겪는 실제 고통에 대해 연민과 책임감을 가져야 한다는 문제의식이 제기된다.
동시에 AI가 생산성과 재미를 높여 같은 사람들에게 새로운 기회를 만들 수 있다는 희망도 언급되지만, 그 과정의 고통이 사라지지는 않는다고 본다.
이에 대한 자신의 대응 방식으로는 불안을 쪼개서, 바꿀 수 있는 것과 없는 것을 나눈 뒤 실행 가능한 영역에 집중하는 태도를 제안한다.

채용 기준의 변화와 모두를 위한 AI 실전 학습 [127:20]

같은 조건의 신입이라면 AI를 전혀 모르는 사람보다 AI 활용에 능숙한 사람을 채용하겠다고 분명히 말한다.
회계, 마케팅, 공급망, 고객 서비스, 영업, 사업개발, 법률처럼 여러 직무에서 AI 활용 역량이 점점 기본 경쟁력이 될 것이라는 판단이 깔려 있다.
모든 대학생이 졸업 전 AI 전문가 수준의 활용력을 갖추도록 해야 하고, 교사들도 이를 적극 장려해야 한다고 조언한다.
목수, 전기기사, 농부, 약사처럼 현장 기반 직업도 예외가 아니며, AI를 써서 자신의 일을 끌어올리고 산업 변화를 주도하는 사람이 되라고 권한다.

과업 중심 직무의 취약성과 목적 중심 직무의 대응 [128:39]

기술이 많은 과업을 자동화하고 일부는 실제로 사라지게 만들 것이라는 점은 인정한다.
만약 자신의 직업이 곧 그 과업 자체라면 큰 충격을 받을 가능성이 높다고 경고한다.
반대로 자신의 직업이 더 큰 목적을 포함하고 있고 그 안에 여러 과업이 들어 있는 구조라면, AI로 그 과업을 자동화하는 법을 배우는 것이 중요하다고 말한다.
직업은 과업과 목적 사이의 연속선 위에 놓여 있으며, 각자는 그 사이 어디에 있는지 냉정하게 판단해야 한다는 함의를 남긴다.

AI를 불안 해소와 실행 계획 수립의 도구로 쓰기 [129:14]

챗봇 형태의 AI는 막연한 불안을 대화로 분해하는 데 특히 유용하다는 경험적 평가가 나온다.
삶의 문제를 상담하듯 정리할 수 있지만, 여기서는 감정 치료보다도 직업 걱정과 역량 개발처럼 실용적 문제 해결 쪽이 강조된다.
자신의 직업이 걱정될 때 어떤 기술을 익혀야 하는지, 어떤 단계를 밟아야 하는지, AI를 어떻게 더 잘 써야 하는지 직접 물으면 점검표 형태의 계획을 받을 수 있다고 본다.
AI 사용법을 모르는 사람에게도 AI가 스스로 사용법을 알려줄 수 있다는 점이, 진입장벽을 낮추는 중요한 특징으로 제시된다.

초보자 마찰을 없애는 AI의 효용 [2:10:00]

엑셀처럼 익숙하지 않은 도구 앞에서 아무것도 모른다고 말하는 순간 뒤처질 수 있다는 감각을 예로 들며, AI가 초심자의 첫 장벽을 없애준다고 본다.
무엇이든 처음 시작할 때 “첫 단계가 무엇인지” 바로 물을 수 있다는 점이 실질적인 도움으로 제시된다.
세계가 제공하는 수많은 경험 앞에서 사용자가 느끼는 주저함과 혼란을 AI가 손잡아 주듯 줄여준다는 인식이 드러난다.

여행 준비와 개인화된 조언의 즉시성 [2:10:25]

중국과 대만 방문 이야기를 계기로, 어디를 가야 하는지와 어떻게 움직여야 하는지 같은 질문이 곧바로 해소되는 점이 아름답다고 표현된다.
대만에 가면 AI에게 화자의 취향에 맞는 식당을 물어보라는 식의 농담이 오가며, AI가 개인화된 추천 도구로도 작동할 수 있음을 시사한다.
COMPUTEX와 NVIDIA GTC Taiwan이 언급되며, 기술 행사와 이동 경험이 AI 보조와 자연스럽게 연결된다.

감정을 인식하는 AI와 감정을 느끼는 존재의 차이 [2:11:01]

인간 의식이나 본성 가운데 계산으로 환원되지 않는 것이 있는지에 대한 질문이 던져진다.
AI는 불안이나 긴장 같은 상태를 인식하고 이해하는 방향으로 발전할 수는 있어도, 칩 자체가 실제로 그런 감정을 느끼게 될지는 회의적으로 본다.
같은 조건에서도 사람마다 전혀 다른 수행이 나오는 이유를 감정과 주관적 상태의 발현에서 찾으며, 이는 단순 계산 결과와는 다르다고 본다.

주관적 경험의 신비와 놀랄 가능성에 대한 개방성 [2:12:34]

희망, 두려움, 사랑, 상실, 죽음에 대한 공포처럼 인간 삶의 밀도 높은 체험은 특별한 차원으로 묘사된다.
계산 장치가 이런 삶의 질감을 실제로 가질 수 있을지 직관적으로는 어렵게 느껴진다는 입장이 나온다.
동시에 최근 몇 년간 스케일링이 보여준 지능의 도약이 너무 놀라웠기 때문에, 앞으로도 예상 밖의 일이 일어날 가능성은 열어둔다.

지능을 인간성과 분리해서 보는 관점 [2:13:34]

지능은 지각, 이해, 추론, 계획 같은 기능적 고리로 설명되며, 인간성 전체와 동일시되어서는 안 된다고 정리한다.
지능을 지나치게 낭만화하지 않겠다는 태도가 드러나고, 오히려 지능은 점점 범용화되는 기능처럼 본다고 말한다.
인간과 인간다움은 훨씬 더 큰 범주이며, 단일한 기술적 개념으로 환원될 수 없다는 선이 그어진다.

뛰어난 사람들 사이에서 조율하는 역할의 의미 [2:14:23]

자신보다 더 똑똑하고 더 잘 교육받았으며 각 분야에서 더 깊이 있는 사람들이 주변에 많다고 말한다.
그럼에도 자신이 그 중심에서 수십 명의 뛰어난 인재를 오케스트레이션하고 있다는 사실을 중요한 사례로 든다.
이를 통해 지능만으로 설명되지 않는 역할, 조율, 판단, 지속성 같은 요소가 성공에 크게 작용한다고 암시한다.

지능의 상품화와 인간적 가치의 재평가 [2:15:15]

지능은 기능적인 것이며, 삶의 경험·고통에 대한 내성·결단력은 다른 단어로 설명해야 한다고 말한다.
사회가 교육과 지능이라는 한 단어에 너무 많은 가치를 몰아넣었지만, 실제 삶은 그보다 훨씬 넓다고 지적한다.
연민, 관대함, 인격, 인간다움 같은 것이 오히려 더 높이 평가되어야 하며, 지능의 민주화가 불안을 만들기보다 영감을 줘야 한다고 주장한다.

죽음, 리더십, 후계보다 지식 전수의 연속성 [2:17:21]

자신의 삶과 가족, 그리고 현재 맡은 일이 너무 중요하기 때문에 죽고 싶지 않다고 솔직하게 말한다.
지금의 경험을 개인의 일생에 한 번이 아니라 인류 차원에서도 드문 경험으로 느끼고 있으며, 회사가 역사적으로 매우 중대한 일을 하고 있다고 본다.
후계 계획 자체에 집착하기보다, 오늘 해야 할 일은 지식·통찰·기술·경험을 가능한 한 빠르고 계속해서 주변에 넘기는 것이라고 설명한다.
모든 회의와 일상적 상호작용을 추론과 지식 전달의 자리로 삼고, 자신이 배우는 것은 거의 즉시 다른 사람에게 퍼뜨린다고 말한다.
궁극적으로는 자신이 죽는 순간까지 일하며, 주변 사람들의 역량이 충분히 끌어올려진 상태를 남기고 싶다는 바람이 드러난다.

인간과 엔지니어링에 대한 찬사에서 미래 질문으로 전환 [2:20:03]

진행자는 젠슨 황 개인과 NVIDIA가 문명에 끼친 긍정적 영향이 크다고 평가하며, 계속 활동해주길 바란다는 팬의 입장을 전한다.
NVIDIA의 빠른 혁신과 지속적인 엔지니어링 성취를 지켜보는 일이 즐겁고, 그것이 뛰어난 빌더와 기술자의 가치를 보여준다고 본다.
이런 감탄은 곧 더 큰 질문으로 이어진다. 앞으로 10년, 20년, 50년, 100년 뒤를 떠올릴 때 인류의 미래에서 무엇이 희망을 주는지 묻는다.

인간의 선의에 대한 강한 신뢰 [2:20:56]

젠슨 황은 인간의 친절함, 관대함, 연민, 그리고 전반적인 인간적 역량에 대해 늘 큰 확신을 가져왔다고 말한다.
때로는 그 신뢰 때문에 이용당하는 일도 있었지만, 그렇다고 해서 사람을 선의로 바라보는 태도를 버리지는 않았다고 한다.
그는 사람들은 기본적으로 좋은 일을 하고 싶어 하고, 다른 사람을 돕고 싶어 한다는 전제에서 출발한다고 설명한다.
자신의 경험상 그 믿음은 대체로 옳았고, 종종 기대 이상으로 확인되었다고 덧붙인다.

해결 가능한 문제들이 시야 안으로 들어온 시대 [2:21:56]

젠슨 황은 현재 가능한 것들을 보고 앞으로를 연장해 생각해보면, 매우 많은 좋은 변화가 실제로 일어날 가능성이 높아 보인다고 말한다.
인류는 풀고 싶은 문제, 만들고 싶은 것, 이루고 싶은 선한 목적이 많으며, 이제 그것들이 손이 닿는 범위 안으로 들어오고 있다고 본다.
특히 자신의 생애 안에서 그런 변화들을 볼 수 있을 것 같다는 점이 희망을 더욱 강하게 만든다.
그래서 이런 시대를 두고 낭만적이지 않을 수 없다고 표현하며, 기술 발전을 단순한 효율 개선이 아니라 인간적 열망의 실현 가능성으로 받아들인다.

질병·오염·우주 이동과 디지털 자아의 상상 [2:22:50]

그는 질병의 종말, 오염의 대폭 감소 같은 일이 충분히 기대 가능한 미래라고 말하며, 기술 진보를 매우 큰 사회적 문제 해결과 연결한다.
빛의 속도로 이동하는 미래도 짧은 거리라는 단서는 있지만 충분히 상상 가능한 범주로 언급한다.
이어 자신이 만든 휴머노이드를 우주선에 먼저 보내고, 비행 중에도 계속 개선되게 한 뒤, 축적된 자신의 디지털 흔적과 인공지능을 나중에 그 로봇에 합류시키는 구상을 이야기한다.
이메일, 발언, 삶의 기록이 이미 인터넷에 축적되어 있으며 그것이 자신의 AI로 이어질 수 있다는 발상은, 인간 정체성과 기술 매개 존재의 결합 가능성을 시사하는 상상으로 읽힌다.

생명·의식·물리학의 해명 가능성과 상호 감사의 마무리 [2:24:00]

진행자는 응용 측면뿐 아니라 과학적 호기심 자체가 더 크게 다가온다며, 여전히 풀리지 않은 수많은 질문들이 있다는 점에 흥분을 드러낸다.
젠슨 황은 생물학적 기계로서의 인간을 이해하는 일이 생각보다 가까이 와 있으며, 10년보다 5년쯤의 문제일 수 있다고 전망한다.
이어 인간의 마음, 이론물리, 의식 설명 같은 주제가 모두 손이 닿는 범위 안에 있다는 공감이 오간다.
마지막에는 진행자가 젠슨 황의 기여와 인간적 면모에 감사를 전하고, 젠슨 황도 깊이 있는 인터뷰와 긴 호흡의 형식을 만들어온 진행자에게 존경과 고마움을 표한다.
이후 진행자는 청취자에게 후원 안내와 인용구를 남기며 대화를 마무리하고, 미래를 예측하는 최선의 방법은 그것을 발명하는 것이라는 문장으로 여운을 남긴다.

🧾 결론

이 인터뷰에서 드러나는 엔비디아의 자기정의는 “GPU 제조사”보다 훨씬 넓다. 회사는 칩, 랙, 데이터센터, 소프트웨어, 전력, 공급망, 생태계를 하나의 시스템으로 보고 있으며, AI 시대의 가치가 개별 부품보다 전체 스택 통합 능력에서 나온다고 본다.
CUDA의 성공은 단순히 기술 우위의 결과라기보다, 설치 기반을 먼저 만들고 오랜 기간 손익 악화를 감수하며 개발자 생태계를 키운 전략의 산물로 제시된다. 이 대목은 플랫폼 사업에서 기술 완성도 못지않게 배포 면적과 지속 투자 의지가 얼마나 중요한지를 보여준다.
AI 수요에 대한 젠슨 황의 시각은 매우 강하게 낙관적이다. 프리트레이닝 데이터 한계론, 추론의 저비용 상품화 가정, 기존 시장 크기 기준의 성장 상한론을 모두 상대화하면서, 미래 수요는 토큰 생산·에이전트 확산·산업 전반의 AI 도입으로 훨씬 더 커질 수 있다고 본다.
동시에 그는 병목이 사라진다고 말하지 않는다. 오히려 앞으로의 핵심 제약은 전력, 공급망, 제조 복잡성, 계약 구조, 데이터센터 운영 유연성 같은 더 물리적이고 산업적인 영역으로 이동한다고 진단한다. 즉 AI 혁명은 소프트웨어만의 이야기가 아니라 산업 시스템 재설계의 문제라는 인식이 분명하다.
인간과 AI의 관계에 대해서도 기능적 지능과 인간다움을 구분하는 선이 반복된다. 지능은 점점 상품화될 수 있지만, 연민·관대함·판단·지속성·조율 같은 인간적 가치가 더 중요해질 수 있다는 후반부 메시지는 기술 낙관론을 인간 중심의 서사로 묶는 역할을 한다.

📈 투자·시사 포인트

가장 직접적인 포인트는 AI 인프라 투자 논리가 칩 판매를 넘어선다는 점이다. 인터뷰 내용대로라면 수혜 범위는 GPU뿐 아니라 HBM, 패키징, 광학, 네트워킹, 전력 설비, 냉각, 랙 제조, 데이터센터 통합, 테스트 인프라까지 확장된다. 따라서 AI 사이클을 볼 때도 단일 반도체 종목이 아니라 공급망 전반을 함께 봐야 한다는 함의가 크다.
엔비디아의 해자를 단순 점유율이 아니라 설치 기반과 개발자 신뢰로 본 대목은 중요하다. 이는 후발주자가 특정 칩 성능이나 가격 경쟁만으로 시장을 빠르게 뒤집기 어렵다는 논리로 연결된다. 다만 이것이 영구적 우위를 뜻한다고 단정할 수는 없고, 실제 지속성은 생태계 유지 속도와 플랫폼 적응력에 달려 있다는 점은 분리해서 볼 필요가 있다.
추론과 에이전트 확산이 오히려 더 많은 컴퓨트를 요구한다는 주장은, 시장이 기대하는 “AI 단가 하락 = 하드웨어 수요 둔화” 시나리오와 다른 그림을 제시한다. 만약 이 논리가 현실화되면, 추론 효율 개선이 수요 축소가 아니라 사용량 폭증을 불러오는 방향으로 작동할 가능성이 있다.
전력과 계약 구조에 대한 논의는 중장기적으로 매우 시사적이다. 데이터센터 증설의 병목이 단순 발전 용량 부족이 아니라, ‘항상 100% 가동 보장’을 전제로 한 고객 계약과 운영 방식일 수 있다는 문제제기는 향후 전력시장, 유틸리티, 데이터센터 SLA 구조 변화까지 연결될 수 있다.
직무와 교육에 대한 메시지도 산업적으로 의미가 있다. 젠슨 황은 AI 활용 역량이 회계, 마케팅, 법률, 공급망 등 거의 모든 화이트칼라 직무의 기본 역량이 될 것이라고 본다. 이는 소프트웨어 업계뿐 아니라 교육, 직업훈련, 기업 채용 기준, 생산성 도구 시장 전반에 구조적 변화가 이어질 수 있음을 시사한다.
다만 일부 장기 전망, 예를 들어 질병 해결, 우주 컴퓨트, 디지털 자아 같은 후반부 발언은 인터뷰 내 비전 제시 성격이 강하다. 이런 부분은 기업가적 상상력과 방향성으로 읽을 수는 있지만, 단기 투자 판단의 확정적 근거로 받아들이기보다는 검증이 필요한 장기 서사로 분리해 보는 편이 적절하다.

⚠️ 불확실하거나 확인이 필요한 부분

인터뷰 제목에 포함된 “$4 Trillion Company”는 영상 메타데이터의 표현이지만, 본문 요약만으로는 그 시점의 실제 시가총액·산정 기준·지속 기간을 검증할 수 없다.
Jensen Huang이 언급한 구체적 수치들(예: 부품 수 130만~150만 개, 약 200개 공급업체, 주당 생산 규모, 전력 규모 등)은 대화 내 발언으로 제시되지만, 외부 공시·기술 문서와 대조한 사실 검증은 별도로 필요하다.
“이미 AGI는 달성됐다”는 발언은 엄밀한 과학적 정의가 아니라 대화 중 제시된 실용적 기준에 따른 해석으로 보이며, 일반적 합의로 단정할 수 없다.