Data Center Networking
기술 정의/원리
AI 데이터센터에서 수천~수만 GPU가 분산 학습·추론을 위해 교환하는 east-west 트래픽을 처리하는 고속 패브릭 기술. 800G/1.6T Ethernet 스위치, InfiniBand NDR/XDR, RDMA(RoCE v2) 등을 통해 GPU 간 all-reduce 통신 지연을 최소화한다.
현재 성숙도
TRL 9 (완전 상용화) — 400G 이더넷 현재 주력, 800G 전환 사이클 본격 진행 중(2025-2026). NVIDIA InfiniBand NDR 400Gbps 상용화 완료, Ultra Ethernet Consortium(UEC) 표준화 작업 진행 중.
주요 기업/연구기관
| 기업 | 역할 | 포지션 |
|---|---|---|
| Broadcom (AVGO) | 이더넷 스위치 ASIC (Tomahawk/Jericho) | 데이터센터 스위치 ASIC 1위 |
| NVIDIA | InfiniBand NIC·스위치 (Mellanox) | AI 클러스터 인터커넥트 표준 |
| Arista Networks (ANET) | 이더넷 스위칭 장비 | 하이퍼스케일러 AI 패브릭 핵심 공급 |
| Coherent / II-VI | 광트랜시버 (800G/1.6T) | 광모듈 공급 1~2위 |
| Marvell Technology | 이더넷 PHY·DSP, 광 DSP | 광트랜시버 DSP 칩 핵심 공급 |
투자 관점 포인트
- GB200 랙 시스템의 800G 필수 전환: GB200 NVL72 랙 구성에서 front-of-rack 스위치가 400G→800G로 업그레이드 필수.
- AI 네트워크는 후행이 아닌 동행 지출: GPU 증설과 동시에 네트워크 업그레이드가 이루어져 수요 가시성이 높음.
- 광트랜시버 수요 폭발: 800G·1.6T 전환에서 광모듈 단가가 상승하고, 실리콘 포토닉스 내재화 경쟁 가속.
- Ultra Ethernet vs InfiniBand 경쟁: UEC 표준 확정 시 이더넷 진영이 AI 클러스터 인터커넥트 점유율을 확대할 잠재력.
2026 핵심 이벤트/마일스톤
- 800G Ethernet 표준화 완료 (IEEE 802.3df): 표준 확정으로 멀티벤더 상호운용성 보장 및 장비 구매 가속화.
- Ultra Ethernet Consortium (UEC) 1.0 스펙 확정: AI 최적화 이더넷 프로토콜 공식 규격 발표.
- NVIDIA Quantum-X800 InfiniBand NDR 800 상용 출하: 차세대 InfiniBand 스위치 시스템 고객 배포.
- 1.6T 광트랜시버 초기 배포: 초대형 클러스터에서 1.6T CPO(Co-Packaged Optics) 파일럿 시작.
- Arista AI 특화 EOS 운영체제 업데이트: AI 트래픽 패턴(all-reduce, all-to-all) 최적화 기능 공개.
🎯 기술 요약
- 한 줄 정의: AI 데이터센터에서 GPU 클러스터 간 초고속·저지연 통신을 보장하는 스위치·인터커넥트·패브릭 기술.
💰 왜 지금 주목(투자 포인트)
- 대규모 분산 학습/추론에서 네트워크 병목이 전체 클러스터 효율을 좌우해, GPU 증설만으로는 성능 개선이 제한되는 구간이 늘고 있다.
- 400G/800G 전환과 광모듈 수요 확대가 동시에 진행되며, 네트워크 장비·광부품·케이블까지 투자 범위가 넓어졌다.
- 이더넷 진영의 AI 최적화가 빨라지면서 InfiniBand 대비 선택지가 늘고, 아키텍처 표준 경쟁이 재점화되고 있다.
📏 KPI (3개)
- 네트워크 효율: 클러스터 utilization, all-reduce 시간, 패킷 재전송률.
- 속도 전환 지표: 400G→800G 포트 믹스, 스위치 백플레인 용량.
- 단가/수익성 지표: 광트랜시버 ASP, 장비 리드타임, 설치량 성장률.
👀 모니터링 (3개)
- 하이퍼스케일러 설계 변화: AI 팩토리형 클러스터 토폴로지(Clos/Dragonfly+) 채택.
- 표준/생태계 동향: UEC, RoCE, InfiniBand 로드맵과 상호운용성 개선.
- 공급망 지표: 광모듈, DSP, 실리콘 포토닉스, 고속 케이블 수급 상황.
🧩 투자 해석 메모
- AI 사이클에서 네트워크는 후행 지출이 아니라 동행 지출로 이동 중이어서 밸류체인 동시 확인이 필요하다.
- 장비 벤더 경쟁력은 포트 속도보다 운영 자동화·관측성·혼합 워크로드 안정성에서 갈릴 가능성이 크다.
- 특정 인터커넥트 표준의 승자독식보다 멀티패브릭 공존 시나리오가 현실적일 수 있다.
⚠️ 리스크 체크
- GPU 공급이 흔들리면 네트워크 투자 집행도 연쇄 지연될 수 있다.
- 표준 전환이 늦어지면 고속 장비/광부품 수요가 일시적으로 공백을 겪을 수 있다.
- 대형 고객 집중도가 높아 발주 타이밍 변동이 실적 변동성으로 확대될 수 있다.
🔗 관련 회사 (Dataview)
TABLE company, market, ticker, sector, value_chain, spotlight_tech, updated
FROM "Research_DB/개별종목"
WHERE contains(spotlight_tech, this.file.link)
OR contains(string(spotlight_tech), this.tech)
OR contains(file.outlinks, this.file.link)
SORT updated DESC
LIMIT 200
✅ 실무 체크리스트
- 이번 분기 핵심 가설 1개를 명시하고, 반증 조건을 함께 기록한다.
- KPI 3개 중 선행지표/후행지표를 구분해 월간 업데이트한다.
- 관련 회사 Dataview 결과에서 상위 5개 종목은 링크 무결성(깨진 링크 여부)을 확인한다.
- 지표 해석 시 단기 이벤트(실적 시즌)와 구조 변화(사이클 전환)를 분리해서 메모한다.
- 테크 노트 업데이트 시 연결된 회사 노트의 spotlight_tech 표기도 함께 점검한다.
🗓️ 90일 관찰 포인트
- 1개월: 발표/실적/가격정책 변화를 수집하고 기존 가설의 방향성을 확인.
- 2개월: 실제 수요 지표(발주, 사용량, 배포 사례)와 기대치 괴리를 점검.
- 3개월: 멀티플/밸류에이션 재평가 요인을 정리하고 next_review에서 반영.
- 관찰 중 신뢰도 낮은 소스는 제외하고, 공식 문서·실적자료·기술문서 중심으로 정제.
- 변화가 없더라도 "변화 없음"을 명시해 추적 공백을 방지.
- 월 1회 최소 업데이트를 목표로 하되, 이벤트 발생 시 수시 갱신.
- 업데이트 시각과 변경 요약을 노트 하단에 1줄로 남긴다.
- 다음 검토일 이전에 핵심 KPI 재정의 필요 여부를 점검.
- 데이터 공백 구간은 추정치 대신 NA로 표기.
Companies Exposed
| Ticker | Exposure | Note |
|---|---|---|
| [[개별종목/미국/NVDA|NVDA]] | High | InfiniBand/NVLink |
| [[개별종목/미국/ANET|ANET]] | High | 이더넷 스위치 |
(자동 업데이터가 채웁니다)
<!-- /AUTO:COMPANIES -->