액침냉각 Immersion Cooling - DOBE Computing 두비컴퓨팅

액침냉각, Immersion Cooling, 액체냉각, Liquid Cooling, Direct-to-Chip, DTC 냉각 고밀도 랙, High Density Rack, 100kW 랙, 200kW 랙, AI 서버 냉각 CDU, Coolant Distribution Unit, 냉각수 분배 장치, Cold Plate, 콜드 플레이트 1상 액침, Single-phase Immersion, 2상 액침, Two-phase Immersion 유전체 용액, Dielectric Fluid, PUE 효율, 데이터센터 냉각 기술 NVIDIA GB200, NVL72, HPC 냉각, AI 데이터센터 냉각 솔루션 In-Row CDU, Rack-Mounted CDU, 정밀 냉각, Precision Cooling

액침냉각 (Immersion Cooling)

고밀도 랙! 즉, 100kW 부하를 처리하기 위해서는 반드시 '액체 냉각(Liquid Cooling)' 솔루션이 도입되어야 합니다.
이를 해결하기 위한 구체적인 3가지 핵심 기술과 시스템 구성은 다음과 같습니다.

1. Direct-to-Chip 방식

현재 NVIDIA의 최신 AI 랙 (GB200 NVL72 : 약 120 kW 소비)을 비롯한 고성능 컴퓨팅(HPC) 시장에서 가장 주류로 채택되는 방식입니다.

  • 작동 원리: 발열이 심한 부품(GPU, CPU, 메모리 등) 바로 위에 금속 소재의 '콜드 플레이트(Cold Plate)'를 부착합니다. 이 플레이트 내부로 냉각수(물 또는 특수 용매)가 흐르며 열을 직접 흡수하여 밖으로 빼냅니다.
  • 장점: 기존 랙 형태를 유지하면서 도입 가능, 가장 검증된 고밀도 냉각 기술.

2. 액침 냉각 (Immersion Cooling)

서버 전체를 비전도성 액체에 '담그는' 방식입니다. 100 kW 이상의 극도로 높은 밀도를 처리하는 데 열효율 측면에서 가장 우수합니다.

  • 작동 원리: 랙 자체가 거대한 수조(Tank) 형태가 됩니다. 서버를 특수 유전체 용액(Dielectric Fluid)에 통째로 담급니다.
    • 1상 액침 (Single-phase): 액체가 순환하며 열을 식힙니다.
    • 2상 액침 (Two-phase): 액체가 끓으면서 기체로 변할 때 발생하는 기화열을 이용해 냉각합니다. (냉각 효율은 2상이 압도적이나 유체 관리 및 환경 규제 이슈가 있음)
  • 100kW 해결 방안: 팬(Fan)이 전혀 필요 없어 전력 효율(PUE)이 1.02~1.05 수준으로 매우 좋습니다. 100 kW는 물론 200kW급 랙도 수용 가능합니다.
  • 단점: 유지보수 시 용액을 닦아내야 하는 번거로움, 바닥 하중 보강 필요, 전용 탱크 도입 필요.

3. 필수 인프라: CDU (Coolant Distribution Unit)

어떤 액체 냉각 방식을 쓰더라도 100 kW 랙을 돌리기 위해서는 CDU가 핵심 심장 역할을 합니다.

  • 역할: 데이터센터 건물(Facility)에서 공급되는 1차 냉각수와, 랙 내부를 도는 2차 냉각수 사이에서 열교환을 하고 유량을 제어합니다.
  • 구성: 고밀도 랙 하나를 위해서는 In-Row CDU (랙 사이에 배치) 또는 Rack-Mounted CDU (랙 내부에 통합)가 필요하며, 분당 수백 리터의 유량을 정밀하게 제어해야 합니다.

📊 요약 및 비교

구분 다이렉트 투 칩 (DTC) 액침 냉각 (Immersion)
냉각 한계 랙당 100kW ~ 120kW 가능 (RDHx 병행 시) 랙당 200kW 이상 가능
공간 효율 기존 데이터센터 구조 활용 가능 전용 수조 공간 및 크레인 필요
주요 적용 NVIDIA, Intel 등 최신 AI 칩셋의 표준 비트코인 채굴, 초고밀도 슈퍼컴퓨터
도입 난이도 중간 (배관, 누수 감지 필요) 높음 (건물 구조 변경, 운영 방식 변화)

🚧 현재 상황: 왜 침체되어 보이는가? (벤더의 장벽)

현재 액침 냉각(Immersion Cooling) 시장은 기술적 우수성에도 불구하고, 하드웨어 벤더(특히 NVIDIA, 주요 서버 제조사)의 보증(Warranty) 정책이라는 거대한 장벽에 막혀 예상보다 더디게 성장하고 있는 것이 사실입니다.

🛡️

보증(Warranty) 파기 이슈 ⚠️ 주의

  • 현재 NVIDIA를 포함한 대부분의 칩 제조사는 칩을 액체에 직접 담그는 행위를 '개조(Modification)'로 간주합니다.
  • 고밀도 랙을 구성하려면 수십 억 원어치의 GPU가 들어가는데, "액체에 담그는 순간 AS가 불가능하다"는 정책은 고객사(데이터센터 운영사)에게 감당할 수 없는 리스크입니다.
🧪

화학적 신뢰성 검증 부족 ⚠️ 주의

  • 액침 냉각용 유체(Fluid)가 장기간 사용되었을 때, 칩의 패키징, 기판(PCB), 커패시터, 케이블 피복 등에 어떤 화학적 변형을 일으킬지에 대한 장기 데이터(5~10년)가 칩 제조사 입장에서 부족합니다.
  • 벤더 입장에서는 검증되지 않은 리스크를 떠안느니, 익숙한 공랭이나 DTC(Direct-to-Chip, 콜드플레이트) 방식을 미는 것이 훨씬 안전합니다.