Přejděte přímo na informace o produktu
1 de 7

Kentino sro

K-AI 384 Rome RTXPro6000MQ — 4× RTX Pro 6000 Blackwell Max-Q Turbofan (384 GB ECC VRAM)

K-AI 384 Rome RTXPro6000MQ — 4× RTX Pro 6000 Blackwell Max-Q Turbofan (384 GB ECC VRAM)

Precio obvyklé EUR € 46.583,00
Precio obvyklé Precio de oferta EUR € 46.583,00
Nabídnout vyčerpaný
Impuestos incluidos. Los náklady na přepravu se počítají na platební obrazovce.

K-AI 384 Řím RTXPro6000MQ 8000TOPS

Laboratorní server s 384 GB ECC VRAM
4x RTX Pro 6000 Max-Q Turbofan | EPYC Milan | 8 000 TOPS INT8

8 000
TOPS INT8
384 GB
ECC VRAM fond
fp8
rodák z Blackwellu
Klid
chlazení turbodmychadlem

Publikované externí reference. Nebylo měřeno na hardwaru Kentino.

Rackový inferenční server s výškou 4U, čtyřmi grafickými kartami NVIDIA RTX Pro 6000 Blackwell Max-Q s turboventilátorem (každá s 96 GB ECC) a 384 GB ECC VRAM, jedním procesorem AMD EPYC 7643 Milan (48C/96T), 384 GB DDR4-2666 ECC, 2 TB NVMe bootovacím diskem a duálním synchronizovaným 2.5kW ATX zdrojem. Stejný křemík Blackwell jako u Server Edition – identická inferenční obálka, identická propustnost – s tišším chladičem vhodným pro laboratorní, výzkumné a vývojové prostředí a prostředí v blízkosti kanceláří.

technické vybavení

Složka Detail
GPU 4x NVIDIA RTX Pro 6000 Blackwell Max-Q 96 GB ECC (chladič s turboventilátorem, 600 W TGP, PCIe 5.0 x16, 2000 INT8 TOPS/karta, nativní FP8)
Pool VRAM 384 GB agregované ECC paměti na 4 kartách
Procesor (CPU) AMD EPYC 7643 Milan (48C/96T, 225 W, 128 linek PCIe 4.0)
Základní deska ASRock Rack ROMED8-2T (SP3, 7x PCIe 4.0 x16, 8x DDR4 ECC, 2x 10 GbE, IPMI)
Systémová RAM 384 GB DDR4-2666 ECC RDIMM (6x 64 GB — 2 sloty DIMM volné pro upgrade na 512 GB)
Spouštění / úložiště 2TB NVMe M.2 (PCIe 4.0 x4)
napájení 2x 2.5 kW ATX se synchronizačním kabelem pro dva zdroje (agregát 5 kW)
Podvozek 4U montáž do racku
Chlazení Věžový chladič SP3 (třída Arctic Freezer 4U-M) + směrované proudění vzduchu zepředu dozadu (3x 120 mm přední sání + 1x 120 mm zadní výfuk). Grafické karty se samy chladí turbodmychadlem (zadní výfuk) – tišší provedení pro laboratorní prostředí.
Síť Duální integrovaný 10GbE (Intel X550)

Napájecí obálka

  • Odběr energie z grafické karty: 4 x 600 W = 2 400 W
  • Celkový výkon systému při plném zatížení: ~2 775 W
  • Celkový výkon zdroje: 5 000 W (duální 2.5 kW synchronizovaný) — 44.5% rezerva
  • Duální zdroj pro rozdělené napájení – selhání jednoho zdroje = ztráta 2 grafických karet nebo 2 grafických karet a základní desky

Tepelný profil (Max-Q)

Max-Q používá turboventilátorový chladič se směrovým odsáváním vzduchu ze zadní strany karty. Očekávaná teplota GPU při trvalém zatížení je 72-80 °C. Výrazně tišší než pasivní karty ve šasi s vysokým statickým tlakem. Vhodnější pro proudění vzduchu mimo datová centra, otevřený rack nebo umístění v blízkosti laboratoře/kanceláře. Křemík, TDP, ECC a výkon jsou shodné s edicí Server Edition.

Co můžete spustit

Identické s edicí Server (K-AI 384 Rome RTXPro6000) – stejný křemíkový procesor Blackwell, stejný 384GB ECC pool, stejný nativní FP8, stejná kompatibilita s modelem. Rozdíl je akustický, nikoli výpočetní.

LLM – text / uvažování / kódování

Čínská hranice

  • DeepSeek V3 / V3-0324 / V3.1 / V3.2 / R1 / R1-0528 Q3 (~290 GB) pohodlně na kartu (~30-40 tok/s jeden tok, publikovaná reference); FP8 nativní (~670 GB s přebytečnou RAM)
  • Qwen3-Coder-480B-A35B Q3 (~350 GB omezeno s únikem RAM) — SOTA open coding agent (~18-25 tok/s jeden, publikovaná reference)
  • Qwen3-235B-A22B Q6/Q8 (~200-280 GB) s dlouhým ctx a dávkovým zpracováním pro více uživatelů
  • GLM-5 / GLM-5.1 Q3 (~317 GB) — Čínská hranice, kódování blízké Claude Opus 4.6
  • Kimi-K2 1.58bitový UD (~240 GB) — agent s biliony parametrů při skutečné propustnosti
  • Hunyuan-velký 389B/52B Q4 (~220 GB), nativní FP8 (~390 GB volné paměti)
  • ERNIE-4.5-424B-A47B 4. čtvrtletí (~240 GB); MiniMax-M1 Q4 (~260 GB) 1M-ctx
  • Lama 3.3 70B bf16 rezidentní na jedné kartě (96 GB/karta)

Západní hranice

  • Mistral Large 3 (675B/41B MoE, Apache 2.0) Q3 (~317 GB) — otevřené váhy na hranici západní fronty (~20-30 tok/s jednotlivě, publikovaná reference)
  • Flame 4 Maverick (400B/17B) Q4 (~232 GB) s velkorysým rozpočtem KV (~45-55 tok/s jeden, publikovaná reference)
  • Llama-3.1-Nemotron Ultra 253B Q4-Q6 (~119-207 GB)
  • gpt-oss-120b Nativní MXFP4 (80 GB) se souběžnou kapacitou paměti
  • Pixtral Large / Mistral Large 2 bf16 (~248 GB); Devstral 2 123B bf16 — 256k otevřeného kódování na nejvyšší úrovni
  • Lama 3.3 70B bf16 na jedné kartě; možné 4 souběžné nasazení 70B

Modely vizuální a jazykové komunikace

Qwen3-VL-235B-A22B bf16 (~240 GB); InternVL3.5-241B-A28B Q4 (~135 GB); Llama 3.2 90B Vision bf16; Pixtral Large 124B bf16; Qwen3-Omni-30B-A3B; Molmo 72B; ERNIE-4.5-VL; GLM-4.6V 106B bf16 na TP. Blackwell fp8 poskytuje ~2x vyšší propustnost na inferenci Vision-Tower oproti Ada.

Generování obrazu

FLUX.1 [dev] / Kontext / Nástroje v nativní verzi pro FP8 (~15-20 s na obraz 1024x1024 na jedné grafické kartě RTX Pro 6000, publikovaná reference); SD 3.5 Large; HunyuanImage-2.1 (17B nativní 2K); HunyuanImage-3.0 80B/13B MoE; AuraFlow; OmniGen; 4x souběžní ComfyUI workeři.

Generování videa

Wan 2.2 T2V-A14B / I2V-A14B duální expert bf16; HunyuanVideo 13B bf16 oba experti; Open-Sora 2.0 (11B) bf16; CogVideoX-5B; Mochi-1; LTX-Video; Pyramid Flow; SVD / SV3D / SV4D; NVIDIA Cosmos Predict 2.

Zvuk / Řeč / TTS

  • ASR: Whisper v3 velký / turbo; Parakeet-TDT; Canary; Qwen3-ASR; SenseVoice
  • Překlad textu na řeč: CosyVoice 2/3; Kokoro; Stable Audio Open; XTTS v2; Step-Audio-EditX
  • Reálný čas / S2S: Kyutai Moshi; Step-Audio 2 mini / R1; Qwen2.5-Omni-7B
  • Hudba / Zvukové efekty: MusicGen / AudioGen / Bark / SeamlessM4T

Vícemodelové / vícenájemnické služby

  • DeepSeek V3 Q3 + souběžný 70B + FLUX.1 + Whisper pro všechny rezidenty
  • 4cestná tenzorová paralelní analýza na třídě 350-400B ve 4. čtvrtletí
  • Izolace klienta na kartu – jeden 96GB Llama 3.3 70B bf16 na kartu, 4 nezávislá inferenční sila
  • Vícemodelový RAG: čtečka + reranker + vision + embedder, vše na jednom hostiteli

Cílové úlohy

  • Inference Frontier Open-Wath pro laboratorní / výzkumný a vývojový tým, kde záleží na akustickém rozpočtu
  • Serverovna pro malé týmy bez vyhrazeného proudění vzduchu v datovém centru – systém chlazení Max-Q toleruje umístění v otevřeném racku
  • Pracovní stanice s umělou inteligencí sousedící s kanceláří pro specializovaný tým (výzkum strojového učení, agentické nástroje)
  • nativní FP8 (DeepSeek / R1 / Hunyuan) v laboratorních podmínkách
  • Izolační úloha pro 4 klienty na kartu s rozpočtem na šum

Publikované reference výkonu

Externí reference | Stejný křemík jako u Server Edition | Neměřeno na hardwaru Kentino

měřítko Výsledek
RTX Pro 6000 na kartu INT8 TOPS 2 000 TOPŮ
Šířka pásma paměti RTX Pro 6000 ~1 800 GB/s na kartu
vLLM — DeepSeek V3 Q3 na 4x Blackwell PCIe (jednoduchý) ~30-40 tok/s
vLLM — DeepSeek V3 Q3 na 4x Blackwell PCIe (dávka-8) ~200 tok/s agregát
SGLang — Llama 4 Maverick Q4 na 4x Blackwell (single) ~45-55 tok/s
llama.cpp — Qwen3-Coder-480B Q3 na 4x Blackwell (jednoduchý) ~18-25 tok/s
FLUX.1 [dev] fp8 na jedné grafické kartě RTX Pro 6000 ~1.8 s na obrázek 1024x1024

Kentino zveřejní čísla od první strany po počátečním sestavení pro zákazníky.

Není ideální pro

  • Správné nasazení v racku datových center se zavedeným prouděním vzduchu v horké uličce – zvolte místo toho pasivní Server Edition (K-AI 384 Rome RTXPro6000): stejný křemík, mechanicky jednodušší
  • Zátěž pro jednoho uživatele až 70B (4x RTX 5090 je pro 128GB pool podstatně levnější)
  • Školení Frontier od nuly (bez NVLink)
  • Plná paměť DeepSeek V3 Q4 na grafické kartě (~404 GB) – upgrade na 6x RTX Pro 6000 / 576 GB

Záruka a dodací lhůta

3 let
Záruka na grafické karty NVIDIA OEM
2 let
záruka na díly
1 rok
záruka na práci
10 28-dny
dodací lhůta

Sestavení zahrnuje montáž, konfiguraci BIOSu, instalaci ovladačů, zapálení, memtest a funkční ověření. Dodací lhůta závisí na dostupnosti komponent, která bude potvrzena při objednávce.

Doporučené doplňky

  • Upgradujte paměť RAM na 512 GB DDR4 (přidejte 2x 64 GB — 2 volné sloty DIMM) pro větší prostor pro RAM u procesorů Q3 Frontier Quantum
  • 4 TB NVMe Gen4 x4 pro knihovnu Frontier-Model (samotná DeepSeek V3 Q3 má na disku ~290 GB)
  • Plná 24U racková skříň s řízeným PDU a online UPS
  • Alternativní silueta: pasivní Server Edition (K-AI 384 Rome RTXPro6000) – stejný křemík, pro nasazení s prouděním vzduchu v datových centrech
Podívejte se na všechny podrobnosti