Kentino sro
K-AI 384 Rome RTXPro6000MQ — 4× RTX Pro 6000 Blackwell Max-Q Turbofan (384 GB ECC VRAM)
K-AI 384 Rome RTXPro6000MQ — 4× RTX Pro 6000 Blackwell Max-Q Turbofan (384 GB ECC VRAM)
Nelze načíst dostupnost výběru
K-AI 384 Řím RTXPro6000MQ 8000TOPS
Laboratorní server s 384 GB ECC VRAM
4x RTX Pro 6000 Max-Q Turbofan | EPYC Milan | 8 000 TOPS INT8
Publikované externí reference. Nebylo měřeno na hardwaru Kentino.
Rackový inferenční server s výškou 4U, čtyřmi grafickými kartami NVIDIA RTX Pro 6000 Blackwell Max-Q s turboventilátorem (každá s 96 GB ECC) a 384 GB ECC VRAM, jedním procesorem AMD EPYC 7643 Milan (48C/96T), 384 GB DDR4-2666 ECC, 2 TB NVMe bootovacím diskem a duálním synchronizovaným 2.5kW ATX zdrojem. Stejný křemík Blackwell jako u Server Edition – identická inferenční obálka, identická propustnost – s tišším chladičem vhodným pro laboratorní, výzkumné a vývojové prostředí a prostředí v blízkosti kanceláří.
technické vybavení
| Složka | Detail |
|---|---|
| GPU | 4x NVIDIA RTX Pro 6000 Blackwell Max-Q 96 GB ECC (chladič s turboventilátorem, 600 W TGP, PCIe 5.0 x16, 2000 INT8 TOPS/karta, nativní FP8) |
| Pool VRAM | 384 GB agregované ECC paměti na 4 kartách |
| Procesor (CPU) | AMD EPYC 7643 Milan (48C/96T, 225 W, 128 linek PCIe 4.0) |
| Základní deska | ASRock Rack ROMED8-2T (SP3, 7x PCIe 4.0 x16, 8x DDR4 ECC, 2x 10 GbE, IPMI) |
| Systémová RAM | 384 GB DDR4-2666 ECC RDIMM (6x 64 GB — 2 sloty DIMM volné pro upgrade na 512 GB) |
| Spouštění / úložiště | 2TB NVMe M.2 (PCIe 4.0 x4) |
| napájení | 2x 2.5 kW ATX se synchronizačním kabelem pro dva zdroje (agregát 5 kW) |
| Podvozek | 4U montáž do racku |
| Chlazení | Věžový chladič SP3 (třída Arctic Freezer 4U-M) + směrované proudění vzduchu zepředu dozadu (3x 120 mm přední sání + 1x 120 mm zadní výfuk). Grafické karty se samy chladí turbodmychadlem (zadní výfuk) – tišší provedení pro laboratorní prostředí. |
| Síť | Duální integrovaný 10GbE (Intel X550) |
Napájecí obálka
- Odběr energie z grafické karty: 4 x 600 W = 2 400 W
- Celkový výkon systému při plném zatížení: ~2 775 W
- Celkový výkon zdroje: 5 000 W (duální 2.5 kW synchronizovaný) — 44.5% rezerva
- Duální zdroj pro rozdělené napájení – selhání jednoho zdroje = ztráta 2 grafických karet nebo 2 grafických karet a základní desky
Tepelný profil (Max-Q)
Max-Q používá turboventilátorový chladič se směrovým odsáváním vzduchu ze zadní strany karty. Očekávaná teplota GPU při trvalém zatížení je 72-80 °C. Výrazně tišší než pasivní karty ve šasi s vysokým statickým tlakem. Vhodnější pro proudění vzduchu mimo datová centra, otevřený rack nebo umístění v blízkosti laboratoře/kanceláře. Křemík, TDP, ECC a výkon jsou shodné s edicí Server Edition.
Co můžete spustit
Identické s edicí Server (K-AI 384 Rome RTXPro6000) – stejný křemíkový procesor Blackwell, stejný 384GB ECC pool, stejný nativní FP8, stejná kompatibilita s modelem. Rozdíl je akustický, nikoli výpočetní.
LLM – text / uvažování / kódování
Čínská hranice
- DeepSeek V3 / V3-0324 / V3.1 / V3.2 / R1 / R1-0528 Q3 (~290 GB) pohodlně na kartu (~30-40 tok/s jeden tok, publikovaná reference); FP8 nativní (~670 GB s přebytečnou RAM)
- Qwen3-Coder-480B-A35B Q3 (~350 GB omezeno s únikem RAM) — SOTA open coding agent (~18-25 tok/s jeden, publikovaná reference)
- Qwen3-235B-A22B Q6/Q8 (~200-280 GB) s dlouhým ctx a dávkovým zpracováním pro více uživatelů
- GLM-5 / GLM-5.1 Q3 (~317 GB) — Čínská hranice, kódování blízké Claude Opus 4.6
- Kimi-K2 1.58bitový UD (~240 GB) — agent s biliony parametrů při skutečné propustnosti
- Hunyuan-velký 389B/52B Q4 (~220 GB), nativní FP8 (~390 GB volné paměti)
- ERNIE-4.5-424B-A47B 4. čtvrtletí (~240 GB); MiniMax-M1 Q4 (~260 GB) 1M-ctx
- Lama 3.3 70B bf16 rezidentní na jedné kartě (96 GB/karta)
Západní hranice
- Mistral Large 3 (675B/41B MoE, Apache 2.0) Q3 (~317 GB) — otevřené váhy na hranici západní fronty (~20-30 tok/s jednotlivě, publikovaná reference)
- Flame 4 Maverick (400B/17B) Q4 (~232 GB) s velkorysým rozpočtem KV (~45-55 tok/s jeden, publikovaná reference)
- Llama-3.1-Nemotron Ultra 253B Q4-Q6 (~119-207 GB)
- gpt-oss-120b Nativní MXFP4 (80 GB) se souběžnou kapacitou paměti
- Pixtral Large / Mistral Large 2 bf16 (~248 GB); Devstral 2 123B bf16 — 256k otevřeného kódování na nejvyšší úrovni
- Lama 3.3 70B bf16 na jedné kartě; možné 4 souběžné nasazení 70B
Modely vizuální a jazykové komunikace
Qwen3-VL-235B-A22B bf16 (~240 GB); InternVL3.5-241B-A28B Q4 (~135 GB); Llama 3.2 90B Vision bf16; Pixtral Large 124B bf16; Qwen3-Omni-30B-A3B; Molmo 72B; ERNIE-4.5-VL; GLM-4.6V 106B bf16 na TP. Blackwell fp8 poskytuje ~2x vyšší propustnost na inferenci Vision-Tower oproti Ada.
Generování obrazu
FLUX.1 [dev] / Kontext / Nástroje v nativní verzi pro FP8 (~15-20 s na obraz 1024x1024 na jedné grafické kartě RTX Pro 6000, publikovaná reference); SD 3.5 Large; HunyuanImage-2.1 (17B nativní 2K); HunyuanImage-3.0 80B/13B MoE; AuraFlow; OmniGen; 4x souběžní ComfyUI workeři.
Generování videa
Wan 2.2 T2V-A14B / I2V-A14B duální expert bf16; HunyuanVideo 13B bf16 oba experti; Open-Sora 2.0 (11B) bf16; CogVideoX-5B; Mochi-1; LTX-Video; Pyramid Flow; SVD / SV3D / SV4D; NVIDIA Cosmos Predict 2.
Zvuk / Řeč / TTS
- ASR: Whisper v3 velký / turbo; Parakeet-TDT; Canary; Qwen3-ASR; SenseVoice
- Překlad textu na řeč: CosyVoice 2/3; Kokoro; Stable Audio Open; XTTS v2; Step-Audio-EditX
- Reálný čas / S2S: Kyutai Moshi; Step-Audio 2 mini / R1; Qwen2.5-Omni-7B
- Hudba / Zvukové efekty: MusicGen / AudioGen / Bark / SeamlessM4T
Vícemodelové / vícenájemnické služby
- DeepSeek V3 Q3 + souběžný 70B + FLUX.1 + Whisper pro všechny rezidenty
- 4cestná tenzorová paralelní analýza na třídě 350-400B ve 4. čtvrtletí
- Izolace klienta na kartu – jeden 96GB Llama 3.3 70B bf16 na kartu, 4 nezávislá inferenční sila
- Vícemodelový RAG: čtečka + reranker + vision + embedder, vše na jednom hostiteli
Cílové úlohy
- Inference Frontier Open-Wath pro laboratorní / výzkumný a vývojový tým, kde záleží na akustickém rozpočtu
- Serverovna pro malé týmy bez vyhrazeného proudění vzduchu v datovém centru – systém chlazení Max-Q toleruje umístění v otevřeném racku
- Pracovní stanice s umělou inteligencí sousedící s kanceláří pro specializovaný tým (výzkum strojového učení, agentické nástroje)
- nativní FP8 (DeepSeek / R1 / Hunyuan) v laboratorních podmínkách
- Izolační úloha pro 4 klienty na kartu s rozpočtem na šum
Publikované reference výkonu
Externí reference | Stejný křemík jako u Server Edition | Neměřeno na hardwaru Kentino
| měřítko | Výsledek |
|---|---|
| RTX Pro 6000 na kartu INT8 TOPS | 2 000 TOPŮ |
| Šířka pásma paměti RTX Pro 6000 | ~1 800 GB/s na kartu |
| vLLM — DeepSeek V3 Q3 na 4x Blackwell PCIe (jednoduchý) | ~30-40 tok/s |
| vLLM — DeepSeek V3 Q3 na 4x Blackwell PCIe (dávka-8) | ~200 tok/s agregát |
| SGLang — Llama 4 Maverick Q4 na 4x Blackwell (single) | ~45-55 tok/s |
| llama.cpp — Qwen3-Coder-480B Q3 na 4x Blackwell (jednoduchý) | ~18-25 tok/s |
| FLUX.1 [dev] fp8 na jedné grafické kartě RTX Pro 6000 | ~1.8 s na obrázek 1024x1024 |
Kentino zveřejní čísla od první strany po počátečním sestavení pro zákazníky.
Není ideální pro
- Správné nasazení v racku datových center se zavedeným prouděním vzduchu v horké uličce – zvolte místo toho pasivní Server Edition (K-AI 384 Rome RTXPro6000): stejný křemík, mechanicky jednodušší
- Zátěž pro jednoho uživatele až 70B (4x RTX 5090 je pro 128GB pool podstatně levnější)
- Školení Frontier od nuly (bez NVLink)
- Plná paměť DeepSeek V3 Q4 na grafické kartě (~404 GB) – upgrade na 6x RTX Pro 6000 / 576 GB
Záruka a dodací lhůta
Sestavení zahrnuje montáž, konfiguraci BIOSu, instalaci ovladačů, zapálení, memtest a funkční ověření. Dodací lhůta závisí na dostupnosti komponent, která bude potvrzena při objednávce.
Doporučené doplňky
- Upgradujte paměť RAM na 512 GB DDR4 (přidejte 2x 64 GB — 2 volné sloty DIMM) pro větší prostor pro RAM u procesorů Q3 Frontier Quantum
- 4 TB NVMe Gen4 x4 pro knihovnu Frontier-Model (samotná DeepSeek V3 Q3 má na disku ~290 GB)
- Plná 24U racková skříň s řízeným PDU a online UPS
- Alternativní silueta: pasivní Server Edition (K-AI 384 Rome RTXPro6000) – stejný křemík, pro nasazení s prouděním vzduchu v datových centrech
Sdílet
