Kentino sro
K-AI 192 Řím ArcProB70 bude upřesněno — 6× Intel Arc Pro B70 — EPYC Milán (Předobjednávka)
K-AI 192 Řím ArcProB70 bude upřesněno — 6× Intel Arc Pro B70 — EPYC Milán (Předobjednávka)
Nelze načíst dostupnost vyzvednutí
V PŘÍPRAVĚ
Předobjednávka — Intel Arc Pro B70 bude dodán ve 3. čtvrtletí 2026
K-AI 192 Řím ArcProB70 bude upřesněno
192 GB VRAM Intel Xe2 Inference Server
6x Arc Pro B70 | EPYC Milán | TOPY budou upřesněny
Cenově výhodná sestava s vysokým objemem VRAM zaměřená na open-source inferenční stack od Intelu. Cena je vázána na dostupnost produktů od Intelu.
Rackový inferenční server s výškou 4U a šesti kartami Intel Arc Pro B70 Creator (každá s 32 GB Xe2-HPG "Battlemage", celkem 192 GB), jedním procesorem AMD EPYC 7643 Milan (48C/96T), 384 GB paměti DDR4 ECC, 2 TB NVMe bootovacím diskem a 2kW ATX zdrojem (důrazně doporučujeme upgrade na dva zdroje). Vytvořeno pro softwarový ekosystém Intel: OpenVINO 2025+, IPEX-LLM, llama.cpp SYCL backend a vLLM-Intel forky. Na tomto hardwaru neběží úlohy pouze s CUDA.
technické vybavení
| Složka | Detail |
|---|---|
| GPU | 6x Intel Arc Pro B70 Creator 32 GB (Xe2-HPG "Battlemage", 250 W, PCIe 5.0 x16, dvouslotová) |
| Pool VRAM | 192 GB agregátu na 6 kartách (bez mezikartové struktury – peer provoz přes PCIe) |
| Procesor (CPU) | AMD EPYC 7643 Milan (48C/96T, 225 W, 128 linek PCIe 4.0) |
| Základní deska | ASRock Rack ROMED8-2T (SP3, 7x PCIe 4.0 x16, 8x DDR4 ECC, 2x 10 GbE, IPMI) |
| Systémová RAM | 384 GB DDR4-2666 ECC RDIMM (6x 64 GB) |
| Spouštění / úložiště | 2TB NVMe M.2 (PCIe 4.0 x4) |
| napájení | 1x 2 kW ATX zdroj (důrazně se doporučuje upgrade na duální 2 kW synchronizovaný zdroj) |
| Podvozek | Montáž do racku 4U (6slotové uspořádání) |
| Chlazení | Věžový chladič SP3 (Arctic Freezer 4U-M) + směrované proudění vzduchu zepředu dozadu (průmyslové ventilátory) |
| Síť | Duální integrovaný 10GbE (Intel X550) |
Napájecí obálka
- Spotřeba GPU: 6 x 250 W = 1 500 W (TDP publikované společností Intel)
- Celkový výkon systému při plném zatížení: ~1 825 W
- Celkový výkon zdroje: 2 000 W (samostatný) — pouze 8.75 % volného prostoru
- Důrazně se doporučuje duální synchronizovaný provoz o výkonu 2 kW – obnovuje ~45 % rezervy
Topologie jízdních pruhů
ROMED8-2T nabízí 7 linek PCIe 4.0 x16. Šest obsazených slotů; jeden volný pro upsell síťové karty. Arc Pro B70 je nativní pro PCIe Gen5; ROMED8-2T běží na Gen4 – dopad na šířku pásma je zanedbatelný pro inferenci při 32 GB na kartu. Žádný přepínač PCIe. Žádný ekvivalent Xe-Link.
Co můžete spustit
Veškerá tvrzení o kompatibilitě se vztahují k softwarovým datovým vrstvám Intel (OpenVINO, IPEX-LLM, llama.cpp SYCL, vLLM-Intel). Na tomto hardwaru neběží úlohy pouze s technologií CUDA. Všechny údaje citují publikované externí zdroje a podléhají nezávislému ověření při expedici karet.
LLM – text / uvažování / kódování
Čínská hranice
- Qwen3 / Qwen3.5 (Alibaba): Qwen3-235B-A22B Q4 (~132 GB) s dlouhou kontextovou rezervou; Qwen3-Coder-480B-A35B Q2 (~160 GB); Qwen3.5-397B-A17B Q3 (~170 GB)
- GLM / Z.ai: GLM-4.5 / 4.6 / 4.7 Q4 (~177 GB) — vhodné pro střední KV
- Tencent Hunyuan: Hunyuan-Large Q3 (~160 GB); Hunyuan-A13B fp8 (~80 GB), pokud je v ovladači odhalena cesta Xe2 fp8
- Ostatní: Baidu ERNIE-4.5-424B Q3 (~180 GB); MiniMax-M1 Q3 (~180 GB); DeepSeek-R2 32B (6 souběžných streamů)
Západní hranice
- Meta láma: Llama 3.3 70B Q6-Q8 s velkorysým KV; Llama 4 Scout 109B/17B Q4 (~63 GB) pohodlná
- Mistral: Mistral Malý 3 / Magistral Malý / Devstral Malý 2 (24B) na bf16; Pixtral Velký Q4-Q6
- OpenAI (otevřené váhy): gpt-oss-120b MXFP4 nativní (~80 GB) — pokud je v Intel stacku k dispozici dostatek MXFP4
- NVIDIA Nemotron: Llama-3.1-Nemotron Ultra 253B Q4 (~120 GB)
- Ostatní: Gemma 3 27B bf16 multimodální; Phi-4 / Phi-4-reasoning 14B; Cohere Command R+ 104B Q4
Modely vizuální a jazykové komunikace
Qwen3-VL-8B / 32B; Qwen3-VL-30B-A3B MoE; InternVL3 až 78B; InternVL3.5-38B; Llama 3.2 90B Vision Q4; Pixtral 12B; Molmo 72B Q4; Gemma 3 12B/27B multimodální; MiniCPM-V 2.6 / MiniCPM-o 2.6. Intel OpenVINO má silnou podporu pro vision-tower – VLM je pravděpodobnou silnou stránkou hned od prvního dne.
Generování obrazu
FLUX.1 [dev] / [schnell] fp8 nebo Q4 GGUF přes lama.cpp SYCL; SDXL / SD 3.5 Large přes OpenVINO genAI runtime; HunyuanDiT; HunyuanImage-2.1 bf16 (~34 GB); Kolors 2.0; AuraFlow; OmniGen; PixArt-Sigma.
Generování videa
Wan 2.2 T2V-A14B / I2V-A14B MoE (~54 GB bf16); Wan 2.2 TI2V-5B; HunyuanVideo 13B bf16; HunyuanVideo 1.5; CogVideoX-5B; Open-Sora 2.0; LTX-Video; Pyramid Flow; Mochi-1 Q4. Video je dnes nejslabší cestou Intelu – v době uvedení na trh se očekává funkční, ale ne optimální propustnost.
Zvuk / Řeč / TTS
- ASR: Whisper v3 large / turbo přes OpenVINO (prvotřídní podpora Intel Whisper); Parakeet-TDT; Canary; SenseVoice
- Překlad textu na řeč: CosyVoice 2/3; Kokoro 82M; Stable Audio Open; XTTS v2; StyleTTS 2; Step-Audio-EditX
- Reálný čas / S2S: Kyutai Moshi; MusicGen / AudioGen / Bark; SeamlessM4T v2
Vícemodelové / vícenájemnické služby
- 6 souběžných streamů modelu Q4 s kapacitou 32 GB (jeden na kartu) – např. 6 agentů Qwen3-32B Q4
- Embeddingová flotila ve velkém měřítku — 6 paralelních streamů BGE-M3 / E5 / Nomic Embed (optimalizované pro OpenVINO)
- Smíšená rezidence — 70B Q4 (tenzorově paralelní přes 3 karty) + FLUX.1 (1 karta) + Whisper-turbo (1 karta) + Moshi (1 karta)
Cílové úlohy
- Pilotní projekt hodnocení softwaru Intel pro alternativní LLM služby CUDA
- Backend pro vkládání / přeřazení, kde VRAM na EUR dominuje požadavkům na propustnost
- Inference rozpočtu Q4 frontier-MoE (Qwen3-235B, GLM-4.5/4.6/4.7) pro malé interní vývojové týmy
- Nasazení nativního modelu OpenVINO vedle stávajících procesorů Intel Xeon / Arc Pro
- Backend pro VLM / OCR / zpracování dokumentů (silná stránka Intel OpenVINO)
Měřený výkon
Specifikace zveřejněné společností Intel | Podléhá nezávislému ověření při expedici karet
| Spec | Hodnota |
|---|---|
| VRAM na kartu | 32 GB GDDR6 |
| Třída šířky pásma paměti | ~450 GB/s na kartu |
| Rozšíření matice Xe (XMX) | Zrychleno přes OpenVINO / IPEX-LLM |
| cesta FP8 | Křemík Xe2 – ověřte expozici řidiče v době lodní dopravy |
Žádná naměřená data společností Kentino. Specifikace zveřejněné společností Intel podléhají nezávislému ověření. Kentino zveřejní údaje o tok/s / QPS / šířce pásma od první strany, jakmile první jednotka projde testovacím obdobím.
Není ideální pro
- CUDA-nativní úlohy – žádný CUDA na Intelu, očekávejte migrační třenice
- Nasazení kritická pro produkci v rámci SLA do stabilizace dodávek a nástrojů Intel Arc Pro
- Frontier 600B+ MoE ve 4. čtvrtletí (vyžaduje 6x RTX Pro 6000 / 576 GB pool)
- Trénovací úlohy – Arc Pro je primárně založený na inferenci, vyspělost frameworku pro distribuované školení je omezená
- Zákazníci, kteří před nákupem požadují naměřené benchmarky – tato skladová jednotka je k předobjednávce
Záruka a dodací lhůta
Standardní záruka Kentino (2 roky na díly, 1 rok na práci); distribuční podmínky Intelu mají přednost tam, kde jsou přísnější. Sestavení zahrnuje montáž, konfiguraci BIOSu, instalaci ovladačů, záběhové testování a ověření funkčnosti. Rezervujte si čas dodání první vlny prostřednictvím kontaktního formuláře Kentino. 30denní lhůta pro stanovení ceny při objednávce.
Doporučené doplňky
- Vylepšení o dva synchronizované zdroje o výkonu 2 kW (výkon jednoho zdroje je omezený s odběrem 1 825 W – důrazně doporučeno)
- Upgrade paměti RAM na 512 GB DDR4 (2x 64 GB — dva volné sloty)
- 4TB NVMe sekundární disk pro knihovnu modelů
Sdílet
