Přejít na informace o produktu
1 of 7

Kentino sro

K-AI 192 Řím ArcProB70 bude upřesněno — 6× Intel Arc Pro B70 — EPYC Milán (Předobjednávka)

K-AI 192 Řím ArcProB70 bude upřesněno — 6× Intel Arc Pro B70 — EPYC Milán (Předobjednávka)

Běžná cena EUR € 20.793,00
Běžná cena Prodejní cena EUR € 20.793,00
Sůl: Vyprodáno
Včetně daní. Přeprava spočítány u pokladny.

V PŘÍPRAVĚ

Předobjednávka — Intel Arc Pro B70 bude dodán ve 3. čtvrtletí 2026

K-AI 192 Řím ArcProB70 bude upřesněno

192 GB VRAM Intel Xe2 Inference Server
6x Arc Pro B70 | EPYC Milán | TOPY budou upřesněny

TBD
Vrchy INT8
192 GB
Pool VRAM
Intel
Bojový mág Xe2
6-karta
OpenVINO / SYCL

Cenově výhodná sestava s vysokým objemem VRAM zaměřená na open-source inferenční stack od Intelu. Cena je vázána na dostupnost produktů od Intelu.

Rackový inferenční server s výškou 4U a šesti kartami Intel Arc Pro B70 Creator (každá s 32 GB Xe2-HPG "Battlemage", celkem 192 GB), jedním procesorem AMD EPYC 7643 Milan (48C/96T), 384 GB paměti DDR4 ECC, 2 TB NVMe bootovacím diskem a 2kW ATX zdrojem (důrazně doporučujeme upgrade na dva zdroje). Vytvořeno pro softwarový ekosystém Intel: OpenVINO 2025+, IPEX-LLM, llama.cpp SYCL backend a vLLM-Intel forky. Na tomto hardwaru neběží úlohy pouze s CUDA.

technické vybavení

Složka Detail
GPU 6x Intel Arc Pro B70 Creator 32 GB (Xe2-HPG "Battlemage", 250 W, PCIe 5.0 x16, dvouslotová)
Pool VRAM 192 GB agregátu na 6 kartách (bez mezikartové struktury – peer provoz přes PCIe)
Procesor (CPU) AMD EPYC 7643 Milan (48C/96T, 225 W, 128 linek PCIe 4.0)
Základní deska ASRock Rack ROMED8-2T (SP3, 7x PCIe 4.0 x16, 8x DDR4 ECC, 2x 10 GbE, IPMI)
Systémová RAM 384 GB DDR4-2666 ECC RDIMM (6x 64 GB)
Spouštění / úložiště 2TB NVMe M.2 (PCIe 4.0 x4)
napájení 1x 2 kW ATX zdroj (důrazně se doporučuje upgrade na duální 2 kW synchronizovaný zdroj)
Podvozek Montáž do racku 4U (6slotové uspořádání)
Chlazení Věžový chladič SP3 (Arctic Freezer 4U-M) + směrované proudění vzduchu zepředu dozadu (průmyslové ventilátory)
Síť Duální integrovaný 10GbE (Intel X550)

Napájecí obálka

  • Spotřeba GPU: 6 x 250 W = 1 500 W (TDP publikované společností Intel)
  • Celkový výkon systému při plném zatížení: ~1 825 W
  • Celkový výkon zdroje: 2 000 W (samostatný) — pouze 8.75 % volného prostoru
  • Důrazně se doporučuje duální synchronizovaný provoz o výkonu 2 kW – obnovuje ~45 % rezervy

Topologie jízdních pruhů

ROMED8-2T nabízí 7 linek PCIe 4.0 x16. Šest obsazených slotů; jeden volný pro upsell síťové karty. Arc Pro B70 je nativní pro PCIe Gen5; ROMED8-2T běží na Gen4 – dopad na šířku pásma je zanedbatelný pro inferenci při 32 GB na kartu. Žádný přepínač PCIe. Žádný ekvivalent Xe-Link.

Co můžete spustit

Veškerá tvrzení o kompatibilitě se vztahují k softwarovým datovým vrstvám Intel (OpenVINO, IPEX-LLM, llama.cpp SYCL, vLLM-Intel). Na tomto hardwaru neběží úlohy pouze s technologií CUDA. Všechny údaje citují publikované externí zdroje a podléhají nezávislému ověření při expedici karet.

LLM – text / uvažování / kódování

Čínská hranice

  • Qwen3 / Qwen3.5 (Alibaba): Qwen3-235B-A22B Q4 (~132 GB) s dlouhou kontextovou rezervou; Qwen3-Coder-480B-A35B Q2 (~160 GB); Qwen3.5-397B-A17B Q3 (~170 GB)
  • GLM / Z.ai: GLM-4.5 / 4.6 / 4.7 Q4 (~177 GB) — vhodné pro střední KV
  • Tencent Hunyuan: Hunyuan-Large Q3 (~160 GB); Hunyuan-A13B fp8 (~80 GB), pokud je v ovladači odhalena cesta Xe2 fp8
  • Ostatní: Baidu ERNIE-4.5-424B Q3 ​​(~180 GB); MiniMax-M1 Q3 (~180 GB); DeepSeek-R2 32B (6 souběžných streamů)

Západní hranice

  • Meta láma: Llama 3.3 70B Q6-Q8 s velkorysým KV; Llama 4 Scout 109B/17B Q4 (~63 GB) pohodlná
  • Mistral: Mistral Malý 3 / Magistral Malý / Devstral Malý 2 (24B) na bf16; Pixtral Velký Q4-Q6
  • OpenAI (otevřené váhy): gpt-oss-120b MXFP4 nativní (~80 GB) — pokud je v Intel stacku k dispozici dostatek MXFP4
  • NVIDIA Nemotron: Llama-3.1-Nemotron Ultra 253B Q4 (~120 GB)
  • Ostatní: Gemma 3 27B bf16 multimodální; Phi-4 / Phi-4-reasoning 14B; Cohere Command R+ 104B Q4

Modely vizuální a jazykové komunikace

Qwen3-VL-8B / 32B; Qwen3-VL-30B-A3B MoE; InternVL3 až 78B; InternVL3.5-38B; Llama 3.2 90B Vision Q4; Pixtral 12B; Molmo 72B Q4; Gemma 3 12B/27B multimodální; MiniCPM-V 2.6 / MiniCPM-o 2.6. Intel OpenVINO má silnou podporu pro vision-tower – VLM je pravděpodobnou silnou stránkou hned od prvního dne.

Generování obrazu

FLUX.1 [dev] / [schnell] fp8 nebo Q4 GGUF přes lama.cpp SYCL; SDXL / SD 3.5 Large přes OpenVINO genAI runtime; HunyuanDiT; HunyuanImage-2.1 bf16 (~34 GB); Kolors 2.0; AuraFlow; OmniGen; PixArt-Sigma.

Generování videa

Wan 2.2 T2V-A14B / I2V-A14B MoE (~54 GB bf16); Wan 2.2 TI2V-5B; HunyuanVideo 13B bf16; HunyuanVideo 1.5; CogVideoX-5B; Open-Sora 2.0; LTX-Video; Pyramid Flow; Mochi-1 Q4. Video je dnes nejslabší cestou Intelu – v době uvedení na trh se očekává funkční, ale ne optimální propustnost.

Zvuk / Řeč / TTS

  • ASR: Whisper v3 large / turbo přes OpenVINO (prvotřídní podpora Intel Whisper); Parakeet-TDT; Canary; SenseVoice
  • Překlad textu na řeč: CosyVoice 2/3; Kokoro 82M; Stable Audio Open; XTTS v2; StyleTTS 2; Step-Audio-EditX
  • Reálný čas / S2S: Kyutai Moshi; MusicGen / AudioGen / Bark; SeamlessM4T v2

Vícemodelové / vícenájemnické služby

  • 6 souběžných streamů modelu Q4 s kapacitou 32 GB (jeden na kartu) – např. 6 agentů Qwen3-32B Q4
  • Embeddingová flotila ve velkém měřítku — 6 paralelních streamů BGE-M3 / E5 / Nomic Embed (optimalizované pro OpenVINO)
  • Smíšená rezidence — 70B Q4 (tenzorově paralelní přes 3 karty) + FLUX.1 (1 karta) + Whisper-turbo (1 karta) + Moshi (1 karta)

Cílové úlohy

  • Pilotní projekt hodnocení softwaru Intel pro alternativní LLM služby CUDA
  • Backend pro vkládání / přeřazení, kde VRAM na EUR dominuje požadavkům na propustnost
  • Inference rozpočtu Q4 frontier-MoE (Qwen3-235B, GLM-4.5/4.6/4.7) pro malé interní vývojové týmy
  • Nasazení nativního modelu OpenVINO vedle stávajících procesorů Intel Xeon / Arc Pro
  • Backend pro VLM / OCR / zpracování dokumentů (silná stránka Intel OpenVINO)

Měřený výkon

Specifikace zveřejněné společností Intel | Podléhá nezávislému ověření při expedici karet

Spec Hodnota
VRAM na kartu 32 GB GDDR6
Třída šířky pásma paměti ~450 GB/s na kartu
Rozšíření matice Xe (XMX) Zrychleno přes OpenVINO / IPEX-LLM
cesta FP8 Křemík Xe2 – ověřte expozici řidiče v době lodní dopravy

Žádná naměřená data společností Kentino. Specifikace zveřejněné společností Intel podléhají nezávislému ověření. Kentino zveřejní údaje o tok/s / QPS / šířce pásma od první strany, jakmile první jednotka projde testovacím obdobím.

Není ideální pro

  • CUDA-nativní úlohy – žádný CUDA na Intelu, očekávejte migrační třenice
  • Nasazení kritická pro produkci v rámci SLA do stabilizace dodávek a nástrojů Intel Arc Pro
  • Frontier 600B+ MoE ve 4. čtvrtletí (vyžaduje 6x RTX Pro 6000 / 576 GB pool)
  • Trénovací úlohy – Arc Pro je primárně založený na inferenci, vyspělost frameworku pro distribuované školení je omezená
  • Zákazníci, kteří před nákupem požadují naměřené benchmarky – tato skladová jednotka je k předobjednávce

Záruka a dodací lhůta

2 let
záruka na díly
1 rok
záruka na práci
Q3 2026
cílová doprava

Standardní záruka Kentino (2 roky na díly, 1 rok na práci); distribuční podmínky Intelu mají přednost tam, kde jsou přísnější. Sestavení zahrnuje montáž, konfiguraci BIOSu, instalaci ovladačů, záběhové testování a ověření funkčnosti. Rezervujte si čas dodání první vlny prostřednictvím kontaktního formuláře Kentino. 30denní lhůta pro stanovení ceny při objednávce.

Doporučené doplňky

  • Vylepšení o dva synchronizované zdroje o výkonu 2 kW (výkon jednoho zdroje je omezený s odběrem 1 825 W – důrazně doporučeno)
  • Upgrade paměti RAM na 512 GB DDR4 (2x 64 GB — dva volné sloty)
  • 4TB NVMe sekundární disk pro knihovnu modelů
Zobrazit všechny podrobnosti