چرا KHB COMPUTE

ساخته شده برای AI در مقیاس بزرگ

بافت GPU توزیع‌شده جهانی که برای سخت‌ترین بارهای کاری آموزش و استنتاج طراحی شده است.

10,000+

GPUهای آنلاین در سراسر جهان

50+

منطقه و نقطه حضور

99.99%

SLA تولید

$0.0001

به ازای هر توکن (سطح پایه)

سطوح سخت‌افزار

سیلیکون مناسب را انتخاب کنید

از استنتاج در سطح مصرف‌کننده تا آموزش مدل‌های پیشرفته — ما برای هر بار کاری سطحی داریم.

پیشرفته

خوشه H100

80GB HBM3، NVLink — برای آموزش LLM بزرگ و استنتاج با توان بالا.

80 GB

700W

NVLink 900GB/s

گره‌های 8-GPU

پیش‌آموزش LLM (70B+)
آموزش توزیع‌شده با NCCL
FP8 / BF16 / FP16
زمان‌بندی اولویت‌دار

کارآمد

خوشه A100

40GB / 80GB HBM2e — استاندارد اثبات‌شده برای استنتاج و تنظیم دقیق.

40/80 GB

400W

NVLink 600GB/s

گره‌های 8-GPU

استنتاج در مقیاس
تنظیم دقیق LoRA / QLoRA
بارهای کاری چندوجهی
بهترین تعادل $/FLOPS

اقتصادی

خوشه RTX 4090

24GB GDDR6X — استنتاج مقرون‌به‌صرفه، توسعه/آزمایش و تنظیم دقیق کوچک.

24 GB

450W

PCIe Gen4

گره‌های 1-4 GPU

استنتاج مدل‌های 7-13B
محیط‌های توسعه / آماده‌سازی
تولید تصویر / ویدیو
کمترین هزینه واحد

خدمات

چه چیزی روی KHB AI Cloud اجرا می‌شود

شش سرویس تولیدمحور، هر کدام با صفحه کنترل مدیریت‌شده و پشتیبانی 24/7.

آموزش LLM

پیش‌آموزش توزیع‌شده — از 7B تا 70B+ با NCCL، DeepSpeed و Megatron.

نقاط پایانی استنتاج

API سازگار با OpenAI، مقیاس‌پذیری خودکار و تأخیر p50 زیر 100ms.

تنظیم دقیق

خطوط لوله LoRA، QLoRA و SFT کامل با مجموعه داده‌های مدیریت‌شده.

میزبانی عامل‌های AI

اجرای عامل‌های LangGraph / AutoGen / CrewAI با جداسازی ابزارها.

پایگاه داده برداری

مدیریت Milvus / Qdrant با بازیابی در مقیاس میلیارد و خردشدگی.

خط لوله MLOps

رجیستری مدل، ارزیابی، نظارت بر رانش و CI/CD برای ML.

موارد استفاده

بارهای کاری که ما تأمین می‌کنیم

نمایی از بارهای کاری تولیدی که امروز روی KHB AI Cloud اجرا می‌شوند.

آموزش مدل بنیادی

پیش‌آموزش در سطح پیشرفته LLMهای خاص حوزه برای مشتریان سازمانی.

AI خدمات مشتری

عامل‌های پشتیبانی چندزبانه با تأخیر زیر ثانیه و یکپارچگی‌های CRM.

تولید محتوا

متن‌های بازاریابی، پست‌های وبلاگ، توضیحات محصول و نوشتار خلاقانه.

تولید کد

تکمیل‌های سبک Copilot، بازسازی آگاه از مخزن و شناسایی باگ.

بینایی کامپیوتر

تشخیص اشیاء، OCR، بازرسی بصری و درک ویدیو.

AI گفتار

STT / TTS بلادرنگ، شبیه‌سازی صدا و رونویسی جلسات.

قیمت‌گذاری

فقط به ازای مصرف خود بپردازید

سه مدل تجاری، متناسب با الگوی بار کاری شما.

بر اساس تقاضا

پرداخت به ازای مصرف

بدون تعهد، صورتحساب بر ثانیه

استفاده GPU-hour اندازه‌گیری‌شده
قیمت‌گذاری استنتاج به ازای هر توکن
سلف‌سرویس از طریق کنسول / API
پشتیبانی استاندارد

رزرو شده

تا 60٪ تخفیف

تعهد 1 ماهه تا 3 ساله

رزرو ظرفیت
صورتحساب ماهانه قابل پیش‌بینی
زمان‌بندی اولویت‌دار
پشتیبانی اولویت‌دار 24/7

سازمانی

سفارشی

برای صنایع نظارتی و ابر مقیاس

سخت‌افزار اختصاصی / خوشه خصوصی
صفحه کنترل تک‌مستأجر
SLA و انطباق سفارشی
TAM اختصاصی و معمار راه‌حل

انطباق و امنیت

سطح سازمانی از روز اول

هم‌راستا با سخت‌ترین چارچوب‌های نظارتی — در سراسر جهان.

ISO 27001 SOC 2 Type II GDPR HK PDPO HIPAA-ready

سؤالات متداول

سؤالات محاسبات، با پاسخ

تفاوت بین رزرو شده و بر اساس تقاضا چیست؟

بر اساس تقاضا بر ثانیه و بدون تعهد اندازه‌گیری می‌شود. رزرو شده تا 60٪ تخفیف در ازای تعهد ظرفیت 1 ماهه تا 3 ساله به شما می‌دهد — ایده‌آل برای بارهای کاری استنتاج حالت پایدار.

آیا می‌توانم مدل و وزن‌های خودم را بیاورم؟

بله. ما از بارگذاری مدل سفارشی در PyTorch، TensorFlow، ONNX و GGUF پشتیبانی می‌کنیم. همچنین می‌توانید از کتابخانه مدل‌های منتخب ما با استقرار یک‌کلیک استفاده کنید.

داده‌ها کجا ذخیره می‌شوند؟

داده‌ها در منطقه‌ای که انتخاب می‌کنید ذخیره می‌شوند (هنگ کنگ، سنگاپور، فرانکفورت، شرق/غرب آمریکا). قراردادهای سازمانی می‌توانند به یک کشور خاص یا خوشه تک‌مستأجر متصل شوند.

آیا از failover چندابری پشتیبانی می‌کنید؟

بله. قراردادهای سازمانی شامل تکرار چندابری (AWS، GCP، Azure، on-prem) با failover خودکار و ارتقاء بدون قطعی هستند.

اولین خوشه خود را راه‌اندازی کنید

100 دلار اعتبار رایگان برای مشتریان جدید. آماده تولید در دقیقه، نه هفته.

دریافت قیمت

قدرت محاسبات AIسازمانی