محاسبات AI · KHB AI Cloud

قدرت محاسبات AI
سازمانی

خوشه‌های GPU توزیع‌شده برای آموزش AI، استنتاج و عامل‌های خودکار. پرداخت به ازای مصرف، استقرار جهانی.

چرا KHB COMPUTE

ساخته شده برای AI در مقیاس بزرگ

بافت GPU توزیع‌شده جهانی که برای سخت‌ترین بارهای کاری آموزش و استنتاج طراحی شده است.

10,000+
GPUهای آنلاین در سراسر جهان
50+
منطقه و نقطه حضور
99.99%
SLA تولید
$0.0001
به ازای هر توکن (سطح پایه)
سطوح سخت‌افزار

سیلیکون مناسب را انتخاب کنید

از استنتاج در سطح مصرف‌کننده تا آموزش مدل‌های پیشرفته — ما برای هر بار کاری سطحی داریم.

پیشرفته

خوشه H100

80GB HBM3، NVLink — برای آموزش LLM بزرگ و استنتاج با توان بالا.

80 GB
700W
NVLink 900GB/s
گره‌های 8-GPU
  • پیش‌آموزش LLM (70B+)
  • آموزش توزیع‌شده با NCCL
  • FP8 / BF16 / FP16
  • زمان‌بندی اولویت‌دار
کارآمد

خوشه A100

40GB / 80GB HBM2e — استاندارد اثبات‌شده برای استنتاج و تنظیم دقیق.

40/80 GB
400W
NVLink 600GB/s
گره‌های 8-GPU
  • استنتاج در مقیاس
  • تنظیم دقیق LoRA / QLoRA
  • بارهای کاری چندوجهی
  • بهترین تعادل $/FLOPS
اقتصادی

خوشه RTX 4090

24GB GDDR6X — استنتاج مقرون‌به‌صرفه، توسعه/آزمایش و تنظیم دقیق کوچک.

24 GB
450W
PCIe Gen4
گره‌های 1-4 GPU
  • استنتاج مدل‌های 7-13B
  • محیط‌های توسعه / آماده‌سازی
  • تولید تصویر / ویدیو
  • کمترین هزینه واحد
خدمات

چه چیزی روی KHB AI Cloud اجرا می‌شود

شش سرویس تولیدمحور، هر کدام با صفحه کنترل مدیریت‌شده و پشتیبانی 24/7.

آموزش LLM

پیش‌آموزش توزیع‌شده — از 7B تا 70B+ با NCCL، DeepSpeed و Megatron.

نقاط پایانی استنتاج

API سازگار با OpenAI، مقیاس‌پذیری خودکار و تأخیر p50 زیر 100ms.

تنظیم دقیق

خطوط لوله LoRA، QLoRA و SFT کامل با مجموعه داده‌های مدیریت‌شده.

میزبانی عامل‌های AI

اجرای عامل‌های LangGraph / AutoGen / CrewAI با جداسازی ابزارها.

پایگاه داده برداری

مدیریت Milvus / Qdrant با بازیابی در مقیاس میلیارد و خردشدگی.

خط لوله MLOps

رجیستری مدل، ارزیابی، نظارت بر رانش و CI/CD برای ML.

موارد استفاده

بارهای کاری که ما تأمین می‌کنیم

نمایی از بارهای کاری تولیدی که امروز روی KHB AI Cloud اجرا می‌شوند.

آموزش مدل بنیادی

پیش‌آموزش در سطح پیشرفته LLMهای خاص حوزه برای مشتریان سازمانی.

AI خدمات مشتری

عامل‌های پشتیبانی چندزبانه با تأخیر زیر ثانیه و یکپارچگی‌های CRM.

تولید محتوا

متن‌های بازاریابی، پست‌های وبلاگ، توضیحات محصول و نوشتار خلاقانه.

تولید کد

تکمیل‌های سبک Copilot، بازسازی آگاه از مخزن و شناسایی باگ.

بینایی کامپیوتر

تشخیص اشیاء، OCR، بازرسی بصری و درک ویدیو.

AI گفتار

STT / TTS بلادرنگ، شبیه‌سازی صدا و رونویسی جلسات.

قیمت‌گذاری

فقط به ازای مصرف خود بپردازید

سه مدل تجاری، متناسب با الگوی بار کاری شما.

بر اساس تقاضا

پرداخت به ازای مصرف
بدون تعهد، صورتحساب بر ثانیه
  • استفاده GPU-hour اندازه‌گیری‌شده
  • قیمت‌گذاری استنتاج به ازای هر توکن
  • سلف‌سرویس از طریق کنسول / API
  • پشتیبانی استاندارد

سازمانی

سفارشی
برای صنایع نظارتی و ابر مقیاس
  • سخت‌افزار اختصاصی / خوشه خصوصی
  • صفحه کنترل تک‌مستأجر
  • SLA و انطباق سفارشی
  • TAM اختصاصی و معمار راه‌حل
انطباق و امنیت

سطح سازمانی از روز اول

هم‌راستا با سخت‌ترین چارچوب‌های نظارتی — در سراسر جهان.

ISO 27001 SOC 2 Type II GDPR HK PDPO HIPAA-ready
سؤالات متداول

سؤالات محاسبات، با پاسخ

تفاوت بین رزرو شده و بر اساس تقاضا چیست؟

بر اساس تقاضا بر ثانیه و بدون تعهد اندازه‌گیری می‌شود. رزرو شده تا 60٪ تخفیف در ازای تعهد ظرفیت 1 ماهه تا 3 ساله به شما می‌دهد — ایده‌آل برای بارهای کاری استنتاج حالت پایدار.

آیا می‌توانم مدل و وزن‌های خودم را بیاورم؟

بله. ما از بارگذاری مدل سفارشی در PyTorch، TensorFlow، ONNX و GGUF پشتیبانی می‌کنیم. همچنین می‌توانید از کتابخانه مدل‌های منتخب ما با استقرار یک‌کلیک استفاده کنید.

داده‌ها کجا ذخیره می‌شوند؟

داده‌ها در منطقه‌ای که انتخاب می‌کنید ذخیره می‌شوند (هنگ کنگ، سنگاپور، فرانکفورت، شرق/غرب آمریکا). قراردادهای سازمانی می‌توانند به یک کشور خاص یا خوشه تک‌مستأجر متصل شوند.

آیا از failover چندابری پشتیبانی می‌کنید؟

بله. قراردادهای سازمانی شامل تکرار چندابری (AWS، GCP، Azure، on-prem) با failover خودکار و ارتقاء بدون قطعی هستند.

اولین خوشه خود را راه‌اندازی کنید

100 دلار اعتبار رایگان برای مشتریان جدید. آماده تولید در دقیقه، نه هفته.

دریافت قیمت