قوة الحوسبة · KHB AI Cloud

قوة الحوسبة AI
للمؤسسات

مجموعات GPU موزعة لتدريب AI والاستدلال والوكلاء المستقلين. ادفع مقابل الاستخدام، نشر عالمي.

لماذا KHB COMPUTE

مبني للذكاء الاصطناعي على نطاق واسع

نسيج GPU موزع عالمياً مصمم لأحمال عمل التدريب والاستدلال الأكثر تطلباً.

10,000+
GPUs متصلة عالمياً
50+
منطقة ونقطة حضور
99.99%
SLA إنتاج
$0.0001
لكل رمز (المستوى الأدنى)
مستويات الأجهزة

اختر السليكون المناسب

من الاستدلال على مستوى المستهلك إلى تدريب النماذج المتقدمة — لدينا مستوى لكل حمل عمل.

متقدم

مجموعة H100

80GB HBM3، NVLink — لتدريب LLM كبير واستدلال عالي الإنتاجية.

80 GB
700W
NVLink 900GB/s
عقد 8-GPU
  • التدريب المسبق لـ LLM (70B+)
  • التدريب الموزع مع NCCL
  • FP8 / BF16 / FP16
  • جدولة ذات أولوية
عامل

مجموعة A100

40GB / 80GB HBM2e — المعيار المثبت للاستدلال والضبط الدقيق.

40/80 GB
400W
NVLink 600GB/s
عقد 8-GPU
  • الاستدلال على نطاق واسع
  • الضبط الدقيق LoRA / QLoRA
  • أحمال عمل متعددة الوسائط
  • أفضل توازن $/FLOPS
اقتصادي

مجموعة RTX 4090

24GB GDDR6X — استدلال فعال من حيث التكلفة، تطوير/اختبار، وضبط دقيق صغير.

24 GB
450W
PCIe Gen4
عقد 1-4 GPU
  • استدلال نماذج 7-13B
  • بيئات التطوير / التدريج
  • توليد الصور / الفيديو
  • أقل تكلفة وحدة
الخدمات

ما يتم تشغيله على KHB AI Cloud

ست خدمات مُنتَجَة، كل منها مدعومة بمستوى تحكم مدار ودعم على مدار الساعة.

تدريب LLM

التدريب المسبق الموزع — من 7B إلى 70B+ مع NCCL و DeepSpeed و Megatron.

نقاط نهاية الاستدلال

واجهة API متوافقة مع OpenAI، تحجيم تلقائي، وp50 latency أقل من 100 مللي ثانية.

الضبط الدقيق

خطوط أنابيب LoRA و QLoRA و SFT الكامل مع مجموعات بيانات مدارة.

استضافة وكلاء AI

تشغيل وكلاء LangGraph / AutoGen / CrewAI مع عزل الأدوات في sandbox.

قاعدة بيانات المتجهات

إدارة Milvus / Qdrant مع استدعاء بمليار المقياس وتقسيم.

خط أنابيب MLOps

سجل النماذج، التقييم، مراقبة الانحراف، و CI/CD لـ ML.

حالات الاستخدام

أعباء العمل التي نمكنها

لقطة من أحمال عمل الإنتاج التي تعمل على KHB AI Cloud اليوم.

تدريب النموذج الأساسي

التدريب المسبق على مستوى متقدم لـ LLMs الخاصة بمجال معين لعملاء المؤسسات.

AI لخدمة العملاء

وكلاء دعم متعددين اللغات مع latency أقل من ثانية وتكاملات CRM.

توليد المحتوى

نسخ تسويقية ومقالات مدونة وأوصاف منتجات وكتابة إبداعية.

توليد الكود

إكمالات بنمط Copilot وإعادة هيكلة مدركة للمستودع واكتشاف الأخطاء.

رؤية الحاسوب

اكتشاف الأشياء و OCR والفحص البصري وفهم الفيديو.

AI الكلام

STT / TTS في الوقت الفعلي واستنساخ الصوت ونسخ الاجتماعات.

التسعير

ادفع فقط مقابل ما تستخدمه

ثلاثة نماذج تجارية، مصممة حسب نمط حمل عملك.

حسب الطلب

ادفع مقابل الاستخدام
لا التزام، فوترة بالثانية
  • استخدام GPU-hour مقنن
  • تسعير الاستدلال لكل رمز
  • خدمة ذاتية عبر وحدة التحكم / API
  • دعم قياسي

المؤسسات

مخصص
للصناعات المنظمة والقياس الفائق
  • أجهزة مخصصة / مجموعة خاصة
  • مستوى تحكم لمستأجر واحد
  • SLAs وامتثال مخصص
  • TAM مخصص ومهندس حلول
الامتثال والأمان

على مستوى المؤسسات من اليوم الأول

متوافق مع أكثر الأطر التنظيمية تطلباً — عالمياً.

ISO 27001 SOC 2 Type II GDPR HK PDPO HIPAA-ready
الأسئلة الشائعة

أسئلة الحوسبة، مع إجابات

ما الفرق بين المحجوز وحسب الطلب؟

يتم قياس حسب الطلب بالثانية بدون التزام. يمنحك المحجوز خصم يصل إلى 60٪ مقابل التزام سعة من شهر إلى 3 سنوات — مثالي لأحمال عمل الاستدلال في الحالة المستقرة.

هل يمكنني جلب نموذجي وأوزاني الخاصة؟

نعم. ندعم تحميل النماذج المخصصة في PyTorch و TensorFlow و ONNX و GGUF. يمكنك أيضاً استخدام مكتبة النماذج المنسقة لدينا بنقرة واحدة.

أين يتم تخزين البيانات؟

يتم تخزين البيانات في المنطقة التي تختارها (هونغ كونغ، سنغافورة، فرانكفورت، شرق/غرب أمريكا). يمكن لعقود المؤسسات التثبيت في بلد محدد أو مجموعة مستأجر واحد.

هل تدعمون تجاوز الفشل عبر السحب؟

نعم. تتضمن عقود المؤسسات النسخ المتماثل عبر السحب (AWS، GCP، Azure، محلي) مع تجاوز الفشل التلقائي والترقيات بدون توقف.

شغّل مجموعتك الأولى

100 دولار من الرصيد المجاني للعملاء الجدد. جاهز للإنتاج في دقائق، وليس أسابيع.

احصل على عرض سعر