لماذا KHB COMPUTE

مبني للذكاء الاصطناعي على نطاق واسع

نسيج GPU موزع عالمياً مصمم لأحمال عمل التدريب والاستدلال الأكثر تطلباً.

10,000+

GPUs متصلة عالمياً

50+

منطقة ونقطة حضور

99.99%

SLA إنتاج

$0.0001

لكل رمز (المستوى الأدنى)

مستويات الأجهزة

اختر السليكون المناسب

من الاستدلال على مستوى المستهلك إلى تدريب النماذج المتقدمة — لدينا مستوى لكل حمل عمل.

متقدم

مجموعة H100

80GB HBM3، NVLink — لتدريب LLM كبير واستدلال عالي الإنتاجية.

80 GB

700W

NVLink 900GB/s

عقد 8-GPU

التدريب المسبق لـ LLM (70B+)
التدريب الموزع مع NCCL
FP8 / BF16 / FP16
جدولة ذات أولوية

عامل

مجموعة A100

40GB / 80GB HBM2e — المعيار المثبت للاستدلال والضبط الدقيق.

40/80 GB

400W

NVLink 600GB/s

عقد 8-GPU

الاستدلال على نطاق واسع
الضبط الدقيق LoRA / QLoRA
أحمال عمل متعددة الوسائط
أفضل توازن $/FLOPS

اقتصادي

مجموعة RTX 4090

24GB GDDR6X — استدلال فعال من حيث التكلفة، تطوير/اختبار، وضبط دقيق صغير.

24 GB

450W

PCIe Gen4

عقد 1-4 GPU

استدلال نماذج 7-13B
بيئات التطوير / التدريج
توليد الصور / الفيديو
أقل تكلفة وحدة

الخدمات

ما يتم تشغيله على KHB AI Cloud

ست خدمات مُنتَجَة، كل منها مدعومة بمستوى تحكم مدار ودعم على مدار الساعة.

تدريب LLM

التدريب المسبق الموزع — من 7B إلى 70B+ مع NCCL و DeepSpeed و Megatron.

نقاط نهاية الاستدلال

واجهة API متوافقة مع OpenAI، تحجيم تلقائي، وp50 latency أقل من 100 مللي ثانية.

الضبط الدقيق

خطوط أنابيب LoRA و QLoRA و SFT الكامل مع مجموعات بيانات مدارة.

استضافة وكلاء AI

تشغيل وكلاء LangGraph / AutoGen / CrewAI مع عزل الأدوات في sandbox.

قاعدة بيانات المتجهات

إدارة Milvus / Qdrant مع استدعاء بمليار المقياس وتقسيم.

خط أنابيب MLOps

سجل النماذج، التقييم، مراقبة الانحراف، و CI/CD لـ ML.

حالات الاستخدام

أعباء العمل التي نمكنها

لقطة من أحمال عمل الإنتاج التي تعمل على KHB AI Cloud اليوم.

تدريب النموذج الأساسي

التدريب المسبق على مستوى متقدم لـ LLMs الخاصة بمجال معين لعملاء المؤسسات.

AI لخدمة العملاء

وكلاء دعم متعددين اللغات مع latency أقل من ثانية وتكاملات CRM.

توليد المحتوى

نسخ تسويقية ومقالات مدونة وأوصاف منتجات وكتابة إبداعية.

توليد الكود

إكمالات بنمط Copilot وإعادة هيكلة مدركة للمستودع واكتشاف الأخطاء.

رؤية الحاسوب

اكتشاف الأشياء و OCR والفحص البصري وفهم الفيديو.

AI الكلام

STT / TTS في الوقت الفعلي واستنساخ الصوت ونسخ الاجتماعات.

التسعير

ادفع فقط مقابل ما تستخدمه

ثلاثة نماذج تجارية، مصممة حسب نمط حمل عملك.

حسب الطلب

ادفع مقابل الاستخدام

لا التزام، فوترة بالثانية

استخدام GPU-hour مقنن
تسعير الاستدلال لكل رمز
خدمة ذاتية عبر وحدة التحكم / API
دعم قياسي

محجوز

خصم يصل إلى 60٪

التزامات من شهر إلى 3 سنوات

حجز السعة
فوترة شهرية يمكن التنبؤ بها
جدولة ذات أولوية
دعم ذو أولوية على مدار الساعة

المؤسسات

مخصص

للصناعات المنظمة والقياس الفائق

أجهزة مخصصة / مجموعة خاصة
مستوى تحكم لمستأجر واحد
SLAs وامتثال مخصص
TAM مخصص ومهندس حلول

الامتثال والأمان

على مستوى المؤسسات من اليوم الأول

متوافق مع أكثر الأطر التنظيمية تطلباً — عالمياً.

ISO 27001 SOC 2 Type II GDPR HK PDPO HIPAA-ready

الأسئلة الشائعة

أسئلة الحوسبة، مع إجابات

ما الفرق بين المحجوز وحسب الطلب؟

يتم قياس حسب الطلب بالثانية بدون التزام. يمنحك المحجوز خصم يصل إلى 60٪ مقابل التزام سعة من شهر إلى 3 سنوات — مثالي لأحمال عمل الاستدلال في الحالة المستقرة.

هل يمكنني جلب نموذجي وأوزاني الخاصة؟

نعم. ندعم تحميل النماذج المخصصة في PyTorch و TensorFlow و ONNX و GGUF. يمكنك أيضاً استخدام مكتبة النماذج المنسقة لدينا بنقرة واحدة.

أين يتم تخزين البيانات؟

يتم تخزين البيانات في المنطقة التي تختارها (هونغ كونغ، سنغافورة، فرانكفورت، شرق/غرب أمريكا). يمكن لعقود المؤسسات التثبيت في بلد محدد أو مجموعة مستأجر واحد.

هل تدعمون تجاوز الفشل عبر السحب؟

نعم. تتضمن عقود المؤسسات النسخ المتماثل عبر السحب (AWS، GCP، Azure، محلي) مع تجاوز الفشل التلقائي والترقيات بدون توقف.

شغّل مجموعتك الأولى

100 دولار من الرصيد المجاني للعملاء الجدد. جاهز للإنتاج في دقائق، وليس أسابيع.

احصل على عرض سعر

قوة الحوسبة AIللمؤسسات