قوة الحوسبة AI
للمؤسسات
مجموعات GPU موزعة لتدريب AI والاستدلال والوكلاء المستقلين. ادفع مقابل الاستخدام، نشر عالمي.
مبني للذكاء الاصطناعي على نطاق واسع
نسيج GPU موزع عالمياً مصمم لأحمال عمل التدريب والاستدلال الأكثر تطلباً.
اختر السليكون المناسب
من الاستدلال على مستوى المستهلك إلى تدريب النماذج المتقدمة — لدينا مستوى لكل حمل عمل.
مجموعة H100
80GB HBM3، NVLink — لتدريب LLM كبير واستدلال عالي الإنتاجية.
- التدريب المسبق لـ LLM (70B+)
- التدريب الموزع مع NCCL
- FP8 / BF16 / FP16
- جدولة ذات أولوية
مجموعة A100
40GB / 80GB HBM2e — المعيار المثبت للاستدلال والضبط الدقيق.
- الاستدلال على نطاق واسع
- الضبط الدقيق LoRA / QLoRA
- أحمال عمل متعددة الوسائط
- أفضل توازن $/FLOPS
مجموعة RTX 4090
24GB GDDR6X — استدلال فعال من حيث التكلفة، تطوير/اختبار، وضبط دقيق صغير.
- استدلال نماذج 7-13B
- بيئات التطوير / التدريج
- توليد الصور / الفيديو
- أقل تكلفة وحدة
ما يتم تشغيله على KHB AI Cloud
ست خدمات مُنتَجَة، كل منها مدعومة بمستوى تحكم مدار ودعم على مدار الساعة.
تدريب LLM
التدريب المسبق الموزع — من 7B إلى 70B+ مع NCCL و DeepSpeed و Megatron.
نقاط نهاية الاستدلال
واجهة API متوافقة مع OpenAI، تحجيم تلقائي، وp50 latency أقل من 100 مللي ثانية.
الضبط الدقيق
خطوط أنابيب LoRA و QLoRA و SFT الكامل مع مجموعات بيانات مدارة.
استضافة وكلاء AI
تشغيل وكلاء LangGraph / AutoGen / CrewAI مع عزل الأدوات في sandbox.
قاعدة بيانات المتجهات
إدارة Milvus / Qdrant مع استدعاء بمليار المقياس وتقسيم.
خط أنابيب MLOps
سجل النماذج، التقييم، مراقبة الانحراف، و CI/CD لـ ML.
أعباء العمل التي نمكنها
لقطة من أحمال عمل الإنتاج التي تعمل على KHB AI Cloud اليوم.
تدريب النموذج الأساسي
التدريب المسبق على مستوى متقدم لـ LLMs الخاصة بمجال معين لعملاء المؤسسات.
AI لخدمة العملاء
وكلاء دعم متعددين اللغات مع latency أقل من ثانية وتكاملات CRM.
توليد المحتوى
نسخ تسويقية ومقالات مدونة وأوصاف منتجات وكتابة إبداعية.
توليد الكود
إكمالات بنمط Copilot وإعادة هيكلة مدركة للمستودع واكتشاف الأخطاء.
رؤية الحاسوب
اكتشاف الأشياء و OCR والفحص البصري وفهم الفيديو.
AI الكلام
STT / TTS في الوقت الفعلي واستنساخ الصوت ونسخ الاجتماعات.
ادفع فقط مقابل ما تستخدمه
ثلاثة نماذج تجارية، مصممة حسب نمط حمل عملك.
حسب الطلب
- استخدام GPU-hour مقنن
- تسعير الاستدلال لكل رمز
- خدمة ذاتية عبر وحدة التحكم / API
- دعم قياسي
محجوز
- حجز السعة
- فوترة شهرية يمكن التنبؤ بها
- جدولة ذات أولوية
- دعم ذو أولوية على مدار الساعة
المؤسسات
- أجهزة مخصصة / مجموعة خاصة
- مستوى تحكم لمستأجر واحد
- SLAs وامتثال مخصص
- TAM مخصص ومهندس حلول
على مستوى المؤسسات من اليوم الأول
متوافق مع أكثر الأطر التنظيمية تطلباً — عالمياً.
أسئلة الحوسبة، مع إجابات
ما الفرق بين المحجوز وحسب الطلب؟
يتم قياس حسب الطلب بالثانية بدون التزام. يمنحك المحجوز خصم يصل إلى 60٪ مقابل التزام سعة من شهر إلى 3 سنوات — مثالي لأحمال عمل الاستدلال في الحالة المستقرة.
هل يمكنني جلب نموذجي وأوزاني الخاصة؟
نعم. ندعم تحميل النماذج المخصصة في PyTorch و TensorFlow و ONNX و GGUF. يمكنك أيضاً استخدام مكتبة النماذج المنسقة لدينا بنقرة واحدة.
أين يتم تخزين البيانات؟
يتم تخزين البيانات في المنطقة التي تختارها (هونغ كونغ، سنغافورة، فرانكفورت، شرق/غرب أمريكا). يمكن لعقود المؤسسات التثبيت في بلد محدد أو مجموعة مستأجر واحد.
هل تدعمون تجاوز الفشل عبر السحب؟
نعم. تتضمن عقود المؤسسات النسخ المتماثل عبر السحب (AWS، GCP، Azure، محلي) مع تجاوز الفشل التلقائي والترقيات بدون توقف.
شغّل مجموعتك الأولى
100 دولار من الرصيد المجاني للعملاء الجدد. جاهز للإنتاج في دقائق، وليس أسابيع.
احصل على عرض سعر