Điện toán AI
Cấp Doanh nghiệp
Cụm GPU phân tán cho huấn luyện AI, suy luận và tác nhân tự trị. Trả theo mức sử dụng, triển khai toàn cầu.
Được Xây dựng cho AI ở Quy mô
Một mạng GPU phân tán toàn cầu được thiết kế cho khối lượng công việc huấn luyện và suy luận đòi hỏi khắt khe nhất.
Chọn Silicon Phù hợp
Từ suy luận cấp tiêu dùng đến huấn luyện mô hình biên giới — chúng tôi có một bậc cho mọi khối lượng công việc.
Cụm H100
80GB HBM3, NVLink — cho huấn luyện LLM lớn và suy luận thông lượng cao.
- Tiền huấn luyện LLM (70B+)
- Huấn luyện phân tán với NCCL
- FP8 / BF16 / FP16
- Lập lịch ưu tiên
Cụm A100
40GB / 80GB HBM2e — tiêu chuẩn đã được chứng minh cho suy luận và tinh chỉnh.
- Suy luận ở quy mô
- Tinh chỉnh LoRA / QLoRA
- Khối lượng đa phương thức
- Cân bằng tốt nhất $/FLOPS
Cụm RTX 4090
24GB GDDR6X — suy luận tiết kiệm chi phí, dev/test, và tinh chỉnh nhỏ.
- Suy luận mô hình 7-13B
- Môi trường dev / staging
- Tạo hình ảnh / video
- Chi phí đơn vị thấp nhất
Cái gì Chạy trên KHB AI Cloud
Sáu dịch vụ được sản phẩm hóa, mỗi dịch vụ được hỗ trợ bởi mặt phẳng điều khiển được quản lý và trực tuyến 24/7.
Huấn luyện LLM
Tiền huấn luyện phân tán — từ 7B đến 70B+ với NCCL, DeepSpeed và Megatron.
Điểm cuối Suy luận
API tương thích OpenAI, tự động mở rộng và độ trễ p50 dưới 100ms.
Tinh chỉnh
Quy trình LoRA, QLoRA và SFT đầy đủ với tập dữ liệu được quản lý.
Lưu trữ Tác nhân AI
Chạy các tác nhân LangGraph / AutoGen / CrewAI với sandboxing công cụ.
Cơ sở dữ liệu Vector
Quản lý Milvus / Qdrant với truy xuất quy mô tỷ và sharding.
Quy trình MLOps
Đăng ký mô hình, đánh giá, giám sát drift và CI/CD cho ML.
Khối lượng Công việc Chúng tôi Cung cấp
Ảnh chụp nhanh các khối lượng công việc sản xuất đang chạy trên KHB AI Cloud hôm nay.
Huấn luyện Mô hình Nền tảng
Tiền huấn luyện cấp biên giới của LLM theo miền cụ thể cho khách hàng doanh nghiệp.
AI Dịch vụ Khách hàng
Tác nhân hỗ trợ đa ngôn ngữ với độ trễ dưới giây và tích hợp CRM.
Tạo Nội dung
Bản sao tiếp thị, bài đăng blog, mô tả sản phẩm và viết sáng tạo.
Tạo Mã
Hoàn thành kiểu Copilot, tái cấu trúc nhận biết repo và phát hiện lỗi.
Thị giác Máy tính
Phát hiện đối tượng, OCR, kiểm tra trực quan và hiểu video.
AI Giọng nói
STT / TTS thời gian thực, nhân bản giọng nói và chép lại cuộc họp.
Chỉ Trả cho Cái Bạn Sử dụng
Ba mô hình thương mại, phù hợp với mô hình khối lượng công việc của bạn.
Theo nhu cầu
- Sử dụng đo theo giờ GPU
- Định giá suy luận theo token
- Tự phục vụ qua console / API
- Hỗ trợ tiêu chuẩn
Dành riêng
- Đặt trước dung lượng
- Thanh toán hàng tháng có thể dự đoán
- Lập lịch ưu tiên
- Hỗ trợ ưu tiên 24/7
Doanh nghiệp
- Phần cứng chuyên dụng / cụm riêng
- Mặt phẳng điều khiển đơn khách
- SLA & tuân thủ tùy chỉnh
- TAM & kiến trúc sư giải pháp chuyên trách
Cấp doanh nghiệp từ Ngày Một
Phù hợp với các khuôn khổ quản lý đòi hỏi khắt khe nhất — trên toàn cầu.
Câu hỏi về Điện toán, Đã được Trả lời
Sự khác biệt giữa dành riêng và theo nhu cầu là gì?
Theo nhu cầu được đo theo giây mà không có cam kết. Dành riêng cho bạn giảm giá đến 60% để đổi lấy cam kết dung lượng từ 1 tháng đến 3 năm — lý tưởng cho khối lượng công việc suy luận ổn định.
Tôi có thể mang mô hình và trọng số riêng không?
Có. Chúng tôi hỗ trợ tải lên mô hình tùy chỉnh ở PyTorch, TensorFlow, ONNX và GGUF. Bạn cũng có thể sử dụng thư viện mô hình được chọn lọc của chúng tôi với triển khai một cú nhấp.
Dữ liệu được lưu trữ ở đâu?
Dữ liệu được lưu trữ trong khu vực bạn chọn (HK, Singapore, Frankfurt, US Đông/Tây). Hợp đồng doanh nghiệp có thể ghim vào một quốc gia cụ thể hoặc cụm đơn khách.
Bạn có hỗ trợ chuyển đổi dự phòng đa đám mây không?
Có. Hợp đồng doanh nghiệp bao gồm sao chép đa đám mây (AWS, GCP, Azure, tại chỗ) với chuyển đổi dự phòng tự động và nâng cấp không thời gian chết.
Khởi động Cụm Đầu tiên của Bạn
$100 tín dụng miễn phí cho khách hàng mới. Sẵn sàng sản xuất trong vài phút, không phải vài tuần.
Nhận Báo giá