TẠI SAO KHB COMPUTE

Được Xây dựng cho AI ở Quy mô

Một mạng GPU phân tán toàn cầu được thiết kế cho khối lượng công việc huấn luyện và suy luận đòi hỏi khắt khe nhất.

10.000+

GPU trực tuyến toàn cầu

50+

Khu vực & PoP

99,99%

SLA Sản xuất

$0,0001

Mỗi token (bậc đầu vào)

CÁC BẬC PHẦN CỨNG

Chọn Silicon Phù hợp

Từ suy luận cấp tiêu dùng đến huấn luyện mô hình biên giới — chúng tôi có một bậc cho mọi khối lượng công việc.

Biên giới

Cụm H100

80GB HBM3, NVLink — cho huấn luyện LLM lớn và suy luận thông lượng cao.

80 GB

700W

NVLink 900GB/s

Nút 8-GPU

Tiền huấn luyện LLM (70B+)
Huấn luyện phân tán với NCCL
FP8 / BF16 / FP16
Lập lịch ưu tiên

Làm việc nặng

Cụm A100

40GB / 80GB HBM2e — tiêu chuẩn đã được chứng minh cho suy luận và tinh chỉnh.

40/80 GB

400W

NVLink 600GB/s

Nút 8-GPU

Suy luận ở quy mô
Tinh chỉnh LoRA / QLoRA
Khối lượng đa phương thức
Cân bằng tốt nhất $/FLOPS

Tiết kiệm

Cụm RTX 4090

24GB GDDR6X — suy luận tiết kiệm chi phí, dev/test, và tinh chỉnh nhỏ.

24 GB

450W

PCIe Gen4

Nút 1-4 GPU

Suy luận mô hình 7-13B
Môi trường dev / staging
Tạo hình ảnh / video
Chi phí đơn vị thấp nhất

DỊCH VỤ

Cái gì Chạy trên KHB AI Cloud

Sáu dịch vụ được sản phẩm hóa, mỗi dịch vụ được hỗ trợ bởi mặt phẳng điều khiển được quản lý và trực tuyến 24/7.

Huấn luyện LLM

Tiền huấn luyện phân tán — từ 7B đến 70B+ với NCCL, DeepSpeed và Megatron.

Điểm cuối Suy luận

API tương thích OpenAI, tự động mở rộng và độ trễ p50 dưới 100ms.

Tinh chỉnh

Quy trình LoRA, QLoRA và SFT đầy đủ với tập dữ liệu được quản lý.

Lưu trữ Tác nhân AI

Chạy các tác nhân LangGraph / AutoGen / CrewAI với sandboxing công cụ.

Cơ sở dữ liệu Vector

Quản lý Milvus / Qdrant với truy xuất quy mô tỷ và sharding.

Quy trình MLOps

Đăng ký mô hình, đánh giá, giám sát drift và CI/CD cho ML.

TRƯỜNG HỢP SỬ DỤNG

Khối lượng Công việc Chúng tôi Cung cấp

Ảnh chụp nhanh các khối lượng công việc sản xuất đang chạy trên KHB AI Cloud hôm nay.

Huấn luyện Mô hình Nền tảng

Tiền huấn luyện cấp biên giới của LLM theo miền cụ thể cho khách hàng doanh nghiệp.

AI Dịch vụ Khách hàng

Tác nhân hỗ trợ đa ngôn ngữ với độ trễ dưới giây và tích hợp CRM.

Tạo Nội dung

Bản sao tiếp thị, bài đăng blog, mô tả sản phẩm và viết sáng tạo.

Tạo Mã

Hoàn thành kiểu Copilot, tái cấu trúc nhận biết repo và phát hiện lỗi.

Thị giác Máy tính

Phát hiện đối tượng, OCR, kiểm tra trực quan và hiểu video.

AI Giọng nói

STT / TTS thời gian thực, nhân bản giọng nói và chép lại cuộc họp.

ĐỊNH GIÁ

Chỉ Trả cho Cái Bạn Sử dụng

Ba mô hình thương mại, phù hợp với mô hình khối lượng công việc của bạn.

Theo nhu cầu

Trả theo mức sử dụng

Không cam kết, thanh toán theo giây

Sử dụng đo theo giờ GPU
Định giá suy luận theo token
Tự phục vụ qua console / API
Hỗ trợ tiêu chuẩn

Dành riêng

Giảm đến 60%

Cam kết 1 tháng đến 3 năm

Đặt trước dung lượng
Thanh toán hàng tháng có thể dự đoán
Lập lịch ưu tiên
Hỗ trợ ưu tiên 24/7

Doanh nghiệp

Tùy chỉnh

Cho ngành được quản lý & quy mô siêu lớn

Phần cứng chuyên dụng / cụm riêng
Mặt phẳng điều khiển đơn khách
SLA & tuân thủ tùy chỉnh
TAM & kiến trúc sư giải pháp chuyên trách

TUÂN THỦ & BẢO MẬT

Cấp doanh nghiệp từ Ngày Một

Phù hợp với các khuôn khổ quản lý đòi hỏi khắt khe nhất — trên toàn cầu.

ISO 27001 SOC 2 Loại II GDPR HK PDPO Sẵn sàng HIPAA

FAQ

Câu hỏi về Điện toán, Đã được Trả lời

Sự khác biệt giữa dành riêng và theo nhu cầu là gì?

Theo nhu cầu được đo theo giây mà không có cam kết. Dành riêng cho bạn giảm giá đến 60% để đổi lấy cam kết dung lượng từ 1 tháng đến 3 năm — lý tưởng cho khối lượng công việc suy luận ổn định.

Tôi có thể mang mô hình và trọng số riêng không?

Có. Chúng tôi hỗ trợ tải lên mô hình tùy chỉnh ở PyTorch, TensorFlow, ONNX và GGUF. Bạn cũng có thể sử dụng thư viện mô hình được chọn lọc của chúng tôi với triển khai một cú nhấp.

Dữ liệu được lưu trữ ở đâu?

Dữ liệu được lưu trữ trong khu vực bạn chọn (HK, Singapore, Frankfurt, US Đông/Tây). Hợp đồng doanh nghiệp có thể ghim vào một quốc gia cụ thể hoặc cụm đơn khách.

Bạn có hỗ trợ chuyển đổi dự phòng đa đám mây không?

Có. Hợp đồng doanh nghiệp bao gồm sao chép đa đám mây (AWS, GCP, Azure, tại chỗ) với chuyển đổi dự phòng tự động và nâng cấp không thời gian chết.

Khởi động Cụm Đầu tiên của Bạn

$100 tín dụng miễn phí cho khách hàng mới. Sẵn sàng sản xuất trong vài phút, không phải vài tuần.

Nhận Báo giá

Điện toán AICấp Doanh nghiệp