
DigitalOcean AI Inference 是 DigitalOcean 提供的雲端 AI 模型推理服務,包含 GPU 計算實例與無伺伺服器推理選項,旨在協助使用者部署與擴展 AI 應用。
主要包括 GPU Droplets(配備 GPU 的虛擬機)、適用於 DOKS 的 GPU、裸機 GPU,以及透過 Gradient™ AI Platform 提供的無伺伺服器推理服務。
支援來自 NVIDIA(如 H100)與 AMD(如 Instinct™ MI350X)的 GPU 選項,提供從單 GPU 到多 GPU 的多種配置。
透過 Gradient™ AI Platform,使用者無需管理實例,可直接透過 API 端點呼叫模型,系統會自動分配推理資源並依使用量計費。
適用於開發者、初創企業及數位原生企業,用於 AI 實驗、模型訓練、實時應用部署及生產環境推理工作負載管理。
主要方式包括:透過 Gradient™ 平台使用無伺伺服器推理、自行建立並管理 GPU Droplets 實例,以及使用一鍵部署模板進行容器化部署。
提供透明的定價結構,包括按需 GPU 實例與按 token 計費的無伺伺服器選項,目的在於提供可預測成本。
支援包括 Claude Opus 在內的主流基礎模型,並透過推理端點提供領先開源模型的托管服務。
Diffus AI 是專業級瀏覽器 AI 影像生成平台,內建 70,000+ 模型,提供雲端創作環境與精準控制工具,零高階硬體也能高效產圖。