
DigitalOcean AI Inference 是DigitalOcean提供的云端AI模型推理服务,包含GPU计算实例和无服务器推理选项,旨在帮助用户部署和扩展AI应用。
主要包括GPU Droplets(配备GPU的虚拟机)、适用于DOKS的GPU、裸金属GPU,以及通过Gradient™ AI Platform提供的无服务器推理服务。
支持来自NVIDIA(如H100)和AMD(如Instinct™ MI350X)的GPU选项,提供从单GPU到多GPU的多种配置。
通过Gradient™ AI Platform,用户无需管理实例,可直接通过API端点调用模型,系统会自动调度推理资源并按使用量计费。
适用于开发者、初创企业及数字原生企业,用于AI实验、模型训练、实时应用部署及生产环境推理工作负载管理。
主要方式包括:通过Gradient™平台使用无服务器推理、自主创建并管理GPU Droplets实例,以及使用一键部署模板进行容器化部署。
提供透明的定价结构,包括按需GPU实例和按token计费的无服务器选项,旨在提供可预测的成本。
支持包括Claude Opus在内的主流基础模型,并通过推理端点提供领先开源模型的托管服务。
Diffus AI是一款专业级浏览器端AI图像生成平台,整合超过70,000个模型,为用户提供云端创作环境与精确控制工具,降低硬件门槛,提升图像创作效率。