
DigitalOcean AI Inference は、DigitalOcean が提供するクラウド上のAIモデル推論サービスで、GPU計算インスタンスとサーバーレス推論オプションを含み、AIアプリケーションのデプロイとスケーリングを支援します。
GPU Droplets(GPU搭載の仮想マシン)、DOKS対応のGPU、裸金属GPU、Gradient™ AI Platformによるサーバーレス推論サービスが中心です。
NVIDIAのH100やAMDのInstinct™ MI350XなどのGPUオプションに対応し、単一GPUから複数GPUまで様々な構成を提供します。
Gradient™ AI Platformを通じて、ユーザーはインスタンスを管理することなく、APIエンドポイント経由でモデルを呼び出し、推論リソースを自動的にスケジュールし、使用量に応じて課金されます。
開発者、スタートアップ、デジタルネイティブ企業を対象に、AI実験、モデルのトレーニング、リアルタイムアプリの展開、そして本番環境の推論ワークロードの管理に適しています。
Gradient™ Platform を使ったサーバーレス推論、GPU Dropletsを自分で作成・管理、ワンクリックデプロイメントテンプレートを使ったコンテナ化デプロイが主な方法です。
オンデマンドGPUインスタンスとトークンごとの課金サーバーレスオプションを含む透明な価格設定で、予測可能なコストを提供します。
Claude Opusを含む主要な基礎モデルをサポートし、推論エンドポイントを通じて主要なオープンソースモデルのホスティングサービスを提供します。
Diffus AIはプロフェッショナル向けブラウザ型AI画像生成プラットフォーム。7万種類以上のモデルを統合し、クラウド上で高品質な創作環境と精密なコントロールツールを提供。GPU不要で手軽に、効率的にビジュアルコンテンツを制作できます。