Do I pay twice—plan plus API?

Your Digio subscription covers infrastructure, agents, and included Digio Tokens. Managed model usage debits that token balance by actual input/output tokens. GPU rental is an add-on for the machines you control.

Can different agents use different models?

Yes—each agent can have its own default. Tasks and chats can override for a single run without changing the global default.

What is the difference between Sonnet and Opus?

Opus is tuned for harder reasoning and longer coherent plans; Sonnet is faster and cheaper for everyday agent loops. Haiku and flash-class models are best for volume subtasks.

Can I run only my own model and block cloud APIs?

Enterprise workspaces can restrict outbound model providers and route all agent traffic to your GPU endpoint. Hybrid mode is the default for most teams.

Which GPU sizes are available?

Offerings depend on region and demand—commonly 24–80 GB VRAM tiers for 7B–70B class models and multi-GPU nodes for larger stacks. We help size VRAM from your parameter count and quantization.

Does private GPU usage still consume Digio Tokens?

Orchestration (agents, tasks, storage) stays on your plan. Inference on your GPU is billed as GPU time; you may optionally meter token-shaped usage for internal chargeback.

數位基礎設施

AI模型和GPU

立即在託管前緣模型上執行代理，或租用 GPU 容量、部署您自己的權重，並將 Digio 任務路由到同一工作區中的專用端點。

克勞德，GPT，雙子座每個代理模型選擇 GPU 租賃和 BYOM

建立工作區計劃和代幣

託管模型

Digio 現已提供型號

為每個代理程式分配預設模型或為每個任務覆蓋。使用量以您的計劃餘額中的 Digio 代幣計量——無論代理呼叫 Sonnet、GPT-4o 還是 Gemini Flash，都是同一個錢包。

人性化的克勞德

Claude Opus 4.7 旗艦推理、長背景、架構和策略工作。
Claude Opus 4.6 上一代 Opus 可實現穩定、高品質的分析。
Claude Sonnet 4.6 日常驅動程式－編碼、編寫和多步驟代理循環。
Claude Sonnet 4.5 / 4 快速 Sonnet 層，可對支援的工作負載進行即時快取。
Claude Haiku 4.5 低延遲草稿、分類和大容量子任務。

開放人工智慧

GPT-5.5 / GPT-5.4 / GPT-5.2 適用於一般和代理工作負載的最新 GPT-5 系列。
GPT-4.1 & GPT-4o 為生產代理提供可靠的多模式聊天和工具使用。
GPT-4o mini 用於摘要和輕量級步驟的經濟高效的路由。
o3 / o3-pro / o3-mini / o4-mini 用於數學、規劃和驗證的推理模型。
GPT-5.3 Codex & Codex mini 程式碼生成、重構和儲存庫感知代理技能。

Google雙子座

Gemini 2.5 Pro 長上下文研究和結構化提取。
Gemini 2.5 Flash 高吞吐量代理步驟具有具競爭力的令牌率。
Gemini 2.0 Flash 用於解析、標記和批次作業的超快速傳遞。

開放且專業的 API

DeepSeek Chat & Reasoner 對於聊天和思維鍊式任務具有很強的價值。
Mistral Large 歐洲託管的多語言代理團隊選項。
Llama 3.3 70B 透過 API 的開放權重類別模型 — 與私有 GPU 完美搭配。
Grok 3 新聞和社會監控代理的即時模型。
Sonar Pro 研究者的基於搜尋的答案。
Command R+ RAG 友善的企業聊天和檢索工作流程。

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

用法

代理商如何選擇模型

協調員可以根據任務類型推薦 Sonnet、Opus 和更便宜的快閃記憶體模型。進階使用者為每個代理角色設定預設值 - Sonnet 的研究、Opus 的最終審查、Haiku 或 Gemini Flash 的批次標記。

Per agent — default model in agent settings; override in To do or chat when needed.
Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).
Skills stay the same — tools and integrations work across models; only latency and cost profile change.
Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU租賃

租用 GPU 並運行您自己的模型

需要微調、氣隙檢查點或可預測的推理定價？在您的 Digio 工作區中新增專用 GPU 容量，安裝您喜歡的服務堆疊，並在您的專用端點處指定代理程式。

專用實例

按小時或按月計算的 GPU 節點（A100、H100、L40S 級）連接到您的租戶 — 與其他客戶隔離。

你的體重

上傳安全張量、GGUF，或從您的註冊表中提取；運行 Llama、Mistral、Qwen 和自訂微調。

標準服務

vLLM、TGI、Ollama 或您維護的容器映像 - Digio 代理程式呼叫與 OpenAI 相容的基本 URL。

相同的編排

要做的事情、團隊聊天、技能和協作不變——只有推理後端是你的。

混合路由

將敏感步驟傳送到專用 GPU，並在一個工作流程中使用 Claude 或 GPT 進行公共研究。

企業控制

受監管團隊的 VPC 對等、靜態出口、審核日誌和模型許可名單。

帶上自己的模型

安裝並連接自訂模型

從零到代理呼叫您的端點的典型設定：

預留GPU

選擇 VRAM、區域和正常運作時間（突發與始終開啟）。重量儲存隨實例一起提供或安裝在您的儲存桶上。
部署堆疊

啟動服務映像或 SSH，安裝 CUDA 驅動程式並載入檢查點。健康檢查確認模型已準備就緒。
註冊端點

在工作區設定中新增基本 URL、API 金鑰和模型 ID。 Digio 在上線前會驗證延遲和令牌格式。
分配給代理

選擇您的私人模特兒作為所選代理商的預設模特兒；託管的 Claude/GPT 型號仍然可以並排使用。

GPU 租賃費用與 Digio 方案訂閱分開計費。請聯絡我們以了解容量規劃、SLA 以及從現有推理集群的遷移。

常問問題

模型和 GPU 問題

選擇託管 API 與 Digio 上的自架推理。

我是否需要支付兩次費用——計劃加 API？

您的 Digio 訂閱涵蓋基礎設施、代理和包含的 Digio 代幣。託管模型使用量按實際輸入/輸出令牌借記令牌餘額。 GPU 租賃是您控制的機器的附加組件。

不同的代理可以使用不同的模型嗎？

是的，每個代理都可以有自己的預設值。任務和聊天可以覆蓋單次運行，而不更改全域預設值。

十四行詩和作品有什麼不同？

Opus 已針對更難的推理和更長的連貫計劃進行了調整；對於日常代理循環來說，Sonnet 更快、更便宜。 Haiku 和 flash 級模型最適合批次子任務。

我可以只運行我自己的模型和區塊雲 API 嗎？

企業工作區可以限制出站模型提供者並將所有代理流量路由到您的 GPU 端點。混合模式是大多數團隊的預設模式。

有哪些 GPU 尺寸可用？

產品取決於地區和需求，通常為 7B-70B 級型號提供 24-80 GB VRAM 層，為更大的堆疊提供多 GPU 節點。我們根據參數計數和量化來幫助您確定 VRAM 的大小。

私人 GPU 使用仍然消耗 Digio 代幣嗎？

編排（代理、任務、儲存）保留在您的計劃中。 GPU 上的推理按 GPU 時間計費；您可以選擇計量令牌形式的使用情況以進行內部退款。

探索數碼

讓模型發揮作用

代理、任務和技能—圍繞您選擇的模型的工作區。

選擇託管型號或自備 GPU

從今天開始使用 Claude 和 GPT，然後在準備好託管自訂權重時添加專用 GPU — 相同的代理、相同的任務和您的推理。

開始使用比較計劃