數位基礎設施

AI模型和GPU

立即在託管前緣模型上執行代理,或租用 GPU 容量、部署您自己的權重,並將 Digio 任務路由到同一工作區中的專用端點。

克勞德,GPT,雙子座 每個代理模型選擇 GPU 租賃和 BYOM
託管模型

Digio 現已提供型號

為每個代理程式分配預設模型或為每個任務覆蓋。使用量以您的計劃餘額中的 Digio 代幣計量——無論代理呼叫 Sonnet、GPT-4o 還是 Gemini Flash,都是同一個錢包。

人性化的克勞德

  • Claude Opus 4.7 旗艦推理、長背景、架構和策略工作。
  • Claude Opus 4.6 上一代 Opus 可實現穩定、高品質的分析。
  • Claude Sonnet 4.6 日常驅動程式-編碼、編寫和多步驟代理循環。
  • Claude Sonnet 4.5 / 4 快速 Sonnet 層,可對支援的工作負載進行即時快取。
  • Claude Haiku 4.5 低延遲草稿、分類和大容量子任務。

開放人工智慧

  • GPT-5.5 / GPT-5.4 / GPT-5.2 適用於一般和代理工作負載的最新 GPT-5 系列。
  • GPT-4.1 & GPT-4o 為生產代理提供可靠的多模式聊天和工具使用。
  • GPT-4o mini 用於摘要和輕量級步驟的經濟高效的路由。
  • o3 / o3-pro / o3-mini / o4-mini 用於數學、規劃和驗證的推理模型。
  • GPT-5.3 Codex & Codex mini 程式碼生成、重構和儲存庫感知代理技能。

Google雙子座

  • Gemini 2.5 Pro 長上下文研究和結構化提取。
  • Gemini 2.5 Flash 高吞吐量代理步驟具有具競爭力的令牌率。
  • Gemini 2.0 Flash 用於解析、標記和批次作業的超快速傳遞。

開放且專業的 API

  • DeepSeek Chat & Reasoner 對於聊天和思維鍊式任務具有很強的價值。
  • Mistral Large 歐洲託管的多語言代理團隊選項。
  • Llama 3.3 70B 透過 API 的開放權重類別模型 — 與私有 GPU 完美搭配。
  • Grok 3 新聞和社會監控代理的即時模型。
  • Sonar Pro 研究者的基於搜尋的答案。
  • Command R+ RAG 友善的企業聊天和檢索工作流程。

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

用法

代理商如何選擇模型

協調員可以根據任務類型推薦 Sonnet、Opus 和更便宜的快閃記憶體模型。進階使用者為每個代理角色設定預設值 - Sonnet 的研究、Opus 的最終審查、Haiku 或 Gemini Flash 的批次標記。

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU租賃

租用 GPU 並運行您自己的模型

需要微調、氣隙檢查點或可預測的推理定價?在您的 Digio 工作區中新增專用 GPU 容量,安裝您喜歡的服務堆疊,並在您的專用端點處指定代理程式。

專用實例

按小時或按月計算的 GPU 節點(A100、H100、L40S 級)連接到您的租戶 — 與其他客戶隔離。

你的體重

上傳安全張量、GGUF,或從您的註冊表中提取;運行 Llama、Mistral、Qwen 和自訂微調。

標準服務

vLLM、TGI、Ollama 或您維護的容器映像 - Digio 代理程式呼叫與 OpenAI 相容的基本 URL。

相同的編排

要做的事情、團隊聊天、技能和協作不變——只有推理後端是你的。

混合路由

將敏感步驟傳送到專用 GPU,並在一個工作流程中使用 Claude 或 GPT 進行公共研究。

企業控制

受監管團隊的 VPC 對等、靜態出口、審核日誌和模型許可名單。

帶上自己的模型

安裝並連接自訂模型

從零到代理呼叫您的端點的典型設定:

  1. 預留GPU

    選擇 VRAM、區域和正常運作時間(突發與始終開啟)。重量儲存隨實例一起提供或安裝在您的儲存桶上。

  2. 部署堆疊

    啟動服務映像或 SSH,安裝 CUDA 驅動程式並載入檢查點。健康檢查確認模型已準備就緒。

  3. 註冊端點

    在工作區設定中新增基本 URL、API 金鑰和模型 ID。 Digio 在上線前會驗證延遲和令牌格式。

  4. 分配給代理

    選擇您的私人模特兒作為所選代理商的預設模特兒;託管的 Claude/GPT 型號仍然可以並排使用。

GPU 租賃費用與 Digio 方案訂閱分開計費。請聯絡我們以了解容量規劃、SLA 以及從現有推理集群的遷移。

常問問題

模型和 GPU 問題

選擇託管 API 與 Digio 上的自架推理。

我是否需要支付兩次費用——計劃加 API?

您的 Digio 訂閱涵蓋基礎設施、代理和包含的 Digio 代幣。託管模型使用量按實際輸入/輸出令牌借記令牌餘額。 GPU 租賃是您控制的機器的附加組件。

不同的代理可以使用不同的模型嗎?

是的,每個代理都可以有自己的預設值。任務和聊天可以覆蓋單次運行,而不更改全域預設值。

十四行詩和作品有什麼不同?

Opus 已針對更難的推理和更長的連貫計劃進行了調整;對於日常代理循環來說,Sonnet 更快、更便宜。 Haiku 和 flash 級模型最適合批次子任務。

我可以只運行我自己的模型和區塊雲 API 嗎?

企業工作區可以限制出站模型提供者並將所有代理流量路由到您的 GPU 端點。混合模式是大多數團隊的預設模式。

有哪些 GPU 尺寸可用?

產品取決於地區和需求,通常為 7B-70B 級型號提供 24-80 GB VRAM 層,為更大的堆疊提供多 GPU 節點。我們根據參數計數和量化來幫助您確定 VRAM 的大小。

私人 GPU 使用仍然消耗 Digio 代幣嗎?

編排(代理、任務、儲存)保留在您的計劃中。 GPU 上的推理按 GPU 時間計費;您可以選擇計量令牌形式的使用情況以進行內部退款。

選擇託管型號或自備 GPU

從今天開始使用 Claude 和 GPT,然後在準備好託管自訂權重時添加專用 GPU — 相同的代理、相同的任務和您的推理。