跳轉到主要內容

系統需求

Echophrase 可在多種硬體上執行。預設模型針對中階遊戲 GPU 調校;另有更輕量的 「Lite」變體,可在沒有獨立 GPU 的裝置上順暢運作。

系統

資源最低需求建議配備
作業系統Windows 10 (22H2)Windows 11
macOSmacOS 13(Apple Silicon)— Metal 測試中macOS 14+
LinuxUbuntu 22.04(僅 CPU)Ubuntu 24.04
記憶體4 GB8 GB+
磁碟空間2 GB 可用4 GB 可用
GPU無 — CPU 即可Windows 上的 DirectX 12 GPU

GPU 加速

Echophrase 會在首次啟動時自動偵測最快的可用裝置 — 無需任何設定。
平台加速方式所需條件
WindowsDirectML任何 DirectX 12 GPU(NVIDIA、AMD、Intel、Qualcomm)
macOSMetal (測試中)Apple Silicon,macOS 13.3+
LinuxCPUGPU 加速已列入規劃
我們移除了 CUDA 支援以擺脫「相依性地獄」— 必須將 NVIDIA 驅動程式版本、 CUDA Toolkit 版本以及 cuDNN 版本全部對齊,每次安裝都變成繁瑣的多步驟工程。 DirectML 內建於 Windows,可在所有現代 GPU(不分品牌)上執行,並在語音轉錄 工作上提供同等的效能 — 卻沒有任何安裝麻煩。原生 CPU 與 Apple Metal 則涵蓋 其餘平台。

支援的模型

以下資料直接來自桌面應用程式的模型登錄表 — 這就是目前實際出貨的模型。
模型參數量最低 VRAM建議 GPU即時速度
Parakeet-TDT 0.6B (預設)0.6B6 GBRTX 3080 或更佳12×
Parakeet Lite120M無(GPU 可選)任何現代 GPU,內建顯卡亦可2–5×
T5-Mini Grammar (後處理)Mini任何 GPU

建議的 NVIDIA 顯示卡

對於預設的 Parakeet-TDT 模型,我們建議使用 RTX 3080 或更佳Parakeet Lite 在內建顯示卡或較舊的 NVIDIA 顯示卡上即可順暢執行 — 您不需要獨立 GPU 才能使用 Echophrase。
更多模型即將推出。 我們正在評估其他 Whisper 變體與多語言語音模型。 想投票決定下一個推出的模型嗎? 加入我們的 Discord