Whisper Web 是一個託管在 Hugging Face Space 平台上的免費語音轉文字 AI 工具,專為需要將語音內容快速轉換為文字的使用者而設計。這個線上工具支援多種語音來源,包括音檔網址、設備內的音檔或直接來自麥克風的即時錄音。無論是會議記錄、訪談筆記還是課程錄音,Whisper Web 都能輕鬆應對,支持無限長度的音檔並且兼容多語言,大幅度減少了後續要手動轉錄的麻煩。使用 Whisper Web 非常簡單,只需上傳音檔即可自動生成逐字稿。在轉錄完成後,使用者可以將結果匯出為標準的文字檔,或者選擇帶有時間戳的 JSON 檔案,方便進一步的處理和應用。
可無限長度音檔與多語言支援的語音轉文字解決方案
1.Whisper Web 支持多種語音來源,包括音檔網址、設備中的錄音檔以及即時的麥克風輸入,使用者可以根據需求靈活選擇合適的語音來源。
2.以來自設備的錄音檔案為例,點選「From file」按鈕來選擇設備內的檔案並會搭配播放器顯示在網頁上。
3.Whisper Web 預設轉錄語言為英文,如果音檔內容不是英語,請點選音檔播放器右下角的「⚙」圖示按鈕,然後勾選「Multilingual」選項。
接著選擇所要轉錄的語言。
4.完成設定,按「Transcribe Audio」按鈕,第一次使用時會先下載所需的 AI 模型。
5.模型載入後,就會開始轉出逐字稿並直接顯示在頁面上,完成轉錄後,頁面最下方有「Export TXT」和「Export JSON」匯出按鈕可選用。
6.如果匯出是 TXT 文字檔,會是沒有任何標點符號文字內容,要解決這個問題最簡單的方法就是透過 ChatGPT 來協助;而匯出 JSON 檔,同樣可用記事本開啟,內容會是帶有時間戳記的內容。
Whisper Web 的出現,大大簡化了語音轉文字的過程。無論你是需要記錄重要的會議、整理訪談內容,還是轉錄課堂講義,Whisper Web 都能完美支持。以一個免費的線上工具來說,它不僅支援多語言和無限長度的音檔,還能匯出帶有時間戳的 JSON 檔案,方便後續使用。