NotebookLM 的中文語音品質實際上如何？適合正式發布嗎？

目前 NotebookLM Audio Overview 的 AI 主持人僅支援英文語音。如果需要中文 podcast，建議使用路線 B（ChatGPT 寫腳本 + ElevenLabs 或 TTSMaker 生成中文語音）。NotebookLM 仍然適合用來整理中文來源資料並生成英文語音內容。

ElevenLabs 免費版每月 10,000 字元夠用嗎？

一集 10 分鐘的 podcast 腳本約 1,500 字。如果是雙人對話分別生成，約需 3,000 字元。所以每月大約可以做 3 集。如果需要更大額度，TTSMaker 每週提供 20,000 字元且可商用。

Spotify for Creators 完全免費嗎？上架後怎麼賺錢？

託管和上架完全免費，無月費、無儲存限制。賺錢的方式主要是透過 Spotify 的廣告分潤計畫，但採五五分潤（創作者拿 50%）。對新手來說，先專注在做出好內容，等累積一定聽眾後再考慮變現。

我需要在 podcast 中標注「AI 生成」嗎？

目前多數國家沒有法律強制要求，但各大平台正在收緊規範。Spotify 的內容政策要求對 AI 生成內容保持透明。從信任角度，主動標注「部分內容由 AI 輔助製作」是最安全的做法，也是對聽眾的尊重。

如果想從 AI 輔助升級到真人錄音，最低成本的設備是什麼？

入門級 USB 麥克風（如 Samson Q2U，約 $70 美元；Audio-Technica ATR2100x 約 $79，但已逐漸停產，可改考慮 Audio-Technica ATR2005USB）加上免費的 Audacity，總成本約 $70-80 美元。這個組合已經能產出比 AI 語音更自然的錄音品質，而且你在 AI 輔助階段學到的腳本撰寫和音頻編輯技巧可以直接沿用。

零器材做出第一集 AI Podcast：NotebookLM + ElevenLabs + Spotify 免費完整教學

沒有麥克風、沒有錄音室、沒有預算。這三個理由讓多少人的 podcast 念頭永遠停在腦子裡。但 2026 年的 AI 工具已經讓「零器材做 podcast」從不可能變成週末下午就能完成的事。這篇文章是我從零開始實測的完整記錄：用免費工具走完腳本、語音生成、編輯到上架 Spotify 的每一步，附上品質把關 checklist，確保你的第一集不會成為被演算法淹沒的 AI slop。

TL;DR

完全免費工具鏈可行：ChatGPT Free → NotebookLM → Audacity → Spotify for Creators
NotebookLM 是目前最快的路線：每日 3 則免費額度，支援 80+ 語言，預設生成約 10 分鐘音頻
需要更多語音控制時，ElevenLabs Free（每月 10,000 字元）是補充選項
AI 語音品質仍有斷句和音調問題，發布前的品質把關不能省
法律與倫理風險真實存在（2026 年 2 月已有 NPR 主持人對 Google 提告），透明標注比隱瞞更安全

為什麼現在是 AI Podcast 的入場時機？

先看數字。根據 DemandSage 統計，2024 年全球 podcast 市場規模約為 308 億至 325 億美元，預計 2030 年成長至約 1,311 億美元。DemandSage 同時預估 2026 年全球 podcast 聽眾將達 6.19 億人。與此同時，AI 語音生成市場也在爆發，MarketsandMarkets 預測 2025 至 2031 年的 CAGR 為 30.7%。

AI 工具正在大幅降低 podcast 製作門檻，根據產業報告，AI 最高能為創作者減少 50% 的製作成本，主要體現在剪輯和轉錄的效率提升上。但市場也有暗面：Podnews 報導指出，已有公司每週量產 3,000 集 AI podcast，每集成本約 1 美元。這種 AI slop 正在稀釋聽眾信任。

這代表什麼？門檻降低讓更多人能入場，但品質分水嶺也在加速形成。認真對待內容品質的創作者，反而因為大量低品質內容的對比而更容易被看見。

兩條路線選擇：NotebookLM 快速版 vs 多工具完整版

開始之前，你需要先決定走哪條路線。兩者都是零成本，差別在於時間投入和控制程度。

維度	NotebookLM 快速版	多工具完整版
製作時間	30-60 分鐘/集	2-4 小時/集
語音風格	雙主持人對話（固定風格）	可選音色、語速、語調
控制程度	低（無法指定語音角色）	高（逐句可調整）
免費額度	每日 3 則	ElevenLabs 每月 10,000 字元
適合場景	快速試水、知識整理分享	品牌節目、固定角色設定

路線 A：NotebookLM 快速版

Google 的 NotebookLM 是目前最快從零到音頻的路線。上傳資料來源（Google Doc、PDF、網頁 URL），它會自動生成雙主持人對話式音頻。支援 80+ 語言，繁體中文包含在內。

免費版每日上限 3 則。時長可選擇短版（約 5 分鐘）、預設（約 10 分鐘）或長版（約 20 分鐘，目前僅限英文）。2025 年新增的 Interactive Mode 讓你可以加入對話、提問，引導內容走向，但目前尚無法在生成過程中即時打斷 AI 主持人。

主要限制：你無法自訂主持人的聲音特徵，也無法針對某一段重新生成。如果對某段不滿意，只能重新生成整集。

路線 B：多工具完整版

工具組合：ChatGPT Free（腳本）→ ElevenLabs Free 或 TTSMaker（語音合成）→ Audacity（編輯）。

這條路線適合想要品牌一致性的創作者，例如固定主持人音色、特定語速節奏。代價是時間成本增加 3-4 倍。

怎麼選？

首集試水、快速驗證主題 → 路線 A（NotebookLM）
打算持續更新、需要固定主持人音色 → 路線 B（多工具）
追求品質但預算有限 → 混合策略：NotebookLM 生成初版 + Audacity 後製

實戰步驟：從腳本到 Spotify 上架

Step 1：腳本製作（ChatGPT Free / Gemini）

不管走哪條路線，好腳本都是基礎。用 ChatGPT Free 或 Gemini 生成腳本時，這個 prompt 框架實測效果不錯：

你是一個 podcast 腳本寫手。請寫一段兩人對話的 podcast 腳本。

主題：[你的主題]
目標聽眾：[描述你的聽眾]
時長目標：10 分鐘（約 1,500-2,000 字）
語氣：輕鬆但有料，像兩個有經驗的朋友在聊天
結構：開場破題 → 核心觀點（3 個）→ 實際案例 → 總結

注意事項：
- 避免過長的獨白段落，每段對話控制在 3-4 句
- 加入自然的語氣詞和過渡句（「對，這點很關鍵」「等等，你是說...」）
- 不要用條列式寫法，要像真實對話

時長換算參考：中文語音合成大約 1,000 字 ≈ 6-8 分鐘。如果目標是 10 分鐘，腳本控制在 1,500 字左右。

常見錯誤：腳本寫得太條列化，AI 語音合成時會變成機械式逐點唸讀，聽感非常差。解法是在 prompt 中強調「像真人對話」，並在生成後手動潤色過渡句。

Step 2：語音生成

路線 A：NotebookLM

前往 NotebookLM，建立新筆記本
上傳素材（建議用 Google Doc 格式，相容性最好）
點選「Audio Overview」，選擇時長
如果想引導內容方向，啟用 Interactive Mode，在生成前輸入你希望強調的重點
等待生成（通常 2-5 分鐘），下載 MP3

實測心得：NotebookLM 生成的對話聽起來確實像兩個人在聊天，會自然地互相回應、追問。不過要注意的是，Audio Overview 的 AI 主持人目前僅支援英文語音。雖然 NotebookLM 本身支援 80+ 語言的文字處理，但語音生成仍以英文為主。2025 年 12 月中旬升級至 Gemini 3 架構後，推理能力提升，對複雜主題的整理更有條理。

路線 B：ElevenLabs Free / TTSMaker

ElevenLabs Free：每月 10,000 字元額度，約等於 10 分鐘音訊。單次生成上限 2,500 字元，所以需要分段生成再合併。免費版僅限非商業用途。

額度管理策略：一集 10 分鐘約需 1,500 字腳本。如果是雙人對話，兩個角色分別生成，總字元數約 3,000。每月可以做 3 集左右。

TTSMaker：每週 20,000 字元配額，且包含商業使用授權。音色選擇比 ElevenLabs 少，但額度更充裕。

繁中語音品質比較：ElevenLabs 的英文音色明顯優於中文，中文偶爾四聲混淆。TTSMaker 的中文斷句處理稍好，但整體音色自然度不如 ElevenLabs。兩者都建議先用短段落測試，找到最適合的音色再正式錄製。

Step 3：音頻編輯（Audacity / GarageBand）

不管用哪條路線，生成的音頻都需要基本後製。Audacity 免費開源，macOS 用戶也可以用內建的 GarageBand。

三個必做操作：

降噪（Noise Reduction）：選取一段無聲片段 → Effect → Noise Reduction → Get Noise Profile → 選全部音軌 → 再次套用。AI 生成的音頻通常底噪很低，但仍建議做一次。
音量標準化（Normalize）：Effect → Normalize → 設定 -1.0 dB。Spotify 建議的響度標準是 -14 LUFS，Normalize 能確保音量一致。
靜音修剪：手動剪掉過長的停頓。AI 語音偶爾會在句子間產生不自然的長停頓，剪掉後聽感改善很多。

加入開場配樂：Pixabay Music 和 Free Music Archive 提供免版稅音樂。下載後在 Audacity 匯入為新音軌，調整音量讓配樂不蓋過人聲（建議配樂音量降至 -15 到 -20 dB）。

匯出設定：File → Export as MP3，選擇 128kbps（Spotify 最低要求 96kbps，128kbps 是品質和檔案大小的平衡點）。

Step 4：上架 Spotify + Apple Podcasts

Spotify for Creators（原 Spotify for Podcasters）提供完全免費的 podcast 託管，無儲存限制、無月費。

Spotify 上架流程：

用 Spotify 帳號登入 Spotify for Creators
建立新節目，填寫節目名稱、分類、描述
上傳封面圖（規格：3000x3000px，JPG 或 PNG。免費製作：用 Canva 的 podcast 封面模板）
上傳第一集音頻，填寫單集標題和說明
提交審核（通常 1-3 個工作天）

同步上架 Apple Podcasts：

Spotify for Creators 會為你的節目生成 RSS feed（在 Settings → Availability 中取得）。拿到 RSS feed 後：

前往 Apple Podcasts Connect，用 Apple ID 登入
點選「新增節目」，貼上 RSS feed URL
提交審核（通常 3-5 個工作天，之後每集更新會在 24 小時內自動同步）

Apple Podcasts 上架同樣完全免費。兩個平台合計覆蓋了全球絕大多數的 podcast 聽眾。

💡 提示：如果你在台灣，也可以考慮 SoundOn 作為託管平台。它是台灣本地服務，免費無上傳限制，且支援自動分發到 Spotify、Apple Podcasts 等多個平台，省去手動提交 RSS 的步驟。

注意：Spotify for Creators 的廣告分潤採創作者與 Spotify 五五分潤模式。但對剛起步的創作者來說，免費託管和曝光機會遠比分潤條件重要。

品質把關 Checklist：避免淪為 AI Slop

AI slop 不是技術問題，是態度問題。當市場上已經有公司每週量產 3,000 集 AI podcast 時，你花 30 分鐘做的品質把關，就是區分你和那些量產內容的關鍵。

發布前 10 項必檢清單：

內容層面

至少完整聽過一遍音頻，標記所有不自然的斷句或停頓
所有數據和事實陳述都有可驗證的來源
內容包含真實觀點或第一手經驗，不是純資訊轉述
AI 生成的人名、機構名、數字全部核實（AI 會自信地說出錯誤資訊）

技術層面

音頻已做過音量標準化處理
無明顯背景雜音或 AI 語音瑕疵（機械感重複、不自然停頓）
開場 30 秒內有清楚的主題說明
音頻時長在合理範圍（首集建議 8-15 分鐘）

合規層面

節目描述中已標注「部分內容由 AI 輔助製作」
使用的配樂素材已確認授權條款（CC0 或免版稅商用）

風險揭露與注意事項

法律風險

2026 年 2 月，前 NPR 主持人 David Greene 正式起訴 Google，指控 NotebookLM Audio Overview 的男性 AI 聲音複製了他的聲音特徵。AI 鑑識測試顯示 53-60% 的匹配信心度。Google 回應稱該聲音基於「付費專業演員」。案件仍在訴訟初期，但這已經為 AI 語音的版權問題畫出了一條清晰的警戒線。

對個人創作者的啟示：不要用 AI 工具模仿任何真實人物的聲音。使用平台預設音色是最安全的做法。

音樂授權也需要注意。即使是「免費」平台的素材，部分仍有商業使用限制。下載前逐一確認授權條款（看清楚是 CC0、CC-BY 還是僅限非商業用途）。

倫理風險

透明度是底線。如果你的 podcast 使用了 AI 生成的語音或腳本，在節目描述中註明。不標注 AI 參與等於對聽眾隱瞞，長期來看會損害信任。

AI slop 對整個 podcast 生態的傷害是真實的。每一集認真製作的 AI 輔助 podcast 都在證明 AI 是工具而非捷徑，這對整個創作者社群都有正面意義。

品質風險

AI 語音的已知缺陷：中文四聲偶爾混淆、專業術語唸法錯誤、句子間的停頓節奏不夠自然。這些問題目前沒有完美解法，只能靠後製修正和多次測試。

最大的隱藏風險是 hallucination。AI 在生成腳本時可能插入不準確的數字或虛構的引述，而且「錯得很有自信」。所有 AI 生成的事實性內容，發布前必須人工核實。

聽眾信任

Podcast 的核心吸引力之一是聽眾與主持人之間的「人際連結感」。純 AI 生成的內容在這方面天生弱勢。長期策略是把 AI 當成提高效率的工具，但個人觀點、真實經驗、獨特視角才是讓聽眾持續收聽的理由。

結論

免費 AI 工具鏈已經讓「零器材做 podcast」從口號變成可執行的工作流。NotebookLM 每日 3 則的免費額度，足夠你今天就完成第一集的音頻草稿。

但工具只是起點。在 AI slop 充斥市場的當下，品質把關才是真正的護城河。花時間核實事實、修剪音頻瑕疵、主動標注 AI 參與，這些「慢功夫」恰好是量產內容做不到的事。

現在就打開 NotebookLM，把你最近想分享的一個主題丟進去，生成你的第一段音頻。不用完美，先讓自己聽到「自己的 podcast」是什麼感覺。第一集永遠是最難的，但有了 AI 工具，它不再需要是最貴的。