零器材做出第一集 AI Podcast:NotebookLM + ElevenLabs + Spotify 免費完整教學

零器材做出第一集 AI Podcast:NotebookLM + ElevenLabs + Spotify 免費完整教學

February 22, 2026

零器材做出第一集 AI Podcast:NotebookLM + ElevenLabs + Spotify 免費完整教學

沒有麥克風、沒有錄音室、沒有預算。這三個理由讓多少人的 podcast 念頭永遠停在腦子裡。但 2026 年的 AI 工具已經讓「零器材做 podcast」從不可能變成週末下午就能完成的事。這篇文章是我從零開始實測的完整記錄:用免費工具走完腳本、語音生成、編輯到上架 Spotify 的每一步,附上品質把關 checklist,確保你的第一集不會成為被演算法淹沒的 AI slop。

TL;DR

  • 完全免費工具鏈可行:ChatGPT Free → NotebookLM → Audacity → Spotify for Creators
  • NotebookLM 是目前最快的路線:每日 3 則免費額度,支援 80+ 語言,預設生成約 10 分鐘音頻
  • 需要更多語音控制時,ElevenLabs Free(每月 10,000 字元)是補充選項
  • AI 語音品質仍有斷句和音調問題,發布前的品質把關不能省
  • 法律與倫理風險真實存在(2026 年 2 月已有 NPR 主持人對 Google 提告),透明標注比隱瞞更安全

為什麼現在是 AI Podcast 的入場時機?

先看數字。根據 Grand View Research 報告,全球 podcast 市場 2024 年規模達 307.2 億美元,預計 2030 年成長至 1,311.3 億美元(CAGR 27.0%,年複合成長率)。DemandSage 統計預估 2026 年全球 podcast 聽眾將達 6.19 億人。與此同時,AI 語音生成市場也在爆發,MarketsandMarkets 預測 2025 至 2031 年的 CAGR 為 30.7%。

三年前做 podcast 至少需要 $500 以上的麥克風和音訊介面,現在免費 AI 工具能完成 80% 的工作。但市場也有暗面:Podnews 報導指出,已有公司每週量產 3,000 集 AI podcast,每集成本約 1 美元。這種 AI slop 正在稀釋聽眾信任。

這代表什麼?門檻降低讓更多人能入場,但品質分水嶺也在加速形成。認真對待內容品質的創作者,反而因為大量低品質內容的對比而更容易被看見。

兩條路線選擇:NotebookLM 快速版 vs 多工具完整版

開始之前,你需要先決定走哪條路線。兩者都是零成本,差別在於時間投入和控制程度。

維度NotebookLM 快速版多工具完整版
製作時間30-60 分鐘/集2-4 小時/集
語音風格雙主持人對話(固定風格)可選音色、語速、語調
控制程度低(無法指定語音角色)高(逐句可調整)
免費額度每日 3 則ElevenLabs 每月 10,000 字元
適合場景快速試水、知識整理分享品牌節目、固定角色設定

路線 A:NotebookLM 快速版

Google 的 NotebookLM 是目前最快從零到音頻的路線。上傳資料來源(Google Doc、PDF、網頁 URL),它會自動生成雙主持人對話式音頻。支援 80+ 語言,繁體中文包含在內。

免費版每日上限 3 則。時長可選擇短版(約 5 分鐘)、預設(約 10 分鐘)或長版(約 20 分鐘,目前僅限英文)。2025 年新增的 Interactive Mode 讓你可以在生成過程中即時打斷、提問,引導內容走向。

主要限制:你無法自訂主持人的聲音特徵,也無法針對某一段重新生成。如果對某段不滿意,只能重新生成整集。

路線 B:多工具完整版

工具組合:ChatGPT Free(腳本)→ ElevenLabs Free 或 TTSMaker(語音合成)→ Audacity(編輯)。

這條路線適合想要品牌一致性的創作者,例如固定主持人音色、特定語速節奏。代價是時間成本增加 3-4 倍。

怎麼選?

  • 首集試水、快速驗證主題 → 路線 A(NotebookLM)
  • 打算持續更新、需要固定主持人音色 → 路線 B(多工具)
  • 追求品質但預算有限 → 混合策略:NotebookLM 生成初版 + Audacity 後製

實戰步驟:從腳本到 Spotify 上架

Step 1:腳本製作(ChatGPT Free / Gemini)

不管走哪條路線,好腳本都是基礎。用 ChatGPT Free 或 Gemini 生成腳本時,這個 prompt 框架實測效果不錯:

你是一個 podcast 腳本寫手。請寫一段兩人對話的 podcast 腳本。

主題:[你的主題]
目標聽眾:[描述你的聽眾]
時長目標:10 分鐘(約 1,500-2,000 字)
語氣:輕鬆但有料,像兩個有經驗的朋友在聊天
結構:開場破題 → 核心觀點(3 個)→ 實際案例 → 總結

注意事項:
- 避免過長的獨白段落,每段對話控制在 3-4 句
- 加入自然的語氣詞和過渡句(「對,這點很關鍵」「等等,你是說...」)
- 不要用條列式寫法,要像真實對話

時長換算參考:中文語音合成大約 1,000 字 ≈ 6-8 分鐘。如果目標是 10 分鐘,腳本控制在 1,500 字左右。

常見錯誤:腳本寫得太條列化,AI 語音合成時會變成機械式逐點唸讀,聽感非常差。解法是在 prompt 中強調「像真人對話」,並在生成後手動潤色過渡句。

Step 2:語音生成

路線 A:NotebookLM

  1. 前往 NotebookLM,建立新筆記本
  2. 上傳素材(建議用 Google Doc 格式,相容性最好)
  3. 點選「Audio Overview」,選擇時長
  4. 如果想引導內容方向,啟用 Interactive Mode,在生成前輸入你希望強調的重點
  5. 等待生成(通常 2-5 分鐘),下載 MP3

實測心得:NotebookLM 生成的對話聽起來確實像兩個人在聊天,會自然地互相回應、追問。中文表現比一年前進步很多,但偶爾仍有不自然的斷句。2025 年 12 月中旬升級至 Gemini 3 架構後,推理能力提升,對複雜主題的整理更有條理。

路線 B:ElevenLabs Free / TTSMaker

ElevenLabs Free:每月 10,000 字元額度,約等於 10 分鐘音訊。單次生成上限 2,500 字元,所以需要分段生成再合併。免費版僅限非商業用途。

額度管理策略:一集 10 分鐘約需 1,500 字腳本。如果是雙人對話,兩個角色分別生成,總字元數約 3,000。每月可以做 3 集左右。

TTSMaker:每週 20,000 字元配額,且包含商業使用授權。音色選擇比 ElevenLabs 少,但額度更充裕。

繁中語音品質比較:ElevenLabs 的英文音色明顯優於中文,中文偶爾四聲混淆。TTSMaker 的中文斷句處理稍好,但整體音色自然度不如 ElevenLabs。兩者都建議先用短段落測試,找到最適合的音色再正式錄製。

Step 3:音頻編輯(Audacity / GarageBand)

不管用哪條路線,生成的音頻都需要基本後製。Audacity 免費開源,macOS 用戶也可以用內建的 GarageBand。

三個必做操作

  1. 降噪(Noise Reduction):選取一段無聲片段 → Effect → Noise Reduction → Get Noise Profile → 選全部音軌 → 再次套用。AI 生成的音頻通常底噪很低,但仍建議做一次。

  2. 音量標準化(Normalize):Effect → Normalize → 設定 -1.0 dB。Spotify 建議的響度標準是 -14 LUFS,Normalize 能確保音量一致。

  3. 靜音修剪:手動剪掉過長的停頓。AI 語音偶爾會在句子間產生不自然的長停頓,剪掉後聽感改善很多。

加入開場配樂Pixabay MusicFree Music Archive 提供免版稅音樂。下載後在 Audacity 匯入為新音軌,調整音量讓配樂不蓋過人聲(建議配樂音量降至 -15 到 -20 dB)。

匯出設定:File → Export as MP3,選擇 128kbps(Spotify 最低要求 96kbps,128kbps 是品質和檔案大小的平衡點)。

Step 4:上架 Spotify + Apple Podcasts

Spotify for Creators(原 Spotify for Podcasters)提供完全免費的 podcast 託管,無儲存限制、無月費。

Spotify 上架流程

  1. 用 Spotify 帳號登入 Spotify for Creators
  2. 建立新節目,填寫節目名稱、分類、描述
  3. 上傳封面圖(規格:3000x3000px,JPG 或 PNG。免費製作:用 Canva 的 podcast 封面模板)
  4. 上傳第一集音頻,填寫單集標題和說明
  5. 提交審核(通常 1-3 個工作天)

同步上架 Apple Podcasts

Spotify for Creators 會為你的節目生成 RSS feed(在 Settings → Availability 中取得)。拿到 RSS feed 後:

  1. 前往 Apple Podcasts Connect,用 Apple ID 登入
  2. 點選「新增節目」,貼上 RSS feed URL
  3. 提交審核(通常 3-5 個工作天,之後每集更新會在 24 小時內自動同步)

Apple Podcasts 上架同樣完全免費。兩個平台合計覆蓋了全球絕大多數的 podcast 聽眾。

💡 提示:如果你在台灣,也可以考慮 SoundOn 作為託管平台。它是台灣本地服務,免費無上傳限制,且支援自動分發到 Spotify、Apple Podcasts 等多個平台,省去手動提交 RSS 的步驟。

注意:Spotify for Creators 的廣告分潤採創作者與 Spotify 五五分潤模式。但對剛起步的創作者來說,免費託管和曝光機會遠比分潤條件重要。

品質把關 Checklist:避免淪為 AI Slop

AI slop 不是技術問題,是態度問題。當市場上已經有公司每週量產 3,000 集 AI podcast 時,你花 30 分鐘做的品質把關,就是區分你和那些量產內容的關鍵。

發布前 10 項必檢清單

內容層面

  • 至少完整聽過一遍音頻,標記所有不自然的斷句或停頓
  • 所有數據和事實陳述都有可驗證的來源
  • 內容包含真實觀點或第一手經驗,不是純資訊轉述
  • AI 生成的人名、機構名、數字全部核實(AI 會自信地說出錯誤資訊)

技術層面

  • 音頻已做過音量標準化處理
  • 無明顯背景雜音或 AI 語音瑕疵(機械感重複、不自然停頓)
  • 開場 30 秒內有清楚的主題說明
  • 音頻時長在合理範圍(首集建議 8-15 分鐘)

合規層面

  • 節目描述中已標注「部分內容由 AI 輔助製作」
  • 使用的配樂素材已確認授權條款(CC0 或免版稅商用)

風險揭露與注意事項

法律風險

2026 年 1 月,前 NPR 主持人 David Greene 正式起訴 Google,指控 NotebookLM Audio Overview 的男性 AI 聲音複製了他的聲音特徵。AI 鑑識測試顯示 53-60% 的匹配信心度。Google 回應稱該聲音基於「付費專業演員」。案件仍在訴訟初期,但這已經為 AI 語音的版權問題畫出了一條清晰的警戒線。

對個人創作者的啟示:不要用 AI 工具模仿任何真實人物的聲音。使用平台預設音色是最安全的做法。

音樂授權也需要注意。即使是「免費」平台的素材,部分仍有商業使用限制。下載前逐一確認授權條款(看清楚是 CC0、CC-BY 還是僅限非商業用途)。

倫理風險

透明度是底線。如果你的 podcast 使用了 AI 生成的語音或腳本,在節目描述中註明。不標注 AI 參與等於對聽眾隱瞞,長期來看會損害信任。

AI slop 對整個 podcast 生態的傷害是真實的。每一集認真製作的 AI 輔助 podcast 都在證明 AI 是工具而非捷徑,這對整個創作者社群都有正面意義。

品質風險

AI 語音的已知缺陷:中文四聲偶爾混淆、專業術語唸法錯誤、句子間的停頓節奏不夠自然。這些問題目前沒有完美解法,只能靠後製修正和多次測試。

最大的隱藏風險是 hallucination。AI 在生成腳本時可能插入不準確的數字或虛構的引述,而且「錯得很有自信」。所有 AI 生成的事實性內容,發布前必須人工核實。

聽眾信任

Podcast 的核心吸引力之一是聽眾與主持人之間的「人際連結感」。純 AI 生成的內容在這方面天生弱勢。長期策略是把 AI 當成提高效率的工具,但個人觀點、真實經驗、獨特視角才是讓聽眾持續收聽的理由。

FAQ

Q:NotebookLM 的中文語音品質實際上如何?適合正式發布嗎?

2025 年 12 月中旬升級 Gemini 3 後,中文表現明顯進步,日常話題的對話聽起來已經相當自然。但專業術語和較長的複合句仍偶有不自然斷句。如果你的主題不涉及大量專業用語,品質足以正式發布。建議先生成一段測試,自己聽過再決定。

Q:ElevenLabs 免費版每月 10,000 字元夠用嗎?

一集 10 分鐘的 podcast 腳本約 1,500 字。如果是雙人對話分別生成,約需 3,000 字元。所以每月大約可以做 3 集。如果需要更大額度,TTSMaker 每週提供 20,000 字元且可商用。

Q:Spotify for Creators 完全免費嗎?上架後怎麼賺錢?

託管和上架完全免費,無月費、無儲存限制。賺錢的方式主要是透過 Spotify 的廣告分潤計畫,但採五五分潤(創作者拿 50%)。對新手來說,先專注在做出好內容,等累積一定聽眾後再考慮變現。

Q:我需要在 podcast 中標注「AI 生成」嗎?

目前多數國家沒有法律強制要求,但各大平台正在收緊規範。Spotify 的內容政策要求對 AI 生成內容保持透明。從信任角度,主動標注「部分內容由 AI 輔助製作」是最安全的做法,也是對聽眾的尊重。

Q:如果想從 AI 輔助升級到真人錄音,最低成本的設備是什麼?

入門級 USB 麥克風(如 Samson Q2U,約 $70 美元;Audio-Technica ATR2100x 約 $79,但已逐漸停產,可改考慮 Audio-Technica ATR2005USB)加上免費的 Audacity,總成本約 $70-80 美元。這個組合已經能產出比 AI 語音更自然的錄音品質,而且你在 AI 輔助階段學到的腳本撰寫和音頻編輯技巧可以直接沿用。

結論

免費 AI 工具鏈已經讓「零器材做 podcast」從口號變成可執行的工作流。NotebookLM 每日 3 則的免費額度,足夠你今天就完成第一集的音頻草稿。

但工具只是起點。在 AI slop 充斥市場的當下,品質把關才是真正的護城河。花時間核實事實、修剪音頻瑕疵、主動標注 AI 參與,這些「慢功夫」恰好是量產內容做不到的事。

現在就打開 NotebookLM,把你最近想分享的一個主題丟進去,生成你的第一段音頻。不用完美,先讓自己聽到「自己的 podcast」是什麼感覺。第一集永遠是最難的,但有了 AI 工具,它不再需要是最貴的。

訂閱 The Shareuhack Brief

如果你喜歡這篇文章,每週還會收到類似的實測筆記與結構觀察。

僅分享高價值內容,絕無促銷。隨時可取消。

Loading Knowledge Graph...

探索更多
AI 與科技

追蹤最前沿的 AI 工具與自動化工作流,用軟體賦能生活與事業。

金錢與理財

精通金融工具與 Web3 生態,實現財務掌控權與全球商業視野。

旅行與生活

數位遊民、飯店點數攻略與生活質感計畫,探索高效生活的無限可能。

生產力與職場

流程自動化與高效協作心法,用最少的心力達成極致的產出。

學習與成長

掌握底層邏輯,建立個人化知識體系,打造無可取代的職場護城河。

Copyright @ Shareuhack 2026. All Rights Reserved.

About Us | Privacy Policy | Terms and Conditions