用免費 AI 工具製作個人化有聲繪本:零基礎家長的完整教學
想像一本繪本,主角的名字是你的孩子,故事場景是他最喜歡的地方,配音是溫柔的中文女聲,把他每天睡前的想像世界具體印成書頁。過去這需要找插畫師、配音員、設計師,花費數萬元、等上幾個月。現在呢?我用完全免費的 AI 工具,用一個下午做完了。
這篇文章是我實際走過完整流程後整理的教學。從故事撰寫、AI 插圖生成(附解決角色一致性的實用技巧)、中文語音朗讀,到最後用 Canva 排版匯出成 PDF——每個工具我都試過,把免費額度算清楚了,讓你不用重蹈我踩的坑。
TL;DR
- 快速路線:用 Gemini Storybook,10 分鐘生成一本通常 10-12 頁的繪本(家長操作,給孩子看)
- 完整路線:ChatGPT 寫故事 → Leonardo AI 生成插圖 → TTSMaker 加中文語音 → Canva 排版匯出
- 一本 10 頁繪本的免費額度消耗:Leonardo AI(約 80 tokens)、TTSMaker(約 700 字元)、Canva(免費版即可)——完全零成本可行
- 最大坑:角色一致性,本文有解法;ElevenLabs 免費版只有 1 萬字元(不是 2 萬)
- 不要做的事:拿 AI 繪本去商業販售,版權風險很高
為什麼現在是自製 AI 繪本的最佳時機
有聲書市場這幾年成長速度驚人。根據 Publishers Weekly 的數據,2024 年美國有聲書銷售額年增 13%,達到 22 億美元,其中兒童與 YA 類別年增約 26%,是所有類別成長最快的。家長對個人化、互動式兒童內容的需求,遠超出傳統出版業的供給速度。
問題是:市面上那些「AI 兒童書」有不少粗製濫造的產品,讓家長對 AI 繪本的品質印象很差。Family Education 曾報導過,Amazon 上出現大量人物解剖錯誤、敘事邏輯混亂的 AI 兒童書,甚至有作者完全沒有親子閱讀經驗就批量生產。
但這恰好說明:自己做的個人化 AI 繪本,品質可以比市售 AI 書好得多——因為你知道你的孩子喜歡什麼,你會去檢查每一頁圖片,你不會接受六根手指的角色。工具的品質也在快速進步,免費方案已經夠用了。
現在進場,時機剛剛好。
兩條路線:快速版 vs 完整版
根據你的時間和對品質的要求,有兩條路可以走。我建議先讀完再選,不然你會花 2 小時做完才發現快速版其實夠用。
快速路線:Gemini Storybook(10 分鐘)
Google 的 Gemini 內建了一個叫 Storybook 的功能,輸入主題就能自動產出 10 頁圖文並茂的繪本,有語音朗讀(部分語言),可以分享連結或下載。
適合情境:想快速體驗、孩子還小覺得「有個故事就好」、送給孩子的當下禮物
限制:
- 僅供 18 歲以上帳號使用(由家長操作,不是讓孩子自己玩的工具)
- 通常 10-12 頁,格式固定,無法大幅自訂
- 故事主角不能直接帶入孩子的名字和個人特徵(需靠 prompt 引導)
- 中文語音朗讀支援程度待確認
流程:進入 Gemini → 找 Storybook 功能 → 輸入故事主題(例如「一個叫小明的男孩和他的恐龍朋友」)→ 等待生成 → 完成。
完整路線:四工具串接(1-3 小時)
完全控制每個細節,孩子的名字、外貌特徵、故事走向、配音風格,全部你說了算。
| 環節 | 工具 | 免費額度 |
|---|---|---|
| 故事撰寫 | ChatGPT 免費版 | 無限制 |
| 插圖生成 | Leonardo AI | 每日 150 tokens(約 18-30 張) |
| 中文語音 | TTSMaker | 每週 20,000 字元(商用免費授權) |
| 排版匯出 | Canva 免費版 | 完整功能,PDF 匯出 |
適合情境:想要高度個人化、準備做成實體書、孩子有強烈的「特定角色偏好」
決策建議:如果你從來沒用過 AI 工具,先試快速版感受一下。滿意度不夠、或想要「主角就是我家孩子」的高度個人化,再走完整版。
Step 1:用 ChatGPT 寫個人化故事腳本
這一步是整個流程的地基。故事腳本寫得好,後面每一步都省力。
Prompt 模板
打開 ChatGPT(免費版 GPT-4o),貼入以下 prompt 並替換括號內的內容:
請幫我寫一本適合 [年齡] 歲孩子的 10 頁繪本故事。
主角設定:
- 名字:[孩子的名字]
- 外貌:[簡單描述,例如「短頭髮、戴眼鏡的男孩」]
- 最喜歡的東西:[例如恐龍、太空、動物]
故事主題:[例如「主角在森林裡遇到一隻迷路的小恐龍,兩人一起找到回家的路」]
格式要求:
1. 共 10 頁,每頁 2-3 句話,句子簡單易懂
2. 每頁故事之後,請附上該頁的「插圖生成 prompt」(英文),描述圖片場景、角色動作、畫面構圖
3. 插圖 prompt 中每次都要包含角色固定描述:[例如「a boy named Xiao Ming, short hair, wearing round glasses, red shirt」]
4. 故事要有清楚的開頭(認識主角)、中段(遇到問題)、結尾(解決問題,溫馨結局)
為什麼要讓 ChatGPT 同時寫「插圖 prompt」?
這是讓整個流程順的關鍵。如果你後面才去想「這頁圖要怎麼生成」,每頁都要重新描述角色,容易漏掉細節導致角色不一致。讓 ChatGPT 直接幫你把每頁的圖片 prompt 準備好,你複製貼上就行了。
範例輸出(第 1 頁)
【第 1 頁故事】
小明是個愛看星星的 5 歲男孩。每天晚上,他都會爬上屋頂,數天上有幾顆星星。今晚,他發現有一顆星星在眨眼睛。
【第 1 頁插圖 prompt】
A boy named Xiao Ming, short black hair, wearing round glasses and a blue pajama with stars pattern, sitting on a rooftop at night, looking up at the sky full of stars, one star is glowing brighter than others, watercolor illustration style, soft colors, child-friendly, simple background
Step 2:用免費 AI 生成繪本插圖(含角色一致性攻略)
這是整個流程最容易卡住的一步。AI 生成插圖最大的問題是「角色一致性崩壞」——第 1 頁的小明有眼鏡,到第 5 頁眼鏡消失了;第 3 頁的角色突然變胖了。10 頁繪本裡角色外貌漂移,完全破壞敘事感。
工具選擇
| 工具 | 免費額度 | 風格控制 | 角色一致性 | 建議場景 |
|---|---|---|---|---|
| Leonardo AI | 每日 150 tokens(約 18-30 張) | 高 | 中(有 Character Reference 功能) | 完整版首選 |
| Microsoft Designer | 每月 15 Credits + 標準速度無限 | 中 | 低 | 快速出圖備用 |
| ChatGPT DALL-E | 約 2-3 張/日(24 小時滾動重置) | 中 | 低 | 已在用 ChatGPT 時嘗試 |
對完整版路線,我推薦從 Leonardo AI 開始。每日 150 tokens,一張圖約消耗 5-8 tokens,一本 10 頁繪本(每頁 1 張主圖)約消耗 50-80 tokens,兩天以內可以免費生完一整本書。
角色一致性三招
這是整篇文章最有價值的部分,其他教學幾乎都跳過這個問題。
招式 1:固定角色描述 prompt(必做)
在 ChatGPT 幫你產出的每頁插圖 prompt 裡,確保角色描述一字不差地出現。建議建立一個固定的「角色標籤」文字,每次貼上:
[角色標籤] = "a 5-year-old boy, short straight black hair, round blue glasses, blue star-pattern pajamas, chubby cheeks, friendly smile"
每頁插圖 prompt 開頭都帶入這段描述,不要省略、不要改寫。
招式 2:選擇高度風格化的插畫風格(強烈推薦)
寫實風格的 AI 圖,角色一致性問題最嚴重。扁平插畫風(flat illustration)或水彩風(watercolor) 反而更容易一致,因為這些風格本身就允許角色特徵稍有誤差而不顯突兀。
在 prompt 結尾加上:flat vector illustration style, children's book, soft pastel colors, consistent character design
招式 3:Leonardo AI 的 Character Reference 功能(進階)
如果你在 Leonardo AI 生成了一張你最滿意的角色圖,可以把它上傳到「Character Reference」功能,後續生成圖片時勾選這個參考圖,AI 會嘗試維持相同的角色外觀。
這個功能不是 100% 完美,但根據我的實測估計,能把一致性從 60% 提升到 80% 以上。
常見問題快速處理
- 六指/多餘肢體:在 prompt 加入
correct anatomy, normal human hands, no extra fingers,並且在 Leonardo AI 的 Negative Prompt 欄位加入extra fingers, deformed hands, bad anatomy - 背景風格不統一:每頁都指定相同的背景描述,例如
simple white background或soft green meadow background - 角色比例突變:在 prompt 加入
full body shot, consistent proportions,避免有些頁面特寫、有些頁面全身
Step 3:加入中文語音朗讀
一本有聲繪本和普通繪本的差距,就是這一步。
先算清楚你需要多少字元。10 頁繪本,每頁約 50-80 字,總共約 500-800 字元。幾乎所有免費 TTS 工具都遠超這個需求,不用擔心額度問題。
工具選擇
| 工具 | 免費額度 | 中文語音品質 | 商用授權 | 建議場景 |
|---|---|---|---|---|
| TTSMaker | 每週 20,000 字元 | 良好 | 免費商用 ✅ | 完整版首選 |
| ElevenLabs | 每月 10,000 字元 | 優秀 | 免費版不可商用 ❌ | 品質要求極高時 |
| Google TTS(試作) | 視瀏覽器 | 中等 | — | 快速測試 |
注意:ElevenLabs 免費版的月額度是 10,000 字元,不是部分網路文章寫的 20,000。我查過官方定價頁確認。對一本 10 頁繪本夠用,但若要製作多本,TTSMaker 的每週 20,000 字元更寬裕,且明確提供商業使用授權。
TTSMaker 操作流程
- 進入 ttsmaker.com
- 語言選「中文(台灣)」,選擇一個語音角色(建議試聽幾個,找溫柔、語速稍慢的女聲)
- 貼入第 1 頁的故事文字
- 點擊「Convert to Speech」,等待幾秒
- 下載 MP3 檔案,命名為
page-01.mp3 - 重複 10 頁
整個過程約 15-20 分鐘。
Step 4:用 Canva 排版成完整有聲繪本
現在你手上有:10 頁故事文字、10 張插圖、10 個 MP3 音檔。最後一步是把它們組裝成一本繪本。
Canva 免費版完全夠用。它有現成的繪本/故事書模板,支援自訂尺寸,可以匯出標準 PDF(列印用)。
基本排版流程
- 進入 Canva,搜尋「兒童故事書」或「Children's Book」模板
- 選一個你喜歡的版型(通常是橫向 A4,圖左文右或圖上文下)
- 每頁:插入對應的 AI 插圖 → 貼入故事文字 → 調整字型大小(建議至少 24pt,確保孩子看得清楚)
- 確認所有頁面風格一致(背景色、字型、邊距)
- 匯出:PDF 標準(列印用)或 PNG 系列(數位分享用)
關於「有聲」的結合
PDF 格式本身不支援音訊播放,這是格式限制,跟 Canva 版本無關(Free 和 Pro 都一樣)。但這有個免費替代方案:
- 用 Google Slides 替代 Canva:可以在每張投影片插入音訊,設定自動播放。需注意現代瀏覽器通常會封鎖自動播放,實際使用時需要先點一次投影片才能解鎖音訊。
- 或者:把繪本 PDF 和 MP3 音檔一起壓縮成 ZIP 包給孩子——閱讀時點播音檔,一樣有有聲效果
如果你只是想自己或家人欣賞,用平板開著 PDF 同時播 MP3 其實完全夠用。
風險揭露:做之前要知道的事
版權風險(重要)
AI 生成圖片的版權在各地法律仍有爭議。美國版權局的立場是純 AI 生成的圖片不受著作權保護。這意味著:你無法主張這些圖片的版權,別人也無法主張。
自己做給孩子看、列印出來送禮:風險很低,沒有商業行為的個人使用幾乎無問題。
拿去商業販售(例如在 Amazon KDP 上架、在市集販售):風險很高,強烈不建議。不只是版權問題,你使用的 AI 工具的服務條款也可能有對商業用途的限制。
內容適當性(每張圖都要人工確認)
AI 有時會生成讓人意外的東西。解剖錯誤(多餘手指、扭曲四肢)最常見,偶爾也可能出現不適合兒童的元素。
規則:每一張插圖都要你親眼確認後才放進繪本,不要因為趕時間而跳過。孩子對視覺刺激非常敏感,一張奇怪的圖可能讓孩子不喜歡這本書。
免費額度隨時可能變動
本文的工具資訊以 2026 年 2 月為準。AI 工具的定價策略變化非常快,建議使用前到官方定價頁再確認一次。特別是 ElevenLabs 的免費額度歷史上就調整過幾次。
隱私考量
不要上傳孩子的真實照片到任何 AI 圖片生成工具,特別是那些使用你上傳的圖片進行模型訓練的服務。改用文字描述孩子的外貌特徵來生成角色,不涉及隱私風險。
常見問題
Q:完全不會設計,真的能做出一本繪本嗎?
可以。本文介紹的工具都是拖曳式介面,Canva 有現成繪本模板,ChatGPT 負責文字,Leonardo AI 負責圖片,不需要任何設計或繪圖基礎。我實測從零開始,第一次完成一本 10 頁繪本大約花了 2 小時(包含試錯時間)。
Q:一本繪本大概要花多少時間?
走快速路線用 Gemini Storybook 約 10 分鐘。走完整路線第一次大約 2-3 小時,熟練後可以壓到 1 小時以內。最花時間的是插圖:每頁圖片可能要重生成 2-3 次才能接受,10 頁算下來就是 20-30 次操作。
Q:可以拿去印刷嗎?推薦哪些服務?
技術上可以。Canva 免費版可以匯出標準 PDF,大部分印刷行都接受。台灣常見選擇有博客來文創印刷、各地的快印店,印 10 頁彩色繪本成本約 200-500 元(視紙張和尺寸而定)。需注意:AI 生成圖片的版權爭議,自用或私下送禮問題不大,但不建議拿去公開販售。
Q:AI 生成的繪本可以拿去賣嗎?
目前強烈不建議。AI 生成圖片的版權在各地法律仍有爭議,商業販售風險很高。自用或個人送禮則幾乎沒有問題。
Q:有沒有適合更小小孩(0-2 歲)的簡化版做法?
有。0-2 歲繪本的需求是:高對比色彩、極簡文字(每頁 1 句話或甚至只有圖片)、大畫面。在 ChatGPT 寫故事時指定「每頁只有 1 句話,句子極短」,Leonardo AI 選飽和色彩的扁平插畫風格,Canva 選字體最大的版型,就能做出適合小寶寶的版本。
結論:今晚就開始你的第一本
AI 繪本工具鏈的完整流程,核心其實只有四件事:ChatGPT 寫故事腳本、Leonardo AI 生成插圖、TTSMaker 配中文語音、Canva 排版匯出。如果你從來沒試過,最低門檻的起點是 Gemini Storybook,10 分鐘,輸入主題,出一本書,感受一下「原來這真的做得到」。
不需要等到技術完美再開始。我第一本的角色在第 7 頁還是歪了,但我孩子不在意——他在意的是故事裡的主角跟他同名,那個故事是他的。
那個感覺,值得你花這個下午。
訂閱 The Shareuhack Brief
如果你喜歡這篇文章,每週還會收到類似的實測筆記與結構觀察。
僅分享高價值內容。隨時可取消。