完全不會設計，真的能做出一本繪本嗎？

可以。本文介紹的工具都是拖曳式介面，Canva 有現成繪本模板，ChatGPT 負責文字，Leonardo AI 負責圖片，不需要任何設計或繪圖基礎。我實測從零開始，第一次完成一本 10 頁繪本大約花了 2 小時（包含試錯時間）。

一本繪本大概要花多少時間？

走快速路線用 Gemini Storybook 約 10 分鐘。走完整路線（ChatGPT + Leonardo AI + TTSMaker + Canva）第一次大約 2-3 小時，熟練後可以壓到 1 小時以內。最花時間的是插圖：每頁圖片可能要重生成 2-3 次才能接受，10 頁算下來就是 20-30 次操作。

可以拿去印刷嗎？推薦哪些服務？

技術上可以。Canva 免費版可以匯出標準 PDF，大部分印刷行都接受。台灣常見選擇是博客來文創印刷或各地快印店，印 10 頁彩色繪本成本約 200-500 元。需注意：AI 生成圖片的商業印刷版權仍有爭議，自用或送禮問題不大，但請勿拿去公開販售。

AI 生成的繪本可以拿去賣嗎？

目前不建議。AI 生成圖片的版權在各地法律仍有爭議，美國版權局已明確表示純 AI 生成的圖片不受版權保護，但若混合人工修改則可能另論。拿去商業販售風險高，自用或個人送禮則無此顧慮。

有沒有適合更小小孩（0-2 歲）的簡化版做法？

有。0-2 歲繪本需求是高對比色彩、極簡文字、大圖片。用 Gemini Storybook 直接生成、或在 ChatGPT 寫故事時指定『每頁只有 1 句話』，Leonardo AI 選擇飽和色彩的扁平插畫風格，即可做出適合小寶寶的版本。Canva 也有專門的嬰兒故事書模板可用。

用免費 AI 工具製作個人化有聲繪本：零基礎家長的完整教學

想像一本繪本，主角的名字是你的孩子，故事場景是他最喜歡的地方，配音是溫柔的中文女聲，把他每天睡前的想像世界具體印成書頁。過去這需要找插畫師、配音員、設計師，花費數萬元、等上幾個月。現在呢？我用完全免費的 AI 工具，用一個下午做完了。

這篇文章是我實際走過完整流程後整理的教學。從故事撰寫、AI 插圖生成（附解決角色一致性的實用技巧）、中文語音朗讀，到最後用 Canva 排版匯出成 PDF——每個工具我都試過，把免費額度算清楚了，讓你不用重蹈我踩的坑。

TL;DR

快速路線：用 Gemini Storybook，10 分鐘生成一本通常 10-12 頁的繪本（家長操作，給孩子看）
完整路線：ChatGPT 寫故事 → Leonardo AI 生成插圖 → TTSMaker 加中文語音 → Canva 排版匯出
一本 10 頁繪本的免費額度消耗：Leonardo AI（約 80 tokens）、TTSMaker（約 700 字元）、Canva（免費版即可）——完全零成本可行
最大坑：角色一致性，本文有解法；ElevenLabs 免費版只有 1 萬字元（不是 2 萬）
不要做的事：拿 AI 繪本去商業販售，版權風險很高

為什麼現在是自製 AI 繪本的最佳時機

有聲書市場這幾年成長速度驚人。根據 Publishers Weekly 的數據，2024 年美國有聲書銷售額年增 13%，達到 22 億美元，其中兒童與 YA 類別年增約 26%，是所有類別成長最快的。家長對個人化、互動式兒童內容的需求，遠超出傳統出版業的供給速度。

問題是：市面上那些「AI 兒童書」有不少粗製濫造的產品，讓家長對 AI 繪本的品質印象很差。Family Education 曾報導過，Amazon 上出現大量人物解剖錯誤、敘事邏輯混亂的 AI 兒童書，甚至有作者完全沒有親子閱讀經驗就批量生產。

但這恰好說明：自己做的個人化 AI 繪本，品質可以比市售 AI 書好得多——因為你知道你的孩子喜歡什麼，你會去檢查每一頁圖片，你不會接受六根手指的角色。工具的品質也在快速進步，免費方案已經夠用了。

現在進場，時機剛剛好。

兩條路線：快速版 vs 完整版

根據你的時間和對品質的要求，有兩條路可以走。我建議先讀完再選，不然你會花 2 小時做完才發現快速版其實夠用。

快速路線：Gemini Storybook（10 分鐘）

Google 的 Gemini 內建了一個叫 Storybook 的功能，輸入主題就能自動產出 10 頁圖文並茂的繪本，有語音朗讀（部分語言），可以分享連結或下載。

適合情境：想快速體驗、孩子還小覺得「有個故事就好」、送給孩子的當下禮物

限制：

僅供 18 歲以上帳號使用（由家長操作，不是讓孩子自己玩的工具）
通常 10-12 頁，格式固定，無法大幅自訂
故事主角不能直接帶入孩子的名字和個人特徵（需靠 prompt 引導）
中文語音朗讀支援程度待確認

流程：進入 Gemini → 找 Storybook 功能 → 輸入故事主題（例如「一個叫小明的男孩和他的恐龍朋友」）→ 等待生成 → 完成。

完整路線：四工具串接（1-3 小時）

完全控制每個細節，孩子的名字、外貌特徵、故事走向、配音風格，全部你說了算。

環節	工具	免費額度
故事撰寫	ChatGPT 免費版	無限制
插圖生成	Leonardo AI	每日 150 tokens（約 18-30 張）
中文語音	TTSMaker	每週 20,000 字元（商用免費授權）
排版匯出	Canva 免費版	完整功能，PDF 匯出

適合情境：想要高度個人化、準備做成實體書、孩子有強烈的「特定角色偏好」

決策建議：如果你從來沒用過 AI 工具，先試快速版感受一下。滿意度不夠、或想要「主角就是我家孩子」的高度個人化，再走完整版。

Step 1：用 ChatGPT 寫個人化故事腳本

這一步是整個流程的地基。故事腳本寫得好，後面每一步都省力。

Prompt 模板

打開 ChatGPT（免費版 GPT-4o），貼入以下 prompt 並替換括號內的內容：

請幫我寫一本適合 [年齡] 歲孩子的 10 頁繪本故事。

主角設定：
- 名字：[孩子的名字]
- 外貌：[簡單描述，例如「短頭髮、戴眼鏡的男孩」]
- 最喜歡的東西：[例如恐龍、太空、動物]

故事主題：[例如「主角在森林裡遇到一隻迷路的小恐龍，兩人一起找到回家的路」]

格式要求：
1. 共 10 頁，每頁 2-3 句話，句子簡單易懂
2. 每頁故事之後，請附上該頁的「插圖生成 prompt」（英文），描述圖片場景、角色動作、畫面構圖
3. 插圖 prompt 中每次都要包含角色固定描述：[例如「a boy named Xiao Ming, short hair, wearing round glasses, red shirt」]
4. 故事要有清楚的開頭（認識主角）、中段（遇到問題）、結尾（解決問題，溫馨結局）

為什麼要讓 ChatGPT 同時寫「插圖 prompt」？

這是讓整個流程順的關鍵。如果你後面才去想「這頁圖要怎麼生成」，每頁都要重新描述角色，容易漏掉細節導致角色不一致。讓 ChatGPT 直接幫你把每頁的圖片 prompt 準備好，你複製貼上就行了。

範例輸出（第 1 頁）

【第 1 頁故事】
小明是個愛看星星的 5 歲男孩。每天晚上，他都會爬上屋頂，數天上有幾顆星星。今晚，他發現有一顆星星在眨眼睛。

【第 1 頁插圖 prompt】
A boy named Xiao Ming, short black hair, wearing round glasses and a blue pajama with stars pattern, sitting on a rooftop at night, looking up at the sky full of stars, one star is glowing brighter than others, watercolor illustration style, soft colors, child-friendly, simple background

Step 2：用免費 AI 生成繪本插圖（含角色一致性攻略）

這是整個流程最容易卡住的一步。AI 生成插圖最大的問題是「角色一致性崩壞」——第 1 頁的小明有眼鏡，到第 5 頁眼鏡消失了；第 3 頁的角色突然變胖了。10 頁繪本裡角色外貌漂移，完全破壞敘事感。

工具選擇

工具	免費額度	風格控制	角色一致性	建議場景
Leonardo AI	每日 150 tokens（約 18-30 張）	高	中（有 Character Reference 功能）	完整版首選
Microsoft Designer	每月 15 Credits + 標準速度無限	中	低	快速出圖備用
ChatGPT DALL-E	約 2-3 張/日（24 小時滾動重置）	中	低	已在用 ChatGPT 時嘗試

對完整版路線，我推薦從 Leonardo AI 開始。每日 150 tokens，一張圖約消耗 5-8 tokens，一本 10 頁繪本（每頁 1 張主圖）約消耗 50-80 tokens，兩天以內可以免費生完一整本書。

角色一致性三招

這是整篇文章最有價值的部分，其他教學幾乎都跳過這個問題。

招式 1：固定角色描述 prompt（必做）

在 ChatGPT 幫你產出的每頁插圖 prompt 裡，確保角色描述一字不差地出現。建議建立一個固定的「角色標籤」文字，每次貼上：

[角色標籤] = "a 5-year-old boy, short straight black hair, round blue glasses, blue star-pattern pajamas, chubby cheeks, friendly smile"

每頁插圖 prompt 開頭都帶入這段描述，不要省略、不要改寫。

招式 2：選擇高度風格化的插畫風格（強烈推薦）

寫實風格的 AI 圖，角色一致性問題最嚴重。扁平插畫風（flat illustration）或水彩風（watercolor） 反而更容易一致，因為這些風格本身就允許角色特徵稍有誤差而不顯突兀。

在 prompt 結尾加上：flat vector illustration style, children's book, soft pastel colors, consistent character design

招式 3：Leonardo AI 的 Character Reference 功能（進階）

如果你在 Leonardo AI 生成了一張你最滿意的角色圖，可以把它上傳到「Character Reference」功能，後續生成圖片時勾選這個參考圖，AI 會嘗試維持相同的角色外觀。

這個功能不是 100% 完美，但根據我的實測估計，能把一致性從 60% 提升到 80% 以上。

常見問題快速處理

六指/多餘肢體：在 prompt 加入 correct anatomy, normal human hands, no extra fingers，並且在 Leonardo AI 的 Negative Prompt 欄位加入 extra fingers, deformed hands, bad anatomy
背景風格不統一：每頁都指定相同的背景描述，例如 simple white background 或 soft green meadow background
角色比例突變：在 prompt 加入 full body shot, consistent proportions，避免有些頁面特寫、有些頁面全身

Step 3：加入中文語音朗讀

一本有聲繪本和普通繪本的差距，就是這一步。

先算清楚你需要多少字元。10 頁繪本，每頁約 50-80 字，總共約 500-800 字元。幾乎所有免費 TTS 工具都遠超這個需求，不用擔心額度問題。

工具選擇

工具	免費額度	中文語音品質	商用授權	建議場景
TTSMaker	每週 20,000 字元	良好	免費商用 ✅	完整版首選
ElevenLabs	每月 10,000 字元	優秀	免費版不可商用 ❌	品質要求極高時
Google TTS（試作）	視瀏覽器	中等	—	快速測試

注意：ElevenLabs 免費版的月額度是 10,000 字元，不是部分網路文章寫的 20,000。我查過官方定價頁確認。對一本 10 頁繪本夠用，但若要製作多本，TTSMaker 的每週 20,000 字元更寬裕，且明確提供商業使用授權。

TTSMaker 操作流程

進入 ttsmaker.com
語言選「中文（台灣）」，選擇一個語音角色（建議試聽幾個，找溫柔、語速稍慢的女聲）
貼入第 1 頁的故事文字
點擊「Convert to Speech」，等待幾秒
下載 MP3 檔案，命名為 page-01.mp3
重複 10 頁

整個過程約 15-20 分鐘。

Step 4：用 Canva 排版成完整有聲繪本

現在你手上有：10 頁故事文字、10 張插圖、10 個 MP3 音檔。最後一步是把它們組裝成一本繪本。

Canva 免費版完全夠用。它有現成的繪本/故事書模板，支援自訂尺寸，可以匯出標準 PDF（列印用）。

基本排版流程

進入 Canva，搜尋「兒童故事書」或「Children's Book」模板
選一個你喜歡的版型（通常是橫向 A4，圖左文右或圖上文下）
每頁：插入對應的 AI 插圖 → 貼入故事文字 → 調整字型大小（建議至少 24pt，確保孩子看得清楚）
確認所有頁面風格一致（背景色、字型、邊距）
匯出：PDF 標準（列印用）或 PNG 系列（數位分享用）

關於「有聲」的結合

PDF 格式本身不支援音訊播放，這是格式限制，跟 Canva 版本無關（Free 和 Pro 都一樣）。但這有個免費替代方案：

用 Google Slides 替代 Canva：可以在每張投影片插入音訊，設定自動播放。需注意現代瀏覽器通常會封鎖自動播放，實際使用時需要先點一次投影片才能解鎖音訊。
或者：把繪本 PDF 和 MP3 音檔一起壓縮成 ZIP 包給孩子——閱讀時點播音檔，一樣有有聲效果

如果你只是想自己或家人欣賞，用平板開著 PDF 同時播 MP3 其實完全夠用。

風險揭露：做之前要知道的事

版權風險（重要）

AI 生成圖片的版權在各地法律仍有爭議。美國版權局的立場是純 AI 生成的圖片不受著作權保護。這意味著：你無法主張這些圖片的版權，別人也無法主張。

自己做給孩子看、列印出來送禮：風險很低，沒有商業行為的個人使用幾乎無問題。

拿去商業販售（例如在 Amazon KDP 上架、在市集販售）：風險很高，強烈不建議。不只是版權問題，你使用的 AI 工具的服務條款也可能有對商業用途的限制。

內容適當性（每張圖都要人工確認）

AI 有時會生成讓人意外的東西。解剖錯誤（多餘手指、扭曲四肢）最常見，偶爾也可能出現不適合兒童的元素。

規則：每一張插圖都要你親眼確認後才放進繪本，不要因為趕時間而跳過。孩子對視覺刺激非常敏感，一張奇怪的圖可能讓孩子不喜歡這本書。

免費額度隨時可能變動

本文的工具資訊以 2026 年 2 月為準。AI 工具的定價策略變化非常快，建議使用前到官方定價頁再確認一次。特別是 ElevenLabs 的免費額度歷史上就調整過幾次。

隱私考量

不要上傳孩子的真實照片到任何 AI 圖片生成工具，特別是那些使用你上傳的圖片進行模型訓練的服務。改用文字描述孩子的外貌特徵來生成角色，不涉及隱私風險。

結論：今晚就開始你的第一本

AI 繪本工具鏈的完整流程，核心其實只有四件事：ChatGPT 寫故事腳本、Leonardo AI 生成插圖、TTSMaker 配中文語音、Canva 排版匯出。如果你從來沒試過，最低門檻的起點是 Gemini Storybook，10 分鐘，輸入主題，出一本書，感受一下「原來這真的做得到」。

不需要等到技術完美再開始。我第一本的角色在第 7 頁還是歪了，但我孩子不在意——他在意的是故事裡的主角跟他同名，那個故事是他的。

那個感覺，值得你花這個下午。