生成绘本故事
我们先分析下需求:
首先我们需要生成双语的,即英语,还有中文,另外很多宝妈宝爸在给宝宝朗读的时候。对于部分单词不知道怎么读,因此,我们还需要加上音标,就像小时候看的带有拼音的儿童故事书一样。
其次小孩子对于色彩绚丽的页面更感兴趣,特别是不满2周岁的宝宝。
最后,故事还需要配合上图画,我们可以让大模型生成故事的同时,还生成画面描述,以便利用画面描述来生成图片。
最终的prompt如下:
儿童英语绘本的故事。
要求:
1、故事描述连贯
2、包括英语,英语对应的音标,英语对应的中文翻译
3、包含对应画面描述每一个画面描述写具体一些,主体、细节、背景等都要包含,色彩鲜明符合 midjourney 的语法
我是用的是“深度思考(R1)”,最终输出结果如下:
以下是为您设计的儿童英语绘本故事《Luna's Magic Forest Adventure》,包含连贯情节、双语对照及详细画面描述:
---
### **Page 1: The Curious Fox**
**English:**
"Look! A glowing tree!"
**Phonetic:** /lʊk ə ˈɡloʊɪŋ triː/
**中文:** "看!一棵发光的树!"
**画面描述:**
一只橙红色的小狐狸露娜(Luna)站在深蓝色夜幕下的森林边缘,圆眼睛瞪大,前爪抬起指向画面右侧。背景中高耸的松树剪影泛着靛青色,中央一棵巨大的古树散发柔和的琥珀色光芒,树皮裂缝间流淌着金色光纹。地面铺满荧光蓝的蘑菇群,空中飘浮着蒲公英般的银色光点。画面色调以冷色为主,光树形成温暖视觉焦点。
---
### **Page 2: Friends Gather**
**English:**
"Let's find the magic!"
**Phonetic:** /lɛts faɪnd ðə ˈmædʒɪk/
**中文:** "我们一起寻找魔法吧!"
**画面描述:**
圆形构图中,露娜被朋友们围绕:左下方灰白垂耳兔踮脚嗅探光树,右后方蓬松尾巴的松鼠捧着橡果,上方枝头停着戴圆框眼镜的猫头鹰。所有动物仰头注视树冠,那里悬浮着水晶般的半透明花朵,花瓣呈现渐变的紫罗兰色。地面投射出细碎的金色光斑,背景虚化的蕨类植物呈现孔雀蓝。
---
### **Page 3: The Sick Tree**
**English:**
"Oh no! The leaves are falling!"
**Phonetic:** /oʊ noʊ ðə liːvz ɑːr ˈfɔːlɪŋ/
**中文:** "糟糕!树叶在凋落!"
**画面描述:**
俯视视角,动物们围成半圆仰望。翡翠绿的叶片边缘卷曲焦黄,如慢镜头般飘落,每片叶子在下坠过程中褪为灰褐色碎屑。树干中央显现暗红色裂痕,根部渗出粘稠的黑色液体。露娜前爪搭在树干上,耳朵沮丧地耷拉着,其他动物表情惊恐。背景密林笼罩在青灰色薄雾中。
---
### **Page 4: Moonlight Quest**
**English:**
"We need moonlight dew!"
**Phonetic:** /wi niːd ˈmuːnlaɪt duː/
**中文:** "我们需要月光露水!"
**画面描述:**
仰角镜头展现动物们攀登月光下的悬崖。露娜领头跃过花岗岩裂缝,尾巴因动态模糊呈现橙色光轨。后方松鼠紧抓兔子的长耳朵,猫头鹰用翅膀托着蜗牛。背景是靛紫色夜空中的巨型满月,银色月光在石英岩表面折射出彩虹光晕。悬崖缝隙间生长着发蓝光的铃兰。
---
### **Page 5: Healing the Tree**
**English:**
"Grow strong, magic tree!"
**Phonetic:** /ɡroʊ strɔːŋ ˈmædʒɪk triː/
**中文:** "快快恢复吧,魔法树!"
**画面描述:**
中心对称构图,露娜用尾巴卷着发光的水晶瓶向树根倾倒银蓝色液体。露珠接触地面的瞬间迸发星形光斑,黑色液体被净化成彩虹涟漪扩散。树干裂缝快速愈合,新生的嫩芽呈霓虹绿色螺旋生长。背景光晕呈现同心圆扩散,所有动物笼罩在柔和的粉金色光辉中。
---
### **Page 6: Forest Celebration**
**English:**
"Friends make magic real!"
**Phonetic:** /frɛndz meɪk ˈmædʒɪk riːl/
**中文:** "友谊让魔法成真!"
**画面描述:**
全景视角展现重生的魔法森林。光树现在高达天际,树冠展开如翡翠色烟花,每片叶子都是不同色调的蓝绿色。动物们在开满七彩花朵的草地上野餐,蝴蝶翅膀映射出万花筒图案。远处瀑布流淌着液态彩虹,极光般的绿色光带在粉紫色夜空中舞动。画面右下角露娜和朋友们叠罗汉比出胜利手势。
---
**Midjourney提示技巧:**
1. 使用色彩代码强化画面(如"#FF6B6B for fox fur")
2. 添加材质描述("iridescent scales", "velvety moss")
3. 标明光影效果("volumetric moonlight", "subsurface scattering")
4. 指定艺术风格("Studio Ghibli meets watercolor textures")
5. 用动态词增强画面感("swirling", "cascading", "pulsating")
这个设计通过重复出现的魔法光效(金色-琥珀色-银蓝-彩虹)构建视觉连续性,每页保持1-2个高饱和度焦点色,符合儿童绘本的认知规律与Midjourney的色彩渲染优势。
感觉画面感很强,给出的描述很给力,就是这个故事好像不是很连贯,下次再优化
生成图片
我的思路是先生成第一张图片,然后把第一张图片作为参考去生成后续几页的图片,以便整体能够保持一致的风格。
根据上面DeepSeek给出的提示技巧,构建了第一张图片的prompt
一只橙红色的小狐狸露娜(Luna)站在深蓝色夜幕下的森林边缘,圆眼睛瞪大,前爪抬起指向画面右侧。背景中高耸的松树剪影泛着靛青色,中央一棵巨大的古树散发柔和的琥珀色光芒,树皮裂缝间流淌着金色光纹。地面铺满荧光蓝的蘑菇群,空中飘浮着蒲公英般的银色光点。画面色调以冷色为主,光树形成温暖视觉焦点。
1. 使用色彩代码强化画面(如"#FF6B6B for fox fur")
2. 添加材质描述("iridescent scales", "velvety moss")
3. 标明光影效果("volumetric moonlight", "subsurface scattering")
4. 指定艺术风格("Studio Ghibli meets watercolor textures")
5. 用动态词增强画面感("swirling", "cascading", "pulsating")
我选择了4:3的大小,我打算用ipad给宝宝讲故事,这样的比例正好合适
最终选择了下面这张图片,这是和做封面

接着以这张图片作为参考,构建第二张图片的prompt
圆形构图中,露娜被朋友们围绕:左下方灰白垂耳兔踮脚嗅探光树,右后方蓬松尾巴的松鼠捧着橡果,上方枝头停着戴圆框眼镜的猫头鹰。所有动物仰头注视树冠,那里悬浮着水晶般的半透明花朵,花瓣呈现渐变的紫罗兰色。地面投射出细碎的金色光斑,背景虚化的蕨类植物呈现孔雀蓝。
1. 使用色彩代码强化画面(如"#FF6B6B for fox fur")
2. 添加材质描述("iridescent scales", "velvety moss")
3. 标明光影效果("volumetric moonlight", "subsurface scattering")
4. 指定艺术风格("Studio Ghibli meets watercolor textures")
5. 用动态词增强画面感("swirling", "cascading", "pulsating")
创作第二张图片的时候遇到了困难,若是没有上传参考图,则画面风格、角色不一致,若是上传了参考图,则不同的参考模式生成的效果各有问题。
没有参考图:

参考图(智能参考),这种模式下,画面基本上变化不大,需要好好去调整下“参考强度”这个参数,参考强度默认是50,我将之调整为5之后,还是没有多大变化,具体如下:


参考图(角色特征参考),我将相关的参数设置成100%,出来的效果也不理想,生成了多次,感觉角色不太一致:

至于其他的参考模式,要么不适合,要么无法识别

就此陷入困境,我尝试分析问题出在哪里:
- 画面太复杂了?
- 画面描述不连贯?
- 即梦本身能力太差?
- 画面中需要参考的对象太多,例如露娜、树、整体的背景,给即梦造成困难?
画面太复杂了?
我觉得这不是问题,即使我给的画面提示词很简单,AI生成的绘本也会有一些我提示词中不存在的元素的
画面描述不连贯?
从画面二的描述上看,确实存在这个问题:
圆形构图中,露娜被朋友们围绕:左下方灰白垂耳兔踮脚嗅探光树,右后方蓬松尾巴的松鼠捧着橡果,上方枝头停着戴圆框眼镜的猫头鹰。所有动物仰头注视树冠,那里悬浮着水晶般的半透明花朵,花瓣呈现渐变的紫罗兰色。地面投射出细碎的金色光斑,背景虚化的蕨类植物呈现孔雀蓝。
露娜是什么动物没有讲清楚,发光的树是怎样的没有描述,地面的蓝色蘑菇也没有了,虽然感觉可以使用‘智能参考’去解决,但是又回到了上面的问题,为什么即梦的智能参考对于画面没有什么改变?连松鼠等角色都没有增加。
对于“对于即梦本身能力太差?”、“画面中需要参考的对象太多,例如露娜、树、整体的背景,给即梦造成困难?”此类问题,我尝试换可灵等文生图应用再试试。结果可灵比即梦效果更差
总结来看即梦有如下几个问题:
1,参考图时,无法识别动物,只能是人,那么我可以先做人的
2,智能参考画面变动不大
3,多角色多物品的时候,无法把所有东西都保持一致
具体的改进方法,下一篇文章详聊,敬请期待