打工人打工魂。年底了,介绍一款 AI PPT 生成项目:banana slides。可借助AI显著降低我们的PPT制作门槛,让每个人都能快速创作出美观专业的演示文稿。希望能对各位有所帮助~
一份合格的PPT,是在特定场景下,能够高效、准确地完成信息传递与说服任务。它至少需要同时满足内容、结构、表达、视觉、交付五个层面的要素。作为职员,是让领导在最短时间内看清楚你做了什么、问题在哪里、以及你准备如何推进下一步。如果做投资汇报,则是在有限时间内清楚说明项目值不值得投、为什么现在投、以及投入后如何持续产生回报。
直接放几张作者的效果图。


项目介绍(摘自项目)
完整项目名:Anionex/banana-slides,可于GHUB搜索。
一个基于nano banana pro🍌的原生AI PPT生成应用,支持想法/大纲/页面描述生成完整PPT演示文稿,
自动提取附件图表、上传任意素材、口头提出修改,迈向真正的"Vibe PPT"。
适用场景:
- 小白:零门槛快速生成美观PPT,无需设计经验,减少模板选择烦恼
- PPT专业人士:参考AI生成的布局和图文元素组合,快速获取设计灵感
- 教育工作者:将教学内容快速转换为配图教案PPT,提升课堂效果
- 学生:快速完成作业Pre,把精力专注于内容而非排版美化
- 职场人士:商业提案、产品介绍快速可视化,多场景快速适配
功能介绍(摘自项目)
✅ 灵活多样的创作路径
支持想法、大纲、页面描述三种起步方式,满足不同创作习惯。
- 一句话生成:输入一个主题,AI 自动生成结构清晰的大纲和逐页内容描述。
- 自然语言编辑:支持以 Vibe 形式口头修改大纲或描述(如"把第三页改成案例分析"),AI 实时响应调整。
- 大纲/描述模式:既可一键批量生成,也可手动调整细节。
✅ 强大的素材解析能力
- 多格式支持:上传 PDF/Docx/MD/Txt 等文件,后台自动解析内容。
- 智能提取:自动识别文本中的关键点、图片链接和图表信息,为生成提供丰富素材。
- 风格参考:支持上传参考图片或模板,定制 PPT 风格。
✅ "Vibe" 式自然语言修改
不再受限于复杂的菜单按钮,直接通过自然语言下达修改指令。
- 局部重绘:对不满意的区域进行口头式修改(如"把这个图换成饼图")。
- 整页优化:基于 nano banana pro🍌 生成高清、风格统一的页面。
✅ 开箱即用的格式导出
- 多格式支持:一键导出标准 PPTX 或 PDF 文件。
- 完美适配:默认 16:9 比例,排版无需二次调整,直接演示。
✅ 可编辑组件pptx导出(Beta迭代中)
智能递归进行组件分析提取、文字提取、表格提取,最终得到可手动编辑的pptx
准备工作
AI生成,就是需要API_KEY了。经过我多方测试,正经用的话,建议大家使用Gemini。
其次是这个MinerU的API_Token,也去申请一个复制下来备用~原文档的环境变量中那个应该可以公用,不过这东西也不麻烦,还是申请一个吧!

部署流程
本次部署流程略有不同。
以威联通NAS为例,通过Docker的方式进行部署。
首先SSH连接NAS。输入以下指令:
# 进入Docker路径下
cd /share/Container
# 克隆仓库
git clone https://github.com/Anionex/banana-slides

为了方便操作,我们打开NAS的WEB管理界面,对环境变量文件进行修改。也可先不管,部署完毕后UI中修改。
必须修改的配置:AI相关的所有,用哪个改哪个(平台/KEY/URL/模型),SECRET_KEY,MINERU_TOKEN。
要注意文本、识图、生图这些模型的区别,不要一股脑全填写一样的。

剩下的大家看着注释,决定是否需要改动。

修改完毕后保存,并如上图,将.env.example重命名为.env。
关于部署文档,如果需要修改两个服务的端口之类,也可一并改掉。修改完后别忘记保存。

接着回到SSH界面,接着输入指令。
# 进入项目目录下
cd banana-slides
# 启动服务
docker compose up -d
整个创建时间大概用时4分钟。

使用演示
因为我没有做什么大调整。部署完毕后,浏览器输入NAS_IP:3000即可访问服务。
所见即所得,各种功能项。

后续更新
SSH依次操作:
git pull
docker compose down
docker compose build --no-cache
docker compose up -d
最后
硅基流动的话,目前图片生成好像有点问题,其中的千问我尝试是配置不上。
国内网络不畅的话建议使用三方中转API,目前生图最强的应该是Gemini。
感谢观看,本文完。
评论区