这么多年过去,微信公众号依然是一个绕不开的信息来源。
估计不少朋友和我一样,随便点几下,关注列表就已经破百。看到一篇不错或实用的文章,往往也只是顺手转发、点个收藏,之后便慢慢被时间埋在列表里。久而久之,无论是技术文章、行业观察,还是长期关注的公众号内容,都会遇到同一个问题:文章分散在平台内部,难以系统化保存,更谈不上检索和二次利用。
等哪一天真的碰到问题需要用到,再一拍脑门,才发现连当初是在哪个公众号看到的,都已经记不清了。很多大佬的文章,编排起来完全可以作为一个完整知识库来用。本期我们就来介绍一个公众号文章下载项目:wechat-article-exporter,支持 docker 部署和 Cloudflare 部署。

项目介绍
完整项目名:wechat-article/wechat-article-exporter,可于GitHub搜索。
这是一款在线的微信公众号文章批量下载工具,支持导出阅读量与评论数据,无需搭建任何环境,可通过在线网站使用(见项目主页),同时也支持 docker 私有化部署和 Cloudflare 部署。 支持下载各种文件格式,其中 HTML 格式可100%还原文章排版与样式。
项目特性
- 搜索公众号,支持关键字搜索
- 支持导出 html/json/excel/txt/md/docx 格式(html 格式打包了图片和样式文件,能够保证100%还原文章样式)
- 缓存文章列表数据,减少接口请求次数
- 支持文章过滤,包括作者、标题、发布时间、原创标识、所属合集等
- 支持合集下载
- 支持图片分享消息
- 支持视频分享消息
- 支持导出评论、评论回复、阅读量、转发量等数据 (需要抓包获取 credentials 信息)
- 支持 Docker 部署
- 支持 Cloudflare 部署
- 开放 API 接口
部署流程
我们以威联通NAS为例,通过Docker Compose的方式进行部署。
部署代码如下。
services:
wechat-article-exporter:
image: ghcr.io/wechat-article/wechat-article-exporter:latest
container_name: wechat-article-exporter
ports:
- "3006:3000"
volumes:
- /share/Container/article/data:/app/.data
restart: always
打开威联通的Container Station,创建新的应用程序。

使用展示
需要公众号一枚,这个申请也毫无门槛,大家用或不用都可以申请个放在那。
这里要注意的是,由于微信返回的相关 cookie 使用了 secure 属性,所以要求网站必须开启 https 才能携带 cookie。localhost和127.0.0.1访问不受该规则限制。
也就是说,如果像过去那样局域网HTTP,输入NAS_IP:3006是没办法扫码登录的。如下图。

这里我提前进行了反代,并且登录了当前的账户。要注意后续操作这些内容只缓存在本地,如果你换台设备登录还要重新搞一遍。

接着再点击「添加」,输入你的目标公众号。这里以我的朋友为例。搜索到并点击。

接着就会加入到列表中。加载进度意味着加载该账户的所有文章,刷新等一会儿即可。

先来看看已经加载出的部分内容,可以看到是从新到旧刷新的。右侧的蓝色按钮分别为访问原文和预览。

选择某一篇文章,选择「抓取」-「文章内容」。

抓取完毕后,再选择「导出」,有诸多格式可选择,我个人更习惯Markdown一些。

下载后用Markdown编辑器打开,效果很好。

其他的使用,比如抓阅读点赞评论,自己搞代~~理等等,可以参照官方文档,已经写得非常详细,我就不多啰嗦咯。

最后
我个人认为是个不错的工具,就算拿来备份自己公众号的文章也很方便~
感谢观看,本文完。
评论区