介绍
仓库地址:https://gitee.com/kkm09/my-subscription
- 业务流程:用户访问页面,提交需要订阅的内容和时间(可自行定义服务),程序调度爬虫适时进行邮件推送。
- 本项目采用前后端分离架构。后端业务处理基于 SpringBoot + MyBatis,爬虫基于Python编写;前端使用 Ace Admin 作为模板
- 使用 Redis 作为缓存
- 采用 Nginx 搭建服务器,托管前端代码
- 面向人群:
- 不能及时或不想自己手动获取信息
- 网络上信息获取需求不能满足(例如没有现成的需求信息的推送服务)
安装教程
Requirement
Java 1.8
MySQL 5.7
Nginx: latest stable version
Python 3.6
Redis: latest stable version
Step
- git clone 项目
my-subscription
到本地 - 新建数据库
db_mail_send
,选择utf8mb4
编码,运行config/database/
中的.sql文件进行导入 - 配置 Nginx,参考
config/nginx/conf
中的文件,将html/ace-master
文件夹以移动到本地 nginx 的html
目录下 - 配置 Redis,配置应与
application.yml
设置一致(自定义) - 运行 Tomcat 服务器,启动项目
- 启动 Python 调度:控制台执行命令:
python (该文件所在的目录路径)/process_util.py
使用说明
- 所有Python文件位于
crawlers/**
:
stable
文件夹为爬虫的稳定版本,beta
为测试版本,beta/customize
为用户自定义文件存放位置- database_util.py:数据库工具文件,注意修改登录配置信息
- mail_assist.py:邮件发送工具文件,根据内容进行信息配置,需要开通smtp服务
- spider_hot.py:管理员编写的爬虫文件,整合了
weibo_spider.py
(微博热搜)、zhihu_spider.py
(知乎热搜)、covid19_spider.py
(国内新冠疫情每日新增信息) - spider_customize.py:用户自定义爬虫调度工具文件,扫描文件的路径根据实际情况修改
- process_util.py:总调度文件,在每日的8点、12点、20点启动程序,可按需修改
html/ace-master文件夹中,修改过的文件以”*-copy.html”结尾
修改后端代码(IDEA项目文件夹:MySubcription)
- 根据个人情况修改applicaiton.yml中的内容
- 用户自定义上传的文件路径位于
com/lzc/util/FileUtils.java
的常量FILEPATH
,根据情况修改
参与贡献
- Fork 本仓库
- 新建 dev 分支
- 提交代码
- 新建 Pull Request
项目展示
赏
使用支付宝打赏
使用微信打赏
若你觉得我的文章对你有帮助,欢迎点击上方按钮对我打赏