简介
蓝天采集器是一款免费的数据采集发布爬虫软件,采用php
+mysql
开发,可部署在云服务器,几乎能采集所有类型的网页,无缝耦合各类CMS
建站程序,免登录实时发布数据,全自动无需人工干预!是大数据、云时代网站数据自动化采集的最佳云端爬虫软件。
截图
安装
环境要求:Apache/Nginx
、MySQL >= 5.0
、PHP > 5.3
。
1、搭建Web环境
可以使用宝塔面板,OneinStack
或者LNMP
一键包,新手建议宝塔。
#请进入相应的安装界面进行操作
宝塔面板:https://www.bt.cn/bbs/thread-1186-1-1.html
OneinStack:https://oneinstack.com/auto
LNMP:https://lnmp.org/install.html
2、上传程序
添加域名(虚拟主机),再上传程序到网站根目录,并给予755
权限,程序下载:Github。然后新建数据库,打开域名,填入数据库信息,管理员密码等进行安装。
具体操作请查看官方手册:http://www.skycaiji.com/manual
未经允许不得转载:嘟嘟 » 蓝天采集器:一个开源的PHP爬虫系统,可视化的采集器
最新评论
请问下,python3 tg_username_update.py都会提示下面这个是因为什么啊 Traceback (most recent call last): File "tg_username_update.py", line 21, in <module> cake = emojize(":cake:", use_aliases=True) TypeError: emojize() got an unexpected keyword argument 'use_aliases'
不可以了
# Install [Debian] [bullseye] [amd64] Downloading... grep: (standard input): binary file matches Error! grub.cfg. root@RRR2:~#
博主你好,请问cloudfront 上传收费这个是事实吧,已经找了几个贴子确认了。 那有什么好办法能够避开这个收费呢?如果不能避开感觉还是cloudflare 比较稳。
来看看
第5步添加自定义主机名进去后等txt验证提示custom hostname does not name to this zone
那没事了,我静态博客。谢谢
为什么缓存键和源请求那里不设置缓存?