Tumblr
内容丰富,特别是图片和视频。下面利用Tumblr
爬虫,结合h5ai
目录直读程序,或者其他图床程序,创建图库。
本方法需要一个Python 2.7
的环境,CentOS 6
升级Python 2.7
方法请参考CentOS 6升级Python 2.6至Python 2.7的方法,CentOS 7自带python 2.7
,下面使用CentOS 7和python 2.7
。
使用tumblr-crawler爬虫
tumblr-crawler
爬虫github
项目地址:https://github.com/dixudx/tumblr-crawler
1、安装可能使用的依赖
yum install openssl-devel bzip2-devel expat-devel gdbm-devel readline-devel sqlite-devel
yum -y install gcc automake autoconf libtool make
yum install gcc gcc-c++
yum -y install readline-devel
2、安装tumblr-crawler
git clone https://github.com/dixudx/tumblr-crawler.git
cd tumblr-crawler
pip install -r requirements.txt
3、使用tumblr-crawler下载图片和视频
1、在sites.txt
中添加tumblr
站,用逗号分开,但不需要.tumblr.com
后缀。如rat.tumblr.com
和rats.tumblr.com
rat,rats
保存后,运行
python tumblr-photo-video-ripper.py
2、直接下载
python tumblr-photo-video-ripper.py rat,rats
最后将所有图片和视频均保存在当前路径的与tumblr
博客名字相同的文件夹
安装、使用h5ai
具体安装方法参考:一款不错的PHP目录列表程序:h5ai安装教程
未经允许不得转载:嘟嘟 » 使用Tumblr爬虫,结合h5ai创建图库
最新评论
请问下,python3 tg_username_update.py都会提示下面这个是因为什么啊 Traceback (most recent call last): File "tg_username_update.py", line 21, in <module> cake = emojize(":cake:", use_aliases=True) TypeError: emojize() got an unexpected keyword argument 'use_aliases'
不可以了
# Install [Debian] [bullseye] [amd64] Downloading... grep: (standard input): binary file matches Error! grub.cfg. root@RRR2:~#
博主你好,请问cloudfront 上传收费这个是事实吧,已经找了几个贴子确认了。 那有什么好办法能够避开这个收费呢?如果不能避开感觉还是cloudflare 比较稳。
来看看
第5步添加自定义主机名进去后等txt验证提示custom hostname does not name to this zone
那没事了,我静态博客。谢谢
为什么缓存键和源请求那里不设置缓存?