img图片不在div中_python爬取优美图库海量图片,附加代码,一键爬取

news/2024/7/8 13:15:25
73484190ffa971e3abfa217b57b4c189.png

优美高清图片为大家提供高清美女套图赏析,非高清不录入,大家的网速要给力。

今天教大家爬取优美图库网站中高质量的图片!!

简单易上手哦~

使用工具:

Python 3.6

pycharm

相关环境:

requests

parsel

xpath

主要内容:

1、系统分析目标网页

2、html标签数据解析方法(xpath)

3、海量图片数据一键保存

爬虫的一般思路:

1、确定爬取的url路径,headers参数

2、发送请求 -- requests 模拟浏览器发送请求,获取响应数据

3、析数据 -- parsel 转化为Selector对象,Selector对象具有xpath的方法,能够对转化的数据进行处理

4、保存数据

代码如下:

import requestsimport parsel# 1、确定爬取的url路径,headers参数base_url = 'https://www.umei.cc/meinvtupian/meinvxiezhen/'headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36'}# 2、发送请求 -- requests 模拟浏览器发送请求,获取响应数据response = requests.get(base_url, headers=headers)response.encoding = response.apparent_encoding  # 自动识别响应对象的编码html = response.text# print(html)# 3、解析数据 -- parsel  转化为Selector对象,Selector对象具有xpath的方法,能够对转化的数据进行处理# 3、1 转换数据类型parse = parsel.Selector(html)# 3、2 解析数据href_list = parse.xpath('//div[@class="TypeList"]/ul/li/a/@href').extract()# print(href_list)for href in href_list:    # print(href)    # 再次发送图片请求    href_data = requests.get(href, headers=headers).text    # 解析图片数据    img = parsel.Selector(href_data)    img_src = img.xpath('//div[@class="ImageBody"]/p/a/img/@src').extract_first()    # print(img_src)    # 发送图片的url    img_data = requests.get(img_src, headers=headers).content    # 4、保存数据    # 1、准备文件名    file_name = img_src.split('/')[-1]    # print(file_name)    # 3、保存文件    with open('img' + file_name, 'wb') as f:        print('正在保存文件:{}'.format(file_name))        f.write(img_data)

效果如下:

c776d46b2bccce13df79bade09749849.png

如果你处于想学Python或者正在学习Python,Python的教程不少了吧,但是是最新的吗?说不定你学了可能是两年前人家就学过的内容,在这小编分享一波2020最新的Python教程。获取方式,私信小编 “ 资料 ”,即可免费获取哦!


http://www.niftyadmin.cn/n/3661289.html

相关文章

[瞭望]关于Ruby on rails

2006年10月25日 09:04:00 RoR是一个老早就有了的东东,只是在近日的连番炒作中,才真正引起更多人的关注。我也是这更多人中的一个。大家关注一个事物的时候,出发点大有不同,得出来的结论也千差万别。不过这都没有关系,你…

点云建模步骤_CASS和点云的小秘密

随着无人机、移动测量车等新技术日臻成熟,点云也越来越多的参与到地形绘图中来了。点云已经开启了三维建模/地形绘图的“斜杠”模式。有小伙伴跑来咨询:CASS是否支持点云加载?CASS能否基于点云数据绘制等高线?CASS能否过滤和渲染点…

geopandas安装_Python空间分析||geopandas安装与基本使用

Python空间分析——geopandas安装与基本使用一、geopandas安装二、geopandas数据读取与存储导入包从geopandas自带的数据库中读取数据从本地读取shp数据显示geopandas表格数据从本地读取geojson数据文件保存空间分析是经济、管理、地理多学科方向重点使用的研究方法&#xff0c…

[软工]说不

2006年10月17日 20:09:00 前两天,ZT跟我说,新生太累了,每天加班到2天,已经连续加了好多天的班了。我很明白她的想法,无非是想让我也出面劝一下JH。JH现在负责新生的培训,在我负责的3.2忙得热火朝天的时候&a…

全局异常处理_springboot 教你如何更加优雅的处理全局异常

“ 众所周知,现在的项目开发基本上都是前后端分离,而前后端分离之后,无论在控制层,还是业务层都需要校验一些数据,无论是前端传过来的,还是经过业务处理判断的,如果不合法的需要友好的提示给用户…

[领域]Javascript Hacking Guide part 1

2007年02月01日 20:09:00 那天听东东将javascript,他讲得也匆忙,我听得也犯晕,心想如果能够建立起javascript的内存对象模型该多好啊。可是在网上找了好久,也没有发现javascript的Hacking guide,不经意间,却…

addeventlistener事件第三个参数_通过几个例子来理解 React 的事件系统

来源:Aaaaaaaaaaayouhttps://juejin.im/post/6863083643427979271说明:本文结论均基于 React 16.13.1 得出,若有出入请参考对应版本源码几个题目我们先来看几个题目,如果你都能很确定的说出结果,那么这篇文章就不用看了…

为取经而来_唐僧为什么冒着生命危险去为李世民取经,李世民的目的又是什么?...

唐僧去西天取经,是为了李世民,这跟他的追求没有一点关系,作为臣子的盲目崇拜也好,还是作为下属的无知感动也罢,反正去西天取这个经,不是自己本身的意图。那李世民为什么听了观音菩萨的一席话就决定派人去西…