男士请进,女生勿看!!爬取某网站小姐姐超好看图片(一)【记得赶紧收藏】


发布日期:2021-08-24 15:11    点击次数:162
终于等到你了……自己闲着无聊,就在CSDN上搜索了“爬取女朋友照片”,这不看不知道,这还真敢给搜索显示结果哈!!

作为具备充分好奇心的我【HH,真实的铁男儿哈】,为了给众多网友(哦不,是LSP呢!)带来一些图片福利呢,我准备出一个系列的爬取小姐姐图片教程!本文是系列教程开局篇--【小试牛刀】“爬取某网站小姐姐超好看图片(一)”

(一)项目需求说明

爬取某网络平台的所有小姐姐图片~~~【网址 】

图片都是社区内分享的非常真实接地气的小姐姐图片。效果图展示出来【哈哈哈哈,抱歉更加真实~~~的图片不敢放出来,那就自行脑补吧!】!!精选 | 不羞涩图片都是社区内分享的非常真实接地气的小姐姐图片。效果图展示出来【哈哈哈哈,抱歉更加真实~~~的图片不敢放出来,那就自行脑补吧!】!!

在技术需求上,使用了一些常见的爬虫爬取、反爬技术点!如有错误之处,欢迎指正!!或许每一个Python爱好者,或其他语言的爬虫爱好者都曾经爬取过类似的东西,当然爬取的方式有很多,我这里爬取的方法比较适合Python的初学者,因为是【开局第1篇】我们就拿“爬取第1个爬虫程序、爬取第一张小姐姐图片”做个范例,其他平台大致只需要改下代码中的网址以及匹配的网址字符串就可以了,非常容易,朋友们都可以自己动手尝试下。

(二)编写第1个爬虫程序

废话不多说,我们在入手第1个爬虫程序时,直接来爬程序员天堂网站“CSDN”哈,网址如下:

https://www.csdn.net/1.爬爬数据

首先,我们来使用最简单的代码编写第1个爬虫程序,代码如下:

import urllib.request

# 明确目标
csdn_url = "https://www.csdn.net/"
# 爬取数据
response = urllib.request.urlopen(csdn_url)
html_result = response.read()
print("结果:",html_result)

往往动手编写代码时,总是事与愿违!难搞啊!!

但不管怎样,编程之路必须坚持走下去!!仔细分析错误,原来是显示的二进制数据格式(bytes)了,那么我们就快速解决问题吧!!

# html_result = response.read()
html_result = response.read().decode("utf-8")

哈哈哈,成功解决问题!!入坑成功啦啦啦啦。。。。。

2.判别爬虫身份

对于上面的爬虫代码,对方服务器能否识别呢?我们运行程序看看结果:

显然,是很容易看到是爬虫身份的,这显得超级尴尬!!!那就换个真实浏览器身份信息吧。

import urllib.request

# 明确目标
csdn_url = "https://www.csdn.net/"

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"}
requester = urllib.request.Request(csdn_url,headers=headers)

# 爬取数据
response = urllib.request.urlopen(requester)
# html_result = response.read()
html_result = response.read().decode("utf-8")
print("结果:",html_result)

呀呀呀,终于成功啦!!!赶紧一键三连啊!!!!!!!!!!

(三)爬取第1张小姐姐图片

俗话说“一切不以结果出发的程序开发,都是烂程序!”哈嘿哈嘿,哪位名人说的我也不知道,如果你没听过,就当是我说的哈HH!下面这个小姐姐图片

就是我们的目标哈!【嘿嘿嘿~~~,如果你有别的图片,也试试看哈!此处不宜做展示的。】

来来来,直接上代码哈!!

import requests

# 明确目标
girl_url = "https://tva1.sinaimg.cn/large/008kAYTRgy1gsd3ecopsmj30u0190tfz.jpg"
# 爬
req = requests.get(girl_url)
# 取数据
image_contnet = req.content
# 存储
image_file = open("./小姐姐图片/小姐姐.jpg","wb")
image_file.write(image_contnet)
image_file.close()
print("成功爬取小姐姐图片!!")

哈哈哈,真漂亮呀!!还是自己亲手爬下来的哟。。。

看到这里了,帮"老码农"点个关注呗,方便看系列教程哟!!