要使用Python爬取网页图片,可以使用requests库来发送HTTP请求,然后使用beautifulsoup库或者正则表达式来解析网页内容,最后使用urllib库来下载图片。
下面是一个简单的示例代码,可以爬取指定网页的所有图片并保存到本地:
import requests from bs4 import BeautifulSoup import urllib # 发送HTTP请求 response = requests.get('http://example.com') # 使用BeautifulSoup解析网页内容 soup = BeautifulSoup(response.text, 'html.parser') # 找到所有的图片标签 img_tags = soup.find_all('img') # 下载图片 for img_tag in img_tags: # 获取图片URL img_url = img_tag['src'] # 下载图片并保存到本地 urllib.request.urlretrieve(img_url, 'image.jpg')
需要注意的是,上述代码只能下载网页中第一个图片,并且没有对错误进行处理。在实际应用中,可能需要处理多张图片和异常情况,例如使用循环来下载所有图片,添加异常处理等。
此外,还可以使用第三方库如Scrapy来更方便地实现图片爬取功能。