Python 爬取指定页面的所有图片

共计 919 个字符，预计需要花费 3 分钟才能阅读完成。

之前看见别人分享小黄鸡头像，但是好像没有提供云盘下载。于是就让 gpt 生成了一下爬取特定页面的代码，爬取后重命名了一下，可以评论获取压缩包。

Python 爬取指定页面的所有图片

同时分享下代码，万一下次用得着呢。

import requests
from bs4 import BeautifulSoup
import os
from urllib.parse import urljoin

# 目标页面
url = "https://zhuanlan.zhihu.com/p/578390498"

# 发送HTTP请求获取页面源码
response = requests.get(url)
html = response.text
soup = BeautifulSoup(html, 'html.parser')
# 提取所有图片链接
img_links = [img['src'] for img in soup.find_all('img', {'src': True})]

if not os.path.exists('images'):
    os.makedirs('images')

# 下载图片
for img_link in img_links:
    # 使用urljoin确保链接是绝对路径
    img_url = urljoin(url, img_link)

    # 检查链接是否以"http"或"https"开头
    if img_url.startswith(('http:', 'https:')):
        # 获取图片内容
        img_data = requests.get(img_url).content
        # 提取图片文件名
        img_name = img_url.split("/")[-1]
        # 保存图片到目录
        with open(os.path.join('images', img_name), 'wb') as img_file:
            img_file.write(img_data)
            print(f"Downloaded: {img_name}")
    else:
        print(f"Skipped: {img_url}")

print("All images downloaded successfully.")

下载地址

小黄鸡头像：链接：https://pan.baidu.com/s/16p0TqdD8jRYbAsZM46VFmA?pwd=akak

提醒：本文发布于936天前，文中所关联的信息可能已发生改变，请知悉！

AD:【腾讯云服务器大降价】2核4G 222元/3年 1核2G 38元/年

Linux 物理机实现快照功能

简介物理机装的系统随着时间的增加，东西肯定越来越多，磁盘占用也越来越大，想要清理这些内容变回一个干净的系统是一件不容易的事情，Linux 上也是如此。而虚拟机则可以为刚装好的系统创建一个快照，无论后面在系统内进行任何操作都可以通过快照进行快速复原系统。经过一方摸索，最开始是准备使用 dd 命令进行镜像的备份和还原，这种方式可行，但是耗时实在过长。于是想着如果系统支持快照还原就好了，之前确实也有...

设计模式之软件设计原则

在软件开发中，为了提高软件系统的可维护性和可复用性，增加软件的可扩展性和灵活性，程序员要尽量根据 6 条原则来开发程序，从而提高软件开发效率、节约软件开发成本和维护成本。 1 开闭原则对扩展开放，对修改关闭。在程序需要进行拓展的时候，不能去修改原有的代码，实现一个热插拔的效果。简言之，是为了使程序的扩展性好，易于维护和升级。想要达到这样的效果，我们需要使用接口和抽象类。因为抽象灵活性好，适应...

Docker 使用两种工具测试网站并发

1. ab工具 ab 代表 ApacheBench，是一个用于测试 HTTP 服务器性能的工具。它是 Apache HTTP 服务器的一部分，可以模拟并发请求并测量服务器的响应时间和吞吐量。相关参数： -c: 并发连接数，即同时发送的请求数量。例如，-c 100表示同时发送100个请求。 -n: 总请求数量，即发送的总请求数量。例如，-n 1000表示发送1000个请求。 -t: 测试时间，即测...

SpringBean 初始化的执行各方法的顺序

Spring 容器在创建 SpringBean 的时候，会帮我们自动给属性赋值，还有一些初始化方法和一些增强的方法。因此，了解这些方法的顺序很有必要，这样可以了解方法增强的时机，有助于更好地编写代码。通过如下案例可以看见执行的先后顺序： MyBean.java @Data public class MyBean implements InitializingBean { private Str...

Alpine 系统手动安装代理

购买了国内的 nat 机用于加速异地组网 tailscale 的访问，配置很低，只有 64M 内存和 512M 硬盘，并且是 lxc 容器，系统 alpine。想着最大发挥它的的作用，其实还可以用作国内代理，偶尔用作绕过当前网络环境的限制。于是问了一下 gpt，最后选择安装 shadowsocks-rust。换源 # 备份 cp /etc/apk/repositories /etc/apk/re...

mowang666 您好，因业务需要，网站地址发生变更，信息如下：网站名称: 新锐博客网站地址: https://blog.xrbk.cn 网站图标: https://blog.xrbk.cn/favicon.png 网站描述: 记录学习与分享资源 RSS地址：https://blog.xrbk.cn/atom.xml 请您及时更新，给你带来的不便敬请谅解

阿蛮君这个我倒是没试过

坏比弓长没有办法在开启JWT的情况下调用吗？

阿蛮君现在我也不清楚了，好久没折腾这了，不好意思哈，现在用的tailscale

jarywj 博主，我用你的教程搭建好了服务器，建好了网络，但是客户端在替换planet文件后，加入了网络，服务器上看不到这个加入的客户端，这是为什么呢？

au 好的好的，感谢回复！

阿蛮君现在没有折腾哪个了，理论上来说替换掉那些api就可以检测，https://v6.ident.me, https://6.ipw.cn, https://v6.yinghualuo.cn/bejson，不过我没有试过不知道行不行。我现在是用ddns-go这款工具。动态解析域名，并且可以触发webhook给我发送邮件的

au 博主，你好，我在知乎看过您的一篇文章，是关于使用Docker部署容器监控公网IP变动并主动发送邮件的“https://zhuanlan.zhihu.com/p/568074329”这篇文章，我想问的是，这个可以监控IPv6的变化并发送邮件嘛？因为我现在测试了，它只能发送IPv4的，请问如果要添加IPv6的变化，我该如何操作呢？谢谢您！

阿蛮君我没用过1p哈，所以我这个无法对比，至少Vaultwarden我用了一两年感觉还不错

兔哥博客博主，你觉得 Vaultwarden 与 1password 比哪个好用？我个人一直在用付费版的 1password，但最近也想自建试试Vaultwarden，又担心用不惯。

Python 爬取指定页面的所有图片

Linux 物理机实现快照功能

设计模式之软件设计原则

Docker 使用两种工具测试网站并发

SpringBean 初始化的执行各方法的顺序

Alpine 系统手动安装代理

Docker 搭建 headscale 异地组网完整教程

Ubuntu 22.04 锁屏不能远程连接的解决方案

Openwrt 编译官方固件详解

Docker 部署 funasr 语音转文字服务

Docker 搭建开源订阅转换 sub2clash