Python3把爬取过来的网页写入到文件

站长苏飞 · 发表于 2021-8-24 09:14:30

Python3把爬取过来的网页写入到文件

第一步请求网页
因为这次主要介绍的是写入文件，所以我们就不使用requests的了，直接使用urllib获取网页
导入urllib

[C#] 纯文本查看 复制代码

 from urllib.request import urlopen

然后使用urlopen获取内容

[C#] 纯文本查看 复制代码

    myURL = urlopen("http://www.sufeinet.com/")
    content = myURL.read(100)  # 读取网页内容

为了加快速度，我们只取前100个字符

第二步，写入文件

打开文件

[C#] 纯文本查看 复制代码

  f = open("test1.html", "wb")

写入文件

[C#] 纯文本查看 复制代码

  f.write(content)
    f.close()

完整的源码如下

[C#] 纯文本查看 复制代码

    from urllib.request import urlopen
    # 输出为文件，目录在项目文件主目录，也可以直接写路径
    f = open("test1.html", "wb")
    myURL = urlopen("http://www.sufeinet.com/")
    content = myURL.read(100)  # 读取网页内容
    f.write(content)
    f.close()
    print(content)
    print("写入成功！")

wengjingqun · 发表于 2021-9-24 18:12:49

站长学py了？

站长苏飞 · 发表于 2021-9-24 19:41:45

wengjingqun 发表于 2021-9-24 18:12
站长学py了？

在学了，快学完了

		自动登录	找回密码
密码			马上注册

[Python3教程] Python3把爬取过来的网页写入到文件

相关帖子