常用的python标准库（python常用库的使用和详解）python教程 / python常用标准库使用教程...

1：PYTHON本人常用的库import urllib.request, time, os, requests, re, json, jsonpath, pyquery, lxml, pymysql ,multiprocessing, aiohttp, asyncio

from urllib.parse import urlencodefrom bs4 import BeautifulSoup（1）Import requests 是http库常用的方式（get post）俩种请求方式，都会有携带

（2）Import time 是时间库写的方式是 time.sleep（3）表示每3s执行一次代码 a = time.time（） qjg（）这是运行时的函数 print（‘[info]耗时:%s’ %（time.time（）-a））去判断运行这段代码花了多少时间

（3）Import re是正则库常用的是a = re.findall("title":"(.*?)", b)html_res = re.sub(, , a) 这是去除re匹配回来的数据里面还有标签比如简书的数据格式

（3）import json html.json() json.dump json.dumps json.loads json.load type(html.json())可以知道返回来的数据类型是str字符串 dict列表 json数据格式

（4）Import jsonpath 这是专门提取json数据内容写法是a = jsonpath.jsonpath(b, ‘$..title’)这是去提取title里面的数据（5）Import pyquery 是类似jquery的一个库去解析html的

（6）From bs4 import BeautifulSoup 是解析html里面的文字数据解析器有 html.parser lxml 后者会快一些（7）From ullib.parse import urlencode 是用于拼接给url地址来爬取分页数据需要在这个外面加for x in range（1,3）：

Data = {“Page”： x}url = ‘www.baidu.com?’urlencode + (data)2：绕过https的限制verify=False3：html = requests.post(url, headers=headers,timeout=30) timeout

表示请求如果超过30s没有响应就会断开连接4：replace 这是把去掉http://\www.baidu.com去掉\这样的符号的自带函数5：op = open(rE:\python\爬完数据存放地址/简书输入关键词爬标题与内容.txt, a, encoding=utf-8) 把爬下来的数据存在本地如果有特殊字符保存不进去就在后面加encoding=utf-8

最近发表

随机文章

标签列表

常用的python标准库（python常用库的使用和详解）python教程 / python常用标准库使用教程...

相关阅读

python自动化数据驱动（PYTHON基础——第一集 入门）python基础 / python测试驱动开发基础...

python基础代码讲解（零基础自学Python：安装Python、解释器、代码风格等）python基础 / python代码风格与规范基础...

python代码编写规范有哪些（Python入门篇之编程习惯与特点）python基础 / python代码风格与规范基础...

python代码规范七大原则（Python入门基本语法和规范）python基础 / python代码风格与规范基础...

python代码合集（Python基础知识：脚本格式，编程风格及对象）python基础 / python代码风格与规范基础...

python3.9性能提升（英特尔开源 NPU 加速库，方便使开发人员优化其 AI 应用浙江寺庙一古井“闹鬼”，专家连掘12天，捞出100余件国宝）python基础 / python性能优化基础...

最近发表

随机文章

标签列表

python自动化数据驱动（PYTHON基础——第一集入门）python基础 / python测试驱动开发基础...