beautifulsoup
-
如何使用正则表达式提取HTML中的特定内容?
正则表达式可用于提取html中的特定内容,但并非最佳工具,推荐使用beautifulsoup等库。1. 提取标签内文本可用类似(.*?)的正则,捕获组提取所需内...
feifei123 发布于 2025-06-30 阅读(0) -
Python爬虫入门:requests库使用
python爬虫使用requests库发送请求、处理cookie和session、设置headers、处理异常及使用代理ip。1. 发送get请求用reques...
feifei123 发布于 2025-06-30 阅读(1) -
正则表达式如何匹配XML/HTML标签?
用正则表达式匹配xml或html标签适用于简单场景,但不适用于复杂结构。1. 匹配开始标签可用]*)?>;2. 匹配闭合标签可用;3. 匹配整个标签对及其...
feifei123 发布于 2025-06-30 阅读(1)