博客
关于我
soup.select()方法详解
阅读量:157 次
发布时间:2019-02-28

本文共 774 字,大约阅读时间需要 2 分钟。

通过BeautifulSoup库筛选HTML元素

BeautifulSoup库提供了便捷的方法来筛选HTML文档中的元素,支持通过标签名、类名、id名以及组合方式进行查找。这些方法的返回类型为list,可以通过列表索引获取具体元素。

1. 通过标签名查找

print soup.select('title')    返回结果:#The Dormouse's story        示例:查找所有a标签     print soup.select('a')    返回结果:#, Lacie, Tillie            2. 通过类名查找         print soup.select('.sister')    返回结果:#, Lacie, Tillie            3. 通过id名查找         print soup.select('#link1')    返回结果:#            4. 组合查找         print soup.select('p #link1')    返回结果:#            5. 直接子标签查找         print soup.select("head > title")    返回结果:#The Dormouse's story            6. 属性查找         print soup.select('a[href="http://example.com/elsie"]')    返回结果:#            7. 获取元素文本         span_text = soup.select('#class')[0].get_text()        通过get_text()方法可以获取元素的文本内容。

转载地址:http://jinj.baihongyu.com/

你可能感兴趣的文章
PIL Image对图像进行点乘,加上常数(等像素操作)
查看>>
PIL Image转Pytorch Tensor
查看>>
PIL&QOOT;IOERROR:带有大图像的图像文件被截断(&Q)
查看>>
PIL.Image、cv2的img、bytes相互转换
查看>>
PIL.Image进行图像融合显示(Image.blend)
查看>>
pilicat-dfs 霹雳猫-分布式文件系统
查看>>
Pillow lacks the JPEG 2000 plugin
查看>>
SpringBoot之ElasticsearchRestTemplate常用示例
查看>>
ping 全网段CMD命令
查看>>
ping 命令的七种用法,看完瞬间成大神
查看>>
Pinia入门(快速上手)
查看>>
Pinia:$patch的使用场景
查看>>
Pinia:$subscribe()的使用场景
查看>>
Pinpoint对Kubernetes关键业务模块进行全链路监控
查看>>
Pinterest 大规模缓存集群的架构剖析
查看>>
pintos project (2) Project 1 Thread -Mission 1 Code
查看>>
PinYin4j库的使用
查看>>
PIP
查看>>
pip install goose-extractor // SyntaxError: Missing parentheses in call to 'print'
查看>>
pip install mysqlclient报错
查看>>