博客
关于我
soup.select()方法详解
阅读量:157 次
发布时间:2019-02-28

本文共 774 字,大约阅读时间需要 2 分钟。

通过BeautifulSoup库筛选HTML元素

BeautifulSoup库提供了便捷的方法来筛选HTML文档中的元素,支持通过标签名、类名、id名以及组合方式进行查找。这些方法的返回类型为list,可以通过列表索引获取具体元素。

1. 通过标签名查找

print soup.select('title')    返回结果:#The Dormouse's story        示例:查找所有a标签     print soup.select('a')    返回结果:#, Lacie, Tillie            2. 通过类名查找         print soup.select('.sister')    返回结果:#, Lacie, Tillie            3. 通过id名查找         print soup.select('#link1')    返回结果:#            4. 组合查找         print soup.select('p #link1')    返回结果:#            5. 直接子标签查找         print soup.select("head > title")    返回结果:#The Dormouse's story            6. 属性查找         print soup.select('a[href="http://example.com/elsie"]')    返回结果:#            7. 获取元素文本         span_text = soup.select('#class')[0].get_text()        通过get_text()方法可以获取元素的文本内容。

转载地址:http://jinj.baihongyu.com/

你可能感兴趣的文章
oracle判断空值的函数nvl2,【PL/SQL】 NVL,NVL2,COALESCE 三种空值判断函数
查看>>
Oracle发布VirtualBox 7.1稳定版!支持ARM、优化了UI、支持Wayland等
查看>>
oracle启动三步
查看>>
oracle启动关闭服务,启动关闭oracle服务.bat
查看>>
Oracle命令行创建数据库
查看>>
Oracle和SQL server的数据类型比较
查看>>
oracle和sybase的一些区别
查看>>
oracle在日本遇到的技术问题
查看>>
Oracle在线重定义
查看>>
oracle基础 管理索引
查看>>
Oracle增量跟新
查看>>
oracle备份恢复之rman恢复到异机
查看>>
oracle复习(一)
查看>>
ORACLE多表关联UPDATE 语句
查看>>
Oracle多表查询与数据更新
查看>>
oracle如何修改单个用户密码永不过期
查看>>
UML- 类图
查看>>
oracle字符集
查看>>
oracle存储参数(storage子句)含义及设置技巧
查看>>
Oracle学习
查看>>