博客
关于我
soup.select()方法详解
阅读量:157 次
发布时间:2019-02-28

本文共 774 字,大约阅读时间需要 2 分钟。

通过BeautifulSoup库筛选HTML元素

BeautifulSoup库提供了便捷的方法来筛选HTML文档中的元素,支持通过标签名、类名、id名以及组合方式进行查找。这些方法的返回类型为list,可以通过列表索引获取具体元素。

1. 通过标签名查找

print soup.select('title')    返回结果:#The Dormouse's story        示例:查找所有a标签     print soup.select('a')    返回结果:#, Lacie, Tillie            2. 通过类名查找         print soup.select('.sister')    返回结果:#, Lacie, Tillie            3. 通过id名查找         print soup.select('#link1')    返回结果:#            4. 组合查找         print soup.select('p #link1')    返回结果:#            5. 直接子标签查找         print soup.select("head > title")    返回结果:#The Dormouse's story            6. 属性查找         print soup.select('a[href="http://example.com/elsie"]')    返回结果:#            7. 获取元素文本         span_text = soup.select('#class')[0].get_text()        通过get_text()方法可以获取元素的文本内容。

转载地址:http://jinj.baihongyu.com/

你可能感兴趣的文章
PHP:第一章——PHP中常量和预定义常量
查看>>
PHP:第一章——PHP中的位运算
查看>>
phpcms
查看>>
phpcms 2008 product.php pagesize参数代码注射漏洞
查看>>
phpcms V9 自定义添加 全局变量{DIY_PATH}方法
查看>>
Redis五种核心数据结构的基本使用与应用场景
查看>>
PHPCMS多文件上传和上传数量限制
查看>>
phpEnv的PHP集成环境
查看>>
PHPExcel一些基本设置总结
查看>>
PHPExcel导入导出 若在thinkPHP3.2中使用(无论实例还是静态调用(如new classname或classname::function)都必须加反斜杠,因3.2就命名空间,如/c...
查看>>
PHPMailer发送邮件
查看>>
phpmailer发送邮件,可以带附件
查看>>
phpmyadmin 安装
查看>>
phpmyadmin数据库建表及插入
查看>>
phprpc简单使用
查看>>
phpstorm中Xdebug的使用
查看>>
phpstorm中使用svn版本控制器
查看>>
phpstorm配置php脚本执行
查看>>
phpStudy安装教程
查看>>
phpunit
查看>>