python3.7爬虫使用xpath解析,获取的表格数据为什么不全面?

发布网友

我来回答

3个回答

热心网友

我认为是xpath默认提取xpath第一个tr属性了,xpath 表达式改成'//div[@class="row"]//table//tr[@height="38px" or @height=""]'

热心网友

要不尝试一下css selector?
response. css(... ). getall()
或者就用个for循环,在每个xpath的tr后加上[i]

热心网友

试试这个
t = response.xpath('//table').extract()[0]
import re

print(re.sub(p1,"",t))

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com