python xpath获取页面注释的方法

心事如莲,心静如水。驾一叶轻舟,吹一支长笛,自池塘深处,揽一朵莲花入怀,似红粉佳人,晶莹剔透,亭亭玉立,娇俏动人,喜一分,爱一分,怜一分,朵朵幽香入心田,丝丝柔情潜心底。

版本信息:

python 2.7.12

lxml 3.8.0

from lxml import etree
 
html_str = """
<div id="box1">this from blog.csdn.net/lncxydjq , DO NOT COPY!
  <div id="box2">*****
    <!--can u get me, bitch?-->
  </div>
</div>
"""
 
html = etree.HTML(html_str)
 
print html.xpath('//div[@id="box1"]/div/node()')[1]
print type(html.xpath('//div[@id="box1"]/div/node()')[1])
print html.xpath('//div[@id="box1"]/div/node()')[1].text
 
"""output:
<!--can u get me, bitch?-->
<type 'lxml.etree._Comment'>
can u get me, bitch?
"""

以上这篇python xpath获取页面注释的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。

标签: python xpath