为什么不要轻易使用 Chrome 复制的 XPath?

谢乾坤|青南 at 
为什么不要轻易使用 Chrome 复制的 XPath?的配图
有一些同学在写爬虫的时候,喜欢在 Chrome 开发者工具里面直接复制 XPath,如下图所示:他们觉得这样复制出来的 XPath 虽然长了点,但是工作一切正常,所以频繁使用。但我希望大家不要过于依赖这个功能。因为它给出的结果仅作参考,有时候并不能让你提取出数据。我们来看一个例子。这是一个非常简单的 HTML 页面,页面中有一个表格,表格有一列叫做电话。我现在想把这里面的 5 个电话提取出来。如果直接使用 Chrome 的复制 XPath 的功能,我们可以得到下面这个 XPath:1/html/body/div/table/tbody/tr[3]/td[4]这实际上对应了刘小三这一行的电话字段……