我们在使用火车头采集器时如果遇到要采集的字段比较多,而且B字段标签会根据A字段标签动态变化时,如果使用前后截取字段的方式,很难去精准的截取到想要的B字段。这个时候如果使用截取其它标签值的方式,就很容的提取到想要的标签值。那么火车头采集器可以从其他标签提取标签,实现方法怎么做呢?
数据提取方式支持调用其他标签值可以让采集过程更加灵活,在提取中点击标签符号即可调用其他标签的值。下面介绍下具体使用方法:
我们以网址:https://detail.tmall.com/item.htm?id=644685533017,为例,目的为提取sku对应的颜色名称,以一个颜色为示例:
下面的图片是目标网址中的一部分HTML代码,仅供参考:
第一步是:首先要去的颜色的SKU值
第二步是:点击标签选择需要调用的标签即可
下面为运行结果:
如果前后截取不能满足需要,需要使用正则提取的话,使用方法和前后截取方法一样,可以参看下图。如果是XPath提取,JSON提取和CSS提取,暂时就不支持这种方式了。如果你对火车头采集器的采集还有其它问题,可以参看其它文章如:如何使用独立标签和列表页标签?
如果你还有其它疑问可以来本站搜索相关问题,这里会有你想要的答案:大海资源库
暂无评论内容