这样就好理解了,如果我要把这个类目的 页面产品全部抓取下来,那么只要把 改成 ,然后, 页 个 ,如此,通过这种方式就可以得到 个产品了。 内容页: 当然,我们要抓的是产品详细信息,所以,找出列表页和文本页之间的关联,仔细分析,你会发现这个 是之间的关联节点。那么我们就可以从这里入手去爬取信息了。 如上图,把 后面的数字用 地址参数 替换,在下面的数字变换中填入你希望抓取的页面。
在预览中即可看到这些列表页了
接下来在列表页内容中继续找规律。 现。比如: 这样的话,我们可以通过变量替换方式,把这个 拼接到内容页上,如下图所示; 点击网址采集测试看看效果;看下图,果然 俄罗斯 WhatsApp 号码列表 可以,已经成功采集到了内容页了。 接下来就可以抓取内容页的详细信息了。 抓取内容有 种方式可以实现。第一种就跟上面的一样,前后截取,第二种是更智能化的 方式。 在内容采集规则页上新建 字段,按上图步骤,点 提取,点选择,将内容页 链接地址输入到 中,或者将 文本粘贴到 文本中,点击 确定。
到这里,我们就顺利抓取到了 标题信息
那么,运行下采集试试。 果然可以。最后,简单设置下保存的文件。 开始采集 别太凶悍,适当降低采集速度。 已经采集到了,完成文件发布后,在桌面上可以找 EC列表 到数据文件。到这里,采集工作就全部做完了。 总结: 这个演示实例,只采集了 。你可以用同样的方法将描述、价格、图片、评级等所有信息采集下来。我在以前的文章也反复提到过,谨慎使用这种方式进行铺货,特别是在你没有一套相对完善的产品管理系统之前,不要乱来。这种方式是暴力且高效,但切勿滥用,以免引火烧身。批量采集并非什么高深技术,会些技术的卖家都能做到,这更不是什么黑科技,小心被骗了。