澳康达二手车-我要买车
搜狐宠物-首页
中华军事-首页
游民星空-首页
参考消息-首页
淘宝联盟(淘宝客)商品采集-童装
一键采集淘宝联盟商品信息,只需输入淘宝联盟商品搜索的链接地址。
采集任务配置:淘宝客淘宝联盟商品采集教程
默认采集字段:商品id,商品标题、封面图、价格、月销量、佣金、佣金比率、商品链接、店铺id、店铺名。
虎嗅-首页资讯-版本1
采集的内容为:虎嗅-首页资讯-版本1
主要数据字段:标题,作者,发布日期,内容,标签,描述,关键字
主要数据截图:(由于虎嗅文章的图片有两种模板,该版本1为采集图片地址在_src属性的文章模板)
A5-站长
东方财富-要闻精华
采集的是东方财富-要闻精华:http://finance.eastmoney.com/news/cywjh.html
配置主要字段:标题,发布日期,正文内容,描述,关键词
系统默认返回字段:抓取的URL(原文),抓取时间,第一张图片链接;
列表翻页数量:2页,如需调整,可到该任务选项卡"基本信息&采集规则"里面的“入口起始网址”中进行配置
主要数据示例如下:
配置更多列表页面: