提供免费采集规则
简数采集平台服务推广站

澳康达二手车-我要买车

兔子大叔阅读(1661)

网页数据采集模板简介

采集的内容为:澳康达二手车-我要买车

入口链接:http://www.akd.cn/carmain/

主要数据字段:标题,作者,发布日期,内容,描述,关键字,价格,图片

主要数据截图:

澳康达二手车-我要买车插图

搜狐宠物-首页

兔子大叔阅读(1210)

网页数据采集模板简介

采集的内容为:搜狐宠物-首页

入口链接:http://pets.sohu.com/

主要数据字段:标题,作者,发布日期,标签,内容,描述,关键字

主要数据截图:

搜狐宠物-首页插图

中华军事-首页

兔子大叔阅读(1208)

网页数据采集模板简介

采集的内容为:中华军事-首页

入口链接:https://military.china.com/zh_cn/

主要数据字段:标题,作者,发布日期,内容,描述,关键字

主要数据截图:

中华军事-首页插图

游民星空-首页

兔子大叔阅读(1747)

网页数据采集模板简介

采集的内容为:游民星空-首页

入口链接:https://www.gamersky.com/

主要数据字段:标题,作者,发布日期,内容

主要数据截图:

游民星空-首页插图

参考消息-首页

兔子大叔阅读(1715)

网页数据采集模板简介

采集的内容为:参考消息-首页

入口链接:http://www.cankaoxiaoxi.com/

主要数据字段:标题,作者,发布日期,内容,标签,描述,关键字

主要数据截图:

参考消息-首页插图

虎嗅-首页资讯-版本1

兔子大叔阅读(1750)

网页数据采集模板简介

采集的内容为:虎嗅-首页资讯-版本1

入口链接:https://www.huxiu.com/

主要数据字段:标题,作者,发布日期,内容,标签,描述,关键字

主要数据截图:(由于虎嗅文章的图片有两种模板,该版本1为采集图片地址在_src属性的文章模板)

虎嗅-首页资讯-版本1插图

A5-站长

兔子大叔阅读(1184)

网页数据采集模板简介

采集的内容为:A5站长频道

入口链接:http://www.admin5.com/webmaster/

主要数据字段:标题,发布日期,内容,描述,关键字

主要数据截图:

A5-站长插图

东方财富-要闻精华

兔子大叔阅读(1623)

网页数据采集模板简介

采集的是东方财富-要闻精华:http://finance.eastmoney.com/news/cywjh.html

配置主要字段:标题,发布日期,正文内容,描述,关键词

系统默认返回字段:抓取的URL(原文),抓取时间,第一张图片链接;

列表翻页数量:2页,如需调整,可到该任务选项卡"基本信息&采集规则"里面的“入口起始网址”中进行配置

主要数据示例如下:

东方财富-要闻精华插图

   配置更多列表页面:

东方财富-要闻精华插图(1)

点击进入简数采集器控制台

控制台