简数免费规则 - 简数采集器加油站

博客园-首页

2020-03-12兔子大叔阅读(820)

网页数据采集模板简介

采集的是博客园的首页：https://www.cnblogs.com/

配置主要字段：标题，作者，发布日期，正文内容

系统默认返回字段：抓取的URL（原文），抓取时间，第一张图片链接；

列表翻页数量：2页，如需调整，可到该任务选项卡"采集更多网址配置(批量网址配置)"中进行配置

主要数据示例如下：

博客园-首页插图

中国教育在线-新闻中心

2020-03-12兔子大叔阅读(1092)

网页数据采集模板简介

采集中国教育在线>新闻中心, 入口链接: http://news.eol.cn/

主要数据示例如下：

中国教育在线-新闻中心插图

微信公众号文章采集

2020-03-12兔子大叔阅读(1166)

网页数据采集模板简介

【通用】采集微信公众号文章，可按微信公众号名称，ID或者关键词进行采集。

模板为采集关键词： "高可用架构"，你可以随意更改为其它关键词或公众号名称，还可以同时使用多个关键词或名称,多个用逗号,分隔。

主要采集字段：微信公众号名称，公众号ID，标题，作者，发布日期，正文，描述（可使用正文截取）等。

数据如下图：

微信公众号文章采集插图

配置如下：

微信公众号文章采集插图1

采集微信公众号注意事项：

1.由于搜狗微信搜索结果的限制，每个关键词只能采集前10页文章，而每个公众号，只能获取最近10条文章;
2.微信采集的原始图片是无法正常显示的（防盗链了），如需图片，请选中“是否下载图片”，即可先下载到简数，再通过ftp回传到您指定位置;
3.默认采集字段：标题，作者，微信号，公众号名称，内容，发布时间，第一张图片链接等

新浪博客-教育-独家推荐

2020-03-12兔子大叔阅读(1135)

网页数据采集模板简介

采集的内容为：新浪教育 > 教育博客 > 教育-独家推荐

入口链接：http://roll.edu.sina.com.cn/blog/jy-djtj/index.shtml

主要数据字段：标题，发布日期，内容，标签

列表翻页数量：5个列表页，如需调整，可到该任务选项卡"采集更多网址配置"中进行配置

如需采集新浪博客其它频道的内容，只需修改入口列表链接即可。（在该任务选项卡"采集更多网址配置"中配置）

数据内容主要如下图：

新浪博客-教育-独家推荐插图

列表翻页配置如下：

新浪博客-教育-独家推荐插图1

中国新闻网

2020-03-12兔子大叔阅读(1089)

网页数据采集模板简介

采集的内容为：中国新闻网

入口链接：http://www.chinanews.com/scroll-news/news1.html

主要数据字段：标题，作者，发布日期，内容，描述，关键词，标签，分类

主要数据截图：

中国新闻网插图

同花顺-财经

2020-03-12兔子大叔阅读(1062)

网页数据采集模板简介

采集的内容为：同花顺-财经

入口链接：http://news.10jqka.com.cn/today_list/

主要数据字段：标题，作者，发布日期，内容，描述，关键词，标签，分类

主要数据截图：

同花顺-财经插图

虎嗅-首页资讯-版本2

2020-03-12兔子大叔阅读(1176)

网页数据采集模板简介

采集的内容为：虎嗅-首页资讯-版本2

入口链接：https://www.huxiu.com/

主要数据字段：标题，作者，发布日期，内容，标签，描述，关键字

主要数据截图：（由于虎嗅文章的图片有两种模板，该版本2为采集图片地址在src属性的文章模板）

I3uIJnzaAzau

虎扑NBA

2020-03-12兔子大叔阅读(1269)

网页数据采集模板简介

采集的内容为：虎扑NBA

入口链接：https://voice.hupu.com/nba

主要数据字段：标题，作者，发布日期，内容，描述，关键词，标签，分类

主要数据截图：

aymuiiMfMJFz

上一页
1
···
5
6
7
8
共 8 页

简数免费规则第8页

博客园-首页

中国教育在线-新闻中心

微信公众号文章采集

新浪博客-教育-独家推荐

如需采集新浪博客其它频道的内容，只需修改入口列表链接即可。（在该任务选项卡"采集更多网址配置"中配置）

中国新闻网

同花顺-财经

虎嗅-首页资讯-版本2

虎扑NBA

本站已收录采集规则模板分类（含官方）

点击进入简数采集器控制台

简数之家QQ

回顶部

简数免费规则 第8页

如需采集新浪博客其它频道的内容，只需修改入口列表链接即可。（在该任务选项卡"采集更多网址配置"中配置）

本站已收录采集规则模板分类（含官方）

点击进入简数采集器控制台

简数之家QQ

回顶部

简数免费规则第8页