提供免费采集规则
简数采集平台服务推广站

东方财经网-要闻

兔子大叔阅读(1692)

网页数据采集模板简介

采集的内容为:东方财经网-要闻

入口链接:http://www.dfcj.net/news/

主要数据字段:标题,作者,发布日期,内容,描述,关键词,标签,分类

主要数据截图:东方财经网-要闻插图

36氪

兔子大叔阅读(1788)

网页数据采集模板简介

采集的内容为:36氪

入口链接:https://36kr.com/

主要数据字段:标题,作者,发布日期,内容,描述,关键词,标签,分类

主要数据截图:

36氪插图

房多多-头条

兔子大叔阅读(1728)

网页数据采集模板简介

采集的内容为:房多多-头条

入口链接:https://shenzhen.fangdd.com/news/list.html

主要数据字段:标题,作者,发布日期,内容,描述,关键词,标签,分类

主要数据截图:

房多多-头条插图

育儿网-资讯

兔子大叔阅读(1649)

网页数据采集模板简介

采集的内容为:育儿网

入口链接:http://news.ci123.com/category/news

主要数据字段:标题,作者,发布日期,内容,描述,关键词,标签,分类

主要数据截图:

育儿网-资讯插图

寻医问药-资讯

兔子大叔阅读(1709)

网页数据采集模板简介

采集的内容为:寻医问药

入口链接:http://club.xywy.com/zixun/

主要数据字段:标题,作者,发布日期,内容,描述,关键词,标签,分类

主要数据截图:

寻医问药-资讯插图

环球网 - 首页

兔子大叔阅读(1750)

网页数据采集模板简介

环球网-首页主要数据如下:

环球网 - 首页插图

今日头条-环球网

兔子大叔阅读(1854)

网页数据采集模板简介

【通用】采集今日头条新闻文章,可按头条号ID、新闻分类ID或者关键词进行采集。

    可以同时使用多个ID或关键词,多个用逗号,分隔即可。(是半角逗号);


入口链接:https://www.toutiao.com/

默认采集字段:

今日头条号名称(x_name),头条号ID(x_id),标题(title),正文(content),发布日期(pubData),作者(author),标签(tag),描述(description)和关键字(keywords);

该模板以采集环球网头条号1页数据为例,可以更改为其他头条号ID、新闻分类ID或者关键词;

主要数据截图:
今日头条-环球网插图

采集今日头条注意事项:

1. 采集的是今日头条“新闻”,每页可能采集到20条;

2. 今日头条采集可能受IP代理可用性或网络状态影响,有时可能获取不到数据,建议重试。

3. 今日头条新闻采集为单独收费项目,服务费:0.05币/1条。

4. 配置详情可看帮助文档-今日头条采集

点击进入简数采集器控制台

控制台