小旋风蜘蛛池如何写采集规则教程？-大海资源库

一、小旋风蜘蛛池如何采集标题

标题库采集还是很简单的，只需要设置一下采集源的地址就可以。

首先添加采集规则，选择文章标题。

分页的写法：

Markup

http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_{p,1,9,1}.shtml

{p,1,5,1}表示分页，参数：p后面的数字分别代表开始、结束、递增/减值，即{p,开始,结束,递增/减值}

Markup

http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_1.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_2.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_3.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_4.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_5.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_6.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_7.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_8.shtml
http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_9.shtml

测试规则的时候可以从网址匹配里看到。添加后，测试看看效果：

二、小旋风蜘蛛池如何采集句子及文章

添加规则：选择整篇内容或者句子段落

比如说我们要采集新浪新闻，地址是:https://news.sina.com.cn/，就在列表配置选项的匹配网址里填上以上地址。

打开采集源的地址，选择其中一篇新闻。复制它的链接地址。

这里的是地址是：https://news.sina.com.cn/c/2019-05-03/doc-ihvhiewr9625655.shtml

然后，内容匹配规则可以这样写

Markup

https://news.sina.com.cn/(w)/(d)-(d)-(d)/(w)-(w).shtml

内容截取规则：

打开内容地址。右键查看源码，找到内容区域。

然后内容截取规则可以这样写：

像新浪这种大型网站，它的内容页有些是不一样的，我们可以写多几个匹配。

保存后，看看效果。

注：您采集句子、文章的同时会自动采集到图片链接，所以不用担心您的内容库里面没有图片！

有问题及时联系站长，QQ：1240555208

更多优质资源在QQ群里，可以进群领取：467392290~

本站资源大多来自网络，如有侵犯你的权益请联系管理员 E-mail： 1240555208@qq.com 我们会第一时间进行审核删除。站内资源为网友个人学习或测试研究使用，未经原版权作者许可,禁止用于任何商业途径！请在下载24小时内删除！

如果遇到付费才可观看的文章，建议升级终身VIP。全站所有资源 “任意下免费看”。本站资源少部分采用 7z压缩，为防止有人压缩软件不支持7z格式，7z 解压，建议下载 7-zip ，zip、rar 解压，建议下载 WinRAR 。

THE END

教程采集教程
# 配置 # 源码 # 测试 # 采集 # 规则

小旋风蜘蛛池如何写采集规则教程？

一、小旋风蜘蛛池如何采集标题

二、小旋风蜘蛛池如何采集句子及文章

请登录后发表评论

大海资源库・vip.lzzcc.cn

关于我们

特色功能

用户服务

公众号

大海资源库最新的更新动态~

万兆网盘更新目录

美化教程

子比主题精品美化教程分享，萌新变大神

大海库-建站笔记

单机游戏

海量3A单机游戏，上千G网盘整合~

站内游戏库

TR-GAME

精品文章等您来关注