署理加盟 2019全新署理方案 挣钱+省钱左右开弓,独立渠道,丰盛赢利!

您现在的方位: unibet网 > 织梦大学 > 织梦收集 >

DeDeCMS织梦后台自带收集器收集教程事例共享

来历:不知道 发布时刻:2019-04-13热度:我要谈论
前面几篇文档,咱们介绍了 织梦自带收集器运用教程 ,可是不是每个用户都能够用都好,总归收集这个东西要实站堆集经历才行,由于方针站代码不同,只要碰到不同的问题堆集起来才干上手操作。 第一步、咱们翻开织梦后台点击收集收集节点办理添加新节点 第二步、新增节点-...

unibet注册unibet淘宝店开业,好礼送不断

前面几篇文档,咱们介绍了织梦自带收集器运用教程,可是不是每个用户都能够用都好,总归收集这个东西要实站堆集经历才行,由于方针站代码不同,只要碰到不同的问题堆集起来才干上手操作。

第一步、咱们翻开织梦后台点击收集——收集节点办理——添加新节点

 

第二步、新增节点-装备网址索引

填写要收集的网站的列表相关规矩,

检查收集站点的编码和

咱们右键单击,点击检查源码,在源码的最初方位,找到一个写有charset=某一编码的meta标签,比方charset="gb2312",这个便是所说的网站编码了

 

 

挑选收集站点的编码

 

 

第三步、新增节点-装备文章网址匹配规矩

咱们检查收集站点的列表页源码,找到文章列表开端html和完毕html标签,分别把它们仿制到添加收集节点->文章网址匹配规矩的"区域开端的HTML"和“区域完毕的HTML”输入框中。你不一定挑选右键检查源码来找到文章列表开端标签,你能够在文章开端的当地右键单击,检查元素(chrome浏览器,firefox是检查元素),这样就更便利的找到文章列表开端和完毕的标签了。

设置之后咱们点击"保存信息并进入下一步设置"

 

 

第四步:网址获取规矩测验

假如在测验成果发现有无关的网址信息,阐明的第五步中的网址过滤规矩有误或许没有填写过滤规矩。假如发现收集有误,你能够回来上一次修正,没有就点击“保存信息并进入下一步设置”。

 

第五步:内容字段获取规矩

咱们检查收集站点的文章源码,找到相关选项的开端和完毕html标签,填写入指定方位,开端和完毕标签以"[内容]"分格。

设置完毕,咱们点击"保存装备并预览"

 

第六步:过滤规矩

在第七步中的匹配规矩后边,都 有一个过滤规矩,这个过滤规矩是用来过滤无需收集的内容。

比方,网易每篇文章都有一个放置广告的iframe标签,咱们要收集网易的文章,不可能收集回来之后,一篇一篇得去删去这个广告。可是怎么去除呢?去除办法便是那个过滤规矩,咱们点击常用规矩,就会弹出一个小窗口,列出了常用的过滤规矩,咱们只需点击要们要过滤的规矩即可,要过滤网易文章中的iframe标签,咱们就点击iframe即可。

测验内容字段设置

由于网易有的文章最初是<div id="endText">,有的文章最初是<div id="endText" class="end-text">,所以会呈现收集犯错的状况。

假如你现在就要收集,你能够点击保存并收集。这儿我挑选仅保存

收集内容(一)

回到收集节点办理的界面,也便是第一步中的界面,咱们挑选节点,点击收集

 

收集内容(二)

 

 

检查已下载

能够在收集界面(即第十步中的界面)的右上角,点击“检查已下载”。也能够在“收集节点办理”的界面里点击“检查已下载”。这儿以第二个办法为例。

导出内容

挑选要导入到的栏目,数据量,是否生成html文件 ,随机引荐数量

终究成果

 

本文地址:https://www.m88nob1.com/dedecms_cj/1636.html

    责任编辑:unibet网

    宣布谈论

    谈论列表(条)