织梦系统是国内最早使用的cms系统,也是使用得最多的一款cms系统,织梦后台界面虽然算不上好看美观,但是逻辑结构还是很清楚,至少你可以花10分钟就可以熟悉整个后台基本操作,上手非常快!所以织梦也就适合新手入门使用,由于新手特别多很多人都不会使用织梦采集。今天就给大家聊聊织梦采集以及怎么全自动挂机织梦采集发布推送!
一、我们打开织梦后台点击采集——采集节点管理——增加新节点填写要采集的 站的列表相关规则,查看采集站点的编码和 站源码我们右键单击,点击查看源码,在源码的开头位置,找到一个写有charset=某一编码的meta标签,比如charset=”gb2312″,这个就是所说的 站编码了。在选择采集站点的编码
二、我们查看采集站点的列表页源码,找到文章列表开始html和结束html标签,分别把它们复制到增加采集节点->文章 址匹配规则的”区域开始的HTML”和“区域结束的HTML”输入框中。你不一定选择右键查看源码来找到文章列表开始标签,你可以在文章开始的地方右键单击,审查元素(chrome浏览器,firefox是查看元素),这样就更方便的找到文章列表开始和结束的标签了。设置之后我们点击”保存信息并进入下一步设置”
三、 址获取规则测试如果在测试结果发现有无关的 址信息, 址过滤规则有误或者没有填写过滤规则。如果发现采集有误,你可以返回上一次修改,没有就点击“保存信息并进入下一步设置”。
四、内容字段获取规则们查看采集站点的文章源码,找到相关选项的开始和结束html标签,填写入指定位置,开始和结束标签以”[内容]”分格
五、过滤规则如: 站每篇文章都有一个放置iframe标签,我们要采集 页的文章,不可能采集回来之后,一篇一篇得去删除这个广告。但是如何去除呢除方法就是那个过滤规则,我们点击常用规则,就会弹出一个小窗口,列出了常用的过滤规则,我们只需点击我们要过滤的规则即可,要过滤 站文章中的iframe标签,我们就点击iframe即可。。
四、第三方织梦采集软件兼容性的优势:
1、支持任意PHP版本
2、支持任意版本Mysql
3、支持任意版本Nginx
4、支持任意织梦CMS版本
不会因为版本不匹配,或者服务器环境不支持等其它原因导致采集不能使用
五、第三方织梦采集软件更容易上手
低门槛:无须花费大量时间学习软件操作,一分钟即可上手无需配置采集规则,输入关键词即可采集.
高效率:提供一站式 站文章解决方案,无须人工干涉,设定任务自动执行采集发布。
零成本:几百上千个不同的CMS 站都能实现统一管理。一个人维护成百上千 站文章更新也不是问题。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!