迷城网络 - 专注于中小企业Linux运维服务

当前位置: 迷城网络 > 建站程序 >

DEDE采集规则过滤与替换

时间:2019-03-27 10:51来源: 作者: 点击:
1,去除超链接,这种最常用。 {dede:trim replace=}a([^]*){/dede:trim} {dede:trim replace=}/a{/dede:trim} 如果填成这样,那就把链接的文本也一起去掉了 {dede:trim replace=}a([^]*)(.*)/a{/dede:trim} 2,过滤JS调用广

1,去除超链接,这种最常用。 {dede:trim replace=''}<a([^>]*)>{/dede:trim}

{dede:trim replace=''}</a>{/dede:trim}

如果填成这样,那就把链接的文本也一起去掉了 {dede:trim replace=''}<a([^>]*)>(.*)</a>{/dede:trim}

2,过滤JS调用广告,比如GG的广告,就加个这样的: {dede:trim replace=''}<script([^>]*)>(.*)</script>{/dede:trim}

3,过滤div标签。这个很重要,如果没过滤干净则可能使发布出来的文章版面错位,目前大多数遇到后错位的原因在此。 {dede:trim replace=''}<div([^.]*)>{/dede:trim}

{dede:trim replace=''}</div>{/dede:trim}

有的时候也需要这样子过滤: {dede:trim replace=''}<div 选择器>(.*)</div>{/dede:trim}

4,其它的过滤规则可以照以上规律进行推出。

5,过滤摘要和关键字使用,经常要用到。 {dede:trim replace=''}{/dede:trim}

6,简单替换。

{dede:trim replace='替换后的词语'}要替换的词语{/dede:trim}

采集的内容当然也要求收录,过滤和替换目的是减少重复,进行伪原创,如何具体的操作,就看个人的要求与喜好了。


(责任编辑:迷城网络科技)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
栏目列表
推荐内容