一直都没有用过采集,昨天体验了一把织梦自带的采集功能,感觉效果杠杠的。但是也有一些问题很快就凸现出来了。例如利用织梦采集功能自带的过滤超链 接规则时,会直接将链接文本内容也过滤掉,这样就造成了采集文章的不完整,给文章阅读用户带来不好的体验。而我们需要达到的只是删除超链接的效果。
织梦默认的过滤超链接规则如下:
{dede:trim replace=”}<a([^>]*)>(.*)</a>{/dede:trim}
在网上查找后发现,只需将以上的过滤规则改为如下的过滤规则,就能完美的解决过滤超链接同时保留文本的问题。
{dede:trim replace=”"}<(|/)a([^>]*)>{/dede:trim}
{dede:trim replace=”}<a([^>]*)>(.*)</a>{/dede:trim}
在网上查找后发现,只需将以上的过滤规则改为如下的过滤规则,就能完美的解决过滤超链接同时保留文本的问题。
{dede:trim replace=”"}<(|/)a([^>]*)>{/dede:trim}
转载请注明出处。