经常在采集文章的时候,标题文字里面有空格,采回来后应用很是麻烦,所以需要在过滤处添加下面正则过滤。
{dede:trim} {/dede:trim}
二:过滤来源作者中连接
在采集文章的时候,有的系统里面作者或者来源处都有连接,直接采集的话将连接采集回来了,然后由于这两个字段有限制,通常会造成需要采集的内容没有采集回来,所以需要在过滤处添加下面正则过滤
三:过滤文章内容中连接以及其他广告代码{dede:trim}]*)>([^<]*){/dede:trim}
实际应用中,我们只需要对连接、动画、调用等进行过滤。 一般的只有链接,使用二中的代码进行过滤就可以了,但是实际上一般的网站现在都在内容里面加有广告等,所以采取下面的过滤正则就可以完成过滤:
{dede:trim}]*)>([^<]*){/dede:trim} {dede:trim}