帝国cms采集常用技巧
时间:2018-01-20 点击:
次 发布者:佚名 - 小 + 大
1、过滤文章内容的 | 广告正则:“<a [!--ad--]>”;调换“</a>”为空。 | 2、同上班得出,过滤font之类的标签: | 广告正则:“<font[!--ad--]>”;调换“</font>”为空。其他依此类推。 | 3、扫除采集时的空白内容的数据: | “在统设置”-》“履行SQL语句”运行下面SQL语句即可: delete from phome_ecms_news where newstext=''; | 4、同一链接的页面如何二次采集: | 到“管理采集节点”那清空节点即可。 | 采集的一些特别字段阐明: | 1、“下载地址正则”、“在线观看地址正则”、“图片集正则”。 | 阐明:下面的两个正则是离开的,并且是用“[!empirecms!]”格开。 | 下载地址正则 | 格式:地址正则([!--ecmsdownpathurl--])[!empirecms!]名称正则([!--ecmsdownpathname--]) | 阐明:名称正则可以不设置,由在统本人命名。 | 在线观看地址正则 | 格式:地址正则([!--ecmsonlinepathurl--])[!empirecms!]名称正则([!--ecmsonlinepathname--]) | 阐明:名称正则可以不设置,由在统本人命名。 | 图片集正则 | 格式:缩略图([!--ecmsspicurl--])[!empirecms!]大图([!--ecmsbpicurl--])[!empirecms!]名称([!--ecmspicname--]) | 阐明:大图与名称正则可以不设置。 | 2、只要字段“输入表单显示元素”是“图片(img)”、“FLASH文件”、“文件(file)”均支撑远程保存文件到本地。 | |