deituiCMS采集插件教程之数据提取模式说明
查看视频教程或者获取有关《deituiCMS采集插件教程》更多信息

deituiCMS采集插件数据提取模式说明

一、基本规则

c=>>

c=>><div class="news_list"> 根据html裁剪
a=>><a href="({url=.*})".*>({title=.*})</a> 根据正则匹配
r=>><p style="text-align:center;"> 根据html删除内容
rp=>><a href="[^"]*">向作者提问</a> 根据正则删除内容


二、标签语法

({key=正则表达式}) 根据key可以匹配多个字段

系统采集表字段

({url=.*}) 匹配url

({title=.*})匹配标题

({imgurl=.*})匹配封面图片

({content=.*})匹配内容

三、正则表达式

.*匹配任意字符
[\d]+匹配数字
[\d\.]+匹配小数点和数字
[\w]+匹配英文字符