deituiCMS采集插件教程之数据提取模式说明
deituiCMS采集插件数据提取模式说明
一、基本规则
c=>>
c=>><div class="news_list"> 根据html裁剪 a=>><a href="({url=.*})".*>({title=.*})</a> 根据正则匹配 r=>><p style="text-align:center;"> 根据html删除内容 rp=>><a href="[^"]*">向作者提问</a> 根据正则删除内容
二、标签语法
({key=正则表达式}) 根据key可以匹配多个字段
系统采集表字段
({url=.*}) 匹配url
({title=.*})匹配标题
({imgurl=.*})匹配封面图片
({content=.*})匹配内容
三、正则表达式
.*匹配任意字符 [\d]+匹配数字 [\d\.]+匹配小数点和数字 [\w]+匹配英文字符