• kk软件交流Q群:283747014
  • 点击加入kk软件使用交流
😁
少侠 何事如此惊慌
1.
表格数据自动录入到后台
可用 KK自动录入工具 自动填写网页自动录入
也可通过 KK万能采集 批量向服务器发送数据包自动录入(可显示录入结果)
2.
网站有更新的新文章,自动提醒(弹窗+发到手机)
当发现网站更新了,会自动抓取新资讯 标题+链接,并提醒你,KK网站资讯监控卡卡新文章提醒工具,均可做到,推荐使用前者。后者不易上手
适用于 薅羊毛、新闻小编、招标信息 及时了解市场行情 等使用人群与场景
3.
将网站信息,批量导到表格中(采集网站内容到表格)
批量采集页面固定区域内容,导出到表格,
导出多个页面的列表信息(标题/链接/内容/时间)到表格,
4.
网页局部信息变动弹窗提醒
应用场景:适用于监控价格变化、某主播上线提醒 等 ,kk网页变动提醒工具
5.
向Aria2下载器,批量投递任务
将excel表格的 下载链接和对应文件名 批量导入下载,泼猴下载器
软件视频教程合集:

虎嗅网(www.huxiu.com)最新文章匹配规则

842次浏览 更新日期:2020-11-08 22:34:49 分类:旧帖留档 评论:0

空中小白 2016-10-23 23:02:52

网站介绍:虎嗅网是一个有视角的、个性化商业资讯与交流平台,核心关注对象是包括公众公司与创业型企业在内的一系列明星公司


今天看了视频教程,然后自己折腾,弄了半个小时,一直提示截取源码为空,后面才找到原因,原来我用的是中文结束标记匹配,而网页GBK编码没勾掉,因为我监控的是utf-8格式的网页,大家别像我一样啊。

然后又遇到问题了,标题明明按教程一样用的万能匹配符 (.*?),但是其它信息能出来,就是看不到标题,百度又找了原因,最后看百度知道看到的回答,又在</h2>前加了一次万能匹配,终于出自己想要的结果了。

弄的好累,不过幸好还是弄好了。

正则匹配规则:

引用:
<h2><a href=http://bbs.kakawz.com/333/"/article/(/d*).html(.*?)target="_blank">(.*?)(.*?)

SQL语句:
引用:

insert into rule(isdo,code,url,before,after,regular,buquan,cookie,tindex,uindex,oindex,ua,class,url,name,type) values('0','0','https://www.huxiu.com','mod-info-flow','点击加载更多','<h2><a href=http://bbs.kakawz.com/333/"/article/(/d*).html(.*?)target="_blank">(.*?)(.*?)','https://www.huxiu.com/article/[1].html','','3','1','1','Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 Safari/537.36 SE 2.X MetaSr 1.0',1,'https://www.huxiu.com','虎嗅网','0')


我自己测试正常,能提取文章,大家有需要的用吧:lol

空中小白 2016-10-23 23:04:33
感谢能这么快审核了,这个网站匹配的有难度啊,发出来以后我有用时候再来复制回去,做个备忘


admin 2016-10-23 23:06:42

引用:
空中小白 发表于 2016-10-23 23:04
感谢能这么快审核了,这个网站匹配的有难度啊,发出来以后我有用时候再来复制回去,做个备忘


多谢能分享规则给大家 我还在论坛上 一刷新提醒有新审核 所以审核的快 运气好 :victory:

超级大鸡吧 2016-10-24 22:03:47
我自己做了半天都失败了,难哦


空中小白 2016-11-01 21:13:52

引用:
超级大鸡吧 发表于 2016-10-24 22:03
我自己做了半天都失败了,难哦


呵呵。加油{:bigsmile:}

fhqswcan 2016-11-11 16:36:11
能把 2.1的数据库共享下吗


38722856 2018-08-02 11:42:38
{:ladyvam:}新学员崇拜


我来说两句
发布新帖
版主信息