仅仅通过UA来判断来访者是不是蜘蛛肯定是不行的,那只是请求中的一个字段而已,想填写什么都行,从国内的几个搜索引擎来说,只有360把自家蜘蛛服务器的ip地址段公布了出来,其他并不提供自家服务器的IP,不过都提供了另一个方法,那就是用rDNS来验证。 PHP有个函数,可以通过IP来反查域名,gethostbyaddr($ip) ,如果没有查到对应的域名就会返回输入的参数,也就是我们提供的IP; 并且,蜘蛛IP的rDNS都是有规则的,所以可以有以下代码:

2018年11月29日 9条评论 11451点热度 18人点赞 jlqwer 阅读全文

坑都在下面注释里了: 先来个示例文件,db是section,每个section有无数的key-value对 [db] server="127.0.0.1" user="root" password="root" 下面是代码:

2018年9月1日 0条评论 4025点热度 3人点赞 jlqwer 阅读全文

之前发布过PHP进行POST(GET)并获取返回值  一篇文章,如果不方便把一些参数直接写在html的form里,利用php来处理一些post请求并处理数据也是一个非常不错的方法。 服务端一个json_encode并打印,然后调用这个api的时候用php在服务器端用服务器发起post请求并接受解析json字符串,可是经过我json_decode之后得到的却是NULL,于是我打印了一下接收到的结果,结果应该是正确的,利用json_last_error发现返回代码是4,就是语法错误的意思,然后随便找了几个json校验的…

2018年8月11日 0条评论 4657点热度 1人点赞 jlqwer 阅读全文

emmmm,先上个效果图,是以时间为横坐标,温度为纵坐标(点击查看大图): 1.首先要有数据来源,嗯怎么来的就不说了,直接从读取数据库开始说。这一步是利用php实现,直接用php输出json格式的数据,方便后期处理;

2018年4月10日 1条评论 7456点热度 2人点赞 jlqwer 阅读全文

其实这件事情用Python做挺好,但某些情况下用PHP更方便(而且我感觉用到数据库的时候两者速度相差很大),更直观。问:如果想用简单的web方式来实现,一个html from表单就解决问题吗?当然是“一个”表单解决不了啦(没有教大家做坏事的意思),不多说废话,直接上代码好了。

2018年4月8日 0条评论 6400点热度 4人点赞 jlqwer 阅读全文

最近发现日志里有很多没见过的蜘蛛UA,基本上都是国外的一些搜索引擎,或者很本不是搜索引擎,有的抓取频率很高,刚开始设置了下robots.txt,因为他们首先都抓取了robots.txt,应该是遵守规则的,没想到人家只是走个过场,并没有把robot.txt放在眼里。 记得Apache可以用.htaccess文件来通过useragent来屏蔽一些访问,搜了一下,大概可以这么做:

2018年4月6日 0条评论 6654点热度 2人点赞 jlqwer 阅读全文
12