手机浏览 RSS 2.0 订阅 膘叔的简单人生 , 腾讯云RDS购买 | 超便宜Qcloud , 注册 | 登陆
浏览模式: 标准 | 列表2012年05月8日的文章

开发中的几件事

开发中又遇到一些事情,于是记录一下
1、CURL的问题
    curl在安全模式下或者设定了open_basedir的情况下,如果使用了OPT_FOLLOWLOCATION,会导致无返回值。这个理由很多,但FOLLOWLOCATION这个参数是用于目标网址会多次跳转而使用,还可以设置最大跳转次数,因此,如果你要抓取的对象有多次跳转,这个参数就非设不可(真纠结,实在不行就file_get_contents了,它自动支持多次跳转,但不如curl更可控一些)
    具体关于CURL的一些常用参数,可以看这里:

http://opensuse.iteye.com/blog/349829
  1. curl_setopt($ch, CURLOPT_HTTP_VERSION, CURL_HTTP_VERSION_1_1);       
  2. //HTTP协议的版本号  
  3. curl_setopt($ch, CURLOPT_NOPROGRESS, 1);                             
  4. //如果你不会PHP为CURL传输显示一个进程条,设置这个选项为一个非零值。注意:PHP自动设置这个选项为非零值,你应该仅仅为了调试的目的来改变这个选项。  
  5. curl_setopt($ch, CURLOPT_NOBODY, 0);  
  6. //如果你不想在输出中包含body部分,设置这个选项为一个非零值。  
  7. curl_setopt($ch, CURLOPT_HTTPGET, 1);  
  8. //设置HTTP请求的方法为GET  
  9. curl_setopt($ch, CURLOPT_ENCODING, ”);  
  10. //设置HTTP请求头中可接受的压缩格式  
  11. curl_setopt($ch, CURLOPT_COOKIEFILE, 1);  
  12. //传递一个包含cookie数据的文件的名字的字符串。这个cookie文件可以是Netscape格式,或是堆存在文件中的HTTP风格的头。  
  13. curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);  
  14. //设置这个选项为一个非零值(象 “Location: “)的头,服务器会把它当做HTTP头的一部分发送(注意这是递归的,PHP将发送形如 “Location: “的头)。  
  15. curl_setopt($ch, CURLOPT_MAXREDIRS, 3);  
  16. //最多可以进行几次HTTP重定向,一般和curl_followlocation联用  
  17. curl_setopt($ch, CURLOPT_USERAGENT, ‘Mozilla/4.0 (compatible; MSIE 5.00; Windows 98)’);  
  18. //在HTTP请求中包含一个”user-agent”头的字符串  
  19. $http_header = array();  
  20. $http_header[] = ‘Connection: Keep-Alive’;  
  21. $http_header[] = ‘Pragma: no-cache’;  
  22. $http_header[] = ‘Cache-Control: no-cache’;  
  23. $http_header[] = ‘Accept: */*’;  
  24. $http_header[] = ‘Host: ‘.$url_ary['host'];  
  25. curl_setopt($ch, CURLOPT_HTTPHEADER, $http_header);  
  26. //一个数组格式的HTTP头文件格式  
  27. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);  
  28. //将curl_exec的返回值转换成一个字符串,而不是直接输出出来  
  29. curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);  
  30. //设置一个长整形数,作为最大延续多少秒  
  31. curl_setopt($ch, CURLOPT_REFERER, $url);  
  32. //在HTTP请求中包含一个”referer”头的字符串  
  33. curl_setopt($ch, CURLOPT_URL, $url);  
  34. //这是你想用PHP取回的URL地址。你也可以在用curl_init()函数初始化时设置这个选项  


2、命令下行指定用户组来执行命令
最偷懒的方法就是:su www -c 'php xxx.php'

3、hightman遇到的Javascript函数parseInt(''),返回NaN,这个让我想起有个人做了一个PPT,来说明JS中的一些特殊问题,它的地址是:http://neatstudio.com/show-1987-1.shtml

4、PHP的header跳转
大家都知道header("Location:http://xxx.xxx.com");在这个之后如果你file_put_contents内容去一个文件,还是会被执行的,于是我们习惯性的在header跳转后继续处理一些内容,即不影响跳转,也可以完成一些内容性的处理。
但尝试了一下,如果是header()下面跟上sleep(10);你会发现header不会即刻跳转了,会等10秒后再跳转。
因此,现在了解header跳转还是会受原有代码的影响的。

5、HTML5的a标签属性ping
ping的属性说的很好,当a有href属性时,如果有ping属性,会在跳转链接时候,自动ping网站(ping标签中的对应网站),但测试了一下之后发现。居然没用。查看了一下资料,我操:

6.6 Changes from 4 March 2010 to 24 June 2010

  • The ping attribute has been removed from the W3C version of HTML5.

我郁闷啊。。。

-------EOF------

Tags: curl

开发中的一些注意事项

开发中遇到一些问题,值得记住,所以我记录了一下
1、在项目中为了取得泛域名的前缀网址,这个前缀是指定的a,b,c三种,如果前缀不在这三种之内,默认为a,在apache下面的时候,建了一个*.test.neatstudio.com的泛域名指到vhost中。然后用偷懒的方法list(explode(".",$_SERVER['SERVER_NAME']))就取到了a,b,c,因为在apapche中,$_SERVER['SERVER_NAME']就是实际的a.test.neatstudio.com。然而到了nginx下行不通了。在nginx下,$_SERVER['SERVER_NAME']居然还是test.neatstudio.com,最后打印$_SERVER变量,发现$_SERVER['SERVER_HOST']才是泛域名的a.test.neatstudio.com。在此做一个记录

2、chown处理大量小文件时,你就等着CPU标高100%吧。这个问题很痛苦,但没办法

3、我晶。我记得要写一个很重要的笔记 的。我TMD又忘了。被第一个问题打断了。我晶啊,算了。等想起来再说吧

Tags: nginx, apache