手机浏览 RSS 2.0 订阅 膘叔的简单人生 , 腾讯云RDS购买 | 超便宜的Vultr , 注册 | 登陆
浏览模式: 标准 | 列表2024年11月的文章

basename的郁闷

又是basename,其实真的不想谈它,只是这两天在修正neatpic的BUG时,又被它折腾了。
前两天有朋友在回复里说,还是对中文处理一下吧。所以,我想了想,对中文又重新更新了下,结果问题就来了。我明明文件名是:“图片2副本.jpg”,但在cache之后就成了“2副本.jpg”,2前面的图片两个字就没有了。。这个,也太妖异了。得,你说不支持中文吧,干脆连后面的副本也没有就算了。却偏偏把前面的中文去掉了。

后来用pathinfo也测试了一下,同样的问题。。。

但是我在win服务器下却一切正常。后来我检查了一下我的WEB服务器,我的版本是5.2.6,

测试代码:echo basename('E:/test/图片2副本');点击查看测试页

这个真叫一个妖啊。。。

所以我现在是:str_replace(dirname($filename).DIRECTORY_SEPARATOR,'',$filename);

希望遇到同样问题的能够再次避免吧。。

 

Tags: basename, pathinfo

集体智慧编程笔记(一):相似度算法

本文内容全部来自《集体智慧编程》一书,原书采用的是python,因为没有python编程环境,所以用PHP实现

PHP代码
  1. <?php  
  2. //filename:test_collecting_preferences  
  3. //数据和代码来自《集体智慧编程》  
  4. //原文采用python实现,尝试用PHP进行转换  
  5. //@description 搜集用户偏好寻找相近用户  
  6. $datalist = array(  
  7.     'Lisa Rose' => array(  
  8.         'Lady in the Water' => 2.5,  
  9.         'Snake on a Plane' => 3.5,  
  10.         'Just My Luck' => 3.0,  
  11.         'Superman Returns' => 3.5,  
  12.         'You, Me and Dupree' => 2.5,  
  13.         'The Night Listener'=> 3.0  
  14.     ),  
  15.     'Gene Seymour' => array(  
  16.         'Lady in the Water' => 3.0,  
  17.         'Snake on a Plane' => 3.5,  
  18.         'Just My Luck' => 1.5,  
  19.         'Superman Returns' => 5.0,  
  20.         'You, Me and Dupree' => 3.5,  
  21.         'The Night Listener'=> 3.0  
  22.     ),  
  23.     'Michael Phillips' => array(  
  24.         'Lady in the Water' => 2.5,  
  25.         'Snake on a Plane' => 3.0,  
  26.         'Superman Returns' => 3.5,  
  27.         'The Night Listener'=> 4.0  
  28.     ),  
  29.     'Claudia Puig' => array(  
  30.         'Snake on a Plane' => 3.5,  
  31.         'Just My Luck' =>3.0,  
  32.         'Superman Returns' => 4.0,  
  33.         'You, Me and Dupree' => 2.5,  
  34.         'The Night Listener'=>4.5  
  35.     ),  
  36.     'Mick LaSalle' => array(  
  37.         'Lady in the Water' => 3.0,  
  38.         'Snake on a Plane' => 4.0,  
  39.         'Just My Luck' => 2.0,  
  40.         'Superman Returns' => 3.0,  
  41.         'You, Me and Dupree' => 2.0,  
  42.         'The Night Listener'=> 3.0  
  43.     ),  
  44.     'Jack Matthews' => array(  
  45.         'Lady in the Water' => 3.0,  
  46.         'Snake on a Plane' => 4.0,  
  47.         'Superman Returns' => 5.0,  
  48.         'You, Me and Dupree' => 3.5,  
  49.         'The Night Listener'=> 3.0  
  50.     ),  
  51.     'Toby' => array(  
  52.         'Snake on a Plane' => 4.5,  
  53.         'Superman Returns' => 4.0,  
  54.         'You, Me and Dupree' => 1.0,  
  55.     ),  
  56. );  
  57. //欧几里德距离  
  58. //它以经过人们的一致评价的物品为坐标轴,然后将参与评价的人绘制到图上,并考查他们彼此间的距离远近。  
  59. //偏好越相似的人,距离越近。不过我们还需要一个函数来对偏好越相近的情况给出越大的值,  
  60. //为此我们可以将函数值加1(这样可以避免遇到被零整除的错误),并取其倒数  
  61. //公式是 1 / (1 + sqrt (  pow( data[a][1] - data[b][1] .... )  ))  
  62. function sim_distance ( $datalist , $person1 , $person2)  
  63. {  
  64.     $si = array();  
  65.     foreach ( $datalist[$person1as $moviename => $grade ){  
  66.         ifarray_key_exists$moviename$datalist[$person2] )){  
  67.             $si[$moviename] = 1;  
  68.         }  
  69.     }  
  70.     ifemptyempty$si )){  
  71.         return 0;  
  72.     }  
  73.     $powers = 0;  
  74.     foreach ( $si as $moviename=>$val ){  
  75.         $powers += pow( ($datalist[$person1][$moviename] - $datalist[$person2][$moviename] ), 2 );//两者影评分数相减的平方值  
  76.     }  
  77.     return 1 / (1+ sqrt($powers));  
  78. }  
  79. //测试 'Lisa Rose' 和 'Gene Seymour' 的相似度评价  
  80. //原书上求出来是 0.29429805508554946 , PHP 的结果是 0.29429805508555,默认精度没有python高  
  81. echo( sim_distance( $datalist , 'Lisa Rose' , 'Gene Seymour') );  
  82. echo'<br/>' );  
  83.   
  84. //皮尔逊相关系数  
  85. //该相关系统是判断两组数据与某一直线拟合程序的一种度量。对应的公司比欧几里德距离评价的计算公式要复杂  
  86. //但是它在数据不是很规范时(如影评者对影片的评价总是相对于平均水平偏离很大),会倾向于给出更好的结果  
  87. //皮尔逊相关度评价法首先会找出两位评论者都曾评过的物品  
  88. //计算两者的评分总和与平方和,并求得评分的乘积之和,最后,利用这个结果计算出相关系数  
  89. function sim_person ( $datalist ,$person1 , $person2)  
  90. {  
  91.     $si = array();  
  92.     foreach ( $datalist[$person1as $moviename => $grade ){  
  93.         ifarray_key_exists$moviename$datalist[$person2] )){  
  94.             $si[$moviename] = 1;  
  95.         }  
  96.     }  
  97.     ifemptyempty$si )){  
  98.         return 1;  
  99.     }  
  100.     $n = count$si );  
  101.     $sum1 = $sum1Sq = $sum2 = $sum2Sq = $pSum = 0;  
  102.     foreach ( $si as $moviename => $val ){  
  103.         $sum1 += $datalist[$person1][$moviename];   //个人影评分数累加  
  104.         $sum1Sq += pow( $datalist[$person1][$moviename], 2 );//个人影评分数平方的累加  
  105.         $sum2 += $datalist[$person2][$moviename];  
  106.         $sum2Sq += pow( $datalist[$person2][$moviename], 2 );  
  107.         $pSum += ( $datalist[$person1][$moviename] * $datalist[$person2][$moviename]);//两人影评之乘积  
  108.     }  
  109.   
  110.     $num = $pSum - ( $sum1 * $sum2 / $n); // 正常情况下,我怎么都觉得这是1吧?  
  111.     $den = sqrt( ( $sum1Sq - pow( $sum1, 2 ) / $n) * ( $sum2Sq - pow( $sum2, 2 ) / $n) );  
  112.     if ( $den == 0 ){  
  113.         return 0;  
  114.     }  
  115.     return ($num / $den );      
  116. }  
  117. //继续测试 'Lisa Rose' 和 'Gene Seymour' 的相似度评价  
  118. //原书上求出来是 0.396059017191 , PHP 的结果是 0.39605901719067,这回。。。位数超过了python  
  119. echo( sim_person( $datalist , 'Lisa Rose' , 'Gene Seymour') );  
  120.   
  121. ?>  

有点长,随便看看吧

Tags: 算法

杂谈:邮箱

谈这个话题确实有点无聊,但总觉得不吐不快吧。
从08年开始仿佛是有了一个自己的邮箱,但现在看来总感觉不真实,那时候有了邮箱,还得学会outlook,看着一封封进来,感觉当然不一样。虽然,邮件进来的很少。

当时申请了好多好多邮箱,只是用到现在的也就是搜狐、新浪、网易的(这三个都是00年左右申请的了),东方网上线后还申请了一个Easyday.com的邮箱。

再后来有了yahoo的邮箱和gmail的邮箱。hotmail也是。这三个都是差不多在04、05年左右的了。gmail邮箱的出现,引出了邀请这个概念,当初为了得到邀请还在这边求那边要的。

用了这么久,谈谈感觉吧。。。

yahoo是最早推出虚拟邮箱(这个名字是我乱写的,11爷建议叫邮箱别名)。比如我注册 aaa@yahoo.com.cn,我可以自己分配几个虚拟名:bbb@yahoo.com.cn,和ccc@yahoo.com.cn,这样,我就可以给不同的人不同的邮箱。邮件也不会搞乱了,但事实上采用这个功能的人很少吧。 yahoo还是较早有邮件过滤功能的,这个一般是在客户端软件中才有的功能,他的WEB版也是早就有了。

gmail在08、09年(?)推出了邮件的标签功能,方便你分门别类的整理。

网易的邮箱我也是一直喜欢用,清新、速度快、垃圾邮件少。只是近来好象不咋地了。不如QQ邮箱了。QQ邮箱,几乎没有广告。难道是和他们庞大的用户有关?(方便收集整理学习垃圾邮件的状态?)

gmail也是几乎没有垃圾邮件的。或者说我看不到。。。

而yahoo是我收到邮件中垃圾邮件最多的,一些正常的邮件会被送进垃圾邮件箱,而没有任何提示,相反一些中奖信息却成天霸占着我的收件箱,即使点了举报也没用。反正三天两头的,不是雅虎欢乐送,就是欧洲大奖上亿美元或欧元,偶尔也会收到香港发来邮件说我透支消费,让我把信用卡密码发到XXX银行指定邮箱进行检查之类的。我就想不通了。为什么这些不能被认为是垃圾邮件?得,欧洲大奖不行,香港信用卡不行,雅虎欢乐送的内容几乎每次都一样,用户名称也都是雅虎管理员之类的,为什么这样还不能定性?

发泄一下,没有其他想法,不说搜狐和新浪,是因为这两个邮箱我是几乎不用的。除了用来登录一下校友录、微博外,其他还真没用过,也没有对外面公开过。

Tags: 邮箱, 垃圾邮件

杂谈:Zend Studio 惊爆严重安全漏洞,系国内黑客首先发现

我是在cnbeta上看到这个新闻的,不过看到这个新闻后我也有疑问,这真的算是BUG吗?还是。。。要知道注释这个东西,本来就是允许你写上html代码让你在生成DOC的时候可以以特定的格式进行输出
不过,文中所说的内容,想来应该确实算是漏洞,但我本身都是在使用zend了,还有什么不可以使用系统变量或者权限呢?随便说说。。
只是看到这个的时候,我不知道phpdoc会怎么样,他会有同样的漏洞吗?他根据图片中的注释,会生成弹出计算器的doc文档吗??

新闻如下:
著名安全从业人员Saiy于2010年7月10日在安全网站80vul.com发布了Zend Studio的安全漏洞。 通过这个漏洞,可以在操作系统中执行任意命令。 在Zend Studio 6.0以上版本中,如果开发者开启了自动提示的功能,那么在一份存在问题的工程文件里(可能是别有用心者提供的),开发者就很可能触发这个漏洞,以执行他 人指定的代码。 文章中进行了案例演示。代码中定义了一个名为A的函数,那么只要在编辑区域输入A即触发此函数,此函数启动了 Windows系统中自带的计算器软件,那么同理,它可以启动任何一个软件,也可以执行任意其他的命令…… 目前Zend公司还没有对此安全漏洞作出任何反应。 建议相关开发者关闭自动提示的功能。
大小: 122.17 K
尺寸: 500 x 282
浏览: 2090 次
点击打开新窗口浏览全图
原文地址(英文): http://80vul.com/Zend%20studio/Zend%20studio%20location%20Cross.htm

Tags: php, zend, zendstudio

高级PHP应用程序漏洞审核技术

不管是初学者还是老鸟,了解一下会有很多好处,比如里面介绍的,从URL传递global变量,比如5.26前的mt_rand的BUG等等。比如urldecode处理%2527会变成单引号,比如。。。实在太多了,或许程序真的没问题,但有问题的可能是PHP自己。
了解一下,可以让代码中更少漏洞吧?

原文很长,我这里也只是把目录贴一下,如果你真的有兴趣,不妨去看看全文

如果你有自己的想法,也可以尝试提交你的建议到该项目中去

Tags: 漏洞, 代码审核