Submitted by gouki on 2008, October 25, 7:45 PM
alipay支持firefox是众所周知的事情了,前两天我还贴出了链接说明alipay现在也开始支持linux下的firefox了。
这是对大家都有利的事情,可惜alipay的这个插件的作者不知道是粗心还是什么,如果象绿色软件那样的安装firefox,那么该插件是不能被使用的。
即:如果你把firefox安装在d盘,然后你重装系统后,再次打开firefox(当然你原先装的插件啥的都没有了。。。fEBE可以备份,只是插件的相关配置是备份不了的),会认为你是新装firefox的。
如果这个时候,你去支付宝下载支持firefox的控件:npaliedit.exe,在安装的时候会提示你:安装程序并未检测到您的火狐浏览器安装目录,请安装火狐浏览器之后再运行安装程序!点击确定后就退出了。
这个时候怎么办?难道就不能使用了吗?想起了以前的解决方法,立马跑到:http://addons.mozilla.org/zh-CN/上面,搜索alipay,找到一个所谓在“沙盘”中的alipay控件,下载下来进行安装。终于解决了。。。。
由于mozilla需要登录才能下载,于是我把该文件放在了本地,希望可以给想使用的人带来方便。
点击进行下载:______________________alipay_security_control_-1.1.0.2-fx-win.xpi
Tags: alipay, 支付宝, firefox, 扩展, 解决
Software | 评论:0
| 阅读:22873
Submitted by gouki on 2008, October 24, 9:21 PM
在淘宝上想淘一个U1000的手机看看的,结果看到某报价:
点开后,发现上面写着:
按照该商家所写的链接,去看了一下该网址,哇塞,手机都好便宜啊,还有400电话呢,而且右上角还有:
哟,还有留言板?打开看看:
看来,真的是象淘宝上写的,商家是苏州的。。。
哇,周先生好辛苦啊,苏州南京经常跑
有两个买到货的哦。只是发现这两个人的IP都是联通的,而且都是福建泉州的
终于有人提出了疑问,看看是怎么回复的?哈哈
一般来说这种网站大概是在02、03年居多,想不过时隔5、6年,又复出了。
以前的电话都是089-8xxx-xxxx这样的,现在OK了,400电话,电信是否可以认作是协同XX呢?随便感慨感慨
Tags: 网站, taobao, 400电话, 广州, 苏州
Misc | 评论:5
| 阅读:22896
Submitted by gouki on 2008, October 24, 3:42 PM
Google Analytics一直为各个站长朋友提供着优质免费的服务,今天Google Analytics进行了比较大的更新,新的功能包括自定义报表,受众分析,Adsense分析,开放API,还有一些用户界面的更新.
1. 自定义报告: Lets you create reports using any source of data (such as people who have bought something on your site, average number of pageviews, geography, visiting source) as the X and Y coordinates for a chart.
2. 受众分析: Lets you look at custom slices of your Website’s audience (such as people who stay for more than two minutes, people who came from TechCrunch, people who came from the New York Times, people who bought something, people who came from Techcrunch and bought something).
3. Adsense集成: This was along time coming. You can already track how your AdWords campaigns impact traffic to your site. Now you can see data from your AdSense account as well. Marry that with Google Analytics data and you can get new insights into not only which ads you place through AdSense are doing the best, but from which referring sites. (Read more on the AdSense blog).
4. API: This will be rolling out “soon,’ but is also being announced today. Google will open up an API to Gogle Analytics that will allow developers to pipe all of the data in Google Analytics to other Websites, tools, widgets, or even mobile apps. So if someone wants to create a widget that will let people show their Google Analytics charts on their blog, that will be possible.
5. 气泡方式显示图表: The new motion charts allow you to visualize data across five dimensions (x axis, y axis, size of bubble, color of bubble, and position over time). It lets you create an animation to show you what’s been happening with your Website’s key metrics. This feature comes out of the Trendalyzer software Google bought from Gapminder in 2007. (See video below).
6. 用户界面优化: You’ll notice some new subtle shading and highlighting. But the biggest change will be in the management dashboard. Now, if you track more than one Website with Google Analytics, you will be able to see trends across all of them at once.
原文:http://www.cnbeta.com/articles/67788.htm
Tags: google, analytics, 统计, 优化, 更新
Software | 评论:0
| 阅读:21817
Submitted by gouki on 2008, October 23, 3:35 PM
小道消息:Linux 操作系统下的 Firefox 用户,从现在开始也可以用支付宝了。参见支付宝官方网志的安装指导。最近微软黑屏事件闹得挺凶,但这个时候支付宝发布新的安全控件,应该和此事无关。
至于很多苹果用户期待的在 Mac 下使用支付宝的事情,请稍安勿躁,有望在 11 月中旬得到解决。届时也将在支付志第一时间发布。支付宝安全工程师一直在努力!
支持 Mac 操作系统,通用的数字证书,更为安全、开放的支付宝时代即将到来。
原文:http://www.dbanotes.net/opensource/alipay_linux_firefox.html
Tags: 支付宝, linux, firefox, alipay, mac
Software | 评论:0
| 阅读:25521
Submitted by gouki on 2008, October 22, 9:55 AM
一直在搜索这块有问题,中文搜索的话,不可避免的会遇到搜索 A 的时候会出现 B 结果的情形,这种情况在MYSQL4.0的时候犹为明显,最近在翻代码的时候,翻到walker以前写的一篇文章,依稀记得大概也是05年左右的事情了吧。
05年这家伙写了不少代码,什么BMP识别啥的。如今也都随着服务器的损坏而烟消云散了。借着google的光,把walker这篇以前的文章再COPY回来。为以后也开发可以做个参考,只是它的这个方法太占数据库空间了。呵呵
如今的walker代码是几乎不写了,以wow为主,可怜的人啊。。。。。http://www.walkerlee.net 是他现在的网站。
文章如下:
/**
* @author : walkerlee
* @copyright : www.neatstudio.com | www.walkerlee.net
*/
转载请保留以上信息。
关键字:MySQL 全文检索 全文索引 中文分词 二元分词 区位码 相似度
注:本文使用的MySQL版本为:MySQL 4.0.x
在MySQL4中,是已经开始支持全文检索(索引)的了。但是只是对英文支持全文检索。
由于英文在书写上的特殊性,使得分词算法相对中文来说,简单得多。一般来说,我们可以通过单词与单词之间的空格,以及标点符号来完成这个分词过程。
但是就中文来说,就没有那么简单。MySQL无法对中文做出正确的分词,假设有如下英文句子:
"Hello world! Hello PHP! "
通过上面提及的方法,可以很简单的把这个句子分词为:
1 Hello
2 world
3 PHP
我们再来看看中文的句子:
"你好世界,你好PHP! "
按照英文的算法,分词如下:
1 你好世界
2 你好PHP
显然是不能满足我们的需要的。
所以,首先我们要做的是,把中文的句子转变为MySQL眼中的英文,以便使得它能以英文分词算法去对句子进行正确的分词处理。
先将上面中文句子进行标点过滤处理,得到以下句子:
你好世界 你好PHP
接着再使用中文分词中较简单实现的二元分词算法对句子进行二元分词,得到以下句子:
你好 好世 世界 你好 PHP
因为把标点符号替换为空格,以及PHP本身为英文字母的关系,可以不用进行二元切分,所以得到上面句子。
这个时候,我们来看看处理过后的句子,会发现,就其书写格式上来说,已经符合英文的书写格式,既以空格,标点来对单词形成自然间隔。只是上面句子没有标点,只有空格而已。
到此,我们已经成功的将中文“翻译”为MySQL能理解的“英文”书写格式。
但是,问题还没解决,首先,MySQL中,ft_min_word_len(分词词汇最小长度)这个参数的默认值为4,也就是4个字母以上长度的单词,才会被考虑,小于4个的,将会被忽略。
如果不改变这个长度,按照上面的分词结果,我们将无法通过 你好,世界,PHP等检索到相关的结果,因为分出来的词太短了,不在MySQL的选择范围内。
我们可以通过修改ft_min_word_len的值,将其设置为2来解决上面问题,但是这样做的话,在检索列表中的原本就为英文的短小词汇,如:PHP,MP3,也会被划入检索范围内,这样做的结果是,出现很多无意义的相关结果。
请看以下列表:
[MP3] the look
[MP3] because of you
因为他们都同有MP3在标题中,所以会出现上述提到的问题。
回到ft_min_word_len值的问题,我们之所以要修改他,是为了能让MySQL找到我们的二元分词,但是短小的英文又被“无辜”的卷入,我们目 前要解决的问题就是,如何使得MySQL能检索到二个字的中文词汇,又能忽略掉原本的英数?第一个反应是把中文MD5,这样以上分词就将转化为以下结果:
你好 好世 世界 你好 PHP => b94ae3c6d892b29cf48d9bea819b27b9 f5625345be46432fb0fd51340fcf6679 9067de5206278a93823f9c5dc2c737fd b94ae3c6d892b29cf48d9bea819b27b9 PHP
这样做,首先是使得中文分词的长度超越了默认的2个字,同时消除了中文的歧义性。(MySQL4对中文的处理有问题),搜索“车轮”时候,不再会出现类似“发动机”结果的问题。(车轮的例子只是为了方便理解而做出的假设)
通过上面的做法,已经解决了分词最小长度的问题,顺利的把中文词汇长度升级,从而达到把中文词汇划入检索范围,把较短的英数划出检索范围。
休息一下,然后发现这个MD5后的字符串是否太长了点……比较占用空间,要不,于是想到区位码,4位数的区位码能表示一个GB汉字,一个词有二个汉字组成,转换为区位码后是8个数字。不但能确定惟一性,也就MD5而已减少了长度。下面是转换后的:
你好 好世 世界 你好 PHP => b94ae3c6d892b29cf48d9bea819b27b9 f5625345be46432fb0fd51340fcf6679 9067de5206278a93823f9c5dc2c737fd b94ae3c6d892b29cf48d9bea819b27b9 PHP => 36672635 26354232 42322971 36672635 PHP
呵呵,是不是比MD5的小了很多呢?最后我们把相同的词汇留一个,多余的删除。得到
36672635 26354232 42322971 PHP
于是就完成了 "你好世界,你好PHP! " 到 "36672635 26354232 42322971 PHP " 的转换。
通过上面方法结合MySQL全文检索语句,我们可以通过给出一个标题例如: "迈克尔·杰克逊 -《危险之旅之布加勒斯特站》 "找出类似以下的相关标题
迈克尔杰克逊 -《迈克尔杰克逊危险布加勒斯特演唱会》
Michael Jackson -《迈克尔杰克逊 罗马尼亚 危险演唱会》
迈克尔杰克Michael Jackson -《危险之旅》
迈克尔杰克逊 -《迈克尔杰克逊 美国50annive演唱会危险片段》
迈克尔杰克逊 -《迈克尔杰克逊 终极收藏 原版DVD危险演唱会》
迈克尔杰克逊 杰克逊五兄弟 -《The Jackson Motown 25 演唱会》
迈克尔杰克逊 -《迈克尔杰克逊BAD日本Yokohama演唱会》
迈克尔杰克逊 -《迈克尔杰克逊日本大阪演唱会》
迈克尔杰克逊 -《迈克尔杰克逊之胜利-达拉丝演唱会》
迈克尔杰克逊 -《迈克尔杰克逊之胜利演唱会 比丽珍 片段》
迈克尔杰克逊 -《迈克尔杰克逊德国危险演唱会之 billie jean片段》
迈克尔杰克逊 -《Michael Jackson -30周年演唱会》
Michael Jackson -《迈克尔杰克逊 马尼拉 历史演唱会》
迈克尔杰克逊 -《1993年美国橄榄球中场休息精彩表演》
表结构 article
title varchar 200 -------- 用于存放标题 (显示用)
ft text ---- fulltext 用于存放标题分词结果 (检索用)
首先我们在把标题保存到数据库时候,就已经对标题进行分词转区位码,保存到ft字段中,用于相关性的检索。
然后把给出的标题 "迈克尔·杰克逊 -《危险之旅之布加勒斯特站》 "转为 "34853143 31432291 22910104 01042960 29603143 31434923 46034753 47535414 54143435 34355414 54141828 18282851 28513253 32534325 43254456 44565330 ",最后进行全文检索查询:
SELECT title, MATCH( ft ) AGAINST( '34853143 31432291 22910104 01042960 29603143 31434923 46034753 47535414 54143435 34355414 54141828 18282851 28513253 32534325 43254456 44565330 ' IN BOOLEAN MODE ) AS score
FROM article
WHERE MATCH( ft ) AGAINST( '34853143 31432291 22910104 01042960 29603143 31434923 46034753 47535414 54143435 34355414 54141828 18282851 28513253 32534325 43254456 44565330 ' IN BOOLEAN MODE )
ORDER BY score DESC
LIMIT 0, 5
从SQL Query上来看,进行了两次全文检索,其实不然,MySQL会将其视为一次,所以不比担心。
同时使用了AS score,这个score是相似度,分值越高,自然越与给出的标题相近。
二点建议:
1.在实际使用中,挑选score大于1的作为检索结果。
2.检索结果会将本身标题也算入其中,根据score排序,为第一条,别忘记过滤哦 ^_^。
站在用户的立场来说,我们给用户提供了更多的相关内容,站在搜索引擎立场上来说,给关键字提供了更多的相关链接,形成了良好的站内互联结构,提高了搜索引擎对网页的评价。
如果各位碰到错误的不合理的地方,恳请指正,共同进步。谢谢!
参考资料:
1.Monkey的二元分词 作者:Monkey http://www.baidu.com/s?wd=monkey+%B6%FE%D4%AA%B7%D6%B4%CA&cl=3
2.PHP里如何实现汉字转区位码 提供者:haoyoul http://zhidao.baidu.com/question/5371961.html
3.对dvbbs.php全文搜索的完全分析 作者:fcicq http://www.phpx.com/happy/viewthread.php?tid=124691
Tags: walkerlee, 全文检索, mysql, 中文
DataBase | 评论:0
| 阅读:22463