Submitted by gouki on 2009, December 4, 5:20 PM
前段时间,我申请了国外的虚拟空间bluehost.com,开始还觉得挺方便,然而今天却让我郁闷了。
朋友推荐的程序是采用了 yii framework【http://www.yiiframework.com】,由于需要跑一个cli模式的程序。结果却发现程序报错,原来,bluehost.com在命令行下不支持 PDO,而在正常情况下是支持的。。。一下子傻掉了。
看来,以后还是买 VPS比较方便啊。。可以自已配置。嗯,决定了,等退完钱后,考虑上VPS。。
只是太贵了。很犹豫,20刀一个月啊。。。慢慢攒了
Misc | 评论:1
| 阅读:15840
Submitted by gouki on 2009, December 4, 11:09 AM
本来不想转贴的,但 一看。。原来里面的软件,我基本上都用过啊。。
本人不上图了,要看原文请去:http://www.cnbeta.com/articles/99240.htm,我这里再加入一些我自己的看法和心情,以【】来展示
原题:Abandonware 趣图赏析
Abandonware(孤儿软件)是一个冷门但有趣的领域。在当前技术日新月异、产品推陈出新的大背景下,适时地回顾一下历史,也许能对现在的工作有一些启发意义。下面展示几张我对一些经典 abandonware 的截图,分享其中的好玩之处,体会软件内外的斗转星移。
1. 用过 UCDOS 6.0 以上版本的朋友都应该记得它当年强调的“特显”、“直接写屏”等功能。据称这样可以做到与显卡无关,提高兼容性,但带来的问题就是在 Windows 9X 下常常会花屏。抛开这个不说,如果两个类似的汉字系统同时写屏是什么效果呢?我们分别启动 GB2312 版的 UCDOS 与 BIG5 版的倚天中文系统,再启动一个 CCED 之类的全屏幕中文程序进行测试。随着键盘、鼠标操作对屏幕的刷新,两个汉字系统抢着写屏,使得屏幕上正确的文字与乱码共存,有超越 CCED 的“密写”功能之势。顺便说一下,我本科时有幸上了 UCDOS 智能拼音作者谭毓安老师的课,拜到了十年前就闻名的牛人。【ucdos是我在486时代最喜欢的软件之一,那时候练五笔没有其他办法,先启动ucdos才是王道。后来才知道,那些启动,其实就是一堆 bat的组合。不过当年就不一样了。看到别人的黑色屏幕,而自己下方却有一个可以显示输入法的蓝条,那是相当地“鸡”动啊。】
2.Windows 95 中文版的蓝屏(BSOD)是 Windows 系列产品中文蓝屏的绝唱。从 Windows 98 以后,中文版 Windows 的蓝屏都改成英文的了,不再做汉化,这是为什么呢?因为 Windows 95 在实际使用中如果出现了某些严重的错误,会使得中文字库也无法加载,这时中文全变成了没有参考价值的乱码。看来在设计这种“最后的机制”时,一定要做到最 小依赖,要给用户提供有效信息,而不要让自身成为系统的拖累。【第一次见到win95,是在南通的南大街上,那,其实是一家盗版软件店,看着店主在操作windows,心里那是一个崇拜啊。。要知道windows 3.1在win95面前,那真的是啥也不是。虽然那时候盗版盘很贵,但是为了第一个仙剑,我的盗版处女生涯就失落在那家小店了,当时和我一起的好象还有:阿飞和小陆明,不知道他们现在是否还依然记得?】
3、Windows 95 中不规范的世界地图。在 Windows 95 的早期 Release 中,“区域设置”的世界地图上的国界标示导致了有领土争端的外国政府抗议(《Windows 编程启示录》中提到过), 因此后来的 Release 取消了地图上的国家(时区)颜色标示。但一个新 bug 随之而来:新版地图上竟然没有阿拉伯半岛。我们使用 PE 资源编辑器打开“区域设置”所在的 intl.cpl 文件,其中有一幅标示了颜色的世界地图,包含阿拉伯半岛的。intl.cpl 读取这个资源,将其按海陆两色显示。不知是什么算法出错,导致阿拉伯半岛消失(其实覆盖对比,还有东欧部分地区和台湾岛也不见了)。不知这事当年有没有在 中东闹起来,软件中的政治问题举足轻重呵。【不关心,没注意过,就是放到我面前,我也认不出。。。】
4.江民的 KV 系列杀毒软件历史久远,在上世纪九十年代中前期,KV200、KV300、KV300+ 系列在 DOS 防毒、杀毒工具中独占鳌头,可谓微机必备。不过在互联网没有普及的时代,病毒库的升级成为一个问题。记得当年一种途径是去软件专卖店拷贝(小城市不可 行),一种途径是用 Modem 拨号、超级终端登录到官方 BBS 上下载(长途话费呀),而最廉价的方式则是从《电脑报》、《软件报》上摘抄最新的病毒特征码,手工敲 debug 命令将其汇编到自己的 KV 病毒库中。设想现在哪个软件的升级若要用户编写并编译一堆代码,一定会被揍的。技术的发展使所谓“电脑高手”的门槛越来越低,这应该让人是高兴呢,还是悲 哀呢?【当年确实中过两次病毒,一次是在dos 6.22下,一次是在win98下,DOS6.22的时候,用的是virusscan?应该没记错,win98下面,是用的隔壁处室的正版kv300,启动杀毒,再后来,我就用上了诺顿,再后来。。。一直裸奔了】
5.同样令人感慨“沧海桑田”的,还有 CCED 3.3 的帮助文档。当年北京市电话号码还是 7 位,传呼机是流行的通信工具。四环路没有贯通,现在的太平洋电脑城附近当年还是“百货”,图上那几个单位如今尤在?【好象易语言的作者就是这个CCED的开发者之一??记不清了,仿佛是吧,我还真没用过。。。我只用了WPS】
6.续上。从金山最失败的产品——盘古组件中提取的“信息服务”小工具,看看当年最长五位数的电话区号、最长三位数的火车车次。如今电话区号变 短了,火车车次却变长了;电话费相对收入降低了,火车票价却不减反增。虽说铁路已经提速好多次了,可又有几次真正惠及了我西北的家乡呢?【又是没用过的软件。】
7.我们再来看看超级兔子。这个软件见证了中国个体软件营销模式的变迁——从简单的免费软件,到知名的共享软件,然后遭殃泡沫经济、转战国外市 场,如今 Web 2.0 时代又回归免费,改为以服务为中心的营利模式。我是这个软件在共享时代的正版注册用户,作者蔡旋给还专门向注册用户们透露了软件中的一个彩蛋:查看作者小 时候的照片。呵呵,不知道蔡旋自己还记得这件事不?【这个,好象用过,不记得了,那时候应该都是用的优化大师吧?还要算号,算号的时候,还不能开着软件。。。现在想起来真的很好笑,大部分设置都可以通过注册表来解决,后来还真的买了本与注册表相关的书。如果那时候再配上VB,直接用VB操作注册表,估计我那时候也可以卖软件了。。。】
8.不知不觉中,我们谈论的内容已经超出了 Abandonware 的范畴。有些产品并非已无版权,只不过开发者对旧版本不再提供支持而已。这并不影响我们怀旧的兴致。最后一幅图仍然是一个彩蛋,而且估计在那几年学过点计 算机的中国人都见过这个彩蛋——Office 2000 附带的隶书、幼园等字体中的“胡万进印”。 有多少人还记得暗藏在 Windows 95、98 或 Office 97、2000、XP 中那些好玩的小动画和小游戏呢?软件开发者期待一个展示个性的空间,然而公司对软件质量的苛求又在扼杀这种小聪明。节日礼花和赛车游戏在如今的 Windows 与 Office 中不复存在,不过有趣的是 Google 产品中的彩蛋却始终没有减少,这又是一个什么样的信号呢?【。。。当年这个胡字闹得很大。。。】
原文链接:http://blog.linjian.org/articles/abandonware-pictures/,作者:林健。
本作品采用知识共享署名-非商业性使用-相同方式共享 2.5 中国大陆许可协议进行许可。
(Digital fingerprint: 993d4981d6d552510db9a08493b2dbec)
--EOF--
作者还搞了一个数字证书,好妖的作法。不过作者没有提到的其实还有一款对于从DOS走来的人很重要的一个软件:pctools。从那个时代过来,而不知道这款软件的人恐怕真的很少吧?也算是一个时代的终结了。。。最后再怀念一下,同时,以后不会再转贴类似文章了,毕竟过去了就过去了。。再怀念也不会回来了。
Misc | 评论:0
| 阅读:16192
Submitted by gouki on 2009, November 30, 7:18 AM
以前的博客文章里介绍了什么是行为:
http://www.neatstudio.com/show-686-1.shtml
- 行为/路径:在一个访问过程中,客户访问过的所有页面的轨迹称为路径,或称为行为。
-
- 特定行为:由用户自行定义的行为,包含若干行为步骤,其中行为步骤不受限制,即可以任意设定行为步骤。进而分析出满足设定行为的发生次数及各个步骤之间的转化率。
-
- 特定行为转化率:在特定行为中,两个步骤之间的转化率。
-
- 行为入口:客户开始访问网站的第一个页面。在Web-IA中,根据入口给出典型行为分析。
-
- 行为出口:客户访问网站的最后一个页面。在Web-IA中,根据出口给出典型行为分析。
而行为分析也是做网站的所非常关注的。每年艾瑞斯咨询都会公布一些网上的用户的行为分析报告,这些都是参考资料啊
而我这次所说的,其实只是一个意外,然后引发出来的:用户其实很笨。这句话我不记得是史玉柱说的还是谁说的了。
昨天的事情其实是这样的。我打开一部片子,不知道按了什么快捷键,结果,动画片成中文的声音了。说实话,真的很意外,我发现切换声道后又有英文了。你们看到我这样会认为我的操作很奇怪,但事实上一点也不奇怪。自从播放器越来越高极后,字幕也成了外挂后,我真的忘记可以用声道来切换语音了。再加上也不是每部电影都会有多语音的。慢慢的也就忘了这个功能了。。。。
天涯,这么大的网站,贴子的内容页样式几乎没变过,为什么我不知道,我只知道,用户很笨,因为就怕一变之后找不到操作了。
做网站的都面临这样的情况,网站一改版,就要面临用户习惯的改变:平时这个连接都在左边的现在提上去一点点,我找不到了。。。
以前有一个网站可以提供用户点击热区的。。。现在找不到那个网站了。意外啊。
其实我只是乱说,莫介意
Misc | 评论:0
| 阅读:16837
Submitted by gouki on 2009, November 29, 9:42 AM
搜索,一直是一个比较大型的工程,效率和匹配就是众人所关心的。而对于搜索引擎来说,数据总量、重复度、抓取等,又是一项复杂的工程
以下来自博客园,纯属参考。。。
原文如下:
一晃时间就过去了一个月的时间了,从找到工作到现在也有一个月的时间了。
回顾这一个月的时间,感觉学习了一些东西,但是没有到理想的效率。
从10月25日差不多正式的开始了解搜索引擎算起,到11月25日,列举一下完成事情的内容,以后这些内容的记录要更频繁一些,也需要分享些经验。东西堆在一起之后就不太想记录下来了。
10月25日 - 11月6日, 看了一下Managing Gigabytes(以下简称MG)这本书,感觉还是很不错的一本书,翻译版叫做《深入搜索引擎》,作者是新西兰的一位教授,属于比较严肃的类型,但是对 知识点讲的还是非常的细,特别是文本压缩,索引,查询,索引构造讲得不错,都是比较传统的方法,最先进的一些方法没有怎么涉及,怪不得是作为 Stanford的教科书和参考书。
11月6日 - 11月12日,lw告诉我,需要下载百度知道,和天涯问答的内容,这样可以构建自己的语料库,程序语言就用perl吧。
于是花了两天来看了下perl,一个非常好用的工具,字符串处理超方便,就是效率不怎么样,可能是我太菜了的原因吧,呵呵。
下载网页的内容无外乎就是做一个简单的爬虫,MG书中没有讲,又去网上查了一些资料,简单的爬虫设计其实挺简单,不停的分析web页面中的html含有的链接,把需要的页面写到文件里面去,这块使用perl天生的正则表达式非常的容易,代码也很短。
百度的网页最好下载,甚至连正则表达式都不需要,因为百度知道的链接是如 http://zhidao.baidu.com/question/126947921.html ,把.html之前的9维数字进行枚举就可以了。
天涯问答的稍微复杂一点,主要需要分析链接的类型,如果是如同
http://wenda.tianya.cn/wenda/thread?tid=40734b71c6b7a07e这样的形式,也就是中间含有thread的,则为问题
如果是
http://wenda.tianya.cn/wenda/label?lid=68aa0de477338ddc& clk=cts_ls,也就是中间含有label的,则为一类问题的集合, 把集合想象为树的节点,问题想象为树的叶子,进行宽度优先搜索或者深度优先搜索就可以了。
如果需要perl源程序的可以跟我联系。
11月12日 - 11月22日, 看了一些Information Retrieve这本书,看了其中的一些内容,好些不太懂,看英文还是有点费力-_-,这本书写得我感觉比MG要轻松易懂一点,主要看了看 Clustering(聚类)和Classification(分类)的方法,主要有kNN与向量法。
学会了用perl处理下载下来的网页,将无用的信息删除,比如一篇内容就剩下分类和主要的文本内容,html标签和一些无用的东西都删除了。
学会了基本的分词算法,最简单的分词算法是正向,反向,最大匹配法,在这基础上有一个叫做双向最大匹配法,其实就是在正向和反向分词做完之后选择一个结果更好的,可以认为留下的单字越少越好,也可以认为分出的词数越少越好,分词后的结果可能是下面的
(不然)\引用\起来\必然\要\出现\牵强\附会\(的)\
现象\
造成\引用\(不得)\体\
今天\(来)\老师\(把)\(这)\一组\诗句\奉献\(给)\(你)\
希望\(你)\(能)\收录\(在)\(自己)\(的)\文件\夹\中\
梅须逊雪三分白\
雪却输梅一段香\
卢\梅\坡\
雪\似\梅花\
梅花\似\雪\
似和不似都奇艳\
括号括出来的是停用词,看起来效果还是不错把,呵呵。 另外对诗句的处理就是用了一些小小的trick,可能造成的错误很多,仅仅是做个实验。
11月24日 - 11月28日 这几天不幸感冒,今天才算缓过气来,准备一下计划吧。
另外公布一个我注册的google code地址作为我的第一篇日志的总结,如果有需要的朋友可以任意使用里面的内容,包括了我的代码和一些我找到的参考资料,可以无责任的使用他们,另外如果有朋友想要扩充这个知识库,可以联系一下我
http://code.google.com/p/mynlp/
原文地址:http://www.cnblogs.com/LeftNotEasy/archive/2009/11/27/1612144.html
Misc | 评论:0
| 阅读:16321
Submitted by gouki on 2009, November 28, 9:11 PM
真的没有想到opera会被咔嚓掉,所以看wap网站就。。。。
默认的浏览器无法看wap网站,很意外的,但又可以理解,毕竟电脑上的chrome也看不了老的wap网站。
所幸还有ucweb,最初的版本是java的,如今已经是apk的了,不错的软件呢。
本文就是在手机上使用ucweb发表,手机打字真的很累
Misc | 评论:0
| 阅读:16626