手机浏览 RSS 2.0 订阅 膘叔的简单人生 , 腾讯云RDS购买 | 超便宜的Vultr , 注册 | 登陆
浏览模式: 标准 | 列表2024年09月的文章

开源分词程序

看到张宴的微博上有一条消息:
推荐一个工具:imewlconverter - 深蓝词库转换( http://t.cn/h4YOCi ) ,可以将搜狗拼音输入法细胞词库( http://t.cn/hWFEQ )*.scel 格式转换成文本格式。然后,可以将提取的一些专用词库,用于中文分词接口中去。

不错的工具,毕竟做分词的也好,做其他的也好,都可能会需要用到这个。所以我先备份了这条微博
官方地址是:http://code.google.com/p/imewlconverter/
张宴的微博:http://weibo.com/rewinx

OK,顺便再贴一下张宴的微型HTTP队列:http://blog.s135.com/httpsqs/
所谓的优点:
HTTPSQS 具有以下特征:

● 非常简单,基于 HTTP GET/POST 协议。PHP、Java、Perl、Shell、Python、Ruby等支持HTTP协议的编程语言均可调用。
● 非常快速,入队列、出队列速度超过10000次/秒。
● 高并发,支持上万的并发连接,C10K不成问题。
● 支持多队列。
● 单个队列支持的最大队列数量高达10亿条。
● 低内存消耗,海量数据存储,存储几十GB的数据只需不到100MB的物理内存缓冲区。
● 可以在不停止服务的情况下便捷地修改单个队列的最大队列数量。
● 可以实时查看队列状态(入队列位置、出队列位置、未读队列数量、最大队列数量)。
● 可以查看指定队列ID(队列点)的内容,包括未出、已出的队列内容。
● 查看队列内容时,支持多字符集编码。
● 源代码不超过800行,适合二次开发。
可以利用它来做很多事情,比如我曾经想做的短信队列发送,原来我都是利用MYSQL来做队列的,这样的效率不是特别高。而且额外写了很多程序。现在可以偷懒了。

Tags: 分词, 开源, 词库转换

一句可以围观的SQL

窝窝(Walkerlee)最近说他折腾了一个SQL,提升了他的工作效率。表示要到博客来投稿,今天我把这个SQL放出来了。
嗯。我总不能说,因为我确实会这个SQL就断了他投稿的心,否则他会砍我的。

前因:
数据库结构如下:

要求:一句SQL实现,分别统计type1,2,3,4 一共多少money (group by uid)

原先做法:分开查询 然后用php合并结果,如

SQL代码
  1. select sum(money) form test where type = 1 group by uid  
  2. select sum(money) form test where type = 2 group by uid  
  3. select sum(money) form test where type = 3 group by uid  
  4. select sum(money) form test where type = 4 group by uid  

现在要求一句SQL。
窝窝问我的时候,我说if(a,b,c)这个函数可以解决,于是他很愤怒。。。。
贴出了最终的SQL语句:

SQL代码
  1. SELECT  
  2. uid,  
  3. SUM( IF(`type`=1, money, 0 ) ) AS `BuyByCash`,  
  4. SUM( IF (`type`=3, money, 0 ) ) AS `BuyByCard`,  
  5. SUM( IF( `type` IN (1,3), money, 0 ) ) AS `BuyByCashAndCard`,  
  6. SUM( IF(`type`=2, money, 0 ) ) AS `SellByCash`,  
  7. SUM( IF(`type`=4, money, 0 ) ) AS `SellByCard`,  
  8. SUM( IF( `type` IN (2,4), money, 0 ) ) AS `BuyByCashAndCard`,  
  9. SUM(money) AS `Amount`,  
  10. COUNT(*) AS `DataNums`  
  11. FROM `test`   
  12. group by `uid`  

窝窝比较郁闷,因为以前处理起来很麻烦,而现在一句就解决了。


此事完结后,他又介绍了一个小技巧:
我有一个relation表,用来存储订单下面的游客

SQL代码
  1. ALTER TABLE `travel_order_customer_relation`  
  2.   ADD CONSTRAINT `travel_order_customer_relation_ibfk_1` FOREIGN KEY (`oid`) REFERENCES `travel_orders` (`id`) ON DELETE CASCADE

然后我用了一个外键,这样order被删除时候,这个关系表里面的相关数据也就自动删除了
----
然后我也很郁闷的说,我的数据表不是INNODB的,所以这个功能我不能用。。。也很纠结

Tags: mysql, group, sum, if

由一个笑话看需求理解

这,是一个笑话:

突然让我想起两年前的那个图,产品经理拿到一个要做秋千的需求,经过层层转达,最后做出一个十不象来,事实上就是人们所说的,每一次信息传递,都会丢失大约20%左右的信息,当信息传达次数过多的时候,需求和结果就已经很偏离方向了。
上海以前有一个节目《智力大冲浪》,其中有一个游戏就是COPY不走样,但事实上这真的不太可能。
在实际工作中,往往都是老板说要做一个什么东西,然后产品经理进行规划,事实上这时候已经可能偏了大约10%左右。然后产品经理规划好了,找开发主管讨论,这时候又偏了10%左右。开发主管找小弟把需求复述一遍,需求还剩70%,这时候根据开发人员的水平来划分:
1、特别好的开发人员能够保证60%的准确度+15%的自己理解(可能会有实际偏差也可能就正好把需求损失的补回来)
2、一般的开发人员,能够保证60%的完成度
3、稍差一点的开发人员,能够保证50%
4、差一点的,30%
5、如果连程序都写不完的,就不谈百分比了。。。。

细想想,难道不正是这样?

儿童咳嗽,不要总当感冒治

也是一个转贴啊,主要是我们家的小朋友也有点这种症状,如果有相同类似的小朋友们可以看看。当然我也不知道这是对还是错。。。

原文来自:http://geek.techweb.com.cn/viewthread.php?tid=231886
引起儿童慢性咳嗽的原因很多,过敏是重要原因之一。

过敏性咳嗽患儿的表现:

?长期咳嗽,久治不见好转;

?一般在夜间或清晨发作,白天通常不咳嗽或很少咳嗽;

?过敏性咳嗽一般不发烧,吐白色泡沫痰,多以咳嗽为主,不喘。

?咳三阵是它的最大特点,晚上睡觉前咳一阵,半夜醒来咳一阵,早上醒来咳一阵,有的儿童一连咳上3个月;

?过敏性咳嗽的孩子喜欢揉眼睛和鼻子,爱抓头皮,睡觉时爱出汗、不安分,喜欢蜷曲着睡。

治疗误区:

孩子出现过敏性咳嗽时,父母的第一反应往往还是“孩子又感冒了”,并把它当成感冒而一味使用抗生素和止咳药治疗,但实际上不对证的治疗是不可能获得良好效果的。咳嗽时间长了,患儿可以发展成典型的支气管哮喘。

正确治疗:

?在季节交替、气温骤变时,父母应尽量为孩子防寒保暖,避免着凉、感冒;

小快克的一分为二设计其实就是将一整袋药品分为两个相等的半份,这样便可以使年轻父母可以更好的掌握用药剂量。小快克的设计受到了广大年轻父母的欢迎,这无疑也是给那些不负责任的厂家好好的上了一课。

其实宝宝作为一家人中最受爱护的对象,从出生开始便会集万千宠爱于一身,很多的父母长辈都希望宝宝可以健康快乐的成长。如果宝宝受到病痛的伤害与侵扰,那将是全家人的烦心事,尤其是在选择用药剂量上,一直以来都困扰着很多的父母。

?避开过敏源,家里不要养宠物和养花,不要铺地毯,避免接触花粉、尘螨、油烟、油漆等,避免食用会引起过敏症状的食物,如海产品、冷饮等;

Tags: 咳嗽

phpstorm 函数提示

其实我一直以为phpstorm的函数提示只能提示参数的,但最近我在把菜单一一看完的时候才发现,原来,它真的可以提示函数的详细信息。
说白了, 就是将phpdoc这一块的内容全部提示出来。具体怎么操作呢?
在macosx上,快捷键是F1或者ctrl+j
其他平台上未知,但没有关系,可以通过keymap来看一下定义的是什么快捷键,也可以看这个:

看那个QuickDocumentation,就知道了。
因为菜单里的提示只是默认的,所以如果有多种快捷键,还是看keymap的定义吧。比如我现在的定义是:

Tags: phpstorm