原文是采用C#来进行编写的。我不知道zip方式,是否也能打包成jar,如果可以,那其实本文就可以用来做参考了。
否则,我们就只能用pack进行打包或者处理,但我没有处理过。先备份一下。也算是了解一下jar的书的构成
原文地址:
作者:
原文如下:
很多喜欢看手机小说的人都应该知道jar这样一种 电子小说格式。并且非常多的人都在使用这样的电子小说格式进行阅读。飞库网就是提供这样服务的一个网站,我非常喜欢他上面的jar,而且ta应该属于行业 里面比较早的一批生成手机小说的站点。jar是一种java的发布程序,但是我观看了飞库网的站,纯粹的dotnet网站当然我们不能够否认ta有可能在 后台采用java进行生成jar小说。难道C#真的无法生成这样的小说?作为一个程序学习我想我可以去试试。
查阅了很多资料,百度了很多东西。其中joymo的站长在他的博客园中给我的启示最大,但是一直没有事例代码,而且有些细节没有说的非常清楚,所以我决定 自己写一份完整点的关于C# 生成jar手机小说的博文。小弟的文笔不好,讲解的很有可能不是非常清楚,我只希望能够给大家带来一次清晰的感觉。不要喷我就好。我采用的模版就是飞库自 己的那个jar小说模版。在我将前面的分析讲解完毕后,我将把代码贴出来给大家参考一下叽歪完了。
一、生成jar基本方法
C#是没法打包生成jar文件的。(博主你脑袋有问题啊?刚才还说可以)呵呵,这是一个基本的常识嘛,两个平台都不一样如何生成另一个 平台的东东?这里有个C#调用jar类的博文大家可以看看(汗了 翻遍了自己的收藏夹都没找到 晕死 我先找找看 找到发上去)。因此我们这里说的生成,严格意义上来说只是一种替换而非真的用C#生成jar。
jar它的本质其实就是zip,所以我们把jar手机电子书的小说内容替换掉后再用压缩文件压缩为jar就可以了。这也就是用C#生成jar的方法。其实 在小白之前已经有很多的人实现了。只是一直没人公布出其中的相关实现细节。所以这成了一个技术秘密一般。比如说飞库,里面的电子书就是用dotNet后台 自动生成的。小白生成的jar在本人的索爱z550中顺利安装阅读,MIDP2.0 java手机。在塞班的操作系统中由于小弟的 条件限制没法进行测试,但是我相信应该没问题。jar的生成其实还是非常简单的,首先用zip 或者winrar解压掉jar 然后把里面的文本信息按照一定的格式进行替换和添加就行了。至于最开始的jar的实现肯定是用java环境下编译的,然而今天我们要讨论的是如何用C#语 言实现 自己创建相应的小说jar。废话说了那么多,只是要把整个过程说明一下,其实我走的弯路还是很多的,好了正文马上开始。
关于jar小说文件格式的说明。
我喜欢去飞库下小说,所以我最开始研究的就是飞库的小说jar
当我们解压掉小说jar文件后获得下面的一些文件信息。我们要着手就是研究这些文件的文件格式,以及他们表示的意义这样我们就可以用任何语言 按照一定的文件格式生成再打包成jar文件就可以了。

在 这个文件图里面,大家看到有一个META-INF文件夹,里面存储的是头信息,可以直接用Txt文本打开 就可以看到里面具体的情况,还有0-109没有文件扩展名的文件,其实这就是我们要研究处理的最主要的部分,关于a.class……等还有图片这是属于, 一些程序文件(暂时这样理解,因为jar文件真正能在手机的java环境下运行,这个起了非常大的作用)这个任何的小说文件都一样因此,我们直接把他作为 以后生成的模版就ok了。下面我将分成3部分进行解析整个jar文件格式
一、META-INF中的MANIFEST.MF
这是整个分析中比较简单的,可以直接使用 记事本就可以打开不需要额外的解析
打开文本将会看到如下信息
Manifest-Version: 1.0
MicroEdition-Configuration: CLDC-1.0
MIDlet-Name: 斗罗大陆_512_4
Created-By: 1.4.2_09 (Sun Microsystems Inc.)
MIDlet-Vendor: FeiKu.com
MIDlet-1: 斗罗大陆_512_4, /0.png, MBook
MIDlet-Version: 1.0
MicroEdition-Profile: MIDP-1.0
我 们只需要了解到其中我加红的信息就可以了。因为其他的信息我们没法改变毕竟 程序在java生成的时候就已经确定,我们无法改变。在红色的字中,我们可以非常清晰的知道,这里面包含了书名,创建者,还有文件信息 里面有一个0.png表示的是在 jar生成后在 手机中显示的一个图标 对应在模版中的0.png图片文件。至此我们分析这个文件就ok了。在我们生成jar小说的时候替换掉这些就ok了
二、关于数字文件中的格式(1)(重点我分2部分讲)
在数字文件中,除了0这个文件以外其他的文件都可以非常清晰的知道他,首先你用word将文本导入,更改掉他的文本编码为Unicode注意不是UTF8这点很重要,如果用utf-8会出错的
三、关于数字文件中的格式(2)(真正具备技术含量的地方出现了)
首先我们用VS打开0这个文件当然如果你有其他的winhex也是可以的
看到下面的图,也就是用vs打开 0文件后得到的文件格式,非常重要的格式如果没有分析清楚生成的jar文件是无法正常打开的,0的这个文件就像是一个索引目录文件它标志着整个jar小说文件中 小说章节的关联。
看到图片中的 用红色框起来的部分,这是我们研究整个格式的关键所在。
1、看到前三个字节里面,有0x00 0x01,0x30。这是jar文件的格式标头。我们记住就行了也就是在生产0这个文件中 首先要把标头设计为0x00 0x01 0x30 这是规定无为什么
2、 接下来我们看第二部分0x00,0x0c两个字节这是表示的是12然后不管接下来读12个字节看看发现包括的就是151136_512_4对应一下发现原 来这是 整个jar文件的 文件名,因此我们明白了在头部 首先用2个字节输入整个文件名的长度,注意是2个字节的。然后就是整个“151136_512_4”整个字符串的bytes数组写入也就ok了我们就把头 部文件信息,我们继续读下去,这需要很大的耐心,同时需要解压多个jar文件进行对比分析,才能够找到其中的关键,
接下来我们继续分析。

3、 我们再读两个字节,0x00,0x03 这两个字节是3,我们再读3个字节看看到底是什么,原来是109 对比(右边的ANSI)就是109的字符串形式。我们看看这个字符串到底是什么意思,我们发现在整个的jar文件中共有109个文件,最开始的时候我们说 了,这些文件中表示的是整个 小说中文件的信息。这有可能表示的是整个文件中表示整个小说章节数的
4、我们继续再读两个字 节,0x00,0x6c这两个字节我们读108个字节看看是什么东西。我们是看不出来到底是什么东西的,主要原因是我们没有更改编码格式,用word打开 编码改为UTF-8然后会知道这居然是整个小说的目录部分这里表示的是整个目录的标题部分。这样我们已经完成了最主要信息的解析(中间分析很痛苦的呵 呵)
5、在尾部的信息我们看哈,下面的图哈。在那看到了又512_4到最后的标题。根据前面我们分析的经验,在文本前面肯定有一个信息是标注整个后面内容大小的字节,我们还是按照两个字节来寻找一下。
最后在查找的时候还是用winhex的方法

在winhex中比较容易看出来 字符集是UTF-8 很明显的看出来如果是2个字节肯定不行那么我们变成4个字节试试看活的正确了

至 此整个文件格式的分析就完成了。下面就是如何使用C#代码去构建整个文件了。下次我在讲。这个的实现具备有非常大的现实意义,如果你想做一个手机小说站 对能够后台实现生产对应的jar文件相当有作用 后面在搞下umd格式和chm 希望能够把整个小说能够存在的载体都用C#实现一次。后面几个相信难度没那么高。总结一下
在我们使用的
头部信息:0x00,0x01,0x30,
然后是2字节的书名长度:
书名字符串
2字节:书的章节数也就是对应有多少个数字的文件(最开始的那张图)数量的长度大小
长度的字符串形式
2字节:表示的是标题的长度第一章
紧跟着标题,注意编码格式是utf-8
然后是第二章
第二章的标题 也是utf-8 的格式
然后第三章
…………
最后关于书的基本信息
4个字节:表示关于书的信息整个长度
然后紧跟着是书的字符串支持\r\n表示换行
至此整个 文件格式的分析就完成了 好痛苦了 呵呵不过还不错啦下次弄出在C#中实现的 一些细节难点
新闻来自于Cnbeta.com,我这里是纯记录
感慨一下科技的发展,就象新闻里说的,我也很向往少数派报告中在虚空中操作电脑。
原文如下:http://www.cnbeta.com/articles/88286.htm
如果不是学计算机科学的话,你可能不知道什么叫计算机视觉,也可能不知 道什么叫模式识别。但是看过电影《少数派报告》的人或许都希望自己能和汤姆·克鲁斯一样,在空中用手比划一下就能完成未来电脑的操作;甚至想过如果有像哈 利·波特那样的魔棒,挥一挥就无所不能。微软亚洲研究院语音组最近发明的空中手书项目就部分地实现了这些科幻迷、童话迷的梦想。
就如上图所展示的那样,用户手中抓一支笔、一个苹果或者其他容易辨认的 物体,在空中写下文字、做出手势,通过摄像头的“眼睛”观察,计算机就能知道用户写的是哪个汉字,想表达的是哪种手势,从而完成计算机和人的自然交流。这 也正是我们项目命名为“空中手书”的由来。之所以说是部分实现了用户的梦想,那是因为我们只是成功实现了空中手书,而真正科幻式的未来生活需要各个行业、 各个学科的共同发展进步。
孝心引发的创新
空中手书项目诞生的直接导火索是迎接2009年的微软技术节 (TechFest),为此语音组在内部广征TechFest的参展议案,结论莫衷一是。当时,我还在家休假。我的经理霍强说,“等马磊回来再讨论吧,这 家伙鬼点子多。”回公司上班那周,正好和霍强1:1交流,当谈到组里还为TechFest参展项目悬而未定时,我就提出了要做“空中手书”的建议。其实, 这个念头由来已久,但是那次回老家度假更坚定了我的这个想法。2009年初在家过年的时候,就经常听到父母抱怨不会用键盘输入,手写板也不好用(需要不断 的抬头看屏幕和低头看板子),我当时便吹牛说,明年回来给家里的电脑装个摄像头,然后你们对着摄像头就可以写字了。其实有这个想法也是因为之前全院的某次 Offsite,在一段非常酷的视频短片里,四位院长用手指在空中轻而易举地写下了MSRA (微软亚洲研究院的英文缩写) 四个字母,这当然是电影特效,但是却让我浮想联翩。
虽然“空中手书”的想法听上去很炫,但是霍强还是对需要投入的时间和人 力成本有所顾虑。为此,我主动请缨用两周时间先做个原型出来,然后再评定能不能继续做下去。实际上最后做出这个原型只用了2天时间,也还是一个比较简陋的 演示:首先把手的运动轨迹跟踪下来,接着保存成数据文件,然后再调用我们的识别引擎,得到识别结果文件,最后经过读取把它显示在屏幕上。
令人惊讶的是,这个原型的效果已经令人相当满意了。因此,便有了更多的人加入到这个项目的开发完善的过程中,比如我的实习生朱晓恩、霍强的实习生孙雷,以及现在继续把这个演示中加入手势识别的禹果。
技术里面隐藏的奥妙
那是不是因为这个问题太简单了,所以用两天就能做出这个演示?当然不是了。我们设计的空中书写系统里面有两个主要的组成部分,一个是运动轨迹的追踪算法,一个是手写体汉字的识别算法。而这两个领域本身都有了几十年的发展,至今还是有很多的未解问题。
比如说这个跟踪算法,跟踪什么东西、提取什么样的特征来跟踪、跟踪的效率,是不是白天晚上各种不同的光照条件下都能跟踪等等,每一个问题都可以展开来细细的做研究。而这些问题如果不解决或一定程度上解决,就不会是一个用户体验良好且稳定的方案。
再比如说这个手写体汉字识别也同样是有很多值得研究的问题。写字的风格 (楷书、行书、隶书、草书) 不同会影响识别率,不同人的写法更是差异很大。另外,汉字的笔顺也是个大问题。除去这些问题不谈,在空中写字的方式和纸面上写出来的字样式上也差别很大, 至少现在空中的汉字是要一笔写成的。这都要求我们的汉字识别器可以稳定地处理和识别出来。
两天做出来的原型只是描述了一个概念,后面还有大量的工作等着我们去做。
我们连同实习生一起做了认真的特征研究,去考虑哪些特征在光线不足的情 况下稳定,哪些在亮光甚至点光源(一般会场和室内的条件)下能够稳定等等问题。另外,现在的摄像头有自动聚焦、白平衡和自动滤波的功能,而这些功能是不是 对我们的应用有帮助?其实,有些功能不但没有帮助反而有害。我们就需要把这些问题一个个研究清楚。除了特征外,什么样的追踪算法稳定高效,适合我们的应用 场景?为此,霍强和我查阅了大量研究资料,咨询了我们微软内部的许多在这方面资深专家寻求更好的方案。
在手写识别方面,我们研究院语音组有很多年研究的积累,平面上的手写体 识别算法的性能和识别率上是全世界领先的。相关算法已经transfer (转化)到了产品部门。但是这个空中字体的轨迹有自身的特点,如一笔连画,三维空间的轨迹映射到二维上,比划之间的转折相对圆滑等。我们的算法在特征上的 处理可以对付这些问题,信号的预处理部分也可以过滤掉由于光线条件不是很好情况下跟踪算法带来的信号抖动。
除了这些在核心技术上的研究之外,在用户界面上我们也考虑了很多。这部 分我的实习生朱晓恩动了很多脑子,比如如何设计更美观的界面,捕捉到的轨迹如何呈现会更舒适。另一个重要的改进就是把识别结果中最可靠的结果放置在候选区 域的中心,把不太确定的候选结果放置在边缘。这也是为了能让用户平均选取正确汉字的手移动距离最短。
最终,完成了我们现在看到的这个对公众演示的算法设计和实现。
空中书写的应用前景
如我所言,空中手书这个项目一开始就是从用户的需求中来(有相当一批人不会用键盘输入或者不知道怎么用包括拼音输入法在内的方式)。我们的项目就给了这些人一个与机器设备交互的可能性。
我们这个空中手书关注的应用场景可以分为以下几类:
1. 交互式游戏场景。比如在Xbox中,在很多时候需要玩家的输入才能导致游戏的继续进行。这时候我们的空中手书就提供给用户一种截然不同的使用体验,用于输入名字,谜题答案;用于交互式控制完成游戏的部分场景等等。
2. 搜索是海量信息时代重要的信息组织方式。 输入搜索的查询关键词有时候并非是一件非常容易的事情。比如在IPTV上,用户的计算机连接到互联网上,用户有需要从互联网上找到有趣的视频或者电影电视 然后从自己家的电视屏幕上进行播放。这时候,我们的空中手书就提供给用户一个输入方式选择。尤其是那些不会用T9输入法的中年以上用户。毕竟,手写输入还 是自然的输入方法之一。
3. 我们的空中手书还允许用户输入手势。通过一组直观易用的手势,用户可以方便地和各种智能设备交互。控制音视频的播放,提升用户体验,快速访问某些设定功能,等等。
总之,空中手书给了用户新的选择。它的应用场景就仅仅受限于我们和用户的想象力。
空中手书的演示成功恰恰是一个研究问题的开始,恰恰说明用户对更自然的 人机交互方式提出了诉求。就在写本文的时候,我们还在研究是否有更自然的方式可以捕捉人的运动,从而和计算机交互;是否能让我们的跟踪算法和人眼的跟踪一 样稳定。同时,我们还在研究使用手势识别来理解用户意图,让每个人都可以体验到空中舞动之美,体验到人机交互带来的便利。
纪念那逝去的岁月。
本想摘取一些各大网站的新闻、稿件来做纪念的,结果
一片冷青
怎么办?我也不敢发声音。
只能从百度百科里找找资料了。
地址为:http://baike.baidu.com/view/10754.htm
七七事变也称“卢沟桥事变”(Lugouqiao Incident / Lugou Bridge Incident/Lukouchiao Bridge Incident/Marco Polo Bridge Incident/Roko Bridge Incident)
虽然我不喜欢百度,但这个时候还是很感谢,因为他里面有这么一段:“七七事变”72年
再次怀念一下
冯小刚虽然有几部片子拍的挺烂,但不代表他没有好片子
相反,他的好片子很多。
每年一部的贺岁片几乎就是他的标志,一年不开张,开张吃三年,估计完全可以体现冯小刚的作品的号召力
当然,御用的葛优也是如此的张扬,即使在批评很多的夜宴里,葛优仍然出尽了风头
非诚勿扰,初次看此片时,是在同事家中,喝着小二,就着烤羊排。但没有看完,只是片头的分岐终端机印象颇深。
昨天晚上睡觉前,又看了会,不过只是结尾那段。在看到工作人员介绍时,突然发现一句话:感谢分岐终端机的发明人:XXX(不记得了)。这句话让我大吃一斤(HOHO)
原来,还真有这玩意啊。。
估计该发明人向冯小刚推广这玩意后,他就兴致一来,写了这个非诚勿扰的故事吧,因为我看编剧和导演都是冯小刚。
虽然我主要是想表达,我的惊讶。
但不可否认,片中的情节和一些话语的精炼
或许,每次冯小刚的片子一出来,网上就会有人把葛优等腕的名言名句列出来吧。就象当年的:手机、天下无贼一样?
不信,搜索一下:非诚勿扰 经典台词,肯定会有发现
既然标题为杂记当然记得东西也就比较杂一点
1、linux
刚刚装好ubuntu后,建立了一个分区,进入分区目录,想改权限为任何用户都能访问
所以进入命令行,用了chown -R nobody.nogroup /
命令中的/,前面少加了一个. ,结果。。。所有的目录权限都不正常了
重启后,无法访问。最后重装(虽然听说用simple mode登录后可以解决,但一来没时间,二来,我是新做的系统,重装速度会更快一点)
2、虚拟机
在ubuntu下面的虚拟机,好象不能设置为随系统启动而启动的。这不象在windows下面。当系统启动后,虚拟机也可以自动启动(虚拟机是server版,可以在每一个虚拟OS上指定是否随系统启动而启动)
3、虚拟机中的windows 2003登录
2003初装好是需要按ctrl+alt+delte登录的,但vmware中按ctrl+alt是退出焦点。vmserver2后,没有客户端访问程序了(需要单独安装)我感觉还不如1.x版呢。。。
所以进入后,先按Ctrl+apace,把输入法调出来,然后按着ctrl+alt,再用鼠标点击软键盘,上面的del键,进入后。gpedit.msc把登录需要ctrl+del+alt关闭
4、招行
招行登录,不能用远程连上计算机登录,只能本机登录。
远程后,进入大众版会显示:非法远程登录,在询问客服后才知道。。。
5、ubuntu下为什么要装虚拟机?
你以为我想啊,可是不装,QQ功能不全,网银不能使用。支付宝也不能用。凡 是要花钱的地方,ubuntu都不支持,我该怎么办??