手机浏览 RSS 2.0 订阅 膘叔的简单人生 , 腾讯云RDS购买 | 超便宜的Vultr , 注册 | 登陆
浏览模式: 标准 | 列表分类:Software

pdf to txt

或许很多软件都是专业的转换,但是如果PDF中有图片的话,那些convert pdf to word就不一定能够成功转换了。所以我推荐这款“汉王 PDF OCR”,和传统的OCR一样对PDF进行识别、转换,再输出。因此,即使你是图片,他也能够认得出啦,因为他可以把图片直接OCR出来。

   汉王PDF OCR是汉王OCR 6.0 和尚书七号的升级版,本软件新增打开与识别PDF文件功能,支持文字型PDF的直接转换和图像型PDF的OCR识别:既可以采用OCR的方式,将PDF文件转换为可编辑文档;也可以采用格式转换的方式直接转换PDF文件为文本。
本软件系统应用OCR(Optical Character Recognition)技术,为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的软件系统。
目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此急需一种快速高效的软件系统来满足这种海量录入需求。本软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。
    ●识别字符
    简体字符集:国标GB2312-80的全部一、二级汉字6800多个。
    纯英文字符集。
    简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
    ●识别字体种类
    能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。
    ●识别字号
    初号 小六号字体。
    ●表格识别
    可以自动判断、拆分、识别和还原各种通用型印刷体表格。

上午尝试了一下,对于一些杂志扫描出来的OCR可以正确识别。精度还挺高。当然。。。纯图片【文章配图】是没有办法导出来了。。

官网:http://www.hanwang.com.cn/

Tags: 汉王, ocr, pdf

netbeans 与 encoding support

Netbeans是我最近常用的编辑器,开源免费跨平台是我选择它的主要原因之一,但是让我郁闷的是,他不能在编辑时按照文件自身的编码来打开,这让我很郁闷,相反editplus还能够自动识别ansi和utf8而根据相应的编码来打开呢。

当然一般情况下,这是很正常的,创建一个project的时候指定编码就足够了。可是大家都知道的dz嘛。为了让自己的程序适合所有的编码,就把文件全部用ansi来处理,然后语言包采用相应的编码,这样,创建一个新的版本就十分方便。只是这样的前提是,所有的代码中不能出现其他编码,只能用GBK,并且不能有UTF8的输出。

于是就有我现在的问题,一半项目是uTF8,一半是GBK,整合在了同一个project里了,打开的时候就经常看到乱码。而所谓的插件encoding support,其实早就集成在系统里了,因为以前的版本不能默认指定编码的。现在的是可以指定项目,但不能指定项目里单独的某个文件。

郁闷 ,不得已了,下载ZendStudio了,因为ZS打开项目中文件的时候,可以右键,选择按指定编码打开。这,让我很方便的在一个项目中处理多种不同编码的文件。

这能怪谁呢?唉。

Tags: netbeans, encoding

netbeans与java7.0runtime不太兼容

PHP开发工具netbeans是一个很不错的工具,对我来说真的很不错。因为他有几个优点是其他IDE无法比拟的。
1、跨平台。同样跨平台的还有Zend,komodo,eclipse等,phped有专门for *nix的开发版本。
2、开源。这时候只剩eclipse和komodo edit了吧?
3、免费。当然还是只有eclipse和komodo edit

虽然说komodoedit也不错,但和ide比起来,功能就少了一点。eclipse也不行,太大了。。。几百兆啊。
所以。还是netbeans不错(
由于这几个跨平台的工具都是其于java的。所以必需的就是java runtime,(komodo不需要,他是基于mozilla的)。由于尝鲜,我直接装了java runtime 7.0,结果就出现了不兼容的地方。并非不能运行,而是代码在输入的时候经常会出问题
1、偶尔中文不能输入,这,我也能接受,实在不行,英文也可以,虽然烂了一点,总还能认识两个
2、代码录入。。。这是最头痛的。

PHP代码
  1. <?php  
  2.   
  3. class test {  
  4.     protected $data = '';   
  5.     //在这个=后面,如果输入单引号,会自动断行,并到下一行的行首输入单引号。就象下面这样  
  6.     protected $data =   
  7. '';  
  8.     //如果是双引号,会自动在双引号间加空格,而且如果双引号在句末,会断行,双引号在句中,会自动把双引号后的单词括进来,如果双引号后是括号,同样把括号包进来  
  9.     //如:  
  10.     protected $data = " 
  11. ";    
  12.     protected $data =";"  
  13.     protected $data = (")";  
  14.   
  15. }  

这些不由自主的行为确实让人头疼。唉。被折腾的都快疯了。我一直以为是6.9的formatter功能的问题,因为我在之前装了6.9测试版,结果就这样不正常了。后来我又卸了装回6.8。结果还是这个问题。于是我只能怀疑是6.9的配置被6.8默认了。当时心都寒了,但想想不太可能。今天因为到单位比较早,于是乎把7.0runtime卸掉,又搞了一下6.0的。结果,真的正常了。。。
于是我认为7.0runtime和netbeans还是不太兼容 。

软件介绍:FavBackup

从软件的介绍中,我很为之心动,要知道每次电脑重装,除了软件外,浏览器才是我们用的最多的程序之一。目前对我来说常用的是Firefox,chrome,但IE我也在用,因为很多网银只支持这玩意。。。

因此重装后就不得不再次进行设置,比如firefox的插件,IE的收藏夹等等。现在firefox和chrome都有了在线收藏夹,而IE下面,360浏览器、maxthon、世界之窗、搜狗等也开始内置类似功能,但IE却是没有这样的设置,因此收藏夹却是需要自己备份(所幸只是某个目录直接拷出来就行)

所以,当看到软件介绍时,就忍不住想推荐给大家了。【申明一下,我没有用过,只是感觉不错】

以下介绍来自汉化新世纪,点击浏览 FavBackup V2.0.0 绿色版

    FavBackup 是一款适用于 Windows 7/Vista/XP/2000 操作系统的,简单易用的网页浏览器设置与其他数据备份和恢复的免费软件,你甚至不必安装即可使用。
    FavBackup 支持 IExplrer、Firefox、Opera、Safari 与 Google Chrome 等各版本的网页浏览器,可以备份包含书签、Cookies、下载纪录、浏览纪录、浏览器设置、储存在浏览器中的密码、搜寻引擎、会话、工具栏设置及其他使 用者个性化设置。透过非常简单的操作介面执行备份、还原等操作,让我们可以快速将原来电脑系统中的浏览器设置快速的搬迁到新的电脑或新的系统中,马上恢復 工作。

大小: 84.88 K
尺寸: 336 x 376
浏览: 1297 次
点击打开新窗口浏览全图
可支援的浏览器:

Internet Explorer 8
Internet Explorer 7
Internet Explorer 6
Firefox 3
Firefox 2
Google Chrome 3
Google Chrome 2
Google Chrome 1
Opera 9
Safari 4
Safari 3

注意!由於浏览器版本不断推陈出新,建议及时下载、更新最新版 FavBackup 软件。
中文版的最新资讯与更新,请关注本人博客(www.localier.com) 中的汉化更新。

--EOF--

点击浏览 FavBackup V2.0.0 绿色版

Firefox插件:Firecookie

Firecookie是firefox的插件。而且它是根在firebug插件里面的。所以,要安装firecookie一定要先安装firebug。安装完Firecookie后,点击F12,在Firebug里面多了一个cookies的Tab,从里面可以看到,列出了当前应用中的cookie信息。

通过这个tab可以看到有些cookie的过期时间显 示“会话”,有些显示的是具体时间。那些显示的是“会话”的cookie就被称为是“会话cookie”,即关闭了当前浏览器后,该cookie就消失 了。那些设置了具体过期时间的cookie被称为是持久cookie,浏览器就会把cookie保存到硬盘上,关闭后再次打开浏览器,这些cookie依 然有效直到超过设定的过期时间。

有些cookie被设置为http-only,是为了防止跨站点脚本攻击(XSS),以防用户重要的cookie信息被别人窃取。这点就不深入了,网上有很多资料。

Cookie的路径用于设置可以读取一个cookie的最顶层的目录,如显示为“/”说明只要在同一个域中,所有的文件都可以访问该cookie。

这个工具可以修改cookie的值、新建cookie、清除cookie等功能。在测试的过程中可以利用这个工具修改相应的cookie的值,来测试对应功能是否正确。

你试试看就知道喽。HOHO