手机浏览 RSS 2.0 订阅 膘叔的简单人生 , 腾讯云RDS购买 | 超便宜的Vultr , 注册 | 登陆
浏览模式: 标准 | 列表Tag:pdf

将网页生成pdf的快速方法

 在网上看到一篇好文章 ,以前都是加入收藏夹,以后可以打开来看。

后来,开始用:readitlater(现在改名叫pocket了),确实都比较方便,毕竟pocket也是全平台支持的。
但即使这样,也会遇到不少的问题,即pocket中的网页已经无效了。晶啊,这太让人纠结了,我存下来可不是只要一个网址的
 
当然在windows下面,以前还用cyberarticle(网文快捕),现在叫wiz了,但不能存在自己的服务器上,总是不太舒服。
 
于是就想着把内容copy出来存为word,方便以后查,但现在,发现有快速生成pdf的方式,轻松将网页生成pdf了,以后查询起来就方便了:
大小: 89.28 K
尺寸: 490 x 376
浏览: 1422 次
点击打开新窗口浏览全图
 
上图怎么样?可以选择指定内容,可以指定背景。而且,不需要额外装软件。
它是谁?它是chrome
嗯,直接按打印就能看到上述菜单了。还不赶紧试试?

Tags: pdf, html

Mou生成PDF时颜色偏淡的解决方法

Mou是一款很优秀的Markdown编辑软件,在MAC下面的展现比较趋向于完美,但一直以来生成PDF时,颜色都非常淡:
大小: 37.09 K
尺寸: 500 x 246
浏览: 1545 次
点击打开新窗口浏览全图
眼睛都快看花了,而LiteIDE里,作者说他是用的Mou授权的CSS文件,却生成出来是这样的效果:
大小: 41.91 K
尺寸: 500 x 273
浏览: 1569 次
点击打开新窗口浏览全图
这相差也太大了。所以就发了封邮件给作者,作者回复的很快,然后发现我也被鄙视了。。。

XML/HTML代码
  1. 你好!我猜你一定是 Mou 的老用户了(从 0.7.2 之前就开始用了),因为这个 CSS 早在 Mou 0.7.3(去年8月19号) 就已经更新过了(PDF颜色加深)。  
  2.   
  3. 但是为了保证用户之前自定义 CSS 的安全,Mou 不会主动覆盖旧的 CSS,如果想使用新的 CSS,需手动删除  
  4. ~/Library/Application Support/Mou/CSS/  
  5. 目录下旧的 CSS,重启 Mou,Mou 会创建新的 CSS。  
  6.   
  7. 这点已在 Release Notes 中多次提及:  
  8. http://mouapp.com/releasenotes/  

看了一下mouapp的releasenotes,那一行果然是其他颜色的。。。天啊。更新这么多次了,都没有看过别人的releasenotes。。。郁闷
大小: 147.47 K
尺寸: 500 x 221
浏览: 1554 次
点击打开新窗口浏览全图
于是进入目录,删除了CSS,重打开Mou,Export 一份PDF,果然正常了。Oh Yeah。。

作者还提供了修改CSS的方法:

XML/HTML代码
  1. 另外如果需要自定义 CSS,不能直接修改 .app 包里的,如果真的那样设定,岂不是每一次更新,用户的自定义 CSS 都会丢掉?  
  2.   
  3. 正确的目录是  
  4. ~/Library/Application Support/Mou/CSS/  
  5. 如果你在 Preferences>CSS 里点击 Edit… 按钮,引导过去的也是这个目录而不是 .app 包里的。  
  6.   
  7. 关于自定义 CSS,可以直接修改现有的,也可以把新的 CSS 文件(文件名随意)拖到这个目录下,重启 Mou 后它会自动刷新 CSS 列表,当再次进入 Preferences>CSS 里时,就可以在列表中选用你新加入的这个 CSS 了。  
  8.   
  9. 还有一篇关于只应用于 PDF 的自定义 CSS 技巧的 Blog:  
  10. http://chenluois.com/blog/mou-pdf-export-page-break/  

享受Mou吧

Tags: mou, pdf, markdown, liteide

利用wps制作6寸PDF电子书

WPS输出PDF功能,相信大家都知道,那么用它来做电子书就再自然不过了,为什么呢?
因为wps可以很自然的读取html文档,并且保持其中的一些格式,这时候再将它存为doc文档,原来加粗的还是加粗,原来的段落也仍然存在,OK,就这样,一篇文档就出来了。
在输出6寸PDF前,我们需要设置一下页面格式,在页面设置里,将页面的左右边距统统设为5毫米,因为在实际的电子书上,5毫米的边距差不多正好。
然后自定义纸张大小(95x120,单位毫米),如果你不设页眉页脚就把他们全设为0吧。
点击保存,然后WPS会自动计算页数。这个时候就可以输出最简单的PDF了。

如果要生成目录,那得设置每个段的h3,h2,h1值,当设置了这些后,利用WPS生成目录,当页面有这些层次结构的时候,PDF的预览中就会出现目录和书签了。

当然,要想很好的做一个PDF,得细细微调(上面说的是几乎不含图片的PDF版本,如果有图片,则仔细测试一下)。
话说回来,我花了五分钟,把:最老程序员创业札记抓回来做了一个电子书,晚上看看。

Tags: wps, 电子书, pdf

TCPDF:php classes for generating pdf documents

手册中介绍PHP生成PDF用的是fpdf,网上也有一些代码其于Fpdf的看起来好象都不错,但是前提是有fpdf。。因此后来都放弃了。
这一个php class我没有试过,但是看上去好象不错,因为:1开源2原生PHP,不用组件(听说,没试过。)主要是看它可以直接把网页生成PDF,因为他支持html,xhtml,css。所以感觉不错

TCPDF is an Open Source PHP class for generating PDF documents.
TCPDF project was started in 2002 and now it is freely used all over the world by millions of people. TCPDF is a Free Libre Open Source Software (FLOSS).

官方的说明也很详细:

Main Features:

  • no external libraries are required for the basic functions;(看来也只是针对基本功能,不过我想应该够了。)
  • all ISO page formats, custom page formats, custom margins and units of measure;
  • UTF-8 Unicode and Right-To-Left languages;
  • TrueTypeUnicode, OpenTypeUnicode, TrueType, OpenType, Type1 and CID-0 fonts;
  • Font subsetting;
  • methods to publish some XHTML + CSS code, Javascript and Forms;
  • images, graphic (geometric figures) and transformation methods;
  • native support for JPEG, PNG and SVG images;
  • 1D and 2D barcodes: CODE 39, ANSI MH10.8M-1983, USD-3, 3 of 9, CODE 93, USS-93, Standard 2 of 5, Interleaved 2 of 5, CODE 128 A/B/C, 2 and 5 Digits UPC-Based Extention, EAN 8, EAN 13, UPC-A, UPC-E, MSI, POSTNET, PLANET, RMS4CC (Royal Mail 4-state Customer Code), CBC (Customer Bar Code), KIX (Klant index - Customer index), Intelligent Mail Barcode, Onecode, USPS-B-3200, CODABAR, CODE 11, PHARMACODE, PHARMACODE TWO-TRACKS, QR-Code, PDF417;
  • Grayscale, RGB, CMYK, Spot Colors and Transparencies;
  • automatic page header and footer management;
  • document encryption and digital signature certifications;
  • transactions to UNDO commands;
  • PDF annotations, including links, text and file attachments;
  • text rendering modes (fill, stroke and clipping);
  • multiple columns mode;
  • bookmarks and table of content;
  • text hyphenation;
  • automatic page break, line break and text alignments including justification;
  • automatic page numbering and page groups;
  • move and delete pages;
  • page compression.

这里也还有一些例子,有61个之多:

  1. Simple PDF with default Header and Footer: [PHP] [PDF]
  2. Simple PDF without Header and Footer: [PHP] [PDF]
  3. Custom Header and Footer: [PHP] [PDF]
  4. Cell stretching: [PHP] [PDF]
  5. Multicell: [PHP] [PDF]
  6. WriteHTML and RTL support: [PHP] [PDF]
  7. Independent columns with WriteHTMLCell: [PHP] [PDF]
  8. External UTF-8 text file: [PHP] [PDF]
  9. Image: [PHP] [PDF]
  10. Multiple columns: [PHP] [PDF]
  11. Colored Tables: [PHP] [PDF]
  12. Graphic Functions: [PHP] [PDF]
  13. Graphic Transformations: [PHP] [PDF]
  14. Javascript and Forms: [PHP] [PDF]
  15. Bookmarks (Table of Content): [PHP] [PDF]
  16. Document Encryption: [PHP] [PDF]
  17. Independent columns with MultiCell: [PHP] [PDF]
  18. Persian and Arabic language on RTL document: [PHP] [PDF]
  19. Non unicode / Alternative config file: [PHP] [PDF]
  20. Multicell complex alignment: [PHP] [PDF]
  21. writeHTML alignment: [PHP] [PDF]
  22. CMYK colors: [PHP] [PDF]
  23. Page Groups: [PHP] [PDF]
  24. Object Visibility: [PHP] [PDF]
  25. Object Transparency: [PHP] [PDF]
  26. Text Clipping: [PHP] [PDF]
  27. Barcodes: [PHP] [PDF]
  28. Multiple page formats: [PHP] [PDF]
  29. Set PDF viewer display preferences: [PHP] [PDF]
  30. Colour gradients: [PHP] [PDF]
  31. Pie Chart Graphic: [PHP] [PDF]
  32. EPS/AI vectorial image: [PHP] [PDF]
  33. Mixed font types (TrueType Unicode, core, CID-0): [PHP] [PDF]
  34. Clipping masks: [PHP] [PDF]
  35. Line styles with cells and multicells: [PHP] [PDF]
  36. Text Annotations: [PHP] [PDF]
  37. Spot Colors: [PHP] [PDF]
  38. NON-embedded CID-0 CJK font: [PHP] [PDF]
  39. HTML Justification: [PHP] [PDF]
  40. Booklet (double-sided pages): [PHP] [PDF]
  41. File attachment: [PHP] [PDF]
  42. Image with Alpha Channel Transparency: [PHP] [PDF]
  43. Disk caching: [PHP] [PDF]
  44. Move, Copy and delete page: [PHP] [PDF]
  45. Table Of Content with Bookmarks: [PHP] [PDF]
  46. Text hyphenation: [PHP] [PDF]
  47. Transactions and UNDO: [PHP] [PDF]
  48. Table header and rowspan: [PHP] [PDF]
  49. TCPDF methods in HTML: [PHP] [PDF]
  50. 2D Barcode (QR Code): [PHP] [PDF]
  51. Full page background: [PHP] [PDF]
  52. Digital Signature Certification: [PHP] [PDF]
  53. Javascript functions: [PHP] [PDF]
  54. XHTML Form: [PHP] [PDF]
  55. Font Dump: [PHP] [PDF]
  56. Crop Marks and Registration Marks: [PHP] [PDF]
  57. Cell vertical alignments: [PHP] [PDF]
  58. SVG Image: [PHP] [PDF]
  59. Table Of Content with HTML templates: [PHP] [PDF]
  60. Advanced page settings: [PHP] [PDF]
  61. XHTML + CSS: [PHP] [PDF]

可以尝试试用一下吧。

Tags: tcpdf, fpdf, pdf

pdf to txt

或许很多软件都是专业的转换,但是如果PDF中有图片的话,那些convert pdf to word就不一定能够成功转换了。所以我推荐这款“汉王 PDF OCR”,和传统的OCR一样对PDF进行识别、转换,再输出。因此,即使你是图片,他也能够认得出啦,因为他可以把图片直接OCR出来。

   汉王PDF OCR是汉王OCR 6.0 和尚书七号的升级版,本软件新增打开与识别PDF文件功能,支持文字型PDF的直接转换和图像型PDF的OCR识别:既可以采用OCR的方式,将PDF文件转换为可编辑文档;也可以采用格式转换的方式直接转换PDF文件为文本。
本软件系统应用OCR(Optical Character Recognition)技术,为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的软件系统。
目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此急需一种快速高效的软件系统来满足这种海量录入需求。本软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。
    ●识别字符
    简体字符集:国标GB2312-80的全部一、二级汉字6800多个。
    纯英文字符集。
    简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
    ●识别字体种类
    能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。
    ●识别字号
    初号 小六号字体。
    ●表格识别
    可以自动判断、拆分、识别和还原各种通用型印刷体表格。

上午尝试了一下,对于一些杂志扫描出来的OCR可以正确识别。精度还挺高。当然。。。纯图片【文章配图】是没有办法导出来了。。

官网:http://www.hanwang.com.cn/

Tags: 汉王, ocr, pdf

Records:912