Blogging with Common Sense

Kindle – how to read/transform PDF

Pe internet gasesti multe carti tehnice insa majoritatea sunt in format PDF.
Cu Abbyy FineReader 11 poti transforma un PDF in EPUB, HTML sau MS Word, dupa care il poti transforma foarte usor in mobi.

Dupa ce ai instalat programul trebuie sa alegi din meniul din stanga E-book – HTML -> File(PDF/Image) to HTML apoi Document language: Romanian sau English. Daca se doreste se pot face corectii asupra fisierului (Analyze, Verification si/sau Read doar pe o pagina) apoi Send-> to HTML, EPUB (Electronic Publication) sau Microsoft Word. Alte setari  pot fi facute in meniul Tools-> Options – Document Language – in ce limba este scris documentul, Color Mode (alb-negru e mai rapid), Scan/Open – Automatically analyze acquired page images, Enable image processing, Detect page orientation, Split facing images, Save – DOCX/ODT/RTF: Retain layout – Formatted text, Default paper size: Automatic, Text settings – nimic, HTML – Formatted Text. Conversia nu este perfecta insa poti folosi Corector-ul din MS Word (in Word 2010 – Meniul Review – Spelling & Grammar).

Pentru a elimina stilurile introduse de aplicatia OCR se salveazã documentul ca RTF, apoi se deschide în WordPad, unde se salveazã din nou, fãrã a i se face vreo modificare. Noul RTF se deschide in Word si se salveazã ca DOC (DOCX).

O problema comuna este legata de litera Î, Abbyy o inlocuieste cu î mic, o solutie e sa aplicati Find/Replace pentru caracterul î aflat la inceput de propozitie (Find . î replace with . Î) sau . Ii înlocuit cu Îi, . In – În, . Il – Îl. O alta problema este legata de litera l mai ales cand este precedata de caracterul – de obicei rezultatul este -1, solutia e Find -1 Replace with -l. Litera Î de la început de propozitie este confundata cu î, pentru asta trebuie sa cautati ^pî si sa-l înlocuiţi cu  ^pÎ . Sfarsitul de paragraf dublat se modifica prin cautarea ^p^p si inlocuire cu ^p, tab-ul ^t se inlocuieste cu spatiu, ^-  cu nimic, se cauta apoi  ^b si se sterge unde este nevoie.

Din cate programe am testat acesta este printre putinele care a reusit sa recunoasca un tabel sau un grafic dintr-un PDF, din pacate varianta trial permite exportul doar unei singure pagini asa ca nu am putut sa convertesc tot documentul in mobi. In imaginea de mai jos puteti veadea in dreapta cum arata pagina identificata de Abby FineReader.

Abbyy Finereader 11

Varianta trial poate fi downloadata de pe download.abbyy.com
Alte teste cu PDF-uri gasesti pe dunedenisip.
Un tutorial foarte bun pentru OCR ai aici.
Daca doresti sa afli alte lucuri despre Kindle 3 vezi dunedenisip tips and tricks.

One response

  1. Pingback: Convert PDF to kindle format « I think therefore i blog

Lasă un răspuns

Completează mai jos detaliile despre tine sau dă clic pe un icon pentru autentificare:

Logo WordPress.com

Comentezi folosind contul tău WordPress.com. Dezautentificare / Schimbă )

Poză Twitter

Comentezi folosind contul tău Twitter. Dezautentificare / Schimbă )

Fotografie Facebook

Comentezi folosind contul tău Facebook. Dezautentificare / Schimbă )

Fotografie Google+

Comentezi folosind contul tău Google+. Dezautentificare / Schimbă )

Conectare la %s