Blogging with Common Sense

Posts tagged “calibre

Calibre – How to create recipes

Acest articol este continuarea rss on kindle3.

Recipe-ul de mai jos este scris in limbajul pyton si e folosit la parsarea site-ului catavencu.ro.

Copiati exemplul si salvati-l intr-un fisier cu extensia recipe sau inspirati-va dupa un recipe deja facut: in Calibre se apasa Fetch news -> Add custom news source-> Customize buildin recipe si se alege un template din lista. Eu m-am inspirat dupa scriptul ScienceDaily[en].

Cu Notepad-ul din Windows se modifica parametrii de culoare rosie.

# -*- coding: utf-8 -*-
#!/usr/bin/env  python
__license__   = ‘GPL v3’
__copyright__ = u’2011, numeleTau
”’
catavencu.ro
”’
from calibre.web.feeds.news import BasicNewsRecipe
class Catavencu(BasicNewsRecipe):
title                 = u’Academia Ca\u0163avencu
__author__            = u’numeleTau
description           = ‘Tagma cum laude
publisher             = ‘Catavencu
oldest_article        = 5
language              = ‘ro’
max_articles_per_feed = 100
no_stylesheets        = True
use_embedded_content  = False
category              = ‘Ziare
encoding              = ‘utf-8’
cover_url           = ‘http://upload.wikimedia.org/wikipedia/en/1/1e/Academia_Catavencu.jpg
conversion_options = {
‘comments’   : description
,’tags’       : category
,’language’   : language
,’publisher’  : publisher
}
keep_only_tags = [
dict(name=’ul’, attrs={‘class’:’articles’})
]
remove_tags = [
dict(name=’div’, attrs={‘class’:[‘tools’]})
, dict(name=’div’, attrs={‘class’:[‘share’]})
, dict(name=’div’, attrs={‘class’:[‘category’]})
, dict(name=’div’, attrs={‘id’:[‘comments’]})
]
remove_tags_after = [
dict(name=’div’, attrs={‘id’:’comments’})
]
feeds          = [
(u’Feeds’, u’http://catavencu.ro/feed/rss’)
]
def preprocess_html(self, soup):
return self.adeify_images(soup)
 
 
 

Explicatii:

keep_only_tags – reprezinta ce elemente html sa apara in subscriptie.

Ex: dict(name=’ul’, attrs={‘class’:’articles’}) – inseamna ca trebuie sa apara doar continutul din tag-ul ul care are css-ul articles

remove_tags – specifica ce elemente sa fie eliminate din tag-ul ul
Ex: dict(name=’div’, attrs={‘class’:[‘tools’]}) – va elimina continutul din tag-ul div care are css-ul tools
Pentru a elimina comentariile din se adauga si dict(name=’div’, attrs={‘id’:[‘comments’]} –  tag-ul div care are id-ul comments

remove_tags_after – unde se termina parsarea
Ex: dict(name=’div’, attrs={‘id’:’comments’} – se termina parsarea dupa div-ul cu id-ul comments

feeds – reprezinta lista de rss-uri. Pot fi mai multe rss-uri
Ex: pentru hotnews am adaugat
feeds          = [   (u’\u0218tiri’, u’http://www.hotnews.ro/rss/actualitate’),
(u’English’, u’http://www.hotnews.ro/rss/english’)
]

via getfirebug.com

Pentru a afla ce tag-uri (div, form, ul ..) sunt folosite de un site va recomand Firefox si plugin-ul Firebug .
Dupa instalarea plugin-ului se da click pe iconita firebug din coltul dreapta jos din Firefox dupa care se selecteaza cursorul din partea stanga sus din consola. Acest cursor este folosit la inspectia elementelor web.

Pentru a testa un recipe se copiaza fisierul in folderul unde este instalat calibre si din command prompt se ruleaza comanda: C:\Program Files\Calibre2>ebook-convert Catavencu.recipe D:\temp –test -vv

Daca apare eroarea IndentationError: unexpected indent inseamna ca nu sunt aliniate comenzile asa cum ar trebui. Deschideti fisierul cu Notepad-ul de Windows si realiniati liniile (vezi docs.python). Daca apar alte erori ignorati-le si deschideti index.html din D:\temp. Daca totul pare ok atunci faceti un test din Calibre.

Pentru a adauga recipe-uri in Calibre se apasa sageata de langa butonul Fetch news si se alege Add custom news source dupa care Load recipe from file si se selecteaza un fisier cu extensia .recipe. Se apasa butonul Add/Update recipe apoi Close si Yes.
Se alege optiunea Schedule news download de langa butonul Fetch news si in Recipe-ul Custom veti gasi denumirea site-ului din fisierul recipe. Pentru a downloada ziarul se apasa butonul Download.

Daca doriti sa primiti documentul automat pe Kindle urmati pasii 3,4,5 de aici.

Daca doriti sa folositi diacritice utilizati forma Unicode (ex: u’Academia Ca\u0163avencu’)

Simbol Cod HTML Unicode
ă ă U0103
Ă Ă U0102
â â U00E2
  U00C2
î î U00EE
Î Î U00CE
ş ş U015F cu sedilă
ş ș U0219 cu virgulă
Ş Ş U015E cu sedilă
Ş Ș U0218 cu virgulă
ţ ţ U0163 cu sedilă
ţ ț U021B cu virgulă
Ţ Ţ U0162 cu sedilă
Ţ Ț U021A cu virgulă

via cheeprey.ro

Tutoriale gasiti pe calibre , calibre tips, mobileread recipe, mobile2, calibre2 plus alte exemple si cele oficiale.

Recipe-uri pentru rss-uri romanesti gasiti in topicul de pe mobileread.

Recipe-urile care apar default in Calibre le gasiti in directorul unde este instalat \resources\builtin_recipes.zip


RSS and Newspaper Subscription on Kindle 3

Daca doresti sa primesti automat ziarul sau revista ta preferata direct pe Kindle atunci urmeaza tutorialul de mai jos (este nevoie de cont gmail).

1. Instaleaza Calibre.
2.1 Se da click pe butonul Fetch news si se cauta ziarul/revista.
Daca se gaseste atunci se selecteaza si se seteaza in Schedule for download cand si la ce ora sa fie trimisa subscriptia. Se trece la pasul 3.

Daca nu se gaseste revista atunci trebuie sa se adauge o sursa de stiri noua – aici aveti 2 optiuni: daca doriti ca subscriptia sa contina tot articolul cu tot cu comentarii, reclame .. etc atunci treceti la pasul 2.2  – daca nu, atunci trebuie sa creati un recipe nou dupa articolul de aici.

2.2 Se da click pe sageata de langa butonul Fetch News si se alege Add a custom news source.
In partea de jos se introduce Feed title (numele ziarului) si Feed URL (url-ul RSS) dupa care se completeaza numele si in campul Recipe title; se apasa butonul  Add feed apoi Add/Update recipe dupa care Close -> Yes.

calibre-ebook.com

Se apasa butonul Fetch news si se cauta ziarul adaugat anterior; se alege ziarul si se apasa Download. Se verifica daca s-a downloadat ziarul pe PC. Se trece la pasul urmator.

3. Se alege butonul Preferences  apoi Sharing books by email. Aici se apasa butonul Add email si se introduce adresa userulTau@free.kindle.com, apoi se actioneaza butonul Make default. Se apasa butonul Use Gmail si se introduc credentialele apoi OK; se verifica daca username-ul este corect si daca este completat campul Send email from dupa care se apasa butonul Test email.

Daca nu sunt erori se apasa Apply din coltul stanga sus.

4. Se acceseaza pagina Amazon My Manage si in paragraful Your Kindle Approved E-mail ListE-mail address: se introduce adresa gmail apoi se apasa butonul Add Adress. In Calibre se alege ziarul downloadat si se apasa butonul Connect Share dupa care se alege optiunea email to userulTau.
Se conecteaza Kindle-ul la Wi-fi si se verifica daca s-a primit ziarul (eventual se verifica si contul email pentru erori).

5. Daca nu a fost setat cand trebuie trimisa subscriptia atunci se apasa din nou butonul Fetch news, se cauta ziarul ,se selecteaza dupa care se apasa check box-ul Schedule for download; se alege cand se doreste primirea ziarului dupa care se apasa butonul Save. Se verifica daca se primeste documentul.

Singura problema e ca daca doriti sa se downloadeze automat atunci trebuie sa aveti Calibre (PC-ul) deschis la ora cand trebuie sa se trimita ziarul. O alta optiune e sa deschideti dimineata programul Calibre dupa care sa alegeti optiunea Download all scheduled new resources apasand sageata de langa butonul Fetch news dupa care se copiaza ziarele/revistele pe Kindle direct prin USB sau Connect/share->Email to.

Fluxuri RSS gasiti pe paginile web ale ziarelor/revistelor. Cateva exemple:

hotnews
adevarul
money
prosport
realitatea
evz
capital
gandul
mediafax
standardmoney
jurnalul
digg
TechCrunch
Techeblog

Daca doriti sa apara un favicon langa ziar in lista Schedule news download atunci trebuie sa copiati un png in directorul unde este instalat CalibreCalibre2\resources\images\news. Pentru a genera favicon-uri din url-ul site-urilor puteti folosi ifavicon , getfavicon sau dynamicdrive.

via mobileread, mobileread2, calibre-ebook

Alte lucruri utile legate de Kindle 3 gasiti aici


Kindle 3 si PDF

Amazon a introdus suportul pentru fisierele pdf incepand cu versiunea de firmware 2.3 pentru Kindle 2 iar mai apoi a introdus si optiunea de Zoom.

Desi mai este loc de imbunatatiri pot sa spun ca cititul documentelor PDF pe Kindle 3 este o experienta placuta, nu foarte deoarece nu poti schimba marimea fontului ca in cazul fisierelor in format azw, prc sau mobi.

Atunci cand citesti un PDF poti selecta diferite nivele de Zoom: Fit-to-screen, 150%, 200%, 300%, Actual size sau Contrast: lightest, lighter, default, darker, darkest plus Screen Rotation unde poti roti imaginea pentru a citi in modul Landscape.

Multi prieteni m-au intrebat cum se vad documentele in format PDF pe un Kindle 3 caci trebuie sa recunoastem, cele mai multe documente pe internet sunt in acest format.

Pentru a testa cum se vede un fisier pdf pe un Kindle 3 am folosit un document de pe redbooks.

Prima pagina

Pagina fara optiunea Darkest

Pagina cu optiunea Darkest

Pagina cu zoom 150%

Pagina Landscape

Daca folosesti optiunea de zoom si doresti sa maresti o anumita zona a ecranului apasa butonul Shift si foloseste sagetile.

Kindle 3 suporta si documente pdf parolate, desigur trebuie sa stii parola ca sa le citesti.

Pentru a vedea explicatiile unui cuvant trebuie sa pozitionezi cursorul langa el si in partea de jos a ecranului se va afisa explicatia din dictionar.

Poti transforma fisierele pdf in formatul mobi folosind Calibre sau Mobipocket iar daca documentul nu depaseste 50 Mb il poti transforma in formatul Kindle azw trimitand fisierul la adresa userulTau@free.kindle.com.

Alte programe care convertesc fisiere pentru dispozitive mobile gasiti pe mobileread .