Přihlásit
: [1]
   |   
: prevod formatu pdf  ( 3976 )
LUTEC
Jr. Member
**

Karma: 0
: 81



« : September 20, 2011, 12:21:07 »

Chtel bych se zeptat jestli nekdo nemate zkusenost s prevodem z formatu pdf. Mam z internetu stazeno nekolik knih prave v tomto formatu a chtel bych je mit v mobilu abych je mohl cist v autobuse nebo metru. Telefon mam nokii bez operacniho systemu a extove soubory, ktere mi tam funguji jsou ve formatu jar. Mozna je i jiny typ souboru ktery ba tam fungoval, ale ja ho neznam. Pokud s tim mate nekdo zkusenost nebo nejaky napad jak by to mohlo jit, tak budu rad za rady..

Mandriva 2010 spring
Peťoš
Global Moderator
Hero Member
*****

Karma: 188
: 6 712



« #1 : September 20, 2011, 13:19:16 »

jar nejsou textove soubory, ale soubory java. Jinak PDF je format navrzeny k tomu, aby nebyl modifikovatelny. Moc se s tim nedomluvis...

Do it or do not. There is no "try".

Peťošův repozitář je na adrese: http://petos.cz/rpms
Fotoblog: http://vzducholode.blogspot.com a http://petos.cz/category/fotky
LUTEC
Jr. Member
**

Karma: 0
: 81



« #2 : September 20, 2011, 17:03:26 »

koukal jsem a ty knizky se daji stahnout i jako wordovskej (writerovskej) soubor, s tim uz by se neco udelat dalo??

Mandriva 2010 spring
Peťoš
Global Moderator
Hero Member
*****

Karma: 188
: 6 712



« #3 : September 20, 2011, 17:10:32 »

S tim se jiz pracovat da (aspon trochu), zkus Ulozit Jako> format bude text-encoded.
Ale jak jsem psal, jar java-archiv. Neni to format pro cteni textu. Nevim, co a v cem jsi cetl.

Do it or do not. There is no "try".

Peťošův repozitář je na adrese: http://petos.cz/rpms
Fotoblog: http://vzducholode.blogspot.com a http://petos.cz/category/fotky
Hobil
Hero Member
*****

Karma: 58
: 4 006


« #4 : September 20, 2011, 17:31:34 »

Zkus ty wordowsky docy otevrit v oowriteru (open office) a pouzit ulozit jako kodovany text (.txt), nebo aportisdoc - nebo nejak tak (pdb, format pro Palm, ctecky ho obvykle znaji), pripadne pocket word (psw), nebo html - jde jen o to, co ctecka umi precist. Je to treba vyzkouset.
Pokud neni pdf soubor pripraveny a ulozeny jako editovatelny, pak je to fakt jen obrazek, ktery by jsi musel prohnat nejakym OCR programem (fine reader, recognita, vse pro win, v linuxu zatim bida).
H.

Benzínem se nemá hasit ohniště
teď už je to jedno, ale pro příště... (K.P.)
Ivan Bibr
Administrator
Hero Member
*****

Karma: 52
: 3 298



« #5 : September 20, 2011, 23:24:36 »

Pokud neni pdf soubor pripraveny a ulozeny jako editovatelny, pak je to fakt jen obrazek, ktery by jsi musel prohnat nejakym OCR programem (fine reader, recognita, vse pro win, v linuxu zatim bida).

Ale no tak... PDF není obrázek, to ani náhodou, a možnost editace(*) na to samozřejmě nemá žádný vliv. V důsledku toho existují nástroje jako pdftotext (konzolový příkaz), který je celkem schopný. Tabulky apod. se mu obvykle  moc nepodaří, ale holý text bývá celkem v pořádku.

(*) Zřejmě jsi myslel možnosti PDF jako zákaz tisku apod. Nevím, jestli je tam i zákaz editace, každopádně na extrakci textu z PDF nic takového nepotřebuješ.

TIP: na převod dokumentů z/do různých formátů existuje celkem dobrý soft Calibre: http://www.linuxexpres.cz/software/calibre-spravce-elektronickych-knih.
« : September 20, 2011, 23:28:41 Ivan Bibr »

Hobil
Hero Member
*****

Karma: 58
: 4 006


« #6 : September 23, 2011, 08:47:22 »

PDF není jen obrázek, ale může se tak chovat. Například jej lze pouze zobrazit, lze zakázat i prosté kopírování (označení bloku myší) ap.  Pro uživatele je to tedy jen obrázek, bez ohledu na to, co je pod kapotou.
Na utilitu pdftotext jsem už dávno rezignoval, výsledky jsou tristní. Už dlouho mi nepřišel do ruky pdf dokument, který by obsahoval "prostý text" bez složitějšího členění do sloupců, tabulek, grafů, vzorců atd.
Když jsem hledal řešení pro zpracování podobných dárečků v naší firmě, pomohl jako jediný Fine Reader (ne není to reklama). Pokud lze z pdf vydolovat text, udělá to (tedy 100% úspěšný "převod"), pokud ne, prožene to OCR modulem a text rozpozná. Jednoduché a funkční.
H.

Benzínem se nemá hasit ohniště
teď už je to jedno, ale pro příště... (K.P.)
LUTEC
Jr. Member
**

Karma: 0
: 81



« #7 : September 27, 2011, 01:13:37 »

Dekuji za rady, nakonec jsem to vyresil tak, ze jsem stahl knihy ve formatu doc a ty pomoci OOWriter ulozil jako kodovany text tedy koncovka txt a ten potom zkomprimoval do zip a pro muj telefon jsem stahl program ANYVIEW, ktery soubory txt zkomprimovane do zip perfektne rozezna. Program Anyview jsem musel zvolit, protoze muj telefon umi jen aplikace java. Pokud ma telefon symbian existuje mnoho jinych programu..... Soubor txt jsem volil z duvodu, ze mi jine druhy souboru po prevodu zobrazovaly nesmyslne znaky.

Mandriva 2010 spring
: [1]
   |   
 
: