View previous topic :: View next topic |
Author |
Message |
lsegalla l33t
Joined: 27 Jun 2007 Posts: 796
|
Posted: Mon Jan 19, 2009 11:08 am Post subject: PDF to TEXT conversion sotto linux |
|
|
Sapete se c'è qualche programma per linux che converte i PDF in DOC o comunque in un formato testo ? |
|
Back to top |
|
|
riverdragon Veteran
Joined: 14 Sep 2006 Posts: 1269 Location: Verona
|
Posted: Mon Jan 19, 2009 12:27 pm Post subject: |
|
|
Prova con pdf2ps e poi ps2ascii. |
|
Back to top |
|
|
lsegalla l33t
Joined: 27 Jun 2007 Posts: 796
|
Posted: Mon Jan 19, 2009 12:41 pm Post subject: |
|
|
riverdragon wrote: | Prova con pdf2ps e poi ps2ascii. |
pdf2ps e ps2pdf funzionano e fanno il loro lavoro (ovvero convertono in ps e mi permettono di tornare a pdf) - fin qui tutto bene
ps2ascii non funziona, del resto dentro c'è un minimo di celle, caselle e grafica di quel tipo
ad ogni modo vorrei riuscire ad andare su un formato word alla fine |
|
Back to top |
|
|
lordalbert l33t
Joined: 26 Nov 2006 Posts: 840 Location: Italy
|
Posted: Mon Jan 19, 2009 3:29 pm Post subject: |
|
|
magari potresti importare il pdf in openoffice (forse richiede un plugin, ma la versione 3 può importare/modificare i pdf) e poi da openoffice lo salvi nel formato che vuoi |
|
Back to top |
|
|
lsegalla l33t
Joined: 27 Jun 2007 Posts: 796
|
Posted: Mon Jan 19, 2009 3:37 pm Post subject: |
|
|
lordalbert wrote: | magari potresti importare il pdf in openoffice (forse richiede un plugin, ma la versione 3 può importare/modificare i pdf) e poi da openoffice lo salvi nel formato che vuoi |
se sapessi come importarlo.... come si fa ? |
|
Back to top |
|
|
djinnZ Advocate
Joined: 02 Nov 2006 Posts: 4831 Location: somewhere in L.O.S.
|
Posted: Mon Jan 19, 2009 3:57 pm Post subject: |
|
|
Dipende da come è fatto il pdf, se gli elementi grafici sono inseriti come immagini raw puoi fare molto poco a parte sovrascrivere.
http://extensions.services.openoffice.org/project/pdfimport , scarichi la versione corrispondente e da strumenti->gestone estensioni->aggiungi apri il pacchetto scaricato.
Non attenderti miracoli, ovviamente. _________________ scita et risus abundant in ore stultorum sed etiam semper severi insani sunt
mala tempora currunt...mater stultorum semper pregna est
Murpy'sLaw:If anything can go wrong, it will - O'Toole's Corollary:Murphy was an optimist |
|
Back to top |
|
|
lsegalla l33t
Joined: 27 Jun 2007 Posts: 796
|
Posted: Mon Jan 19, 2009 4:14 pm Post subject: |
|
|
djinnZ wrote: | Dipende da come è fatto il pdf, se gli elementi grafici sono inseriti come immagini raw puoi fare molto poco a parte sovrascrivere.
http://extensions.services.openoffice.org/project/pdfimport , scarichi la versione corrispondente e da strumenti->gestone estensioni->aggiungi apri il pacchetto scaricato.
Non attenderti miracoli, ovviamente. |
Mi aspettavo che almeno caricasse l'estensione, ahaha...!!
Mi esce questo messaggio in una finestra appena cerco di importare il file da GESTIONE ESTENSIONI:
Io gli do' quindi ok e non succede niente... |
|
Back to top |
|
|
djinnZ Advocate
Joined: 02 Nov 2006 Posts: 4831 Location: somewhere in L.O.S.
|
Posted: Mon Jan 19, 2009 5:45 pm Post subject: |
|
|
Usi OOo compilato o binario? Pare che sia necessario compilare...
Tanto per curiosità qualcuno ha capito come scaricare i sorgenti? _________________ scita et risus abundant in ore stultorum sed etiam semper severi insani sunt
mala tempora currunt...mater stultorum semper pregna est
Murpy'sLaw:If anything can go wrong, it will - O'Toole's Corollary:Murphy was an optimist |
|
Back to top |
|
|
lsegalla l33t
Joined: 27 Jun 2007 Posts: 796
|
Posted: Mon Jan 19, 2009 6:24 pm Post subject: |
|
|
djinnZ wrote: | Usi OOo compilato o binario? Pare che sia necessario compilare...
Tanto per curiosità qualcuno ha capito come scaricare i sorgenti? |
Ho fatto il solito emerge.... vuoi dirmi che per sta stupidaggine devo compilarmelo tutto a manina ?? |
|
Back to top |
|
|
lordalbert l33t
Joined: 26 Nov 2006 Posts: 840 Location: Italy
|
Posted: Mon Jan 19, 2009 7:51 pm Post subject: |
|
|
lsegalla wrote: | djinnZ wrote: | Usi OOo compilato o binario? Pare che sia necessario compilare...
Tanto per curiosità qualcuno ha capito come scaricare i sorgenti? |
Ho fatto il solito emerge.... vuoi dirmi che per sta stupidaggine devo compilarmelo tutto a manina ?? |
intendeva se hai usato openoffice-bin
Io ho usato la versione da compilare (con emerge) e funziona... |
|
Back to top |
|
|
mack1 Guru
Joined: 18 Mar 2006 Posts: 315
|
Posted: Mon Jan 19, 2009 9:13 pm Post subject: |
|
|
Per convertire un pdf in formato testo puoi usare pdftotext lo trovi in:
Code: |
root@Hell_in_a_Shell:22:06:0:~>qfile `which pdftotext`
app-text/poppler (/usr/bin/pdftotext)
|
E' velocissimo nella conversione , però non converte ancora le immagini in ascii art, peccato .
Ciao |
|
Back to top |
|
|
lsegalla l33t
Joined: 27 Jun 2007 Posts: 796
|
Posted: Tue Jan 20, 2009 8:35 am Post subject: |
|
|
lordalbert wrote: | lsegalla wrote: | djinnZ wrote: | Usi OOo compilato o binario? Pare che sia necessario compilare...
Tanto per curiosità qualcuno ha capito come scaricare i sorgenti? |
Ho fatto il solito emerge.... vuoi dirmi che per sta stupidaggine devo compilarmelo tutto a manina ?? |
intendeva se hai usato openoffice-bin
Io ho usato la versione da compilare (con emerge) e funziona... |
Io non ho usato openoffice-bin... per usarla secondo voi è sufficiente che io disinstalli il vecchio con Code: | emerge -C openoffice | e poi installi il bin con Code: | emerge openoffice-bin | oppure ci son altri problemi strada facendo? Flag da avere abilitate invece ?
Attendo consigli.... |
|
Back to top |
|
|
lordalbert l33t
Joined: 26 Nov 2006 Posts: 840 Location: Italy
|
Posted: Tue Jan 20, 2009 10:37 am Post subject: |
|
|
lsegalla wrote: | lordalbert wrote: | lsegalla wrote: | djinnZ wrote: | Usi OOo compilato o binario? Pare che sia necessario compilare...
Tanto per curiosità qualcuno ha capito come scaricare i sorgenti? |
Ho fatto il solito emerge.... vuoi dirmi che per sta stupidaggine devo compilarmelo tutto a manina ?? |
intendeva se hai usato openoffice-bin
Io ho usato la versione da compilare (con emerge) e funziona... |
Io non ho usato openoffice-bin... per usarla secondo voi è sufficiente che io disinstalli il vecchio con Code: | emerge -C openoffice | e poi installi il bin con Code: | emerge openoffice-bin | oppure ci son altri problemi strada facendo? Flag da avere abilitate invece ?
Attendo consigli.... |
da quello che ha detto djinnZ è meglio avere la versione "non binaria". Ad ogni modo, io ho la versione compilata (semplicemente opeoffice, come la tua) e non da problemi. Quindi è strano...
Quello che ho fatto io, è cliccare sulla versione da scaricare da questa pagina http://extensions.services.openoffice.org/project/pdfimport e poi ho fatto "apri con... OpenOffice" e l'ha installato senza problemi |
|
Back to top |
|
|
lsegalla l33t
Joined: 27 Jun 2007 Posts: 796
|
Posted: Tue Jan 20, 2009 12:11 pm Post subject: |
|
|
Io vedo che con ARK si riesce ad aprire il file OXT e che dentro c'è appunto il file che da me genera quell'errore... magari è sputtanato quello...
Ho provato a rifare il download e a reinstallarlo, ho provato anche a modificare i diritti di quel file... tutte operazioni con improbabile successo e infatti
Tutto come prima!
Comunque di fatto mi basterebbe anche un programma che aggiunge dati a un PDF esistente (come PDFPEN che vedo sotto osx ad esempio)
Ho provato pdftk ma non sembra faccia al caso mio.
Poppler/PDFtoText funziona e mi converte tutto in formato testo pero' avrei bisogno dello stesso form.
Mi basterebbe appunto scrivere sopra al PDF che già ho a sto punto...
--- EDIT ---
Sotto Windows ne ho trovato uno, si chiama FOXIT READER, quello riesce a modificare solo alcuni campi (in stile FORM per intenderci)
http://www.foxitsoftware.com/pdf/reader_2/down_reader.htm
Esisterà qualcosa anche per linux ? Funzionerà con wine ? Tutto da provare per ora, vi fo sapere magari |
|
Back to top |
|
|
mack1 Guru
Joined: 18 Mar 2006 Posts: 315
|
|
Back to top |
|
|
djinnZ Advocate
Joined: 02 Nov 2006 Posts: 4831 Location: somewhere in L.O.S.
|
Posted: Tue Jan 20, 2009 5:53 pm Post subject: |
|
|
Non lo so io ho problemi sia con la compilata che con la binaria (ma non ho indagato più di tanto ho altre rogne al momento).
Parlavo di compilare il plugin non openoffice, pare che funzioni per una build specifica (o richiderà dbus/mono od una versione specifica di java, non ho idea) al punto che per ubuntu hanno predisposto un pacchetto apposito.
Pdftoedit mi pare che dovrebbe essere in un overlay o sul bugzilla da un pezzo. _________________ scita et risus abundant in ore stultorum sed etiam semper severi insani sunt
mala tempora currunt...mater stultorum semper pregna est
Murpy'sLaw:If anything can go wrong, it will - O'Toole's Corollary:Murphy was an optimist |
|
Back to top |
|
|
lsegalla l33t
Joined: 27 Jun 2007 Posts: 796
|
Posted: Wed Jan 21, 2009 12:40 pm Post subject: |
|
|
Questo sembra essere decisamente interessante, sembra che faccia un po' tutto quel che mi serve ora.
La riconversione verso .doc per ora la lascio perdere, non mi incasino oltre...
Che ci sia anche una versione per windows di questo PDFedit ? Giusto per sapere... non mi sembra di averlo visto in giro.... |
|
Back to top |
|
|
mack1 Guru
Joined: 18 Mar 2006 Posts: 315
|
|
Back to top |
|
|
lsegalla l33t
Joined: 27 Jun 2007 Posts: 796
|
Posted: Thu Jan 22, 2009 8:17 am Post subject: |
|
|
Sì sì, nel pinguino l'ho già installato e funzionante.... è che sotto terminal server son vincolato e devo far lavorare l'utente di turno sotto windows senno' mi tocca ogni volta fargli tutto io
Sperem che la cosa non sia molto ripetitiva che non ho proprio tutto sto tempo |
|
Back to top |
|
|
Ic3M4n Advocate
Joined: 02 Nov 2004 Posts: 3489 Location: Bergamo.
|
Posted: Thu Jan 22, 2009 8:51 am Post subject: |
|
|
in alternativa acroread permette di esportare in txt, il risultato è simile a pdftotext, almeno per le poche volte che mi è servito. Il problema è che entrambi non interpretano correttamente alcuni caratteri, per esempio è viene trasformato in 'e e cose del genere. Inoltre ogni tanto vengono visualizzati i caratteri unicode codificati, rettangolino con dentro i numeri etc etc. |
|
Back to top |
|
|
|