Gentoo Forums
Gentoo Forums
Gentoo Forums
Quick Search: in
PDF to TEXT conversion sotto linux
View unanswered posts
View posts from last 24 hours
View posts from last 7 days

 
Reply to topic    Gentoo Forums Forum Index Forum italiano (Italian) Forum di discussione italiano
View previous topic :: View next topic  
Author Message
lsegalla
l33t
l33t


Joined: 27 Jun 2007
Posts: 796

PostPosted: Mon Jan 19, 2009 11:08 am    Post subject: PDF to TEXT conversion sotto linux Reply with quote

Sapete se c'è qualche programma per linux che converte i PDF in DOC o comunque in un formato testo ?
Back to top
View user's profile Send private message
riverdragon
Veteran
Veteran


Joined: 14 Sep 2006
Posts: 1269
Location: Verona

PostPosted: Mon Jan 19, 2009 12:27 pm    Post subject: Reply with quote

Prova con pdf2ps e poi ps2ascii.
Back to top
View user's profile Send private message
lsegalla
l33t
l33t


Joined: 27 Jun 2007
Posts: 796

PostPosted: Mon Jan 19, 2009 12:41 pm    Post subject: Reply with quote

riverdragon wrote:
Prova con pdf2ps e poi ps2ascii.

pdf2ps e ps2pdf funzionano e fanno il loro lavoro (ovvero convertono in ps e mi permettono di tornare a pdf) - fin qui tutto bene
ps2ascii non funziona, del resto dentro c'è un minimo di celle, caselle e grafica di quel tipo

ad ogni modo vorrei riuscire ad andare su un formato word alla fine :?
Back to top
View user's profile Send private message
lordalbert
l33t
l33t


Joined: 26 Nov 2006
Posts: 840
Location: Italy

PostPosted: Mon Jan 19, 2009 3:29 pm    Post subject: Reply with quote

magari potresti importare il pdf in openoffice (forse richiede un plugin, ma la versione 3 può importare/modificare i pdf) e poi da openoffice lo salvi nel formato che vuoi
Back to top
View user's profile Send private message
lsegalla
l33t
l33t


Joined: 27 Jun 2007
Posts: 796

PostPosted: Mon Jan 19, 2009 3:37 pm    Post subject: Reply with quote

lordalbert wrote:
magari potresti importare il pdf in openoffice (forse richiede un plugin, ma la versione 3 può importare/modificare i pdf) e poi da openoffice lo salvi nel formato che vuoi

se sapessi come importarlo.... come si fa ?
Back to top
View user's profile Send private message
djinnZ
Advocate
Advocate


Joined: 02 Nov 2006
Posts: 4831
Location: somewhere in L.O.S.

PostPosted: Mon Jan 19, 2009 3:57 pm    Post subject: Reply with quote

Dipende da come è fatto il pdf, se gli elementi grafici sono inseriti come immagini raw puoi fare molto poco a parte sovrascrivere.

http://extensions.services.openoffice.org/project/pdfimport , scarichi la versione corrispondente e da strumenti->gestone estensioni->aggiungi apri il pacchetto scaricato.
Non attenderti miracoli, ovviamente.
_________________
scita et risus abundant in ore stultorum sed etiam semper severi insani sunt:wink:
mala tempora currunt...mater stultorum semper pregna est :evil:
Murpy'sLaw:If anything can go wrong, it will - O'Toole's Corollary:Murphy was an optimist :wink:
Back to top
View user's profile Send private message
lsegalla
l33t
l33t


Joined: 27 Jun 2007
Posts: 796

PostPosted: Mon Jan 19, 2009 4:14 pm    Post subject: Reply with quote

djinnZ wrote:
Dipende da come è fatto il pdf, se gli elementi grafici sono inseriti come immagini raw puoi fare molto poco a parte sovrascrivere.

http://extensions.services.openoffice.org/project/pdfimport , scarichi la versione corrispondente e da strumenti->gestone estensioni->aggiungi apri il pacchetto scaricato.
Non attenderti miracoli, ovviamente.

Mi aspettavo che almeno caricasse l'estensione, ahaha...!!

Mi esce questo messaggio in una finestra appena cerco di importare il file da GESTIONE ESTENSIONI:
Quote:

loading component library failed:
file:///home/luca/.ooo3/user/uno_packages/cache/uno_packages/RkGyof_/pdfimport.oxt/pdfimport.uno.so


Io gli do' quindi ok e non succede niente... :(
Back to top
View user's profile Send private message
djinnZ
Advocate
Advocate


Joined: 02 Nov 2006
Posts: 4831
Location: somewhere in L.O.S.

PostPosted: Mon Jan 19, 2009 5:45 pm    Post subject: Reply with quote

Usi OOo compilato o binario? Pare che sia necessario compilare...
Tanto per curiosità qualcuno ha capito come scaricare i sorgenti?
_________________
scita et risus abundant in ore stultorum sed etiam semper severi insani sunt:wink:
mala tempora currunt...mater stultorum semper pregna est :evil:
Murpy'sLaw:If anything can go wrong, it will - O'Toole's Corollary:Murphy was an optimist :wink:
Back to top
View user's profile Send private message
lsegalla
l33t
l33t


Joined: 27 Jun 2007
Posts: 796

PostPosted: Mon Jan 19, 2009 6:24 pm    Post subject: Reply with quote

djinnZ wrote:
Usi OOo compilato o binario? Pare che sia necessario compilare...
Tanto per curiosità qualcuno ha capito come scaricare i sorgenti?

Ho fatto il solito emerge.... vuoi dirmi che per sta stupidaggine devo compilarmelo tutto a manina ?? 8O
Back to top
View user's profile Send private message
lordalbert
l33t
l33t


Joined: 26 Nov 2006
Posts: 840
Location: Italy

PostPosted: Mon Jan 19, 2009 7:51 pm    Post subject: Reply with quote

lsegalla wrote:
djinnZ wrote:
Usi OOo compilato o binario? Pare che sia necessario compilare...
Tanto per curiosità qualcuno ha capito come scaricare i sorgenti?

Ho fatto il solito emerge.... vuoi dirmi che per sta stupidaggine devo compilarmelo tutto a manina ?? 8O


intendeva se hai usato openoffice-bin :)
Io ho usato la versione da compilare (con emerge) e funziona...
Back to top
View user's profile Send private message
mack1
Guru
Guru


Joined: 18 Mar 2006
Posts: 315

PostPosted: Mon Jan 19, 2009 9:13 pm    Post subject: Reply with quote

Per convertire un pdf in formato testo puoi usare pdftotext lo trovi in:

Code:

root@Hell_in_a_Shell:22:06:0:~>qfile `which pdftotext`
app-text/poppler (/usr/bin/pdftotext)


E' velocissimo nella conversione 8O , però non converte ancora le immagini in ascii art, peccato :cry: .

Ciao
Back to top
View user's profile Send private message
lsegalla
l33t
l33t


Joined: 27 Jun 2007
Posts: 796

PostPosted: Tue Jan 20, 2009 8:35 am    Post subject: Reply with quote

lordalbert wrote:
lsegalla wrote:
djinnZ wrote:
Usi OOo compilato o binario? Pare che sia necessario compilare...
Tanto per curiosità qualcuno ha capito come scaricare i sorgenti?

Ho fatto il solito emerge.... vuoi dirmi che per sta stupidaggine devo compilarmelo tutto a manina ?? 8O


intendeva se hai usato openoffice-bin :)
Io ho usato la versione da compilare (con emerge) e funziona...


Io non ho usato openoffice-bin... per usarla secondo voi è sufficiente che io disinstalli il vecchio con
Code:
emerge -C openoffice
e poi installi il bin con
Code:
emerge openoffice-bin
oppure ci son altri problemi strada facendo? Flag da avere abilitate invece ?

Attendo consigli....
Back to top
View user's profile Send private message
lordalbert
l33t
l33t


Joined: 26 Nov 2006
Posts: 840
Location: Italy

PostPosted: Tue Jan 20, 2009 10:37 am    Post subject: Reply with quote

lsegalla wrote:
lordalbert wrote:
lsegalla wrote:
djinnZ wrote:
Usi OOo compilato o binario? Pare che sia necessario compilare...
Tanto per curiosità qualcuno ha capito come scaricare i sorgenti?

Ho fatto il solito emerge.... vuoi dirmi che per sta stupidaggine devo compilarmelo tutto a manina ?? 8O


intendeva se hai usato openoffice-bin :)
Io ho usato la versione da compilare (con emerge) e funziona...


Io non ho usato openoffice-bin... per usarla secondo voi è sufficiente che io disinstalli il vecchio con
Code:
emerge -C openoffice
e poi installi il bin con
Code:
emerge openoffice-bin
oppure ci son altri problemi strada facendo? Flag da avere abilitate invece ?

Attendo consigli....


da quello che ha detto djinnZ è meglio avere la versione "non binaria". Ad ogni modo, io ho la versione compilata (semplicemente opeoffice, come la tua) e non da problemi. Quindi è strano...

Quello che ho fatto io, è cliccare sulla versione da scaricare da questa pagina http://extensions.services.openoffice.org/project/pdfimport e poi ho fatto "apri con... OpenOffice" e l'ha installato senza problemi
Back to top
View user's profile Send private message
lsegalla
l33t
l33t


Joined: 27 Jun 2007
Posts: 796

PostPosted: Tue Jan 20, 2009 12:11 pm    Post subject: Reply with quote

Io vedo che con ARK si riesce ad aprire il file OXT e che dentro c'è appunto il file che da me genera quell'errore... magari è sputtanato quello...
Ho provato a rifare il download e a reinstallarlo, ho provato anche a modificare i diritti di quel file... tutte operazioni con improbabile successo e infatti
Tutto come prima!

Comunque di fatto mi basterebbe anche un programma che aggiunge dati a un PDF esistente (come PDFPEN che vedo sotto osx ad esempio)
Ho provato pdftk ma non sembra faccia al caso mio.
Poppler/PDFtoText funziona e mi converte tutto in formato testo pero' avrei bisogno dello stesso form.

Mi basterebbe appunto scrivere sopra al PDF che già ho a sto punto...

--- EDIT ---
Sotto Windows ne ho trovato uno, si chiama FOXIT READER, quello riesce a modificare solo alcuni campi (in stile FORM per intenderci)
http://www.foxitsoftware.com/pdf/reader_2/down_reader.htm

Esisterà qualcosa anche per linux ? Funzionerà con wine ? Tutto da provare per ora, vi fo sapere magari
Back to top
View user's profile Send private message
mack1
Guru
Guru


Joined: 18 Mar 2006
Posts: 315

PostPosted: Tue Jan 20, 2009 3:03 pm    Post subject: Reply with quote

Googolando ho trovato pdftoedit, anche se in portage non è presente:

http://www.cyberciti.biz/tips/open-source-linux-pdf-writer.html

La home del progetto:

http://pdfedit.petricek.net/index_e.html

Ciao
Back to top
View user's profile Send private message
djinnZ
Advocate
Advocate


Joined: 02 Nov 2006
Posts: 4831
Location: somewhere in L.O.S.

PostPosted: Tue Jan 20, 2009 5:53 pm    Post subject: Reply with quote

Non lo so io ho problemi sia con la compilata che con la binaria (ma non ho indagato più di tanto ho altre rogne al momento).

Parlavo di compilare il plugin non openoffice, pare che funzioni per una build specifica (o richiderà dbus/mono od una versione specifica di java, non ho idea) al punto che per ubuntu hanno predisposto un pacchetto apposito.

Pdftoedit mi pare che dovrebbe essere in un overlay o sul bugzilla da un pezzo.
_________________
scita et risus abundant in ore stultorum sed etiam semper severi insani sunt:wink:
mala tempora currunt...mater stultorum semper pregna est :evil:
Murpy'sLaw:If anything can go wrong, it will - O'Toole's Corollary:Murphy was an optimist :wink:
Back to top
View user's profile Send private message
lsegalla
l33t
l33t


Joined: 27 Jun 2007
Posts: 796

PostPosted: Wed Jan 21, 2009 12:40 pm    Post subject: Reply with quote

mack1 wrote:
Googolando ho trovato pdftoedit, anche se in portage non è presente:

http://www.cyberciti.biz/tips/open-source-linux-pdf-writer.html

La home del progetto:

http://pdfedit.petricek.net/index_e.html

Ciao


Questo sembra essere decisamente interessante, sembra che faccia un po' tutto quel che mi serve ora.
La riconversione verso .doc per ora la lascio perdere, non mi incasino oltre...
Che ci sia anche una versione per windows di questo PDFedit ? Giusto per sapere... non mi sembra di averlo visto in giro....
Back to top
View user's profile Send private message
mack1
Guru
Guru


Joined: 18 Mar 2006
Posts: 315

PostPosted: Wed Jan 21, 2009 2:54 pm    Post subject: Reply with quote

Pdfedit c'è solo per il pinguino.... lo trovi nel Sunrise Overlay:

http://overlays.gentoo.org/proj/sunrise

Prova a dare un'occhiata alla lista di programmi fatta da wikipedia:

http://en.wikipedia.org/wiki/List_of_PDF_software

Ciao
Back to top
View user's profile Send private message
lsegalla
l33t
l33t


Joined: 27 Jun 2007
Posts: 796

PostPosted: Thu Jan 22, 2009 8:17 am    Post subject: Reply with quote

Sì sì, nel pinguino l'ho già installato e funzionante.... è che sotto terminal server son vincolato e devo far lavorare l'utente di turno sotto windows senno' mi tocca ogni volta fargli tutto io :-)

Sperem che la cosa non sia molto ripetitiva che non ho proprio tutto sto tempo :evil:
Back to top
View user's profile Send private message
Ic3M4n
Advocate
Advocate


Joined: 02 Nov 2004
Posts: 3489
Location: Bergamo.

PostPosted: Thu Jan 22, 2009 8:51 am    Post subject: Reply with quote

in alternativa acroread permette di esportare in txt, il risultato è simile a pdftotext, almeno per le poche volte che mi è servito. Il problema è che entrambi non interpretano correttamente alcuni caratteri, per esempio è viene trasformato in 'e e cose del genere. Inoltre ogni tanto vengono visualizzati i caratteri unicode codificati, rettangolino con dentro i numeri etc etc.
Back to top
View user's profile Send private message
Display posts from previous:   
Reply to topic    Gentoo Forums Forum Index Forum italiano (Italian) Forum di discussione italiano All times are GMT
Page 1 of 1

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum