Eξαγωγή κειμένου από PDF αρχείο

Welcome!

By registering with us, you'll be able to discuss, share and private message with other members of our community.

SignUp Now!

manos426f

Lich
Staff member
Joined
Nov 27, 2012
Messages
6,191
Γνωρίζει κανείς σας κάποιο freeware utility με το οποίο να μπορώ από ένα pdf να κάνω αντιγραφή κειμένου και αποθήκευση σε .doc μορφή;
Προσοχή, θέλω να μου συστήσετε software που να έχετε <u>δοκιμάσει </u>και να γνωρίζετε ότι <u>υποστηρίζει και την ελληνική γλώσσα</u> επί του κειμένου που επιθυμούμε να εξάγουμε. <img src="/wink.gif" width="" height="" alt=";)" title=";)" class="bbcode_smiley" />
 
Google Docs ;
 
Μολις γυρισω σπιτι θα σου στειλω ενα σελιδοδεικτη με online εφαρμογη που εχει κανει πολλακις τη δουλεια παλιοτερα σε μενα.
 
Το αντίστοιχο Word του Open/Libre Office το υποστηρίζει - δοκιμασμένο και ταχύτατο.
Τα online εργαλεία δεν τα έχω δοκιμάσει αλλά αν το έγγραφο είναι κάπως "ευαίσθητο" δεν θα τα εμπιστευόμουν.
 


elessar wrote:
Το αντίστοιχο Word του Open/Libre Office το υποστηρίζει - δοκιμασμένο και ταχύτατο.</blockquote>
Για την ακρίβεια το Draw κάνει τη δουλειά π.χ στο Libre.
Όμως, απ' όσο γνωρίζω, μπορείς να κάνεις μόνο edit το pdf και έπειτα να εξάγεις το αποτέλεσμα πάλι σε pdf format. Απ' ό,τι κατάλαβα (μπορεί να κάνω και λάθος) ο Μάνος θέλει να εξάγει το κείμενο από το pdf ώστε να το βάλει σε κάποιο text editor.

 


jimmy213 wrote:


elessar wrote:
Το αντίστοιχο Word του Open/Libre Office το υποστηρίζει - δοκιμασμένο και ταχύτατο.</blockquote>
Για την ακρίβεια το Draw κάνει τη δουλειά π.χ στο Libre.
Όμως, απ' όσο γνωρίζω, μπορείς να κάνεις μόνο edit το pdf και έπειτα να εξάγεις το αποτέλεσμα πάλι σε pdf format. Απ' ό,τι κατάλαβα (μπορεί να κάνω και λάθος) ο Μάνος θέλει να εξάγει το κείμενο από το pdf ώστε να το βάλει σε κάποιο text editor.</blockquote>

Φίλε έχεις δίκιο, τεράστιο λάθος.
Μάνο νόμιζα ότι θέλεις να κάνεις το ακριβώς αντιθετο, δλδ World2PDF και όχι PDF2World.
My bad.



 


jimmy213 wrote:
Απ' ό,τι κατάλαβα (μπορεί να κάνω και λάθος) ο Μάνος θέλει να εξάγει το κείμενο από το pdf ώστε να το βάλει σε κάποιο text editor.</blockquote>

Αυτό ακριβώς θέλω να κάνω, πολύ σωστά κατάλαβες!

 
Λοιπόν πριν λίγο δοκίμασα να ανοίξω δύο pdf στο Microsoft Word 2013 (δεν ξέρω αν γίνεται σε παλιότερες εκδόσεις).
Το πρώτο προερχόταν (πριν τη μετατροπή του σε pdf) από κάποιον text editor. Μέσω του Word έγινε η επιτυχής εξαγωγή του κειμένου και των εικόνων που είχε το pdf. Στη συνέχεια κάνεις ό,τι θέλεις (editing, αποθήκευση σε .doc κτλ).
Το δεύτερο είχε σκαναρισμένο έγγραφο (στην ουσία πολλές εικόνες μαζί), οπότε όπως είναι λογικό έγινε εξαγωγή των δεδομένων ως εικόνες.
Επίσης, αν υπάρχει κάτι χειρόγραφο στο pdf το βγάζει σαν εικόνα.

Δεν θα σου πρότεινα online λύσεις, καθώς στο παρελθόν που είχα δοκιμάσει κάποια site, δεν ήταν καλή η μετατροπή και σε πολλές περιπτώσεις δεν μπορούσα να επεξεργαστώ το τελικό αποτέλεσμα.

Για free δεν βρήκα κάτι. Κάπως γίνεται στο Libre Office Writer νομίζω χρησιμοποιώντας κάποιες εντολές, αλλά δεν γνωρίζω να σου πω περισσότερα.
 
καποια στιγμη που ηθελα να κανω το ιδιο, ειχα φαει μεγαλο σχοινι. οντως οι online λυσεις, μονο λυσεις δεν ειναι.
 
http://www.online-convert.com/

did the job
φυσικα ηθελε μορφοποιηση μετα το κειμενο να ερθει εκει που το ηθελα

edit: αν τα pdf εχουν εικονες με κειμενο, θα χρειαστεις και ocr προγραμμα
ps: μην γελιεσαι, περα απο το αυτοματο του πραματος, θα ριξεις και λιγο ιδρωτα.
there's no easy way out. Στο λεω μετα απο ΠΟΛΛΑ κεμενα σε pdf....
και καθε φορα που θα λιγοψυχας για λιγο, ακου αυτο να επανερχεσαι στο θεμα σου πιο γρηγορα
http://www.youtube.com/watch?v=MwPb7g_BlXQ
 
Back
Top