Πώς λειτουργεί η μετατροπή PDF σε κείμενο
Τα αρχεία PDF είναι ιδανικά για την κοινοποίηση ολοκληρωμένων εγγράφων, αλλά συχνά δυσκολεύουν την επαναχρησιμοποίηση του κειμένου που περιέχουν. Αυτό το εργαλείο διαβάζει το επιλέξιμο κείμενο από κάθε σελίδα και το μετατρέπει σε ένα απλό αρχείο .txt που μπορείτε να αντιγράψετε, να επεξεργαστείτε και να αναζητήσετε σε οποιονδήποτε editor.
Πότε να χρησιμοποιήσετε αυτό το εργαλείο
Χρησιμοποιήστε το PDF σε κείμενο όταν θέλετε να αντιγράψετε ή να επαναχρησιμοποιήσετε περιεχόμενο από ένα PDF χωρίς να το ξαναπληκτρολογήσετε. Είναι ιδιαίτερα χρήσιμο για παραθέματα, ερευνητικές σημειώσεις, συμβόλαια, αναφορές και e-books.
- Γρήγορη αντιγραφή: εξαγάγετε παραγράφους ή ενότητες χωρίς επιλογή σελίδα-σελίδα.
- Επεξεργασία: μεταφέρετε το περιεχόμενο σε οποιονδήποτε editor και επεξεργαστείτε το ελεύθερα.
- Αναζήτηση: μετατρέψτε ένα μεγάλο PDF σε αναζητήσιμο απλό κείμενο.
Θέλετε να κάνετε το αντίστροφο; Μετατρέψτε απλό κείμενο ξανά σε PDF με το Μετατροπέας Κειμένου σε PDF. Αν χρειάζεστε επεξεργάσιμο έγγραφο με περισσότερη δομή από ένα TXT, δοκιμάστε το Μετατροπέας PDF σε Word.
Βήμα προς βήμα: από PDF σε καθαρό κείμενο
Η εξαγωγή κειμένου από τα PDF σας ακολουθεί μια σύντομη, επαναλαμβανόμενη διαδικασία:
- Προσθέστε τα αρχεία PDF σας. Σύρετε και αποθέστε PDF στο πλαίσιο παραπάνω ή κάντε κλικ για να επιλέξετε αρχεία από τη συσκευή σας.
- Ελέγξτε τη λίστα. Κάθε αρχείο εμφανίζεται με το όνομά του και την κατάστασή του, ώστε να βλέπετε τι θα μετατραπεί.
- Μετατροπή σε κείμενο. Πατήστε Μετατροπή σε κείμενο. Το εργαλείο επεξεργάζεται κάθε PDF απευθείας στον browser σας.
- Αποθηκεύστε τα αρχεία TXT σας. Χρησιμοποιήστε το Αποθήκευση δίπλα σε κάθε αρχείο ή το Αποθήκευση όλων των αρχείων όταν όλα είναι έτοιμα.
Απόρρητο, όρια και πώς αυτό το εργαλείο χειρίζεται τα αρχεία σας
Το FileYoga έχει σχεδιαστεί γύρω από έναν απλό κανόνα: τα αρχεία σας παραμένουν σε εσάς. Αυτός ο μετατροπέας PDF σε κείμενο ακολουθεί πιστά αυτόν τον κανόνα.
Μόνο τοπική μετατροπή
Η μετατροπή εκτελείται στον browser σας. Τα αρχεία PDF σας δεν μεταφορτώνονται.
Χωρίς τεχνητούς περιορισμούς
Χωρίς ποσοστώσεις. Τα μόνα όρια προέρχονται από τη μνήμη της συσκευής σας και τον browser σας.
Δεν απαιτείται λογαριασμός
Ανοίγετε τη σελίδα, μετατρέπετε, κατεβάζετε και τελειώσατε.
Χωρίς κρυφά αντίγραφα
Όταν καθαρίσετε τη λίστα ή κλείσετε την καρτέλα, το εργαλείο σταματά να χρησιμοποιεί τα αρχεία σας.
Συμβουλές για καλύτερα αποτελέσματα
- Τα καλύτερα αποτελέσματα προέρχονται από PDF που έχουν εξαχθεί από Word/Google Docs (συνήθως βασίζονται σε κείμενο).
- Τα σαρωμένα PDF και οι φωτογραφίες μπορεί να έχουν λίγο ή καθόλου εξαγώγιμο κείμενο, επειδή δεν περιλαμβάνεται OCR.
- Οι διατάξεις πολλών στηλών μπορεί να εξαχθούν με λάθος σειρά (δεν είναι εγγυημένο ότι θα διαβαστούν αριστερή στήλη και μετά δεξιά).
- Αν το PDF σας είναι πολύ μεγάλο, μετατρέψτε το μόνο του και κλείστε βαριές καρτέλες για να μειώσετε την πίεση στη μνήμη.
- Μετά τη μετατροπή, τακτοποιήστε τίτλους και αποστάσεις στον editor σας (το TXT είναι σκόπιμα απλό).
Αντιμετώπιση προβλημάτων
- Το αρχείο TXT είναι κενό ή πολύ μικρό: Το PDF μπορεί να είναι σάρωση (μόνο εικόνα) ή το κείμενο να είναι ενσωματωμένο με τρόπο που δεν είναι επιλέξιμος. Αυτό το εργαλείο δεν εκτελεί OCR, οπότε τα σαρωμένα PDF συνήθως επιστρέφουν λίγο ή καθόλου κείμενο.
- Το κείμενο είναι εκτός σειράς (στήλες/πλευρικές ενότητες): Ορισμένα PDF αποθηκεύουν το κείμενο με βάση τη θέση του. Σε σελίδες με πολλές στήλες, sidebars ή σύνθετη διάταξη, το κείμενο μπορεί να εξαχθεί με απρόσμενη σειρά ανάγνωσης. Το αποτέλεσμα παραμένει χρήσιμο, αλλά ίσως χρειαστεί να το αναδιατάξετε στον editor σας.
- Παράξενα σύμβολα ή λείπουν χαρακτήρες: Μερικά PDF χρησιμοποιούν προσαρμοσμένες κωδικοποιήσεις γραμματοσειρών. Αν οι χαρακτήρες δεν αντιστοιχίζονται σωστά, δοκιμάστε να εξαγάγετε νέο PDF από το αρχικό έγγραφο ή να χρησιμοποιήσετε άλλη έκδοση του εγγράφου.
- Πολλές επιπλέον αλλαγές γραμμής: Τα PDF συχνά αποθηκεύουν το κείμενο σε μικρά τμήματα. Ίσως χρειαστεί να αφαιρέσετε επιπλέον αλλαγές γραμμής στον editor σας μετά την εξαγωγή.
- Η εξαγωγή αποτυγχάνει σε συγκεκριμένο αρχείο: Το PDF μπορεί να είναι κατεστραμμένο ή περιορισμένο. Δοκιμάστε πρώτα το Επιδιόρθωση PDF και μετά εξαγάγετε ξανά.
- Ο browser γίνεται αργός ή κρασάρει: Τα μεγάλα PDF μπορεί να φτάσουν τα όρια μνήμης του browser. Μετατρέψτε ένα αρχείο κάθε φορά, μειώστε το μέγεθος του PDF ή χωρίστε το έγγραφο πριν από την εξαγωγή.
Συχνές ερωτήσεις
Όχι. Όλη η μετατροπή γίνεται απευθείας στον browser σας με JavaScript. Τα αρχεία PDF και το εξαγόμενο κείμενο δεν φεύγουν ποτέ από τη συσκευή σας, και τα αρχεία TXT που κατεβάζετε δημιουργούνται τοπικά.
Όχι. Αυτό το εργαλείο εστιάζει στο να επαναφέρει επεξεργάσιμο κείμενο, όχι στην τέλεια οπτική αναπαραγωγή. Τίτλοι, παράγραφοι και βασική δομή συχνά εξάγονται σωστά, αλλά στήλες, ακριβείς αποστάσεις, γραμματοσειρές και η ακριβής διάταξη δεν αναπαράγονται σε ένα απλό αρχείο TXT.
Αυτός ο μετατροπέας που λειτουργεί μόνο στον browser δεν εκτελεί OCR (οπτική αναγνώριση χαρακτήρων). Αν το PDF σας είναι απλώς εικόνα κειμένου, μπορεί να υπάρχει λίγο ή καθόλου κείμενο για εξαγωγή και το αρχείο TXT που θα προκύψει μπορεί να είναι σχεδόν άδειο.
Ορισμένα PDF αποθηκεύουν το κείμενο ως αποσπάσματα με συγκεκριμένες θέσεις αντί για πραγματική σειρά ανάγνωσης. Σε διατάξεις πολλών στηλών, sidebars ή σύνθετες σελίδες, το εξαγόμενο κείμενο μπορεί να εμφανιστεί με απρόσμενη σειρά. Το αποτέλεσμα παραμένει χρήσιμο, αλλά ίσως χρειαστεί να το αναδιατάξετε στον editor σας.
Οι εικόνες και τα γραφικά δεν διατηρούνται ως οπτικά στοιχεία στην έξοδο TXT. Οι απλοί πίνακες μπορεί να εμφανιστούν ως γραμμές κειμένου, αλλά οι σύνθετοι πίνακες θα χάσουν τη δομή τους. Κρατήστε το αρχικό PDF ως σημείο αναφοράς όταν η διάταξη έχει σημασία.
Ορισμένα κρυπτογραφημένα ή περιορισμένα PDF μπορεί να μπλοκάρουν την εξαγωγή κειμένου στον browser. Αν έχετε πρόσβαση, ανοίξτε το PDF στην αρχική εφαρμογή και εξαγάγετε ένα ξεκλείδωτο αντίγραφο και μετά δοκιμάστε ξανά.
Δεν υπάρχει τεχνητό όριο ενσωματωμένο σε αυτό το εργαλείο. Μπορείτε να προσθέσετε πολλά PDF ταυτόχρονα. Πολύ μεγάλα αρχεία ή μεγάλες παρτίδες μπορεί να επιβραδύνουν τον browser σας, οπότε αν συμβεί αυτό, μετατρέψτε τα έγγραφα σε μικρότερες ομάδες.
Μερικά PDF χρησιμοποιούν προσαρμοσμένες κωδικοποιήσεις γραμματοσειρών όπου οι χαρακτήρες δεν αντιστοιχίζονται σωστά σε Unicode κείμενο. Αν οι χαρακτήρες φαίνονται λανθασμένοι, δοκιμάστε να εξαγάγετε νέο PDF από το αρχικό έγγραφο και επαναλάβετε την εξαγωγή.
Χρησιμοποιήστε το Μετατροπέας Κειμένου σε PDF για να μετατρέψετε απλό κείμενο σε ένα απλό PDF έτοιμο για εκτύπωση. Αν χρειάζεστε επεξεργάσιμη μορφή εγγράφου με πιο πλούσια δομή, χρησιμοποιήστε αντί γι’ αυτό το Μετατροπέας PDF σε Word.