OCR PDF

Αναγνωρίστε κείμενο σε σαρωμένα PDF ή PDF που βασίζονται σε εικόνες απευθείας στο πρόγραμμα περιήγησής σας. Μετατρέψτε μη αναζητήσιμες σελίδες σε PDF με δυνατότητα αναζήτησης, εξαγάγετε το αναγνωρισμένο κείμενο ως αρχείο .txt όταν χρειάζεται και, προαιρετικά, ελέγξτε το αποτέλεσμα OCR πριν το αποθηκεύσετε. Το εργαλείο λειτουργεί καλύτερα για σαρώσεις, PDF από φωτογραφίες και έγγραφα όπου το κείμενο φαίνεται αλλά δεν μπορεί να επιλεγεί. Όλη η διαδικασία εκτελείται στη συσκευή σας, με καμία μεταφόρτωση, χωρίς λογαριασμό και χωρίς αποθήκευση σε διακομιστή.

Είσοδος: PDF (.pdf)
OCR: Αναγνώριση σαρωμένου κειμένου
Όλη η επεξεργασία γίνεται απευθείας στη συσκευή σας

Χρήσιμες πληροφορίες

Αυτό το εργαλείο έχει σχεδιαστεί για σαρωμένα PDF και σελίδες που είναι μόνο εικόνες. Αναγνωρίζει ορατό κείμενο, διατηρεί την αρχική εμφάνιση της σελίδας και μπορεί να προσθέσει ένα κρυφό επίπεδο αναζητήσιμου κειμένου πίσω από τη σελίδα. Η ακρίβεια του OCR εξαρτάται από την ποιότητα της σάρωσης, την επιλογή γλώσσας, την καθαρότητα της σελίδας και την αρχική διάταξη.

  • Είσοδος: αρχεία PDF (.pdf).
  • Έξοδος: αναζητήσιμο .pdf από προεπιλογή, με προαιρετική εξαγωγή αναγνωρισμένου κειμένου σε .txt.
  • Ιδανικό για: σαρώσεις, PDF από φωτογραφίες, έγγραφα τύπου φαξ και PDF χωρίς επιλέξιμο κείμενο.
  • Η επιλογή γλώσσας έχει σημασία: η χειροκίνητη επιλογή γλώσσας είναι συνήθως πιο ακριβής από την αυτόματη ανίχνευση όταν γνωρίζετε ήδη τη γλώσσα του εγγράφου.
  • Απόρρητο: το PDF σας δεν φεύγει ποτέ από τη συσκευή σας, τίποτα δεν μεταφορτώνεται στους διακομιστές του FileYoga.

Εκτέλεση OCR σε σαρωμένο PDF

Προσθέστε ένα PDF, επιλέξτε ρυθμίσεις OCR, αναγνωρίστε το κείμενο και αποθηκεύστε το αναζητήσιμο αποτέλεσμα.
Σύρετε ένα αρχείο PDF εδώ
ή κάντε κλικ για επιλογή αρχείου
Υποστηρίζει αρχεία .pdf. Τα αρχεία υποβάλλονται σε επεξεργασία στο πρόγραμμα περιήγησής σας και δεν μεταφορτώνονται ποτέ σε διακομιστή.

Πώς λειτουργεί το OCR

Το OCR PDF χρησιμοποιεί οπτική αναγνώριση χαρακτήρων για να εντοπίσει κείμενο μέσα σε σαρωμένες σελίδες PDF ή σελίδες που βασίζονται σε εικόνες. Μπορεί να δημιουργήσει ένα PDF με δυνατότητα αναζήτησης, τοποθετώντας ένα κρυφό επίπεδο κειμένου πάνω από τις αρχικές σελίδες, και μπορεί επίσης να εξαγάγει το αναγνωρισμένο περιεχόμενο ως απλό κείμενο για αντιγραφή ή επεξεργασία.

Με απλά λόγια, το OCR διαβάζει κείμενο μέσα από μια εικόνα. Αν το PDF σας έχει δημιουργηθεί από σαρώσεις ή εικόνες, το κείμενο φαίνεται αναγνώσιμο αλλά δεν μπορεί πραγματικά να επιλεγεί ή να αναζητηθεί. Το OCR αναλύει κάθε σελίδα, αναγνωρίζει οπτικά γράμματα και λέξεις και τα μετατρέπει σε πραγματικό κείμενο που μπορεί να κατανοήσει η συσκευή σας.

Αυτό διαφέρει από ένα συνηθισμένο εργαλείο PDF σε κείμενο. Αν ένα PDF περιέχει ήδη επιλέξιμο κείμενο, εκείνο το εργαλείο απλώς το εξάγει αμέσως. Το OCR χρειάζεται μόνο όταν το PDF δεν έχει πραγματικό επίπεδο κειμένου και όλα είναι απλώς εικόνα — για παράδειγμα σαρώσεις, φωτογραφίες ή έντυπα έγγραφα αποθηκευμένα ως PDF.


Πότε να χρησιμοποιήσετε αυτό το εργαλείο

Το OCR είναι χρήσιμο όταν το κείμενο φαίνεται στη σελίδα, αλλά δεν μπορείτε να το αναζητήσετε, να το επισημάνετε ή να το αντιγράψετε από το PDF.

  • Μετατρέψτε ένα σαρωμένο έντυπο έγγραφο σε PDF με δυνατότητα αναζήτησης.
  • Αναγνωρίστε κείμενο από σαρώσεις κινητού που έχουν αποθηκευτεί ως PDF.
  • Ανακτήστε κείμενο από PDF που είναι μόνο εικόνες και δεν αντιγράφονται κανονικά.
  • Εξαγάγετε αναγνώσιμο κείμενο από παλιές αναφορές, επιστολές, τιμολόγια ή αρχειοθετημένα έγγραφα.

Θέλετε να εξαγάγετε κείμενο από PDF που έχει ήδη επιλέξιμο κείμενο; Χρησιμοποιήστε το PDF σε απλό κείμενο. Χρειάζεστε εικόνες σελίδων αντί για κείμενο OCR; Δοκιμάστε το PDF σε εικόνα. Θέλετε πρώτα να επεξεργαστείτε μόνο συγκεκριμένες σελίδες; Χρησιμοποιήστε την εξαγωγή επιλεγμένων σελίδων PDF σε νέο PDF.

Βήμα προς βήμα: εκτέλεση OCR σε PDF

Για να κάνετε το PDF σας αναζητήσιμο, χρειάζονται μόνο λίγα βήματα:

  • Προσθέστε το PDF σας. Σύρετε και αφήστε το αρχείο στο πλαίσιο παραπάνω ή κάντε κλικ για να το επιλέξετε από τη συσκευή σας.
  • Επιλέξτε γλώσσα OCR. Χρησιμοποιήστε την αυτόματη ανίχνευση ή επιλέξτε χειροκίνητα την κύρια γλώσσα του εγγράφου.
  • Επιλέξτε εύρος σελίδων. Εκτελέστε OCR σε όλες τις σελίδες ή πατήστε μεμονωμένες σελίδες χειροκίνητα.
  • Επιλέξτε έξοδο. Το PDF με δυνατότητα αναζήτησης είναι προεπιλεγμένο, ενώ μπορείτε επίσης να εξαγάγετε αρχείο κειμένου αν χρειάζεται.
  • Επιλέξτε αν θα εμφανίζεται προεπισκόπηση κειμένου. Ενεργοποιήστε την μόνο αν θέλετε να δείτε το αναγνωρισμένο κείμενο κάτω από τις σελίδες.
  • Εκτελέστε OCR. Το εργαλείο επεξεργάζεται τις σελίδες στο πρόγραμμα περιήγησής σας και δημιουργεί το αποτέλεσμα τοπικά.

Τι περιλαμβάνει η έξοδος

  • PDF με δυνατότητα αναζήτησης: η εμφάνιση της σελίδας παραμένει ίδια, ενώ προστίθεται ένα κρυφό επίπεδο αναγνωρισμένου κειμένου για αναζήτηση, επισήμανση και αντιγραφή σε συμβατά προγράμματα προβολής PDF.
  • Αρχείο κειμένου: απλή εξαγωγή .txt του αναγνωρισμένου περιεχομένου για επαναχρησιμοποίηση, καθαρισμό ή επικόλληση αλλού.
  • Προαιρετική προεπισκόπηση: μπορείτε να εμφανίσετε την προεπισκόπηση του αναγνωρισμένου κειμένου πριν την αποθήκευση, όταν θέλετε να ελέγξετε την ποιότητα του OCR.

Το OCR συνήθως δεν αναδημιουργεί τέλεια την αρχική διάταξη του εγγράφου ως επεξεργάσιμο κείμενο. Είναι καλύτερο για αναγνώριση, αναζήτηση, αντιγραφή και βασική ανάκτηση κειμένου.

Απόρρητο, όρια και πώς χειρίζεται αυτό το εργαλείο τα αρχεία σας

Το FileYoga βασίζεται σε έναν απλό κανόνα: τα αρχεία σας μένουν μαζί σας. Το OCR εκτελείται τοπικά στο πρόγραμμα περιήγησής σας, επομένως τα PDF σας δεν μεταφορτώνονται ποτέ στους διακομιστές του FileYoga.

Επεξεργασία μόνο τοπικά

Το OCR γίνεται στο πρόγραμμα περιήγησής σας, στη συσκευή σας. Το PDF σας δεν μεταφορτώνεται και τα αρχεία εξόδου δημιουργούνται στη δική σας πλευρά.

Καμία κρυφή αντιγραφή

Όταν καθαρίζετε το αρχείο ή κλείνετε την καρτέλα, το εργαλείο σταματά να χρησιμοποιεί το PDF σας και δεν αποθηκεύει αντίγραφα σε διακομιστή.

Χωρίς τεχνητά όρια

Χωρίς paywall ή ποσοστώσεις. Τα πραγματικά όρια προκύπτουν από την ταχύτητα της συσκευής σας, τη μνήμη του προγράμματος περιήγησης, τον αριθμό σελίδων και την ποιότητα της σάρωσης.

Δεν απαιτείται λογαριασμός

Χρησιμοποιήστε το εργαλείο χωρίς εγγραφή. Ανοίξτε τη σελίδα, εκτελέστε OCR, αποθηκεύστε το αποτέλεσμα και φύγετε όταν τελειώσετε.

Συμβουλές για καλύτερα αποτελέσματα

  • Επιλέξτε τη γλώσσα OCR χειροκίνητα όταν γνωρίζετε ήδη την κύρια γλώσσα του εγγράφου.
  • Οι καθαρές, ίσιες σαρώσεις με υψηλή αντίθεση συνήθως δίνουν καλύτερο OCR από θολές, στραβές ή σκιερές σελίδες.
  • Εκτελέστε OCR μόνο στις σελίδες που χρειάζεστε όταν το PDF είναι μεγάλο ή η συσκευή σας είναι πιο αργή.
  • Χρησιμοποιήστε την προεπισκόπηση αναγνωρισμένου κειμένου όταν η ακρίβεια έχει σημασία πριν αποθηκεύσετε το τελικό αποτέλεσμα.
  • Αν το αναζητήσιμο PDF γίνει μεγαλύτερο μετά το OCR, συμπιέστε το στη συνέχεια.
  • Τα έγγραφα με πολλές γλώσσες μπορεί να χρειάζονται ξεχωριστές εκτελέσεις OCR, αν διαφορετικές ομάδες σελίδων έχουν διαφορετική κύρια γλώσσα.

Αντιμετώπιση προβλημάτων

  • Το OCR είναι αργό: μεγάλα PDF, σελίδες υψηλής ανάλυσης και πολλές σαρωμένες σελίδες χρειάζονται περισσότερο χρόνο, επειδή κάθε σελίδα αναλύεται στο πρόγραμμα περιήγησής σας.
  • Η ποιότητα αναγνώρισης είναι χαμηλή: η σάρωση μπορεί να είναι θολή, χαμηλής ανάλυσης, στραβή, με θόρυβο ή τραβηγμένη με κακό φωτισμό.
  • Η αυτόματη ανίχνευση επέλεξε λάθος γλώσσα: εκτελέστε ξανά το OCR και επιλέξτε χειροκίνητα την κύρια γλώσσα για καλύτερη ακρίβεια.
  • Το αναζητήσιμο PDF φαίνεται ίδιο: αυτό είναι αναμενόμενο — η ορατή σελίδα συνήθως παραμένει ίδια, ενώ προστίθεται κρυφό αναζητήσιμο κείμενο πίσω της.
  • Μερικές λέξεις είναι λάθος ή λείπουν: διακοσμητικές γραμματοσειρές, χειρόγραφα, πίνακες, σφραγίδες, χαμηλή αντίθεση και μεικτές γλώσσες μπορούν να μειώσουν την ακρίβεια του OCR.
  • Σφάλμα στο PDF: το αρχείο μπορεί να είναι κατεστραμμένο, κρυπτογραφημένο, υπερβολικά σύνθετο ή πολύ βαρύ για το πρόγραμμα περιήγησης — αποθηκεύστε το ξανά σε εφαρμογή PDF στον υπολογιστή και δοκιμάστε ξανά.

Συχνές ερωτήσεις