Πώς να συλλάβετε κείμενο από εικόνες με λογισμικό ocr

Ένα από τα πράγματα που με απογοήτευσε συχνά είναι η αδυναμία εύκολης αντιγραφής κειμένου από εικόνες και συγκεκριμένα αρχεία PDF (π.χ. εκείνα που μπορεί να έχουν δημιουργηθεί από σαρωμένα έγγραφα). Ευτυχώς, με την πάροδο του χρόνου αναπτύχθηκαν λύσεις λογισμικού για την αντιμετώπιση αυτού του ζητήματος, επιτρέποντας σημαντική εξοικονόμηση χρόνου που διαφορετικά θα έπρεπε να ξοδέψατε χειροκίνητα για την αντιγραφή και την επανεγγραφή του κειμένου. Στη σημερινή άκρη, θα μιλήσω για ένα εργαλείο ελεύθερου λογισμικού που ονομάζεται Capture2Text που χρησιμοποιεί έναν αλγόριθμο οπτικής αναγνώρισης χαρακτήρων (OCR) που θα σας επιτρέψει να καταγράψετε κείμενο από αρχεία εικόνας και PDF.

Εγκατάσταση και ρύθμιση

Για να ξεκινήσετε, κατευθυνθείτε στη σελίδα SourceForge του έργου και κάντε λήψη της τελευταίας έκδοσης του Capture2Text. Το λογισμικό έρχεται ως αρχειοφυλάκιο zip και εκείνη τη στιγμή δεν περιλαμβάνει ειδικό πρόγραμμα εγκατάστασης. Μετά τη λήψη, αποσυνδέστε το αρχείο και ξεκινήστε το αρχείο Capture2Text.exe. Αυτό θα ξεκινήσει το λογισμικό και θα θέσει ένα εικονίδιο κάτω στη συρταρωτή συστοιχία:

Κατ 'αρχάς, αυτό που θα θελήσετε να κάνετε είναι να ρυθμίσετε τις προτιμήσεις του λογισμικού, συγκεκριμένα τα οποία πλήκτρα (ή συντομεύσεις) για να ξεκινήσετε και να σταματήσετε τη λήψη:

Στην περίπτωσή μου, επέλεξα να χρησιμοποιήσω τα πλήκτρα "Windows + q" για να ξεκινήσω τη λήψη και το "Enter" για να το σταματήσω. Μπορείτε να προσαρμόσετε αυτές τις επιλογές σε αυτό που σας ταιριάζει καλύτερα. Λάβετε υπόψη ότι το κλειδί "Windows + s" χρησιμοποιείται συχνά ήδη για την καταγραφή οθόνης (π.χ. από προγράμματα όπως το Microsoft One Note).

Στην επόμενη καρτέλα, οι επιλογές OCR μπορούν να ρυθμιστούν συμπεριλαμβανομένης της γλώσσας εισαγωγής (προς το παρόν υποστηρίζονται επτά γλώσσες) και αν θα χρησιμοποιηθεί η προεπεξεργασία OCR για τη βελτίωση της ακρίβειας (συνιστάται ιδιαίτερα). Τέλος, στην καρτέλα "Έξοδος", μεταξύ άλλων επιλογών, μπορείτε να επιλέξετε αν θα αποθηκεύσετε ακριβώς το κείμενο που έχει ληφθεί στο πρόχειρο ή αν θα ξεκινήσει ένα ξεχωριστό αναδυόμενο παράθυρο.

Χρησιμοποιώντας το Λογισμικό

Μόλις εγκατασταθεί και ρυθμιστεί το λογισμικό, μπορείτε να το χρησιμοποιήσετε μέσω του συνδυασμού πλήκτρων εκκίνησης λήψης. Χρησιμοποιώντας το ποντίκι σας, επιλέξτε την περιοχή στην εικόνα που περιλαμβάνει το κείμενο που θέλετε να συλλάβετε. Για να σταματήσετε τη λήψη, απλώς πατήστε το πλήκτρο πρόσβασης που έχετε επιλέξει για να σταματήσετε τη λήψη. Στη συνέχεια, το κείμενο θα αντιγραφεί είτε στο πρόχειρο, είτε στο αναδυόμενο παράθυρο εξόδου ή και στα δύο. Ένα παράδειγμα μπορεί να δει παρακάτω.

Από τη γρήγορη δοκιμή του εργαλείου με τις εικόνες, βρήκα την ακρίβειά του να είναι αξιοπρεπής. Προφανώς, υπάρχουν περιορισμοί σε εργαλεία όπως αυτό και το OCR γενικά. Για παράδειγμα, πολύ τροποποιημένο κείμενο (πολύ διαβατικό, πλάγια ή μοντέρνο) μπορεί να μην λειτουργεί τόσο καλά, και μερικές φορές καθόλου. Επίσης, σε ορισμένες περιπτώσεις θα βοηθήσει να ρυθμίσετε ελαφρώς τις διαστάσεις του κουτιού λήψης ή να παίξετε με το ζουμ στην ίδια την εικόνα για να έχετε πιο ακριβές αποτέλεσμα.

Κατά την αποτύπωση κειμένου από σαρωμένα έγγραφα PDF η ακρίβεια είναι εντάξει, ενώ κάποιες τελικές τροποποιήσεις είναι ακόμα απαραίτητες για την καταγεγραμμένη έξοδο (ανάλογα με την ποιότητα της αρχικής σάρωσης). Επίσης, έχω παρατηρήσει ότι το λογισμικό μπορεί να διαρκέσει μερικά δευτερόλεπτα για να επεξεργαστεί, ειδικά όταν ζητείται να μετατρέψετε μεγάλες ποσότητες κειμένου.

Ότι όλοι λέγονται, γενικά πιστεύω ότι το εργαλείο κάνει καλή δουλειά, ειδικά αφού είναι ελεύθερα διαθέσιμο - σας ενθαρρύνω να το δοκιμάσετε.

Προσθήκη 11/16/2015:

Ως άλλη επιλογή, για όσους διαθέτουν Λογαριασμούς Google, είναι επίσης δυνατή η χρήση των δυνατοτήτων OCR της Google φορτώνοντας ένα αρχείο στο Google Drive (περισσότερες πληροφορίες μπορείτε να βρείτε εδώ). Επιπλέον, υπάρχει επίσης ένα plugin OCR διαθέσιμο για χρήστες του Google Chrome που ονομάζεται Copyfish που ίσως θελήσετε να ελέγξετε επίσης.