5 Servizi OCR online gratuiti testati e recensiti

Hai un documento PDF(PDF document) o un'immagine che vorresti convertire in testo? Di recente, qualcuno mi ha inviato un documento nella posta che dovevo modificare e rispedire con le correzioni. La persona non riusciva a trovare una copia digitale, quindi mi è stato assegnato il compito di trasferire tutto quel testo in formato digitale.

Non avrei passato ore a digitare di nuovo tutto, quindi ho finito per scattare una bella foto di alta qualità del documento e poi mi sono fatto strada attraverso una serie di servizi OCR online per vedere quale mi avrebbe dato il meglio risultati.

In questo articolo, esaminerò un paio dei miei siti preferiti per l' OCR che sono gratuiti. Vale la pena notare che la maggior parte di questi siti fornisce un servizio gratuito di base e quindi ha opzioni a pagamento se desideri funzionalità extra come immagini più grandi, documenti PDF(PDF) multipagina , diverse lingue di input, ecc.

È anche bene sapere in anticipo che la maggior parte di questi servizi non sarà in grado di corrispondere alla formattazione del documento originale. Questi sono principalmente per estrarre il testo e il gioco è fatto. Se hai bisogno che tutto sia in un layout o formato(layout or format) specifico , dovrai farlo manualmente una volta ottenuto tutto il testo dall'OCR(OCR) .

Inoltre, i migliori risultati per ottenere il testo proverranno da documenti con una risoluzione da 200 a 400 DPI(DPI resolution) . Se hai un'immagine DPI(DPI image) bassa , i risultati non saranno altrettanto buoni.

Infine, c'erano molti siti che ho testato che semplicemente non funzionavano(t work) . Se esegui l' OCR online gratuito su Google , vedrai un sacco di siti ma molti dei siti tra i primi 10 risultati non hanno nemmeno completato la conversione. Alcuni sarebbero scaduti, altri avrebbero dato errori e alcuni sarebbero rimasti bloccati nella pagina di "conversione", quindi non mi sono nemmeno preoccupato di menzionare quei siti.

Per ogni sito, ho testato due documenti per vedere come sarebbe stato l'output. Per i miei test, ho semplicemente usato il mio iPhone 5S per scattare una foto di entrambi i documenti e poi li ho caricati direttamente sui siti Web per la conversione.

Nel caso volessi vedere che aspetto avevano le immagini che ho usato per il mio test, le ho allegate qui: Test1 e Test2 . Si noti che queste non sono le versioni a piena risoluzione delle immagini riprese dal telefono. Ho usato l'immagine a piena risoluzione(resolution image) durante il caricamento sui siti.

OnlineOCR

OnlineOCR.net è un sito semplice e pulito che ha fornito ottimi risultati nel mio test. La cosa principale che mi piace è che non ha tonnellate di annunci ovunque, come di solito accade con questi tipi di siti di servizi di nicchia .(niche service)

gratis online ocr

Per iniziare, seleziona il tuo file e attendi fino(file and wait till) al termine del caricamento. La dimensione massima di caricamento per questo sito è 100 MB. Se ti registri per un account gratuito, ottieni alcune funzionalità extra come le dimensioni di caricamento maggiori, PDF(PDFs) multipagina , diverse lingue di input, più conversioni all'ora, ecc.

Quindi, scegli la lingua di input(input language) e quindi scegli il formato di output(output format) . È possibile scegliere tra Word , Excel o Testo normale(Plain Text) . Fai clic(Click) sul pulsante Converti(Convert) e vedrai il testo visualizzato in basso in una casella insieme a un link per il download(download link) .

uscita ocr

Se tutto ciò che desideri è il testo, copialo e incollalo(copy and paste) dalla casella. Tuttavia, ti suggerisco di scaricare il documento di Word(Word document) perché fa un lavoro sorprendentemente ottimo nel mantenere il layout del documento originale.

Ad esempio, quando ho aperto il documento di Word(Word document) per il mio secondo test, sono rimasto sorpreso di scoprire che il documento includeva una tabella con tre colonne, proprio come nell'immagine.

uscita ocr online

Tra tutti i siti, questo era di gran lunga il migliore. Vale assolutamente la pena registrarsi se devi eseguire molte conversioni.

Per completezza, collegherò anche i file di output creati da ciascun servizio in modo che tu possa vedere i risultati di persona. Ecco i risultati di OnlineOCR : Test1 Doc e Test2 Doc(Test1 Doc and Test2 Doc) .

Tieni presente che quando apri questi documenti di Word sul tuo computer, riceverai un messaggio in Word che afferma che proviene da Internet e la modifica(Internet and editing) è stata disabilitata. Questo è perfettamente OK perché Word non(Word doesn) considera attendibili i documenti da Internet e non è necessario abilitare la modifica se si desidera solo visualizzare il documento.

i2OCR

Un altro sito che ha dato buoni risultati è stato i2OCR . Il processo è molto simile: scegli la lingua, il file, quindi premi Estrai testo(Extract Text) .

i2ocr

Dovrai aspettare un minuto o due qui perché questo sito richiede un po' più di tempo. Inoltre, nel passaggio 2(Step 2) , assicurati che l'immagine venga visualizzata con il lato destro rivolto verso l'alto nell'anteprima, altrimenti otterrai un sacco di incomprensioni come output. Per qualche motivo, le immagini dal mio iPhone venivano visualizzate in modalità verticale(portrait mode) sul mio computer, ma in orizzontale quando le ho caricate su questo sito.

uscita i2ocr

Ho dovuto aprire manualmente l'immagine in un'app di fotoritocco, ruotarla di 90 gradi, quindi ruotarla di nuovo in verticale e quindi salvarla di nuovo. Una volta(Once) completato, scorri verso il basso e ti mostrerà un'anteprima del testo insieme a un pulsante di download(download button) .

Questo sito è andato abbastanza bene con l'output per il primo test, ma non ha funzionato così bene con il secondo test che aveva il layout delle colonne(column layout) . Ecco i risultati di i2OCR: Test1 Doc e Test2 Doc(Test1 Doc and Test2 Doc) .

FreeOCR

Free-OCR.com prenderà le tue immagini e le convertirà in testo normale(plain text) . Non ha un'opzione per esportare in formato Word(Word format) . Scegli il tuo file, seleziona una lingua e quindi fai clic su Start .

Il sito è veloce e otterrai l'output abbastanza rapidamente. Basta cliccare(Just click) sul link per scaricare il file di testo(text file) sul tuo computer.

freeocr

Come con NewOCR menzionato di seguito, questo sito mette in maiuscolo tutte le T nel documento. Non ho idea del perché lo farebbe, ma per qualche strana ragione questo sito e NewOCR(site and NewOCR) lo hanno fatto entrambi. Non è un grosso problema cambiarlo, ma è un processo noioso che non dovresti davvero fare.

Ecco i risultati di FreeOCR : Test1 Doc e Test2 Doc(Test1 Doc and Test2 Doc) .

ABBYY FineReader in linea

Per utilizzare FineReader Online , devi registrarti per un account, che ti offre una prova gratuita di 15 giorni per OCR fino a 10 pagine gratuitamente. Se hai solo bisogno di eseguire un OCR(OCR) una tantum per un paio di pagine, puoi utilizzare questo servizio. Assicurati(Make) di fare clic sul collegamento(verify link) di verifica nell'e-mail(confirmation email) di conferma dopo la registrazione.

finereader in linea

Clicca su Riconosci(Recognize) in alto e poi clicca su Carica(Upload) per selezionare il tuo file. Scegli la lingua, il formato di output e quindi fai clic su Riconosci(Recognize) in basso. Questo sito ha un'interfaccia pulita e anche senza pubblicità.

Nei miei test, questo sito è stato in grado di catturare il testo dal primo documento di test(test document) , ma è stato assolutamente enorme quando ho aperto il documento di Word(Word doc) , quindi ho finito per farlo di nuovo e ho scelto Testo normale(Plain Text) come formato di output(output format) .

Per il secondo test con le colonne, il documento di Word(Word document) era vuoto e non riuscivo nemmeno a trovare il testo. Non sono sicuro di cosa sia successo lì, ma non sembra essere in grado di gestire nient'altro che semplici paragrafi. Ecco i risultati di FineReader : Test1 Doc e Test2 Doc.

NuovoOCR

Il sito successivo, NewOCR.com , era OK, ma non così buono come il primo sito. In primo luogo, ha annunci, ma per fortuna non un sacco. Selezionare prima il file e quindi fare clic sul pulsante Anteprima(Preview) .

carica immagine

È quindi possibile ruotare l'immagine e regolare l'area in cui si desidera eseguire la scansione del testo. È più o meno come funziona il processo di scansione(scanning process) su un computer con uno scanner collegato.

immagine ocr

Se il documento ha più colonne, puoi controllare il pulsante Analisi layout pagina( Page layout analysis) e proverà a dividere il testo in colonne. Fai clic(Click) sul pulsante OCR(OCR button) , attendi qualche secondo per il completamento, quindi scorri fino in fondo quando la pagina si aggiorna.

Nel primo test, ha ottenuto tutto il testo correttamente, ma per qualche motivo ha scritto in maiuscolo ogni T nel documento! Non ho idea del perché lo farebbe, ma lo fece. Nel secondo test con l' analisi della pagina(page analysis) abilitata, ha ottenuto la maggior parte del testo, ma il layout era completamente disattivato.

Ecco i risultati di NewOCR : Test1 Doc e Test2 Doc.

Conclusione

Come puoi vedere, la maggior parte delle volte, sfortunatamente, la versione gratuita non ti dà ottimi risultati. Il primo sito menzionato è di gran lunga il migliore perché non solo ha fatto un ottimo lavoro nel riconoscere tutto il testo, ma è anche riuscito a mantenere il formato del documento originale.

Se hai solo bisogno di testo, tuttavia, la maggior parte dei siti Web sopra dovrebbe essere in grado di farlo per te. Se avete domande, sentitevi liberi di commentare. Divertiti!



About the author

Ciao potenziali datori di lavoro! Sono un software engineer di grande esperienza con oltre 7 anni di esperienza nel settore. So come progettare e sviluppare applicazioni per Windows 7 e ho un'ampia gamma di consigli su fantastici siti Web sul mio profilo. Le mie capacità ed esperienze mi offrono una combinazione eccellente per qualsiasi azienda che cerca una persona di talento con buone capacità di gestione dei progetti, conoscenze di programmazione ed esperienza di sviluppo web.



Related posts