Come estrarre tabelle da documenti PDF

Questo articolo ti mostrerà come estrarre tabelle da documenti PDF(extract tables from PDF documents) . Potresti avere molti file PDF che contengono più tabelle che desideri utilizzare separatamente. Copiare(Copying) e incollare quelle tabelle non è una buona opzione in quanto potrebbe non fornire l'output previsto, quindi sono necessarie altre semplici opzioni in grado di estrarre tabelle da un file PDF e salvare tali tabelle come file separati.

La maggior parte di questi strumenti di estrazione della tabella PDF(PDF table extractor tools) non può essere d'aiuto se la tabella PDF viene scansionata. In tal caso, dovresti prima rendere il PDF ricercabile(make the PDF searchable)  e quindi provare queste opzioni.

Estrai tabelle da documenti PDF

In questo post abbiamo aggiunto 2 servizi online gratuiti e 3 software gratuiti per estrarre tabelle da un file PDF :

  1. PDF in XLS
  2. PDFtoExcel.com
  3. Tabula
  4. ByteScout PDF Multitool
  5. Sejda PDF Desktop.

1] PDF in XLS

Servizio da PDF a XLS

PDF to XLS è una delle migliori opzioni per estrarre tabelle da PDF . Ha due caratteristiche che lo rendono pratico. Puoi recuperare tabelle da 20 documenti PDF(20 PDF) insieme. Inoltre, l' estrazione della tabella PDF è automatica. (PDF)Genera l'output come file XLSX . Se un PDF ha più tabelle, ciascuna tabella viene archiviata separatamente in diversi fogli di file XLSX di output .

Apri la homepage(Open the homepage) di questo servizio. Successivamente, trascina e rilascia i file PDF o usa il pulsante CARICA FILE(UPLOAD FILES) . Ogni PDF(PDF) caricato viene convertito automaticamente in un file in formato XLSX. Quando i file di output sono pronti, puoi scaricarli uno per uno o scaricare un file ZIP che conterrà tutti i file di output.

2] PDFtoExcel.com

Estrai tabelle da documenti PDF

Il servizio PDFtoExcel.com(PDFtoExcel.com) può estrarre tabelle da un PDF contemporaneamente ma supporta più piattaforme per caricare PDF . Supporta le piattaforme OneDrive , desktop , Google Drive e Dropbox per caricare un PDF . Inoltre, il processo di conversione è automatico.

Questa homepage del servizio è qui(here) . Lì, seleziona un'opzione di caricamento per aggiungere PDF . Successivamente, carica e converte automaticamente il file PDF in Excel ( XLSX ). Quando l'output è pronto, riceverai il link per il download per salvare il file di output contenente le tabelle PDF .

Nota:(Note: ) sebbene questo servizio menzioni che può estrarre tabelle anche da file PDF scansionati , non ha funzionato per me. Puoi ancora provarlo per i PDF scansionati .

3] Tabula

Software di estrazione PDF Tabula

Tabula è un potente software in grado di rilevare automaticamente le tabelle presenti in un PDF e quindi di salvarle come file TSV , JSON o CSV . Puoi selezionare l'opzione per salvare file CSV separati per ciascuna tabella PDF o salvare tutte le tabelle in un unico file CSV .

Per scaricare questo estrattore di tabelle PDF open source , fai clic qui(click here) . Richiede anche Java(requires Java) per eseguirlo e utilizzarlo correttamente.

Estrarre il file ZIP scaricato ed eseguire il file tabula.exe . Si aprirà una pagina nel browser predefinito. Se la pagina non è aperta, aggiungi http://localhost:8080 nel tuo browser e premi Invio(Enter) .

Ora vedrai la sua interfaccia dove puoi usare l' opzione Sfoglia(Browse) per aggiungere un PDF . Successivamente, premi il pulsante Importa(Import) . Quando il PDF viene aggiunto, puoi vedere le pagine PDF sulla sua interfaccia.

Usa il pulsante Rileva automaticamente tabelle(Autodetect Tables) e evidenzierà automaticamente tutte le tabelle presenti in quel PDF . Puoi anche evidenziare manualmente una tabella selezionando una tabella particolare. Se lo desideri, puoi anche rimuovere le tabelle selezionate(remove selected tables) a tua scelta.

Questo ti aiuterà a salvare solo le tabelle che desideri. Quando le tabelle PDF sono evidenziate, fare clic sul pulsante Anteprima ed esportazione dei dati estratti(Preview & Export Extracted Data) .

Infine, utilizza il menu a tendina disponibile nella parte superiore per selezionare un formato di output e premi il pulsante Esporta(Export) . Ciò salverà le tabelle PDF nel file di formato di output selezionato da te.

4] Strumento multiplo PDF ByteScout

ByteScout PDF Multitool: aggiungi pdf e rileva tabelle

Come suggerisce il nome, questo software viene fornito con più strumenti. Dispone di strumenti come convertire PDF in TIFF multipagina(convert PDF to multipage TIFF) , ruotare documenti PDF(rotate PDF document) , rendere PDF non ricercabili(make PDF unsearchable) , ottimizzare PDF(optimize PDF) , aggiungere un'immagine a PDF(add an image to PDF) e altro ancora. C'è anche la funzione di rilevamento della tabella PDF , il che è davvero fantastico. (PDF)Il vantaggio di questo strumento è che puoi estrarre tabelle(extract tables from scanned PDF) anche da PDF scansionati. È possibile rilevare le tabelle in più pagine e quindi estrarre tali tabelle come file in formato CSV , XLS , XML , TXT o JSON . Prima dell'estrazione, ti consente anche di impostare un intervallo di pagine(page range)per estrarre tabelle solo da pagine specificate.

Puoi prendere questo software qui(here) . È gratuito(free for non-commercial use) solo per uso non commerciale. Dopo l'installazione, esegui questo software e usa l'opzione Apri documento(Open Document) per aggiungere un PDF . Successivamente, fai clic sullo strumento Rileva tabelle(Detect tables) come evidenziato nell'immagine sopra. Questo strumento è presente nella categoria Estrazione dati(Data Extraction) .

Si aprirà una finestra in cui è possibile impostare le condizioni per rilevare le tabelle. Ad esempio, puoi impostare un numero minimo di colonne, righe, interruzioni di riga minime tra tabelle, impostare la modalità di rilevamento delle tabelle su tabelle con bordi o senza bordi, ecc. Utilizzare le opzioni o mantenere le impostazioni predefinite.

Successivamente, premi il pulsante Rileva tabella successiva(Detect next table) in quella casella. Identificherà e selezionerà una tabella nella pagina corrente. In questo modo, puoi passare a un'altra pagina e rilevare più tabelle.

rilevare tabelle e salvare tabelle pdf con l'output selezionato

Quando hai finito, usa il pulsante Procedi all'estrazione(Proceed to extraction) e seleziona il formato di output. Infine, puoi utilizzare le opzioni per salvare le tabelle dalla pagina corrente o definire un intervallo di pagine e salvare l'output.

Lo strumento fornisce un output soddisfacente. Ma a volte, potrebbe rilevare altri contenuti in PDF e potrebbe non essere in grado di estrarre tabelle da più pagine. In tal caso, dovresti usarlo per recuperare e salvare le tabelle una per una.

5] Sejda PDF Desktop

Sejda PDF Desktop con convertitore da pdf a excel

Sejda PDF Desktop è anche un software multiuso. Può ottimizzare o comprimere PDF(compress PDF) , aggiungere filigrana a PDF, rimuovere restrizioni da PDF(remove restrictions from PDF) , modificare documenti PDF , ecc. Tuttavia, il suo piano gratuito ha dei limiti. Nel piano gratuito è possibile eseguire solo 3 attività al giorno. Inoltre, il limite delle dimensioni del PDF è di (PDF)50 MB o 10 pagine(10 pages) .

Puoi utilizzare il suo strumento di conversione da PDF a Excel(PDF to Excel) per estrarre tabelle PDF . Rileva automaticamente le tabelle nelle pagine PDF e consente di salvare tali tabelle come XLSX o CSV .

Il suo link per il download è qui(here) . Dopo l'installazione, utilizzare lo strumento PDF in Excel dalla sua interfaccia principale. Dopo aver selezionato quello strumento, usa il pulsante Scegli file PDF(Choose PDF files) . È possibile aggiungere un solo PDF al piano gratuito.

Quando il PDF viene aggiunto, fornirà i pulsanti Converti PDF in CSV(Convert PDF to CSV) e Converti PDF in Excel . (Convert PDF to Excel)Usa un pulsante e poi puoi salvare l'output nella posizione desiderata sul tuo PC.

converti tabella pdf in excel o csv

Il suo strumento di rilevamento delle tabelle PDF è buono. (PDF)Non è necessario rilevare manualmente le tabelle. Tuttavia, a volte potrebbe includere altro contenuto di testo come tabella PDF e memorizzarlo nell'output. Ma i risultati complessivi sono buoni.

È tutto.

Questi sono alcuni buoni strumenti per estrarre tabelle da PDF . Il software Tabula(Tabula) è più efficace di altri strumenti. Tuttavia, puoi provare tutti gli strumenti e verificare quale aiuta.

Simile si legge:(Similar reads:)



About the author

ingegnere audiofilo e specialista di prodotti audio con oltre 10 anni di esperienza. Sono specializzato nella creazione di altoparlanti e cuffie per musica di qualità dall'inizio alla fine. Sono un esperto nella risoluzione dei problemi audio e nella progettazione di nuovi altoparlanti e sistemi di cuffie. La mia esperienza va oltre la semplice realizzazione di buoni prodotti; Ho anche una passione per aiutare gli altri a essere il meglio di sé possibile, sia attraverso l'istruzione che il servizio alla comunità.



Related posts