Come estrarre tabelle da documenti PDF
Questo articolo ti mostrerà come estrarre tabelle da documenti PDF(extract tables from PDF documents) . Potresti avere molti file PDF che contengono più tabelle che desideri utilizzare separatamente. Copiare(Copying) e incollare quelle tabelle non è una buona opzione in quanto potrebbe non fornire l'output previsto, quindi sono necessarie altre semplici opzioni in grado di estrarre tabelle da un file PDF e salvare tali tabelle come file separati.
La maggior parte di questi strumenti di estrazione della tabella PDF(PDF table extractor tools) non può essere d'aiuto se la tabella PDF viene scansionata. In tal caso, dovresti prima rendere il PDF ricercabile(make the PDF searchable) e quindi provare queste opzioni.
Estrai tabelle da documenti PDF
In questo post abbiamo aggiunto 2 servizi online gratuiti e 3 software gratuiti per estrarre tabelle da un file PDF :
- PDF in XLS
- PDFtoExcel.com
- Tabula
- ByteScout PDF Multitool
- Sejda PDF Desktop.
1] PDF in XLS
PDF to XLS è una delle migliori opzioni per estrarre tabelle da PDF . Ha due caratteristiche che lo rendono pratico. Puoi recuperare tabelle da 20 documenti PDF(20 PDF) insieme. Inoltre, l' estrazione della tabella PDF è automatica. (PDF)Genera l'output come file XLSX . Se un PDF ha più tabelle, ciascuna tabella viene archiviata separatamente in diversi fogli di file XLSX di output .
Apri la homepage(Open the homepage) di questo servizio. Successivamente, trascina e rilascia i file PDF o usa il pulsante CARICA FILE(UPLOAD FILES) . Ogni PDF(PDF) caricato viene convertito automaticamente in un file in formato XLSX. Quando i file di output sono pronti, puoi scaricarli uno per uno o scaricare un file ZIP che conterrà tutti i file di output.
2] PDFtoExcel.com
Il servizio PDFtoExcel.com(PDFtoExcel.com) può estrarre tabelle da un PDF contemporaneamente ma supporta più piattaforme per caricare PDF . Supporta le piattaforme OneDrive , desktop , Google Drive e Dropbox per caricare un PDF . Inoltre, il processo di conversione è automatico.
Questa homepage del servizio è qui(here) . Lì, seleziona un'opzione di caricamento per aggiungere PDF . Successivamente, carica e converte automaticamente il file PDF in Excel ( XLSX ). Quando l'output è pronto, riceverai il link per il download per salvare il file di output contenente le tabelle PDF .
Nota:(Note: ) sebbene questo servizio menzioni che può estrarre tabelle anche da file PDF scansionati , non ha funzionato per me. Puoi ancora provarlo per i PDF scansionati .
3] Tabula
Tabula è un potente software in grado di rilevare automaticamente le tabelle presenti in un PDF e quindi di salvarle come file TSV , JSON o CSV . Puoi selezionare l'opzione per salvare file CSV separati per ciascuna tabella PDF o salvare tutte le tabelle in un unico file CSV .
Per scaricare questo estrattore di tabelle PDF open source , fai clic qui(click here) . Richiede anche Java(requires Java) per eseguirlo e utilizzarlo correttamente.
Estrarre il file ZIP scaricato ed eseguire il file tabula.exe . Si aprirà una pagina nel browser predefinito. Se la pagina non è aperta, aggiungi http://localhost:8080 nel tuo browser e premi Invio(Enter) .
Ora vedrai la sua interfaccia dove puoi usare l' opzione Sfoglia(Browse) per aggiungere un PDF . Successivamente, premi il pulsante Importa(Import) . Quando il PDF viene aggiunto, puoi vedere le pagine PDF sulla sua interfaccia.
Usa il pulsante Rileva automaticamente tabelle(Autodetect Tables) e evidenzierà automaticamente tutte le tabelle presenti in quel PDF . Puoi anche evidenziare manualmente una tabella selezionando una tabella particolare. Se lo desideri, puoi anche rimuovere le tabelle selezionate(remove selected tables) a tua scelta.
Questo ti aiuterà a salvare solo le tabelle che desideri. Quando le tabelle PDF sono evidenziate, fare clic sul pulsante Anteprima ed esportazione dei dati estratti(Preview & Export Extracted Data) .
Infine, utilizza il menu a tendina disponibile nella parte superiore per selezionare un formato di output e premi il pulsante Esporta(Export) . Ciò salverà le tabelle PDF nel file di formato di output selezionato da te.
4] Strumento multiplo PDF ByteScout
Come suggerisce il nome, questo software viene fornito con più strumenti. Dispone di strumenti come convertire PDF in TIFF multipagina(convert PDF to multipage TIFF) , ruotare documenti PDF(rotate PDF document) , rendere PDF non ricercabili(make PDF unsearchable) , ottimizzare PDF(optimize PDF) , aggiungere un'immagine a PDF(add an image to PDF) e altro ancora. C'è anche la funzione di rilevamento della tabella PDF , il che è davvero fantastico. (PDF)Il vantaggio di questo strumento è che puoi estrarre tabelle(extract tables from scanned PDF) anche da PDF scansionati. È possibile rilevare le tabelle in più pagine e quindi estrarre tali tabelle come file in formato CSV , XLS , XML , TXT o JSON . Prima dell'estrazione, ti consente anche di impostare un intervallo di pagine(page range)per estrarre tabelle solo da pagine specificate.
Puoi prendere questo software qui(here) . È gratuito(free for non-commercial use) solo per uso non commerciale. Dopo l'installazione, esegui questo software e usa l'opzione Apri documento(Open Document) per aggiungere un PDF . Successivamente, fai clic sullo strumento Rileva tabelle(Detect tables) come evidenziato nell'immagine sopra. Questo strumento è presente nella categoria Estrazione dati(Data Extraction) .
Si aprirà una finestra in cui è possibile impostare le condizioni per rilevare le tabelle. Ad esempio, puoi impostare un numero minimo di colonne, righe, interruzioni di riga minime tra tabelle, impostare la modalità di rilevamento delle tabelle su tabelle con bordi o senza bordi, ecc. Utilizzare le opzioni o mantenere le impostazioni predefinite.
Successivamente, premi il pulsante Rileva tabella successiva(Detect next table) in quella casella. Identificherà e selezionerà una tabella nella pagina corrente. In questo modo, puoi passare a un'altra pagina e rilevare più tabelle.
Quando hai finito, usa il pulsante Procedi all'estrazione(Proceed to extraction) e seleziona il formato di output. Infine, puoi utilizzare le opzioni per salvare le tabelle dalla pagina corrente o definire un intervallo di pagine e salvare l'output.
Lo strumento fornisce un output soddisfacente. Ma a volte, potrebbe rilevare altri contenuti in PDF e potrebbe non essere in grado di estrarre tabelle da più pagine. In tal caso, dovresti usarlo per recuperare e salvare le tabelle una per una.
5] Sejda PDF Desktop
Sejda PDF Desktop è anche un software multiuso. Può ottimizzare o comprimere PDF(compress PDF) , aggiungere filigrana a PDF, rimuovere restrizioni da PDF(remove restrictions from PDF) , modificare documenti PDF , ecc. Tuttavia, il suo piano gratuito ha dei limiti. Nel piano gratuito è possibile eseguire solo 3 attività al giorno. Inoltre, il limite delle dimensioni del PDF è di (PDF)50 MB o 10 pagine(10 pages) .
Puoi utilizzare il suo strumento di conversione da PDF a Excel(PDF to Excel) per estrarre tabelle PDF . Rileva automaticamente le tabelle nelle pagine PDF e consente di salvare tali tabelle come XLSX o CSV .
Il suo link per il download è qui(here) . Dopo l'installazione, utilizzare lo strumento PDF in Excel dalla sua interfaccia principale. Dopo aver selezionato quello strumento, usa il pulsante Scegli file PDF(Choose PDF files) . È possibile aggiungere un solo PDF al piano gratuito.
Quando il PDF viene aggiunto, fornirà i pulsanti Converti PDF in CSV(Convert PDF to CSV) e Converti PDF in Excel . (Convert PDF to Excel)Usa un pulsante e poi puoi salvare l'output nella posizione desiderata sul tuo PC.
Il suo strumento di rilevamento delle tabelle PDF è buono. (PDF)Non è necessario rilevare manualmente le tabelle. Tuttavia, a volte potrebbe includere altro contenuto di testo come tabella PDF e memorizzarlo nell'output. Ma i risultati complessivi sono buoni.
È tutto.
Questi sono alcuni buoni strumenti per estrarre tabelle da PDF . Il software Tabula(Tabula) è più efficace di altri strumenti. Tuttavia, puoi provare tutti gli strumenti e verificare quale aiuta.
Simile si legge:(Similar reads:)
- Estrai allegati da PDF(Extract attachments from PDF)
- Estrai il testo evidenziato dal PDF(Extract highlighted text from PDF) .
Related posts
Document Converter: Convert DOC, PDF, DOCX, RTF, TXT, HTML File
Cos'è uno PPS file? Come convertire PPS su PDF in Windows 11/10?
PDF text scompare durante la modifica o il salvataggio del file in Windows 10
Best Free PDF Editor Online Tools che sono basati su cloud
PDF Editor Online Tool gratuito per modificare i file PDF - PDF Yeah
Come convertire Excel file su PDF online usando Google Drive
PDF24 Creator è uno PDF Creator gratuito per creare, convertire, unire i file PDF
Adobe Reader non funziona in Windows 10
Come abilitare due pagine Layout per PDFs in Edge browser
Come estrarre Highlighted Text da PDF come Text File?
Come convertire i documenti in PDF con CutePDF per Windows 10
Encrypt PDF file usando PDF Page Lock per Windows PC
Optimize, comprimere e ridurre PDF File size in Windows 10
Come salvare le pagine Web come PDF in Chrome or Firefox
PDFTK Builder è un software gratuito per modificare e dividere PDF file e documenti
Best PDF word counter software and online tools
Download Adobe Reader app per Windows 10 da Microsoft Store
7-PDF Website Converter: Convert Web Pages in PDF
LightPDF è un globale globale PDF Editor tool per tutte le tue esigenze PDF
Best GRATIS ONLINE PDF a PDF/A converter Strumenti