ExtractPDF, hoe afbeeldingen en teksten uit een PDF-bestand te extraheren

extractpdf

De pdf-bestanden (Portable Document Format) zijn voor veel mensen van dagelijks gebruik , zowel op het werk als in hun vrije tijd. Rapporten, tijdschriften, digitale boeken en allerlei soorten documenten zijn meestal in dit Adobe-formaat. De Adobe Acrobat Reader-applicatie is gratis en kan worden geïnstalleerd op computers, smartphones en tablets, maar vaak is het alleen kunnen lezen ervan niet voldoende. Vaak is het interessant om afbeeldingen en teksten en zelfs lettertypen te kunnen extraheren . Hiervoor zijn verschillende tools beschikbaar, in de vorm van applicaties of online diensten; velen zijn gratis. Onder de gratis tools valt ExtractPDF op., omdat het erg compleet is; Het wordt niet alleen gebruikt om teksten, lettertypen en afbeeldingen uit dit bestandsformaat te extraheren, maar het is ook mogelijk om aanvullende informatie zoals bijbehorende metadata te extraheren .

ExtractPDF werkt via internet. De gebruiker kan de bewerking op twee manieren uitvoeren. De eerste is om het PDF-bestand naar de site te uploaden en de tweede is om het internetadres (URL) in te voeren van waar het bestand dat je wilt verwerken wordt gehost. De interface is heel eenvoudig en is beschikbaar in twee talen: Engels en Duits. U hoeft zich niet te registreren om het te gebruiken en u hoeft ook geen e-mailverificatie uit te voeren. De service heeft geen toegang tot de inhoud van de geüploade bestanden en ze verwijderen de bestanden nadat ze zijn verwerkt.

extractpdf

Als de gebruiker ervoor kiest om het bestand te uploaden , is de maximale grootte van de pdf beperkt tot 10 MB (megabytes). Nadat de PDF is geüpload, moet de gebruiker op de knop Bestand verzenden klikken en na een zeer korte tijd krijgt hij de resultaten. Op de pagina die de resultaten van het proces verzamelt, zijn er vier secties: afbeeldingen, teksten, bronnen en metadata . De gebruiker hoeft alleen het overeenkomstige tabblad te kiezen om de inhoud te downloaden, bijvoorbeeld het tabblad met afbeeldingen. Een ander voordeel is dat de afbeeldingen, teksten en andere gecomprimeerd worden gedownload in ZIP , zodat ze minder ruimte innemen en de bewerking weinig tijd kost.

De ExtractPDF- tool extraheert de originele afbeeldingen die in de PDF zijn gebruikt. Negeer echter alle volgende transformaties, zoals rotaties of kleurinversies. Met betrekking tot de lettertypen adviseert de service dat de geëxtraheerde lettertypen de lettertypen zijn die in het originele PDF-document voorkomen. Dit betekent dat als dat originele bestand niet de letter "Q" bevat, die letter niet in de resultaten zal verschijnen.

De ExtractPDF- service is gratis en er is geen beperking op het aantal bestanden dat per dag kan worden verwerkt. Het wordt gedeeltelijk gefinancierd met reclame; ze plaatsen advertenties op uw pagina. Ten slotte zijn er nog andere alternatieve tools die ook gratis zijn, hoewel niet zo compleet, zoals onder andere Extract PDF Images , PDF Text Extractor of iWeSoft PDF Image Extractor .

Dit is de link naar de ExtractPDF- site .