myPDFconvert - Starke Kompression plus OCR

myPDFconvert bietet über seine einheitliche grafische Benutzerschnittstelle (GUI) auch Verarbeitungsoptionen für das hochperformante Komprimieren von Dokumenten verschiedener PDF- und Grafikformate sowie eine integrierte OCR-Verarbeitung.

 

Starke Komprimierung
Das Produkt enthält eine Implementierung des JBIG2-Standards (ISO/IEC 14492). Es bietet eine verlustfreie und nahe-verlustfreie Codierung von schwarz/weißen Inhalten gemäß JBIG2. Für gescannte, farbige Dokumente, die sowohl bitonale Elemente (Text, technische Zeichnungen) als auch Bilder enthalten, nutzt myPDFconvert eine Implementierung des ebenfalls genormten Kompressionsverfahrens JPEG2000 / Part6.


Es werden sehr hohe Kompressionsraten und hoher Durchsatz erreicht:

Üblicherweise sind die mit verlustfreier (lossless) JBIG2-Komprimierung erzeugten, gemäß ISO 19005-1b PDF/A-konformen PDF-Dateien am Ende nur noch halb so groß wie die ursprünglich vorhandenen oder eingescannten TIFF-Dateien (vergl. Abb. rechts). Diese Dokumente sind dann für Archivsysteme und andere automatische Verarbeitungen durchsuchbar (Volltextrecherche) und Anwender können ihren Posteingang gleich beim Scannen normkonform umwandeln - und ggf. noch signieren.

Die in myPDFconvert genutzten Funktionen komprimieren Schwarz-Weiß-Scans in der Regel um einen Faktor 5 bis 10 und Farbscans um einen Faktor 10 bis 100. Die textbezogene Farbscanbearbeitung garantiert höchste Datentreue selbst bei starker Komprimierung.

Für das Anzeigen der erzeugten PDF-Dateien wird der normale Adobe Acrobat Reader verwendet, der von Adobe Systems' website bezogen werden kann.

 

 

Komprimieren plus OCR
Zusätzlich bietet myPDFconvert eine fortschrittliche OCR-Texterkennung, die davon profitiert, dass der Zeichenerkennung wahlweise ein Prozess zur Verbesserung der Bildqualität vorausgeht.

Werden Bitmap-Dokumente (z.B. TIFF, BMP) mit myPDFconvert in PDF/A-konforme PDF-Dokumente umgewandelt, so kann - neben der Komprimierung - auch die OCR-Funktionalität mit in die Verarbeitung einbezogen werden. Dessen Arbeitsergebnis - die extrahierten bzw. erkannten Texte – werden zusammen mit dem (stark komprimierten) Image im erstellten PDF/A-Dokument gespeichert. In der Anzeige im Adobe-Viewer bilden Text und Bild dann eine Einheit - gesuchter Text wird dort gefunden und angezeigt, wo er sich auch im Bild befindet.

 

Leistungsstarke, automatisierte OCR mit präzisen Ergebnissen
Die OCR-Engine in myPDFconvert wurde für leistungsstarkes Scannen und OCR im Unternehmenseinsatz entwickelt. myPDFconvert bietet Konfigurationsmöglichkeiten für Geschwindigkeit, Menge und Automatisierung.

Es automatisiert den OCR-Prozess durch überwachte Ordner; auf diese Weise brauchen Anwender die Dokumentverarbeitung nicht zu beaufsichtigen. Im entsprechenden Modus werden Dateien einer OCR-Analyse unterzogen, indem man sie z.B. einfach in einen Ordner zieht. Um große Mengen an Scans zu bewältigen, arbeitet die OCR-Stapelverarbeitung mit einer hohen Geschwindigkeit von ca. 1 gescannten Seite pro Sekunde.

Beta Systems Software AG

Ansprechpartner

Rahim Ajjaji

Rahim Ajjaji

DETEC Software GmbH
Bensheimer Straße 61
65428 Rüsselsheim

Tel  +49 - (0)6142 - 35 75 - 10
Fax: +49 - (0)6142 - 3575-99
rahim.ajjaji@betasystems.com