Optical Character Recognition. Grundlagen, OCR-Programme und potentielle Einsatzgebiete in der Wohnungswirtschaft


Seminararbeit, 2000
17 Seiten

Gratis online lesen

1 Einleitung

„Wer aufmerksam, die verschiedenen Computermagazine verfolgt, wird bei vielen Artikeln über die Texterkennung dem Schlagwort vom papierlosen Büro, an dessen Pforte wir nun alle heftig klopften, begegnen. Dieser Gedanke ist ohne Zweifel nicht allein reine Phantasie. Der Gang zu einem der unzähligen Ämter oder Behörden beweist, daß es sich dabei nicht nur um ein leeres Schlagwort handelt.

Während früher z. B. personenbezogene Informationen auf unzähligen fliegenden Blättern in verschiedenen Aktenordnern zusammengepfercht waren, so genügt heute ein Tastendruck auf die Computertastatur, und der Rechenknecht schaufelt alle notwendigen Informationen auf den Monitor“ (Fabian, S. 141).

Nach wie vor liegen immer noch unendlich viele Daten verborgen und versteckt in unübersichtlichen Aktenordnern. Sollen diese Daten in eine computerlesbare Form überführt werden, so bieten sich mittlerweile zwei Wege an. Zum einen können sich menschliche Hände an der Computertastatur erproben und in ellenlangen Arbeitsstunden all die sensiblen Daten eingeben.

Als Alternative dazu bietet sich eine zweite Möglichkeit der Texterfassung, die Software unterstützte Texterkennung an (vgl. ebenda, S. 141 f.).

Zunächst soll das zweite Kapitel die grundlegenden Voraussetzungen für das Verständnis der Begriffe OCR und Schrifterkennung verschaffen. Abschließend wird ebenfalls im zweiten Kapitel die Funktionsweise von OCR dargestellt.

Ziel des dritten Kapitels ist es einen Überblick über die wichtigsten Marktanbieter von OCR - Software zu verschaffen. Es werden auch weitere Einsatzmöglichkeiten von OCR dargestellt.

Im vierten Kapitel wird die derzeitige Einsatzsituation von OCR speziell in der Immobilienwirtschaft aufgezeigt.

2 Grundlagen

2.1 Begriffe und Definitionen

Im folgenden sollen zunächst einige grundlegende Begriffe und Definitionen näher beschrieben werden:

- Scanner
- OCR
- OCR - A - OCR - B
- Auflösung
- dpi
- Mustervergleich - Pattern Matching
- Merkmalsentnahme - Feature Recognition
- Cross Update

- Scanner

Der Begriff Scanner stammt bekanntlich aus dem Englischen von „to scan“, im Sinne von kritisch prüfen, ursprünglich lateinisch scandere (auch deutsch skandieren für Sprechweisen unter besonderer Betonung und / oder Rhytmisierung) (vgl. Limper, S. 75).

Der Scanner ist eine Dateneingabeeinrichtung, mit der sich Schriften, Fotos und Zeich- nungen in einen Computer einlesen lassen. Man unterscheidet im allgemeinen Text, - Bild- und Barcodescanner. Der Vorgang des Abtastens einer Vorlage mit dem Scanner wird als scannen (engl. scanning) bezeichnet. Scanner wandeln die in einem Bild oder Text enthaltenen Schwarz/Weiß - Werte, Graustufen oder Farbinformationen durch Abtasten mit einem Lichtstrahl in elektrische Impulse um, die dann von einem Compu- ter mit der entsprechenden Software weiterverarbeitet werden können (vgl. Schimpf; Ullfors, S. 330).

- OCR

Steht für die englische Abkürzung Optical Character Recognition, zu deutsch: optische Zeichenerkennung. Es ist eine Methode zur Erkennung von Buchstaben in gescannten Texten. Mit Hilfe eines OCR - Programms lassen sich als Bilddateien vorliegende Texte in editierbare Textdateien umwandeln (vgl. Kraus, S. 225).

- OCR - A - OCR - B

Geräte die nur OCR - Schriften erfassen, bezeichnet man als Belegleser oder Klar- schriftleser. Von derartigen Systemen interpretierbare Schriftarten sind OCR - A und OCR - B. Diese sind die weltweit am weitesten verbreiteten Maschinenschriften. OCR - A besteht aus Ziffern, sowie den Großbuchstaben des Alphabets und einigen Sonderzeichen. OCR - A ist sehr maschinenorientiert, zur Auswertung, besonders der Ziffern, zieht man lediglich waagerechte und senkrechte Strichelemente heran (vgl. Schimpf; Ullfors, S. 168).

Der Prozentsatz der korrekt erkannten und interpretierten Zeichen ist im Unterschied zu anderen Schriftarten besonders hoch. Die für den Menschen leichter zu lesende ist OCR - B, zumal hier auch Kleinbuchstaben verwendet werden. Beide Schriften kommen überall in den Bereichen zum Einsatz, in denen große Mengen maschinell erzeugter Daten zwecks Weiterverarbeitung wieder eingelesen werden müssen. Das wohl bekannteste Beispiel ist der Euroscheck. Die aufgedruckten Ziffern für Bankleitzahl und laufende Nummer entstammen dem OCR - A Zeichensatz (vgl. ebenda, S. 168).

- Auflösung

Unter Auflösung wird das Maß eines Gerätes (Scanner, Monitor, Drucker) verstanden, Details darzustellen. Je höher die Auflösung, desto genauer ist die Darstellung. Dpi heißt die Maßeinheit bei Scannern und Druckern (vgl. Eisenkolb; Weickardt, 1995, S. 175).

- dpi

Unter dpi versteht man dots per inch oder Punkte pro Zoll (1 Zoll = 2, 54 cm). Die Maßeinheit für die Auflösung bei Scannern oder Druckern (vgl. ebenda S. 177).

- Mustervergleich - Pattern Matching

Pattern Matching ist eine Methode bei der das gescannte Zeichen mit vortrainierten und gespeicherten Mustern verglichen wird und somit erkannt werden kann (vgl. www.datascan.de). In dem das Programm die gespeicherten Zeichen über die gescannten „legt“ und so Zeichen für Zeichen abgleicht (vgl. Schimpf; Ullfors, S. 268).

Quelle: www.datascan.de

Abbildung in dieser Leseprobe nicht enthalten

Abb. 1: Mustervergleich - Pattern Matching

- Merkmalsentnahme - Feature Recognition

„Beim Topologieverfahren (engl. feature recognition) findet kein Bitmustervergleich statt, sondern das jeweils zu erkennende Zeichen wird auf eine gespeicherte >>Beschreibung<< hin geprüft. Eine Beschreibung für den Buchstaben A könnte z. B. so lauten: >>Zwei Strecken mit einer gleichen Länge n bilden am oberen Ende einen Winkel zwischen 15°und 45°und sind im Bereich zwischen X und Y durch eine waagerechte Strecke miteinander verbunden<<. Jedes gescannte Zeichen wird mit der Zeichenbeschreibung jedes Buchstabens (und anderer Zeichen)verglichen und dem entsprechenden Zeichen aus dem Zeichensatz zugewiesen“ (Schimpf; Ullfors, S. 268).

Quelle: www.datascan.de

Abbildung in dieser Leseprobe nicht enthalten

Abb. 2: Merkmalsentnahme - Feature Recognition

- Cross Update

Heute ist jeder Scanner mit einer deutlich eingeschränkten OCR - Software ausgestattet. Diese ist für einfache Texte zwar ausreichend, beherrscht meistens nur den Automatik - Modus ohne Eingriffsmöglichkeiten. Sie reicht aber aus, um statt einer Vollversion ein Upgrade, ein sogenanntes Cross Update, zu erwerben. Dabei muß man vorher nicht einmal das Produkt des gleichen Herstellers verwendet haben (vgl. o. V.: Vom Scanner zum richtigen Text, S. 72)

2.2 Funktionsweise von OCR

Am Anfang steht die optische Abtastung des Textes durch einen Scanner. Die Vorlage wird dabei in Bildpunkte zerlegt und jedem dieser Bildpunkte wird ein Wert für die Graustufen- bzw. Farbinformationen zugeordnet. Als Ergebnis eines Scanvorgangs erhält man eine Grafikdatei, die mit Hilfe von einem Bildbearbeitungsprogramm gedruckt und verändert werden kann. Soll der Text aber mit einem Textverarbeitungs- programm weiterverarbeitet werden, muß ein Texterkennungsprogramm im gescannten Abbild nach Buchstaben suchen und diese auch interpretieren (vgl. www.ocr- systeme.de).

In einem ersten vorbereitenden Arbeitsgang wird die Textvorlage segmentiert und in einzelne Buchstaben und Zeichen zerlegt. Für die Auswertung der Zeichen können zwei verschiedene Technologien angewandt werden.

Eine Möglichkeit ist es, die gescannten und separierten Zeichen mit abgespeicherten Mustern zu vergleichen (Pattern Matching) und bei Übereinstimmung bestimmte Buchstaben zuzuordnen (vgl. ebenda).

Eine andere Technik ist die Auswertung nach Merkmalen (Feature Recognition) der Zeichen. Dabei wird ein Zeichen in geometrische Figuren wie Linien und Kreise zerlegt und diesen Elementen wird dann ein Buchstabe zugeordnet. Sicher kann man sich vorstellen, daß die Auswertung ähnlich aussehender Zeichen wie I und 1 oder 0 und O sehr schwierig ist, wenn nicht auf Sinnzusammenhänge zurückgegriffen werden kann (vgl. ebenda). Auch bei Ligaturen1 ist es eine Erleichterung, wenn Sinnzusammenhänge zurückgegriffen werden kann (vgl. Eisenkolb; Weickardt, 1997, S. 177)

Aufgrund der Leistungsfähigkeit heutiger Texterkennungssysteme werden natürlich zahlreiche Technologien und Analysen eingesetzt, um sehr hohe Genauigkeiten zu erzielen. Der Faktor Erkennungsgenauigkeit ist in starkem Maße abhängig von der Vorlagenqualität und natürlich auch von der Helligkeitseinstellung beim Scanvorgang. Das Gesamtergebnis können die meisten OCR - Systeme durch bestimmte Hilfsmittel wie Wörterbuch oder Trainingsmöglichkeiten positiv beeinflussen (vgl. www.ocr- systeme.de).

Eine 100%-ige Erkennung kann jedoch kein System garantieren. Um so beeindruckender ist es deshalb, daß die Fehlerrate bei neuen Versionen um Größenordnungen gesenkt werden kann und die Verarbeitung schwieriger Vorlagen ermöglicht wird (vgl. ebenda).

Ein Überblick über die Erkennungsgenauigkeit. Sie liegen nach Stand der Technik zwi- schen:

- > 99,9% bei Normschriften
- bei > 98% für Druck und Maschinenschriften
- bei ca. 95% für Handschrift - Ziffern in Kästchen
- unter 95% für Handschrift - Buchstaben geblockt (vgl. www.datascan.de)

3 Vorstellung gängiger OCR - Programme

3.1 Texterkennungsprogramme

„Wer mit seinem Scanner Dokumente einliest, um sie digital weiterzuverarbeiten, möchte Zeit sparen. Das Erfassen einschließlich der Korrektur von Erkennungsfehlern muß schneller gehen, als den Text in den PC zu tippen“ (Faass; Michl, S. 198).

Oft versprechen die Anbieter von OCR - Software Erkennungsraten von beinahe 100%, blitzschnelle Umwandlung von Scan in Text unter Erhaltung des Layouts und Export der Ergebnisse in gängige Textverarbeitungsprogramme (vgl. ebenda, S. 198).

Der Markt ist überschaubar geworden, aufgrund einiger Fusionen und dadurch daß einige Anbieter ganz vom Markt verschwunden sind. Trotzdem sind die Preise gesunken. Mehr als dreihundert Mark muß für eine professionelle Texterkennungssoftware nicht mehr investiert werden (vgl. ebenda, S. 198). Das ist auf zwei Gründe zurück zuführen: Zum einen haben andere Anbieter mitgezogen, als Scansoft (Xerox) den Preis für die Vollversion von Textbridge Pro auf 200 Mark gesenkt hat. Zum anderen ist selbst die bisher teuerste Software von Omni- page mit einem Cross - Update für 300 Mark erhältlich (vgl. ebenda, S. 198).

In den folgenden Abschnitten 3.1.1 bis 3.1.4 soll ein Einblick in die wichtigsten aktuellen Programme gegeben werden.

>>Der Worte sind genug gewechselt, Laßt mich auch endlich Daten seh´n!<<

(Doktor Faust bei einer Vorführung des neuen IBM-Computers, frei nach Goethe)

3.1.1 Fine Reader 4

Das aus Rußland stammende OCR - Programm welches in Deutschland noch relativ neu ist, hat sich bereits recht gut auf dem Deutschen Markt etabliert. Fine Reader baut auf einer eigenen Entwicklung auf, die in den Grundzügen auf der Pattern - Matching - Methode basiert. Das Programm überzeugt durch eine angenehme, nicht zu überladene Oberfläche. Alle wichtigen Funktionen sind mit nur einem Mausklick erreichbar (vgl. www.pcgo.de).

Auch die Erkennungsvorgänge lassen sich weitgehend automatisieren. Sogar alle Text- blöcke werden automatisch erkannt und eine manuelle Nachbearbeitung ist nicht not- wendig. Nach der eigentlichen Erkennung wird die integrierte Rechtschreibprüfung aktiv, die sich nicht wesentlich von den aus einer Textverarbeitung bekannten Modulen unterscheidet (vgl. ebenda).

Alle Wörter die nicht eindeutig erkannt wurden, werden grün hinterlegt und können sofort geändert oder dem Wörterbuch hinzugefügt werden.

Bei neuen Wörtern, die hinzugefügt werden sollen, wechselt das Programm automatisch in den sogenannten Trainingsmodus (vgl. ebenda).

„Bei schlechten Vorlagen hilft die Funktion >>Säubern<<, die störende Flecken oder ähnliches entfernt und die Konturen schärft“ (ebenda).

3.1.2 Textbridge 9.0 - Pagis Pro 3.0

Das bereits seit Jahren auf dem Deutschen Markt etablierte Produkt aus den Scansoft (Xerox) - Labors liefert sich einen harten Konkurrenzkampf mit Omnipage. Deshalb ist es auch nicht verwunderlich, daß bei beiden Programmen der Lieferumfang sehr identisch ist. Der gesamte Vorgang des Scannens bis zur Ausgabe läuft automatisch ab. Den Zugang erhält man über nur drei Schaltflächen (vgl. ebenda).

Die automatische Segmentierung der einzelnen Bereiche bereitet Textbridge keine Probleme, nur bei komplizierten Layouts empfiehlt sich eine manuelle Nachbearbeitung der Bereiche. Das Wörterbuch beherrscht elf europäische Sprachen und bietet einen riesigen Wortschatz. Nicht sauber erkannte Wörter werden farblich hervorgehoben, was die Korrektur erheblich vereinfacht und beschleunigt (vgl. ebenda).

Auch bei den Ausgabeformaten setzt Textbridge Maßstäbe: Knapp 40 verschiedene Formate beherrscht das Programm, darunter auch drei HTML - Formate. Mit der Ausgabe übernimmt Textbridge auch das Layout. Desweiteren werden sämtliche Spalten mit erstaunlich wenigen Problemen fehlerfrei erkannt (vgl. ebenda).

In Pagis Pro 3.0 bündelt Scansoft mit Textbridge Pro 9.0 das Dokumentenmanagement - Tool Pagis (inklusive des Moduls Copier zum Farbkopieren und der Formularsoftware Forms Fill - in) sowie die Business Edition der Bildbearbeitung Photo Deluxe von Adobe. Das erstaunliche daran ist das der Preis für das gesamte Softwarepaket nur 100 Mark über dem Preis des Einzelprogramms Textbridge Pro 9.0 liegt (vgl. Faass; Michl,S. 200).

3.1.3 Omnipage Pro 9.0 - Scanner Suite

Zur steten Verbesserung des Programms hat unter anderem die Übernahme einiger Konkurrenten geführt. Omnipage besitzt nun eine übersichtliche und intuitiv zu bedie- nende Oberfläche. Der Bildschirm wird von fünf großen Schaltflächen dominiert, über die ein Zugriff auf sämtliche Programmfunktionen möglich ist (vgl. www.pcgo.de).

Sogar der Bildschirm ist dreigeteilt: Links sieht man die Seiten in einem Miniaturformat, im mittleren das Bitmap als Abbild der Vorlage und rechts das Erkennungsergebnis zur Korrektur. Diese Aufteilung erweist sich als sehr praktisch, da der erkannte Text sofort mit der Vorlage vergleichbar ist (vgl. ebenda).

Caere bietet auch einen eigenen Scannertreiber, der neben dem üblichen Schwarzweiß- modus auch mit den beiden Graustufenmodi 3D-OCR und HP Accupage (nur für HP- Scanner) umgehen kann. Vor allem bei unsauberen Vorlagen empfiehlt sich der Graustufenmodus, der die Vorlage im Detail besser auf die Erkennung vorbereitet (vgl. ebenda).

„Bei aufwendigen Layouts spielt Omnipage seine Stärken aus: Das Programm unter- scheidet zwischen rechteckigen und mehreckigen Rahmen, wobei außerdem zwischen Text-, Tabellen- und Grafikfenstern unterschieden wird. Das macht gerade dann Sinn, wenn Formsatz erkannt werden soll, bei dem beispielsweise Bilder in Textspalten hin- ein ragen“ (ebenda). Das eigene umfangreiche Wörterbuch unterstützt 13 Sprachen, die für den täglichen Gebrauch auch durchaus ausreichen dürften (vgl. Faass; Michl, S. 199).

Omnipage Pro Scanner Suite ist ebenfalls wie Pagis Pro 3.0 (Abschnitt 3.1.3) ein Softwarepakt, das aus folgenden Komponenten besteht: Omnipage Pro 9.0, der Version 3.0 des hauseigenen Dokumentenverwalters Pagekeeper Pro, Adobes Photo Deluxe Business Edition und die Post - it Software Notes von 3M. Auch hier liegt der Verkaufspreis für das gesamte Paket nur ca. 100 Mark über dem Preis für das Cross Update von Omnipage Pro 9.0 (vgl. ebenda, S. 200).

3.1.4 Recognita Plus 5.0

Nachdem Recognita 1996 von Caere übernommen wurde, erscheint jetzt nach längerer Pause die neue Version Recognita Plus 5.0 (vgl. Heyer, S. 102). Recognita Plus 5.0 erkennt jetzt mehr Sprachen als je zuvor. Zusätzlich zum kyrillischen Alphabet erkennt das Programm viele osteuropäische Sprachen wie Russisch, Ukrainisch, Bulgarisch, Moldawisch, Tschetschenisch etc. Die Gesamtzahl der lesbaren Sprachen hat sich somit auf insgesamt 114 erhöht (vgl. www.flusoft.de). Ebenfalls ist ein Wörterbuch mit 16 weit verbreiteten Sprachen integriert (vgl. Heyer, S. 102).

Bisher konnte der Anwender zwischen Geschwindigkeit und Erkennungsgenauigkeit in fünf Stufen wählen. Jetzt ist eine sechste Stufe hinzugekommen, bei der Recognita zwei Erkennungsdienste parallel einsetzt. Diese Bearbeiten die Seiten unabhängig, verglei- chen dann die Resultate und treffen anschließend die Entscheidung über die Umsetzung (vgl. ebenda, S. 102).

Von Recognita wird diese Stufe empfohlen, wenn Faxe vorliegen oder die Vorlage in minderwertiger Qualität ist. Dagegen erkennt Recognita Drucksachen in guter Qualität problemlos, auch die Layoutübernahme wurde stark verbessert (vgl. ebenda, S. 102). „Recognita Plus 5.0 unterstützt das Einlesen in Farbe und speichert in den Text eingebettete Bilder. Weiterhin gibt es die drei Modi Schwarz/Weiß, Schwarz/Weiß mit automatischer Helligkeit sowie Grau. Die Auflösung lässt sich im Gegensatz zu Omnipage zwischen 300 und 400 Punkten pro Zoll variieren“ (ebenda, S. 102).

3.2 Sonstige OCR - Programme

Nach einem ausführlichen Einblick in die gängigen Texterkennungsprogramme soll nachfolgend noch ein kleiner Überblick über weitere Einsatzgebiete von Optischer Zeichenerkennung gegeben werden.

3.2.1 Formulare erfassen - Anwendungsbeispiel aus der Praxis

Einige Beispiele, auf die man sehr häufig trifft, sind Überweisungen oder auch Briefe. Die Deutsche Post AG hat in ihren Postverteilungszentren „Scanner“ die auf dem Brief- umschlag nach einer fünfstelligen Zahl (Postleitzahl) suchen. Eine OCR - Software hilft ihnen dabei.

Die Banken müssen die hand- oder maschinenbeschrifteten Belege buchen. Das geschah früher per Hand, in dem eine Menge Leute damit beschäftigt waren, die auf dem Über- weisungsträger geschriebenen Daten in die Erfassungsmaske eines Buchungssystems zu tippen (vgl. www.datascan.de).

Heute werden diese Belege maschinell verarbeitet. Zuerst werden die Belege in der Bank mit leistungsfähigen Scannern digitalisiert. Dabei wird die Farbe der Kästchen bewußt ignoriert, weshalb das Abbild nur noch die hand- oder maschinengeschriebenen Daten zeigt und zwar nur schwarz auf weiß (vgl. ebenda).

Da im Grunde die Anordnung der einzelnen Felder prinzipiell immer gleich ist, wird eine Art elektronische Maske über das Abbild gelegt, welche dem Computer sagt, wo sich welche Informationen befinden. Nun liest der Computer Zeichen für Zeichen aus und hinterlegt die einzelnen Felder nacheinander in einer Datei (vgl. ebenda).

Diese Leseergebnisse werden nun nacheinander in einer Korrekturmaske angezeigt, wo die nicht oder nicht zweifelsfrei erkannten Zeichen mit entsprechenden Abbildungen des Originals durch einen Mitarbeiter verglichen, überprüft und ergänzt werden können. „Da man dem Erfassungssystem vorher einmal mitgeteilt hat, welche Struktur die Ausgabedaten haben sollen, werden diese, sobald verifiziert, gleich an das Buchungssystem übergeben und sind damit erledigt“ (ebenda).

3.2.2 FormFile - FormFile SWR 2.4

Das Formularlesesystem von IMPROX automatisiert die Übernahme von Informationen die in Papierform vorliegen (Formulare, Belege, etc.) zu maschinell verarbeitbaren Daten. Durch FormFile wird der PC gleichzeitig zum Daten- und Prüferfasser. Die strikte Einhaltung von Industriestandards ermöglicht auch die Integration in die bestehende EDV-Umgebung und die einfache Datenübergabe zu nachfolgenden Buchungs-, Archiv- und Datenbanksystemen (vgl. ebenda).

Das System ist von der reinen Softwarelösung bis zum Hochleistungs - OCR - Serversystem durchgehend skalier- und erweiterbar. Dadurch wird die Automatisierung der Formular- und Belegerfassung für den Anwender mit einigen Dutzend Dokumenten am Tag ebenso möglich, wie mit einem Belegvolumen von täglich 50.000 und mehr. Scanner aller Größenordnungen werden ebenfalls unterstützt (vgl. ebenda).

Die grafischen Werkzeuge zur freien Definition von Lesezonen, Datenfeldern und Bildschirmmasken erlauben ein einfaches und müheloses Anpassen von FormFile an Formulare jeder Art (vgl. ebenda).

Zur Erstellung eines gewünschten Arbeitsablaufes von Texterkennung und Nachbearbeitung können mittels der integrierten Scriptsprache Makros definiert werden. Damit lassen sich auf einfachste Weise Plausibilitätsprüfungen von der einfachen Prüfziffernrechnung bis hin zum komplexen Datenbankzugriff erstellen. Anwendungsspezifische Routinen können auch in den modernen Hochsprachen (C/C++, VisualBasic, etc.) geschrieben und eingebunden werden (vgl. ebenda).

Lesezonen werden mit der Maus definiert und können bequem in ihrer Größe und Lage verändert werden. Attribute der Lesezonen (Schriftart, Zeichensatz, Bildvorverarbei- tung, dynamische Zonennachführung, etc.) können auch auf Knopfdruck festgelegt werden.

Die Nachbearbeitung wird rasch und effizient durchgeführt. Wenn Rückweisungen (nicht erkannte Zeichen) zu korrigieren sind, wird ein Bildausschnitt des gescannten Images angezeigt, um die Problemstelle sofort und einfach zu erfassen. Zusätzlich wird die jeweilige Zeile dem von FormFile gelesenen Text unmittelbar dem Originaltext gegenübergestellt, um so einen sofortigen und direkten Vergleich zu haben (vgl. ebenda).

FormFile SWR 2.42 ist ein PC basiertes Formular- und Beleglesesystem. Je nach Ver- sion, PC und Schriftgut ist es möglich zwischen 26 und 860 Zeichen/Sek. Maschinen-, Handblockschrift oder Barcodes zu lesen. FormFile SWR 2.4 ist in hohem Grade ska- lierbar und kann bei Belegaufkommen von wenigen 100 Stück pro Woche bis hin zu mehreren 10.000 Belegen pro Tag eingesetzt werden. Die sehr flexible Exportfunktion ermöglicht die Übergabe der korrigierten und geprüften Datensätze in eine Vielzahl von anderen Anwendungen wie Buchungs- und Archivierungssyteme oder Datenbanken (vgl. ebenda).

3.2.3 Blue Wings®/Capture

„BlueWings®/Capture ist ein Hochleistungssystem für die automatische Erkennung und Erfassung von Geschäftsdokumenten“ (www.pronobis.at).

BlueWings®/ Capture wandelt Papierdokumente in elektronische Daten um. Dabei erkennt und prüft das System auch den Inhalt und stellt die gewonnenen Informationen anderen Anwendungen für die Weiterverarbeitung zur Verfügung. Die einzelnen Arbeitsschritte - Scannen oder Faximport, Klassifizieren der Dokumente, Erkennen, Prüfen und sowie das Exportieren der Daten- laufen bei BlueWings®/Capture weitgehend automatisch ab (vgl. ebenda).

Ein Benutzereingriff ist nur für die Bedienung des Scanners und für die Ergänzung der nicht erkannten Zeichen notwendig.

Die Erfassung großer Mengen von Papierdokumenten wie Bestellungen, Anträge, Rechnungen, Überweisungen, Fragebögen und andere Geschäftsdokumente erfordert einen beträchtlichen Aufwand von Zeit und Personal. Ein wesentlicher Kostenfaktor in jedem Geschäft, der mit BlueWings®/Capture effizient reduziert wird (vgl. ebenda). BlueWings®/Capture amortisiert sich häufig schon nach sechs bis zwölf Monaten; eine Wirtschaftlichkeit, die auf folgenden Vorteilen basiert:

Geschwindigkeit Die wesentliche Beschleunigung der Dokumentenverarbeitung, die Daten sind schnell verfügbar.

Abbildung in dieser Leseprobe nicht enthalten

Quelle: Eigene Darstellung in Anlehnung an: http://www.pronobis.at, vom 18.04.2000

Abb. 3: Die wirtschaftlichen Vorteile von BlueWings ®/Capture

3.3 Schrifterkennung für Blinde

Recognita Plus 5.0 unterstützt nicht nur das kyrillische Alphabet, sondern auch die Blindenschrift Braille3 (vgl. o. V.: Exaktere Erkennung, S. 44). In Braille geschriebene Texte setzt Recognita Plus 5.0 in normale Zeichen um. Um vor allem Sehbehinderten die Arbeit zu erleichtern, sind sämtliche Programmfunktionen und alle Eigenschaften über die Tastatur erreichbar (vgl. Heyer, S. 102).

4 OCR in der Immobilienwirtschaft

4.1 Praxisüberblick

Trotz umfangreicher Recherche erwies es sich als sehr schwierig in der Immobilienwirtschaft Unternehmen zu finden, die OCR Texterkennungssoftware einsetzen. Eine Anfrage beim Verband Norddeutscher Wohnungsunternehmen ergab, das selbst in diesem doch relativ großen Verbandsgebiet bis jetzt noch kein einzigstes Wohnungsunternehmen die Vorteile von OCR Texterkennung nutzt.

Auch ein großes Wohnungsunternehmen in Frankfurt am Main (40.000 Wohneinheiten) setzt keine OCR Schrifterkennung ein.

Etwas anders sieht es auf Gewerbeimmobiliensektor aus. Anschließend zwei Beispiele bei der OCR Schrifterkennung bereits seit einiger Zeit im Einsatz ist.

4.1.1 Erfahrungen der BHB Immobilien - Verwaltungs GmbH

Die BHB Immobilien - Verwaltungs GmbH (BHB) in München, ist eine kleine innova-tive Immobilienverwaltung. Sie betreut ca. 35 Objektgesellschaften mit insgesamt 45 Objekten (vorwiegend Gewebeobjekte) in ganz Deutschland. (Wichtige Standorte:

München, Berlin, Bonn, Köln, Dresden, Leipzig u.a.) Das derzeit betreute Vermögen beträgt ca. 370 Mrd. DM und ein jährliches Mietvolumen von ca. 30 Mio. DM.

Die BHB setzt seit ungefähr 2 Jahren die OCR Software Omnipage von Caere (Omnipage Limited Edition) ein. Zum überwiegenden Teil werden mehrseitige Dokumente (5 Seiten und mehr) wie z. B. Verträge, die nur in Papierform vorliegen, eingescannt und dann in eine Textdatei zur Weiterverarbeitung umgewandelt.

Die BHB verwendet ihren Scanner nicht nur zum einscannen von Texten, sondern auch zum einlesen von Fotos. Diese werden dann mit dem Fotobearbeitungsprogramm Ulead Photoimpact bearbeitet, um sie dann u.a. leichter als E - Mail versenden zu können. Die BHB ist sehr zufrieden mit der OCR- Scannersoftware. Die Anwendung ist unkom- pliziert und schnell. Ein Nacharbeiten des eingescannten Textes läßt sich aber trotzdem nicht vermeiden, da Absätze, Umlaute, Aufzählungen etc. nicht oder nicht vollständig als solche erkannt werden. In jedem Fall wird für das Nachbearbeiten wesentlich weni- ger Zeit benötigt, als wenn man den ganzen Text per Hand eingeben würde.

4.1.2 Erfahrungen von Haas & Halverscheidt

Haas & Halverscheidt Real Estate Services, in Stuttgart, ist ein Partnerunternehmen von Müller International. Haas & Halverscheidt Real Estate Services ist, wie sein Partner, ebenfalls Spezialmakler für Gewerbeimmobilien.

Haas & R Halverscheidt Real Estate Services setzt das Texterkennungsprogramm Textbridge bereits seit 4 Jahren ein. Hauptsächlich werden Zeitungsartikel, Zeitungsanzeigen, sowie auch Buchpassagen nach dem Scannen in Textdateien umgewandelt. Die Zeitungsanzeigen liefern wichtige Informationen zum aktuellen Markt, deshalb werden diese Informationen dann in einer Datenbank weiterverarbeitet, um so den Markt beobachten zu können.

Die Erkennungsgenauigkeit hängt von der Qualität der Vorlage entscheidend ab. Buchseiten und Magazinseiten werden recht gut erkannt. Probleme gibt es bei Zeitungsanzeigen, da sie auf relativ dünnem Papier vorliegen, was zur Folge hat, daß die Rückseite durchschimmert.

Erstaunlich war die Aussage von Haas & Halverscheidt Real Estate Services, daß sie nur 200 dpi - Auflösung verwenden, um ihre Vorlagen zu scannen.

Als sehr positiv wird empfunden, daß das Programm „lernfähig“ ist, d. h. neue Wörter in einem Trainingsmodus lernt und diese anschließend erkennt. Auch die verschiedenen Fremdsprachen haben Haas & Halverscheidt überzeugt.

4.2 Potentielle Einsatzgebiete in der Wohnungswirtschaft

Auch in der Wohnungswirtschaft ist der Einsatz von OCR Schrifterkennung sehr gut vorstellbar. Beispielsweise gibt es Wohnungsunternehmen die dezentrale Büros unter- halten oder externe Hausverwalter beschäftigen, welche entweder auf eine gemeinsame zentrale Datenbank zugreifen oder miteinander vernetzt sind. Bei diesen trifft man häu- fig auf das Problem, daß die benötigten Originalunterlagen sich meist gerade dort befin- den, wo sie nicht gebraucht werden. Oder sich auf dem Postweg zwischen den einzelnen Büros befinden.

Eine einfache und effektive Lösung dieses Problems könnte sich wie folgt gestalten. Die Dokumente und Verträge könnten mit Hilfe eines Scanners eingelesen werden, und anschließend mit einer OCR Software in kleine und unkomplizierte Textdateien umge- wandelt werden.

Die Dateien befinden sich dann entweder in der zentralen Datenbank, auf die die Betroffenen schnell und jederzeit zugreifen könnten. Oder sie befinden sich auf den Lokalen Datenbanken die wiederum miteinander vernetzt sind, und so den Zugriff ermöglichen.

Auch die stetig verbesserten Archivierungssysteme könnten gerade für kleine und mittelständische Wohnungsunternehmen von zunehmender Bedeutung sein. Wie oft kommt es vor, daß Dokumente in Ordnern abgelegt wurden, und wenn man sie dann benötigt, sind die Dokumente nicht auffindbar. Mit einem elektronischen Archivierungssystem gestaltet sich die Suche nach den benötigten Daten recht einfach, am PC mit einer Hilfe Stichwortsuchfunktion. OCR Schrifterkennung ist eine erhebliche Erleichterung für die Archivierung bereits vorhandener Dokumente. Auch das aufwendige Ablegen (manuell) und wiederauffinden der Dokumente entfällt durch den Einsatz einer OCR Schrifterkennung und eines elektronischen Archivierungs- system.

5 Fazit

„Natürlich ist die OCR in ihren Möglichkeiten immer noch eingeschränkt, da sie bei weitem nicht die Fähigkeit des menschlichen Auges und die Erkennungsmöglichkeiten des Gehirns besitzt. So richtet sich die Erfolgsquote bei der Texterkennung nach der Qualität der Vorgabe. Nur wenn diese Vorlage gut lesbar vorliegt, also weder Schlieren noch Knicke noch Fehlfarben etc. enthält, kann der Text einwandfrei erkannt werden“ (Eisenkolb; Weickardt, 1997, S. 179)

„Selbst wenn die Größe der Schrift ausreicht und die Scanner - Auflösung passabel hoch eingestellt wurde, kann der Erfolg in Frage gestellt werden. Dann nämlich, wenn die Zeilen schief >>im Bild liegen <<“ (Hennings, S. 47).

Wie die verschiedenen Tests (die zum Teil doch sehr widersprüchlich waren) der letzten Zeit gezeigt haben, befinden sich die OCR Programme in einem ständigen Prozeß der Verbesserung. Dennoch ist nicht davon auszugehen, daß in naher Zukunft OCR Programme die Fähigkeiten des menschlichen Auges und die Erkennungsgenauigkeit des Gehirns erreichen werden.

Nichts desto trotz sind die bereits vorhandenen Programme eine wirkliche Errungenschaft für Unternehmen, die ihre Daten vollständig elektronisch archivieren wollen. Denn nicht nur die Erfassung des bereits vorhanden Datenbestandes (der meist nur in Papierform vorhanden ist) wird dadurch erheblich erleichtert. Sondern auch die Erweiterung der Datenbank gestaltet sich mit einem Scanner und einer anschließenden Texterkennung durch OCR wesentlich einfacher. Es wäre doch eine schöne Vorstellung, nicht mehr in den Keller laufen zu müssen, nur weil man ein Dokument benötigt, welches schon 2 Jahre alt ist.

Ich gehe davon aus, daß schon bald sehr viel mehr Immobilienunternehmen, speziell in der Wohnungswirtschaft, mit einem Scanner, einem OCR Schrifterkennungs Programm und auch mit Archivierungssystemen arbeiten werden. Die Gründe dafür sind die Effizienz und die Kostenersparnis durch den Einsatz dieser „neuen“ Technik.

Literatur- und Quellenverzeichnis:

Das moderne Lexikon: Blindenschrift, S. 87 f. + S. 189.

Eisenkolb, K.; Weickardt, H.: Perfekt scannen ganz einfach, 1. Auflage, Paderborn 1995.

Eisenkolb, K.; Weickardt, H.: PC Praxis Buch Scannen, 2. Auflage, Zutphen (Niederlande) 1997.

Faass, H.; Michl, M.: Grenzen der Texterkennung, in: CHIP 10/1999, S. 198 - 202. Fabian, D.: Das große Scannerbuch, 1. Auflage, Paderborn 1994. Hennings, H.: Scannen:; Technik und Praxis, München 1994. Heyer, J.: Recognita Plus 5.0: Fremdsprachentalent, in PC Professionell 3/2000, S. 102.

Kraus, H.: Scannen mit Desktop - Scannern zum perfekten Bild, Bonn, Paris 1996. Limper, W.: OCR und Archivierung, 1. Auflage, München 1993.

o. V.: Texterkennung: Exaktere Erkennung, in: PC Professionell 2/2000, S. 44.

o. V.: Vom Scanner zum richtigen Text, in: PCgo 7/1998, S. 72.

Schimpf, C.-A.; Ullfors C.-M.: Informatik, EDV, Computertechnik, Gütersloh 1994.

Internetverzeichnis:

http://www.datascan.de vom 18.04.2000. http://www.flusoft.de vom 18.04.2000. http://www.ocr-system.de vom 05.04.2000. http://www.pcgo.de vom 19.04.2000. http://www.pronobis.at vom 18.04.2000.

[...]


1 Eine Ligatur ist das Zusammenrutschen von eng aufeinanderfolgenden Zeichen, z. B. aus „rn“ wird „m“ (vgl. Eisenkolb; Weickardt, 1997, S. 177).

2 SWR = Software Recogniton: Softwarebasierte Erkennung, d. h. es wird kein spezielles Prozessorboard benötigt

3 Braille Louis, ein französischer Blindenlehrer (war selbst blind), schuf 1829 die international gültige Form der Blindenschrift (vgl. Das moderne Lexikon, S. 189) Die Blindenschrift wurde von Braille auf 6 Punkte reduziert wurde, deren Stellung zueinander sich 63mal, verändern läßt (vgl. Das moderne Lexikon, S. 88).

17 von 17 Seiten

Details

Titel
Optical Character Recognition. Grundlagen, OCR-Programme und potentielle Einsatzgebiete in der Wohnungswirtschaft
Hochschule
Hochschule für Wirtschaft und Umwelt Nürtingen-Geislingen; Standort Nürtingen
Autor
Jahr
2000
Seiten
17
Katalognummer
V97120
Dateigröße
420 KB
Sprache
Deutsch
Schlagworte
optical, character, recognition, grundlagen, ocr-programme, einsatzgebiete, wohnungswirtschaft
Arbeit zitieren
Anja Rassmann (Autor), 2000, Optical Character Recognition. Grundlagen, OCR-Programme und potentielle Einsatzgebiete in der Wohnungswirtschaft, München, GRIN Verlag, https://www.grin.com/document/97120

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Optical Character Recognition. Grundlagen, OCR-Programme und potentielle Einsatzgebiete in der Wohnungswirtschaft


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden