close

Willkommen auf unserer digitalen Leseplattform – Bitte wählen Sie Ihre gewünschte Region aus

The Magazine
Management. Expertise. Inspiration.

Date: 07/03/2018

Title: Intelligente Texterkennung mit RPA

Teaser: Texterkennungstechnologien entwickeln sich rasant. Sie können somit auch immer gewinnbringender in Robotic Process Automation (RPA) eingebracht werden. Doch wie profitieren Finanzdienstleister davon? 

Button: Mehr lesen

Image:

Intelligente Texterkennung – das i-Tüpfelchen von Robotic Process Automation

Texterkennungstechnologien entwickeln sich rasant. Sie können somit auch immer gewinnbringender in Robotic Process Automation (RPA) eingebracht werden. Doch wie profitieren Finanzdienstleister davon? Neben einer ganzheitlichen RPA-Methodik lohnt sich die Analyse der Integrationsfähigkeit von Robotiklösungen verschiedener Anbieter.

Autoren: André H. Burger | Nenad Gataric


Die Einbindung von Daten in unstrukturierter oder physischer Form galt lange als nicht anwendbar in der Robotik. Softwarelösungen zur optischen Zeichen- und Texterkennung, OCR – Optical Character Recognition oder ICR – Intelligent Character Recognition, lösen diese Grenzen auf und ermöglichen durch intelligente Verknüpfung mit Robotik-Software eine enorme Steigerung des Automatisierungspotenzials. Voraussetzung dabei – die Auswahl einer geeigneten OCR Software, um eine optimale Kombination mit Robotik entlang der gesamten Wertschöpfungskette zu erzielen.

In Zusammenarbeit mit Kunden hat Synpulse bei Evaluationsprojekten OCR-Qualitätsmerkmale bestimmt und eine Übersicht zu potenziellen Anbietern erstellt. Diese ersetzt keine fallspezifische Evaluation, bietet jedoch eine Orientierung und hilft, die Auswahl der OCR-Software zu beschleunigen.

Neue Technologien ermöglichen über die Texterkennung hinaus, neben strukturierten, auch unstrukturierte Daten zu verwenden. Dies bildet die Grundlage für effiziente Prozessänderungen und eine wirksame digitale Strategie. Eine ganzheitliche Betrachtung ist dabei unerlässlich.

OCR erweitert mit RPA den Automatisierungsgrad

Robotik-Lösungen zur Automatisierung von Geschäftsprozessen nehmen bei Finanzinstituten eine immer wichtigere Rolle ein. Sie sorgen für eine Entlastung der Mitarbeiter im Kerngeschäft, minimieren Fehlerquellen und beschleunigen die Prozessabläufe. Mit RPA allein kann jedoch nicht komplett automatisiert werden, da die Technologie Informationen in digitaler Form benötigt. Daher wurden bei der Prozessauswahl in der Regel primär Prozesse berücksichtigt, bei denen die Daten in strukturierter und vor allem in digitaler Form vorliegen. Jedoch sind bei Banken und Versicherungen zahlreiche Prozesse noch dokumentenbasiert. Die Dokumente liegen also als Druck in Papierform oder eingescannt vor. Dies erfordert im Robotik-Kontext weiterhin eine manuelle Eingabe durch die Mitarbeiter und ist sehr zeitintensiv. Medienbrüche waren bislang nicht zu vermeiden. Des Weiteren ist der Eingang von unstrukturierten Daten, zum Beispiel ein formloser Kundenauftrag per E-Mail, häufiger Bestandteil eines Geschäftsprozesses. Moderne OCR-Softwarelösungen ermöglichen es an dieser Stelle, Eingabedaten zu digitalisieren und anhand des erkannten Textes auf einen Sachverhalt zu schließen. Somit können die gewonnenen Informationen dem Roboter direkt zur Verfügung gestellt und der Prozess signifikant beschleunigt werden.

Digitalisierung der Eingabedaten

Damit Informationen aus papierbasierten Dokumenten durch den Roboter genutzt werden können, ist es nicht ausreichend, diese einfach einzuscannen. Das Dokument liegt zwar digital vor, ist jedoch nur eine Bildkopie, die sogenannte Rastergrafik eines Dokuments. Durch die Anwendung von OCR-Technologie werden diese Rasterdokumente in lesbare Dateiformate umgewandelt und können wiederverwendet werden, z. B. zur:

  • Erkennung relevanter Merkmale/Inhalte wie die Kundennummer, die Postleitzahl etc.
  • Umwandlung der Rastergrafik in diverse Dateiformate
  • Erkennung von Merkmalen zur vertieften Datenanalyse
  • Layouterkennung und Dateiarchivierung
  • Volltextsuche innerhalb des Dokuments

Somit umfassen moderne OCR-Technologien mehr als nur die reine Texterkennung. Vielmehr werden Methoden der Kontextanalyse, Intelligent Character Recognition (ICR), mit einbezogen, welche die ORC-Ergebnisse korrigieren. Dabei erfolgt ein Abgleich von «gelesenen» Wörtern mit einem Wörterbuch, wodurch die Erkennungsgenauigkeit verbessert wird. Unterstützt durch den Einsatz von künstlicher Intelligenz können die erkannten Merkmale korrekt in einen Sachverhalt eingegliedert werden. Je nach Kontext werden die Daten anschließend im Prozess richtig kanalisiert.

OCR und RPA in Kombination

Eine optimale Kombination von OCR- und RPA-Technologie ermöglicht es in bestimmten Anwendungsfällen entlang der gesamten Wertschöpfungskette, von Front End bis Back End, Prozesse vollständig zu automatisieren. Im Rahmen von Robotik-Projekten hat Synpulse OCR-Technologie genutzt, um Informationen aus papierbasierten Formularen zur Kontoeröffnung zu strukturieren und klassifizieren. Auf Grundlage der gewonnenen Erkenntnisse wurde der entsprechende Roboterprozess gestartet. Im weiteren Verlauf des Workflows wurde OCR genutzt, um Daten aus anderen Druckerzeugnissen auszulesen und durch Umformung dem Roboter wieder bereitzustellen.

Welche OCR-Softwarelösung sich aber in Kombination mit Robitic Process Automation langfristig etablieren wird, hängt maßgeblich davon ab, welcher Anbieter es schafft, Weiterentwicklungen von OCR zuverlässig zu integrieren. Dies ist notwendig, um auch handschriftliche Formen oder unstrukturierte Daten verschiedener Eingangskanäle verarbeiten zu können. Die Weiterentwicklung von OCR-Lösungen zur Erkennung von Fließhandschriften, IWR – Intelligent Word Recognition, ist derzeit noch nicht vollständig ausgereift. Um unstrukturierte Daten in einem Gesamtkonzept zuverlässig einordnen zu können, wird der Einsatz von Machine Learning entscheidend sein.

Einflussfaktoren auf die OCR-Qualität

Die Qualität der automatisierten Texterkennung aus Rastergrafiken wird vor allem anhand von zwei Faktoren bestimmt: der Qualität der physischen Dokumente/Eingabegeräte und der Qualität der OCR-Softwarelösung. Diese beide Faktoren haben einen starken Einfluss auf die Transformation der Rastergrafiken in lesbare Dateien und damit auf die Output-Qualität physischer Dokumente.

Die Qualität der physischen Dokumente beziehungsweise der vorhandenen Eingabegeräte hängt nicht direkt mit der OCRSoftware zusammen und kann nur teilweise beeinflusst werden. Dazu gehören folgende Eigenschaften des Originaldokuments: Farben, Kontraste, Layout und Schriftart. Weiterhin sind die Qualität und Auflösungsfähigkeit des Scangeräts oder der Kamera entscheidend, da diese wiederum die Qualität der Rasterdatei bestimmen.

Qualität von OCR-Software

Im Zuge des Evaluationsprojekts wurden acht Bewertungsmerkmale definiert, um die Qualität von OCR-Softwarelösungen zu bestimmen:

  • Qualität der Layouterkennung
  • Umfang und Qualität der Wörterbücher Qualität der Algorithmen zur Fehlerkorrektur
  • Transformationsgeschwindigkeit
  • Automatisierte Korrektur der OCR-Ergebnisse mittels ICR
  • Reifegrad von Selbstlernmechanismen
  • Benutzerfreundlichkeit/Entwicklerfreundlichkeit
  • Umfang und Qualität der Muster-Datenbank
  • Integrierbarkeit in Robotik-Lösungen

Neben dieser technischen Betrachtung ist weiterhin der Kostenaspekt entscheidend. OCR-Anbieter unterscheiden sich im Lizensierungsmodell und -umfang und bei den Kosten pro Lizenz. Dabei beinhalten Lizenzmodelle einiger Anbieter eine Beschränkung nach Seitenanzahl je Monat. Weiterhin unterscheidet sich die Benutzerfreundlichkeit an der Anwendung des bereitgestellten Programmier-Werkzeugs (SDK-Software Development Kits) der Softwareanbieter.

Potenzielle OCR-Softwareprodukte

Auf dem Markt ist eine Vielzahl an OCR-Softwarelösungen vorhanden. Basierend auf den Erfahrungen von Synpulse wurden drei Anbieter für einen spezifischen Anwendungsfall untersucht und getestet. Mit «ABBYY FineReader Corporate Version 14.0» wurde ein Software-Produkt identifiziert, dass besonders geeignet ist für den Einsatz bei Finanzdienstleistern, da es sich sehr gut in die Robotik-Lösungen integriert. Die Lösungen «Readiris Corporate Version 14.0», «OmniPage Ultimate» konnten als sehr hochwertige Lösungen identifiziert werden.

ABBYY ist besonders für den Einsatz zur Verarbeitung hoher Stückzahlen geeignet und konnte durch eine hohe Transformationsqualität in lesbare Dateien überzeugen. Somit ist es sehr geeignet für die Verknüpfung mit weiteren Data-Analytics-Prozessen oder für die Nutzung zur Klassifikation von Dokumenten. Zudem integriert sich ABBYY hervorragend in RPA-Anwendungen.

Readiris verfügt über eine tiefe bis mittlere Transformationsqualität in lesbare Dateien. Dadurch ist diese Lösung nur teilweise geeignet für weitere Data-Analytics-Prozesse oder Kontextanalysen zum Starten von Roboterprozessen.

OmniPage verfügt über eine mittlere Transformationsqualität, wobei Inhalte und Struktur teilweise automatisch angepasst werden. Dennoch ist es ebenfalls nur eingeschränkt für die Verknüpfung mit Data-Analytics-Prozessen geeignet.

Der Lösungsmarkt und damit die Integrationsmöglichkeiten von OCR-Software sind sehr komplex. Insgesamt sind über 100 Lösungen im professionellen Bereich einsetzbar.

Je nach Anwendungsgebiet und Umfang eignen sich andere Lösungen. Der «TextReader» von A2IA ist beispielsweise besonders geeignet für die Erkennung und Transformation von handschriftlicher Schrift und konnte in einem anderen Anwendungsfall überzeugen.

Zielbild: Kognitive Prozessautomatisierung

OCR-Software ermöglicht die Ausschöpfung enormer Automatisierungspotenziale. Durch die neuen Technologien können Daten sämtlicher Eingangskanäle in maschinenlesbare Formate bereitgestellt werden. Weiterhin ermöglichen es Softwarelösungen von Squirro, Cogito und Celaton unter Einsatz von Machine Learning und Natural Language Processing, besonders große und komplexe Datenmengen zu analysieren, zu strukturieren und weiterzuverarbeiten. In Verbindung mit diesen Fortschritten formt sich in der Robotik-Anwendung das Zielbild einer kognitiven Prozessautomatisierung.

Ganzheitliche RPA-Methodik ist erforderlich

Um das Zielbild einer kognitiven Prozessautomatisierung umzusetzen, müssen für den spezifischen Anwendungsfall eine prozessuale und digitale Strategie definiert werden. Dies bedingt eine intelligente Verknüpfung von RPA-Technologieexpertise mit Business Know-how. Das Synpulse RPA-Haus ( Abb.1) wurde entwickelt, um eine gesamtheitliche RPA-Methodik abzuleiten. Folgende Faktoren sind besonders relevant:

  • Festlegung der strategischen Anwendungsbereiche
  • Identifikation und Analyse von Geschäftsprozessen und Informationsflüssen
  • Definition des Digital Operation Model (RPA-Software, OCR-Technologie, Technologie Plattform sowie IT-Architektur)
  • Ganzheitliche Planung und Umsetzung der Transformation
graphic graphic

Synpulse hat einen Marktradar der besten Lösungen erarbeitet und aktualisiert diesen laufend. Diese Übersicht über Softwareprodukte soll Anwendern eine valide Guidance bei der Evaluation der geeigneten Lösung für Robotic Process Automation, Optical Character Recognition und der Implementierung an die Hand geben.

Kontakt

graphic

André Burger

Cookies helfen uns bei der Bereitstellung unserer Dienste. Durch die Nutzung unserer Dienste erklären Sie sich damit einverstanden, dass wir Cookies setzen. Mehr erfahren.
OK