WO1997036250A1

WO1997036250A1 - Verfahren zur datenkonvertierung

Info

Publication number: WO1997036250A1
Application number: PCT/EP1997/001442
Authority: WO
Inventors: Rolf Wadewitz
Original assignee: Rolf Wadewitz
Priority date: 1996-03-25
Filing date: 1997-03-21
Publication date: 1997-10-02
Also published as: EP0890154A1

Abstract

Es wird ein Verfahren zur Konvertierung von Daten zwischen zwei Anwendungen bzw. Softwarepaketen vorgeschlagen, die zueinander unterschiedliche Datenformate benutzen. Als ein Grundproblem der heutigen Datenverarbeitung ist dabei das Zusammenführen und der Austausch von Datenquellen verschiedener Softwarepakete erkannt worden. Für eine intelligente Konvertierungssoftware werden in erster Linie Datenstrukturen von Datenbanken und Datenverarbeitungsanlagen betrachtet. Ausgehend von dem ersten Erkennen einer Grobstruktur wird die Dateiform in Konvertierungstools vorklassifiziert. Die Konvertierungssoftware stellt einen Satz von Algorithmen zur Verfügung, wodurch automatisch die Feinstruktur erkannt und umgewandelt wird. Die Analyse von Vorlagefiles der Anwendungen A und B wird bis in die Substrukturen fortgeführt, wobei letztendlich die Quelldaten mit Hilfe der Analyse in die Zieldaten konvertiert werden, welche von der Anwendung B importiert werden.

Description

Beschreibung

Verfahren zur Datenkonvertierung

Die Erfindung betrifft ein Verfahren zum Konvertieren von Daten zwischen zwei Anwendungen beziehungsweise Softwarepaketen, die unterschiedliche Datenformate benutzen, nach dem Oberbegriff des Patentanspruches 1.

Der Erfindung liegt das grundsätzliche Problem der Inkompatibi- lität von Daten aus verschiedenen Anwendungen bzw. Softwarepa¬ keten zugrunde. Viele Programme besitzen ein eigenes Datenfor¬ mat für die interne Verarbeitung der Daten. Dieses ist aber nur selten von anderen Programmen zur Weiterverarbeitung einlesbar. Der Anwender steht vor dem Problem, beliebige Daten von Anwen¬ dung A nach Anwendung B zu transportieren, wobei ihm im allge¬ meinen die Datenformate der Anwendungen A und B nicht bekannt sind. Bei den zu transportierenden Daten handelt es sich meist um Datenbanken, es können aber auch im weitesten Sinne Anwen¬ dungsdaten auftreten, wie zum Beispiel Textdateien, CAD-Daten, Sound-Formate, Kalkulationsprogramme und andere.

Um den vorstehend beschriebenen Datentransfer realisieren zu können, bieten moderne und flexible Programme die Möglichkeit, Daten der gängigsten Formate einzulesen und in ihrem eigenen Format weiterzuverarbeiten. Um einen Austausch zwischen ver¬ schiedenen Anwendungen, beispielsweise auch von anderen Be¬ triebssystemen, zu ermöglichen, ist bei einigen Softwarepaketen eine Im- und Exportfunktion im ASCII-Format oder einem anderen gängigen Format vorgesehen. Darüberhinaus gibt es viele Hilfsprogramme, die Datenkonvertie¬ rungen von einem Format A nach einem Format B erlauben. Diese haben einen fest vorgegebenen Konvertierungsalgorithmus imple¬ mentiert, welcher der jeweiligen Anwendung entspricht. Der An- wender kann nun wählen, zwischen welchen Datenformaten A und B das Programm eine Konvertierung durchführen soll. Diese Hilfs¬ programme können teilweise die Art der Datei bzw. die Art der Anwendung A automatisch anhand von einfachen spezifischen Merk¬ malen bei der Dateiform, wie zum Beispiel der Dateiform und fe- sten Infostrukturen und Versionskennungen innerhalb der Datei, erkennen.

Ein spezielles Verfahren zur Datenkonvertierung ist bereits aus der DE 4128 940 AI bekannt. Mit Hilfe dieses Verfahrens werden druckaufbereitete digitale Daten eines mit einer Text- und/oder Graphik-Software am Bildschirm einer Datenverarbeitungsanlage erstellten Dokumentes in faksimilespezifische Übertragungsdaten konvertiert. Dieses Verfahren ersetzt die umständliche, zeit¬ aufwendige und fehlerbehaftete Methode, ein am Bildschirm einer Datenverarbeitungsanlage erstelltes Dokument an einem an der Datenverarbeitungsanlage angeschlossenen Drucker auszudrucken und anschließend das auf Papier gedruckte Dokument durch eine optoelektronische Einheit eines Faksimilegerätes abzutasten. Die Abtastdaten der optoelektronischen Einheit werden dann fak- similespezifisch codiert und übertragen.

Sowohl die in den Anwendungen integrierten Konvertierungspro¬ gramme als auch die eigenständigen Hilfsprogramme zur Datenkon¬ vertierung haben beide den Nachteil, daß nur eine begrenzte Auswahl an Datenformaten zur Verfügung gestellt wird, die mit den festen Algorithmen des Programmes konvertiert werden kön¬ nen. Diese Konvertierungen berücksichtigen in der Regel nicht die Elementinhalte und deren Verknüpfungen, wie beispielsweise Zeicheninhalt und Zeichenlänge, sprachliche Aspekte, Existenz- regeln, Elementumformungen, Sprachraum, Elementmuster und Ele¬ mentinterpretation. Außerdem sind die meisten Datenformate nicht sehr gut standardisiert, und viele Anwendungen bringen ihre eigenen Datenstrukturen ein. Die Datenelemente sind für die Quellanwendung optimiert und können bei der Zielanwendung Fehler bei der Verarbeitung verursachen, die aufwendig vom An- wender von Hand korrigiert werden müssen oder sogar eine Wei¬ terverarbeitung der Daten unmöglich machen.

Es ist Aufgabe der Erfindung, dem Anwender ein Verfahren zur Datenkonvertierung zur Verfügung zu stellen, das eine flexible Datenangleichung von verschiedenen Anwendungsprogrammen mit relativ einfachen Mitteln ermöglicht.

Diese Aufgabe ist erfindungsgemäß durch die Merkmale des Pa¬ tentanspruchs 1 gelöst.

Erfinderische Weiterbildungen und Ausgestaltungen der Erfindung sind in den Unteransprüchen beschrieben.

Die erfindungsgemäße Konvertierungssoftware ist dabei in der Lage, Daten eines beliebigen Formates A in Daten eines beliebi¬ gen Formates B halb- und auch vollautomatisch zu transferieren, wobei im Prinzip keine Einschränkung bezüglich der möglichen Datenformate auftritt. Da die Datenformate A und B von der er¬ findungsgemäßen Konvertierungssoftware über die Grobstruktur der Daten hinaus sowohl halb- als auch vollautomatisch in deren Feinstruktur analysiert werden, ist die mögliche Fehlerquote beim Datentransfer von Anwendung A nach Anwendung B deutlich geringer als bei den üblichen Hilfsprogrammen. Zusätzlich sind Datenveränderungen und Datenanpassungen in diversen Ebenen, beispielsweise in der Datei-, Satz-, Elementebene und weitere, vorgesehen, um die Fehlerquote bei der Zielanwendung zu verrin¬ gern.

Der Aufbau des erfindungsgemäßen Verfahrens zur Datenkonver- tierung ist in der Zeichnung dargestellt und nacchstehend er¬ läutert. Darin zeigen: Fig. l das Informationsablaufdiagramm des Verfahrens zum Datentransfer;

Fig. 2 ein Diagramm zur Strukturanalyse des Verfahrens mit detailliertem Strukturaufbau; Fig. 3 den Syntheseverlauf des Verfahrens für die Bil¬ dung der Daten B aus den Daten A;

Fig. 4 das Informationsablaufdiagramm gemäß Figur l in detaillierterer Darstellung.

Die Figur 1 zeigt in Form eines Informationsablaufdiagrammes den Ablauf eines Datentransfers mit Hilfe des erfindungsgemäßen Verfahrens bzw. der erfindungsgemäßen Konvertierungssoftware (1) . Ein Anwender möchte beliebige Quelldaten Q (2) , die von der Anwendung A (3) erzeugt und exportiert werden, zur Anwen- düng B (4) transportieren, um sie dort weiterzuverarbeiten. Jede der Anwendungen A (3) und B (4) kann ihre Daten in einem für sie selbst verständlichen Format im- und exportieren; dies ist in den Anwendung (3) und (4) implementiert, um Daten zwi¬ schen Anwendungen der gleichen Art auf verschiedenen Arbeits- platzen auszutauschen.

Der Anwender kann nun jeweils einen Probeexport von beispiels¬ weise etwa 500 Datensätzen aus dem Datenbestand der Anwendung A (3) und dem der Anwendung B (4) erzeugen. So entstehen das Vorlagefile VA (5) aus Anwendung A (3) und Vorlagefile VB (6) aus Anwendung B (4) . Voraussetzung für das Funktionieren des Verfahrens zur Datenkonvertierung ist dabei, daß die Anwendung B (4) ihr eigenes, von ihr erzeugtes, exporttiertes Vorlagefile VB (6) wieder importieren kann, was aber selbstverständlich funktionieren sollte. Jetzt können die Vorlagefiles VA (5) und VB (6) mittels der Konvertierungssoftware (1) analysiert werden (7) .

Es wäre grundsätzlich auch ein Datenaustausch von Anwendung A (3) zu Anwendung B (4) direkt möglich ohne den Weg über die

Datei (zum Beispiel OLE, DDE und weitere) zu gehen. Hier wird dann also der Umweg über die Dateien gespart, während die Ana¬ lyse- und Verknüpfungsprozesse natürlich wirksam bleiben sind.

Da der Anwender im allgemeinen nichts über den Aufbau der Da- tenstrukturen und über die Datenstrukturen der Anwendungen A (3) und B (4) weiß, und darüber auch nichts wissen möchte, sind für die Analyse komplexe Algorithmen erforderlich, um den An¬ wender möglichst von Entscheidungen zu entlasten und den Analy¬ se- und Verknüpfungsprozeß (8) zu automatisieren oder zumindest zum Teil zu automatisieren. Die implementierten Algorithmen können problemlos erweitert werden, um auch neue, in Zukunft auftretende Datenstrukturen analysieren zu können. Der Umfang der Analyse (8) der Strukturen wird weiter unten anhand von Fi¬ gur 2 näher erläutert. Nach dem Analyse- und Verknüpfungsprozeß (8) kennt die Konvertierungssoftware (1) die Datenstruktur der Vorlagefiles VA (5) und VB (6) und auch die notwendigen Ver¬ knüpfungen zwischen den Elementen der Vorlagefiles VA (5) und VB (6) . Dieses Konvertierungsmuster für die Übertragung der Daten von Anwendung A (3) nach Anwendung B (4) wird als Muster- ablaufdatei M abgespeichert.

Will der Anwender zu einem späteren Zeitpunkt weitere Daten¬ transfers zwischen denselben Anwendungen A (3) und B (4) wie oben erläutert durchführen, so ist es möglich, das eben erτrtit- telte Konvertierungsmuster in Form von Musterablaufdaten M (9) abzuspeichern (10) . Somit erübrigt sich für den Anwender beim nächsten Konvertierungsprozeß die Erzeugung der Vorlagefiles VA (5) und VB (6) , und die KonvertierungsSoftware (1) kann beim Datentransfer ohne Analyseprozeß (8) direkt auf die gesicherten Musterablaufdaten M (9) zurückgreifen und die Musterablaufdaten M (9) wieder einlesen (10) .

Wie dazu insbesondere Figur 4 in Ergänzung zu Figur l zeigt, unterteilt sich die Analysephase sowohl des Vorlagefiles VA (5) als auch des Vorlagefiles VB (6) in eine Grobanalyse, eine fol¬ gende Feinanalyse, eine weitere folgende Subanalyse und so wei- ter, um schließlich im Ergebnis zur Endanalyse zu gelangen. An die Analysephase schließt sich dann die Verknüpfungsphase an, in welcher die Analysen der Vorlagefiles verknüpft werden.

In der Synthesephase (11) wird mit Hilfe des ermittelten Analy¬ se- und Verknüpfungsergebnisses eine Konvertierung der Quellda¬ ten Q (2) in die Zieldaten Z (12) erreicht. Im letzten Schritt kann die Anwendung B (4) die Zieldaten Z (12) importieren, da sie in dem von der Anwendung B (4) im- und exportierbaren Da- tenformat vorliegen, und weiterverarbeiten.

Bei diesem erfindungsgemäßen Verfahren zur Datenkonvertierung ist es für den Benutzer zudem möglich, durch Verwendung von vom Benutzer definierten Sonderregeln bei der Synthese (11) der Quelldaten Q (2) in die Zieldaten Z (12) Datenveränderungen vorzunehmen. Als Beispiele, und keineswegs vollständig aufge¬ zählt, seien hier nur der Ersatz von ä, ö, ü durch ae, oe ue und die Umbildung der Elemente [Sehr geehrter] und [Herr xyz] in die Elemente [Sehr geehrter Herr] und [xyz] genannt. Es sind hierbei natürlich auch sehr komplexe Datenveränderungen mög¬ lich, die am besten mit dem Begriff des "Morphing" aus der Bildverarbeitung verglichen werden können, der die Wandlung von einem Muster A nach Muster B ohne Informationsverluste be¬ schreibt.

Wie Figur 1 zeigt, wird die zu exportierende Quelldatei (28) der Anwendung A (3) in die Quellanalyse (29) gegeben. Nach er¬ folgter Analyse für automatische Regelbildung und Verknüpfungen im Block (8) wird die Zielanalyse (11) erstellt. Die konver- tierten Daten werden sodann in die importierbare Zieldatei (30) gegeben. Bei dem Vorgang des Exportierens der Quelldatei (28) in die Zieldatei (11) mittels der Musterablaufdaten M ist eine Quell- oder Zielanalyse nicht mehr erforderlich. Auch die Re¬ gelbildung und die Verknüpfungen wurden in diesem Fall bereits mit den Vorlagefiles VA (5) und VB (6) erzeugt. Bei der Synthe¬ se wird die Quelldatei Q (2) gelesen und mit dem Datenfilter aus den Musterablaufdaten M bearbeitet. Die generierten Daten¬ sätze werden in die Zieldatei geschrieben. Das Datenfilter kann sich externer Dateien zum Abgleich wie auch interner Dateien zum Suchen und Sortieren bedienen.

In Figur 2 ist ein Diagramm dargestellt, welches den Struktur¬ aufbau einer allgemeinen Datentransferdatei in detaillierter Form zeigt. Die Analyse (8) der Vorlagefiles VA (5) und VB (6) unterteilt sich in mehrere Phasen. Ausgehend von dem ersten Er- kennen der Grobstruktur (13) wird die Dateiform wie bei bisher bekannten Konvertierungsprogrammen zunächst vorklassifiziert. Die intelligente Konvertierungssoftware stellt nun zusätzlich einen Satz von Algorithmen zur Verfügung, der in der Lage ist, automatisch die Feinstruktur (14) der vorliegenden Daten zu er- kennen. Die Analyse (8) wird fortgeführt, um auch die Substruk- turen (15) innerhalb der Datenelemente (17) zu erkennen.

Wie auch gut erkennbar aus Figur 3 hervorgeht, dient die Grob¬ struktur (13) dem Erkennen der Filestruktur, der Trennzeichen, der ElementbeZeichner, der Zeichenlänge usw. im Dateiraum und im Satzraum (16) . In der Grobstruktur (13) werden Dateien nach ihrer Dateiform unterschieden. Die Unterschiede sind zum Bei¬ spiel anhand von Dateiendungen oder Infostrukturen innerhalb der gesamten Datei zu erkennen.

Die Feinstruktur (14) dient dem Erkennen von Elementexistenz, Element-Zeicheninhalten, Elementzeichenlänge usw. wie Elemen¬ traum (19) und Zeichenraum (20) . Die Feinstruktur (14) bezieht sich auf die Satzebene, die den Aufbau eines einzelnen Daten- satzes im sogenannten Satzraum (16) aus den Elementen (17) , sowie die Verknüpfungen der Satzelemente (17) untereinander, den sogenannten Satzregelraum (18) beinhaltet. Bei der Merk- malsfindung für den Datensatzaufbau und die Datensatzstruktur werden beispielsweise Feldnamen in einem Datensatz (16) analy- siert, die Verwendung spezieller Trennsymbole für Elemente (17) und Datensätze (16) , die Verwendung von Start- und Stopsymbolen für die Strukturierung- innerhalb der Elemente (17) und die An¬ zahl der Elemente (17) pro Datensatz (16) ermittelt.

Die SubStruktur (15) dient dem Erkennen von Worten und Subele- menten mit Sub-Trennern in den einzelnen Elementen, wie Elemen¬ traum (19) , Zeichenraum, Wortraum. Die SubStruktur unterglie¬ dert sich also nochmals in die Elementebene, dem Elementraum (19) , und die Zeichenebene, dem Zeichenraum mit Zahlenraum (20) . In der Elementebene (19) werden die Existenzmerkmale für ein Element (17) festgelegt.

Als Existenzmerkmale treten zum Beispiel auf: minimale und maximale Datenelement-Zeichenlänge, Datenelement-Existenzvor¬ gaben (muß, kann, darf) , zulässige und vorkommende Zeichen in einem Datenelement (17) , verwendeter Sprachraum, begrenzte Li¬ stenstrukturen innerhalb von Datenelementen (17) , Wortanalysen, etc.. Die Zeichenebene (20) gibt die möglichen Auswahlräume für Zahlen, Buchstaben, Sonderzeichen, OEM-Zeichen und andere vor.

So kann zum Beispiel das Element "Arb.Zeit" einen

1. Satz: "Meier/Müller/Graf/Kemper", einen

2. Satz: "8h /7H /9h /8h" und einen

3. Satz: "5H /9h /11h /7h enthalten.

Demzufolge gibt es in dem Element "Arb.Zeit" offenbar Substruk- turen, die durch das Zeichen "/" getrennt sind. Solche und ähn¬ liche SubStrukturen werden erkannt und bei der Analyse wie zu¬ sätzliche Elemente mit Bezeichner, nämlich Meier, Müller, Graf, Kemper, und entsprechenden Inhalten behandelt.

Wie oben an anderer Stelle bereits ausgeführt, enhält das Ele¬ ment "Anrede" mehrere Wörter:

1. Satz: "Sehr geehrter Herr",

2. Satz: "Sehr geehrte Frau", ~ 3. Satz: "Hallo, Herr" und

4. Satz: "Sehr geehrter Herr Dipl.-Ing". Diese SubStrukturen werden als Wörter in Wortlisten übernommen und gegebenenfalls einzeln weiter nach zusätzlichen Mustern und Regeln analysiert.

Zur Verdeutlichung dient ein weiteres Beispiel. Das Element "Strasse" enthält die Muster

1. Satz "Hofweg 13",

2. Satz "Am langen Kant 77" und

3. Satz "Bremer Strasse 19".

Diese SubStrukturen (15) werden als Worte analysiert und nach Mustern untersucht. Es können so zum Beispiel Strassenname und Hausnummer gesplittet werden.

Von großer Wichtigkeit ist es, daß sich die SubStrukturen (15) auf Objekte in einer Ebene unter den Satzelementen beziehen. Hier werden die Elementinhalte nach weiteren Mustern abgesucht.

Bei der Musterstruktur werden mit den vorgenannten Analyse- Ergebnissen die Muster- und Verknüpfungsanalysen durchgeführt

(Satzraum (16) , Satzregelraum, Elementraum (19) , Wortraum) .

Dabei werden übergreifende Muster und Regeln mittels fester

Algorithmen und neuronaler sowie Fuzzy-Algorithmen bestimmt.

Um die Mustererkennung bei der sprachlichen Analyse (8) von Feinstruktur (14) und Substruktur (15) möglichst automatisch ablaufen lassen zu können, ist bei den Algorithmen die Verwen¬ dung moderner Techniken, wie neuronale Netze und Fuzzy-Logik neben festen Algorithmen, erforderlich. Läßt man solche Ansätze weg, so muß der Anwender eventuell einzelne Verknüpfungen von Hand durchführen.

Die Figur 3 zeigt in Diagrammform nun den Syntheseverlauf (11) für die Bildung der Datenelemente (21) für die Anwendung B (4) " aus den Datenelementen (22) der Anwendung A (3) . Aus der oben beschriebenen Analyse (8) der Vorlagefiles VA (5) und VB (6) ergibt sich ein Datenfilter (23) , der die zuvor ermittelten Verknüpfungsregeln (24) zwischen den Datenelementen (21) und (22) enthält. Schickt man die Datensätze (25) aus der Anwendung A (3) durch diesen Datenfilter (23) , so erhält man neue Daten- sätze (26) mit neuen Datenelementen (21) , die in einem von der Anwendung B (4) im- und exportierbaren Datenformat vorliegen. Die Anzahl der Datenelemente (22) der Datensätze (25) aus der Anwendung A (3) ist nicht unbedingt gleich der Anzahl der Da¬ tenelemente (21) der Datensätze (26) für die Anwendung B (4) , die Anzahl der Datensätze (25) und (26) ist im allgemeinen für beide Anwendungen A (3) und B (4) gleich.

Zusätzlich zu dem aus der Analyse (8) der Vorlagefiles VA (5) und VB (6) entstandenen Datenfilter (23) für den Datentransfer von Anwendung A' (3) nach Anwendung B (4) ist auch ein Abgleich der Datenelemente (21) und (22) mit einer externen Datenbank oder mehreren externen Datenbanken (27) möglich, beispielsweise auch die Mischung von mehreren Datenbanken, wie Kundendatei + Rechnungsdatei. Mit einem solchen externen Abgleich können zum Beispiel die Postleitzahlen der Datensätze (25) und (26) kon¬ trolliert werden, indem man die Datenelemente (21) und (22) von Land, Stadt, Straße und Postleitzahl mit denen der externen Da¬ tenbank (27) vergleicht.

Zusätzlich ist das Anlegen einer oder mehrerer interner Zwi¬ schendatenbanken zum Suchen und Sortieren auf Dateiebene mög¬ lich. Dies ist erforderlich, um ein schnelles Suchen und Sor¬ tieren, beispielsweise nach dem Alphabet oder speziellen Merk¬ malen, zu ermöglichen.

Bezugszeichenliste

1 Konvertierungssoftware bzw. Verfahren

2 Quelldaten Q

3 Anwendung A

4 Anwendung B 5 Vorlagefile VA

6 Vorlagefile VB

7 Eingang Analysevorlagen

8 Analyse, Analyseprozeß

9 Musterablaufdaten M 10 Speichern der Musterablaufdaten

11 Synthese, Synthesephase

12 Zieldaten Z

13 Grobstruktur

14 Feinstruktur 15 SubStruktur

16 Datensatz

17 (Daten-) Element

18 Satzregelraum

19 Elementebene 20 Zeichenebene

21 Datenelemente

22 Datenelemente

23 Datenfilter

24 Verknüpfungen, Verknüpfungsregeln 25 Datensätze

26 Datensätze

27 externe Datenbank

28 Quelldatei

29 Quellanalyse 30 Zieldatei

Claims

Patentansprüche

l. Verfahren zur Konvertierung von Daten und nicht-dateibezo¬ genen Methoden zwischen zwei Anwendungen bzw. Softwarepaketen, die zueinander unterschiedliche Datenformate benutzen, dadurch gekennzeichnet, daß aus dem Datenbestand der ersten Anwendung A (3) und dem Da- tenbestand der.zweiten Anwendung B (4) jeweils ein Probe-Export von Datensätzen relativ geringer Menge erzeugt wird, aus denen ein Vorlagefile VA (5) aus Anwendung A (3) und ein Vorlagefile VB (6) aus Anwendung B (4) gebildet werden, von denen die An¬ wendung B (4) das von ihr erzeugte Vorlagefile VB (6) wieder importieren kann, daß die Vorlagesfiles VA (5) und VB (6) zur Ermittlung ihrer Datenstrukturen und gegebenenfalls zur Ermitt¬ lung der Verknüpfungen zwischen den Elementen durch eine Kon¬ vertierungssoftware (l) analysiert werden, und daß die Quell- daten Q (2) mit Hilfe der Analyseergebnisse in die Zieldaten Z (12) konvertiert werden, welche von der Anwendung B (4) impor¬ tiert werden.

2. Verfahren nach Anspruch l, dadurch gekennzeichnet, daß das Analyse-Ergebnis als Konvertierungsmuster für die Über¬ tragung der Daten des ersten Anwenders A (3) zum zweiten Anwen¬ der B (4) in Form von Musterablaufdaten M (9) abgespeichert wird.

^* 3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Quelldaten Q-(2) nach Durchlauf der Analyse (8) und Verknüpfung in eine Zielsynthese (11) gegeben werden, von der sie in die Zieldaten Z (12) konvertiert werden.

4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß die Analyse (8) der Vorlagefiles VA (5) und VB (6) in mehrere, insbesondere drei Phasen unterteilt ist, wobei nach dem Erkennen der Grobstruktur (13) die Dateiform zunächst vorklassifiziert wird, anschließend durch die Konvertierungs- Software ein Satz von Algorithmen zur automatischen Erkennung der Feinstruktur (14) zu Verfügung gestellt wird und schließ¬ lich in Fortführung der Analyse die SubStrukturen (15) inner¬ halb von Datenelementen (17) erkannt werden.

5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß in der Grobstruktur (13) die Dateien nach ihrer Dateiform unterschieden werden.

6. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß sich die Feinstruktur (14) auf die Satzebene bezieht, die den Aufbau eines Satzes (16) aus Elementen (17) und die Ver- knüpfungen der Satzelemente (17) untereinander beinhaltet.

7. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die Substruktur (15) sich in die Elementebene (19) und in die Zeichenebene (20) mit Zeichenraum und Zahlenraum unter¬ gliedert, wobei in der Elementebene (19) die Existenzmerkmale für ein Element (17) festgelegt werden.

8. Verfahren nach einem der vorgenannten Ansprüche, ^~ dadurch gekennzeichnet, daß bei den Algorithmen für die Mustererkennung der sprachli- chen und logischen Analyse (8) die Technologien der neuronalen Netze und/oder der Fuzzy-Logik eingesetzt werden.

9. Verfahren nach einem der vorgenannten Ansprüche, dadurch gekennzeichnet, daß aus der Analyse (8) der Vorlagefiles VA (5) und VB (6) ein Datenfilter (23) gebildet wird, der die Verknüfungsregeln (24) zwischen den Datenelementen (21,22) auf der Dateiebene oder zu¬ sammen mit einer oder mehreren externen Datenquellen (Abgleich) aufweist, wobei nach Durchlauf von Datensätzen (25) aus der An¬ wendung A (3) durch den Datenfilter (23) neue Datensätze (26) mit neuen Datenelementen (21) erhalten werden, die in einem von der Anwendung B (4) im- und exportierbaren Datenformat vor¬ liegen.

10. Verfahren nach einem der vorgenannten Ansprüche, dadurch gekennzeichnet, daß die Datenelemente (21,22) mit einer externen Datenbank (27) abgleichbar sind.

11. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß eine oder mehrere interne Zwischendatenbanken zur Suche und Sortierung von Datensätzen eingerichtet wird bzw. werden.

0

S