WO1997036250A1 - Verfahren zur datenkonvertierung - Google Patents

Verfahren zur datenkonvertierung Download PDF

Info

Publication number
WO1997036250A1
WO1997036250A1 PCT/EP1997/001442 EP9701442W WO9736250A1 WO 1997036250 A1 WO1997036250 A1 WO 1997036250A1 EP 9701442 W EP9701442 W EP 9701442W WO 9736250 A1 WO9736250 A1 WO 9736250A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
application
analysis
file
elements
Prior art date
Application number
PCT/EP1997/001442
Other languages
English (en)
French (fr)
Inventor
Rolf Wadewitz
Original Assignee
Rolf Wadewitz
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE19635351A external-priority patent/DE19635351C2/de
Application filed by Rolf Wadewitz filed Critical Rolf Wadewitz
Priority to EP97916371A priority Critical patent/EP0890154A1/de
Priority to US09/155,338 priority patent/US6249786B1/en
Publication of WO1997036250A1 publication Critical patent/WO1997036250A1/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Definitions

  • the invention relates to a method for converting data between two applications or software packages that use different data formats, according to the preamble of claim 1.
  • the invention is based on the fundamental problem of the incompatibility of data from different applications or software packages. Many programs have their own data format for the internal processing of the data. However, this is rarely readable by other programs for further processing. The user is faced with the problem of transporting any data from application A to application B, although the data formats of applications A and B are generally unknown to him.
  • the data to be transported are mostly databases, but application data can also occur in the broadest sense, such as text files, CAD data, sound formats, calculation programs and others.
  • a special method for data conversion is already known from DE 4128 940 AI. With the aid of this method, print-prepared digital data of a document created with text and / or graphics software on the screen of a data processing system are converted into facsimile-specific transmission data.
  • This method replaces the cumbersome, time-consuming and error-prone method of printing out a document created on the screen of a data processing system on a printer connected to the data processing system and then scanning the document printed on paper by an optoelectronic unit of a facsimile device. The scanning data of the optoelectronic unit are then coded and transmitted in a facsimile-specific manner.
  • the conversion software according to the invention is able to transfer data of any format A into data of any format B semi-automatically and also fully automatically, with in principle no restriction with regard to the possible data formats. Since the data formats A and B are analyzed semi-automatically and fully automatically in their fine structure by the conversion software according to the invention, in addition to the rough structure of the data, the possible error rate in the data transfer from application A to application B is significantly lower than in the usual auxiliary programs. In addition, data changes and data adjustments are provided in various levels, for example in the file, record, element level and others, in order to reduce the error rate in the target application.
  • FIG. 4 shows the information flow diagram according to FIG. 1 in a more detailed representation.
  • FIG. 1 shows in the form of an information flow diagram the sequence of a data transfer using the method according to the invention or the conversion software (1) according to the invention.
  • a user would like to transport any source data Q (2) generated and exported by application A (3) to application B (4) in order to process them there.
  • Each of the applications A (3) and B (4) can import and export their data in a format that they can understand; this is implemented in applications (3) and (4) in order to exchange data between applications of the same type at different workplaces.
  • the user can now generate a sample export of, for example, approximately 500 data records from the database of application A (3) and that of application B (4).
  • This creates template file VA (5) from application A (3) and template file VB (6) from application B (4).
  • a prerequisite for the functioning of the data conversion method is that application B (4) can import its own exported template file VB (6), which it has produced and exported, but this should of course work.
  • the template files VA (5) and VB (6) can be analyzed (7) using the conversion software (1).
  • the conversion software (1) knows the data structure of the template files VA (5) and VB (6) and also the necessary links between the elements of the template files VA (5) and VB (6). This conversion pattern for the transfer of the data from application A (3) to application B (4) is stored as a sample sequence file M.
  • the analysis phase of both the template file VA (5) and the template file VB (6) is subdivided into a rough analysis, a subsequent fine analysis, a further subsequent sub-analysis and so on. ter in order to finally arrive at the final analysis.
  • the analysis phase is then followed by the linking phase, in which the analyzes of the template files are linked.
  • a conversion of the source data Q (2) into the target data Z (12) is achieved with the aid of the determined analysis and linking result.
  • application B (4) can import the target data Z (12), since they are in the data format that can be imported and exported by application B (4), and process them further.
  • the source file (28) to be exported from application A (3) is placed in the source analysis (29).
  • the target analysis (11) is created.
  • the converted data are then placed in the importable target file (30).
  • a source or target analysis is no longer necessary.
  • the rule formation and the links were already generated with the template files VA (5) and VB (6).
  • the source file Q (2) is read and with the data filter processed from the pattern flow data M.
  • the data records generated are written to the target file.
  • the data filter can use external files for comparison as well as internal files for searching and sorting.
  • FIG. 2 shows a diagram which shows the structure of a general data transfer file in a detailed form.
  • the analysis (8) of the template files VA (5) and VB (6) is divided into several phases. On the basis of the first recognition of the rough structure (13), the file form is first pre-classified, as in the case of conversion programs known hitherto.
  • the intelligent conversion software now also provides a set of algorithms that are able to automatically recognize the fine structure (14) of the data at hand.
  • the analysis (8) is continued in order to also recognize the substructures (15) within the data elements (17).
  • the rough structure (13) serves to recognize the file structure, the separators, the element identifier, the character length, etc. in the file space and in the sentence space (16).
  • files are differentiated according to their file form. The differences can be recognized, for example, from file extensions or information structures within the entire file.
  • the fine structure (14) serves to recognize element existence, element character contents, element character length, etc., such as element dream (19) and drawing space (20).
  • the fine structure (14) relates to the sentence level, which contains the structure of a single data record in the so-called sentence space (16) from the elements (17), as well as the links between the sentence elements (17), the so-called sentence control space (18).
  • sentence level contains the structure of a single data record in the so-called sentence space (16) from the elements (17), as well as the links between the sentence elements (17), the so-called sentence control space (18).
  • the substructure (15) serves to recognize words and sub-elements with sub-separators in the individual elements, such as element dream (19), drawing space, word space.
  • the substructure is thus subdivided into the element level, the element space (19), and the drawing level, the drawing space with number space (20).
  • the element level (19) the existential characteristics for an element (17) are determined.
  • the character level (20) specifies the possible selection spaces for numbers, letters, special characters, OEM characters and others.
  • the "Working Time” element can be a
  • the "Street" element contains the patterns
  • These substructures are analyzed as words and examined for patterns. For example, street names and house numbers can be split.
  • the pattern and linkage analyzes are carried out with the aforementioned analysis results
  • FIG. 3 shows in diagram form the synthesis process (11) for the formation of the data elements (21) for application B (4) "from the data elements (22) of application A (3).
  • a data filter (23) which contains the previously determined linking rules (24) between the data elements (21) and (22). If one sends the data records (25) from the application A (3) through this data filter (23), one obtains new data records (26) with new data elements (21), which in one of the applications B (4) and exportable data format.
  • the number of data elements (22) of data records (25) from application A (3) is not necessarily the same as the number of data elements (21) of data records (26) for application B (4), the number of data records ( 25) and (26) is generally the same for both applications A (3) and B (4).
  • the data elements (21) must also be compared. and (22) possible with an external database or several external databases (27), for example also the mixture of several databases, such as customer file + invoice file.
  • an external comparison for example, the postal codes of data records (25) and (26) can be checked by comparing the data elements (21) and (22) of country, city, street and postal code with those of the external database (27) compares.

Abstract

Es wird ein Verfahren zur Konvertierung von Daten zwischen zwei Anwendungen bzw. Softwarepaketen vorgeschlagen, die zueinander unterschiedliche Datenformate benutzen. Als ein Grundproblem der heutigen Datenverarbeitung ist dabei das Zusammenführen und der Austausch von Datenquellen verschiedener Softwarepakete erkannt worden. Für eine intelligente Konvertierungssoftware werden in erster Linie Datenstrukturen von Datenbanken und Datenverarbeitungsanlagen betrachtet. Ausgehend von dem ersten Erkennen einer Grobstruktur wird die Dateiform in Konvertierungstools vorklassifiziert. Die Konvertierungssoftware stellt einen Satz von Algorithmen zur Verfügung, wodurch automatisch die Feinstruktur erkannt und umgewandelt wird. Die Analyse von Vorlagefiles der Anwendungen A und B wird bis in die Substrukturen fortgeführt, wobei letztendlich die Quelldaten mit Hilfe der Analyse in die Zieldaten konvertiert werden, welche von der Anwendung B importiert werden.

Description

Beschreibung
Verfahren zur Datenkonvertierung
Die Erfindung betrifft ein Verfahren zum Konvertieren von Daten zwischen zwei Anwendungen beziehungsweise Softwarepaketen, die unterschiedliche Datenformate benutzen, nach dem Oberbegriff des Patentanspruches 1.
Der Erfindung liegt das grundsätzliche Problem der Inkompatibi- lität von Daten aus verschiedenen Anwendungen bzw. Softwarepa¬ keten zugrunde. Viele Programme besitzen ein eigenes Datenfor¬ mat für die interne Verarbeitung der Daten. Dieses ist aber nur selten von anderen Programmen zur Weiterverarbeitung einlesbar. Der Anwender steht vor dem Problem, beliebige Daten von Anwen¬ dung A nach Anwendung B zu transportieren, wobei ihm im allge¬ meinen die Datenformate der Anwendungen A und B nicht bekannt sind. Bei den zu transportierenden Daten handelt es sich meist um Datenbanken, es können aber auch im weitesten Sinne Anwen¬ dungsdaten auftreten, wie zum Beispiel Textdateien, CAD-Daten, Sound-Formate, Kalkulationsprogramme und andere.
Um den vorstehend beschriebenen Datentransfer realisieren zu können, bieten moderne und flexible Programme die Möglichkeit, Daten der gängigsten Formate einzulesen und in ihrem eigenen Format weiterzuverarbeiten. Um einen Austausch zwischen ver¬ schiedenen Anwendungen, beispielsweise auch von anderen Be¬ triebssystemen, zu ermöglichen, ist bei einigen Softwarepaketen eine Im- und Exportfunktion im ASCII-Format oder einem anderen gängigen Format vorgesehen. Darüberhinaus gibt es viele Hilfsprogramme, die Datenkonvertie¬ rungen von einem Format A nach einem Format B erlauben. Diese haben einen fest vorgegebenen Konvertierungsalgorithmus imple¬ mentiert, welcher der jeweiligen Anwendung entspricht. Der An- wender kann nun wählen, zwischen welchen Datenformaten A und B das Programm eine Konvertierung durchführen soll. Diese Hilfs¬ programme können teilweise die Art der Datei bzw. die Art der Anwendung A automatisch anhand von einfachen spezifischen Merk¬ malen bei der Dateiform, wie zum Beispiel der Dateiform und fe- sten Infostrukturen und Versionskennungen innerhalb der Datei, erkennen.
Ein spezielles Verfahren zur Datenkonvertierung ist bereits aus der DE 4128 940 AI bekannt. Mit Hilfe dieses Verfahrens werden druckaufbereitete digitale Daten eines mit einer Text- und/oder Graphik-Software am Bildschirm einer Datenverarbeitungsanlage erstellten Dokumentes in faksimilespezifische Übertragungsdaten konvertiert. Dieses Verfahren ersetzt die umständliche, zeit¬ aufwendige und fehlerbehaftete Methode, ein am Bildschirm einer Datenverarbeitungsanlage erstelltes Dokument an einem an der Datenverarbeitungsanlage angeschlossenen Drucker auszudrucken und anschließend das auf Papier gedruckte Dokument durch eine optoelektronische Einheit eines Faksimilegerätes abzutasten. Die Abtastdaten der optoelektronischen Einheit werden dann fak- similespezifisch codiert und übertragen.
Sowohl die in den Anwendungen integrierten Konvertierungspro¬ gramme als auch die eigenständigen Hilfsprogramme zur Datenkon¬ vertierung haben beide den Nachteil, daß nur eine begrenzte Auswahl an Datenformaten zur Verfügung gestellt wird, die mit den festen Algorithmen des Programmes konvertiert werden kön¬ nen. Diese Konvertierungen berücksichtigen in der Regel nicht die Elementinhalte und deren Verknüpfungen, wie beispielsweise Zeicheninhalt und Zeichenlänge, sprachliche Aspekte, Existenz- regeln, Elementumformungen, Sprachraum, Elementmuster und Ele¬ mentinterpretation. Außerdem sind die meisten Datenformate nicht sehr gut standardisiert, und viele Anwendungen bringen ihre eigenen Datenstrukturen ein. Die Datenelemente sind für die Quellanwendung optimiert und können bei der Zielanwendung Fehler bei der Verarbeitung verursachen, die aufwendig vom An- wender von Hand korrigiert werden müssen oder sogar eine Wei¬ terverarbeitung der Daten unmöglich machen.
Es ist Aufgabe der Erfindung, dem Anwender ein Verfahren zur Datenkonvertierung zur Verfügung zu stellen, das eine flexible Datenangleichung von verschiedenen Anwendungsprogrammen mit relativ einfachen Mitteln ermöglicht.
Diese Aufgabe ist erfindungsgemäß durch die Merkmale des Pa¬ tentanspruchs 1 gelöst.
Erfinderische Weiterbildungen und Ausgestaltungen der Erfindung sind in den Unteransprüchen beschrieben.
Die erfindungsgemäße Konvertierungssoftware ist dabei in der Lage, Daten eines beliebigen Formates A in Daten eines beliebi¬ gen Formates B halb- und auch vollautomatisch zu transferieren, wobei im Prinzip keine Einschränkung bezüglich der möglichen Datenformate auftritt. Da die Datenformate A und B von der er¬ findungsgemäßen Konvertierungssoftware über die Grobstruktur der Daten hinaus sowohl halb- als auch vollautomatisch in deren Feinstruktur analysiert werden, ist die mögliche Fehlerquote beim Datentransfer von Anwendung A nach Anwendung B deutlich geringer als bei den üblichen Hilfsprogrammen. Zusätzlich sind Datenveränderungen und Datenanpassungen in diversen Ebenen, beispielsweise in der Datei-, Satz-, Elementebene und weitere, vorgesehen, um die Fehlerquote bei der Zielanwendung zu verrin¬ gern.
Der Aufbau des erfindungsgemäßen Verfahrens zur Datenkonver- tierung ist in der Zeichnung dargestellt und nacchstehend er¬ läutert. Darin zeigen: Fig. l das Informationsablaufdiagramm des Verfahrens zum Datentransfer;
Fig. 2 ein Diagramm zur Strukturanalyse des Verfahrens mit detailliertem Strukturaufbau; Fig. 3 den Syntheseverlauf des Verfahrens für die Bil¬ dung der Daten B aus den Daten A;
Fig. 4 das Informationsablaufdiagramm gemäß Figur l in detaillierterer Darstellung.
Die Figur 1 zeigt in Form eines Informationsablaufdiagrammes den Ablauf eines Datentransfers mit Hilfe des erfindungsgemäßen Verfahrens bzw. der erfindungsgemäßen Konvertierungssoftware (1) . Ein Anwender möchte beliebige Quelldaten Q (2) , die von der Anwendung A (3) erzeugt und exportiert werden, zur Anwen- düng B (4) transportieren, um sie dort weiterzuverarbeiten. Jede der Anwendungen A (3) und B (4) kann ihre Daten in einem für sie selbst verständlichen Format im- und exportieren; dies ist in den Anwendung (3) und (4) implementiert, um Daten zwi¬ schen Anwendungen der gleichen Art auf verschiedenen Arbeits- platzen auszutauschen.
Der Anwender kann nun jeweils einen Probeexport von beispiels¬ weise etwa 500 Datensätzen aus dem Datenbestand der Anwendung A (3) und dem der Anwendung B (4) erzeugen. So entstehen das Vorlagefile VA (5) aus Anwendung A (3) und Vorlagefile VB (6) aus Anwendung B (4) . Voraussetzung für das Funktionieren des Verfahrens zur Datenkonvertierung ist dabei, daß die Anwendung B (4) ihr eigenes, von ihr erzeugtes, exporttiertes Vorlagefile VB (6) wieder importieren kann, was aber selbstverständlich funktionieren sollte. Jetzt können die Vorlagefiles VA (5) und VB (6) mittels der Konvertierungssoftware (1) analysiert werden (7) .
Es wäre grundsätzlich auch ein Datenaustausch von Anwendung A (3) zu Anwendung B (4) direkt möglich ohne den Weg über die
Datei (zum Beispiel OLE, DDE und weitere) zu gehen. Hier wird dann also der Umweg über die Dateien gespart, während die Ana¬ lyse- und Verknüpfungsprozesse natürlich wirksam bleiben sind.
Da der Anwender im allgemeinen nichts über den Aufbau der Da- tenstrukturen und über die Datenstrukturen der Anwendungen A (3) und B (4) weiß, und darüber auch nichts wissen möchte, sind für die Analyse komplexe Algorithmen erforderlich, um den An¬ wender möglichst von Entscheidungen zu entlasten und den Analy¬ se- und Verknüpfungsprozeß (8) zu automatisieren oder zumindest zum Teil zu automatisieren. Die implementierten Algorithmen können problemlos erweitert werden, um auch neue, in Zukunft auftretende Datenstrukturen analysieren zu können. Der Umfang der Analyse (8) der Strukturen wird weiter unten anhand von Fi¬ gur 2 näher erläutert. Nach dem Analyse- und Verknüpfungsprozeß (8) kennt die Konvertierungssoftware (1) die Datenstruktur der Vorlagefiles VA (5) und VB (6) und auch die notwendigen Ver¬ knüpfungen zwischen den Elementen der Vorlagefiles VA (5) und VB (6) . Dieses Konvertierungsmuster für die Übertragung der Daten von Anwendung A (3) nach Anwendung B (4) wird als Muster- ablaufdatei M abgespeichert.
Will der Anwender zu einem späteren Zeitpunkt weitere Daten¬ transfers zwischen denselben Anwendungen A (3) und B (4) wie oben erläutert durchführen, so ist es möglich, das eben erτrtit- telte Konvertierungsmuster in Form von Musterablaufdaten M (9) abzuspeichern (10) . Somit erübrigt sich für den Anwender beim nächsten Konvertierungsprozeß die Erzeugung der Vorlagefiles VA (5) und VB (6) , und die KonvertierungsSoftware (1) kann beim Datentransfer ohne Analyseprozeß (8) direkt auf die gesicherten Musterablaufdaten M (9) zurückgreifen und die Musterablaufdaten M (9) wieder einlesen (10) .
Wie dazu insbesondere Figur 4 in Ergänzung zu Figur l zeigt, unterteilt sich die Analysephase sowohl des Vorlagefiles VA (5) als auch des Vorlagefiles VB (6) in eine Grobanalyse, eine fol¬ gende Feinanalyse, eine weitere folgende Subanalyse und so wei- ter, um schließlich im Ergebnis zur Endanalyse zu gelangen. An die Analysephase schließt sich dann die Verknüpfungsphase an, in welcher die Analysen der Vorlagefiles verknüpft werden.
In der Synthesephase (11) wird mit Hilfe des ermittelten Analy¬ se- und Verknüpfungsergebnisses eine Konvertierung der Quellda¬ ten Q (2) in die Zieldaten Z (12) erreicht. Im letzten Schritt kann die Anwendung B (4) die Zieldaten Z (12) importieren, da sie in dem von der Anwendung B (4) im- und exportierbaren Da- tenformat vorliegen, und weiterverarbeiten.
Bei diesem erfindungsgemäßen Verfahren zur Datenkonvertierung ist es für den Benutzer zudem möglich, durch Verwendung von vom Benutzer definierten Sonderregeln bei der Synthese (11) der Quelldaten Q (2) in die Zieldaten Z (12) Datenveränderungen vorzunehmen. Als Beispiele, und keineswegs vollständig aufge¬ zählt, seien hier nur der Ersatz von ä, ö, ü durch ae, oe ue und die Umbildung der Elemente [Sehr geehrter] und [Herr xyz] in die Elemente [Sehr geehrter Herr] und [xyz] genannt. Es sind hierbei natürlich auch sehr komplexe Datenveränderungen mög¬ lich, die am besten mit dem Begriff des "Morphing" aus der Bildverarbeitung verglichen werden können, der die Wandlung von einem Muster A nach Muster B ohne Informationsverluste be¬ schreibt.
Wie Figur 1 zeigt, wird die zu exportierende Quelldatei (28) der Anwendung A (3) in die Quellanalyse (29) gegeben. Nach er¬ folgter Analyse für automatische Regelbildung und Verknüpfungen im Block (8) wird die Zielanalyse (11) erstellt. Die konver- tierten Daten werden sodann in die importierbare Zieldatei (30) gegeben. Bei dem Vorgang des Exportierens der Quelldatei (28) in die Zieldatei (11) mittels der Musterablaufdaten M ist eine Quell- oder Zielanalyse nicht mehr erforderlich. Auch die Re¬ gelbildung und die Verknüpfungen wurden in diesem Fall bereits mit den Vorlagefiles VA (5) und VB (6) erzeugt. Bei der Synthe¬ se wird die Quelldatei Q (2) gelesen und mit dem Datenfilter aus den Musterablaufdaten M bearbeitet. Die generierten Daten¬ sätze werden in die Zieldatei geschrieben. Das Datenfilter kann sich externer Dateien zum Abgleich wie auch interner Dateien zum Suchen und Sortieren bedienen.
In Figur 2 ist ein Diagramm dargestellt, welches den Struktur¬ aufbau einer allgemeinen Datentransferdatei in detaillierter Form zeigt. Die Analyse (8) der Vorlagefiles VA (5) und VB (6) unterteilt sich in mehrere Phasen. Ausgehend von dem ersten Er- kennen der Grobstruktur (13) wird die Dateiform wie bei bisher bekannten Konvertierungsprogrammen zunächst vorklassifiziert. Die intelligente Konvertierungssoftware stellt nun zusätzlich einen Satz von Algorithmen zur Verfügung, der in der Lage ist, automatisch die Feinstruktur (14) der vorliegenden Daten zu er- kennen. Die Analyse (8) wird fortgeführt, um auch die Substruk- turen (15) innerhalb der Datenelemente (17) zu erkennen.
Wie auch gut erkennbar aus Figur 3 hervorgeht, dient die Grob¬ struktur (13) dem Erkennen der Filestruktur, der Trennzeichen, der ElementbeZeichner, der Zeichenlänge usw. im Dateiraum und im Satzraum (16) . In der Grobstruktur (13) werden Dateien nach ihrer Dateiform unterschieden. Die Unterschiede sind zum Bei¬ spiel anhand von Dateiendungen oder Infostrukturen innerhalb der gesamten Datei zu erkennen.
Die Feinstruktur (14) dient dem Erkennen von Elementexistenz, Element-Zeicheninhalten, Elementzeichenlänge usw. wie Elemen¬ traum (19) und Zeichenraum (20) . Die Feinstruktur (14) bezieht sich auf die Satzebene, die den Aufbau eines einzelnen Daten- satzes im sogenannten Satzraum (16) aus den Elementen (17) , sowie die Verknüpfungen der Satzelemente (17) untereinander, den sogenannten Satzregelraum (18) beinhaltet. Bei der Merk- malsfindung für den Datensatzaufbau und die Datensatzstruktur werden beispielsweise Feldnamen in einem Datensatz (16) analy- siert, die Verwendung spezieller Trennsymbole für Elemente (17) und Datensätze (16) , die Verwendung von Start- und Stopsymbolen für die Strukturierung- innerhalb der Elemente (17) und die An¬ zahl der Elemente (17) pro Datensatz (16) ermittelt.
Die SubStruktur (15) dient dem Erkennen von Worten und Subele- menten mit Sub-Trennern in den einzelnen Elementen, wie Elemen¬ traum (19) , Zeichenraum, Wortraum. Die SubStruktur unterglie¬ dert sich also nochmals in die Elementebene, dem Elementraum (19) , und die Zeichenebene, dem Zeichenraum mit Zahlenraum (20) . In der Elementebene (19) werden die Existenzmerkmale für ein Element (17) festgelegt.
Als Existenzmerkmale treten zum Beispiel auf: minimale und maximale Datenelement-Zeichenlänge, Datenelement-Existenzvor¬ gaben (muß, kann, darf) , zulässige und vorkommende Zeichen in einem Datenelement (17) , verwendeter Sprachraum, begrenzte Li¬ stenstrukturen innerhalb von Datenelementen (17) , Wortanalysen, etc.. Die Zeichenebene (20) gibt die möglichen Auswahlräume für Zahlen, Buchstaben, Sonderzeichen, OEM-Zeichen und andere vor.
So kann zum Beispiel das Element "Arb.Zeit" einen
1. Satz: "Meier/Müller/Graf/Kemper", einen
2. Satz: "8h /7H /9h /8h" und einen
3. Satz: "5H /9h /11h /7h enthalten.
Demzufolge gibt es in dem Element "Arb.Zeit" offenbar Substruk- turen, die durch das Zeichen "/" getrennt sind. Solche und ähn¬ liche SubStrukturen werden erkannt und bei der Analyse wie zu¬ sätzliche Elemente mit Bezeichner, nämlich Meier, Müller, Graf, Kemper, und entsprechenden Inhalten behandelt.
Wie oben an anderer Stelle bereits ausgeführt, enhält das Ele¬ ment "Anrede" mehrere Wörter:
1. Satz: "Sehr geehrter Herr",
2. Satz: "Sehr geehrte Frau", ~ 3. Satz: "Hallo, Herr" und
4. Satz: "Sehr geehrter Herr Dipl.-Ing". Diese SubStrukturen werden als Wörter in Wortlisten übernommen und gegebenenfalls einzeln weiter nach zusätzlichen Mustern und Regeln analysiert.
Zur Verdeutlichung dient ein weiteres Beispiel. Das Element "Strasse" enthält die Muster
1. Satz "Hofweg 13",
2. Satz "Am langen Kant 77" und
3. Satz "Bremer Strasse 19".
Diese SubStrukturen (15) werden als Worte analysiert und nach Mustern untersucht. Es können so zum Beispiel Strassenname und Hausnummer gesplittet werden.
Von großer Wichtigkeit ist es, daß sich die SubStrukturen (15) auf Objekte in einer Ebene unter den Satzelementen beziehen. Hier werden die Elementinhalte nach weiteren Mustern abgesucht.
Bei der Musterstruktur werden mit den vorgenannten Analyse- Ergebnissen die Muster- und Verknüpfungsanalysen durchgeführt
(Satzraum (16) , Satzregelraum, Elementraum (19) , Wortraum) .
Dabei werden übergreifende Muster und Regeln mittels fester
Algorithmen und neuronaler sowie Fuzzy-Algorithmen bestimmt.
Um die Mustererkennung bei der sprachlichen Analyse (8) von Feinstruktur (14) und Substruktur (15) möglichst automatisch ablaufen lassen zu können, ist bei den Algorithmen die Verwen¬ dung moderner Techniken, wie neuronale Netze und Fuzzy-Logik neben festen Algorithmen, erforderlich. Läßt man solche Ansätze weg, so muß der Anwender eventuell einzelne Verknüpfungen von Hand durchführen.
Die Figur 3 zeigt in Diagrammform nun den Syntheseverlauf (11) für die Bildung der Datenelemente (21) für die Anwendung B (4) " aus den Datenelementen (22) der Anwendung A (3) . Aus der oben beschriebenen Analyse (8) der Vorlagefiles VA (5) und VB (6) ergibt sich ein Datenfilter (23) , der die zuvor ermittelten Verknüpfungsregeln (24) zwischen den Datenelementen (21) und (22) enthält. Schickt man die Datensätze (25) aus der Anwendung A (3) durch diesen Datenfilter (23) , so erhält man neue Daten- sätze (26) mit neuen Datenelementen (21) , die in einem von der Anwendung B (4) im- und exportierbaren Datenformat vorliegen. Die Anzahl der Datenelemente (22) der Datensätze (25) aus der Anwendung A (3) ist nicht unbedingt gleich der Anzahl der Da¬ tenelemente (21) der Datensätze (26) für die Anwendung B (4) , die Anzahl der Datensätze (25) und (26) ist im allgemeinen für beide Anwendungen A (3) und B (4) gleich.
Zusätzlich zu dem aus der Analyse (8) der Vorlagefiles VA (5) und VB (6) entstandenen Datenfilter (23) für den Datentransfer von Anwendung A' (3) nach Anwendung B (4) ist auch ein Abgleich der Datenelemente (21) und (22) mit einer externen Datenbank oder mehreren externen Datenbanken (27) möglich, beispielsweise auch die Mischung von mehreren Datenbanken, wie Kundendatei + Rechnungsdatei. Mit einem solchen externen Abgleich können zum Beispiel die Postleitzahlen der Datensätze (25) und (26) kon¬ trolliert werden, indem man die Datenelemente (21) und (22) von Land, Stadt, Straße und Postleitzahl mit denen der externen Da¬ tenbank (27) vergleicht.
Zusätzlich ist das Anlegen einer oder mehrerer interner Zwi¬ schendatenbanken zum Suchen und Sortieren auf Dateiebene mög¬ lich. Dies ist erforderlich, um ein schnelles Suchen und Sor¬ tieren, beispielsweise nach dem Alphabet oder speziellen Merk¬ malen, zu ermöglichen.
Bezugszeichenliste
1 Konvertierungssoftware bzw. Verfahren
2 Quelldaten Q
3 Anwendung A
4 Anwendung B 5 Vorlagefile VA
6 Vorlagefile VB
7 Eingang Analysevorlagen
8 Analyse, Analyseprozeß
9 Musterablaufdaten M 10 Speichern der Musterablaufdaten
11 Synthese, Synthesephase
12 Zieldaten Z
13 Grobstruktur
14 Feinstruktur 15 SubStruktur
16 Datensatz
17 (Daten-) Element
18 Satzregelraum
19 Elementebene 20 Zeichenebene
21 Datenelemente
22 Datenelemente
23 Datenfilter
24 Verknüpfungen, Verknüpfungsregeln 25 Datensätze
26 Datensätze
27 externe Datenbank
28 Quelldatei
29 Quellanalyse 30 Zieldatei

Claims

Patentansprüche
l. Verfahren zur Konvertierung von Daten und nicht-dateibezo¬ genen Methoden zwischen zwei Anwendungen bzw. Softwarepaketen, die zueinander unterschiedliche Datenformate benutzen, dadurch gekennzeichnet, daß aus dem Datenbestand der ersten Anwendung A (3) und dem Da- tenbestand der.zweiten Anwendung B (4) jeweils ein Probe-Export von Datensätzen relativ geringer Menge erzeugt wird, aus denen ein Vorlagefile VA (5) aus Anwendung A (3) und ein Vorlagefile VB (6) aus Anwendung B (4) gebildet werden, von denen die An¬ wendung B (4) das von ihr erzeugte Vorlagefile VB (6) wieder importieren kann, daß die Vorlagesfiles VA (5) und VB (6) zur Ermittlung ihrer Datenstrukturen und gegebenenfalls zur Ermitt¬ lung der Verknüpfungen zwischen den Elementen durch eine Kon¬ vertierungssoftware (l) analysiert werden, und daß die Quell- daten Q (2) mit Hilfe der Analyseergebnisse in die Zieldaten Z (12) konvertiert werden, welche von der Anwendung B (4) impor¬ tiert werden.
2. Verfahren nach Anspruch l, dadurch gekennzeichnet, daß das Analyse-Ergebnis als Konvertierungsmuster für die Über¬ tragung der Daten des ersten Anwenders A (3) zum zweiten Anwen¬ der B (4) in Form von Musterablaufdaten M (9) abgespeichert wird.
* 3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Quelldaten Q-(2) nach Durchlauf der Analyse (8) und Verknüpfung in eine Zielsynthese (11) gegeben werden, von der sie in die Zieldaten Z (12) konvertiert werden.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß die Analyse (8) der Vorlagefiles VA (5) und VB (6) in mehrere, insbesondere drei Phasen unterteilt ist, wobei nach dem Erkennen der Grobstruktur (13) die Dateiform zunächst vorklassifiziert wird, anschließend durch die Konvertierungs- Software ein Satz von Algorithmen zur automatischen Erkennung der Feinstruktur (14) zu Verfügung gestellt wird und schlie߬ lich in Fortführung der Analyse die SubStrukturen (15) inner¬ halb von Datenelementen (17) erkannt werden.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß in der Grobstruktur (13) die Dateien nach ihrer Dateiform unterschieden werden.
6. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß sich die Feinstruktur (14) auf die Satzebene bezieht, die den Aufbau eines Satzes (16) aus Elementen (17) und die Ver- knüpfungen der Satzelemente (17) untereinander beinhaltet.
7. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die Substruktur (15) sich in die Elementebene (19) und in die Zeichenebene (20) mit Zeichenraum und Zahlenraum unter¬ gliedert, wobei in der Elementebene (19) die Existenzmerkmale für ein Element (17) festgelegt werden.
8. Verfahren nach einem der vorgenannten Ansprüche, ~ dadurch gekennzeichnet, daß bei den Algorithmen für die Mustererkennung der sprachli- chen und logischen Analyse (8) die Technologien der neuronalen Netze und/oder der Fuzzy-Logik eingesetzt werden.
9. Verfahren nach einem der vorgenannten Ansprüche, dadurch gekennzeichnet, daß aus der Analyse (8) der Vorlagefiles VA (5) und VB (6) ein Datenfilter (23) gebildet wird, der die Verknüfungsregeln (24) zwischen den Datenelementen (21,22) auf der Dateiebene oder zu¬ sammen mit einer oder mehreren externen Datenquellen (Abgleich) aufweist, wobei nach Durchlauf von Datensätzen (25) aus der An¬ wendung A (3) durch den Datenfilter (23) neue Datensätze (26) mit neuen Datenelementen (21) erhalten werden, die in einem von der Anwendung B (4) im- und exportierbaren Datenformat vor¬ liegen.
10. Verfahren nach einem der vorgenannten Ansprüche, dadurch gekennzeichnet, daß die Datenelemente (21,22) mit einer externen Datenbank (27) abgleichbar sind.
11. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß eine oder mehrere interne Zwischendatenbanken zur Suche und Sortierung von Datensätzen eingerichtet wird bzw. werden.
0
S
PCT/EP1997/001442 1996-03-25 1997-03-21 Verfahren zur datenkonvertierung WO1997036250A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP97916371A EP0890154A1 (de) 1996-03-25 1997-03-21 Verfahren zur datenkonvertierung
US09/155,338 US6249786B1 (en) 1997-03-21 1997-03-21 Data-conversion method

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
DE19611672.4 1996-03-25
DE19611672 1996-03-25
DE19635351.3 1996-08-31
DE19635351A DE19635351C2 (de) 1996-03-25 1996-08-31 Verfahren zur Formatkonvertierung

Publications (1)

Publication Number Publication Date
WO1997036250A1 true WO1997036250A1 (de) 1997-10-02

Family

ID=26024094

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP1997/001442 WO1997036250A1 (de) 1996-03-25 1997-03-21 Verfahren zur datenkonvertierung

Country Status (2)

Country Link
EP (1) EP0890154A1 (de)
WO (1) WO1997036250A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999059086A1 (en) * 1998-05-14 1999-11-18 Autodesk, Inc. Translating objects between software applications which employ different data formats

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846059B (zh) * 2018-06-01 2022-04-05 北京航空航天大学 面向结果后处理的OpenFOAM有限体积分析结果数据格式及其转换方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0130375A2 (de) * 1983-07-05 1985-01-09 International Business Machines Corporation Interaktives Steuerungsverfahren für Datenübertragung zwischen inkompatiblen Informationsverarbeitungssystemen
EP0449494A2 (de) * 1990-03-27 1991-10-02 International Business Machines Corporation Verfahren und Gerät zur Steuerung der Übertragung von Daten zwischen heterogenen Datenbanksystemen
US5119465A (en) * 1989-06-19 1992-06-02 Digital Equipment Corporation System for selectively converting plurality of source data structures through corresponding source intermediate structures, and target intermediate structures into selected target structure

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0130375A2 (de) * 1983-07-05 1985-01-09 International Business Machines Corporation Interaktives Steuerungsverfahren für Datenübertragung zwischen inkompatiblen Informationsverarbeitungssystemen
US5119465A (en) * 1989-06-19 1992-06-02 Digital Equipment Corporation System for selectively converting plurality of source data structures through corresponding source intermediate structures, and target intermediate structures into selected target structure
EP0449494A2 (de) * 1990-03-27 1991-10-02 International Business Machines Corporation Verfahren und Gerät zur Steuerung der Übertragung von Daten zwischen heterogenen Datenbanksystemen

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999059086A1 (en) * 1998-05-14 1999-11-18 Autodesk, Inc. Translating objects between software applications which employ different data formats
US6847384B1 (en) 1998-05-14 2005-01-25 Autodesk, Inc. Translating objects between software applications which employ different data formats
US7711527B2 (en) 1998-05-14 2010-05-04 Autodesk, Inc Translating objects between software applications which employ different data formats

Also Published As

Publication number Publication date
EP0890154A1 (de) 1999-01-13

Similar Documents

Publication Publication Date Title
EP1669852B1 (de) Verfahren und Computerprogramm zum Umwandeln eines Eingangs-Dokumentendatenstroms mit einem oder mehreren Dokumenten in eine strukturierte Datendatei
EP1665132B1 (de) Verfahren und system zum erfassen von daten aus mehreren maschinell lesbaren dokumenten
EP1579309B1 (de) Verfahren, computerprogrammprodukt und vorrichtung zum verarbeiten eines dokumentendatenstroms eines eingangsformates zu einem ausgangsformat
DE4216893C2 (de) Dateneingabeverfahren
EP1359514A2 (de) Drucken mit variablen Daten unter Verwendung von Varianten
EP1353276A2 (de) Drucken mit variablen Daten unter Verwendung einer dynamischen Ausschiessvorlage
EP1451766B1 (de) Verfahren, gerätesystem und computerprogrammprodukt zur erzeugung eines gedruckten dokuments aus mehreren eingangsdateien
DE10162418A1 (de) System zur Verarbeitung strukturierter Dokumente, damit sie sich zur Ablieferung über Netzwerke eignen
WO2005119580A1 (de) Verfahren und einrichtung zur strukturanalyse eines dokuments
DE10158419A1 (de) Verfahren zum digitalen Drucken von zusammengesetzten Dokumenten
EP1749257A2 (de) Verfahren, vorrichtung und computerprogrammprodukt zum erzeugen eines seiten- und/oder bereichsstrukturierten datenstroms aus einem zeilendatenstrom
WO2009019248A2 (de) Verfahren zum erzeugen eines templates
EP1013070B1 (de) Verfahren und gerät zur elektronischen archivierung eines computer-datenstroms
EP0890154A1 (de) Verfahren zur datenkonvertierung
DE19635351C2 (de) Verfahren zur Formatkonvertierung
EP1605368B1 (de) Erstellen elektronisch verarbeitbarer Unterschriftendateien
DE102009016588A1 (de) Verfahren zur Ermittlung von Textinformationen
EP2682866B1 (de) Verfahren zur Umsetzung von Datenformaten
EP0563077B1 (de) Verfahren zum maschinellen ermitteln von in zwei datenfolgen enthaltenen gleichen datenelementen
EP1917626A1 (de) Verfahren zum wiederauffinden von textblöcken in dokumenten
DE102005030645A1 (de) Verfahren und Computerprogramm-Produkt zum Umwandeln eines Eingangs-Dokumentendatenstroms mit einem oder mehreren Dokumenten in eine strukturierte Datendatei und Computerprogramm-Produkt sowie Verfahren zum Erstellen eines Regelsatzes für ein solches Verfahren
EP3742278A1 (de) Seitenbezogene steuerungsdaten
DE102004059120A1 (de) Verfahren zum Umwandeln eines Eingangs-Dokumentendatenstroms mit einem oder mehreren Dokumenten in eine strukturierte Datendatei und Computerprogramm-Produkt zum Erstellen eines Regelsatzes für ein solches Verfahren
DE10112571A1 (de) Vorrichtung und Verfahren zum Ermitteln einer Begriffs-Vergleichsstruktur sowie Vorrichtung und Verfahren zum Ermitteln von Begriffen in einem elektronischen Dokument, Computerlesbare Speichermedien und Computerprogramm-Elemente
EP0952534A1 (de) Verfahren zur automatisierten Regelgenerierung für die Klassifizierung von Daten, insbesondere Bilddaten

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH DE DK ES FI FR GB GR IE IT LU MC NL PT SE

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 09155338

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 1997916371

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1997916371

Country of ref document: EP

WWR Wipo information: refused in national office

Ref document number: 1997916371

Country of ref document: EP

WWW Wipo information: withdrawn in national office

Ref document number: 1997916371

Country of ref document: EP