DE10054280A1

DE10054280A1 - Verfahren, Computersystem, Computerprogrammprodukt und Internetserver zum Verarbeiten von Daten

Info

Publication number: DE10054280A1
Application number: DE10054280A
Authority: DE
Inventors: Hans Weber; Nicola Leonetti
Original assignee: GSDC GLOBAL SOLUTIONS FOR DOCU
Current assignee: GSDC GLOBAL SOLUTIONS FOR DOCU
Priority date: 2000-11-02
Filing date: 2000-11-02
Publication date: 2002-05-29

Abstract

Die Erfindung betrifft ein Verfahren, ein Computersystem, ein Computerprogrammprodukt und einen Internetserver zum Verarbeiten von Daten, die mehrere systematisch angeordnete Datenelemente umfassen, zur Umwandlung in Daten, die in einem vollstrukturierten Datenformat vorliegen. Hierbei wird eine dem vollstrukturierten Datenformat entsprechende Datenstrukturierungsschablone erstellt, welche Strukturbeschreibungselemente umfaßt, die an die Datenstruktur der systematisch angeordneten Datenelemente der zu verarbeitenden Daten angepaßt werden. Anschließend wird diese Datenstrukturierungsschablone an den zu verarbeitenden Daten angewandt, indem mittels der Strukturbeschreibungselemente die erforderliche Datenstruktur des vollstrukturierten Datenformats erzeugt wird, und die Datenelemente der zu verarbeitenden Daten in der erzeugten Datenstruktur als vollstrukturierte Daten ausgegeben werden.

Description

Die Erfindung betrifft im allgemeinen das Gebiet der Da tenverarbeitung, und insbesondere die Umwandlung von Da ten, die systematisch angeordnete Datenelemente umfassen, in Daten, die in einem voll strukturierten Datenformat vorliegen.

Es werden heutzutage eine Vielzahl unterschiedlichster Anwendungsprogramme benutzt, mit denen Daten erzeugt wer den. Häufig besteht der Wunsch, die von einem bestimmten Anwendungsprogramm erzeugten Daten in ein anderes Anwen dungsprogramm exportieren zu können, wobei keine Informa tion über die Struktur der Daten verlorengehen sollte. So besteht im Zuge der rasant steigenden Nutzung des Inter nets als das von der Allgemeinheit am meisten genutzte Computer-Netzwerk der Bedarf, Daten, die beispielsweise firmenintern von einem bestimmten Anwendungsprogramm er stellt worden sind, ohne großen Aufwand in das Internet stellen zu können.

Das Internet ist kein einzelnes Netzwerk, sondern umfaßt eine weltweite und laufend wachsende Ansammlung von Com putern und Computernetzwerken, die über standardisierte Arbeitsweisen und Protokolle miteinander kommunizieren können. Ein Standardisierungsmittel, das einen speziellen Standard für den Austausch von Daten beispielsweise über das Internet festlegt, ist die international standardisierte XML (Extended Markup Language). Die XML beschreibt eine Klasse von Datenobjekten, die XML-Dokumente genannt werden, und beschreibt weiterhin teilweise das Verhalten von Computer-Programmen, die solche Dokumente verarbei ten. Die von XML gebildeten Dokumente sind aus Speiche rungseinheiten aufgebaut, auch Entities genannt, die u. a. analysierte (parsed) Daten enthalten. Analysierte Daten bestehen aus Datenelementen, welche einerseits die den eigentlichen Dateninhalt betreffende Datenelemente und andererseits Strukturelemente (Markup) umfassen. Die Strukturelemente stellen zusammen eine Beschreibung der Aufteilung auf die Speicherungseinheiten und der logi schen Struktur des Dokumentes. XML bietet dabei einen Me chanismus an, um Beschränkungen der Aufteilung und logi schen Struktur zu formulieren.

Allgemein, liefert ein vollstrukturiertes Datenformat In formation über die logische Struktur einer Datenansamm lung sowie die darin eingebetteten eigentlichen Datenin halte. Somit sind vollstrukturierte Daten also Daten, bei denen Inhaltsdaten und deren Strukturierung mit Hilfe von Strukturelementen angegeben wird. Solche Daten werden üb licherweise in zwei Schritten angelegt, indem zuerst die Datenstruktur beispielsweise in Form einer Baumstruktur erstellt wird und anschließend die Daten in die bestehen de Datenstruktur eingegeben werden, beispielsweise an den Knotenpunkten der Baumstruktur. Es gibt eine Vielzahl un terschiedlichster vollstrukturierter Datenformate, zu de nen beispielsweise auch relationale Datenbanken mit dem Datenbankschema als Datenstruktur und den eigentlichen Daten gezählt werden. Ferner stellen auch bestimmte hoch entwickelte Programmiersprachen, wie Pascal, Fortran, etc. ein solches vollstrukturiertes Datenformat bereit, indem nämlich durch die darin aufgeführten Routinen bzw. Module und Untermodule hochsystematische Baumstrukturen erstellt werden.

Auf der anderen Seite werden Daten häufig von bestimmten Anwendungsprogrammen, wie zum Beispiel Tabellenkalkulati onsprogrammen (Excel, etc.), in Tabellen systematisch an geordnet. Die spezielle systematische Anordnung bestimmt jedoch der Benutzer selbst, indem er seine Daten ganz in dividuell nach seiner Vorstellung in einer leeren Tabelle ordnet. Diese Strukturierung der Daten ist somit subjek tiv und für ein weiteres Anwendungsprogramm nicht weiter verarbeitbar festgelegt. Als Beispiel sei eine mit einem Tabellenkalkulationsprogramm erstellte Tabelle angeführt, die zwei Spalten und mehrere Zeilen pro Spalte aufweist. In der ersten Spalte sind beispielsweise lauter Pro duktnamen und in der zweiten Spalte, in den zugehörigen Zeilen, der entsprechende Produktpreis angeordnet. Die Tabelle enthält jedoch keine Strukturelemente, welche an zeigen, daß die erste Spalte einen Produktnamen kenn zeichnet und daß die zweite Spalte den zu jedem Pro duktnamen zugehörigen Produktpreis angibt.

Häufig werden solche Anwendungsprogramme dazu verwendet, firmenintern beispielsweise Datenblätter mit den ver schiedenen angebotenen Produkten und dem zugehörigen Pro duktpreis zu erstellen. Sollen diese Datenblätter an schließend als Katalog ins Internet gestellt werden, so tritt folgendes Problem auf: die von dem Benutzer den Da tenblättern aufgeprägte Struktur, die in keinen Struktu relementen oder ähnlichem Niederschlag findet, da die Da ten der Datenblätter lediglich in dem sozusagen unstruk turierten Datenformat vorliegen, muß in entsprechende vollstrukturierte Daten, wie das XML-Format, übertragen werden. Dies wird heutzutage mühsam von Hand erledigt, indem die Datenelemente der individuell angelegten Tabel len in eine entsprechende Struktur des vollstrukturierten Datenformats kopiert werden.

Der Erfindung liegt nunmehr die Aufgabe zugrunde, die Um wandlung von zu verarbeitenden Daten zu vereinfachen, die mehrere systematisch angeordnete Datenelemente umfassen, in Daten, die in einem vollstrukturierten Datenformat vorliegen.

Die Erfindung löst diese Aufgabe jeweils mit den Gegen ständen der Ansprüche 1, 33, 34 und 35. Bevorzugte Aus führungsformen der Erfindung sind in den Unteransprüchen beschrieben.

Danach ist ein Verfahren zum Verarbeiten von Daten ge schaffen, die mehrere systematisch angeordnete Datenele mente umfassen, zur Umwandlung in Daten, die in einem vollstrukturierten Datenformat vorliegen, bei welchem ei ne dem vollstrukturierten Datenformat entsprechende Da tenstrukturierungsschablone erstellt wird, welche Struk turbeschreibungselemente umfaßt, die an die Datenstruktur der systematisch angeordneten Datenelemente der zu verar beitenden Daten angepaßt werden, diese Datenstrukturie rungsschablone an den zu verarbeitenden Daten angewandt wird, indem mittels der Strukturbeschreibungselemente die erforderliche Datenstruktur des vollstrukturierten Daten formats erzeugt wird, und die Datenelemente der zu verar beitenden Daten in die erzeugte Datenstruktur als voll strukturierte Daten ausgegeben werden. Der Vorteil des erfindungsgemäßen Verfahrens liegt darin, daß solche Da tenstrukturierungsschablonen beispielsweise für eine be stimmte Dokumentdarstellung (z. B. eine Web-Seite im In ternet) lediglich einmal beispielsweise für eine bestimm te in einer speziellen Tabellenform vorliegenden Ansamm lung zu verarbeitender Daten erstellt werden muß, und an schließend die Datenstrukturierungsschablone für unter schiedliche Daten, die jedoch in einer ähnlichen Tabel lenform angeordnet sind, automatisch immer wieder ange wandt werden kann. Die Strukturbeschreibungselemente stellen dabei ein äußerst flexibles Werkzeug dar, mit dem verschiedenste Datenansammlungen, die zwar die gleiche inhärente Struktur aufweisen, jedoch dabei vom äußeren Erscheinungsbild völlig unterschiedlich systematisch an geordnet sind, mit einer einzigen Datenstrukturierungsschablone in ein strukturiertes Datenformat umgewandelt werden können. Vorteilhaft können dann die in dem voll strukturierten Datenformat vorliegenden Daten einfach in andere Datenformate umgewandelt werden, da es bereits viele Anwendungsprogramme gibt, welche in einem voll strukturierten Datenformat vorliegende Daten in ihr eige nes Datenformat umwandeln können. Bislang war lediglich die erstere Umwandlungsrichtung nur mit zeitaufwendigen, vollständig manuellen Umwandlungsprozeduren möglich. Die Erfindung schafft somit letztendlich ein leistungsfähiges Tool, Daten in verschiedensten Datenformaten über die Schnittstelle in Form eines vollstrukturierten Datenfor mats ineinander umzuwandeln.

Unter systematisch angeordneten Daten wird auch verstan den, daß die Daten in einer Datenansammlung beliebiger Form vorliegen, wobei bevorzugt ein System (Struktur) in der Anordnung der Datenelemente der Datenansammlung er kennbar ist. Im Extremfall kann die Datenansammlung auch überhaupt keine Struktur erkennen lassen. Vielmehr wird diesen Daten dann eine Struktur beispielsweise mittels einer vorgegebenen Struktur-Vorlage aufgeprägt (siehe un ten).

Bevorzugt sind die Datenelemente der zu verarbeitenden Daten in adressierbaren Datenzellen angeordnet, die be sonders bevorzugt tabellarisch angeordnet sind. Dies stellt jedoch lediglich eine spezielle Ausgangslage von systematisch angeordneten Daten dar, die sich jedoch be sonders für die Erstellung der Datenstrukturierungsscha blone bzw. der darin enthaltenen Strukturbeschreibungse lemente eignet.

Bevorzugt umfassen die Strukturbeschreibungselemente Zei gerelemente, die

- veranlassen, daß jeweils auf eine bestimmte Daten zelle gezeigt wird,
- bei denen die Adresse der aufgezeichneten Datenfälle direkt eingebbar ist,
- bei denen jeweils ein bestimmter Inhalt eingebbar ist, und die veranlassen, daß jeweils auch die Adresse einer Datenzelle mit diesem Inhalt gezeigt wird,
- bei denen für die einzelnen Adressen-Koordinaten, insbesondere die Spaltenadresse und die Reihenadres se, unterschiedliche Inhalte eingebbar sind,
- bei denen zusätzlich zum Inhalt noch ein Tabellenbe reich eingebbar ist, und die veranlassen, daß inner halb des Tabellenbereichs nach Datenzellen mit dem eingegebenen Inhalt gesucht wird,
- bei denen die Adresse der aufzuzeigenden Datenzellen bzw. der Tabellenbereich als absolute Adresse ein gebbar ist,
- bei denen die Adresse der aufzuzeigenden Datenzellen bzw. der Tabellenbereich relativ zu anderen Zeigere lementen eingebbar ist, und/oder
- bei denen zusätzlich ein Offset-Wert eingebbar ist, und die veranlassen, daß auch Datenquellen unter Be rücksichtigung des Offset-Wertes gezeigt wird.

Diese Zeigerelemente stellen ein besonders leicht intui tiv handzuhabendes Markierungsmittel dar, mit dem ein Be nutzer beispielsweise bestimmte Zellen in der Tabelle un abhängig von dem konkreten Aufbau der Tabelle markieren kann. Befindet sich beispielsweise in den verschiedenen Tabellen eines Tabellenkalkulationsprogramms immer eine Spalte mit Produktnamen, die immer mit einem bestimmten Produktnamen beginnt, die absolute Adressierung der Spal te in der Tabelle jedoch variiert, so kann der Benutzer einfach über ein solches Zeigerelement, welches nach dem Inhalt einer Zelle mit dem speziellen Produktnamen sucht, diese Spalte für alle Tabellen markieren. Ist dann bei spielsweise weiterhin bekannt, daß im Abstand von drei Spalten zu der Produktnamenspalte in allen Tabellen eine Produktpreisspalte angeordnet ist, so kann mit Hilfe eines Zeigerelementes, bei denen die Adresse der aufzuzei genden Datenzelle relativ zu dem auf die Produktnamen spalte zeigenden Zeigerelement eingebbar ist, für alle Tabellen diese Produktpreisspalte markiert werden. Insge samt steht mit der oben aufgezählten, jedoch nicht ab schließenden Auswahl an Zeigerelementen ein sehr mächti ges Werkzeug bereit, bestimmte Abschnitte von in Tabel lenform angeordneten Daten flexibel markieren zu können.

Bevorzugt umfassen die Strukturbeschreibungselemente wei terhin Schleifenbildungselemente,

- die veranlassen, daß iterativ Datenelemente der zu verabeitenden Daten von einer eingebbaren Startda tenzelle bis zu einer eingebbaren Enddatenzelle adressiert werden,
- bei denen die Start- und/oder Enddatenzellen als Zeigerelementen und/oder weitere Schleifenbildungse lementen eingebbar sind,
- die veranlassen, daß Datenelemente spaltenweise, reihenweise oder tabellenweise adressiert werden, und/oder
- bei denen wenigstens ein Offset-Wert eingebbar ist, und die veranlassen, daß iterativ Datenelemente von einer eingebbaren Startdatenzelle bis zu einer ein gebbaren Enddatenzelle unter Berücksichtigung des wenigstens einen Offset-Werts adressiert werden.

Mit diesen Schleifenbildungselementen kann nun äußerst flexibel auf eine genau festgelegte Abfolge von Datenzel len zugegriffen werden. In dem oben erwähnten Beispiel können mit einem Schleifenbildungselement, das veranlaßt, daß Datenelemente spaltenweise adressiert werden, und dessen Startdatenzelle mittels eines Zeigerelementes ein gebbar ist, das auf den ersten Produktnamen in der Pro duktnamen-Spalte zeigt, und dessen Enddatenzelle mittels eines Zeigerelementes eingebbar ist, das auf eine leere Zelle zeigt, sowie eines Offset-Wertes von einer Zelle zurück in der Spalte, die gesamte Spalte mit den Pro duktnamen adressiert werden.

Bevorzugt umfassen die Strukturbeschreibungselemente wei terhin Bedingungselemente, bei denen eine beliebige Be dingung eingebbar ist, und die veranlassen, daß ein logi scher Wert ausgegeben wird, dessen Wert davon abhängt, ob die Bedingung erfüllt ist oder nicht. Solche Bedingungen können beispielsweise ein Attribut (Datentyp, etc.) der Datenzelle sein. Besonders bevorzugt ist bei den Bedin gungselementen zusätzlich ein Tabellenbereich entweder direkt oder über Zeiger- und Schleifenbildungselemente eingebbar. Diese Bedingungselemente veranlassen dann, daß der eingegebene Tabellenbereich auf die eingegebene Be dingung hin untersucht wird.

Besonders bevorzugt ist für die Zeiger-, Schleifenbil dungs- und/oder Bedingungselementen jeweils ein Name ein gebbar, mit dem auf das jeweilige Zeiger-, Schleifenbil dungs- und/oder Bedingungselement zugegriffen werden kann. Somit lassen sich beispielsweise mehrere verschie dene Spalten in einer Tabelle, in der immer die Pro duktnamen aufgelistet sind, mit mehreren Schleifenbil dungselementen adressieren, indem diese nacheinander von entsprechenden Strukturbeschreibungselementen über ihren individuellen Namen aufgerufen werden.

Bevorzugt umfassen die Strukturbeschreibungselemente Schleifenbildungselemente, denen eine Bedingung und/oder der Name eines Bedingungselement eingebbar ist, und die veranlassen, daß iterativ lediglich die Datenzellen adressiert werden, welche die entsprechende Bedingung er füllen. Somit lassen sich auch komplexe Iterationen durchführen, da über die Bedingungselemente beliebige Funktionen eingeführt werden können.

Bevorzugt umfassen die Strukturbeschreibungselemente er ste Anweisungselemente, denen ein bestimmter Inhalt ein gebbar ist, und die veranlassen, daß ein Strukturelement mit dem eingegebenen Inhalt des vollstrukturierten Daten formats erzeugt wird. Diese Strukturbeschreibungselemente dienen also der Erzeugung der erforderlichen Datenstruk tur des vollstrukturierten Datenformats.

Bevorzugt umfassen die Strukturbeschreibungselemente fer ner zweite Anweisungselemente, denen ein bestimmter In halt eingebbar ist, und die veranlassen, daß bestimmte Datenelemente der zu verarbeitenden Daten in die Struktur des vollstrukturierten Datenformats eingebettet werden. Diese Strukturbeschreibungselemente dienen also der Aus gabe der Datenelemente in die Datenstruktur als voll strukturierte Daten.

Bevorzugt umfassen die Strukturbeschreibungselemente da bei erste und/oder zweite Anweisungselemente,

- bei denen der Inhalt mittels eines Zeigerelementes eingebbar ist,
- bei denen der Inhalt mittels Zeigerelementen eingge bar ist, wobei für jede Adressen-Koordinate, insbe sondere für die Spalten- und Reihenadresse, ein un terschiedliches Zeigerelement eingebbar ist, und/oder
- bei denen der Inhalt mittels eines Zeigerelementes und zusätzlich eines Offset-Wertes eingebbar ist.

Diese Strukturbeschreibungselemente stellen einfache Mit tel zur Erzeugung der Datenstruktur des vollstrukturier ten Datenformats dar.

Bevorzugt wird die Abfolge erster und zweiter Anweisung selemente und Schleifenbildungselemente in der Daten strukturierungsschablone anhand der Struktur des zu er zeugenden vollstrukturierten Datenformats eingegeben. Da bei wird ganz besonders bevorzugt die Abfolge automatisch aus einer als document type definition (DTD) vorliegenden Struktur des vollstrukturierten Datenformats erstellt.

Bevorzugt werden die Zeiger- und/oder Bedienungsanweisun gen manuell eingegeben. Ganz besonders bevorzugt werden dabei in einem ersten Schritt die Zeiger- und/oder Bedin gungsanweisungen und in einem zweiten Schritt die ersten und zweiten Anweisungselemente und Schleifenbildungsele mente eingegeben.

Die Zeigerelemente können alternativ auch bevorzugt auto matisch, insbesondere anhand statistischer Auswertungen einer Vielzahl zu verarbeitender Daten erstellt werden.

Die Daten in dem vollstrukturierten Datenformat können nun einerseits bevorzugt unmittelbar mit der Eingabe neu er Datenelemente der zu verarbeitenden Daten erzeugt wer den, oder aber erst nach Eingabe aller Datenelemente der zu verarbeitenden Daten.

Ganz besonders bevorzugt werden die Strukturbeschreibung selemente der Datenstrukturierungsschablone in Ausfüh rungsbefehle umgewandelt, welche von einer die Datenele mente der zu verarbeitenden Daten systematisch anordnen den Datenanordnungssprache verstanden wird. So können die Struktubeschreibungselemente beispielsweise in Macro- Befehlen der jeweiligen Datenanordnungssprache implemen tiert sein.

Zu den auf ein Computerprogramm-Produkt gerichteten Pa tentanspruch sei zusätzlich erwähnt, daß unter dem Be griff "Computerprogramm-Produkt" ein Computerprogramm oder ein Computerprogramm-Modul zu verstehen ist, welches durch Speicherung (zum Beispiel auf einem magnetischen Speichermedium oder in einem flüchtigen oder nicht flüchtigen Halbleiterspeicher eines Computers) oder durch Signale, die über ein Netzwerk, insbesondere das Inter net, versendet werden, verkörpert ist. Dabei braucht das Computerprogramm nicht in einer unmittelbar ausführbaren Form vorliegen, vielmehr kann es auch in einer für die Installation auf einem Benutzerhost oder einem Internetserver vorbereiteten Form vorliegen, wobei es selbstver ständlich gepackt, verschlüsselt, für eine etwaige Ver sendung über ein Netz in Pakete zerteilt und mit übertra gungsbezogenen Headern versehen sein kann, etc.

Die Erfindung sowie weitere Vorteile und Merkmale der Er findung werden nunmehr anhand bevorzugter Ausführungsbei spiele der Erfindung in bezug auf die beigefügte Zeich nung näher erläutert. In der Zeichnung zeigen:

Fig. 1 an einem speziellen Beispiel zu verarbei tende Daten, deren Datenelemente systema tisch in einer Tabellenform mit zwei Ta bellenseiten angeordnet sind;

Fig. 2 an dem speziellen Beispiel die den Daten der Fig. 1 implizit innewohnende Struktur anhand einer Baumstruktur;

Fig. 3 an dem speziellen Beispiel eine auf die Daten der Fig. 1 zugeschnittene Daten strukturierungsschablone mit den einzelnen Strukturbeschreibungselementen;

Fig. 4 an dem speziellen Beispiel die Daten der Fig. 1, nachdem sie in ein vollstruktu riertes Datenformat umgewandelt worden sind.

Nachfolgend wird in groben Zügen der Aufbau eines Compu tersystems beschrieben, daß für den Ablauf des Verfahrens herangezogen werden kann. In der Regel umfaßt ein solches Computersystem einen Computer mit einem Monitor, einer Eingabetastatur und einer Computermaus. Anstelle des Mo nitors können beliebige andere Anzeigemittel, wie bei spielsweise ein Projektor, verwendet werden. Anstelle der Computermaus können ebenfalls beliebige andere Cursorpo sitionierungsmittel, wie beispielsweise ein Track-Ball, ein Touch-Pad, ein Mouse-Stick, eine Touch-Screen oder Pfeiltasten einer Computertastatur verwendet werden.

Der Computer weist einen ersten Datenspeicher in Form ei nes Plattenspeichers auf, wie etwa einer Festplatte, CD oder Diskette, und einen zweiten Datenspeicher in Form eines Haupt- und/oder Arbeitsspeichers. Zwischen den Platten- und dem Arbeitsspeicher werden Daten übertragen. Die Übertragung erfolgt beispielsweise über übliche Schnittstellen und Bussysteme. Die Be- und/oder Verarbei tung von Daten erfolgt über eine CPU (Central Processing Unit).

Auf dem Plattenspeicher werden Daten gespeichert, auf die der Computer über entsprechende Kontrollmittel zugreifen kann. Der Computer kann weiterhin eine Netzwerkkarte um fassen, mit der er beispielsweise mit einem zweiten Com puter verbunden sein kann. Ferner kann der Computer ein sogenanntes Modem umfassen, mit dem er über das Telefon netz und seinem entsprechenden Provider mit dem Internet verbunden werden kann. Der Computer kann auch Teil einer direkten PC-Verbindung, weiterer Computer eines Computer- Clusters oder Server eines Netzwerks sein. Für die Über tragung zwischen den einzelnen Computern wird ein übli ches Protokoll angewandt, beispielsweise ein Basisproto koll für eine einfache physikalische Netzwerkverbindung, wie Ethernet oder Tokenring oder ein Internetprotokoll, wie ein TCP/IP (Transmission Control Protocol/Internet Protocol).

Vorab wird allgemein angemerkt, daß unter einer Tabelle in der Regel eine zweidimensionale Matrix von Zellen ver standen wird, wobei jede Dimension durch eine fortlaufen de Adresse gekennzeichnet ist. Für den Fall mehrerer Ta bellenseiten kann eine weitere Dimension hinzugekommen. Unter einer Zell-Adresse oder einer Zelle einer Tabelle wird ein Koordinatenpaar (X, Y) verstanden, mit dem die bestimmte Zelle in der Tabelle adressiert wird. Unter dem Zellinhalt wird der entsprechende Matrixeintrag verstan den, der durch eine Zell-Adresse gekennzeichnet ist. Mit einer Zeile sind alle die Zellen gemeint, deren Y- Koordinaten den gleichen Wert haben, während mit einer Spalte alle die Zellen gemeint sind, deren X-Koordinaten den gleichen Wert haben. Schließlich bezeichnet ein Zell bereich noch einen rechteckigen Tabellenausschnitt, der durch die zwei Adressen der oberen linken Ecke und der unteren rechten Ecke beschrieben ist.

Weiterhin sei an dieser Stelle bemerkt, daß das nachfol gende spezielle Datenbeispiel selbstverständlich nicht als einschränkend für die Erfindung zu verstehen ist. Die Beschreibung der Erfindung anhand eines speziellen Daten beispiels und nicht anhand einer abstrakteren Darstellung wurde lediglich zwecks leichterem Verständnis der Erfin dung gewählt.

Fig. 1 zeigt an einem speziellen Beispiel zu verarbei tende Daten, die in einer Tabellenform mit zwei Tabellen seiten angeordnet sind. Beispielsweise können solche Ta bellen besonders einfach mit einem Tabellenkalkulations programm, wie Excel, erstellt werden. Die in Fig. 1 ge zeigte Tabelle umfaßt nunmehr zwei Tabellenseiten, die mit Tabellenseite 1 und Tabellenseite 2 bezeichnet sind. Jede Tabellenseite enthält im wesentlichen einen ähnli chen Tabellenaufbau, wie aus der ersten Tabellenzeile je der Tabellenseite ersichtlich wird. So weist jede Tabel lenseite fünf Spalten auf, wobei diese Spalten mit den Überschriften "Hersteller", "Produkte", "Produktinforma tion", "Niederlassung" und "N-Ort" überschrieben sind. Unter der Überschrift "Hersteller" befindet sich in jeder Tabellenseite lediglich ein spezieller Hersteller als Da teninhalt, für die Tabellenseite 1 der Hersteller "Porsche" und für die Tabellenseite 2 der Hersteller "Mercedes". Es sei bemerkt, daß es sich bei den angegebe nen Dateninhalten der Tabellen sowie bei weiteren in der Beschreibung und der Zeichnung verwendeten Namen (Excel, usw.) um markenrechtlich geschützte Bezeichnungen handeln kann. Unter der Überschrift "Produkte" befindet sich in jeder Tabellenseite eine zweireihige Spalte. Für die Tabellenseite 1 sind die Produktbezeichnungen "911" und "928" in dieser Spalte enthalten, während für die Tabel lenseite 2 die Produktbezeichnungen "S-Klasse" und "M- Klasse" enthalten sind. Die Spalte mit der Überschrift "Produkte" wird jeweils mit einer Zelle beendet, welche den Eintrag "Endprodukte" enthält.

Die Spalte mit der Überschrift "Produktinformation" ent hält ebenfalls eine zweireihige Spalte. Der Eintrag "Schnelles Auto" in der oberen Zelle dieser Spalte der Tabellenseite 1 bezieht dabei auf den Eintrag "911" in der Spalte mit der Überschrift "Produkte", während der Eintrag "Langsameres Auto" in der unteren Zelle dieser Spalte der Tabellenseite 1 sich auf den Eintrag "928" der Spalte "Produkte" bezieht.

Ferner umfaßt jede Tabellenseite noch eine Spalte mit der Überschrift "Niederlassungen", bei der in der dazugehöri gen Spalte jeder Tabellenseite unterschiedlich viele Ein träge aufgelistet sind, beispielsweise die Einträge "Porsche-Zentrum", "Porsche-Zentrum", "Willbert" und "Reiger" für die Tabellenseite 1 und die Einträge "Mercedes-Hannes" und "Mercedes-Zentrum" für die Tabel lenseite 2. Diese Spalte ist ferner mit einer Zelle abge schlossen, welche den Eintrag "Endniederlassungen" ent hält.

Schließlich ist unter der Überschrift "N-Ort" in jeder Tabellenseite noch eine Spalte angeordnet, welche die gleiche Reihenzahl wie die zugehörige Spalte mit der Überschrift "Niederlassung" der jeweiligen Tabellenseite enthält. In den Zellen dieser Spalte sind die einzelnen Niederlassungsorte "Nürnberg", "München", "Hamburg" und "Köln" für die vier Niederlassungen des Porsche-Produktes (Tabellenseite 1) und die Niederlassungsorte "Nürnberg" und "München" für die zwei Niederlassungen des Mercedes- Produktes (Tabellenseite 2) enthalten.

Die oben mit Worten beschriebene Struktur der in der Ta belle der Fig. 1 enthaltenen Daten ist in Fig. 2 sche matisch dargestellt. Wie bereits erwähnt ist diese Struk tur bei den in der Tabelle angeordneten Datenelemente nicht in Strukturelementen ausgedrückt, sondern läßt sich nur über eine syntaktische Analyse der Anordnung der Da tenelemente in der Tabelle und ihrer jeweiligen Bedeutung ableiten. Selbstverständlich läßt sich mit den gleichen Daten aus der Tabelle der Fig. 1 auch eine ganz andere Struktur erzeugen. Häufig liegt jedoch der Fall vor, daß eine Struktur fest vorgegeben ist (beispielsweise als DTD-Vorlage, siehe unten), und die Daten nur noch in die se Struktur eingebettet werden müssen.

In der Fig. 2 sind die verschiedenen Baumhierarchien in absteigendes Folge mit "INLEVEL1" bis "INLEVEL4" bezeich net, wobei jeder Hierarchiestufe ein Name "LEVELNAME" zu geordnet wird. Der leichteren Lesbarkeit sind in der Fig. 2 noch neben jeden "LEVELNAME" die für das spezielle Beispiel der Fig. 1 sich ergebenden Namen aufgelistet, ebenso wie die speziellen Dateninhalte neben "INHALT".

Die als auf eine bestimmte Weise systematisch angeordne ten Datenelemente der Fig. 1 sollen nunmehr entsprechend dem erfindungsgemäßen Verfahren in Daten in einem voll strukturierten Datenformat umgewandelt werden. Hierzu wird eine Datenstrukturierungsschablone erstellt, wie sie für die zu verarbeitenden Daten der Fig. 1 in der Fig. 3 dargestellt sind. Die Datenstrukturierungsschablone ist aus einzelnen Strukturbeschreibungselementen aufgebaut, die in der Fig. 3 zeilenweise hintereinander geschrieben sind. Diese zeilenweise Auflistung dient lediglich dem einfacheren Verständnis der Erfindung, ist jedoch nicht einschränkend zu verstehen, da die einzelnen Strukturbe schreibungselemente auch über entsprechende Menus einer graphischen Benutzeroberfläche oder ähnlichem eingegeben und dargestellt werden können.

In den Zeilen 1 bis 7 sind sieben verschiedene Zeigerele mente als Strukturbeschreibungselemente aufgeführt, in der Zeile 9 ein Bedingungselement als Strukturbeschrei bungselement und in den Zeilen 11 bis 54 sind 44 ver schiedene Anweisungselemente als Strukturbeschreibungse lemente aufgelistet.

Die Zeigerelemente stellen Markierungen für ausgezeichne te Zellen einer Tabelle dar, die für die Strukturbe schreibung verwendet werden. Solche Zeigerelemente beste hen aus einem Namen, unter dem auf das entsprechende Zei gerelement zugegriffen werden kann, und einer Adresse, die auf zwei unterschiedliche Weise eingegeben werden kann: Einerseits kann nach einem bestimmten Zellinhalt gesucht werden, zum Beispiel dem Zellinhalt "Hersteller", wobei ferner noch ein Zellbereich eingegeben werden kann, innerhalb dem dieser Zellinhalt gesucht werden soll. An dererseits kann eine Zelladresse direkt adressiert wer den, indem das entsprechende Koordinatenpaar eingebbar ist. Beide Eingabearten können dabei absolut oder relativ zu anderen Zeigerelementen eingegeben werden. Als relati ve Eingabe sei das Beispiel genannt, bei dem der zu durchsuchende Zellbereich über zwei Zelladressen defi niert wird, die wiederum als Zeigerelemente eingegeben werden.

Grundsätzlich besteht eine im nicht vollstrukturierten Datenformat vorliegende Tabelle aus Zellen, die per se erst einmal nur Inhaltsdaten tragen, und die im vorlie genden Kontext als Datenzellen bezeichnet werden. Dabei kann der Inhalt auch ein Nullinhalt sein. Dabei gilt es nunmehr solche Datenzellen aus der Tabelle herauszugrei fen, die stellvertretend für eine Struktur in den zu ver arbeitenden Daten stehen. So sind im Beispiel der Fig. 1 alle Zellen der ersten Reihe sogenannte "versteckte" Strukturzellen, welche auf die Struktur in der Tabelle verweisen und diesen die Bezeichnungen "Hersteller", "Produkte", "Produktinformation", "Niederlassung" und "N- Ort" geben. Gleiches gilt auch für die beiden Zellen "Endprodukte" und "Endniederlassung" in jeder Tabellen seite. Diese Datenzellen sind in der Fig. 1 grau hinter legt. Die übrigen Zellen stellen alle Datenzellen dar.

Nachfolgend wird auf die einzelnen Zeigerelemente der in der Fig. 3 gezeigten Datenstrukturierungsschablone näher eingegangen. Dem in der Zeile 1 aufgeführten Zeigerele ment, wobei anstatt des Begriffs "Zeigerelements" in der Fig. 3 der Begriff "Anker" verwendet wird (siehe Spalte A), wird ein bestimmter Name zugeordnet, der in der Spal te B aufgeführt ist. So hat das Zeigerelement der Zeile 1 den Namen "hersteller". In der Spalte C ist der zu su chende Inhalt der Zelle angegeben. Für das Zeigerelement der Zeile 1 lautet der zu suchende Inhalt "Hersteller". Die nächsten beiden Spalten D, E dienen der Eingabe einer absoluten bzw. relativen Spaltenadresse der oberen, lin ken Zelle eines zu durchsuchenden Zellbereichs. Die Spal ten F, G stellen die absolute bzw. relative Reihenadresse der oberen, linken Zelle des zu durchsuchenden Zellbe reichs, die Spalten H, I die relative bzw. absolute Zei lenadresse der unteren, rechten Zelle des zu durchsuchen den Zellbereichs und die Spalten J, K die absolute bzw. relative Reihenadresse der unteren, rechten Zelle des zu durchsuchenden Zellbereichs dar. Für das Zeigerelement der Reihe 1 beginnt der zu durchsuchende Tabellenbereich also mit einer oberen, linken Zelle, welche die Koordina ten (1, 1) aufweist (im Falle eines leeren Feldes in den Spalten D und F für die Spaltenadresse bzw. in den Spal ten H und J für die Reihenadresse des jeweiligen Zeigere lementes handelt es sich um eine absolute Adressierung, im anderen Fall um eine relative Adressierung), und endet mit einer unteren, rechten Zelle, welche die Koordinaten (99.999,4) aufweist.

Für das Zeigerelement der Spalte 2, mit dem Namen "product" und dem zu suchenden Inhalt "Produkte" ist eine relative Adressierung des zu durchsuchenden Zellbereichs eingegeben. So wird die obere, linke Zelle des Zellbe reichs relativ zu den Koordinaten des Zeigerelementes "hersteller", d. h. dem Zeigerelement der Zeile 1, einge geben, wobei ferner ein Offset-Wert für die Spaltenkoor dinate der oberen, linken Zelle von -99.999, ein Offset- Wert für die Reihenkoordinate der oberen, linken Zelle von 0, ein Offset-Wert der Spaltenkoordinate der unteren, rechten Zelle von 99.999 und ein Offset-Wert der Reihen koordinate der unteren, rechten Zelle von 0 eingegeben wird. Entsprechendes gilt für die Zeigerelemente mit den Namen "endproduct", "productinfo", "dependance", "end dependance" und "dplace", die in den Zeilen 3 bis 7 dar gestellt sind, und die nach den folgenden Inhalten su chen: "Endprodukte", "Produktinformation", "Niederlassun gen", "Endniederlassungen", "N-Ort". Zusammenfassend kön nen mit diesen Zeigerelementen alle "versteckten" Struk turzellen der in der Fig. 1 gezeigten Tabelle adressiert werden. Da diese Zeigerelemente nach Inhalten für die Adressierung suchen, ist es unerheblich, an welcher abso luten Adresse sich die einzelnen "versteckten" Struktur zellen befinden, oder ob eine der Tabellenseite mehr Zei len als die anderen enthält. Ändert sich beispielsweise von einer zu verarbeitenden Gesamttabelle zur nächsten lediglich der Inhalt einer "versteckten" Strukturzelle, indem beispielsweise anstelle von "Produktinformation" nur "Information" in dieser "versteckten" Strukturzelle steht, so muß lediglich das Zeigerelement in der Zeile 4 in dessen Spalte C entsprechend geändert werden. Im übri gen bliebe die gesamte Datenstrukturierungsschablone un verändert auf alle Tabellen anwendbar, in der statt "Produktinformation" nur "Information" steht, die anson sten aber gleich strukturiert sind.

Auf das in der Zeile 9 aufgeführte Bedingungselement wird an dieser Stelle nicht näher eingegangen. Es sei jedoch erwähnt, daß hier beliebige (auch sehr komplexe) Funktio nen eingegeben werden können, die auf die einzelnen Zel len einer Tabellenkalkulation einwirken können und als Ergebnis die Werte "WAHR" oder "FALSCH" liefern. Diese Funktionen können beispielsweise in der Sprache des Ta bellenkalkulationsprogramms implementiert sein (z. B. als Makro-Befehle, etc.). So kann beispielsweise eine Bedin gung sein, daß der Zelleninhalt ein String sein muß. Eine andere Bedingung kann sein, daß der Zelleninhalt eine Web-Adresse sein muß, usw. Die Bedingungselemente können wiederum Zeigerelemente als Eingaben umfassen, mit denen beispielsweise ein bestimmter Tabellenbereich festgelegt, innerhalb dem jede Datenzelle der Bedingung genügen muß. So kann beispielsweise eine Bedingung lauten, daß inner halb des angegebenen Tabellenbereichs wenigstens eine Da tenzelle ausgefüllt sein muß. Die Bedingungselemente wer den nunmehr entweder interaktiv abgearbeitet werden, d. h. mit jeder Eingabe eines neuen Datenelements in die Tabel le der Fig. 1 wird geprüft, ob noch allen über die Be dingungselemente angegebenen Bedingungen genügt wird. Al ternativ können die Bedingungselemente auch erst nach Fertigstellung der Tabelle und vor Erzeugung der Daten in dem vollstrukturierten Datenformat abgearbeitet werden. Den Bedingungselementen kann ferner jeweils noch ein spe zieller Name zugeordnet werden, in dem dargestellten Bei spiel ist dies der Namen "x", unter dem die Bedingung an schließend von den einzelnen Anweisungselementen aufgeru fen werden kann.

Nachfolgend wird auf die in den Zeilen 11 bis 54 aufge führten Anweisungselemente, die in der Spalte A der Fig. 3 auch als "Mapping" bezeichnet werden, näher eingegan gen. Ein Anweisungselement in der Zeile 11, dessen Inhalt als "XML-start" in Spalte B aufgeführt ist, veranlaßt die Erzeugung einer XML-Datei mit den entsprechenden Headern.

Ein Anweisungselement in der Reihe 12 erzeugt einen für das XML-Format üblichen tag (siehe Spalte B) mit dem fe sten Inhalt "INLEVEL1", wie er in Spalte C angegeben ist. Dies gilt entsprechend für das Anweisungselement der Rei he 13, das ein Tag mit dem Inhalt "LEVELNAME" erzeugt.

Das Anweisungselement in Zeile 14 übergibt in reiner Da tenform den Inhalt "Hersteller", während das Anweisungse lement der Zeile 15 ein tag-end mit dem Inhalt "LEVELNAME" erzeugt. Die von diesen vier Anweisungsele menten erzeugten Daten in dem vollstrukturiertem Daten format sind in Fig. 4 in der ersten Zeile des Dokumentes dargestellt. Mit anderen Worten umfaßt die Datenstruktu rierungsschablone Anweisungselemente, mit der reine Strukturdaten zur Bezeichnung beispielsweise einer Hier archieebene erzeugt werden, "tag" und "tag-end" (diese Anweisungselemente werden in den Ansprüchen auch als er ste Anweisungselemente bezeichnet), sowie Anweisungsele mente, mit denen Datenelemente als spezielle Bezeichnung einer Hierarchieebene erzeugt werden, "Hersteller", oder mit denen die Datenelemente der zu verarbeitenden Daten als Inhalte in die Datenstruktur des vollstrukturierten Datenformats übergeben und dort eingebettet werden (siehe unten). Diese Anweisungselemente werden in den Ansprüchen auch als zweite Anweisungselemente bezeichnet.

Die in dem speziellen Datenbeispiel verwendeten Bezeich nungen einer Hierarchieebene können den "versteckten" Strukturzellen" der lediglich systematisch angeordneten Daten entnommen werden und mit den geeigneten Anweisung selementen in die Struktur des vollstrukturierten Daten formats eingebettet werden. Solche zusätzlichen Bezeich nungen für die einzelnen Hierarchieebenen sind jedoch nicht zwingend erforderlich.

Das Anweisungselement "raw" in der Zeile 14 kann entweder einen festen String enthalten, der so wie er in der Spal te C eingegeben ist als Datenelement der Struktur des vollstrukturierten Datenformats übergeben wird. Dieses Anweisungselement kann in den Spalten E und G auch den Namen zweier Zeigerelemente (für Spalten- und Reihena dressierung getrennt), beispielsweise "hersteller" ent halten, mit dem dasjenige Datenelement der zu verarbei tenden Daten als Inhalt übergeben werden kann, das mit dem Zeigerelement, ggf. unter Berücksichtigung eines Offset-Wertes (siehe unten), adressiert wird. So würde in dem speziellen Beispiel das Zeigerelement mit dem Namen "hersteller" auf die Datenzelle mit dem zu suchenden In halt "Hersteller" verweisen, so daß das Ergebnis dieses Operanden gerade der Inhalt dieser markierten Zelle, näm lich "Hersteller" ist.

In der Zeile 16 ist ein Schleifenbildungselement "sheet- loop" als Anweisungselement eingegeben, das veranlaßt, daß Datenelemente tabellenweise adressiert werden. In dem dargestellten Fall werden, da in den Spalten E bis H kei ne weiteren Einträge sind, alle vorhandenen Tabellensei ten von Tabellenseite 0 bis Tabellenseite 1 durchlaufen. In der Spalte D kann jeweils noch der Name eines beliebi gen Bedingungselements oder direkt eine Bedingung einge geben werden, die bei der Schleifenbildung berücksichtigt sein muß. Nur wenn diese Bedingung den Wert "WAHR" lie fert, wird das entsprechende Datenelement von dem Schlei fenbildungselement adressiert. Beispielsweise können Be dingungen so konstruiert werden, daß Schleifen nur in 5er-Schritten, etc. durchlaufen werden oder daß andere Schleifenbildungselemente bestimmte Datenzellen adressie ren usw. Hierbei sind keine Grenzen gesetzt, so daß im Prinzip noch so komplizierte Anordnungsmuster von Daten über die doch recht einfach aufgebauten Schleifenbildung selemente durchlaufen werden können. In den Spalten E bis H werden prinzipiell jeweils noch die Startdatenzelle über ein Zeigerelement ggf. mit einem Offset-Wert oder eine absolute Adressierung und entsprechend die Enddaten zelle eingegeben. Diese sind bei dem Schleifenbildungse lement der Zeile 16 jedoch nicht explizit eingegeben. Diese Adressierung wird weiter unten mit Bezug auf das Schleifenbildungselement der Zeile 25 näher erläutert. Wenn keine explizite Eingabe in diesen Spalten vorliegt, wie bei dem Schleifenbildungselement der Zeile 16, findet ein Durchlauf über alle vorhandenen Tabellenseiten statt.

Das Ende des Schleifenbildungselements über die Tabellen seiten ist in der Zeile 52 angegeben. Wird die Daten strukturierungsschablone beispielsweise interaktiv und über eine graphische Benutzeroberfläche dialog-geführt eingegeben, so werden die Endpositionen der Schleifenbil dungselemente automatisch von der den Dialog führenden Eingabesteuerung erstellt. Selbstverständlich kann die gesamte Datenstrukturierungsschablone auch automatisch aus einer DTD-Vorlage erstellt werden (document type de finition). Häufig ist der Ausgangspunkt für die Umwand lung von systematisch angeordneten Daten in Daten in ei nem vollstrukturierten Datenformant, daß von einer Nor mierungsgesellschaft (DIN-Norm-Gesellschaft, Datennormie rungsgesellschaft, etc.) oder einem Internet-Provider oder Handelspartner eine bestimmte Struktur für die Prä sentation von Daten vorgegeben wird. Diese Strukturvorga be wird in der Regel mit Hilfe der sogenannten DTD- Vorlagen weitergeleitet. Es ist nunmehr möglich, aus der DTD-Vorlage automatisch die Datenstrukturierungsschablone mit den entsprechenden Strukturbeschreibungselementen zu erstellen, so daß lediglich noch die einzelnen Zeigerele mente sowie ggf. der spezielle Typ der Schleifenbildungs elemente (ob spalten-, reihen oder tabellenadressierend) an die zu verarbeitenden Daten angepaßt werden müssen. Liegt eine solche DTD-Vorlage nicht vor, so werden zweck mäßig in einem ersten Schritt die Zeigerelemente für die zu verarbeitenden Daten erstellt und dann in einem zwei ten Schritt die Datenstrukturierungsschablone aufge stellt. Liegen beispielsweise die zu verarbeitenden Daten in vielen sehr ähnlichen Tabellen o. ä. vor, so können die Zeigerelemente auch automatisch mittels statistischer Auswertungen dieser Tabellen oder Verfahren der künstli chen Intelligenz erstellt werden.

In den Zeilen 17 und 18 übergibt jeweils ein Anweisungse lement "tag" die Strukturelemente mit den Bezeichnungen "INLEVEL2" und "LEVELNAME". Das Anweisungselement "raw" der Zeile 19 übergibt nunmehr den Inhalt der Datenzellen, die mittels des Zeigerelementes "hersteller" (Spalte E) und des zugehörigen Offset-Wertes 0 (Spalte F) für die Spaltenadresse und mittels des Zeigerelementes "hersteller" (Spalte G) und des zugehörigen Offset-Wertes 1 (Spalte H) für die Reihenadresse adressiert wird. Somit wird an dieser Stelle je nach Iterationsschritt des Schleifenbildungselementes "sheet-loop" der Zeile 16 der Inhalt "Porsche" oder "Mercedes" in die Struktur des vollstrukturierten Datenformats eingebettet, da das An weisungselement der Zeile 19 über das Zeigerelement "hersteller" und die Reihen-Offset-Wert von 1 auf die Da tenzelle unterhalb der "Überschrift"-Datenzelle "Herstel ler" zeigt. Selbstverständlich können bei diesen Anwei sungselementen die Reihen- und Spaltenadresse mittels un terschiedlicher Zeigerelemente adressiert werden.

Als letztes Beispiel für ein spezielles Strukturbeschrei bungselement wird auf das Schleifenbildungselement "row- loop" der Zeile 25 näher eingegangen, daß iterativ auf einanderfolgende Reihen einer bestimmten Spalte adres siert. Hierzu kann wiederum der Name eines Bedingungsele mentes oder direkt eine Bedingung in die Spalte D einge geben, die bei jedem Iterationsschritt erfüllt sein muß (siehe oben). Die Spalte, in der über einzelne Reihen iteriert werden soll, wird in der Spalte E mittels des Zeigerelementes "product" adressiert, wobei mit dem glei chen Zeigerelement und dem entsprechenden Offset-Wert in der Spalte F die entsprechende Reihe adressiert wird, mit der die Iteration beginnen soll. In dem speziellen Bei spiel werden hiermit abhängig von Tabellenseite die Da tenzellen "911" oder "S-Klasse" direkt unter der "Überschrift"-Datenzelle der zu verarbeitenden Daten (wegen des Offset-Wertes 1 in der Spalte F) als Startda tenzelle der Iteration adressiert. Entsprechendes gilt auch für die Enddatenzelle, die über das Zeigerelement "endproduct" in Spalte G und den Offset-Wert -1 in Spalte H adressiert wird, und damit die Datenzellen mit den In halten "928" und "M-Klasse" adressiert. In der Spalte I ist noch der Name für das Schleifenbildungselement der Zeile 25 eingegeben, mit dem dieses Strukturbeschreibung selement von anderen Strukturbeschreibungselementen, wie ersten und zweiten Anweisungselementen und weiteren Schleifenbildungselementen für die Adressierung, usw. aufgerufen werden kann.

Die Fig. 4 zeigt das Ergebnis der Umwandlung der Daten in den beiden Tabellenseiten der Fig. 1 mit Hilfe des in Fig. 3 gezeigten Datenstrukturierungsschablone in voll strukturierte Daten. Wie aus der Fig. 4 ersichtlich wird sind die mittels der ersten Anweisungselemente übergebe nen Bezeichnungen der einzelnen Strukturelemente in spit zen Klammern geschrieben, z. B. "<INLEVEL1<" bzw. "</INLEVEL<", während die mittels der zweiten Anweisung selemente übergebenen Dateninhalte der Datenelemente der zu verarbeitenden Daten immer zwischen zwei Strukturele menten aufgeführt sind, z. B. "<LEVELNAME<Hersteller- </LEVELNAME<" oder "<INHALT<Schnelles Auto</INHALT<".

Es sei nochmals erwähnt, daß das oben aufgeführte Bei spiel lediglich eine von vielen Möglichkeiten widerspie gelt, in denen die zu verarbeitenden Daten vorliegen, in dem geschilderten Beispiel nämlich in Tabellen von einem Tabellenkalkulationsprogramm geordnet. Die Erfindung ist selbstverständlich auf alle anderen Fälle von systema tisch angeordneten Daten anwendbar, beispielsweise Daten benbanken, die von beliebigen Datenbanksystemen erstellt wurden, etc. Mit der von der Erfindung geschaffenen Da tenstrukturierungsschablone, die aus den einzelnen oben aufgeführten Strukturbeschreibungselementen zusammenge stellt wird, können all diese systematisch angeordneten Daten - unabhängig von dem zugrundeliegenden Datenord nunsprogramm (Tabellenkalkulationsprogramm, Datenbanksy stem, Programmiersprachen-Editor, etc.) in vollstruktu rierte Daten umgewandelt werden. Es ist lediglich erfor derlich, die Strukturbeschreibungselemente zur Ausfüh rungs auf dem jeweiligen Datenordnungsprogramm ausführbar zu kompilieren. Dabei können selbstverständlich auch wei tere Strukturbeschreibungselemente mit anderen Funktionen erstellt werden, die in der obigen Beschreibung noch nicht erwähnt sind. Es hat sich jedoch gezeigt, daß die oben aufgeführten Strukturbeschreibungselemente eine aus reichende und - insbesondere intuitiv leicht erfaßbare Handhabungsmöglichkeit bieten.

Zudem diente die Darstellung der einzelnen Strukturbe schreibungselemente in einer Tabelle, bei der in einzel nen Zellen der Tabelle die für die entsprechenden Struk turbeschreibungselemente erforderlichen Eingaben aufge führt sind, auch nur einem leichteren Verständnis der Er findung. Selbstverständlich sind der Darstellung der Strukturbeschreibungselementen keine Grenzen gesetzt, wo bei zur Zeit eine (nicht dargestellte) dialog-geführte Eingabe über eine graphische Benutzeroberfläche bevorzugt wird.

Claims

1. Verfahren zum Verarbeiten von Daten, die mehrere sy stematisch angeordnete Datenelemente umfassen, zur Umwandlung in Daten, die in einem vollstrukturierten Datenformat vorliegen, bei welchem:

a) eine dem vollstrukturierten Datenformat entspre chende Datenstrukturierungsschablone erstellt wird, welche Strukturbeschreibungselemente um faßt, die an die Datenstruktur der systematisch angeordneten Datenelemente der zu verarbeitenden Daten angepaßt werden,
b) diese Datenstrukturierungsschablone an den zu verarbeitenden Daten angewandt wird, indem mit tels der Strukturbeschreibungselemente
- 1. die erforderliche Datenstruktur des voll strukturierten Datenformats erzeugt wird, und
- 2. die Datenelemente der zu verarbeitenden Da ten in die erzeugte Datenstruktur als voll strukturierte Daten ausgegeben werden.

2. Verfahren nach Anspruch 1, bei welchem die Datenele mente der zu verarbeitenden Daten in adressierbaren Datenzellen angeordnet sind.

3. Verfahren nach Anspruch 2, bei welchem die Datenzel len tabellarisch angeordnet sind.

4. Verfahren nach Anspruch 2 oder 3, bei welchem die Strukturbeschreibungselemente Zeigerelemente umfas sen, die veranlassen, daß jeweils auf eine bestimmte Datenzelle gezeigt wird.

5. Verfahren nach Anspruch 4, bei welchem die Struktur beschreibungselemente Zeigerelemente umfassen, bei denen die Adresse der aufzuzeigenden Datenzelle di rekt eingebbar ist.

6. Verfahren nach Anspruch 4 oder 5, bei welchem die Strukturbeschreibungselemente Zeigerelemente umfas sen, bei denen jeweils ein bestimmter Inhalt einge gebbar ist, und die veranlassen, daß jeweils auf die Adresse einer Datenzelle mit diesem Inhalt gezeigt wird.

7. Verfahren nach Anspruch 6, bei welchem die Struktur beschreibungselemente Zeigerelemente umfassen, bei denen für die einzelnen Adressen-Koordinaten, insbe sondere die Spaltenadresse und die Reihenadresse, unterschiedliche Inhalte eingebbar sind.

8. Verfahren nach Anspruch 6 oder 7, bei welchem die Strukturbeschreibungselemente Zeigerelemente umfas sen, bei denen zusätzlich zum Inhalt noch ein Tabel lenbereich eingebbar ist, und die veranlassen, daß innerhalb des eingegebenen Tabellenbereichs nach Da tenzellen mit dem eingegebenen Inhalt gesucht wird.

9. Verfahren nach Anspruch 5 oder 8, bei welchem die Strukturbeschreibungselemente Zeigerelemente umfas sen, bei denen die Adresse der aufzuzeigenden Daten zelle bzw. der Tabellenbereich als absolute Adresse eingebbar ist.

10. Verfahren nach Anspruch 5 oder 8, bei welchem die Strukturbeschreibungselemente Zeigerelemente umfas sen, bei denen die Adresse der aufzuzeigenden Daten zelle bzw. der Tabellenbereich relativ zu anderen Zeigerelementen eingebbar ist.

11. Verfahren nach einem der Ansprüche 4 bis 10, bei welchem die Strukturbeschreibungselemente Zeigerele mente umfassen, bei denen zusätzlich ein Offset-Wert eingebbar ist, und die veranlassen, daß auf Daten zellen unter Berücksichtigung des Offset-Werts ge zeigt wird.

12. Verfahren nach einem der Ansprüche 4 bis 11, bei welchem die Strukturbeschreibungselemente Schleifen bildungselemente umfassen, die veranlassen, daß ite rativ Datenelemente der zu verarbeitenden Daten von einer eingebbaren Startdatenzelle bis zu einer ein gebbaren Enddatenzelle adressiert werden.

13. Verfahren nach Anspruch 12, bei welchem die Struk turbeschreibungselemente Schleifenbildungselemente umfassen, bei denen die Start- und/oder Enddatenzel len als Zeigerelemente und/oder weitere Schleifen bildungselemente eingebbar sind.

14. Verfahren nach Anspruch 12 oder 13, bei welchem die Strukturbeschreibungselemente Schleifenbildungsele mente umfassen, die veranlassen, daß Datenelemente spaltenweise, reihenweise oder tabellenweise adres siert werden.

15. Verfahren nach einem der Ansprüche 12 bis 14, bei welchem die Strukturbeschreibungselemente Schleifen bildungselemente umfassen, bei denen wenigstens ein Offset-Wert eingebbar ist, und die veranlassen, daß iterativ Datenelemente von einer eingebbaren Start datenzelle bis zu einer eingebbaren Enddatenzelle unter Berücksichtigung des wenigstens einen Offset- Werts adressiert werden.

16. Verfahren nach einem der vorhergehenden Ansprüche, bei welchem die Strukturbeschreibungselemente Bedin gungselemente umfassen, bei denen eine beliebige Be dingung eingebbar ist, und die veranlassen, daß ein logischer Wert ausgegeben wird, dessen Wert davon abhängt, ob die Bedingung erfüllt ist oder nicht.

17. Verfahren nach Anspruch 16, bei welchem die Struk turbeschreibungselemente Bedingungselemente umfas sen, bei denen zusätzlich ein Tabellenbereich entwe der direkt oder über Zeiger- und Schleifenbildungse lemente eingebbar ist, und die veranlassen, daß der Tabellenbereich auf die eingegebene Bedingung hin untersucht wird.

18. Verfahren nach einem der Ansprüche 4 bis 17, bei welchem den Zeiger-, Schleifenbildungs- und/oder Be dingungselementen jeweils ein Name eingebbar ist, mit dem auf das jeweilige Zeiger-, Schleifenbil dungs- und/oder Bedingungselement zugegriffen werden kann.

19. Verfahren nach einem der Ansprüche 12 bis 18, bei welchem die Strukturbeschreibungselemente Schleifen bildungselemente umfassen, denen eine Bedingung und/oder der Name eines Bedingungselement eingebbar ist, und die veranlassen, daß iterativ lediglich die Datenzellen adressiert werden, welche die entspre chende Bedingung erfüllen.

20. Verfahren nach einem der vorhergehenden Ansprüche, bei welchem die Strukturbeschreibungselemente erste Anweisungselemente umfassen, denen ein bestimmter Inhalt eingebbar ist, und die veranlassen, daß ein Strukturelement mit dem eingegebenen Inhalt des vollstrukturierten Datenformats erzeugt wird.

21. Verfahren nach einem der vorhergehenden Ansprüche, bei welchem die Strukturbeschreibungselemente zweite Anweisungselemente umfassen, denen ein bestimmter Inhalt eingebbar ist, und die veranlassen, daß be stimmte Datenelemente der zu verarbeitenden Daten in die Struktur des vollstrukturierten Datenformats eingebettet werden.

22. Verfahren nach Anspruch 20 oder 21, bei welchem die Strukturbeschreibungselemente erste und/oder zweite Anweisungselemente umfassen, bei denen der Inhalt mittels eines Zeigerelementes eingebbar ist.

23. Verfahren nach Anspruch 22, bei welchem die Struk turbeschreibungselemente erste und/oder zweite An weisungselemente umfassen, bei denen der Inhalt mit tels Zeigerelementen eingebbar ist, wobei für jede Adressen-Koordinate, insbesondere für die Spalten- und Reihenadresse, ein unterschiedliches Zeigerele ment eingebbar ist.

24. Verfahren nach Anspruch 22 oder 23, bei welchem die Strukturbeschreibungselemente erste und/oder zweite Anweisungselemente umfassen, bei denen der Inhalt mittels eines Zeigerelementes und zusätzlich eines Offset-Wertes eingebbar ist.

25. Verfahren nach einem der Ansprüche 20 bis 24, bei welchem die Abfolge erster und zweiter Anweisungse lemente und Schleifenbildungselemente in der Daten strukturierungsschablone anhand der Struktur des zu erzeugenden vollstrukturierten Datenformats eingege ben wird.

26. Verfahren nach Anspruch 25, bei welchem die Abfolge automatisch aus einer als document type definition vorliegenden Struktur des vollstrukturierten Daten formats erstellt wird.

27. Verfahren nach Anspruch 25 oder 26, bei welchem die Zeiger- und/oder Bedingungsanweisungen manuell ein gegeben werden.

28. Verfahren nach einem der Ansprüche 25 bis 27, bei welchem in einem ersten Schritt die Zeiger- und/oder Bedingungsanweisungen und in einem zweiten Schritt die ersten und zweiten Anweisungselemente und Schleifenbildungselemente eingegeben werden.

29. Verfahren nach einem der Ansprüche 4 bis 28, bei welchem die Zeigerelemente automatisch anhand stati stischer Auswertungen einer Vielzahl der zu verar beitenden Daten erstellt werden.

30. Verfahren nach einem der vorhergehenden Ansprüche, bei welchem die Daten in dem vollstrukturierten Da tenformat unmittelbar mit der Eingabe neuer Da tenelemente der zu verarbeitenden Daten erzeugt wer den.

31. Verfahren nach einem der Ansprüche 1 bis 29, bei welchem die Daten in dem vollstrukturierten Daten format erst nach Eingabe aller Datenelemente der zu verarbeitenden Daten erzeugt werden.

32. Verfahren nach einem der vorhergehenden Ansprüche, bei welchem die Strukturbeschreibungselemente der Strukturschablone in Ausführungsbefehle umgewandelt werden, welche von einer die Datenelemente der zu verarbeitenden Daten systematisch anordnenden Daten anordnungssprache verstanden wird.

33. Computersystem zum Verarbeiten von Daten, die mehre re systematisch angeordnete Datenelemente umfassen, zur Umwandlung in Daten, die in einem vollstruktu rierten Datenformat vorliegen, wobei das Computersy stem wenigstens einen Datenspeicher, einen Anschluß für einen Bildschirm und einen Anschluß für ein Ein gabemittel zum manuellen Eingeben von Daten in den Datenspeicher umfaßt, zum Betreiben eines Verfahrens nach einem der vorhergehenden Ansprüche.

34. Computerprogrammprodukt, welches in einem Speicher medium speicherbar ist und welches Softwarecodeab schnitte umfaßt, mit denen Schritte nach einem der vorhergehenden Verfahrensansprüche ausgeführt wer den, wenn das Computerprogrammprodukt auf einem Com putersystem ausgeführt wird.

35. Internetserver mit einem Speichermedium, auf welchem ein Computerprogrammprodukt nach Anspruch 34 gespei chert ist.