DE60112188T2 - Methode und system zur erzeugung strukturierter dokumente für verschiedene darstellungsweisen - Google Patents

Methode und system zur erzeugung strukturierter dokumente für verschiedene darstellungsweisen Download PDF

Info

Publication number
DE60112188T2
DE60112188T2 DE60112188T DE60112188T DE60112188T2 DE 60112188 T2 DE60112188 T2 DE 60112188T2 DE 60112188 T DE60112188 T DE 60112188T DE 60112188 T DE60112188 T DE 60112188T DE 60112188 T2 DE60112188 T2 DE 60112188T2
Authority
DE
Germany
Prior art keywords
document
objects
metafile
display
definition file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60112188T
Other languages
English (en)
Other versions
DE60112188D1 (de
Inventor
S. Evan HUANG
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XMLCities Inc
Original Assignee
XMLCities Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XMLCities Inc filed Critical XMLCities Inc
Publication of DE60112188D1 publication Critical patent/DE60112188D1/de
Application granted granted Critical
Publication of DE60112188T2 publication Critical patent/DE60112188T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/157Transformation using dictionaries or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)
  • User Interface Of Digital Computer (AREA)

Description

  • bzw,HINTERGRUND DER ERFINDUNG
  • Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft allgemein das Gebiet der Dokumentenverarbeitung und der elektronischen Veröffentlichungssysteme und betrifft insbesondere ein Verfahren und eine Vorrichtung zur Erzeugung von strukturierten Dokumenten mit benutzerdefinierten Dokumenttypdefinitionen. Die vorliegende Erfindung betrifft auch einen Mechanismus, der für Benutzer bereit gestellt wird, um unter Verwendung des Verfahrens und der Vorrichtung unstrukturierte Dokumente für verschiedene Präsentationen zu konvertieren, wobei die unstrukturierten Dokumente als durch eine Autorenanwendung (z.B. Textverarbeitung) erstellte, bearbeitete oder verwaltete Dateien definiert sind.
  • Beschreibung des Standes der Technik
  • Das Internet ist ein schnell wachsendes Kommunikationsnetzwerk von untereinander verbundenen Computern über die ganze Welt. Zusammen bilden diese Millionen von vernetzten Computern einen riesigen Aufbewahrungsort für hyperverlinkte Informationen, der von jedem der angeschlossenen Computer von überall aus und jederzeit mühelos zugänglich ist. Da jedes Jahr Millionen von Webseiten erzeugt und zu diesem riesigen Aufbewahrungsort hinzugefügt werden, besteht ein gewaltiger Bedarf, Dokumente, wie Präsentationen, Datenblätter oder Broschüren, schnell und einfach in ein Format zu konvertieren, das anderen Anwendungen oder Computern im Internet präsentierbar oder für diese zugänglich ist.
  • Es ist wohlbekannt, dass ein bevorzugtes Format, das einer im Netz stöbernden Anwendung (z.B. einem Browser) präsentierbar ist, in einer Auszeichnungssprache, wie HyperText Markup Language (HTML), Extensible Markup Language (XML), Standard Generalized Markup Language (SGML) oder Wireless Markup Language (WML) vorliegt. Dateien oder Dokumente, die so für Anwendungen zum Stöbern im Netz erstellt, bearbeitet oder verwaltet werden, werden gewöhnlich als strukturierte Dateien oder Dokumente bezeichnet. Unter all den Vorteilen der strukturierten Dokumente eröffnet die Fähigkeit, benutzerdefinierte Dokumenttypdefinitionen (DTD) oder Dokumentschemadefinition bereit zu stellen, ein neues Musterbeispiel für den Informationsaustausch oder für die Informationsspeicherung. Jedoch besteht die Herausforderung darin, wie man mit beliebig benutzerdefinierten DTD strukturierte Dokumente erzeugt.
  • Ein unstrukturiertes Dokument mit spezifischer DTD kann entweder aus einem unstrukturierten Dokument erzeugt oder aus einem strukturierten Dokument mit einer anderen Art von DTD konvertiert werden. Es gibt mehrere Editoren zum Erzeugen von Strukturdokumenten. Die beispielhaften Editoren schließen Adobe FrameMaker, Arbortext Epic und SoftQuad XMetal ein. Diese Editoren stellen gewöhnlich eine strukturelle Ansicht mit einer Textverarbeitungsansicht bereit, wobei die Textverarbeitungsansicht der traditionellen Textverarbeitungsumgebung für ein unstrukturiertes Dokument gleicht, während die Strukturansicht die Dokumentstruktur von Datenelementen enthält, die in einer gewissen DTD definiert sind. Um in diesen Editoren aus Gekritzel ein strukturiertes Dokument zu erzeugen, muss ein Benutzer gewöhnlich in der Textverarbeitungsansicht ein unstrukturiertes Dokument erzeugen. Mit einem gewünschten geladenen DTD konstruiert der Benutzer in der Strukturansicht einen Dokumentstrukturbaum gemäß in der DTD definierten Dokumentelementen. Typischerweise ist der Benutzer mit Verfahren befasst, mit denen die Datenelemente aus dem erzeugten Dokument in den Dokumentstrukturbaum kopiert und eingefügt oder herübergezogen und losgelassen werden.
  • Um in diesen Editoren ein strukturiertes Dokument mit einer DTD in eine andere DTD zu konvertieren, muss man das strukturierte Dokument laden, um die Anhängsel und Attribute von Dokumentelementen aus einer DTD in eine andere umzuwandeln, und um die Datenelemente zu versetzen oder neue Datenelemente zu parsen, die mit umdefinierten Dokumentelementen in der neuen DTD verbunden sind.
  • Unter den oben beschriebenen Verfahren stellt die Verknüpfung zwischen Datenelementen und Dokumentelementen eine kritische und mühevolle Bearbeitung zur Erzeugung oder Konvertierung eines unstrukturierten oder strukturierten Dokuments in ein strukturiertes Dokument mit spezifischer DTD dar. Mehrere Ansätze sind vorgeschlagen worden, um die Datenelemente und die Dokumentelemente zu verknüpfen, um die Erzeugung des strukturierten Dokuments zu vereinfachen. Zum Beispiel gewinnt ein Schlüsselwortgewinnungs-Ansatz aus einem unstrukturierten Dokument ein für die Dokumentstruktur repräsentatives Schlüsselwort, und die Schlüsselwort/Text-Paare werden als Verknüpfung zwischen Dokumentelementen und Datenelementen benutzt. Ein Koordinaten-Ansatz verknüpft Datenelemente mit Auszeichnungssprachenanhängseln in Dokumentelementen durch Sortieren der Koordinaten für Koordinatendokumente. Ein Datenstruktur- oder Logikstruktur-Ansatz analysiert die Dokumentstruktur, indem die vorbestimmten Muster auf Übereinstimmung geprüft werden, und parst die Datenelemente auf der Grundlage der analysierten Dokumentelemente. Nichtsdestotrotz hat keiner der obigen Ansätze in Betracht gezogen, Kennungen (z.B. Schriftinformationen) zu verwenden, um die Datenelemente und Dokumentelemente zu verknüpfen. Es besteht daher ein Bedarf an einem generischen Ansatz, um die Kennungsinformationen in benutzerdefinierten Dokumenttypdefinitionen zu nutzen, um Datenelemente und Dokumentelemente zur Erzeugung strukturierter Dokumente zu verknüpfen.
  • Zusätzlich sind die Vorgehensweisen, die von den beispielhaften Editoren verlangt werden, etwas langweilig und mühsam und sind inhärent teuer. Ziemlich häufig muss ein Geschäft, das viele Dokumente zu konvertieren hat, das Verfahren wegen der mit dem Konversionsvorgang verbundenen Ineffizienz und Langsamkeit an Dritte vergeben. Auf der anderen Seite ist das von einem Diensteanbieter durchgeführte Konversionsverfahren schwierig zu quantifizieren, da es in Abhängigkeit von den Komplexitäten der Dokumente hauptsächlich um manuelle und wiederholte Prozesse geht. Es besteht somit ein anderer Bedarf an einem Mechanismus zum Quantifizieren der Konversion der unstrukturierten Dokumente in strukturierte Dokumente für verschiedene Präsentationen in einer kostenermittelbaren Weise.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die vorliegende Erfindung ist in Anbetracht der oben beschriebenen Probleme und Bedürfnisse gemacht worden und hat besondere Anwendungen für Präsentationen über das Internet. Eines der Merkmale der vorliegenden Erfindung ist die Verwendung von Kennungen in einer DTD-Datei, um ausgewählte Objekte oder Gruppenobjekte zu verknüpfen, so dass Verknüpfungsinformationen von ausgewählten Objekten oder Gruppenobjekten die Erzeugung von Dateien in einer für Präsentationen auf verschiedenen Medien geeigneten Auszeichnungssprache erleichtern können.
  • Die vorliegende Erfindung kann als ein Verfahren, ein System, ein Produkt oder in anderen praktischen Formen implementiert werden. Gemäß einer Implementierung ist die vorliegende Erfindung ein Verfahren zur Erzeugung von strukturierten Dokumenten. Das Verfahren empfängt eine Definitionsdatei, die Dokumenttypdefinitionen (DTD) enthält, und zeigt zusammen mit der Definitionsdatei eine Metadatei an, wobei die Metadatei eine Anzahl von anzeigbaren Objekten und jeweiligen Anzeigeattributen über jedes der anzeigbaren Objekte enthält, um zu bestimmen, wie die anzeigbaren Objekte in einer Anzeige angezeigt werden.
  • Die Definitionsdatei enthält eine Struktur für Dokumentelemente, von denen jedes einem der anzeigbaren Objekte in der Metadatei entspricht. Einige der Dokumentelemente enthalten eine Anzahl von Kennungen, wobei jede der Kennungen einem der Dokumentelemente zugeordnet ist. In einer Implementierung sind die Kennungen Zahlen und/oder Buchstaben. In einer anderen Implementierung sind die Kennungen ein oder mehrere von einem Schriftnamen, einem Farbnamen, einer Größe, einer Schriftart, einer Farbe, einer Gestaltung, verschiedenen Effekten oder anderen Symbolen. Das Verfahren verknüpft mindestens eine der Kennungen mit einem der anzeigbaren Objekte.
  • Gemäß einer anderen Implementierung ist die vorliegende Erfindung ein Verfahren zum Erzeugen von strukturierten Dokumenten, wobei das Verfahren umfasst:
    Empfangen einer Definitionsdatei, die Dokumenttypdefinitionen enthält;
    Anzeigen einer Metadatei zusammen mit der Definitionsdatei, wobei die Metadatei eine Anzahl von anzeigbaren Objekten und jeweilige Anzeigeattribute über jedes der anzeigbaren Objekte enthält, um zu bestimmen, wie die anzeigbaren Objekte in einer Anzeige angezeigt werden; und
    Verknüpfen von mindestens einer der Definitionen in der Definitionsdatei mit einem der anzeigbaren Objekte.
  • Ziele und Vorteile zusammen mit den vorangehend genannten werden bei der Ausübung der Erfindung in der folgenden Beschreibung erreicht und führen zu den in den begleitenden Zeichnungen dargestellten Ausführungsformen.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Diese und andere Merkmale, Aspekte und Vorteile der vorliegenden Erfindung werden unter Betrachtung der nachfolgenden Beschreibung, der beigefügten Ansprüche und der begleitenden Zeichnungen besser verständlich, wobei:
  • 1A eine grundlegende Systemkonfiguration zeigt, in der die vorliegende Erfindung gemäß einer bevorzugten Ausführungsform implementiert werden kann;
  • 1B zeigt interne Konstruktionsblöcke eines Systems, in dem die vorliegende Erfindung implementiert und ausgeführt werden kann, um gewünschte Ergebnisse zu erzielen, die bei der vorliegenden Erfindung ins Auge gefasst werden;
  • 2A zeigt ein Beispiel eines unstrukturierten Dokuments, das von einem Autorenwerkzeug erstellt, bearbeitet oder verwaltet wird;
  • 2B ist ein Beispiel von Dokumenttypdefinitionen (DTD);
  • 2C zeigt ein strukturiertes Dokument für das in 2A dargestellte unstrukturierte Dokument auf der Grundlage der Dokumenttypdefinitionen (DTD) in 2B;
  • 3A veranschaulicht ein funktionales Schaubild gemäß einer Ausführungsform der vorliegenden Erfindung;
  • 3B zeigt eine visuelle Umgebung, die ein Konvertierungsmodul gemäß einer Ausführungsform der vorliegenden Erfindung implementiert;
  • 3C zeigt ein Beispiel eines im XML-Format gestalteten Formatierungsblattes mit Bezug auf anzeigbare Objekte in einer in 3B dargestellten Metadatei;
  • 3D zeigt eine beispielhafte Meldung aus einem Dongle;
  • 3E zeigt ein Verarbeitungsfließbild einer Verwendung eines Produkts, das eine Implementierung eines Konvertierungsmoduls gemäß einer Ausführungsform der vorliegenden Erfindung einschließt;
  • 4 veranschaulicht ein Blockdiagramm einer Datenverarbeitungsvorrichtung, die unter Verwendung von strukturbasierten Schriftinformationen unstrukturierte oder strukturierte Dokumente importiert, bearbeitet und in strukturierte Dokumente mit benutzerdefinierten DTD konvertiert;
  • 5 ist eine Verknüpfungstabelle für in 2B in DTD definierte Dokumentelemente und Schriftattribute;
  • 6 zeigt ein Bearbeitungsergebnis für das unstrukturierte Dokument in 1, wo jedem geparsten Datenelement basierend auf der Verknüpfungstabelle in 5 Schriftattribute zugeordnet worden sind;
  • 7 zeigt einen Transformationsvorgang, der die geparsten Datenelemente in 6 in das gewünschte strukturierte Dokument mit den beispielhaften DTD in 2B konvertiert;
  • 8 ist ein strukturiertes Zwischendokument, das geparste Datenelemente mit zugeordneten Schriftkennungen enthält, die mit einer Liste von Schrift-Dokumentelementen verknüpft sind;
  • 9 zeigt einen Transformationsvorgang, der das strukturierte Zwischendokument in 6 in das gewünschte strukturierte Dokument mit DTD in 2 konvertiert; und
  • 10 zeigt eine Implementierung des Transformationsvorgangs in 9 unter Verwendung der Extensible Style Language for Transformation (XSLT).
  • AUSFÜHRLICHE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
  • In der nachfolgenden ausführlichen Beschreibung der vorliegenden Erfindung sind zahlreiche spezifische Einzelheiten angegeben, um für ein gründliches Verständnis der vorliegenden Erfindung zu sorgen. Jedoch wird für den Fachmann ersichtlich werden, dass die vorliegende Erfindung ohne diese spezifischen Einzelheiten ausgeführt werden kann. In anderen Fällen sind wohlbekannte Verfahren, Vorgehensweisen, Komponenten und Schaltungsanordnungen nicht ausführlich beschrieben worden, um es zu vermeiden, das Verständnis von Aspekten der vorliegenden Erfindung unnötig zu erschweren. Die ausführliche Beschreibung wird zum größten Teil als Vorgehensweisen, Logikblöcke, Verarbeitung und andere symbolische Darstellungen präsentiert, die direkt oder indirekt den Funktionsweisen von mit Netzwerken verbundenen Datenverarbeitungsvorrichtungen ähneln.
  • Diese Verfahrensbeschreibungen und Verfahrensdarstellungen sind die Mittel, die von Experten oder Fachleuten benutzt werden, um den Kern ihrer Arbeit anderen Fachleuten am wirkungsvollsten zu übermitteln.
  • Wenn hier auf "eine Ausführungsform" oder "eine Ausführung" verwiesen wird, bedeutet dies, dass ein bestimmtes Merkmal, eine bestimmte Struktur oder Eigenschaft, die in Verbindung mit der Ausführungsform beschrieben wird, in mindestens einer Ausführungsform der Erfindung enthalten sein kann. Das Erscheinen der Wortfolge "bei einer Ausführungsform" an verschiedenen Stellen in der Beschreibung soll sich nicht notwendigerweise immer auf dieselbe Ausführungsform beziehen, noch schließen getrennte oder alternative Ausführungsformen sich gegenseitig aus. Weiter zeigt die Reihenfolge von Blöcken in Verfahrensfließbildern oder Schaubildern, die eine oder mehrere Ausführungsformen der Erfindung darstellen, nicht inhärent irgendeine bestimmte Reihenfolge an, noch impliziert sie irgendwelche Beschränkungen der Erfindung.
  • Es wird nun auf die Zeichnungen Bezug genommen, in denen sich gleiche Bezugszeichen über die mehreren Ansichten hinweg auf gleiche Teile beziehen. 1A zeigt eine grundlegende Systemkonfiguration, in der die vorliegende Erfindung gemäß einer bevorzugten Ausführungsform implementiert werden kann. Unstrukturierte Dokumente, wie Produktbeschreibungen, Funktionslisten und Preisverzeichnisse können unter Verwendung eines auf einem Computer 100 ausgeführten Autorenwerkzeugs erzeugt werden. Dateien oder Dokumente, die von einem Autorenwerkzeug erzeugt worden sind, werden als unstrukturierte Dokumente bezeichnet. Beispielhafte Autorenwerkzeugs können Microsoft Office (z.B. Microsoft Word, Microsoft PowerPoint und Microsoft Excel), Adobe FrameMaker und Adobe Photoshop einschließen. Die unstrukturierten Dokumente können in eine Rechenvorrichtung 102 geladen werden, die als zentraler Aufbewahrungsort dienen kann. Die Rechenvorrichtung 102 kann eine Serverstation von Sun Microsystems (www.sun.com) oder ein Personal-Computer sein, in den eine kompilierte und verkettete Version von einer die vorliegende Erfindung realisierenden Ausführungsform geladen worden ist.
  • In einem Rahmen sind der Computer 100 und die Rechenvorrichtung 102 untrennbar und führen den Dokumentenkonvertierungsprozess durch und erzeugen strukturierte Dokumente, die schließlich in einem Auszeichnungssprachenformat, wie XML oder HTML, dargestellt werden können. Bei einer Anwendung werden die in XML dargestellten strukturierten Dokumente in das HTML-Format konvertiert und werden durch ein privates Netzwerk 110 für einen Dienste-Server 104 verfügbar, der beherbergt, was allgemein als Standort im www (world wide web) bekannt ist.
  • In einer Situation verwendet ein Benutzer einen Personal-Computer 106, der mit einer stöbernden Anwendung arbeitet, und ist mit einem Datennetzwerk 108 verbunden, um auf Dateien auf dem Dienste-Server 104 zuzugreifen. Diese Dateien, die von den strukturierten Dokumenten im Computer 102 repräsentiert werden, können die neusten Produktinformationen darstellen, die ursprünglich durch ein Autorenwerkzeug erstellt worden sind.
  • Wie unten erläutert werden wird, ist die vorliegende Erfindung nicht auf die Internet-Anwendungen beschränkt. Sie kann in einzelnen Computern ausgeführt werden, in denen Benutzer häufig Dokumente in verschiedenen Textverarbeitungsformaten, wie FrameMaker oder Microsoft World erzeugen. Die vorliegende Erfindung kann benutzt werden, um Dokumente ungeachtet der genauen Textverarbeitungsformate in eine Auszeichnungsdarstellung zu konvertieren.
  • 1B zeigt interne Konstruktionsblöcke eines Systems 118, in dem die vorliegende Erfindung implementiert und ausgeführt werden kann. Das System 118 kann einer Klientenvorrichtung (z.B. dem Computer 100, 102 oder 106) oder einer Servervorrichtung (z.B. Server 104) entsprechen. Wie in 1B dargestellt, schließt das System 108 eine Zentraleinheit (CPU) 122 ein, die mit einer Schnittstelle zu einem Datenbus 120 und einer Geräteschnittstelle 124 versehen ist. Die CPU 122 führt gewisse Befehle aus, um alle mit dem Datenbus 120 verbundenen Geräte und Schnittstellen für synchronisierte Operationen zu verwalten, und die Geräteschnittstelle 124 kann mit einem externen Gerät, wie dem Rechner 102, verbunden sein, so dass Dokumente aus diesem über den Datenbus 120 in einen Speicher empfangen werden. Ebenfalls als Schnittstelle zum Datenbus 120 ist eine Anzeigeschnittstelle 126, eine Netzwerkschnittstelle 128, eine Druckerschnittstelle 130 und eine Diskettenlaufwerkschnittstelle 138 ausgebildet. Allgemein wird eine kompilierte und verkettete Version von einer Ausführungsform der vorliegenden Erfindung durch die Diskettenlaufwerkschnittstelle 138, Netzwerkschnittstelle 128, Geräteschnittstelle 124 oder andere mit dem Datenbus 120 verbundene Schnittstellen in den Speicher 136 geladen.
  • Ein Hauptspeicher 132, wie ein Direktzugriffsspeicher (RAM), ist ebenfalls mit einer Schnittstelle zum Datenbus 120 versehen, um die CPU 122 mit den Befehlen zu versorgen und zwecks Daten und anderer Befehle auf den Datenspeicher 136 zuzugreifen. Insbesondere dann, wenn sie gespeicherte Anwendungsprogrammbefehle ausführt, wie die kompilierte und verkettete Version der vorliegenden Erfindung, wird bewirkt, dass die CPU 122 die Daten manipuliert, um von der vorliegenden Erfindung ins Auge gefasste Ergebnisse zu erzielen. Ein ROM (Nurlesespeicher) 134 ist vorgesehen, um unveränderliche Befehlsfolgen zu speichern, wie ein grundlegendes Eingabe/Ausgabe-Betriebssystem (BIOS) für den Betrieb einer Tastatur 190, der Anzeige 126 und einer Zeigevorrichtung 142, falls vorhanden.
  • 2A veranschaulicht ein Beispiel eines unstrukturierten Dokuments 200, das von einem Autorenprogramm erstellt, bearbeitet oder verwaltet werden kann. Im Allgemeinen werden in einem unstrukturierten Dokument Daten in einer Folge dargestellt, die gewöhnlich einer Reihenfolge beim Lesen folgt (z.B. von oben nach unten und links nach rechts). Diese Folge kann in Segmente oder Abschnitte von Datenelementen geparst werden, wobei jedem Datenelement 202 Verzierungsattribute oder Informationen, wie Positionen, Schriftfarbe, Schriftgröße, Schriftart, Gestaltung und verschiedene Effekte etc. zugeordnet werden. Die Verzierungsinformationen dienen im Wesentlichen dem Zweck einer richtigen Gestaltung und Darstellung, wenn eine die Datenelemente enthaltende Datei vom Autorenwerkzeug zur Anzeige auf einem Anzeigeschirm geöffnet wird.
  • Gemäß einer Ausführungsform wird ein unstrukturiertes Dokument in einem Metadateiformat gedruckt, das die Verzierungsinformationen enthält. Ein Beispiel eines Metadateiformats ist das gebräuchlich verwendete Portable Data Format (PDF). Einer der Vorteile des Metadateiformats ist seine Unabhängigkeit vom Autorenwerkzeug und vielleicht von Rechnern, so dass das Metadateiformat in vielen verschiedenen Umgebungen identisch geöffnet oder gelesen werden kann.
  • Ein strukturiertes Dokument, wie SGML und XML, beginnt mit Dokumenttypdefinitionen (DTD). 2B veranschaulicht ein Beispiel von DTD 208 für Dokumente "von der Art eines Rezepts", in denen ein Dokument in Strukturen von Dokumentelementen zerlegt werden soll. Ein bestimmtes Dokumentelement 210 kann andere Dokumentelemente und Attribute enthalten. Ein anderes Beispiel des Dokumentelements 212 enthält nur die geparsten Zeichendaten.
  • 2C zeigt ein strukturiertes Dokument 220, das mit Bezug auf die DTD 208 in 2B aus dem unstrukturierten Dokument 200 in 2A entsprechend konvertiert worden ist. Wie in der Figur dargestellt, ist die Datenfolge im unstrukturierten Dokument in Datenelemente geparst, die für das strukturierte Dokument mit in DTD definierten Dokumentelementen verknüpft sind.
  • Anders als das unstrukturierte Dokument kann das strukturierte Dokument über die Dokumentelemente leicht auf gewisse Informationen zugreifen. Die Darstellung eines strukturierten Dokuments ist gewöhnlich in getrennten Formatierungsblättern definiert, z.B. in einem Kaskaden-Formatierungsblatt (CSS) oder in einer erweiterbaren Formatierungssprache zum Formatieren von Objekten (XSL-FO) geschrieben, welche die Gestaltung für jedes Dokumentelement übersetzt. Dieses Merkmal gestattet es, ein strukturiertes Element durch verschiedene Formatierungsblätter für verschiedene Medien in verschiedenen Gestaltungen darzustellen. Im Allgemeinen werden die Verzierungsinformationen oder Formatierungsattribute, wie Schriftinformationen in einem unstrukturierten Dokument, sofern sie nicht in DTD als Attribute von Dokumentelementen definiert sind, aufgegeben, nachdem ein unstrukturiertes Dokument in ein entsprechendes strukturiertes Dokument konvertiert worden ist. Eine weitere Veränderung der Formatierungsinformationen wird im Allgemeinen die konvertierten strukturierten Dokumente nicht beeinflussen.
  • 3A veranschaulicht ein funktionales Schaubild 300 gemäß einer Ausführungsform der vorliegenden Erfindung. Ein Konvertierungsmodul 302 umfasst ein Verknüpfungsmodul 304 und ein Integrationsmodul 306. Das Verknüpfungsmodul 304 empfängt ein unstrukturiertes Dokument, vorzugsweise in einem Metadateiformat. Gleichzeitig empfängt das Verknüpfungsmodul 304 auch eine als Definitionsdatei bezeichnete Datei, die DTD enthält, die vordefiniert sind. Im Allgemeinen werden die DTD der Art oder den Zwecken des unstrukturierten Dokuments entsprechend definiert. Wenn sich zum Beispiel das unstrukturierte Dokument in einer Kategorie von Rezepten befindet, z.B. das Dokument 200 in 2A, ist die DTD in einer Definitionsdatei, wie in 2B dargestellt, entsprechend den rezeptartigen Dokumenten gestaltet.
  • Um das Verknüpfungsmodul 304 weiter zu verstehen, zeigt 3B eine Umgebung 320, die das Konvertierungsmodul 302 gemäß einer Ausführungsform der vorliegenden Erfindung implementiert. Die Umgebung 320 schließt zwei Anzeigen 322 und 324 für einen Benutzer ein, um eine Konvertierung eines unstrukturierten Dokuments in eine Datei in Auszeichnungssprache (unter Verweis auf eine Auszeichnungssprachendatei) durchzuführen. Die Anzeige 322 wird benutzt, um das unstrukturierte Dokument anzuzeigen. Bei einer bevorzugten Ausführungsform wird für die Anzeige eine Metadateiversion des unstrukturierten Dokuments geladen. Eine Metadatei, die sich entweder auf das unstrukturierte Dokument oder eine gedruckte Version desselben bezieht, enthält typischerweise viele anzeigbare Objekte. Jedes Objekt ist eine Gruppierung oder eine Gruppe von Zeichen oder Worten oder eine graphische Darstellung. Wie in der Anzeige 322 dargestellt, ist jedes Wort oder eine alleinstehende Zahl ein anzeigbares Objekt, das inhärent in die Metadatei überführt wird. Mit anderen Worten wird jedes Objekt durch eine Anzahl von Attributen oder Verzierungsinformationen definiert, die Art, Größe, Farbe und Position des Objekts einschließen, jedoch nicht darauf beschränkt sind, so dass es richtig gedruckt werden kann. Eine Anzahl von Objekten kann von einem Benutzer manuell im Hinblick auf ihre Bedeutungen oder Zwecke gruppiert werden. Zum Beispiel enthält das Gruppenobjekt 326 drei Objekte von der Art mit Buchstaben "Grüne", "Chili" und "Soße". Die drei Objekte von der Art mit Buchstaben bilden natürlich einen Titel als Gruppenobjekt 326. Die Objektgruppierung kann in der Anzeige 322 auch für den Rest der angezeigten Metadatei ausgeführt werden.
  • Die Anzeige 324 wird benutzt, um eine für die Metadatei in der Anzeige 322 vorbereitete Definitionsdatei anzuzeigen. Um die Operationen des Verknüpfungsmoduls 302 zu erleichtern, wird die Definitionsdatei graphisch als "DTD-Pool" 328 dargestellt. Zum Beispiel wird die graphische Darstellung 328 der DTD 208 in 2B in der Anzeige 324 benutzt, um die hierarchischen Beziehungen unter den Dokumentelementen zu veranschaulichen.
  • Gemäß einer Ausführungsform, welche die Metadatei schließlich in eine XML-Datei konvertiert, wird aus dem "DTD-Pool" 328 ein Hilfs-XML-Baum 330 erzeugt. Der Hilfs-XML-Baum 330 zeigt ebenfalls die hierarchischen Beziehungen unter den Dokumentelementen. Zusätzlich wird jedes der Dokumentelemente einer Kennung zugeordnet, die eine Zahl, einen Namen, eine Schrift, einen Typennamen oder eine Farbe einschließen kann, jedoch nicht darauf beschränkt ist. Bei einer Ausführungsform befindet sich die Kennung in "Daten" von jedem der Dokumentelemente. Um das Gruppenobjekt 326 mit einem Dokumentelement "Titel" 332 zu verknüpfen, wird "Daten" 334 aktiviert, sobald das Gruppenobjekt 326 ausgewählt wird. Eines der Merkmale in der vorliegenden Erfindung ist eine unterlegte Verknüpfung, die das Gruppenobjekt 326 mit der Kennung in Daten 334 in Beziehung setzt. Speziell wird, wenn die Kennung in "Daten" 334 eine Farbe "grün" ist, bei einer Ausführungsform das Gruppenobjekt 326 in grün hervorgehoben, um anzuzeigen, dass dieses Gruppenobjekt mit der DTD verknüpft worden ist. Wenn die Kennung eine Schrift "Arial" ist, wird das Gruppenobjekt 326 in der Schrift Arial hervorgehoben, um anzuzeigen, dass dieses Gruppenobjekt mit der DTD verknüpft worden ist.
  • In ähnlicher Weise kann ein Gruppenobjekt 340 unter "Zutat" mit einer Kennung in Daten 342 verknüpft werden, ein Gruppenobjekt 344 kann unter "Menge" an "Zutat" mit einer Kennung in Daten 346 verknüpft werden, und so weiter. Infolgedessen ist die Metadatei in der Anzeige 322 segmentiert worden, und die anzeigbaren Objekte darin sind jeweils gruppiert und jedes der Gruppenobjekte ist durch eine Kennung mit dem Dokumentelement in den geladenen DTD verknüpft. Die Anzeige 322 weist nun eine modifizierte Metadatei 310 auf, von der ein Beispiel unten veranschaulicht werden wird.
  • Wieder Bezug nehmend auf 3A, wird die modifizierte Metadatei 310 in ein Integrationsmodul 306 eingegeben, das weiter ein Formatierungsblatt empfängt. Ein Formatierungsblatt ist typischerweise so konfiguriert, dass es Abbildungsregeln enthält, entsprechend den Medien, auf denen die Objekte aus der Metadatei präsentiert werden. Ein beispielhaftes Medium ist eine Netz-Präsentation einer Datei, auf die mittels eines Browsers (z.B. Internet Explorer von Microsoft) zugegriffen werden kann. Somit liegt die Datei in Auszeichnungssprache vor, wie HTML oder XML, weshalb sie als Auszeichnungssprachendatei bezeichnet wird.
  • 3C zeigt ein Beispiel eines solchen Formatierungsblatts, das mit Bezug auf die anzeigbaren Objekte in der Metadatei im XML-Format gestaltet worden ist. Im Allgemeinen ist ein Formatierungsblatt dazu bestimmt, jedes der Objekte jeweils so zu positionieren, zu färben oder zu bemessen, dass eine ordentliche und für Aufmerksamkeit sorgende Darstellung für ein bestimmtes Medium erzielt werden kann. Das Beispiel in 3C ist zur Darstellung eines Dokuments "nach Art eines Rezepts" bestimmt und bewirkt, dass die modifizierte Metadatei eine richtige XML-Datei erzeugt, wenn sie geladen wird. Mit anderen Worten erzeugt das Integrationsmodul 306 entsprechend dem Formatierungsblatt aus der modifizierten Metadatei die XML-Datei. Die vorangehende Beschreibung vorausgesetzt, kann festgestellt werden, dass ein Formatierungsblatt nicht in das Integrationsmodul 306 eingegeben werden braucht. Bei einer Implementierung können die Abbildungsregeln mit der DTD-Datei geladen werden, so dass das Integrationsmodul 306 entsprechend den geladenen Abbildungsregeln die Abbildung aus der modifizierten Metadatei in eine Auszeichnungssprachendatei vornimmt.
  • Gemäß einer Ausführungsform wird das Konvertierungsmodul 302 als Software implementiert und kann als Anwendung an Benutzer oder Diensteanbieter vertrieben werden. Es versteht sich, dass der Konvertierungsprozess von einem unstrukturierten Dokument in eine Auszeichnungssprachendatei in einer kostenbestimmbaren Weise schwierig zu quantifizieren ist. Ein Zähler 308 ist im Konvertierungsmodul 302 enthalten. Bei einer Ausführungsform ist der Zähler 308 konfiguriert, um die Anzahl von Seiten in der zu konvertierenden Metadatei zu zählen. Jedes Mal, wenn alle der Objekte in einer Anzeige (d.h. einer Seitenanzeige) mit den Dokumentelementen in einer DTB-Datei verknüpft und als eine entsprechende modifizierte Metadatei gesichert worden sind, wird der Zähler 308 hochgesetzt. 3D zeigt ein Beispiel von Zählergebnissen, die in einem Dongle aufbewahrt werden. Ein Dongle (ausgesprochen DONG-uhl) ist ein Mechanismus, um sicherzustellen, dass nur befugte Benutzer eine spezielle Softwareanwendung kopieren oder verwenden können, speziell sehr teure Programme. Gebräuchliche Implementierungen eines Dongles schließen einen Hardwareschlüssel, der in einen parallelen oder seriellen Anschluss an einem Computer gesteckt wird und auf den eine Softwareanwendung zur Bestätigung zugreift, bevor sie weiter abläuft; spezielle Schlüsseldisketten, auf die in einer ähnlichen Weise zugegriffen wird, sowie Registriernummern ein, die in der Fabrik oder während einer Systeminstallation in irgendeine Form von Nur-Lese-Speicher geladen werden.
  • Wenn der Dongle zurückgesetzt werden muss, kann der Konvertierungsprozess in einer kostenbestimmbaren Weise beurteilt werden. Gemäß einer Ausführungsform kann ein Eigentümer eines Produkts, das eine Implementierung des Konvertierungsmoduls 302 einschließt, das Produkt umsonst oder zu sehr niedrigen Kosten an Benutzer vertreiben. Typischerweise muss der Benutzer aus den von verschiedenen Autorenwerkzeugen erstellten, bearbeiteten oder verwalteten unstrukturierten Dokumenten Mengen von Webseiten erzeugen. Einer der Vorteile, der für den Benutzer darin liegt, das Produkt in einer solchen Weise zu erhalten, besteht darin, dass er kein großes Kapital benötigt, um das Produkt zu kaufen, bevor er es benutzt. Die Benutzer können für die Benutzung der Produkte zahlen. Somit besteht einer der Zwecke einer Verwendung eines Dongles mit einem Konvertierungsmodul 302 darin, seine Benutzung zu verwalten. Infolgedessen kann der Eigentümer des Produkts die Benutzung des Produkts kontrollieren, indem er den die Benutzungsinformationen enthaltenden Dongle kontrolliert.
  • 3E zeigt ein Verfahrensfließbild 370 einer Benutzung eines Produkts, das eine Implementierung des Konvertierungsmoduls 302 gemäß einer Ausführungsform der vorliegenden Erfindung enthält. Manchmal wird das Produkt von einem Benutzer oder einem Geschäft geleast. Ein anderes Mal wird das Produkt von einem Diensteanbieter benutzt, der für Geschäfte, die unstrukturierte Dokumente zur Darstellung in verschiedenen Medien (z.B. zur Darstellung auf einer Webseite) in strukturierte Dokumente konvertieren müssen, Dienste bereit stellt.
  • Das Verfahren 370 beginnt bei 372 mit der Erzeugung von Metadateien aus Autorendokumenten. Im Allgemeinen können die Autorendokumente unter Verwendung von einem oder mehreren Autorenwerkzeugen vorbereitet worden sein. Wie oben beschrieben, erhält man aus den Autorendokumenten vorzugsweise Metadateien, so dass das Konvertierungsmodul 302 nicht für jedes der verschiedenen Autorenwerkzeuge jeweils konfiguriert werden muss. Jedoch sollte festgestellt werden, dass die Bevorzugung einer Metadatei keine inhärente Beschränkung der vorliegenden Erfindung ist, sondern dazu dient, das Produkt oder Konvertierungsmodul 302 effektiver arbeiten zu lassen. Der Fachmann versteht, dass eine Konvertierungsschnittstelle oder ein Druckertreiber konfiguriert werden könnten, um sich an jegliche Art der Autorendokumente anzupassen oder die Metadateien zu erzeugen.
  • Sobald man die Metadateien erhalten hat, können sie nun in eine visuelle Umgebung geladen werden, in der die Metadateien jeweils angezeigt werden können. Die Umgebung 320 aus 3B kann verwendbar sein, so dass Seiten von jeder der Metadateien einzeln zur Anzeige geladen werden können.
  • Bevor es das Verfahren 370 einem Benutzer erlaubt, weiter fortzufahren, wird ein Berechtigungsprozess 378 ausgelöst, um sicherzustellen, dass der Benutzer mit einem berechtigten Produkt arbeitet. Wie oben beschrieben, wird ein beispielhaftes Berechtigungsverfahren durch einen Dongle vorgenommen, der von einem das Produkt anbietenden/besitzenden/kontrollierenden Geschäft oder Händler voreingestellt wird. Wenn der Berechtigungsprozess 378 anzeigt, dass das Verfahren 370 nicht berechtigt ist, wird dem Benutzer typischerweise eine Anzeige gezeigt, wo man eine Berechtigung des Produkt bekommen kann. Eine der Vorgehensweisen bei der Einstellung der Berechtigung 376 beinhaltet einen Kauf einer erlaubten Menge der Anzahl an konvertierten oder gesicherten Seiten.
  • Gemäß einer Ausführungsform wird für die Verbindung mit einem das Verfahren 370 ausführenden Computer ein Dongle benutzt. Der Dongle enthält eine erste und eine zweite Zahl. Die erste Zahl ist eine Anfangszahl, zum Beispiel "10", und die zweite Zahl ist eine Grenzzahl, zum Beispiel "1000", was bedeutet, dass mittels des Verfahrens 370 1000 Seiten konvertierte Dokumente bearbeitet und gesichert werden können.
  • Sobald es dem Verfahren 370 erlaubt wird, zu 380 fortzufahren, wird es dem Benutzer nun erlaubt, eine Reihe von anzeigbaren Objekten jeweils in Gruppenobjekte zu gruppieren, vielleicht entsprechend ihren Bedeutungen oder ihren Zwecken und mit Blick auf eine geladene und in der Nähe angezeigte DTD-Datei. Bei 382 können die Gruppenobjekte jeweils mit Definitionen in den DTD verknüpft werden. Mindestens einige der Definitionen weisen eine Anzahl von Kennungen auf, wobei vorzugsweise jede Kennung mit einer der Definitionen verknüpft oder für diese bestimmt ist.
  • Wie oben beschrieben, sollen die Verknüpfungen zwischen den ausgewählten Objekten und den Definitionen in einer modifizierten Metadatei gesichert werden. Bevor das Verfahren 370 eine solche Sicherung erlaubt, muss bei 386 ein Zähler geprüft werden. Bei einer Ausführungsform werden die erste und die zweite Zahl im Dongle verglichen. Wenn die erste Zahl im Wesentlichen in der Nähe der zweiten Zahl liegt, zum Beispiel die beiden Zahlen dieselben sind, wird das Verfahren 370 nach einer Ergänzung der erlaubten Benutzung fragen. Typischerweise muss der Benutzer den Dongle von einem Geschäft oder einem Händler zurückstellen oder neu konfigurieren lassen, das/der nun auf der Grundlage der Informationen im Dongle Gebühren verlangen kann. Bei 384 sind die Zahlen zurückgesetzt worden und erlauben es nun, dass das Verfahren 370 fortschreitet.
  • Bei 386 kann ein Sicherungsschritt durchgeführt werden. In Abhängigkeit von einer genauen Implementierung kann entweder die modifizierte Metadatei oder eine Auszeichnungssprachendatei in einem Speicherplatz gesichert werden. Die Auszeichnungssprachendatei wird aus der modifizierten Metadatei unter Bezug auf ein Formatierungsblatt für eine vorbestimmte Medienpräsentation erzeugt. Bei 388 wird der Zähler hochgesetzt.
  • Es sollte festgestellt werden, dass der Zähler bei 386 überprüft wird, insbesondere nach 384 in 3E. In der Tat hat es die Beschreibung für den Fachmann ersichtlich gemacht, dass der Zähler praktisch überall entlang des Verfahrens 370 überprüft oder abgefragt werden könnte. Eines der Ziele der Verwendung eines Zählers besteht hier darin, es einem Geschäft zu erleichtern, die Benutzung des Verfahrens 370 zu kontrollieren und so festzulegen, dass Kosten bestimmt und eine Gebühr berechnet werden könnte.
  • 4 zeigt ein funktionales Blockdiagramm 400 eines Datenverarbeitungsmoduls 404 gemäß einer Ausführungsform der vorliegenden Erfindung. Das im Integrationsmodul 306 enthaltene Datenverarbeitungsmodul 404 umfasst ein Eingabemodul 406, ein Bearbeitungsmodul 410 und ein Transformations- oder Filtermodul 414. Eine der vom Datenverarbeitungsmodul 404 ausgeführten Funktionen besteht darin, unstrukturierte Dokumente oder strukturierte Dokumente mit verschiedenen DTD in entsprechende strukturierte Dokumente mit vorbestimmten oder speziellen DTD zu konvertieren.
  • Das Eingabemodul 406 lädt Dokumente oder importiert Dokumente aus einer Dokumentdatenbank 402, die einem Aufbewahrungsort in der Rechenvorrichtung 102 aus 1A entsprechen kann.
  • Alternativ kann das Eingabemodul 406 ein neues Dokument 408 beginnen. Es sollte festgestellt werden, dass die geladenen oder importierten Dokumente entweder unstrukturiert (z.B. eine Metadatei) oder strukturiert sein können und in gewissen Fällen zuvor erzeugte strukturbasierende Schriftinformationen enthalten haben können.
  • Ein Bearbeitungsmodul 410 kommuniziert mit dem Eingabemodul 406 und erzeugt/bearbeitet für die eingegebenen Dokumente die strukturbasierenden Schriftinformationen. Dieses Modul erlaubt eine Auswahl von Datenelementen für die eingegebenen Dokumente und liefert eine Bearbeitungsumgebung, um die Schriftattribute, wie Schriftart, Schriftgestaltung, Schriftfarbe, Schriftgröße und Schrifteffekte für die ausgewählten Datenelemente zu verändern. Die Art und Weise, um die eingegebenen Dokumente in Datenelemente zu parsen und ihnen Schriftattribute zuzuordnen, basiert auf einer Verknüpfungstabelle für die in einer gewünschten DTD definierten Dokumentelemente und zugehörigen Schriftattribute 412. Eine beispielhafte Verknüpfungstabelle 500 für DTD 412 ist in 5 angegeben, die Felder für Dokumentelement 502, Elementattribut 504, Schriftart 506, Schriftgestaltung 508, Schriftfarbe 510, Schriftgröße 512 und Schrifteffekt 514 enthält.
  • 6 zeigt ein Bearbeitungsergebnis 600 für das unstrukturierte Dokument 200 aus 2A. Jedem geparsten Datenelement oder kombinierten Objekten 602, 604, 606, 608, 610, 612 und 614 sind basierend auf der Verknüpfungstabelle in 5 Schriftattribute zugewiesen worden und sie sind jeweils in der zugewiesenen Schrift angezeigt worden. Während des Parsens erlaubt dieses Modul eine Folgeauswahl von Datenelementen basierend auf der Lesereihenfolge des eingegebenen Dokuments 602, um ihre Schriftinformationen zu bearbeiten. Dieses Modul erlaubt auch eine Bereichsgruppierung von Datenelementen, um ihre Schriftinformationen zu bearbeiten. Dieses Modul kann auch eine zusätzliche Ansicht der Verknüpfungstabelle vorsehen.
  • Das Transformations- oder Filtermodul 414 konvertiert die geladenen Dokumente in strukturierte Dokumente mit benutzerdefinierten Dokumenttypdefinitionen (DTD) unter Verwendung der strukturbasierten Schriftinformationen. Abbildungsregeln basierend auf den Dokumentelementen und Schriftattributen für die Konvertierung 416 werden in diesem Modul importiert oder bestimmt.
  • 7 veranschaulicht ein Beispiel 700 der Abbildungsregeln zum Konvertieren des bearbeiteten Dokuments 602 in das strukturierte Dokument 220 aus 2C. Insbesondere startet 702 das "Dokument"-Element und 718 beendet es, 704 startet das "Rezept"-Dokument und 714 beendet es, 706 bildet das "Zutat"-Element, 708 bildet das "Vorgehensweise"-Element, 710 bildet das "Darstellung"-Element und 712 bildet das "Ursprung"-Element. In 704, 706, 708, 710 und 712 werden die strukturbasierten Schriftinformationen benutzt, um die Datenelemente zu lokalisieren, und die lokalisierten Datenelemente werden als Attribute oder geparste Zeichendaten für Dokumentelemente zugewiesen. Diese Abbildungsregeln können mittels Programmiersprachen, wie Java, Javascript, Extensible Style Language for Transformation (XSLT), C/C ++, ... usw. implementiert werden, oder mittels beliebigen eingebauten oder programmierbaren Hardwarevorrichtungen, sind jedoch nicht darauf beschränkt. Die konvertierten Dokumente können entweder als Dateidokument gesichert oder in eine Dokumentdatenbank 418 exportiert werden.
  • Außer einer direkten Konvertierung in die gewünschten Dokumente kann das Transformationsmodul auch die bearbeiteten Dokumente als die strukturierten Zwischendokumente ausgeben, welche die strukturbasierten Schriftinformationen enthalten. Die strukturierten Zwischendokumente können zur weiteren Bearbeitung oder gruppenweisen Konvertierung erneut geladen werden.
  • Ein Beispiel des strukturierten Zwischendokuments 808 für das bearbeitete Dokument 600 ist in 8 angegeben, wo 802 "Schrift"-Elemente mit speziellen Schriftattributen enthält, und 804 die geparsten Datenelemente mit "Schrift_ID"-Attributen oder "Schrift_Kennungs"-Attributen zur Verknüpfung der Schriftinformationen enthält. Da die geparsten Datenelemente mit denselben Schriftattributen von derselben "Schrift_ID" oder Schrift_Kennung" in die strukturierten Zwischendokumente gruppiert worden sind, können Abbildungsregeln zur Konvertierung basierend auf den gruppierten Schriftinformationen festgelegt werden.
  • 9 veranschaulicht ein Beispiel der Abbildungsregeln zur Konvertierung des Zwischendokuments 800 in das strukturierte Dokument 220. Insbesondere startet 902 das "Dokument"-Element und 918 beendet es, 904 startet das "Rezept"-Dokument und 914 beendet es, 906 bildet das "Zutat"-Element, 908 bildet das "Vorgehensweise"-Element, 910 bildet das "Darstellung"-Element und 912 bildet das "Ursprung"-Element. In 904, 906, 908, 910 und 912 werden die gruppierten Schriftinformationen benutzt, um die Datenelemente zu lokalisieren, und die lokalisierten Datenelemente werden als Attribute oder geparste Zeichendaten für Dokumentelemente zugewiesen.
  • 10 zeigt ein Beispiel einer Implementierung der in 9 angegebenen Abbildungsregeln unter Verwendung der Extensible Style Language for Transformation (XSLT).
  • Die oben beschriebene Erfindung wird vorzugsweise in Software, Hardware oder in einer Kombination von beiden implementiert. Zumindest Teile der Erfindung können als computerlesbarer Code auf einem computerlesbaren Medium enthalten sein. Das computerlesbare Medium ist eine beliebige Datenspeichervorrichtung, die Daten speichern kann, welche danach von einer Rechenvorrichtung gelesen werden können. Beispiele des computerlesbaren Mediums schließen Nur-Lese-Speicher, Direktzugriffsspeicher, Plattenlaufwerke, Disketten, CD-ROMs, DVDs, Magnetband, optische Datenspeichervorrichtungen, Trägerwellen ein. Die computerlesbaren Medien können auch über netzwerkverbundene Computersysteme vertrieben werden, so dass der computerlesbare Code in einer verteilten Weise gespeichert und ausgeführt wird.
  • Die vorliegende Erfindung ist ausreichend detailliert mit einem gewissen Grad an Bestimmtheit beschrieben worden. Für den Fachmann versteht sich, dass die vorliegende Offenbarung von Ausführungsformen nur anhand von Beispielen vorgenommen worden ist, und dass zahlreiche Veränderungen in der Anordnung und Kombination von Teilen vorgenommen werden können, ohne den Umfang der Erfindung, wie beansprucht, zu verlassen. Obwohl es scheinen kann, als ob die hier erörterten Ausführungsformen einige Beschränkungen enthalten, was die Darstellung der Informationseinheiten im Hinblick auf das Format und die Anordnung angeht, weist die Erfindung eine weit über eine solche Ausführungsform hinausreichende Anwendbarkeit auf, was für den Fachmann ersichtlich ist. Dementsprechend wird der Umfang der vorliegenden Erfindung statt durch die vorangehende Beschreibung von Ausführungsformen durch die beigefügten Ansprüche definiert.

Claims (12)

  1. Verfahren zur Erzeugung von strukturierten Dokumenten, wobei das Verfahren umfasst: Empfangen einer Definitionsdatei, die Dokumenttypdefinitionen (208) enthält; Anzeigen einer Metadatei (200) zusammen mit der Definitionsdatei, wobei die Metadatei eine Anzahl von anzeigbaren Objekten (202) und jeweilige Anzeigeattribute über jedes der anzeigbaren Objekte (202) enthält, um zu bestimmen, wie die anzeigbaren Objekte (202) in einer Anzeige angezeigt werden; und Verknüpfen von mindestens einer der Definitionen (208) in der Definitionsdatei mit einem der anzeigbaren Objekte (202).
  2. Verfahren nach Anspruch 1, weiter umfassend: Aktivieren einer Umgebung (320), die eine erste Anzeige (322) und eine zweite Anzeige (324) enthält, wobei die erste Anzeige (320) die Metadatei (200) anzeigt und die zweite Anzeige (324) die Definitionsdatei anzeigt, wobei jede der Dokumenttypdefinitionen (208) eine Kennung einschließt; Bilden einer Anzahl von Gruppenobjekten (326, 340, 344), wobei jedes der Gruppenobjekte eine Anzahl der anzeigbaren Objekte (202) enthält; und Kennzeichnen von jedem der Gruppenobjekte (326, 340, 344) mit der Kennung in einer der Dokumenttypdefinitionen (208).
  3. Verfahren nach Anspruch 2, weiter umfassend Erzeugen einer modifizierten Metadatei, die Informationen von jedem der Gruppenobjekte (326, 340, 344) enthält, das mit der Kennung in einer der Dokumenttypdefinitionen (208) verknüpft ist.
  4. Verfahren nach Anspruch 3, weiter umfassend Konvertieren der modifizierten Metadatei in eine Auszeichnungssprachendatei gemäß einer Gruppe von Abbildungsregeln.
  5. Verfahren nach einem der vorangehenden Ansprüche, bei dem die Definitionsdatei eine Struktur für Dokumentelemente (210, 212) enthält, die jeweils einem der anzeigbaren Objekte (202) in der Metadatei (200) entsprechen.
  6. Verfahren nach Anspruch 5, bei dem einige der Dokumentelemente (210, 212) eine andere Schicht von Unterdokumentelementen enthalten und jedes der Unterdokumentelemente einem der anzeigbaren Objekte (202) in der Metadatei (200) entspricht.
  7. Verfahren nach Anspruch 6, bei dem mindestens einige der Dokumentelemente (210, 222) jeweils eine Anzahl von Kennungen enthalten, wobei jede der Kennungen einem von den mindestens einigen der Dokumentelemente (210, 212) zugeordnet ist und wobei das Verknüpfen der mindestens einen der Definitionen (208) in der Definitionsdatei umfasst: Auswählen von einem der anzeigbaren Objekte (202); und Zuordnen von einer der Kennungen zu dem ausgewählten Anzeigeobjekt.
  8. Verfahren nach einem der vorangehenden Ansprüche, bei dem die Metadatei (200) aus einem unstrukturierten Dokument erzeugt wird, das von einem Autorenwerkzeug erstellt, bearbeitet oder verwaltet wird.
  9. Verfahren nach einem der vorangehenden Ansprüche, bei dem einige der anzeigbaren Objekte (202) jeweilige Gruppen von Zeichen sind.
  10. Verfahren nach Anspruch 4, bei dem die Auszeichnungssprachendatei auf einer Auszeichnungssprache basiert, die aus einer Gruppe bestehend aus HyperText Markup Language (HTML), compact HyperText Markup Language (cHTML), Extensible Markup Language (XML), Standard Generalized Markup Language (SGML) oder Wireless Markup Language (WML) ausgewählt ist.
  11. Maschinenlesbares Medium, das Anweisungen zur Ausführung durch einen Prozessor enthält, wobei die Anweisungen, wenn sie vom Prozessor ausgeführt werden, bewirken, dass der Prozessor strukturierte Dokumente erzeugt, wobei das maschinenlesbare Medium umfasst: Programmcode zum Empfangen einer Definitionsdatei, die Dokumenttypdefinitionen (208) enthält; Programmcode zum Anzeigen einer Metadatei (200) zusammen mit der Definitionsdatei, wobei die Metadatei (200) eine Anzahl von anzeigbaren Objekten und jeweilige Anzeigeattribute über jedes der anzeigbaren Objekte (202) enthält, um zu bestimmen, wie die anzeigbaren Objekte (202) in einer Anzeige angezeigt werden; und Programmcode zum Verknüpfen von mindestens einer der Definitionen (208) in der Definitionsdatei mit einem der anzeigbaren Objekte.
  12. Maschinenlesbares Medium nach Anspruch 11, weiter umfassend: Programmcode zum Aktivieren einer Umgebung (320), die eine erste Anzeige (322) und eine zweite Anzeige (324) enthält, wobei die erste Anzeige (322) die Metadatei anzeigt und die zweite Anzeige (324) eine Definitionsdatei anzeigt, die Dokumenttypdefinitionen (208) enthält, wobei jede der Dokumenttypdefinitionen (208) eine Kennung einschließt; Programmcode zum Bilden einer Anzahl von Gruppenobjekten (326, 340, 344), wobei jedes der Gruppenobjekte eine Anzahl der anzeigbaren Objekte (202) enthält; und Programmcode zum Kennzeichnen von jedem der Gruppenobjekte (326, 340, 344) mit der Kennung in einer der Dokumenttypdefinitionen (208).
DE60112188T 2000-01-31 2001-01-08 Methode und system zur erzeugung strukturierter dokumente für verschiedene darstellungsweisen Expired - Fee Related DE60112188T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US17933000P 2000-01-31 2000-01-31
US179330P 2000-01-31
PCT/US2001/000631 WO2001055900A1 (en) 2000-01-31 2001-01-08 Method and apparatus for generating structured documents for various presentations

Publications (2)

Publication Number Publication Date
DE60112188D1 DE60112188D1 (de) 2005-09-01
DE60112188T2 true DE60112188T2 (de) 2005-12-29

Family

ID=22656117

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60112188T Expired - Fee Related DE60112188T2 (de) 2000-01-31 2001-01-08 Methode und system zur erzeugung strukturierter dokumente für verschiedene darstellungsweisen

Country Status (11)

Country Link
US (2) US6910182B2 (de)
EP (1) EP1166214B1 (de)
JP (1) JP2003521069A (de)
KR (1) KR20010110671A (de)
CN (1) CN1392986A (de)
AT (1) ATE300766T1 (de)
AU (2) AU2775401A (de)
CA (1) CA2365622A1 (de)
DE (1) DE60112188T2 (de)
RU (1) RU2001128738A (de)
WO (2) WO2001055899A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102016224894A1 (de) * 2016-12-14 2018-06-14 Robert Bosch Gmbh Diagnose-Dongle für ein Werkzeug und Verfahren zur Diagnose und/oder Steuerung eines Werkzeugs mittels eines Diagnose-Dongles

Families Citing this family (168)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1076862A1 (de) * 1999-03-09 2001-02-21 Koninklijke Philips Electronics N.V. Dokumentkodierungsverfahren
US7966234B1 (en) 1999-05-17 2011-06-21 Jpmorgan Chase Bank. N.A. Structured finance performance analytics system
JP4320491B2 (ja) * 1999-11-18 2009-08-26 ソニー株式会社 文書処理システム、端末装置、文書提供装置、文書処理方法、記録媒体
AU2001249914A1 (en) * 2000-04-07 2001-10-23 Financeware.Com Method and apparatus for rendering electronic documents
US7249095B2 (en) 2000-06-07 2007-07-24 The Chase Manhattan Bank, N.A. System and method for executing deposit transactions over the internet
US8396859B2 (en) * 2000-06-26 2013-03-12 Oracle International Corporation Subject matter context search engine
AUPQ950400A0 (en) * 2000-08-17 2000-09-07 Peruch, Stephen Sebastian Computer implemented system and method of transforming a source file into transformed file using a set of trigger instructions
US7386790B2 (en) * 2000-09-12 2008-06-10 Canon Kabushiki Kaisha Image processing apparatus, server apparatus, image processing method and memory medium
US7313541B2 (en) 2000-11-03 2007-12-25 Jpmorgan Chase Bank, N.A. System and method for estimating conduit liquidity requirements in asset backed commercial paper
WO2002037622A2 (en) * 2000-11-06 2002-05-10 Vitesse Semiconductor Corporation Method of controlling the turn off characteristics of a vcsel diode
US7181684B2 (en) * 2000-12-12 2007-02-20 Oracle International Corporation Dynamic tree control system
US7013309B2 (en) * 2000-12-18 2006-03-14 Siemens Corporate Research Method and apparatus for extracting anchorable information units from complex PDF documents
US7107279B2 (en) * 2000-12-20 2006-09-12 Insitech Group, Inc. Rapid development in a distributed application environment
US20020129061A1 (en) * 2001-03-07 2002-09-12 Swart Stacey J. Method and apparatus for creating files that are suitable for hardcopy printing and for on-line use
US7703009B2 (en) * 2001-04-09 2010-04-20 Huang Evan S Extensible stylesheet designs using meta-tag information
JP2003036152A (ja) * 2001-05-17 2003-02-07 Matsushita Electric Ind Co Ltd 情報印刷システム
US7272594B1 (en) 2001-05-31 2007-09-18 Autonomy Corporation Ltd. Method and apparatus to link to a related document
US20030093565A1 (en) * 2001-07-03 2003-05-15 Berger Adam L. System and method for converting an attachment in an e-mail for delivery to a device of limited rendering capability
US20030037023A1 (en) * 2001-08-07 2003-02-20 Intelliclaim Emulation process for making changes and revisions to computer data files
WO2003038662A1 (en) * 2001-10-31 2003-05-08 University Of Medicine & Dentistry Of New Jersey Conversion of text data into a hypertext markup language
US8117533B2 (en) * 2002-03-12 2012-02-14 International Business Machines Corporation Method and system for stylesheet rule creation, combination, and removal
US7337391B2 (en) * 2002-03-12 2008-02-26 International Business Machines Corporation Method and system for stylesheet execution interactive feedback
US7992088B2 (en) * 2002-03-12 2011-08-02 International Business Machines Corporation Method and system for copy and paste technology for stylesheet editing
US7315980B2 (en) 2002-03-21 2008-01-01 International Business Machines Corporation Method and apparatus for generating electronic document definitions
US7093195B2 (en) * 2002-03-21 2006-08-15 International Business Machines Corporation Standards-based formatting of flat files into markup language representations
US7305455B2 (en) 2002-03-21 2007-12-04 International Business Machines Corporation Interfacing objects and markup language messages
US7130842B2 (en) * 2002-03-21 2006-10-31 International Business Machines Corporation Method and apparatus for generating electronic document definitions
JP2003296223A (ja) * 2002-03-29 2003-10-17 Fuji Xerox Co Ltd ウェブページ提供方法および装置並びにプログラム
US20030208460A1 (en) * 2002-05-06 2003-11-06 Ncr Corporation Methods, systems and data structures to generate and link reports
US8224723B2 (en) 2002-05-31 2012-07-17 Jpmorgan Chase Bank, N.A. Account opening system, method and computer program product
US7117429B2 (en) * 2002-06-12 2006-10-03 Oracle International Corporation Methods and systems for managing styles electronic documents
JP4227468B2 (ja) * 2002-06-24 2009-02-18 キヤノン株式会社 画像形成装置及び方法、並びに制御プログラム
US7650566B1 (en) 2002-06-28 2010-01-19 Microsoft Corporation Representing list definitions and instances in a markup language document
US7523394B2 (en) * 2002-06-28 2009-04-21 Microsoft Corporation Word-processing document stored in a single XML file that may be manipulated by applications that understand XML
US7533335B1 (en) 2002-06-28 2009-05-12 Microsoft Corporation Representing fields in a markup language document
US7562295B1 (en) 2002-06-28 2009-07-14 Microsoft Corporation Representing spelling and grammatical error state in an XML document
US7565603B1 (en) 2002-06-28 2009-07-21 Microsoft Corporation Representing style information in a markup language document
US7607081B1 (en) 2002-06-28 2009-10-20 Microsoft Corporation Storing document header and footer information in a markup language document
US7584419B1 (en) 2002-06-28 2009-09-01 Microsoft Corporation Representing non-structured features in a well formed document
US7496834B2 (en) 2002-08-23 2009-02-24 Lg Electronics, Inc. Electronic document request/supply method based on XML
US7322022B2 (en) * 2002-09-05 2008-01-22 International Business Machines Corporation Method for creating wrapper XML stored procedure
US20040083196A1 (en) * 2002-10-29 2004-04-29 Jason Reasor Hardware property management system and method
DE10250842B4 (de) * 2002-10-31 2010-11-11 OCé PRINTING SYSTEMS GMBH Verfahren, Computerprogrammprodukt und Vorrichtung zum Verarbeiten eines Dokumentendatenstroms eines Eingangsformates zu einem Ausgangsformat
KR100636909B1 (ko) 2002-11-14 2006-10-19 엘지전자 주식회사 확장성 표기 언어 기반의 전자문서 버전 매김 및 버전을이용한 갱신 문서 제공 방법
US7293031B1 (en) * 2002-11-21 2007-11-06 Ncr Corp. Report specification generators and interfaces
JP2004192427A (ja) * 2002-12-12 2004-07-08 Internet Disclosure Co Ltd 財務関係開示書類作成システム
TW583556B (en) * 2002-12-20 2004-04-11 Inst Information Industry Method for translating web page document into web service interface and storage medium storing computer program for executing the method
US20040177315A1 (en) 2003-03-03 2004-09-09 International Business Machines Corporation Structured document bounding language
US7213201B2 (en) * 2003-03-03 2007-05-01 International Business Machines Corporation Meta editor for structured documents
AU2003901428A0 (en) * 2003-03-24 2003-04-10 Objective Systems Pty Ltd A system and method for formatting and distributing reading material
JP3982454B2 (ja) * 2003-05-27 2007-09-26 ソニー株式会社 携帯型電子機器、ウェブページ処理方法およびプログラム
US7770184B2 (en) 2003-06-06 2010-08-03 Jp Morgan Chase Bank Integrated trading platform architecture
US7970688B2 (en) 2003-07-29 2011-06-28 Jp Morgan Chase Bank Method for pricing a trade
US7657832B1 (en) * 2003-09-18 2010-02-02 Adobe Systems Incorporated Correcting validation errors in structured documents
US7188127B2 (en) 2003-10-07 2007-03-06 International Business Machines Corporation Method, system, and program for processing a file request
US7155444B2 (en) * 2003-10-23 2006-12-26 Microsoft Corporation Promotion and demotion techniques to facilitate file property management between object systems
US20050097450A1 (en) * 2003-10-31 2005-05-05 Spx Corporation System and method for composition and decomposition of information objects
US20050097449A1 (en) * 2003-10-31 2005-05-05 Jurgen Lumera System and method for content structure adaptation
US20050114764A1 (en) * 2003-11-25 2005-05-26 Gudenkauf John C. Producing a page of information based on a dynamic edit form and one or more transforms
US20050114765A1 (en) * 2003-11-25 2005-05-26 Gudenkauf John C. Producing a page of information based on a dynamic edit form and one or more transforms
US7162692B2 (en) * 2003-12-11 2007-01-09 International Business Machines Corporation Differential dynamic content delivery
US9378187B2 (en) * 2003-12-11 2016-06-28 International Business Machines Corporation Creating a presentation document
TWI242727B (en) * 2003-12-12 2005-11-01 Inst Information Industry System and method of online education website establishment
US8499232B2 (en) * 2004-01-13 2013-07-30 International Business Machines Corporation Differential dynamic content delivery with a participant alterable session copy of a user profile
US7890848B2 (en) 2004-01-13 2011-02-15 International Business Machines Corporation Differential dynamic content delivery with alternative content presentation
US7571380B2 (en) 2004-01-13 2009-08-04 International Business Machines Corporation Differential dynamic content delivery with a presenter-alterable session copy of a user profile
US7430707B2 (en) 2004-01-13 2008-09-30 International Business Machines Corporation Differential dynamic content delivery with device controlling action
GB2411014A (en) * 2004-02-11 2005-08-17 Autonomy Corp Ltd Automatic searching for relevant information
FR2868036B1 (fr) * 2004-03-24 2006-06-02 Eca Societe Par Actions Simpli Dispositif de mise a l'eau et de recuperation d'un vehicule submersible
CN1997990B (zh) * 2004-03-30 2010-12-08 日本胜利株式会社 电子化维修手册生成方法以及电子化维修手册生成装置
US8423447B2 (en) 2004-03-31 2013-04-16 Jp Morgan Chase Bank System and method for allocating nominal and cash amounts to trades in a netted trade
US7519683B2 (en) 2004-04-26 2009-04-14 International Business Machines Corporation Dynamic media content for collaborators with client locations in dynamic client contexts
US7827239B2 (en) 2004-04-26 2010-11-02 International Business Machines Corporation Dynamic media content for collaborators with client environment information in dynamic client contexts
DE102004021269A1 (de) * 2004-04-30 2005-11-24 OCé PRINTING SYSTEMS GMBH Verfahren, Vorrichtung und Computerprogrammprodukt zum Erzeugen eines seiten- und/oder bereichsstrukturierten Datenstroms aus einem Zeilendatenstrom
US20050257193A1 (en) * 2004-05-13 2005-11-17 Alexander Falk Method and system for visual data mapping and code generation to support data integration
JP2005352696A (ja) * 2004-06-09 2005-12-22 Canon Inc 画像処理装置及びその制御方法、プログラム
JP4154368B2 (ja) * 2004-06-15 2008-09-24 キヤノン株式会社 文書処理装置及び文書処理方法、文書処理プログラム
US7487208B2 (en) 2004-07-08 2009-02-03 International Business Machines Corporation Differential dynamic content delivery to alternate display device locations
US8185814B2 (en) 2004-07-08 2012-05-22 International Business Machines Corporation Differential dynamic delivery of content according to user expressions of interest
US9167087B2 (en) 2004-07-13 2015-10-20 International Business Machines Corporation Dynamic media content for collaborators including disparate location representations
US7426538B2 (en) 2004-07-13 2008-09-16 International Business Machines Corporation Dynamic media content for collaborators with VOIP support for client communications
US7693770B2 (en) 2004-08-06 2010-04-06 Jp Morgan Chase & Co. Method and system for creating and marketing employee stock option mirror image warrants
US7536634B2 (en) * 2005-06-13 2009-05-19 Silver Creek Systems, Inc. Frame-slot architecture for data conversion
US7599952B2 (en) * 2004-09-09 2009-10-06 Microsoft Corporation System and method for parsing unstructured data into structured data
WO2006051960A1 (ja) * 2004-11-12 2006-05-18 Justsystems Corporation 文書処理装置及び文書処理方法
US7711676B2 (en) * 2004-11-12 2010-05-04 Sap Aktiengesellschaft Tracking usage of data elements in electronic business communications
JPWO2006051957A1 (ja) * 2004-11-12 2008-05-29 株式会社ジャストシステム 文書処理装置及び文書処理方法
US7818342B2 (en) * 2004-11-12 2010-10-19 Sap Ag Tracking usage of data elements in electronic business communications
US7865519B2 (en) * 2004-11-17 2011-01-04 Sap Aktiengesellschaft Using a controlled vocabulary library to generate business data component names
JP4868733B2 (ja) * 2004-11-25 2012-02-01 キヤノン株式会社 構造化文書処理装置及び構造化文書処理方法、プログラム
US20060116864A1 (en) * 2004-12-01 2006-06-01 Microsoft Corporation Safe, secure resource editing for application localization with automatic adjustment of application user interface for translated resources
US20070041041A1 (en) 2004-12-08 2007-02-22 Werner Engbrocks Method and computer program product for conversion of an input document data stream with one or more documents into a structured data file, and computer program product as well as method for generation of a rule set for such a method
US20060129745A1 (en) * 2004-12-11 2006-06-15 Gunther Thiel Process and appliance for data processing and computer program product
KR100709379B1 (ko) * 2004-12-30 2007-04-20 주식회사 엔리치텍 메타파일을 이용한 문서양식 제작방법
US7693848B2 (en) * 2005-01-10 2010-04-06 Xerox Corporation Method and apparatus for structuring documents based on layout, content and collection
US7412649B2 (en) * 2005-01-24 2008-08-12 International Business Machines Corporation Viewing and editing markup language files with complex semantics
WO2006081428A2 (en) 2005-01-27 2006-08-03 Symyx Technologies, Inc. Parser for generating structure data
US7996443B2 (en) * 2005-02-28 2011-08-09 Microsoft Corporation Schema grammar and compilation
US8688569B1 (en) 2005-03-23 2014-04-01 Jpmorgan Chase Bank, N.A. System and method for post closing and custody services
US7475340B2 (en) * 2005-03-24 2009-01-06 International Business Machines Corporation Differential dynamic content delivery with indications of interest from non-participants
US7756839B2 (en) 2005-03-31 2010-07-13 Microsoft Corporation Version tolerant serialization
US7493556B2 (en) * 2005-03-31 2009-02-17 International Business Machines Corporation Differential dynamic content delivery with a session document recreated in dependence upon an interest of an identified user participant
US7478325B2 (en) * 2005-04-22 2009-01-13 Microsoft Corporation Methods for providing an accurate visual rendition of a text element formatted with an unavailable font
US7634515B2 (en) * 2005-05-13 2009-12-15 Microsoft Corporation Data model and schema evolution
US7587671B2 (en) * 2005-05-17 2009-09-08 Palm, Inc. Image repositioning, storage and retrieval
US7895219B2 (en) * 2005-05-23 2011-02-22 International Business Machines Corporation System and method for guided and assisted structuring of unstructured information
US7822682B2 (en) 2005-06-08 2010-10-26 Jpmorgan Chase Bank, N.A. System and method for enhancing supply chain transactions
JP2006350867A (ja) * 2005-06-17 2006-12-28 Ricoh Co Ltd 文書処理装置、文書処理方法、プログラム及び情報記録媒体
CN100437594C (zh) * 2005-09-02 2008-11-26 鸿富锦精密工业(深圳)有限公司 图元关联操作系统及方法
US7567928B1 (en) 2005-09-12 2009-07-28 Jpmorgan Chase Bank, N.A. Total fair value swap
US20070067397A1 (en) * 2005-09-19 2007-03-22 Available For Licensing Systems and methods for sharing documents
US7818238B1 (en) 2005-10-11 2010-10-19 Jpmorgan Chase Bank, N.A. Upside forward with early funding provision
US7730388B2 (en) * 2005-11-03 2010-06-01 Microsoft Corporation Converting an enhanced metafile into a chronologically independent object property list for conversion into a PDF document
WO2007064050A1 (en) * 2005-11-29 2007-06-07 Our Tech Co., Ltd. System offering a data- skin based on standard schema and the method
US7921367B2 (en) * 2005-12-20 2011-04-05 Oracle International Corp. Application generator for data transformation applications
US9207917B2 (en) 2005-12-20 2015-12-08 Oralce International Corporation Application generator for data transformation applications
US20070198516A1 (en) * 2006-01-31 2007-08-23 Ganapathy Palamadai R Method of and system for organizing unstructured information utilizing parameterized templates and a technology presentation layer
US8280794B1 (en) 2006-02-03 2012-10-02 Jpmorgan Chase Bank, National Association Price earnings derivative financial product
CN101055578A (zh) * 2006-04-12 2007-10-17 龙搜(北京)科技有限公司 基于规则的文档内容挖掘器
US8407585B2 (en) * 2006-04-19 2013-03-26 Apple Inc. Context-aware content conversion and interpretation-specific views
US7620578B1 (en) 2006-05-01 2009-11-17 Jpmorgan Chase Bank, N.A. Volatility derivative financial product
US7647268B1 (en) 2006-05-04 2010-01-12 Jpmorgan Chase Bank, N.A. System and method for implementing a recurrent bidding process
US7916972B2 (en) * 2006-07-31 2011-03-29 Xerox Corporation Landmark-based form reading with declarative language
US9811868B1 (en) 2006-08-29 2017-11-07 Jpmorgan Chase Bank, N.A. Systems and methods for integrating a deal process
US20090300482A1 (en) * 2006-08-30 2009-12-03 Compsci Resources, Llc Interactive User Interface for Converting Unstructured Documents
US20080065671A1 (en) * 2006-09-07 2008-03-13 Xerox Corporation Methods and apparatuses for detecting and labeling organizational tables in a document
US7827096B1 (en) 2006-11-03 2010-11-02 Jp Morgan Chase Bank, N.A. Special maturity ASR recalculated timing
US7801926B2 (en) 2006-11-22 2010-09-21 Microsoft Corporation Programmable logic and constraints for a dynamically typed storage system
WO2008077359A1 (de) * 2006-12-22 2008-07-03 Siemens Aktiengesellschaft Verfahren zur generierung eines maschinenausführbaren zielcodes aus einem quellcode, zugehöriges computerprogramm und computersystem
US8095575B1 (en) * 2007-01-31 2012-01-10 Google Inc. Word processor data organization
US20080320401A1 (en) * 2007-06-21 2008-12-25 Padmashree B Template-based deployment of user interface objects
CN101464870B (zh) * 2007-12-21 2011-03-23 鸿富锦精密工业(深圳)有限公司 冲压模具零件跨图档拷贝系统及方法
US20090259995A1 (en) * 2008-04-15 2009-10-15 Inmon William H Apparatus and Method for Standardizing Textual Elements of an Unstructured Text
US10169546B2 (en) * 2008-05-28 2019-01-01 International Business Machines Corporation Generating document processing workflows configured to route documents based on document conceptual understanding
US9852127B2 (en) 2008-05-28 2017-12-26 International Business Machines Corporation Processing publishing rules by routing documents based on document conceptual understanding
US20090327213A1 (en) * 2008-06-25 2009-12-31 Microsoft Corporation Document index for handheld application navigation
US20090327862A1 (en) * 2008-06-30 2009-12-31 Roy Emek Viewing and editing markup language files with complex semantics
US8126837B2 (en) * 2008-09-23 2012-02-28 Stollman Jeff Methods and apparatus related to document processing based on a document type
US8261186B2 (en) * 2009-01-02 2012-09-04 Apple Inc. Methods for efficient cluster analysis
US8108766B2 (en) * 2009-03-20 2012-01-31 Xerox Corporation XPath-based display of a paginated XML document
US8312390B2 (en) 2009-06-10 2012-11-13 Microsoft Corporation Dynamic screentip language translation
US8738514B2 (en) 2010-02-18 2014-05-27 Jpmorgan Chase Bank, N.A. System and method for providing borrow coverage services to short sell securities
US8352354B2 (en) 2010-02-23 2013-01-08 Jpmorgan Chase Bank, N.A. System and method for optimizing order execution
US20120166953A1 (en) * 2010-12-23 2012-06-28 Microsoft Corporation Techniques for electronic aggregation of information
US8442998B2 (en) 2011-01-18 2013-05-14 Apple Inc. Storage of a document using multiple representations
US8549399B2 (en) * 2011-01-18 2013-10-01 Apple Inc. Identifying a selection of content in a structured document
US8380753B2 (en) 2011-01-18 2013-02-19 Apple Inc. Reconstruction of lists in a document
US8910039B2 (en) * 2011-09-09 2014-12-09 Accenture Global Services Limited File format conversion by automatically converting to an intermediate form for manual editing in a multi-column graphical user interface
US20150199307A1 (en) * 2012-08-08 2015-07-16 Google Inc. Pluggable Architecture For Optimizing Versioned Rendering of Collaborative Documents
EP4174866A1 (de) * 2021-10-27 2023-05-03 Koninklijke Philips N.V. Benutzergeführte strukturierte dokumentenmodellierung
US9323767B2 (en) 2012-10-01 2016-04-26 Longsand Limited Performance and scalability in an intelligent data operating layer system
CN103885972B (zh) * 2012-12-20 2017-02-08 北大方正集团有限公司 一种文档内容结构化的方法及装置
US9588675B2 (en) 2013-03-15 2017-03-07 Google Inc. Document scale and position optimization
CN103885925B (zh) * 2013-03-28 2017-04-26 中国证券监督管理委员会信息中心 一种xbrl实例文档的封装方法
US20160371238A1 (en) * 2013-07-09 2016-12-22 Blueprint Sofware Systems Inc, Computing device and method for converting unstructured data to structured data
US10089388B2 (en) 2015-03-30 2018-10-02 Airwatch Llc Obtaining search results
US10229209B2 (en) * 2015-03-30 2019-03-12 Airwatch Llc Providing search results based on enterprise data
US10318582B2 (en) 2015-03-30 2019-06-11 Vmware Inc. Indexing electronic documents
US9361086B1 (en) 2015-04-22 2016-06-07 International Business Machines Corporation Collating and intelligently sequencing installation documentation
US10572579B2 (en) * 2015-08-21 2020-02-25 International Business Machines Corporation Estimation of document structure
US9881003B2 (en) * 2015-09-23 2018-01-30 Google Llc Automatic translation of digital graphic novels
CN106933781A (zh) * 2015-12-30 2017-07-07 航天信息软件技术有限公司 一种word文档数据写入系统和方法
CN107301162A (zh) * 2016-04-14 2017-10-27 珠海金山办公软件有限公司 一种识别文字文档的方法及装置
US10089285B2 (en) * 2016-12-14 2018-10-02 Rfpio, Inc. Method to automatically convert proposal documents
KR101965563B1 (ko) * 2017-03-17 2019-04-04 주식회사 인프라웨어 전자 문서 편집 방법 및 장치
KR101774257B1 (ko) * 2017-05-15 2017-09-04 주식회사 한글과컴퓨터 객체의 서식을 유지하는 문서 편집 장치 및 그의 동작 방법
US10592738B2 (en) * 2017-12-01 2020-03-17 International Business Machines Corporation Cognitive document image digitalization
US10452904B2 (en) 2017-12-01 2019-10-22 International Business Machines Corporation Blockwise extraction of document metadata

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5276793A (en) * 1990-05-14 1994-01-04 International Business Machines Corporation System and method for editing a structured document to preserve the intended appearance of document elements
JP3023690B2 (ja) * 1990-06-15 2000-03-21 富士ゼロックス株式会社 文書処理装置及び方法
GB9225566D0 (en) * 1992-12-07 1993-01-27 Incontext Corp System for display of structured documents
US5386369A (en) * 1993-07-12 1995-01-31 Globetrotter Software Inc. License metering system for software applications
WO1996017310A1 (en) 1994-11-29 1996-06-06 Avalanche Development Company System and process for creating structured documents
US6003048A (en) * 1995-04-27 1999-12-14 International Business Machines Corporation System and method for converting a coordinate based document to a markup language (ML) based document
JPH0969101A (ja) 1995-08-31 1997-03-11 Hitachi Ltd 構造化文書生成方法および装置
JPH10116275A (ja) * 1996-10-11 1998-05-06 Fuji Xerox Co Ltd 文書スタイル編集装置
JPH10307816A (ja) * 1997-05-08 1998-11-17 Just Syst Corp 構造化文書処理装置、構造化文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102016224894A1 (de) * 2016-12-14 2018-06-14 Robert Bosch Gmbh Diagnose-Dongle für ein Werkzeug und Verfahren zur Diagnose und/oder Steuerung eines Werkzeugs mittels eines Diagnose-Dongles

Also Published As

Publication number Publication date
ATE300766T1 (de) 2005-08-15
EP1166214B1 (de) 2005-07-27
CN1392986A (zh) 2003-01-22
DE60112188D1 (de) 2005-09-01
US6910182B2 (en) 2005-06-21
WO2001055899A1 (en) 2001-08-02
RU2001128738A (ru) 2003-07-20
US20010032217A1 (en) 2001-10-18
US20010032218A1 (en) 2001-10-18
CA2365622A1 (en) 2001-08-02
JP2003521069A (ja) 2003-07-08
AU2001226368A1 (en) 2001-08-07
WO2001055900A9 (en) 2002-04-18
EP1166214A1 (de) 2002-01-02
KR20010110671A (ko) 2001-12-13
AU2775401A (en) 2001-08-07
WO2001055900A1 (en) 2001-08-02

Similar Documents

Publication Publication Date Title
DE60112188T2 (de) Methode und system zur erzeugung strukturierter dokumente für verschiedene darstellungsweisen
DE10042601B4 (de) Sprache für XML-Server-Seiten
DE10135445B4 (de) Integriertes Verfahren für das Schaffen einer aktualisierbaren Netzabfrage
DE68919503T2 (de) Methode und System zur Darstellung einer Benutzeroberfläche auf einem Computerbildschirm.
DE69625884T2 (de) Informationswiederauffindungssystem
DE3586273T2 (de) Implizite erzeugung einer superblockstruktur in einem vieldaten-edierungsgeraet.
DE10129209A1 (de) Produktkonstruktionssystem und -verfahren
EP1902407B1 (de) System zum übertragen von daten aus einer dokumentenanwendung in eine datenanwendung
DE10048940A1 (de) Erzeugen von Dokumenteninhalten durch Transcodierung mit Hilfe von Java Server Pages
US20060174199A1 (en) Web-based design system
US20060195424A1 (en) Generating business warehouse reports
US20050234886A1 (en) Report designer tool and method
DE69907714T2 (de) Komponentbasiertes quellcodegeneratorverfahren
US7475337B1 (en) Generating structured documents by associating document elements in a first display with displayed document type definitions in a second display
DE3486349T2 (de) Menü-gestütztes, natürliche Sprache verstehendes System.
DE102016218656A1 (de) Verfahren zur Generierung eines User-Interfaces in Form einer Mindmap
DE60010078T2 (de) System zur analyse von daten für den elektronischen handel
DE10221178A1 (de) Verfahren zur Generierung von Seiten in einer Auszeichnungssprache zur Auswahl von Produkten und Softwaretool
EP2017776A1 (de) System und Verfahren zur Steuerung der Generierung und Verteilung von Publikationen
DE112015004642T5 (de) Erzeugen von Webbrowseransichten für Anwendungen
Salminen et al. SGML for E-Governance: The case of the Finnish Parliament
EP1254412B1 (de) Verfahren zur datenverwaltung
DE10129147B4 (de) Verfahren und Datenverarbeitungs-System zum Entwicklen von Software im Internet-, Netzwerk- und/oder Anwendungssoftware-Bereich für einen Webserver
DelGobbo A Beginner’s Guide to Incorporating SAS® Output in Microsoft® Office Applications
DE202022104829U1 (de) System zur Interaktion zwischen einem digitalen Endgerät und einem analogen Objekt

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee