DE602005006029T2 - Datenverarbeitungseinheit und Datenverarbeitungsprogramm gespeichert in einem computerlesbaren Aufzeichnungsmedium - Google Patents

Datenverarbeitungseinheit und Datenverarbeitungsprogramm gespeichert in einem computerlesbaren Aufzeichnungsmedium Download PDF

Info

Publication number
DE602005006029T2
DE602005006029T2 DE602005006029T DE602005006029T DE602005006029T2 DE 602005006029 T2 DE602005006029 T2 DE 602005006029T2 DE 602005006029 T DE602005006029 T DE 602005006029T DE 602005006029 T DE602005006029 T DE 602005006029T DE 602005006029 T2 DE602005006029 T2 DE 602005006029T2
Authority
DE
Germany
Prior art keywords
attribute
record
data processing
component
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE602005006029T
Other languages
English (en)
Other versions
DE602005006029D1 (de
Inventor
Tetsuya Nose
Motonori Tanaka
Kazuhiko Iwanaga
Yasuyuki Fujita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Publication of DE602005006029D1 publication Critical patent/DE602005006029D1/de
Application granted granted Critical
Publication of DE602005006029T2 publication Critical patent/DE602005006029T2/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/543User-generated data transfer, e.g. clipboards, dynamic data exchange [DDE], object linking and embedding [OLE]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion

Description

  • Die Offenbarung betrifft eine Datenverarbeitungseinheit zum Importieren von Textdaten in eine Datenbank und ein Datenverarbeitungsprogramm, das auf einem computerlesbaren Medium gespeichert ist.
  • Derzeit existieren verschiedene Arten von Softwareteilen zum Handhaben von Zeichenketten (Textdaten) auf einem Computer und Datenaustausch zwischen unterschiedlichen Softwareteilen wurde häufig ausgeführt. Beispielweise werden persönliche Adressdaten als Adresse für Post, die mit Textverarbeitungssoftware erstellt wurde, verwendet, und die Adressdaten werden auch verwendet, um auf eine Postkarte oder dergleichen gedruckt zu werden. Ferner können die Adressdaten durch E-Mail übertragen werden. Weil die Adressdaten in einer von der Software verwendeten Datei in einem von der Software verwendeten Format gespeichert werden, müssen in diesem Fall diese Adressdaten, wenn die Adresse für andere Software verwendet wird, in ein Format exportiert/importiert werden, das von beiden Softwareteilen lesbar ist, oder ist es notwendig, dass durch Aktivie rung beider Softwareteile ein Adressabschnitttext so dargestellt wird, dass er manuell kopiert und eingefügt wird.
  • Ein Verfahren zur Verwendung von Daten ohne solch ein Zeit- und Arbeitsbedürfnis wird in der japanischen Patentanmeldung mit der Offenlegungsnummer HEI 11-296512 offenbart. Gemäß der Adressverarbeitungseinheit und des Adressverarbeitungsverfahrens, das in der Veröffentlichung offenbart ist, werden die eingegebenen Dokumentdaten zeilenweise unter der Verwendung eines Wörterbuchs analysiert, so dass ein Zeilenattribut und eine Art der gesamten Daten basierend auf Aggregation der Zeilenattribute bestimmt wird. Die Daten werden dann in einer Datenbank mit entsprechenden Attributen gespeichert.
  • Jedoch wird gemäß der herkömmlichen Einheit und des herkömmlichen Verfahrens der Umfang eines Wörterbuchs sehr groß um die Genauigkeit zur Bestimmung der Attribute zu intensivieren, weil das Wörterbuch dazu verwendet wird, das Attribut der Daten zu bestimmen, wodurch die Verarbeitungsgeschwindigkeit beeinflusst wird, und eine Verarbeitungseinheit mit einer geringen Verarbeitungskapazität ist nicht dazu in der Lage, das herkömmliche Verfahren richtig zu verwenden.
  • Druckschrift US-A-6040832 offenbart eine Datenverarbeitungseinheit, die eine eingegebene Zeichenkette in eine Datenbank eingibt und aufweist: Speicherungsmittel zum Speicher der Datenbank, Anzeigemittel zum Anzeigen der Zeichenkette und Auswahlmittel zum Auswählen eines vorbestimmten Bereichs der Zeichenkette, die durch das Anzeigemittel angezeigt wird.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Entsprechend löst diese Offenbarung das oben beschriebene Problem. Eine Aufgabe dieser Erfindung ist es, eine Datenverarbeitungseinheit, die dazu in der Lage ist, Daten mit einer einfachen Struktur zu importieren, und ein Datenverarbeitungsprogramm, das auf einem computerlesbaren Medium gespeichert ist, bereitzustellen.
  • Um die Aufgabe zu lösen, wird nach einem ersten Aspekt eine Datenverarbeitungseinheit bereitgestellt, die eine eingegebene Zeichenkette analysiert und Komponenten dieser eingegebenen Zeichenkette in ein Datenbankfeld, das einer Art der eingegebenen Zeichenkette entspricht, importiert, aufweisend Speichermittel zum Speichern der Datenbank, die mehrere Felder und Datensätze beinhaltet; Anzeigemittel zum Anzeigen der Zeichenkette; Auswahlmittel zum Auswählen eines vorbestimmten Bereichs der Zeichenkette, die durch das Anzeigemittel angezeigt wird; Datensatzzuweisungsmittel zum Zuweisen einer durch das Auswahlmittel ausgewählten Zeichenkette an die Datensätze; Komponentenunterteilungsmittel zum Unterteilen einer Zeichenkette in einem durch das Datensatzzuweisungsmittel zugewiesenen Datensatz in Komponenten; Attributbestimmungsmittel zum Bestimmen des Attributs der Komponenten, die durch das Unterteilen mit dem Komponentenunterteilungsmittel unterteilt wurden; und Speichermittel zum Speichern der Komponenten in dem Datenbankfeld, das dem Attribut, das durch das Attributbestimmungsmittel bestimmt wurde, entspricht.
  • Gemäß einem zweiten Aspekt wird eine Datenverarbeitungseinheit bereitgestellt, die eine eingegebene Zeichenkette analysiert und Komponenten der eingegebenen Zeichenkette in ein Datenbankfeld importiert, das einer Art der eingegebenen Zeichenkette entspricht, aufweisend Speichermittel zum Speichern der Datenbank, die mehrere Felder und Datensätze beinhaltet; Anzeigemittel zum Anzeigen der Zeichenkette; Auswahlmittel zum Auswählen eines vorbestimmten Bereichs der Zeichenkette, die durch das Anzeigemittel angezeigt wird; Attributbestimmungsmittel zum Zuweisen einer durch das Auswahlmittel ausgewählten Zeichenkette an einen Datensatz gemäß einem vorausgehend eingestellten Importformat und zum Unterteilen einer an den Datensatz zugewiesenen Zeichenkette in Komponenten, um das Attribut der durch die Unterteilung erhaltenen Komponenten zu bestimmen; und Speichermittel zum Speichern der Komponenten in dem Datenbankfeld, das dem durch das Attributbestimmungsmittel bestimmten Attribut entspricht.
  • Gemäß einem dritten Aspekt wird ein Datenverarbeitungsprogramm, das auf einem computerlesbaren Medium gespeichert ist, bereitgestellt, das einen Computer dazu veranlasst, eine eingegebene Zeichenkette zu analysieren und einen Datenimport in ein Datenbankfeld, das einer Art der eingegebenen Zeichnkette entspricht, auszuführen, wobei das Datenverarbeitungsprogramm einen Speicherungsvorgang, der mehrere Felder und Datensätze in einer speicherbaren Datenbank speichert; einen Anzeigevorgang, der die Zeichenkette anzeigt; einen Auswahlvorgang, der einen vorbestimmten Bereich für die Zeichenkette, die durch den Anzeigenvorgang angezeigt wird, auswählt; einen Datensatzzuweisungsvorgang, der eine durch den Auswahvorgang ausgewählte Zeichenkette den Datensätzen zuweist; einen Komponentenunterteilungsvorgang, der eine Zeichenkette in einem durch den Datensatzzuweisungsvorgang zugewiesenen Datensatz in Komponenten unterteilt; einen Attributbestimmungsvorgang, der das Attribut der Komponenten bestimmt, die durch Unterteilung des Komponentenunterteilungsvorgangs erhalten wurden; und einen Speichervorgang, der die Komponenten in einem Datenbankfeld speichert, das dem in dem Attributbestimmungsvorgang bestimmten Attribut entspricht, aufweist.
  • Gemäß einem vierten Aspekt wird ein Datenverarbeitungsprogramm, das auf einem computerlesbaren Medium gespeichert ist, bereitgestellt, das einen Computer dazu veranlasst, eine eingegebene Zeichenkette zu analysieren und einen Datenimport in ein Datenbankfeld veranlasst, das eine Art der eingegebenen Zeichenkette entspricht, wobei das Datenverarbeitungsprogramm einen Speicherungsvorgang, der mehrere Felder und Datensätze in einer speicherbaren Datenbank speichert; einen Anzeigevorgang, der die Zeichenkette anzeigt; einen Auswahlvorgang, der einen vorbestimmten Bereich für die Zeichenkette, die durch den Anzeigevorgang angezeigt wird, auswählt; ein Attributbestimmungsvorgang, der eine durch den Auswahlvorgang ausgewählte Zeichenkette einem Datensatz gemäß einem vorläufig eingestellten Importformat zuweist und eine dem Datensatz zugewiesene Zeichenkette in Komponenten unterteilt, um die Attribute der durch die Unterteilung erhaltenen Komponenten zu bestimmen; und einem Speichervorgang zum Speichern der Komponenten in einem dem durch den Attributbestimmungsvorgang entsprechenden Datenbankfeld, aufweist.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Ausführungsbeispiele der Erfindung werden nachfolgend im Detail unter Bezugnahme auf die begleitenden Zeichnungen beschrieben.
  • 1 ist ein Blockschaltbild, das eine elektrische Struktur der Datenverarbeitungseinheit zeigt;
  • 2 ist ein schematisches Diagramm, das die Strukturen einer Adressdatenbank zeigt;
  • 3 ist ein schematisches Diagramm, das die Struktur eines RAM zeigt;
  • 4 ist ein Flussdiagramm einer Hauptroutine der Datenverarbeitungseinheit gemäß einem ersten Ausführungsbeispiel;
  • 5 ist ein Flussdiagramm einer Unterroutine für einen Zeilenkopfzeichenkettenentfernungsvorgang, der in S13 aus 4 ausgeführt wird;
  • 6 ist ein Beispiel eines Datensatzzuweisungsbedingungseinstellungsbildschirms;
  • 7 ist ein Beispiel eines Textdatenimportierungsbildschirms;
  • 8 ist ein Beispiel eines E-Mail-Importierungsbildschirms;
  • 9 ist ein Beispiel eines Bildschirms, der ein Ergebnis anzeigt, das aus Textdaten in die Adressdatenbank importiert wurde;
  • 10 ist ein Flussdiagramm einer Hauptroutine gemäß einem zweiten Ausführungsbeispiel;
  • 11 ist ein Flussdiagramm einer Unterroutine zur Postleitzahlenbestätigungsverarbeitung, die in S47 aus 10 ausgeführt wird;
  • 12 ist ein Beispiel eines Datenimportierungsbildschirms aus einer Tabellenkalkulationssoftware;
  • 13 ist ein Beispiel eines Bildschirms, der ein Ergebnis darstellt, das aus den Tabellenkalkulationsdaten in die Adressdatenbank importiert wurde;
  • 14 ist ein schematisches Diagramm, das die Struktur des RAMs gemäß einem dritten Ausführungsbeispiel zeigt;
  • 15 ist ein Bilddiagramm, das ein Datenbeispiel zeigt, das in einem Formatdatenpuffer, einem Datensatzdatenpuffer und einem Attributdatenpuffer des RAMs gehalten wird;
  • 16 ist ein Flussdiagramm einer Hauptroutine gemäß einem dritten Ausführungsbeispiel;
  • 17 ist ein Flussdiagramm einer Unterroutine zur Datensatzzuweisungsverarbeitung, die in S111 aus 16 ausgeführt wird;
  • 18 ist ein Flussdiagramm einer Unterroutine zur Attributbestimmungsverarbeitung, die in S115 aus 16 ausgeführt wird;
  • 19 ist ein Beispiel eines Importformateinstellungsbildschirms;
  • 20 ist ein Flussdiagramm einer Hauptroutine gemäß einem vierten Ausführungsbeispiel; und
  • 21 ist ein Beispiel des Importformateinstellungsbildschirms.
  • DETAILLIERTE BESCHREIBUNG VON AUSFÜHRUNGSBEISPIELEN
  • Die Aufgabe der Erfindung wird mittels der Merkmale der Ansprüche gelöst.
  • Zunächst werden die bevorzugten Ausführungsbeispiele unter Bezugnahme auf die begleitenden Zeichnungen beschrieben. Zuerst wird ein Ausführungsbeispiel einer Datenverarbeitungseinheit 1 beschrieben, die das Datenverarbeitungsprogramm verwendet. Dieses Ausführungsbeispiel zielt darauf ab, Daten von einer Software, die Text handhabt, so wie eine Textverarbeitungssoftware und einen Texteditor in eine Adressdatenbank zu importieren. Ein importiertes Ergebnis kann von einer Adressdatensatzsoftware verwendet werden, die eine Adressdatenbank in gleicher Art handhabt, wie von einem Benutzer manuell eingegebene Adressdaten. Zuerst wird die Struktur der Datenverarbeitungseinheit unter Bezugnahme auf die 13 beschrieben. 1 ist ein Blockschaltbild, das die elektrische Struktur der Datenverarbeitungseinheit 1 zeigt. 2 ist ein schematisches Diagramm, das die Struktur einer Adressdatenbank 32 zeigt. 3 ist ein schematisches Diagramm, das die Struktur des RAMs 22 zeigt.
  • Wie in 1 gezeigt ist, wird die Datenverarbeitungseinheit 1 aus einem wohlbekannten Personalcomputer gebildet, der eine CPU 20 zum Steuern der Datenverarbeitungseinheit 1 aufweist. Ein ROM 21, das ein BIOS und dergleichen speichert, ein RAM 22, das verschiedene Arten von Daten temporär speichert, und eine E/A-Schnittstelle 40 zum Austauschen von Daten sind mit der CPU 20 verbunden. Der gesamte oder Teile des Bildschirms 24, der ein Anzeigemittel zum Anzeigen der Zeichen, Bilder und dergleichen ist, eine Tastatur 26 zum Eingeben von Daten durch verschiedene Arten von Tasten, eine Maus 28 zum Zeigen auf eine beliebige Position auf dem Bildschirm, eine Festplatteneinheit 30, ein Diskettenlaufwerk 41, ein DVD-/CD-Laufwerk 42, ein Speicherkartenleser/-beschreiber 43 und eine Netzkarte 44 sind gewöhnlicherweise mit der E/A-Schnittstelle 40 verbunden. Die Festplatteneinheit 30 beinhaltet einen Programmspeicherbereich 31 zum Speichern von Programmen, die durch die CPU 20 ausgeführt werden, und eine Adressdatenbank 32. Ein Programm, das durch die CPU 20 ausgeführt wird, kann auf einem computerlesbaren Medium, wie einem ROM, einem CD-ROM, einem DVD-ROM, einer Diskette, einer Speicherkarte und dergleichen gespeichert sein und zugeführt werden, um in die Festplatteneinheit 30 der Datenverarbeitungseinheit 1 eingelesen zu werden oder über ein Netz heruntergeladen werden, um auf die Festplatteneinheit 30 der Datenverarbeitungseinheit 1 eingelesen zu werden.
  • Wie in 2 gezeigt ist, besteht die Adressdatenbank 32 aus einem Namensfeld 321, einem Adressfeld 322, einem Postleitzahlenfeld 323, und anderen Feldern nach Eignung. Für das Namensfeld 321, das Adressfeld 322, und das Postleitzahlenfeld 323 gilt, dass Daten aus Textdaten durch eine Datenverarbeitung, die später beschrieben wird, in jedem Feld gespeichert wird. Während dessen können Daten nicht nur automatisch eingegeben werden, sondern auch durch einen Benutzer über Software, die die Adressdatenbank 32 bedient, beispielsweise Adressdatensatzsoftware, direkt in die Datenbank eingegeben werden.
  • Als nächstes besteht, wie in 3 gezeigt ist, das RAM 22 aus einem Datensatzuweisungsbedingungspuffer 221 zum Aufzeichnen einer Datensatzzuweisungsbedingung, die einen Bereich spezifiziert, der von einer ausgewählten Zeichenkette einem einzelnen Datensatz zugeordnet werden soll, einen Textdatenpuffer 222 zum Halten von importierten Textdaten, einen Datensatzdatenpuffer 223 zum Halten von Daten jedes Datensatzes, der durch Unterteilen der importierten Textdaten erzeugt wurde, einen Attributdatenpuffer 224 zum Halten von Komponenten, die durch Unterteilen eines Datensatzes entsprechend dem Attribut erzeugt wurden, einen Textkombinationspuffer 225, der ein Bereich ist, der benutzt wird, wenn Komponenten mit den gleichen Attributen kombiniert werden, und einen Postleitzahlenbestätigungspuffer 226, der ein Bereich ist, der zur Bestätigung des Postleitzahlenattributs verwendet wird. Das RAM 22 beinhaltet zusätzlich verschiedene Arten von Arbeitsbereichen.
  • Als nächstes wird der Betrieb der Datenverarbeitungseinheit 1 mit solch einer Struktur unter Bezugnahme auf die Flussdiagramme aus 4 und 5 und die Beispiele der Anzeigebildschirme, die in 69 gefunden werden können, beschrieben. Danach wird ein Beispiel für das Importieren von Daten von der Textverarbeitungssoftware in eine Datenbank 32 beschrieben. Wenn der Benutzer eine Textverarbeitungssoftware startet, wird ein Textverarbeitungsfenster 110 auf dem Bildschirm 24 dargestellt, wie in 7 gezeigt ist. Hier gibt der Benutzer Zeichenketten neu ein oder ruft eine bestehende Datei auf, so dass eine Zeichenkette angezeigt wird. Als nächstes wird eine Zeichenkette eines Abschnitts, den der Benutzer importieren will, unter Verwendung der Maus 28 oder der Tastatur 26 ausgewählt, und ein ausgewählter Bereich 112 wird invertiert/hervorgehoben/markiert. Wenn eine Einfügen-Schaltfläche, die in dem Textverarbeitungsfenster 110 bereitgestellt ist, in diesem Zustand angeklickt wird, wird das Datenverarbeitungsprogramm gestartet, so dass eine Verarbeitung dieses Ausführungsbeispiels, die in 4 gezeigt ist, gestartet wird.
  • Wenn das Programm gestartet wird, wird zuerst bestimmt, ob eine Datensatzzuweisungsbedingung eingestellt ist (S1). Die Einstellung der Datensatzzuweisungsbedingung kann durchgeführt werden, wenn ein Datensatzzuweisungseinstellungsbildschirm 100, wie er in 6 gezeigt ist, durch Rechtsklicken oder dergleichen während der Aktivierung des Programms dargestellt wird. Die Datensatzzuweisungsbedingung stellt ein, wie viele Zeilen eines ausgewählten Textes als ein einzelner Datensatz importiert werden sollen. Wenn ein zusammenhängender Bereich ausgewählt ist, wird er abhängig von der Anzahl der Zeilen, die in der Datensatzzuweisungsbedingung eingestellt sind, in Datensätze unterteilt. Wenn spezifiziert ist, dass ein individuell ausgewählter Bereich als gesonderter Datensatz importiert wird und der Benutzer mehrere Stellen auswählt, werden die jeweiligen Stellen als einzelner Datensatz importiert.
  • Wenn beabsichtigt ist, dass eine Datensatzzuweisungsbedingung eingestellt wird (S1: JA), wird eine eingestellte Bedingung in dem Datensatzzuweisungsbedingungspuffer 221 im RAM 22 gespeichert (S3). Wenn nicht beabsichtigt ist, dass eine Datensatzzuweisungsbedingung eingestellt wird (S1: NEIN) oder nachdem die Einstellung der Datensatzzuweisungsbedingung endet, wird das Verarbeiten eines ausgewählten Textes ausgeführt. Aus diesem Grund wird zuerst eine in dem Datensatzzuweisungsbedingungspuffer 221 gespeicherte Datensatzzuweisungsbedingung bezogen (S5). Zwischenzeitlich wird ein vorbestimmter Wert in bezogen (S5). Zwischenzeitlich wird ein vorbestimmter Wert in dem Datensatzzuweisungsbedingungspuffer 221 gespeichert, bis der Benutzer eine Datensatzzuweisungsbedingung einstellt. Es ist zulässig, ein zuvor eingestelltes Importformat zu speichern. Zum Beispiel ist in dem Fall aus 6 "2" als Anzahl der Zuweisungszeilen eingestellt, und es wird angenommen, dass diese Anzahl aus dem Zuweisungsbedingungspuffer 221 bezogen wurde.
  • Als nächstes wird der Text in dem ausgewählten Bereich bezogen und in dem Textdatenpuffer 222 gespeichert (S7). Dann wird die Datensatzzuweisungsbedingung, die im Schritt S5 bezogen wurde, angewendet, um den ausgewählten Text in Datensätze zu unterteilen (S9). In dem Fall aus 7 umfasst der ausgewählte Bereich 112 vier Zeilen. Wenn "zwei Zeilen", was eine zuvor eingestellte Datensatzzuweisungsbedingung ist, angewendet wird, wird ein Text von jeweils zwei Zeilen als einzelner Datensatz gehandhabt.
  • Als nächstes werden die Datensatzdaten, die im Schritt S9 zugeordnet wurden, in dem Datensatzdatenpuffer 223 gespeichert (S11). Entsprechend dem vorherigen Ausführungsbeispiel wird "YOSHIDA Jiro ... Tokyo-to" als ein erster Datensatz gespeichert und "ITO Saburo ... Nagoya-shi" als ein zweiter Datensatz aufgezeichnet.
  • Als nächstes geschieht eine Zeilenkopfzeichenkettenlöschungsverarbeitung, wenn all die Zeilenkopfzeichen des Datensatzes, der in dem Datensatzdatenpuffer 223 gespeichert ist, identisch sind, z. B. > oder >>, wobei bestimmt wird, dass das Zeichen ein Zitatzeichen ist, das in einer E-Mail verwendet wird, z. B. #, und das Löschen der Zeilenkopfzeichenkette wird ausgeführt (S13). Das Detail der Zeilenkopfzeichenkettelöschungsverarbeitung wird unter Bezugnahme auf 5 beschrieben.
  • Als nächstes wird bestimmt, dass Daten aus der ersten Zeile der Datensatzdaten, die in dem Datensatzdatenpuffer 223 gespeichert sind, zu einem Namensattribut gehören (S15). Entsprechend diesem Ausführungsbeispiel werden die Daten jeder durch einen Zeilenvorschubscode abgetrennten Zeile der Datensatzdaten, die in dem Datensatzdatenpuffer 223 gespeichert sind, als einzelne Komponente behandelt. Dann wird in diesem Schritt ferner das Attribut der Komponente, die aus den Daten der ersten Zeile gebildet wird, automatisch als Namensattribut bestimmt.
  • Als nächstes wird bestimmt, dass das Attribut der Daten aus der zweiten und folgenden Zeilen zu einem Adressattribut gehört (S17). Weil in dem vorherigen Beispiel die Datensatzdaten aus zwei Zeilen gebildet werden, wird nur bestimmt, dass die zweite Zeile ein Adressattribut ist und es gibt nur zwei Komponenten. Wenn die Anzahl der Datensatzzuweisungszeilen drei oder mehr ist, werden die zweite, die dritte, die vierte usw. auch als Adressattribut betrachtet.
  • Als nächstes wird bestimmt, ob die Komponenten des Adressattributs zusammenhängend sind (S19). Weil bestimmt wurde, dass alle diejenigen Datenattribute der zweiten und folgenden Zeilen ein Adressattribut sind, liegen die Komponenten des Adressattributs zusammenhängend vor, wenn die Anzahl der Datensatzzuweisungszeilen drei oder mehr ist. Wenn die Komponenten des Adressattributs zusammenhängend sind (S19: JA), werden die Textdaten der Komponenten unter Verwendung des Textkombinierungspuffers 225 kombiniert (S21). Dann werden die kombinier ten Textdaten über den Attributdatenpuffer als die Komponente des Adressattributs geschrieben und darin gespeichert, und die Prozedur schreitet zu Schritt S23 fort.
  • Wenn das Adressattribut aus nur einer Komponente gebildet wird (S19: NEIN), schreitet die Prozedur zu Schritt S23 fort. In S23 werden das Attribut und die Komponente aus dem Attributdatenpuffer 224 ausgelesen und in einem Feld der korrespondierenden Adressdatenbank 32 gespeichert. Beispielsweise wird in dem vorherigen Beispiel "YOSHIDA Jiro" in dem Namensfeld 321 und "T 104-0035 3-3-8, Kyobashi Chuo-ku, Tokyo-to" in dem Adressfeld 322 gespeichert. Das Symbol "T" vor der Postleitzahl 104-0035 ist ein japanisches Postleitzahlensymbol.
  • Als nächstes wird bestimmt, ob ein unbehandelter nächster Datensatz in den Datensatzdatenpuffer 223 existiert (S25). Wenn es einen nächsten Datensatz gibt (S25: JA), kehrt die Prozedur zu Schritt S13 zurück, in dem das Attribut jeder Komponente bestimmt wird, bis es keine weiteren unbehandelten Datensätze mehr gibt, und die Verarbeitung zum Speichern des Attributs jeder Komponente in dem geeigneten Datenbankfeld wird wiederholt. Wenn es keinen nächsten Datensatz gibt (S25: NEIN), wird die Adressdatensatzsoftware gestartet, und wie in 9 gezeigt wird, wird ein Importierungsergebnis in einem Adressdatenbankbereich 132 eines Adressdatensatzfensters 130 angezeigt (S27). Wie in 9 gezeigt ist, werden ein Namensfeld 134, ein Adressfeld 136, ein Postleitzahlenfeld 138 und ein Memofeld 139 in dem Adressdatenbankbereich 132 angezeigt, wobei das Ergebnis gezeigt wird, dass aus einer Textverarbeitungssoftware ausgewählter Text in jedem Feld gemäß einem bestimmten Attribut gespeichert wurde. Weil das Importieren der Adressdaten in obiger Art vollendet wurde, endet das Datenverar beitungsprogramm. Der Benutzer kann den Betrieb der Adressdatensatzsoftware fortführend ausführen.
  • Als nächstes wird die Zeilenkopfzeichenkettenlöschungsverarbeitung, die in Schritt S13 aus 4 ausgeführt wird, unter Bezugnahme auf 5 beschrieben. Die Zeilenkopfzeichenkettenlöschungsverarbeitung ist eine Verarbeitung zum Löschen von Markierungen, wie ">", ">>", "#" und dergleichen, die an einem Zeilenkopf angebracht sind und insbesondere in E-Mails verwendet werden, wie in einem E-Mailfenster 120 aus 8 gezeigt ist, und zum Importieren von Daten in die Datenbank, weil diese Markierungen für den Dateninhalt irrelevant sind.
  • Zuerst wird bestimmt, ob all die Zeilenkopfzeichenketten der jeweiligen Zeilen in den Textdaten eines Datensatzes, der in dem Datensatzdatenpuffer 223 gespeichert ist, identisch sind (S31). Beispielsweise wird bestimmt, dass in den Textdaten in dem Datensatzdatenpuffer 223, die aus dem ausgewählten Bereich 122 in 8 bezogen wurden, alle ihre Zeilenkopfzeichenketten identisch sind, da die Daten der drei Zeilen mit ">" beginnen.
  • Wenn alle die Zeilenkopfzeichenketten identisch sind (S31: JA), wird die identische Zeichenkette gelöscht (S33). In dem vorherigen Beispiel wird das erste ">" jedes Zeilenkopfs gelöscht. Dann werden nach der Löschung die verbleibenden Daten in dem Datensatzdatenpuffer 223 gespeichert (S35). Dann kehrt die Prozedur zu Schritt S31 zurück, in dem wieder bestimmt wird, ob alle Zeilenkopfzeichenketten in den Textdaten nach der Löschung identisch sind (S31). Obwohl in dem vorherigen Beispiel in den Daten das erste ">" gelöscht wurde, verbleibt immer noch ein weiteres ">" an dem Zeilenkopf, und folglich wird in Schritt S31 JA bestimmt, und das verbleibende ">" wird gelöscht. Durch wiederholtes Prüfen der Zeichenkette an einem Zeilenkopf in dieser Art können alle Zeilenkopfzeichenketten gelöscht werden, selbst wenn Zitatzeichen wiederholt angebracht sind. Wenn es dazu kommt, dass Zeilenkopfzeichenketten nicht identisch sind (S31: NEIN), kehrt die Prozedur zu der Hauptroutine in 4 zurück.
  • Bei der Datenverarbeitungseinheit 1 aus diesem Ausführungsbeispiel kann das Attribut jeder Zeile einfach ohne jede detaillierte Einstellung bestimmt werden, und Daten werden in eine Datenbank einer anderen Software importiert, wenn der Benutzer unter Verwendung einer Maus oder dergleichen Textdaten auswählt, die mit einer Textverarbeitungssoftware eingegeben wurden, und wie oben beschrieben ein Einfügeprogramm startet.
  • Als nächstes wird ein zweites Ausführungsbeispiel beschrieben. Gemäß dem zweiten Ausführungsbeispiel werden Daten aus einer Tabellenkalkulationssoftware in die Adressdatenbank 32 importiert. Weil der Aufbau des zweiten Ausführungsbeispiels identisch mit dem ersten Ausführungsbeispiel ist, werden die 13 und ihre Beschreibung übernommen. Im Folgenden wird der Betrieb der Datenverarbeitungseinheit 1 des zweiten Ausführungsbeispiels gemäß den Flussdiagrammen aus den 10 und 11 und den Beispielen der Anzeigebildschirme aus den 12 und 13 beschrieben.
  • Im Folgenden wird ein Beispiel eines Datenimports aus einer Tabellenkalkulationssoftware beschrieben. Wenn der Benutzer eine Tabellenkalkulationssoftware startet, wird ein Tabellenkalkulationsprogrammfenster 140, das in 12 gezeigt ist, gestartet. Das Tabellenkalkulationsprogrammfenster wird aus einzelnen Zellen gebildet, die durch Spalten (Feld) und Zeilen spezifiziert sind. Der Benutzer gibt eine Zeichenkette in eine Zelle neu ein oder ruft eine existierende Datei auf, um eine Zeichenkette anzuzeigen. In dem in 12 gezeigten Beispiel werden Namen in einer Spalte A jeder Zeile eingegeben, eine Adresse wird in Spalten B–D eingegeben und eine Postleitzahl wird in Spalte E eingegeben. Hier wählt der Benutzer eine Zelle eines Abschnitts unter Verwendung der Maus 28 oder der Tastatur 26 aus, die er importieren will, und invertiert einen ausgewählten Bereich 142. Wenn der Benutzer in diesem Zustand die Einfügen-Schaltfläche anklickt, die in dem Tabellenkalkulationsprogrammfenster 140 vorgesehen ist, wird ein Datenverarbeitungsprogramm gestartet, so dass die Verarbeitung dieses Ausführungsbeispiels, wie in 10 gezeigt ist, gestartet wird.
  • Wenn das Programm gestartet wird, werden zuerst die Textdaten des ausgewählten Bereichs entsprechend jedem Feld bezogen (S41), jeder Datensatz wird den Datensätzen in der Datenbank zugeordnet, und dann wird jeder Datensatz in dem Datensatzdatenpuffer 223 gespeichert (S42). Als nächstes wird die Datenverarbeitung aufeinanderfolgend von dem ersten Datensatz an ausgeführt. Zuerst werden Daten eines Kopffeldes als Namensattribute bestimmt und in dem Attributpuffer 224 gespeichert (S43). Entsprechend diesem Ausführungsbeispiel werden mit einem Feld seiner Originaldaten als die Komponente deren Attribut bestimmt.
  • Als nächstes wird bestimmt, dass alle Daten der verbleibenden Felder Adressattribute sind, und sie werden in dem Attributdatenpufer 224 gespeichert (S45). Dann wird die Postleitzahlenbestätigungsverarbeitung zum Prüfen, ob Daten eines letzten Feldes eine Postleitzahl sind, ausgeführt (S47). Das Detail der Postleitzahlenbestätigungsverarbeitung wird unter Bezugnahme auf 11 beschrieben.
  • Nachdem die Postleitzahlenbestätigungsverarbeitung endet, wird bestimmt, ob das Attribut der Komponente, die in dem Attributdatenpuffer 224 gespeichert ist, ein Adressattribut ist, das in Vielzahl zusammenhängend ist (S49). Wenn das Adressattribut zusammenhängend ist (S49: JA), werden Textdaten der Komponenten unter Verwendung des Textkombinierungspuffers 225 kombiniert (S51). Dann werden die kombinierten Textdaten über den Attributdatenpuffer 224 als Komponenten des Adressattributs geschrieben und gespeichert, und die Prozedur schreitet zu Schritt S53 fort.
  • Wenn es nur eine Komponente mit dem Adressattribut gibt (S49: NEIN), schreitet die Prozedur zu Schritt S53 fort. In Schritt S53 werden ein Attribut und eine Komponente aus dem Attributdatenpuffer 224 ausgelesen und in einem Feld einer entsprechenden Adressdatenbank 32 gespeichert. Zum Beispiel wird in dem Fall aus 12 "YOSHIDA Jiro" in dem Namensfeld 321 und "3-3-8, Kyobashi, Chuo-ku, Tokyo-to 461-8561" in dem Adressfeld gespeichert.
  • Als nächstes wird bestimmt, ob ein unbehandelter nächster Datensatz in dem Datensatzdatenpuffer 223 existiert (S55). Wenn ein solcher nächster Datensatz existiert (S55: JA), kehrt die Prozedur zu Schritt S43 zurück, in dem das Attribut jeder Komponente bestimmt wird, bis es keine unbehandelten Datensätze mehr gibt, und eine Verarbeitung zum Speichern in einem Datenbankfeld wird wiederholt. Wenn ein nächster Datensatz nicht mehr existiert (S55: NEIN), wird die Adressdatensatzsoftware gestartet und, wie in 13 gezeigt ist, ein importiertes Ergebnis in einem Adressdatenbankbereich 152 eines Adressdatensatzfensters 150 angezeigt (S57). Wie in 13 gezeigt ist, werden ein Namensfeld 154, ein Adressfeld 156, ein Postleitzahlenfeld 158 und ein Memofeld 159 in dem Adressdatenbankbereich 152 angezeigt, wodurch das Ergebnis angezeigt wird, dass aus einer Tabellenkalkulationssoftware gewählter Text in jedes Feld entsprechend einem bestimmten Attribut gespeichert wurde. Weil das Importieren der Adressdaten in obiger Art abgeschlossen ist, endet das Datenverarbeitungsprogramm. Der Benutzer kann den Betrieb der Adressdatensatzsoftware fortführend ausführen.
  • Als nächstes wird die Postleitzahlbestätigungsverarbeitung, die in Schritt S10 aus 10 ausgeführt wird, unter Bezugnahme auf 11 beschrieben. Obwohl in der Verarbeitung aus 10 bestimmt wurde, dass ein erstes Feld von einem Namensattribut und die verbleibenden Felder von einem Adressattribut sind und in jeweils entsprechenden Datenbankfeldern gespeichert werden, wird dann, wenn ein letztes Feld der Felder in dem ausgewählten Bereich numerischer Art ist, bestimmt, dass dieses eine Postleitzahl ist und in dem Postleitzahlenfeld gespeichert wird.
  • Daten in einem letzten Feld eines bearbeiteten Datensatzes, die in dem Datensatzdatenpuffer 223 gespeichert sind, werden in dem Postleitzahlenbestätigungspuffer 226 gespeichert (S61). Als nächstes wird bestimmt, ob ein Bindestrich in den gespeicherten Daten enthalten ist (S63). Jede Postleitzahl ist aus Zahlen aufgebaut, aber es gibt ein Beispiel, in dem ein Bindestrich fallabhängig eingegeben ist. Wenn der Bindestrich in den gespeicherten Daten gefunden wurde, kann nicht bestimmt werden, dass er numerischer Art ist. Daher ist es erforderlich, ihn zuvor zu entfernen, und diese Bestimmung wird durchgeführt.
  • Wenn ein Bindestrich gefunden wurde (S63: JA), wird der Bindestrich gelöscht, und die Daten werden in dem Postleitzahlenbestätigungspuffer 226 gespeichert (S65). Dann schreitet die Prozedur zu Schritt S67 fort. Wenn kein Bindestrich gefunden wurde (S63: NEIN), schreitet die Prozedur zu Schritt S67 fort. In Schritt S67 wird bestimmt, ob in dem Postleitzahlenbestätigungspuffer 226 gespeicherte Daten numerischer Art sind. Wenn sie numerischer Art sind (S67: JA), wird bestimmt, dass Daten dieses Feldes zu dem Postleitzahlenattribut gehören und sie werden in dem Attributdatenpuffer 224 gespeichert (S69). Dann kehrt die Prozedur zurück zur Hauptroutine in 10. Wenn sie nicht numerischer Art sind (S67: NEIN), kehrt die Prozedur zur Hauptroutine in 10 zurück.
  • Wie oben beschrieben, ist die Datenverarbeitungseinheit 1 aus diesem Ausführungsbeispiel dazu in der Lage, in der Art Tabellenkalkulation gespeicherte Daten einfach in eine Adressdatenbank zu speichern. Selbst wenn eine Adresse in getrennten Feldern gespeichert ist, werden sie in dem Adressfeld kombiniert und gespeichert, so dass es keine Zeit und Arbeit benötigt, die Reihenfolge der Felder anzuordnen.
  • Als nächstes wird ein drittes Ausführungsbeispiel beschrieben. Gemäß dem dritten Ausführungsbeispiel wird dann, wenn aus einer Software, die Text handhabt, wie eine Textverarbeitungssoftware oder ein Texteditor, in die Adressdatenbank importiert wird, ein Importformat vorausgehend eingestellt und das Importieren gemäß diesem Format ausgeführt. Weil der Aufbau des dritten Ausführungsbeispiels im Wesentlichen identisch zu dem ersten und zweiten Ausführungsbeispiel ist, werden die 1, 2 und deren Beschreibung verwendet und die Struktur des RAM 22 wird unter Bezugnahme auf die 14 und 15 beschrieben. 14 ist ein schematisches Diagramm, das die Struktur des RAM 22 zeigt. 15 ist ein Bilddiagramm, das ein Datenbeispiel zeigt, das in einem Formatdatenpuffer 231, einem Datensatzdatenpuffer 238 und einem Attributdatenpuffer 239 des RAMs 22 gehalten ist.
  • Wie in 14 gezeigt ist, weist das RAM 22 einen Formatdatenpuffer 231 zum Halten eines Importformats, einen Anfangszeichenpuffer 232 zum Halten eines Anfangszeichens, das den Anfang eines Imports in einem ausgewählten Bereich anzeigt, einen Markierungsnamenspuffer 234 zum Halten des Namens einer Markierung, die ein Importformat ist, einen Interpunktionszeichenkettenpuffer 235 zum Halten einer Interpunktionszeichenkette, die eine Interpunktion der Komponente anzeigt, einen Datensatzzuweisungsbedingungspuffer 236 zum Merken einer Datensatzzuweisungsbedingung, die spezifiziert wie viel eines Bereichs einer ausgewählten Zeichenkette einem Datensatz zugewiesen werden soll, einen Textdatenpuffer 237 zum Halten der importierten Textdaten, ein Datensatzdatenpuffer 238 zum Halten von Daten jedes Datensatzes, die durch Unterteilen von importierten Textdaten erhalten wurden, einen Attributdatenpuffer 239 zum Halten von Komponenten, die durch Unterteilen eines Datensatzes in Übereinstimmung mit seinen Attributen erhalten wurden, und einen Textkombinierungspuffer 240, der ein Bereich ist, der dazu verwendet wird, Komponenten desselben Attributs zu kombinieren, auf. Im RAM 22 werden verschiedene andere Arten von Arbeitsbereichen vorgehalten.
  • Als nächstes wird ein Beispiel des Importformats und importierte Daten unter Bezugnahme auf 15 beschrieben. Gemäß diesem Ausführungsbeispiel wird das Importformat mit einer Markierung 301, die zwischen den Symbolen "<", ">" liegt, einem Interpunktionszeichen 302, das zwischen den Markierungen liegt, und einem Anfangszeichen 303, das den Kopf eines Importbereichs anzeigt, aufgesetzt. Die Markierung 301 ist beispielsweise in dem Format <NAME>, um ein Namensattribut anzuzeigen, <CODE>, um ein Postleitzahlenattribut anzuzeigen, <ADDRESS>, um ein Adressattribut anzuzeigen, spezifiziert. Ferner ist das Interpunktionszeichen 302 zwischen einer Markierung und einer weiteren angeordnet und spezifiziert, wenn ein Importtext durch eine spezifische Zeichenkette, wie ein Leerzeichen und einen Zeilenvorschubscode, getrennt ist. Die Interpunktionszeichenkette 302 kann ein einzelnes Zeichen oder eine Vielzahl von Zeichen sein. Gemäß diesem Ausführungsbeispiel wird bestimmt, dass Textdaten, die zwischen Interpunktionszeichenketten 302 existieren, von dem Attribut des Markierungsnamens sind, das dort dazwischen existiert. Ferner schließt das Anfangszeichen 303 eine Zeichenkette aus, die vor dieser Kette existiert, die von einem Importobjekt kommt, selbst wenn sie innerhalb des ausgewählten Bereichs liegt. Durch vorausgehendes Spezifizieren des Anfangszeichens 303 kann das Importieren gerade dann begonnen werden, wenn das Anfangszeichen auftritt, wenn Daten, die importiert werden sollen, Teil eines ausgewählten Bereichs sind.
  • Beispielsweise sind in dem Beispiel 1 in 15 das Importformat in einer einzelnen Zeile in dem Format <NAME> <NAME> <CODE> <ADDRESS> beschrieben und in dem Formatdatenpuffer 231 gespeichert. Dies zeigt an, dass mit einem Leerschritt getrennte Daten in der Reihenfolge Namensattribut, Postleitzah lenattribut und Adressattribut angeordnet sind, und ein Datensatz aus einer einzelnen Zeile besteht. Daher wird ein Datensatz in dem ausgewählten Bereich als "YAMADA Taro 467-8561 15-1 Naeshiro-cho, Mizuho-ku, Nagoya-shi" ausgedrückt, wie in Beispiel 1 des Datensatzdatenpuffers 238 angezeigt wird. Dann wird bestimmt, wenn die später beschriebene Importverarbeitung ausgeführt wird, dass das Namensattribut (NAME) "YAMADA Taro" ist, der Postleitzahlencode (CODE) "467-8561" ist und das Adressattribut (ADDRESS) "15-1, Naeshiro-Cho, Mizuho-ku, Nagoyashi" ist, und wird in dem Attributdatenpuffer 239 gespeichert. Obwohl ein Leerschritt, der die Interpunktionszeichenkette 302 ist, in den Adressdaten existiert, wird dieser Leerschritt nicht als die Interpunktionszeichenkette 302, sondern als Textdaten behandelt, weil es keine Spezifikation über die Interpunktionszeichenkette und Komponenten nach der <ADDRESS>-Markierung gibt.
  • In Beispiel 2 wird das Importformat in drei Zeilen beschrieben, "<CODE> (Zeilenvorschubscode) <ADDRESS> (Zeilenvorschubscode) <NAME> <NAME>", und in dem Formatdatenpuffer 231 gespeichert. Dies zeigt an, dass mit den Zeilenvorschubscodes getrennte Zeilen in der Reihenfolge Postleitzahlenattribut, Adressattribut und Namensattribut angeordnet sind, und ein einzelner Datensatz aus drei Zeilen besteht. Daher wird der Datensatz des ausgewählten Bereichs als "467-8561 (Zeilenvorschubscode) 15-1, Naeshiro-cho, Mizuho-ku, Nagoyashi (Zeilenvorschubscode) YAMADA Taro" ausgedrückt, wie im Beispiel 2 des Datensatzdatenpuffers 238 angezeigt ist. Dann wird bestimmt, wenn die später beschriebene Importverarbeitung ausgeführt wird, dass das Namensattribut (NAME) "YAMADA Taro" ist, die Postleitzahl (CODE) "467-8561" ist, und das Adress attribut (ADDRESS) "15-1, Naeshiro-cho, Mizuho-ku, Nagoya-shi" ist, und wird in dem Attributdatenpuffer 239 gespeichert.
  • In Beispiel 3 wird ein japanisches Postleitzahlensymbol "T" vor der Markierung <CODE> in dem Importformat beschrieben und in dem Formatdatenpuffer 231 gespeichert. Dieses Symbol "T" ist das Anfangszeichen 303. Dann werden diese Daten in zwei Zeilen beschrieben, "<CODE> <ADDRESS> (Zeilenvorschubscode) <NAME> <NAME>". In der ersten Zeile sind durch einen einzelnen Leerschritt getrennte Daten in der Reihenfolge Postleitzahlenattribut und Adressattribut angeordnet, und Daten des Namensattributs sind in einer zweiten Zeile angeordnet, wodurch angezeigt wird, dass ein Datensatz aus zwei Zeilen besteht.
  • Daher wird der Datensatz des ausgewählten Bereichs als "467-8561 15-1, Naeshiro-cho, Mizuho-ku, Nagoya-shi (Zeilenvorschubscode) YAMADA Taro" ausgedrückt, wie in dem Beispiel 3 aus dem Datensatzdatenpuffer 238 angezeigt ist. Dann wird bestimmt, wenn die später beschriebene Importverarbeitung ausgeführt wird, dass das Namensattribut (NAME) "YAMADA Taro" ist, das Postleitzahlenattribut (CODE) "467-8561" ist und das Adressattribut (ADDRESS) "15-1, Naeshiro-cho, Mizuho-ku, Nagoyashi" ist, und wird in dem Attributdatenpuffer 239 gespeichert.
  • Im Beispiel 4 ist das japanische Postleitzahlensymbol "T", das das Anfangszeichen 303 ist, vor der Markierung <CODE> in dem Importformat beschrieben und in dem Formatdatenpuffer 231 gespeichert. Dann sind die Daten in vier Zeilen beschrieben, "<CODE> (Zeilenvorschubscode) <ADDRESS> (Zeilenvorschubscode) <ADDRESS> (Zeilenvorschubscode) <NAME> <NAME>". Dies zeigt an, dass die Daten des Postleitzahlenattributs gesondert in der ersten Zeile angeordnet sind, und die Daten des Adressattributs in einer zweiten Zeilen und einer dritten Zeile angeord net sind, und die Daten des Namensattributs in einer vierten Zeile angeordnet sind, wodurch angezeigt wird, dass ein einzelner Datensatz aus vier Zeilen besteht. So wird der Datensatz des ausgewählten Bereichs als "467-8561 (Zeilenvorschubscode) 15-1, Naeshiro-cho (Zeilenvorschubscode), Mizuho-ku, Nagoya-shi (Zeilenvorschubscode), YAMADA Taro" ausgedrückt, wie in Beispiel 4 des Datensatzdatenpuffers 238 angezeigt ist. Dann, wenn die später beschriebene Importverarbeitung ausgeführt wird, wird bestimmt, dass das Namensattribut (NAME) "YAMADA Taro" ist und das Postleitzahlenattribut (CODE) "467-8561" ist, das Adressattribut (ADDRESS) "15-1 Naeshiro-cho, Mizuho-ku, Nagoya-shi" ist, und werden in dem Attributdatenpuffer 239 gespeichert.
  • In dem Importformat aus Beispiel 5 ist das japanische Postleitzahlensymbol "T", das das Anfangszeichen 303 ist, vor der Markierung <CODE> beschrieben, und "<CODE> <> <ADDRESS> <ADDRESS> <NAME> <NAME>" sind mit einer einzelnen Zeile beschrieben. Eine leere Markierung ist nahe der Markierung <CODE> beschrieben. Diese leere Markierung zeigt eine Anweisung an, dass obwohl hier Daten existieren, diese Daten nicht in den Attributdatenpuffer 239 importiert werden müssen. Daher sind mit einem Leerschritt getrennte Daten in der Reihenfolge Postleitzahlenattribut, unnötige Daten, Adressattribut, Adressattribut und Namensattribut angeordnet, wodurch angezeigt wird, dass ein Datensatz aus einer Zeile besteht. Folglich ist ein Datensatz in dem ausgewählten Bereich angeordnet als "467-8561 052-123-4567 15-1 Naeshiro-cho, Mizuho-ku, Nagoya-shi YAMADA Taro" wie im Beispiel 5 des Datensatzdatenpuffers 238 in der Reihenfolge Postleitzahl, Telefonnummerdaten, Adressdaten, Namensdaten angeordnet. Wenn die später beschriebene Importverarbeitung ausgeführt wird, wird bestimmt, dass das Namensattribut (NAME) "YAMADA Taro" attribut (NAME) "YAMADA Taro" ist, das Postleitzahlenattribut (CODE) "467-8561" ist, das Adressattribut (ADDRESS) "15-1 Naeshiro-cho, Mizuho-ku, Nagoya-shi" ist, und dann in dem Attributdatenpuffer 239 gespeichert wird. Dann werden die Telefonnummerndaten, die als unnötig bestimmt wurden, nicht in den Attributdatenpuffer 239 importiert.
  • Als nächstes wird der Betrieb in der Datenverarbeitungseinheit 1 gemäß dem dritten Ausführungsbeispiel mit solch einer Struktur unter Bezugnahme auf die Flussdiagramme der 1618 und dem Anzeigebildschirm aus 19 beschrieben. Im Folgenden wird ein Beispiel eines Datenimports einer Textverarbeitungssoftware beschrieben. Wenn der Benutzer eine Textverarbeitungssoftware startet, wird ein Textverarbeitungssoftwarefenster 110 auf den Bildschirm 224, wie in 7 gezeigt, gleich dem ersten Ausführungsbeispiel dargestellt. Der Benutzer gibt hier eine Zeichenkette neu ein oder ruft eine existierende Datei auf, so dass eine Zeichenkette dargestellt wird. Dann wird unter Verwendung der Maus 28 oder der Tastatur 26 eine Zeichenkette eines Abschnitts, den er importieren will, ausgewählt, und dieser ausgewählte Bereich 112 wird invertiert. Wenn die Einfügeschaltfläche, die in dem Textverarbeitungsprogrammfenster 110 vorgesehen ist, in diesem Zustand angeklickt wird, wird das Datenverarbeitungsprogramm gestartet, so dass die Verarbeitung dieses Ausführungsbeispiels, wie in 16 gezeigt, gestartet wird.
  • Wenn das Programm gestartet wird, wird bestimmt, ob ein Importformat eingestellt ist (S101). Wenn die rechte Schaltfläche der Maus während der Aktivierung des Programms angeklickt wird, wird ein Importformateinstellungsbildschirm 116, wie in 19 gezeigt, dargestellt, um das Einstellen des Importfor mats zu ermöglichen. Das Importformat dient zum Einstellen, welche Attributkomponenten in welcher Reihenfolge oder in welchem Stil in einem Datensatz, der zum Importieren vorgesehen ist, angeordnet sind, und aus wie vielen Zeilen ein Datensatz aufgebaut ist. Zum Beispiel wird eine Markierung umgeben von "<" und ">" zur Einstellung verwendet. Gemäß diesem ersten Ausführungsbeispiel zeigt der Name der Markierung ein Attribut an, und eine Zeichenkette, die zwischen ">" und "<" eingegeben ist, eine Interpunktionszeichenkette an, die zur Interpunktion der Komponenten eingegeben ist, und die Gesamtanzahl der eingegebenen Importformate zeigen die Anzahl der Komponenten in einem Datensatz an.
  • Wenn ein Importformat eingestellt ist (S101: JA), wird der Anzeigebildschirm, wie er in 19 gezeigt ist, auf dem Display 24 angezeigt, und ein eingegebenes Format wird anfangs in dem Formatdatenpuffer 231 gespeichert (S103). Wenn kein Importformat eingestellt ist (S101: NEIN) oder die Einstellung des Importformats endet, wird ein Importformat, das in dem Formatdatenpuffer 231 gespeichert ist, bezogen, um die Verarbeitung des ausgewählten Textes auszuführen (S105). Wenn der Benutzer kein Importformat einstellt, wird ein Vorgabeimportformat, das anfänglich in dem Formatdatenpuffer 231 gespeichert ist, verwendet. Als nächstes wird ein Markierungsname, ein Anfangszeichen, eine Interpunktionszeichenkette und eine Zeilenanzahl in einem Datensatz aus dem Importformat, das aus dem Formatdatenpuffer 231 bezogen wurde, extrahiert (S107). Der hierbei extrahierte Markierungsname wird in dem Markierungsnamenspuffer 234, das Anfangszeichen in dem Anfangszeichenpuffer 232, die Interpunktionszeichenkette in dem Interpunktionszeichenkettenpuffer 235 und die Zeilenanzahl in einem Datensatz in dem Datensatzzuweisungsbedingungspuffer 236 gespeichert.
  • Als nächstes wird ein Text eines ausgewählten Bereichs bezogen und in dem Textdatenpuffer 237 gespeichert (S109). Dann wird durch Anwenden der Datensatzzuweisungsbedingung, die im Schritt S107 extrahiert und gespeichert wurde, die Datensatzzuweisungsverarbeitung zum Unterteilen des ausgewählten Textes in jeden Datensatz ausgeführt (S111). Das Detail der Datensatzzuweisungsverarbeitung wird unter Bezugnahme auf 17 beschrieben.
  • Als nächstes wird die Attributbestimmungsverarbeitung zum Bestimmen der Attribute jeder Komponente in Datensatzdaten, die in dem Datensatzdatenpuffer 238 gespeichert sind, ausgeführt (S115). Das Detail der Attributbestimmungsverarbeitung wird unter Bezugnahme auf 18 beschrieben.
  • Dann wird bestimmt, ob Komponenten mit einem identischen Attribut fortlaufend sind (S117). Wenn Komponenten mit identischem Attribut fortlaufend sind (S117: JA), dann werden Textdaten der Komponenten mit Einfügen von Leerschritten unter Verwendung des Textdatenkombinierungspuffers 225 kombiniert (S119). Dann werden die kombinierten Textdaten über den Attributdatenpuffer 238 als eine einzelne Komponente geschrieben, und die Prozedur schreitet zu Schritt S121 fort.
  • Wenn es nur eine Komponente mit identischem Attribut gibt (S117: NEIN), schreitet die Prozedur zu Schritt S121 fort. Im Schritt S121 wird ein Attribut und eine Komponente aus dem Attributdatenpuffer 239 ausgelesen und in einem entsprechenden Feld in der Adressdatenbank 32 gespeichert.
  • Als nächstes wird bestimmt, ob es einen unbehandelten nächsten Datensatz in dem Datensatzdatenpuffer 238 gibt (S123). Wenn es einen nächsten Datensatz gibt (S123: JA), kehrt die Prozedur zu Schritt S115 zurück, in dem eine Verarbeitung der Bestimmung des Attributs jeder Komponente und deren Speichern in einem Datenbankfeld wiederholt wird, bis keine unbehandelten Datensätze existieren. Wenn kein nächster Datensatz existiert (S123: NEIN), wird die Adressdatensoftware gestartet und ein importiertes Ergebnis wird auf dem Bildschirm 24 angezeigt (S125). Dann endet das Datenverarbeitungsprogramm.
  • Als nächstes wird die Datensatzzuweisungsverarbeitung, die in dem Schritt S111 aus 16 ausgeführt wird, unter Bezugnahme auf 17 beschrieben. Zuerst wird bestimmt, ob ein Anfangszeichen in dem Anfangszeichenpuffer 232 gespeichert ist (S131). Wenn ein Anfangszeichen gespeichert ist (S131: JA), wird aufeinanderfolgend von einem Kopfzeichen des Textes in dem ausgewählten Bereich aus geprüft, ob ein Zeichen ein Anfangszeichen ist. Wenn ein Zeichen, das bearbeitet wird, nicht das Anfangszeichen ist (S133: NEIN), schreitet die Prozedur zu einem nächsten Zeichen fort (S135) und kehrt zu Schritt S133 zurück, in dem bestimmt wird, ob dieses Zeichen ein Anfangszeichen ist.
  • Wenn das behandelte Zeichen unter ein Anfangszeichen fällt (S133: JA), wird der ausgewählte Text nach dem Anfangszeichen durch Anwenden der Datensatzzuweisungsbedingung, die in dem Datensatzzuweisungsbedingungspuffer 236 gespeichert ist, in Datensatzeinheiten unterteilt, weil der Text nach diesem Zeichen ein Importobjekt ist (S137). Dann werden die zugewiesenen Datensatzdaten in dem Datensatzdatenpuffer 238 gespeichert (S139) und die Prozedur kehrt zur Hauptroutine aus 16 zu rück. Andererseits schreitet, wenn ein Anfangszeichen nicht in dem Anfangszeichenpuffer 232 gespeichert ist (S131: NEIN), die Prozedur zu dem Schritt S137 fort, in dem die Zuweisungsverarbeitung zu einem Datensatz ausgeführt wird, und dann kehrt die Prozedur zur Hauptroutine aus 16 zurück.
  • Durch Spezifizieren des Anfangszeichens in dieser Art können nur notwendige Daten importiert werden, ohne irrelevante Daten zu importieren, selbst wenn der Benutzer zufällig Text vor einem Text, den er importieren will, auswählt.
  • Als nächstes wird die Attributbestimmungsverarbeitung, die im Schritt S115 aus 16 ausgeführt wird, unter Bezugnahme auf 18 beschrieben. Zuerst wird ein erster Markierungsname von dem Markierungsnamenpuffer 234 bezogen (S151). Als nächstes wird bestimmt, ob ein Markierungsname bezogen wurde (S153). Wenn ein Markierungsname nicht bezogen werden kann (S153: NEIN), kehrt die Prozedur zur Hauptroutine aus 16 zurück, weil die Verarbeitung aller Markierungsnamen abgeschlossen ist.
  • Wenn ein Markierungsname bezogen wurde (S153: JA), wird eine Verarbeitung zur Bestimmung des Attributs jedes Zeichens auf einem bearbeiteten Datensatz ausgeführt. Zuerst wird ein erstes Zeichen gelesen (S155). Dann wird bestimmt, ob das gelesene Zeichen eine in dem Zeichenkettenpuffer 235 gespeicherte Interpunktionszeichenkette ist, wie ein Leerzeichen oder ein Zeilenvorschubscode (S157). Wenn die Zeichenkette keine Interpunktionszeichenkette ist (S157: NEIN), wird das Attribut des im Schritt S151 bezogenen Markierungsnamens bestimmt, weil dieses Zeichen ein Importobjektdatum ist und wird in dem Attributdatenpuffer 239 gespeichert (S159). Dann kehrt die Proze dur zu Schritt S155 zurück, in dem ein nächstes Zeichen gelesen wird, und Verarbeitung dieses Zeichens wird ausgeführt.
  • Wenn die gelesene Zeichenkette eine Interpunktionszeichenkette ist (S157: JA), kehrt die Prozedur zu Schritt S151 zurück, in der ein nächster Markierungsname bezogen wird, weil Attributdaten bis hierher enden. Dann wird eine Verarbeitung des zeichenweisen Auslesens (S155), ein Bestimmen, ob das ausgelesene Zeichen ein Interpunktionszeichen ist (S157) und ein Bestimmen des Attributs (S159) wiederholt, bis ein nächster Markierungsname nicht bezogen werden kann (S153: NEIN).
  • Weil wie oben beschrieben gemäß der Datenverarbeitungseinheit 1 dieses Ausführungsbeispiels der Datenimport ausgeführt wird, nachdem ein Importformat vorausgehend eingestellt wurde, kann der Benutzer das Attribut einer Komponente durch Zuweisen der Daten an Datensätze unter Verwendung der Markierungen spezifizieren, wenn Text gemäß einem spezifischen Format eingegeben wird. Folglich können Daten geeignet in die Datenbank importier werden.
  • Als nächstes wird ein viertes Ausführungsbeispiel beschrieben. Gemäß dem vierten Ausführungsbeispiel wird, wenn Daten aus einer Tabellenkalkulationsprogrammsoftware und dergleichen in die Adressdatenbank importiert werden, ein Importformat vorausgehend eingestellt, und der Import wird gemäß diesem Format ausgeführt. Weil die Konfiguration des vierten Ausführungsbeispiels identisch zu dem dritten Ausführungsbeispiel ist, werden die 1, 2, 14 und 15 und die Beschreibung dieser Figuren verwendet.
  • Als nächstes wird der Betrieb der Datenverarbeitungseinheit 1 des vierten Ausführungsbeispiels unter Bezugnahme auf das Flussdiagramm aus 20 und ein Beispiel des Importformateinstellungsbildschirms aus 21 beschrieben. Im Folgenden wird ein Beispiel des Datenimports aus der Tabellenkalkulationsprogrammsoftware beschrieben. Wenn der Benutzer die Tabellenkalkulationsprogrammsoftware startet, wird ein Tabellenkalkulationsprogrammfenster 140, wie es in 12 gezeigt ist, gleich dem zweiten Ausführungsbeispiel gestartet. Das Tabellenkalkulationsprogrammfenster besteht aus individuellen Zellen, die durch die Spalte (Feld) und die Zeile spezifiziert sind. Der Benutzer gibt Zeichenketten in eine Zelle neu ein oder ruft eine existierende Datei auf, so dass eine Zeichenkette dargestellt wird. Hier wählt der Benutzer unter Verwendung der Maus 28 oder der Tastatur 26 die Zelle eines Abschnitts, den er importieren will, und invertiert den ausgewählten Bereich 142. Wenn der Benutzer die Einfügen-Schaltfläche, die innerhalb des Tabellenkalkulationsprogrammfensters 140 vorgesehen ist, in diesem Zustand anklickt, wird das Datenverarbeitungsprogramm gestartet, so dass die Verarbeitung des Ausführungsbeispiels gestartet wird.
  • Wenn das Programm gestartet wird, wird zuerst bestimmt, ob beabsichtigt ist, ein Importformat einzustellen (S171). Wie im dritten Ausführungsbeispiel kann das Einstellen des Importformats durch Bedienen der Maus durch Klicken der rechten Schaltfläche derselben oder dergleichen während der Aktivierung des Programms ausgeführt werden, während ein Importformateinstellungsbildschirm 170, wie in 21 gezeigt, dargestellt wird.
  • Wenn beabsichtigt ist, ein Importformat einzustellen (S171: JA), wird ein Anzeigebildschirm wie in 21 auf dem Bildschirm 24 dargestellt, und ein eingegebenes Format wird in einem Formatdatenpuffer 231 gespeichert (S175). Weil die Daten in diesem Fall der Tabellenkalkulationsprogrammsoftware aus Feldern besteht, stellt das Importformat ein, in welches Feld diese Komponente zu importieren ist. Weil in dem Beispiel aus 21 Daten in der Reihenfolge "<NAME> <ADDRESS> <ADDRESS> <ADDRESS> <CODE>" angeordnet sind, werden durch die später beschriebene Verarbeitung Daten in die Felder der Tabellenkalkulationsprogrammsoftware importiert.
  • Wenn nicht beabsichtigt ist, ein Importformat einzustellen (S171: NEIN) oder nachdem das Einstellen des Importformats endet, wird ein Importformat, das in dem Formatdatenpuffer 231 gespeichert ist, bezogen, um die Verarbeitung des ausgewählten Texts auszuführen (S177). Dann wird die Reihenfolge der Markierungen aus dem Importformat extrahiert (S179). Wenn der Benutzer kein Importformat einstellt, ist ein Vorgabeimportformat in dem Formatdatenpuffer 231 gespeichert. Alternativ kann ein zuvor eingestelltes Importformat gespeichert werden, wie es ist. Da im Falle einer Tabellenkalkulationsprogrammsoftware Daten in jedes Feld eingegeben werden, bestimmt ein Abgleichen dieses Feldes mit der Anordnungsreihenfolge der gemäß dem Importformat eingestellten Markierungen ein Attribut, so dass Daten in der Datenbank gespeichert werden können.
  • Als nächstes werden Textdaten in dem ausgewählten Bereich entsprechend jedem Feld bezogen (S181) und durch Zuweisen jeweiliger Datensätze zu Datensätzen in der Datenbank wird jeder Datensatz in dem Datensatzdatenpuffer 238 gespeichert (S182). Dann wird die Verarbeitung fortlaufend von einem ersten Datensatz an ausgeführt. Durch Abgleichen der Anordnungsreihenfolge der Markierungen, die im Schritt S179 extrahiert wurden, mit der Anordnungsreihenfolge der Felder eines Verarbeitungsobjektdatensatzes wird das Attribut aller Daten in dem Datensatz bestimmt (S183). Im Fall der 12 ist beispielsweise ein Name in einer Spalte A jeder Zeile, eine Adresse in Spalten B–D und eine Postleitzahl in einer Spalte E eingegeben. Weil das Importformat, das von dem Formatdatenpuffer 231 bezogen wurde, "<NAME> <ADDRESS> <ADDRESS> <ADDRESS> <CODE>" ist, wie in 21 gezeigt ist, wird bestimmt, dass Spalte A vom Namensattribut, Spalten B–D vom Adressattribut und Spalte E vom Postleitzahlattribut ist. Nachdem das Attribut bestimmt wurden, wird es in dem Attributdatenpuffer 239 gespeichert.
  • Als nächstes wird bestimmt, ob ein Feld (Komponente) mit einem identischen Attribut zusammenhängend ist (S185). Wenn die Komponenten mit einem identischen Attribut zusammenhängend sind (S185: JA), werden die Textdaten der Komponenten unter Verwendung des Textkombinierungspuffers 240 kombiniert (S187). Dann werden die kombinierten Textdaten über den Attributdatenpuffer 239 als einzelne Komponent geschrieben und die Prozedur schreitet zu Schritt S189 fort.
  • Wenn es nur eine Komponente mit einem identischen Attribut gibt (S185: NEIN), schreitet die Prozedur zum Schritt S189 fort. Im Schritt S189 werden das Attribut und die Komponente aus dem Attributdatenpuffer 239 ausgelesen und in einem Feld einer entsprechenden Adressdatenbank 32 gespeichert.
  • Als nächstes wird bestimmt, ob es einen unbehandelten nächsten Datensatz in dem Datensatzdatenpuffer 238 gibt (S191): Wenn es einen nächsten Datensatz gibt (S191: JA), kehrt die Prozedur zu Schritt S183 zurück, in dem eine Verarbeitung der Bestimmung des Attributs jeder Komponente und Speichern in einem Feld der Datenbank wiederholt wird, bis keine unbehandelten Datensätze mehr vorhanden sind. Wenn es keinen nächsten Datensatz gibt (S191: NEIN), wird ein importiertes Ergebnis auf dem Bildschirm 24 angezeigt (S193). Dann endet das Datenverarbeitungsprogramm.
  • Wie oben beschrieben kann der Benutzer das Attribut einer Komponente geeignet spezifiziert, so dass der Import der Daten sicher erreicht werden kann, weil die Datenverarbeitungseinheit 1 aus dem vierten Ausführungsbeispiel vorausgehend ein Importformat einstellt und dann das Importieren der Daten im Falle der Tabellenkalkulationsprogrammsoftware ausführt.
  • Wenn wie oben beschrieben der Benutzer in der Datenverarbeitungseinheit einen Abschnitt einer dargestellten Zeichenkette unter Verwendung von Auswahlmitteln auswählt, die er/sie importieren will, wird eine ausgewählte Zeichenkette durch Datensatzzuweisungsmittel einem Datensatz zugewiesen. Dann wird eine einem Datensatz zugewiesene Zeichenkette durch ein Komponentenunterteilungsmittel analysiert und in Komponenten unterteilt. Ferner wird das Attribut (beispielsweise Name, Adresse, Postleitzahl und dergleichen in der Adressdatenbank) jeder durch die Unterteilung erhaltenen Komponente bestimmt und die Komponente in dem Datenbankfeld gespeichert, das dem Attribut entspricht. Daher kann eine Datenbank einfach unter Verwendung bereits existierender eingegebenen Textdaten aufgebaut werden, ohne irgendwelche neuen Zeichenketten in die Datenbank einzugeben.
  • Wenn eine aus mehreren Zeilen bestehende Zeichenkette ausgewählt wird, wird eine einzelne Zeile einer einzelnen Komponente übergeben, und es wird bestimmt, dass eine Zeichenkette einer ersten Zeile von einem Namensattribut ist, während bestimmt wird, dass Zeichenketten einer zweiten und folgenden Zeilen von einem Adressattribut sind. Weil das Attribut der Komponenten bestimmt wird, ohne dass der Benutzer den Inhalt der Komponenten bestätigt, können die Daten in die Adressdatenbank einfach importiert werden. Zum Beispiel ist dies besonders für einen Fall effektiv, in dem eine eingegebene Zeichenkette in der Reihenfolge einer Adresse in englischer eingegeben ist.
  • Wenn durch einen Feldcode unterteilte Daten wie Tabellenkalkulationsdaten ausgewählt werden, wird jedes Feld als einzelne Komponente betrachtet, und es wird bestimmt, dass ein erstes Feld vom Namensattribut ist, während bestimmt wird, dass alle verbleibenden Felder von Adressattribut sind. Weil das Attribut der Komponenten bestimmt wird, ohne dass der Benutzer den Inhalt der Komponente bestätigt, können die Daten in die Adressdatenbank leicht importiert werden. Dies ist insbesondere für Tabellenkalkulationsdaten effektiv, weil im Falle einer Tabellenkalkulation der Name oft in ein erstes Feld eingegeben wird.
  • Wenn ein letztes Feld von numerischer Art ist, wenn Daten aus den Tabellenkalkulationsdaten importiert werden, wird es als Postleitzahl betrachtet und sein Attribut wird bestimmt. Folglich kann die Postleitzahl getrennt von der Adresse importiert werden, wenn sie in der Datenbank gespeichert werden.
  • Wenn Komponenten, die durch Unterteilung einer Zeichenkette erhalten werden, zusammenhängend identische Attribute haben (beispielsweise Name, Adresse, Adresse, Adresse, Postleitzahl) werden die identischen Komponenten zu einer einzelnen Komponente integriert, wenn sie in ein Feld gespeichert werden. So kann dieses Ausführungsbeispiel einem Fall entsprechen, in dem die Anzahl der Felder unterschiedlich zwischen einem Importobjekt und einem Importziel ist.
  • Wenn auch mehrere Bereiche gewählt werden, ist es möglich, diese einem einzelnen Datensatz zuzuweisen und die Importverarbeitung insgesamt auf einmal durchzuführen.
  • Durch vorausgehendes Einstellen einer spezifischen Zeichenkette als eine Datensatzinterpunktionszeichenkette ist es möglich, einen Bereich, der mit dieser Zeichenkette getrennt ist, einem einzelnen Datensatz zuzuweisen und die Importverarbeitung insgesamt auf einmal durchzuführen.
  • Wenn die Anzahl der einem einzelnen Datensatz zuzuweisenden Zeilen vorausgehend spezifiziert wurde, können Textdaten, in welchen sich eine Zeichenkette eines spezifischen Formats alle paar Zeilen wiederholt, effektiv importiert werden.
  • Wenn eine identische Zeichenkette an einem Zeilenkopf eingegeben ist, wie beispielsweise ein Zitatzeichen, wird diese Zeichenkette entfernt, und die verbleibenden Daten werden einem Datensatz zugewiesen. Folglich ist es möglich, nur notwendige Abschnitte automatisch zu importieren und in der Datenbank zu speichern.
  • Weil der Datenimport unter Verwendung eines vorausgehend eingestellten Importformats ausgeführt wird, kann der Benutzer die Zuweisung eines Datensatzes und der Attribute einer Komponente gemäß dem Importformat spezifizieren und sie in die Datenbank geeignet importieren, wenn der Text in einem spezifischen Format eingegeben wird.
  • Ferner können Daten in die Datenbank geeignet importiert werden, weil die Attributart und die Zuweisung der Komponente und die Anzahl der Zeile in einem Datensatz gemäß dem Importformat eingestellt sind. Ferner kann ein Importformat wiederverwendet werden.
  • Die Verwendung der Interpunktionszeichenkette erlaubt es, ein Importformat einfach einzustellen. Weil das Importformat durch Dazwischenlegen einer Zeichenkette, die eine Attributinformation anzeigt, zwischen spezifische Symbole eingestellt wird, kann der Benutzer ein Attribut deutlich erkennen und das Attribut einfach einstellen. Ferner kann eine Komponente, die nicht in das Empfangsprogramm importiert werden muss, mit einem einfachen Format spezifiziert werden und Komponenten mit einem identischen Attribut können ohne das Bewusstsein des Benutzers in ein Einziges integriert werden.
  • Wenn eine Zeichenkette mit einem Auswahlmittel ausgewählt wird, ist es möglich es auszuwählen, ohne sich über irgendwelche Zeichenketten bewusst zu sein, die nicht in das Empfangsprogramm importiert werden müssen.
  • Ferner wird gemäß dem Datenverarbeitungsprogramm der Offenbarung, dass auf einem computerlesbaren Medium gespeichert ist, die ausgewählte Zeichenkette durch die Datensatzzuweisungsmittel einem Datensatz zugewiesen, wenn der Benutzer einen Abschnitt einer dargestellten Zeichenkette mit einem Auswahlmittel auswählt, den er/sie importieren will. Dann wird eine Zeichenkette, die einem einzelnen Zeichensatz zugewiesen wurde, durch ein Komponentenunterteilungsmittel analysiert und in Komponenten unterteilt. Ferner wird das Attribut (beispielsweise Name, Adresse, Postleitzahl und dergleichen in der Ad ressdatenbank) jeder durch die Unterteilung unterteilten Komponente bestimmt, und die Komponente wird in einem Datenbankfeld gespeichert, das dem Attribut entspricht. Folglich kann die Datenbank unter Verwendung bereits existierender eingegebener Daten einfach aufgebaut werden, ohne zusätzliche Zeichenketten für die Datenbank einzugeben.

Claims (34)

  1. Eine Datenverarbeitungseinheit (1), die eine eingegebene Zeichenkette analysiert und Komponenten der eingegebenen Zeichenkette in eine Datenbank importiert, aufweisend: Speichermittel (30) zum Speichern der Datenbank (32), die mehrere Felder (321, 322, 323) und Datensätze beinhaltet; Anzeigemittel (24) zum Anzeigen der Zeichenkette; Auswahlmittel (26, 28) zum Auswählen eines vorbestimmten Bereichs (112) der Zeichenkette, die durch das Anzeigemittel (30) angezeigt wird; Datensatzzuweisungsmittel (100, 221, 223, 236, 238, 20) zum Zuweisen einer durch das Auswahlmittel ausgewählten Zeichenkette an die Datensätze; dadurch gekennzeichnet, daß die Komponenten in ein Datenbankfeld (321, 322, 323), das einer Art der eingegebenen Zeichenkette entspricht, importiert werden und die Datenverarbeitungseinheit (1) aufweist: Komponentenunterteilungsmittel (224, 239, 20) zum Unterteilen einer Zeichenkette in einem durch das Datensatzzuweisungsmittel zugewiesenen Datensatz in Komponenten; Attributbestimmungsmittel (223, 238, 20) zum Bestimmen des Attributs der Komponenten, die durch Unterteilen mit dem Komponentenunterteilungsmittel erhalten wurden; und Speichermittel (224, 239, 20) zum Speichern der Komponente in das Datenbankfeld (321, 322, 323), das dem durch das Attributbestimmungsmittel (223, 238, 20) bestimmten Attribut entspricht.
  2. Die Datenverarbeitungseinheit (1) gemäß Anspruch 1, wobei das Komponentenunterteilungsmittel (224, 239, 20) eine durch einen Zeilenumbruchcode punktierte einzelne Zeile aus einer dem Datensatz zugewiesenen Zeichenkette in eine Komponente un terteilt, und das Attributbestimmungsmittel (223, 238, 20) bestimmt, daß die Komponente, die aus einer Zeichenkette einer ersten Zeile besteht, von einem Attribut Name ist und die Komponente, die aus einer zweiten und folgenden Zeichenkette besteht, von einem Attribut Adresse ist.
  3. Die Datenverarbeitungseinheit gemäß Anspruch 1, wobei das Komponentenunterteilungsmittel (224, 239, 20) die Zeichenkette mittels eines Feldcodes in der Zeichenkette, die dem Datensatz zugewiesen ist, in Komponenten unterteilt, und das Attributbestimmungsmittel (223, 238, 20) bestimmt, daß eine erste Komponente von einem Attribut Name ist und die verbleibenden Komponenten von einem Attribut Adresse sind.
  4. Die Datenverarbeitungseinheit (1) gemäß Anspruch 1 oder 3, wobei das Komponentenunterteilungsmittel (224, 239, 20) die Zeichenkette mittels eines Feldcodes in der Zeichenkette, die dem Datensatz zugewiesen ist, und des Attributbestimmungsmittels (223, 238, 20) zum Bestimmen, daß die aus einer Zeichenkette bestehende Komponente in einem letzten Feld von einem Attribut Postleitzahl ist, wenn die Zeichenkette in dem letzten Feld numerisch ist, in Komponenten unterteilt.
  5. Die Datenverarbeitungseinheit (1) gemäß einem der Ansprüche 1 bis 4, ferner aufweisend: ein Komponentenvereinigungsmittel (225, 240, 20) zum Vereinigen mehrerer Komponenten zu einer einzige Komponente, wenn das durch das Attributbestimmungsmittel (223, 238, 20) bestimmte Attribut bei aufeinanderfolgenden mehreren Komponenten identisch ist.
  6. Die Datenverarbeitungseinheit (1) gemäß einem der Ansprüche 1 bis 5, wobei das Auswahlmittel (26, 28) mehrere Bereiche (112) auswählt, und das Datensatzzuweisungsmittel (100, 221, 223, 236, 238, 20) jeden der durch das Auswahlmittel (26, 28) ausgewählten mehreren Bereiche (112) jedem Datensatz zuweist.
  7. Die Datenverarbeitungseinheit (1) gemäß einem der Ansprüche 1 bis 6, wobei das Datensatzzuweisungsmittel (100, 221, 223, 236, 238, 20) einen durch eine spezifische Zeichenkette punktierten Bereich des durch das Auswahlmittel (26, 28) ausgewählten Bereichs (112) einem Datensatz zuweist.
  8. Die Datenverarbeitungseinheit (1) gemäß einem der Ansprüche 1 bis 6, wobei das Datensatzzuweisungsmittel (100, 221, 223, 236, 238, 20) eine vorbestimmte Anzahl Zeilen in einem durch das Auswahlmittel (26, 28) ausgewählten Bereich (112) einem Datensatz zuweist.
  9. Die Datenverarbeitungseinheit (1) gemäß einem der Ansprüche 1 bis 8, ferner aufweisend: ein Löschungsmittel (20) zum Löschen von Zeichenketten an Zeilenköpfen, wenn die Zeichenketten mehrerer Zeilen durch das Auswahlmittel (26, 28) ausgewählt wurden und die Zeichenketten an den Zeilenköpfen der mehreren Zeilen identisch sind.
  10. Die Datenverarbeitungseinheit (1) gemäß einem der Ansprüche 1 bis 9, wobei das Attributbestimmungsmittel (223, 238, 20) eine durch das Auswahlmittel (26, 28) ausgewählte Zeichenkette gemäß einem zuvor eingestellten Importformat einem Datensatz zuweist.
  11. Die Datenverarbeitungseinheit (1) gemäß Anspruch 10, wobei das Importformat die Attributart und die Zuweisung einer Komponente in einem Datensatz und die einem Datensatz zuzuweisende Anzahl von Zeilen beinhaltet.
  12. Die Datenverarbeitungseinheit (1) gemäß Anspruch 10 oder 11, ferner aufweisend: Einstellungsmittel (100, 170) zum Einstellen des Importformats; und Formatspeichermittel (231) zum Speichern eines Importformats, das durch das Einstellmittel eingestellt wurde.
  13. Die Datenverarbeitungseinheit (1) gemäß einem der Ansprüche 10 bis 12, wobei das Importformat eine Punktierungszeichenkette (302) zum Unterteilen einer einem Datensatz zugewiesenen Zeichenkette in Komponenten und Attributinformation zum Bestimmen des Attributs einer durch das Punktierungszeichen (302) punktierten Komponente beinhaltet.
  14. Die Datenverarbeitungseinheit (1) gemäß Anspruch 13, wobei die Attributinformation aus einer Zeichenkette (301) besteht, die ein Attribut, das zwischen spezifischen Symbolen liegt, anzeigt.
  15. Die Datenverarbeitungseinheit (1) gemäß Anspruch 14, wobei angezeigt wird, daß eine Komponente, die einer Attributinformation entspricht, nicht importiert werden muß, wenn die Attributinformation nur aus dem spezifischen Symbol besteht.
  16. Die Datenverarbeitungseinheit gemäß einem der Ansprüche 10 bis 15, ferner aufweisend: ein Komponentenvereinigungsmittel (225, 240, 20) zum Vereinigen mehrerer Komponenten, bei denen durch das Attributbestimmungsmittel (233, 238, 20) bestimmt wurde, daß sie ein identisches Attribut haben.
  17. Die Datenverarbeitungseinheit (1) gemäß einem der Ansprüche 10 bis 16, wobei das Importformat ein Anfangszeichen (303) beinhaltet, das den Kopf eines zu importierenden Bereichs (112) anzeigt.
  18. Ein Datenverarbeitungsprogramm, das auf einem computerlesbaren Medium gespeichert ist und das einen Computer (1) dazu veranlasst, eine eingegebene Zeichenkette zu analysieren und einen Datenimport in ein Datenbankfeld (321, 322, 323), das einer Art der eingegebenen Zeichenkette entspricht, auszuführen, wobei das Datenverarbeitungsprogramm aufweist: einen Speicherungsvorgang, der mehrere Felder und Datensätze in einer speicherbaren Datenbank speichert; einen Anzeigevorgang, der die Zeichenkette anzeigt; einen Auswahlvorgang, der einen vorbestimmten Bereich (112) für die Zeichenkette, die durch den Anzeigevorgang angezeigt wird, auswählt; einen Datensatzzuweisungsvorgang, der eine durch den Auswahlvorgang ausgewählte Zeichenkette den Datensätzen zuweist; einen Komponentenunterteilungsvorgang, der eine Zeichenkette in einem durch den Datensatzzuweisungsvorgang zugewiesenen Datensatz in Komponenten unterteilt; einen Attributbestimmungsvorgang, der das Attribut der Komponenten bestimmt, die durch Unterteilen mit dem Komponentenunterteilungsvorgang erhalten wurden; und einen Speichervorgang, der die Komponente in dem Datenbankfeld (321, 322, 323) speichert, das dem durch den Attributbestimmungsvorgang bestimmten Attribut entspricht.
  19. Das Datenverarbeitungsprogramm gemäß Anspruch 18, wobei der Komponentenunterteilungsvorgang eine einzelne durch einen Zeilenumbruchscode punktierte Zeile einer dem Datensatz zuge wiesenen Zeichenkette in eine Komponente unterteilt, und der Attributbestimmungsvorgang bestimmt, daß die Komponente, die aus einer Zeichenkette einer ersten Zeile besteht, von einem Attribut Name ist und die Komponente, die aus einer zweiten und folgenden Zeichenkette besteht, von einem Attribut Adresse ist.
  20. Das Datenverarbeitungsprogramm gemäß Anspruch 18, wobei der Komponentenunterteilungsvorgang die Zeichenkette mittels eines Feldcodes in der dem Datensatz zugewiesenen Zeichenkette in Komponenten unterteilt und der Attributbestimmungsvorgang bestimmt, daß eine erste Komponente von einem Attribut Name ist und die verbleibenden Komponenten von einem Attribut Adresse sind.
  21. Das Datenverarbeitungsprogramm gemäß Anspruch 18 oder 20, wobei der Komponentenunterteilungsvorgang die Zeichenkette mittels eines Feldcodes in der dem Datensatz zugewiesenen Zeichenkette und des Attributbestimmungsvorgangs, der bestimmt, daß die Komponente, die aus einer Zeichenkette in dem letzten Feld besteht, von einem Attribut Postleitzahl ist, wenn die Zeichenkette in dem letzten Feld numerisch ist, in Komponenten unterteilt.
  22. Das Datenverarbeitungsprogramm gemäß einem der Ansprüche 18 bis 21, ferner aufweisend: einen Komponentenvereinigungsvorgang, der mehrere Komponenten zu einer einzigen Komponente vereinigt, wenn das durch den Attributbestimmungsvorgang bestimmte Attribut bei aufeinanderfolgenden mehreren Komponenten identisch ist.
  23. Das Datenverarbeitungsprogramm gemäß einem der Ansprüche 18 bis 22, wobei der Auswahlvorgang mehrere Bereiche (112) auswählt und der Datensatzzuweisungsvorgang jeden der durch den Auswahlvorgang ausgewählten mehreren Bereiche (112) jedem Datensatz zuweist.
  24. Das Datenverarbeitungsprogramm gemäß einem der Ansprüche 18 bis 23, wobei der Datensatzzuweisungsvorgang einen durch eine spezifische Zeichenkette punktierten Bereich (112) des durch den Auswahlvorgang ausgewählten Bereichs einem Datensatz zuweist.
  25. Das Datenverarbeitungsprogramm gemäß einem der Ansprüche 18 bis 23, wobei der Datensatzzuweisungsvorgang eine vorbestimmte Anzahl Zeilen in einem durch den Auswahlvorgang ausgewählten Bereich (112) einem Datensatz zuweist.
  26. Das Datenverarbeitungsprogramm gemäß einem der Ansprüche 18 bis 25, ferner aufweisend: einen Löschungsvorgang, der Zeichenketten an Zeilenköpfen löscht, wenn die Zeichenketten mehrerer Zeilen durch den Auswahlvorgang ausgewählt wurden und die Zeichenketten an den Zeilenköpfen der mehreren Zeilen identisch sind.
  27. Das Datenverarbeitungsprogramm gemäß einem der Ansprüche 18 bis 26, wobei der Attributbestimmungsvorgang eine durch den Auswahlvorgang ausgewählte Zeichenkette gemäß einem zuvor eingestellten Importformat einem Datensatz zuweist.
  28. Das Datenverarbeitungsprogramm gemäß Anspruch 27, wobei das Importformat die Attributart und die Zuweisung einer Komponente in einem Datensatz und die Anzahl der einem Datensatz zuzuweisenden Zeilen beinhaltet.
  29. Das Datenverarbeitungsprogramm gemäß Anspruch 27 oder 28, ferner aufweisend: einen Einstellungsvorgang, der das Importformat einstellt; und einen Formatspeicherungsvorgang, der ein Importformat speichert, das durch den Einstellungsvorgang eingestellt wurde.
  30. Das Datenverarbeitungsprogramm gemäß einem der Ansprüche 27 bis 29, wobei das Importformat eine Punktierungszeichenkette (302) zum Unterteilen einer einem Datensatz zugewiesenen Zeichenkette in Komponenten und Attributinformation zum Bestimmen des Attributs einer durch das Punktierungszeichen (302) punktierten Komponente beinhaltet.
  31. Das Datenverarbeitungsprogramm gemäß Anspruch 30, wobei die Attributinformation aus einer Zeichenkette (301) besteht, die ein Attribut, das zwischen spezifischen Symbolen liegt, anzeigt.
  32. Das Datenverarbeitungsprogramm gemäß Anspruch 31, wobei angezeigt wird, daß eine Komponente, die einer Attributinformation entspricht, nicht importiert werden muß, wenn die Attributinformation nur aus dem spezifischen Symbol besteht.
  33. Das Datenverarbeitungsprogramm gemäß einem der Ansprüche 27 bis 32, ferner aufweisend: einen Komponentenvereinigungsvorgang, der mehrere Komponenten vereinigt, bei denen durch den Attributbestimmungsvorgang bestimmt wurde, daß sie ein identisches Attribut haben.
  34. Das Datenverarbeitungsprogramm gemäß einem der Ansprüche 27 bis 33, wobei das Importformat ein Anfangszeichen (303) be inhaltet, das den Kopf eines zu importierenden Bereichs anzeigt.
DE602005006029T 2004-02-20 2005-02-17 Datenverarbeitungseinheit und Datenverarbeitungsprogramm gespeichert in einem computerlesbaren Aufzeichnungsmedium Active DE602005006029T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004043821A JP2005234915A (ja) 2004-02-20 2004-02-20 データ処理装置及びデータ処理プログラム
JP2004043821 2004-02-20

Publications (2)

Publication Number Publication Date
DE602005006029D1 DE602005006029D1 (de) 2008-05-29
DE602005006029T2 true DE602005006029T2 (de) 2009-05-07

Family

ID=34709129

Family Applications (1)

Application Number Title Priority Date Filing Date
DE602005006029T Active DE602005006029T2 (de) 2004-02-20 2005-02-17 Datenverarbeitungseinheit und Datenverarbeitungsprogramm gespeichert in einem computerlesbaren Aufzeichnungsmedium

Country Status (5)

Country Link
US (1) US20050187904A1 (de)
EP (1) EP1566750B1 (de)
JP (1) JP2005234915A (de)
AT (1) ATE392668T1 (de)
DE (1) DE602005006029T2 (de)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7937426B2 (en) * 2006-06-30 2011-05-03 Mircosoft Corporation Interval generation for numeric data
JP4742010B2 (ja) * 2006-10-20 2011-08-10 日立キャピタル株式会社 個人情報ファイルの監視システム
CN101727399B (zh) * 2008-10-30 2012-10-10 鸿富锦精密工业(深圳)有限公司 存储装置及使用该存储装置的数据交换系统
EP2356601A1 (de) * 2008-11-14 2011-08-17 Koninklijke Philips Electronics N.V. Suchmaschine für medizinische daten
CN112650799A (zh) * 2019-10-12 2021-04-13 中国石油化工股份有限公司 用于分析地震解释数据文本的方法和装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6243696B1 (en) * 1992-11-24 2001-06-05 Pavilion Technologies, Inc. Automated method for building a model
US5889518A (en) * 1995-10-10 1999-03-30 Anysoft Ltd. Apparatus for and method of acquiring, processing and routing data contained in a GUI window
CA2329345A1 (en) * 1997-04-22 1998-10-29 Greg Hetherington Method and apparatus for processing free-format data
US6154738A (en) * 1998-03-27 2000-11-28 Call; Charles Gainor Methods and apparatus for disseminating product information via the internet using universal product codes
AU7941600A (en) * 1999-10-12 2001-04-23 Shopper Inc., The A method and system for automatically structuring content from universal marked-up documents
US6687711B1 (en) * 2000-12-04 2004-02-03 Centor Software Corporation Keyword and methods for using a keyword
KR100483497B1 (ko) * 2002-11-26 2005-04-15 한국전자통신연구원 엘리먼트 기반 웹 문서의 파싱시스템 및 그 방법

Also Published As

Publication number Publication date
EP1566750B1 (de) 2008-04-16
JP2005234915A (ja) 2005-09-02
ATE392668T1 (de) 2008-05-15
EP1566750A1 (de) 2005-08-24
US20050187904A1 (en) 2005-08-25
DE602005006029D1 (de) 2008-05-29

Similar Documents

Publication Publication Date Title
DE60219048T2 (de) Sektionsextrahierungswerkzeug für pdf-dokumente
DE60120810T2 (de) Verfahren zur Dokumenterkennung und -indexierung
DE60008498T2 (de) Verfahren und System zum Addieren und Löschen von Elementen in einem Bereich von mit Namen versehenen Zellen entsprechend verschiedener Methoden in einem elektronischen Kalkulationsblatt
EP1902407B1 (de) System zum übertragen von daten aus einer dokumentenanwendung in eine datenanwendung
EP0910829B1 (de) Datenbanksystem
DE4334524C2 (de) Dokumentverarbeitungsvorrichtung
EP1669852B1 (de) Verfahren und Computerprogramm zum Umwandeln eines Eingangs-Dokumentendatenstroms mit einem oder mehreren Dokumenten in eine strukturierte Datendatei
DE60319586T2 (de) Elektronisches wörterbuch mit beispielsätzen
DE3141571A1 (de) &#34;tischcomputer mit tasteneingabefeld&#34;
DE19706512A1 (de) Echtzeit-Ereignisanordnung in einem elektronischen Ablaufdiagramm
DE212017000257U1 (de) Systeme zum Anwenden eines Layouts auf Dokumente
DE602005006029T2 (de) Datenverarbeitungseinheit und Datenverarbeitungsprogramm gespeichert in einem computerlesbaren Aufzeichnungsmedium
DE60310881T2 (de) Methode und Benutzerschnittstelle für das Bilden einer Darstellung von Daten mit Meta-morphing
DE19514799A1 (de) Druckvorrichtung, Drucksteuerverfahren und Zeichenfontmustersteuerverfahren in einer Druckvorrichtung
WO2005119580A1 (de) Verfahren und einrichtung zur strukturanalyse eines dokuments
DE10352341A1 (de) Verfahren zur Veränderung der Abmessungen eines elektronisch gespeicherten Bildes
DE10011664A1 (de) Dokumentenanalysesystem und Verfahren zum Analysieren von Dokumenten
EP0788632B1 (de) Computergestützte umwandlung von tabellen
DE602004003230T2 (de) System und Verfahren in einer Datentabelle zur Erzeugung von rekursiven skalierbaren Vorlageninstanzen
DE3234892C2 (de)
DE602004003140T2 (de) System und verfahren in einer datentabelle zur verwaltung von löschoperationen in rekursiven skalierbaren vorlageninstanzen
DE19653435A1 (de) Elektronisches Publizier-System
DE60209783T2 (de) Verfahren zur speicherfreigabe in einer vorrichtung mit begrenzter speicherkapazität zur erzeugung digitaler striche
DE3838732A1 (de) Informationsverarbeitungsgeraet
DE10000935C2 (de) Vorrichtung und Verfahren zum Steuern einer Dokumentenbereichsanalyse

Legal Events

Date Code Title Description
8364 No opposition during term of opposition