DE112010005297T5 - Suchvorrichtung und Suchprogramm - Google Patents

Suchvorrichtung und Suchprogramm Download PDF

Info

Publication number
DE112010005297T5
DE112010005297T5 DE112010005297T DE112010005297T DE112010005297T5 DE 112010005297 T5 DE112010005297 T5 DE 112010005297T5 DE 112010005297 T DE112010005297 T DE 112010005297T DE 112010005297 T DE112010005297 T DE 112010005297T DE 112010005297 T5 DE112010005297 T5 DE 112010005297T5
Authority
DE
Germany
Prior art keywords
input
search
candidate
unit
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE112010005297T
Other languages
English (en)
Inventor
Yohei Okato
Tomohiro Iwasaki
Toshiyuki Hanazawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of DE112010005297T5 publication Critical patent/DE112010005297T5/de
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

Die Indexerzeugungseinheit (20) teilt jeweilige Namensdaten von Suchzieldaten (10) sowohl in Wörter als auch in Zeichen, berechnet ein Anfangs- und ein Endergebnis, die einen Anfang und ein Ende von jedem der Wörter zeigen, sowie ein Anfangs- und ein Endergebnis, die einen Anfang und ein Ende von jedem der Zeichen zeigen, verbindet sie mit jedem Eingabewort, dass die Namensdaten bildet, als eine Liste (ein Namens-ID, eine Position und Anfangs- und Endergebnis), und speichert diese Liste in einer Indexspeichereinheit (30). Eine Sucheinheit (40) zersetzt eine Eingangszeichenreihe in Teilzeichenreihen, erhält entsprechende Kandidateneingaben von der Indexspeichereinheit (30) und beurteilt die Kontinuität zwischen Kandidateneingaben auf der Grundlage von Listen, um ein Vergleichsergebnis gemäß der Kontinuität zu einer Kandidateneingabe hinzuzufügen.

Description

  • Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf eine Suchvorrichtung und ein Suchprogramm zum Suchen des Namens eines Suchziels anhand von Indices, die vorher erzeugt wurden.
  • Hintergrund der Erfindung
  • Wenn eine Volltextsuche durchgeführt wird, kann eine herkömmliche Suchvorrichtung ein großes Volumen von Indices erzeugen, mit denen ein Name, der ein Suchziel ist, vorher von teilweisen Zeichenreihen in Bezug genommen werden kann, die den Namen bilden durch Verwendung einer Menge von Dokumentendaten, um eine Teilübereinstimmungssuche bei dem großen Volumen von Indices mit einer hohen Geschwindigkeit durchzuführen. Ein Wort oder ein N-Zeichengramm wird als die kleinste zu suchende Einheit verwendet. Wenn Wörter als Sucheinheiten definiert sind, während Suchergebnisse, die linguistisch angemessen sind, als zu erfassen erwartet werden können, findet eine Suchunterlassung statt, wenn ein Fehler in einer früheren Sprachanalyse auftritt. Weiterhin kann eine derartige herkömmliche Suchvorrichtung keine Suche in Einheiten eines Elements, dass kürzer als ein Wort ist, durchführen. Weiterhin besteht, wenn N-Zeichengramme als Sucheinheiten definiert sind, während keine Suchunterlassung auftritt, eine Möglichkeit, dass Kandidaten für den Namen, die jeweils Trennzeichen haben, die linguistisch nicht angemessen sind, unerwartet auftreten. Beispielsweise ist es möglich, obgleich es unmöglich ist, ein Worttrennzeichen, dass
    Figure 00020001
    der Schrägstrich zeigt ein Trennzeichen) in Entsprechung mit dem folgenden Wort:
    Figure 00020002
    zu bringen, die folgenden Zeichen:
    Figure 00020003
    durch eine Übereinstimmungsteilsuche in Entsprechung mit Zeichentrennzeichen zu bringen, die
    Figure 00020004
    anzeigen. Daher ist, obgleich
    Figure 00020005
    nicht in Suchergebnissen enthalten ist, wenn eine Suche nach
    Figure 00020006
    auf einer Wort-für-Wort-Basis durchgeführt wird,
    Figure 00020007
    in Suchergebnissen enthalten, wenn eine Suche nach
    Figure 00020008
    auf einer Zeichen-für-Zeichen-Basis durchgeführt wird, und dieses Suchergebnisse hat keine linguistische Gültigkeit.
  • Um dieses Problem zu lösen, ist eine derartige herkömmliche Suchvorrichtung so ausgebildet, dass sie in der Lage ist, eine Suche auf einer Wort-für-Wort-Basis und auf einer Zeichen-für-Zeichen-Basis durchzuführen. Ein Problem besteht jedoch darin, dass die Zeit, die erforderlich ist zum Erzeugen von Indices, und die Suchzeit, die zum Durchführen einer Suche erforderlich ist, verlängert wird auf die Summe der Zeit, die erforderlich ist zum Erzeugen von Indices für eine Suche auf einer Wort-für-Wort-Basis, und die Summe der Zeit, die erforderlich ist zum Erzeugen von Indices für eine Suche auf einer Zeichen-für-Zeichen-Basis und die Summe der Suchzeit, die erforderlich ist zum Durchführen einer Suche auf einer Wort-für-Wort-Basis, und der Suchzeit, die erforderlich ist zum Durchführen einer Suche auf einer Zeichen-für-Zeichen-Basis. Im Gegensatz hierzu fügt eine Informationssuchvorrichtung, die in dem Patentdokument 1 offenbart ist, Wortinformationen zu jedem Index, der eine Zeicheneinheit ist, hinzu und führt eine Suche auf einer Wort-für-Wort-Basis und auf einer Zeichen-für-Zeichen-Basis in einer komplexen Weise durch, wodurch eine Verlängerung der Verarbeitungszeit unterdrückt wird.
  • Weiterhin ist, wenn ein Name gesetzt wird, den ein Benutzer als einen Suchbegriff geäußert hat, und einen Namenssuche nach Namen, von denen jeder teilweise mit einem Index übereinstimmt, beispielsweise eine Fuzzy-Übereinstimmungs-Suchtechnik nützlich, da der von dem Benutzer geäußerte Name nicht immer teilweise mit einem Index übereinstimmt. Die Patentdokumente 2 und 3 schlagen Fuzzy-Übereinstimmungs-Suchtechniken vor, die Indices für Volltextsuche verwenden. Eine Zeichenreihen-Suchvorrichtung, die durch das Patentdokument 2 offenbart wird, teilt einen Suchbegriff in N-Zeichengramme, sucht durch die Indices nach einem Namen, der teilweise mit jedem der N-Zeichengramme übereinstimmt, und gibt den Namen enthaltend die größte Anzahl von N-Zeichengrammen, von denen jedes teilweise mit dem Suchbegriff übereinstimmt, als ein Suchergebnis aus. Weiterhin zählt eine durch das Patentdokument 3 offenbarte Textsuchvorrichtung die Anzahl von Zeichen in jedem Index, von denen jedes an der selben Position wie das selbe Zeichen in einem Suchbegriff oder an einer Position, die in einen vorbestimmten Bereich von der Position desselben Zeichens aus fällt, erscheint, um den Grad der Ähnlichkeit jedes Index zu berechnen, und gibt den Namen mit dem höchsten Grad von Ähnlichkeit als ein Suchergebnis aus.
  • Dokumente nach dem Stand der Technik
  • Patentdokumente
    • Patentdokument 1: JP 3636941
    • Patentdokument 2: JP 3665112
    • Patentdokument 3: JP 3715672
  • Zusammenfassung der Erfindung
  • Daher herkömmliche Suchvorrichtungen wie vorbeschrieben ausgebildet sind, besteht ein Problem mit einer Fuzzy-Übereinstimmungssuche bei einer Volltext-Suchvorrichtung, die Indices verwendet, darin, dass ein unerwarteter Fehler leicht auftritt und der Grad der Suchgenauigkeit niedrig ist, weil verschiedene Vergleiche zulässig sind. Insbesondere ist, wenn eine Suche auf der Basis eines Suchausdrucks durchgeführt wird, der nahe eines Sprachausdrucks auf der Grundlage von Sucheinheiten ist, wie japanischen Kana-Zeichen (etwa 100 Zeichen) oder englischen phonemischen Symbolen (etwa 40 phonemische Symbole), die Zunahme der Anzahl von Kandidaten bemerkenswert, da die Anzahl von Zeichen oder Symbolen klein ist im Vergleich mit der Anzahl von Wörtern und der Anzahl von chinesischen Zeichen, und ein höherer Grad von Unschärfe wird erhalten. Jedoch tritt in einem Fall, in welchem Indices, die Worteinheiten sind, erzeugt werden, eine Suchunterlassung auf, wenn ein Analysefehler zu der Zeit der Erzeugung der Indices auftritt, wie vorstehend erwähnt ist, während eine Möglichkeit besteht, dass der Suchausdruck zu der Zeit der Durchführung einer Suche fehlerhaft in Wörter geteilt wird. Weiterhin kann eine derartige auf den Indices basierende Technik nicht eine Paraphrase stützen, die häufig im Japanischen gesehen wird und die ein degeneriertes Wort ist
    Figure 00040001
    das eine Abkürzung von
    Figure 00040002
    ist). Ein weiteres Problem besteht darin, dass in einem Fall, in welchem der Suchausdruck aus Sprachdaten besteht, selbst wenn eine Spracherkennung bei nur einem Zeichen fehlerhaft durchgeführt wird, die Erfassung des Wortes fehlschlägt und ein Kandidat, der in der Ähnlichkeit sehr weit von dem ursprünglichen Suchausdruck entfernt ist, ausgewählt wird.
  • Die vorliegende Erfindung wurde gemacht, um die vorbeschriebene Probleme zu lösen, und es ist daher eine Aufgabe der vorliegende Erfindung, eine Suchvorrichtung und ein Suchprogramm vorzusehen, die eine hochgenaue Fuzzy-Übereinstimmungssuche implementieren, in dem eine Suche nach einer Eingangszeichenreihe, die ein Suchziel ist, durchgeführt wird auf der Grundlage von minimalen Einheiten, während die auf längeren Einheiten basierende linguistische Gültigkeit berücksichtigt wird.
  • Gemäß der vorliegenden Erfindung ist eine Suchvorrichtung vorgesehen, welche enthält: eine Namenanalyseinheit zum Teilen von Namendaten, die aus einer Zeichenreihe bestehen, in mehrere Datenstücke in zumindest einem Typ von Einheiten, um Grenzinformationen zu erzeugen, die einen Anfang und ein Ende von jedem der vorgenannten mehreren Datenstücke zeigen; eine Anfangs- und Endinformations-Hinzufügungseinheit zum Herausziehen von Teilzeichenreihen, die die Namendaten bilden, um die Teilzeichenreihen als Eingaben zu definieren und zum Hinzufügen von Positionsinformationen über eine Position von jeder der Eingaben in den Namendaten und der Grenzinformationen der Datenstücke, die in der vorgenannten Eingabe enthalten sind, zu dieser Eingabe; und eine Teilzeichenreihenindex-Erzeugungseinheit zum Sortieren von Ausgangsergebnissen der Anfangs- und Endinformations-Hinzufügungseinheit in der Reihenfolge der Eingaben, um Indices zu erzeugen.
  • Weiterhin ist gemäß der vorliegenden Erfindung ein Suchprogramm vorgesehen, um zu bewirken, dass ein Computer arbeitet als: eine Namenanalyseeinheit zum Teilen von Namendaten, die aus einer Zeichenreihe bestehen, in mehrere Datenstücke in zumindest einem Typ von Einheiten, um Grenzinformationen zu erzeugen, die einen Anfang und eine Ende von jedem der vorgenannten mehreren Datenstücke zeigen; eine Anfangs- und Endinformations-Hinzufügungseinheit zum Herausziehen von Teilzeichenreihen, die die Namendaten bilden, um die Teilzeichenreihen als Eingaben zu definieren, und zum Hinzufügen von Positionsinformationen über eine Position von jeder der vorgenannten Eingaben in den Namendaten und der Grenzinformationen der in der vorgenannten Eingabe enthaltenen Datenstücke zu dieser Eingabe; und eine Teilzeichenreihenindex-Erzeugungseinheit zum Sortieren von Ausgangsergebnissen der Anfangs- und Endinformations-Hinzufügungseinheit in der Reihenfolge der Eingaben, um Indices zu erzeugen.
  • Gemäß der vorliegenden Erfindung kann, da Namendaten, die aus einer Zeichenreihe bestehen, in mehrere Datenstücke in zumindest einem Typ von Einheiten geteilt werden, um Grenzinformationen zu erzeugen, die einen Anfang und ein Ende von jedem der mehreren Datenstücke zeigen, und Positionsinformationen über die Position von jeder der Eingaben in den Namendaten und die Grenzinformationen der Datenstücke, die in der vorgenannten Eingabe enthalten sind, zu der Eingabe hinzugefügt werden, um Indices zu erzeugen, während eine Suche nach einer Eingangszeichenreihe, die ein Suchziel ist, auf einer pro minimum-Einheitbasis durchgeführt wird, die auf längeren Einheiten basierende linguistische Gültigkeit auch berücksichtigt werden. Als eine Folge kann eine hochgenaue Fuzzy-Übereinstimmungssuche implementiert werden.
  • Kurzbeschreibung der Zeichnungen
  • 1 ist ein funktionelles Blockschaltbild, dass die Struktur einer Suchvorrichtung gemäß dem Ausführungsbeispiel 1 der vorliegenden Erfindung zeigt;
  • 2 ist ein funktionelles Blockschaltbild, dass die interne Struktur einer in 1 gezeigten Index-Erzeugungseinheit zeigt;
  • 3 ist eine Ansicht, die ein Beispiel für Suchzieldaten zeigt;
  • 4 ist eine Ansicht, die ein Beispiel für Suchzieldaten zeigt, die jeweils in geschriebene Wörter geteilt sind;
  • 5 ist eine Ansicht, die ein Beispiel für Suchzieldaten zeigt, die jeweils in geschriebene Zeichen geteilt sind;
  • 6 ist eine Ansicht, die ein Beispiel für eine Tabelle zeigt, die durch eine Anfangs- und Endinformations-Hinzufügungseinheit erzeugt ist;
  • 7 ist eine Ansicht, die ein Beispiel für eine Liste (einen Namens-ID, eine Position, und Anfangs- und Endergebnisse), die durch eine Teilzeichenreihenindex-Erzeugungseinheit erzeugt wird;
  • 8 ist ein funktionelles Blockschaltbild, dass die innere Struktur einer Sucheinheit zeigt;
  • 9 ist ein Flussdiagramm, dass die Arbeitsweise der Sucheinheit erläutert; und
  • 10 ist eine Ansicht, dass ein Beispiel für eine Vergleichsergebnistabelle zeigt.
  • Ausführungsbeispiele der Erfindung
  • Nachfolgend werden, um diese Erfindung im Einzelnen zu erläutern, die bevorzugten Ausführungsbeispiele der vorliegenden Erfindung mit Bezug auf die begleitenden Zeichnungen beschrieben.
  • Ausführungsbeispiel 1
  • Eine in 1 gezeigte Suchvorrichtung ist versehen mit einer Indexerzeugungseinheit 20 zum vorhergehenden Erzeugen von Indices anhand von Suchzieldaten 10, einer Indexspeichereinheit 30 zum Speicher der Indices und einer Sucheinheit 40 zum Vergleichen von in diese eingegebenen Eingangsdaten (einer Eingangszeichenreihe) als Daten für die Suche mit den Indices, um Kandidaten, die den Eingangsdaten ähnlich sind, zu erfassen. Die innere Struktur der Indexerzeugungseinheit 20 ist in 2 gezeigt, und die innere Struktur der Sucheinheit 40 ist in 8 gezeigt. Diese Suchvorrichtung wird verwendet zum Durchführen einer Suche durch eine Menge von Kandidaten für den Namen auf der Grundlage einer Lesezeichenreihe, um Kandidaten mit einem hohen Gültigkeitsgrad aus teilweise übereinstimmenden Kandidaten enthaltend einen Kandidaten mit einer verschiedenen Wortreihenfolge und einen Kandidaten mit einer teilweisen Unterlassung zu erfassen.
  • Die Suchzieldaten 10 sind Namendaten über die Namen von Suchzielen und dienen als eine Grundlage für die Indices. Die jeweiligen Namendaten enthalten zumindest eine Lesung, die eine mit den Eingangsdaten zu vergleichende Zeichenreihe ist, und einen Namens-ID zum Identifizieren dieser Namendaten. Bei einem in 3 gezeigten Beispiel der Suchzieldaten 10 bestehen die jeweiligen Namendaten aus einem Namens-ID, einem Schreiben und einem Lesen.
  • Einen Namensanalyseeinheit 21 in den in 2 gezeigten Indexerzeugungseinheiten 20 liest die Information über die Suchzieldaten 10 und teilt die Zeichenreihe, die die jeweiligen Namendaten bildet, in mehrere Datenstücke in einem oder mehr Typen von linguistischen Einheiten, während auf Wörterbuchinformationen Bezug genommen wird. Als konkrete linguistische Einheit sind beispielsweise in dem Fall von Japanisch Wort(Morphem)-Einheiten und Zeicheneinheiten, die jeweils einem Schreiben eines Zeichens entsprechen, vorgesehen. Bei diesem Ausführungsbeispiel analysiert die Namensanalyseeinheit die Zeichenreihe in den zwei Typen von linguistischen Einheiten, die eine Kombination von Worteinheiten und Zeicheneinheiten sind. Der Grund, weshalb die Namensanalyseeinheit die Zeichenreihe in den zwei Typen von linguistischen Einheiten analysiert, liegt darin, dass die Grade der Analysegenauigkeit sowohl in Worteinheiten als auch in Zeicheneinheiten einander unterschiedlich sind und die Empfänglichkeit für jede Paraphrase vorgesehen ist, die in einer Schritt-für-Schritt-Weise erfasst wird. Es besteht eine Möglichkeit, dass, währen die Analyse der Zeichenreihe auf einer Wort-für-Wort-Basis einen starken linguistischen Zwang hat, das Analyseergebnis einen Analysefehler enthält, und es besteht auch eine Möglichkeit, dass die Analyse nicht eine Paraphrase handhaben kann, deren Länge kürzer als Wörter ist. Die Analyse der Zeichenreihe auf einer Zeichen-für-Zeichen-Basis hat einen hohen Grad von Analysegenauigkeit. Weiterhin sind in den meisten Fällen Zeichen die minimale Einheit von Pharaphrasen. In dem Wörterbuch werden Zeichen, Wörter und ihre Lesung sowie Anzeigewerte, die jeweils zum korrekten Hinzufügen eines Trennungszeichens verwendet werden und jeweils den Grad des Erscheinens von entweder einem Zeichen oder Wort selbst oder einem Zeichen oder Wort, das mit einem anderen Zeichen oder Wort übereinstimmt, zeigen, gespeichert. Diese Anzeigewerte werden statistisch in einer solchen Weise gelernt, dass ein Ergebnis, des die Summe von Anzeigewerten ist, einen großen Wert für korrekte Trennzeichen auf der Basis eines großen Volumens von Textdaten enthaltend Informationen über die korrekten Trennzeichen hat.
  • Die Namensanalyseeinheit 21 gibt die Lesungen von Wörtern, in die die Eingangszeichenreihe geteilt ist, und das Ergebnis dieser Teilung sowie die Lesungen von Zeichen, in die die Eingangszeichenreihe geteilt ist, und das Ergebnis dieser Teilung als ein Analyseergebnis aus, während auf die Wörterbuchinformationen Bezug genommen wird. Das Hinzufügen von Trennzeichen wird in einer solchen Weise durchgeführt, dass ein Ergebnis zu der Zeit der Verwendung jedes beliebigen Trennverfahrens berechnet wird auf der Grundlage von aus dem Wörterbuch gelesenen Anzeigewerten, und ein Satz von Trennzeichen, der das größte Ergebnis liefert, wird bestimmt. Ein Beispiel für Suchzieldaten 10, die jeweils ein in Wörter geteiltes Schreiben haben, ist in 4 gezeigt, und ein Beispiel für Suchzieldaten 10, die jeweils ein in Zeichen geteilte Schreiben haben, ist in 5 gezeigt. In den 4 und 5 zeigt jeder Schrägstrich (Schrägstrich) ein Trennzeichen.
  • Eine Anfangs- und Endinformations-Hinzufügungseinheit 22 zersetzt das durch die Namensanalyseeinheit 21 erhaltene Analyseergebnis in Teilzeichenreihen (Eingaben), die als Indices zu speichern sind, und erzeugt eine Tabelle, die aus der Position jeder Eingabe, die in dem Namen der Teilzeichenreihe erscheint, und dem Wortanfangspunkt, dem Wortendpunkt, dem Zeichenanfangspunkt und dem Zeichenendpunkt jeder Eingabe in dem Analyseergebnis besteht. Ein Beispiel für die durch die Anfangs- und Endinformations-Hinzufügungseinheit 22 erzeugte Tabelle ist in 6 gezeigt. In diesem Beispiel ist jede Eingabe mit einer Lesung (jeder Lesung in der Figur) ein Bigramm, das eine Einheit von Moras ist. Ein Mora ist eine Einheit entsprechend einem Haku im Japanischen. In einer Eingabe mit einem Anfangspunkt „1” zeigt dieser Anfangspunkt, dass eine Grenze zwischen Wörtern oder Zeichen bei einem Zeichen vor dem Lesen dieser Eingabe vorhanden ist. In einer Eingabe mit einem Endpunkt „1” zeigt dieser Endpunkt, dass eine Grenze zwischen Wörtern oder Zeichen bei zwei Zeichen nach dem Lesen dieser Eingabe ist. Beispielsweise beginnt die Teilzeichenreihe
    Figure 00090001
    mit dem selben Namens-ID „01” von einer Position „1”, ist der Anfangspunkt einer Worteinheit und hat den Anfangspunkt und den Endpunkt einer Zeicheneinheit.
  • Zusätzlich fügt die Anfangs- und Endinformations-Hinzufügungseinheit 22 Anfangs- und Endpunkt-Grenzinformationen zu jeder Eingabe hinzu durch Verwendung von Informationen über den Anfangspunkt und den Endpunkt, die für jede Worteinheit definiert sind, und den Anfangspunkt und den Endpunkt, die für jede Zeicheneinheit definiert sind. Da bei diesem Beispiel jede Wortgrenze in einer Zeichengrenze enthalten ist, kann die Anfangs- und Endpunkt-Grenzinformation einer der folgenden drei möglichen Werte sein: „2” in einem Fall, in welchem die Eingabe eine Wortgrenze und eine Zeichengrenze hat, „1” in einem Fall, in welchem die Eingabe eine Zeichengrenze hat, die nicht eine Wortgrenze ist, und „3” in anderen Fällen. In einem in 6 gezeigten Beispiel für die Anfangs- und Endpunkt-Grenzinformation werden Ergebniswerte, die auf den vorgenannten drei möglichen Werten basieren, einem Anfangsergebnis bzw. einem Endergebnis jeder Eingabe zugewiesen.
  • Eine Teilzeichenreihen-Indexerzeugungseinheit 23 bezieht sich auf die durch die Anfangs- und Endinformations-Hinzufügungseinheit 22 erzeugte Tabelle, um jede der Eingaben in Entsprechung mit einer oder mehr Listen zu bringen, von denen jede aus einem Namens-ID, einer Position und Anfangs- und Endergebnissen besteht, und sortiert die eine oder mehr Listen für jede Eingabe, um sie als Indices vorzusehen. Ein Beispiel für die eine oder mehr Listen (jede mit einem Namens-ID, einer Position und Anfangs- und Endergebnis), die von der Teilzeichenreihen-Indexerzeugungseinheit 23 erzeugt wurden, ist in 7 gezeigt. Beispielsweise ist, da die Eingabe von
    Figure 00100001
    sowohl in dem Namen
    Figure 00100002
    als auch dem Namen
    Figure 00100003
    enthalten ist, die Eingabe in Entsprechung mit den beiden Namens-IDn „01” und „02” gebracht.
  • Die Indexspeichereinheit 30 speichert die Indices der Eingaben, die durch die Teilzeichenreihen-Indexerzeugungseinheit 23 erzeugt wurden, und gibt jede Liste (ein Namens-ID, eine Position und Anfangs- und Endbedingung) frei, die in Entsprechung mit einer zu erhaltenden Eingabe gebracht ist.
  • Eine Teilzeichenreihen-Zersetzungseinheit 41, die in den in 8 gezeigten Sucheinheiten 40 enthalten ist, zersetzt eine Eingangszeichenreihe, die ein in die Suchvorrichtung eingegebenes Suchziel ist, in Teilzeichenreihen gemäß dem selben Kriterium, das zu der Zeit verwendet wird, zu der die Indexerzeugungseinheit 20 jeden Namen in Eingaben zersetzt. Nachfolgend wird angenommen, dass die Teilzeichenreihen-Zersetzungseinheit die Eingangszeichenreihe, die ein Suchziel ist, in Bigramme, von den jedes eine Einheit von Moras ist, gemäß der vorstehenden Erläuterung zersetzt.
  • Eine Teilzeichenreihen-Indexbezugseinheit 42 sucht nach Eingaben, die jeweils mit einer der Teilzeichenreihen übereinstimmen, die in der Eingangszeichenreihe von der Indexspeichereinheit 30 enthalten sind, um die Listen dieser Eingaben (die jeweils einen Namens-ID, eine Position sowie Anfangs- sowie Endergebnis haben) für jede der Teilzeichenreihen abzurufen.
  • Eine Kandidatenergebnis-Aktualisierungseinheit 43 aktualisiert eine Vergleichshistorie und ein Kandidatenergbnis für die Liste (eine Namens-ID, eine Position sowie Anfangs- und Endergebnis) von jeder der Kandidateneingaben, die durch die Teilzeichenreihen-Indexbezugseinheit 42 erhalten wurden und bestimmt eine Kandidatennamensliste, die gemäß Kandidatenergebnissen, die zu der Zeit bestimmt sind, zu der das Ende der in dieser eingegebenen Teilzeichenreihen erreicht wird, bestimmt sind, auszugeben ist. Die Einzelheiten der Kandidatenergebnis-Aktualisierungseinheit 43 werden später beschreiben.
  • Als Nächstes wird die Arbeitsweise der Sucheinheit 40 unter Verwendung eines in 9 gezeigten Flussdiagramms erläutert. Die Sucheinheit 40 hat eine Kandidatennamensliste (Kandidatennamensliste) und berechnet ein Kandidatenergebnis durch Verwendung dieser Kandidatennamensliste als eine Vergleichshistorie zum vorübergehenden Halten verschiedener Informationsstücke über Namensdaten, die die Teilzeichenreihen-Indexbezugseinheit 42 von der Index-Speichereinheit 30 erhalten hat. Genauer gesagt, für jeden von Kandidatennamen id(s) (1 ≤ id ≤ maximaler Namens-ID) von Namendaten (nachfolgend als Kandidatennamen bezeichnet), die Kandidaten für einen Namen sind, enthält diese Kandidatennamensliste die folgenden Informationssstücke:
    score[id]; ein Kandidatenergebnis,
    inpOfs[id]; die Position einer Teilzeichenreihe, mit der ein Vergleich in einer Eingangszeichenreihe gemacht ist (nachfolgend als die Eingangszeichenreihen-Vergleichsposition bezeichnet),
    idxOfs[id]; die Position einer Eingabe, mit der ein Vergleich in dem Kandidatennamen gemacht wird (nachfolgend als die Kandidatennamen-Vergleichsposition bezeichnet),
    boundary[id]; das Endergebnis einer Eingabe, mit der ein Vergleich zum letzten Mal in dem Kandidatennamen gemacht wurde (nachfolgend als das unmittelbar vorhergehende Eingabeendergebnis bezeichnet).
  • Während die Sucheinheit 40 im Schritt ST1 das Kandidatenergebnis, die Eingangszeichenreihen-Vergleichsposition und die Kandidatennamen-Vergleichsposition in der Kandidatennamensliste zu score[id] = inpOfs[id] = idxOfs[id] = 0 initialisiert, setzt die Sucheinheit das unmittelbar vorhergehende Eingabeendergebnis auf boundary[id] = 2. Bei diesem Ausführungsbeispiel zeigt boundary[id] nur das Endergebnis von dem Start- und dem Endergebnis, und boundary[id] = 2 zeigt, dass das Ende der Eingabe einen Wert „2” hat, was zeigt, dass das Ende eine Wortgrenze und eine Zeichengrenze ist.
  • Die Sucheinheit 40 erhält im Schritt ST2 die Eingangszeichenreihe, die ein Suchziel ist. Die Teilzeichenreihen-Zersetzungseinheit 41 zersetzt im nächsten Schritt ST3 die durch die Sucheinheit erhaltene Eingabezeichenreihe in Teilzeichenreihen, um eine Teilzeichenreihenliste zu erzeugen. Jede von den Teilzeichenreihen ist ein Bigramm, das eine Einheit von Moras ist, wie vorstehend beschrieben ist. Wenn das Lesen der Eingangszeichenreihe ausgedrückt wird als InpLen moras {s[1], s[2], ..., s[InpLen]}, wird jede Teilzeichenreihe ausgedrückt als s2[i] = (s[i], s[i + 1]). Das tiefer gestellte i zeigt die Zeichenposition jeder Teilzeichenreihe in der Eingangszeichenreihe und hat einen Bereich von 1 ≤ i ≤ InpLen – 1.
  • Wennbeispielsweise das Lesen der Eingangszeichenreihe
    Figure 00120001
    ist, ist InpLen gleich drei (die Eingangszeichenreihe enthält die folgenden drei Moras:
    Figure 00120002
    das ausgedrückt wird als s2[1] und
    Figure 00120003
    das ausgedrückt wird als s2[2], sind in der Teilzeichenreihenliste enthalten.
  • Die Teilzeichenreihen-Zersetzungseinheit 41 initialisiert im Schritt ST4 die Tieferstellung i zu i = 1 und bewirkt den Start des Vergleichsvorgangs von der in der Eingangszeichenreihe enthaltenen Kopfteilzeichenreihe s2[1] aus.
  • Die Teilzeichenreihen-Indexbezugseinheit 42 bezieht sich im Schritt ST5 auf die Indexspeichereinheit 30 für jede der Teilzeichenreihen, um die Liste (einen Namens-ID, eine Position und das Start- und Endergebnis) von jeder von einer oder mehr Eingaben (nachfolgend jede als eine Kandidateneingabe bezeichnet), die mit jeder der Teilzeichenreihen übereinstimmen, zu erhalten und eine Kandidateneingabeliste zu erzeugen. Die Anzahl von Kandidatennamen entsprechend der i-ten Zeichenposition wird ausgedrückt als IndexNum[i]. Weiterhin werden die eine oder mehr Kandidateneingaben entsprechend der Teilzeichenreihe an der i-ten Zeichenposition ausgedrückt als Index[i][j] (1 ≤ j ≤ IndexNum[i]). Das tiefer gestellte j zeigt die Kandidateneingabe, bei der der Vergleichsvorgang das nächste Mal durchzuführen ist. Genauer gesagt, der Namens-ID, die Position, das Anfangsergebnis und das Endergebnis in der Kandidateneingangsliste, die in Entsprechung mit der j-ten Kandidateneingabe gebracht ist, werden in der folgenden Weise ausgedrückt:
    Index[i][j].id; Namens-ID
    Index[i][j].ofs; Position,
    Index[i][j].begin; Anfangsergebnis,
    Index[i][j].end; Endergebnis.
  • Beispielsweise sind die eine oder mehr Kandidateneingaben entsprechend der Teilzeichenreihe s2[1] von
    Figure 00130001
    der Eingangszeichenreihe
    Figure 00130002
    (02, 1, 20). In diesem Fall ist, da zwei (= IndexNum[1]) Kandidatennamen enstprechend der i = 1sten Teilzeichenreihe
    Figure 00130003
    wie folgt vorhanden sind:
    Figure 00130004
    mit einem Namens-ID von 01 und
    Figure 00130005
    mit einem Namens-ID von 02, die j = 1ste Kandidateneingabe definiert als
    Figure 00130006
    (01, 2, 00) mit einem Namens-ID von 01, und die j = 2te Kandidateneingabe ist definiert als
    Figure 00130007
    (02, 1, 20) mit einem Namens-ID von 02. Daher ist in der Kandidateneingabeliste die Information, die in Entsprechung mit der j = 1sten Kandidateneingabe
    Figure 00130008
    gebracht ist, gleich Index[1][1].id = 01, Index[1][1].ofs = 2, Index[1][1].begin = 0, und Index[1][1].end = 0.
  • Die Teilzeichenreihen-Indexbezugseinheit 42 initialisiert im Schritt ST6 das tiefer gestellte j zu 1 und wandelt im nächsten Schritt ST7 die Kandidatennamensliste in id = Index[i][j].id um. Wenn zwei oder mehr Kandidatennamen entsprechend der Teilzeichenreihe s2[1] von
    Figure 00130009
    vorhanden sind, wie
    Figure 00130010
    bewirkt die Teilzeichenreihen-Indexbezugseinheit, dass die Sucheinheit den Vergleichsvorgang von der Kopfeingabe von einem der mehreren Kandidatennamen zuerst startet.
  • Die Kandidatenergebnis-Aktualisierungseinheit 43 führt im Schritt ST8 einen Vergleich zwischen der Kandidatennamensliste der Indices, der Kandidateneingabeliste und der Liste von Teilzeichenreihen der Eingabezeichenliste durch, um die Kontinuität in der Eingabezeichenreihe zu beurteilen. In einem Zustand, in welchem Index[i][j].id, dass den Namens-ID von der einen oder mehr Kandidateneingaben zeigt, bereits in der Kandidatennamensliste enthalten sind, und die Eingabezeichenreihen-Vergleichsposition inpOfs[id] um eins (in diesem Fall um eine Mora-Einheit) vorgerückt ist und die Kandidatennamens-Vergleichsposition idxOfs[id] um eins (in diesem Fall um eine Mora-Einheit) vorgerückt ist, d. h. wenn der Bewegungsabstand der Vergleichsposition des Kandidatennamens der folgenden Gleichung genügt: Index[i][j].ofsidxOfs[id] = 1, und der Bewegungsabstand der Vergleichsposition in der Eingangszeichenreihe der folgenden Gleichung genügt: i – inpOfs[id] = 1, beurteilt die Kandidatenergebnis-Aktualisierungseinheit, dass die Kontinuität aufrechterhalten ist. Ansonsten beurteilt die Kandidatenergebnis-Aktualisierungseinheit, dass die Kontinuität nicht aufrechterhalten ist.
  • Wenn die Eingangszeichenreihe, die ein Suchziel ist, das Ergebnis einer Spracherkennung bei einer Spracheingabe ist, wird der Zwang auf die Kontinuitätsbeurteilung wie folgt gelockert. In einem Zustand, in welchem die Eingabezeichenreihen-Vergleichsposition inpOfs[id] und die Kandidatennamenvergleichsposition idxOfs[id] um beliebige Zahlen D1 bzw. D2 vorgerückt sind, d. h., wenn der Bewegungsabstand der Vergleichsposition bei dem Kandidatennamen der folgenden Gleichung genügt: 1 ≤ Index[i][j].ofs-idxOfs[id] = D1, und der Bewegungsabstand der Vergleichsposition bei der Eingangszeichenreihe der folgenden Gleichung genügt: 1 ≤ i – inpOfs[id] = D2, beurteilt die Kandidatenergebnis-Aktualisierungseinheit, dass die Kontinuität aufrechterhalten ist, wodurch einige Veränderungen zulässig sind.
  • Wenn die Kontinuität aufrechterhalten ist (wenn „ja” im Schritt ST8), setzt die Kandidatenergebnis-Aktualisierungseinheit 43 im nächsten Schritt ST9 ein Vergleichsergebnis sc(i, j) = 1.0 für die Kandidateneingabe, bei der ein Vergleich durchgeführt wird. Die Kandidatenergebnis-Aktualisierungseinheit setzt das Vergleichsergebnis sc(i, j), das ein maximaler Wert ist, für die Kandidateneingabe, wenn die Kontinuität aufrechterhalten ist, während die Kandidatenergebnis-Aktualisierungseinheit den Wert des Vergleichsergebnisses gemäß dem Grad der linguistischen Gültigkeit der Kandidateneingaben einstellt, wenn die Kontinuität nicht aufrechterhalten ist.
  • Wenn die Kontinuität nicht aufrechterhalten ist (wenn „nein” im Schritt ST8), wählt die Kandidatenergebnis-Aktualisierungseinheit 43 im nächsten Schritt ST10 ein Vergleichsergebnis sc(i, j) für die Kandidateneingabe, bei der ein Vergleich durchgeführt wird, aus der Vergleichsergebnistabelle aus auf der Grundlage von sowohl end score boundary [id] der Kandidateneingabe (d. h., der unmittelbar vorhergehenden Eingabe), die in der Kandidatennamensliste gespeichert ist und mit der das letzte Mal ein Vergleich durchgeführt wurde, als auch start score index [i][j].begin der Kandidateneingabe, mit der ein Vergleich durchgeführt wird, gespeichert in der Kandidateneingabeliste.
  • Ein Beispiel für die Vergleichsergebnistabelle ist in 10 gezeigt. In diesem Beispiel setzt, wenn die Kandidateneingabe, bei der das letzte Mal ein Vergleich durchgeführt, den Endpunkt eines Wortes hat, und die Kandidateneingabe, bei der ein Vergleich durchgeführt wird, den Startpunkt eines Wortes in dem Kandidatennamen hat, die Kandidatenergebnis-Aktualisierungseinheit ein Vergleichsergebnis sc(i, j) von 1.0, das ein Maximum für die Kandidateneingabe ist, bei der ein Vergleich durchgeführt wird, da angenommen werden kann, dass ein Austausch in der Wortfolge in Einheiten eines Wortes in dem Kandidatennamen erfolgt, und daher besteht eine linguistische Gültigkeit zwischen ihnen. Weiterhin setzt, wenn die Kandidateneingabe, bei der das letzte Mal der Vergleich durchgeführt wurde, den Endpunkt eines Zeichens hat, und die Kandidateneingabe, bei der ein Vergleich durchgeführt wird, den Startpunkt eines Wortes in dem Kandidatennamen hat, die Kandidatenergebnis-Aktualisierungseinheit ein hohes Vergleichsergebnis von 0,9 für die Kandidateneingabe, bei der ein Vergleich durchgeführt wird, da angenommen werden kann, dass der Kandidatenname eine Paraphrase ist, in der das Ende eines Worte weggelassen ist. Das Muster einer Paraphrase, deren Erwartung angenommen werden kann, kann durch die in der Vergleichsergebnistabelle gespeicherten Vergleichsergebnisse in dieser Weise begrenzt werden.
  • Als eine Alternative kann das Muster einer Paraphrase, deren Erwartung angenommen werden kann, begrenzt werden durch Vorsehen eines Nachteils an Stelle des vorgenannten Vergleichsergebnisse sc(i, j) für die Kandidateneingabe, bei der ein Vergleich durchgeführt wird, wenn beispielsweise der im Schritt ST7 berechnete Bewegungsabstand negativ ist. Genauer gesagt, in einer Fall, in welchem die Eingabezeichenreihe einen Eingabefehler enthalten kann, wie einen Auslassungsfehler, einen Einfügungsfehler oder einen Ersetzungsfehler, verringert die Kandidatenergebnis-Aktualisierungseinheit das Vergleichsergebnis sc(i, j), wenn der Bewegungsabstand der Vergleichsposition bei dem Kandidatennamen (d. h., eine Positionsbeziehung zwischen den Eingaben in den Namendaten) negativ ist. Als eine Alternative kann anstelle der direkten Einstellung des Vergleichsergebnisse sc(i, j) die Kandidatenergebnis-Aktualisierungseinheit ein anderes Gewicht verwenden in Abhängigkeit davon, ob der Bewegungsabstand positiv oder negativ ist. Als eine Folge kann die Kandidatenergebnis-Aktualisierungseinheit verhindern, dass die Suchergebnisse ein ausgetauschtes Wort mit einem Austausch in der Wortfolge enthalten, wie in dem vorbeschriebenen Fall.
  • Die Kandidatenergebnis-Aktualisierungseinheit 43 fügt im Schritt ST11 das Vergleichsergebnis sc(i, j) zu dem Kandidatenergebnis score[id] für den Kandidatennamen score[id] = score[id] + sc(i, j)) hinzu. Die Kandidatenergebnis-Aktualisierungseinheit 43 aktualisiert weiterhin Informationen der Kandidatennamenliste, die andere als die Kandidatenergebnisse sind, zu der Zeit des Vergleichsergebnisses sc(i, j) > 0. Da die Kandidatenergebnis-Aktualisierungseinheit spezifizieren kann, dass der Vergleichsvorgang durchgeführt wurde durch Aktualisieren der Eingabezeichenreihen-Vergleichsposition und der Kandidatennamen-Vergleichsposition durch diesen Aktualisierungsvorgang, können die Informationen über diese Vergleichspositionen als eine Vergleichshistorie verwendet werden. Genauer gesagt, die Kandidatenergebnis-Aktualisierungseinheit aktualisiert das Kandidatenergebnis, die Eingabezeichenreihen-Vergleichsposition, die Kandidatennamen-Vergleichsposition und das unmittelbar vorhergehende Eingabeendergebnis wie folgt:
    score[id] = score[id] + sc(i, j),
    inpOfs[id] = i,
    idxOfs[id] = Index[i][j].end, und
    boundary[id] = Index[i][j].end.
  • Beispielsweise wird, da die j = 1ste Kandidateneingabe
    Figure 00160001
    (der Kandidatenname von id01) für die i = 1ste Teilzeichenreihe
    Figure 00160002
    einen Bewegungsabstand von 2( = 2 – 0) der Vergleichsposition für den Kandidatennamen
    Figure 00160003
    und einen Bewegungsabstand von 1(= 1 – 0) der Vergleichsposition für die Eingangszeichenreihe
    Figure 00160004
    hat, beurteilt, dass die Kontinuität nicht aufrechterhalten ist, und das Vergleichsergebnisse sc(1, 1) = 0.4 wird zu der Kandidateneingabe gemäß der in 10 gezeigten Vergleichsergebnistabelle hinzugefügt. Durch diesen Vergleichsvorgang wird das Kandidatenergebnis des Kandidatennamens
    Figure 00160005
    (der Kandidatenname von id01) zu dem Ergebnis [01] = 0 + 0.4 = 0.4. aktualisiert.
  • Die Sucheinheit 40 aktualisiert im Schritt ST12 das tiefer gestellte j zu j = j + 1, um zu bewirken, dass die i-te Teilzeichenreihe, bei der ein Vergleich durchgeführt wird, mit dem nächsten Kandidatennamen zu vergleichen ist, und prüft im nächsten Schritt ST13, ob diese Sucheinheit den Vergleich zwischen der i-ten Teilzeichenreihe und sämtlichen der j Kandidatennamen beendet hat. Wenn die Sucheinheit den Vergleich zwischen der i-ten Teilzeichenreihe und sämtlichen der Kandidatennamen (j ≤ IndexNum[i] nicht beendet hat (d. h., wenn ”ja” im Schritt ST13), kehrt die Sucheinheit zum Schritt ST7 zurück und führt den Vergleichsvorgang der Schritte ST7 bis ST11 bei allen der Kandidatennamen durch. Wenn jedoch zwei oder mehr selbe Namens-ID an verschiedenen Positionen der Eingangszeichenreihe existieren, wählt die Sucheinheit die Position, die das Kandidatenergebnis, in welchem die Vergleichsergebnisse summiert wurden, maximiert, auf einer Prioritätsbasis aus.
  • Beispielsweise führt, wenn der Vergleich zwischen der Teilzeichenreihe und sämtlichen der Kandidatennamen nicht beendet wurde, die Sucheinheit einen Vergleich zwischen der i = 1sten Teilzeichenreihe
    Figure 00170001
    und der j=2ten Kandidateneingabe
    Figure 00170002
    durch. Da diese Kandidateneingabe
    Figure 00170003
    einen Bewegungsabstand von 1 (= 1 – 0) der Vergleichsposition für den Kandidatennamen
    Figure 00170004
    (den Kandidatennamen von id02) und einen Bewegungsabstand von 1(1 – 0) der Vergleichsposition für die Eingangszeichenreihe
    Figure 00170005
    hat, wird beurteilt, dass die Kontinuität aufrechterhalten ist, und dass Vergleichsergebnis sc(1, 2) = 1.0 wird der Kandidateneingabe zugeteilt. Durch diesen Vergleichsvorgang wird das Kandidatenergebnis des Kandidatennamens
    Figure 00170006
    (das Kandidatennamens von id02) aktualisiert zu score[02] = 0 + 1.0 = 1.0.
  • Wenn der Vergleich zwischen der Teilzeichenreihe und sämtlichen der Kandidatennamen beendet ist ((j > IndexNum[i], d. h. wenn „nein” im Schritt ST13), aktualisiert die Sucheinheit 40 im nächsten Schritt ST14 das tiefer gestellte i zu i = i + 1, um zu bewirken, dass die nächste Teilzeichenreihe in der Eingangszeichenreihe mit jedem der Kandidatennamen zu vergleichen ist, und prüft im Schritt ST15 weiterhin, ob die Sucheinheit den Vergleichsvorgang bei sämtlichen der in der Eingangszeichenreihe enthaltenen i Teilzeichenreihen beendet hat.
  • Wenn sie beispielsweise den Vergleich bei sämtlichen der Teilzeichenreihen nicht beendet hat, führt die Sucheinheit den Vergleichsvorgang bei der i = 2ten Teilzeichenreihe, d. h.
    Figure 00170007
    die die Teilzeichenreihe s2[2] der Eingangszeichenreihe
    Figure 00170008
    ist, in dem nächsten Vergleichsvorgang durch.
  • Wenn der Vergleich bei allen der i Teilzeichenreihen beendet ist (i > InpLen – 1, d. h., wenn ”nein” im Schritt ST15), sortiert im nächsten Schritt ST16 die Teilzeichenreihen-Indexerzeugungseinheit 23 die in der Kandidatennamensliste enthaltenen Kandidatennamen zu der Zeit des Erreichens des Endes der Eingangszeichenreihe in der Reihenfolge auf der Grundlagen ihrer Kandidatenergebnisse (z. B. in abnehmender Reihenfolge des Kandidatenergebnisses), und gibt die hierdurch sortierten Kandidatennamen als eine Kandidatennamensliste aus und präsentiert diese Kandidatennamensliste dem Benutzer. Demgegenüber, wenn der Vergleich bei allen der i Teilzeichenreihen nicht beendet wurde (i ≤ InpLen – 1, d. h., wenn ”ja” im Schritt ST15), kehrt die Sucheinheit 41 zum Schritt ST5 zurück und führt den Vergleichsvorgang bei der nächsten Teilzeichenreihe durch.
  • Da die Sucheinheit 40 somit die Anfangs- und Endgrenzinformationen verwendet, die die linguistische Gültigkeit zeigen, die zu jeder Eingabe hinzugefügt werden, die in den von der Indexerzeugungseinheit 20 erzeugten Indices enthalten sind, und die einen Namen bilden, um eine Fuzzy-Übereinstimmungssuche bei der Eingangszeichenreihe durchzuführen, ergibt die Suchvorrichtung einen verbesserten Genauigkeitsgrad im Vergleich zu einem Fall, in welchem die Suchvorrichtung eine Suche ohne Verwendung jeglicher Anfangs- und Endgrenzinformationen durchführt. Da die Suchvorrichtung weiterhin das Muster einer annehmbaren Paraphrase einstellen kann gemäß dem Zwang auf die Bewegungsabstände in dem Vergleichsvorgang und den in der Vergleichsergebnistabelle gespeicherten Vergleichsergebnissen, kann die Suchvorrichtung die Eingangszeichenreihe flexibel handhaben unter Berücksichtigung eines Auslassungsfehlers, eines Einfügungsfehlers und eines Ersetzungsfehlers, die durch Spracherkennung beim Erkennen der Eingangszeichenreihe bewirkt werden. Beispielsweise kann die Suchvorrichtung den Zwang auf die Extraktion einer Paraphrase lockern, um ein erwartetes Wort in einer weiten Weise herauszuziehen oder kann die Extraktion einer Paraphrase zurückhalten, indem im Gegensatz große Wichtigkeit auf die Genauigkeit gelegt wird.
  • Bei der vorstehenden Erläuterung sind Schreiben und Lesen in Japanisch als Beispiel genommen. Dieses Ausführungsbeispiel ist nicht auf dieses Beispiel beschränkt. Auch in einem Fall, in welchem die Suchvorrichtung auf Englisch angewendet wird, kann die Suchvorrichtung die selben Vorgänge durchführen, indem Silben als Zeicheneinheiten, Phoneme oder Silben anstelle von Lesungen oder Silben oder Morpheme als Zeicheneinheiten verwendet werden.
  • Wie vorstehend beschrieben ist, ist die Suchvorrichtung gemäß dem Ausführungsbeispiel 1 so ausgebildet, dass sie enthält: die Namensanalyseeinheit 21 zum Teilen von Namendaten, die aus einer Zeichenreihe bestehen, sowohl in Wörter als auch in Zeichen, um Anfangs- und Endergebnisse, die einen Anfang und ein Ende von jedem der Wörter zeigen, und Anfangs- und Endergebnisse, die einen Anfang und eine Ende von jedem der Zeichen zeigen, zu erzeugen; die Anfangs- und Endinformations-Hinzufügungseinheit 22 zum Herausziehen von Teilzeichenreihen, die die Namendaten bilden, um Teilzeichenreihen als Eingaben zu definieren, und zum Hinzufügen einer Liste, die die Position von jeder der Eingaben in den Namensdaten, das Anfangs- und das Endergebnis von jedem Wort und das Anfangs- und das Endergebnis von jedem Zeichen, dass in der Eingabe enthalten ist, zeigt (ein Namens-ID, eine Position und ein Anfangs- und ein Endergebnis) zu der Eingabe; und die Teilzeichenreihen-Indexerzeugungseinheit 23 zum Sortieren der durch die Anfangs- und Endinformations-Hinzufügungseinheit 22 erhaltenen Ausgangsergebnisse in der Reihenfolge der Eingaben, um Indices zu erzeugen. Daher kann die Suchvorrichtung Indices erzeugen, die Sprachinformationen in Einheiten eines Zeichens, dass eine minimale Einheit ist, sowie Sprachinformationen in Einheiten eines Wortes, dass eine längere Einheit ist, enthalten. Als eine Folge kann die Suchvorrichtung eine Fuzzy-Übereinstimmungssuche hoher Genauigkeit implementieren.
  • Weiterhin ist die Suchvorrichtung gemäß dem Ausführungsbeispiel 1 so ausgebildet, dass sie enthält: die Teilzeichenreihen-Zersetzungseinheit 41 zum Herausziehen von Teilzeichenreihen, die eine Eingangszeichenreihe bilden; die Teilzeichenreihen-Indexbezugseinheit 42 zum Erhalten der Liste (ein Namens-ID, eine Position, und Anfangs- und Endergebnis) von jeder der einen oder mehr Kandidateneingaben entsprechend jeder der Teilzeichenreihen für die jeweiligen Namensdaten anhand der Indices, die vorher erzeugt und in der Indexspeichereinheit 30 gespeichert wurden, die Kandidatenergebnis-Aktualisierungseinheit 43 zum Beurteilen der Kontinuität in den Kandidatennamensdaten zwischen Kandidateneingaben, die die Teilzeichenreihen-Indexbezugseinheit 42 erhalten hat, auf der Grundlage ihrer Listen (jede einen Namens-ID, eine Position, und Anfangs- und Endergebnis aufweisend), zum Hinzufügen eines maximalen Vergleichsergebnisses sc(i, j) zu einer der Kandidateneingaben, von der die Kandidatenergebnis-Aktualisierungseinheit bestimmt hat, dass sie kontinuierlich zu der anderen Kandidateneingabe ist, oder Hinzufügen eines Vergleichsergebnisses sc(i, j) gemäß der Gültigkeit der Verbindung mit jeder von Kandidateneingaben, die vor und hinter der Kandidateneingabe, von der die Kandidatenergebnis-Aktualisierungseinheit bestimmt hat, dass sie diskontinuierlich zu der anderen Kandidateneingabe ist, angeordnet sind, zu der Kandidateneingabe auf der Grundlage des Anfangs- und Endergebnisses dieser Kandidateneingabe, zum Berechnen eines Kandidatenergebnisses score sc(i, j) durch Summieren des Vergleichsergebnisses sc(i, j) von jeder Kandidateneingabe, die in dem Kandidatennamen enthalten ist, und zum Sortieren der Kandidatennamen in abnehmender Reihenfolge des Kandidatenergebnisse score[id], um sie auszugeben. Daher kann, während die Suchvorrichtung eine Suche auf der Grundlage von Zeichen, die minimale Einheiten sind, durchführen kann, die Suchvorrichtung eine Suche durchführen durch Berücksichtigung der linguistischen Gültigkeit auf der Grundlage von Wörtern, die längere Einheiten sind. Daher kann, selbst wenn der Kandidat für einen Namen nicht die Eingangszeichenreihe selbst ist, oder sogar in einem Fall der Durchführung einer unvollkommenen Teilübereinstimmungssuche die Suchvorrichtung die Suche durchführen und die Suche mit einem hohen Genauigkeitsgrad und in einer Fuzzy Weise implementieren. Insbesondere kann die Suchvorrichtung ihre Robustheit in einem Fall, in welchem die Eingabe eine Sprache ist und die Eingangszeichenreihe ein Fehlererkennungsergebnis enthält, verbessern.
  • Weiterhin ist die Kandidatenergebnis-Aktualisierungseinheit 43 gemäß dem Ausführungsbeispiel 1 derart ausgebildet, dass sie bestimmt, dass die Kontinuität aufrechterhalten ist, wenn ein Bewegungsabstand zwischen einer Teilzeichenreihe, die in der Eingangszeichenreihe enthalten ist und mit der zuletzt ein Vergleich durchgeführt wurde, und einer Teilzeichenreihe, mit der ein Vergleich durchgeführt wird, und ein Bewegungsabstand zwischen den Kandidateneingaben in dem Kandidatennamen jeweils entsprechend den Teilzeichenreihen gleich bzw. kürzer als vorbestimmte Bewegungsabstände sind. Daher kann durch Einstellen der vorgenannten vorbestimmten Bewegungsabstände zum Beurteilen der Kontinuität die Kandidatenergebnis-Aktualisierungseinheit das Kandidatenergebnis berechnen unter Berücksichtigung der Grenze zwischen Wörtern, der Grenze zwischen Zeichen, Eingangsfehlern und verschiedenen Mustern ausgetauschter Wörter. Daher kann im Vergleich mit einem herkömmlichen Fuzzy-Übereinstimmungssuchverfahren, das diese nicht berücksichtigt, das vorliegende Ausführungsbeispiel einen höheren Grad von Suchgenauigkeit ergeben.
  • Weiterhin ist die Kandidatenergebnis-Aktualisierungseinheit 43 gemäß dem Ausführungsbespiel 1 so ausgebildet, dass sie das Vergleichsergebnis sc(i, j) gemäß dem Bewegungsabstand zwischen Kandidateneingaben in jedem Namenskandidaten einstellt. Daher kann, indem sie einen Nachteil für das Vergleichsergebnis sc(i, j) vorsieht, wenn der Bewegungsabstand negativ ist, die Suchvorrichtung das Herausziehen einer Paraphrase aus den Indices unterdrücken, wodurch sie in der Lage ist, die Suchgenauigkeit weiter zu verbessern.
  • In einem Fall, in welchem die Suchvorrichtung als ein Computer ausgebildet ist, kann ein Suchprogramm, in welches die Prozessbeschreibungen der Indexerzeugungseinheit 20, der Indexspeichereinheit 30 und Sucheinheit 40 geschrieben sind, in einem Speicher des Computers gespeichert sein, und eine CPU des Computers kann ausgebildet sein, das in dem Speicher gespeicherte Suchprogramm auszuführen.
  • Gewerbliche Anwendbarkeit
  • Wie vorstehend beschrieben ist, ist, da die Suchvorrichtung gemäß der vorliegenden Erfindung eine Suche durchführen kann unter Berücksichtigung der Grenze zwischen Wörtern, der Grenze zwischen Zeichen, Eingangsfehler und verschiedener Muster von ausgetauschten Wörtern, um Kandidaten mit einem hohen Gültigkeitsgrad aus teilweise übereinstimmenden Kandidaten enthaltend einen Kandidaten mit einer verschiedenen Wortfolge und einen Kandidaten mit einer Teilunterlassung zu erhalten, die Suchvorrichtung der vorliegenden Erfindung geeignet zur Verwendung als eine Suchvorrichtung für Spracherkennung oder dergleichen.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • JP 3636941 [0005]
    • JP 3665112 [0005]
    • JP 3715672 [0005]

Claims (8)

  1. Suchvorrichtung zum Suchen nach einer Eingangszeichenreihe durch Verwendung von Indices, welche Suchvorrichtung aufweist. eine Namensanalyseeinheit zum Teilen von Namensdaten, die aus einer Zeichenreihe bestehen, in mehrere Datenstücke in zumindest einem Typ von Einheiten, um Grenzinformationen zu erzeugen, die einen Anfang und ein Ende von jedem der mehreren Datenstücke zeigen; eine Anfangs- und Endinformations-Hinzufügungseinheit zum Herausziehen von Teilzeichenreihen, die die Namensdaten bilden, um die Teilzeichenreihen als Eingaben zu definieren, und zum Hinzufügen von Positionsinformationen über eine Position von jeder der Eingaben in den Namensdaten und der Grenzinformationen der Datenstücke, die in jeder der Eingabe enthalten sind, zu jeder Eingabe; und eine Teilzeichenreihen-Indexerzeugungseinheit zum Sortieren von Ausgangsergebnissen der Anfangs- und Endinformations-Hinzufügungseinheit, in der Reihenfolge der Eingaben, um Indices zu erzeugen.
  2. Suchvorrichtung nach Anspruch 1, bei der eine Namenssucheinheit, die Namensdaten in mehrere Datenstücke in Einheiten eines Wortes und mehrere Datenstücke in Einheiten eines Zeichens teilt
  3. Suchvorrichtung nach Anspruch 1, bei der die Suchvorrichtung enthält: eine Teilzeichenreihen-Zersetzungseinheit zum Herausziehen von Teilzeichenreihen, die eine Eingangszeichenreihe bilden; eine Teilzeichenreihen-Indexbezugseinheit zum Erhalten von Positionsinformationen und Grenzinformationen einer Eingabe entsprechend jeder der Teilzeichenreihen für die jeweiligen Namensdaten anhand der Indices, die vorher erzeugt wurden; und eine Kandidatenergebnis-Aktualisierungseinheit zum Beurteilen der Kontinuität in den jeweiligen Namensdaten zwischen Eingaben, die durch die Teilzeichenreihen-Indexbezugseinheit erhalten wurden, auf der Grundlage der Positionsinformationen und zum Hinzufügen eines maximalen Vergleichsergebnisses zu einer der Eingaben, die die Kandidatenergebnis-Aktualisierungseinheit als kontinuierlich bestimmt hat zu der anderen Eingabe, und zum Hinzufügen eines Vergleichsergebnisses gemäß der Gültigkeit der Kontinuität mit jeder von Eingaben, die vor und nach der Eingabe, die die Kandidatenergebnis-Aktualisierungseinheit als diskontinuierlich zu der anderen Eingabe bestimmt hat, angeordnet sind, zu der Eingabe auf der Grundlage der Grenzinformationen.
  4. Suchvorrichtung nach Anspruch 3, bei der, wenn ein Abstand zwischen beliebigen Teilzeichenreihen, die in der Eingangszeichenreihe enthalten sind, und ein Abstand zwischen Eingaben in Namensdaten entsprechend den beliebigen Teilzeichenreihen gleich bzw. kürzer als vorbestimmte Abstände sind, die Kandidatenaktualisierungseinheit bestimmt, dass die beliebigen Teilzeichenreihen kontinuierlich zueinander sind.
  5. Suchvorrichtung nach Anspruch 3, bei der die Kandidatenergebnis-Aktualisierungseinheit das Vergleichsergebnis gemäß einer Positionsbeziehung zwischen den Eingaben in den Namensdaten einstellt.
  6. Suchvorrichtung nach Anspruch 3, bei der die Kandidatenergebnis-Aktualisierungseinheit ein Kandidatenergebnis berechnet durch Summieren eines Vergleichsergebnisses jeder in den Namensdaten enthaltenen Eingabe und die Namensdaten in abnehmender Reihenfolge des Kandidatenergebnisses sortiert und die Namensdaten ausgibt.
  7. Suchprogramm, um zu bewirken, dass ein Computer als eine Suchvorrichtung zum Suchen nach einer Eingangszeichenreihe durch Verwendung von Indices arbeitet, worin das Suchprogramm bewirkt, dass der Computer arbeitet als: eine Namensanalyseeinheit zum Teilen von Namensdaten, die aus einer Zeichenreihe bestehen, in mehrere Datenstücke in zumindest einem Typ von Einheiten, um Grenzinformationen zu erzeugen, die einen Anfang und eine Ende von jedem der mehreren Datenstücke zeigen; eine Anfangs- und Endinformations-Hinzufügungseinheit zum Herausziehen von Teilzeichenreihen, die die Namensdaten bilden, um die Teilzeichenreihen als Eingaben zu definieren, und zum Hinzufügen von Positionsinformationen über eine Position von jeder der Eingaben in den Namensdaten, und der Grenzinformationen der Datenstücke, die in jeder der Eingaben enthalten sind, zu jeder Eingabe; und eine Teilzeichenreihen-Indexerzeugungseinheit zum Sortieren von Ausgangsergebnissen der Anfangs- und Endinformations-Hinzufügungseinheit in der Reihenfolge der Eingabe, um Indices zu erzeugen.
  8. Suchprogramm nach Anspruch 7, bei dem das Suchprogramm bewirkt, dass der Computer arbeitet als: eine Teilzeichenreihen-Zersetzungseinheit zum Herausziehen von Teilzeichenreihen, die eine Eingangszeichenreihe bilden; eine Teilzeichenreihen-Indexbezugseinheit zum Erhalten von Positionsinformationen und Grenzinformationen einer Eingabe entsprechend jeder der Teilzeichenreihen für die jeweiligen Namensdaten anhand der Indices, die vorher erzeugt wurden; und eine Kandidatenergebnis-Aktualisierungseinheit zum Beurteilen der Kontinuität in den jeweiligen Namensdaten zwischen Eingaben, die durch die Teilzeichenreihen-Indexbezugseinheit erhalten wurden, auf einer Grundlage der Positionsinformationen, und zum Hinzufügen eines maximalen Vergleichsergebnisses zu einer der Eingaben, die die Kandidatenergebnis-Aktualisierungseinheit als kontinuierlich zu der anderen Eingabe bestimmt hat, und zum Hinzufügen eines Vergleichsergebnisses gemäß der Gültigkeit der Kontinuität mit Eingaben vor und hinter der Eingabe, die die Kandidatenergebnis-Aktualisierungseinheit als diskontinuierlich zu der anderen Eingabe bestimmt hat, zu der Eingabe auf der Grundlage der Grenzinformationen.
DE112010005297T 2010-02-24 2010-02-24 Suchvorrichtung und Suchprogramm Ceased DE112010005297T5 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2010/001239 WO2011104754A1 (ja) 2010-02-24 2010-02-24 検索装置及び検索プログラム

Publications (1)

Publication Number Publication Date
DE112010005297T5 true DE112010005297T5 (de) 2013-01-31

Family

ID=44506204

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112010005297T Ceased DE112010005297T5 (de) 2010-02-24 2010-02-24 Suchvorrichtung und Suchprogramm

Country Status (5)

Country Link
US (1) US8914385B2 (de)
JP (1) JP5449521B2 (de)
CN (1) CN102770863B (de)
DE (1) DE112010005297T5 (de)
WO (1) WO2011104754A1 (de)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8650031B1 (en) 2011-07-31 2014-02-11 Nuance Communications, Inc. Accuracy improvement of spoken queries transcription using co-occurrence information
US9026855B2 (en) * 2012-07-26 2015-05-05 Nec Laboratories America, Inc. Fault localization in distributed systems using invariant relationships
CN103885662A (zh) * 2012-12-20 2014-06-25 联想(北京)有限公司 辅助语音输入的方法和装置
WO2014136173A1 (ja) * 2013-03-04 2014-09-12 三菱電機株式会社 検索装置
CN104063389B (zh) * 2013-03-20 2017-10-20 阿里巴巴集团控股有限公司 一种生成索引信息的方法和设备
JP6072922B2 (ja) * 2013-08-21 2017-02-01 Necソリューションイノベータ株式会社 文字列検索装置、文字列検索方法および文字列検索プログラム
US9189517B2 (en) * 2013-10-02 2015-11-17 Microsoft Technology Licensing, Llc Integrating search with application analysis
EP2871816B1 (de) 2013-11-11 2016-03-09 51 Degrees Mobile Experts Limited Identifizieren der Eigenschaften einer Kommunikationsvorrichtung
JP5866084B2 (ja) * 2014-01-16 2016-02-17 三菱電機株式会社 検索装置
JP6406932B2 (ja) * 2014-08-29 2018-10-17 日立オムロンターミナルソリューションズ株式会社 帳票認識装置及び方法
US9652627B2 (en) * 2014-10-22 2017-05-16 International Business Machines Corporation Probabilistic surfacing of potentially sensitive identifiers
US10353905B2 (en) * 2015-04-24 2019-07-16 Salesforce.Com, Inc. Identifying entities in semi-structured content
CN106909647B (zh) * 2017-02-21 2020-01-03 福建榕基软件股份有限公司 一种数据检索方法及装置
EP3438848B1 (de) 2017-07-31 2019-05-15 51 Degrees Mobile Experts Limited Identifizierung der eigenschaften einer kommunikationsvorrichtung
US10546062B2 (en) * 2017-11-15 2020-01-28 International Business Machines Corporation Phonetic patterns for fuzzy matching in natural language processing
JP6947307B2 (ja) * 2018-07-25 2021-10-13 日本電信電話株式会社 解析装置、解析方法及び解析プログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03194653A (ja) 1989-12-25 1991-08-26 Tokai Tv Hoso Kk 情報検索システムにおける略語検索法
JP3415214B2 (ja) 1993-09-09 2003-06-09 株式会社東芝 文書検索装置
JP2000339332A (ja) * 1999-05-28 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> 検索インデックスを記録した媒体、検索インデックス更新方法、その装置、そのプログラムを記録した媒体
JP3636941B2 (ja) * 1999-07-19 2005-04-06 松下電器産業株式会社 情報検索方法と情報検索装置
JP4342753B2 (ja) * 2001-08-10 2009-10-14 株式会社リコー 文書検索装置、文書検索方法、プログラム及びコンピュータに読み取り可能な記憶媒体
US7296011B2 (en) * 2003-06-20 2007-11-13 Microsoft Corporation Efficient fuzzy match for evaluating data records
JP4549839B2 (ja) 2004-12-20 2010-09-22 大日本印刷株式会社 検索装置および方法
US20070260595A1 (en) * 2006-05-02 2007-11-08 Microsoft Corporation Fuzzy string matching using tree data structure
JP5224851B2 (ja) * 2008-02-27 2013-07-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 検索エンジン、検索システム、検索方法およびプログラム
US7996369B2 (en) * 2008-11-14 2011-08-09 The Regents Of The University Of California Method and apparatus for improving performance of approximate string queries using variable length high-quality grams

Also Published As

Publication number Publication date
CN102770863A (zh) 2012-11-07
JP5449521B2 (ja) 2014-03-19
JPWO2011104754A1 (ja) 2013-06-17
WO2011104754A1 (ja) 2011-09-01
US8914385B2 (en) 2014-12-16
US20120317098A1 (en) 2012-12-13
CN102770863B (zh) 2014-12-17

Similar Documents

Publication Publication Date Title
DE112010005297T5 (de) Suchvorrichtung und Suchprogramm
DE69907513T2 (de) Handgeschriebene oder gesprochene wort-erkennung mit neuronalen netzwerken
DE69937176T2 (de) Segmentierungsverfahren zur Erweiterung des aktiven Vokabulars von Spracherkennern
DE69730930T2 (de) Verfahren und Gerät zur Zeichenerkennung
DE102020205786B4 (de) Spracherkennung unter verwendung von nlu (natural language understanding)-bezogenem wissen über tiefe vorwärtsgerichtete neuronale netze
DE60225317T2 (de) Zeichenkettenidentifikation
DE3853894T2 (de) Auf Paradigmen basierende morphologische Textanalyse für natürliche Sprachen.
DE69710459T2 (de) Identifizierung von wörtern im japanischem text durch ein rechnersystem
DE69829074T2 (de) Identifizierung der sprache und des zeichensatzes aus text-repräsentierenden daten
DE102008017993B4 (de) Sprachsuchvorrichtung
DE602005001840T2 (de) System und Verfahren zur Verdeutlichung nicht diakritisierter arabischer Wörter in einem Text
DE102011079443A1 (de) Lerngewichtungen von Schriftarten für getippte Proben bei der Handschriftenschlüsselwortauffindung
Van Berkel et al. Triphone Analysis: A Combined Method for the Correction of Orthographical and Typographical Errors.
Sánchez et al. Handwritten text recognition for historical documents in the transcriptorium project
DE112014006343T5 (de) Sprachsuchvorrichtung und Sprachsuchverfahren
DE112007000848T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Durchführung einer optimierten Rechtschreibprüfung während einer Texteingabe durch Vorsehen einer sequentiell angeordneten Reihe von Rechtschreibprüfalgorithmen
DE112007000727T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Durchführung einer Rechtschreibprüfung während einer Texteingabe und zum Integrieren der Ausgabe der Rechtschreibprüfung in die Ausgabe einer Disambiguierung
DE112007000855T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Durchführung einer Rechtschreibprüfung während einer Texteingabe und zum Vorsehen eines Rechtschreibprüfungs-Lern-Merkmals
DE4232507A1 (de) Verfahren zum Kennzeichnen, Wiederauffinden und Sortieren von Dokumenten
Firmani et al. Towards Knowledge Discovery from the Vatican Secret Archives. In Codice Ratio-Episode 1: Machine Transcription of the Manuscripts.
CN1979638A (zh) 一种语音识别结果纠错方法
CN108776653A (zh) 一种基于PageRank和信息熵的裁判文书的文本分词方法
DE112006003650T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Disambiguierung einer Kompositum-Eingabe bei Einsatz unterschiedlicher Gruppierungen von Datenquellen, um unterschiedliche Teile einer Eingabe zu disambiguieren
DE69633595T2 (de) Verfahren und Gerät zur Erweiterung und Wiedergewinnung von ähnlichen Zeichenfolgen.
CN105095196A (zh) 文本中新词发现的方法和装置

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R084 Declaration of willingness to licence
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0017300000

Ipc: G06F0016000000

R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final