JP2010266946A - Device and method for inputting character string - Google Patents

Device and method for inputting character string Download PDF

Info

Publication number
JP2010266946A
JP2010266946A JP2009115797A JP2009115797A JP2010266946A JP 2010266946 A JP2010266946 A JP 2010266946A JP 2009115797 A JP2009115797 A JP 2009115797A JP 2009115797 A JP2009115797 A JP 2009115797A JP 2010266946 A JP2010266946 A JP 2010266946A
Authority
JP
Japan
Prior art keywords
node
spelling
dictionary data
search key
complement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009115797A
Other languages
Japanese (ja)
Other versions
JP4514826B1 (en
Inventor
Tatsuhiko Okada
達彦 岡田
Takenori Watari
健典 亘
Takashi Mizobuchi
敬司 溝渕
Sadaji Takai
貞治 高井
Takamitsu Ishioka
隆光 石岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SYNTAX KK
NTT Data Group Corp
Original Assignee
SYNTAX KK
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SYNTAX KK, NTT Data Corp filed Critical SYNTAX KK
Priority to JP2009115797A priority Critical patent/JP4514826B1/en
Application granted granted Critical
Publication of JP4514826B1 publication Critical patent/JP4514826B1/en
Publication of JP2010266946A publication Critical patent/JP2010266946A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To input expressions configured of a plurality of word strings with high use frequency by a simple operation by using dictionary data which can be efficiently created. <P>SOLUTION: A storage part 400 stores "reading complementary dictionary data" configured on the basis of input reading and "spelling complementary dictionary data" configured on the basis of the spelling after conversion to be associated with each other as dictionary data prepared according to input contents on the basis of task content for which an input terminal 1 is used. Each data are configured like a tree structure with words having dependency relation as nodes. A control part 100 retrieves reading complementary dictionary data and spelling complementary dictionary data by using a retrieval key to be obtained from an input character string, and reads a conversion candidate node string from the spelling complementary dictionary data. When conversion candidates are read, the control part 100 reads the node string to which the same complementary unit number has been imparted as one node string in a batch from the complementary dictionary data. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、文字列入力装置及び文字列入力方法に関し、特に、コールセンタなどにおける入力作業に好適な文字列入力装置及び文字列入力方法に関する。   The present invention relates to a character string input device and a character string input method, and more particularly to a character string input device and a character string input method suitable for input work in a call center or the like.

コンピュータなどの装置に自然言語としての文字列を入力する場合、言語の種類に応じた入力変換をおこなうことで、キーボードなどから入力された文字列を自然言語に変換することが一般的におこなわれている。このような入力変換としては、キーボードなどからの入力をキーとして辞書データを検索し、候補となる単語を抽出して画面に表示し、その中からユーザが選択することによって入力する方法が一般的である。しかしながら、このような方法では、入力中の文字列以前の文字列(確定文字列)については何ら考慮せずに、読みに基づいた変換候補をすべて表示するため、入力文字数が少ない場合などには、変換候補の数が非常に多くなってしまうという不都合があった。そこで、先行して入力された単語との関係(頻度など)を用いて、次に入力されると思われる単語を変換候補として表示する技術がある(例えば、特許文献1参照)。   When inputting a character string as a natural language into a device such as a computer, the character string input from a keyboard or the like is generally converted into a natural language by performing input conversion according to the language type. ing. As such input conversion, a method of searching dictionary data using an input from a keyboard or the like as a key, extracting candidate words, displaying them on a screen, and inputting by selecting from among them is generally used. It is. However, this method displays all conversion candidates based on reading without considering anything before the character string being entered (determined character string). There is a disadvantage that the number of conversion candidates becomes very large. Therefore, there is a technique for displaying a word that is supposed to be input next as a conversion candidate using a relationship (frequency or the like) with a previously input word (for example, see Patent Document 1).

特開2003−233605号公報JP 2003-233605 A

特定の業務においてユーザがコンピュータを利用する場合、同じ文章や、慣用句などの表現を何度も入力することがある。しかし、特許文献1に開示されている手法では、先行して入力された単語との関係(頻度など)を用いて、次に入力されると思われる単語を変換候補として表示していくため、よく使用する文章や慣用句であっても、先頭から順に単語を選択し、確定していく操作が必要となり、これは煩雑な操作であった。例えば、このような不都合は、電話による応対の内容をリアルタイムに入力する必要のあるコールセンタの作業などにおいて問題となることが多く、より効率的に文字列入力を行なうことが望まれている。そこで、よく使用する表現を辞書に登録し、少ない変換回数で入力変換することが考えられるが、この場合、その表現を構成する単語列が長くなるほど変換候補の数も増えてしまい、文字列を入力するユーザにとって、必ずしも入力の効率化には結びつかない。また、よく入力する表現は時間の経過とともに変化していくことも多く、辞書データを更新していくことが必要となるが、辞書を作成する側にとっても、長い単語列からなる表現が含まれる辞書データを、更新が必要となる度に構築することは現実的ではない。   When a user uses a computer in a specific job, the same sentence or an expression such as an idiom may be input many times. However, in the method disclosed in Patent Document 1, a word that is supposed to be input next is displayed as a conversion candidate using a relationship (frequency, etc.) with a previously input word. Even for frequently used sentences and idioms, it is necessary to select and confirm words in order from the top, which is a complicated operation. For example, such inconvenience often becomes a problem in work of a call center where it is necessary to input the contents of reception by telephone in real time, and it is desired to input a character string more efficiently. Therefore, it is conceivable to register frequently used expressions in the dictionary and perform input conversion with a small number of conversions. In this case, the longer the word string constituting the expression, the greater the number of conversion candidates. For an input user, it does not necessarily lead to input efficiency. In addition, expressions that are frequently input often change over time, and it is necessary to update the dictionary data. However, expressions that consist of long word strings are also included for the dictionary creator. It is not realistic to build the dictionary data every time it needs to be updated.

本発明は、このような事情を考慮してなされたものであり、その目的は、効率的に作成可能な辞書データを用いて、複数の単語からなる使用頻度の高い表現を簡易な操作によって入力することができる文字列入力装置及び文字列入力方法を提供することにある。   The present invention has been made in consideration of such circumstances, and its purpose is to input frequently used expressions composed of a plurality of words by a simple operation using dictionary data that can be efficiently created. Another object of the present invention is to provide a character string input device and a character string input method that can be used.

上述した課題を解決するために、本発明は、入力された文字列に応じた変換候補を検索して提示し、提示された変換候補を選択することで文字列入力を行う文字列入力装置であって、入力される文字列を変換処理する前の読みが単語として記録された辞書であって、互いに係り受け関係にある単語を、ノードとして木構造に構成した読み補完辞書データ、及び、前記読み補完辞書データに含まれる各単語が変換処理された後の綴りが単語として記録された辞書であって、変換処理前と変換処理後の単語をノードとして対応付けて前記読み補完辞書データの示す木構造と合致した木構造に構成し、かつ、1つのノード列としてみなす、係り受け関係にあるノードに同一の補完単位番号を付与した綴り補完辞書データを記憶する記憶部と、ユーザの入力に基づき検索キーを生成する検索キー生成部と、前記検索キー生成部により生成された検索キーに基づき前記読み補完辞書データ及び前記綴り補完辞書データを検索して当該検索キーに対応した前記綴り補完辞書データのノードを特定し、特定したノードの綴りと、当該特定したノードと同一の補完単位番号が付与されている当該特定したノードの下流のノードの綴りとを前記綴り補完辞書データから読み出して結合した変換候補を取得する変換候補抽出部と、前記変換候補抽出部が取得した変換候補を出力する変換候補出力部と、を備えることを特徴とする文字列入力装置である。   In order to solve the above-described problem, the present invention provides a character string input device that searches for and presents conversion candidates according to an input character string and inputs a character string by selecting the presented conversion candidate. A dictionary in which readings before conversion processing of input character strings are recorded as words, and reading complementary dictionary data in which words having a dependency relationship with each other are configured in a tree structure as nodes, and A dictionary in which spelling after each word included in the reading completion dictionary data is converted as a word is recorded as a word, and the word before the conversion processing and the word after the conversion processing are associated as nodes and indicated by the reading completion dictionary data A storage unit configured to store a spelling completion dictionary data in which a same complementing unit number is assigned to a node having a dependency relationship, which is configured as a tree structure that matches the tree structure and is regarded as one node row; A search key generation unit that generates a search key based on an input; and the spelling corresponding to the search key by searching the reading completion dictionary data and the spelling completion dictionary data based on the search key generated by the search key generation unit The node of the complementary dictionary data is identified, and the spelling of the identified node and the spelling of the downstream node of the identified node assigned the same complement unit number as the identified node are read from the spelling complement dictionary data A conversion candidate extraction unit that acquires conversion candidates that are combined together, and a conversion candidate output unit that outputs the conversion candidates acquired by the conversion candidate extraction unit.

また、上述した課題を解決するために、本発明は、上述する文字列入力装置であって、前記変換候補抽出部は、前記検索キーが未確定ひらがなからなる場合、前記読み補完辞書データから当該検索キーと完全一致する最上流のノードを検出し、検出した当該ノードに対応した前記綴り補完辞書データのノード及び1つ下流のノードを特定し、当該特定したノード及び1つ下流のノードの綴りと、当該1つ下流のノードと同一の補完単位番号が付与されている当該1つ下流のノードのさらに下流のノード綴りとを結合した変換候補を取得する、ことを特徴とする。   Further, in order to solve the above-described problem, the present invention provides the above-described character string input device, wherein the conversion candidate extraction unit, when the search key includes unconfirmed hiragana, The most upstream node that completely matches the search key is detected, the spelling complement dictionary data node corresponding to the detected node and one downstream node are identified, and the spelling of the identified node and one downstream node is identified. And a conversion candidate obtained by combining the further downstream node spelling of the one downstream node assigned the same complement unit number as the one downstream node.

また、上述した課題を解決するために、本発明は、上述する文字列入力装置であって、前記変換候補抽出部は、前記検索キーが確定文字からなる場合、前記綴り補完辞書データから検索キーと前方一致かつ部分一致する最上流のノードを特定し、当該特定したノードの綴りと、当該特定したノードと同一の補完単位番号が付与されている当該特定したノードの下流のノードの綴りとを結合した変換候補を取得する、ことを特徴とする。   Further, in order to solve the above-described problem, the present invention provides the character string input device described above, wherein the conversion candidate extraction unit uses the search key from the spelling completion dictionary data when the search key is a confirmed character. The most upstream node that is forward-matching and partial-matching, and the spelling of the identified node and the spelling of the downstream node of the identified node assigned the same complement unit number as the identified node. A combined conversion candidate is acquired.

また、上述した課題を解決するために、本発明は、上述する文字列入力装置であって、前記変換候補抽出部は、前記検索キーが確定文字からなる場合、前記綴り補完辞書データから検索キーと完全一致する最上流のノードと、当該特定したノードの1つ下流のノードを特定し、当該特定したノード及び1つ下流のノードの綴りと、当該1つ下流のノードと同一の補完単位番号が付与されている当該1つ下流のノードのさらに下流のノード綴りとを結合した変換候補を取得する、ことを特徴とする。   Further, in order to solve the above-described problem, the present invention provides the character string input device described above, wherein the conversion candidate extraction unit uses the search key from the spelling completion dictionary data when the search key is a confirmed character. The most upstream node that exactly matches the node, one node downstream of the identified node, the spelling of the identified node and one downstream node, and the same complement unit number as the one downstream node A conversion candidate obtained by combining the downstream node spelling of the one downstream node to which is assigned is acquired.

また、上述した課題を解決するために、本発明は、上述する文字列入力装置であって、前記変換候補抽出部は、前記検索キーが確定文字及び未確定ひらがなからなる未確定文字列からなる場合、当該検索キーの確定文字によって、前記綴り補完辞書データの最も上流のノードを検索して一致するノードを特定し、特定したノードに対応する前記読み補完辞書データのノードの下流のノードと前記検索キーの未確定ひらがなとの一致を判断し、前記綴り補完辞書データから前記特定したノードと、当該特定したノードの下流のノードであり、前記検索キーの未確定ひらがなと一致すると判断された前記読み補完辞書データのノードに対応したノードと、当該下流のノードと同一の補完単位番号が付与されているさらに下流のノードとの綴りを読み出し、読み出した綴りを結合した変換候補を取得する、ことを特徴とする。   In order to solve the above-described problem, the present invention provides the above-described character string input device, wherein the conversion candidate extraction unit includes an unconfirmed character string in which the search key includes a confirmed character and an unconfirmed hiragana. In this case, by using the fixed character of the search key, the most upstream node of the spelling completion dictionary data is searched to identify a matching node, and the downstream node of the reading completion dictionary data node corresponding to the identified node and the node It is determined that the search key matches the unconfirmed hiragana, and is determined from the spelling completion dictionary data to be the identified node and the downstream node of the identified node, and is determined to match the unconfirmed hiragana of the search key Read the spelling between the node corresponding to the node of the reading completion dictionary data and the further downstream node assigned the same completion unit number as the downstream node. Out, to obtain a conversion candidate bound the read spelling, characterized in that.

また、上述した課題を解決するために、本発明は、上述する文字列入力装置であって、入力済みの文章のデータから所定の閾値より出現頻度の高い単語列を特定し、当該特定した単語列に対応した綴り補完辞書データのノード列に同一の補完単位番号を付与して生成した新たなノード列を前記綴り補完辞書データに追加するとともに、当該追加したノード列に対応したノード列を前記読み補完辞書データに追加する辞書生成部をさらに備えることを特徴とする。   Further, in order to solve the above-described problem, the present invention provides the above-described character string input device, which specifies a word string having an appearance frequency higher than a predetermined threshold from input sentence data, and the specified word A new node sequence generated by assigning the same complement unit number to the node sequence of the spelling complement dictionary data corresponding to the column is added to the spelling complement dictionary data, and the node sequence corresponding to the added node sequence is A dictionary generation unit for adding to the reading completion dictionary data is further provided.

また、上述した課題を解決するために、本発明は、上述する文字列入力装置であって、前記綴り補完辞書データの各最上流のノードについて、当該最上流のノードを先頭とするノード列の数を取得し、取得したノード列の数が所定以下である場合に、当該最上流のノードを先頭とするノード列に同一の補完単位番号を付与して生成した新たなノード列を前記綴り補完辞書データに追加するとともに、当該追加したノード列に対応したノード列を前記読み補完辞書データに追加する辞書生成部をさらに備えることを特徴とする。   Further, in order to solve the above-described problem, the present invention provides the above-described character string input device, wherein each of the most upstream nodes of the spelling complement dictionary data has a node sequence starting from the most upstream node. If the number of acquired node strings is less than or equal to the predetermined number, the new node string generated by assigning the same complement unit number to the node string starting from the most upstream node is used as the spelling complement. In addition to adding to the dictionary data, a dictionary generation unit is further provided for adding a node sequence corresponding to the added node sequence to the reading completion dictionary data.

また、上述した課題を解決するために、本発明は、入力された文字列に応じた変換候補を検索して提示し、提示された変換候補を選択することで文字列入力を行う文字列入力装置に用いられる文字列入力方法であって、前記入力装置は、入力される文字列を変換処理する前の読みが単語として記録された辞書であって、互いに係り受け関係にある単語を、ノードとして木構造に構成した読み補完辞書データ、及び、前記読み補完辞書データに含まれる各単語が変換処理された後の綴りが単語として記録された辞書であって、変換処理前と変換処理後の単語をノードとして対応付けて前記読み補完辞書データの示す木構造と合致した木構造に構成し、かつ、1つのノード列としてみなす、係り受け関係にあるノードに同一の補完単位番号を付与した綴り補完辞書データを記憶する記憶部を備え、前記文字列入力装置の検索キー生成部が、ユーザの入力に基づき検索キーを生成する検索キー生成過程と、前記文字列入力装置の変換候補抽出部が、前記検索キー生成過程において生成された検索キーに基づき前記読み補完辞書データ及び前記綴り補完辞書データを検索して当該検索キーに対応した前記綴り補完辞書データのノードを特定し、特定したノードの綴りと、当該特定したノードと同一の補完単位番号が付与されている当該特定したノードの下流のノードの綴りとを前記綴り補完辞書データから読み出して結合した変換候補を取得する変換候補抽出過程と、前記文字列入力装置の変換候補出力部が、前記変換候補抽出過程において取得した変換候補を出力する変換候補出力過程と、を有することを特徴とする文字列入力方法である。   In order to solve the above-described problem, the present invention searches and presents conversion candidates according to the input character string, and performs character string input by selecting the presented conversion candidate. A character string input method used in a device, wherein the input device is a dictionary in which readings before conversion processing of input character strings are recorded as words, and words that are in a dependency relationship with each other are represented as nodes. Reading dictionary data configured in a tree structure, and a dictionary in which spelling after each word included in the reading completion dictionary data is converted as a word is recorded before and after the conversion process. Associating words as nodes to form a tree structure that matches the tree structure indicated by the reading completion dictionary data, and assigning the same complementary unit number to the nodes in the dependency relationship that are regarded as one node string A search key generation process in which a search key generation unit of the character string input device generates a search key based on a user input, and conversion candidate extraction of the character string input device. The part searches the reading completion dictionary data and the spelling completion dictionary data based on the search key generated in the search key generation process, and identifies and specifies the node of the spelling completion dictionary data corresponding to the search key Conversion candidate extraction for acquiring a conversion candidate obtained by reading from the spelling complement dictionary data the spelling of a node and the spelling of a node downstream of the specified node assigned the same complement unit number as the specified node A conversion candidate output process in which the conversion candidate output unit of the character string input device outputs the conversion candidate acquired in the conversion candidate extraction process; Is a character string input method characterized by having a.

この発明によれば、ユーザが先頭の文字を入力するだけで、複数の単語列からなる表現を変換候補として表示出力することができるため、効率的に文字列入力を行うことが可能となる。また、入力頻度が高い表現や、限られた表現でしか使用されない単語を含んだ表現を抽出して、一つのノード列として扱うように辞書に登録することができるため、辞書の更新を迅速に行なうことが可能となり、辞書の構築にかかっていた時間や人的リソースを削減することができる。   According to the present invention, since a user can input and display an expression composed of a plurality of word strings as conversion candidates only by inputting the first character, it is possible to efficiently input a character string. In addition, it is possible to extract expressions that include frequently used expressions or words that are used only in limited expressions, and register them in the dictionary so that they can be handled as a single node sequence. This makes it possible to reduce the time and human resources required to build the dictionary.

本実施形態による入力端末1の構成を示すブロック図である。It is a block diagram which shows the structure of the input terminal 1 by this embodiment. 本実施形態による辞書データの構成例を示すブロック図である。It is a block diagram which shows the structural example of the dictionary data by this embodiment. 本実施形態による入力画面の一例を示す模式図である。It is a schematic diagram which shows an example of the input screen by this embodiment. 本実施形態による読み補完辞書データの構成例を示す概念図である。It is a conceptual diagram which shows the structural example of the reading complement dictionary data by this embodiment. 本実施形態による綴り補完辞書データの構成例を示す概念図である。It is a conceptual diagram which shows the structural example of the spelling complement dictionary data by this embodiment. 本実施形態による制御部100によって実現される機能を示す機能ブロック図である。It is a functional block diagram which shows the function implement | achieved by the control part 100 by this embodiment. 本実施形態による、文字列入力処理の動作を説明するためのフローチャートである。It is a flowchart for demonstrating the operation | movement of a character string input process by this embodiment. 本実施形態による、検索キー生成処理の動作を説明するためのフローチャートである。It is a flowchart for demonstrating operation | movement of the search key production | generation process by this embodiment. 検索キー生成処理での各種例を示す概念図である。It is a conceptual diagram which shows the various examples in a search key production | generation process. 本実施形態による、候補抽出処理の動作を説明するためのフローチャートである。It is a flowchart for demonstrating operation | movement of the candidate extraction process by this embodiment. 本実施形態による、先頭未確定処理の動作を説明するためのフローチャートである。It is a flowchart for demonstrating operation | movement of the head unconfirmed process by this embodiment. 先頭未確定処理での各種例を示す概念図である。It is a conceptual diagram which shows the various examples in a head unconfirmed process. 先頭未確定処理での各種例を示す概念図である。It is a conceptual diagram which shows the various examples in a head unconfirmed process. 先頭未確定処理での各種例を示す概念図である。It is a conceptual diagram which shows the various examples in a head unconfirmed process. 先頭未確定処理での各種例を示す概念図である。It is a conceptual diagram which shows the various examples in a head unconfirmed process. 実施形態による、先頭確定処理の動作を説明するためのフローチャートである。It is a flowchart for demonstrating operation | movement of the head determination process by embodiment. 先頭確定処理での各種例を示す概念図である。It is a conceptual diagram which shows the various examples in a head determination process. 本実施形態による、余剰一致処理の動作を説明するためのフローチャートである。It is a flowchart for demonstrating the operation | movement of the surplus matching process by this embodiment. 本実施形態による、余剰一致処理の動作を説明するためのフローチャートである。It is a flowchart for demonstrating the operation | movement of the surplus matching process by this embodiment. 余剰一致処理での各種例を示す概念図である。It is a conceptual diagram which shows the various examples in a surplus matching process. 余剰一致処理での各種例を示す概念図である。It is a conceptual diagram which shows the various examples in a surplus matching process. 余剰一致処理での各種例を示す概念図である。It is a conceptual diagram which shows the various examples in a surplus matching process. 余剰一致処理での各種例を示す概念図である。It is a conceptual diagram which shows the various examples in a surplus matching process. 余剰一致処理での各種例を示す概念図である。It is a conceptual diagram which shows the various examples in a surplus matching process. 余剰一致処理での各種例を示す概念図である。It is a conceptual diagram which shows the various examples in a surplus matching process. 本実施形態による、出力処理の動作を説明するためのフローチャートである。It is a flowchart for demonstrating the operation | movement of an output process by this embodiment. 出力処理での各種例を示す概念図である。It is a conceptual diagram which shows the various examples in an output process. 本実施形態による、出力例を説明するための模式図である。It is a schematic diagram for demonstrating the example of an output by this embodiment. 本実施形態による、補完単位番号付与処理の動作を説明するためのフローチャートである。It is a flowchart for demonstrating operation | movement of the supplement unit number assignment | providing process by this embodiment. 図29の補完単位番号付与処理での例を示す概念図である。It is a conceptual diagram which shows the example in the complement unit number provision process of FIG. 図29の補完単位番号付与処理での辞書更新例を示す概念図である。It is a conceptual diagram which shows the example of a dictionary update in the supplement unit number provision process of FIG. 本実施形態による、補完単位番号付与処理の動作を説明するためのフローチャートである。It is a flowchart for demonstrating operation | movement of the supplement unit number assignment | providing process by this embodiment. 図32の補完単位番号付与処理での辞書更新例を示す概念図である。It is a conceptual diagram which shows the example of a dictionary update in the complementary unit number provision process of FIG. 本発明をサーバ−クライアントシステムに適用した場合の構成例を示すブロック図である。It is a block diagram which shows the structural example at the time of applying this invention to a server client system.

以下、本発明の一実施形態を、図面を参照して説明する。本実施形態では、本発明を、例えば、コールセンタなどでの入力業務に用いる入力端末に適用した場合を例に説明する。   Hereinafter, an embodiment of the present invention will be described with reference to the drawings. In the present embodiment, a case where the present invention is applied to an input terminal used for input work in a call center or the like will be described as an example.

本実施形態にかかる入力端末1は、例えば、ワークステーションやパーソナルコンピュータなどの情報処理装置から構成されるものとする。以下、本実施形態にかかる入力端末1を、図1を参照して説明する。
図1は、本実施形態による入力端末1の構成を示す概略ブロック図である。図示するように、入力端末1は、制御部100、入力制御装置200、出力制御装置300、記憶部400などから構成される。
The input terminal 1 according to the present embodiment is configured from an information processing apparatus such as a workstation or a personal computer, for example. Hereinafter, the input terminal 1 according to the present embodiment will be described with reference to FIG.
FIG. 1 is a schematic block diagram showing the configuration of the input terminal 1 according to the present embodiment. As illustrated, the input terminal 1 includes a control unit 100, an input control device 200, an output control device 300, a storage unit 400, and the like.

制御部100は、例えば、CPU(Central Processing Unit:中央演算処理装置)や、ワークエリアとなるメモリなどから構成され、記憶部400に格納されているプログラムを読み出して実行することで、入力端末1の各部を制御するとともに、後述する各処理を実行する。   The control unit 100 includes, for example, a CPU (Central Processing Unit), a memory serving as a work area, and the like. The control unit 100 reads out and executes a program stored in the storage unit 400, whereby the input terminal 1 Are controlled, and each process to be described later is executed.

入力制御装置200は、例えば、キーボード211や、ポインティングデバイス212などの入力装置210と入力端末1とを接続し、入力装置210の操作に応じた入力信号を制御部100に入力する。本実施形態では、キーボード211を用いて文字列の入力がなされ、ポインティングデバイス212を用いて入力エリアの選択などが行われるものとする。   The input control device 200 connects, for example, an input device 210 such as a keyboard 211 or a pointing device 212 and the input terminal 1, and inputs an input signal corresponding to an operation of the input device 210 to the control unit 100. In the present embodiment, it is assumed that a character string is input using the keyboard 211 and an input area is selected using the pointing device 212.

出力制御装置300は、例えば、ディスプレイ装置311などの出力装置310と入力端末1とを接続し、制御部100の処理結果などを出力装置310に出力する。本実施形態では、予め用意されている入力画面がディスプレイ装置311に出力されることにより表示され、入力装置210を用いた入力操作が、当該表示された入力画面上で行われるものとする。   The output control device 300 connects, for example, the output device 310 such as the display device 311 and the input terminal 1, and outputs the processing result of the control unit 100 to the output device 310. In the present embodiment, an input screen prepared in advance is displayed by being output to the display device 311, and an input operation using the input device 210 is performed on the displayed input screen.

記憶部400は、例えば、ハードディスク装置などの記憶装置から構成され、主に、本実施形態にかかる文字列入力処理に必要な情報を格納する。本実施形態では、記憶部400に、辞書格納領域410、プログラム格納領域440、検索された変換候補を記憶する結果テーブル450、変換候補の中からユーザが入力装置210を用いて選択した文字列によって構成される入力文章を記憶する入力文章格納領域460などの記憶領域が確保されるものとする。   The storage unit 400 includes a storage device such as a hard disk device, for example, and mainly stores information necessary for character string input processing according to the present embodiment. In the present embodiment, the storage unit 400 stores a dictionary storage area 410, a program storage area 440, a result table 450 that stores the searched conversion candidates, and a character string selected by the user using the input device 210 from the conversion candidates. It is assumed that a storage area such as an input sentence storage area 460 for storing the input sentence to be configured is secured.

辞書格納領域410には、入力端末1を用いた文字列入力の際に用いられる辞書データが格納される。本実施形態では、入力端末1を用いた文字列入力において、自然言語としての日本語入力が行われるものとする。この場合、入力端末1は、いわゆるFEP(Front End Processor)の動作により、キーボード211からの入力に応じた入力変換を行う。よって、辞書格納領域410には、このような、日本語入力変換の際に参照される辞書データが格納される。この場合、入力端末1は、辞書格納領域410に格納されている辞書データを参照することで、変換候補(入力候補)の文字列を選択可能に表示出力する。   The dictionary storage area 410 stores dictionary data used when inputting a character string using the input terminal 1. In the present embodiment, it is assumed that Japanese character input as a natural language is performed in character string input using the input terminal 1. In this case, the input terminal 1 performs input conversion according to the input from the keyboard 211 by a so-called FEP (Front End Processor) operation. Therefore, the dictionary storage area 410 stores such dictionary data that is referred to during Japanese input conversion. In this case, the input terminal 1 refers to the dictionary data stored in the dictionary storage area 410 to display and output a conversion candidate (input candidate) character string in a selectable manner.

本実施形態にかかる辞書データの例を、図2を参照して説明する。図2は、辞書格納領域410に格納される辞書データの構成を説明する図である。この図に示すように、辞書格納領域410には、基本辞書領域420と入力内容別辞書領域430とが確保される。基本辞書領域420は、入力端末1での日本語入力の際に参照される辞書データのうち、一般的な辞書データ(以下、「基本辞書データ」とする)を格納する領域である。この基本辞書データには、種々の単語と、その品詞や、読みなどを示す情報とが対応付けられている。すなわち、通常の入力用FEPなどで用いられる一般的な辞書データが、基本辞書データとして基本辞書領域420に格納されている。   An example of dictionary data according to the present embodiment will be described with reference to FIG. FIG. 2 is a diagram for explaining the configuration of dictionary data stored in the dictionary storage area 410. As shown in this figure, a basic dictionary area 420 and an input content-specific dictionary area 430 are secured in the dictionary storage area 410. The basic dictionary area 420 is an area for storing general dictionary data (hereinafter referred to as “basic dictionary data”) among the dictionary data referred to when inputting Japanese on the input terminal 1. In this basic dictionary data, various words are associated with information indicating parts of speech and readings. That is, general dictionary data used in a normal input FEP or the like is stored in the basic dictionary area 420 as basic dictionary data.

入力内容別辞書領域430は、入力端末1が用いられる業務内容などに基づいて、入力内容に応じて用意された辞書データを格納する領域である。例えば、入力端末1をコールセンタ業務に用いる場合、入力項目が予め規定されているので、特定の入力項目での入力に用いられる単語群から構成される辞書データが入力内容別辞書領域430に格納される。すなわち、入力内容別辞書領域430には、入力内容毎に用意された専用辞書データが格納される。   The input content-specific dictionary area 430 is an area for storing dictionary data prepared according to the input content based on the business content used by the input terminal 1. For example, when the input terminal 1 is used for call center operations, the input items are defined in advance, so that dictionary data composed of word groups used for input with specific input items is stored in the input content-specific dictionary region 430. The That is, dedicated dictionary data prepared for each input content is stored in the dictionary region 430 for each input content.

一例として、図2に示すような、応対入力辞書データ(A1)431や、住所入力辞書データ(A2)432などが入力内容別辞書領域430に格納される。このような入力内容別辞書データは、入力画面の入力エリアと対応付けられている。ここで、図3は、入力画面の一例を表す図である。例えば、この図に示すような入力画面ISの場合、応対入力辞書データ431は、電話応対での応対内容を入力するための入力エリアA1と対応付けられる。住所入力辞書データ432は、住所情報を入力するための入力エリアA2と対応付けられる。すなわち、図3に示したような入力画面ISにおいては、辞書データが対応付けされた入力エリアについては、その入力エリアに入力される内容が規定される。   As an example, reception input dictionary data (A1) 431, address input dictionary data (A2) 432, and the like as shown in FIG. Such input content-specific dictionary data is associated with the input area of the input screen. Here, FIG. 3 is a diagram illustrating an example of the input screen. For example, in the case of the input screen IS as shown in this figure, the reception input dictionary data 431 is associated with the input area A1 for inputting the content of the telephone reception. The address input dictionary data 432 is associated with an input area A2 for inputting address information. That is, on the input screen IS as shown in FIG. 3, the contents input to the input area are defined for the input area associated with the dictionary data.

このような入力内容別に用意された辞書データのそれぞれには、入力される読みに基づいて構成された「読み補完辞書データ」と、変換後の綴りに基づいて構成された「綴り補完辞書データ」と、が一対となって含まれている。すなわち、図2に示すように、応対入力辞書データ(A1)431には、読み補完辞書データ431Aと綴り補完辞書データ431Bとが対応付けられて含まれている。住所入力辞書データ432(A2)には、読み補完辞書データ432Aと綴り補完辞書データ432Bとが対応付けられて含まれている。   Each of the dictionary data prepared for each input content includes “reading dictionary data” configured based on the input reading and “spelling dictionary data” configured based on the spelling after conversion. Are included as a pair. That is, as shown in FIG. 2, the reception input dictionary data (A1) 431 includes the reading complement dictionary data 431A and the spelling complement dictionary data 431B in association with each other. The address input dictionary data 432 (A2) includes reading complement dictionary data 432A and spelling complement dictionary data 432B in association with each other.

入力内容別に用意された辞書データのそれぞれは、このような一対の異なる辞書データによって構成されており、応対入力辞書データ(A1)431と住所入力辞書データ(A2)432とのそれぞれが1組の辞書データである。よって、仮に、応対入力辞書データ(A1)431と住所入力辞書データ(A2)432のみが入力内容別辞書領域430に格納されているのであれば、入力内容別辞書領域430には、2組の辞書データが格納されていることになる。   Each of the dictionary data prepared for each input content is composed of such a pair of different dictionary data, and each of the response input dictionary data (A1) 431 and the address input dictionary data (A2) 432 is a set. Dictionary data. Therefore, if only the response input dictionary data (A1) 431 and the address input dictionary data (A2) 432 are stored in the input content-specific dictionary region 430, the input content-specific dictionary region 430 includes two sets. Dictionary data is stored.

このような入力内容別辞書データの構成を、図4および図5を参照して説明する。ここでは、入力内容別辞書データの一例として、応対入力辞書データ431の構成について説明する。図4は、読み補完辞書データ431Aの構成例を示す概念図であり、図5は、綴り補完辞書データ431Bの構成例を示す概念図である。なお、本実施形態では、携帯電話のユーザサポート業務を行うコールセンタにおいて、ユーザに対する電話応答時に頻出する語彙を基に、応対入力辞書データ431が構成されている場合について説明する。   The configuration of such input content-specific dictionary data will be described with reference to FIGS. 4 and 5. FIG. Here, the configuration of the response input dictionary data 431 will be described as an example of input content dictionary data. FIG. 4 is a conceptual diagram illustrating a configuration example of the reading complement dictionary data 431A, and FIG. 5 is a conceptual diagram illustrating a configuration example of the spelling complement dictionary data 431B. In the present embodiment, a case will be described in which the response input dictionary data 431 is configured based on a vocabulary that frequently appears at the time of a telephone response to a user in a call center that performs a user support service for a mobile phone.

図4を参照して、読み補完辞書データ431Aの構成例を説明する。
図示するように、読み補完辞書データ431Aは、辞書の要素である単語の「読み」を結節点(ノード)とした、樹状の階層構造(木構造)のバイナリデータによって構成されている。そして、この階層構造は、rootを頂点とし、係り受けの関係の係り側の文節を構成するノードから、受け側の文節を構成するノードへと順に連結した構成(ノード列)となっている。ここでは、ノード列のうち、rootに近いほうを上流のノード、rootから遠いほうを下流のノードと呼ぶ。よって、rootの1つ下流が最上流のノードとなる。この構成により、文法的に互いに係り受け関係にある単語が、相関的な位置で連結されている状態を示すデータによって辞書が構築される。なお、1つの文節を構成するノードの数は1または複数でありうる。ここで、読み補完辞書データ431Aは、入力される単語の「読み」に基づく辞書であるので、各ノードには、読みを表すひらがなによって見出し語が示されている。図4において、読み補完辞書データ431Aの各ノードの読みは<>内に示している。
With reference to FIG. 4, a configuration example of the reading completion dictionary data 431A will be described.
As shown in the figure, the reading complement dictionary data 431A is composed of binary data having a tree-like hierarchical structure (tree structure) with “reading” of a word as a dictionary element as a node (node). This hierarchical structure is a configuration (node string) in which root is the apex, and nodes in the dependency-side clause of the dependency relationship are sequentially connected to nodes in the receiver-side clause. Here, in the node sequence, a node closer to the root is called an upstream node, and a node far from the root is called a downstream node. Therefore, one downstream of the root is the most upstream node. With this configuration, a dictionary is constructed from data indicating a state in which words that are grammatically dependent on each other are linked at relative positions. Note that the number of nodes constituting one clause may be one or more. Here, since the reading complement dictionary data 431A is a dictionary based on “reading” of the input word, each node is indicated with a headword by hiragana representing reading. In FIG. 4, the reading of each node of the reading complement dictionary data 431A is shown in <>.

このような読み補完辞書データ431Aと対をなす綴り補完辞書データ431Bの構成例を図5に示す。図示するように綴り補完辞書データ431Bは、読み補完辞書データ431Aと同一の階層構造(木構造)によって構成されており、読み補完辞書データ431Aの各ノードに示された読みに対応する「綴り」が、その読み補完辞書データ431Aのノードに対応する綴り補完辞書データ431Bのノードの位置に、綴り補完辞書データ431Bの各ノードの見出し語として構成される。図5において、綴り補完辞書データ431Bの各ノードの綴りは<>内に示している。   FIG. 5 shows a configuration example of the spelling complement dictionary data 431B paired with such reading complement dictionary data 431A. As shown in the figure, the spelling complement dictionary data 431B is configured by the same hierarchical structure (tree structure) as the reading complement dictionary data 431A, and “spelling” corresponding to the readings indicated in each node of the reading complement dictionary data 431A. Is configured as a headword of each node of the spelling complement dictionary data 431B at the position of the node of the spelling complement dictionary data 431B corresponding to the node of the reading complement dictionary data 431A. In FIG. 5, the spelling of each node in the spelling complement dictionary data 431B is shown in <>.

つまり、綴り補完辞書データ431Bは、読み補完辞書データ431Aに含まれている各ノードを、当該ノードの綴りに基づいて構成した辞書データである。例えば、読み補完辞書データ431Aにおいて、読みが「けいたい」であるノードにリンクする綴り補完辞書データ431Bでのノードでは、「けいたい」の変換後表記、つまり、綴りである「携帯」が対応する。   That is, the spelling complement dictionary data 431B is dictionary data in which each node included in the reading complement dictionary data 431A is configured based on the spelling of the node. For example, in the reading completion dictionary data 431A, the node in the spelling completion dictionary data 431B linked to the node whose reading is “Keitai” corresponds to the post-conversion notation of “Keitai”, that is, the spelling “mobile”. To do.

ここで、読み補完辞書データ431Aおよび綴り補完辞書データ431Bの各ノードに付されている[]内の記号は、読み補完辞書データ431Aと綴り補完辞書データ431Bとのノード間のリンクを表すリンクポインタである。つまり、読み補完辞書データ431Aと綴り補完辞書データ431Bとの間において、[]に同じ記号のリンクポインタが設定されているノード同士は、相互に参照可能であることを示している。ここでは、読み補完辞書データ431Aのリンクポインタには区別のためリンクポインタの記号に「’」を付加している。つまり、綴り補完辞書データ431Bのノードに付与されたリンクポインタが[xn]であれば、読み補完辞書データ431Aの対応するノードのリンクポインタは[xn’]となる。これにより、一対の読み補完辞書データ431Aと綴り補完辞書データ431Bとは、ノード単位でリンクされていることを表している。   Here, the symbol in [] attached to each node of the reading complement dictionary data 431A and the spelling complement dictionary data 431B is a link pointer representing a link between the nodes of the reading complement dictionary data 431A and the spelling complement dictionary data 431B. It is. That is, between the reading complement dictionary data 431A and the spelling complement dictionary data 431B, nodes having a link pointer of the same symbol in [] can be referred to each other. Here, “′” is added to the symbol of the link pointer to distinguish the link pointer of the reading completion dictionary data 431A. That is, if the link pointer given to the node of the spelling complement dictionary data 431B is [xn], the link pointer of the corresponding node of the reading complement dictionary data 431A is [xn ′]. As a result, the pair of reading completion dictionary data 431A and the spelling completion dictionary data 431B are linked in units of nodes.

以下、リンクポインタxn’、読みが「**」であるノードをノードxn’「**」または単にノードxn’と記載し、リンクポインタxn、綴りが「**」であるノードをノードxn「**」または単にノードxnと記載する。例えば、読み補完辞書データ431Aにおけるリンクポインタa1’のノードはノードa1’「けいたい」またはノードa1’と記載し、綴り補完辞書データ431Bにおけるリンクポインタa1のノードはノードa1「携帯」またはノードa1と記載する。   Hereinafter, the link pointer xn ′ and the node whose reading is “**” will be described as the node xn ′ “**” or simply the node xn ′, and the node whose link pointer xn and the spelling is “**” will be referred to as the node xn “ ** "or simply node xn. For example, the node of the link pointer a1 ′ in the reading completion dictionary data 431A is described as the node a1 ′ “Keitai” or the node a1 ′, and the node of the link pointer a1 in the spelling completion dictionary data 431B is the node a1 “mobile” or the node a1. It describes.

また、読み補完辞書データ431Aおよび綴り補完辞書データ431Bの各ノードに付されている()内の数値は補完単位番号であり、リンクポインタによって対応する読み補完辞書データ431Aのノードと、綴り補完辞書データ431Bのノードには、同じ補完単位番号が記述されている。同じ数値の補完単位番号が付与されている相互に連続する隣接したノードは、1つのノード列としてみなす。以下、あるノードxn(またはノードxn’)から、当該ノードxn(xn’)と同じ補完単位番号が付与され、かつ、当該ノードxn(xn’)より下流の連続したノードからなるノード列を、ノードxn(xn’)の同一補完単位ノード列と記載する。なお、少なくとも同じ文節を構成するノードには同じ補完単位番号が付与される。また、同一補完単位ノード列は、1つのノードからなる場合もある。   The numerical values in parentheses attached to the nodes of the reading complement dictionary data 431A and the spelling complement dictionary data 431B are the complement unit numbers, and the corresponding node of the reading complement dictionary data 431A by the link pointer and the spelling complement dictionary The same complement unit number is described in the node of the data 431B. Adjacent nodes adjacent to each other with the same numerical complement unit number are regarded as one node string. Hereinafter, from a certain node xn (or node xn ′), the same complement unit number as that of the node xn (xn ′) is given, and a node sequence consisting of continuous nodes downstream from the node xn (xn ′) It is described as the same complement unit node string of the node xn (xn ′). The same complement unit number is assigned to at least the nodes constituting the same phrase. The same complement unit node string may be composed of one node.

例えば、綴り補完辞書データ431Bにおけるノードa1「携帯」は補完単位番号が1、ノードa2「の」は補完単位番号が2であるため、異なる同一補完単位ノード列に含まれるノードとしてみなされる。一方、ノードi1「携帯」、ノードi2「の」、ノードi3「画面」は補完単位番号が1であるため、ノードi1、i2、i3は同一補完単位ノード列であり、1つのノード列としてみなされる。   For example, since the node a1 “mobile” in the spelling complement dictionary data 431B has a complementing unit number of 1 and the node a2 “no” has a complementing unit number of 2, it is regarded as a node included in a different same complementing unit node sequence. On the other hand, the node i1 “mobile”, the node i2 “no”, and the node i3 “screen” have the complementary unit number 1, so the nodes i1, i2, and i3 are the same complementary unit node sequence and are regarded as one node sequence. It is.

また、読み補完辞書データ431Aおよび綴り補完辞書データ431Bの各ノードに付されている≪≫内の数値は、実際に入力エリアに入力された文章における出現回数を示す。例えば、「新しい」の出現回数が50回である場合、綴り補完辞書データ431Bのノードf1、j1「新しい」に出現回数50が設定され、「新しい/携帯/を/買った」(「/」はノードが結合されている位置を示す)の出現回数が5である場合、ノードf4「買った」に出現回数5が設定される。なお、出現回数の代わりに、単語が出現する割合や標準偏差など、出現頻度を示す任意の情報を用いることができる。   The numerical value in << >> attached to each node of the reading complement dictionary data 431A and the spelling complement dictionary data 431B indicates the number of appearances in the sentence actually input to the input area. For example, when the number of appearances of “new” is 50, the number of appearances 50 is set in the nodes f1 and j1 “new” of the spelling completion dictionary data 431B, and “new / mobile / buy / buy” (“/” Indicates the position where the nodes are combined), the number of appearances 5 is set in the node f4 “Bought”. Instead of the number of appearances, arbitrary information indicating the appearance frequency, such as the rate of appearance of words and the standard deviation, can be used.

なお、上記において辞書データは、3階層以下の文節を構成するノードによる階層構造としているが、2階層の文節を構成するノードによる階層構造としてもよく、4階層以上を最大の文節としたノードによる階層構造としてもよい。   In the above, the dictionary data has a hierarchical structure with nodes that constitute clauses of three or less levels, but may have a hierarchical structure with nodes that constitute clauses of two layers, or a node that has four or more layers as the maximum clause. A hierarchical structure may be used.

上述した図1に示すプログラム格納領域440には、制御部100が実行するプログラムが格納される。そして、制御部100が、プログラム格納領域440に格納されているプログラムを実行することで、本実施形態にかかる文字列入力処理を実行する際の機能が実現される。制御部100によって実現される機能を図6に示す。   The program executed by the control unit 100 is stored in the program storage area 440 shown in FIG. And the function at the time of performing the character string input process concerning this embodiment is implement | achieved because the control part 100 runs the program stored in the program storage area 440. FIG. Functions realized by the control unit 100 are shown in FIG.

図6は、制御部100によって実現される機能を示す機能ブロック図である。図示するように、制御部100は、辞書選択部110、検索キー生成部120、変換候補抽出部130、変換候補出力部140、文字列入力部150、辞書生成部160等の機能を含む。   FIG. 6 is a functional block diagram illustrating functions realized by the control unit 100. As illustrated, the control unit 100 includes functions of a dictionary selection unit 110, a search key generation unit 120, a conversion candidate extraction unit 130, a conversion candidate output unit 140, a character string input unit 150, a dictionary generation unit 160, and the like.

辞書選択部110は、入力画面IS上の入力エリアのいずれに入力が行われているかを判別し、判別された結果に基づいて、その入力エリアに応じた辞書を辞書格納領域410から選択する。   The dictionary selection unit 110 determines which of the input areas on the input screen IS is input, and selects a dictionary corresponding to the input area from the dictionary storage area 410 based on the determined result.

検索キー生成部120は、入力が行われている入力エリアから文字列を取得し、検索キーを生成して変換候補抽出部130へ引き渡す。   The search key generation unit 120 acquires a character string from the input area where the input is performed, generates a search key, and delivers it to the conversion candidate extraction unit 130.

変換候補抽出部130は、検索キー生成部120が生成した検索キーと辞書選択部110によって指定された辞書に基づいて、変換候補語を抽出し、記憶部400の結果テーブル450に記憶する。   The conversion candidate extraction unit 130 extracts conversion candidate words based on the search key generated by the search key generation unit 120 and the dictionary specified by the dictionary selection unit 110 and stores the conversion candidate words in the result table 450 of the storage unit 400.

変換候補出力部140は、変換候補抽出部130で抽出された候補語から、後述するように、冗長な部分を削除する。そして、出力制御装置300との協働により、整形後の文字列を選択可能にディスプレイ装置311に表示出力する。   The conversion candidate output unit 140 deletes redundant portions from the candidate words extracted by the conversion candidate extraction unit 130, as will be described later. Then, in cooperation with the output control device 300, the formatted character string is displayed on the display device 311 so that it can be selected.

文字列入力部150は、入力制御装置200などとの協働により、変換候補出力部140が選択可能にディスプレイ装置311に表示出力した整形後の文字列のうち、入力装置210によって選択された文字列を、未確定文字列に対応した変換後の文字列、あるいは、確定文字列に続く文字列として入力する。この場合、出力制御装置300との協働により、選択された文字列を、現在入力作業をおこなっている入力エリアに表示させるとともに、選択された文字列で構成される文章を入力文章格納領域460に書き込む。つまり、記憶部400には、各入力エリアに実際に入力された文章が書き込まれることになる。   The character string input unit 150 is a character selected by the input device 210 among the formatted character strings displayed and output on the display device 311 so as to be selectable by the conversion candidate output unit 140 in cooperation with the input control device 200 or the like. The string is input as a converted character string corresponding to the unconfirmed character string or a character string following the confirmed character string. In this case, in cooperation with the output control device 300, the selected character string is displayed in the input area where the input operation is currently being performed, and a sentence composed of the selected character string is displayed in the input sentence storage area 460. Write to. That is, the text actually input in each input area is written in the storage unit 400.

辞書生成部160は、入力文章格納領域460に書き込まれた各入力エリアの文章から出現頻度が所定より高い単語列を、また、辞書データにおいて係り受けの分岐が少ない単語列を検出し、当該入力エリアに対応する読み補完辞書データ及び綴り補完辞書データにおいて、検出した単語列を示すノード列を特定し、特定したノード列に同一の補完番号を付与して生成した新たなノード列を追加する。   The dictionary generation unit 160 detects a word string having an appearance frequency higher than a predetermined value from a sentence in each input area written in the input sentence storage area 460 and a word string with few dependency branches in the dictionary data. In the reading completion dictionary data and spelling completion dictionary data corresponding to the area, a node string indicating the detected word string is identified, and a new node string generated by assigning the same complement number to the identified node string is added.

本実施形態では、制御部100がプログラムを実行することで、図6に示す各機能構成が論理的に実現されるが、これらの機能を、例えば、ASIC(Application Specific Integrated Circuit:特定用途向け集積回路)などの物理的な構成によって実現してもよい。   In the present embodiment, the functional configuration shown in FIG. 6 is logically realized by the control unit 100 executing a program. These functions are, for example, integrated in an application specific integrated circuit (ASIC). It may be realized by a physical configuration such as a circuit).

次に、上述した構成を有する入力端末1の動作を説明する。ここでは、入力端末1を用いて文字列入力を行う場合に実行される「文字列入力処理」を、図7〜図28を参照して説明する。この処理は、例えば、図3に示すような入力画面ISを表示する操作が行われたことを契機に開始されるものとする。   Next, the operation of the input terminal 1 having the above-described configuration will be described. Here, “character string input processing” executed when a character string is input using the input terminal 1 will be described with reference to FIGS. 7 to 28. For example, this process is started when an operation for displaying the input screen IS as shown in FIG. 3 is performed.

図7は、入力端末1における字列入力処理のフローチャートである。同図において、処理が開始され、オペレータによって入力装置210から入力がなされると、入力制御装置200から制御部100への入力信号に基づき、辞書選択部110は、表示した入力画面IS上の、どの入力エリアが指定されたかを判別する(S001)。すなわち、入力端末1のオペレータによるポインティングデバイス212等の操作によって、入力画面IS上に用意された入力エリアのうち、入力対象となる入力エリアが選択されたか否かを判別する。   FIG. 7 is a flowchart of the character string input process in the input terminal 1. In the same figure, when the processing is started and an input is made from the input device 210 by the operator, the dictionary selection unit 110 based on the input signal from the input control device 200 to the control unit 100, It is determined which input area is designated (S001). That is, it is determined whether or not the input area to be input is selected from the input areas prepared on the input screen IS by the operation of the pointing device 212 or the like by the operator of the input terminal 1.

いずれかの入力エリアが指定されると(S001:YES)、辞書選択部110は、指定された入力エリアが特定の入力エリアであるか否かを判別する(S002)。本実施形態では、辞書データが対応付けられた入力エリアであって、入力内容別辞書を用いた変換入力の対象となっている入力エリアを特定の入力エリアとする。ここでは、応対内容を入力するための入力エリアA1と住所を入力するための入力エリアA2(図3参照)が該当する。   When any input area is designated (S001: YES), the dictionary selection unit 110 determines whether or not the designated input area is a specific input area (S002). In the present embodiment, an input area that is associated with dictionary data and that is a target of conversion input using a dictionary according to input content is set as a specific input area. Here, there are an input area A1 for inputting the response contents and an input area A2 (see FIG. 3) for inputting an address.

指定された入力エリアが、特定の入力エリアではないと判定された場合(S002:NO)、基本辞書領域420の基本辞書データを参照し、通常の入力変換動作によって文字列入力が行われる(S100)。   When it is determined that the designated input area is not a specific input area (S002: NO), the basic dictionary data in the basic dictionary area 420 is referred to, and a character string is input by a normal input conversion operation (S100). ).

一方、特定の入力エリアが指定されたと判定された場合(S002:YES)、辞書選択部110は、指定された入力エリアの種別を検出する。ここでは、入力エリアA1が指定された場合には、その入力エリアに対応づけされている識別子「A1」が検出され、入力エリアA2が指定された場合には、その入力エリアに対応付けされている識別子「A2」が検出される。   On the other hand, when it is determined that a specific input area has been designated (S002: YES), the dictionary selection unit 110 detects the type of the designated input area. Here, when the input area A1 is designated, the identifier “A1” associated with the input area is detected, and when the input area A2 is designated, the identifier is associated with the input area. The identifier “A2” is detected.

辞書選択部110は、識別子を検出すると、入力内容別辞書領域430にアクセスし、検出された識別子に対応する辞書データを選択する(S003)。図2に示すように、入力内容別辞書領域430に格納されている複数組の入力内容別辞書データには、対応する入力エリアを示す識別子(図2の例では「A1」と「A2」)が付与されている。よって、辞書選択部110は、検出された識別子に基づいて、対応する識別子が付与されている辞書データを選択する。以下、本実施形態では、入力エリアA1に文字列入力を行うものとして説明する。よって、ここでは、応対入力辞書データ(A1)431が選択される。   When the dictionary selection unit 110 detects the identifier, the dictionary selection unit 110 accesses the dictionary area 430 for each input content, and selects dictionary data corresponding to the detected identifier (S003). As shown in FIG. 2, identifiers indicating corresponding input areas (“A1” and “A2” in the example of FIG. 2) are included in a plurality of sets of input content dictionary data stored in the input content dictionary area 430. Is granted. Thus, the dictionary selection unit 110 selects dictionary data to which a corresponding identifier is assigned based on the detected identifier. Hereinafter, in the present embodiment, description will be made assuming that a character string is input to the input area A1. Therefore, the response input dictionary data (A1) 431 is selected here.

使用する辞書データを選択すると、辞書選択部110は、選択した辞書データがいずれであるかを変換候補抽出部130に通知するとともに、指定された入力エリアを検索キー生成部120に通知する。   When the dictionary data to be used is selected, the dictionary selection unit 110 notifies the conversion candidate extraction unit 130 of the selected dictionary data and also notifies the search key generation unit 120 of the designated input area.

辞書選択部110から入力エリアの通知を受けると、検索キー生成部120は、指定された入力エリアにある文字列を取得して検索キーを生成する(S200)。検索キーの生成には、種々の方法が考えられるが、本実施形態では、後述する図8に示すフローチャートに従って検索キーを生成する。   When receiving the notification of the input area from the dictionary selection unit 110, the search key generation unit 120 acquires a character string in the designated input area and generates a search key (S200). Various methods are conceivable for generating the search key. In this embodiment, the search key is generated according to the flowchart shown in FIG.

変換候補抽出部130は、S200において生成された検索キーを検索キー生成部120から受け取ると、当該検索キーを用いて辞書選択部110がS003において選択した辞書から変換候補を抽出し、検索結果として出力する(S300)。検索結果としての候補語が抽出されなければ(S004:NO)、変換候補抽出部130は、図8に示す検索キー生成を行う。候補語の抽出に成功していれば(S004:YES)、変換候補出力部140は、S300において出力された検索結果を候補表示するための整形を行う(S400)。   When the conversion candidate extraction unit 130 receives the search key generated in S200 from the search key generation unit 120, the conversion candidate extraction unit 130 extracts conversion candidates from the dictionary selected by the dictionary selection unit 110 in S003 using the search key, and obtains a search result. Output (S300). If a candidate word as a search result is not extracted (S004: NO), the conversion candidate extraction unit 130 generates a search key shown in FIG. If the extraction of the candidate word is successful (S004: YES), the conversion candidate output unit 140 performs shaping for displaying the search result output in S300 as a candidate (S400).

S400の後、入力装置210による入力が行われなかった場合(S005:NO)、あるいは、現在指定されている入力エリアにさらに文字が入力された場合(S005:YES、S006:YES)、再び、S200からの処理を行う。一方、入力装置210による入力が、現在指定されている入力エリアへの文字入力でもなく、終了指示の入力でもない場合(S006:NO、S007:NO)、S001からの処理を行い、終了指示の入力である場合(S006:NO、S007:YES)、処理を終了する。   After S400, when input by the input device 210 is not performed (S005: NO), or when characters are further input in the currently specified input area (S005: YES, S006: YES), The process from S200 is performed. On the other hand, when the input by the input device 210 is neither a character input to the currently designated input area nor an input of an end instruction (S006: NO, S007: NO), the process from S001 is performed, and an end instruction is issued. If it is an input (S006: NO, S007: YES), the process is terminated.

次に、図8及び図9を参照して、検索キー生成部120の動作を説明する。図8は、図7のS200において検索キー生成部120が実行する検索キー生成処理のフローチャートを示し、図9は、検索キー生成処理における例を示す。
図7のS200において、検索キー生成処理が実行された場合、図8において、検索キー生成部120は、まず、指定された入力エリア中の文字列を取得する(S201)。一般に、入力エリアには、変換終了した確定文字列と、変換すべく入力作業中の未確定文字列とが混在している。そして、未確定文字列には、FEPが機能する前の「ひらがな」状態と、FEPが機能して漢字などの変換候補が暫定的に表示された状態とがある。以降において、未確定文字列部分は、明細書中では『』により囲まれた文字によって、図中は下線付加によって示すこととする。「確定文字列+未確定文字列」の例は、図9(a)に示すようになる。ここでは、「携帯電話」の文字列を入力する場合において、「携帯」の文字列の漢字が確定しており、『でんわ』の部分がFEPが機能する前の未確定文字列である。そして、『でんわ』の文字列が、暫定的に『電話』として変換される。
Next, the operation of the search key generation unit 120 will be described with reference to FIGS. FIG. 8 shows a flowchart of the search key generation process executed by the search key generation unit 120 in S200 of FIG. 7, and FIG. 9 shows an example of the search key generation process.
When the search key generation process is executed in S200 of FIG. 7, in FIG. 8, the search key generation unit 120 first acquires a character string in the designated input area (S201). In general, a fixed character string that has been converted and an undetermined character string that is being input for conversion are mixed in the input area. The unconfirmed character string includes a “Hiragana” state before the FEP functions, and a state in which conversion candidates such as kanji are temporarily displayed by the FEP function. Hereinafter, the undetermined character string portion is indicated by a character surrounded by “” in the specification and by underlining in the drawing. An example of “confirmed character string + unconfirmed character string” is as shown in FIG. Here, when inputting the character string of “mobile phone”, the Chinese character of the character string of “mobile” is fixed, and the “phone” part is an unconfirmed character string before the FEP functions. Then, the character string “Denwa” is temporarily converted as “telephone”.

次いで、検索キー生成部120は、得られた文字列のうち、最後の句点「。」以前の文字列を削除する(S202)。その例を図9(b)に示す。ここでは、入力エリア中の文字列「ユーザです。携帯が壊れました。どこのショップ『にも』交換」から、文字列「ユーザです。携帯が壊れました。」を削除し、検索キーを「どこのショップ『にも』交換」としている。   Next, the search key generating unit 120 deletes the character string before the last punctuation “.” From the obtained character string (S202). An example is shown in FIG. Here, delete the character string "User is mobile. Broken" from the string "User is mobile. Broken mobile phone. Replace shop" anywhere in the input area, and press the search key. "Everywhere shop" to "exchange".

次に、検索キーに未確定部が含まれており、かつ、当該未確定部の右側に確定文字列がある場合には、検索キーから削除(除外)する(S203)。その例を図9(c)に示す。S202において生成された検索キーが「どこのショップ『にも』交換」であった場合、「交換」を削除して検索キー「どこのショップ『にも』」としている。   Next, when the unconfirmed part is included in the search key and there is a confirmed character string on the right side of the unconfirmed part, it is deleted (excluded) from the search key (S203). An example is shown in FIG. If the search key generated in S202 is “any shop“ to ”exchange”, “exchange” is deleted and the search key “any shop“ to ”” is used.

一般に、文字列中に未確定部が複数存在することはない。したがって、入力エリアの文字列の状態は、次のような場合に限られる。
(1)確定部のみ
(2)確定部+未確定部
(3)確定部+未確定部+確定部
(4)未確定部のみ
(5)未確定部+確定部
In general, there are never a plurality of undetermined parts in a character string. Therefore, the state of the character string in the input area is limited to the following cases.
(1) Only the confirmed part (2) Confirmed part + Unconfirmed part (3) Confirmed part + Unconfirmed part + Confirmed part (4) Only unconfirmed part (5) Unconfirmed part + Confirmed part

このうち、S203の処理の結果、(3)の場合は(2)の場合に、(5)の場合は(4)の場合に帰着するので、検索キーは、(1)「確定部のみ」、(2)「確定部+未確定部」、(4)「未確定部のみ」の3通りの場合に限られることとなる。   Of these, as a result of the processing of S203, the case of (3) results in the case of (2), and the case of (5) results in the case of (4). , (2) “determined part + undetermined part”, (4) “only undetermined part”.

次に、検索キー生成部120は、検索キーを「確定部」と「未確定部」とに分離し(S204)、確定部の長さLを取得する(S205)。例えば、確定部が「どこのショップ」である場合、L=7である。次に検索キー生成部120は、確定部の末尾(右端)から左側に長さLの文字列を取り出して「末尾部」を生成する(S206)。最初の検索キー生成にあっては、末尾部は確定部の長さに等しい。従って、S206で生成される末尾部は「どこのショップ」となる。
最後に、検索キー生成部120は、「末尾部」と「未確定部」とを結合する(S207)。この結果、上記例の場合、図9(d)に示す文字列が検索キーとして出力される。つまり、S203において検索キー「どこのショップ『にも』」が抽出され、末尾部が「どこのショップ」である場合、末尾部「どこのショップ」と未確定部『にも』を結合した「どこのショップ『にも』」が検索キーとなる。なお、(1)の場合、「未確定部」がないため、「末尾部」のみが検索キーとなる。このように検索キーが生成されると、続いて、図7のS300の処理を行なう。
Next, the search key generation unit 120 separates the search key into a “determined part” and an “unconfirmed part” (S204), and acquires the length L of the confirmed part (S205). For example, when the deterministic part is “where shop”, L = 7. Next, the search key generation unit 120 extracts a character string having a length L from the end (right end) to the left side of the confirmation unit, and generates a “end part” (S206). In the first search key generation, the end part is equal to the length of the fixed part. Therefore, the tail part generated in S206 is “where shop”.
Finally, the search key generation unit 120 combines the “end part” and the “undefined part” (S207). As a result, in the above example, the character string shown in FIG. 9D is output as a search key. That is, in S203, when the search key “any shop” is extracted and the end part is “where shop”, the end part “where shop” and the unconfirmed part “also” are combined. The search key is “anywhere”. In the case of (1), since there is no “undetermined part”, only “tail part” is the search key. When the search key is generated in this way, the process of S300 in FIG. 7 is subsequently performed.

なお、図7において、候補語が抽出されなかった場合(S004:NO)、検索キー生成部120は、L=0か否かを判断する(S209)。Lが0の場合(S209:YES)、図7のS400の処理を実行し、Lが0ではない場合(S209:NO)、現在のLを1減算した値に更新して確定部の左端を一文字減らし、S206からの処理を行ない、S207の実行後は、図7のS300の処理を行なう。
例えば、L=7、末尾部が「どこのショップ」のときに候補語が抽出されなかった場合、S206では、確定部の「末尾」である右端から(L−1)文字を取り出して、末尾部とするため、L=6であり、末尾部は「このショップ」となる。そして、S207では、検索キーは「このショップ『にも』」となる。
In FIG. 7, when a candidate word is not extracted (S004: NO), the search key generation unit 120 determines whether L = 0 (S209). If L is 0 (S209: YES), the process of S400 in FIG. 7 is executed. If L is not 0 (S209: NO), the current L is updated to a value obtained by subtracting 1 and the left end of the determination unit is displayed. One character is reduced, the process from S206 is performed, and after the execution of S207, the process of S300 in FIG. 7 is performed.
For example, when a candidate word is not extracted when L = 7 and the last part is “where shop”, in S206, (L−1) characters are extracted from the right end, which is the “end” of the final part, and the end Since L = 6, the last part is “this shop”. In S207, the search key is “this shop“ also ””.

次に、図10〜図25を参照して変換候補抽出部130の動作を説明する。   Next, the operation of the conversion candidate extraction unit 130 will be described with reference to FIGS.

図10は、図7のS300において変換候補抽出部130が実行する候補抽出処理のフローチャートを示す。
図10において、変換候補抽出部130は、まず、検索キーの先頭が「ひらがなのみ」からなる「未確定部」であるか否かを判断する(S301)。そして、検索キーの先頭が「ひらがなのみ」で、かつ「未確定部」である場合には(S301:YES)、「先頭未確定処理」(S500)に進み、「ひらがなのみ」からなる「未確定部」でない場合(S301:NO)には、「先頭確定処理」(S600)に進む。
FIG. 10 shows a flowchart of candidate extraction processing executed by the conversion candidate extraction unit 130 in S300 of FIG.
In FIG. 10, the conversion candidate extraction unit 130 first determines whether or not the head of the search key is an “unconfirmed unit” consisting of “Hiragana only” (S301). If the head of the search key is “Hiragana only” and “unconfirmed part” (S301: YES), the process proceeds to “Head unconfirmed process” (S500), and “Hiragana only” is formed. If it is not a “determining part” (S301: NO), the process proceeds to the “leading determination process” (S600).

次に、図10に示す候補抽出処理におけるS500の「先頭未確定処理」について、図11〜図15を参照して説明する。図11は、図10のS500において変換候補抽出部130が実行する先頭未確定処理のフローチャートを示し、図12〜図15は、先頭未確定処理の例を示す。
図11において、変換候補抽出部130は、まず、「読み補完辞書」からrootの1つ下流のノードである最上流ノードを一つ取得する(S501)。これをノードxとする。なお、以降、アルファベット小文字を用いて「ノードx」と記載した場合には、読み補完辞書のノードを表し、アルファベット大文字を用いて「ノードX」と記載した場合には、ノードxと対応する、綴り補完辞書のノードを表すものとする。
Next, the “start unconfirmed process” in S500 in the candidate extraction process shown in FIG. 10 will be described with reference to FIGS. FIG. 11 shows a flowchart of the head unconfirmed process executed by the conversion candidate extraction unit 130 in S500 of FIG. 10, and FIGS. 12 to 15 show examples of the head unconfirmed process.
In FIG. 11, the conversion candidate extraction unit 130 first acquires one most upstream node that is one node downstream from the “reading supplement dictionary” (S501). This is designated as node x. Hereinafter, when “node x” is described using lower case alphabet letters, it represents a node of the reading completion dictionary, and when “node X” is written using upper case letters, it corresponds to node x. It represents a spelling completion dictionary node.

ノードxと検索キーとの間に何らかの「前方一致」がある場合、検索キーとノードxとの長短に応じて、包含関係を次のように定義する。
検索キー ⊂ ノードx 部分一致
検索キー = ノードx 完全一致
検索キー ⊃ ノードx 余剰一致
When there is some “forward match” between the node x and the search key, the inclusion relation is defined as follows according to the length of the search key and the node x.
Search key ⊂ Node x Partial match Search key = Node x Exact match Search key ⊃ Node x Extra match

また、読み補完辞書および綴り補完辞書は、各々、図4および図5に示すように構成されているものとする。ノードxの読みが「けいたい」の場合を例に、検索キーとの部分一致、完全一致、余剰一致する例は、図12(a)に示す通りである。つまり、検索キーが未確定部『けい』であれば部分一致、検索キーが未確定部『けいたい』であれば完全一致、検索キーが未確定部『けいたいが』であれれば余剰一致である。
なお、前方一致とは検索キーとノードxとの一致判断にあたり、常に先頭部分(文字列左端)の一致を条件とすることをいう。部分一致だが前方一致ではない例と、余剰一致だが前方一致ではない例とを、図12(b)に示す。つまり、検索キーが未確定部『たい』であれば部分一致であるが前方一致ではない。また、検索キーが未確定部『わたしのけいたい』であれば余剰一致ではあるが、やはり前方一致ではない。
Further, the reading complement dictionary and the spelling complement dictionary are configured as shown in FIGS. 4 and 5, respectively. An example in which the reading of the node x is “Keitai” is an example of partial match, complete match, and surplus match with the search key, as shown in FIG. In other words, if the search key is an unconfirmed part “Kei”, it is a partial match. is there.
It should be noted that the forward match means that the match of the head part (the left end of the character string) is always a condition when determining the match between the search key and the node x. FIG. 12B shows an example of partial matching but not forward matching and an example of surplus matching but not forward matching. That is, if the search key is the unconfirmed part “tai”, it is a partial match but not a forward match. Also, if the search key is the unconfirmed part “I want to”, it is a surplus match, but not a forward match.

検索キーとノードxに何らの一致(前方一致)もない場合(S502:NO)、変換候補抽出部130は、読み補完辞書に比較すべきノードが残っていないか確認する(S506)。比較すべきノードが残っていれば(S506:NO)、S501へ戻り、まだ比較を行なっていないrootの1つ下流のノードを1つ選択し、このノードをノードxとして以降の処理を行う。
一方、全てのノードについて比較を行なったため、比較すべきノードが残っていない場合(S506:YES)は、当該先頭未確定処理を終了する。
If there is no match (forward match) between the search key and the node x (S502: NO), the conversion candidate extraction unit 130 checks whether there are any remaining nodes to be compared in the reading completion dictionary (S506). If there remains a node to be compared (S506: NO), the process returns to S501, and one node downstream of root that has not been compared is selected, and the subsequent processing is performed with this node as node x.
On the other hand, since all nodes have been compared, if there are no remaining nodes to be compared (S506: YES), the head unconfirmed process ends.

また、検索キーとノードxとが、部分一致、完全一致、余剰一致のいずれかの形で前方一致すれば(S502:YES)、変換候補抽出部130は、ノードxに付与されたリンクポインタにより、綴り補完辞書のノードXを取得する(S503)。
そして、検索キーとノードxが部分一致する場合(S504:YES)、変換候補抽出部130は、綴り補完辞書からノードXの同一補完単位ノード列の綴りを読み出して結果テーブル450に追加する(S505)。このとき、変換候補抽出部130は、同一補完単位ノード列の最後のノードの出現回数を綴り補完辞書から読み出し、結合した綴りと対応づけて結果テーブル450に書き込む。この例を図13に示す。ただし、図13では、結果テーブルに書き込まれる出現回数は省略している。
Further, if the search key and the node x match forward in any of partial match, complete match, and surplus match (S502: YES), the conversion candidate extraction unit 130 uses the link pointer assigned to the node x. The node X of the spelling complement dictionary is acquired (S503).
If the search key and the node x partially match (S504: YES), the conversion candidate extraction unit 130 reads the spelling of the same complement unit node string of the node X from the spelling complement dictionary and adds it to the result table 450 (S505). ). At this time, the conversion candidate extraction unit 130 reads the number of appearances of the last node of the same complement unit node sequence from the spelling complement dictionary, and writes it in the result table 450 in association with the combined spelling. An example of this is shown in FIG. However, in FIG. 13, the number of appearances written in the result table is omitted.

図13(a)に示すように、例えば、検索キーが未確定文字『けい』であり、ノードxが読み補完辞書データ431Aにおけるノードa1’「けいたい」である場合は部分一致するため、綴り補完辞書データ431Bのノードa1「携帯」がノードXとして特定される。ノードa1「携帯」には補完単位番号「1」が付与され、1つ下流のノードa2「の」、ノードc2「が」、…には補完単位番号「2」が付与されており、補完単位番号が異なっている。従って、変換候補抽出部130は、ノードXのみを同一補完単位ノード列とし、ノードa1の綴り「携帯」及び出現回数を対応づけて結果テーブル450に追加する。   As shown in FIG. 13A, for example, when the search key is the unconfirmed character “Kei” and the node x is the node a1 ′ “Keitai” in the reading complement dictionary data 431A, the spelling is partially matched. The node a1 “mobile” in the complementary dictionary data 431B is identified as the node X. The node a1 “mobile” is assigned the complement unit number “1”, and the node a2 “no”, the node c2 “ga”,... The numbers are different. Therefore, the conversion candidate extraction unit 130 sets only the node X as the same complement unit node string, and adds the spelling “mobile” and the number of appearances of the node a1 to the result table 450 in association with each other.

また、検索キーが未確定文字『けい』であり、ノードxが読み補完辞書データ431Aにおけるノードd1’「けいたいででんわ」である場合も部分一致するため、綴り補完辞書データ431Bのノードd1「携帯電話」がノードXとして特定される。ノードd1「携帯電話」には補完単位番号「1」が付与され、1つ下流のノードd2「の」には補完単位番号「2」が付与されており、補完単位番号が異なっている。従って、変換候補抽出部130は、ノードXのみを同一補完単位ノード列とし、ノードd1の綴り「携帯電話」及び出現回数を対応づけて結果テーブル450に追加する。   In addition, when the search key is the unconfirmed character “Kei” and the node x is the node d1 ′ “Keitai Denwa” in the reading completion dictionary data 431A, it partially matches, so the node d1 “of the spelling completion dictionary data 431B”. “Mobile phone” is identified as node X. A complement unit number “1” is assigned to the node d1 “mobile phone”, a complement unit number “2” is assigned to the node d2 “no” one downstream, and the complement unit numbers are different. Therefore, the conversion candidate extraction unit 130 sets only the node X as the same complement unit node string, associates the spelling “mobile phone” of the node d1 and the number of appearances, and adds it to the result table 450.

また、検索キーが未確定文字『けい』であり、ノードxが読み補完辞書データ431Aにおけるノードi1’「けいたい」である場合も部分一致するため、綴り補完辞書データ431Bのノードi1「携帯」がノードXとして特定される。ノードi1「携帯」には補完単位番号「1」が付与されており、下流のノードi2「の」、ノードi3「画面」にも同じ補完単位番号「1」が付与されている。従って、変換候補抽出部130は、ノードi1+ノードi2+ノードi3を同一補完単位ノード列とし、ノードi1、i2、i3の綴りを結合した「携帯の画面」、及び、ノードi3の出現回数を対応付けて結果テーブル450に追加する。   In addition, when the search key is the unconfirmed character “Kei” and the node x is the node i1 ′ “Keitai” in the reading completion dictionary data 431A, it partially matches, so the node i1 “mobile” in the spelling completion dictionary data 431B. Is identified as node X. The node i1 “mobile” is assigned the complementary unit number “1”, and the downstream node i2 “no” and the node i3 “screen” are also assigned the same complementary unit number “1”. Therefore, the conversion candidate extraction unit 130 associates the node i1 + node i2 + node i3 with the same complement unit node string and associates the spelling of the nodes i1, i2, and i3 with the number of appearances of the node i3. To the result table 450.

一方、図13(b)に示すように、検索キーが未確定文字『あ』であり、ノードxが読み補完辞書データ431Aにおけるノードf1’「あたらしい」である場合は部分一致するため、綴り補完辞書データ431Bのノードf1「新しい」がノードXとして特定される。ノードf1「新しい」には補完単位番号「1」が付与され、下流のノードf2「携帯」、ノードh2「パソコン」、…には全て補完単位番号「2」が付与されており、補完単位番号が異なっている。従って、変換候補抽出部130は、ノードXのみを同一補完単位ノード列とし、ノードf1の綴り「新しい」及び出現回数を対応付けて結果テーブル450に追加する。   On the other hand, as shown in FIG. 13 (b), if the search key is the unconfirmed character “A” and the node x is the node f1 ′ “new” in the reading completion dictionary data 431A, it is partially matched. The node f1 “new” of the dictionary data 431B is specified as the node X. The node f1 “new” is assigned the complement unit number “1”, and the downstream node f2 “mobile”, the node h2 “computer”,. Are different. Therefore, the conversion candidate extraction unit 130 sets only the node X as the same complement unit node string, and adds the spelling “new” and the number of appearances of the node f1 to the result table 450 in association with each other.

また、検索キーが未確定文字『あ』であり、ノードxが読み補完辞書データ431Aにおけるノードj1’「あたらしい」である場合も部分一致するため、綴り補完辞書データ431Bのノードj1「新しい」がノードXとして特定される。ノードj1には補完単位番号「1」が、下流のノードj2「パソコン」には補完単位番号「2」が付与されており、補完単位番号が異なっている。従って、変換候補抽出部130は、ノードXのみを同一補完単位ノード列とし、ノードj1の綴り「新しい」及び出現回数を対応付けて結果テーブル450に追加する。   In addition, when the search key is the undetermined character “A” and the node x is the node j1 ′ “new” in the reading complement dictionary data 431A, partial matching is made, so the node j1 “new” in the spelling complement dictionary data 431B is Identified as node X. A complement unit number “1” is assigned to the node j1, and a complement unit number “2” is assigned to the downstream node j2 “PC”, and the complement unit numbers are different. Therefore, the conversion candidate extraction unit 130 sets only the node X as the same complement unit node string, and adds the spelling “new” and the number of appearances of the node j1 to the result table 450 in association with each other.

その後、比較すべき候補がまだ残っていれば(S506:NO)、S501へ戻る。全てのノードxについて比較が終了していれば(S506:YES)、当該先頭未確定処理を終了する。   Thereafter, if there are still candidates to be compared (S506: NO), the process returns to S501. If the comparison has been completed for all the nodes x (S506: YES), the head unconfirmed process is terminated.

一方、検索キーとノードxが完全一致する場合(S504:NO、S507:YES)、変換候補抽出部130は、綴り補完辞書から、ノードXと、当該ノードXの1つ下流のノードの同一補完単位ノード列の綴りを読み出して結合し、結果テーブル450に追加する(S508)。このとき、変換候補抽出部130は、同一補完単位ノード列の最後のノードに付加された出現回数を綴り補完辞書から読み出し、綴りと対応づけて結果テーブル450に書き込む。この例を図14に示す。ただし、図14では、結果テーブルに書き込まれる出現回数は省略している。   On the other hand, when the search key and the node x completely match (S504: NO, S507: YES), the conversion candidate extraction unit 130 performs the same complement of the node X and the node immediately downstream of the node X from the spelling complement dictionary. The spelling of the unit node sequence is read and combined, and added to the result table 450 (S508). At this time, the conversion candidate extraction unit 130 reads the number of appearances added to the last node of the same complement unit node sequence from the spelling complement dictionary, and writes it in the result table 450 in association with the spelling. An example of this is shown in FIG. However, in FIG. 14, the number of appearances written in the result table is omitted.

図14(a)に示すように、例えば、検索キーが未確定文字『けいたい』であり、ノードxが読み補完辞書データ431Aにおけるノードa1’「けいたい」である場合は完全一致するため、綴り補完辞書データ431Bのノードa1「携帯」がノードXとして特定される。変換候補抽出部130は、ノードa1の1つ下流のノードa2「の」、ノードc2「が」、…とその補完単位番号「2」を読み出す。そして、読み出した下流のノードそれぞれについて、同一の補完単位番号が付与されたさらに下流のノードを結合したノード列、ノードa2「の」+ノードa3「画面」、ノードa2「の」+ノードb3「ありか」、ノードc2「が」+ノードc3「壊れた」、…を取得する。よって、変換候補抽出部130は、(1)ノードa1(ノードX)とノードa2+ノードa3(同一補完単位ノード列)の綴りを結合した「携帯の画面」、及び、ノードa3の出現回数の対応づけ、(2)ノードa1(ノードX)とノードa2+ノードb3(同一補完単位ノード列)の綴りを結合した「携帯のありか」、及び、ノードb3の出現回数の対応づけ、(3)ノードa1(ノードX)とノードc2+ノードc3(同一補完単位ノード列)の綴りを結合した「携帯が壊れた」、及び、ノードc3の出現回数の対応づけ、を結果テーブル450に追加する。   As shown in FIG. 14A, for example, when the search key is the unconfirmed character “Keitai” and the node x is the node a1 ′ “Keitai” in the reading completion dictionary data 431A, the match is complete. The node a1 “mobile” in the spelling complement dictionary data 431B is identified as the node X. The conversion candidate extraction unit 130 reads the node a2 “no”, the node c2 “ga”,..., And the complement unit number “2” that are one downstream of the node a1. Then, for each of the read downstream nodes, a node string obtained by combining further downstream nodes to which the same complement unit number is assigned, node a2 “no” + node a3 “screen”, node a2 “no” + node b3 “ “Is there”, node c2 “ga” + node c3 “broken”,... Therefore, the conversion candidate extraction unit 130 corresponds to (1) the “portable screen” in which the spelling of the node a1 (node X) and the node a2 + node a3 (same complement unit node string) is combined, and the number of appearances of the node a3. (2) Correspondence between “there is a mobile phone” that combines the spelling of the node a1 (node X) and the node a2 + node b3 (same complement unit node string) and the number of appearances of the node b3, (3) node The association between the spelling of a1 (node X) and node c2 + node c3 (same complement unit node string) and the number of appearances of node c3 are added to the result table 450.

また、検索キーが未確定文字『けいたい』であり、ノードxが読み補完辞書データ431Aにおけるノードi1’「けいたい」である場合も完全一致するため、綴り補完辞書データ431Bのノードi1「携帯」がノードXとして特定される。変換候補抽出部130は、ノードi1の1つ下流のノードi2「の」とその補完単位番号「1」を読み出す。そして、読み出した下流のノードについて、同一の補完単位番号が付与されたさらに下流のノードを結合したノード列、ノードi2「の」+ノードi3「画面」…を取得する。よって、変換候補抽出部130は、ノードi1(ノードX)とノードi2+ノードi3(同一補完単位ノード列)の綴りを結合した「携帯の画面」、及び、ノードi3の出現回数を対応付けて結果テーブル450に追加する。   Further, when the search key is the unconfirmed character “Keitai” and the node x is the node i1 ′ “Keitai” in the reading completion dictionary data 431A, it is completely matched. Therefore, the node i1 “mobile” in the spelling completion dictionary data 431B Is identified as node X. The conversion candidate extraction unit 130 reads the node i2 “no” one downstream of the node i1 and its complement unit number “1”. Then, for the read downstream node, a node string obtained by combining further downstream nodes to which the same complement unit number is assigned, node i2 “no” + node i3 “screen”... Therefore, the conversion candidate extraction unit 130 associates the spelling of the node i1 (node X) and the node i2 + node i3 (same complement unit node string) with the number of appearances of the node i3, and the result. Add to table 450.

一方、図14(b)に示すように、例えば、検索キーが未確定文字『ふるい』であり、ノードxが読み補完辞書データ431Aにおけるノードk1’「ふるい」である場合は完全一致するため、綴り補完辞書データ431Bのノードk1「古い」がノードXとして特定される。ノードk1の1つ下流のノードk2「携帯」には補完単位番号「1」が付与され、ノードk2の1つ下流のノードk3には補完単位番号「2」が付与されており、補完単位番号が異なっている。よって、変換候補抽出部130は、ノードk2のみを同一補完単位ノード列とし、ノードk1(ノードX)とノードk2(同一補完単位ノード列)の綴りを結合した「古い携帯」、及び、ノードk2の出現回数の対応付けを結果テーブル450に追加する。   On the other hand, as shown in FIG. 14B, for example, when the search key is the unconfirmed character “sieving” and the node x is the node k1 ′ “sieving” in the reading complement dictionary data 431A, The node k1 “old” of the spelling complement dictionary data 431B is identified as the node X. A node k2 “mobile” that is one downstream of the node k1 is assigned a complement unit number “1”, and a node k3 that is one downstream of the node k2 is assigned a complement unit number “2”. Are different. Therefore, the conversion candidate extraction unit 130 sets only the node k2 as the same complement unit node string, and combines the spelling of the node k1 (node X) and the node k2 (same complement unit node string), and the node k2 Is added to the result table 450.

一方、図14(c)に示すように、検索キーが未確定文字『あたらしい』であり、ノードxが読み補完辞書データ431Aにおけるノードf1’「あたらしい」(ノードx)である場合は完全一致するため、綴り補完辞書データ431Bのノードf1「新しい」がノードXとして特定される。ノードf1の1つ下流のノードf2「携帯」、ノードh2「パソコン」、…には補完単位番号「2」が付与され、さらに下流のノードf3、g3、h3には補完単位番号「3」が付与されており、補完単位番号が異なっている。よって、変換候補抽出部130は、(1)ノードf1(ノードX)とノードf2(同一補完単位ノード列)の綴りを結合した「新しい携帯」、及び、ノードf2の出現回数の対応付け、(2)ノードf1(ノードX)とノードh2(同一補完単位ノード列)の綴りを結合した「新しいパソコン」、及び、ノードh2の出現回数の対応付け、…を結果テーブル450に追加する。   On the other hand, as shown in FIG. 14 (c), when the search key is the unconfirmed character “new” and the node x is the node f1 ′ “new” (node x) in the reading complement dictionary data 431A, they completely match. Therefore, the node f1 “new” of the spelling complement dictionary data 431B is specified as the node X. A complement unit number “2” is assigned to the node f2 “mobile”, the node h2 “personal computer”,... One downstream of the node f1, and a complement unit number “3” is assigned to the downstream nodes f3, g3, and h3. The supplementary unit number is different. Therefore, the conversion candidate extraction unit 130 (1) associates the spelling of the node f1 (node X) with the spelling of the node f2 (same complementary unit node string) and the number of appearances of the node f2, ( 2) A “new personal computer” in which the spelling of the node f1 (node X) and the node h2 (same complementary unit node string) is combined, and the association of the number of appearances of the node h2, etc. are added to the result table 450.

また、検索キーが未確定文字『あたらしい』であり、ノードxが読み補完辞書データ431Aにおけるノードj1’「あたらしい」である場合も完全一致するため、ノードXとして綴り補完辞書データ431Bのノードj1「新しい」が特定される。ノードj1の1つ下流のノードj2「パソコン」には補完単位番号「2」が付与されており、さらに下流のノードj3「の」、ノードj4「発売日」にも補完単位番号「2」が付与されている。よって、変換候補抽出部130は、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4からなる同一補完単位ノード列の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数を対応づけて結果テーブル450に追加する。   Further, when the search key is the unconfirmed character “new” and the node x is the node j1 ′ “new” in the reading completion dictionary data 431A, the search key is completely matched. Therefore, the node j1 of the spelling completion dictionary data 431B as the node X “New” is identified. A complement unit number “2” is assigned to the node j2 “personal computer” that is one downstream of the node j1, and a complement unit number “2” is also assigned to the downstream node j3 “no” and the node j4 “release date”. Has been granted. Accordingly, the conversion candidate extraction unit 130 combines the spelling of the same complement unit node sequence consisting of the node j1 (node X) and the node j2 + node j3 + node j4, and the number of appearances of the node j4. Are added to the result table 450 in association with each other.

その後、比較すべき候補がまだ残っていれば(S506:NO)、S501へ戻る。全てのノードxについて比較が終了していれば(S506:YES)、先頭未確定処理を終了する。   Thereafter, if there are still candidates to be compared (S506: NO), the process returns to S501. If the comparison has been completed for all the nodes x (S506: YES), the head unconfirmed process is terminated.

また、検索キーとノードxが部分一致も完全一致もしない場合には、余剰一致となる(S507:NO)。そこでまず、変換候補抽出部130は、nに1を代入すると(S509)、読み補完辞書からノードyn−1の1つ下流のノードyを取得する(S510)。ただし、ノードyはノードxとするため、最初のループにおいては、ノードy(n=1)は、ノードxの1つ下流のノードとなる。 If the search key and the node x are neither partially matched nor completely matched, a surplus match is obtained (S507: NO). Therefore, first, the conversion candidate extracting unit 130 and substituting 1 to n (S509), to obtain one downstream node y n nodes from reading complement dictionary y n-1 (S510). However, since the node y 0 is node x, in the first loop, a node y n (n = 1) is a one downstream node of the node x.

次いで、変換候補抽出部130は、まだ余剰キーが生成されていない場合、検索キーからノードxを削除した余りである余剰キーを生成し、すでに余剰キーが生成されている場合は、現在の余剰キーからノードyn−1を削除して余剰キーを更新する。変換候補抽出部130は、余剰キーがノードyに、前方一致を条件として含まれるか(部分一致ないし完全一致するか)判断する(S511)。従って、最初のループにおいては、検索キーからノードxを削除した余剰キーが、ノードxの1つ下流のノードyに含まれるかを判断する。 Next, the conversion candidate extraction unit 130 generates a surplus key that is a remainder obtained by deleting the node x from the search key when the surplus key has not yet been generated, and if the surplus key has already been generated, the current surplus key is generated. Delete the node y n-1 from the key and update the surplus key. Conversion candidate extracting unit 130, surplus key to node y n, (or partial match or exact) is or includes a forward match condition is determined (S511). Therefore, in the first loop, it is determined whether or not the surplus key obtained by deleting the node x from the search key is included in the node y 1 that is one downstream of the node x.

そして、余剰キーがノードyに含まれる場合(S511:YES)、ノードyと対応する綴り補完辞書のノードYを特定し、ノードyに対応したノードYからノードYの同一補完単位ノード列までの綴りをノード列Yとして取得する(S512)。従って、最初のループにおいては、ノード列Yは、ノードYの同一補完単位ノード列となる。変換候補抽出部130は、ノードX+ノード列Yの綴りを結果テーブル450に追加する(S513)。このとき、変換候補抽出部130は、ノード列Yの最後のノードの出現回数を綴り補完辞書から読み出し、結合した綴りと対応づけて結果テーブル450に書き込む。 When the surplus key is included in a node y n (S511: YES), the same node y n and identifies the node Y n corresponding spelling complement dictionary, the nodes from the node Y 1 corresponding to the node y 1 Y n The spelling up to the complement unit node row is acquired as the node row Y (S512). Thus, in the first loop, the node string Y is the same complementary units node sequence of the node Y 1. The conversion candidate extraction unit 130 adds the spelling of the node X + node string Y to the result table 450 (S513). At this time, the conversion candidate extraction unit 130 reads the number of appearances of the last node of the node string Y from the spelling complement dictionary, and writes it in the result table 450 in association with the combined spelling.

一方、S511において、余剰キーがノードyに含まれないと判断した場合(S511:NO)、変換候補抽出部130は、ノードyが前方一致を条件として余剰キーに含まれるか、つまり、余剰キーがノードyに対して余剰一致するかを判断する(S515)。余剰キーがノードyに対して余剰一致する場合(S515:YES)、現在のnの値に1加算し(S516)、S510からの処理を行う。
例えば、S516において、nの値が2に更新された場合、S510において、変換候補抽出部130は、読み補完辞書からノードyの1つ下流のノードyを取得する。次いで、S511において、変換候補抽出部130は、現在の余剰キーからノードyを削除した余りにより余剰キーを更新し、更新した余剰キーがノードyに、前方一致を条件として含まれるか判断する。
On the other hand, in S511, if the surplus key is determined not included in node y n (S511: NO), the conversion candidate extraction unit 130, or the node y n is included in excess keys forward match condition, i.e., excess key to determine whether the excess matched against nodes y n (S515). If the surplus keys to excess matched against nodes y n (S515: YES), 1 is added to the value of the current n (S516), the processes from S510.
For example, in S516, when the value of n is updated to 2, in S510, the conversion candidate extracting unit 130 acquires one downstream node y 2 nodes y 1 from the complementary dictionary readings. Then, in S511, the conversion candidate extraction unit 130, the remainder obtained by deleting the node y 1 from the current surplus key update surplus key update surplus key to node y 2 was, determined either included forward matching condition To do.

S513の処理の後、あるいは、S515において余剰キーがノードyに対して余剰一致しないと判断された場合(S515:NO)、比較すべき下流ノード候補がまだ残っていれば(S514:NO)、S509へ戻る。一方、全てのノードyについて比較が終了していれば(S514:YES)、S506へ進む。 After the processing of S513, or if the surplus key in S515 is determined not to excess matched against nodes y n (S515: NO), if the still downstream node candidate to be compared (S514: NO) , Return to S509. On the other hand, if the comparison has been completed for all the nodes y 1 (S514: YES), the process proceeds to S506.

余剰キーで示される余りが部分一致、完全一致、余剰一致の例を図15(a)、(b)、(c)に示す。ただし、図15では、結果テーブルに書き込まれる出現回数は省略している。   FIGS. 15A, 15B, and 15C show examples in which the remainder indicated by the surplus key is a partial match, complete match, and surplus match. However, in FIG. 15, the number of appearances written in the result table is omitted.

図15(a)に示すように、例えば、検索キーが未確定文字『けいたいの』であり、ノードxが読み補完辞書データ431Aにおけるノードa1’「けいたい」(ノードx)である場合は余剰一致する。変換候補抽出部130は、ノードa1’の1つ下流のノードa2’「の」、ノードc2’「が」を読み補完辞書データ431Aから読み出し、ノードyとする。余剰キーは「の」であるため、変換候補抽出部130は、完全一致するノードyの読み「の」を特定する。そして、この特定したノードyであるノードa2’のリンクポインタにより、綴り補完辞書データ431Bから、ノードa2「の」が特定される。変換候補抽出部130は、ノードa2の同一補完単位ノード列として、ノードa2「の」+ノードa3「画面」、ノードa2「の」+ノードb3「ありか」を読み出し、ノード列Yとする。変換候補抽出部130は、(1)ノードa1(ノードX)と、ノードa2+ノードa3(ノード列Y)との綴りを結合した「携帯の画面」、及び、ノードa3の出現回数の対応づけ、(2)ノードa1(ノードX)と、ノードa2+ノードb3(ノード列Y)との綴りを結合した「携帯のありか」、及び、ノードb3の出現回数の対応づけを結果テーブル450に追加する。
また、ノードxが読み補完辞書データ431Aにおけるノードi1’「けいたい」(ノードx)である場合もノードy(ノードi2’「の」)と余剰キー「の」は完全一致し、ノードi1(ノードX)と、ノードi2+ノードi3(ノード列Y)との綴りを結合した「携帯の画面」、及び、ノードi3の出現回数の対応づけが結果テーブル450に追加される。
As shown in FIG. 15A, for example, when the search key is the unconfirmed character “Keitai” and the node x is the node a1 ′ “Keitai” (node x) in the reading complement dictionary data 431A. Matches surplus. Conversion candidate extraction unit 130, the node a1 '1 next downstream node a2' of "no", the node c2 'read from the "ga" complementary dictionary data 431A read, the node y 1. Since the surplus key is “NO”, the conversion candidate extraction unit 130 specifies the reading “NO” of the completely matched node y 1 . Then, by the link pointer of the node a2 'is a node y 1 that this particular, from spelling supplement dictionary data 431 B, node a2 "no" is specified. The conversion candidate extraction unit 130 reads the node a2 “no” + node a3 “screen” and the node a2 “no” + node b3 “whether” as the same complement unit node row of the node a2, and sets it as the node row Y. The conversion candidate extraction unit 130 associates (1) the “portable screen” in which the spelling of the node a1 (node X) and the node a2 + node a3 (node row Y) is combined, and the number of appearances of the node a3, (2) Add the correspondence between “there is a mobile phone” that combines the spelling of the node a1 (node X) and the node a2 + node b3 (node row Y) and the appearance count of the node b3 to the result table 450 .
Further, even when the node x is the node i1 ′ “Keitai” (node x) in the reading completion dictionary data 431A, the node y 1 (node i2 ′ “no”) and the surplus key “no” completely match, and the node i1 “Portable screen” in which the spelling of (node X) and node i 2 + node i 3 (node row Y) is combined, and the association of the number of appearances of node i 3 are added to result table 450.

一方、図15(b)に示すように、検索キーが未確定文字『あたらしいぱ』であり、ノードxが読み補完辞書データ431Aにおけるノードf1’「あたらしい」である場合は余剰一致する。変換候補抽出部130は、ノードf1’の1つ下流のノードf2’「けいたい」、h2’「ぱそこん」を読み補完辞書データ431Aから読み出し、ノードyとする。余剰キーは、「ぱ」であるため、変換候補抽出部130は、前方一致かつ部分一致するノードyの読み「ぱそこん」を特定する。そして、この特定したノードyであるノードh2’のリンクポインタにより、綴り補完辞書データ431Bにおいて、ノードh2「パソコン」を特定する。ノードh2「パソコン」には補完単位番号「2」が付与され、ノードh2の1つ下流のノードh3には補完単位番号「3」が付与されており、補完単位番号が異なっている。よって、変換候補抽出部130は、ノードh2のみを同一補完単位ノード列とし、このノードh2の同一補完単位ノード列をノード列Yとする。変換候補抽出部130は、ノードf1(ノードX)と、ノードh2(ノード列Y)の綴りを結合した「新しいパソコン」、及び、ノードh2の出現回数の対応づけを結果テーブル450に追加する。 On the other hand, as shown in FIG. 15B, when the search key is the undetermined character “new path” and the node x is the node f1 ′ “new” in the reading complement dictionary data 431A, there is a redundant match. Conversion candidate extracting unit 130, a node f1 'one of the downstream node f2'"form", h2 'read from the complementary dictionary data 431A Read "computer", and the node y 1. Since the surplus key is “Pa”, the conversion candidate extraction unit 130 specifies the reading “Pason” of the node y 1 that matches forward and partially matches. Then, by the link pointer of the specified node y 1 a is a node h2 ', in spelling supplement dictionary data 431 B, identifies the node h2 "PC". A complement unit number “2” is assigned to the node h2 “personal computer”, a complement unit number “3” is assigned to the node h3 that is one downstream of the node h2, and the complement unit number is different. Therefore, the conversion candidate extraction unit 130 sets only the node h2 as the same complement unit node string, and sets the same complement unit node string of the node h2 as the node string Y. The conversion candidate extraction unit 130 adds the “new personal computer” in which the spelling of the node f1 (node X) and the node h2 (node string Y) is combined, and the association of the number of appearances of the node h2 to the result table 450.

また、検索キーが未確定文字『あたらしいぱ』であり、ノードxが読み補完辞書データ431Aにおけるノードj1’「あたらしい」である場合も余剰一致する。変換候補抽出部130は、ノードj1’の1つ下流のノードj2’「ぱそこん」を読み補完辞書データ431Aから読み出し、ノードyとする。余剰キーは「ぱ」であるため、ノードyと前方一致かつ部分一致する。そこで、変換候補抽出部130は、ノードyであるノードj2’のリンクポインタにより、綴り補完辞書データ431Bにおいて、ノードj2「パソコン」を特定すると、ノードj2の同一補完単位ノード列として、ノードj2「パソコン」+ノードj3「の」+ノードj4「発売日」を読み出し、ノード列Yとする。変換候補抽出部130は、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数を対応づけて結果テーブル450に追加する。 In addition, when the search key is the undetermined character “new path” and the node x is the node j1 ′ “new” in the reading complement dictionary data 431A, there is a redundant match. Conversion candidate extraction unit 130 reads from the complementary dictionary data 431A Read "computer"'one downstream node j2' of nodes j1, and the node y 1. Since the surplus key is “Pa”, it coincides with node y 1 in a forward match and a partial match. Therefore, the conversion candidate extracting unit 130, by the link pointer of the node j2 'is a node y 1, the spelling supplement dictionary data 431 B, a node j2 specifies "computer", as the same complementary units node sequence of the node j2, node j2 “Personal computer” + node j3 “no” + node j4 “release date” is read out and set as node string Y. The conversion candidate extraction unit 130 associates the spelling of the node j1 (node X) with the spelling of the node j2 + node j3 + node j4 (node string Y) and the number of appearances of the node j4. It adds to the result table 450.

また、図15(c)に示すように、検索キーが未確定文字『あたらしいけいたいの』であり、ノードxが読み補完辞書データ431Aにおけるノードf1’「あたらしい」である場合は余剰一致する。変換候補抽出部130は、ノードf1’の1つ下流のノードf2’「けいたい」、h2’「ぱそこん」を読み補完辞書データ431Aから読み出し、ノードyとする。余剰キーは、「けいたいの」であるため、ノードf2’「けいたい」と余剰一致する。そこで、変換候補抽出部130は、余剰一致するノードy、つまり、ノードf2’「けいたい」の1つ下流のノードf3’「を」、ノードg3’「の」を読み補完辞書データ431Aから読み出してノードyとするとともに、余剰キーを、「けいたいの」からノードy(ノードf2’)を削除した「の」に更新する。 Further, as shown in FIG. 15C, when the search key is the unconfirmed character “I want to wake up” and the node x is the node f1 ′ “new” in the reading complement dictionary data 431A, there is a surplus match. Conversion candidate extracting unit 130, a node f1 'one of the downstream node f2'"form", h2 'read from the complementary dictionary data 431A Read "computer", and the node y 1. Since the surplus key is “Keitai”, there is a surplus match with the node f2 ′ “Keitai”. Therefore, the conversion candidate extraction unit 130, a node y 1 to excess matching, that is, 'downstream node f3 one of the "form"'"wo" node f2, the complementary dictionary data 431A node g3 'Read "to" with the node y 2 reads, excess key is updated to delete a node from the "form of" y 1 (node f2 ') "of".

余剰キーは「の」であるため、変換候補抽出部130は、完全一致するノードyの読み「の」を特定する。そして、この特定したノードyであるノードg3’のリンクポインタにより、綴り補完辞書データ431Bから、ノードg3「の」を特定する。変換候補抽出部130は、ノードg3「の」の同一補完単位ノード列として、ノードg3「の」+ノードg4「発売日」を読み出すとともに、読み出した同一補完単位ノード列の上流ノードであるノードy、つまり、ノードf2’のリンクポインタにより、綴り補完辞書データ431Bのノードf2「携帯」をノードYとして特定すると、ノードYからノードYの同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードf1(ノードX)と、ノードf2+ノードg3+ノードg4(ノード列Y)との綴りを結合した「新しい携帯の発売日」、及び、ノードg4の出現回数の対応づけを結果テーブル450に追加する。 Since surplus key is "no", the conversion candidate extraction unit 130 reads the full matching nodes y 2 specifies "no". Then, by the link pointer of the node g3 'This is a specific node y 2, to identify the spelling supplement dictionary data 431 B, node g3 to "no". The conversion candidate extraction unit 130 reads the node g3 “no” + the node g4 “release date” as the same complement unit node string of the node g3 “no”, and the node y that is the upstream node of the read same complement unit node string 1, i.e., the node by the link pointers f2 ', when a specific node in the spelling complementary dictionary data 431 B f2 to "mobile" as the node Y 1, the node node to the same complementary units node series from Y 1 node Y 2 column Y To do. The conversion candidate extraction unit 130 associates the spelling of the node f1 (node X) with the spelling of the node f2 + node g3 + node g4 (node row Y) and the number of appearances of the node g4. Is added to the result table 450.

一方、S515において、余剰キーがノードyに対して余剰一致しないと判断した場合(S515:NO)、直接、S514へ進む。この例を図15(d)に示す。
その後、比較すべきノードyがまだ残っていれば(S514:NO)、S509へ戻る。全てのノードyについて比較が終了していれば(S514:YES)、S506へ進む。
On the other hand, in S515, if the surplus key is determined not to excess matched against nodes y n (S515: NO), it proceeds directly to S514. An example of this is shown in FIG.
Then, if still remains nodes y 1 to be compared (S514: NO), it returns to S509. If the comparison has been completed for all the nodes y 1 (S514: YES), the process proceeds to S506.

図15(d)に示すように、検索キーが未確定文字『けいたいがこわれたので』である場合、n=2まで、つまり、余剰キー「がこわれたので」とノードy「が」、及び、余剰キー「こわれたので」とノードy「こわれた」は余剰一致するが、n=3、つまり、余剰キーが「ので」となった場合、S510においてノードyを取得できなくなるため、S511及びS515においてNOと判定される。
また、検索キーが未確定文字『けいたいがふるい』である場合、n=1のとき、つまり、余剰キー「がふるい」とノードy「が」は余剰一致するが、n=2のとき、つまり、余剰キーが「ふるい」となった場合、いずれのノードyとも一致しないため、S511及びS515においてNOと判定される。
As shown in FIG. 15 (d), when the search key is an unconfirmed character “because the key was broken”, n = 2, that is, the surplus key “because the key was broken” and the node y 1 “ And, the surplus key “because it was broken” and the node y 2 “broken” are redundantly matched, but if n = 3, that is, if the surplus key becomes “so”, the node y 3 cannot be acquired in S510. Therefore, it is determined NO in S511 and S515.
Further, when the search key is the unconfirmed character “Keitai sieving”, when n = 1, that is, when the surplus key “ga sift” and the node y 1 “ga” are redundantly matched, but n = 2. , that is, if the surplus key becomes "old", because it does not match any node y n, is determined as nO in S511 and S515.

次に、図10に示す候補抽出処理におけるS600の「先頭確定処理」について図16及び図17を参照して説明する。図16は、図10のS600において変換候補抽出部130が実行する先頭確定処理のフローチャートを示し、図17は、先頭確定処理における例を示す。
図16のフローで処理される検索キーには、「確定部のみ」の場合と「確定部+未確定部」の場合とがある。変換候補抽出部130は、綴り補完辞書からrootの1つ下流のノードXを1つ取得する(S601)。ノードXと検索キーとの間の包含関係の定義は、「先頭未確定処理」の場合と同様である。
検索キー ⊂ ノードX 部分一致
検索キー = ノードX 完全一致
検索キー ⊃ ノードX 余剰一致
Next, the “first determination process” in S600 in the candidate extraction process shown in FIG. 10 will be described with reference to FIGS. FIG. 16 shows a flowchart of the head determination process executed by the conversion candidate extraction unit 130 in S600 of FIG. 10, and FIG. 17 shows an example of the head determination process.
The search key processed in the flow of FIG. 16 includes a case of “determined part only” and a case of “determined part + unconfirmed part”. The conversion candidate extraction unit 130 acquires one node X that is one downstream of root from the spelling complement dictionary (S601). The definition of the inclusion relationship between the node X and the search key is the same as in the case of the “head unconfirmed process”.
Search key ⊂ Node X Partial match Search key = Node X Exact match Search key ⊃ Node X Surplus match

また、先頭確定処理においても、一致判断は「前方一致」を条件とする。ノードXが「携帯」の場合を例とした、検索キーとの部分一致、完全一致、余剰一致の例を図17(a)に示す。つまり、検索キーが確定部「携」であれば部分一致、検索キーが確定部「携帯」であれば完全一致、検索キーが確定部「携帯が」であれれば余剰一致である。   Also, in the head determination process, the match determination is made on the condition of “front match”. FIG. 17A shows an example of partial match, complete match, and surplus match with the search key, taking the case where the node X is “mobile” as an example. In other words, if the search key is the confirmed part “mobile”, the partial match is made. If the search key is the confirmed part “mobile”, the complete match is made.

検索キーとノードXとの間に何らの一致もない場合(S602:NO)、変換候補抽出部130は、綴り補完辞書に、検索キーと比較すべきノードXが残っていないか確認する(S606)。そして、比較すべきノードXが残っていれば(S606:NO)、S601へ戻り、まだ比較を行なっていないrootの1つ下流のノードを1つ選択し、このノードをノードXとして以降の処理を行う。   If there is no match between the search key and the node X (S602: NO), the conversion candidate extraction unit 130 checks whether there is a node X to be compared with the search key remaining in the spelling completion dictionary (S606). ). If there remains a node X to be compared (S606: NO), the process returns to S601, selects one node that is one downstream of the root that has not been compared, and uses this node as the node X for the subsequent processing. I do.

一方、全てのrootの1つ下流のノードについて比較を行なったため、比較すべきノードが残っていない場合には(S606:YES)、当該先頭確定処理を終了する。
一方、部分一致の場合には(S604:YES)、変換候補抽出部130は、綴り補完辞書からノードXの同一補完単位ノード列の綴りを読み出して結果テーブル450に追加する。このとき、変換候補抽出部130は、同一補完単位ノード列の最後のノードに付加された出現回数を綴り補完辞書から読み出し、綴りと対応づけて結果テーブル450に書き込む。この例を図17(b)に示す。ただし、図17では、結果テーブルに書き込まれる出現回数は省略している。
On the other hand, since the comparison is performed for one node downstream of all the roots, when there is no remaining node to be compared (S606: YES), the head determination process ends.
On the other hand, in the case of partial match (S604: YES), the conversion candidate extraction unit 130 reads the spelling of the same complement unit node string of the node X from the spelling complement dictionary and adds it to the result table 450. At this time, the conversion candidate extraction unit 130 reads the number of appearances added to the last node of the same complement unit node sequence from the spelling complement dictionary, and writes it in the result table 450 in association with the spelling. An example of this is shown in FIG. However, in FIG. 17, the number of appearances written in the result table is omitted.

図17(b)に示すように、例えば、検索キーが確定文字「携」であり、ノードXが綴り補完辞書データ431Bにおけるノードa1「携帯」である場合は部分一致する。ノードa1「携帯」には補完単位番号「1」が付与され、1つ下流のノードa2「の」、ノードc2「が」、…には全て補完単位番号「2」が付与されており、補完単位番号が異なっている。従って、変換候補抽出部130は、ノードXのみを同一補完単位ノード列とし、ノードa1の綴り「携帯」及び出現回数を対応づけて結果テーブル450に追加する。   As shown in FIG. 17B, for example, when the search key is the confirmed character “mobile” and the node X is the node a1 “mobile” in the spelling complement dictionary data 431B, they partially match. The node a1 “mobile” is assigned the complement unit number “1”, and the node a2 “no”, the node c2 “ga”,... Downstream are all assigned the complement unit number “2”. The unit number is different. Therefore, the conversion candidate extraction unit 130 sets only the node X as the same complement unit node string, and adds the spelling “mobile” and the number of appearances of the node a1 to the result table 450 in association with each other.

また、検索キーが確定文字「携」であり、ノードXが綴り補完辞書データ431Bにおけるノードd1「携帯電話」である場合も部分一致する。ノードd1「携帯電話」には補完単位番号「1」が付与され、1つ下流のノードa2「の」には補完単位番号「2」が付与されており、補完単位番号が異なっている。従って、変換候補抽出部130は、ノードXのみを同一補完単位ノード列とし、ノードd1の綴り「携帯電話」及び出現回数を対応づけて結果テーブル450に追加する。   In addition, the search key is the fixed character “mobile”, and the node X is also the node d1 “mobile phone” in the spelling complement dictionary data 431B. A complement unit number “1” is assigned to the node d1 “mobile phone”, a complement unit number “2” is assigned to the node a2 “no” one downstream, and the complement unit numbers are different. Therefore, the conversion candidate extraction unit 130 sets only the node X as the same complement unit node string, associates the spelling “mobile phone” of the node d1 and the number of appearances, and adds it to the result table 450.

また、検索キーが確定文字「携」であり、ノードXが綴り補完辞書データ431Bにおけるノードi1「携帯」である場合も部分一致する。ノードi1「携帯」には補完単位番号「1」が付与されており、下流のノードi2「の」、ノードi3「画面」にも同じ補完単位番号「1」が付与されている。従って、変換候補抽出部130は、ノードi1+ノードi2+ノードi3を同一補完単位ノード列とし、ノードi1、i2、i3の綴りを結合した「携帯の画面」、及び、ノードi3の出現回数を対応付けて結果テーブル450に追加する。   Further, the search key is the confirmed character “mobile”, and the node X is also the node i1 “mobile” in the spelling complement dictionary data 431B. The node i1 “mobile” is assigned the complementary unit number “1”, and the downstream node i2 “no” and the node i3 “screen” are also assigned the same complementary unit number “1”. Therefore, the conversion candidate extraction unit 130 associates the node i1 + node i2 + node i3 with the same complement unit node string and associates the spelling of the nodes i1, i2, and i3 with the number of appearances of the node i3. To the result table 450.

そして、比較すべきノードがまだ残っていれば(S606:NO)、S601へ戻る。全てのノードXについて比較が終了していれば(S606:YES)、当該先頭確定処理を終了する。   If nodes to be compared still remain (S606: NO), the process returns to S601. If the comparison has been completed for all nodes X (S606: YES), the head determination process is terminated.

一方、完全一致の場合(S604:NO、S607:YES)、変換候補抽出部130は、綴り補完辞書から、綴り補完辞書のノードXと、当該ノードXの1つ下流のノードの同一補完単位ノード列の綴りを読み出して結合し、結果テーブル450に追加する(S608)。このとき、変換候補抽出部130は、ノード列の最後のノードに付加された出現回数を綴り補完辞書から読み出し、綴りと対応づけて結果テーブル450に書き込む。この例を図17(c)に示す。   On the other hand, in the case of a perfect match (S604: NO, S607: YES), the conversion candidate extraction unit 130 determines from the spelling complement dictionary the node X of the spelling complement dictionary and the same complement unit node one node downstream of the node X. The column spelling is read and combined, and added to the result table 450 (S608). At this time, the conversion candidate extraction unit 130 reads the number of appearances added to the last node in the node sequence from the spelling complement dictionary, and writes it in the result table 450 in association with the spelling. An example of this is shown in FIG.

図17(c)に示すように、例えば、検索キーが確定文字「新しい」であり、ノードXが綴り補完辞書データ431Bにおけるノードf1「新しい」である場合は完全一致する。ノードf1の1つ下流のノードf2「携帯」、ノードh2「パソコン」、…には補完単位番号「2」が付与され、さらに下流のノードf3、g3には補完単位番号「3」が付与されており、補完単位番号が異なっている。よって、変換候補抽出部130は、(1)ノードf1(ノードX)とノードf2(同一補完単位ノード列)の綴りを結合した「新しい携帯」、及び、ノードf2の出現回数の対応付け、(2)ノードf1(ノードX)とノードh2(同一補完単位ノード列)の綴りを結合した「新しいパソコン」、及び、ノードh2の出現回数の対応付け、…を結果テーブル450に追加する。   As shown in FIG. 17C, for example, when the search key is the confirmed character “new” and the node X is the node f1 “new” in the spelling complement dictionary data 431B, they are completely matched. A node f2 “mobile”, a node h2 “personal computer”,... Downstream of the node f1 is assigned a complement unit number “2”, and further nodes f3 and g3 are assigned a complement unit number “3”. The supplement unit numbers are different. Therefore, the conversion candidate extraction unit 130 (1) associates the spelling of the node f1 (node X) with the spelling of the node f2 (same complementary unit node string) and the number of appearances of the node f2, ( 2) A “new personal computer” in which the spelling of the node f1 (node X) and the node h2 (same complementary unit node string) is combined, and the association of the number of appearances of the node h2, etc. are added to the result table 450.

また、検索キーが確定文字「新しい」であり、ノードXが綴り補完辞書データ431Bにおけるノードj1「新しい」である場合も完全一致する。ノードj1の1つ下流のノードj2「パソコン」には補完単位番号「2」が付与されており、さらに下流のノードj3「の」、ノードj4「発売日」にも補完単位番号「2」が付与されている。よって、変換候補抽出部130は、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4からなる同一補完単位ノード列の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数を対応づけて結果テーブル450に追加する。   In addition, when the search key is the confirmed character “new” and the node X is the node j1 “new” in the spelling complement dictionary data 431B, the search key is completely matched. A complement unit number “2” is assigned to the node j2 “personal computer” that is one downstream of the node j1, and a complement unit number “2” is also assigned to the downstream node j3 “no” and the node j4 “release date”. Has been granted. Therefore, the conversion candidate extraction unit 130 combines the spelling of the same complement unit node sequence consisting of the node j1 (node X) and the node j2 + node j3 + node j4, and the number of appearances of the node j4. Are added to the result table 450 in association with each other.

次いで、変換候補抽出部130は綴り補完辞書に比較すべきノードが残っていないか確認する(S606)。比較すべきノードが残っていれば(S606:NO)、S601へ戻る。一方、比較すべきノードが残っていない場合には(S606:YES)、当該先頭確定処理を終了する。   Next, the conversion candidate extraction unit 130 checks whether there are any remaining nodes to be compared in the spelling complement dictionary (S606). If there are remaining nodes to be compared (S606: NO), the process returns to S601. On the other hand, if there are no remaining nodes to be compared (S606: YES), the head determination process ends.

また、部分一致でも完全一致でもない場合は余剰一致となる(S607:NO)。変換候補抽出部130は、後述する余剰一致処理(S700)を行い、綴り補完辞書に比較すべきノードが残っていないか確認する(S606)。比較すべきノードが残っていれば(S606:NO)、S601へ戻る。一方、比較すべきノードが残っていない場合には(S606:YES)、当該先頭確定処理を終了する。   Further, when neither partial coincidence nor complete coincidence is made, redundant coincidence is determined (S607: NO). The conversion candidate extraction unit 130 performs a surplus matching process (S700), which will be described later, and checks whether there are any remaining nodes to be compared in the spelling complement dictionary (S606). If there are remaining nodes to be compared (S606: NO), the process returns to S601. On the other hand, if there are no remaining nodes to be compared (S606: YES), the head determination process ends.

次に、図18〜図25を参照して余剰一致処理について説明する。図18及び図19は、図16のS700において変換候補抽出部130が実行する余剰処理のフローチャートを示し、図20〜図25は、余剰処理の例を示す。
図18において、変換候補抽出部130は、まず、nに1を代入すると(S701)、綴り補完辞書からノードYn−1の1つ下流のノードYを一つ取得する(S702)。ただし、ノードYはノードXとするため、ノードYはノードXの1つ下流のノードとなる。ノードYの例を図20に示す。
Next, the surplus matching process will be described with reference to FIGS. 18 and 19 show flowcharts of surplus processing executed by the conversion candidate extraction unit 130 in S700 of FIG. 16, and FIGS. 20 to 25 show examples of surplus processing.
18, the conversion candidate extraction unit 130, first, by substituting 1 to n (S701), acquires one node Y 1 next downstream node of the n-1 Y n from spelling complement dictionary (S702). However, since the node Y 0 is the node X, the node Y 1 is a node one downstream of the node X. Examples of node Y 1 shown in FIG. 20.

図20(a)に示すように、例えば、検索キーが「携帯『の』」、または、「携帯の」であり、ノードXが綴り補完辞書データ431Bにおけるノードa1「携帯」である場合、ノードa2「の」、及び、ノードc2「が」がノードYとして選択される。
また、ノードXが綴り補完辞書データ431Bにおけるノードi1「携帯」である場合、ノードi2「の」がノードYとして選択される。
As shown in FIG. 20A, for example, when the search key is “mobile” “no” or “mobile” and the node X is the node a1 “mobile” in the spelling completion dictionary data 431B, the node a2 "no", and the node c2 "ga" is selected as the node Y 1.
Also, if the node X is the node i1 "portable" in the complementation dictionary data 431B spelling, node i2 "no" is selected as the node Y 1.

一方、図20(b)に示すように、検索キーが「新しい『ぱ』」であり、ノードXが綴り補完辞書データ431Bにおけるノードf1「新しい」である場合、一つ下流のノードf2「携帯」、及び、h2「パソコン」がノードYとして選択される。
また、検索キーが「新しい『ぱ』」であり、ノードXが綴り補完辞書データ431Bにおけるノードj1「新しい」である場合、ノードj2「パソコン」がノードYとして選択される。
On the other hand, as shown in FIG. 20B, when the search key is “new“ pa ”and the node X is the node f1“ new ”in the spelling complement dictionary data 431B, one downstream node f2“ mobile ” "and, h2" PC "is selected as the node Y 1.
In addition, the search key is "new" path "", if the node X is a node j1 "new" in the supplement dictionary data 431B spelling, node j2 "PC" is selected as the node Y 1.

次いで、変換候補抽出部130は、検索キーからノードYn−1を削除した余りキーαを生成すると、この余りキーαが「ひらがなのみ」からなる「未確定部」であるか否か判断する(S703)。ここで、図21(a)にS703がYESの例を示し、図21(b)にS703がNOの例を示す。図21(a)には、検索キーが「携帯『のが』」である場合、余りキーαが未確定部『のが』となることが、図21(b)には、検索キーが「携帯の『が』」である場合、余りキーαが確定部と未確定部が含まれる「の『が』」となることを示している。 Next, when the conversion candidate extraction unit 130 generates a remainder key α n obtained by deleting the node Y n−1 from the search key, it is determined whether or not the remainder key α n is an “unconfirmed part” composed of “Hiragana only”. Judgment is made (S703). Here, FIG. 21A shows an example in which S703 is YES, and FIG. 21B shows an example in which S703 is NO. The FIG. 21 (a), the case where the search key is a "portable" of it "" to be a very key alpha 1 is undetermined portion "that" in FIG. 21 (b), the search key It indicates that the case of "portable" ga "," very key alpha 1 is included deterministic part and undetermined portion "of" ga "".

余りαが「ひらがなのみ」からなる「未確定部」である場合には(S703:YES)、変換候補抽出部130は、読み補完辞書から、ノードYn−1の1つ下流のノードYと対応するノードyを検索して取得する(S704)。そして、変換候補抽出部130は、余りキーαが前方一致し、かつ、ノードyと部分一致ないし完全一致するか判定する(S705)。 If the remainder α n is an “undetermined part” consisting of “Hiragana only” (S703: YES), the conversion candidate extraction unit 130 moves from the reading completion dictionary one node Y downstream of the node Y n−1. The node yn corresponding to n is searched and acquired (S704). Then, the conversion candidate extraction unit 130 determines whether or not the remainder key α n matches forward and partially matches or completely matches the node y n (S705).

そして、余りキーαがノードyと前方一致し、かつ、部分一致ないし完全一致する場合(S705:YES)、変換候補抽出部130は、綴り補完辞書より、ノードYからノードYの同一補完単位ノード列までの綴りをノード列Yとして取得すると、ノードXとノード列Yの綴り結合し、結果テーブル450に追加する(S706)。このとき、変換候補抽出部130は、ノード列Yの最後のノードの出現回数を綴り補完辞書から読み出し、綴りと対応づけて結果テーブル450に書き込む。 If the remainder key α n matches forward with the node y n and also partially matches or completely matches (S705: YES), the conversion candidate extraction unit 130 searches the node Y 1 to the node Y n from the spelling complement dictionary. When the spelling up to the same complement unit node string is acquired as the node string Y, the node X and the node string Y are spell-joined and added to the result table 450 (S706). At this time, the conversion candidate extraction unit 130 reads the appearance count of the last node in the node string Y from the spelling complement dictionary, and writes it in the result table 450 in association with the spelling.

一方、S705において、余りキーαがノードyに含まれないと判断した場合(S705:NO)、変換候補抽出部130は、ノードyが前方一致を条件として余りキーαに含まれるか、つまり、余りキーαがノードyに対して余剰一致するかを判断する(S708)。余りキーαがノードyに対して余剰一致する場合(S708:YES)、現在のnの値に1加算し(S709)、余りキーαn−1からノードyn−1を削除して余りキーαを生成すると(S710)、S704からの処理を行なう。
例えば、S709において、nの値が2に更新された場合、S710において、変換候補抽出部130は、余りキーαからノードyを削除した余りにより余りキーαを生成し、S704において、ノードyの1つ下流のノードyを取得する。次いで、生成した余りキーαがノードyに、前方一致を条件として含まれるか判断する。
上記例を図22に示す。ただし、図22では、結果テーブルに書き込まれる出現回数は省略している。S706の処理の後、変換候補抽出部130は、S707へ進む。
On the other hand, when it is determined in S705 that the remainder key α n is not included in the node y n (S705: NO), the conversion candidate extraction unit 130 includes the node y n in the remainder key α n on the condition that forward matching is used. or, in other words, less key alpha n determines whether the excess matched against nodes y n (S708). When the remainder key α n is redundantly matched with the node y n (S708: YES), 1 is added to the current value of n (S709), and the node y n-1 is deleted from the remainder key α n-1. When the remainder key α n is generated (S710), the processing from S704 is performed.
For example, in S709, when the value of n is updated to 2, in S710, the conversion candidate extracting unit 130 generates a key alpha 2 remainder by remainder obtained by deleting the node y 1 from a remainder key alpha 1, in S704, obtaining one downstream node y 2 nodes y 1. Next, it is determined whether or not the generated remainder key α 2 is included in the node y 2 on the condition that a forward match is made.
The above example is shown in FIG. However, in FIG. 22, the number of appearances written in the result table is omitted. After the process of S706, the conversion candidate extraction unit 130 proceeds to S707.

図22(a)に示すように、検索キーが「新しい『ぱ』」、余りキーαが『ぱ』、ノードXがノードf1「新しい」、ノードYがノードf2「携帯」、ノードh2「パソコン」である場合、変換候補抽出部130は、ノードyとして、読み補完辞書データ431Aからノードf2’の読み「けいたい」、ノードh2’の読み「ぱそこん」を取得する。余りキーαとノードh2’の読みは前方一致かつ部分一致するため、変換候補抽出部130は、綴り補完辞書データ431Bにおいて、ノードh2’に対応したノードh2を特定する。ノードh2「パソコン」には補完単位番号「2」が付与され、ノードh2の1つ下流のノードh3には補完単位番号「3」が付与されており、補完単位番号が異なっているため、変換候補抽出部130は、ノードh2のみを同一補完単位ノード列とし、このノードh2の同一補完単位ノード列をノード列Yとする。ノード変換候補抽出部130は、ノードf1(ノードX)と、ノードh2(ノード列Y)の綴りを結合した「新しいパソコン」、及び、ノードh2の出現回数を対応づけて結果テーブル450に追加する。 As shown in FIG. 22 (a), the search key "new" path "," very key alpha 1 is "Pas", the node X to the node f1 "new", the node Y 1 node f2 "mobile" node h2 If it is "PC", the conversion candidate extraction unit 130, a node y 1, read supplement dictionary data 431A from node f2 'reading' form ", node h2 'to obtain the reading" PC "in the. Remainder 'for reading to forward matching and broad, the conversion candidate extraction unit 130, the spelling supplement dictionary data 431 B, node h2' key alpha 1 and node h2 identifying a node h2 corresponding to. The node h2 “PC” is assigned the complement unit number “2”, the node h3 one downstream of the node h2 is assigned the complement unit number “3”, and the complement unit number is different. The candidate extraction unit 130 sets only the node h2 as the same complement unit node string, and sets the same complement unit node string of the node h2 as the node string Y. The node conversion candidate extraction unit 130 associates the spelling of the node f1 (node X) with the spelling of the node h2 (node string Y) and the number of appearances of the node h2, and adds them to the result table 450. .

また、検索キーが「新しい『ぱ』」、余りキーαが『ぱ』、ノードXがノードj1「新しい」、ノードYがノードj2「パソコン」である場合、変換候補抽出部130は、ノードyとして、読み補完辞書データ431Aからノードj2’の読み「ぱそこん」を取得する。余りキーα『ぱ』とノードj2’の読みは前方一致かつ部分一致する。変換候補抽出部130は、ノードj2の同一補完単位ノード列として、ノードj2「パソコン」+ノードj3「の」+ノードj4「発売日」を綴り補完辞書データ431Bから読み出し、ノード列Yとする。変換候補抽出部130は、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数を対応づけて結果テーブル450に追加する。 Also, the search key "new" path "," very key alpha 1 is "Pas", the node X to the node j1 "new", if the node Y 1 is the node j2 "PC", the conversion candidate extraction unit 130, as a node y 1, to get the "PC" from reading complement dictionary data 431A node j2 'reading of. The readings of the remainder key α 1 “Pa” and the node j2 ′ are forward coincident and partial coincidence. The conversion candidate extraction unit 130 reads node j2 “personal computer” + node j3 “no” + node j4 “release date” from the spelling completion dictionary data 431B as the same complement unit node string of the node j2, and sets it as the node string Y. The conversion candidate extraction unit 130 associates the spelling of the node j1 (node X) with the spelling of the node j2 + node j3 + node j4 (node string Y) and the number of appearances of the node j4. It adds to the result table 450.

一方、図22(b)に示すように、検索キーが「新しい『ぱそこんの』」、余りキーαが『ぱそこんの』、ノードXがノードf1「新しい」、ノードYがノードf2「携帯」、ノードh2「パソコン」である場合、変換候補抽出部130は、ノードyとして、読み補完辞書データ431Aからノードf2’の読み「けいたい」、ノードh2’の読み「ぱそこん」を取得する。余りキーαはノードh2’の読みと余剰一致するため、変換候補抽出部130は、余りキーαからノードh2’(ノードy)を削除した余りキーα『の』を生成するとともに、読み補完辞書データ431Aからノードh2’の1つ下流のノードh3’「の」を読み出してノードyとする。余りキーαとノードh3’は完全一致するため、変換候補抽出部130は、綴り補完辞書データ431Bにおいて、ノードh3の同一補完単位ノード列として、ノードh3「の」+ノードh4「発売日」を特定すると、ノードYからノードYの同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードf1(ノードX)と、ノードh2+ノードh3+ノードh4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードh4の出現回数を対応づけて結果テーブル450に追加する。 On the other hand, as shown in FIG. 22 (b), "new" PC "," search key, much the key alpha 1 is "PC", the node X to the node f1 "new", the node Y 1 node f2 "Mobile "If a node h2" PC ", the conversion candidate extraction unit 130, a node y 1, read supplement dictionary data 431A from node f2 'reading'form", node h2 'to obtain the reading "PC" in . Since the remainder key α 1 is redundantly coincident with the reading of the node h 2 ′, the conversion candidate extraction unit 130 generates a remainder key α 2 “no” obtained by deleting the node h 2 ′ (node y 1 ) from the remainder key α 1. , and node y 2 reads out the "no"'one downstream node h3 of' node h2 from reading complement dictionary data 431A. Remainder key alpha 2 and the node h3 'for the exact match, the conversion candidate extraction unit 130, the spelling supplement dictionary data 431 B, as the same complementary units node sequence of nodes h3, node h3 "of" + node h4 "Date" Is specified as the node string Y from the node Y 1 to the same complementary unit node string of the node Y 2 . The conversion candidate extracting unit 130 associates the spelling of the node f1 (node X) with the spelling of the node h2 + node h3 + node h4 (node row Y) and the number of appearances of the node h4. It adds to the result table 450.

また、検索キーが「新しい『ぱそこんの』」、余りキーαが『ぱそこんの』、ノードXがノードj1「新しい」である場合も同様の処理により、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数の対応付けが結果テーブル450に追加される。 Further, when the search key is “new“ pason ”, the remainder key α 1 is“ pason ”, and the node X is“ new ”, the node j1 (node X) and the node j2 + The “new PC release date” combined with the spelling of node j3 + node j4 (node row Y) and the number of appearances of node j4 are added to result table 450.

一方、余りキーαがノードyに対して余剰一致しない場合(S708:NO)、すなわち、図22(c)に示すような場合には、直接、S707へ進む。
図22(c)に示すように、例えば、検索キーが「携帯『から』」、余りキーαが『から』である場合、ノードXがノードa1、i1「携帯」のいずれであっても、ノードyと余りキーは部分一致も完全一致も余剰一致もしない。
また、検索キーが「携帯『のがめんがきえた』」である場合、n=2まで、つまり、余りキーα「のがめんがきえた」とノードy「の」、余りキーα「がめんがきえた」とノードy「がめん」は余剰一致するが、n=3のとき、つまり、余りキーαが「がきえた」となったところで、S704でノードY、ノードyが取得できず、S705及びS708においてNOと判定される。
On the other hand, when the surplus key α n does not coincide with the node y n (S708: NO), that is, in the case shown in FIG. 22C, the process directly proceeds to S707.
As shown in FIG. 22 (c), for example, the search key "portable" from "," less if the key alpha 1 is "from", be any node X to the node a1, i1 of "portable" , The node y 1 and the remainder key do not have partial match, complete match or surplus match.
Also, if the search key is “mobile phone“ no mangamen ””, up to n = 2, that is, the remainder key α 1 “no anger has gone” and node y 1 “no”, the remainder key α 2 “Gamen is clear” and node y 2 “Gamen” are redundantly matched, but when n = 3, that is, when the remainder key α 3 becomes “clear”, node Y 4 in S704 , can not obtain a node y 4 is determined as NO in S705 and S 708.

その後、比較すべきノードYがまだ残っていれば(S707:NO)、S701へ戻り、まだ比較を行なっていないノードYを1つ選択して以降の処理を行う。一方、全てのノードYについて比較が終了していれば(S707:YES)、当該余剰一致処理を終了する。 Thereafter, any remaining still Node Y 1 to be compared (S707: NO), returns to S701, performs still one node Y 1 that is not performed compared selected and subsequent processing. On the other hand, if the comparison of all the nodes Y 1 has been completed (S707: YES), ends the surplus matching.

また、余りキーαの中に確定文字列があるか、未確定部のみであっても、ひらがなだけではない場合(S703:NO)、変換候補抽出部130は、余りキーαがノードYと部分一致または完全一致するか判定する(S711)。そして、余りキーαがノードYと部分一致または完全一致する場合(S711:YES)、変換候補抽出部130は、綴り補完辞書より、ノードYからノードYの同一補完単位ノード列までの綴りをノード列Yとして取得すると、ノードXとノード列Yの綴りを結合し、結果テーブル450に追加する(S712)。この例を図23(a)、(b)に示す。ただし、図23では、結果テーブルに書き込まれる出現回数は省略している。その後、S707へ進む。 If there is a confirmed character string in the remainder key α n or only the unconfirmed part is not only hiragana (S703: NO), the conversion candidate extraction unit 130 determines that the remainder key α n is the node Y It is determined whether or not n matches partly or completely (S711). If the remainder key α n partially matches or completely matches the node Y n (S711: YES), the conversion candidate extraction unit 130 from the spelling complement dictionary to the same complement unit node string of the node Y n from the node Y 1 Is acquired as the node string Y, the spelling of the node X and the node string Y is combined and added to the result table 450 (S712). This example is shown in FIGS. 23 (a) and (b). However, in FIG. 23, the number of appearances written in the result table is omitted. Thereafter, the process proceeds to S707.

図23(a)において、検索キーが「携帯の」、余りキーαが「の」であり、ノードXがノードa1「携帯」、ノードYがノードa2「の」である場合、変換候補抽出部130は、ノードYと余りキーαが完全一致すると判断する(S711:YES)。変換候補抽出部130は、ノードa2の同一補完単位ノード列として、ノードa2「の」+ノードa3「画面」、及び、ノードa2「の」+ノードb3「ありか」を綴り補完辞書データ431Bから読み出し、ノード列Yとする。変換候補抽出部130は、(1)ノードa1と、ノードa2+ノードa3(ノード列Y)の綴りを結合した「携帯の画面」、及び、ノードa3の出現回数の対応付け、(2)ノードa1と、ノードa2+ノードb3(ノード列Y)の綴りを結合した「携帯のありか」、及び、ノードb3の出現回数の対応付けを結果テーブル450に追加する。
なお、ノードXがノードi1「携帯」、ノードYがノードi2「の」である場合も同様に、「携帯の画面」、及び、ノードi3の出現回数の対応付けがが結果テーブル450に追加される。
In FIG. 23 (a), the search key "mobile", a remainder key alpha 1 is "no", the node X to the node a1 "portable", when the node Y 1 is the node a2 "of" conversion candidate The extraction unit 130 determines that the node Y 1 and the remainder key α 1 completely match (S711: YES). The conversion candidate extraction unit 130 sets the node a2 “no” + the node a3 “screen” and the node a2 “no” + the node b3 “whether” from the spelling complement dictionary data 431B as the same complement unit node sequence of the node a2. Read, node node Y. The conversion candidate extraction unit 130 associates (1) the “portable screen” in which the spelling of the node a1 and the node a2 + node a3 (node row Y) is combined with the number of appearances of the node a3, and (2) the node a1. Are added to the result table 450, and the association of “the presence of mobile phone” that combines the spelling of the node a 2 + node b 3 (node row Y) and the number of appearances of the node b 3 is added.
Incidentally, also when the node X is the node i1 "mobile", the node Y 1 node i2 "no", "mobile screen", and the association of the number of occurrences of the node i3 is the result added to the table 450 Is done.

図23(b)において、検索キーが「新しいパ」、余りキーαが「パ」、ノードXがノードf1「新しい」、ノードYがノードh2「パソコン」である場合、変換候補抽出部130は、ノードYと余りキーαが部分一致すると判断する(S711:YES)。ノードh2「パソコン」には補完単位番号「2」が付与され、ノードh2の1つ下流のノードh3には補完単位番号「3」が付与されており、補完単位番号が異なっているため、変換候補抽出部130は、ノードh2のみを同一補完単位ノード列とし、このノードh2の同一補完単位ノード列をノード列Yとする。ノード変換候補抽出部130は、ノードf1(ノードX)と、ノードh2(ノード列Y)の綴りを結合した「新しいパソコン」、及び、ノードh2の出現回数を対応づけて結果テーブル450に追加する。 In FIG. 23B, when the search key is “new pa”, the remainder key α 1 is “pa”, the node X is the node f1 “new”, and the node Y 1 is the node h2 “personal computer”, the conversion candidate extraction unit 130 determines that the node Y 1 and less key alpha 1 match part (S711: YES). The node h2 “PC” is assigned the complement unit number “2”, the node h3 one downstream of the node h2 is assigned the complement unit number “3”, and the complement unit number is different. The candidate extraction unit 130 sets only the node h2 as the same complement unit node string, and sets the same complement unit node string of the node h2 as the node string Y. The node conversion candidate extraction unit 130 associates the spelling of the node f1 (node X) with the spelling of the node h2 (node string Y) and the number of appearances of the node h2, and adds them to the result table 450. .

また、検索キーが「新しいパ」、余りキーαが「パ」、ノードXがノードj1「新しい」、ノードYがノードj2「パソコン」である場合、変換候補抽出部130は、ノードYと余りキーαが部分一致すると判断する(S711:YES)。変換候補抽出部130は、ノードj2の同一補完単位ノード列として、ノードj2「パソコン」+ノードj3「の」+ノードj4「発売日」を読み出し、ノード列Yとする。変換候補抽出部130は、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数を対応づけて結果テーブル450に追加する。 Also, if the search key is a "new path", too key alpha 1 is "Pas", the node X to the node j1 "new", the node Y 1 is a node j2 "PC", the conversion candidate extraction unit 130, the node Y 1 and less key alpha 1 determines that partially match (S711: YES). The conversion candidate extraction unit 130 reads node j2 “personal computer” + node j3 “no” + node j4 “release date” as the same complement unit node string of node j2, and sets it as node string Y. The conversion candidate extraction unit 130 associates the spelling of the node j1 (node X) with the spelling of the node j2 + node j3 + node j4 (node string Y) and the number of appearances of the node j4. It adds to the result table 450.

その後、比較すべきノードYがまだ残っていれば(S707:NO)、S701へ戻る。一方、全てのノードYについて比較が終了していれば(S707:YES)、当該余剰一致処理を終了する。 Then, if still remains nodes Y 1 to be compared (S707: NO), it returns to S701. On the other hand, if the comparison of all the nodes Y 1 has been completed (S707: YES), ends the surplus matching.

一方、余りキーαがノードYと部分一致も完全一致もしない場合(S711:NO)、図19において、変換候補抽出部130は、余りキーαがノードYを包含するか否か判定する(S713)。そして、余りキーαがノードYを包含しない場合(S713:NO)、すなわち、図23(c)に示すような場合には、図18のS707へ進む。
図23(c)において、例えば、検索キーが「携帯から」、余りキーαが「から」である場合、ノードXがノードa1、i1「携帯」のいずれであっても、ノードYと余りキーαは部分一致も完全一致もせず、余りキーαはノードYを包含しない。
On the other hand, when the remainder key α n does not partially match or completely match the node Y n (S711: NO), in FIG. 19, the conversion candidate extraction unit 130 determines whether or not the remainder key α n includes the node Y n . Determination is made (S713). When the remainder key α n does not include the node Y n (S713: NO), that is, in the case as shown in FIG. 23C, the process proceeds to S707 in FIG.
In FIG. 23 (c), the example, "from the mobile" search key, when the remainder key alpha 1 is "from", be any node X to the node a1, i1 of "mobile", and the node Y 1 The remainder key α does not match partly or completely, and the remainder key α 1 does not include the node Y 1 .

一方、図19において、余りキーαがノードYを包含する場合(S713:YES)、変換候補抽出部130は、余りキーαから更にノードYを除いた余りキーαn+1を作成し、余りキーαn+1が「ひらがなのみ」からなる「未確定部」であるか否か判定する(S714)。
余りキーαn+1がひらがなのみからなる未確定部である場合(S714:YES)、変換候補抽出部130は、ノードYの1つ下流のノードYn+1と対応するノードyn+1を読み補完辞書から取得すると(S715)、余りキーαn+1がノードyn+1と部分一致または完全一致するか判定する(S716)。そして、余りキーαn+1がノードyn+1と部分一致または完全一致する場合(S716:YES)、変換候補抽出部130は、綴り補完辞書より、ノードYからノードYn+1の同一補完単位ノード列までの綴りをノード列Yとして取得すると、ノードX+ノード列Yの綴りを結合して、結果テーブル450に追加する(S717)。このとき、変換候補抽出部130は、ノード列Yの最後のノードに付加された出現回数を綴り補完辞書から読み出し、綴りと対応づけて結果テーブル450に書き込む。
On the other hand, in FIG. 19, when the remainder key alpha n encompasses the node Y n (S713: YES), the conversion candidate extracting unit 130 further creates a very key alpha n + 1, except for the node Y n from a remainder key alpha n Then, it is determined whether or not the remainder key α n + 1 is an “undetermined part” composed of “Hiragana only” (S714).
Less if the key alpha n + 1 is an undetermined portion consisting of only Hiragana (S714: YES), the conversion candidate extraction unit 130, from one downstream node Y n + 1 and complementary dictionary read node y n + 1 corresponding node Y n When acquired (S715), it is determined whether the remainder key α n + 1 partially matches or completely matches the node y n + 1 (S716). If the remainder key α n + 1 partially matches or completely matches the node y n + 1 (S716: YES), the conversion candidate extraction unit 130 determines from the spelling complement dictionary to the same complement unit node string of the node Y 1 to the node Y n + 1. Is acquired as the node string Y, the spelling of the node X + the node string Y is combined and added to the result table 450 (S717). At this time, the conversion candidate extraction unit 130 reads the appearance count added to the last node of the node string Y from the spelling complement dictionary, and writes it in the result table 450 in association with the spelling.

一方、S716において、余りキーαn+1がノードyn+1と部分一致も完全一致もしないと判断した場合(S716:NO)、変換候補抽出部130は、ノードyn+1が前方一致を条件として余りキーαn+1に含まれるか、つまり、余りキーαn+1がノードyn+1に対して余剰一致するかを判断する(S718)。余りキーαn+1がノードyn+1に対して余剰一致する場合(S718:YES)、現在のnの値に1加算し(S719)、余りキーαからノードyを削除して余りキーαn+1を生成すると(S720)、S715からの処理を行なう。
例えば、S719において、nの値が2に更新された場合、S720において、変換候補抽出部130は、余りキーαからノードyを削除した余りにより余りキーαを生成し、S715において、ノードyの1つ下流のノードyを取得する。次いで、S716生成した余りキーαがノードyに、部分一致または前方一致するかを判断する。
On the other hand, in S716, when it is determined that the remainder key α n + 1 does not partially match or completely match the node y n + 1 (S716: NO), the conversion candidate extraction unit 130 uses the remainder key α as a condition that the node y n + 1 is a forward match. It is determined whether it is included in n + 1 , that is, whether the remainder key α n + 1 is redundantly matched with the node y n + 1 (S718). Remainder when the key alpha n + 1 is redundant match for the node y n + 1 (S718: YES ), 1 is added to the value of the current n (S719), the key alpha n + 1 remainder remove the node y n from the remainder key alpha n Is generated (S720), the processing from S715 is performed.
For example, in S719, when the value of n is updated to 2, in S720, the conversion candidate extracting unit 130 generates a key alpha 3 remainder by remainder obtained by deleting the node y 2 from a remainder key alpha 2, in S715, obtaining one downstream node y 3 nodes y 2. Next, it is determined whether or not the remainder key α 3 generated in S716 partially matches or forward matches the node y 3 .

上記の例を図24(a)、(b)、(c)に示す。ただし、図24では、結果テーブルに書き込まれる出現回数は省略している。S717の処理の後、図18のS707へ進む。   The above examples are shown in FIGS. 24 (a), (b), and (c). However, in FIG. 24, the number of appearances written in the result table is omitted. After the process of S717, the process proceeds to S707 in FIG.

図24(a)において、検索キーが「携帯の『が』」、余りキーαが「の『が』」であり、ノードXがノードa1「携帯」、ノードYがノードa2「の」である場合、余りキーαはノードYを包含する。よって、余りキーα『が』を作成する。余りキーαがひらがなのみからなる未確定部であるため(S714:YES)、変換候補抽出部130は、ノードYの次のノードであるノードY、つまりノードa3「画面」に対応したノードa3’の読み「がめん」をノードyとして読み補完辞書データ431Aから読み出す(S715)。ノードyであるノードa3’「がめん」と、余りキーα『が』は部分一致する(S716:YES)。綴り補完辞書データ431Bにおいて、ノードa3には下流のノードがないため、変換候補抽出部130は、ノードa3のみをノードYの同一補完単位ノード列とし、ノードYからノードYの同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードa1(ノードX)と、ノードa2+ノードa3(ノード列Y)の綴りを結合した「携帯の画面」、及び、ノードa3の出現回数を対応づけて結果テーブル450に追加する。
なお、ノードXがノードi1「携帯」、ノードYがノードi2「の」である場合も同様の処理により、ノードi1(ノードX)と、ノードi2+ノードi3(ノード列Y)の綴りを結合した「携帯の画面」、及び、ノードi3の出現回数の対応付けが結果テーブル450に追加される。
In FIG. 24 (a), a search key is "portable" ga "", a remainder key alpha 1 is "a" but "," node X to the node a1 "mobile", the node Y 1 is a node a2 "of" , The remainder key α 1 contains the node Y 1 . Thus, the remainder create a key α 2 "ga". Less for the key alpha 2 is undetermined portion consisting of only Hiragana (S714: YES), the conversion candidate extraction unit 130, the node Y 2 is the next node of the node Y 1, i.e. corresponding to the node a3 "screen" node a3 'read the "screen" as a node y 2 reading of the reading from the complementary dictionary data 431A (S715). Node and y 2 at a node a3 '"screen", a remainder key alpha 2 "ga" is broad match (S716: YES). In spelling supplement dictionary data 431 B, since there is no downstream nodes in the node a3, conversion candidate extracting unit 130, a node a3 only the same complement unit node sequence of node Y 2, the same complement of the node Y 2 from the node Y 1 A node string Y is defined up to the unit node string. The conversion candidate extraction unit 130 associates the spelling of the node a1 (node X) with the spelling of the node a2 + node a3 (node row Y) and the number of appearances of the node a3 in the result table 450. to add.
Incidentally, linked by similar processes when the node X to the node i1 "mobile", the node Y 1 is the node i2 "no", the node i1 and (node X), node i2 + node i3 spelling (node sequence Y) The association between the “portable screen” and the number of appearances of the node i3 is added to the result table 450.

一方、図24(b)において、検索キーが「新しいパソコン『の』」、余りキーαが「パソコン『の』」であり、ノードXがノードf1「新しい」、ノードYがノードh2「パソコン」である場合、余りキーαはノードYを包含する。よって、余りキーα『の』を作成する。余りキーαがひらがなのみからなる未確定部であるため(S714:YES)、変換候補抽出部130は、ノードYの次のノードであるノードY、つまりノードh3「の」に対応したノードh3’の読み「の」をノードyとして読み補完辞書データ431Aから読み出す(S715)。ノードyであるノードh3’「の」と、余りキーα『の』は完全一致するため(S716:YES)、変換候補抽出部130は、ノードh3の同一補完単位ノード列として、ノードh3「の」+ノードh4「発売日」を特定すると、ノードYからノードYの同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードj1(ノードX)と、ノードh2+ノードh3+ノードh4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードh4の出現回数を対応づけて結果テーブル450に追加する。
また、ノードXがノードj1「新しい」、ノードYがノードj2「パソコン」である場合も同様の処理により、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数の対応付けが結果テーブル450に追加される。
On the other hand, in FIG. 24 (b), the search key "new computer" of "", a remainder key alpha 1 is "PC" no "," node X node f1 "new", the node Y 1 node h2 " In the case of “PC”, the remainder key α 1 includes the node Y 1 . Therefore, the remainder key α 2 “NO” is created. Less for the key alpha 2 is undetermined portion consisting of only Hiragana (S714: YES), the conversion candidate extraction unit 130, the node Y 2 is the next node of the node Y 1, corresponding to the words node h3 "of" node h3 'of reading read from the complementary dictionary data 431A to read the the node y 2 "to" (S715). Node and y 2 is the node h3 '' of "a remainder key alpha 2" The "exact match to order (S716: YES), the conversion candidate extraction unit 130, as the same complementary units node sequence of nodes h3, node h3 "the" + node and h4 to identify the "Release Date", and node Y 1 from the node Y 2 of the same complement unit node column until the node column Y. The conversion candidate extraction unit 130 associates the spelling of the node j1 (node X) with the spelling of the node h2 + node h3 + node h4 (node row Y) and the number of appearances of the node h4. It adds to the result table 450.
The node X is the node j1 "new", the same process is when the node Y 1 is the node j2 "PC", spelled nodes j1 and (node X), a node j2 + node j3 + node j4 (node sequence Y) Are associated with the “release date of a new personal computer” and the number of appearances of the node j4.

一方、図24(c)において、検索キーが「新しいパソコン『のは』」、余りキーαが「パソコン『のは』」であり、ノードXがノードf1「新しい」、ノードYがノードh2「パソコン」である場合、余りキーαはノードYを包含する。よって、余りキーα『のは』を作成する。余りキーαがひらがなのみからなる未確定部であるため(S714:YES)、変換候補抽出部130は、ノードYの次のノードであるノードY、つまりノードh3「の」に対応したノードh3’の読み「の」をノードyとして読み補完辞書データ431Aから読み出す(S715)。
ノードyと余りキーαは余剰一致するため(S716:NO、S718:YES)、変換候補抽出部130は、余りキーα『のは』からノードyを削除し、余りキーα『は』を作成する(S719、S720)。変換候補抽出部130は、ノードh3’(ノードy)の1つ下流のノードh4’の読み「はつばいび」をノードyとして読み補完辞書データ431Aから読み出す(S715)。
On the other hand, in FIG. 24C, the search key is “new personal computer“ no-ha ””, the remainder key α 1 is “personal computer“ no-ha ””, the node X is the node f 1 “new”, and the node Y 1 is the node In the case of h2 “personal computer”, the remainder key α 1 includes the node Y 1 . Therefore, the remainder key α 2 “noha” is created. Less for the key alpha 2 is undetermined portion consisting of only Hiragana (S714: YES), the conversion candidate extraction unit 130, the node Y 2 is the next node of the node Y 1, corresponding to the words node h3 "of" node h3 'of reading read from the complementary dictionary data 431A to read the the node y 2 "to" (S715).
Since the node y 2 and the remainder key α 2 are redundantly matched (S716: NO, S718: YES), the conversion candidate extraction unit 130 deletes the node y 2 from the remainder key α 2 “noha”, and the remainder key α 3 “Ha” is created (S719, S720). The conversion candidate extraction unit 130 reads from the supplementary dictionary data 431A the reading “hatsubibi” of the node h4 ′ that is one downstream of the node h3 ′ (node y 2 ) as the node y 3 (S715).

ノードyと余りキーαは部分一致する(S716:YES)。綴り補完辞書データ431Bにおいて、ノードh4には下流のノードがないため、変換候補抽出部130は、ノードh4のみをノードYの同一補完単位ノード列とし、ノードYからノードYの同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードj1(ノードX)と、ノードh2+ノードh3+ノードh4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードh4の出現回数を対応づけて結果テーブル450に追加する。
また、ノードXがノードj1「新しい」、ノードYがノードj2「パソコン」である場合も同様の処理により、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数の対応付けが結果テーブル450に追加される。
The node y 3 and the remainder key α 3 partially match (S716: YES). In spelling supplement dictionary data 431 B, since there is no downstream nodes in the node h4, the conversion candidate extraction unit 130, the node h4 only the same complement unit node sequence of the node Y 3, the same complement of the node Y 3 from the node Y 1 A node string Y is defined up to the unit node string. The conversion candidate extraction unit 130 associates the spelling of the node j1 (node X) with the spelling of the node h2 + node h3 + node h4 (node row Y) and the number of appearances of the node h4. It adds to the result table 450.
The node X is the node j1 "new", the same process is when the node Y 1 is the node j2 "PC", spelled nodes j1 and (node X), a node j2 + node j3 + node j4 (node sequence Y) Are associated with the “release date of a new personal computer” and the number of appearances of the node j4.

一方、余りキーαn+1がノードyn+1に対して余剰一致しない場合(S718:NO)、すなわち、図24(d)に示すような場合には、図18のS707へ進む。 On the other hand, if the surplus key α n + 1 does not coincide with the node y n + 1 (S718: NO), that is, as shown in FIG. 24D, the process proceeds to S707 in FIG.

例えば、図24(d)に示すように、検索キーが「新しいパソコン『が』」、余りキーαが「パソコン『が』」であり、ノードXがノードf1「新しい」、ノードYがノードh2「パソコン」である場合、余りキーα『が』が作成される。ノードY、つまりノードh3「の」に対応したノードh3’(ノードy)の読み「の」は、余りキーαとは部分一致も完全一致も余剰一致もしない。ノードXがノードj1「新しい」、ノードYがノードj2「パソコン」である場合も同様である。
その後、比較すべき下流のノードYがまだ残っていれば(S707:NO)、S701へ戻る。一方、全てのノードYについて比較が終了していれば(S707:YES)、当該余剰一致処理を終了する。
For example, as shown in FIG. 24D, the search key is “new personal computer“ GA ””, the remainder key α 1 is “PC“ GA ””, node X is node f 1 “new”, and node Y 1 is In the case of the node h2 “personal computer”, the remainder key α 2 “ga” is created. The reading “NO” of the node Y 2 , that is, the node h 3 ′ (node y 2 ) corresponding to the node h 3 “NO” has no partial match, complete match, or redundant match with the remainder key α 2 . Node X node j1 "new", node Y 1 is also the same in cases where it is a node j2 "PC".
Then, if still remains downstream node Y 1 to be compared (S707: NO), it returns to S701. On the other hand, if the comparison of all the nodes Y 1 has been completed (S707: YES), ends the surplus matching.

一方、図19において、余りキーαn+1が「ひらがなのみ」からなる「未確定部」でない場合(S714:NO)、変換候補抽出部130は、余りキーαn+1がノードYの1つ下流のノードYn+1と部分一致または完全一致するか判定する(S721)。余りキーαn+1とノードYn+1が部分一致または完全一致の場合(S721:YES)、変換候補抽出部130は、綴り補完辞書より、ノードYからノードYn+1の同一補完単位ノード列までの綴りをノード列Yとして取得すると、ノードX+ノード列Yを結果テーブル450に追加する(S722)。このとき、変換候補抽出部130は、ノード列Yの最後のノードの出現回数を綴り補完辞書から読み出し、綴りと対応づけて結果テーブル450に書き込む。 On the other hand, in FIG. 19, when the remainder key α n + 1 is not an “undecided part” consisting of “Hiragana only” (S714: NO), the conversion candidate extraction unit 130 has the remainder key α n + 1 one downstream of the node Y n. It is determined whether the node Yn + 1 partially matches or completely matches (S721). Less if the key alpha n + 1 and the node Y n + 1 are partial or exact match (S721: YES), the conversion candidate extraction unit 130, spelling than spelling complement dictionary, from the node Y 1 to node Y n + 1 of the same complementary units node sequence Is acquired as the node string Y, the node X + the node string Y is added to the result table 450 (S722). At this time, the conversion candidate extraction unit 130 reads the appearance count of the last node in the node string Y from the spelling complement dictionary, and writes it in the result table 450 in association with the spelling.

一方、S721において、余りキーαn+1がノードyn+1に含まれないと判断した場合(S721:NO)、変換候補抽出部130は、ノードyn+1が前方一致を条件として余りキーαn+1に含まれるか、つまり、余りキーαn+1がノードyn+1に対して余剰一致するかを判断する(S723)。余りキーαn+1がノードyn+1に対して余剰一致する場合(S723:YES)、現在のnの値に1加算し(S724)、S714からの処理を行なう。
例えば、S724において、nの値が2に更新された場合、S714において、変換候補抽出部130は、余りキーαからノードYを削除した余りにより余りキーαを生成し、余りキーαが未確定ひらがなかを判断する。
上記例を図25(a)、(b)、(c)に示す。ただし、図25においては、結果テーブルに書き込まれる出現回数は省略している。S722の処理の後、あるいは、S723において余りキーαn+1がノードyn+1に対して余剰一致しないと判断された場合(S723:NO)、変換候補抽出部130は、図18のS707へ進む。
On the other hand, when it is determined in S721 that the remainder key α n + 1 is not included in the node y n + 1 (S721: NO), the conversion candidate extraction unit 130 includes the node y n + 1 in the remainder key α n + 1 on the condition of a forward match. That is, it is determined whether the remainder key α n + 1 is redundantly matched with the node y n + 1 (S723). If the remainder key α n + 1 is redundantly matched with the node y n + 1 (S723: YES), 1 is added to the current value of n (S724), and the processing from S714 is performed.
For example, in S724, when the value of n is updated to 2, in S714, the conversion candidate extracting unit 130 generates a key alpha 3 remainder by remainder obtained by deleting the node Y 2 from the remainder key alpha 2, remainder key alpha 3 determines whether the hiragana is unconfirmed.
The above examples are shown in FIGS. 25 (a), (b), and (c). However, in FIG. 25, the number of appearances written in the result table is omitted. After the process of S722 or when it is determined in S723 that the surplus key α n + 1 does not coincide with the node y n + 1 (S723: NO), the conversion candidate extraction unit 130 proceeds to S707 in FIG.

図25(a)において、例えば、検索キーが「新しいパソコンの」、余りキーαが「パソコンの」であり、ノードXがノードf1「新しい」、ノードYがノードh2「パソコン」である場合、余りキーα「パソコンの」は、ノードYであるノードh2「パソコン」を包含するため、余りキーα「の」を作成する。ノードY、つまりノードh3「の」と、余りキーαは完全一致するため(S721:YES)、変換候補抽出部130は、ノードh3の同一補完単位ノード列として、ノードh3「の」+ノードh4「発売日」を特定すると、ノードYからノードYの同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードf1(ノードX)と、ノードh2+ノードh3+ノードh4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードh4の出現回数を対応づけて結果テーブル450に追加する。 In FIG. 25 (a), a example, the search key is "new PC", a remainder key alpha 1 is "PC", the node X to the node f1 "new", the node Y 1 node h2 is "PC" In this case, since the remainder key α 1 “personal computer” includes the node h 2 “personal computer” that is the node Y 1 , the remainder key α 2 “no” is created. Since the node Y 2 , that is, the node h 3 “no” and the remainder key α 2 completely match (S 721: YES), the conversion candidate extraction unit 130 sets the node h 3 “no” + as the same complement unit node string of the node h 3. When you identify the node h4 "Release Date", from the node Y 1 to the same complement unit node column of the node Y 2 and node row Y. The conversion candidate extracting unit 130 associates the spelling of the node f1 (node X) with the spelling of the node h2 + node h3 + node h4 (node row Y) and the number of appearances of the node h4. It adds to the result table 450.

また、ノードXがノードj1「新しい」、ノードYがノードj2「パソコン」である場合も同様の処理により、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数の対応づけが結果テーブル450に追加される。 The node X is the node j1 "new", the same process is when the node Y 1 is the node j2 "PC", spelled nodes j1 and (node X), a node j2 + node j3 + node j4 (node sequence Y) Are added to the result table 450. The “new PC release date” and the number of appearances of the node j4 are associated with each other.

図25(b)に示すように、例えば、検索キーが「新しいパソコンの発」、余りキーαが「パソコンの発」であり、ノードXがノードf1「新しい」、ノードYがノードh2「パソコン」である場合、余りキーα「パソコンの発」は、ノードYであるノードh2「パソコン」を包含するため、変換候補抽出部130は、余りキーα「の発」を作成するとともに、ノードh2「パソコン」の1つ下流のノードであるh3の綴り「の」をノードYとして綴り補完辞書データ431Bから読み出す。
余りキーαはノードYと余剰一致するため(S721:NO、S723:YES)、変換候補抽出部130は、余りキーαからノードh3(ノードY)を削除した余りキーα「発」を生成する。余りキーαは未確定ひらがなではないため(S714:NO)、変換候補抽出部130は、ノードh3「の」の1つ下流のノードであるh4の綴り「発売日」をノードYとして綴り補完辞書データ431Bから読み出す。
Figure 25 (b) as shown in, for example, the search key "calling of new personal computer" is a very key α 1 is "the calling of the personal computer", the node X is node f1 "new", node Y 1 is node h2 In the case of “personal computer”, since the remainder key α 1 “departure of personal computer” includes the node h2 “personal computer” which is node Y 1 , the conversion candidate extraction unit 130 creates the remainder key α 2 “departure”. to together, read from spelling supplement dictionary data 431B node h2 spelling h3 is one downstream node of the "PC", "no" as a node Y 2.
Remainder key alpha 2 Node Y 2 and excess matched for (S721: NO, S723: YES ), the conversion candidate extraction unit 130, too key alpha 2 from the node h3 (node Y 2) less key alpha 3 deleting the " Generate ". Since much key alpha 3 is not undetermined hiragana (S714: NO), the conversion candidate extraction unit 130, spelling node h3 "of" is one downstream node of h4 spelling the "Date" as the node Y 3 Read from the complementary dictionary data 431B.

余りキーαはノードYと部分一致する(S721:YES)。綴り補完辞書データ431Bにおいて、ノードh4には下流のノードがないため、変換候補抽出部130は、ノードh4のみをノードYの同一補完単位ノード列とし、ノードYからノードYの同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードj1(ノードX)と、ノードh2+ノードh3+ノードh4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードh4の出現回数を対応づけて結果テーブル450に追加する。 Remainder key alpha 3 coincides node Y 3 and part (S721: YES). In spelling supplement dictionary data 431 B, since there is no downstream nodes in the node h4, the conversion candidate extraction unit 130, the node h4 only the same complement unit node sequence of the node Y 3, the same complement of the node Y 3 from the node Y 1 A node string Y is defined up to the unit node string. The conversion candidate extraction unit 130 associates the spelling of the node j1 (node X) with the spelling of the node h2 + node h3 + node h4 (node row Y) and the number of appearances of the node h4. It adds to the result table 450.

また、ノードXがノードj1「新しい」、ノードYがノードj2「パソコン」である場合も同様の処理により、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数の対応付けが結果テーブル450に追加される。 The node X is the node j1 "new", the same process is when the node Y 1 is the node j2 "PC", spelled nodes j1 and (node X), a node j2 + node j3 + node j4 (node sequence Y) Are associated with the “release date of a new personal computer” and the number of appearances of the node j4.

図25(c)に示すように、例えば、検索キーが「新しいパソコンの『は』」、余りキーαが「パソコンの『は』」であり、ノードXがノードf1「新しい」、ノードYがノードh2「パソコン」である場合、余りキーα「パソコンの『は』」は、ノードYであるノードh2「パソコン」を包含するため、変換候補抽出部130は、余りキーα「の『は』」を作成するとともに、ノードh2「パソコン」の1つ下流のノードであるh3の綴り「の」をノードYとして綴り補完辞書データ431Bから読み出す。
余りキーαはノードYと余剰一致するため(S721:NO、S723:YES)、変換候補抽出部130は、余りキーαからノードh3(ノードY)を削除した余りキーα『は』を生成する。余りキーαは未確定ひらがなであるため(S714:YES)、変換候補抽出部130は、ノードh3(ノードY)に対応したノードh3’(ノードy)の1つ下流のノードh4’の読み「はつばいび」を、ノードyとして読み補完辞書データ431Aから読み出す(S715)。
As shown in FIG. 25C, for example, the search key is “new PC“ ha ””, the remainder key α 1 is “PC“ ha ””, node X is node f1 “new”, node Y When 1 is the node h2 “personal computer”, the remainder key α 1 “the personal computer“ ha ”” includes the node h2 “personal computer” that is the node Y 1 , so the conversion candidate extraction unit 130 uses the remainder key α 2 "a" is "" with creating a read from spelling supplement dictionary data 431B node h2 spelling h3 is one downstream node of the "PC", "no" as a node Y 2.
Remainder key alpha 2 Node Y 2 and excess matched for (S721: NO, S723: YES ), the conversion candidate extraction unit 130, too key alpha 2 from the node h3 (node Y 2) less key alpha 3 deleting the " Is generated. Since the remainder is key alpha 3 is undetermined hiragana (S714: YES), the conversion candidate extraction unit 130, node h3 (node Y 2) node h3 corresponding to '(node y 2) 1 next downstream node of the h4' of reading the "sale beauty", read from the complementary dictionary data 431A read as node y 3 (S715).

ノードyと余りキーαは部分一致する(S716:YES)。綴り補完辞書データ431Bにおいて、ノードh4には下流のノードがないため、変換候補抽出部130は、ノードh4のみをノードYの同一補完単位ノード列とし、ノードYからノードYの同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードj1(ノードX)と、ノードh2+ノードh3+ノードh4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードh4の出現回数を対応づけて結果テーブル450に追加する。
また、ノードXがノードj1「新しい」、ノードYがノードj2「パソコン」である場合も同様の処理により、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数の対応付けが結果テーブル450に追加される。
The node y 3 and the remainder key α 3 partially match (S716: YES). In spelling supplement dictionary data 431 B, since there is no downstream nodes in the node h4, the conversion candidate extraction unit 130, the node h4 only the same complement unit node sequence of the node Y 3, the same complement of the node Y 3 from the node Y 1 A node string Y is defined up to the unit node string. The conversion candidate extraction unit 130 associates the spelling of the node j1 (node X) with the spelling of the node h2 + node h3 + node h4 (node row Y) and the number of appearances of the node h4. It adds to the result table 450.
The node X is the node j1 "new", the same process is when the node Y 1 is the node j2 "PC", spelled nodes j1 and (node X), a node j2 + node j3 + node j4 (node sequence Y) Are associated with the “release date of a new personal computer” and the number of appearances of the node j4.

S722の処理の後、あるいは、S723において余りキーαn+1がノードyn+1に対して余剰一致しないと判断された場合(S723:NO)、図18のS707へ進む。図25(d)に部分一致でも完全一致でも余剰一致でもない場合の例を示す。 After the process of S722 or when it is determined in S723 that the surplus key α n + 1 does not coincide with the node y n + 1 (S723: NO), the process proceeds to S707 in FIG. FIG. 25 (d) shows an example of a case where there is no partial match, complete match or surplus match.

図25(d)において、例えば、検索キーが「新しいパソコンの『価格』」、余りキーαが「パソコンの『価格』」であり、ノードXがノードf1「新しい」、ノードYがノードh2「パソコン」である場合、余りキーα「の『価格』」とノードYであるノードh3「の」とは余剰一致するが、余りキーα『価格』と、ノードh3の1つ下流のノードとは部分一致も完全一致も余剰一致もしない。ノードXがノードj1「新しい」、ノードYがノードj2「パソコン」である場合も同様である。 In FIG. 25D, for example, the search key is “price” of the new computer, the remainder key α 1 is “price” of the computer, the node X is “new” and the node Y 1 is the node In the case of h2 “personal computer”, the surplus key α 2 “no price” and the node h3 “no” of the node Y 2 have a coincidence, but the surplus key α 3 “price” and one of the nodes h3 There is no partial match, complete match or surplus match with downstream nodes. Node X node j1 "new", node Y 1 is also the same in cases where it is a node j2 "PC".

その後、図18において、比較すべき下流のノードYがまだ残っていれば(S707:NO)、S701へ戻る。一方、全てのノードYについて比較が終了していれば(S707:YES)、当該余剰一致処理を終了する。 Thereafter, 18, any remaining still downstream node Y 1 to be compared (S707: NO), returns to S701. On the other hand, if the comparison of all the nodes Y 1 has been completed (S707: YES), ends the surplus matching.

次に、図7のS400における出力処理について説明する。図26は、変換候補出力部140が実行する出力処理のフローチャートを示す。
同図において、変換候補出力部140は、結果テーブル450に書き込まれた文字列に、同一の文字列が含まれている場合は、これらの重複している文字列のうち1つのみを残す(S401)。S402〜S405までの処理は、説明を容易にするため、検索キーが「末尾部のみ」、「末尾部+未確定部」、「未確定部のみ」の場合に分けて説明する。
Next, the output process in S400 of FIG. 7 will be described. FIG. 26 shows a flowchart of output processing executed by the conversion candidate output unit 140.
In the figure, the conversion candidate output unit 140 leaves only one of these overlapping character strings when the character string written in the result table 450 includes the same character string ( S401). For ease of explanation, the processing from S402 to S405 will be described separately when the search key is “tail part only”, “tail part + unconfirmed part”, and “unconfirmed part only”.

<検索キーが末尾部のみの場合>
変換候補出力部140は、結果テーブル450の文字列から、検索キーの「末尾部」を削除する(S402)。次に、削除した結果、検索キーの「未確定部」と完全一致することになった出力候補語があるか判定する(S403)。この例では、検索キーに「未確定部」を含まないので、S403は自動的にNOとなる。この結果、図27(a)に示すような出力が得られる(S405)。
<When the search key is the last part only>
The conversion candidate output unit 140 deletes the “tail part” of the search key from the character string in the result table 450 (S402). Next, it is determined whether there is an output candidate word that has been completely matched with the “undefined part” of the search key as a result of deletion (S403). In this example, the search key does not include “indeterminate part”, so S403 is automatically NO. As a result, an output as shown in FIG. 27A is obtained (S405).

図27(a)において、検索キーが「新しい」であり、結果テーブルには文字列「新しい携帯」、「新しいパソコン」、「新しいパソコンの発売日」が記憶されている。このとき、結果テーブルに記憶されているそれぞれの文字列から「新しい」を除いた「携帯」、「パソコン」、「パソコンの発売日」が出現回数の多い順に出力候補語として出力される。このように整形された出力候補語の画面表示例を図28(a)に示す。   In FIG. 27A, the search key is “new”, and the character strings “new mobile phone”, “new personal computer”, and “new personal computer release date” are stored in the result table. At this time, “mobile”, “personal computer”, and “personal computer release date” excluding “new” from each character string stored in the result table are output as output candidate words in descending order of appearance frequency. A screen display example of the output candidate words thus shaped is shown in FIG.

<検索キーが「末尾部+未確定部」の場合>
変換候補出力部140は、まず、結果テーブル450の文字列から検索キーの「末尾部」を削除する(S402)。さらに、末尾部削除の結果、出力候補語の中に検索キーの未確定部と完全一致する出力候補語がある場合(S403:YES)、当該一致する出力候補語を結果テーブル450の出力候補語から削除する(S404)。
<When the search key is "end part + unconfirmed part">
First, the conversion candidate output unit 140 deletes the “tail part” of the search key from the character string of the result table 450 (S402). Furthermore, if the output candidate word includes an output candidate word that completely matches the undetermined part of the search key as a result of the deletion of the tail part (S403: YES), the matching output candidate word is selected as the output candidate word of the result table 450. (S404).

図27(b)に示す例1では、検索キーが末尾部「新しい」+未確定部『ぱ』からなる「新しい『ぱ』」であり、結果テーブルには文字列「新しいパソコン」、「新しいパソコンの発売日」が記憶されている。末尾部削除後の出力候補語のノード列「パソコン」、「パソコンの発売日」において、検索キーの未確定部『ぱ』と完全一致するノードがないため、「パソコン」、「パソコンの発売日」が出現頻度の多い順に出力候補語として出力される(S405)。このように整形された出力候補語の画面表示例を図28(b)に示す。   In example 1 shown in FIG. 27B, the search key is “new“ pa ”consisting of the suffix“ new ”+ the unconfirmed part“ pa ”, and the result table includes the strings“ new PC ”,“ new ” "Release date of PC" is stored. In the node column “PC” and “PC release date” of the output candidate word after deleting the tail part, there is no node that exactly matches the undetermined part “pa” of the search key, so “PC” and “PC release date” Are output as output candidate words in the order of appearance frequency (S405). A screen display example of the output candidate words thus shaped is shown in FIG.

図27(c)に示す例2では、検索キーが末尾部「携帯」+未確定部『が』からなる「携帯『が』」であり、結果テーブルには文字列「携帯が壊れた」が記憶されている。検索キーの未確定部『が』は、末尾部削除後の出力候補語のノード列「が/壊れた」のうち「が」と一致する。しかし、完全一致ではないので(S403:NO)、「が壊れた」がそのまま出力候補語として出力される(S405)。このように整形された出力候補語の画面表示例を図28(c)に示す。そして、オペレータが例えば「が壊れた」を選択すると、未確定状態の「が」を削除して「が壊れた」を確定情報で入力エリアに挿入する。なお、出力候補語が複数ある場合には、出現回数が多い順に表示する。   In the example 2 shown in FIG. 27C, the search key is “mobile phone” composed of the tail part “mobile phone” + the unconfirmed part “ga”, and the character string “mobile phone is broken” is displayed in the result table. It is remembered. The unconfirmed part “GA” of the search key matches “GA” in the node string “GA / broken” of the output candidate word after the end part is deleted. However, since it is not a perfect match (S403: NO), “is broken” is output as an output candidate word as it is (S405). FIG. 28C shows a screen display example of the output candidate word thus shaped. When the operator selects, for example, “broken”, the unconfirmed “ga” is deleted and “broken” is inserted into the input area with the definite information. When there are a plurality of output candidate words, they are displayed in descending order of the number of appearances.

また、図27(d)に示す例3では、検索キーが末尾部「携帯の」+未確定部『ありか』からなる「携帯の『ありか』」であり、結果テーブルには文字列「携帯のありか」が記憶されている。検索キーの未確定部『ありか』が、末尾部削除後の出力候補語「ありか」と完全一致するので、S404において「ありか」全体が削除され、S405で、出力候補語は出力されない。入力エリアにすでに表示された未確定文字列と出力候補語表示エリアに表示される文字列が一致した場合、オペレータは、出力候補語表示エリアから出力候補語を選択するよりも、入力エリアの文字列を、例えば、Enterキーなどで確定させるほうが自然だからである。この場合の画面表示例を図28(d)に示す。   Further, in Example 3 shown in FIG. 27D, the search key is “portable“ is there ”” composed of the tail part “mobile” and the unconfirmed part “is there”, and the character string “ "Is there a mobile phone?" Since the unconfirmed part “Are there” of the search key completely matches the output candidate word “Are there” after the end part deletion, the whole “Are?” Is deleted in S404, and the output candidate word is not output in S405. . When the unconfirmed character string already displayed in the input area matches the character string displayed in the output candidate word display area, the operator selects the character in the input area rather than selecting the output candidate word from the output candidate word display area. This is because it is more natural to determine the column using, for example, the Enter key. A screen display example in this case is shown in FIG.

<検索キーが「未確定部のみ」の場合>
検索キーが「未確定部のみ」の場合、S402で削除される部分はなく、原則、検索結果がそのまま出力される(S405)。図27(e)に例1の場合、図27(f)に例2の場合を示す。また、このような場合の出力候補語の画面表示例を図28(e)、(f)に示す。
<When the search key is "Only unconfirmed part">
If the search key is “only unconfirmed part”, there is no part deleted in S402, and the search result is output as it is (S405). FIG. 27E shows the case of Example 1, and FIG. 27F shows the case of Example 2. In addition, examples of screen display of output candidate words in such a case are shown in FIGS.

図27(e)に示す例1では、検索キーが『けい』であり、結果テーブルには文字列「携帯」、「携帯電話」、「携帯の画面」が記憶されている。よって、図28(e)に示すように、出現回数の多い順に「携帯」、「携帯電話」、「携帯の画面」が出力候補語として出力される。   In Example 1 shown in FIG. 27E, the search key is “Kei”, and the character strings “mobile phone”, “mobile phone”, and “mobile phone screen” are stored in the result table. Accordingly, as shown in FIG. 28 (e), “mobile phone”, “mobile phone”, and “mobile phone screen” are output as output candidate words in descending order of appearance frequency.

図27(f)に示す例2では、検索キーが『あたらしい』であり、結果テーブルには文字列「新しい携帯」、「新しいパソコン」、「新しいパソコンの発売日」が記憶されている。よって、図28(f)に示すように、出現回数の多い順に「新しいパソコン」、「新しいパソコンの発売日」、「新しい携帯」が出力候補語として出力される。   In Example 2 shown in FIG. 27F, the search key is “new”, and the character strings “new mobile phone”, “new personal computer”, and “new personal computer release date” are stored in the result table. Therefore, as shown in FIG. 28 (f), “new personal computer”, “new personal computer release date”, and “new mobile phone” are output as output candidate words in descending order of appearance frequency.

例外的に、綴り補完辞書に、ひらがなのみからなるノードがあり、当該ノードが出力候補語となった場合には、S403でYESとなり、一致した出力候補語が結果テーブルから削除される(S404)。この例を図27(g)に示す。   Exceptionally, if the spelling completion dictionary includes a node consisting only of hiragana, and that node becomes an output candidate word, YES is obtained in S403, and the matched output candidate word is deleted from the result table (S404). . An example of this is shown in FIG.

上記のS405の後、オペレータは、キーボード211などを操作し、表示された変換候補のうち好適な候補を選択する。この選択操作に応じた入力信号が入力制御装置200から制御部100に入力されると(S406:YES)、文字列入力部150によって、選択された変換候補の確定入力がおこなわれる(S407)。   After the above S405, the operator operates the keyboard 211 or the like, and selects a suitable candidate from the displayed conversion candidates. When an input signal corresponding to the selection operation is input from the input control device 200 to the control unit 100 (S406: YES), the character string input unit 150 performs confirmation input of the selected conversion candidate (S407).

ここでは、変換候補出力部140によって表示させている選択候補のいずれが選択されたかを文字列入力部150が判別し、出力制御装置300を制御することで、選択された変換候補を確定文字列として入力エリアに表示する。また、文字列入力部150は、このようにして確定入力した確定文字列からなる文章を、入力エリアの識別及び時間情報とともに入力文章格納領域460に書き込む。   Here, the character string input unit 150 determines which of the selection candidates displayed by the conversion candidate output unit 140 has been selected, and controls the output control device 300 to determine the selected conversion candidate as a confirmed character string. Is displayed in the input area. Further, the character string input unit 150 writes the sentence composed of the confirmed character string that has been confirmed and input in this manner, together with the input area identification and time information, in the input sentence storage area 460.

そして、この確定入力の後、再び、図7のS200の検索キー処理が実行され、検索キーが生成される。従って、続く図7のS300の候補抽出処理においては、図10に示すS600の先頭確定処理、つまり、図16に示す処理が実行される。
あるいは、確定入力の後、ユーザが何らかの未確定文字をキーボード211により入力した場合も、図7のS200の検索キー処理が実行され、末尾部+未確定部の検索キーが生成される。従って、続く図7のS300の候補抽出処理においては、図10に示すS500の先頭未確定処理、つまり、図11に示す処理が実行される。
Then, after the confirmation input, the search key process of S200 of FIG. 7 is executed again to generate a search key. Therefore, in the candidate extraction process of S300 in FIG. 7, the head determination process of S600 shown in FIG. 10, that is, the process shown in FIG. 16 is executed.
Alternatively, even after the confirmation input, when the user inputs some unconfirmed character using the keyboard 211, the search key process of S200 of FIG. 7 is executed, and the search key of the tail part + unconfirmed part is generated. Therefore, in the candidate extraction process of S300 in FIG. 7, the head unconfirmed process of S500 shown in FIG. 10, that is, the process shown in FIG. 11 is executed.

なお、未確定文字列に入力誤りがあるなどによって、変換候補の選択がされず、入力取消操作などがおこなわれると(S406:NO、S408:YES)、確定入力をおこなわずに処理を終了する。   If the conversion candidate is not selected and an input canceling operation is performed due to an input error in the undetermined character string (S406: NO, S408: YES), the process ends without performing the confirmed input. .

次に、補完単位番号付与処理について説明する。この補完単位番号付与処理では、現在の辞書データの中から、同一の補完単位番号を付与すべきノード列を検出し、特定したノード列に同一の補完番号を付与して生成した新たなノード列を追加し、辞書データを更新する。同一の補完単位番号を付与すべきノード列には、(1)入力エリアに入力された頻度が高いもの、(2)係り受けの分岐が少ないもの、の2つがある。(1)では、実際にオペレータが入力した頻度が高い表現を変換候補として選択可能とすることができるようになる。(2)では、ある単語がいくつかの限られた表現の中でしか使用されない場合、その表現が変換候補として表示されるようになる。   Next, the supplement unit number assigning process will be described. In this complement unit number assigning process, a node sequence to which the same complement unit number should be assigned is detected from the current dictionary data, and a new node sequence generated by assigning the same complement number to the identified node sequence To update the dictionary data. There are two types of node sequences to which the same complement unit number is to be assigned: (1) those that are frequently input to the input area, and (2) those that have few dependency branches. In (1), it is possible to select an expression that is frequently input by the operator as a conversion candidate. In (2), when a certain word is used only in some limited expressions, the expression is displayed as a conversion candidate.

図29〜図31を用いて、入力エリアに入力される頻度が高いノード列に同一の補完単位番号を付与するときの補完単位番号付与処理について説明する。
まず、入力内容別辞書領域430には、予め、各入力エリアに対応した読み補完辞書データと綴り補完辞書データの対が記憶されているものとする。
A complementary unit number assigning process when assigning the same complementary unit number to a node string that is frequently input to the input area will be described with reference to FIGS.
First, it is assumed that a pair of reading completion dictionary data and spelling completion dictionary data corresponding to each input area is stored in the input content dictionary area 430 in advance.

図29は、辞書生成部160が実行する補完単位番号付与処理のフローチャートを示し、図30は、図29の補完単位番号付与処理のデータ例を示し、図31は、辞書データの更新例を示す。
図29において、辞書生成部160は、1週間、1ヶ月毎などの所定の期間毎に、あるいは、ユーザによる指示が入力されることにより、入力文章格納領域460から補完単位番号付与処理の対象とする辞書データに対応した入力エリアの入力文章を読み出す。このとき、入力エリアの入力文章全てを読み出してもよく、現在から3ヶ月前までなどの所定期間分の文章を読み出してもよい(S801)。なお、補完単位番号付与処理の対象とする辞書データを特定する情報は予め入力しておくことでもよく、全ての辞書データについて順に行なうようにしてもよい。辞書生成部160は、S801において読み込んだ文章、つまり、文字列を、文末記号に従って分割し、文リストを生成する(S802)。文末記号には、例えば、句点「。」とすることができる。
29 shows a flowchart of the complementary unit number assigning process executed by the dictionary generation unit 160, FIG. 30 shows an example of data of the complementary unit number assigning process of FIG. 29, and FIG. 31 shows an example of updating dictionary data. .
In FIG. 29, the dictionary generation unit 160 selects a supplementary unit number assignment process from the input sentence storage area 460 by a predetermined period such as one week, every month, or when a user inputs an instruction. The input sentence in the input area corresponding to the dictionary data to be read is read out. At this time, all the input texts in the input area may be read, or texts for a predetermined period such as three months before the present time may be read (S801). Note that information for specifying dictionary data to be subjected to the complementary unit number assigning process may be input in advance, or may be sequentially performed for all dictionary data. The dictionary generation unit 160 divides the text read in S801, that is, the character string in accordance with the sentence end symbol, and generates a sentence list (S802). The sentence ending symbol can be, for example, a punctuation mark “.”.

辞書生成部160は、S802で生成した文リストの先頭から順に、まだ読み込んでいない文を取得する(S803)。辞書生成部160は、S803で読み込んだ文から不要文字、例えば、英数字に挟まれたもの以外の空白、タブ、改行などを削除する(S804)。辞書生成部160は、S804で不要文字を削除した文の構文解析を行なう(S805)。この構文解析の処理には、従来より使用されている、入力文から単語や、単語相互の係り受け関係を取り出す任意の構文解析ソフトウェア等を使用することができる。
解析が失敗した場合(S806:NO)、S803に進む。
The dictionary generation unit 160 acquires sentences that have not yet been read in order from the top of the sentence list generated in S802 (S803). The dictionary generation unit 160 deletes unnecessary characters, for example, blanks, tabs, line feeds, and the like other than those sandwiched between alphanumeric characters from the sentence read in S803 (S804). The dictionary generation unit 160 performs syntax analysis of the sentence from which unnecessary characters are deleted in S804 (S805). For this parsing process, any conventional parsing software that extracts words from the input sentence or the dependency relationship between words can be used.
When analysis fails (S806: NO), it progresses to S803.

解析が成功すると(S806:YES)、辞書生成部160は、解析結果から、親子関係の部分木、単独の部分木を抽出すると、部分木配列リストを生成する(S807)。部分木配列リストの例を図30(a)に示す。部分木配列リストは、各部分木について、自身の部分木番号、当該部分木を構成する単語の読み及び綴りと品詞、親子(係り受け)関係にある部分木の番号を示す。なお、上下に並んだ部分木のうち、上に位置する部分木が親であり、下に位置する部分木が子である。   When the analysis is successful (S806: YES), the dictionary generation unit 160 generates a subtree array list after extracting the parent-child relation subtree and the single subtree from the analysis result (S807). An example of the subtree array list is shown in FIG. The subtree array list indicates, for each subtree, its own subtree number, the reading and spelling of words constituting the subtree, the spelling and part of speech, and the number of subtrees in a parent-child (dependency) relationship. Of the subtrees arranged vertically, the subtree located at the top is the parent, and the subtree located at the bottom is the child.

辞書生成部160は、部分木から得られた綴り及び読みに対応したパス(マッチング経路)をパスファイルに書き込む(S808)。この例を、図30(b)に示す。つまり、親子関係の部分木の子は係り側、親は受け側とした係り受け関係の文節としてパスを生成し、さらに、各部分木(文節)を構成する単語の読み、綴りをノードとしたパスを生成する。そして、親子関係にある子側の部分木、つまり、係り側の文節の最後のノードにある助詞は、親側の部分木、つまり、受け側の文節の最初のノードに移動する。辞書生成部160は、文節の単位で補完単位番号を付与する。このとき、先頭の文節には補完単位番号1を付与し、受け側の文節には、係り側の文節よりも1大きな補完単位番号を付与する。そして、各文節に付与された補完単位番号を、当該文節を構成するノードに付与する。   The dictionary generation unit 160 writes the path (matching path) corresponding to the spelling and reading obtained from the subtree to the path file (S808). An example of this is shown in FIG. In other words, a path is generated as a dependency-related clause with the child of the parent-child relationship subtree as the dependency side and the parent as the reception side, and further, the words that make up each subtree (sentence) are read and spelled as nodes. Generate a path. Then, the particle at the last node of the child-side subtree in the parent-child relationship, that is, the last node of the dependency-side clause, moves to the parent-side subtree, that is, the first node of the receiving-side clause. The dictionary generation unit 160 assigns a complement unit number in units of phrases. At this time, a complement unit number of 1 is assigned to the head phrase, and a complement unit number of 1 greater than that of the dependency phrase is assigned to the receiver phrase. Then, the complement unit number assigned to each clause is assigned to the node constituting the clause.

そして、文リストにまだ未処理の文がある場合(S809:YES)、辞書生成部160は、再びS602からの処理を行う。文リストに含まれる全ての文について処理を終えた場合(S809:NO)、辞書生成部160は、生成したパスファイルからなる中間ファイルを自身の保持する記憶領域に記憶する(S810)。   If there is an unprocessed sentence in the sentence list (S809: YES), the dictionary generation unit 160 performs the process from S602 again. When processing has been completed for all sentences included in the sentence list (S809: NO), the dictionary generation unit 160 stores the intermediate file composed of the generated path file in the storage area held by itself (S810).

辞書生成部160は、S810において記憶した中間ファイルから、2以上所定数以下の連続する補完単位番号のノード列を全て取得する。例えば、読み補完辞書データと綴り補完辞書データが3文節以下からなる場合、補完単位番号が1−2、2−3、3−4、…のように連続するノード列と、補完単位番号が1−2−3,2−3−4、3―4―5、…のように連続するノード列を読み出す。そして、そして、同じ綴りからなるノード列毎に出現回数をカウントすると、各ノード列の出現頻度、例えば、出現回数の標準偏差、全体に占める出現割合を求める(S811)。なお、出現回数自体を出現頻度としてもよい。そして、所定の閾値よりも出現頻度が高いノード列を、同じ補完単位番号を付与すべきノード列(以下、「対象ノード列」と記載)であると判断する。辞書生成部160は、綴り補完辞書データから対象ノード列を特定すると、対象ノード列と同じノードからなるノード列、及び、対象ノード列を含むノード列を綴り補完辞書データのrootのノードの1つ下流に追加し、追加したノード列に対して、対象ノード列と一致するノード列に同一の補完単位番号を付与する。そして、追加したノード列に対応するノード列を読み補完辞書データに追加する(S812)。この例を図31に示す。   The dictionary generation unit 160 acquires all the node strings having two or more consecutive complementary unit numbers from the intermediate file stored in S810. For example, when the reading complement dictionary data and the spelling complement dictionary data are composed of three or less phrases, the complementing unit number is a continuous node string such as 1-2, 2-3, 3-4,. Read consecutive node strings such as 2-3, 2-3-4, 3-4-5,. Then, when the number of appearances is counted for each node sequence composed of the same spelling, the appearance frequency of each node sequence, for example, the standard deviation of the number of appearances, and the appearance ratio in the whole are obtained (S811). The appearance frequency itself may be used as the appearance frequency. Then, it is determined that a node string having an appearance frequency higher than a predetermined threshold is a node string to be assigned the same complement unit number (hereinafter referred to as “target node string”). When the dictionary generation unit 160 specifies the target node string from the spelling complement dictionary data, the node string including the same node as the target node string and the node string including the target node string are one of the root nodes of the spelling complement dictionary data. The same complement unit number is assigned to the node sequence that matches the target node sequence for the added node sequence. Then, the node sequence corresponding to the added node sequence is read and added to the complementary dictionary data (S812). An example of this is shown in FIG.

例えば、応対入力辞書データ(A1)431が処理対象であり、対象ノード列が「携帯/を/買った」であるとする。この場合、辞書生成部160は、綴り補完辞書データ431B(図5)からノードf2+ノードf3+ノードf4を特定する。辞書生成部160は、図31(a)に示すように、新たなノードs1「携帯」−ノードs2「を」−ノードs3「買った」からなるノード列と、新たなノードt1「新しい」−ノードt2「携帯」−ノードt3「を」−ノードt4「買った」からなるノード列を綴り補完辞書データ431Bのrootの配下に追加する。そして、ノードs1、s2、s3に補完単位番号「1」を付与する。また、ノードt1に補完単位番号「1」を、ノードt2、t3、t4に補完単位番号「2」を付与する。
さらに、辞書生成部160は、図31(b)に示すように、読み補完辞書データ431Aに、新たなノードs1’「けいたい」−ノードs2’「を」−ノードs3’「かった」からなるノード列と、新たなノードt1’「あたらしい」−ノードt2「けいたい」−ノードt3「を」−ノードt4「かった」からなるノード列をrootの配下に追加する。そして、ノードs1’、s2’、s3’に補完単位番号「1」を付与する。また、ノードt1’に補完単位番号「1」を、ノードt2’、t3’、t4’に補完単位番号「2」を付与する。
For example, it is assumed that the response input dictionary data (A1) 431 is a processing target and the target node string is “mobile / buy / buy”. In this case, the dictionary generation unit 160 identifies the node f2 + node f3 + node f4 from the spelling complement dictionary data 431B (FIG. 5). As shown in FIG. 31A, the dictionary generation unit 160 includes a new node s1 “mobile” -node s2 “buy” -node s3 “buy” and a new node t1 “new”- A node string consisting of node t2 “mobile” -node t3 “has” -node t4 “buyed” is added under the root of the spelling complement dictionary data 431B. Then, the complement unit number “1” is assigned to the nodes s1, s2, and s3. Further, the complement unit number “1” is assigned to the node t1, and the complement unit number “2” is assigned to the nodes t2, t3, and t4.
Further, as shown in FIG. 31B, the dictionary generation unit 160 adds the new node s1 ′ “Keitai” -node s2 ′ “to” -node s3 ′ “Kai” to the reading completion dictionary data 431A. And a new node t1 ′ “new” -node t2 “Keitai” -node t3 “is” -node t4 “Kato” is added under the root. Then, the complement unit number “1” is assigned to the nodes s1 ′, s2 ′, and s3 ′. Further, the complement unit number “1” is assigned to the node t1 ′, and the complement unit number “2” is assigned to the nodes t2 ′, t3 ′, and t4 ′.

また、S812において、さらに、辞書生成部160は、所定の閾値よりも出現頻度が低く、かつ、補完単位が連続するノード列のうち、綴り補完辞書データ、読み補完辞書データに同じ補完単位番号が付与されて登録されているノード列がある場合、このノード列を含んだroot配下のノード列を削除する。例えば、応対入力辞書データ(A1)431が処理対象であり、「パソコン/の/発売日」の出現頻度が閾値以下となったとする。辞書生成部160は、綴り補完辞書データ431B(図5)から同じ補完単位番号「2」が付与されたノードj2+ノードj3+ノードj4を特定する。この場合、綴り補完辞書データ431Bからノードj1〜j4のノード列が、読み補完辞書データ431Aからノードj1’〜j4’のノード列が削除される。   Further, in S812, the dictionary generation unit 160 further has the same complement unit number in the spelling complement dictionary data and the reading complement dictionary data in the node sequence whose appearance frequency is lower than a predetermined threshold and whose complement units are continuous. If there is a node string assigned and registered, the node string under the root including this node string is deleted. For example, it is assumed that the response input dictionary data (A1) 431 is a processing target, and the appearance frequency of “PC /// release date” is equal to or less than a threshold value. The dictionary generation unit 160 identifies the node j2 + node j3 + node j4 to which the same complement unit number “2” is assigned from the spelling complement dictionary data 431B (FIG. 5). In this case, the node strings of the nodes j1 to j4 are deleted from the spelling complement dictionary data 431B, and the node strings of the nodes j1 'to j4' are deleted from the reading complement dictionary data 431A.

また、辞書生成部160は、各ノード列毎にカウントした出現回数により、読み補完辞書データと綴り補完辞書データの各ノードに記述されている出現回数を更新する。   Further, the dictionary generation unit 160 updates the number of appearances described in each node of the reading completion dictionary data and the spelling completion dictionary data with the number of appearances counted for each node sequence.

続いて、図32及び図33を用いて係り受けの分岐が少ないものに同一の補完単位番号を付与するときの補完単位番号付与処理について説明する。図32は、辞書生成部160が実行する補完単位番号付与処理のフローチャートを示し、図33は、図32の補完単位番号付与処理における辞書更新の例を示す。   Next, a complementary unit number assigning process when assigning the same complementary unit number to those with few dependency branches will be described with reference to FIGS. 32 and 33. 32 shows a flowchart of the complementary unit number assigning process executed by the dictionary generation unit 160, and FIG. 33 shows an example of dictionary update in the complementary unit number assigning process of FIG.

図32において、辞書生成部160は、補完単位番号付与処理の対象とする辞書データの綴り補完辞書データから、rootの1つ下流のノードである最上流ノードを一つ取得する。これをノードXとする(S901)。辞書生成部160は、ノードXの1つ下流のノードの数、1つ下流のノードそれぞれの1つ下流のノードの数、・・・を合計し、ノードXを先頭とするノード列の数を取得すると(S902)、取得したノード列の数が所定以下であるか否かを判断する(S903)。   In FIG. 32, the dictionary generation unit 160 acquires one upstream node that is one node downstream from the root from the spelling complement dictionary data of the dictionary data that is the target of the supplement unit number assignment process. This is designated as node X (S901). The dictionary generation unit 160 adds up the number of nodes one downstream of the node X, the number of one downstream node of each downstream node,..., And calculates the number of node strings starting with the node X. If acquired (S902), it is determined whether or not the number of acquired node strings is equal to or less than a predetermined value (S903).

ノード列の数が所定数以下である場合は(S903:YES)、辞書生成部160は、さらに、ノードXの下流の各ノードの補完単位番号が同一であるかを判断する(S904)。同一でない場合(S904:NO)、辞書生成部160は、ノードXを最上流とするノード列を全て複製し、同一の補完単位番号「1」を付与して綴り補完辞書データに追加する。そして、追加したノード列に対応するノード列を読み補完辞書データに追加する(S905)。図33にこの例を示す。   When the number of node strings is equal to or less than the predetermined number (S903: YES), the dictionary generation unit 160 further determines whether the complementary unit numbers of the nodes downstream of the node X are the same (S904). If they are not the same (S904: NO), the dictionary generation unit 160 duplicates all the node strings having the node X as the most upstream, assigns the same complement unit number “1”, and adds them to the spelling complement dictionary data. Then, the node sequence corresponding to the added node sequence is read and added to the complementary dictionary data (S905). This example is shown in FIG.

図33(a)に示すように、綴り補完辞書データの最上流ノードがノードa1「携帯」、ノードa1の1つ下流のノードがノードa2「の」及びノードc3「が」の2つ、ノードa2「の」の1つ下流のノードがノードa3「画面」及びノードb3「ありか」の2つ、ノードc3「が」の1つ下流のノードがノードc3「壊れた」の1つ、「画面」、「ありか」及び「壊れた」の下流にはノードがないものとする。この場合、辞書生成部160は、ノードa1を先頭とするノード列の数は3となる。そして、ノードa1とノードa2,c2の補完単位番号が異なるため、辞書生成部160は、ノードa1を最上流とするノード列を全て複製して綴り補完辞書データのrootの配下に追加し、追加したノード列の各ノードに新しいリンクポインタを付与するとともに、ノードa1及びノードa1の下流のノード全てに補完単位番号「1」を付与する。
さらに、辞書生成部160は、図33(b)に示すように、読み補完辞書データに、ノードa1’を最上流とするノード列を複製して読み補完辞書データのrootの配下に追加し、追加したノード列の各ノードに、読み補完辞書データに対応したリンクポインタと、補完単位番号「1」を付与する。
As shown in FIG. 33A, the most upstream node of the spelling completion dictionary data is the node a1 “mobile”, the node one node downstream of the node a1 is the node a2 “no” and the node c3 “is”, the node One node downstream of a2 “no” is node a3 “screen” and node b3 “is there”, one node downstream of node c3 “ga” is one of node c3 “broken”, “ It is assumed that there are no nodes downstream of “screen”, “is there”, and “broken”. In this case, the dictionary generation unit 160 has 3 node strings starting from the node a1. Since the complement unit numbers of the node a1 and the nodes a2 and c2 are different, the dictionary generation unit 160 duplicates all the node sequences having the node a1 as the most upstream and adds them under the root of the spelling complement dictionary data. A new link pointer is assigned to each node in the node sequence, and a complement unit number “1” is assigned to all nodes a1 and downstream of the node a1.
Furthermore, as shown in FIG. 33 (b), the dictionary generation unit 160 duplicates the node sequence having the node a1 ′ as the most upstream in the reading completion dictionary data and adds it to the root of the reading completion dictionary data. A link pointer corresponding to the reading completion dictionary data and a completion unit number “1” are assigned to each node of the added node row.

S903においてノード列の数が所定数を超えると判断した場合(S903:NO)、S904においてノードXの下流の各ノードの補完単位番号が同一であると判断した場合(S904:YES)、あるいは、S905の処理の処理を行なったのち、辞書生成部160は、綴り補完辞書データに比較すべきノードが残っていないか確認する(S906)。比較すべきノードが残っていれば(S906:NO)、S901へ戻り、まだ処理を行なっていない最上流ノードを1つ選択し、このノードをノードXとして以降の処理を行う。
一方、全ての最上流ノードについて比較を行なったため、比較すべきノードが残っていない場合(S906:YES)は、当該先頭未確定処理を終了する。
When it is determined in S903 that the number of node columns exceeds a predetermined number (S903: NO), when it is determined in S904 that the complementary unit number of each node downstream of the node X is the same (S904: YES), or After performing the processing of S905, the dictionary generation unit 160 checks whether there are any remaining nodes to be compared in the spelling complement dictionary data (S906). If there remains a node to be compared (S906: NO), the process returns to S901, and selects the most upstream node that has not been processed yet, and the subsequent processing is performed with this node as node X.
On the other hand, since all the most upstream nodes have been compared, and there are no remaining nodes to be compared (S906: YES), the head unconfirmed process ends.

なお、図32において、読み補完辞書データを用いて同一の補完単位番号をすべき最上流ノードを検出するようにしてもよい。   In FIG. 32, the most upstream node that should have the same complement unit number may be detected using the reading complement dictionary data.

なお、上記の補完単位番号付与処理は、辞書作成時に行なっても良い。この場合、図29のS801において、入力文章格納領域460から入力文章を読み出す代わりに、任意の文章群を読み込んで使用する。   Note that the above complementing unit number assigning process may be performed at the time of dictionary creation. In this case, in S801 of FIG. 29, instead of reading out the input sentence from the input sentence storage area 460, an arbitrary sentence group is read and used.

上述した実施形態は一例であり、本発明の適用範囲はこれに限られない。すなわち、種々の応用が可能であり、あらゆる実施の形態が本発明の範囲に含まれる。
例えば、上記実施の形態では、一対の読み補完辞書データと綴り補完辞書データとを入力エリアと対応づけることで、入力内容別の辞書データを構築したが、入力内容に応じて選択可能であれば、対応づけるものは入力エリアに限られない。例えば、文字列入力をおこなう入力画面や使用するアプリケーションと辞書データとを対応づけてもよい。
The embodiment described above is an example, and the scope of application of the present invention is not limited to this. That is, various applications are possible, and all embodiments are included in the scope of the present invention.
For example, in the above embodiment, the dictionary data for each input content is constructed by associating a pair of reading completion dictionary data and spelling completion dictionary data with the input area. What is associated is not limited to the input area. For example, an input screen for inputting a character string or an application to be used may be associated with dictionary data.

上記実施形態では、入力内容別辞書データとして、応対入力辞書データの例を主に示したが、互いに係り受け関係にある単語の階層構成とすることができるのであれば、種々の内容について入力内容別辞書データを構築することができる。例えば、都道府県名とそれに続く下位の地域名とを階層構造とすることで、住所入力に用いる辞書データを構築することができる他、姓とこれに続く名の組み合わせで階層構造とすることで、人名入力に用いる辞書データを構築することができる。つまり、対象とする複数の単語が相関的な位置をもって連結させることが可能であれば、種々の内容に応じた入力内容別辞書データを構築することができる。   In the above embodiment, the example of the response input dictionary data is mainly shown as the dictionary data according to the input content. However, if it is possible to have a hierarchical structure of words having a dependency relationship with each other, the input content is various contents. Another dictionary data can be constructed. For example, it is possible to build dictionary data used for address input by creating a hierarchical structure of prefecture names and subsequent subordinate regional names, and by creating a hierarchical structure with combinations of surnames and subsequent names. Dictionary data used for personal name input can be constructed. That is, if it is possible to connect a plurality of target words with relative positions, dictionary data according to input contents according to various contents can be constructed.

また、上記実施形態では、キーボード211によって文字列が入力される場合を例示したが、文字列が入力できるのであれば、その入力方法はこれに限られず任意である。例えば、音声認識によって文字列入力を行う場合にも、本発明を適用することで、より効率的な文字列入力を実現することができる。   Moreover, although the case where a character string was input with the keyboard 211 was illustrated in the said embodiment, as long as a character string can be input, the input method is not restricted to this but is arbitrary. For example, even when a character string is input by voice recognition, more efficient character string input can be realized by applying the present invention.

上記実施形態では、電話応答の内容をリアルタイムで入力する必要のあるコールセンタの入力端末に本発明を適用した場合を例示した。本発明は、このような高速な入力作業が求められる分野に特に好適ではあるが、これに限られるものではなく、文字列入力をおこなう種々の場面で用いられる入力装置等に本発明を適用可能であり、いずれの場合であっても、より効率的な文字列入力を実現することができる。   In the above embodiment, the case where the present invention is applied to an input terminal of a call center that needs to input the contents of a telephone response in real time has been exemplified. The present invention is particularly suitable for the field where such high-speed input work is required, but is not limited to this, and the present invention can be applied to input devices used in various scenes for inputting character strings. In any case, more efficient character string input can be realized.

上記実施形態にかかる入力端末1は、スタンドアローンで構成可能であるだけでなく、いわゆるサーバ−クライアントシステムとしても構成可能である。すなわち、例えば、図34に示すように、制御部501、通信部502を備えるクライアント500に入力装置210と出力装置310の機能を持たせ、該クライアント500と、制御部601、通信部602、記憶部603を備え、検索機能を持たせたサーバ600とから構成としても良い。サーバ600は、検索機能として、辞書選択部601−1、検索キー生成部601−2、変換候補抽出部601−3、変換候補出力部601−4、文字列入力部601−5、辞書生成部601−6を備える。辞書選択部601−1、検索キー生成部601−2、変換候補抽出部601−3、変換候補出力部601−4、文字列入力部601−5、辞書生成部601−6はそれぞれ、図6に示す辞書選択部110、検索キー生成部120、変換候補抽出部130、変換候補出力部140、文字列入力部150、辞書生成部160と同様の機能を有する。また、記憶部603は、図1に示す記憶部400と同様のデータを記憶する。   The input terminal 1 according to the above embodiment can be configured not only as a stand-alone but also as a so-called server-client system. That is, for example, as shown in FIG. 34, a client 500 including a control unit 501 and a communication unit 502 is provided with functions of an input device 210 and an output device 310, and the client 500, control unit 601, communication unit 602, storage It is good also as a structure from the server 600 provided with the part 603 and given the search function. The server 600 includes, as a search function, a dictionary selection unit 601-1, a search key generation unit 601-2, a conversion candidate extraction unit 601-3, a conversion candidate output unit 601-4, a character string input unit 601-5, and a dictionary generation unit. 601-6. The dictionary selection unit 601-1, search key generation unit 601-2, conversion candidate extraction unit 601-3, conversion candidate output unit 601-4, character string input unit 601-5, and dictionary generation unit 601-6 are respectively shown in FIG. The same functions as the dictionary selection unit 110, search key generation unit 120, conversion candidate extraction unit 130, conversion candidate output unit 140, character string input unit 150, and dictionary generation unit 160 shown in FIG. The storage unit 603 stores the same data as the storage unit 400 illustrated in FIG.

このようなプログラムの提供方法は任意であり、例えば、CD−ROMなどの記憶媒体に格納して配布可能であることはもとより、プログラムデータを搬送波に重畳することで、所定の通信媒体(例えば、インターネットなど)を介して配布することもできる。   Such a program providing method is arbitrary. For example, the program data can be stored and distributed in a storage medium such as a CD-ROM, and the program data can be superposed on a carrier wave so that a predetermined communication medium (for example, It can also be distributed via the Internet).

1 入力端末
100 制御部
110 辞書選択部
120 検索キー生成部
130 変換候補抽出部
140 変換候補出力部
150 文字列入力部
160 辞書生成部
200 入力制御装置
210 入力装置
211 キーボード
212 ポインティングデバイス
300 出力制御装置
310 出力装置
311 ディスプレイ装置
400 記憶部
410 辞書格納領域
420 基本辞書領域
430 入力内容別辞書領域
431 応対入力辞書データ(A1)
431A 読み補完辞書データ
431B 綴り補完辞書データ
432 住所入力辞書データ(A2)
432A 読み補完辞書データ
432B 綴り補完辞書データ
440 プログラム格納領域
450 結果テーブル
460 入力文章格納領域
DESCRIPTION OF SYMBOLS 1 Input terminal 100 Control part 110 Dictionary selection part 120 Search key generation part 130 Conversion candidate extraction part 140 Conversion candidate output part 150 Character string input part 160 Dictionary generation part 200 Input control apparatus 210 Input apparatus 211 Keyboard 212 Pointing device 300 Output control apparatus 310 Output device 311 Display device 400 Storage unit 410 Dictionary storage area 420 Basic dictionary area 430 Dictionary area according to input contents 431 Response input dictionary data (A1)
431A Reading completion dictionary data 431B Spelling completion dictionary data 432 Address input dictionary data (A2)
432A Reading completion dictionary data 432B Spelling completion dictionary data 440 Program storage area 450 Result table 460 Input sentence storage area

Claims (9)

入力された文字列に応じた変換候補を検索して提示し、提示された変換候補を選択することで文字列入力を行う文字列入力装置であって、
入力される文字列を変換処理する前の読みが単語として記録された辞書であって、互いに係り受け関係にある単語を、ノードとして木構造に構成した読み補完辞書データ、及び、前記読み補完辞書データに含まれる各単語が変換処理された後の綴りが単語として記録された辞書であって、変換処理前と変換処理後の単語をノードとして対応付けて前記読み補完辞書データの示す木構造と合致した木構造に構成し、かつ、1つのノード列としてみなす、係り受け関係にあるノードに同一の補完単位番号を付与した綴り補完辞書データを記憶する記憶部と、
ユーザの入力に基づき検索キーを生成する検索キー生成部と、
前記検索キー生成部により生成された検索キーに基づき前記読み補完辞書データ及び前記綴り補完辞書データを検索して当該検索キーに対応した前記綴り補完辞書データのノードを特定し、特定したノードの綴りと、当該特定したノードと同一の補完単位番号が付与されている当該特定したノードの下流のノードの綴りとを前記綴り補完辞書データから読み出して結合した変換候補を取得する変換候補抽出部と、
前記変換候補抽出部が取得した変換候補を出力する変換候補出力部と、
を備えることを特徴とする文字列入力装置。
A character string input device that searches and presents conversion candidates according to an input character string and performs character string input by selecting the presented conversion candidate,
A dictionary in which readings before conversion processing of input character strings are recorded as words, and reading completion dictionary data in which words having a dependency relationship are configured as nodes in a tree structure, and the reading completion dictionary A dictionary in which spelling after each word included in the data is converted is recorded as a word, and the tree structure indicated by the reading completion dictionary data by associating the word before conversion processing and the word after conversion processing as a node; A storage unit configured to store the spelling completion dictionary data in which the same complementing unit number is assigned to the nodes in the dependency relationship, which is configured as a matched tree structure and regarded as one node sequence;
A search key generation unit that generates a search key based on user input;
Based on the search key generated by the search key generation unit, the reading completion dictionary data and the spelling complement dictionary data are searched to identify a node of the spelling complement dictionary data corresponding to the search key, and the spelling of the specified node A conversion candidate extraction unit that reads out from the spelling complement dictionary data and combines the spelling of the downstream node of the identified node assigned the same complement unit number as the identified node, and
A conversion candidate output unit that outputs the conversion candidate acquired by the conversion candidate extraction unit;
A character string input device comprising:
前記変換候補抽出部は、前記検索キーが未確定ひらがなからなる場合、前記読み補完辞書データから当該検索キーと前方一致かつ部分一致する最上流のノードを検出し、検出した当該ノードに対応した前記綴り補完辞書データのノードを特定し、当該特定したノードの綴りと、当該特定したノードと同一の補完単位番号が付与されている当該特定したノードの下流のノードの綴りとを結合した変換候補を取得する、
ことを特徴とする請求項1に記載の文字列入力装置。
When the search key is composed of unconfirmed hiragana, the conversion candidate extraction unit detects the most upstream node that is forward-matched and partially matched with the search key from the reading completion dictionary data, and corresponds to the detected node The candidate of the spelling completion dictionary data is identified, and a conversion candidate is obtained by combining the spelling of the identified node and the spelling of the downstream node of the identified node to which the same complement unit number as the identified node is assigned. get,
The character string input device according to claim 1.
前記変換候補抽出部は、前記検索キーが未確定ひらがなからなる場合、前記読み補完辞書データから当該検索キーと完全一致する最上流のノードを検出し、検出した当該ノードに対応した前記綴り補完辞書データのノード及び1つ下流のノードを特定し、当該特定したノード及び1つ下流のノードの綴りと、当該1つ下流のノードと同一の補完単位番号が付与されている当該1つ下流のノードのさらに下流のノード綴りとを結合した変換候補を取得する、
ことを特徴とする請求項1に記載の文字列入力装置。
When the search key is an unconfirmed hiragana, the conversion candidate extraction unit detects the most upstream node that completely matches the search key from the reading completion dictionary data, and the spelling completion dictionary corresponding to the detected node The data node and the one downstream node are identified, the spelling of the identified node and the one downstream node, and the one downstream node assigned with the same complement unit number as the one downstream node To obtain a conversion candidate that combines the further node spelling of
The character string input device according to claim 1.
前記変換候補抽出部は、前記検索キーが確定文字からなる場合、前記綴り補完辞書データから検索キーと前方一致かつ部分一致する最上流のノードを特定し、当該特定したノードの綴りと、当該特定したノードと同一の補完単位番号が付与されている当該特定したノードの下流のノードの綴りとを結合した変換候補を取得する、
ことを特徴とする請求項1に記載の文字列入力装置。
When the search key is a fixed character, the conversion candidate extraction unit specifies the most upstream node that matches the search key forward and partially matches the spelling completion dictionary data, spells the specified node, and specifies the specified To obtain a conversion candidate that combines the spelling of the downstream node of the identified node assigned the same complement unit number as
The character string input device according to claim 1.
前記変換候補抽出部は、前記検索キーが確定文字からなる場合、前記綴り補完辞書データから検索キーと完全一致する最上流のノードと、当該特定したノードの1つ下流のノードを特定し、当該特定したノード及び1つ下流のノードの綴りと、当該1つ下流のノードと同一の補完単位番号が付与されている当該1つ下流のノードのさらに下流のノード綴りとを結合した変換候補を取得する、
ことを特徴とする請求項1に記載の文字列入力装置。
When the search key is a fixed character, the conversion candidate extraction unit specifies the most upstream node that completely matches the search key from the spelling completion dictionary data and a node that is one downstream of the specified node, and A conversion candidate is obtained by combining the spelling of the identified node and one downstream node and the further downstream node spelling of the one downstream node assigned the same complement unit number as the one downstream node. To
The character string input device according to claim 1.
前記変換候補抽出部は、
前記検索キーが確定文字及び未確定ひらがなからなる未確定文字列からなる場合、当該検索キーの確定文字によって、前記綴り補完辞書データの最も上流のノードを検索して一致するノードを特定し、
特定したノードに対応する前記読み補完辞書データのノードの下流のノードと前記検索キーの未確定ひらがなとの一致を判断し、
前記綴り補完辞書データから前記特定したノードと、当該特定したノードの下流のノードであり、前記検索キーの未確定ひらがなと一致すると判断された前記読み補完辞書データのノードに対応したノードと、当該下流のノードと同一の補完単位番号が付与されているさらに下流のノードとの綴りを読み出し、読み出した綴りを結合した変換候補を取得する、
ことを特徴とする請求項1に記載の文字列入力装置。
The conversion candidate extraction unit
When the search key is composed of an unconfirmed character string consisting of a confirmed character and an unconfirmed hiragana, by using the confirmed character of the search key, the most upstream node of the spelling completion dictionary data is searched to identify a matching node,
Determining a match between a node downstream of the node of the reading completion dictionary data corresponding to the identified node and an unconfirmed hiragana of the search key;
The identified node from the spelling completion dictionary data, a node downstream of the identified node, and a node corresponding to the node of the reading completion dictionary data determined to match the unconfirmed hiragana of the search key; Read the spelling with a further downstream node assigned the same complement unit number as the downstream node, and obtain a conversion candidate that combines the read spelling.
The character string input device according to claim 1.
入力済みの文章のデータから所定の閾値より出現頻度の高い単語列を特定し、当該特定した単語列に対応した綴り補完辞書データのノード列に同一の補完単位番号を付与して生成した新たなノード列を前記綴り補完辞書データに追加するとともに、当該追加したノード列に対応したノード列を前記読み補完辞書データに追加する辞書生成部をさらに備えることを特徴とする請求項1から請求項6のいずれかの項に記載の文字列入力装置。   A new word generated by identifying a word string having an appearance frequency higher than a predetermined threshold from the input sentence data and assigning the same complement unit number to the node string of the spelling complement dictionary data corresponding to the identified word string 7. The apparatus according to claim 1, further comprising: a dictionary generation unit that adds a node sequence to the spelling completion dictionary data and adds a node sequence corresponding to the added node sequence to the reading completion dictionary data. The character string input device according to any one of the items. 前記綴り補完辞書データの各最上流のノードについて、当該最上流のノードを先頭とするノード列の数を取得し、取得したノード列の数が所定以下である場合に、当該最上流のノードを先頭とするノード列に同一の補完単位番号を付与して生成した新たなノード列を前記綴り補完辞書データに追加するとともに、当該追加したノード列に対応したノード列を前記読み補完辞書データに追加する辞書生成部をさらに備えることを特徴とする請求項1から請求項6のいずれかの項に記載の文字列入力装置。   For each uppermost node of the spelling completion dictionary data, the number of node rows starting from the uppermost node is obtained, and when the obtained number of node rows is less than or equal to a predetermined number, A new node string generated by assigning the same complement unit number to the first node string is added to the spelling complement dictionary data, and a node string corresponding to the added node string is added to the reading complement dictionary data The character string input device according to any one of claims 1 to 6, further comprising a dictionary generation unit that performs the operation. 入力された文字列に応じた変換候補を検索して提示し、提示された変換候補を選択することで文字列入力を行う文字列入力装置に用いられる文字列入力方法であって、
前記入力装置は、入力される文字列を変換処理する前の読みが単語として記録された辞書であって、互いに係り受け関係にある単語を、ノードとして木構造に構成した読み補完辞書データ、及び、前記読み補完辞書データに含まれる各単語が変換処理された後の綴りが単語として記録された辞書であって、変換処理前と変換処理後の単語をノードとして対応付けて前記読み補完辞書データの示す木構造と合致した木構造に構成し、かつ、1つのノード列としてみなす、係り受け関係にあるノードに同一の補完単位番号を付与した綴り補完辞書データを記憶する記憶部を備え、
前記文字列入力装置の検索キー生成部が、ユーザの入力に基づき検索キーを生成する検索キー生成過程と、
前記文字列入力装置の変換候補抽出部が、前記検索キー生成過程において生成された検索キーに基づき前記読み補完辞書データ及び前記綴り補完辞書データを検索して当該検索キーに対応した前記綴り補完辞書データのノードを特定し、特定したノードの綴りと、当該特定したノードと同一の補完単位番号が付与されている当該特定したノードの下流のノードの綴りとを前記綴り補完辞書データから読み出して結合した変換候補を取得する変換候補抽出過程と、
前記文字列入力装置の変換候補出力部が、前記変換候補抽出過程において取得した変換候補を出力する変換候補出力過程と、
を有することを特徴とする文字列入力方法。
A character string input method used for a character string input device that searches for and presents conversion candidates according to an input character string, and inputs a character string by selecting the presented conversion candidate,
The input device is a dictionary in which readings before converting input character strings are recorded as words, and reading completion dictionary data in which words having dependency relations are configured as nodes in a tree structure, and A dictionary in which spelling after each word included in the reading completion dictionary data is converted as a word is recorded as a word, and the word before conversion processing and the word after conversion processing are associated with each other as a node. Comprising a storage unit for storing spelling completion dictionary data in which the same complementing unit number is assigned to a node in a dependency relationship, which is configured as a tree structure that matches the tree structure indicated by
A search key generation process in which the search key generation unit of the character string input device generates a search key based on a user input;
The spelling completion dictionary corresponding to the search key by the conversion candidate extraction unit of the character string input device searching the reading completion dictionary data and the spelling completion dictionary data based on the search key generated in the search key generation process. The data node is identified, and the spelling of the identified node and the spelling of the downstream node of the identified node assigned the same complement unit number as the identified node are read and combined from the spelling complement dictionary data Conversion candidate extraction process for acquiring the converted conversion candidates;
A conversion candidate output process in which the conversion candidate output unit of the character string input device outputs the conversion candidates acquired in the conversion candidate extraction process;
A character string input method characterized by comprising:
JP2009115797A 2009-05-12 2009-05-12 Character string input device and character string input method Active JP4514826B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009115797A JP4514826B1 (en) 2009-05-12 2009-05-12 Character string input device and character string input method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009115797A JP4514826B1 (en) 2009-05-12 2009-05-12 Character string input device and character string input method

Publications (2)

Publication Number Publication Date
JP4514826B1 JP4514826B1 (en) 2010-07-28
JP2010266946A true JP2010266946A (en) 2010-11-25

Family

ID=42582597

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009115797A Active JP4514826B1 (en) 2009-05-12 2009-05-12 Character string input device and character string input method

Country Status (1)

Country Link
JP (1) JP4514826B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003233605A (en) * 2002-02-07 2003-08-22 Mitsubishi Electric Corp Character string input device and character string input method
JP2007334534A (en) * 2006-06-14 2007-12-27 Ntt Data Corp Apparatus and method for inputting character string, and program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003233605A (en) * 2002-02-07 2003-08-22 Mitsubishi Electric Corp Character string input device and character string input method
JP2007334534A (en) * 2006-06-14 2007-12-27 Ntt Data Corp Apparatus and method for inputting character string, and program

Also Published As

Publication number Publication date
JP4514826B1 (en) 2010-07-28

Similar Documents

Publication Publication Date Title
US6789231B1 (en) Method and system for providing alternatives for text derived from stochastic input sources
CN102298582A (en) Data searching and matching method and system
KR20130018205A (en) Method for disambiguating multiple readings in language conversion
JP6529761B2 (en) Topic providing system and conversation control terminal device
JP2007334534A (en) Apparatus and method for inputting character string, and program
JP2020080025A (en) Question and answer data generation device and question and answer data generation method
JP2009140466A (en) Method and system for providing conversation dictionary services based on user created dialog data
JP5323652B2 (en) Similar word determination method and system
JP2002117027A (en) Feeling information extracting method and recording medium for feeling information extracting program
Haq et al. Urdu named entity recognition system using deep learning approaches
JP4514826B1 (en) Character string input device and character string input method
CN110968999A (en) Annotating method and system for automatically realizing fine granularity and diversification of docx file
JP5557469B2 (en) Character search device, character search system, character search method, input terminal device, search server, and program
JP2007200252A (en) Abbreviation generation/validity evaluation method, synonym database generation/update method, abbreviation generation/validity evaluation device, synonym database generation/update device, program, and recording medium
JP5481095B2 (en) Character string input device, character string input method, and program
JP5542368B2 (en) Character string input device, character string input method, and program
JP5337559B2 (en) Character string input device, character string input method, and program
JP6807201B2 (en) Information processing device
JP5481094B2 (en) Character string input device, character string input method, and program
JP4765107B2 (en) Character string input device and program
JP3785439B2 (en) Natural language processing device, natural language processing method thereof, and natural language processing program
JP2006011842A (en) Translation device and translation program
JP2010266950A (en) Device, method, and program for inputting character string
JP6476638B2 (en) Specific term candidate extraction device, specific term candidate extraction method, and specific term candidate extraction program
JP5367099B2 (en) Difference location extraction apparatus and program

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100413

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100511

R150 Certificate of patent or registration of utility model

Ref document number: 4514826

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140521

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350