JP2010266946A - Device and method for inputting character string - Google Patents
Device and method for inputting character string Download PDFInfo
- Publication number
- JP2010266946A JP2010266946A JP2009115797A JP2009115797A JP2010266946A JP 2010266946 A JP2010266946 A JP 2010266946A JP 2009115797 A JP2009115797 A JP 2009115797A JP 2009115797 A JP2009115797 A JP 2009115797A JP 2010266946 A JP2010266946 A JP 2010266946A
- Authority
- JP
- Japan
- Prior art keywords
- node
- spelling
- dictionary data
- search key
- complement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 132
- 230000000295 complement effect Effects 0.000 claims abstract description 304
- 238000006243 chemical reaction Methods 0.000 claims abstract description 244
- 238000000605 extraction Methods 0.000 claims description 154
- 238000012545 processing Methods 0.000 claims description 32
- 238000011144 upstream manufacturing Methods 0.000 claims description 24
- 230000014509 gene expression Effects 0.000 abstract description 14
- 238000010586 diagram Methods 0.000 description 30
- 239000013589 supplement Substances 0.000 description 22
- 230000006870 function Effects 0.000 description 13
- 230000004044 response Effects 0.000 description 12
- 238000012790 confirmation Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000007873 sieving Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000003796 beauty Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000012559 user support system Methods 0.000 description 1
Images
Abstract
Description
本発明は、文字列入力装置及び文字列入力方法に関し、特に、コールセンタなどにおける入力作業に好適な文字列入力装置及び文字列入力方法に関する。 The present invention relates to a character string input device and a character string input method, and more particularly to a character string input device and a character string input method suitable for input work in a call center or the like.
コンピュータなどの装置に自然言語としての文字列を入力する場合、言語の種類に応じた入力変換をおこなうことで、キーボードなどから入力された文字列を自然言語に変換することが一般的におこなわれている。このような入力変換としては、キーボードなどからの入力をキーとして辞書データを検索し、候補となる単語を抽出して画面に表示し、その中からユーザが選択することによって入力する方法が一般的である。しかしながら、このような方法では、入力中の文字列以前の文字列(確定文字列)については何ら考慮せずに、読みに基づいた変換候補をすべて表示するため、入力文字数が少ない場合などには、変換候補の数が非常に多くなってしまうという不都合があった。そこで、先行して入力された単語との関係(頻度など)を用いて、次に入力されると思われる単語を変換候補として表示する技術がある(例えば、特許文献1参照)。 When inputting a character string as a natural language into a device such as a computer, the character string input from a keyboard or the like is generally converted into a natural language by performing input conversion according to the language type. ing. As such input conversion, a method of searching dictionary data using an input from a keyboard or the like as a key, extracting candidate words, displaying them on a screen, and inputting by selecting from among them is generally used. It is. However, this method displays all conversion candidates based on reading without considering anything before the character string being entered (determined character string). There is a disadvantage that the number of conversion candidates becomes very large. Therefore, there is a technique for displaying a word that is supposed to be input next as a conversion candidate using a relationship (frequency or the like) with a previously input word (for example, see Patent Document 1).
特定の業務においてユーザがコンピュータを利用する場合、同じ文章や、慣用句などの表現を何度も入力することがある。しかし、特許文献1に開示されている手法では、先行して入力された単語との関係(頻度など)を用いて、次に入力されると思われる単語を変換候補として表示していくため、よく使用する文章や慣用句であっても、先頭から順に単語を選択し、確定していく操作が必要となり、これは煩雑な操作であった。例えば、このような不都合は、電話による応対の内容をリアルタイムに入力する必要のあるコールセンタの作業などにおいて問題となることが多く、より効率的に文字列入力を行なうことが望まれている。そこで、よく使用する表現を辞書に登録し、少ない変換回数で入力変換することが考えられるが、この場合、その表現を構成する単語列が長くなるほど変換候補の数も増えてしまい、文字列を入力するユーザにとって、必ずしも入力の効率化には結びつかない。また、よく入力する表現は時間の経過とともに変化していくことも多く、辞書データを更新していくことが必要となるが、辞書を作成する側にとっても、長い単語列からなる表現が含まれる辞書データを、更新が必要となる度に構築することは現実的ではない。
When a user uses a computer in a specific job, the same sentence or an expression such as an idiom may be input many times. However, in the method disclosed in
本発明は、このような事情を考慮してなされたものであり、その目的は、効率的に作成可能な辞書データを用いて、複数の単語からなる使用頻度の高い表現を簡易な操作によって入力することができる文字列入力装置及び文字列入力方法を提供することにある。 The present invention has been made in consideration of such circumstances, and its purpose is to input frequently used expressions composed of a plurality of words by a simple operation using dictionary data that can be efficiently created. Another object of the present invention is to provide a character string input device and a character string input method that can be used.
上述した課題を解決するために、本発明は、入力された文字列に応じた変換候補を検索して提示し、提示された変換候補を選択することで文字列入力を行う文字列入力装置であって、入力される文字列を変換処理する前の読みが単語として記録された辞書であって、互いに係り受け関係にある単語を、ノードとして木構造に構成した読み補完辞書データ、及び、前記読み補完辞書データに含まれる各単語が変換処理された後の綴りが単語として記録された辞書であって、変換処理前と変換処理後の単語をノードとして対応付けて前記読み補完辞書データの示す木構造と合致した木構造に構成し、かつ、1つのノード列としてみなす、係り受け関係にあるノードに同一の補完単位番号を付与した綴り補完辞書データを記憶する記憶部と、ユーザの入力に基づき検索キーを生成する検索キー生成部と、前記検索キー生成部により生成された検索キーに基づき前記読み補完辞書データ及び前記綴り補完辞書データを検索して当該検索キーに対応した前記綴り補完辞書データのノードを特定し、特定したノードの綴りと、当該特定したノードと同一の補完単位番号が付与されている当該特定したノードの下流のノードの綴りとを前記綴り補完辞書データから読み出して結合した変換候補を取得する変換候補抽出部と、前記変換候補抽出部が取得した変換候補を出力する変換候補出力部と、を備えることを特徴とする文字列入力装置である。 In order to solve the above-described problem, the present invention provides a character string input device that searches for and presents conversion candidates according to an input character string and inputs a character string by selecting the presented conversion candidate. A dictionary in which readings before conversion processing of input character strings are recorded as words, and reading complementary dictionary data in which words having a dependency relationship with each other are configured in a tree structure as nodes, and A dictionary in which spelling after each word included in the reading completion dictionary data is converted as a word is recorded as a word, and the word before the conversion processing and the word after the conversion processing are associated as nodes and indicated by the reading completion dictionary data A storage unit configured to store a spelling completion dictionary data in which a same complementing unit number is assigned to a node having a dependency relationship, which is configured as a tree structure that matches the tree structure and is regarded as one node row; A search key generation unit that generates a search key based on an input; and the spelling corresponding to the search key by searching the reading completion dictionary data and the spelling completion dictionary data based on the search key generated by the search key generation unit The node of the complementary dictionary data is identified, and the spelling of the identified node and the spelling of the downstream node of the identified node assigned the same complement unit number as the identified node are read from the spelling complement dictionary data A conversion candidate extraction unit that acquires conversion candidates that are combined together, and a conversion candidate output unit that outputs the conversion candidates acquired by the conversion candidate extraction unit.
また、上述した課題を解決するために、本発明は、上述する文字列入力装置であって、前記変換候補抽出部は、前記検索キーが未確定ひらがなからなる場合、前記読み補完辞書データから当該検索キーと完全一致する最上流のノードを検出し、検出した当該ノードに対応した前記綴り補完辞書データのノード及び1つ下流のノードを特定し、当該特定したノード及び1つ下流のノードの綴りと、当該1つ下流のノードと同一の補完単位番号が付与されている当該1つ下流のノードのさらに下流のノード綴りとを結合した変換候補を取得する、ことを特徴とする。 Further, in order to solve the above-described problem, the present invention provides the above-described character string input device, wherein the conversion candidate extraction unit, when the search key includes unconfirmed hiragana, The most upstream node that completely matches the search key is detected, the spelling complement dictionary data node corresponding to the detected node and one downstream node are identified, and the spelling of the identified node and one downstream node is identified. And a conversion candidate obtained by combining the further downstream node spelling of the one downstream node assigned the same complement unit number as the one downstream node.
また、上述した課題を解決するために、本発明は、上述する文字列入力装置であって、前記変換候補抽出部は、前記検索キーが確定文字からなる場合、前記綴り補完辞書データから検索キーと前方一致かつ部分一致する最上流のノードを特定し、当該特定したノードの綴りと、当該特定したノードと同一の補完単位番号が付与されている当該特定したノードの下流のノードの綴りとを結合した変換候補を取得する、ことを特徴とする。 Further, in order to solve the above-described problem, the present invention provides the character string input device described above, wherein the conversion candidate extraction unit uses the search key from the spelling completion dictionary data when the search key is a confirmed character. The most upstream node that is forward-matching and partial-matching, and the spelling of the identified node and the spelling of the downstream node of the identified node assigned the same complement unit number as the identified node. A combined conversion candidate is acquired.
また、上述した課題を解決するために、本発明は、上述する文字列入力装置であって、前記変換候補抽出部は、前記検索キーが確定文字からなる場合、前記綴り補完辞書データから検索キーと完全一致する最上流のノードと、当該特定したノードの1つ下流のノードを特定し、当該特定したノード及び1つ下流のノードの綴りと、当該1つ下流のノードと同一の補完単位番号が付与されている当該1つ下流のノードのさらに下流のノード綴りとを結合した変換候補を取得する、ことを特徴とする。 Further, in order to solve the above-described problem, the present invention provides the character string input device described above, wherein the conversion candidate extraction unit uses the search key from the spelling completion dictionary data when the search key is a confirmed character. The most upstream node that exactly matches the node, one node downstream of the identified node, the spelling of the identified node and one downstream node, and the same complement unit number as the one downstream node A conversion candidate obtained by combining the downstream node spelling of the one downstream node to which is assigned is acquired.
また、上述した課題を解決するために、本発明は、上述する文字列入力装置であって、前記変換候補抽出部は、前記検索キーが確定文字及び未確定ひらがなからなる未確定文字列からなる場合、当該検索キーの確定文字によって、前記綴り補完辞書データの最も上流のノードを検索して一致するノードを特定し、特定したノードに対応する前記読み補完辞書データのノードの下流のノードと前記検索キーの未確定ひらがなとの一致を判断し、前記綴り補完辞書データから前記特定したノードと、当該特定したノードの下流のノードであり、前記検索キーの未確定ひらがなと一致すると判断された前記読み補完辞書データのノードに対応したノードと、当該下流のノードと同一の補完単位番号が付与されているさらに下流のノードとの綴りを読み出し、読み出した綴りを結合した変換候補を取得する、ことを特徴とする。 In order to solve the above-described problem, the present invention provides the above-described character string input device, wherein the conversion candidate extraction unit includes an unconfirmed character string in which the search key includes a confirmed character and an unconfirmed hiragana. In this case, by using the fixed character of the search key, the most upstream node of the spelling completion dictionary data is searched to identify a matching node, and the downstream node of the reading completion dictionary data node corresponding to the identified node and the node It is determined that the search key matches the unconfirmed hiragana, and is determined from the spelling completion dictionary data to be the identified node and the downstream node of the identified node, and is determined to match the unconfirmed hiragana of the search key Read the spelling between the node corresponding to the node of the reading completion dictionary data and the further downstream node assigned the same completion unit number as the downstream node. Out, to obtain a conversion candidate bound the read spelling, characterized in that.
また、上述した課題を解決するために、本発明は、上述する文字列入力装置であって、入力済みの文章のデータから所定の閾値より出現頻度の高い単語列を特定し、当該特定した単語列に対応した綴り補完辞書データのノード列に同一の補完単位番号を付与して生成した新たなノード列を前記綴り補完辞書データに追加するとともに、当該追加したノード列に対応したノード列を前記読み補完辞書データに追加する辞書生成部をさらに備えることを特徴とする。 Further, in order to solve the above-described problem, the present invention provides the above-described character string input device, which specifies a word string having an appearance frequency higher than a predetermined threshold from input sentence data, and the specified word A new node sequence generated by assigning the same complement unit number to the node sequence of the spelling complement dictionary data corresponding to the column is added to the spelling complement dictionary data, and the node sequence corresponding to the added node sequence is A dictionary generation unit for adding to the reading completion dictionary data is further provided.
また、上述した課題を解決するために、本発明は、上述する文字列入力装置であって、前記綴り補完辞書データの各最上流のノードについて、当該最上流のノードを先頭とするノード列の数を取得し、取得したノード列の数が所定以下である場合に、当該最上流のノードを先頭とするノード列に同一の補完単位番号を付与して生成した新たなノード列を前記綴り補完辞書データに追加するとともに、当該追加したノード列に対応したノード列を前記読み補完辞書データに追加する辞書生成部をさらに備えることを特徴とする。 Further, in order to solve the above-described problem, the present invention provides the above-described character string input device, wherein each of the most upstream nodes of the spelling complement dictionary data has a node sequence starting from the most upstream node. If the number of acquired node strings is less than or equal to the predetermined number, the new node string generated by assigning the same complement unit number to the node string starting from the most upstream node is used as the spelling complement. In addition to adding to the dictionary data, a dictionary generation unit is further provided for adding a node sequence corresponding to the added node sequence to the reading completion dictionary data.
また、上述した課題を解決するために、本発明は、入力された文字列に応じた変換候補を検索して提示し、提示された変換候補を選択することで文字列入力を行う文字列入力装置に用いられる文字列入力方法であって、前記入力装置は、入力される文字列を変換処理する前の読みが単語として記録された辞書であって、互いに係り受け関係にある単語を、ノードとして木構造に構成した読み補完辞書データ、及び、前記読み補完辞書データに含まれる各単語が変換処理された後の綴りが単語として記録された辞書であって、変換処理前と変換処理後の単語をノードとして対応付けて前記読み補完辞書データの示す木構造と合致した木構造に構成し、かつ、1つのノード列としてみなす、係り受け関係にあるノードに同一の補完単位番号を付与した綴り補完辞書データを記憶する記憶部を備え、前記文字列入力装置の検索キー生成部が、ユーザの入力に基づき検索キーを生成する検索キー生成過程と、前記文字列入力装置の変換候補抽出部が、前記検索キー生成過程において生成された検索キーに基づき前記読み補完辞書データ及び前記綴り補完辞書データを検索して当該検索キーに対応した前記綴り補完辞書データのノードを特定し、特定したノードの綴りと、当該特定したノードと同一の補完単位番号が付与されている当該特定したノードの下流のノードの綴りとを前記綴り補完辞書データから読み出して結合した変換候補を取得する変換候補抽出過程と、前記文字列入力装置の変換候補出力部が、前記変換候補抽出過程において取得した変換候補を出力する変換候補出力過程と、を有することを特徴とする文字列入力方法である。 In order to solve the above-described problem, the present invention searches and presents conversion candidates according to the input character string, and performs character string input by selecting the presented conversion candidate. A character string input method used in a device, wherein the input device is a dictionary in which readings before conversion processing of input character strings are recorded as words, and words that are in a dependency relationship with each other are represented as nodes. Reading dictionary data configured in a tree structure, and a dictionary in which spelling after each word included in the reading completion dictionary data is converted as a word is recorded before and after the conversion process. Associating words as nodes to form a tree structure that matches the tree structure indicated by the reading completion dictionary data, and assigning the same complementary unit number to the nodes in the dependency relationship that are regarded as one node string A search key generation process in which a search key generation unit of the character string input device generates a search key based on a user input, and conversion candidate extraction of the character string input device. The part searches the reading completion dictionary data and the spelling completion dictionary data based on the search key generated in the search key generation process, and identifies and specifies the node of the spelling completion dictionary data corresponding to the search key Conversion candidate extraction for acquiring a conversion candidate obtained by reading from the spelling complement dictionary data the spelling of a node and the spelling of a node downstream of the specified node assigned the same complement unit number as the specified node A conversion candidate output process in which the conversion candidate output unit of the character string input device outputs the conversion candidate acquired in the conversion candidate extraction process; Is a character string input method characterized by having a.
この発明によれば、ユーザが先頭の文字を入力するだけで、複数の単語列からなる表現を変換候補として表示出力することができるため、効率的に文字列入力を行うことが可能となる。また、入力頻度が高い表現や、限られた表現でしか使用されない単語を含んだ表現を抽出して、一つのノード列として扱うように辞書に登録することができるため、辞書の更新を迅速に行なうことが可能となり、辞書の構築にかかっていた時間や人的リソースを削減することができる。 According to the present invention, since a user can input and display an expression composed of a plurality of word strings as conversion candidates only by inputting the first character, it is possible to efficiently input a character string. In addition, it is possible to extract expressions that include frequently used expressions or words that are used only in limited expressions, and register them in the dictionary so that they can be handled as a single node sequence. This makes it possible to reduce the time and human resources required to build the dictionary.
以下、本発明の一実施形態を、図面を参照して説明する。本実施形態では、本発明を、例えば、コールセンタなどでの入力業務に用いる入力端末に適用した場合を例に説明する。 Hereinafter, an embodiment of the present invention will be described with reference to the drawings. In the present embodiment, a case where the present invention is applied to an input terminal used for input work in a call center or the like will be described as an example.
本実施形態にかかる入力端末1は、例えば、ワークステーションやパーソナルコンピュータなどの情報処理装置から構成されるものとする。以下、本実施形態にかかる入力端末1を、図1を参照して説明する。
図1は、本実施形態による入力端末1の構成を示す概略ブロック図である。図示するように、入力端末1は、制御部100、入力制御装置200、出力制御装置300、記憶部400などから構成される。
The
FIG. 1 is a schematic block diagram showing the configuration of the
制御部100は、例えば、CPU(Central Processing Unit:中央演算処理装置)や、ワークエリアとなるメモリなどから構成され、記憶部400に格納されているプログラムを読み出して実行することで、入力端末1の各部を制御するとともに、後述する各処理を実行する。
The
入力制御装置200は、例えば、キーボード211や、ポインティングデバイス212などの入力装置210と入力端末1とを接続し、入力装置210の操作に応じた入力信号を制御部100に入力する。本実施形態では、キーボード211を用いて文字列の入力がなされ、ポインティングデバイス212を用いて入力エリアの選択などが行われるものとする。
The
出力制御装置300は、例えば、ディスプレイ装置311などの出力装置310と入力端末1とを接続し、制御部100の処理結果などを出力装置310に出力する。本実施形態では、予め用意されている入力画面がディスプレイ装置311に出力されることにより表示され、入力装置210を用いた入力操作が、当該表示された入力画面上で行われるものとする。
The
記憶部400は、例えば、ハードディスク装置などの記憶装置から構成され、主に、本実施形態にかかる文字列入力処理に必要な情報を格納する。本実施形態では、記憶部400に、辞書格納領域410、プログラム格納領域440、検索された変換候補を記憶する結果テーブル450、変換候補の中からユーザが入力装置210を用いて選択した文字列によって構成される入力文章を記憶する入力文章格納領域460などの記憶領域が確保されるものとする。
The
辞書格納領域410には、入力端末1を用いた文字列入力の際に用いられる辞書データが格納される。本実施形態では、入力端末1を用いた文字列入力において、自然言語としての日本語入力が行われるものとする。この場合、入力端末1は、いわゆるFEP(Front End Processor)の動作により、キーボード211からの入力に応じた入力変換を行う。よって、辞書格納領域410には、このような、日本語入力変換の際に参照される辞書データが格納される。この場合、入力端末1は、辞書格納領域410に格納されている辞書データを参照することで、変換候補(入力候補)の文字列を選択可能に表示出力する。
The
本実施形態にかかる辞書データの例を、図2を参照して説明する。図2は、辞書格納領域410に格納される辞書データの構成を説明する図である。この図に示すように、辞書格納領域410には、基本辞書領域420と入力内容別辞書領域430とが確保される。基本辞書領域420は、入力端末1での日本語入力の際に参照される辞書データのうち、一般的な辞書データ(以下、「基本辞書データ」とする)を格納する領域である。この基本辞書データには、種々の単語と、その品詞や、読みなどを示す情報とが対応付けられている。すなわち、通常の入力用FEPなどで用いられる一般的な辞書データが、基本辞書データとして基本辞書領域420に格納されている。
An example of dictionary data according to the present embodiment will be described with reference to FIG. FIG. 2 is a diagram for explaining the configuration of dictionary data stored in the
入力内容別辞書領域430は、入力端末1が用いられる業務内容などに基づいて、入力内容に応じて用意された辞書データを格納する領域である。例えば、入力端末1をコールセンタ業務に用いる場合、入力項目が予め規定されているので、特定の入力項目での入力に用いられる単語群から構成される辞書データが入力内容別辞書領域430に格納される。すなわち、入力内容別辞書領域430には、入力内容毎に用意された専用辞書データが格納される。
The input content-
一例として、図2に示すような、応対入力辞書データ(A1)431や、住所入力辞書データ(A2)432などが入力内容別辞書領域430に格納される。このような入力内容別辞書データは、入力画面の入力エリアと対応付けられている。ここで、図3は、入力画面の一例を表す図である。例えば、この図に示すような入力画面ISの場合、応対入力辞書データ431は、電話応対での応対内容を入力するための入力エリアA1と対応付けられる。住所入力辞書データ432は、住所情報を入力するための入力エリアA2と対応付けられる。すなわち、図3に示したような入力画面ISにおいては、辞書データが対応付けされた入力エリアについては、その入力エリアに入力される内容が規定される。
As an example, reception input dictionary data (A1) 431, address input dictionary data (A2) 432, and the like as shown in FIG. Such input content-specific dictionary data is associated with the input area of the input screen. Here, FIG. 3 is a diagram illustrating an example of the input screen. For example, in the case of the input screen IS as shown in this figure, the reception
このような入力内容別に用意された辞書データのそれぞれには、入力される読みに基づいて構成された「読み補完辞書データ」と、変換後の綴りに基づいて構成された「綴り補完辞書データ」と、が一対となって含まれている。すなわち、図2に示すように、応対入力辞書データ(A1)431には、読み補完辞書データ431Aと綴り補完辞書データ431Bとが対応付けられて含まれている。住所入力辞書データ432(A2)には、読み補完辞書データ432Aと綴り補完辞書データ432Bとが対応付けられて含まれている。
Each of the dictionary data prepared for each input content includes “reading dictionary data” configured based on the input reading and “spelling dictionary data” configured based on the spelling after conversion. Are included as a pair. That is, as shown in FIG. 2, the reception input dictionary data (A1) 431 includes the reading
入力内容別に用意された辞書データのそれぞれは、このような一対の異なる辞書データによって構成されており、応対入力辞書データ(A1)431と住所入力辞書データ(A2)432とのそれぞれが1組の辞書データである。よって、仮に、応対入力辞書データ(A1)431と住所入力辞書データ(A2)432のみが入力内容別辞書領域430に格納されているのであれば、入力内容別辞書領域430には、2組の辞書データが格納されていることになる。
Each of the dictionary data prepared for each input content is composed of such a pair of different dictionary data, and each of the response input dictionary data (A1) 431 and the address input dictionary data (A2) 432 is a set. Dictionary data. Therefore, if only the response input dictionary data (A1) 431 and the address input dictionary data (A2) 432 are stored in the input content-
このような入力内容別辞書データの構成を、図4および図5を参照して説明する。ここでは、入力内容別辞書データの一例として、応対入力辞書データ431の構成について説明する。図4は、読み補完辞書データ431Aの構成例を示す概念図であり、図5は、綴り補完辞書データ431Bの構成例を示す概念図である。なお、本実施形態では、携帯電話のユーザサポート業務を行うコールセンタにおいて、ユーザに対する電話応答時に頻出する語彙を基に、応対入力辞書データ431が構成されている場合について説明する。
The configuration of such input content-specific dictionary data will be described with reference to FIGS. 4 and 5. FIG. Here, the configuration of the response
図4を参照して、読み補完辞書データ431Aの構成例を説明する。
図示するように、読み補完辞書データ431Aは、辞書の要素である単語の「読み」を結節点(ノード)とした、樹状の階層構造(木構造)のバイナリデータによって構成されている。そして、この階層構造は、rootを頂点とし、係り受けの関係の係り側の文節を構成するノードから、受け側の文節を構成するノードへと順に連結した構成(ノード列)となっている。ここでは、ノード列のうち、rootに近いほうを上流のノード、rootから遠いほうを下流のノードと呼ぶ。よって、rootの1つ下流が最上流のノードとなる。この構成により、文法的に互いに係り受け関係にある単語が、相関的な位置で連結されている状態を示すデータによって辞書が構築される。なお、1つの文節を構成するノードの数は1または複数でありうる。ここで、読み補完辞書データ431Aは、入力される単語の「読み」に基づく辞書であるので、各ノードには、読みを表すひらがなによって見出し語が示されている。図4において、読み補完辞書データ431Aの各ノードの読みは<>内に示している。
With reference to FIG. 4, a configuration example of the reading
As shown in the figure, the reading
このような読み補完辞書データ431Aと対をなす綴り補完辞書データ431Bの構成例を図5に示す。図示するように綴り補完辞書データ431Bは、読み補完辞書データ431Aと同一の階層構造(木構造)によって構成されており、読み補完辞書データ431Aの各ノードに示された読みに対応する「綴り」が、その読み補完辞書データ431Aのノードに対応する綴り補完辞書データ431Bのノードの位置に、綴り補完辞書データ431Bの各ノードの見出し語として構成される。図5において、綴り補完辞書データ431Bの各ノードの綴りは<>内に示している。
FIG. 5 shows a configuration example of the spelling
つまり、綴り補完辞書データ431Bは、読み補完辞書データ431Aに含まれている各ノードを、当該ノードの綴りに基づいて構成した辞書データである。例えば、読み補完辞書データ431Aにおいて、読みが「けいたい」であるノードにリンクする綴り補完辞書データ431Bでのノードでは、「けいたい」の変換後表記、つまり、綴りである「携帯」が対応する。
That is, the spelling
ここで、読み補完辞書データ431Aおよび綴り補完辞書データ431Bの各ノードに付されている[]内の記号は、読み補完辞書データ431Aと綴り補完辞書データ431Bとのノード間のリンクを表すリンクポインタである。つまり、読み補完辞書データ431Aと綴り補完辞書データ431Bとの間において、[]に同じ記号のリンクポインタが設定されているノード同士は、相互に参照可能であることを示している。ここでは、読み補完辞書データ431Aのリンクポインタには区別のためリンクポインタの記号に「’」を付加している。つまり、綴り補完辞書データ431Bのノードに付与されたリンクポインタが[xn]であれば、読み補完辞書データ431Aの対応するノードのリンクポインタは[xn’]となる。これにより、一対の読み補完辞書データ431Aと綴り補完辞書データ431Bとは、ノード単位でリンクされていることを表している。
Here, the symbol in [] attached to each node of the reading
以下、リンクポインタxn’、読みが「**」であるノードをノードxn’「**」または単にノードxn’と記載し、リンクポインタxn、綴りが「**」であるノードをノードxn「**」または単にノードxnと記載する。例えば、読み補完辞書データ431Aにおけるリンクポインタa1’のノードはノードa1’「けいたい」またはノードa1’と記載し、綴り補完辞書データ431Bにおけるリンクポインタa1のノードはノードa1「携帯」またはノードa1と記載する。
Hereinafter, the link pointer xn ′ and the node whose reading is “**” will be described as the node xn ′ “**” or simply the node xn ′, and the node whose link pointer xn and the spelling is “**” will be referred to as the node xn “ ** "or simply node xn. For example, the node of the link pointer a1 ′ in the reading
また、読み補完辞書データ431Aおよび綴り補完辞書データ431Bの各ノードに付されている()内の数値は補完単位番号であり、リンクポインタによって対応する読み補完辞書データ431Aのノードと、綴り補完辞書データ431Bのノードには、同じ補完単位番号が記述されている。同じ数値の補完単位番号が付与されている相互に連続する隣接したノードは、1つのノード列としてみなす。以下、あるノードxn(またはノードxn’)から、当該ノードxn(xn’)と同じ補完単位番号が付与され、かつ、当該ノードxn(xn’)より下流の連続したノードからなるノード列を、ノードxn(xn’)の同一補完単位ノード列と記載する。なお、少なくとも同じ文節を構成するノードには同じ補完単位番号が付与される。また、同一補完単位ノード列は、1つのノードからなる場合もある。
The numerical values in parentheses attached to the nodes of the reading
例えば、綴り補完辞書データ431Bにおけるノードa1「携帯」は補完単位番号が1、ノードa2「の」は補完単位番号が2であるため、異なる同一補完単位ノード列に含まれるノードとしてみなされる。一方、ノードi1「携帯」、ノードi2「の」、ノードi3「画面」は補完単位番号が1であるため、ノードi1、i2、i3は同一補完単位ノード列であり、1つのノード列としてみなされる。
For example, since the node a1 “mobile” in the spelling
また、読み補完辞書データ431Aおよび綴り補完辞書データ431Bの各ノードに付されている≪≫内の数値は、実際に入力エリアに入力された文章における出現回数を示す。例えば、「新しい」の出現回数が50回である場合、綴り補完辞書データ431Bのノードf1、j1「新しい」に出現回数50が設定され、「新しい/携帯/を/買った」(「/」はノードが結合されている位置を示す)の出現回数が5である場合、ノードf4「買った」に出現回数5が設定される。なお、出現回数の代わりに、単語が出現する割合や標準偏差など、出現頻度を示す任意の情報を用いることができる。
The numerical value in << >> attached to each node of the reading
なお、上記において辞書データは、3階層以下の文節を構成するノードによる階層構造としているが、2階層の文節を構成するノードによる階層構造としてもよく、4階層以上を最大の文節としたノードによる階層構造としてもよい。 In the above, the dictionary data has a hierarchical structure with nodes that constitute clauses of three or less levels, but may have a hierarchical structure with nodes that constitute clauses of two layers, or a node that has four or more layers as the maximum clause. A hierarchical structure may be used.
上述した図1に示すプログラム格納領域440には、制御部100が実行するプログラムが格納される。そして、制御部100が、プログラム格納領域440に格納されているプログラムを実行することで、本実施形態にかかる文字列入力処理を実行する際の機能が実現される。制御部100によって実現される機能を図6に示す。
The program executed by the
図6は、制御部100によって実現される機能を示す機能ブロック図である。図示するように、制御部100は、辞書選択部110、検索キー生成部120、変換候補抽出部130、変換候補出力部140、文字列入力部150、辞書生成部160等の機能を含む。
FIG. 6 is a functional block diagram illustrating functions realized by the
辞書選択部110は、入力画面IS上の入力エリアのいずれに入力が行われているかを判別し、判別された結果に基づいて、その入力エリアに応じた辞書を辞書格納領域410から選択する。
The
検索キー生成部120は、入力が行われている入力エリアから文字列を取得し、検索キーを生成して変換候補抽出部130へ引き渡す。
The search
変換候補抽出部130は、検索キー生成部120が生成した検索キーと辞書選択部110によって指定された辞書に基づいて、変換候補語を抽出し、記憶部400の結果テーブル450に記憶する。
The conversion
変換候補出力部140は、変換候補抽出部130で抽出された候補語から、後述するように、冗長な部分を削除する。そして、出力制御装置300との協働により、整形後の文字列を選択可能にディスプレイ装置311に表示出力する。
The conversion
文字列入力部150は、入力制御装置200などとの協働により、変換候補出力部140が選択可能にディスプレイ装置311に表示出力した整形後の文字列のうち、入力装置210によって選択された文字列を、未確定文字列に対応した変換後の文字列、あるいは、確定文字列に続く文字列として入力する。この場合、出力制御装置300との協働により、選択された文字列を、現在入力作業をおこなっている入力エリアに表示させるとともに、選択された文字列で構成される文章を入力文章格納領域460に書き込む。つまり、記憶部400には、各入力エリアに実際に入力された文章が書き込まれることになる。
The character
辞書生成部160は、入力文章格納領域460に書き込まれた各入力エリアの文章から出現頻度が所定より高い単語列を、また、辞書データにおいて係り受けの分岐が少ない単語列を検出し、当該入力エリアに対応する読み補完辞書データ及び綴り補完辞書データにおいて、検出した単語列を示すノード列を特定し、特定したノード列に同一の補完番号を付与して生成した新たなノード列を追加する。
The
本実施形態では、制御部100がプログラムを実行することで、図6に示す各機能構成が論理的に実現されるが、これらの機能を、例えば、ASIC(Application Specific Integrated Circuit:特定用途向け集積回路)などの物理的な構成によって実現してもよい。
In the present embodiment, the functional configuration shown in FIG. 6 is logically realized by the
次に、上述した構成を有する入力端末1の動作を説明する。ここでは、入力端末1を用いて文字列入力を行う場合に実行される「文字列入力処理」を、図7〜図28を参照して説明する。この処理は、例えば、図3に示すような入力画面ISを表示する操作が行われたことを契機に開始されるものとする。
Next, the operation of the
図7は、入力端末1における字列入力処理のフローチャートである。同図において、処理が開始され、オペレータによって入力装置210から入力がなされると、入力制御装置200から制御部100への入力信号に基づき、辞書選択部110は、表示した入力画面IS上の、どの入力エリアが指定されたかを判別する(S001)。すなわち、入力端末1のオペレータによるポインティングデバイス212等の操作によって、入力画面IS上に用意された入力エリアのうち、入力対象となる入力エリアが選択されたか否かを判別する。
FIG. 7 is a flowchart of the character string input process in the
いずれかの入力エリアが指定されると(S001:YES)、辞書選択部110は、指定された入力エリアが特定の入力エリアであるか否かを判別する(S002)。本実施形態では、辞書データが対応付けられた入力エリアであって、入力内容別辞書を用いた変換入力の対象となっている入力エリアを特定の入力エリアとする。ここでは、応対内容を入力するための入力エリアA1と住所を入力するための入力エリアA2(図3参照)が該当する。
When any input area is designated (S001: YES), the
指定された入力エリアが、特定の入力エリアではないと判定された場合(S002:NO)、基本辞書領域420の基本辞書データを参照し、通常の入力変換動作によって文字列入力が行われる(S100)。
When it is determined that the designated input area is not a specific input area (S002: NO), the basic dictionary data in the
一方、特定の入力エリアが指定されたと判定された場合(S002:YES)、辞書選択部110は、指定された入力エリアの種別を検出する。ここでは、入力エリアA1が指定された場合には、その入力エリアに対応づけされている識別子「A1」が検出され、入力エリアA2が指定された場合には、その入力エリアに対応付けされている識別子「A2」が検出される。
On the other hand, when it is determined that a specific input area has been designated (S002: YES), the
辞書選択部110は、識別子を検出すると、入力内容別辞書領域430にアクセスし、検出された識別子に対応する辞書データを選択する(S003)。図2に示すように、入力内容別辞書領域430に格納されている複数組の入力内容別辞書データには、対応する入力エリアを示す識別子(図2の例では「A1」と「A2」)が付与されている。よって、辞書選択部110は、検出された識別子に基づいて、対応する識別子が付与されている辞書データを選択する。以下、本実施形態では、入力エリアA1に文字列入力を行うものとして説明する。よって、ここでは、応対入力辞書データ(A1)431が選択される。
When the
使用する辞書データを選択すると、辞書選択部110は、選択した辞書データがいずれであるかを変換候補抽出部130に通知するとともに、指定された入力エリアを検索キー生成部120に通知する。
When the dictionary data to be used is selected, the
辞書選択部110から入力エリアの通知を受けると、検索キー生成部120は、指定された入力エリアにある文字列を取得して検索キーを生成する(S200)。検索キーの生成には、種々の方法が考えられるが、本実施形態では、後述する図8に示すフローチャートに従って検索キーを生成する。
When receiving the notification of the input area from the
変換候補抽出部130は、S200において生成された検索キーを検索キー生成部120から受け取ると、当該検索キーを用いて辞書選択部110がS003において選択した辞書から変換候補を抽出し、検索結果として出力する(S300)。検索結果としての候補語が抽出されなければ(S004:NO)、変換候補抽出部130は、図8に示す検索キー生成を行う。候補語の抽出に成功していれば(S004:YES)、変換候補出力部140は、S300において出力された検索結果を候補表示するための整形を行う(S400)。
When the conversion
S400の後、入力装置210による入力が行われなかった場合(S005:NO)、あるいは、現在指定されている入力エリアにさらに文字が入力された場合(S005:YES、S006:YES)、再び、S200からの処理を行う。一方、入力装置210による入力が、現在指定されている入力エリアへの文字入力でもなく、終了指示の入力でもない場合(S006:NO、S007:NO)、S001からの処理を行い、終了指示の入力である場合(S006:NO、S007:YES)、処理を終了する。
After S400, when input by the
次に、図8及び図9を参照して、検索キー生成部120の動作を説明する。図8は、図7のS200において検索キー生成部120が実行する検索キー生成処理のフローチャートを示し、図9は、検索キー生成処理における例を示す。
図7のS200において、検索キー生成処理が実行された場合、図8において、検索キー生成部120は、まず、指定された入力エリア中の文字列を取得する(S201)。一般に、入力エリアには、変換終了した確定文字列と、変換すべく入力作業中の未確定文字列とが混在している。そして、未確定文字列には、FEPが機能する前の「ひらがな」状態と、FEPが機能して漢字などの変換候補が暫定的に表示された状態とがある。以降において、未確定文字列部分は、明細書中では『』により囲まれた文字によって、図中は下線付加によって示すこととする。「確定文字列+未確定文字列」の例は、図9(a)に示すようになる。ここでは、「携帯電話」の文字列を入力する場合において、「携帯」の文字列の漢字が確定しており、『でんわ』の部分がFEPが機能する前の未確定文字列である。そして、『でんわ』の文字列が、暫定的に『電話』として変換される。
Next, the operation of the search
When the search key generation process is executed in S200 of FIG. 7, in FIG. 8, the search
次いで、検索キー生成部120は、得られた文字列のうち、最後の句点「。」以前の文字列を削除する(S202)。その例を図9(b)に示す。ここでは、入力エリア中の文字列「ユーザです。携帯が壊れました。どこのショップ『にも』交換」から、文字列「ユーザです。携帯が壊れました。」を削除し、検索キーを「どこのショップ『にも』交換」としている。
Next, the search
次に、検索キーに未確定部が含まれており、かつ、当該未確定部の右側に確定文字列がある場合には、検索キーから削除(除外)する(S203)。その例を図9(c)に示す。S202において生成された検索キーが「どこのショップ『にも』交換」であった場合、「交換」を削除して検索キー「どこのショップ『にも』」としている。 Next, when the unconfirmed part is included in the search key and there is a confirmed character string on the right side of the unconfirmed part, it is deleted (excluded) from the search key (S203). An example is shown in FIG. If the search key generated in S202 is “any shop“ to ”exchange”, “exchange” is deleted and the search key “any shop“ to ”” is used.
一般に、文字列中に未確定部が複数存在することはない。したがって、入力エリアの文字列の状態は、次のような場合に限られる。
(1)確定部のみ
(2)確定部+未確定部
(3)確定部+未確定部+確定部
(4)未確定部のみ
(5)未確定部+確定部
In general, there are never a plurality of undetermined parts in a character string. Therefore, the state of the character string in the input area is limited to the following cases.
(1) Only the confirmed part (2) Confirmed part + Unconfirmed part (3) Confirmed part + Unconfirmed part + Confirmed part (4) Only unconfirmed part (5) Unconfirmed part + Confirmed part
このうち、S203の処理の結果、(3)の場合は(2)の場合に、(5)の場合は(4)の場合に帰着するので、検索キーは、(1)「確定部のみ」、(2)「確定部+未確定部」、(4)「未確定部のみ」の3通りの場合に限られることとなる。 Of these, as a result of the processing of S203, the case of (3) results in the case of (2), and the case of (5) results in the case of (4). , (2) “determined part + undetermined part”, (4) “only undetermined part”.
次に、検索キー生成部120は、検索キーを「確定部」と「未確定部」とに分離し(S204)、確定部の長さLを取得する(S205)。例えば、確定部が「どこのショップ」である場合、L=7である。次に検索キー生成部120は、確定部の末尾(右端)から左側に長さLの文字列を取り出して「末尾部」を生成する(S206)。最初の検索キー生成にあっては、末尾部は確定部の長さに等しい。従って、S206で生成される末尾部は「どこのショップ」となる。
最後に、検索キー生成部120は、「末尾部」と「未確定部」とを結合する(S207)。この結果、上記例の場合、図9(d)に示す文字列が検索キーとして出力される。つまり、S203において検索キー「どこのショップ『にも』」が抽出され、末尾部が「どこのショップ」である場合、末尾部「どこのショップ」と未確定部『にも』を結合した「どこのショップ『にも』」が検索キーとなる。なお、(1)の場合、「未確定部」がないため、「末尾部」のみが検索キーとなる。このように検索キーが生成されると、続いて、図7のS300の処理を行なう。
Next, the search
Finally, the search
なお、図7において、候補語が抽出されなかった場合(S004:NO)、検索キー生成部120は、L=0か否かを判断する(S209)。Lが0の場合(S209:YES)、図7のS400の処理を実行し、Lが0ではない場合(S209:NO)、現在のLを1減算した値に更新して確定部の左端を一文字減らし、S206からの処理を行ない、S207の実行後は、図7のS300の処理を行なう。
例えば、L=7、末尾部が「どこのショップ」のときに候補語が抽出されなかった場合、S206では、確定部の「末尾」である右端から(L−1)文字を取り出して、末尾部とするため、L=6であり、末尾部は「このショップ」となる。そして、S207では、検索キーは「このショップ『にも』」となる。
In FIG. 7, when a candidate word is not extracted (S004: NO), the search
For example, when a candidate word is not extracted when L = 7 and the last part is “where shop”, in S206, (L−1) characters are extracted from the right end, which is the “end” of the final part, and the end Since L = 6, the last part is “this shop”. In S207, the search key is “this shop“ also ””.
次に、図10〜図25を参照して変換候補抽出部130の動作を説明する。
Next, the operation of the conversion
図10は、図7のS300において変換候補抽出部130が実行する候補抽出処理のフローチャートを示す。
図10において、変換候補抽出部130は、まず、検索キーの先頭が「ひらがなのみ」からなる「未確定部」であるか否かを判断する(S301)。そして、検索キーの先頭が「ひらがなのみ」で、かつ「未確定部」である場合には(S301:YES)、「先頭未確定処理」(S500)に進み、「ひらがなのみ」からなる「未確定部」でない場合(S301:NO)には、「先頭確定処理」(S600)に進む。
FIG. 10 shows a flowchart of candidate extraction processing executed by the conversion
In FIG. 10, the conversion
次に、図10に示す候補抽出処理におけるS500の「先頭未確定処理」について、図11〜図15を参照して説明する。図11は、図10のS500において変換候補抽出部130が実行する先頭未確定処理のフローチャートを示し、図12〜図15は、先頭未確定処理の例を示す。
図11において、変換候補抽出部130は、まず、「読み補完辞書」からrootの1つ下流のノードである最上流ノードを一つ取得する(S501)。これをノードxとする。なお、以降、アルファベット小文字を用いて「ノードx」と記載した場合には、読み補完辞書のノードを表し、アルファベット大文字を用いて「ノードX」と記載した場合には、ノードxと対応する、綴り補完辞書のノードを表すものとする。
Next, the “start unconfirmed process” in S500 in the candidate extraction process shown in FIG. 10 will be described with reference to FIGS. FIG. 11 shows a flowchart of the head unconfirmed process executed by the conversion
In FIG. 11, the conversion
ノードxと検索キーとの間に何らかの「前方一致」がある場合、検索キーとノードxとの長短に応じて、包含関係を次のように定義する。
検索キー ⊂ ノードx 部分一致
検索キー = ノードx 完全一致
検索キー ⊃ ノードx 余剰一致
When there is some “forward match” between the node x and the search key, the inclusion relation is defined as follows according to the length of the search key and the node x.
Search key ⊂ Node x Partial match Search key = Node x Exact match Search key ⊃ Node x Extra match
また、読み補完辞書および綴り補完辞書は、各々、図4および図5に示すように構成されているものとする。ノードxの読みが「けいたい」の場合を例に、検索キーとの部分一致、完全一致、余剰一致する例は、図12(a)に示す通りである。つまり、検索キーが未確定部『けい』であれば部分一致、検索キーが未確定部『けいたい』であれば完全一致、検索キーが未確定部『けいたいが』であれれば余剰一致である。
なお、前方一致とは検索キーとノードxとの一致判断にあたり、常に先頭部分(文字列左端)の一致を条件とすることをいう。部分一致だが前方一致ではない例と、余剰一致だが前方一致ではない例とを、図12(b)に示す。つまり、検索キーが未確定部『たい』であれば部分一致であるが前方一致ではない。また、検索キーが未確定部『わたしのけいたい』であれば余剰一致ではあるが、やはり前方一致ではない。
Further, the reading complement dictionary and the spelling complement dictionary are configured as shown in FIGS. 4 and 5, respectively. An example in which the reading of the node x is “Keitai” is an example of partial match, complete match, and surplus match with the search key, as shown in FIG. In other words, if the search key is an unconfirmed part “Kei”, it is a partial match. is there.
It should be noted that the forward match means that the match of the head part (the left end of the character string) is always a condition when determining the match between the search key and the node x. FIG. 12B shows an example of partial matching but not forward matching and an example of surplus matching but not forward matching. That is, if the search key is the unconfirmed part “tai”, it is a partial match but not a forward match. Also, if the search key is the unconfirmed part “I want to”, it is a surplus match, but not a forward match.
検索キーとノードxに何らの一致(前方一致)もない場合(S502:NO)、変換候補抽出部130は、読み補完辞書に比較すべきノードが残っていないか確認する(S506)。比較すべきノードが残っていれば(S506:NO)、S501へ戻り、まだ比較を行なっていないrootの1つ下流のノードを1つ選択し、このノードをノードxとして以降の処理を行う。
一方、全てのノードについて比較を行なったため、比較すべきノードが残っていない場合(S506:YES)は、当該先頭未確定処理を終了する。
If there is no match (forward match) between the search key and the node x (S502: NO), the conversion
On the other hand, since all nodes have been compared, if there are no remaining nodes to be compared (S506: YES), the head unconfirmed process ends.
また、検索キーとノードxとが、部分一致、完全一致、余剰一致のいずれかの形で前方一致すれば(S502:YES)、変換候補抽出部130は、ノードxに付与されたリンクポインタにより、綴り補完辞書のノードXを取得する(S503)。
そして、検索キーとノードxが部分一致する場合(S504:YES)、変換候補抽出部130は、綴り補完辞書からノードXの同一補完単位ノード列の綴りを読み出して結果テーブル450に追加する(S505)。このとき、変換候補抽出部130は、同一補完単位ノード列の最後のノードの出現回数を綴り補完辞書から読み出し、結合した綴りと対応づけて結果テーブル450に書き込む。この例を図13に示す。ただし、図13では、結果テーブルに書き込まれる出現回数は省略している。
Further, if the search key and the node x match forward in any of partial match, complete match, and surplus match (S502: YES), the conversion
If the search key and the node x partially match (S504: YES), the conversion
図13(a)に示すように、例えば、検索キーが未確定文字『けい』であり、ノードxが読み補完辞書データ431Aにおけるノードa1’「けいたい」である場合は部分一致するため、綴り補完辞書データ431Bのノードa1「携帯」がノードXとして特定される。ノードa1「携帯」には補完単位番号「1」が付与され、1つ下流のノードa2「の」、ノードc2「が」、…には補完単位番号「2」が付与されており、補完単位番号が異なっている。従って、変換候補抽出部130は、ノードXのみを同一補完単位ノード列とし、ノードa1の綴り「携帯」及び出現回数を対応づけて結果テーブル450に追加する。
As shown in FIG. 13A, for example, when the search key is the unconfirmed character “Kei” and the node x is the node a1 ′ “Keitai” in the reading
また、検索キーが未確定文字『けい』であり、ノードxが読み補完辞書データ431Aにおけるノードd1’「けいたいででんわ」である場合も部分一致するため、綴り補完辞書データ431Bのノードd1「携帯電話」がノードXとして特定される。ノードd1「携帯電話」には補完単位番号「1」が付与され、1つ下流のノードd2「の」には補完単位番号「2」が付与されており、補完単位番号が異なっている。従って、変換候補抽出部130は、ノードXのみを同一補完単位ノード列とし、ノードd1の綴り「携帯電話」及び出現回数を対応づけて結果テーブル450に追加する。
In addition, when the search key is the unconfirmed character “Kei” and the node x is the node d1 ′ “Keitai Denwa” in the reading
また、検索キーが未確定文字『けい』であり、ノードxが読み補完辞書データ431Aにおけるノードi1’「けいたい」である場合も部分一致するため、綴り補完辞書データ431Bのノードi1「携帯」がノードXとして特定される。ノードi1「携帯」には補完単位番号「1」が付与されており、下流のノードi2「の」、ノードi3「画面」にも同じ補完単位番号「1」が付与されている。従って、変換候補抽出部130は、ノードi1+ノードi2+ノードi3を同一補完単位ノード列とし、ノードi1、i2、i3の綴りを結合した「携帯の画面」、及び、ノードi3の出現回数を対応付けて結果テーブル450に追加する。
In addition, when the search key is the unconfirmed character “Kei” and the node x is the node i1 ′ “Keitai” in the reading
一方、図13(b)に示すように、検索キーが未確定文字『あ』であり、ノードxが読み補完辞書データ431Aにおけるノードf1’「あたらしい」である場合は部分一致するため、綴り補完辞書データ431Bのノードf1「新しい」がノードXとして特定される。ノードf1「新しい」には補完単位番号「1」が付与され、下流のノードf2「携帯」、ノードh2「パソコン」、…には全て補完単位番号「2」が付与されており、補完単位番号が異なっている。従って、変換候補抽出部130は、ノードXのみを同一補完単位ノード列とし、ノードf1の綴り「新しい」及び出現回数を対応付けて結果テーブル450に追加する。
On the other hand, as shown in FIG. 13 (b), if the search key is the unconfirmed character “A” and the node x is the node f1 ′ “new” in the reading
また、検索キーが未確定文字『あ』であり、ノードxが読み補完辞書データ431Aにおけるノードj1’「あたらしい」である場合も部分一致するため、綴り補完辞書データ431Bのノードj1「新しい」がノードXとして特定される。ノードj1には補完単位番号「1」が、下流のノードj2「パソコン」には補完単位番号「2」が付与されており、補完単位番号が異なっている。従って、変換候補抽出部130は、ノードXのみを同一補完単位ノード列とし、ノードj1の綴り「新しい」及び出現回数を対応付けて結果テーブル450に追加する。
In addition, when the search key is the undetermined character “A” and the node x is the node j1 ′ “new” in the reading
その後、比較すべき候補がまだ残っていれば(S506:NO)、S501へ戻る。全てのノードxについて比較が終了していれば(S506:YES)、当該先頭未確定処理を終了する。 Thereafter, if there are still candidates to be compared (S506: NO), the process returns to S501. If the comparison has been completed for all the nodes x (S506: YES), the head unconfirmed process is terminated.
一方、検索キーとノードxが完全一致する場合(S504:NO、S507:YES)、変換候補抽出部130は、綴り補完辞書から、ノードXと、当該ノードXの1つ下流のノードの同一補完単位ノード列の綴りを読み出して結合し、結果テーブル450に追加する(S508)。このとき、変換候補抽出部130は、同一補完単位ノード列の最後のノードに付加された出現回数を綴り補完辞書から読み出し、綴りと対応づけて結果テーブル450に書き込む。この例を図14に示す。ただし、図14では、結果テーブルに書き込まれる出現回数は省略している。
On the other hand, when the search key and the node x completely match (S504: NO, S507: YES), the conversion
図14(a)に示すように、例えば、検索キーが未確定文字『けいたい』であり、ノードxが読み補完辞書データ431Aにおけるノードa1’「けいたい」である場合は完全一致するため、綴り補完辞書データ431Bのノードa1「携帯」がノードXとして特定される。変換候補抽出部130は、ノードa1の1つ下流のノードa2「の」、ノードc2「が」、…とその補完単位番号「2」を読み出す。そして、読み出した下流のノードそれぞれについて、同一の補完単位番号が付与されたさらに下流のノードを結合したノード列、ノードa2「の」+ノードa3「画面」、ノードa2「の」+ノードb3「ありか」、ノードc2「が」+ノードc3「壊れた」、…を取得する。よって、変換候補抽出部130は、(1)ノードa1(ノードX)とノードa2+ノードa3(同一補完単位ノード列)の綴りを結合した「携帯の画面」、及び、ノードa3の出現回数の対応づけ、(2)ノードa1(ノードX)とノードa2+ノードb3(同一補完単位ノード列)の綴りを結合した「携帯のありか」、及び、ノードb3の出現回数の対応づけ、(3)ノードa1(ノードX)とノードc2+ノードc3(同一補完単位ノード列)の綴りを結合した「携帯が壊れた」、及び、ノードc3の出現回数の対応づけ、を結果テーブル450に追加する。
As shown in FIG. 14A, for example, when the search key is the unconfirmed character “Keitai” and the node x is the node a1 ′ “Keitai” in the reading
また、検索キーが未確定文字『けいたい』であり、ノードxが読み補完辞書データ431Aにおけるノードi1’「けいたい」である場合も完全一致するため、綴り補完辞書データ431Bのノードi1「携帯」がノードXとして特定される。変換候補抽出部130は、ノードi1の1つ下流のノードi2「の」とその補完単位番号「1」を読み出す。そして、読み出した下流のノードについて、同一の補完単位番号が付与されたさらに下流のノードを結合したノード列、ノードi2「の」+ノードi3「画面」…を取得する。よって、変換候補抽出部130は、ノードi1(ノードX)とノードi2+ノードi3(同一補完単位ノード列)の綴りを結合した「携帯の画面」、及び、ノードi3の出現回数を対応付けて結果テーブル450に追加する。
Further, when the search key is the unconfirmed character “Keitai” and the node x is the node i1 ′ “Keitai” in the reading
一方、図14(b)に示すように、例えば、検索キーが未確定文字『ふるい』であり、ノードxが読み補完辞書データ431Aにおけるノードk1’「ふるい」である場合は完全一致するため、綴り補完辞書データ431Bのノードk1「古い」がノードXとして特定される。ノードk1の1つ下流のノードk2「携帯」には補完単位番号「1」が付与され、ノードk2の1つ下流のノードk3には補完単位番号「2」が付与されており、補完単位番号が異なっている。よって、変換候補抽出部130は、ノードk2のみを同一補完単位ノード列とし、ノードk1(ノードX)とノードk2(同一補完単位ノード列)の綴りを結合した「古い携帯」、及び、ノードk2の出現回数の対応付けを結果テーブル450に追加する。
On the other hand, as shown in FIG. 14B, for example, when the search key is the unconfirmed character “sieving” and the node x is the node k1 ′ “sieving” in the reading
一方、図14(c)に示すように、検索キーが未確定文字『あたらしい』であり、ノードxが読み補完辞書データ431Aにおけるノードf1’「あたらしい」(ノードx)である場合は完全一致するため、綴り補完辞書データ431Bのノードf1「新しい」がノードXとして特定される。ノードf1の1つ下流のノードf2「携帯」、ノードh2「パソコン」、…には補完単位番号「2」が付与され、さらに下流のノードf3、g3、h3には補完単位番号「3」が付与されており、補完単位番号が異なっている。よって、変換候補抽出部130は、(1)ノードf1(ノードX)とノードf2(同一補完単位ノード列)の綴りを結合した「新しい携帯」、及び、ノードf2の出現回数の対応付け、(2)ノードf1(ノードX)とノードh2(同一補完単位ノード列)の綴りを結合した「新しいパソコン」、及び、ノードh2の出現回数の対応付け、…を結果テーブル450に追加する。
On the other hand, as shown in FIG. 14 (c), when the search key is the unconfirmed character “new” and the node x is the node f1 ′ “new” (node x) in the reading
また、検索キーが未確定文字『あたらしい』であり、ノードxが読み補完辞書データ431Aにおけるノードj1’「あたらしい」である場合も完全一致するため、ノードXとして綴り補完辞書データ431Bのノードj1「新しい」が特定される。ノードj1の1つ下流のノードj2「パソコン」には補完単位番号「2」が付与されており、さらに下流のノードj3「の」、ノードj4「発売日」にも補完単位番号「2」が付与されている。よって、変換候補抽出部130は、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4からなる同一補完単位ノード列の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数を対応づけて結果テーブル450に追加する。
Further, when the search key is the unconfirmed character “new” and the node x is the node j1 ′ “new” in the reading
その後、比較すべき候補がまだ残っていれば(S506:NO)、S501へ戻る。全てのノードxについて比較が終了していれば(S506:YES)、先頭未確定処理を終了する。 Thereafter, if there are still candidates to be compared (S506: NO), the process returns to S501. If the comparison has been completed for all the nodes x (S506: YES), the head unconfirmed process is terminated.
また、検索キーとノードxが部分一致も完全一致もしない場合には、余剰一致となる(S507:NO)。そこでまず、変換候補抽出部130は、nに1を代入すると(S509)、読み補完辞書からノードyn−1の1つ下流のノードynを取得する(S510)。ただし、ノードy0はノードxとするため、最初のループにおいては、ノードyn(n=1)は、ノードxの1つ下流のノードとなる。
If the search key and the node x are neither partially matched nor completely matched, a surplus match is obtained (S507: NO). Therefore, first, the conversion
次いで、変換候補抽出部130は、まだ余剰キーが生成されていない場合、検索キーからノードxを削除した余りである余剰キーを生成し、すでに余剰キーが生成されている場合は、現在の余剰キーからノードyn−1を削除して余剰キーを更新する。変換候補抽出部130は、余剰キーがノードynに、前方一致を条件として含まれるか(部分一致ないし完全一致するか)判断する(S511)。従って、最初のループにおいては、検索キーからノードxを削除した余剰キーが、ノードxの1つ下流のノードy1に含まれるかを判断する。
Next, the conversion
そして、余剰キーがノードynに含まれる場合(S511:YES)、ノードynと対応する綴り補完辞書のノードYnを特定し、ノードy1に対応したノードY1からノードYnの同一補完単位ノード列までの綴りをノード列Yとして取得する(S512)。従って、最初のループにおいては、ノード列Yは、ノードY1の同一補完単位ノード列となる。変換候補抽出部130は、ノードX+ノード列Yの綴りを結果テーブル450に追加する(S513)。このとき、変換候補抽出部130は、ノード列Yの最後のノードの出現回数を綴り補完辞書から読み出し、結合した綴りと対応づけて結果テーブル450に書き込む。
When the surplus key is included in a node y n (S511: YES), the same node y n and identifies the node Y n corresponding spelling complement dictionary, the nodes from the node Y 1 corresponding to the node y 1 Y n The spelling up to the complement unit node row is acquired as the node row Y (S512). Thus, in the first loop, the node string Y is the same complementary units node sequence of the node Y 1. The conversion
一方、S511において、余剰キーがノードynに含まれないと判断した場合(S511:NO)、変換候補抽出部130は、ノードynが前方一致を条件として余剰キーに含まれるか、つまり、余剰キーがノードynに対して余剰一致するかを判断する(S515)。余剰キーがノードynに対して余剰一致する場合(S515:YES)、現在のnの値に1加算し(S516)、S510からの処理を行う。
例えば、S516において、nの値が2に更新された場合、S510において、変換候補抽出部130は、読み補完辞書からノードy1の1つ下流のノードy2を取得する。次いで、S511において、変換候補抽出部130は、現在の余剰キーからノードy1を削除した余りにより余剰キーを更新し、更新した余剰キーがノードy2に、前方一致を条件として含まれるか判断する。
On the other hand, in S511, if the surplus key is determined not included in node y n (S511: NO), the conversion
For example, in S516, when the value of n is updated to 2, in S510, the conversion
S513の処理の後、あるいは、S515において余剰キーがノードynに対して余剰一致しないと判断された場合(S515:NO)、比較すべき下流ノード候補がまだ残っていれば(S514:NO)、S509へ戻る。一方、全てのノードy1について比較が終了していれば(S514:YES)、S506へ進む。 After the processing of S513, or if the surplus key in S515 is determined not to excess matched against nodes y n (S515: NO), if the still downstream node candidate to be compared (S514: NO) , Return to S509. On the other hand, if the comparison has been completed for all the nodes y 1 (S514: YES), the process proceeds to S506.
余剰キーで示される余りが部分一致、完全一致、余剰一致の例を図15(a)、(b)、(c)に示す。ただし、図15では、結果テーブルに書き込まれる出現回数は省略している。 FIGS. 15A, 15B, and 15C show examples in which the remainder indicated by the surplus key is a partial match, complete match, and surplus match. However, in FIG. 15, the number of appearances written in the result table is omitted.
図15(a)に示すように、例えば、検索キーが未確定文字『けいたいの』であり、ノードxが読み補完辞書データ431Aにおけるノードa1’「けいたい」(ノードx)である場合は余剰一致する。変換候補抽出部130は、ノードa1’の1つ下流のノードa2’「の」、ノードc2’「が」を読み補完辞書データ431Aから読み出し、ノードy1とする。余剰キーは「の」であるため、変換候補抽出部130は、完全一致するノードy1の読み「の」を特定する。そして、この特定したノードy1であるノードa2’のリンクポインタにより、綴り補完辞書データ431Bから、ノードa2「の」が特定される。変換候補抽出部130は、ノードa2の同一補完単位ノード列として、ノードa2「の」+ノードa3「画面」、ノードa2「の」+ノードb3「ありか」を読み出し、ノード列Yとする。変換候補抽出部130は、(1)ノードa1(ノードX)と、ノードa2+ノードa3(ノード列Y)との綴りを結合した「携帯の画面」、及び、ノードa3の出現回数の対応づけ、(2)ノードa1(ノードX)と、ノードa2+ノードb3(ノード列Y)との綴りを結合した「携帯のありか」、及び、ノードb3の出現回数の対応づけを結果テーブル450に追加する。
また、ノードxが読み補完辞書データ431Aにおけるノードi1’「けいたい」(ノードx)である場合もノードy1(ノードi2’「の」)と余剰キー「の」は完全一致し、ノードi1(ノードX)と、ノードi2+ノードi3(ノード列Y)との綴りを結合した「携帯の画面」、及び、ノードi3の出現回数の対応づけが結果テーブル450に追加される。
As shown in FIG. 15A, for example, when the search key is the unconfirmed character “Keitai” and the node x is the node a1 ′ “Keitai” (node x) in the reading
Further, even when the node x is the node i1 ′ “Keitai” (node x) in the reading
一方、図15(b)に示すように、検索キーが未確定文字『あたらしいぱ』であり、ノードxが読み補完辞書データ431Aにおけるノードf1’「あたらしい」である場合は余剰一致する。変換候補抽出部130は、ノードf1’の1つ下流のノードf2’「けいたい」、h2’「ぱそこん」を読み補完辞書データ431Aから読み出し、ノードy1とする。余剰キーは、「ぱ」であるため、変換候補抽出部130は、前方一致かつ部分一致するノードy1の読み「ぱそこん」を特定する。そして、この特定したノードy1であるノードh2’のリンクポインタにより、綴り補完辞書データ431Bにおいて、ノードh2「パソコン」を特定する。ノードh2「パソコン」には補完単位番号「2」が付与され、ノードh2の1つ下流のノードh3には補完単位番号「3」が付与されており、補完単位番号が異なっている。よって、変換候補抽出部130は、ノードh2のみを同一補完単位ノード列とし、このノードh2の同一補完単位ノード列をノード列Yとする。変換候補抽出部130は、ノードf1(ノードX)と、ノードh2(ノード列Y)の綴りを結合した「新しいパソコン」、及び、ノードh2の出現回数の対応づけを結果テーブル450に追加する。
On the other hand, as shown in FIG. 15B, when the search key is the undetermined character “new path” and the node x is the node f1 ′ “new” in the reading
また、検索キーが未確定文字『あたらしいぱ』であり、ノードxが読み補完辞書データ431Aにおけるノードj1’「あたらしい」である場合も余剰一致する。変換候補抽出部130は、ノードj1’の1つ下流のノードj2’「ぱそこん」を読み補完辞書データ431Aから読み出し、ノードy1とする。余剰キーは「ぱ」であるため、ノードy1と前方一致かつ部分一致する。そこで、変換候補抽出部130は、ノードy1であるノードj2’のリンクポインタにより、綴り補完辞書データ431Bにおいて、ノードj2「パソコン」を特定すると、ノードj2の同一補完単位ノード列として、ノードj2「パソコン」+ノードj3「の」+ノードj4「発売日」を読み出し、ノード列Yとする。変換候補抽出部130は、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数を対応づけて結果テーブル450に追加する。
In addition, when the search key is the undetermined character “new path” and the node x is the node j1 ′ “new” in the reading
また、図15(c)に示すように、検索キーが未確定文字『あたらしいけいたいの』であり、ノードxが読み補完辞書データ431Aにおけるノードf1’「あたらしい」である場合は余剰一致する。変換候補抽出部130は、ノードf1’の1つ下流のノードf2’「けいたい」、h2’「ぱそこん」を読み補完辞書データ431Aから読み出し、ノードy1とする。余剰キーは、「けいたいの」であるため、ノードf2’「けいたい」と余剰一致する。そこで、変換候補抽出部130は、余剰一致するノードy1、つまり、ノードf2’「けいたい」の1つ下流のノードf3’「を」、ノードg3’「の」を読み補完辞書データ431Aから読み出してノードy2とするとともに、余剰キーを、「けいたいの」からノードy1(ノードf2’)を削除した「の」に更新する。
Further, as shown in FIG. 15C, when the search key is the unconfirmed character “I want to wake up” and the node x is the node f1 ′ “new” in the reading
余剰キーは「の」であるため、変換候補抽出部130は、完全一致するノードy2の読み「の」を特定する。そして、この特定したノードy2であるノードg3’のリンクポインタにより、綴り補完辞書データ431Bから、ノードg3「の」を特定する。変換候補抽出部130は、ノードg3「の」の同一補完単位ノード列として、ノードg3「の」+ノードg4「発売日」を読み出すとともに、読み出した同一補完単位ノード列の上流ノードであるノードy1、つまり、ノードf2’のリンクポインタにより、綴り補完辞書データ431Bのノードf2「携帯」をノードY1として特定すると、ノードY1からノードY2の同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードf1(ノードX)と、ノードf2+ノードg3+ノードg4(ノード列Y)との綴りを結合した「新しい携帯の発売日」、及び、ノードg4の出現回数の対応づけを結果テーブル450に追加する。
Since surplus key is "no", the conversion
一方、S515において、余剰キーがノードynに対して余剰一致しないと判断した場合(S515:NO)、直接、S514へ進む。この例を図15(d)に示す。
その後、比較すべきノードy1がまだ残っていれば(S514:NO)、S509へ戻る。全てのノードy1について比較が終了していれば(S514:YES)、S506へ進む。
On the other hand, in S515, if the surplus key is determined not to excess matched against nodes y n (S515: NO), it proceeds directly to S514. An example of this is shown in FIG.
Then, if still remains nodes y 1 to be compared (S514: NO), it returns to S509. If the comparison has been completed for all the nodes y 1 (S514: YES), the process proceeds to S506.
図15(d)に示すように、検索キーが未確定文字『けいたいがこわれたので』である場合、n=2まで、つまり、余剰キー「がこわれたので」とノードy1「が」、及び、余剰キー「こわれたので」とノードy2「こわれた」は余剰一致するが、n=3、つまり、余剰キーが「ので」となった場合、S510においてノードy3を取得できなくなるため、S511及びS515においてNOと判定される。
また、検索キーが未確定文字『けいたいがふるい』である場合、n=1のとき、つまり、余剰キー「がふるい」とノードy1「が」は余剰一致するが、n=2のとき、つまり、余剰キーが「ふるい」となった場合、いずれのノードynとも一致しないため、S511及びS515においてNOと判定される。
As shown in FIG. 15 (d), when the search key is an unconfirmed character “because the key was broken”, n = 2, that is, the surplus key “because the key was broken” and the node y 1 “ And, the surplus key “because it was broken” and the node y 2 “broken” are redundantly matched, but if n = 3, that is, if the surplus key becomes “so”, the node y 3 cannot be acquired in S510. Therefore, it is determined NO in S511 and S515.
Further, when the search key is the unconfirmed character “Keitai sieving”, when n = 1, that is, when the surplus key “ga sift” and the node y 1 “ga” are redundantly matched, but n = 2. , that is, if the surplus key becomes "old", because it does not match any node y n, is determined as nO in S511 and S515.
次に、図10に示す候補抽出処理におけるS600の「先頭確定処理」について図16及び図17を参照して説明する。図16は、図10のS600において変換候補抽出部130が実行する先頭確定処理のフローチャートを示し、図17は、先頭確定処理における例を示す。
図16のフローで処理される検索キーには、「確定部のみ」の場合と「確定部+未確定部」の場合とがある。変換候補抽出部130は、綴り補完辞書からrootの1つ下流のノードXを1つ取得する(S601)。ノードXと検索キーとの間の包含関係の定義は、「先頭未確定処理」の場合と同様である。
検索キー ⊂ ノードX 部分一致
検索キー = ノードX 完全一致
検索キー ⊃ ノードX 余剰一致
Next, the “first determination process” in S600 in the candidate extraction process shown in FIG. 10 will be described with reference to FIGS. FIG. 16 shows a flowchart of the head determination process executed by the conversion
The search key processed in the flow of FIG. 16 includes a case of “determined part only” and a case of “determined part + unconfirmed part”. The conversion
Search key ⊂ Node X Partial match Search key = Node X Exact match Search key ⊃ Node X Surplus match
また、先頭確定処理においても、一致判断は「前方一致」を条件とする。ノードXが「携帯」の場合を例とした、検索キーとの部分一致、完全一致、余剰一致の例を図17(a)に示す。つまり、検索キーが確定部「携」であれば部分一致、検索キーが確定部「携帯」であれば完全一致、検索キーが確定部「携帯が」であれれば余剰一致である。 Also, in the head determination process, the match determination is made on the condition of “front match”. FIG. 17A shows an example of partial match, complete match, and surplus match with the search key, taking the case where the node X is “mobile” as an example. In other words, if the search key is the confirmed part “mobile”, the partial match is made. If the search key is the confirmed part “mobile”, the complete match is made.
検索キーとノードXとの間に何らの一致もない場合(S602:NO)、変換候補抽出部130は、綴り補完辞書に、検索キーと比較すべきノードXが残っていないか確認する(S606)。そして、比較すべきノードXが残っていれば(S606:NO)、S601へ戻り、まだ比較を行なっていないrootの1つ下流のノードを1つ選択し、このノードをノードXとして以降の処理を行う。
If there is no match between the search key and the node X (S602: NO), the conversion
一方、全てのrootの1つ下流のノードについて比較を行なったため、比較すべきノードが残っていない場合には(S606:YES)、当該先頭確定処理を終了する。
一方、部分一致の場合には(S604:YES)、変換候補抽出部130は、綴り補完辞書からノードXの同一補完単位ノード列の綴りを読み出して結果テーブル450に追加する。このとき、変換候補抽出部130は、同一補完単位ノード列の最後のノードに付加された出現回数を綴り補完辞書から読み出し、綴りと対応づけて結果テーブル450に書き込む。この例を図17(b)に示す。ただし、図17では、結果テーブルに書き込まれる出現回数は省略している。
On the other hand, since the comparison is performed for one node downstream of all the roots, when there is no remaining node to be compared (S606: YES), the head determination process ends.
On the other hand, in the case of partial match (S604: YES), the conversion
図17(b)に示すように、例えば、検索キーが確定文字「携」であり、ノードXが綴り補完辞書データ431Bにおけるノードa1「携帯」である場合は部分一致する。ノードa1「携帯」には補完単位番号「1」が付与され、1つ下流のノードa2「の」、ノードc2「が」、…には全て補完単位番号「2」が付与されており、補完単位番号が異なっている。従って、変換候補抽出部130は、ノードXのみを同一補完単位ノード列とし、ノードa1の綴り「携帯」及び出現回数を対応づけて結果テーブル450に追加する。
As shown in FIG. 17B, for example, when the search key is the confirmed character “mobile” and the node X is the node a1 “mobile” in the spelling
また、検索キーが確定文字「携」であり、ノードXが綴り補完辞書データ431Bにおけるノードd1「携帯電話」である場合も部分一致する。ノードd1「携帯電話」には補完単位番号「1」が付与され、1つ下流のノードa2「の」には補完単位番号「2」が付与されており、補完単位番号が異なっている。従って、変換候補抽出部130は、ノードXのみを同一補完単位ノード列とし、ノードd1の綴り「携帯電話」及び出現回数を対応づけて結果テーブル450に追加する。
In addition, the search key is the fixed character “mobile”, and the node X is also the node d1 “mobile phone” in the spelling
また、検索キーが確定文字「携」であり、ノードXが綴り補完辞書データ431Bにおけるノードi1「携帯」である場合も部分一致する。ノードi1「携帯」には補完単位番号「1」が付与されており、下流のノードi2「の」、ノードi3「画面」にも同じ補完単位番号「1」が付与されている。従って、変換候補抽出部130は、ノードi1+ノードi2+ノードi3を同一補完単位ノード列とし、ノードi1、i2、i3の綴りを結合した「携帯の画面」、及び、ノードi3の出現回数を対応付けて結果テーブル450に追加する。
Further, the search key is the confirmed character “mobile”, and the node X is also the node i1 “mobile” in the spelling
そして、比較すべきノードがまだ残っていれば(S606:NO)、S601へ戻る。全てのノードXについて比較が終了していれば(S606:YES)、当該先頭確定処理を終了する。 If nodes to be compared still remain (S606: NO), the process returns to S601. If the comparison has been completed for all nodes X (S606: YES), the head determination process is terminated.
一方、完全一致の場合(S604:NO、S607:YES)、変換候補抽出部130は、綴り補完辞書から、綴り補完辞書のノードXと、当該ノードXの1つ下流のノードの同一補完単位ノード列の綴りを読み出して結合し、結果テーブル450に追加する(S608)。このとき、変換候補抽出部130は、ノード列の最後のノードに付加された出現回数を綴り補完辞書から読み出し、綴りと対応づけて結果テーブル450に書き込む。この例を図17(c)に示す。
On the other hand, in the case of a perfect match (S604: NO, S607: YES), the conversion
図17(c)に示すように、例えば、検索キーが確定文字「新しい」であり、ノードXが綴り補完辞書データ431Bにおけるノードf1「新しい」である場合は完全一致する。ノードf1の1つ下流のノードf2「携帯」、ノードh2「パソコン」、…には補完単位番号「2」が付与され、さらに下流のノードf3、g3には補完単位番号「3」が付与されており、補完単位番号が異なっている。よって、変換候補抽出部130は、(1)ノードf1(ノードX)とノードf2(同一補完単位ノード列)の綴りを結合した「新しい携帯」、及び、ノードf2の出現回数の対応付け、(2)ノードf1(ノードX)とノードh2(同一補完単位ノード列)の綴りを結合した「新しいパソコン」、及び、ノードh2の出現回数の対応付け、…を結果テーブル450に追加する。
As shown in FIG. 17C, for example, when the search key is the confirmed character “new” and the node X is the node f1 “new” in the spelling
また、検索キーが確定文字「新しい」であり、ノードXが綴り補完辞書データ431Bにおけるノードj1「新しい」である場合も完全一致する。ノードj1の1つ下流のノードj2「パソコン」には補完単位番号「2」が付与されており、さらに下流のノードj3「の」、ノードj4「発売日」にも補完単位番号「2」が付与されている。よって、変換候補抽出部130は、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4からなる同一補完単位ノード列の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数を対応づけて結果テーブル450に追加する。
In addition, when the search key is the confirmed character “new” and the node X is the node j1 “new” in the spelling
次いで、変換候補抽出部130は綴り補完辞書に比較すべきノードが残っていないか確認する(S606)。比較すべきノードが残っていれば(S606:NO)、S601へ戻る。一方、比較すべきノードが残っていない場合には(S606:YES)、当該先頭確定処理を終了する。
Next, the conversion
また、部分一致でも完全一致でもない場合は余剰一致となる(S607:NO)。変換候補抽出部130は、後述する余剰一致処理(S700)を行い、綴り補完辞書に比較すべきノードが残っていないか確認する(S606)。比較すべきノードが残っていれば(S606:NO)、S601へ戻る。一方、比較すべきノードが残っていない場合には(S606:YES)、当該先頭確定処理を終了する。
Further, when neither partial coincidence nor complete coincidence is made, redundant coincidence is determined (S607: NO). The conversion
次に、図18〜図25を参照して余剰一致処理について説明する。図18及び図19は、図16のS700において変換候補抽出部130が実行する余剰処理のフローチャートを示し、図20〜図25は、余剰処理の例を示す。
図18において、変換候補抽出部130は、まず、nに1を代入すると(S701)、綴り補完辞書からノードYn−1の1つ下流のノードYnを一つ取得する(S702)。ただし、ノードY0はノードXとするため、ノードY1はノードXの1つ下流のノードとなる。ノードY1の例を図20に示す。
Next, the surplus matching process will be described with reference to FIGS. 18 and 19 show flowcharts of surplus processing executed by the conversion
18, the conversion
図20(a)に示すように、例えば、検索キーが「携帯『の』」、または、「携帯の」であり、ノードXが綴り補完辞書データ431Bにおけるノードa1「携帯」である場合、ノードa2「の」、及び、ノードc2「が」がノードY1として選択される。
また、ノードXが綴り補完辞書データ431Bにおけるノードi1「携帯」である場合、ノードi2「の」がノードY1として選択される。
As shown in FIG. 20A, for example, when the search key is “mobile” “no” or “mobile” and the node X is the node a1 “mobile” in the spelling
Also, if the node X is the node i1 "portable" in the
一方、図20(b)に示すように、検索キーが「新しい『ぱ』」であり、ノードXが綴り補完辞書データ431Bにおけるノードf1「新しい」である場合、一つ下流のノードf2「携帯」、及び、h2「パソコン」がノードY1として選択される。
また、検索キーが「新しい『ぱ』」であり、ノードXが綴り補完辞書データ431Bにおけるノードj1「新しい」である場合、ノードj2「パソコン」がノードY1として選択される。
On the other hand, as shown in FIG. 20B, when the search key is “new“ pa ”and the node X is the node f1“ new ”in the spelling
In addition, the search key is "new" path "", if the node X is a node j1 "new" in the
次いで、変換候補抽出部130は、検索キーからノードYn−1を削除した余りキーαnを生成すると、この余りキーαnが「ひらがなのみ」からなる「未確定部」であるか否か判断する(S703)。ここで、図21(a)にS703がYESの例を示し、図21(b)にS703がNOの例を示す。図21(a)には、検索キーが「携帯『のが』」である場合、余りキーα1が未確定部『のが』となることが、図21(b)には、検索キーが「携帯の『が』」である場合、余りキーα1が確定部と未確定部が含まれる「の『が』」となることを示している。
Next, when the conversion
余りαnが「ひらがなのみ」からなる「未確定部」である場合には(S703:YES)、変換候補抽出部130は、読み補完辞書から、ノードYn−1の1つ下流のノードYnと対応するノードynを検索して取得する(S704)。そして、変換候補抽出部130は、余りキーαnが前方一致し、かつ、ノードynと部分一致ないし完全一致するか判定する(S705)。
If the remainder α n is an “undetermined part” consisting of “Hiragana only” (S703: YES), the conversion
そして、余りキーαnがノードynと前方一致し、かつ、部分一致ないし完全一致する場合(S705:YES)、変換候補抽出部130は、綴り補完辞書より、ノードY1からノードYnの同一補完単位ノード列までの綴りをノード列Yとして取得すると、ノードXとノード列Yの綴り結合し、結果テーブル450に追加する(S706)。このとき、変換候補抽出部130は、ノード列Yの最後のノードの出現回数を綴り補完辞書から読み出し、綴りと対応づけて結果テーブル450に書き込む。
If the remainder key α n matches forward with the node y n and also partially matches or completely matches (S705: YES), the conversion
一方、S705において、余りキーαnがノードynに含まれないと判断した場合(S705:NO)、変換候補抽出部130は、ノードynが前方一致を条件として余りキーαnに含まれるか、つまり、余りキーαnがノードynに対して余剰一致するかを判断する(S708)。余りキーαnがノードynに対して余剰一致する場合(S708:YES)、現在のnの値に1加算し(S709)、余りキーαn−1からノードyn−1を削除して余りキーαnを生成すると(S710)、S704からの処理を行なう。
例えば、S709において、nの値が2に更新された場合、S710において、変換候補抽出部130は、余りキーα1からノードy1を削除した余りにより余りキーα2を生成し、S704において、ノードy1の1つ下流のノードy2を取得する。次いで、生成した余りキーα2がノードy2に、前方一致を条件として含まれるか判断する。
上記例を図22に示す。ただし、図22では、結果テーブルに書き込まれる出現回数は省略している。S706の処理の後、変換候補抽出部130は、S707へ進む。
On the other hand, when it is determined in S705 that the remainder key α n is not included in the node y n (S705: NO), the conversion
For example, in S709, when the value of n is updated to 2, in S710, the conversion
The above example is shown in FIG. However, in FIG. 22, the number of appearances written in the result table is omitted. After the process of S706, the conversion
図22(a)に示すように、検索キーが「新しい『ぱ』」、余りキーα1が『ぱ』、ノードXがノードf1「新しい」、ノードY1がノードf2「携帯」、ノードh2「パソコン」である場合、変換候補抽出部130は、ノードy1として、読み補完辞書データ431Aからノードf2’の読み「けいたい」、ノードh2’の読み「ぱそこん」を取得する。余りキーα1とノードh2’の読みは前方一致かつ部分一致するため、変換候補抽出部130は、綴り補完辞書データ431Bにおいて、ノードh2’に対応したノードh2を特定する。ノードh2「パソコン」には補完単位番号「2」が付与され、ノードh2の1つ下流のノードh3には補完単位番号「3」が付与されており、補完単位番号が異なっているため、変換候補抽出部130は、ノードh2のみを同一補完単位ノード列とし、このノードh2の同一補完単位ノード列をノード列Yとする。ノード変換候補抽出部130は、ノードf1(ノードX)と、ノードh2(ノード列Y)の綴りを結合した「新しいパソコン」、及び、ノードh2の出現回数を対応づけて結果テーブル450に追加する。
As shown in FIG. 22 (a), the search key "new" path "," very key alpha 1 is "Pas", the node X to the node f1 "new", the node Y 1 node f2 "mobile" node h2 If it is "PC", the conversion
また、検索キーが「新しい『ぱ』」、余りキーα1が『ぱ』、ノードXがノードj1「新しい」、ノードY1がノードj2「パソコン」である場合、変換候補抽出部130は、ノードy1として、読み補完辞書データ431Aからノードj2’の読み「ぱそこん」を取得する。余りキーα1『ぱ』とノードj2’の読みは前方一致かつ部分一致する。変換候補抽出部130は、ノードj2の同一補完単位ノード列として、ノードj2「パソコン」+ノードj3「の」+ノードj4「発売日」を綴り補完辞書データ431Bから読み出し、ノード列Yとする。変換候補抽出部130は、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数を対応づけて結果テーブル450に追加する。
Also, the search key "new" path "," very key alpha 1 is "Pas", the node X to the node j1 "new", if the node Y 1 is the node j2 "PC", the conversion
一方、図22(b)に示すように、検索キーが「新しい『ぱそこんの』」、余りキーα1が『ぱそこんの』、ノードXがノードf1「新しい」、ノードY1がノードf2「携帯」、ノードh2「パソコン」である場合、変換候補抽出部130は、ノードy1として、読み補完辞書データ431Aからノードf2’の読み「けいたい」、ノードh2’の読み「ぱそこん」を取得する。余りキーα1はノードh2’の読みと余剰一致するため、変換候補抽出部130は、余りキーα1からノードh2’(ノードy1)を削除した余りキーα2『の』を生成するとともに、読み補完辞書データ431Aからノードh2’の1つ下流のノードh3’「の」を読み出してノードy2とする。余りキーα2とノードh3’は完全一致するため、変換候補抽出部130は、綴り補完辞書データ431Bにおいて、ノードh3の同一補完単位ノード列として、ノードh3「の」+ノードh4「発売日」を特定すると、ノードY1からノードY2の同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードf1(ノードX)と、ノードh2+ノードh3+ノードh4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードh4の出現回数を対応づけて結果テーブル450に追加する。
On the other hand, as shown in FIG. 22 (b), "new" PC "," search key, much the key alpha 1 is "PC", the node X to the node f1 "new", the node Y 1 node f2 "Mobile "If a node h2" PC ", the conversion
また、検索キーが「新しい『ぱそこんの』」、余りキーα1が『ぱそこんの』、ノードXがノードj1「新しい」である場合も同様の処理により、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数の対応付けが結果テーブル450に追加される。 Further, when the search key is “new“ pason ”, the remainder key α 1 is“ pason ”, and the node X is“ new ”, the node j1 (node X) and the node j2 + The “new PC release date” combined with the spelling of node j3 + node j4 (node row Y) and the number of appearances of node j4 are added to result table 450.
一方、余りキーαnがノードynに対して余剰一致しない場合(S708:NO)、すなわち、図22(c)に示すような場合には、直接、S707へ進む。
図22(c)に示すように、例えば、検索キーが「携帯『から』」、余りキーα1が『から』である場合、ノードXがノードa1、i1「携帯」のいずれであっても、ノードy1と余りキーは部分一致も完全一致も余剰一致もしない。
また、検索キーが「携帯『のがめんがきえた』」である場合、n=2まで、つまり、余りキーα1「のがめんがきえた」とノードy1「の」、余りキーα2「がめんがきえた」とノードy2「がめん」は余剰一致するが、n=3のとき、つまり、余りキーα3が「がきえた」となったところで、S704でノードY4、ノードy4が取得できず、S705及びS708においてNOと判定される。
On the other hand, when the surplus key α n does not coincide with the node y n (S708: NO), that is, in the case shown in FIG. 22C, the process directly proceeds to S707.
As shown in FIG. 22 (c), for example, the search key "portable" from "," less if the key alpha 1 is "from", be any node X to the node a1, i1 of "portable" , The node y 1 and the remainder key do not have partial match, complete match or surplus match.
Also, if the search key is “mobile phone“ no mangamen ””, up to n = 2, that is, the remainder key α 1 “no anger has gone” and node y 1 “no”, the remainder key α 2 “Gamen is clear” and node y 2 “Gamen” are redundantly matched, but when n = 3, that is, when the remainder key α 3 becomes “clear”, node Y 4 in S704 , can not obtain a node y 4 is determined as NO in S705 and S 708.
その後、比較すべきノードY1がまだ残っていれば(S707:NO)、S701へ戻り、まだ比較を行なっていないノードY1を1つ選択して以降の処理を行う。一方、全てのノードY1について比較が終了していれば(S707:YES)、当該余剰一致処理を終了する。 Thereafter, any remaining still Node Y 1 to be compared (S707: NO), returns to S701, performs still one node Y 1 that is not performed compared selected and subsequent processing. On the other hand, if the comparison of all the nodes Y 1 has been completed (S707: YES), ends the surplus matching.
また、余りキーαnの中に確定文字列があるか、未確定部のみであっても、ひらがなだけではない場合(S703:NO)、変換候補抽出部130は、余りキーαnがノードYnと部分一致または完全一致するか判定する(S711)。そして、余りキーαnがノードYnと部分一致または完全一致する場合(S711:YES)、変換候補抽出部130は、綴り補完辞書より、ノードY1からノードYnの同一補完単位ノード列までの綴りをノード列Yとして取得すると、ノードXとノード列Yの綴りを結合し、結果テーブル450に追加する(S712)。この例を図23(a)、(b)に示す。ただし、図23では、結果テーブルに書き込まれる出現回数は省略している。その後、S707へ進む。
If there is a confirmed character string in the remainder key α n or only the unconfirmed part is not only hiragana (S703: NO), the conversion
図23(a)において、検索キーが「携帯の」、余りキーα1が「の」であり、ノードXがノードa1「携帯」、ノードY1がノードa2「の」である場合、変換候補抽出部130は、ノードY1と余りキーα1が完全一致すると判断する(S711:YES)。変換候補抽出部130は、ノードa2の同一補完単位ノード列として、ノードa2「の」+ノードa3「画面」、及び、ノードa2「の」+ノードb3「ありか」を綴り補完辞書データ431Bから読み出し、ノード列Yとする。変換候補抽出部130は、(1)ノードa1と、ノードa2+ノードa3(ノード列Y)の綴りを結合した「携帯の画面」、及び、ノードa3の出現回数の対応付け、(2)ノードa1と、ノードa2+ノードb3(ノード列Y)の綴りを結合した「携帯のありか」、及び、ノードb3の出現回数の対応付けを結果テーブル450に追加する。
なお、ノードXがノードi1「携帯」、ノードY1がノードi2「の」である場合も同様に、「携帯の画面」、及び、ノードi3の出現回数の対応付けがが結果テーブル450に追加される。
In FIG. 23 (a), the search key "mobile", a remainder key alpha 1 is "no", the node X to the node a1 "portable", when the node Y 1 is the node a2 "of" conversion candidate The
Incidentally, also when the node X is the node i1 "mobile", the node Y 1 node i2 "no", "mobile screen", and the association of the number of occurrences of the node i3 is the result added to the table 450 Is done.
図23(b)において、検索キーが「新しいパ」、余りキーα1が「パ」、ノードXがノードf1「新しい」、ノードY1がノードh2「パソコン」である場合、変換候補抽出部130は、ノードY1と余りキーα1が部分一致すると判断する(S711:YES)。ノードh2「パソコン」には補完単位番号「2」が付与され、ノードh2の1つ下流のノードh3には補完単位番号「3」が付与されており、補完単位番号が異なっているため、変換候補抽出部130は、ノードh2のみを同一補完単位ノード列とし、このノードh2の同一補完単位ノード列をノード列Yとする。ノード変換候補抽出部130は、ノードf1(ノードX)と、ノードh2(ノード列Y)の綴りを結合した「新しいパソコン」、及び、ノードh2の出現回数を対応づけて結果テーブル450に追加する。
In FIG. 23B, when the search key is “new pa”, the remainder key α 1 is “pa”, the node X is the node f1 “new”, and the node Y 1 is the node h2 “personal computer”, the conversion
また、検索キーが「新しいパ」、余りキーα1が「パ」、ノードXがノードj1「新しい」、ノードY1がノードj2「パソコン」である場合、変換候補抽出部130は、ノードY1と余りキーα1が部分一致すると判断する(S711:YES)。変換候補抽出部130は、ノードj2の同一補完単位ノード列として、ノードj2「パソコン」+ノードj3「の」+ノードj4「発売日」を読み出し、ノード列Yとする。変換候補抽出部130は、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数を対応づけて結果テーブル450に追加する。
Also, if the search key is a "new path", too key alpha 1 is "Pas", the node X to the node j1 "new", the node Y 1 is a node j2 "PC", the conversion
その後、比較すべきノードY1がまだ残っていれば(S707:NO)、S701へ戻る。一方、全てのノードY1について比較が終了していれば(S707:YES)、当該余剰一致処理を終了する。 Then, if still remains nodes Y 1 to be compared (S707: NO), it returns to S701. On the other hand, if the comparison of all the nodes Y 1 has been completed (S707: YES), ends the surplus matching.
一方、余りキーαnがノードYnと部分一致も完全一致もしない場合(S711:NO)、図19において、変換候補抽出部130は、余りキーαnがノードYnを包含するか否か判定する(S713)。そして、余りキーαnがノードYnを包含しない場合(S713:NO)、すなわち、図23(c)に示すような場合には、図18のS707へ進む。
図23(c)において、例えば、検索キーが「携帯から」、余りキーα1が「から」である場合、ノードXがノードa1、i1「携帯」のいずれであっても、ノードY1と余りキーαは部分一致も完全一致もせず、余りキーα1はノードY1を包含しない。
On the other hand, when the remainder key α n does not partially match or completely match the node Y n (S711: NO), in FIG. 19, the conversion
In FIG. 23 (c), the example, "from the mobile" search key, when the remainder key alpha 1 is "from", be any node X to the node a1, i1 of "mobile", and the node Y 1 The remainder key α does not match partly or completely, and the remainder key α 1 does not include the node Y 1 .
一方、図19において、余りキーαnがノードYnを包含する場合(S713:YES)、変換候補抽出部130は、余りキーαnから更にノードYnを除いた余りキーαn+1を作成し、余りキーαn+1が「ひらがなのみ」からなる「未確定部」であるか否か判定する(S714)。
余りキーαn+1がひらがなのみからなる未確定部である場合(S714:YES)、変換候補抽出部130は、ノードYnの1つ下流のノードYn+1と対応するノードyn+1を読み補完辞書から取得すると(S715)、余りキーαn+1がノードyn+1と部分一致または完全一致するか判定する(S716)。そして、余りキーαn+1がノードyn+1と部分一致または完全一致する場合(S716:YES)、変換候補抽出部130は、綴り補完辞書より、ノードY1からノードYn+1の同一補完単位ノード列までの綴りをノード列Yとして取得すると、ノードX+ノード列Yの綴りを結合して、結果テーブル450に追加する(S717)。このとき、変換候補抽出部130は、ノード列Yの最後のノードに付加された出現回数を綴り補完辞書から読み出し、綴りと対応づけて結果テーブル450に書き込む。
On the other hand, in FIG. 19, when the remainder key alpha n encompasses the node Y n (S713: YES), the conversion
Less if the key alpha n + 1 is an undetermined portion consisting of only Hiragana (S714: YES), the conversion
一方、S716において、余りキーαn+1がノードyn+1と部分一致も完全一致もしないと判断した場合(S716:NO)、変換候補抽出部130は、ノードyn+1が前方一致を条件として余りキーαn+1に含まれるか、つまり、余りキーαn+1がノードyn+1に対して余剰一致するかを判断する(S718)。余りキーαn+1がノードyn+1に対して余剰一致する場合(S718:YES)、現在のnの値に1加算し(S719)、余りキーαnからノードynを削除して余りキーαn+1を生成すると(S720)、S715からの処理を行なう。
例えば、S719において、nの値が2に更新された場合、S720において、変換候補抽出部130は、余りキーα2からノードy2を削除した余りにより余りキーα3を生成し、S715において、ノードy2の1つ下流のノードy3を取得する。次いで、S716生成した余りキーα3がノードy3に、部分一致または前方一致するかを判断する。
On the other hand, in S716, when it is determined that the remainder key α n + 1 does not partially match or completely match the node y n + 1 (S716: NO), the conversion
For example, in S719, when the value of n is updated to 2, in S720, the conversion
上記の例を図24(a)、(b)、(c)に示す。ただし、図24では、結果テーブルに書き込まれる出現回数は省略している。S717の処理の後、図18のS707へ進む。 The above examples are shown in FIGS. 24 (a), (b), and (c). However, in FIG. 24, the number of appearances written in the result table is omitted. After the process of S717, the process proceeds to S707 in FIG.
図24(a)において、検索キーが「携帯の『が』」、余りキーα1が「の『が』」であり、ノードXがノードa1「携帯」、ノードY1がノードa2「の」である場合、余りキーα1はノードY1を包含する。よって、余りキーα2『が』を作成する。余りキーα2がひらがなのみからなる未確定部であるため(S714:YES)、変換候補抽出部130は、ノードY1の次のノードであるノードY2、つまりノードa3「画面」に対応したノードa3’の読み「がめん」をノードy2として読み補完辞書データ431Aから読み出す(S715)。ノードy2であるノードa3’「がめん」と、余りキーα2『が』は部分一致する(S716:YES)。綴り補完辞書データ431Bにおいて、ノードa3には下流のノードがないため、変換候補抽出部130は、ノードa3のみをノードY2の同一補完単位ノード列とし、ノードY1からノードY2の同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードa1(ノードX)と、ノードa2+ノードa3(ノード列Y)の綴りを結合した「携帯の画面」、及び、ノードa3の出現回数を対応づけて結果テーブル450に追加する。
なお、ノードXがノードi1「携帯」、ノードY1がノードi2「の」である場合も同様の処理により、ノードi1(ノードX)と、ノードi2+ノードi3(ノード列Y)の綴りを結合した「携帯の画面」、及び、ノードi3の出現回数の対応付けが結果テーブル450に追加される。
In FIG. 24 (a), a search key is "portable" ga "", a remainder key alpha 1 is "a" but "," node X to the node a1 "mobile", the node Y 1 is a node a2 "of" , The remainder key α 1 contains the node Y 1 . Thus, the remainder create a key α 2 "ga". Less for the key alpha 2 is undetermined portion consisting of only Hiragana (S714: YES), the conversion
Incidentally, linked by similar processes when the node X to the node i1 "mobile", the node Y 1 is the node i2 "no", the node i1 and (node X), node i2 + node i3 spelling (node sequence Y) The association between the “portable screen” and the number of appearances of the node i3 is added to the result table 450.
一方、図24(b)において、検索キーが「新しいパソコン『の』」、余りキーα1が「パソコン『の』」であり、ノードXがノードf1「新しい」、ノードY1がノードh2「パソコン」である場合、余りキーα1はノードY1を包含する。よって、余りキーα2『の』を作成する。余りキーα2がひらがなのみからなる未確定部であるため(S714:YES)、変換候補抽出部130は、ノードY1の次のノードであるノードY2、つまりノードh3「の」に対応したノードh3’の読み「の」をノードy2として読み補完辞書データ431Aから読み出す(S715)。ノードy2であるノードh3’「の」と、余りキーα2『の』は完全一致するため(S716:YES)、変換候補抽出部130は、ノードh3の同一補完単位ノード列として、ノードh3「の」+ノードh4「発売日」を特定すると、ノードY1からノードY2の同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードj1(ノードX)と、ノードh2+ノードh3+ノードh4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードh4の出現回数を対応づけて結果テーブル450に追加する。
また、ノードXがノードj1「新しい」、ノードY1がノードj2「パソコン」である場合も同様の処理により、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数の対応付けが結果テーブル450に追加される。
On the other hand, in FIG. 24 (b), the search key "new computer" of "", a remainder key alpha 1 is "PC" no "," node X node f1 "new", the node Y 1 node h2 " In the case of “PC”, the remainder key α 1 includes the node Y 1 . Therefore, the remainder key α 2 “NO” is created. Less for the key alpha 2 is undetermined portion consisting of only Hiragana (S714: YES), the conversion
The node X is the node j1 "new", the same process is when the node Y 1 is the node j2 "PC", spelled nodes j1 and (node X), a node j2 + node j3 + node j4 (node sequence Y) Are associated with the “release date of a new personal computer” and the number of appearances of the node j4.
一方、図24(c)において、検索キーが「新しいパソコン『のは』」、余りキーα1が「パソコン『のは』」であり、ノードXがノードf1「新しい」、ノードY1がノードh2「パソコン」である場合、余りキーα1はノードY1を包含する。よって、余りキーα2『のは』を作成する。余りキーα2がひらがなのみからなる未確定部であるため(S714:YES)、変換候補抽出部130は、ノードY1の次のノードであるノードY2、つまりノードh3「の」に対応したノードh3’の読み「の」をノードy2として読み補完辞書データ431Aから読み出す(S715)。
ノードy2と余りキーα2は余剰一致するため(S716:NO、S718:YES)、変換候補抽出部130は、余りキーα2『のは』からノードy2を削除し、余りキーα3『は』を作成する(S719、S720)。変換候補抽出部130は、ノードh3’(ノードy2)の1つ下流のノードh4’の読み「はつばいび」をノードy3として読み補完辞書データ431Aから読み出す(S715)。
On the other hand, in FIG. 24C, the search key is “new personal computer“ no-ha ””, the remainder key α 1 is “personal computer“ no-ha ””, the node X is the
Since the node y 2 and the remainder key α 2 are redundantly matched (S716: NO, S718: YES), the conversion
ノードy3と余りキーα3は部分一致する(S716:YES)。綴り補完辞書データ431Bにおいて、ノードh4には下流のノードがないため、変換候補抽出部130は、ノードh4のみをノードY3の同一補完単位ノード列とし、ノードY1からノードY3の同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードj1(ノードX)と、ノードh2+ノードh3+ノードh4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードh4の出現回数を対応づけて結果テーブル450に追加する。
また、ノードXがノードj1「新しい」、ノードY1がノードj2「パソコン」である場合も同様の処理により、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数の対応付けが結果テーブル450に追加される。
The node y 3 and the remainder key α 3 partially match (S716: YES). In spelling
The node X is the node j1 "new", the same process is when the node Y 1 is the node j2 "PC", spelled nodes j1 and (node X), a node j2 + node j3 + node j4 (node sequence Y) Are associated with the “release date of a new personal computer” and the number of appearances of the node j4.
一方、余りキーαn+1がノードyn+1に対して余剰一致しない場合(S718:NO)、すなわち、図24(d)に示すような場合には、図18のS707へ進む。 On the other hand, if the surplus key α n + 1 does not coincide with the node y n + 1 (S718: NO), that is, as shown in FIG. 24D, the process proceeds to S707 in FIG.
例えば、図24(d)に示すように、検索キーが「新しいパソコン『が』」、余りキーα1が「パソコン『が』」であり、ノードXがノードf1「新しい」、ノードY1がノードh2「パソコン」である場合、余りキーα2『が』が作成される。ノードY2、つまりノードh3「の」に対応したノードh3’(ノードy2)の読み「の」は、余りキーα2とは部分一致も完全一致も余剰一致もしない。ノードXがノードj1「新しい」、ノードY1がノードj2「パソコン」である場合も同様である。
その後、比較すべき下流のノードY1がまだ残っていれば(S707:NO)、S701へ戻る。一方、全てのノードY1について比較が終了していれば(S707:YES)、当該余剰一致処理を終了する。
For example, as shown in FIG. 24D, the search key is “new personal computer“ GA ””, the remainder key α 1 is “PC“ GA ””, node X is
Then, if still remains downstream node Y 1 to be compared (S707: NO), it returns to S701. On the other hand, if the comparison of all the nodes Y 1 has been completed (S707: YES), ends the surplus matching.
一方、図19において、余りキーαn+1が「ひらがなのみ」からなる「未確定部」でない場合(S714:NO)、変換候補抽出部130は、余りキーαn+1がノードYnの1つ下流のノードYn+1と部分一致または完全一致するか判定する(S721)。余りキーαn+1とノードYn+1が部分一致または完全一致の場合(S721:YES)、変換候補抽出部130は、綴り補完辞書より、ノードY1からノードYn+1の同一補完単位ノード列までの綴りをノード列Yとして取得すると、ノードX+ノード列Yを結果テーブル450に追加する(S722)。このとき、変換候補抽出部130は、ノード列Yの最後のノードの出現回数を綴り補完辞書から読み出し、綴りと対応づけて結果テーブル450に書き込む。
On the other hand, in FIG. 19, when the remainder key α n + 1 is not an “undecided part” consisting of “Hiragana only” (S714: NO), the conversion
一方、S721において、余りキーαn+1がノードyn+1に含まれないと判断した場合(S721:NO)、変換候補抽出部130は、ノードyn+1が前方一致を条件として余りキーαn+1に含まれるか、つまり、余りキーαn+1がノードyn+1に対して余剰一致するかを判断する(S723)。余りキーαn+1がノードyn+1に対して余剰一致する場合(S723:YES)、現在のnの値に1加算し(S724)、S714からの処理を行なう。
例えば、S724において、nの値が2に更新された場合、S714において、変換候補抽出部130は、余りキーα2からノードY2を削除した余りにより余りキーα3を生成し、余りキーα3が未確定ひらがなかを判断する。
上記例を図25(a)、(b)、(c)に示す。ただし、図25においては、結果テーブルに書き込まれる出現回数は省略している。S722の処理の後、あるいは、S723において余りキーαn+1がノードyn+1に対して余剰一致しないと判断された場合(S723:NO)、変換候補抽出部130は、図18のS707へ進む。
On the other hand, when it is determined in S721 that the remainder key α n + 1 is not included in the node y n + 1 (S721: NO), the conversion
For example, in S724, when the value of n is updated to 2, in S714, the conversion
The above examples are shown in FIGS. 25 (a), (b), and (c). However, in FIG. 25, the number of appearances written in the result table is omitted. After the process of S722 or when it is determined in S723 that the surplus key α n + 1 does not coincide with the node y n + 1 (S723: NO), the conversion
図25(a)において、例えば、検索キーが「新しいパソコンの」、余りキーα1が「パソコンの」であり、ノードXがノードf1「新しい」、ノードY1がノードh2「パソコン」である場合、余りキーα1「パソコンの」は、ノードY1であるノードh2「パソコン」を包含するため、余りキーα2「の」を作成する。ノードY2、つまりノードh3「の」と、余りキーα2は完全一致するため(S721:YES)、変換候補抽出部130は、ノードh3の同一補完単位ノード列として、ノードh3「の」+ノードh4「発売日」を特定すると、ノードY1からノードY2の同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードf1(ノードX)と、ノードh2+ノードh3+ノードh4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードh4の出現回数を対応づけて結果テーブル450に追加する。
In FIG. 25 (a), a example, the search key is "new PC", a remainder key alpha 1 is "PC", the node X to the node f1 "new", the node Y 1 node h2 is "PC" In this case, since the remainder key α 1 “personal computer” includes the
また、ノードXがノードj1「新しい」、ノードY1がノードj2「パソコン」である場合も同様の処理により、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数の対応づけが結果テーブル450に追加される。 The node X is the node j1 "new", the same process is when the node Y 1 is the node j2 "PC", spelled nodes j1 and (node X), a node j2 + node j3 + node j4 (node sequence Y) Are added to the result table 450. The “new PC release date” and the number of appearances of the node j4 are associated with each other.
図25(b)に示すように、例えば、検索キーが「新しいパソコンの発」、余りキーα1が「パソコンの発」であり、ノードXがノードf1「新しい」、ノードY1がノードh2「パソコン」である場合、余りキーα1「パソコンの発」は、ノードY1であるノードh2「パソコン」を包含するため、変換候補抽出部130は、余りキーα2「の発」を作成するとともに、ノードh2「パソコン」の1つ下流のノードであるh3の綴り「の」をノードY2として綴り補完辞書データ431Bから読み出す。
余りキーα2はノードY2と余剰一致するため(S721:NO、S723:YES)、変換候補抽出部130は、余りキーα2からノードh3(ノードY2)を削除した余りキーα3「発」を生成する。余りキーα3は未確定ひらがなではないため(S714:NO)、変換候補抽出部130は、ノードh3「の」の1つ下流のノードであるh4の綴り「発売日」をノードY3として綴り補完辞書データ431Bから読み出す。
Figure 25 (b) as shown in, for example, the search key "calling of new personal computer" is a very key α 1 is "the calling of the personal computer", the node X is node f1 "new", node Y 1 is node h2 In the case of “personal computer”, since the remainder key α 1 “departure of personal computer” includes the node h2 “personal computer” which is node Y 1 , the conversion
Remainder key alpha 2 Node Y 2 and excess matched for (S721: NO, S723: YES ), the conversion
余りキーα3はノードY3と部分一致する(S721:YES)。綴り補完辞書データ431Bにおいて、ノードh4には下流のノードがないため、変換候補抽出部130は、ノードh4のみをノードY3の同一補完単位ノード列とし、ノードY1からノードY3の同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードj1(ノードX)と、ノードh2+ノードh3+ノードh4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードh4の出現回数を対応づけて結果テーブル450に追加する。
Remainder key alpha 3 coincides node Y 3 and part (S721: YES). In spelling
また、ノードXがノードj1「新しい」、ノードY1がノードj2「パソコン」である場合も同様の処理により、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数の対応付けが結果テーブル450に追加される。 The node X is the node j1 "new", the same process is when the node Y 1 is the node j2 "PC", spelled nodes j1 and (node X), a node j2 + node j3 + node j4 (node sequence Y) Are associated with the “release date of a new personal computer” and the number of appearances of the node j4.
図25(c)に示すように、例えば、検索キーが「新しいパソコンの『は』」、余りキーα1が「パソコンの『は』」であり、ノードXがノードf1「新しい」、ノードY1がノードh2「パソコン」である場合、余りキーα1「パソコンの『は』」は、ノードY1であるノードh2「パソコン」を包含するため、変換候補抽出部130は、余りキーα2「の『は』」を作成するとともに、ノードh2「パソコン」の1つ下流のノードであるh3の綴り「の」をノードY2として綴り補完辞書データ431Bから読み出す。
余りキーα2はノードY2と余剰一致するため(S721:NO、S723:YES)、変換候補抽出部130は、余りキーα2からノードh3(ノードY2)を削除した余りキーα3『は』を生成する。余りキーα3は未確定ひらがなであるため(S714:YES)、変換候補抽出部130は、ノードh3(ノードY2)に対応したノードh3’(ノードy2)の1つ下流のノードh4’の読み「はつばいび」を、ノードy3として読み補完辞書データ431Aから読み出す(S715)。
As shown in FIG. 25C, for example, the search key is “new PC“ ha ””, the remainder key α 1 is “PC“ ha ””, node X is node f1 “new”, node Y When 1 is the node h2 “personal computer”, the remainder key α 1 “the personal computer“ ha ”” includes the node h2 “personal computer” that is the node Y 1 , so the conversion
Remainder key alpha 2 Node Y 2 and excess matched for (S721: NO, S723: YES ), the conversion
ノードy3と余りキーα3は部分一致する(S716:YES)。綴り補完辞書データ431Bにおいて、ノードh4には下流のノードがないため、変換候補抽出部130は、ノードh4のみをノードY3の同一補完単位ノード列とし、ノードY1からノードY3の同一補完単位ノード列までをノード列Yとする。変換候補抽出部130は、ノードj1(ノードX)と、ノードh2+ノードh3+ノードh4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードh4の出現回数を対応づけて結果テーブル450に追加する。
また、ノードXがノードj1「新しい」、ノードY1がノードj2「パソコン」である場合も同様の処理により、ノードj1(ノードX)と、ノードj2+ノードj3+ノードj4(ノード列Y)の綴りを結合した「新しいパソコンの発売日」、及び、ノードj4の出現回数の対応付けが結果テーブル450に追加される。
The node y 3 and the remainder key α 3 partially match (S716: YES). In spelling
The node X is the node j1 "new", the same process is when the node Y 1 is the node j2 "PC", spelled nodes j1 and (node X), a node j2 + node j3 + node j4 (node sequence Y) Are associated with the “release date of a new personal computer” and the number of appearances of the node j4.
S722の処理の後、あるいは、S723において余りキーαn+1がノードyn+1に対して余剰一致しないと判断された場合(S723:NO)、図18のS707へ進む。図25(d)に部分一致でも完全一致でも余剰一致でもない場合の例を示す。 After the process of S722 or when it is determined in S723 that the surplus key α n + 1 does not coincide with the node y n + 1 (S723: NO), the process proceeds to S707 in FIG. FIG. 25 (d) shows an example of a case where there is no partial match, complete match or surplus match.
図25(d)において、例えば、検索キーが「新しいパソコンの『価格』」、余りキーα1が「パソコンの『価格』」であり、ノードXがノードf1「新しい」、ノードY1がノードh2「パソコン」である場合、余りキーα2「の『価格』」とノードY2であるノードh3「の」とは余剰一致するが、余りキーα3『価格』と、ノードh3の1つ下流のノードとは部分一致も完全一致も余剰一致もしない。ノードXがノードj1「新しい」、ノードY1がノードj2「パソコン」である場合も同様である。 In FIG. 25D, for example, the search key is “price” of the new computer, the remainder key α 1 is “price” of the computer, the node X is “new” and the node Y 1 is the node In the case of h2 “personal computer”, the surplus key α 2 “no price” and the node h3 “no” of the node Y 2 have a coincidence, but the surplus key α 3 “price” and one of the nodes h3 There is no partial match, complete match or surplus match with downstream nodes. Node X node j1 "new", node Y 1 is also the same in cases where it is a node j2 "PC".
その後、図18において、比較すべき下流のノードY1がまだ残っていれば(S707:NO)、S701へ戻る。一方、全てのノードY1について比較が終了していれば(S707:YES)、当該余剰一致処理を終了する。 Thereafter, 18, any remaining still downstream node Y 1 to be compared (S707: NO), returns to S701. On the other hand, if the comparison of all the nodes Y 1 has been completed (S707: YES), ends the surplus matching.
次に、図7のS400における出力処理について説明する。図26は、変換候補出力部140が実行する出力処理のフローチャートを示す。
同図において、変換候補出力部140は、結果テーブル450に書き込まれた文字列に、同一の文字列が含まれている場合は、これらの重複している文字列のうち1つのみを残す(S401)。S402〜S405までの処理は、説明を容易にするため、検索キーが「末尾部のみ」、「末尾部+未確定部」、「未確定部のみ」の場合に分けて説明する。
Next, the output process in S400 of FIG. 7 will be described. FIG. 26 shows a flowchart of output processing executed by the conversion
In the figure, the conversion
<検索キーが末尾部のみの場合>
変換候補出力部140は、結果テーブル450の文字列から、検索キーの「末尾部」を削除する(S402)。次に、削除した結果、検索キーの「未確定部」と完全一致することになった出力候補語があるか判定する(S403)。この例では、検索キーに「未確定部」を含まないので、S403は自動的にNOとなる。この結果、図27(a)に示すような出力が得られる(S405)。
<When the search key is the last part only>
The conversion
図27(a)において、検索キーが「新しい」であり、結果テーブルには文字列「新しい携帯」、「新しいパソコン」、「新しいパソコンの発売日」が記憶されている。このとき、結果テーブルに記憶されているそれぞれの文字列から「新しい」を除いた「携帯」、「パソコン」、「パソコンの発売日」が出現回数の多い順に出力候補語として出力される。このように整形された出力候補語の画面表示例を図28(a)に示す。 In FIG. 27A, the search key is “new”, and the character strings “new mobile phone”, “new personal computer”, and “new personal computer release date” are stored in the result table. At this time, “mobile”, “personal computer”, and “personal computer release date” excluding “new” from each character string stored in the result table are output as output candidate words in descending order of appearance frequency. A screen display example of the output candidate words thus shaped is shown in FIG.
<検索キーが「末尾部+未確定部」の場合>
変換候補出力部140は、まず、結果テーブル450の文字列から検索キーの「末尾部」を削除する(S402)。さらに、末尾部削除の結果、出力候補語の中に検索キーの未確定部と完全一致する出力候補語がある場合(S403:YES)、当該一致する出力候補語を結果テーブル450の出力候補語から削除する(S404)。
<When the search key is "end part + unconfirmed part">
First, the conversion
図27(b)に示す例1では、検索キーが末尾部「新しい」+未確定部『ぱ』からなる「新しい『ぱ』」であり、結果テーブルには文字列「新しいパソコン」、「新しいパソコンの発売日」が記憶されている。末尾部削除後の出力候補語のノード列「パソコン」、「パソコンの発売日」において、検索キーの未確定部『ぱ』と完全一致するノードがないため、「パソコン」、「パソコンの発売日」が出現頻度の多い順に出力候補語として出力される(S405)。このように整形された出力候補語の画面表示例を図28(b)に示す。 In example 1 shown in FIG. 27B, the search key is “new“ pa ”consisting of the suffix“ new ”+ the unconfirmed part“ pa ”, and the result table includes the strings“ new PC ”,“ new ” "Release date of PC" is stored. In the node column “PC” and “PC release date” of the output candidate word after deleting the tail part, there is no node that exactly matches the undetermined part “pa” of the search key, so “PC” and “PC release date” Are output as output candidate words in the order of appearance frequency (S405). A screen display example of the output candidate words thus shaped is shown in FIG.
図27(c)に示す例2では、検索キーが末尾部「携帯」+未確定部『が』からなる「携帯『が』」であり、結果テーブルには文字列「携帯が壊れた」が記憶されている。検索キーの未確定部『が』は、末尾部削除後の出力候補語のノード列「が/壊れた」のうち「が」と一致する。しかし、完全一致ではないので(S403:NO)、「が壊れた」がそのまま出力候補語として出力される(S405)。このように整形された出力候補語の画面表示例を図28(c)に示す。そして、オペレータが例えば「が壊れた」を選択すると、未確定状態の「が」を削除して「が壊れた」を確定情報で入力エリアに挿入する。なお、出力候補語が複数ある場合には、出現回数が多い順に表示する。 In the example 2 shown in FIG. 27C, the search key is “mobile phone” composed of the tail part “mobile phone” + the unconfirmed part “ga”, and the character string “mobile phone is broken” is displayed in the result table. It is remembered. The unconfirmed part “GA” of the search key matches “GA” in the node string “GA / broken” of the output candidate word after the end part is deleted. However, since it is not a perfect match (S403: NO), “is broken” is output as an output candidate word as it is (S405). FIG. 28C shows a screen display example of the output candidate word thus shaped. When the operator selects, for example, “broken”, the unconfirmed “ga” is deleted and “broken” is inserted into the input area with the definite information. When there are a plurality of output candidate words, they are displayed in descending order of the number of appearances.
また、図27(d)に示す例3では、検索キーが末尾部「携帯の」+未確定部『ありか』からなる「携帯の『ありか』」であり、結果テーブルには文字列「携帯のありか」が記憶されている。検索キーの未確定部『ありか』が、末尾部削除後の出力候補語「ありか」と完全一致するので、S404において「ありか」全体が削除され、S405で、出力候補語は出力されない。入力エリアにすでに表示された未確定文字列と出力候補語表示エリアに表示される文字列が一致した場合、オペレータは、出力候補語表示エリアから出力候補語を選択するよりも、入力エリアの文字列を、例えば、Enterキーなどで確定させるほうが自然だからである。この場合の画面表示例を図28(d)に示す。 Further, in Example 3 shown in FIG. 27D, the search key is “portable“ is there ”” composed of the tail part “mobile” and the unconfirmed part “is there”, and the character string “ "Is there a mobile phone?" Since the unconfirmed part “Are there” of the search key completely matches the output candidate word “Are there” after the end part deletion, the whole “Are?” Is deleted in S404, and the output candidate word is not output in S405. . When the unconfirmed character string already displayed in the input area matches the character string displayed in the output candidate word display area, the operator selects the character in the input area rather than selecting the output candidate word from the output candidate word display area. This is because it is more natural to determine the column using, for example, the Enter key. A screen display example in this case is shown in FIG.
<検索キーが「未確定部のみ」の場合>
検索キーが「未確定部のみ」の場合、S402で削除される部分はなく、原則、検索結果がそのまま出力される(S405)。図27(e)に例1の場合、図27(f)に例2の場合を示す。また、このような場合の出力候補語の画面表示例を図28(e)、(f)に示す。
<When the search key is "Only unconfirmed part">
If the search key is “only unconfirmed part”, there is no part deleted in S402, and the search result is output as it is (S405). FIG. 27E shows the case of Example 1, and FIG. 27F shows the case of Example 2. In addition, examples of screen display of output candidate words in such a case are shown in FIGS.
図27(e)に示す例1では、検索キーが『けい』であり、結果テーブルには文字列「携帯」、「携帯電話」、「携帯の画面」が記憶されている。よって、図28(e)に示すように、出現回数の多い順に「携帯」、「携帯電話」、「携帯の画面」が出力候補語として出力される。 In Example 1 shown in FIG. 27E, the search key is “Kei”, and the character strings “mobile phone”, “mobile phone”, and “mobile phone screen” are stored in the result table. Accordingly, as shown in FIG. 28 (e), “mobile phone”, “mobile phone”, and “mobile phone screen” are output as output candidate words in descending order of appearance frequency.
図27(f)に示す例2では、検索キーが『あたらしい』であり、結果テーブルには文字列「新しい携帯」、「新しいパソコン」、「新しいパソコンの発売日」が記憶されている。よって、図28(f)に示すように、出現回数の多い順に「新しいパソコン」、「新しいパソコンの発売日」、「新しい携帯」が出力候補語として出力される。 In Example 2 shown in FIG. 27F, the search key is “new”, and the character strings “new mobile phone”, “new personal computer”, and “new personal computer release date” are stored in the result table. Therefore, as shown in FIG. 28 (f), “new personal computer”, “new personal computer release date”, and “new mobile phone” are output as output candidate words in descending order of appearance frequency.
例外的に、綴り補完辞書に、ひらがなのみからなるノードがあり、当該ノードが出力候補語となった場合には、S403でYESとなり、一致した出力候補語が結果テーブルから削除される(S404)。この例を図27(g)に示す。 Exceptionally, if the spelling completion dictionary includes a node consisting only of hiragana, and that node becomes an output candidate word, YES is obtained in S403, and the matched output candidate word is deleted from the result table (S404). . An example of this is shown in FIG.
上記のS405の後、オペレータは、キーボード211などを操作し、表示された変換候補のうち好適な候補を選択する。この選択操作に応じた入力信号が入力制御装置200から制御部100に入力されると(S406:YES)、文字列入力部150によって、選択された変換候補の確定入力がおこなわれる(S407)。
After the above S405, the operator operates the
ここでは、変換候補出力部140によって表示させている選択候補のいずれが選択されたかを文字列入力部150が判別し、出力制御装置300を制御することで、選択された変換候補を確定文字列として入力エリアに表示する。また、文字列入力部150は、このようにして確定入力した確定文字列からなる文章を、入力エリアの識別及び時間情報とともに入力文章格納領域460に書き込む。
Here, the character
そして、この確定入力の後、再び、図7のS200の検索キー処理が実行され、検索キーが生成される。従って、続く図7のS300の候補抽出処理においては、図10に示すS600の先頭確定処理、つまり、図16に示す処理が実行される。
あるいは、確定入力の後、ユーザが何らかの未確定文字をキーボード211により入力した場合も、図7のS200の検索キー処理が実行され、末尾部+未確定部の検索キーが生成される。従って、続く図7のS300の候補抽出処理においては、図10に示すS500の先頭未確定処理、つまり、図11に示す処理が実行される。
Then, after the confirmation input, the search key process of S200 of FIG. 7 is executed again to generate a search key. Therefore, in the candidate extraction process of S300 in FIG. 7, the head determination process of S600 shown in FIG. 10, that is, the process shown in FIG. 16 is executed.
Alternatively, even after the confirmation input, when the user inputs some unconfirmed character using the
なお、未確定文字列に入力誤りがあるなどによって、変換候補の選択がされず、入力取消操作などがおこなわれると(S406:NO、S408:YES)、確定入力をおこなわずに処理を終了する。 If the conversion candidate is not selected and an input canceling operation is performed due to an input error in the undetermined character string (S406: NO, S408: YES), the process ends without performing the confirmed input. .
次に、補完単位番号付与処理について説明する。この補完単位番号付与処理では、現在の辞書データの中から、同一の補完単位番号を付与すべきノード列を検出し、特定したノード列に同一の補完番号を付与して生成した新たなノード列を追加し、辞書データを更新する。同一の補完単位番号を付与すべきノード列には、(1)入力エリアに入力された頻度が高いもの、(2)係り受けの分岐が少ないもの、の2つがある。(1)では、実際にオペレータが入力した頻度が高い表現を変換候補として選択可能とすることができるようになる。(2)では、ある単語がいくつかの限られた表現の中でしか使用されない場合、その表現が変換候補として表示されるようになる。 Next, the supplement unit number assigning process will be described. In this complement unit number assigning process, a node sequence to which the same complement unit number should be assigned is detected from the current dictionary data, and a new node sequence generated by assigning the same complement number to the identified node sequence To update the dictionary data. There are two types of node sequences to which the same complement unit number is to be assigned: (1) those that are frequently input to the input area, and (2) those that have few dependency branches. In (1), it is possible to select an expression that is frequently input by the operator as a conversion candidate. In (2), when a certain word is used only in some limited expressions, the expression is displayed as a conversion candidate.
図29〜図31を用いて、入力エリアに入力される頻度が高いノード列に同一の補完単位番号を付与するときの補完単位番号付与処理について説明する。
まず、入力内容別辞書領域430には、予め、各入力エリアに対応した読み補完辞書データと綴り補完辞書データの対が記憶されているものとする。
A complementary unit number assigning process when assigning the same complementary unit number to a node string that is frequently input to the input area will be described with reference to FIGS.
First, it is assumed that a pair of reading completion dictionary data and spelling completion dictionary data corresponding to each input area is stored in the input
図29は、辞書生成部160が実行する補完単位番号付与処理のフローチャートを示し、図30は、図29の補完単位番号付与処理のデータ例を示し、図31は、辞書データの更新例を示す。
図29において、辞書生成部160は、1週間、1ヶ月毎などの所定の期間毎に、あるいは、ユーザによる指示が入力されることにより、入力文章格納領域460から補完単位番号付与処理の対象とする辞書データに対応した入力エリアの入力文章を読み出す。このとき、入力エリアの入力文章全てを読み出してもよく、現在から3ヶ月前までなどの所定期間分の文章を読み出してもよい(S801)。なお、補完単位番号付与処理の対象とする辞書データを特定する情報は予め入力しておくことでもよく、全ての辞書データについて順に行なうようにしてもよい。辞書生成部160は、S801において読み込んだ文章、つまり、文字列を、文末記号に従って分割し、文リストを生成する(S802)。文末記号には、例えば、句点「。」とすることができる。
29 shows a flowchart of the complementary unit number assigning process executed by the
In FIG. 29, the
辞書生成部160は、S802で生成した文リストの先頭から順に、まだ読み込んでいない文を取得する(S803)。辞書生成部160は、S803で読み込んだ文から不要文字、例えば、英数字に挟まれたもの以外の空白、タブ、改行などを削除する(S804)。辞書生成部160は、S804で不要文字を削除した文の構文解析を行なう(S805)。この構文解析の処理には、従来より使用されている、入力文から単語や、単語相互の係り受け関係を取り出す任意の構文解析ソフトウェア等を使用することができる。
解析が失敗した場合(S806:NO)、S803に進む。
The
When analysis fails (S806: NO), it progresses to S803.
解析が成功すると(S806:YES)、辞書生成部160は、解析結果から、親子関係の部分木、単独の部分木を抽出すると、部分木配列リストを生成する(S807)。部分木配列リストの例を図30(a)に示す。部分木配列リストは、各部分木について、自身の部分木番号、当該部分木を構成する単語の読み及び綴りと品詞、親子(係り受け)関係にある部分木の番号を示す。なお、上下に並んだ部分木のうち、上に位置する部分木が親であり、下に位置する部分木が子である。
When the analysis is successful (S806: YES), the
辞書生成部160は、部分木から得られた綴り及び読みに対応したパス(マッチング経路)をパスファイルに書き込む(S808)。この例を、図30(b)に示す。つまり、親子関係の部分木の子は係り側、親は受け側とした係り受け関係の文節としてパスを生成し、さらに、各部分木(文節)を構成する単語の読み、綴りをノードとしたパスを生成する。そして、親子関係にある子側の部分木、つまり、係り側の文節の最後のノードにある助詞は、親側の部分木、つまり、受け側の文節の最初のノードに移動する。辞書生成部160は、文節の単位で補完単位番号を付与する。このとき、先頭の文節には補完単位番号1を付与し、受け側の文節には、係り側の文節よりも1大きな補完単位番号を付与する。そして、各文節に付与された補完単位番号を、当該文節を構成するノードに付与する。
The
そして、文リストにまだ未処理の文がある場合(S809:YES)、辞書生成部160は、再びS602からの処理を行う。文リストに含まれる全ての文について処理を終えた場合(S809:NO)、辞書生成部160は、生成したパスファイルからなる中間ファイルを自身の保持する記憶領域に記憶する(S810)。
If there is an unprocessed sentence in the sentence list (S809: YES), the
辞書生成部160は、S810において記憶した中間ファイルから、2以上所定数以下の連続する補完単位番号のノード列を全て取得する。例えば、読み補完辞書データと綴り補完辞書データが3文節以下からなる場合、補完単位番号が1−2、2−3、3−4、…のように連続するノード列と、補完単位番号が1−2−3,2−3−4、3―4―5、…のように連続するノード列を読み出す。そして、そして、同じ綴りからなるノード列毎に出現回数をカウントすると、各ノード列の出現頻度、例えば、出現回数の標準偏差、全体に占める出現割合を求める(S811)。なお、出現回数自体を出現頻度としてもよい。そして、所定の閾値よりも出現頻度が高いノード列を、同じ補完単位番号を付与すべきノード列(以下、「対象ノード列」と記載)であると判断する。辞書生成部160は、綴り補完辞書データから対象ノード列を特定すると、対象ノード列と同じノードからなるノード列、及び、対象ノード列を含むノード列を綴り補完辞書データのrootのノードの1つ下流に追加し、追加したノード列に対して、対象ノード列と一致するノード列に同一の補完単位番号を付与する。そして、追加したノード列に対応するノード列を読み補完辞書データに追加する(S812)。この例を図31に示す。
The
例えば、応対入力辞書データ(A1)431が処理対象であり、対象ノード列が「携帯/を/買った」であるとする。この場合、辞書生成部160は、綴り補完辞書データ431B(図5)からノードf2+ノードf3+ノードf4を特定する。辞書生成部160は、図31(a)に示すように、新たなノードs1「携帯」−ノードs2「を」−ノードs3「買った」からなるノード列と、新たなノードt1「新しい」−ノードt2「携帯」−ノードt3「を」−ノードt4「買った」からなるノード列を綴り補完辞書データ431Bのrootの配下に追加する。そして、ノードs1、s2、s3に補完単位番号「1」を付与する。また、ノードt1に補完単位番号「1」を、ノードt2、t3、t4に補完単位番号「2」を付与する。
さらに、辞書生成部160は、図31(b)に示すように、読み補完辞書データ431Aに、新たなノードs1’「けいたい」−ノードs2’「を」−ノードs3’「かった」からなるノード列と、新たなノードt1’「あたらしい」−ノードt2「けいたい」−ノードt3「を」−ノードt4「かった」からなるノード列をrootの配下に追加する。そして、ノードs1’、s2’、s3’に補完単位番号「1」を付与する。また、ノードt1’に補完単位番号「1」を、ノードt2’、t3’、t4’に補完単位番号「2」を付与する。
For example, it is assumed that the response input dictionary data (A1) 431 is a processing target and the target node string is “mobile / buy / buy”. In this case, the
Further, as shown in FIG. 31B, the
また、S812において、さらに、辞書生成部160は、所定の閾値よりも出現頻度が低く、かつ、補完単位が連続するノード列のうち、綴り補完辞書データ、読み補完辞書データに同じ補完単位番号が付与されて登録されているノード列がある場合、このノード列を含んだroot配下のノード列を削除する。例えば、応対入力辞書データ(A1)431が処理対象であり、「パソコン/の/発売日」の出現頻度が閾値以下となったとする。辞書生成部160は、綴り補完辞書データ431B(図5)から同じ補完単位番号「2」が付与されたノードj2+ノードj3+ノードj4を特定する。この場合、綴り補完辞書データ431Bからノードj1〜j4のノード列が、読み補完辞書データ431Aからノードj1’〜j4’のノード列が削除される。
Further, in S812, the
また、辞書生成部160は、各ノード列毎にカウントした出現回数により、読み補完辞書データと綴り補完辞書データの各ノードに記述されている出現回数を更新する。
Further, the
続いて、図32及び図33を用いて係り受けの分岐が少ないものに同一の補完単位番号を付与するときの補完単位番号付与処理について説明する。図32は、辞書生成部160が実行する補完単位番号付与処理のフローチャートを示し、図33は、図32の補完単位番号付与処理における辞書更新の例を示す。
Next, a complementary unit number assigning process when assigning the same complementary unit number to those with few dependency branches will be described with reference to FIGS. 32 and 33. 32 shows a flowchart of the complementary unit number assigning process executed by the
図32において、辞書生成部160は、補完単位番号付与処理の対象とする辞書データの綴り補完辞書データから、rootの1つ下流のノードである最上流ノードを一つ取得する。これをノードXとする(S901)。辞書生成部160は、ノードXの1つ下流のノードの数、1つ下流のノードそれぞれの1つ下流のノードの数、・・・を合計し、ノードXを先頭とするノード列の数を取得すると(S902)、取得したノード列の数が所定以下であるか否かを判断する(S903)。
In FIG. 32, the
ノード列の数が所定数以下である場合は(S903:YES)、辞書生成部160は、さらに、ノードXの下流の各ノードの補完単位番号が同一であるかを判断する(S904)。同一でない場合(S904:NO)、辞書生成部160は、ノードXを最上流とするノード列を全て複製し、同一の補完単位番号「1」を付与して綴り補完辞書データに追加する。そして、追加したノード列に対応するノード列を読み補完辞書データに追加する(S905)。図33にこの例を示す。
When the number of node strings is equal to or less than the predetermined number (S903: YES), the
図33(a)に示すように、綴り補完辞書データの最上流ノードがノードa1「携帯」、ノードa1の1つ下流のノードがノードa2「の」及びノードc3「が」の2つ、ノードa2「の」の1つ下流のノードがノードa3「画面」及びノードb3「ありか」の2つ、ノードc3「が」の1つ下流のノードがノードc3「壊れた」の1つ、「画面」、「ありか」及び「壊れた」の下流にはノードがないものとする。この場合、辞書生成部160は、ノードa1を先頭とするノード列の数は3となる。そして、ノードa1とノードa2,c2の補完単位番号が異なるため、辞書生成部160は、ノードa1を最上流とするノード列を全て複製して綴り補完辞書データのrootの配下に追加し、追加したノード列の各ノードに新しいリンクポインタを付与するとともに、ノードa1及びノードa1の下流のノード全てに補完単位番号「1」を付与する。
さらに、辞書生成部160は、図33(b)に示すように、読み補完辞書データに、ノードa1’を最上流とするノード列を複製して読み補完辞書データのrootの配下に追加し、追加したノード列の各ノードに、読み補完辞書データに対応したリンクポインタと、補完単位番号「1」を付与する。
As shown in FIG. 33A, the most upstream node of the spelling completion dictionary data is the node a1 “mobile”, the node one node downstream of the node a1 is the node a2 “no” and the node c3 “is”, the node One node downstream of a2 “no” is node a3 “screen” and node b3 “is there”, one node downstream of node c3 “ga” is one of node c3 “broken”, “ It is assumed that there are no nodes downstream of “screen”, “is there”, and “broken”. In this case, the
Furthermore, as shown in FIG. 33 (b), the
S903においてノード列の数が所定数を超えると判断した場合(S903:NO)、S904においてノードXの下流の各ノードの補完単位番号が同一であると判断した場合(S904:YES)、あるいは、S905の処理の処理を行なったのち、辞書生成部160は、綴り補完辞書データに比較すべきノードが残っていないか確認する(S906)。比較すべきノードが残っていれば(S906:NO)、S901へ戻り、まだ処理を行なっていない最上流ノードを1つ選択し、このノードをノードXとして以降の処理を行う。
一方、全ての最上流ノードについて比較を行なったため、比較すべきノードが残っていない場合(S906:YES)は、当該先頭未確定処理を終了する。
When it is determined in S903 that the number of node columns exceeds a predetermined number (S903: NO), when it is determined in S904 that the complementary unit number of each node downstream of the node X is the same (S904: YES), or After performing the processing of S905, the
On the other hand, since all the most upstream nodes have been compared, and there are no remaining nodes to be compared (S906: YES), the head unconfirmed process ends.
なお、図32において、読み補完辞書データを用いて同一の補完単位番号をすべき最上流ノードを検出するようにしてもよい。 In FIG. 32, the most upstream node that should have the same complement unit number may be detected using the reading complement dictionary data.
なお、上記の補完単位番号付与処理は、辞書作成時に行なっても良い。この場合、図29のS801において、入力文章格納領域460から入力文章を読み出す代わりに、任意の文章群を読み込んで使用する。
Note that the above complementing unit number assigning process may be performed at the time of dictionary creation. In this case, in S801 of FIG. 29, instead of reading out the input sentence from the input
上述した実施形態は一例であり、本発明の適用範囲はこれに限られない。すなわち、種々の応用が可能であり、あらゆる実施の形態が本発明の範囲に含まれる。
例えば、上記実施の形態では、一対の読み補完辞書データと綴り補完辞書データとを入力エリアと対応づけることで、入力内容別の辞書データを構築したが、入力内容に応じて選択可能であれば、対応づけるものは入力エリアに限られない。例えば、文字列入力をおこなう入力画面や使用するアプリケーションと辞書データとを対応づけてもよい。
The embodiment described above is an example, and the scope of application of the present invention is not limited to this. That is, various applications are possible, and all embodiments are included in the scope of the present invention.
For example, in the above embodiment, the dictionary data for each input content is constructed by associating a pair of reading completion dictionary data and spelling completion dictionary data with the input area. What is associated is not limited to the input area. For example, an input screen for inputting a character string or an application to be used may be associated with dictionary data.
上記実施形態では、入力内容別辞書データとして、応対入力辞書データの例を主に示したが、互いに係り受け関係にある単語の階層構成とすることができるのであれば、種々の内容について入力内容別辞書データを構築することができる。例えば、都道府県名とそれに続く下位の地域名とを階層構造とすることで、住所入力に用いる辞書データを構築することができる他、姓とこれに続く名の組み合わせで階層構造とすることで、人名入力に用いる辞書データを構築することができる。つまり、対象とする複数の単語が相関的な位置をもって連結させることが可能であれば、種々の内容に応じた入力内容別辞書データを構築することができる。 In the above embodiment, the example of the response input dictionary data is mainly shown as the dictionary data according to the input content. However, if it is possible to have a hierarchical structure of words having a dependency relationship with each other, the input content is various contents. Another dictionary data can be constructed. For example, it is possible to build dictionary data used for address input by creating a hierarchical structure of prefecture names and subsequent subordinate regional names, and by creating a hierarchical structure with combinations of surnames and subsequent names. Dictionary data used for personal name input can be constructed. That is, if it is possible to connect a plurality of target words with relative positions, dictionary data according to input contents according to various contents can be constructed.
また、上記実施形態では、キーボード211によって文字列が入力される場合を例示したが、文字列が入力できるのであれば、その入力方法はこれに限られず任意である。例えば、音声認識によって文字列入力を行う場合にも、本発明を適用することで、より効率的な文字列入力を実現することができる。
Moreover, although the case where a character string was input with the
上記実施形態では、電話応答の内容をリアルタイムで入力する必要のあるコールセンタの入力端末に本発明を適用した場合を例示した。本発明は、このような高速な入力作業が求められる分野に特に好適ではあるが、これに限られるものではなく、文字列入力をおこなう種々の場面で用いられる入力装置等に本発明を適用可能であり、いずれの場合であっても、より効率的な文字列入力を実現することができる。 In the above embodiment, the case where the present invention is applied to an input terminal of a call center that needs to input the contents of a telephone response in real time has been exemplified. The present invention is particularly suitable for the field where such high-speed input work is required, but is not limited to this, and the present invention can be applied to input devices used in various scenes for inputting character strings. In any case, more efficient character string input can be realized.
上記実施形態にかかる入力端末1は、スタンドアローンで構成可能であるだけでなく、いわゆるサーバ−クライアントシステムとしても構成可能である。すなわち、例えば、図34に示すように、制御部501、通信部502を備えるクライアント500に入力装置210と出力装置310の機能を持たせ、該クライアント500と、制御部601、通信部602、記憶部603を備え、検索機能を持たせたサーバ600とから構成としても良い。サーバ600は、検索機能として、辞書選択部601−1、検索キー生成部601−2、変換候補抽出部601−3、変換候補出力部601−4、文字列入力部601−5、辞書生成部601−6を備える。辞書選択部601−1、検索キー生成部601−2、変換候補抽出部601−3、変換候補出力部601−4、文字列入力部601−5、辞書生成部601−6はそれぞれ、図6に示す辞書選択部110、検索キー生成部120、変換候補抽出部130、変換候補出力部140、文字列入力部150、辞書生成部160と同様の機能を有する。また、記憶部603は、図1に示す記憶部400と同様のデータを記憶する。
The
このようなプログラムの提供方法は任意であり、例えば、CD−ROMなどの記憶媒体に格納して配布可能であることはもとより、プログラムデータを搬送波に重畳することで、所定の通信媒体(例えば、インターネットなど)を介して配布することもできる。 Such a program providing method is arbitrary. For example, the program data can be stored and distributed in a storage medium such as a CD-ROM, and the program data can be superposed on a carrier wave so that a predetermined communication medium (for example, It can also be distributed via the Internet).
1 入力端末
100 制御部
110 辞書選択部
120 検索キー生成部
130 変換候補抽出部
140 変換候補出力部
150 文字列入力部
160 辞書生成部
200 入力制御装置
210 入力装置
211 キーボード
212 ポインティングデバイス
300 出力制御装置
310 出力装置
311 ディスプレイ装置
400 記憶部
410 辞書格納領域
420 基本辞書領域
430 入力内容別辞書領域
431 応対入力辞書データ(A1)
431A 読み補完辞書データ
431B 綴り補完辞書データ
432 住所入力辞書データ(A2)
432A 読み補完辞書データ
432B 綴り補完辞書データ
440 プログラム格納領域
450 結果テーブル
460 入力文章格納領域
DESCRIPTION OF
431A Reading
432A Reading
Claims (9)
入力される文字列を変換処理する前の読みが単語として記録された辞書であって、互いに係り受け関係にある単語を、ノードとして木構造に構成した読み補完辞書データ、及び、前記読み補完辞書データに含まれる各単語が変換処理された後の綴りが単語として記録された辞書であって、変換処理前と変換処理後の単語をノードとして対応付けて前記読み補完辞書データの示す木構造と合致した木構造に構成し、かつ、1つのノード列としてみなす、係り受け関係にあるノードに同一の補完単位番号を付与した綴り補完辞書データを記憶する記憶部と、
ユーザの入力に基づき検索キーを生成する検索キー生成部と、
前記検索キー生成部により生成された検索キーに基づき前記読み補完辞書データ及び前記綴り補完辞書データを検索して当該検索キーに対応した前記綴り補完辞書データのノードを特定し、特定したノードの綴りと、当該特定したノードと同一の補完単位番号が付与されている当該特定したノードの下流のノードの綴りとを前記綴り補完辞書データから読み出して結合した変換候補を取得する変換候補抽出部と、
前記変換候補抽出部が取得した変換候補を出力する変換候補出力部と、
を備えることを特徴とする文字列入力装置。 A character string input device that searches and presents conversion candidates according to an input character string and performs character string input by selecting the presented conversion candidate,
A dictionary in which readings before conversion processing of input character strings are recorded as words, and reading completion dictionary data in which words having a dependency relationship are configured as nodes in a tree structure, and the reading completion dictionary A dictionary in which spelling after each word included in the data is converted is recorded as a word, and the tree structure indicated by the reading completion dictionary data by associating the word before conversion processing and the word after conversion processing as a node; A storage unit configured to store the spelling completion dictionary data in which the same complementing unit number is assigned to the nodes in the dependency relationship, which is configured as a matched tree structure and regarded as one node sequence;
A search key generation unit that generates a search key based on user input;
Based on the search key generated by the search key generation unit, the reading completion dictionary data and the spelling complement dictionary data are searched to identify a node of the spelling complement dictionary data corresponding to the search key, and the spelling of the specified node A conversion candidate extraction unit that reads out from the spelling complement dictionary data and combines the spelling of the downstream node of the identified node assigned the same complement unit number as the identified node, and
A conversion candidate output unit that outputs the conversion candidate acquired by the conversion candidate extraction unit;
A character string input device comprising:
ことを特徴とする請求項1に記載の文字列入力装置。 When the search key is composed of unconfirmed hiragana, the conversion candidate extraction unit detects the most upstream node that is forward-matched and partially matched with the search key from the reading completion dictionary data, and corresponds to the detected node The candidate of the spelling completion dictionary data is identified, and a conversion candidate is obtained by combining the spelling of the identified node and the spelling of the downstream node of the identified node to which the same complement unit number as the identified node is assigned. get,
The character string input device according to claim 1.
ことを特徴とする請求項1に記載の文字列入力装置。 When the search key is an unconfirmed hiragana, the conversion candidate extraction unit detects the most upstream node that completely matches the search key from the reading completion dictionary data, and the spelling completion dictionary corresponding to the detected node The data node and the one downstream node are identified, the spelling of the identified node and the one downstream node, and the one downstream node assigned with the same complement unit number as the one downstream node To obtain a conversion candidate that combines the further node spelling of
The character string input device according to claim 1.
ことを特徴とする請求項1に記載の文字列入力装置。 When the search key is a fixed character, the conversion candidate extraction unit specifies the most upstream node that matches the search key forward and partially matches the spelling completion dictionary data, spells the specified node, and specifies the specified To obtain a conversion candidate that combines the spelling of the downstream node of the identified node assigned the same complement unit number as
The character string input device according to claim 1.
ことを特徴とする請求項1に記載の文字列入力装置。 When the search key is a fixed character, the conversion candidate extraction unit specifies the most upstream node that completely matches the search key from the spelling completion dictionary data and a node that is one downstream of the specified node, and A conversion candidate is obtained by combining the spelling of the identified node and one downstream node and the further downstream node spelling of the one downstream node assigned the same complement unit number as the one downstream node. To
The character string input device according to claim 1.
前記検索キーが確定文字及び未確定ひらがなからなる未確定文字列からなる場合、当該検索キーの確定文字によって、前記綴り補完辞書データの最も上流のノードを検索して一致するノードを特定し、
特定したノードに対応する前記読み補完辞書データのノードの下流のノードと前記検索キーの未確定ひらがなとの一致を判断し、
前記綴り補完辞書データから前記特定したノードと、当該特定したノードの下流のノードであり、前記検索キーの未確定ひらがなと一致すると判断された前記読み補完辞書データのノードに対応したノードと、当該下流のノードと同一の補完単位番号が付与されているさらに下流のノードとの綴りを読み出し、読み出した綴りを結合した変換候補を取得する、
ことを特徴とする請求項1に記載の文字列入力装置。 The conversion candidate extraction unit
When the search key is composed of an unconfirmed character string consisting of a confirmed character and an unconfirmed hiragana, by using the confirmed character of the search key, the most upstream node of the spelling completion dictionary data is searched to identify a matching node,
Determining a match between a node downstream of the node of the reading completion dictionary data corresponding to the identified node and an unconfirmed hiragana of the search key;
The identified node from the spelling completion dictionary data, a node downstream of the identified node, and a node corresponding to the node of the reading completion dictionary data determined to match the unconfirmed hiragana of the search key; Read the spelling with a further downstream node assigned the same complement unit number as the downstream node, and obtain a conversion candidate that combines the read spelling.
The character string input device according to claim 1.
前記入力装置は、入力される文字列を変換処理する前の読みが単語として記録された辞書であって、互いに係り受け関係にある単語を、ノードとして木構造に構成した読み補完辞書データ、及び、前記読み補完辞書データに含まれる各単語が変換処理された後の綴りが単語として記録された辞書であって、変換処理前と変換処理後の単語をノードとして対応付けて前記読み補完辞書データの示す木構造と合致した木構造に構成し、かつ、1つのノード列としてみなす、係り受け関係にあるノードに同一の補完単位番号を付与した綴り補完辞書データを記憶する記憶部を備え、
前記文字列入力装置の検索キー生成部が、ユーザの入力に基づき検索キーを生成する検索キー生成過程と、
前記文字列入力装置の変換候補抽出部が、前記検索キー生成過程において生成された検索キーに基づき前記読み補完辞書データ及び前記綴り補完辞書データを検索して当該検索キーに対応した前記綴り補完辞書データのノードを特定し、特定したノードの綴りと、当該特定したノードと同一の補完単位番号が付与されている当該特定したノードの下流のノードの綴りとを前記綴り補完辞書データから読み出して結合した変換候補を取得する変換候補抽出過程と、
前記文字列入力装置の変換候補出力部が、前記変換候補抽出過程において取得した変換候補を出力する変換候補出力過程と、
を有することを特徴とする文字列入力方法。 A character string input method used for a character string input device that searches for and presents conversion candidates according to an input character string, and inputs a character string by selecting the presented conversion candidate,
The input device is a dictionary in which readings before converting input character strings are recorded as words, and reading completion dictionary data in which words having dependency relations are configured as nodes in a tree structure, and A dictionary in which spelling after each word included in the reading completion dictionary data is converted as a word is recorded as a word, and the word before conversion processing and the word after conversion processing are associated with each other as a node. Comprising a storage unit for storing spelling completion dictionary data in which the same complementing unit number is assigned to a node in a dependency relationship, which is configured as a tree structure that matches the tree structure indicated by
A search key generation process in which the search key generation unit of the character string input device generates a search key based on a user input;
The spelling completion dictionary corresponding to the search key by the conversion candidate extraction unit of the character string input device searching the reading completion dictionary data and the spelling completion dictionary data based on the search key generated in the search key generation process. The data node is identified, and the spelling of the identified node and the spelling of the downstream node of the identified node assigned the same complement unit number as the identified node are read and combined from the spelling complement dictionary data Conversion candidate extraction process for acquiring the converted conversion candidates;
A conversion candidate output process in which the conversion candidate output unit of the character string input device outputs the conversion candidates acquired in the conversion candidate extraction process;
A character string input method characterized by comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009115797A JP4514826B1 (en) | 2009-05-12 | 2009-05-12 | Character string input device and character string input method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009115797A JP4514826B1 (en) | 2009-05-12 | 2009-05-12 | Character string input device and character string input method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4514826B1 JP4514826B1 (en) | 2010-07-28 |
JP2010266946A true JP2010266946A (en) | 2010-11-25 |
Family
ID=42582597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009115797A Active JP4514826B1 (en) | 2009-05-12 | 2009-05-12 | Character string input device and character string input method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4514826B1 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003233605A (en) * | 2002-02-07 | 2003-08-22 | Mitsubishi Electric Corp | Character string input device and character string input method |
JP2007334534A (en) * | 2006-06-14 | 2007-12-27 | Ntt Data Corp | Apparatus and method for inputting character string, and program |
-
2009
- 2009-05-12 JP JP2009115797A patent/JP4514826B1/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003233605A (en) * | 2002-02-07 | 2003-08-22 | Mitsubishi Electric Corp | Character string input device and character string input method |
JP2007334534A (en) * | 2006-06-14 | 2007-12-27 | Ntt Data Corp | Apparatus and method for inputting character string, and program |
Also Published As
Publication number | Publication date |
---|---|
JP4514826B1 (en) | 2010-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6789231B1 (en) | Method and system for providing alternatives for text derived from stochastic input sources | |
CN102298582A (en) | Data searching and matching method and system | |
KR20130018205A (en) | Method for disambiguating multiple readings in language conversion | |
JP6529761B2 (en) | Topic providing system and conversation control terminal device | |
JP2007334534A (en) | Apparatus and method for inputting character string, and program | |
JP2020080025A (en) | Question and answer data generation device and question and answer data generation method | |
JP2009140466A (en) | Method and system for providing conversation dictionary services based on user created dialog data | |
JP5323652B2 (en) | Similar word determination method and system | |
JP2002117027A (en) | Feeling information extracting method and recording medium for feeling information extracting program | |
Haq et al. | Urdu named entity recognition system using deep learning approaches | |
JP4514826B1 (en) | Character string input device and character string input method | |
CN110968999A (en) | Annotating method and system for automatically realizing fine granularity and diversification of docx file | |
JP5557469B2 (en) | Character search device, character search system, character search method, input terminal device, search server, and program | |
JP2007200252A (en) | Abbreviation generation/validity evaluation method, synonym database generation/update method, abbreviation generation/validity evaluation device, synonym database generation/update device, program, and recording medium | |
JP5481095B2 (en) | Character string input device, character string input method, and program | |
JP5542368B2 (en) | Character string input device, character string input method, and program | |
JP5337559B2 (en) | Character string input device, character string input method, and program | |
JP6807201B2 (en) | Information processing device | |
JP5481094B2 (en) | Character string input device, character string input method, and program | |
JP4765107B2 (en) | Character string input device and program | |
JP3785439B2 (en) | Natural language processing device, natural language processing method thereof, and natural language processing program | |
JP2006011842A (en) | Translation device and translation program | |
JP2010266950A (en) | Device, method, and program for inputting character string | |
JP6476638B2 (en) | Specific term candidate extraction device, specific term candidate extraction method, and specific term candidate extraction program | |
JP5367099B2 (en) | Difference location extraction apparatus and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100413 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100511 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4514826 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130521 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140521 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |