JP5803481B2 - Information processing apparatus and information processing program - Google Patents

Information processing apparatus and information processing program Download PDF

Info

Publication number
JP5803481B2
JP5803481B2 JP2011205097A JP2011205097A JP5803481B2 JP 5803481 B2 JP5803481 B2 JP 5803481B2 JP 2011205097 A JP2011205097 A JP 2011205097A JP 2011205097 A JP2011205097 A JP 2011205097A JP 5803481 B2 JP5803481 B2 JP 5803481B2
Authority
JP
Japan
Prior art keywords
character string
phrase
distance
character
editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011205097A
Other languages
Japanese (ja)
Other versions
JP2013068983A (en
Inventor
洋平 山根
洋平 山根
基行 鷹合
基行 鷹合
大悟 杉原
大悟 杉原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2011205097A priority Critical patent/JP5803481B2/en
Publication of JP2013068983A publication Critical patent/JP2013068983A/en
Application granted granted Critical
Publication of JP5803481B2 publication Critical patent/JP5803481B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置及び情報処理プログラムに関する。   The present invention relates to an information processing apparatus and an information processing program.

文章作成に関する技術がある。
これに関連する技術として、例えば、特許文献1には、予測変換による入力効率を向上させることを課題とし、表示順序設定部は、記憶部に格納されている入力履歴に基づいて、予測変換の変換候補の表示順序を設定し、予測変換処理部は、操作部の操作で入力された未確定文字列に対応する変換候補を、表示順序設定部が設定した表示順序で変換候補を表示部に表示し、確定入力処理部は、操作部からの入力に基づいて、選択された変換候補を確定文字列として確定入力すると、入力履歴更新部は、当該確定文字列についての入力履歴を生成して記憶部に格納し、削除検出部が、確定入力された確定文字列についての削除を検出すると、表示順序変更部が、該確定文字列を示す変換候補に設定された表示順序を、最上位以外の表示順序に変更し、これにより、誤って変換候補を確定した場合、修正時にその変換候補の表示順序が最上位とならないことが開示されている。
There are techniques related to writing.
As a technique related to this, for example, Patent Document 1 has an issue of improving input efficiency by predictive conversion, and the display order setting unit performs predictive conversion based on the input history stored in the storage unit. The conversion candidate display order is set, and the predictive conversion processing unit converts the conversion candidate corresponding to the unconfirmed character string input by the operation of the operation unit into the display unit according to the display order set by the display order setting unit. When the confirmation input processing unit confirms and inputs the selected conversion candidate as a confirmed character string based on the input from the operation unit, the input history update unit generates an input history for the confirmed character string. When the deletion detection unit detects deletion of the confirmed character string that has been confirmed and input, the display order changing unit sets the display order set to the conversion candidate indicating the confirmed character string to a value other than the highest order. Change the display order to And, thereby, when determining the mistake conversion candidate, the display order of the conversion candidates during modification has been disclosed that not a top level.

また、例えば、特許文献2には、予測処理結果の表示更新タイミングを制御することによって、ユーザーが任意のタイミングで予測候補文字列の選択を行うことができる文字列予測装置及び方法を提供することを課題とし、パターンを入力し、パターン認識用辞書を用いてパターン評価値を算出し、パターン評価値が高い順に認識候補文字を複数個出力し、その中から文脈辞書を用いて最適な認識候補文字を選択し、当該認識候補文字を組み合わせて検索文字列を生成し、キーとして予測辞書を検索し、複数の予測候補文字列を出力し、予測候補文字列もしくは最適な認識候補文字を表示する文字列入力方法であって、最新の予測候補文字列に表示更新するのか制御する条件を判定し、最新の予測候補文字列に表示更新する条件を満たしていると判定された場合に、最新の予測候補文字列に表示更新するように制御することが開示されている。   In addition, for example, Patent Document 2 provides a character string prediction apparatus and method that allow a user to select a prediction candidate character string at an arbitrary timing by controlling the display update timing of the prediction processing result. , Input a pattern, calculate a pattern evaluation value using a pattern recognition dictionary, output a plurality of recognition candidate characters in descending order of the pattern evaluation value, and use the context dictionary to select the optimal recognition candidate Select a character, generate a search character string by combining the recognition candidate characters, search the prediction dictionary as a key, output a plurality of prediction candidate character strings, and display the prediction candidate character string or the optimal recognition candidate character This is a character string input method that determines whether or not to update display to the latest prediction candidate character string, and satisfies the condition to update display to the latest prediction candidate character string. And when it is determined, it is controlled so as to display updated to the latest prediction candidate character strings is disclosed.

また、例えば、特許文献3には、文字入力装置を用いて文章を入力するに際し、ユーザーが入力しようとする文字列を予測する精度を向上させる予測入力装置を提供することを課題とし、音声入力部を介して入力された発言者の音声情報が、音声認識部でテキスト情報に変換され、予測データ作成部でそのテキスト情報から名詞が「読み」とともに抽出され、話題予測データが生成され、作成文書で使用された確定文字列は、文字情報入力部を介して予測データ作成部に与えられ、確定文字列と読みからなる履歴予測データが生成され、入力中の文字列(読み)が、予測処理部に与えられ、上記各予測データ並びに基本予測データに対して前方一致検索を行い、該当する文字列を予測候補に決定し、予測表示部を介して表示部に表示し、そして、予測選択部で選択された予測候補を予測候補出力部が作成文書に追加すべく出力することが開示されている。   In addition, for example, Patent Document 3 has an object to provide a prediction input device that improves the accuracy of predicting a character string to be input by a user when inputting a sentence using a character input device. The speech information of the speaker input via the part is converted into text information by the speech recognition part, and the noun is extracted from the text information together with “reading” by the prediction data creation part, and topic prediction data is generated and created. The confirmed character string used in the document is given to the prediction data creation unit via the character information input unit, and history prediction data composed of the confirmed character string and reading is generated, and the character string (reading) being input is predicted. Given to the processing unit, a forward matching search is performed on each of the prediction data and the basic prediction data, a corresponding character string is determined as a prediction candidate, displayed on the display unit via the prediction display unit, and , The prediction candidate output portion is disclosed to be output to be added to create a document prediction candidate selected by the prediction selector.

また、例えば、特許文献4には、日本語及び他の言語入力を行うユーザーのタイピング作業を最小限とし、かつ正確で迅速な入力を実現する装置及び方法を提供することを課題とし、文字入力装置と共に用いる予測入力装置が、1の文字列とそれから予測される後続文字列候補リストとを互いに関連付け格納した後続文字列データベースと、既入力文字列の最後尾の文字列に対応する後続文字列候補リストを呼び出す手段と、呼び出しに応答して最後尾の文字列を判定する判定手段と、判定された文字列に対応する後続文字列候補リストを後続文字列データベースから検索する検索手段と、後続文字列候補リストを表示する表示手段と、表示された候補リスト中に適切な後続文字列がある場合はその適切な後続文字列を選択する選択手段と、選択された後続文字列を入力する手段とを有することが開示されている。   Further, for example, Patent Document 4 has an object to provide an apparatus and method for minimizing typing operations of a user who inputs Japanese and other languages, and realizing accurate and quick input. The prediction input device used together with the device stores a subsequent character string database in which one character string and a subsequent character string candidate list predicted therefrom are stored in association with each other, and a subsequent character string corresponding to the last character string of the input character string Means for calling the candidate list; determination means for determining the last character string in response to the call; search means for searching the subsequent character string database corresponding to the determined character string from the subsequent character string database; A display means for displaying a character string candidate list, and a selection means for selecting an appropriate subsequent character string if there is an appropriate subsequent character string in the displayed candidate list; It discloses that to have a means for inputting the-option has been trailing string.

また、例えば、特許文献5には、同一文書内の文字列を指示する文字列が入力された場合、予め保存しておいた情報をもとに同一文書内に現れている文字列を予測文字列として入力者に示すことにより、その操作性を向上させることができる文字列予測方法、及びこの方法を用いた文字列予測装置を提供することを目的とし、文字列入力部と、かな−漢字辞書、指示文字列辞書、指示文字列判定部、漢字変換部、品詞情報保存部、文字列−品詞バッファ、表示部、被指示文字列選択制御部、文字列取り出し部、文字列選択部、及び出力部とを備え、かな漢字変換方法等によって得られた品詞情報を語彙と共に保存しておき、入力された文字列が同一文書内の語句を指示する指示文字列であった場合には保存しておいた情報をもとに、その時点までに入力された文章の中から文字列を取り出し、予測文字列として出力することを特徴とすることが開示されている。   Also, for example, in Patent Document 5, when a character string indicating a character string in the same document is input, a character string appearing in the same document based on information stored in advance is predicted. It is an object of the present invention to provide a character string prediction method capable of improving the operability by showing it to the input person as a string, and a character string prediction device using this method. Dictionary, instruction character string dictionary, instruction character string determination unit, kanji conversion unit, part of speech information storage unit, character string-part of speech buffer, display unit, commanded character string selection control unit, character string extraction unit, character string selection unit, and Part-of-speech information obtained by the Kana-Kanji conversion method, etc. is stored together with the vocabulary, and if the input character string is an instruction character string indicating a phrase in the same document, save it At that point, based on the information It retrieves a string from the text entered, that and outputs a predicted character string disclosed in.

また、例えば、特許文献6には、携帯端末機等の情報端末等に文書を入力する際、文字列を入力し予測変換中に、当該変換中の単語前方、すなわち既に入力済みの文章中に、単語やフレーズを簡便な操作のみで迅速に追加することを課題とし、文章を入力する際に、操作部におけるユーザー操作により入力された文字列に応じた単語の候補を単語検索部によって検索するとともに、単語の文章中における入力位置を検出し、単語の候補中から選択された単語を入力単語として取得し、入力単語の属性及び入力位置に応じて、入力単語の前方又は後方に連結される前方フレーズ又は後方フレーズの候補をフレーズ検索部により検索し、ユーザー操作に基づき、前方又は後方を切り替えてフレーズの候補を選択可能に表示部に表示し、これらの文字入力及び候補選択による入力結果に基づいて文章を構成することが開示されている。   Further, for example, in Patent Document 6, when inputting a document into an information terminal such as a portable terminal, a character string is input and during predictive conversion, in front of the word being converted, that is, in a sentence that has already been input. The problem is to add words and phrases quickly by simple operation. When inputting a sentence, the word search unit searches for word candidates according to the character string input by the user operation in the operation unit. In addition, the input position in the sentence of the word is detected, the word selected from the word candidates is acquired as the input word, and connected to the front or rear of the input word according to the attribute and the input position of the input word. Search forward phrase or backward phrase candidates with the phrase search unit, and switch between forward or backward based on user operation and display the phrase candidates selectable on the display unit. It is disclosed that constitutes a sentence based on an input result by the input and candidate selection.

また、例えば、特許文献7には、文章の入力時に語句の補完を効果的に行い、利用者による文章入力の効率を向上させることを課題とし、文章入力補助装置は、蓄積された1又は複数の電子文書から抽出した語句を記憶し、記憶される語句の中から、利用者により入力された文字列と関連する語句を検索し、検索された語句のいずれかに基づいて文字列を補完することが開示されている。   In addition, for example, in Patent Document 7, it is an object to effectively complement words at the time of text input and improve the text input efficiency by the user. The phrase extracted from the electronic document is stored, the phrase related to the character string input by the user is searched from the stored phrases, and the character string is complemented based on one of the searched phrases. It is disclosed.

特開2008−083848号公報JP 2008-083848 A 特開2004−070599号公報JP 2004070599 A 特開2000−285112号公報JP 2000-285112 A 特開平11−212967号公報JP-A-11-212967 特開平09−044492号公報JP 09-044492 A 特開2005−301699号公報JP 2005-301699 A 特開2009−211285号公報JP 2009-2111285 A

本発明は、第1の文字列を補完する場合に、第1の文字列の後に第2の文字列を付加する補完の候補だけでなく、第1の文字列の一部を置換する第2の文字列を補完の候補とするようにした情報処理装置及び情報処理プログラムを提供することを目的としている。   In the present invention, when a first character string is complemented, not only a candidate for complementation in which a second character string is added after the first character string but also a part of the first character string is replaced. It is an object of the present invention to provide an information processing apparatus and an information processing program in which the character string is used as a candidate for completion.

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、第1の文字列を受け付ける受付手段と、第2の文字列を記憶している記憶手段から、前記受付手段によって受け付けられた第1の文字列を補完するために用いる文字列の候補として、該第2の文字列から該第1の文字列へ又は該第1の文字列から該第2の文字列へ編集するための距離に基づいて算出した点数を用いて、該第2の文字列を取得する取得手段と、前記取得手段によって取得された第2の文字列又は該第2の文字列の一部を表示する表示手段と、前記表示手段によって表示された第2の文字列又は該第2の文字列の一部を、操作者の選択操作によって選択し、該選択された第2の文字列又は該第2の文字列の一部に基づいて、前記第1の文字列を補完する補完手段を具備し、前記表示手段は、前記第2の文字列の一部から前記第1の文字列へ又は該第1の文字列から該第2の文字列の一部へ編集するための距離と第2の文字列の一部以外の部分の文字列の長さに基づいて、補完に用いる文字列として表示する文字列である該第2の文字列の一部を生成することを特徴とする情報処理装置である。
The gist of the present invention for achieving the object lies in the inventions of the following items.
The invention of claim 1 is used for complementing the first character string received by the receiving means from the receiving means for receiving the first character string and the storage means for storing the second character string. Using the score calculated based on the distance for editing from the second character string to the first character string or from the first character string to the second character string as a character string candidate, Acquisition means for acquiring the second character string, display means for displaying the second character string acquired by the acquisition means or a part of the second character string, and display of the second character string displayed by the display means A second character string or a part of the second character string is selected by an operator's selection operation, and the second character string or a part of the second character string is selected based on the selected second character string or a part of the second character string. comprising complementary means to complement the first character string, the display means, said second string The distance for editing from a part to the first character string or from the first character string to a part of the second character string, and the length of the character string other than a part of the second character string On the basis of the above, the information processing apparatus generates a part of the second character string that is a character string to be displayed as a character string used for complementation .

請求項2の発明は、前記記憶手段は、第2の文字列と該第2の文字列に関する数値を対応させて記憶しており、前記取得手段は、前記記憶手段から、前記受付手段によって受け付けられた第1の文字列を補完するために用いる文字列の候補として、前記第2の文字列から該第1の文字列へ又は該第1の文字列から該第2の文字列へ編集するための距離と該第2の文字列に関する数値に基づいて算出した点数を用いて、該第2の文字列を取得し、前記第2の文字列に関する数値は、該第2の文字列が、第2の文字列を抽出対象とした文書中で出現している頻度を示す数値であり、前記取得手段は、前記第2の文字列に関する数値から前記距離と重みを乗算した値を減算して前記点数を算出し、該点数が高い順に予め定められた件数の第2の文字列を取得することを特徴とする請求項1に記載の情報処理装置である。 According to a second aspect of the present invention, the storage means stores a second character string and a numerical value related to the second character string in association with each other, and the acquisition means is received from the storage means by the reception means. Editing from the second character string to the first character string or from the first character string to the second character string as a character string candidate used for complementing the received first character string The second character string is obtained using a distance calculated based on the distance and the numerical value related to the second character string, and the second character string includes the second character string, It is a numerical value indicating the frequency of appearance in a document in which the second character string is extracted, and the acquisition means subtracts a value obtained by multiplying the distance and weight from a numerical value related to the second character string. The score is calculated, and a predetermined number of second characters in descending order. Obtaining a an information processing apparatus according to claim 1, wherein the.

請求項3の発明は、前記取得手段は、距離が大であるほど選択されにくくなるようにしており、距離として、第2の文字列を第1の文字列にするための編集であって、挿入編集の距離は、削除編集の距離より大である、又は、第1の文字列を第2の文字列にするための編集であって、削除編集の距離は、挿入編集の距離より大であることを特徴とする請求項1又は2に記載の情報処理装置である。   The invention according to claim 3 is an edit for making the second character string a first character string as the distance, wherein the acquisition means is less likely to be selected as the distance is larger. The distance for insertion editing is greater than the distance for deletion editing, or editing for changing the first character string to the second character string, and the distance for deletion editing is greater than the distance for insertion editing. The information processing apparatus according to claim 1, wherein the information processing apparatus is provided.

請求項の発明は、コンピュータを、第1の文字列を受け付ける受付手段と、第2の文字列を記憶している記憶手段から、前記受付手段によって受け付けられた第1の文字列を補完するために用いる文字列の候補として、該第2の文字列から該第1の文字列へ又は該第1の文字列から該第2の文字列へ編集するための距離に基づいて算出した点数を用いて、該第2の文字列を取得する取得手段と、前記取得手段によって取得された第2の文字列又は該第2の文字列の一部を表示する表示手段と、前記表示手段によって表示された第2の文字列又は該第2の文字列の一部を、操作者の選択操作によって選択し、該選択された第2の文字列又は該第2の文字列の一部に基づいて、前記第1の文字列を補完する補完手段として機能させ、前記表示手段は、前記第2の文字列の一部から前記第1の文字列へ又は該第1の文字列から該第2の文字列の一部へ編集するための距離と第2の文字列の一部以外の部分の文字列の長さに基づいて、補完に用いる文字列として表示する文字列である該第2の文字列の一部を生成することを特徴とする情報処理プログラムである。 According to a fourth aspect of the present invention, the computer supplements the first character string received by the receiving means from the receiving means for receiving the first character string and the storage means for storing the second character string. As a character string candidate to be used, a score calculated based on a distance for editing from the second character string to the first character string or from the first character string to the second character string is calculated. Using the acquisition means for acquiring the second character string, the display means for displaying the second character string acquired by the acquisition means or a part of the second character string, and the display by the display means. The selected second character string or a part of the second character string is selected by the selection operation of the operator, and based on the selected second character string or the part of the second character string , to function as a complementary means to complement the first character string, the display hand Is a distance for editing from a part of the second character string to the first character string or from the first character string to a part of the second character string, and one of the second character strings. An information processing program that generates a part of the second character string, which is a character string to be displayed as a character string used for complementation, based on a length of a character string of a part other than the part .

請求項1の情報処理装置によれば、第1の文字列を補完する場合に、第1の文字列の後に第2の文字列を付加する補完の候補だけでなく、第1の文字列の一部を置換する第2の文字列を補完の候補とし、本発明の構成を有していない場合と比較して、文字列の入力に関する操作を少なくすることができる。また、補完すべき文字列として表示する文字列を編集するための距離と文字列の長さに基づいて制御することができる。 According to the information processing apparatus of claim 1, when complementing the first character string, not only the candidate for complementation in which the second character string is added after the first character string but also the first character string Compared to the case where the second character string that replaces a part is used as a candidate for completion and does not have the configuration of the present invention, it is possible to reduce operations related to input of the character string. Further, it is possible to control based on the distance for editing the character string to be displayed as the character string to be complemented and the length of the character string.

請求項2の情報処理装置によれば、第2の文字列に関する数値を用いて、第2の文字列を取得することができる。   According to the information processing apparatus of the second aspect, it is possible to acquire the second character string using the numerical value related to the second character string.

請求項3の情報処理装置によれば、第1の文字列をそのまま用いられるような第2の文字列を選択することができる。   According to the information processing apparatus of the third aspect, it is possible to select the second character string that allows the first character string to be used as it is.

請求項の情報処理プログラムによれば、第1の文字列を補完する場合に、第1の文字列の後に第2の文字列を付加する補完の候補だけでなく、第1の文字列の一部を置換する第2の文字列を補完の候補とし、本発明の構成を有していない場合と比較して、文字列の入力する操作を少なくすることができる。また、補完すべき文字列として表示する文字列を編集するための距離と文字列の長さに基づいて制御することができる。 According to the information processing program of claim 4 , when the first character string is complemented, not only the candidate for completion in which the second character string is added after the first character string but also the first character string Compared to the case where the second character string that replaces a part is used as a candidate for complementation and does not have the configuration of the present invention, the operation of inputting the character string can be reduced. Further, it is possible to control based on the distance for editing the character string to be displayed as the character string to be complemented and the length of the character string.

本実施の形態のフレーズ抽出処理を行う情報処理装置の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of the information processing apparatus which performs the phrase extraction process of this Embodiment. 本実施の形態の補完処理を行う情報処理装置の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of the information processing apparatus which performs the complementation process of this Embodiment. 本実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by this Embodiment. 補完対象となる文字列の受け付け処理例を示す説明図である。It is explanatory drawing which shows the example of a reception process of the character string used as complementation object. 編集距離の算出例を示す説明図である。It is explanatory drawing which shows the example of calculation of edit distance. 編集距離の算出例を示す説明図である。It is explanatory drawing which shows the example of calculation of edit distance. フレーズデータ格納テーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of a phrase data storage table. フレーズ・重要度・編集距離対応テーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of a phrase / importance / edit distance correspondence table. スコア算出テーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of a score calculation table. スコア算出テーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of a score calculation table. 補完フレーズの抽出例を示す説明図である。It is explanatory drawing which shows the example of extraction of a complement phrase. 補完フレーズの抽出例を示す説明図である。It is explanatory drawing which shows the example of extraction of a complement phrase. 補完フレーズの表示例を示す説明図である。It is explanatory drawing which shows the example of a display of a complement phrase. 補完フレーズの表示例を示す説明図である。It is explanatory drawing which shows the example of a display of a complement phrase. 補完フレーズの表示例を示す説明図である。It is explanatory drawing which shows the example of a display of a complement phrase. 補完フレーズの表示例を示す説明図である。It is explanatory drawing which shows the example of a display of a complement phrase. 補完した後の表示例を示す説明図である。It is explanatory drawing which shows the example of a display after complementing. 補完フレーズの表示例を示す説明図である。It is explanatory drawing which shows the example of a display of a complement phrase. 補完した後の表示例を示す説明図である。It is explanatory drawing which shows the example of a display after complementing. 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。It is a block diagram which shows the hardware structural example of the computer which implement | achieves this Embodiment.

以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
Hereinafter, an example of a preferred embodiment for realizing the present invention will be described with reference to the drawings.
FIG. 1 shows a conceptual module configuration diagram of a configuration example of the present embodiment.
The module generally refers to components such as software (computer program) and hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a computer program but also a module in a hardware configuration. Therefore, the present embodiment is a computer program for causing these modules to function (a program for causing a computer to execute each procedure, a program for causing a computer to function as each means, and a function for each computer. This also serves as an explanation of the program and system and method for realizing the above. However, for the sake of explanation, the words “store”, “store”, and equivalents thereof are used. However, when the embodiment is a computer program, these words are stored in a storage device or stored in memory. It is the control to be stored in the device. Modules may correspond to functions one-to-one, but in mounting, one module may be configured by one program, or a plurality of modules may be configured by one program, and conversely, one module May be composed of a plurality of programs. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Note that one module may include other modules. Hereinafter, “connection” is used not only for physical connection but also for logical connection (data exchange, instruction, reference relationship between data, etc.). “Predetermined” means that the process is determined before the target process, and not only before the process according to this embodiment starts but also after the process according to this embodiment starts. In addition, if it is before the target processing, it is used in accordance with the situation / state at that time or with the intention to be decided according to the situation / state up to that point.
In addition, the system or device is configured by connecting a plurality of computers, hardware, devices, and the like by communication means such as a network (including one-to-one correspondence communication connection), etc., and one computer, hardware, device. The case where it implement | achieves by etc. is included. “Apparatus” and “system” are used as synonymous terms. Of course, the “system” does not include a social “mechanism” (social system) that is an artificial arrangement.
In addition, when performing a plurality of processes in each module or in each module, the target information is read from the storage device for each process, and the processing result is written to the storage device after performing the processing. is there. Therefore, description of reading from the storage device before processing and writing to the storage device after processing may be omitted. Here, the storage device may include a hard disk, a RAM (Random Access Memory), an external storage medium, a storage device via a communication line, a register in a CPU (Central Processing Unit), and the like.

文章を作成する場合(特に、定型的な文章を入力する場合)に、キーボード、タッチパネル等を用いた文章打ち込みにおける省力化を行う技術として補完技術が存在する。
この補完技術は、次の2つの技術がある。(1)過去に作成された電子文書(以下、文書ともいう)から定型的なフレーズ(文字列)を抽出しておく技術、(2)文章打ち込みにおいて、打ち込まれた文章(文字列)に続くフレーズの候補をカーソル付近に表示し、操作者に選択させることで、文章作成の負担を軽減する技術である。
本実施の形態は、まず(1)の技術を用いる情報処理を図1の例を用いて説明し、次に(2)の技術を用いる情報処理を図2以降の例を用いて説明する。
Complementary technology exists as a technique for saving labor in sentence writing using a keyboard, a touch panel, or the like when writing a sentence (particularly when inputting a regular sentence).
This complementary technology includes the following two technologies. (1) Technology for extracting a standard phrase (character string) from an electronic document (hereinafter also referred to as a document) created in the past, (2) In the text typing, following the typed text (character string) This is a technology that reduces phrase creation by displaying phrase candidates near the cursor and allowing the operator to select them.
In the present embodiment, first, information processing using the technique (1) will be described using the example of FIG. 1, and then information processing using the technique (2) will be described using the examples of FIG.

本実施の形態である情報処理装置は、過去に作成された文書から定型的なフレーズ(以下、文字列ともいう)を抽出するものであって、図1の例に示すように、文書格納モジュール110、フレーズ抽出モジュール120、フレーズデータ格納モジュール130を有している。
これは、操作者が文章を書き始める前に、予め補完するフレーズを、過去に作成された文書から抽出して、フレーズデータを作成しておくためのものである。
The information processing apparatus according to the present embodiment extracts a standard phrase (hereinafter also referred to as a character string) from a document created in the past. As shown in the example of FIG. 110, a phrase extraction module 120, and a phrase data storage module 130.
This is for extracting phrase to be complemented in advance from a document created in the past and creating phrase data before the operator starts to write a sentence.

文書格納モジュール110は、フレーズ抽出モジュール120と接続されている。文書格納モジュール110は、過去に作成された文書を格納しており、フレーズ抽出モジュール120からアクセスされる。この格納されている文書は、一人の操作者(特に、図2の例を用いて説明する補完技術を実現する情報処理装置の操作者と同じ操作者)によって作成された文書であってもよいし、他の人によって作成された文書であってもよい。例えば、組織(具体例として、会社、部署、グループ、プロジェクトに属しているメンバー等)によって作成された文書を記憶している文書データベース等が該当する。   The document storage module 110 is connected to the phrase extraction module 120. The document storage module 110 stores documents created in the past and is accessed from the phrase extraction module 120. The stored document may be a document created by a single operator (in particular, the same operator as the information processing device operator that implements the complementary technology described using the example of FIG. 2). Alternatively, it may be a document created by another person. For example, a document database that stores documents created by an organization (specifically, members belonging to a company, a department, a group, a project, or the like) is applicable.

フレーズ抽出モジュール120は、文書格納モジュール110、フレーズデータ格納モジュール130と接続されている。フレーズ抽出モジュール120は、文書格納モジュール110に格納されている文書から補完するフレーズを抽出し、その抽出したフレーズをフレーズデータ格納モジュール130に格納する。また、抽出したフレーズには重要度を付与してもよい。
例えば、句読点を区切りとしてフレーズを抽出し、そのフレーズが全ての文書中で出現している頻度を計数し、この頻度をそのフレーズの重要度とするようにしてもよい。また、形態素解析技術を用いて、フレーズを抽出してもよく。また、重要度は、文書格納モジュール110に格納された文書における出現頻度に基づいてその初期値を決定してもよい。そして、図2の例に示す情報処理装置において、そのフレーズの補完としての利用回数に基づいて更新することとしてもよい。例えば、語句の重要度Iは、語句の出現頻度をA、補完としての利用回数をBとして、I=p・A+q・B(p,qは重み)という式により算出することとしてもよい。
The phrase extraction module 120 is connected to the document storage module 110 and the phrase data storage module 130. The phrase extraction module 120 extracts a complementary phrase from the document stored in the document storage module 110 and stores the extracted phrase in the phrase data storage module 130. Moreover, you may give importance to the extracted phrase.
For example, phrases may be extracted with punctuation marks as delimiters, the frequency with which the phrases appear in all documents may be counted, and this frequency may be used as the importance of the phrase. Moreover, you may extract a phrase using a morphological analysis technique. The importance may be determined based on the appearance frequency of the document stored in the document storage module 110. And in the information processing apparatus shown in the example of FIG. 2, it is good also as updating based on the frequency | count of utilization as the complement of the phrase. For example, the importance level I of a phrase may be calculated by an expression of I = p · A + q · B (p and q are weights) where A is the appearance frequency of the phrase and B is the number of times of use as complement.

フレーズデータ格納モジュール130は、フレーズ抽出モジュール120と接続されている。フレーズデータ格納モジュール130は、フレーズ抽出モジュール120によって抽出されたフレーズを格納している。また、フレーズ抽出モジュール120によって抽出されたフレーズとそのフレーズの重要度を対応付けて格納していてもよい。具体的なデータ構造例は、図7の例を用いて後述する。また、フレーズデータ格納モジュール130は、図2の例に示す情報処理装置からもアクセスされる。そのために、フレーズデータ格納モジュール130は、フレーズ抽出モジュール120又は図2の例に示す情報処理装置と通信回線を介して接続されているサーバー等内にあってもよい。   The phrase data storage module 130 is connected to the phrase extraction module 120. The phrase data storage module 130 stores the phrase extracted by the phrase extraction module 120. Moreover, the phrase extracted by the phrase extraction module 120 and the importance of the phrase may be stored in association with each other. A specific data structure example will be described later with reference to the example of FIG. The phrase data storage module 130 is also accessed from the information processing apparatus shown in the example of FIG. Therefore, the phrase data storage module 130 may be in the phrase extraction module 120 or a server connected to the information processing apparatus shown in the example of FIG. 2 via a communication line.

図2は、本実施の形態の補完処理を行う情報処理装置の構成例についての概念的なモジュール構成図である。
補完処理を行う情報処理装置は、図2の例に示すように、テキスト受付モジュール210、補完候補フレーズ取得モジュール220、フレーズデータ格納モジュール130、補完候補フレーズ表示モジュール230、補完モジュール240を有している。
FIG. 2 is a conceptual module configuration diagram of a configuration example of the information processing apparatus that performs the complementing processing according to the present embodiment.
As illustrated in the example of FIG. 2, the information processing apparatus that performs the complement processing includes a text reception module 210, a complement candidate phrase acquisition module 220, a phrase data storage module 130, a complement candidate phrase display module 230, and a complement module 240. Yes.

テキスト受付モジュール210は、補完候補フレーズ取得モジュール220と接続されている。テキスト受付モジュール210は、キーボード、タッチパネル等に対する操作者の操作によって、打ち込まれる文字列(テキスト)を受け付ける。例えば、日本語入力フロントエンドプロセッサ(かな漢字変換モジュール)等によって構成されていてもよい。図4は、補完対象となる文字列の受け付け処理例を示す説明図である。既打込文字列表示領域400内には、既に打ち込まれた文字列が表示されており、現在の打ち込み位置にカーソル410が表示されている。   The text reception module 210 is connected to the complement candidate phrase acquisition module 220. The text receiving module 210 receives a character string (text) that is input by an operator's operation on a keyboard, a touch panel, or the like. For example, it may be configured by a Japanese input front-end processor (kana-kanji conversion module) or the like. FIG. 4 is an explanatory diagram illustrating an example of receiving processing of a character string to be complemented. In the already-printed character string display area 400, the already-printed character string is displayed, and the cursor 410 is displayed at the current drive position.

補完候補フレーズ取得モジュール220は、テキスト受付モジュール210、フレーズデータ格納モジュール130、補完候補フレーズ表示モジュール230と接続されている。補完候補フレーズ取得モジュール220は、第1の文字列を受け付ける。ここでの第1の文字列は、後述する第2の文字列によって補完され得る文字列(補完対象の文字列)である。テキスト受付モジュール210によって打ち込まれた文字列から、第1の文字列を取得する。つまり、操作者がテキスト受付モジュール210に打ち込んだ文字列から、補完フレーズを検索するための第1の文字列(以下、検索キーともいう)を取得する。検索キーを取得するタイミングは、最後に文字が打ち込まれてから予め定められた時間が経過したときとする。例えば、最後に文字が入力されてから100ms経過したときに検索キーを取得する。
取得する検索キーは、カーソル位置から前方の文字列を予め定められたルールに基づき取得する。例えば、カーソル位置から予め定められた文字数の文字列を取得してもよいし、カーソル位置の直前の区切り文字までの文字列を取得してもよい。例えば、区切り文字として句読点、改行、かっこ又は空白等を用いるものとする。図4に示す例では、検索キーとして“有意なリンパ節の腫大は”を取得することになる。
The complement candidate phrase acquisition module 220 is connected to the text reception module 210, the phrase data storage module 130, and the complement candidate phrase display module 230. The complement candidate phrase acquisition module 220 receives the first character string. The first character string here is a character string (a character string to be complemented) that can be complemented by a second character string to be described later. A first character string is acquired from the character string typed by the text reception module 210. That is, a first character string (hereinafter also referred to as a search key) for searching for a complementary phrase is acquired from a character string that the operator types in the text receiving module 210. The search key is acquired when a predetermined time has elapsed since the last character was typed. For example, the search key is acquired when 100 ms has passed since the last character input.
The search key to be acquired acquires a character string in front of the cursor position based on a predetermined rule. For example, a character string of a predetermined number of characters may be acquired from the cursor position, or a character string up to a delimiter immediately before the cursor position may be acquired. For example, punctuation marks, line feeds, parentheses, or spaces are used as delimiters. In the example shown in FIG. 4, “significant lymph node enlargement” is acquired as a search key.

フレーズデータ格納モジュール130は、補完候補フレーズ取得モジュール220と接続されている。フレーズデータ格納モジュール130は、1つ以上のフレーズ(第2の文字列)を記憶している。この第2の文字列は、第1の文字列を補完するために用いる文字列である。
また、フレーズデータ格納モジュール130は、第2の文字列とその第2の文字列に関する数値(補完候補フレーズ取得モジュール220が補完候補として第2の文字列を抽出する際に用いる数値であり、具体的には、図1の例で説明した重要度)を対応させて記憶していてもよい。例えば、フレーズデータ格納テーブル700を記憶している。図7は、フレーズデータ格納テーブル700のデータ構造例を示す説明図である。フレーズデータ格納テーブル700は、フレーズ欄710、重要度欄720を有している。フレーズ欄710は、第2の文字列を記憶している。重要度欄720は、その第2の文字列に対応する重要度を記憶している。
The phrase data storage module 130 is connected to the supplement candidate phrase acquisition module 220. The phrase data storage module 130 stores one or more phrases (second character strings). This second character string is a character string used to complement the first character string.
Further, the phrase data storage module 130 is a numerical value related to the second character string and the second character string (a numerical value used when the supplement candidate phrase acquisition module 220 extracts the second character string as a complement candidate, Specifically, the importance levels described in the example of FIG. 1 may be stored in association with each other. For example, a phrase data storage table 700 is stored. FIG. 7 is an explanatory diagram showing an example of the data structure of the phrase data storage table 700. The phrase data storage table 700 has a phrase column 710 and an importance level column 720. The phrase column 710 stores the second character string. The importance level column 720 stores the importance level corresponding to the second character string.

そして、補完候補フレーズ取得モジュール220は、フレーズデータ格納モジュール130から、第1の文字列を補完するために用いる文字列の候補として、第2の文字列から第1の文字列へ又は第1の文字列から第2の文字列へ編集するための距離(編集距離ともいわれる)に基づいて算出した点数(以下、スコアという)を用いて、第2の文字列を取得する。
また、補完候補フレーズ取得モジュール220は、フレーズデータ格納モジュール130から、第1の文字列を補完するために用いる文字列の候補として、第2の文字列から第1の文字列へ又は第1の文字列から第2の文字列へ編集するための距離と第2の文字列に関する数値に基づいて算出した点数を用いて、第2の文字列を取得するようにしてもよい。
なお、補完には、第1の文字列の後に、第2の文字列の一部を付加することがある。これは、第2の文字列の先頭にある文字列と第1の文字列が同じ場合が典型的な例であり、第1の文字列を打ち込んだ時点で、第2の文字列を打ち込もうとしていると判断して、続きの第2の文字列の一部(第2の文字列の前述の先頭の文字列以外の文字列である後半の文字列)を付加することである。なお、第2の文字列の一部とは、第2の文字列に含まれている文字列であって、1字以上の連続する文字列である。
この他に、補完には、第1の文字列の一部又は全部を第2の文字列又は第2の文字列の一部で置換することが含まれる。例えば、第1の文字列の一部と第2の文字列の一部が同じ場合であって、第1の文字列の全部を第2の文字列で置き換える場合が該当する。
Then, the supplement candidate phrase acquisition module 220 receives from the phrase data storage module 130 the second character string to the first character string or the first character string as a character string candidate used for complementing the first character string. A second character string is acquired using a score (hereinafter referred to as a score) calculated based on a distance for editing from the character string to the second character string (also referred to as an edit distance).
In addition, the supplement candidate phrase acquisition module 220 receives from the phrase data storage module 130 the second character string to the first character string or the first character string as a character string candidate used for complementing the first character string. You may make it acquire a 2nd character string using the score calculated based on the distance for editing from a character string to a 2nd character string, and the numerical value regarding a 2nd character string.
For complementation, a part of the second character string may be added after the first character string. This is a typical example where the first character string and the first character string are the same as the first character string. When the first character string is input, the second character string is input. It is determined that it is about to add, and a part of the subsequent second character string (second character string that is a character string other than the first character string of the second character string) is added. The part of the second character string is a character string included in the second character string, and is a continuous character string of one or more characters.
In addition, complementation includes replacing part or all of the first character string with the second character string or part of the second character string. For example, a case where a part of the first character string and a part of the second character string are the same and the whole of the first character string is replaced with the second character string is applicable.

補完候補フレーズ取得モジュール220の処理について、具体的に説明する。
補完候補フレーズ取得モジュール220は、第1の文字列(検索キー)を手がかりとして、フレーズデータ格納モジュール130からスコアが高い順に予め定められた件数の第2の文字列を取得する。
例えば、第2の文字列のスコアの計算は、重要度を用いない場合は、
スコア = − 重み × 距離 ・・・ (1)
重要度を用いる場合は、
スコア = 重要度 − 重み × 距離 ・・・ (2)
の式によって計算する。そして、本例では取得する件数は3件とする。
(2)式での重要度とは、第2の文字列の重要度(具体的にはフレーズデータ格納テーブル700の重要度欄720)である。各式における距離とは、第2の文字列から第1の文字列又は第1の文字列から第2の文字列へ変換するために必要となる編集の種類(挿入編集、削除編集、置換編集等)とその編集する文字数又は単語数に基づいて算出される値である。そして、距離が大であるほど補完の候補として選択されにくくなるようにしており(つまり、距離が大であるとスコアが低くなる)、距離として、第2の文字列を第1の文字列にするための編集であって、挿入編集の距離は、削除編集の距離より大である、又は、第1の文字列を第2の文字列にするための編集であって、削除編集の距離は、挿入編集の距離より大である。また、この距離算出のための編集として置換編集を含めてもよい。置換編集は、削除編集と挿入編集の組み合わせである。
以下では、主に第2の文字列から第1の文字列へ変換するために必要となる編集であって、編集は文字単位で行うことを例として用いて説明する。
例えば、削除編集のコストを0、挿入編集のコストを1とする。具体例をもって示すと、第2の文字列から5文字削除することによって第1の文字列となる場合はコストが0であり、第2の文字列に3文字挿入することによって第1の文字列となる場合はコストが3である。また、重みは10とする。
なお、重要度の値に比べて距離の値が小さいことから、各式において重みを用いているが、重みは必ずしも必要ない。例えば、コスト自体を前述の1、0ではなく、10、0のようにすることや、重要度を1/10の値としてもよい。
The process of the complement candidate phrase acquisition module 220 will be specifically described.
The complement candidate phrase acquisition module 220 acquires a predetermined number of second character strings in descending order from the phrase data storage module 130 using the first character string (search key) as a clue.
For example, if the score for the second string is not using importance,
Score =-Weight x Distance (1)
When using importance,
Score = Importance-Weight x Distance (2)
Calculate using the following formula. In this example, the number of acquisitions is three.
The importance in the equation (2) is the importance of the second character string (specifically, the importance column 720 of the phrase data storage table 700). The distance in each expression is the type of editing required for converting from the second character string to the first character string or from the first character string to the second character string (insert editing, deletion editing, replacement editing). Etc.) and the number of characters or words to be edited. The larger the distance, the harder it is to be selected as a candidate for complementation (that is, the greater the distance, the lower the score). As the distance, the second character string is changed to the first character string. The distance for insertion editing is larger than the distance for deletion editing, or for editing the first character string into the second character string, and the distance for deletion editing is It is larger than the distance of insert editing. Further, replacement editing may be included as editing for calculating the distance. Replacement editing is a combination of deletion editing and insertion editing.
In the following, description will be made using an example in which editing is mainly required for conversion from the second character string to the first character string, and editing is performed in units of characters.
For example, the cost of deletion editing is 0, and the cost of insertion editing is 1. Specifically, when the first character string is obtained by deleting five characters from the second character string, the cost is 0, and the first character string is obtained by inserting three characters into the second character string. The cost is 3. The weight is 10.
Since the distance value is smaller than the importance value, the weight is used in each equation, but the weight is not always necessary. For example, the cost itself may be set to 10, 0 instead of the above-described 1, 0, and the importance may be set to 1/10.

例えば、フレーズデータ格納モジュール130内にある“有意なリンパ節の腫大は認められません。”という第2の文字列(フレーズ)であって、第1の文字列(検索キー)である“有意なリンパ節の腫大は”の場合、第1の文字列から第2の文字列への距離は、図5の例に示すように0となる。図5は、距離の算出例を示す説明図である。編集距離算出例500は、フレーズ欄510、操作欄520、コスト欄530、編集距離欄540を有している。編集距離算出例500の第1行は第2の文字列、第2行は第1の文字列のことを示している。つまり、第1行から第2行への編集を示している。
フレーズ欄510の第1行にある“有意なリンパ節の腫大は認められません。”というフレーズに対して、“認められません。”の8文字を削除するという編集(操作欄520の第2行)を施すと、フレーズ欄510の第2行のように第1の文字列(検索キー)である“有意なリンパ節の腫大は”に変換できる。ここでの編集は削除編集であるので、コストは0となり、結局、距離も0である(図5の例のコスト欄530、編集距離欄540の第2行参照)。
For example, there is a second character string (phrase) in the phrase data storage module 130 that “a significant enlargement of lymph nodes is not recognized” and a first character string (search key) “ When the significant lymph node enlargement is "the distance from the first character string to the second character string is 0 as shown in the example of FIG. FIG. 5 is an explanatory diagram illustrating an example of calculating the distance. The edit distance calculation example 500 includes a phrase field 510, an operation field 520, a cost field 530, and an edit distance field 540. In the edit distance calculation example 500, the first line indicates the second character string, and the second line indicates the first character string. That is, editing from the first line to the second line is shown.
Edit that deletes the eight characters “not allowed” for the phrase “significant lymph node enlargement is not found” in the first line of phrase column 510 (operation column 520 When the second line is applied, as in the second line of the phrase column 510, the first character string (search key) “significant lymph node enlargement” can be converted. Since the editing here is a deletion editing, the cost is 0 and the distance is also 0 after all (see the second row in the cost column 530 and the editing distance column 540 in the example of FIG. 5).

次に、フレーズデータ格納モジュール130内にある“顕著なリンパ節腫大はありません。”という第2の文字列(フレーズ)であって、第1の文字列(検索キー)である“有意なリンパ節の腫大は”の場合、第1の文字列から第2の文字列への距離は、図6の例に示すように3となる。図6は、距離の算出例を示す説明図である。編集距離算出例600は、フレーズ欄610、操作欄620、コスト欄630、編集距離欄640を有している。編集距離算出例600の第1行は第2の文字列、第5行は第1の文字列のことを示している。つまり、第1行から第5行への編集を示している。
フレーズ欄610の第1行にある“顕著なリンパ節腫大はありません。”というフレーズに対して、“ありません。”の6文字を削除するという編集(操作欄620の2行目)を施すと、フレーズ欄610の第2行のように“顕著なリンパ節腫大は”に変換でき、ここでの編集は削除編集であるので、コストは0となり、距離も0である(図6の例のコスト欄630、編集距離欄640の第2行参照)。
次に、フレーズ欄610の第2行にある“顕著なリンパ節腫大は”というフレーズに対して、“顕著”の2文字を削除するという編集(操作欄620の3行目)を施すと、フレーズ欄610の第3行のように“なリンパ節腫大は”に変換でき、ここでの編集は削除編集であるので、コストは0となり、距離も0である(図6の例のコスト欄630、編集距離欄640の第3行参照)。
次に、フレーズ欄610の第3行にある“なリンパ節腫大は”というフレーズに対して、“有意”の2文字を挿入するという編集(操作欄620の4行目)を施すと、フレーズ欄610の第4行のように“有意なリンパ節腫大は”に変換でき、ここでの編集は挿入編集であるので、コストは2となり、距離も2である(図6の例のコスト欄630、編集距離欄640の第4行参照)。
次に、フレーズ欄610の第4行にある“有意なリンパ節腫大は”というフレーズに対して、“の”の1文字を挿入するという編集(操作欄620の5行目)を施すと、フレーズ欄610の第5行のように第1の文字列(検索キー)である“有意なリンパ節の腫大は”に変換できる。ここでの編集は挿入編集であるので、コストは1となり、距離は3となる(図6の例のコスト欄630、編集距離欄640の第5行参照)。距離は、その編集でのコストと前回までの距離との和である。したがって、編集距離算出例600の5行目では、コスト欄630の第5行の1と編集距離欄640の第4行の2を加算して、編集距離欄640の第5行の3となる。
なお、編集の順番は、編集距離算出例600以外の順番であってもよい。編集距離算出例600の第2行から第4行までは、編集の途中経過を示している。
Next, there is a second character string (phrase) in the phrase data storage module 130 that says “No significant lymphadenopathy”, and the first character string (search key) “significant lymph nodes”. When the swelling of the node is "the distance from the first character string to the second character string is 3, as shown in the example of FIG. FIG. 6 is an explanatory diagram illustrating an example of calculating the distance. The edit distance calculation example 600 includes a phrase field 610, an operation field 620, a cost field 630, and an edit distance field 640. In the edit distance calculation example 600, the first line indicates the second character string, and the fifth line indicates the first character string. That is, editing from the first line to the fifth line is shown.
If the phrase “No significant lymphadenopathy” in the first line of the phrase column 610 is edited (the second line in the operation column 620) to delete the six characters “No”. As shown in the second line of the phrase column 610, the “significant lymphadenopathy” can be converted into “edit”, and since the editing here is a deletion editing, the cost is 0 and the distance is also 0 (example in FIG. 6). Cost column 630, edit distance column 640, second line).
Next, if the phrase “significant lymphadenopathy is” in the second line of the phrase column 610 is edited to delete the two characters “significant” (third line of the operation column 620) As shown in the third line of the phrase column 610, the “large lymphadenopathy” can be converted into “deletion editing”, so the cost is 0 and the distance is also 0 (in the example of FIG. 6). (Refer to the third line of the cost column 630 and the edit distance column 640).
Next, for the phrase “na lymphadenopathy is” in the third line of the phrase column 610, editing (fourth line in the operation column 620) to insert two characters “significant” is performed. As in the fourth line of the phrase column 610, “significant lymphadenopathy” can be converted into “edit”, and since the editing here is an insertion editing, the cost is 2 and the distance is 2 (in the example of FIG. 6). (Refer to the fourth line of the cost column 630 and the edit distance column 640).
Next, if the phrase “significant lymphadenopathy is” in the fourth line of the phrase column 610 is edited (the fifth line in the operation column 620) to insert one character “no”. As in the fifth line of the phrase column 610, the first character string (search key) “significant lymph node enlargement” can be converted. Since the editing here is insertion editing, the cost is 1 and the distance is 3 (see the cost column 630 and the fifth line of the editing distance column 640 in the example of FIG. 6). The distance is the sum of the cost of editing and the distance to the previous time. Therefore, in the fifth line of the edit distance calculation example 600, 1 in the fifth line of the cost column 630 and 2 in the fourth line of the edit distance column 640 are added to become 3 in the fifth line of the edit distance column 640. .
Note that the editing order may be an order other than the editing distance calculation example 600. The second to fourth lines of the edit distance calculation example 600 indicate the progress of editing.

補完候補フレーズ取得モジュール220は、フレーズデータ格納モジュール130内の第2の文字列全てに対して、前述の距離の算出を行ってもよいし、フレーズデータ格納モジュール130内から既存の技術を用いて第1の文字列と類似している第2の文字列を抽出し、その抽出した第2の文字列に対して、前述の距離の算出を行ってもよい。
その結果、フレーズ・重要度・編集距離対応テーブル800を作成する。図8は、フレーズ・重要度・編集距離対応テーブル800のデータ構造例を示す説明図である。フレーズ・重要度・編集距離対応テーブル800は、フレーズ欄810、重要度欄820、編集距離欄830を有している。フレーズ・重要度・編集距離対応テーブル800は、フレーズデータ格納テーブル700に編集距離欄830を加えたものである。つまり、フレーズ欄810は、フレーズデータ格納テーブル700のフレーズ欄710に対応し、重要度欄820は、フレーズデータ格納テーブル700の重要度欄720に対応する。編集距離欄830は、フレーズ欄810内の第2の文字列に対して前述のように算出した距離を記憶している。
The complementary candidate phrase acquisition module 220 may calculate the above-described distance for all the second character strings in the phrase data storage module 130, or may use existing technology from within the phrase data storage module 130. A second character string similar to the first character string may be extracted, and the above-described distance calculation may be performed on the extracted second character string.
As a result, a phrase / importance / edit distance correspondence table 800 is created. FIG. 8 is an explanatory diagram showing an example of the data structure of the phrase / importance / edit distance correspondence table 800. The phrase / importance / edit distance correspondence table 800 includes a phrase field 810, an importance field 820, and an edit distance field 830. The phrase / importance / edit distance correspondence table 800 is obtained by adding an edit distance column 830 to the phrase data storage table 700. That is, the phrase column 810 corresponds to the phrase column 710 of the phrase data storage table 700, and the importance column 820 corresponds to the importance column 720 of the phrase data storage table 700. The edit distance column 830 stores the distance calculated as described above for the second character string in the phrase column 810.

次に、各第2の文字列に対してのスコア算出方法について説明する。
図9は、スコア算出テーブル900のデータ構造例を示す説明図である。スコア算出テーブル900は、フレーズ欄910、重要度欄920、編集距離欄930、スコア欄940を有している。スコア算出テーブル900は、フレーズ・重要度・編集距離対応テーブル800にスコア欄940を加えたものである。つまり、フレーズ欄910は、フレーズ・重要度・編集距離対応テーブル800のフレーズ欄810に対応し、重要度欄920は、フレーズ・重要度・編集距離対応テーブル800の重要度欄820に対応し、編集距離欄930は、フレーズ・重要度・編集距離対応テーブル800の編集距離欄830に対応する。スコア欄940は、フレーズ欄910内の第2の文字列に対して前述の(2)式によって算出したスコアを記憶している。例えば、第2行のスコア(25)は、55−10×3の計算結果である。
次に、スコアが高い順に並べ替え(降順でのソート)を行う。並べ替えを行った結果を図10の例に示す。図10は、スコア算出テーブル1000のデータ構造例を示す説明図である。スコア算出テーブル1000は、フレーズ欄1010、重要度欄1020、編集距離欄1030、スコア欄1040を有している。スコアの高い順に並べ替えられている。
そして、このスコア算出テーブル1000から上位にある第2の文字列を予め定められた数だけ抽出する。この第2の文字列が、操作者によって選択対象となるものであって、第1の文字列を補完するために用いる文字列となる。
Next, a score calculation method for each second character string will be described.
FIG. 9 is an explanatory diagram showing a data structure example of the score calculation table 900. The score calculation table 900 includes a phrase field 910, an importance field 920, an edit distance field 930, and a score field 940. The score calculation table 900 is obtained by adding a score column 940 to the phrase / importance / edit distance correspondence table 800. That is, the phrase column 910 corresponds to the phrase column 810 of the phrase / importance / edit distance correspondence table 800, the importance column 920 corresponds to the importance column 820 of the phrase / importance / edit distance correspondence table 800, The edit distance column 930 corresponds to the edit distance column 830 of the phrase / importance / edit distance correspondence table 800. The score column 940 stores the score calculated by the above-described equation (2) for the second character string in the phrase column 910. For example, the score (25) in the second row is a calculation result of 55-10 × 3.
Next, rearrangement is performed in descending order (sorting in descending order). The result of rearrangement is shown in the example of FIG. FIG. 10 is an explanatory diagram showing an example of the data structure of the score calculation table 1000. The score calculation table 1000 includes a phrase column 1010, an importance column 1020, an edit distance column 1030, and a score column 1040. They are sorted in descending order of score.
Then, a predetermined number of second character strings at the top are extracted from the score calculation table 1000. This second character string is to be selected by the operator, and is a character string used to complement the first character string.

補完候補フレーズ表示モジュール230は、補完候補フレーズ取得モジュール220、補完モジュール240と接続されている。補完候補フレーズ表示モジュール230は、補完候補フレーズ取得モジュール220によって取得された第2の文字列又はその第2の文字列の一部を表示する。その表示は、表示されている第1の文字列の近辺に表示するようにしてもよい。
また、補完候補フレーズ表示モジュール230は、第2の文字列の一部から第1の文字列へ又は第1の文字列から第2の文字列の一部へ編集するための距離とその第2の文字列の一部以外の部分の文字列の長さに基づいて、補完に用いる文字列として表示する文字列である第2の文字列の一部を生成するようにしてもよい。
補完候補フレーズ取得モジュール220によって選択された第2の文字列を先頭からの文字列とそれ以外の文字列の2つの部分に分ける。つまり、第2の文字列を前半部分と後半部分の2つに分割する。ここでは、前半の部分を「カーソルより前のフレーズ」といい、それ以外の後半の部分を「補完フレーズ」という。
The complement candidate phrase display module 230 is connected to the complement candidate phrase acquisition module 220 and the complement module 240. The complement candidate phrase display module 230 displays the second character string acquired by the complement candidate phrase acquisition module 220 or a part of the second character string. The display may be displayed in the vicinity of the displayed first character string.
The complement candidate phrase display module 230 also edits the distance from the part of the second character string to the first character string or the distance from the first character string to the part of the second character string and the second character string. A part of the second character string, which is a character string to be displayed as a character string used for complementation, may be generated based on the length of the character string in a part other than a part of the character string.
The second character string selected by the complement candidate phrase acquisition module 220 is divided into two parts: a character string from the beginning and a character string other than that. That is, the second character string is divided into two parts, a first half part and a second half part. Here, the first half is called “phrase before the cursor”, and the other latter half is called “complement phrase”.

カーソルより前のフレーズから第1の文字列(検索キー)への距離が最小であって、かつ補完フレーズが最長のものを、補完候補フレーズ表示モジュール230が表示する補完フレーズとする。もちろんのことながら、第1の文字列(検索キー)からカーソルより前のフレーズへの距離を用いるようにしてもよい。
この処理について、図11を用いて説明する。図11は、補完フレーズの抽出例を示す説明図である。補完フレーズ抽出例1100は、No.欄1110、カーソルより前のフレーズ欄1120、補完フレーズ欄1130、カーソルより前のフレーズから検索キーへの編集距離欄1140を有している。カーソルより前のフレーズから検索キーへの編集距離欄1140は、第2の文字列を前半部分から第1の文字列への距離を記憶している。第1行から第8行までは、編集が削除編集のみであるので、距離は0である。第9行は“は”(1文字)の挿入編集が必要であるので、距離は1となり、第10行は“大は”(2文字)の挿入編集が必要であるので、距離は2となる。したがって、スコア欄1040の値が最小で、編集距離欄1030の文字列長が最長のものは、第8行の“有意なリンパ節の腫大は”を選択することとなる。
The complement phrase displayed by the complement candidate phrase display module 230 is the one with the shortest distance from the phrase before the cursor to the first character string (search key) and the longest complement phrase. Of course, the distance from the first character string (search key) to the phrase before the cursor may be used.
This process will be described with reference to FIG. FIG. 11 is an explanatory diagram illustrating an example of extraction of a complementary phrase. The complementary phrase extraction example 1100 is No. A column 1110, a phrase column 1120 before the cursor, a complementary phrase column 1130, and an edit distance column 1140 from the phrase before the cursor to the search key are provided. The edit distance column 1140 from the phrase before the cursor to the search key stores the distance from the first half of the second character string to the first character string. From the first line to the eighth line, the distance is 0 because editing is only deletion editing. The 9th line requires insertion editing of “ha” (1 character), so the distance is 1, and the 10th line requires insertion editing of “large” (2 characters), so the distance is 2. Become. Therefore, when the value in the score column 1040 is the smallest and the character string length in the edit distance column 1030 is the longest, “significant enlargement of lymph node” on the eighth line is selected.

他の例について、図12を用いて説明する。図12は、補完フレーズの抽出例を示す説明図である。補完フレーズ抽出例1200は、No.欄1210、カーソルより前のフレーズ欄1220、補完フレーズ欄1230、カーソルより前のフレーズから検索キーへの編集距離欄1240を有している。カーソルより前のフレーズから検索キーへの編集距離欄1240は、第2の文字列を前半部分から第1の文字列への距離を記憶している。第1行から第14行までは、“特に”を削除し、“の”を挿入し、“は”を挿入し、“などの異常は指摘できません”等を削除する編集が必要であるので、距離は2である。第15行はさらに“大”(1文字)の挿入編集が必要であるので、距離は3となり、第16行は第15行に対してさらに“腫”(1文字)の挿入編集が必要であるので、距離は4となる。したがって、カーソルより前のフレーズから検索キーへの編集距離欄1240の値が最小で、補完フレーズ欄1230の文字列長が最長のものは、第14行の“特に有意なリンパ節腫大”を選択することとなる。   Another example will be described with reference to FIG. FIG. 12 is an explanatory diagram illustrating an example of extraction of a complementary phrase. The complementary phrase extraction example 1200 is No. A column 1210, a phrase column 1220 before the cursor, a complement phrase column 1230, and an edit distance column 1240 from the phrase before the cursor to the search key are provided. The edit distance column 1240 from the phrase before the cursor to the search key stores the distance from the first half of the second character string to the first character string. From the first line to the 14th line, it is necessary to edit to delete “especially”, insert “no”, insert “ha”, “cannot point out abnormalities such as” etc. The distance is 2. The 15th line requires further “large” (1 character) insertion editing, so the distance is 3, and the 16th line requires further “tumor” (1 character) insertion editing. Because there is, the distance is 4. Therefore, the value of the edit distance column 1240 from the phrase before the cursor to the search key is the smallest, and the longest character string length of the complementary phrase column 1230 is “particularly significant lymphadenopathy” in the 14th line. Will be selected.

また、補完候補フレーズ表示モジュール230は、補完候補フレーズ取得モジュール220によって選択された第2の文字列を、その一部ではなく、第2の文字列全体を表示するようにしてもよい。特に、第2の文字列から第1の文字列に編集する場合に、第2の文字列の先頭の文字から編集が必要であるか否かを判断し、編集が必要である場合に、第2の文字列全体を表示するようにしてもよい。例えば、図12の例に示す補完フレーズ抽出例1200では、補完フレーズ欄1230内のフレーズのみならず、カーソルより前のフレーズ欄1220内のフレーズも表示することになる。   Further, the complement candidate phrase display module 230 may display the entire second character string instead of a part of the second character string selected by the complement candidate phrase acquisition module 220. In particular, when editing from the second character string to the first character string, it is determined whether editing is necessary from the first character of the second character string. The entire character string 2 may be displayed. For example, in the complementary phrase extraction example 1200 shown in the example of FIG. 12, not only the phrase in the complementary phrase column 1230 but also the phrase in the phrase column 1220 before the cursor is displayed.

図13は、補完フレーズの表示例を示す説明図である。
補完候補フレーズ表示モジュール230は、既打込文字列表示領域400に対して、カーソル410の近辺に補完フレーズ候補群表示領域1310を表示する。例えば、前述のように、最後に文字が入力されてから100ms経過したときに、カーソル410の下方に補完フレーズ候補群表示領域1310を表示する。補完フレーズ候補群表示領域1310は、補完フレーズ1312、1314、1316を有している。補完フレーズ1312、1314、1316は、補完候補フレーズ取得モジュール220によって選択された第2の文字列であって、前述の補完候補フレーズ表示モジュール230の処理によって選択されたフレーズ(例えば、第2の文字列の後半部分の文字列)である。
FIG. 13 is an explanatory diagram illustrating a display example of a complementary phrase.
The complementary candidate phrase display module 230 displays a complementary phrase candidate group display area 1310 in the vicinity of the cursor 410 with respect to the already entered character string display area 400. For example, as described above, the complementary phrase candidate group display area 1310 is displayed below the cursor 410 when 100 ms has elapsed since the last character input. The complementary phrase candidate group display area 1310 includes complementary phrases 1312, 1314, and 1316. The complementary phrases 1312, 1314, and 1316 are second character strings selected by the candidate complement phrase acquisition module 220, and are phrases (for example, second characters) selected by the processing of the candidate complement phrase display module 230 described above. Character string in the second half of the column).

図14は、図13の状態から、マウスカーソルを補完フレーズ1312に移動した場合(又はキーボード内の下矢印キーを押した場合、以下、同様)の例を示している。補完フレーズ1312が操作者によって選択されたならば、カーソル410の後に補完フレーズ1312に表示されている文字列を追加する編集がなされることを示している。   FIG. 14 shows an example when the mouse cursor is moved to the complementary phrase 1312 from the state of FIG. 13 (or when the down arrow key in the keyboard is pressed, the same applies hereinafter). If the complement phrase 1312 is selected by the operator, it indicates that editing is performed to add the character string displayed in the complement phrase 1312 after the cursor 410.

図15は、図13の状態から、マウスカーソルを補完フレーズ1314に移動した場合の例を示している。補完フレーズ1314が操作者によって選択されたならば、黒白を反転された領域である置換元文字列1520の位置から補完フレーズ1314に表示されている文字列を置換する編集がなされることを示している。これは、前述の第2の文字列から第1の文字列へ編集する場合の距離を算出するために、その編集が行われる第1の文字列内の位置を抽出しているが、その編集の最初の位置(先頭に近い位置)からカーソル410までの間を置換対象領域の文字列であるとして、他の文字列とは区別できるように(例えば、図15の例のように黒白反転する)表示する。つまり、図15の例では、補完フレーズ1314が操作者によって選択された場合、既打込文字列表示領域400内の“の腫大は”を“腫大や胸水貯留は認められません。”に置換する。   FIG. 15 shows an example when the mouse cursor is moved to the complementary phrase 1314 from the state of FIG. If the supplemental phrase 1314 is selected by the operator, this indicates that editing is performed to replace the character string displayed in the supplemental phrase 1314 from the position of the replacement source character string 1520, which is a black and white inverted area. Yes. This is because, in order to calculate the distance when editing from the second character string to the first character string, the position in the first character string where the editing is performed is extracted. The character string in the replacement target area is defined as the character string in the replacement target area from the first position (position close to the top) to the cursor 410 (for example, black and white is inverted as in the example of FIG. 15). )indicate. In other words, in the example of FIG. 15, when the complementary phrase 1314 is selected by the operator, “no swelling” in the already-filled character string display area 400 is “no swelling or pleural effusion is recognized.” Replace with.

図16は、図13の状態から、マウスカーソルを補完フレーズ1316に移動した場合の例を示している。補完フレーズ1316が操作者によって選択されたならば、黒白を反転された領域である置換元文字列1620の位置から補完フレーズ1316に表示されている文字列を置換する編集がなされることを示している。これは、前述の第2の文字列から第1の文字列へ編集する場合の距離を算出するために、その編集が行われる第1の文字列内の位置を抽出しているが、その編集の最初の位置(先頭に近い位置)からカーソル410までの間を置換対象領域の文字列であるとして、他の文字列とは区別できるように(例えば、図16の例のように黒白反転する)表示する。
図17は、補完した後の表示例を示す説明図である。つまり、図16の例の状態から、補完フレーズ1316が操作者によって選択された場合を示している。既打込文字列表示領域400内の“有意なリンパ節の腫大は”が“特に有意なリンパ節腫大などの異常は指摘できません。”に置換されている。
FIG. 16 shows an example when the mouse cursor is moved to the complementary phrase 1316 from the state of FIG. If the supplemental phrase 1316 is selected by the operator, it indicates that editing is performed to replace the character string displayed in the supplemental phrase 1316 from the position of the replacement source character string 1620 that is an area where black and white are inverted. Yes. This is because, in order to calculate the distance when editing from the second character string to the first character string, the position in the first character string where the editing is performed is extracted. The area from the first position (position close to the beginning) to the cursor 410 is assumed to be the character string of the replacement target area, so that it can be distinguished from other character strings (for example, black and white are inverted as in the example of FIG. 16). )indicate.
FIG. 17 is an explanatory diagram illustrating a display example after complementation. That is, the supplemental phrase 1316 is selected by the operator from the state of the example of FIG. “Significant lymph node enlargement” in the already-printed character string display area 400 is replaced with “Cannot point out abnormalities such as particularly significant lymph node enlargement”.

図18は、補完フレーズの表示例を示す説明図である。
補完候補フレーズ表示モジュール230は、既打込文字列表示領域400に対して、カーソル410の近辺に補完フレーズ候補群表示領域1810を表示する。例えば、前述のように、最後に文字が入力されてから100ms経過したときに、カーソル410の下方に補完フレーズ候補群表示領域1810を表示する。補完フレーズ候補群表示領域1810は、補完フレーズ1812、1814、1816を有している。補完フレーズ1812、1814、1816は、補完候補フレーズ取得モジュール220によって選択された第2の文字列であって、前述の補完候補フレーズ表示モジュール230の処理によって選択されたフレーズ(例えば、第2の文字列の後半部分の文字列)である。
図18に示す例は、前述の第2の文字列から第1の文字列へ編集する場合の距離を算出するために、その編集が行われる第1の文字列内の位置を抽出しているが、その編集の最後の位置(カーソル410に近い位置)からカーソル410までの間を置換対象領域の文字列であるとして、他の文字列とは区別できるように(例えば、図18の例のように黒白反転する)表示する。
図19は、補完した後の表示例を示す説明図である。つまり、図18の例の状態から、補完フレーズ1816が操作者によって選択された場合を示している。既打込文字列表示領域400内の“の腫大は”が“腫大などの異常は指摘できません。”に置換されている。
FIG. 18 is an explanatory diagram showing a display example of a complementary phrase.
The complementary candidate phrase display module 230 displays a complementary phrase candidate group display area 1810 in the vicinity of the cursor 410 with respect to the already entered character string display area 400. For example, as described above, the complementary phrase candidate group display area 1810 is displayed below the cursor 410 when 100 ms has elapsed since the last character input. The complementary phrase candidate group display area 1810 includes complementary phrases 1812, 1814, and 1816. The complementary phrases 1812, 1814, and 1816 are the second character strings selected by the candidate complement phrase acquisition module 220, and are phrases (for example, second characters) selected by the processing of the candidate complement phrase display module 230 described above. Character string in the second half of the column).
In the example shown in FIG. 18, in order to calculate the distance when editing from the second character string to the first character string, the position in the first character string where the editing is performed is extracted. Is assumed to be a character string in the replacement target area from the last position of the editing (position close to the cursor 410) to the cursor 410 (for example, in the example of FIG. 18). Display in black and white.
FIG. 19 is an explanatory diagram illustrating a display example after complementation. That is, the supplemental phrase 1816 is selected by the operator from the state of the example of FIG. In the already-printed character string display area 400, “no swelling” is replaced with “an abnormality such as swelling cannot be pointed out”.

補完モジュール240は、補完候補フレーズ表示モジュール230と接続されている。補完モジュール240は、補完候補フレーズ表示モジュール230によって表示された第2の文字列又はその第2の文字列の一部を、操作者の選択操作によって選択し、その選択された第2の文字列又はその第2の文字列の一部に基づいて、第1の文字列を補完する。つまり、図13から図19の例を用いて説明した編集を行うものである。つまり、ここでの補完は、現在のカーソルの位置から文字列を単に追加する補完だけではなく、補完するフレーズに合わせて既に打ち込まれている文字列の一部又は全部を置換することも含めた補完を行うこともある。   The complement module 240 is connected to the complement candidate phrase display module 230. The complement module 240 selects the second character string displayed by the complement candidate phrase display module 230 or a part of the second character string by the selection operation of the operator, and the selected second character string. Alternatively, the first character string is complemented based on a part of the second character string. That is, the editing described with reference to the examples of FIGS. 13 to 19 is performed. In other words, the completion here includes not only the addition of a character string from the current cursor position, but also the replacement of part or all of the already typed character string according to the phrase to be completed. Complementation may be performed.

図3は、本実施の形態による処理例を示すフローチャートである。
ステップS302では、補完候補フレーズ取得モジュール220は、フレーズデータ格納モジュール130からフレーズ(第2の文字列)を取得する。
ステップS304では、補完候補フレーズ取得モジュール220は、フレーズ(第2の文字列)は検索キー(第1の文字列)と同じであるか否かを判断し、同じである場合はステップS308へ進み、それ以外の場合はステップS306へ進む。
ステップS306では、補完候補フレーズ取得モジュール220は、フレーズ(第2の文字列)から検索キー(第1の文字列)への編集を行う。
ステップS308では、補完候補フレーズ取得モジュール220は、編集におけるスコアを算出する。
ステップS310では、補完候補フレーズ取得モジュール220は、スコアに対してソートを行う。上位から予め定められた数のフレーズ(第2の文字列)を選択する。
ステップS312では、補完候補フレーズ表示モジュール230は、表示するフレーズ(第2の文字列又は第2の文字列の一部)を生成する。
ステップS314では、補完候補フレーズ表示モジュール230は、生成したフレーズ(第2の文字列又は第2の文字列の一部)を表示する。
ステップS316では、補完候補フレーズ表示モジュール230は、操作者の選択操作によってフレーズ(第2の文字列又は第2の文字列の一部)を選択する。
ステップS318では、補完モジュール240は、検索キー(第1の文字列)をステップS316で選択したフレーズ(第2の文字列又は第2の文字列の一部)で補完する。
FIG. 3 is a flowchart showing an example of processing according to this embodiment.
In step S <b> 302, the complement candidate phrase acquisition module 220 acquires a phrase (second character string) from the phrase data storage module 130.
In step S304, the complementary candidate phrase acquisition module 220 determines whether or not the phrase (second character string) is the same as the search key (first character string). If they are the same, the process proceeds to step S308. In other cases, the process proceeds to step S306.
In step S306, the complement candidate phrase acquisition module 220 performs editing from the phrase (second character string) to the search key (first character string).
In step S308, the complementary candidate phrase acquisition module 220 calculates a score for editing.
In step S310, the complement candidate phrase acquisition module 220 sorts the scores. A predetermined number of phrases (second character string) are selected from the top.
In step S312, the complement candidate phrase display module 230 generates a phrase to be displayed (second character string or part of the second character string).
In step S314, the supplementary candidate phrase display module 230 displays the generated phrase (second character string or part of the second character string).
In step S316, the complement candidate phrase display module 230 selects a phrase (second character string or part of the second character string) by the operator's selection operation.
In step S318, the complement module 240 supplements the search key (first character string) with the phrase (second character string or part of the second character string) selected in step S316.

なお、本実施の形態(図1又は図2に例示する情報処理装置)としてのプログラムが実行されるコンピュータのハードウェア構成は、図20に例示するように、一般的なコンピュータであり、具体的にはパーソナルコンピュータ、サーバーとなり得るコンピュータ等である。つまり、具体例として、処理部(演算部)としてCPU2001を用い、記憶装置としてRAM2002、ROM2003、HD2004を用いている。HD2004として、例えばハードディスクを用いてもよい。フレーズ抽出モジュール120、補完候補フレーズ取得モジュール220、補完候補フレーズ表示モジュール230、補完モジュール240等のプログラムを実行するCPU2001と、そのプログラムやデータを記憶するRAM2002と、本コンピュータを起動するためのプログラム等が格納されているROM2003と、補助記憶装置であるHD2004と、キーボード、マウス、タッチパネル等に対する利用者の操作に基づいてデータを受け付ける受付装置2006と、CRT、液晶ディスプレイ等の出力装置2005と、ネットワークインタフェースカード等の通信ネットワークと接続するための通信回線インタフェース2007、そして、それらをつないでデータのやりとりをするためのバス2008により構成されている。これらのコンピュータが複数台互いにネットワークによって接続されていてもよい。   Note that the hardware configuration of a computer that executes a program as the present embodiment (the information processing apparatus illustrated in FIG. 1 or FIG. 2) is a general computer as illustrated in FIG. These include personal computers and computers that can serve as servers. That is, as a specific example, the CPU 2001 is used as a processing unit (calculation unit), and the RAM 2002, ROM 2003, and HD 2004 are used as storage devices. For example, a hard disk may be used as the HD 2004. CPU 2001 for executing programs such as phrase extraction module 120, supplement candidate phrase acquisition module 220, complement candidate phrase display module 230, complement module 240, RAM 2002 for storing the program and data, a program for starting the computer, and the like ROM 2003, auxiliary storage device HD 2004, accepting device 2006 that accepts data based on user operations on a keyboard, mouse, touch panel, etc., output device 2005 such as a CRT, liquid crystal display, etc., network A communication line interface 2007 for connecting to a communication network such as an interface card, and a bus 2008 for connecting them to exchange data. A plurality of these computers may be connected to each other via a network.

前述の実施の形態のうち、コンピュータ・プログラムによるものについては、本ハードウェア構成のシステムにソフトウェアであるコンピュータ・プログラムを読み込ませ、ソフトウェアとハードウェア資源とが協働して、前述の実施の形態が実現される。
なお、図20に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図20に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えばASIC等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図20に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、情報家電、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
Among the above-described embodiments, the computer program is a computer program that reads the computer program, which is software, in the hardware configuration system, and the software and hardware resources cooperate with each other. Is realized.
Note that the hardware configuration illustrated in FIG. 20 illustrates one configuration example, and the present embodiment is not limited to the configuration illustrated in FIG. 20, and is a configuration capable of executing the modules described in the present embodiment. I just need it. For example, some modules may be configured by dedicated hardware (for example, ASIC), and some modules may be in an external system and connected via a communication line. A plurality of systems shown in FIG. 5 may be connected to each other via communication lines so as to cooperate with each other. In particular, in addition to personal computers, information appliances, copiers, fax machines, scanners, printers, and multifunction machines (image processing apparatuses having two or more functions of scanners, printers, copiers, fax machines, etc.) Etc. may be incorporated.

前述の実施の形態では、フレーズデータ格納モジュール130はフレーズ(第2の文字列)の重要度をそのフレーズと対応させて記憶している例を主に示したが、フレーズデータ格納モジュール130は重要度を記憶せずにフレーズだけを記憶しているようにしてもよい。その場合、補完候補フレーズ取得モジュール220が行うスコアの算出は、(1)式を例示したが、
スコア = −距離
としてもよい。なお、
スコア = 距離
としてもよいが、その場合は、フレーズの並べ替えにおいて降順ではなく、昇順に並べ替えを行うようにして、スコアが少ないものから予め定められた数の第2の文字列を選択するようにすればよい。
In the above-described embodiment, the example in which the phrase data storage module 130 stores the importance of the phrase (second character string) in association with the phrase is mainly shown. However, the phrase data storage module 130 is important. Only the phrase may be stored without storing the degree. In that case, the calculation of the score performed by the complement candidate phrase acquisition module 220 has exemplified the formula (1).
Score =-distance may be used. In addition,
Score = distance may be used, but in that case, a predetermined number of second character strings are selected from those having a low score by rearranging phrases in ascending order instead of descending order. What should I do?

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
The program described above may be provided by being stored in a recording medium, or the program may be provided by communication means. In that case, for example, the above-described program may be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standard “DVD + R, DVD + RW, etc.”, compact disc (CD), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), Blu-ray disc ( Blu-ray Disc (registered trademark), magneto-optical disk (MO), flexible disk (FD), magnetic tape, hard disk, read-only memory (ROM), electrically erasable and rewritable read-only memory (EEPROM (registered trademark)) )), Flash memory, Random access memory (RAM) SD (Secure Digital) memory card and the like.
The program or a part of the program may be recorded on the recording medium for storage or distribution. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, etc., or wireless communication It may be transmitted using a transmission medium such as a network or a combination of these, or may be carried on a carrier wave.
Furthermore, the program may be a part of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media. Further, it may be recorded in any manner as long as it can be restored, such as compression or encryption.

110…文書格納モジュール
120…フレーズ抽出モジュール
130…フレーズデータ格納モジュール
210…テキスト受付モジュール
220…補完候補フレーズ取得モジュール
230…補完候補フレーズ表示モジュール
240…補完モジュール
DESCRIPTION OF SYMBOLS 110 ... Document storage module 120 ... Phrase extraction module 130 ... Phrase data storage module 210 ... Text reception module 220 ... Complement candidate phrase acquisition module 230 ... Complement candidate phrase display module 240 ... Complement module

Claims (4)

第1の文字列を受け付ける受付手段と、
第2の文字列を記憶している記憶手段から、前記受付手段によって受け付けられた第1の文字列を補完するために用いる文字列の候補として、該第2の文字列から該第1の文字列へ又は該第1の文字列から該第2の文字列へ編集するための距離に基づいて算出した点数を用いて、該第2の文字列を取得する取得手段と、
前記取得手段によって取得された第2の文字列又は該第2の文字列の一部を表示する表示手段と、
前記表示手段によって表示された第2の文字列又は該第2の文字列の一部を、操作者の選択操作によって選択し、該選択された第2の文字列又は該第2の文字列の一部に基づいて、前記第1の文字列を補完する補完手段
を具備し、
前記表示手段は、前記第2の文字列の一部から前記第1の文字列へ又は該第1の文字列から該第2の文字列の一部へ編集するための距離と第2の文字列の一部以外の部分の文字列の長さに基づいて、補完に用いる文字列として表示する文字列である該第2の文字列の一部を生成する
ことを特徴とする情報処理装置。
Accepting means for accepting the first character string;
The first character from the second character string is used as a candidate for the character string used to complement the first character string received by the receiving means from the storage means storing the second character string. An acquisition means for acquiring the second character string using a score calculated based on a distance to edit to the column or from the first character string to the second character string;
Display means for displaying the second character string acquired by the acquiring means or a part of the second character string;
The second character string displayed by the display means or a part of the second character string is selected by an operator's selection operation, and the selected second character string or the second character string is selected. Complementing means for complementing the first character string based on a part thereof ,
The display means includes a distance and a second character for editing from a part of the second character string to the first character string or from the first character string to a part of the second character string. An information processing apparatus that generates a part of the second character string that is a character string to be displayed as a character string used for complementation based on a length of a character string of a part other than a part of the string .
前記記憶手段は、第2の文字列と該第2の文字列に関する数値を対応させて記憶しており、
前記取得手段は、前記記憶手段から、前記受付手段によって受け付けられた第1の文字列を補完するために用いる文字列の候補として、前記第2の文字列から該第1の文字列へ又は該第1の文字列から該第2の文字列へ編集するための距離と該第2の文字列に関する数値に基づいて算出した点数を用いて、該第2の文字列を取得し、
前記第2の文字列に関する数値は、該第2の文字列が、第2の文字列を抽出対象とした文書中で出現している頻度を示す数値であり、
前記取得手段は、前記第2の文字列に関する数値から前記距離と重みを乗算した値を減算して前記点数を算出し、該点数が高い順に予め定められた件数の第2の文字列を取得する
ことを特徴とする請求項1に記載の情報処理装置。
The storage means stores a second character string and a numerical value related to the second character string in association with each other,
The acquisition means is a candidate for a character string used for complementing the first character string received by the receiving means from the storage means, from the second character string to the first character string, or Using the distance calculated for editing from the first character string to the second character string and the score calculated based on the numerical value related to the second character string, the second character string is obtained ,
The numerical value related to the second character string is a numerical value indicating the frequency with which the second character string appears in a document in which the second character string is extracted,
The acquisition unit calculates the score by subtracting a value obtained by multiplying the distance and the weight from a numerical value related to the second character string, and acquires a predetermined number of second character strings in descending order of the score. the information processing apparatus according to claim 1, characterized in that.
前記取得手段は、距離が大であるほど選択されにくくなるようにしており、距離として、第2の文字列を第1の文字列にするための編集であって、挿入編集の距離は、削除編集の距離より大である、又は、第1の文字列を第2の文字列にするための編集であって、削除編集の距離は、挿入編集の距離より大である
ことを特徴とする請求項1又は2に記載の情報処理装置。
The acquisition means is configured such that the larger the distance is, the less likely it is to be selected. As the distance, editing is performed to change the second character string to the first character string, and the insertion editing distance is deleted. The edit distance is greater than the edit distance, or is an edit for changing the first character string to the second character string, and the delete edit distance is greater than the insert edit distance. Item 3. The information processing apparatus according to item 1 or 2.
コンピュータを、
第1の文字列を受け付ける受付手段と、
第2の文字列を記憶している記憶手段から、前記受付手段によって受け付けられた第1の文字列を補完するために用いる文字列の候補として、該第2の文字列から該第1の文字列へ又は該第1の文字列から該第2の文字列へ編集するための距離に基づいて算出した点数を用いて、該第2の文字列を取得する取得手段と、
前記取得手段によって取得された第2の文字列又は該第2の文字列の一部を表示する表示手段と、
前記表示手段によって表示された第2の文字列又は該第2の文字列の一部を、操作者の選択操作によって選択し、該選択された第2の文字列又は該第2の文字列の一部に基づいて、前記第1の文字列を補完する補完手段
として機能させ
前記表示手段は、前記第2の文字列の一部から前記第1の文字列へ又は該第1の文字列から該第2の文字列の一部へ編集するための距離と第2の文字列の一部以外の部分の文字列の長さに基づいて、補完に用いる文字列として表示する文字列である該第2の文字列の一部を生成する
ことを特徴とする情報処理プログラム。
Computer
Accepting means for accepting the first character string;
The first character from the second character string is used as a candidate for the character string used to complement the first character string received by the receiving means from the storage means storing the second character string. An acquisition means for acquiring the second character string using a score calculated based on a distance to edit to the column or from the first character string to the second character string;
Display means for displaying the second character string acquired by the acquiring means or a part of the second character string;
The second character string displayed by the display means or a part of the second character string is selected by an operator's selection operation, and the selected second character string or the second character string is selected. Based on a part, it functions as a complement means for complementing the first character string ,
The display means includes a distance and a second character for editing from a part of the second character string to the first character string or from the first character string to a part of the second character string. Generate a part of the second character string, which is a character string to be displayed as a character string used for completion, based on the length of the character string in a part other than a part of the string
An information processing program characterized by that .
JP2011205097A 2011-09-20 2011-09-20 Information processing apparatus and information processing program Expired - Fee Related JP5803481B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011205097A JP5803481B2 (en) 2011-09-20 2011-09-20 Information processing apparatus and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011205097A JP5803481B2 (en) 2011-09-20 2011-09-20 Information processing apparatus and information processing program

Publications (2)

Publication Number Publication Date
JP2013068983A JP2013068983A (en) 2013-04-18
JP5803481B2 true JP5803481B2 (en) 2015-11-04

Family

ID=48474665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011205097A Expired - Fee Related JP5803481B2 (en) 2011-09-20 2011-09-20 Information processing apparatus and information processing program

Country Status (1)

Country Link
JP (1) JP5803481B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3186007U (en) 2013-07-03 2013-09-12 羽柴 由倫 Sleeping cushion
JP5931015B2 (en) * 2013-07-12 2016-06-08 ヤフー株式会社 Information processing apparatus, system, server apparatus, terminal, and information processing method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040002849A1 (en) * 2002-06-28 2004-01-01 Ming Zhou System and method for automatic retrieval of example sentences based upon weighted editing distance
US8364468B2 (en) * 2006-09-27 2013-01-29 Academia Sinica Typing candidate generating method for enhancing typing efficiency

Also Published As

Publication number Publication date
JP2013068983A (en) 2013-04-18

Similar Documents

Publication Publication Date Title
JP5513898B2 (en) Shared language model
JP4502615B2 (en) Similar sentence search device, similar sentence search method, and program
CN103049458A (en) Method and system for revising user word bank
JP6210398B2 (en) Translation support device, translation support system, and program thereof
JP5910134B2 (en) Text search apparatus and program
JP5323652B2 (en) Similar word determination method and system
JP5737079B2 (en) Text search device, text search program, and text search method
JP5430312B2 (en) Data processing apparatus, data name generation method, and computer program
JP2006259919A (en) Device for supporting input of character string
JP5803481B2 (en) Information processing apparatus and information processing program
JP5342760B2 (en) Apparatus, method, and program for creating data for translation learning
JP2006318509A (en) Solution data editing processing device and processing method
JP5733285B2 (en) SEARCH DEVICE, SEARCH METHOD, AND PROGRAM
JP4416644B2 (en) Character processing apparatus with prediction function, method, recording medium, and program
JP2010191851A (en) Article feature word extraction device, article feature word extraction method and program
JP5609718B2 (en) Input support program, input support device, and input support method
JP6447549B2 (en) Text search apparatus, text search method and program
JP2020166501A (en) Segmentation model generation system, text segmentation device and segmentation model generation method
JP2013077084A (en) Sentence example dictionary generation program and sentence example dictionary generation device
JP6421568B2 (en) Information processing apparatus and information processing program
JP5262190B2 (en) Input completion device and input completion program
JP3744136B2 (en) Translation device and storage medium
JP5909123B2 (en) Machine translation apparatus, machine translation method and program
JP4300056B2 (en) CONCEPT EXPRESSION GENERATION METHOD, PROGRAM, STORAGE MEDIUM, AND CONCEPT EXPRESSION GENERATION DEVICE
JP5326945B2 (en) Character input support device, program, and character input support method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150414

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150417

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150804

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150817

R150 Certificate of patent or registration of utility model

Ref document number: 5803481

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees