JP5803481B2 - Information processing apparatus and information processing program - Google Patents
Information processing apparatus and information processing program Download PDFInfo
- Publication number
- JP5803481B2 JP5803481B2 JP2011205097A JP2011205097A JP5803481B2 JP 5803481 B2 JP5803481 B2 JP 5803481B2 JP 2011205097 A JP2011205097 A JP 2011205097A JP 2011205097 A JP2011205097 A JP 2011205097A JP 5803481 B2 JP5803481 B2 JP 5803481B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- phrase
- distance
- character
- editing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明は、情報処理装置及び情報処理プログラムに関する。 The present invention relates to an information processing apparatus and an information processing program.
文章作成に関する技術がある。
これに関連する技術として、例えば、特許文献1には、予測変換による入力効率を向上させることを課題とし、表示順序設定部は、記憶部に格納されている入力履歴に基づいて、予測変換の変換候補の表示順序を設定し、予測変換処理部は、操作部の操作で入力された未確定文字列に対応する変換候補を、表示順序設定部が設定した表示順序で変換候補を表示部に表示し、確定入力処理部は、操作部からの入力に基づいて、選択された変換候補を確定文字列として確定入力すると、入力履歴更新部は、当該確定文字列についての入力履歴を生成して記憶部に格納し、削除検出部が、確定入力された確定文字列についての削除を検出すると、表示順序変更部が、該確定文字列を示す変換候補に設定された表示順序を、最上位以外の表示順序に変更し、これにより、誤って変換候補を確定した場合、修正時にその変換候補の表示順序が最上位とならないことが開示されている。
There are techniques related to writing.
As a technique related to this, for example,
また、例えば、特許文献2には、予測処理結果の表示更新タイミングを制御することによって、ユーザーが任意のタイミングで予測候補文字列の選択を行うことができる文字列予測装置及び方法を提供することを課題とし、パターンを入力し、パターン認識用辞書を用いてパターン評価値を算出し、パターン評価値が高い順に認識候補文字を複数個出力し、その中から文脈辞書を用いて最適な認識候補文字を選択し、当該認識候補文字を組み合わせて検索文字列を生成し、キーとして予測辞書を検索し、複数の予測候補文字列を出力し、予測候補文字列もしくは最適な認識候補文字を表示する文字列入力方法であって、最新の予測候補文字列に表示更新するのか制御する条件を判定し、最新の予測候補文字列に表示更新する条件を満たしていると判定された場合に、最新の予測候補文字列に表示更新するように制御することが開示されている。
In addition, for example,
また、例えば、特許文献3には、文字入力装置を用いて文章を入力するに際し、ユーザーが入力しようとする文字列を予測する精度を向上させる予測入力装置を提供することを課題とし、音声入力部を介して入力された発言者の音声情報が、音声認識部でテキスト情報に変換され、予測データ作成部でそのテキスト情報から名詞が「読み」とともに抽出され、話題予測データが生成され、作成文書で使用された確定文字列は、文字情報入力部を介して予測データ作成部に与えられ、確定文字列と読みからなる履歴予測データが生成され、入力中の文字列(読み)が、予測処理部に与えられ、上記各予測データ並びに基本予測データに対して前方一致検索を行い、該当する文字列を予測候補に決定し、予測表示部を介して表示部に表示し、そして、予測選択部で選択された予測候補を予測候補出力部が作成文書に追加すべく出力することが開示されている。
In addition, for example,
また、例えば、特許文献4には、日本語及び他の言語入力を行うユーザーのタイピング作業を最小限とし、かつ正確で迅速な入力を実現する装置及び方法を提供することを課題とし、文字入力装置と共に用いる予測入力装置が、1の文字列とそれから予測される後続文字列候補リストとを互いに関連付け格納した後続文字列データベースと、既入力文字列の最後尾の文字列に対応する後続文字列候補リストを呼び出す手段と、呼び出しに応答して最後尾の文字列を判定する判定手段と、判定された文字列に対応する後続文字列候補リストを後続文字列データベースから検索する検索手段と、後続文字列候補リストを表示する表示手段と、表示された候補リスト中に適切な後続文字列がある場合はその適切な後続文字列を選択する選択手段と、選択された後続文字列を入力する手段とを有することが開示されている。
Further, for example,
また、例えば、特許文献5には、同一文書内の文字列を指示する文字列が入力された場合、予め保存しておいた情報をもとに同一文書内に現れている文字列を予測文字列として入力者に示すことにより、その操作性を向上させることができる文字列予測方法、及びこの方法を用いた文字列予測装置を提供することを目的とし、文字列入力部と、かな−漢字辞書、指示文字列辞書、指示文字列判定部、漢字変換部、品詞情報保存部、文字列−品詞バッファ、表示部、被指示文字列選択制御部、文字列取り出し部、文字列選択部、及び出力部とを備え、かな漢字変換方法等によって得られた品詞情報を語彙と共に保存しておき、入力された文字列が同一文書内の語句を指示する指示文字列であった場合には保存しておいた情報をもとに、その時点までに入力された文章の中から文字列を取り出し、予測文字列として出力することを特徴とすることが開示されている。
Also, for example, in
また、例えば、特許文献6には、携帯端末機等の情報端末等に文書を入力する際、文字列を入力し予測変換中に、当該変換中の単語前方、すなわち既に入力済みの文章中に、単語やフレーズを簡便な操作のみで迅速に追加することを課題とし、文章を入力する際に、操作部におけるユーザー操作により入力された文字列に応じた単語の候補を単語検索部によって検索するとともに、単語の文章中における入力位置を検出し、単語の候補中から選択された単語を入力単語として取得し、入力単語の属性及び入力位置に応じて、入力単語の前方又は後方に連結される前方フレーズ又は後方フレーズの候補をフレーズ検索部により検索し、ユーザー操作に基づき、前方又は後方を切り替えてフレーズの候補を選択可能に表示部に表示し、これらの文字入力及び候補選択による入力結果に基づいて文章を構成することが開示されている。
Further, for example, in
また、例えば、特許文献7には、文章の入力時に語句の補完を効果的に行い、利用者による文章入力の効率を向上させることを課題とし、文章入力補助装置は、蓄積された1又は複数の電子文書から抽出した語句を記憶し、記憶される語句の中から、利用者により入力された文字列と関連する語句を検索し、検索された語句のいずれかに基づいて文字列を補完することが開示されている。
In addition, for example, in
本発明は、第1の文字列を補完する場合に、第1の文字列の後に第2の文字列を付加する補完の候補だけでなく、第1の文字列の一部を置換する第2の文字列を補完の候補とするようにした情報処理装置及び情報処理プログラムを提供することを目的としている。 In the present invention, when a first character string is complemented, not only a candidate for complementation in which a second character string is added after the first character string but also a part of the first character string is replaced. It is an object of the present invention to provide an information processing apparatus and an information processing program in which the character string is used as a candidate for completion.
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、第1の文字列を受け付ける受付手段と、第2の文字列を記憶している記憶手段から、前記受付手段によって受け付けられた第1の文字列を補完するために用いる文字列の候補として、該第2の文字列から該第1の文字列へ又は該第1の文字列から該第2の文字列へ編集するための距離に基づいて算出した点数を用いて、該第2の文字列を取得する取得手段と、前記取得手段によって取得された第2の文字列又は該第2の文字列の一部を表示する表示手段と、前記表示手段によって表示された第2の文字列又は該第2の文字列の一部を、操作者の選択操作によって選択し、該選択された第2の文字列又は該第2の文字列の一部に基づいて、前記第1の文字列を補完する補完手段を具備し、前記表示手段は、前記第2の文字列の一部から前記第1の文字列へ又は該第1の文字列から該第2の文字列の一部へ編集するための距離と第2の文字列の一部以外の部分の文字列の長さに基づいて、補完に用いる文字列として表示する文字列である該第2の文字列の一部を生成することを特徴とする情報処理装置である。
The gist of the present invention for achieving the object lies in the inventions of the following items.
The invention of
請求項2の発明は、前記記憶手段は、第2の文字列と該第2の文字列に関する数値を対応させて記憶しており、前記取得手段は、前記記憶手段から、前記受付手段によって受け付けられた第1の文字列を補完するために用いる文字列の候補として、前記第2の文字列から該第1の文字列へ又は該第1の文字列から該第2の文字列へ編集するための距離と該第2の文字列に関する数値に基づいて算出した点数を用いて、該第2の文字列を取得し、前記第2の文字列に関する数値は、該第2の文字列が、第2の文字列を抽出対象とした文書中で出現している頻度を示す数値であり、前記取得手段は、前記第2の文字列に関する数値から前記距離と重みを乗算した値を減算して前記点数を算出し、該点数が高い順に予め定められた件数の第2の文字列を取得することを特徴とする請求項1に記載の情報処理装置である。
According to a second aspect of the present invention, the storage means stores a second character string and a numerical value related to the second character string in association with each other, and the acquisition means is received from the storage means by the reception means. Editing from the second character string to the first character string or from the first character string to the second character string as a character string candidate used for complementing the received first character string The second character string is obtained using a distance calculated based on the distance and the numerical value related to the second character string, and the second character string includes the second character string, It is a numerical value indicating the frequency of appearance in a document in which the second character string is extracted, and the acquisition means subtracts a value obtained by multiplying the distance and weight from a numerical value related to the second character string. The score is calculated, and a predetermined number of second characters in descending order. Obtaining a an information processing apparatus according to
請求項3の発明は、前記取得手段は、距離が大であるほど選択されにくくなるようにしており、距離として、第2の文字列を第1の文字列にするための編集であって、挿入編集の距離は、削除編集の距離より大である、又は、第1の文字列を第2の文字列にするための編集であって、削除編集の距離は、挿入編集の距離より大であることを特徴とする請求項1又は2に記載の情報処理装置である。
The invention according to
請求項4の発明は、コンピュータを、第1の文字列を受け付ける受付手段と、第2の文字列を記憶している記憶手段から、前記受付手段によって受け付けられた第1の文字列を補完するために用いる文字列の候補として、該第2の文字列から該第1の文字列へ又は該第1の文字列から該第2の文字列へ編集するための距離に基づいて算出した点数を用いて、該第2の文字列を取得する取得手段と、前記取得手段によって取得された第2の文字列又は該第2の文字列の一部を表示する表示手段と、前記表示手段によって表示された第2の文字列又は該第2の文字列の一部を、操作者の選択操作によって選択し、該選択された第2の文字列又は該第2の文字列の一部に基づいて、前記第1の文字列を補完する補完手段として機能させ、前記表示手段は、前記第2の文字列の一部から前記第1の文字列へ又は該第1の文字列から該第2の文字列の一部へ編集するための距離と第2の文字列の一部以外の部分の文字列の長さに基づいて、補完に用いる文字列として表示する文字列である該第2の文字列の一部を生成することを特徴とする情報処理プログラムである。 According to a fourth aspect of the present invention, the computer supplements the first character string received by the receiving means from the receiving means for receiving the first character string and the storage means for storing the second character string. As a character string candidate to be used, a score calculated based on a distance for editing from the second character string to the first character string or from the first character string to the second character string is calculated. Using the acquisition means for acquiring the second character string, the display means for displaying the second character string acquired by the acquisition means or a part of the second character string, and the display by the display means. The selected second character string or a part of the second character string is selected by the selection operation of the operator, and based on the selected second character string or the part of the second character string , to function as a complementary means to complement the first character string, the display hand Is a distance for editing from a part of the second character string to the first character string or from the first character string to a part of the second character string, and one of the second character strings. An information processing program that generates a part of the second character string, which is a character string to be displayed as a character string used for complementation, based on a length of a character string of a part other than the part .
請求項1の情報処理装置によれば、第1の文字列を補完する場合に、第1の文字列の後に第2の文字列を付加する補完の候補だけでなく、第1の文字列の一部を置換する第2の文字列を補完の候補とし、本発明の構成を有していない場合と比較して、文字列の入力に関する操作を少なくすることができる。また、補完すべき文字列として表示する文字列を編集するための距離と文字列の長さに基づいて制御することができる。
According to the information processing apparatus of
請求項2の情報処理装置によれば、第2の文字列に関する数値を用いて、第2の文字列を取得することができる。 According to the information processing apparatus of the second aspect, it is possible to acquire the second character string using the numerical value related to the second character string.
請求項3の情報処理装置によれば、第1の文字列をそのまま用いられるような第2の文字列を選択することができる。 According to the information processing apparatus of the third aspect, it is possible to select the second character string that allows the first character string to be used as it is.
請求項4の情報処理プログラムによれば、第1の文字列を補完する場合に、第1の文字列の後に第2の文字列を付加する補完の候補だけでなく、第1の文字列の一部を置換する第2の文字列を補完の候補とし、本発明の構成を有していない場合と比較して、文字列の入力する操作を少なくすることができる。また、補完すべき文字列として表示する文字列を編集するための距離と文字列の長さに基づいて制御することができる。
According to the information processing program of
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
Hereinafter, an example of a preferred embodiment for realizing the present invention will be described with reference to the drawings.
FIG. 1 shows a conceptual module configuration diagram of a configuration example of the present embodiment.
The module generally refers to components such as software (computer program) and hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a computer program but also a module in a hardware configuration. Therefore, the present embodiment is a computer program for causing these modules to function (a program for causing a computer to execute each procedure, a program for causing a computer to function as each means, and a function for each computer. This also serves as an explanation of the program and system and method for realizing the above. However, for the sake of explanation, the words “store”, “store”, and equivalents thereof are used. However, when the embodiment is a computer program, these words are stored in a storage device or stored in memory. It is the control to be stored in the device. Modules may correspond to functions one-to-one, but in mounting, one module may be configured by one program, or a plurality of modules may be configured by one program, and conversely, one module May be composed of a plurality of programs. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Note that one module may include other modules. Hereinafter, “connection” is used not only for physical connection but also for logical connection (data exchange, instruction, reference relationship between data, etc.). “Predetermined” means that the process is determined before the target process, and not only before the process according to this embodiment starts but also after the process according to this embodiment starts. In addition, if it is before the target processing, it is used in accordance with the situation / state at that time or with the intention to be decided according to the situation / state up to that point.
In addition, the system or device is configured by connecting a plurality of computers, hardware, devices, and the like by communication means such as a network (including one-to-one correspondence communication connection), etc., and one computer, hardware, device. The case where it implement | achieves by etc. is included. “Apparatus” and “system” are used as synonymous terms. Of course, the “system” does not include a social “mechanism” (social system) that is an artificial arrangement.
In addition, when performing a plurality of processes in each module or in each module, the target information is read from the storage device for each process, and the processing result is written to the storage device after performing the processing. is there. Therefore, description of reading from the storage device before processing and writing to the storage device after processing may be omitted. Here, the storage device may include a hard disk, a RAM (Random Access Memory), an external storage medium, a storage device via a communication line, a register in a CPU (Central Processing Unit), and the like.
文章を作成する場合(特に、定型的な文章を入力する場合)に、キーボード、タッチパネル等を用いた文章打ち込みにおける省力化を行う技術として補完技術が存在する。
この補完技術は、次の2つの技術がある。(1)過去に作成された電子文書(以下、文書ともいう)から定型的なフレーズ(文字列)を抽出しておく技術、(2)文章打ち込みにおいて、打ち込まれた文章(文字列)に続くフレーズの候補をカーソル付近に表示し、操作者に選択させることで、文章作成の負担を軽減する技術である。
本実施の形態は、まず(1)の技術を用いる情報処理を図1の例を用いて説明し、次に(2)の技術を用いる情報処理を図2以降の例を用いて説明する。
Complementary technology exists as a technique for saving labor in sentence writing using a keyboard, a touch panel, or the like when writing a sentence (particularly when inputting a regular sentence).
This complementary technology includes the following two technologies. (1) Technology for extracting a standard phrase (character string) from an electronic document (hereinafter also referred to as a document) created in the past, (2) In the text typing, following the typed text (character string) This is a technology that reduces phrase creation by displaying phrase candidates near the cursor and allowing the operator to select them.
In the present embodiment, first, information processing using the technique (1) will be described using the example of FIG. 1, and then information processing using the technique (2) will be described using the examples of FIG.
本実施の形態である情報処理装置は、過去に作成された文書から定型的なフレーズ(以下、文字列ともいう)を抽出するものであって、図1の例に示すように、文書格納モジュール110、フレーズ抽出モジュール120、フレーズデータ格納モジュール130を有している。
これは、操作者が文章を書き始める前に、予め補完するフレーズを、過去に作成された文書から抽出して、フレーズデータを作成しておくためのものである。
The information processing apparatus according to the present embodiment extracts a standard phrase (hereinafter also referred to as a character string) from a document created in the past. As shown in the example of FIG. 110, a
This is for extracting phrase to be complemented in advance from a document created in the past and creating phrase data before the operator starts to write a sentence.
文書格納モジュール110は、フレーズ抽出モジュール120と接続されている。文書格納モジュール110は、過去に作成された文書を格納しており、フレーズ抽出モジュール120からアクセスされる。この格納されている文書は、一人の操作者(特に、図2の例を用いて説明する補完技術を実現する情報処理装置の操作者と同じ操作者)によって作成された文書であってもよいし、他の人によって作成された文書であってもよい。例えば、組織(具体例として、会社、部署、グループ、プロジェクトに属しているメンバー等)によって作成された文書を記憶している文書データベース等が該当する。
The
フレーズ抽出モジュール120は、文書格納モジュール110、フレーズデータ格納モジュール130と接続されている。フレーズ抽出モジュール120は、文書格納モジュール110に格納されている文書から補完するフレーズを抽出し、その抽出したフレーズをフレーズデータ格納モジュール130に格納する。また、抽出したフレーズには重要度を付与してもよい。
例えば、句読点を区切りとしてフレーズを抽出し、そのフレーズが全ての文書中で出現している頻度を計数し、この頻度をそのフレーズの重要度とするようにしてもよい。また、形態素解析技術を用いて、フレーズを抽出してもよく。また、重要度は、文書格納モジュール110に格納された文書における出現頻度に基づいてその初期値を決定してもよい。そして、図2の例に示す情報処理装置において、そのフレーズの補完としての利用回数に基づいて更新することとしてもよい。例えば、語句の重要度Iは、語句の出現頻度をA、補完としての利用回数をBとして、I=p・A+q・B(p,qは重み)という式により算出することとしてもよい。
The
For example, phrases may be extracted with punctuation marks as delimiters, the frequency with which the phrases appear in all documents may be counted, and this frequency may be used as the importance of the phrase. Moreover, you may extract a phrase using a morphological analysis technique. The importance may be determined based on the appearance frequency of the document stored in the
フレーズデータ格納モジュール130は、フレーズ抽出モジュール120と接続されている。フレーズデータ格納モジュール130は、フレーズ抽出モジュール120によって抽出されたフレーズを格納している。また、フレーズ抽出モジュール120によって抽出されたフレーズとそのフレーズの重要度を対応付けて格納していてもよい。具体的なデータ構造例は、図7の例を用いて後述する。また、フレーズデータ格納モジュール130は、図2の例に示す情報処理装置からもアクセスされる。そのために、フレーズデータ格納モジュール130は、フレーズ抽出モジュール120又は図2の例に示す情報処理装置と通信回線を介して接続されているサーバー等内にあってもよい。
The phrase
図2は、本実施の形態の補完処理を行う情報処理装置の構成例についての概念的なモジュール構成図である。
補完処理を行う情報処理装置は、図2の例に示すように、テキスト受付モジュール210、補完候補フレーズ取得モジュール220、フレーズデータ格納モジュール130、補完候補フレーズ表示モジュール230、補完モジュール240を有している。
FIG. 2 is a conceptual module configuration diagram of a configuration example of the information processing apparatus that performs the complementing processing according to the present embodiment.
As illustrated in the example of FIG. 2, the information processing apparatus that performs the complement processing includes a
テキスト受付モジュール210は、補完候補フレーズ取得モジュール220と接続されている。テキスト受付モジュール210は、キーボード、タッチパネル等に対する操作者の操作によって、打ち込まれる文字列(テキスト)を受け付ける。例えば、日本語入力フロントエンドプロセッサ(かな漢字変換モジュール)等によって構成されていてもよい。図4は、補完対象となる文字列の受け付け処理例を示す説明図である。既打込文字列表示領域400内には、既に打ち込まれた文字列が表示されており、現在の打ち込み位置にカーソル410が表示されている。
The
補完候補フレーズ取得モジュール220は、テキスト受付モジュール210、フレーズデータ格納モジュール130、補完候補フレーズ表示モジュール230と接続されている。補完候補フレーズ取得モジュール220は、第1の文字列を受け付ける。ここでの第1の文字列は、後述する第2の文字列によって補完され得る文字列(補完対象の文字列)である。テキスト受付モジュール210によって打ち込まれた文字列から、第1の文字列を取得する。つまり、操作者がテキスト受付モジュール210に打ち込んだ文字列から、補完フレーズを検索するための第1の文字列(以下、検索キーともいう)を取得する。検索キーを取得するタイミングは、最後に文字が打ち込まれてから予め定められた時間が経過したときとする。例えば、最後に文字が入力されてから100ms経過したときに検索キーを取得する。
取得する検索キーは、カーソル位置から前方の文字列を予め定められたルールに基づき取得する。例えば、カーソル位置から予め定められた文字数の文字列を取得してもよいし、カーソル位置の直前の区切り文字までの文字列を取得してもよい。例えば、区切り文字として句読点、改行、かっこ又は空白等を用いるものとする。図4に示す例では、検索キーとして“有意なリンパ節の腫大は”を取得することになる。
The complement candidate
The search key to be acquired acquires a character string in front of the cursor position based on a predetermined rule. For example, a character string of a predetermined number of characters may be acquired from the cursor position, or a character string up to a delimiter immediately before the cursor position may be acquired. For example, punctuation marks, line feeds, parentheses, or spaces are used as delimiters. In the example shown in FIG. 4, “significant lymph node enlargement” is acquired as a search key.
フレーズデータ格納モジュール130は、補完候補フレーズ取得モジュール220と接続されている。フレーズデータ格納モジュール130は、1つ以上のフレーズ(第2の文字列)を記憶している。この第2の文字列は、第1の文字列を補完するために用いる文字列である。
また、フレーズデータ格納モジュール130は、第2の文字列とその第2の文字列に関する数値(補完候補フレーズ取得モジュール220が補完候補として第2の文字列を抽出する際に用いる数値であり、具体的には、図1の例で説明した重要度)を対応させて記憶していてもよい。例えば、フレーズデータ格納テーブル700を記憶している。図7は、フレーズデータ格納テーブル700のデータ構造例を示す説明図である。フレーズデータ格納テーブル700は、フレーズ欄710、重要度欄720を有している。フレーズ欄710は、第2の文字列を記憶している。重要度欄720は、その第2の文字列に対応する重要度を記憶している。
The phrase
Further, the phrase
そして、補完候補フレーズ取得モジュール220は、フレーズデータ格納モジュール130から、第1の文字列を補完するために用いる文字列の候補として、第2の文字列から第1の文字列へ又は第1の文字列から第2の文字列へ編集するための距離(編集距離ともいわれる)に基づいて算出した点数(以下、スコアという)を用いて、第2の文字列を取得する。
また、補完候補フレーズ取得モジュール220は、フレーズデータ格納モジュール130から、第1の文字列を補完するために用いる文字列の候補として、第2の文字列から第1の文字列へ又は第1の文字列から第2の文字列へ編集するための距離と第2の文字列に関する数値に基づいて算出した点数を用いて、第2の文字列を取得するようにしてもよい。
なお、補完には、第1の文字列の後に、第2の文字列の一部を付加することがある。これは、第2の文字列の先頭にある文字列と第1の文字列が同じ場合が典型的な例であり、第1の文字列を打ち込んだ時点で、第2の文字列を打ち込もうとしていると判断して、続きの第2の文字列の一部(第2の文字列の前述の先頭の文字列以外の文字列である後半の文字列)を付加することである。なお、第2の文字列の一部とは、第2の文字列に含まれている文字列であって、1字以上の連続する文字列である。
この他に、補完には、第1の文字列の一部又は全部を第2の文字列又は第2の文字列の一部で置換することが含まれる。例えば、第1の文字列の一部と第2の文字列の一部が同じ場合であって、第1の文字列の全部を第2の文字列で置き換える場合が該当する。
Then, the supplement candidate
In addition, the supplement candidate
For complementation, a part of the second character string may be added after the first character string. This is a typical example where the first character string and the first character string are the same as the first character string. When the first character string is input, the second character string is input. It is determined that it is about to add, and a part of the subsequent second character string (second character string that is a character string other than the first character string of the second character string) is added. The part of the second character string is a character string included in the second character string, and is a continuous character string of one or more characters.
In addition, complementation includes replacing part or all of the first character string with the second character string or part of the second character string. For example, a case where a part of the first character string and a part of the second character string are the same and the whole of the first character string is replaced with the second character string is applicable.
補完候補フレーズ取得モジュール220の処理について、具体的に説明する。
補完候補フレーズ取得モジュール220は、第1の文字列(検索キー)を手がかりとして、フレーズデータ格納モジュール130からスコアが高い順に予め定められた件数の第2の文字列を取得する。
例えば、第2の文字列のスコアの計算は、重要度を用いない場合は、
スコア = − 重み × 距離 ・・・ (1)
重要度を用いる場合は、
スコア = 重要度 − 重み × 距離 ・・・ (2)
の式によって計算する。そして、本例では取得する件数は3件とする。
(2)式での重要度とは、第2の文字列の重要度(具体的にはフレーズデータ格納テーブル700の重要度欄720)である。各式における距離とは、第2の文字列から第1の文字列又は第1の文字列から第2の文字列へ変換するために必要となる編集の種類(挿入編集、削除編集、置換編集等)とその編集する文字数又は単語数に基づいて算出される値である。そして、距離が大であるほど補完の候補として選択されにくくなるようにしており(つまり、距離が大であるとスコアが低くなる)、距離として、第2の文字列を第1の文字列にするための編集であって、挿入編集の距離は、削除編集の距離より大である、又は、第1の文字列を第2の文字列にするための編集であって、削除編集の距離は、挿入編集の距離より大である。また、この距離算出のための編集として置換編集を含めてもよい。置換編集は、削除編集と挿入編集の組み合わせである。
以下では、主に第2の文字列から第1の文字列へ変換するために必要となる編集であって、編集は文字単位で行うことを例として用いて説明する。
例えば、削除編集のコストを0、挿入編集のコストを1とする。具体例をもって示すと、第2の文字列から5文字削除することによって第1の文字列となる場合はコストが0であり、第2の文字列に3文字挿入することによって第1の文字列となる場合はコストが3である。また、重みは10とする。
なお、重要度の値に比べて距離の値が小さいことから、各式において重みを用いているが、重みは必ずしも必要ない。例えば、コスト自体を前述の1、0ではなく、10、0のようにすることや、重要度を1/10の値としてもよい。
The process of the complement candidate
The complement candidate
For example, if the score for the second string is not using importance,
Score =-Weight x Distance (1)
When using importance,
Score = Importance-Weight x Distance (2)
Calculate using the following formula. In this example, the number of acquisitions is three.
The importance in the equation (2) is the importance of the second character string (specifically, the
In the following, description will be made using an example in which editing is mainly required for conversion from the second character string to the first character string, and editing is performed in units of characters.
For example, the cost of deletion editing is 0, and the cost of insertion editing is 1. Specifically, when the first character string is obtained by deleting five characters from the second character string, the cost is 0, and the first character string is obtained by inserting three characters into the second character string. The cost is 3. The weight is 10.
Since the distance value is smaller than the importance value, the weight is used in each equation, but the weight is not always necessary. For example, the cost itself may be set to 10, 0 instead of the above-described 1, 0, and the importance may be set to 1/10.
例えば、フレーズデータ格納モジュール130内にある“有意なリンパ節の腫大は認められません。”という第2の文字列(フレーズ)であって、第1の文字列(検索キー)である“有意なリンパ節の腫大は”の場合、第1の文字列から第2の文字列への距離は、図5の例に示すように0となる。図5は、距離の算出例を示す説明図である。編集距離算出例500は、フレーズ欄510、操作欄520、コスト欄530、編集距離欄540を有している。編集距離算出例500の第1行は第2の文字列、第2行は第1の文字列のことを示している。つまり、第1行から第2行への編集を示している。
フレーズ欄510の第1行にある“有意なリンパ節の腫大は認められません。”というフレーズに対して、“認められません。”の8文字を削除するという編集(操作欄520の第2行)を施すと、フレーズ欄510の第2行のように第1の文字列(検索キー)である“有意なリンパ節の腫大は”に変換できる。ここでの編集は削除編集であるので、コストは0となり、結局、距離も0である(図5の例のコスト欄530、編集距離欄540の第2行参照)。
For example, there is a second character string (phrase) in the phrase
Edit that deletes the eight characters “not allowed” for the phrase “significant lymph node enlargement is not found” in the first line of phrase column 510 (
次に、フレーズデータ格納モジュール130内にある“顕著なリンパ節腫大はありません。”という第2の文字列(フレーズ)であって、第1の文字列(検索キー)である“有意なリンパ節の腫大は”の場合、第1の文字列から第2の文字列への距離は、図6の例に示すように3となる。図6は、距離の算出例を示す説明図である。編集距離算出例600は、フレーズ欄610、操作欄620、コスト欄630、編集距離欄640を有している。編集距離算出例600の第1行は第2の文字列、第5行は第1の文字列のことを示している。つまり、第1行から第5行への編集を示している。
フレーズ欄610の第1行にある“顕著なリンパ節腫大はありません。”というフレーズに対して、“ありません。”の6文字を削除するという編集(操作欄620の2行目)を施すと、フレーズ欄610の第2行のように“顕著なリンパ節腫大は”に変換でき、ここでの編集は削除編集であるので、コストは0となり、距離も0である(図6の例のコスト欄630、編集距離欄640の第2行参照)。
次に、フレーズ欄610の第2行にある“顕著なリンパ節腫大は”というフレーズに対して、“顕著”の2文字を削除するという編集(操作欄620の3行目)を施すと、フレーズ欄610の第3行のように“なリンパ節腫大は”に変換でき、ここでの編集は削除編集であるので、コストは0となり、距離も0である(図6の例のコスト欄630、編集距離欄640の第3行参照)。
次に、フレーズ欄610の第3行にある“なリンパ節腫大は”というフレーズに対して、“有意”の2文字を挿入するという編集(操作欄620の4行目)を施すと、フレーズ欄610の第4行のように“有意なリンパ節腫大は”に変換でき、ここでの編集は挿入編集であるので、コストは2となり、距離も2である(図6の例のコスト欄630、編集距離欄640の第4行参照)。
次に、フレーズ欄610の第4行にある“有意なリンパ節腫大は”というフレーズに対して、“の”の1文字を挿入するという編集(操作欄620の5行目)を施すと、フレーズ欄610の第5行のように第1の文字列(検索キー)である“有意なリンパ節の腫大は”に変換できる。ここでの編集は挿入編集であるので、コストは1となり、距離は3となる(図6の例のコスト欄630、編集距離欄640の第5行参照)。距離は、その編集でのコストと前回までの距離との和である。したがって、編集距離算出例600の5行目では、コスト欄630の第5行の1と編集距離欄640の第4行の2を加算して、編集距離欄640の第5行の3となる。
なお、編集の順番は、編集距離算出例600以外の順番であってもよい。編集距離算出例600の第2行から第4行までは、編集の途中経過を示している。
Next, there is a second character string (phrase) in the phrase
If the phrase “No significant lymphadenopathy” in the first line of the
Next, if the phrase “significant lymphadenopathy is” in the second line of the
Next, for the phrase “na lymphadenopathy is” in the third line of the
Next, if the phrase “significant lymphadenopathy is” in the fourth line of the
Note that the editing order may be an order other than the editing distance calculation example 600. The second to fourth lines of the edit distance calculation example 600 indicate the progress of editing.
補完候補フレーズ取得モジュール220は、フレーズデータ格納モジュール130内の第2の文字列全てに対して、前述の距離の算出を行ってもよいし、フレーズデータ格納モジュール130内から既存の技術を用いて第1の文字列と類似している第2の文字列を抽出し、その抽出した第2の文字列に対して、前述の距離の算出を行ってもよい。
その結果、フレーズ・重要度・編集距離対応テーブル800を作成する。図8は、フレーズ・重要度・編集距離対応テーブル800のデータ構造例を示す説明図である。フレーズ・重要度・編集距離対応テーブル800は、フレーズ欄810、重要度欄820、編集距離欄830を有している。フレーズ・重要度・編集距離対応テーブル800は、フレーズデータ格納テーブル700に編集距離欄830を加えたものである。つまり、フレーズ欄810は、フレーズデータ格納テーブル700のフレーズ欄710に対応し、重要度欄820は、フレーズデータ格納テーブル700の重要度欄720に対応する。編集距離欄830は、フレーズ欄810内の第2の文字列に対して前述のように算出した距離を記憶している。
The complementary candidate
As a result, a phrase / importance / edit distance correspondence table 800 is created. FIG. 8 is an explanatory diagram showing an example of the data structure of the phrase / importance / edit distance correspondence table 800. The phrase / importance / edit distance correspondence table 800 includes a
次に、各第2の文字列に対してのスコア算出方法について説明する。
図9は、スコア算出テーブル900のデータ構造例を示す説明図である。スコア算出テーブル900は、フレーズ欄910、重要度欄920、編集距離欄930、スコア欄940を有している。スコア算出テーブル900は、フレーズ・重要度・編集距離対応テーブル800にスコア欄940を加えたものである。つまり、フレーズ欄910は、フレーズ・重要度・編集距離対応テーブル800のフレーズ欄810に対応し、重要度欄920は、フレーズ・重要度・編集距離対応テーブル800の重要度欄820に対応し、編集距離欄930は、フレーズ・重要度・編集距離対応テーブル800の編集距離欄830に対応する。スコア欄940は、フレーズ欄910内の第2の文字列に対して前述の(2)式によって算出したスコアを記憶している。例えば、第2行のスコア(25)は、55−10×3の計算結果である。
次に、スコアが高い順に並べ替え(降順でのソート)を行う。並べ替えを行った結果を図10の例に示す。図10は、スコア算出テーブル1000のデータ構造例を示す説明図である。スコア算出テーブル1000は、フレーズ欄1010、重要度欄1020、編集距離欄1030、スコア欄1040を有している。スコアの高い順に並べ替えられている。
そして、このスコア算出テーブル1000から上位にある第2の文字列を予め定められた数だけ抽出する。この第2の文字列が、操作者によって選択対象となるものであって、第1の文字列を補完するために用いる文字列となる。
Next, a score calculation method for each second character string will be described.
FIG. 9 is an explanatory diagram showing a data structure example of the score calculation table 900. The score calculation table 900 includes a
Next, rearrangement is performed in descending order (sorting in descending order). The result of rearrangement is shown in the example of FIG. FIG. 10 is an explanatory diagram showing an example of the data structure of the score calculation table 1000. The score calculation table 1000 includes a
Then, a predetermined number of second character strings at the top are extracted from the score calculation table 1000. This second character string is to be selected by the operator, and is a character string used to complement the first character string.
補完候補フレーズ表示モジュール230は、補完候補フレーズ取得モジュール220、補完モジュール240と接続されている。補完候補フレーズ表示モジュール230は、補完候補フレーズ取得モジュール220によって取得された第2の文字列又はその第2の文字列の一部を表示する。その表示は、表示されている第1の文字列の近辺に表示するようにしてもよい。
また、補完候補フレーズ表示モジュール230は、第2の文字列の一部から第1の文字列へ又は第1の文字列から第2の文字列の一部へ編集するための距離とその第2の文字列の一部以外の部分の文字列の長さに基づいて、補完に用いる文字列として表示する文字列である第2の文字列の一部を生成するようにしてもよい。
補完候補フレーズ取得モジュール220によって選択された第2の文字列を先頭からの文字列とそれ以外の文字列の2つの部分に分ける。つまり、第2の文字列を前半部分と後半部分の2つに分割する。ここでは、前半の部分を「カーソルより前のフレーズ」といい、それ以外の後半の部分を「補完フレーズ」という。
The complement candidate
The complement candidate
The second character string selected by the complement candidate
カーソルより前のフレーズから第1の文字列(検索キー)への距離が最小であって、かつ補完フレーズが最長のものを、補完候補フレーズ表示モジュール230が表示する補完フレーズとする。もちろんのことながら、第1の文字列(検索キー)からカーソルより前のフレーズへの距離を用いるようにしてもよい。
この処理について、図11を用いて説明する。図11は、補完フレーズの抽出例を示す説明図である。補完フレーズ抽出例1100は、No.欄1110、カーソルより前のフレーズ欄1120、補完フレーズ欄1130、カーソルより前のフレーズから検索キーへの編集距離欄1140を有している。カーソルより前のフレーズから検索キーへの編集距離欄1140は、第2の文字列を前半部分から第1の文字列への距離を記憶している。第1行から第8行までは、編集が削除編集のみであるので、距離は0である。第9行は“は”(1文字)の挿入編集が必要であるので、距離は1となり、第10行は“大は”(2文字)の挿入編集が必要であるので、距離は2となる。したがって、スコア欄1040の値が最小で、編集距離欄1030の文字列長が最長のものは、第8行の“有意なリンパ節の腫大は”を選択することとなる。
The complement phrase displayed by the complement candidate
This process will be described with reference to FIG. FIG. 11 is an explanatory diagram illustrating an example of extraction of a complementary phrase. The complementary phrase extraction example 1100 is No. A
他の例について、図12を用いて説明する。図12は、補完フレーズの抽出例を示す説明図である。補完フレーズ抽出例1200は、No.欄1210、カーソルより前のフレーズ欄1220、補完フレーズ欄1230、カーソルより前のフレーズから検索キーへの編集距離欄1240を有している。カーソルより前のフレーズから検索キーへの編集距離欄1240は、第2の文字列を前半部分から第1の文字列への距離を記憶している。第1行から第14行までは、“特に”を削除し、“の”を挿入し、“は”を挿入し、“などの異常は指摘できません”等を削除する編集が必要であるので、距離は2である。第15行はさらに“大”(1文字)の挿入編集が必要であるので、距離は3となり、第16行は第15行に対してさらに“腫”(1文字)の挿入編集が必要であるので、距離は4となる。したがって、カーソルより前のフレーズから検索キーへの編集距離欄1240の値が最小で、補完フレーズ欄1230の文字列長が最長のものは、第14行の“特に有意なリンパ節腫大”を選択することとなる。
Another example will be described with reference to FIG. FIG. 12 is an explanatory diagram illustrating an example of extraction of a complementary phrase. The complementary phrase extraction example 1200 is No. A
また、補完候補フレーズ表示モジュール230は、補完候補フレーズ取得モジュール220によって選択された第2の文字列を、その一部ではなく、第2の文字列全体を表示するようにしてもよい。特に、第2の文字列から第1の文字列に編集する場合に、第2の文字列の先頭の文字から編集が必要であるか否かを判断し、編集が必要である場合に、第2の文字列全体を表示するようにしてもよい。例えば、図12の例に示す補完フレーズ抽出例1200では、補完フレーズ欄1230内のフレーズのみならず、カーソルより前のフレーズ欄1220内のフレーズも表示することになる。
Further, the complement candidate
図13は、補完フレーズの表示例を示す説明図である。
補完候補フレーズ表示モジュール230は、既打込文字列表示領域400に対して、カーソル410の近辺に補完フレーズ候補群表示領域1310を表示する。例えば、前述のように、最後に文字が入力されてから100ms経過したときに、カーソル410の下方に補完フレーズ候補群表示領域1310を表示する。補完フレーズ候補群表示領域1310は、補完フレーズ1312、1314、1316を有している。補完フレーズ1312、1314、1316は、補完候補フレーズ取得モジュール220によって選択された第2の文字列であって、前述の補完候補フレーズ表示モジュール230の処理によって選択されたフレーズ(例えば、第2の文字列の後半部分の文字列)である。
FIG. 13 is an explanatory diagram illustrating a display example of a complementary phrase.
The complementary candidate
図14は、図13の状態から、マウスカーソルを補完フレーズ1312に移動した場合(又はキーボード内の下矢印キーを押した場合、以下、同様)の例を示している。補完フレーズ1312が操作者によって選択されたならば、カーソル410の後に補完フレーズ1312に表示されている文字列を追加する編集がなされることを示している。
FIG. 14 shows an example when the mouse cursor is moved to the
図15は、図13の状態から、マウスカーソルを補完フレーズ1314に移動した場合の例を示している。補完フレーズ1314が操作者によって選択されたならば、黒白を反転された領域である置換元文字列1520の位置から補完フレーズ1314に表示されている文字列を置換する編集がなされることを示している。これは、前述の第2の文字列から第1の文字列へ編集する場合の距離を算出するために、その編集が行われる第1の文字列内の位置を抽出しているが、その編集の最初の位置(先頭に近い位置)からカーソル410までの間を置換対象領域の文字列であるとして、他の文字列とは区別できるように(例えば、図15の例のように黒白反転する)表示する。つまり、図15の例では、補完フレーズ1314が操作者によって選択された場合、既打込文字列表示領域400内の“の腫大は”を“腫大や胸水貯留は認められません。”に置換する。
FIG. 15 shows an example when the mouse cursor is moved to the
図16は、図13の状態から、マウスカーソルを補完フレーズ1316に移動した場合の例を示している。補完フレーズ1316が操作者によって選択されたならば、黒白を反転された領域である置換元文字列1620の位置から補完フレーズ1316に表示されている文字列を置換する編集がなされることを示している。これは、前述の第2の文字列から第1の文字列へ編集する場合の距離を算出するために、その編集が行われる第1の文字列内の位置を抽出しているが、その編集の最初の位置(先頭に近い位置)からカーソル410までの間を置換対象領域の文字列であるとして、他の文字列とは区別できるように(例えば、図16の例のように黒白反転する)表示する。
図17は、補完した後の表示例を示す説明図である。つまり、図16の例の状態から、補完フレーズ1316が操作者によって選択された場合を示している。既打込文字列表示領域400内の“有意なリンパ節の腫大は”が“特に有意なリンパ節腫大などの異常は指摘できません。”に置換されている。
FIG. 16 shows an example when the mouse cursor is moved to the
FIG. 17 is an explanatory diagram illustrating a display example after complementation. That is, the
図18は、補完フレーズの表示例を示す説明図である。
補完候補フレーズ表示モジュール230は、既打込文字列表示領域400に対して、カーソル410の近辺に補完フレーズ候補群表示領域1810を表示する。例えば、前述のように、最後に文字が入力されてから100ms経過したときに、カーソル410の下方に補完フレーズ候補群表示領域1810を表示する。補完フレーズ候補群表示領域1810は、補完フレーズ1812、1814、1816を有している。補完フレーズ1812、1814、1816は、補完候補フレーズ取得モジュール220によって選択された第2の文字列であって、前述の補完候補フレーズ表示モジュール230の処理によって選択されたフレーズ(例えば、第2の文字列の後半部分の文字列)である。
図18に示す例は、前述の第2の文字列から第1の文字列へ編集する場合の距離を算出するために、その編集が行われる第1の文字列内の位置を抽出しているが、その編集の最後の位置(カーソル410に近い位置)からカーソル410までの間を置換対象領域の文字列であるとして、他の文字列とは区別できるように(例えば、図18の例のように黒白反転する)表示する。
図19は、補完した後の表示例を示す説明図である。つまり、図18の例の状態から、補完フレーズ1816が操作者によって選択された場合を示している。既打込文字列表示領域400内の“の腫大は”が“腫大などの異常は指摘できません。”に置換されている。
FIG. 18 is an explanatory diagram showing a display example of a complementary phrase.
The complementary candidate
In the example shown in FIG. 18, in order to calculate the distance when editing from the second character string to the first character string, the position in the first character string where the editing is performed is extracted. Is assumed to be a character string in the replacement target area from the last position of the editing (position close to the cursor 410) to the cursor 410 (for example, in the example of FIG. 18). Display in black and white.
FIG. 19 is an explanatory diagram illustrating a display example after complementation. That is, the
補完モジュール240は、補完候補フレーズ表示モジュール230と接続されている。補完モジュール240は、補完候補フレーズ表示モジュール230によって表示された第2の文字列又はその第2の文字列の一部を、操作者の選択操作によって選択し、その選択された第2の文字列又はその第2の文字列の一部に基づいて、第1の文字列を補完する。つまり、図13から図19の例を用いて説明した編集を行うものである。つまり、ここでの補完は、現在のカーソルの位置から文字列を単に追加する補完だけではなく、補完するフレーズに合わせて既に打ち込まれている文字列の一部又は全部を置換することも含めた補完を行うこともある。
The
図3は、本実施の形態による処理例を示すフローチャートである。
ステップS302では、補完候補フレーズ取得モジュール220は、フレーズデータ格納モジュール130からフレーズ(第2の文字列)を取得する。
ステップS304では、補完候補フレーズ取得モジュール220は、フレーズ(第2の文字列)は検索キー(第1の文字列)と同じであるか否かを判断し、同じである場合はステップS308へ進み、それ以外の場合はステップS306へ進む。
ステップS306では、補完候補フレーズ取得モジュール220は、フレーズ(第2の文字列)から検索キー(第1の文字列)への編集を行う。
ステップS308では、補完候補フレーズ取得モジュール220は、編集におけるスコアを算出する。
ステップS310では、補完候補フレーズ取得モジュール220は、スコアに対してソートを行う。上位から予め定められた数のフレーズ(第2の文字列)を選択する。
ステップS312では、補完候補フレーズ表示モジュール230は、表示するフレーズ(第2の文字列又は第2の文字列の一部)を生成する。
ステップS314では、補完候補フレーズ表示モジュール230は、生成したフレーズ(第2の文字列又は第2の文字列の一部)を表示する。
ステップS316では、補完候補フレーズ表示モジュール230は、操作者の選択操作によってフレーズ(第2の文字列又は第2の文字列の一部)を選択する。
ステップS318では、補完モジュール240は、検索キー(第1の文字列)をステップS316で選択したフレーズ(第2の文字列又は第2の文字列の一部)で補完する。
FIG. 3 is a flowchart showing an example of processing according to this embodiment.
In step S <b> 302, the complement candidate
In step S304, the complementary candidate
In step S306, the complement candidate
In step S308, the complementary candidate
In step S310, the complement candidate
In step S312, the complement candidate
In step S314, the supplementary candidate
In step S316, the complement candidate
In step S318, the
なお、本実施の形態(図1又は図2に例示する情報処理装置)としてのプログラムが実行されるコンピュータのハードウェア構成は、図20に例示するように、一般的なコンピュータであり、具体的にはパーソナルコンピュータ、サーバーとなり得るコンピュータ等である。つまり、具体例として、処理部(演算部)としてCPU2001を用い、記憶装置としてRAM2002、ROM2003、HD2004を用いている。HD2004として、例えばハードディスクを用いてもよい。フレーズ抽出モジュール120、補完候補フレーズ取得モジュール220、補完候補フレーズ表示モジュール230、補完モジュール240等のプログラムを実行するCPU2001と、そのプログラムやデータを記憶するRAM2002と、本コンピュータを起動するためのプログラム等が格納されているROM2003と、補助記憶装置であるHD2004と、キーボード、マウス、タッチパネル等に対する利用者の操作に基づいてデータを受け付ける受付装置2006と、CRT、液晶ディスプレイ等の出力装置2005と、ネットワークインタフェースカード等の通信ネットワークと接続するための通信回線インタフェース2007、そして、それらをつないでデータのやりとりをするためのバス2008により構成されている。これらのコンピュータが複数台互いにネットワークによって接続されていてもよい。
Note that the hardware configuration of a computer that executes a program as the present embodiment (the information processing apparatus illustrated in FIG. 1 or FIG. 2) is a general computer as illustrated in FIG. These include personal computers and computers that can serve as servers. That is, as a specific example, the
前述の実施の形態のうち、コンピュータ・プログラムによるものについては、本ハードウェア構成のシステムにソフトウェアであるコンピュータ・プログラムを読み込ませ、ソフトウェアとハードウェア資源とが協働して、前述の実施の形態が実現される。
なお、図20に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図20に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えばASIC等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図20に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、情報家電、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
Among the above-described embodiments, the computer program is a computer program that reads the computer program, which is software, in the hardware configuration system, and the software and hardware resources cooperate with each other. Is realized.
Note that the hardware configuration illustrated in FIG. 20 illustrates one configuration example, and the present embodiment is not limited to the configuration illustrated in FIG. 20, and is a configuration capable of executing the modules described in the present embodiment. I just need it. For example, some modules may be configured by dedicated hardware (for example, ASIC), and some modules may be in an external system and connected via a communication line. A plurality of systems shown in FIG. 5 may be connected to each other via communication lines so as to cooperate with each other. In particular, in addition to personal computers, information appliances, copiers, fax machines, scanners, printers, and multifunction machines (image processing apparatuses having two or more functions of scanners, printers, copiers, fax machines, etc.) Etc. may be incorporated.
前述の実施の形態では、フレーズデータ格納モジュール130はフレーズ(第2の文字列)の重要度をそのフレーズと対応させて記憶している例を主に示したが、フレーズデータ格納モジュール130は重要度を記憶せずにフレーズだけを記憶しているようにしてもよい。その場合、補完候補フレーズ取得モジュール220が行うスコアの算出は、(1)式を例示したが、
スコア = −距離
としてもよい。なお、
スコア = 距離
としてもよいが、その場合は、フレーズの並べ替えにおいて降順ではなく、昇順に並べ替えを行うようにして、スコアが少ないものから予め定められた数の第2の文字列を選択するようにすればよい。
In the above-described embodiment, the example in which the phrase
Score =-distance may be used. In addition,
Score = distance may be used, but in that case, a predetermined number of second character strings are selected from those having a low score by rearranging phrases in ascending order instead of descending order. What should I do?
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
The program described above may be provided by being stored in a recording medium, or the program may be provided by communication means. In that case, for example, the above-described program may be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standard “DVD + R, DVD + RW, etc.”, compact disc (CD), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), Blu-ray disc ( Blu-ray Disc (registered trademark), magneto-optical disk (MO), flexible disk (FD), magnetic tape, hard disk, read-only memory (ROM), electrically erasable and rewritable read-only memory (EEPROM (registered trademark)) )), Flash memory, Random access memory (RAM) SD (Secure Digital) memory card and the like.
The program or a part of the program may be recorded on the recording medium for storage or distribution. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, etc., or wireless communication It may be transmitted using a transmission medium such as a network or a combination of these, or may be carried on a carrier wave.
Furthermore, the program may be a part of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media. Further, it may be recorded in any manner as long as it can be restored, such as compression or encryption.
110…文書格納モジュール
120…フレーズ抽出モジュール
130…フレーズデータ格納モジュール
210…テキスト受付モジュール
220…補完候補フレーズ取得モジュール
230…補完候補フレーズ表示モジュール
240…補完モジュール
DESCRIPTION OF
Claims (4)
第2の文字列を記憶している記憶手段から、前記受付手段によって受け付けられた第1の文字列を補完するために用いる文字列の候補として、該第2の文字列から該第1の文字列へ又は該第1の文字列から該第2の文字列へ編集するための距離に基づいて算出した点数を用いて、該第2の文字列を取得する取得手段と、
前記取得手段によって取得された第2の文字列又は該第2の文字列の一部を表示する表示手段と、
前記表示手段によって表示された第2の文字列又は該第2の文字列の一部を、操作者の選択操作によって選択し、該選択された第2の文字列又は該第2の文字列の一部に基づいて、前記第1の文字列を補完する補完手段
を具備し、
前記表示手段は、前記第2の文字列の一部から前記第1の文字列へ又は該第1の文字列から該第2の文字列の一部へ編集するための距離と第2の文字列の一部以外の部分の文字列の長さに基づいて、補完に用いる文字列として表示する文字列である該第2の文字列の一部を生成する
ことを特徴とする情報処理装置。 Accepting means for accepting the first character string;
The first character from the second character string is used as a candidate for the character string used to complement the first character string received by the receiving means from the storage means storing the second character string. An acquisition means for acquiring the second character string using a score calculated based on a distance to edit to the column or from the first character string to the second character string;
Display means for displaying the second character string acquired by the acquiring means or a part of the second character string;
The second character string displayed by the display means or a part of the second character string is selected by an operator's selection operation, and the selected second character string or the second character string is selected. Complementing means for complementing the first character string based on a part thereof ,
The display means includes a distance and a second character for editing from a part of the second character string to the first character string or from the first character string to a part of the second character string. An information processing apparatus that generates a part of the second character string that is a character string to be displayed as a character string used for complementation based on a length of a character string of a part other than a part of the string .
前記取得手段は、前記記憶手段から、前記受付手段によって受け付けられた第1の文字列を補完するために用いる文字列の候補として、前記第2の文字列から該第1の文字列へ又は該第1の文字列から該第2の文字列へ編集するための距離と該第2の文字列に関する数値に基づいて算出した点数を用いて、該第2の文字列を取得し、
前記第2の文字列に関する数値は、該第2の文字列が、第2の文字列を抽出対象とした文書中で出現している頻度を示す数値であり、
前記取得手段は、前記第2の文字列に関する数値から前記距離と重みを乗算した値を減算して前記点数を算出し、該点数が高い順に予め定められた件数の第2の文字列を取得する
ことを特徴とする請求項1に記載の情報処理装置。 The storage means stores a second character string and a numerical value related to the second character string in association with each other,
The acquisition means is a candidate for a character string used for complementing the first character string received by the receiving means from the storage means, from the second character string to the first character string, or Using the distance calculated for editing from the first character string to the second character string and the score calculated based on the numerical value related to the second character string, the second character string is obtained ,
The numerical value related to the second character string is a numerical value indicating the frequency with which the second character string appears in a document in which the second character string is extracted,
The acquisition unit calculates the score by subtracting a value obtained by multiplying the distance and the weight from a numerical value related to the second character string, and acquires a predetermined number of second character strings in descending order of the score. the information processing apparatus according to claim 1, characterized in that.
ことを特徴とする請求項1又は2に記載の情報処理装置。 The acquisition means is configured such that the larger the distance is, the less likely it is to be selected. As the distance, editing is performed to change the second character string to the first character string, and the insertion editing distance is deleted. The edit distance is greater than the edit distance, or is an edit for changing the first character string to the second character string, and the delete edit distance is greater than the insert edit distance. Item 3. The information processing apparatus according to item 1 or 2.
第1の文字列を受け付ける受付手段と、
第2の文字列を記憶している記憶手段から、前記受付手段によって受け付けられた第1の文字列を補完するために用いる文字列の候補として、該第2の文字列から該第1の文字列へ又は該第1の文字列から該第2の文字列へ編集するための距離に基づいて算出した点数を用いて、該第2の文字列を取得する取得手段と、
前記取得手段によって取得された第2の文字列又は該第2の文字列の一部を表示する表示手段と、
前記表示手段によって表示された第2の文字列又は該第2の文字列の一部を、操作者の選択操作によって選択し、該選択された第2の文字列又は該第2の文字列の一部に基づいて、前記第1の文字列を補完する補完手段
として機能させ、
前記表示手段は、前記第2の文字列の一部から前記第1の文字列へ又は該第1の文字列から該第2の文字列の一部へ編集するための距離と第2の文字列の一部以外の部分の文字列の長さに基づいて、補完に用いる文字列として表示する文字列である該第2の文字列の一部を生成する
ことを特徴とする情報処理プログラム。 Computer
Accepting means for accepting the first character string;
The first character from the second character string is used as a candidate for the character string used to complement the first character string received by the receiving means from the storage means storing the second character string. An acquisition means for acquiring the second character string using a score calculated based on a distance to edit to the column or from the first character string to the second character string;
Display means for displaying the second character string acquired by the acquiring means or a part of the second character string;
The second character string displayed by the display means or a part of the second character string is selected by an operator's selection operation, and the selected second character string or the second character string is selected. Based on a part, it functions as a complement means for complementing the first character string ,
The display means includes a distance and a second character for editing from a part of the second character string to the first character string or from the first character string to a part of the second character string. Generate a part of the second character string, which is a character string to be displayed as a character string used for completion, based on the length of the character string in a part other than a part of the string
An information processing program characterized by that .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011205097A JP5803481B2 (en) | 2011-09-20 | 2011-09-20 | Information processing apparatus and information processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011205097A JP5803481B2 (en) | 2011-09-20 | 2011-09-20 | Information processing apparatus and information processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013068983A JP2013068983A (en) | 2013-04-18 |
JP5803481B2 true JP5803481B2 (en) | 2015-11-04 |
Family
ID=48474665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011205097A Expired - Fee Related JP5803481B2 (en) | 2011-09-20 | 2011-09-20 | Information processing apparatus and information processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5803481B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3186007U (en) | 2013-07-03 | 2013-09-12 | 羽柴 由倫 | Sleeping cushion |
JP5931015B2 (en) * | 2013-07-12 | 2016-06-08 | ヤフー株式会社 | Information processing apparatus, system, server apparatus, terminal, and information processing method |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040002849A1 (en) * | 2002-06-28 | 2004-01-01 | Ming Zhou | System and method for automatic retrieval of example sentences based upon weighted editing distance |
US8364468B2 (en) * | 2006-09-27 | 2013-01-29 | Academia Sinica | Typing candidate generating method for enhancing typing efficiency |
-
2011
- 2011-09-20 JP JP2011205097A patent/JP5803481B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013068983A (en) | 2013-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5513898B2 (en) | Shared language model | |
JP4502615B2 (en) | Similar sentence search device, similar sentence search method, and program | |
CN103049458A (en) | Method and system for revising user word bank | |
JP6210398B2 (en) | Translation support device, translation support system, and program thereof | |
JP5910134B2 (en) | Text search apparatus and program | |
JP5323652B2 (en) | Similar word determination method and system | |
JP5737079B2 (en) | Text search device, text search program, and text search method | |
JP5430312B2 (en) | Data processing apparatus, data name generation method, and computer program | |
JP2006259919A (en) | Device for supporting input of character string | |
JP5803481B2 (en) | Information processing apparatus and information processing program | |
JP5342760B2 (en) | Apparatus, method, and program for creating data for translation learning | |
JP2006318509A (en) | Solution data editing processing device and processing method | |
JP5733285B2 (en) | SEARCH DEVICE, SEARCH METHOD, AND PROGRAM | |
JP4416644B2 (en) | Character processing apparatus with prediction function, method, recording medium, and program | |
JP2010191851A (en) | Article feature word extraction device, article feature word extraction method and program | |
JP5609718B2 (en) | Input support program, input support device, and input support method | |
JP6447549B2 (en) | Text search apparatus, text search method and program | |
JP2020166501A (en) | Segmentation model generation system, text segmentation device and segmentation model generation method | |
JP2013077084A (en) | Sentence example dictionary generation program and sentence example dictionary generation device | |
JP6421568B2 (en) | Information processing apparatus and information processing program | |
JP5262190B2 (en) | Input completion device and input completion program | |
JP3744136B2 (en) | Translation device and storage medium | |
JP5909123B2 (en) | Machine translation apparatus, machine translation method and program | |
JP4300056B2 (en) | CONCEPT EXPRESSION GENERATION METHOD, PROGRAM, STORAGE MEDIUM, AND CONCEPT EXPRESSION GENERATION DEVICE | |
JP5326945B2 (en) | Character input support device, program, and character input support method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150414 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150417 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150611 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150817 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5803481 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |