JP2007310589A - Program, method and apparatus for learning input conversion - Google Patents

Program, method and apparatus for learning input conversion Download PDF

Info

Publication number
JP2007310589A
JP2007310589A JP2006138080A JP2006138080A JP2007310589A JP 2007310589 A JP2007310589 A JP 2007310589A JP 2006138080 A JP2006138080 A JP 2006138080A JP 2006138080 A JP2006138080 A JP 2006138080A JP 2007310589 A JP2007310589 A JP 2007310589A
Authority
JP
Japan
Prior art keywords
character string
conversion
vocabulary
processing
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006138080A
Other languages
Japanese (ja)
Other versions
JP4847210B2 (en
Inventor
Hiroyuki Machiya
宏之 町屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006138080A priority Critical patent/JP4847210B2/en
Publication of JP2007310589A publication Critical patent/JP2007310589A/en
Application granted granted Critical
Publication of JP4847210B2 publication Critical patent/JP4847210B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a program, a method and an apparatus for learning input conversion capable of automatically, easily and efficiently performing Kana input conversion. <P>SOLUTION: According to the program for learning input conversion, words to be operated are weighted according to character string operations, such as displaying, selecting ranges, copying, pasting, and converting, performed in another system 200 such as a Web browser 200a, an e-mail application 200b, and an editor 200c, and the words are registered in a language dictionary table of a language dictionary DB 105c. During the input conversion in a language input system 300, the content registered in the language dictionary table of the language dictionary DB 105c is read and displayed at the top of a list of input conversion candidate lists, whereby it is made possible to efficiently convert certain input Kana letters into a word for which character string operations have been more frequently performed. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理をコンピュータに実行させるための入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に関する。   The present invention provides a kana-kanji input conversion candidate learning process in a kana-kanji conversion system that converts a kana character string input in an application into a kanji character string by selecting one conversion candidate from a list of conversion candidates. The present invention relates to an input conversion learning program, an input conversion learning method, and an input conversion learning device to be executed by a computer.

コンピュータシステムにおける入力方法において、漢字仮名混じりの日本語の文章を入力するために、先ず仮名で入力した文字列を順次必要に応じて漢字に変換していくことが一般的である。かかる変換方法では、仮名による文字列に対し複数の変換候補を変換候補リストに列挙して選択させることが行われている。   In an input method in a computer system, in order to input a Japanese sentence mixed with kanji characters, it is common to first convert a character string input with kana characters into kanji characters as necessary. In such a conversion method, a plurality of conversion candidates are listed in a conversion candidate list and selected for a character string of kana.

このような変換をより効率的に行うために、変換のために直近において選択された変換候補を変換候補リストの最優先に配置するという学習機能を持たせることが多い。また、さらに効率的な変換を行うために、例えば、特許文献1には、言語モデルとして読み込まれたユーザファイルに含まれる文章を形態素解析した結果から、ある形態素とこれに連接する形態素との連接組み合わせでの出現確率を算出しておき、該連接組み合わせの仮名入力の変換の際に、該出現確率が最も高い連接組み合わせを変換候補として選択する仮名入力変換方法が開示されている。   In order to perform such conversion more efficiently, a learning function of placing the conversion candidate most recently selected for conversion in the highest priority in the conversion candidate list is often provided. In order to perform more efficient conversion, for example, Patent Document 1 discloses a connection between a morpheme and a morpheme connected to the morpheme based on a result of a morphological analysis of a sentence included in a user file read as a language model. A kana input conversion method is disclosed in which the appearance probability of a combination is calculated, and the concatenation combination having the highest appearance probability is selected as a conversion candidate when converting the kana input of the connection combination.

特開2004−118461号公報JP 2004-118461 A

しかしながら、上記特許文献1に代表される従来技術では、連接組み合わせの出現確率は、言語モデルとして読み込まれたユーザファイルに含まれる文章に当該連接組み合わせが存在する場合にのみ算出可能であることから、出現確率が最も高い連接組み合わせを変換候補として選択するためには、より多くのユーザファイルを読み込んでより多くの連接組み合わせの出現確率を算出しておかなければならない。   However, in the related art represented by the above-mentioned Patent Document 1, the appearance probability of the connection combination can be calculated only when the connection combination exists in the text included in the user file read as the language model. In order to select the connection combination having the highest appearance probability as a conversion candidate, it is necessary to read more user files and calculate the appearance probability of more connection combinations.

また、ユーザファイルの読み込みはマニュアルで行わなければならないことから、能動的な手続きが煩雑であるのみならず、読み込むユーザファイルの選択が適切でない場合には、必要とする連接組み合わせの学習がなされていないこととなり、効率的な仮名入力変換の用をなさなくなってしまいかねなかった。   In addition, since the user file must be read manually, the active procedure is not only complicated, but when the user file to be read is not properly selected, the necessary connection combinations are learned. As a result, efficient kana input conversion could not be performed.

本発明は、上記問題点(課題)を解消するためになされたものであって、文字列操作に応じて自動的に言語モデルを取り込んで該言語モデルに含まれる文章の語彙を順序付けし、この順序付けに従った変換候補のリスト表示から変換候補を選択可能とすることによって、自動的かつ容易で効率的な仮名入力変換を行うことが可能な入力変換学習プログラム、入力変換学習方法及び入力変換学習装置を提供することを目的とする。   The present invention has been made to solve the above problems (problems), and automatically imports a language model in accordance with a character string operation to order the vocabulary of sentences included in the language model. Input conversion learning program, input conversion learning method, and input conversion learning capable of performing automatic, easy and efficient kana input conversion by enabling conversion candidates to be selected from a list of conversion candidates according to ordering An object is to provide an apparatus.

上述した問題を解決し、目的を達成するため、本発明は、変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理をコンピュータに実行させるための入力変換学習プログラムであって、前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理検知手順と、前記文字列処理検知手順により検知された文字列を語彙に分解する文字列分解処理手順と、前記文字列分解処理手順により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理手順と、前記語彙重み付け処理手順により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理手順とをコンピュータに実行させることを特徴とする。   In order to solve the above-described problems and achieve the object, the present invention converts a kana character string input in an application into a kanji character string by selecting one conversion candidate from a list of conversion candidates. An input conversion learning program for causing a computer to execute conversion candidate learning processing for kana-kanji input conversion in a system, the character string processing detection procedure for detecting character string processing for a character string handled by the application, and the character A character string decomposition processing procedure for decomposing a character string detected by the sequence processing detection procedure into vocabulary, and a vocabulary weighting processing procedure for performing weighting according to the character string processing for each vocabulary obtained by the character string decomposition processing procedure; The vocabulary weighted by the vocabulary weighting procedure together with the weighting and reading of the vocabulary Characterized in that to execute the lexical registration procedure for registering the conversion learning database on the computer.

また、本発明は、変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習方法であって、前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理検知工程と、前記文字列処理検知工程により検知された文字列を語彙に分解する文字列分解処理工程と、前記文字列分解処理工程により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理工程と、前記語彙重み付け処理工程により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理工程とを含んだことを特徴とする。   The present invention also provides a learning of conversion candidates for kana-kanji input conversion in a kana-kanji conversion system that converts a kana character string input in an application into a kanji character string by selecting one conversion candidate from a list of conversion candidates. An input conversion learning method for performing processing, a character string processing detection step for detecting character string processing for a character string handled by the application, and a character for decomposing the character string detected by the character string processing detection step into a vocabulary A column decomposition processing step, a vocabulary weighting processing step for weighting each vocabulary obtained by the character string decomposition processing step according to the character string processing, and the weighting and vocabulary weighted by the vocabulary weighting processing step. Including a vocabulary registration processing step of registering in the conversion learning database together with the vocabulary reading kana That.

また、本発明は、変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習装置であって、前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理手段と、前記文字列処理手段により検知された文字列を語彙に分解する文字列分解処理手段と、前記文字列分解処理手段により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理手段と、前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に記憶する変換学習記憶手段と、前記変換学習記憶手段に、前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に登録する語彙登録処理手段とを備えたことを特徴とする。   The present invention also provides a learning of conversion candidates for kana-kanji input conversion in a kana-kanji conversion system that converts a kana character string input in an application into a kanji character string by selecting one conversion candidate from a list of conversion candidates. An input conversion learning device that performs processing, wherein a character string processing unit that detects character string processing for a character string handled by the application, and a character string decomposition that decomposes the character string detected by the character string processing unit into a vocabulary Processing means, vocabulary weighting processing means for performing weighting according to the character string processing for each vocabulary obtained by the character string decomposition processing means, and the vocabulary weighted by the vocabulary weighting processing means Conversion learning storage means for storing together with the reading kana, and the vocabulary weighting processing means in the conversion learning storage means Characterized in that a vocabulary registration processing means for registering a more weighted vocabulary with kana of the weighting and the vocabulary.

本発明によれば、文字列分解処理手順により得られた語彙毎に文字列処理に応じた重み付けを行う語彙重み付け処理手順と、語彙重み付け処理手順により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理手順を含んだので、読み仮名に対する語彙を文字列処理に応じた重み付けで評価して順序付けすることができるという効果を奏する。   According to the present invention, the vocabulary weighting processing procedure for weighting each vocabulary obtained by the character string decomposition processing procedure according to the character string processing, the vocabulary weighted by the vocabulary weighting processing procedure, the weighting and reading of the vocabulary Since the vocabulary registration processing procedure for registering in the conversion learning database together with the kana is included, there is an effect that the vocabulary for the reading kana can be evaluated and ordered by weighting according to the character string processing.

以下に添付図面を参照して、本発明の入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に係る好適な実施例を詳細に説明する。なお、以下の実施例では、本発明を、コンピュータシステムに予め実装されている日本語入力変換プログラムとは別にさらに実装することによって、該日本語入力変換プログラムの入力変換学習機能を補完する機能を有する入力変換学習プログラム、入力変換学習方法及び入力変換学習装置について説明することとする。また、コンピュータシステムに限らず、携帯電話機における入力変換システムへも適用可能である。   Exemplary embodiments of an input conversion learning program, an input conversion learning method, and an input conversion learning apparatus according to the present invention will be described below in detail with reference to the accompanying drawings. In the following embodiments, the present invention is further implemented separately from the Japanese input conversion program that is pre-installed in the computer system, thereby supplementing the input conversion learning function of the Japanese input conversion program. An input conversion learning program, an input conversion learning method, and an input conversion learning device will be described. Further, the present invention can be applied not only to a computer system but also to an input conversion system in a mobile phone.

先ず、本実施例の入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に係るシステム構成を説明しつつ、本実施例の特徴を説明することとする。図1は、本実施例の入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に係るシステム構成の概念を示す図である。   First, the features of the present embodiment will be described while describing the system configuration of the input conversion learning program, the input conversion learning method, and the input conversion learning apparatus of the present embodiment. FIG. 1 is a diagram illustrating a concept of a system configuration according to an input conversion learning program, an input conversion learning method, and an input conversion learning device of the present embodiment.

同図に示すように、本実施例のシステムは、自動学習システム100と、Webブラウザ200a、電子メールアプリケーション(いわゆるMailer)200b及びエディタ200cなどの他システム200と、日本語入力変換プログラムで実現される言語入力システム300とを含んで構成されるものである。自動学習システム100、他システム200及び言語入力システム300は、一のコンピュータシステムに同時に実装されるアプリケーションソフトウェア群である。   As shown in the figure, the system of the present embodiment is realized by an automatic learning system 100, a Web browser 200a, another system 200 such as an e-mail application (so-called Mailer) 200b and an editor 200c, and a Japanese input conversion program. The language input system 300 is configured. The automatic learning system 100, the other system 200, and the language input system 300 are application software groups that are simultaneously implemented in one computer system.

自動学習システム100は、入力変換の自動学習処理の実行態様としてのプロセスに相当する自動学習アプリケーション100aと、自動学習アプリケーション100aによる入力変換学習処理結果を学習記憶するための言語辞書DB(Data Base)105cとを有する。   The automatic learning system 100 includes an automatic learning application 100a corresponding to a process as an execution mode of automatic learning processing of input conversion, and a language dictionary DB (Data Base) for learning and storing the input conversion learning processing result by the automatic learning application 100a. 105c.

言語入力システム300は、日本語の仮名漢字入力変換処理の実行態様としてのプロセスに相当する言語入力アプリケーション300aと、言語入力アプリケーション300aによる仮名漢字入力変換を行うために仮名と漢字(又は変換文字)とを対応付けて記憶している変換辞書DB305cとを有する。   The language input system 300 includes a language input application 300a corresponding to a process as an execution mode of Japanese kana-kanji input conversion processing, and kana and kanji (or converted characters) for performing kana-kanji input conversion by the language input application 300a. Is stored in association with the conversion dictionary DB 305c.

ここで、従来のシステムでは、言語入力システム300の言語入力アプリケーション300aが、入力された仮名に対応して一度選択され変換された漢字(又は変換文字)を、変換辞書DBを305c参照して再度読み出して変換候補として表示する際に、該表示を優先的に行うことによって、当該仮名に対応して該漢字(又は変換文字)が優先的に選択され変換処理されうるという変換辞書DB305cの学習機能を有することによって、効率的な仮名漢字入力変換を行うこととしていた。   Here, in the conventional system, the language input application 300a of the language input system 300 selects a kanji (or converted character) once selected and converted corresponding to the input kana, and again refers to the conversion dictionary DB 305c. A learning function of the conversion dictionary DB 305c that, when being read and displayed as a conversion candidate, by performing the display preferentially, the kanji (or conversion character) can be preferentially selected and converted according to the kana. Therefore, efficient kana-kanji input conversion is to be performed.

しかし、かかる学習機能では、入力された仮名が一度変換文字に変換されないと機能しないために、初めて入力する仮名に対して適切な変換文字を変換選択候補として提示することができず、効率的な仮名漢字変換を実現することができなかった。   However, such a learning function does not function unless the input kana is once converted into a conversion character, so that an appropriate conversion character cannot be presented as a conversion selection candidate for the first input kana, which is efficient. Kana-kanji conversion could not be realized.

特に、コンピュータシステムにおける文字列操作は、仮名の入力及び該仮名の変換文字への変換のみではなく、表示、選択、コピー、ペーストなど多岐に亘り、このような入力変換とは異なる文字列操作が行われた文字列又は語彙が入力変換の対象となる場合も多い。   In particular, character string operations in computer systems include not only input of kana and conversion of the kana into converted characters, but also display, selection, copy, paste, and other character string operations that are different from such input conversion. In many cases, the performed character string or vocabulary is subject to input conversion.

本発明は、かかる問題点に着目してなされたものであって、入力変換とは異なる文字列操作をも変換学習の対象とし、以って、初めて入力された仮名に対しても適切な変換文字を変換候補として提示可能とし、効率的な仮名漢字変換を実現することを目的とする。   The present invention has been made paying attention to such a problem, and is also subject to conversion learning for character string operations different from input conversion. The purpose is to realize efficient kana-kanji conversion by allowing characters to be presented as conversion candidates.

具体的には、自動学習アプリケーション100aは、他システム200において表示、選択、コピー、ペースト又は変換された文字列から語彙を抽出し、表示、選択、コピー、ペースト又は変換それぞれに応じてポイントを付与する重み付けを行ってから言語辞書DB105cへ格納する。   Specifically, the automatic learning application 100a extracts a vocabulary from a character string displayed, selected, copied, pasted or converted in the other system 200, and gives points according to each of the displayed, selected, copied, pasted or converted After the weighting is performed, it is stored in the language dictionary DB 105c.

そして、言語入力アプリケーション300aは、入力された仮名を変換文字へ変換する際に、変換辞書DB305cから変換候補を取得するのみならず、自動学習アプリケーション100aの言語辞書DB105cからも、入力された仮名に対応する変換候補を取得し、変換辞書DB305cの変換候補の表示順を前述の重み付けに従って修正する。   The language input application 300a not only obtains conversion candidates from the conversion dictionary DB 305c when converting the input kana into converted characters, but also converts the input kana from the language dictionary DB 105c of the automatic learning application 100a. Corresponding conversion candidates are acquired, and the display order of conversion candidates in the conversion dictionary DB 305c is corrected according to the above-described weighting.

自動学習システム100を導入すると、表示、範囲選択、コピー、ペースト、変換などの各種の文字列操作が行われる毎にリアルタイムで変換候補の表示順が変更されることとなる。よって、必要とされる変換候補を常に最新の状態で変換候補リストの上位に表示させることが可能となり、入力変換処理の効率性を高めかつ維持することが可能となる。   When the automatic learning system 100 is introduced, the display order of conversion candidates is changed in real time every time various character string operations such as display, range selection, copy, paste, and conversion are performed. Therefore, the necessary conversion candidates can be always displayed at the top of the conversion candidate list in the latest state, and the efficiency of the input conversion process can be improved and maintained.

なお、実施例では、この変換候補の表示順の修正は、変換辞書DB305cから取得した所定順序で順序付けられた変換候補全てに優先させ、言語辞書DB105cから取得した所定順序で順序付けられた変換候補を表示するとするが、これに限らず、言語辞書DB105cに記憶される語彙の重み付けに従って変換辞書DB305cに記憶される変換文字の表示順序を変更することとしてもよい。   In the embodiment, the correction of the display order of the conversion candidates is prioritized over all conversion candidates ordered in the predetermined order acquired from the conversion dictionary DB 305c, and the conversion candidates ordered in the predetermined order acquired from the language dictionary DB 105c are used. The display order of the conversion characters stored in the conversion dictionary DB 305c may be changed according to the weighting of the vocabulary stored in the language dictionary DB 105c.

次に、図1に示した入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に係るシステムで処理される自動学習機能の処理例を説明する。図2は、図1に示した入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に係るシステムで処理される自動学習機能の処理例を示す図である。   Next, a processing example of the automatic learning function processed in the system according to the input conversion learning program, the input conversion learning method, and the input conversion learning device shown in FIG. 1 will be described. FIG. 2 is a diagram illustrating a processing example of an automatic learning function processed by the system according to the input conversion learning program, the input conversion learning method, and the input conversion learning device illustrated in FIG.

同図に示すように、例えば、表示、選択、コピー、ペースト及び変換の各事象の事象毎の重み付けとしてのポイントを次のように定義する。即ち、表示:1(点)、範囲選択:3(点)、コピー:5(点)、ペースト:7(点)、変換:9(点)とする(図2(1))。   As shown in the figure, for example, points as weights for each event of display, selection, copy, paste, and conversion are defined as follows. That is, display: 1 (point), range selection: 3 (point), copy: 5 (point), paste: 7 (point), conversion: 9 (point) (FIG. 2 (1)).

このように重み付けのポイントが定義されている状況で、図示するようなメールを長岡さんが受け取って表示する(図2(2))。続いて、本実施例の自動学習システム100による自動学習機能が、形態素解析を行って、図示するメールの文章内から語彙を抽出し、各語彙に対してポイントを付与する。なお、自動学習機能は、仮名に逆変換可能な語彙を抽出してポイントを付与するが、本例示においては、説明を簡明にするために、特に抽出語彙を氏名のみに着目して説明することとする。すると、抽出語彙及び各語彙に付与されたポイントは、図2(3)の図表に示すように、全ての語彙は“表示”の事象が行われたことにより1(点)となる。   In a situation where weighting points are defined in this way, Mr. Nagaoka receives and displays an email as shown (FIG. 2 (2)). Subsequently, the automatic learning function of the automatic learning system 100 of the present embodiment performs morphological analysis, extracts vocabulary from the illustrated mail text, and gives points to each vocabulary. Note that the automatic learning function extracts vocabulary that can be converted back to kana and gives points, but in this example, in order to simplify the explanation, the extracted vocabulary will be explained by focusing on only the name. And Then, the points given to the extracted vocabulary and each vocabulary become 1 (point) when the event of “display” is performed for all vocabularies as shown in the chart of FIG.

この後、長岡さんが次の操作を行ったとする。即ち、「弘之」の語彙をコピー及びペーストし、「弘幸」の語彙のコピーを行った。この場合に、“コピー”という操作としての事象に対しては5(点)が与えられるものであり、“ペースト”という事象に対しては7(点)が与えられることから、「弘之」のポイントは、“表示”の1(点)に加えて“コピー”の5(点)及び“ペースト”の7(点)が付与されるために1+5+7=13(点)となる。また、「弘幸」のポイントは、“表示”の1(点)に加えて“コピー”の5(点)が付与されるために1+5=6(点)となる。このように、事象が発生し検知される毎に、ポイント合計値に各事象に対応するポイント(点数)が加算されることとなる。   After this, suppose that Nagaoka performed the following operations. That is, the vocabulary “Hiroyuki” was copied and pasted, and the vocabulary “Hiroyuki” was copied. In this case, 5 (point) is given to the event as an operation of “copy”, and 7 (point) is given to the event of “paste”. The point is 1 + 5 + 7 = 13 (point) because 5 (point) of “copy” and 7 (point) of “paste” are given in addition to 1 (point) of “display”. The point of “Hiroyuki” is 1 + 5 = 6 (points) because “copy” 5 (points) is given in addition to “display” 1 (points). In this way, each time an event occurs and is detected, points (points) corresponding to each event are added to the total point value.

この後、長岡さんが「ひろゆき」という語彙を言語入力アプリケーション300aを使用して変換する場合に、ポイントが最も高い「弘之」が最優先に、次にポイントが高い「弘幸」が優先されて、変換候補の優先候補として表示されることとなる。   Thereafter, when Nagaoka converts the vocabulary “Hiroyuki” using the language input application 300a, “Hiroyuki” with the highest point is given the highest priority, and “Hiroyuki” with the next highest point is given priority. It will be displayed as a priority candidate for the conversion candidate.

次に、図1に示した自動学習システムの構成について説明する。図3は、図1に示した自動学習システムの構成を示す機能ブロック図である。自動学習システム100はコンピュータシステムに自動学習アプリケーション100a及び言語辞書105cを実装して実現される入力変換学習装置である。同図に示すように、自動学習システム100は、事象検知判定処理部101と、対象文字列読み込み処理部102と、形態素解析処理部103と、形態素ポイント処理部104と、記憶部105と、変換処理検知部106と、変換候補追加優先表示処理部107とを有する。   Next, the configuration of the automatic learning system shown in FIG. 1 will be described. FIG. 3 is a functional block diagram showing the configuration of the automatic learning system shown in FIG. The automatic learning system 100 is an input conversion learning device realized by mounting an automatic learning application 100a and a language dictionary 105c on a computer system. As shown in the figure, the automatic learning system 100 includes an event detection determination processing unit 101, a target character string reading processing unit 102, a morpheme analysis processing unit 103, a morpheme point processing unit 104, a storage unit 105, and a conversion. A processing detection unit 106 and a conversion candidate addition priority display processing unit 107 are included.

事象検知判定処理部101は、他システム200において文字列の処理が行われたことを検知し、該処理が事象DB105aに登録されている表示、選択、コピー、ペースト又は変換の何れかの処理であるか否かを判定する。事象検知判定処理部101は、検知した文字列の処理が事象DB105aの事象テーブルに登録されている表示、選択、コピー、ペースト又は変換の何れかの処理であると判定したならば、検知文字列を対象文字列読み込み処理部102へ受け渡すこととなる。   The event detection determination processing unit 101 detects that the character string processing has been performed in the other system 200, and the processing is one of display, selection, copy, paste, or conversion registered in the event DB 105a. It is determined whether or not there is. If the event detection determination processing unit 101 determines that the processing of the detected character string is a display, selection, copy, paste, or conversion process registered in the event table of the event DB 105a, the detected character string Is transferred to the target character string reading processing unit 102.

対象文字列読み込み処理部102は、表示、選択、コピー、ペースト又は変換された文字列を形態素解析の処理対象文字列として読み込み、形態素解析処理部103へ受け渡す。形態素解析処理部103は、処理対象文字列を形態素解析し、解析した結果を形態素解析結果データDB105bの形態素解析結果データテーブルに記憶する。   The target character string reading processing unit 102 reads a character string that has been displayed, selected, copied, pasted or converted as a processing target character string for morphological analysis, and passes it to the morphological analysis processing unit 103. The morpheme analysis processing unit 103 performs a morphological analysis on the processing target character string, and stores the analysis result in the morpheme analysis result data table of the morpheme analysis result data DB 105b.

形態素解析処理部103が形態素解析結果を形態素解析結果データテーブルに記憶したならば、形態素ポイント処理部104は、図示しない読み仮名を登録した辞書を参照して各形態素に読み仮名を付する。さらに、事象検知判定処理部101が検知した事象に応じたポイントを各形態素に付与して該ポイントのポイント合計値を算出する。各形態素の品詞は形態素解析により判明している。よって、“読み”に対応する“品詞”、“語句”、“ポイント合計値”を、言語辞書DB105cの言語辞書テーブルに記憶していくこととなる。このとき、同音語を区別するために、“読み”に対応する“品詞”、“語句”、“ポイント合計値”のレコードに“枝番”を付して、一の“読み”に対応する複数の“語句”を識別可能とする。   If the morpheme analysis processing unit 103 stores the morpheme analysis result in the morpheme analysis result data table, the morpheme point processing unit 104 refers to a dictionary in which a reading kana not shown is registered and assigns a reading kana to each morpheme. Furthermore, a point corresponding to the event detected by the event detection determination processing unit 101 is assigned to each morpheme, and the point total value of the point is calculated. The part of speech of each morpheme is known by morphological analysis. Therefore, “part of speech”, “phrase”, and “point total value” corresponding to “reading” are stored in the language dictionary table of the language dictionary DB 105c. At this time, in order to distinguish homonyms, “branch number” is added to the record of “part of speech”, “phrase” and “point total value” corresponding to “reading” to correspond to one “reading”. A plurality of “phrases” can be identified.

変換処理検知部106は、言語入力システム300において入力変換処理の指示が行われたことを検知し、入力変換処理の指示を検知したことを変換候補追加優先表示処理部107へ通知する。変換処理検知部106から入力変換処理の指示の検知を通知された変換候補追加優先表示処理部107は、入力変換処理の対象となる仮名で表される“読み”に対応する全てのレコードの情報を言語辞書DB105cから読み出して、ポイント合計値の高い順序で言語入力システム300に受け渡す。言語辞書DB105cから読み出されて受け渡された情報は、言語入力システム300における入力変換候補の一覧表示において変換候補として優先的に追加表示されることとなる。   The conversion processing detection unit 106 detects that an instruction for input conversion processing has been performed in the language input system 300 and notifies the conversion candidate addition priority display processing unit 107 that the instruction for input conversion processing has been detected. The conversion candidate addition priority display processing unit 107 notified of the detection of the input conversion processing instruction from the conversion processing detection unit 106 has information on all records corresponding to “reading” represented by the pseudonym that is the target of the input conversion processing. Are read from the language dictionary DB 105c and transferred to the language input system 300 in the order of the highest point total value. The information read from the language dictionary DB 105c and transferred is preferentially additionally displayed as conversion candidates in the input conversion candidate list display in the language input system 300.

次に、図3に示した形態素解析結果データDB105bに格納される形態素解析結果データテーブルについて説明する。図4は、形態素解析結果データテーブルのテーブルイメージを示す図である。同図に示すように、形態素解析結果データテーブルは、“語句”と“品詞”のカラムを有する。“語句”は、形態素解析によって品詞に分解されかつ原型変換されたものが格納されている。“品詞”は、形態素解析によって判明した品詞である。なお、形態素解析結果データテーブルは一時記憶のためのテーブルであるので、形態素解析結果の語彙が言語辞書DB105cへ格納された後には、該形態素解析結果は消去されることとなる。   Next, the morpheme analysis result data table stored in the morpheme analysis result data DB 105b shown in FIG. 3 will be described. FIG. 4 is a diagram showing a table image of the morphological analysis result data table. As shown in the figure, the morphological analysis result data table has columns of “word” and “part of speech”. “Phrase” is stored after being decomposed into parts of speech by morphological analysis and converted into prototypes. “Part of speech” is a part of speech found by morphological analysis. Since the morphological analysis result data table is a table for temporary storage, the morphological analysis result is deleted after the vocabulary of the morphological analysis result is stored in the language dictionary DB 105c.

図4を具体的に見ると、「先生は学校へ車で行った」という文字列(文章)を品詞分解すると「先生△は△学校△へ△車△で△行っ△た」(“△”は形態素の区切りを表す)となり、さらにこれを原型変換すると「先生△は△学校△へ△車△で△行く△た」となる。この“先生”、“は”、“学校”、“へ”、“車”、“で”、“行く”、“た”の各語彙の品詞を判定し該品詞判定結果とともに各語彙を形態素解析結果データテーブルに記憶することとなる。   Specifically, when the character string (sentence) of “Teacher went to school by car” is decomposed into parts of speech, “Teacher △ went to △ School △ △ went △ by car △” (“△” Represents a morpheme break), and when this is converted into a prototype, "Teacher △ goes to △ school △ Δ car △ goes △”. Determine the part-of-speech of each vocabulary of “teacher”, “ha”, “school”, “to”, “car”, “de”, “go”, “ta”, and morphological analysis of each vocabulary together with the part-of-speech determination result It will be stored in the result data table.

次に、図3に示した言語辞書DB105cに格納される言語辞書テーブルについて説明する。図5は、言語辞書テーブルのテーブルイメージを示す図である。同図に示すように、言語辞書テーブルは“読み”と、“枝番”と、“品詞”と、“語句”と、“ポイント合計値”とのカラムを有する。“読み”は、各“語句”に対応する読みを示す読み仮名である。枝番は、一の“読み”に対して複数の“語句”が対応する場合のために、当該“読み”に対応する各“語彙”を識別するための識別子である、“品詞”は、形態素解析によって判明した当該“語句”の品詞名である。“ポイント合計値”は、当該“語句”に対してなされた文字列操作である事象の種別に応じて付与されたポイントの合計値である。このポイントは、常に加算されていくものであり、減算されることは一切ない。   Next, the language dictionary table stored in the language dictionary DB 105c shown in FIG. 3 will be described. FIG. 5 is a diagram showing a table image of the language dictionary table. As shown in the figure, the language dictionary table has columns of “reading”, “branch number”, “part of speech”, “phrase”, and “point total value”. “Reading” is a reading pseudonym indicating a reading corresponding to each “word”. The branch number is an identifier for identifying each “vocabulary” corresponding to the “reading” in the case where a plurality of “words” corresponds to one “reading”. It is the part of speech name of the “word” found by morphological analysis. The “point total value” is the total value of points given according to the type of event that is a character string operation performed on the “word”. This point is always added and never subtracted.

次に、図3に示した事象DB105aに格納される事象テーブルについて説明する。図6は、事象テーブルのテーブルイメージを示す図である。同図に示すように、事象テーブルは、“事象”と、“ポイント”とのカラムを有する。“事象”は、処理対象文字列に対してなされた処理の種別を示す。具体的には、「表示」は文字列の表示を示し、「範囲選択」は文字列の反転表示による選択を示す。また、「コピー」は文字列のコピーを示し、「ペースト」はコピーした文字列の貼り付けを示す。また、「変換」は入力文字列の仮名漢字変換を示す。   Next, an event table stored in the event DB 105a shown in FIG. 3 will be described. FIG. 6 is a diagram showing a table image of the event table. As shown in the figure, the event table has columns of “event” and “point”. “Event” indicates the type of processing performed on the processing target character string. Specifically, “display” indicates display of a character string, and “range selection” indicates selection by reverse display of the character string. “Copy” indicates copying of the character string, and “Paste” indicates pasting of the copied character string. “Conversion” indicates kana-kanji conversion of the input character string.

なお、図6に示す事象テーブルのイメージ図では、表示:1(点)、範囲選択:3(点)、コピー:5(点)、ペースト:7(点)、変換:9(点)と、各事象に対してポイントが割り振られているが、当該事象テーブルに登録してポイント加算対象の事象として認識する事象の種別及び各事象に割り当てられるポイント数は、一例を示すに過ぎず、自動学習システム100、他システム200及び言語入力システム300の利用態様に応じて適宜変更可能な事項である。   In the event table image diagram shown in FIG. 6, display: 1 (point), range selection: 3 (point), copy: 5 (point), paste: 7 (point), conversion: 9 (point), Points are assigned to events, but the types of events that are registered in the event table and recognized as events to be added points and the number of points assigned to each event are merely examples, and an automatic learning system 100, the other system 200, and the language input system 300 are matters that can be changed as appropriate.

次に、図1に示した自動学習システム100において実行される言語辞書テーブル登録処理手順について説明する。図7は、言語辞書テーブル登録処理手順を示すフローチャートである。以下の処理は、事象検知判定処理部101、対象文字列読み込み処理部102、形態素解析処理部103又は形態素ポイント処理部104により実行される処理である。同図に示すように、先ず、他システムにおける文字列に対する事象の発生を検知したか否かを判定する(ステップS101)。他システムにおける文字列に対する事象の発生を検知したと判定された場合に(ステップS101肯定)、ステップS102へ処理を移し、判定されなかった場合に(ステップS101否定)、ステップS101を繰り返す。   Next, the language dictionary table registration processing procedure executed in the automatic learning system 100 shown in FIG. 1 will be described. FIG. 7 is a flowchart showing a language dictionary table registration processing procedure. The following processing is processing executed by the event detection determination processing unit 101, the target character string reading processing unit 102, the morpheme analysis processing unit 103, or the morpheme point processing unit 104. As shown in the figure, first, it is determined whether or not the occurrence of an event for a character string in another system is detected (step S101). When it is determined that the occurrence of an event for the character string in another system is detected (Yes at Step S101), the process proceeds to Step S102, and when it is not determined (No at Step S101), Step S101 is repeated.

次に、発生した事象が事象テーブルに存在するか否かを判定し(ステップS102)、存在すると判定されるならば(ステップS102肯定)、ステップS103へ処理を移し、存在すると判定されないならば(ステップS102否定)、ステップS101へ処理を移す。   Next, it is determined whether or not the event that has occurred is present in the event table (step S102). If it is determined that the event is present (Yes in step S102), the process proceeds to step S103. (No in step S102), the process proceeds to step S101.

ステップS103では、処理対象文字列を形態素解析し、結果を形態素解析結果データテーブルに格納する。続いて、対象となるすべての文字列について形態素解析されたか否かを判定し(ステップS104)、全ての文字列について形態素解析されたと判定された場合に(ステップS104肯定)、ステップS105へ処理を移し、全ての文字列について形態素解析されたと判定されなかった場合に(ステップS104否定)、ステップS103へ処理を移す。   In step S103, the character string to be processed is subjected to morphological analysis, and the result is stored in the morphological analysis result data table. Subsequently, it is determined whether or not morphological analysis has been performed on all target character strings (step S104). If it is determined that morphological analysis has been performed on all character strings (Yes in step S104), the process proceeds to step S105. If it is not determined that morphological analysis has been performed for all character strings (No at step S104), the process proceeds to step S103.

ステップS105では、形態素解析結果データの語句と品詞を元に言語辞書テーブルを検索する。続いて、検索対象が言語辞書テーブルに存在するか否かを判定し(ステップS106)、存在すると判定される場合に(ステップS106肯定)、検索されたレコードのポイント合計値に事象テーブルのポイントを加算し(ステップS107)、存在すると判定されなかった場合に(ステップS106否定)、読みに対する語句のレコードを新規追加し、ポイント合計値に事象テーブルのポイントを加算する(ステップS108)。ステップS107又はステップS108が終了した場合には、ステップS109へ処理を移す。   In step S105, the language dictionary table is searched based on the words and parts of speech of the morphological analysis result data. Subsequently, it is determined whether or not the search target exists in the language dictionary table (step S106). When it is determined that the search target exists (step S106 affirmative), the points of the event table are added to the point total value of the searched records. Add (step S107), and if it is not determined to exist (No in step S106), a new word record for the reading is added, and the points in the event table are added to the point total value (step S108). If step S107 or step S108 is completed, the process proceeds to step S109.

ステップS109では、対象となる全ての形態素解析結果データについて言語辞書テーブルが検索されたか否かを判定し、全ての形態素解析結果データについて言語辞書テーブルが検索されたと判定される場合に(ステップS109肯定)、言語辞書テーブル登録処理を終了し、全ての形態素解析結果データについて言語辞書テーブルが検索されたと判定されなかった場合に(ステップS109否定)、ステップS105へ処理を移す。   In step S109, it is determined whether or not the language dictionary table has been searched for all target morpheme analysis result data. If it is determined that the language dictionary table has been searched for all morpheme analysis result data (Yes in step S109). ), The language dictionary table registration process is terminated, and if it is not determined that the language dictionary table has been searched for all the morphological analysis result data (No at Step S109), the process proceeds to Step S105.

次に、図1に示した自動学習システム100において実行される言語辞書テーブル読み出し処理手順について説明する。図8は、言語辞書テーブル読み出し処理手順を示すフローチャートである。以下の処理は、変換処理検知部106又は変換候補追加優先表示処理部107により実行される処理である。同図に示すように、先ず、言語入力システムにおける変換処理の指示を検知したか否かを判定する(ステップS201)。変換処理の指示を検知したと判定される場合に(ステップS202)、入力された「読み」に対応する変換候補を、ポイントが高い順序で言語辞書DB105cから読み出し、言語入力システムへ受け渡す。入力された「読み」に対応する変換候補をポイントが高い順序で受け渡された言語入力システム300は、変換辞書305cから読み出して表示する変換候補に追加しかつ該変換候補に優先させて、言語辞書DB105cからの変換候補をポイントの高い順序で追加表示することとなる。   Next, the language dictionary table read processing procedure executed in the automatic learning system 100 shown in FIG. 1 will be described. FIG. 8 is a flowchart showing a language dictionary table read processing procedure. The following processing is processing executed by the conversion processing detection unit 106 or the conversion candidate addition priority display processing unit 107. As shown in the figure, first, it is determined whether or not an instruction for conversion processing in the language input system has been detected (step S201). When it is determined that an instruction for conversion processing has been detected (step S202), conversion candidates corresponding to the input “reading” are read out from the language dictionary DB 105c in descending order of points and transferred to the language input system. The language input system 300 to which the conversion candidates corresponding to the input “reading” are transferred in the order of high points is added to the conversion candidates to be read out and displayed from the conversion dictionary 305c and given priority over the conversion candidates. Conversion candidates from the dictionary DB 105c are additionally displayed in the order of higher points.

次に、図1に示した言語入力システムが自動学習システムと連携した場合に、該言語入力システムにおける変換候補の表示例について説明する。図9は、言語入力システムにおける変換候補の表示例を示す図である。同図では、“きしゃ”という文字列を変換する場合を例示している。   Next, a display example of conversion candidates in the language input system when the language input system shown in FIG. 1 is linked with the automatic learning system will be described. FIG. 9 is a diagram illustrating a display example of conversion candidates in the language input system. In the figure, a case where a character string “Kisha” is converted is illustrated.

言語辞書DB105cの言語辞書テーブルには、この“きしゃ”の“読み”に対応する“語句”として“貴社”、“汽車”、“記者”、“帰社”の各語句が記憶されており、それぞれのポイントが“8”、“7”、“5”、“1”となっている。このポイントが高い順序で言語辞書テーブルから言語入力システム300へ受け渡され、言語入力システム300の変換候補の表示リストの先頭から該順序で表示されることとなる。即ち、変換候補の表示リストの1番目から4番目は、言語辞書テーブルから読み出されて表示されたものである。   In the language dictionary table of the language dictionary DB 105c, the words “your company”, “train”, “reporter”, and “return home” are stored as “words and phrases” corresponding to “reading” of this “work”. The respective points are “8”, “7”, “5”, and “1”. These points are transferred from the language dictionary table to the language input system 300 in a high order, and are displayed in that order from the top of the display list of conversion candidates of the language input system 300. That is, the first to fourth conversion candidate display lists are read from the language dictionary table and displayed.

一方で、言語入力システム300の変換候補の表示リストの5番目以降は、変換辞書DB305cの変換辞書テーブルから読み出される本来の変換候補である。このように、変換辞書DB305cの変換辞書テーブルから読み出される変換候補に優先させて語辞書DB105cの言語辞書テーブルに記憶されている変換候補を表示させると、最近において文字列操作が行われたことによって選択される可能性がより高い変換候補を変換候補の表示リストの上位に優先的に表示させることとなり、仮名漢字変換の効率性をより高めることができる。   On the other hand, the fifth and subsequent items in the conversion candidate display list of the language input system 300 are original conversion candidates read from the conversion dictionary table of the conversion dictionary DB 305c. As described above, when the conversion candidates stored in the language dictionary table of the word dictionary DB 105c are displayed in preference to the conversion candidates read from the conversion dictionary table of the conversion dictionary DB 305c, the character string operation has been performed recently. Conversion candidates that are more likely to be selected are preferentially displayed at the top of the display list of conversion candidates, and the efficiency of kana-kanji conversion can be further increased.

なお、上記実施例で説明した各処理は、あらかじめ用意されたプログラムをパーソナルコンピュータ、サーバ又はワークステーションなどのコンピュータシステムで実行することによって実現することができる。   Each process described in the above embodiment can be realized by executing a prepared program on a computer system such as a personal computer, a server, or a workstation.

上記実施例によれば、アプリケーションは、仮名漢字入力変換の対象であるアプリケーションのみならず、コンピュータシステムにおいて実行される他のアプリケーションをも含むので、多様なアプリケーションで行われる文字列操作を語彙の重み付けの契機とすることができ、使用頻度を性格に反映したより正確な語彙の重み付けを行うことが可能となる場合がある。   According to the above embodiment, the application includes not only the application that is the target of kana-kanji input conversion, but also other applications that are executed in the computer system. Therefore, character string operations performed in various applications are weighted by vocabulary. In some cases, more accurate vocabulary weighting reflecting the frequency of use in the personality may be possible.

また、上記実施例によれば、入力変換処理検知手順により入力変換処理が検知されると、該入力変換処理に際して入力された変換対象の仮名文字列に一致するよみ仮名に対応する語彙を変換学習データベースから読み出し、重み付けの順位が高い順序で変換候補として表示可能に仮名漢字変換システムに受け渡す変換候補受け渡し手順を含んだので、文字列処理に応じた重み付けで評価して順序付けられた語彙を、変換候補のリストの上位に重み付けの順位が高い語彙を表示させて変換効率の向上を図ることができる場合がある。   Further, according to the above embodiment, when the input conversion process is detected by the input conversion process detection procedure, the conversion learning is performed on the vocabulary corresponding to the kana character string that matches the kana character string to be converted input in the input conversion process. Since it includes a conversion candidate transfer procedure that is read from the database and transferred to the kana-kanji conversion system so that it can be displayed as a conversion candidate in the order of high weighting order, the vocabulary that has been ordered and evaluated with weighting according to the character string processing, In some cases, it is possible to improve the conversion efficiency by displaying a vocabulary with a high weighting order at the top of the list of conversion candidates.

以上、本発明の実施例を説明したが、本発明は、これに限られるものではなく、特許請求の範囲に記載した技術的思想の範囲内で、更に種々の異なる実施例で実施されてもよいものである。また、実施例に記載した効果は、これに限定されるものではない。   As mentioned above, although the Example of this invention was described, this invention is not limited to this, In the range of the technical idea described in the claim, even if it implements in a various different Example, it is. It ’s good. Moreover, the effect described in the Example is not limited to this.

上記実施例では、形態素解析の結果である語彙を、言語辞書DB105cの言語辞書テーブルへ登録する語句の単位としている。しかし、これに限らず、語彙と語彙とが結合した複合語も語句として登録するようにしてもよい。このようにすることによって、変換処理の利便性、効率性がより高まることがある。また、語彙の抽出方法は、形態素解析に限られるものではない。   In the above embodiment, the vocabulary that is the result of the morphological analysis is used as a unit of words to be registered in the language dictionary table of the language dictionary DB 105c. However, the present invention is not limited to this, and a compound word in which a vocabulary and a vocabulary are combined may be registered as a phrase. By doing so, the convenience and efficiency of the conversion process may be further increased. The vocabulary extraction method is not limited to morphological analysis.

上記実施例では、コンピュータシステムが本来有する言語入力システムに追加して機能させることにより、変換以外の文字列操作を入力変換候補の学習結果に反映させることとしている。そのために、変換以外の文字列操作が行われた語句を、言語辞書テーブルへ次々と新規に登録していくという方式を取っている。しかし、これに限らず、言語入力システム300の変換辞書305cの変換辞書テーブルの仕様を変更し、直接この変換辞書テーブルに文字列操作に応じたポイントを記録していくこととし、変換候補の表示時に、該ポイントの高い順に表示を行うこととしてもよい。このようにすると、言語辞書DB105cの言語辞書テーブルを用意する必要が省け、コンピュータ資源の節約を図ることができることがある。若しくは、言語入力システム300が変換辞書として、言語辞書DB105cの言語辞書テーブルを参照することとしてもよい。   In the above-described embodiment, the character string operation other than the conversion is reflected in the learning result of the input conversion candidate by adding and functioning to the language input system that the computer system originally has. For this purpose, a method is adopted in which words and phrases having undergone character string operations other than conversion are newly registered one after another in the language dictionary table. However, the present invention is not limited to this, the specification of the conversion dictionary table of the conversion dictionary 305c of the language input system 300 is changed, and points corresponding to character string operations are directly recorded in this conversion dictionary table, so that conversion candidates are displayed. Sometimes, the display may be performed in descending order of the points. This eliminates the need to prepare a language dictionary table in the language dictionary DB 105c, and may save computer resources. Alternatively, the language input system 300 may refer to the language dictionary table of the language dictionary DB 105c as the conversion dictionary.

また、上記実施例で示した自動学習システム100の機能及び処理を言語入力システム300が包含するような態様の実施例であってもよい。または、言語入力システム300の機能及び処理を自動学習システム100が包含するような態様の実施例であってもよい。これらによれば、入力変換に係るシステムが自動学習システム100又は言語入力システム300に一本化されるので、システム構成がシンプルとなり、メンテナンスの容易性が向上することがある。   Further, the embodiment may be an embodiment in which the language input system 300 includes the functions and processing of the automatic learning system 100 shown in the above embodiment. Alternatively, the embodiment may be an embodiment in which the automatic learning system 100 includes the functions and processing of the language input system 300. According to these, the system related to the input conversion is integrated into the automatic learning system 100 or the language input system 300, so that the system configuration becomes simple and the ease of maintenance may be improved.

上記実施例によれば、Webブラウザ200a、電子メールアプリケーション200b、エディタ200c(ワード・プロセッサなども同様)などの他システム200においてなされた表示、範囲選択、コピー、ペースト、変換などの文字列操作に応じて操作対象の語彙に重み付けを行って言語辞書DB105の言語辞書テーブルに登録する。言語入力システム300における入力変換に際して、言語辞書DB105の言語辞書テーブルの登録内容を読み出し、入力変換候補の候補リストの上位に表示させることによって、ある入力仮名を文字列操作がより頻繁に行われた語彙へと効率的に変換することが可能となる場合がある。   According to the above-described embodiment, character string operations such as display, range selection, copy, paste, and conversion performed in another system 200 such as the Web browser 200a, the e-mail application 200b, and the editor 200c (same as a word processor) are performed. Accordingly, the vocabulary to be operated is weighted and registered in the language dictionary table of the language dictionary DB 105. When performing input conversion in the language input system 300, the registered contents of the language dictionary table of the language dictionary DB 105 are read out and displayed at the top of the candidate list of input conversion candidates, whereby a character string operation is performed more frequently on an input kana. It may be possible to efficiently convert to vocabulary.

なお、“読み”に対応する“語句”は、漢字に限られるものではなく、平仮名や片仮名、英数字、各種記号や標印などであってもよい。   The “phrase” corresponding to “reading” is not limited to kanji, and may be hiragana, katakana, alphanumeric characters, various symbols, or a mark.

(付記1)変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理をコンピュータに実行させるための入力変換学習プログラムであって、
前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理検知手順と、
前記文字列処理検知手順により検知された文字列を語彙に分解する文字列分解処理手順と、
前記文字列分解処理手順により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理手順と、
前記語彙重み付け処理手順により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理手順と
をコンピュータに実行させることを特徴とする入力変換学習プログラム。
(Supplementary Note 1) A kana-kanji input conversion candidate learning process in a kana-kanji conversion system that converts a kana character string input in an application into a kanji character string by selecting one conversion candidate from a list of conversion candidates. An input conversion learning program for causing a computer to execute,
A character string processing detection procedure for detecting character string processing for a character string handled by the application;
A character string disassembling procedure for decomposing a character string detected by the character string processing detecting procedure into a vocabulary;
A vocabulary weighting processing procedure for performing weighting according to the character string processing for each vocabulary obtained by the character string decomposition processing procedure;
An input conversion learning program for causing a computer to execute a vocabulary registration processing procedure for registering a vocabulary weighted by the vocabulary weighting processing procedure together with the weighting and a reading kana of the vocabulary in a conversion learning database.

(付記2)前記アプリケーションは、前記仮名漢字入力変換の対象であるアプリケーションのみならず、前記コンピュータシステムにおいて実行される他のアプリケーションをも含んだことを特徴とする付記1に記載の入力変換学習プログラム。 (Supplementary note 2) The input conversion learning program according to supplementary note 1, wherein the application includes not only the application that is the target of kana-kanji input conversion but also other applications that are executed in the computer system. .

(付記3)前記文字列処理は、文字列の表示、範囲選択、コピー、ペースト若しくは仮名漢字入力変換を含んだことを特徴とする付記1又は2に記載の入力変換学習プログラム。 (Supplementary note 3) The input conversion learning program according to Supplementary note 1 or 2, wherein the character string processing includes character string display, range selection, copy, paste, or kana / kanji input conversion.

(付記4)前記コンピュータにおける入力変換システムが入力変換処理を行ったことを検知する入力変換処理検知手順と、
前記入力変換処理検知手順により入力変換処理が検知されると、該入力変換処理に際して入力された変換対象の仮名文字列に一致する前記読み仮名に対応する語彙を変換学習データベースから読み出し、前記重み付けの順位が高い順序で前記変換候補として表示可能に前記仮名漢字変換システムに受け渡す変換候補受け渡し手順と
をコンピュータに実行させることを特徴とする付記1〜3の何れか一つに記載の入力変換学習プログラム。
(Additional remark 4) The input conversion process detection procedure which detects that the input conversion system in the said computer performed the input conversion process,
When the input conversion process is detected by the input conversion process detection procedure, the vocabulary corresponding to the reading kana that matches the conversion target kana character string input in the input conversion process is read from the conversion learning database, and the weighting The input conversion learning according to any one of appendices 1 to 3, further comprising: causing a computer to execute a conversion candidate transfer procedure that is transferred to the kana-kanji conversion system so as to be displayed as the conversion candidates in a descending order. program.

(付記5)変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習方法であって、
前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理検知工程と、
前記文字列処理検知工程により検知された文字列を語彙に分解する文字列分解処理工程と、
前記文字列分解処理工程により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理工程と、
前記語彙重み付け処理工程により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理工程と
を含んだことを特徴とする入力変換学習方法。
(Supplementary Note 5) A kana-kanji input conversion candidate learning process in a kana-kanji conversion system that converts a kana character string input in an application into a kanji character string by selecting one conversion candidate from a list of conversion candidates. An input conversion learning method to perform,
A character string processing detection step of detecting character string processing for a character string handled by the application;
A character string decomposing process for decomposing the character string detected by the character string process detecting process into a vocabulary;
A vocabulary weighting process for performing weighting according to the character string process for each vocabulary obtained by the character string decomposition process;
A vocabulary registration processing step of registering the vocabulary weighted in the vocabulary weighting processing step in a conversion learning database together with the weighting and reading of the vocabulary.

(付記6)変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習装置であって、
前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理手段と、
前記文字列処理手段により検知された文字列を語彙に分解する文字列分解処理手段と、
前記文字列分解処理手段により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理手段と、
前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に記憶する変換学習記憶手段と、
前記変換学習記憶手段に、前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に登録する語彙登録処理手段と
を備えたことを特徴とする入力変換学習装置。
(Supplementary note 6) A kana-kanji input conversion conversion candidate learning process in a kana-kanji conversion system that converts a kana character string input in an application into a kanji character string by selecting one conversion candidate from a list of conversion candidates. An input conversion learning device to perform,
A character string processing means for detecting character string processing for a character string handled by the application;
A character string decomposition processing unit that decomposes the character string detected by the character string processing unit into a vocabulary;
Vocabulary weighting processing means for performing weighting according to the character string processing for each vocabulary obtained by the character string decomposition processing means;
Conversion learning storage means for storing the vocabulary weighted by the vocabulary weighting processing means together with the weighting and reading of the vocabulary;
An input conversion learning device, comprising: the conversion learning storage means comprising: a vocabulary registration processing means for registering the vocabulary weighted by the vocabulary weighting processing means together with the weighting and reading of the vocabulary.

本発明は、文字列操作に応じて自動的に言語モデルを取り込んで該言語モデルに含まれる文章の語彙を順序付けし、この順序付けに従った変換候補のリスト表示から変換候補を選択可能とすることによって、自動的かつ容易で効率的な仮名入力変換を行いたい場合に有用である。 The present invention automatically captures a language model in accordance with a character string operation, orders the vocabulary of sentences included in the language model, and enables conversion candidates to be selected from a list of conversion candidates according to the ordering. This is useful when it is desired to perform automatic, easy and efficient kana input conversion.

システム構成の概念を示す図である。It is a figure which shows the concept of a system configuration. 自動学習機能の処理例を示す図である。It is a figure which shows the process example of an automatic learning function. 自動学習システムの構成を示す機能ブロック図である。It is a functional block diagram which shows the structure of an automatic learning system. 形態素解析結果データテーブルのテーブルイメージを示す図である。It is a figure which shows the table image of a morphological analysis result data table. 言語辞書テーブルのテーブルイメージを示す図である。It is a figure which shows the table image of a language dictionary table. 事象テーブルのテーブルイメージを示す図である。It is a figure which shows the table image of an event table. 言語辞書テーブル登録処理手順を示すフローチャートである。It is a flowchart which shows a language dictionary table registration process procedure. 言語辞書テーブル読み出し処理手順を示すフローチャートである。It is a flowchart which shows a language dictionary table read-out process procedure. 言語入力システムにおける変換候補の表示例を示す図である。It is a figure which shows the example of a display of the conversion candidate in a language input system.

符号の説明Explanation of symbols

100 自動学習システム
101 事象検知判定処理部
102 対象文字列読み込み処理部
103 形態素解析処理部
104 形態素ポイント処理部
105 記憶部
105a 事象DB
105b 形態素解析結果データDB
105c 言語辞書DB
106 変換処理検知部
107 変換候補追加優先表示処理部
200a Webブラウザ
200b 電子メールアプリケーション
200c エディタ
300 言語入力システム
300a 言語入力アプリケーション
305c 変換辞書DB
DESCRIPTION OF SYMBOLS 100 Automatic learning system 101 Event detection determination processing part 102 Target character string reading processing part 103 Morphological analysis processing part 104 Morphological point processing part 105 Storage part 105a Event DB
105b Morphological analysis result data DB
105c Language Dictionary DB
106 Conversion processing detection unit 107 Conversion candidate addition priority display processing unit 200a Web browser 200b E-mail application 200c Editor 300 Language input system 300a Language input application 305c Conversion dictionary DB

Claims (3)

変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理をコンピュータに実行させるための入力変換学習プログラムであって、
前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理検知手順と、
前記文字列処理検知手順により検知された文字列を語彙に分解する文字列分解処理手順と、
前記文字列分解処理手順により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理手順と、
前記語彙重み付け処理手順により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理手順と
をコンピュータに実行させることを特徴とする入力変換学習プログラム。
By selecting one conversion candidate from the conversion candidate list, the computer executes a kana-kanji input conversion candidate learning process in the kana-kanji conversion system that converts the kana character string input in the application into a kanji character string. An input conversion learning program for
A character string processing detection procedure for detecting character string processing for a character string handled by the application;
A character string disassembling procedure for decomposing a character string detected by the character string processing detecting procedure into a vocabulary;
A vocabulary weighting processing procedure for performing weighting according to the character string processing for each vocabulary obtained by the character string decomposition processing procedure;
An input conversion learning program for causing a computer to execute a vocabulary registration processing procedure for registering a vocabulary weighted by the vocabulary weighting processing procedure in the conversion learning database together with the weighting and reading of the vocabulary.
変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習方法であって、
前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理検知工程と、
前記文字列処理検知工程により検知された文字列を語彙に分解する文字列分解処理工程と、
前記文字列分解処理工程により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理工程と、
前記語彙重み付け処理工程により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理工程と
を含んだことを特徴とする入力変換学習方法。
Input conversion learning that performs conversion candidate learning processing for kana-kanji input conversion in a kana-kanji conversion system that converts a kana character string input in an application into a kanji character string by selecting one conversion candidate from a list of conversion candidates A method,
A character string processing detection step of detecting character string processing for a character string handled by the application;
A character string decomposing process for decomposing the character string detected by the character string process detecting process into a vocabulary;
A vocabulary weighting process for performing weighting according to the character string process for each vocabulary obtained by the character string decomposition process;
A vocabulary registration processing step of registering the vocabulary weighted in the vocabulary weighting processing step in a conversion learning database together with the weighting and reading of the vocabulary.
変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習装置であって、
前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理手段と、
前記文字列処理手段により検知された文字列を語彙に分解する文字列分解処理手段と、
前記文字列分解処理手段により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理手段と、
前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に記憶する変換学習記憶手段と、
前記変換学習記憶手段に、前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に登録する語彙登録処理手段と
を備えたことを特徴とする入力変換学習装置。
Input conversion learning that performs conversion candidate learning processing for kana-kanji input conversion in a kana-kanji conversion system that converts a kana character string input in an application into a kanji character string by selecting one conversion candidate from a list of conversion candidates A device,
A character string processing means for detecting character string processing for a character string handled by the application;
A character string decomposition processing unit that decomposes the character string detected by the character string processing unit into a vocabulary;
Vocabulary weighting processing means for performing weighting according to the character string processing for each vocabulary obtained by the character string decomposition processing means;
Conversion learning storage means for storing the vocabulary weighted by the vocabulary weighting processing means together with the weighting and reading of the vocabulary;
An input conversion learning apparatus, comprising: the conversion learning storage means comprising: a vocabulary registration processing means for registering the vocabulary weighted by the vocabulary weighting processing means together with the weighting and reading of the vocabulary.
JP2006138080A 2006-05-17 2006-05-17 Input conversion learning program, input conversion learning method, and input conversion learning device Expired - Fee Related JP4847210B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006138080A JP4847210B2 (en) 2006-05-17 2006-05-17 Input conversion learning program, input conversion learning method, and input conversion learning device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006138080A JP4847210B2 (en) 2006-05-17 2006-05-17 Input conversion learning program, input conversion learning method, and input conversion learning device

Publications (2)

Publication Number Publication Date
JP2007310589A true JP2007310589A (en) 2007-11-29
JP4847210B2 JP4847210B2 (en) 2011-12-28

Family

ID=38843395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006138080A Expired - Fee Related JP4847210B2 (en) 2006-05-17 2006-05-17 Input conversion learning program, input conversion learning method, and input conversion learning device

Country Status (1)

Country Link
JP (1) JP4847210B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150675A (en) * 2011-01-19 2012-08-09 Fujitsu Ltd Input support program, information processor and information processing method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001209638A (en) * 2000-01-28 2001-08-03 Sharp Corp Information processor, information processing method and storage medium to be used for the information processor
JP2004118461A (en) * 2002-09-25 2004-04-15 Microsoft Corp Method and device for training language model, method and device for kana/kanji conversion, computer program, and computer readable recording medium

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001209638A (en) * 2000-01-28 2001-08-03 Sharp Corp Information processor, information processing method and storage medium to be used for the information processor
JP2004118461A (en) * 2002-09-25 2004-04-15 Microsoft Corp Method and device for training language model, method and device for kana/kanji conversion, computer program, and computer readable recording medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150675A (en) * 2011-01-19 2012-08-09 Fujitsu Ltd Input support program, information processor and information processing method

Also Published As

Publication number Publication date
JP4847210B2 (en) 2011-12-28

Similar Documents

Publication Publication Date Title
US7912700B2 (en) Context based word prediction
US7992085B2 (en) Lightweight reference user interface
US7788590B2 (en) Lightweight reference user interface
JP4202041B2 (en) Method and system for applying input mode bias
US7802305B1 (en) Methods and apparatus for automated redaction of content in a document
US7254784B2 (en) User-driven menu generation system with multiple submenus
US8031943B2 (en) Automatic natural language translation of embedded text regions in images during information transfer
US7774193B2 (en) Proofing of word collocation errors based on a comparison with collocations in a corpus
US7836401B2 (en) User operable help information system
US20040243415A1 (en) Architecture for a speech input method editor for handheld portable devices
US8924852B2 (en) Apparatus, method, and program for supporting processing of character string in document
US20070156618A1 (en) Embedded rule engine for rendering text and other applications
US8918323B2 (en) Contextual conversion platform for generating prioritized replacement text for spoken content output
JP2005190338A (en) Device and method for information extraction
JP2010257392A (en) Device and method for inputting character, computer readable program, and recording medium
JP2010134922A (en) Similar word determination method and system
US6976214B1 (en) Method, system, and program for enhancing text composition in a text editor program
JP4847210B2 (en) Input conversion learning program, input conversion learning method, and input conversion learning device
JP2005173999A (en) Device, system and method for searching electronic file, program, and recording media
WO2007088902A1 (en) Character processing device, method and program, and recording medium
JP2001101162A (en) Document processor and storage medium storing document processing program
CN106250354A (en) Process the information processor of document, information processing method and program
JP5123350B2 (en) Test case creation system, method and program
US20050102278A1 (en) Expanded search keywords
JP2001109740A (en) Device and method for preparing chinese document

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111011

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111013

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141021

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees