JPH11238056A - Predictive japanese input method/system and medium for programming/recording the method - Google Patents

Predictive japanese input method/system and medium for programming/recording the method

Info

Publication number
JPH11238056A
JPH11238056A JP10038990A JP3899098A JPH11238056A JP H11238056 A JPH11238056 A JP H11238056A JP 10038990 A JP10038990 A JP 10038990A JP 3899098 A JP3899098 A JP 3899098A JP H11238056 A JPH11238056 A JP H11238056A
Authority
JP
Japan
Prior art keywords
character string
reading
prediction
dictionary
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10038990A
Other languages
Japanese (ja)
Inventor
Yoshimi Saito
佳美 齋藤
Yumi Ichimura
由美 市村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10038990A priority Critical patent/JPH11238056A/en
Publication of JPH11238056A publication Critical patent/JPH11238056A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve the efficiency of document input and to easily input Japanese by precisely giving priority results obtained through automatically executing input/prediction from an arbitrary position during the input of a sentence and showing them to a user. SOLUTION: A segment part 107 takes out a partial character string group from a read character string which is inputted or prediction-supplemented, and a KANJI (Chinese character/KANA (Japanese character) notation where the partial character string taken out is forward-matched with the reading is retrieved at a retrieval part 108 by using a dictionary. Control parts 103, 110 and 111 assigns a priority order to the retrieved KANJI/KANA notation by using one of (1) frequency information on the KANJI/KANA notation character string and frequency information on at least a part of the partial character string of the reading character string, (2) frequency information on the reading character string, (3) likelihood information for respective KANJI/KANA notation characters and (4) likelihood information for respective reading character strings in a dictionary 109, and Japanese is predicted/inputted.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、日本語予測入力方
法ならびにシステム及び同方法がプログラムされ記録さ
れる記録媒体に関し、詳しくは、既に入力された文字を
手掛かりに、入力される文字列を予測し入力することの
できる日本語予測入力方法およびシステムならびに記録
媒体に係わる。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method and system for predicting and inputting Japanese language, and a recording medium on which the method is programmed and recorded. The present invention relates to a method and a system for predicting and inputting Japanese words and a recording medium that can be input.

【0002】[0002]

【従来の技術】最近、計算機上で文書を作成することは
ー般的となり、ワードプロセッサ等の専用機、あるいは
パーソナルコンピュータ等の汎用機の使用により、簡易
に文書を入力できるようになっている。特に近年は、計
算機上での文書の通信によるコミュニケーンョンもー般
化しつつあり、計算機上で文書を作成する機会は更に増
大している。
2. Description of the Related Art In recent years, it has become common to create a document on a computer, and a document can be easily input by using a dedicated machine such as a word processor or a general-purpose machine such as a personal computer. In particular, in recent years, communication through communication of documents on a computer has become generalized, and opportunities for creating documents on a computer have been further increased.

【0003】一方、技術の進歩によりコンピュータを始
めとする種々の電子装置は小型化し、携帯機器の普及が
著しい。携帯機器等においては、キーボード等の操作部
のサイズが小さいことなどから、文書の入力作業の負担
は大きく、ユーザの入力に関わる負担を軽減することが
望まれる。
[0003] On the other hand, various electronic devices such as computers have been downsized due to technological advances, and portable devices have been widely used. In a mobile device or the like, the size of an operation unit such as a keyboard is small, so that the burden of inputting a document is large, and it is desired to reduce the burden related to user input.

【0004】このような問題を解決するために、入力し
たい熟語の読みの先頭を入力し、それをキーとして入力
する熟語を検索して提示する文書入力装置( 特開昭60
−105029号) や、変換確定された単語に連接する
単語を検索提示するワードプロセッサ( 特開平1−26
0568) 、入力したい読みの先頭を入力し、それをキ
ーとして入力する読みを検索して提示するかな漢字変換
システム( 特開平8−147289) 等が知られてい
る。特開昭60−105029号では、熟語の読みの頻
度の情報を記憶し、これによって候補の優先順位付けを
行っている。特開平1−260568号では、過去の入
力履歴により候補の優先順位付けが行われている。特開
平8−147289号では、変換候補の単語の頻度情報
を記憶し、これによって候補の優先順位付けを行ってい
る。
[0004] In order to solve such a problem, a document input device for inputting the beginning of the idiom to be input and searching for and presenting the idiom to be input using the input as a key (Japanese Patent Application Laid-open No. Sho 60/1985).
(Japanese Patent Application Laid-Open No. 1-26).
[0568] A kana-kanji conversion system (Japanese Patent Laid-Open No. 8-147289) is known which inputs the beginning of a reading to be input, and searches for and presents the reading to be input using the key as a key. In Japanese Patent Application Laid-Open No. 60-105029, information on the frequency of reading idioms is stored, and the priorities of candidates are determined based on the information. In Japanese Patent Application Laid-Open No. 1-268568, priorities are assigned to candidates based on past input histories. In Japanese Patent Application Laid-Open No. 8-147289, frequency information of conversion candidate words is stored, and priorities are assigned to the candidates based on the frequency information.

【0005】[0005]

【発明が解決しようとする課題】しかし、上述した従来
の方法によればいずれも入力したい文字列の先頭が入力
されることを前提とし、これをキーに辞書を前方一致検
索して予測を行う仕組みとなっている。従って、文章の
入力中に任意の位置で、そこに続く入力を自動的に予測
できる仕組みを備えていないため、近年一般的となって
いる連文節入力での入力中に使用する際には、変換の途
中でー回変換キーを押す等入力操作を中断した後改めて
入力したい文字列の先頭を入力したり、あるいは、予測
を行いたい位置で予測検索を命令したり、といったキー
操作が必要となり、操作が繁雑となり、オペレータに負
担を強いていた。
However, according to the above-mentioned conventional methods, it is assumed that the head of a character string to be input is input, and the prediction is performed by using the key as a key to search the dictionary forward. It has a mechanism. Therefore, since there is no mechanism for automatically predicting the subsequent input at an arbitrary position during input of a sentence, when using it during input of continuous phrase input, which has become common in recent years, conversion After interrupting the input operation, such as pressing the conversion key-times in the middle of, the key operation such as inputting the beginning of the character string to be input again or instructing a prediction search at the position where prediction is desired is required, The operation became complicated, and the operator was burdened.

【0006】一方、入力中の任意の位置から予測を行う
ためには、従来の単語やその読みの頻度情報のみで予測
候補間の優先順位付けを精度よく行うことは困難であ
り、任意の箇所での自動的な予測は実用上困難であっ
た。特に予測候補を上位の数個に限って表示するような
制御には向かず、予測候補間の優先順位付けのための新
しい方式の開発が必要であった。
On the other hand, in order to perform prediction from an arbitrary position during input, it is difficult to accurately perform prioritization between prediction candidates using only conventional words and their reading frequency information. It was difficult in practice to make automatic predictions. In particular, it is not suitable for control of displaying only the top several prediction candidates, and it is necessary to develop a new method for prioritizing prediction candidates.

【0007】本発明は上記事情に鑑みてなされたもので
あり、ユーザの入力中、および予測補完の後の任意の箇
所で、白動的に高精度な予測を行い、ユーザにわかりや
すく提示する、日本語予測入力方法ならびにシステム及
び同方法がプログラムされ記録される記録媒体を提供す
ることを目的とする。
The present invention has been made in view of the above circumstances, and performs highly accurate white dynamic prediction during user input and at any point after prediction complementation, and presents it to the user in an easy-to-understand manner. It is an object of the present invention to provide a method and system for inputting Japanese prediction and a recording medium on which the method is programmed and recorded.

【0008】[0008]

【課題を解決するための手段】本発明の日本語予測入力
方法は、読み文字列を入力し、この入力あるいは予測補
完された読み文字列から少なくとも一部の部分文字列群
を取り出し、取り出された部分文字列と読みが前方一致
する漢字かな表記を辞書を用いて検索し、(1)前記辞書
中にある漢字かな表記文字列に対する頻度情報と読み文
字列の部分文字列の少なくともー部に対する頻度情報を
用い、あるいは(2) 前記辞書中にある読み文字列の部分
文字列の少なくともー部に対する頻度情報を用いて検索
された漢字かな表記の優先順位付けを行ない日本語予測
入力することを特徴とする。また、(3) 辞書中にある漢
字かな表記文字列に対する、前方一致した読み文子列毎
の尤度情報を用いて(4) あるいは、読み文字列の部分文
字列の少なくともー部に対する頻度情報を用いて検索さ
れた漢字かな表記の優先順位付けを行ない日本語予測入
力することも特徴とする。
According to the present invention, there is provided a method for inputting Japanese predictive characters, comprising inputting a reading character string, extracting at least a partial character string group from the input or predicted and complemented reading character string. A dictionary is used to search for a kanji kana notation whose pronunciation is in front of the partial character string, and (1) frequency information for the kanji kana notation character string in the dictionary and at least a part of the partial character string of the reading character string. Using frequency information, or (2) prioritizing kanji kana notation searched using frequency information for at least a part of a partial character string of a read character string in the dictionary and performing Japanese prediction input. Features. In addition, (3) using the likelihood information for each kanji character string in the dictionary that matches the leading part of the reading sentence string using (4) or frequency information for at least a part of the partial character string of the reading character string. It is also characterized by prioritizing the retrieved Kanji Kana notation and inputting Japanese prediction.

【0009】本発明の日本語予測入力システムは、日本
語文のー部を構成する漢字かな表記およびその読み文字
列を記憶した辞書と、読み文字列を入力する手段と、入
力あるいは予測補完された読み文字列から部分文字列群
のー部または全部を取り出す手段と、取り出された部分
文字列と読みが前方一致する漢字かな表記を前記辞書か
ら検索する手段と、(1) 前記辞書中にある漢字かな表記
文字列に対する頻度情報と、読み文字列の部分文字列の
ー部または全部に対する頻度情報を用い、(2)あるい
は、前記辞書中にある読み文字列の部分文字列のー部ま
たは全部に対する頻度情報を用いて検索された漢字かな
表記の優先順位付けする手段とを具備することを特徴と
する。また、(3) 前記辞書中にある漢字かな表記文字列
に対する、前方一致した読み文字列毎の尤度情報を用い
て(4) 読み文字列に対する、前方一致した読み文字列毎
の尤度情報を用いて検索された漢字かな表記の優先順位
付けを行う手段とを具備することも特徴とする。
According to the present invention, there is provided a Japanese predictive input system comprising: a dictionary storing Kanji Kana notation constituting a part of a Japanese sentence and a reading character string thereof; a means for inputting a reading character string; Means for extracting part or all of the partial character string group from the read character string, means for searching the dictionary for a kanji kana notation whose reading matches the extracted partial character string in front of the character string, and (1) which is included in the dictionary. Using the frequency information for the Kanji Kana written character string and the frequency information for the part or all of the partial character string of the reading character string, (2) or the part or all of the partial character string of the reading character string in the dictionary Means for prioritizing kanji kana notations searched using the frequency information for. Also, (3) using likelihood information for each of the read character strings that match forward with respect to the kanji kana written character string in the dictionary, (4) likelihood information for each of the read character strings that match forward with respect to the read character string Means for prioritizing the kanji kana notation searched by using.

【0010】本発明の記録媒体は、既に入力した文字を
手掛かりに入力される文字列を予測し、入力する日本語
予測入力システムにおいて用いられ、入力される読み文
字列を取り込むステップと、取り込まれた読み文字列あ
るいは予測補完された読み文字列から少なくとも一部の
部分文字列群を切り出すステップと、切り出された部分
文字列と読みが前方一致する漢字かな表記を辞書を用い
て検索するステップと、(1) 前記辞書中にある漢字かな
表記文字列に対する頻度情報と読み文字列の部分文字列
の少なくともー部に対する頻度情報、もしくは前記辞書
中にある読み文字列の少なくとも一部に対する頻度情報
を用いて検索された漢字かな表記の優先順位付けを行な
うステップ、あるいは、(2) 前記辞書中にある漢字かな
表記文字列に対する前方一致した読み文字列毎の尤度情
報、もしくは前記辞書中にある読み文字列に対する前方
一致した読み文字列毎の尤度情報を用いて検索された漢
字かな表記の優先順位付けを行なうステップとがプログ
ラムされ記録されることを特徴とする。
The recording medium of the present invention is used in a Japanese predictive input system for predicting and inputting a character string to be input based on already input characters, and a step of capturing an input reading character string. Extracting at least a partial character string group from the read character string or the predicted and complemented read character string, and using a dictionary to search for a kanji kana notation in which the cut-out partial character string and the reading match in front. (1) frequency information for the kanji kana written character string in the dictionary and frequency information for at least a part of the partial character string of the read character string, or frequency information for at least a part of the read character string in the dictionary. Prioritizing the kanji kana notation searched by using, or (2) the kanji kana notation character string in the dictionary Prioritizing the kanji kana notation searched using the likelihood information for each reading character string that matches each other, or the likelihood information for each reading character string that matches forward with respect to the reading character string in the dictionary; Is programmed and recorded.

【0011】このことにより、文章入力中の任意の位置
から自動的に入力予測を行った結果を高精度に優先順位
付けしてユーザに呈示することができ、文書入力の効率
が向上し、簡易に日本語入力を行うことができる。
[0011] As a result, the result of automatically predicting the input from an arbitrary position in the text input can be given to the user with high accuracy prioritized and presented to the user. Can input Japanese.

【0012】[0012]

【発明の実施の形態】図1は、本発明の日本語予測入力
システムの実施形態を示すブロック図である。
FIG. 1 is a block diagram showing an embodiment of a Japanese predictive input system according to the present invention.

【0013】図において、101は入力部、102は制
御部、103は予測制御部、104はかな漢字変換部、
105はかな漢字変換辞書検索部、106はかな漢字変
換辞書、107は読み文字列切り出し部、108は予測
辞書検索部、109は予測辞書、110は予測候補評価
部、111は予測候補絞り込み部、112は出力部であ
る。
In the figure, 101 is an input unit, 102 is a control unit, 103 is a prediction control unit, 104 is a kana-kanji conversion unit,
105 is a kana-kanji conversion dictionary search unit, 106 is a kana-kanji conversion dictionary, 107 is a reading character string cutout unit, 108 is a prediction dictionary search unit, 109 is a prediction dictionary, 110 is a prediction candidate evaluation unit, 111 is a prediction candidate narrowing unit, and 112 is a prediction candidate narrowing unit. Output unit.

【0014】入力部101からは、読み情報をはじめと
する、ユーザからの種々の操作情報が取り込まれる。取
り込まれた情報は、制御部102に送られて解析された
後、必要な各処理部への情報として渡される。各処理部
の処理結果はまた制御部102に返され、漢字かな混じ
り文字列ほか必要な情報は出力部112を通して出力さ
れる。入力された情報のうち読み情報は制御部102か
ら、まず予測制御部103に渡される。取り込まれた情
報は、予測制御部103で解析された後、必要な各処理
部への情報として渡される。各処理部の処理結果はまた
予測制御部103に返されて、もうー度予測制御部10
3で処理された後、予測された漢字かな表記および読み
文字列ほか、必要な情報は制御部102に返される。予
測制御部103以下の処理については後に詳述する。
From the input unit 101, various operation information from the user, including reading information, is taken in. The acquired information is sent to the control unit 102 and analyzed, and then passed as necessary information to each processing unit. The processing result of each processing unit is also returned to the control unit 102, and necessary information such as a character string mixed with kanji and kana is output through the output unit 112. The reading information of the input information is first passed from the control unit 102 to the prediction control unit 103. The fetched information is analyzed by the prediction control unit 103 and then passed as necessary information to each processing unit. The processing result of each processing unit is also returned to the prediction control unit 103, and the prediction control unit 10
After the processing in step 3, the required information, such as the predicted kanji kana notation and the read character string, is returned to the control unit 102. The processes after the prediction control unit 103 will be described later in detail.

【0015】次に、制御部102は、入力された読み情
報と予測された漢字かな表記を、例えばディスプレー画
面に表示する等ユーザに提示する情報として出力する。
ここでユーザが表示される情報に従い入力した、表示さ
れた予測候補の採用/不採用、所望の候補の選択等の操
作情報は入力部101から取り込まれ、制御部102に
送られる。制御部102のこの部分の処理については後
に詳述する。また制御部102は、かな漢字変換処理を
行うことが指示された場合、またはあらかじめ変換処理
に入ることが定められている文字が入力された場合、ま
たは入力予測の結果がユーザに採用された場合、入力さ
れた読み情報と、もしそれに連続する予測補完された読
み文字列がある場合にはその読み文字列とを、かな漢字
変換部104に送る。制御部102のこの部分の処理に
ついては後に詳述する。
Next, the control unit 102 outputs the input reading information and the predicted kanji kana notation as information to be presented to the user, for example, by displaying it on a display screen.
Here, operation information input by the user according to the displayed information, such as adoption / non-adoption of the displayed prediction candidate, selection of a desired candidate, etc., is taken in from the input unit 101 and sent to the control unit 102. The processing of this part of the control unit 102 will be described later in detail. Also, the control unit 102, when instructed to perform the kana-kanji conversion process, when a character that is determined to enter the conversion process in advance is input, or when the result of the input prediction is adopted by the user, The input reading information and, if there is a predicted and complemented reading character string that follows it, are sent to the kana-kanji conversion unit 104. The processing of this part of the control unit 102 will be described later in detail.

【0016】かな漢字変換部104では、かな漢字変換
辞書検索部105によりかな漢字変換辞書106を参照
しながら、制御部102より送られてきた読み文字列を
漢字かな混じり文字列に変換する。かな漢字変換の方法
は広く公知であるので、ここでは言及しない。変換結果
は、制御部102を通じて出力部112から出力され、
例えばディスプレーに表示される。ユーザは表示された
情報に従い、引き続き読み文字列の入力を行ったり、所
望の漢字かな表記を確定するなどの操作を行う。
The kana-kanji conversion unit 104 converts the read character string sent from the control unit 102 into a kana-kana-kana mixed character string while referring to the kana-kanji conversion dictionary 106 by the kana-kanji conversion dictionary search unit 105. Since the kana-kanji conversion method is widely known, it will not be described here. The conversion result is output from the output unit 112 through the control unit 102,
For example, it is displayed on the display. In accordance with the displayed information, the user performs operations such as inputting a reading character string or determining a desired Kanji Kana notation.

【0017】ここで、更に、制御部102は、引き続き
入力された読み文字列を、予測制御部103に送る。こ
の時、制御部102は入力された読み文字列の他、もし
それに連続する予測補完された読み文字列がある場合に
はその読み文字列を合わせ、予測制御部103に送る。
制御部102のこの部分の処理については後に詳述す
る。
Here, the control unit 102 sends the continuously input character string to the prediction control unit 103. At this time, in addition to the input read character string, if there is a predictive and complemented read character string continuous with the input read character string, the control unit 102 combines the read character strings and sends the read character string to the prediction control unit 103.
The processing of this part of the control unit 102 will be described later in detail.

【0018】このように一連のユーザ操作とシステムの
処理により、日本語文の入力が完了する。以上が本発明
の日本語予測入力システムによる処理の流れの概要であ
る。
As described above, the input of the Japanese sentence is completed by a series of user operations and the processing of the system. The above is the outline of the processing flow by the Japanese predictive input system of the present invention.

【0019】次に、予測制御部103以下の処理の流れ
の概要を図1を用いて説明する。
Next, an outline of the flow of processing after the prediction control unit 103 will be described with reference to FIG.

【0020】予測制御部103では、制御部102から
受け取った読み文字列を、読み文字列切り出し部107
に送る。読み文字列切り出し部107では、受け取った
読み文字列から、予測辞書検索に必要な部分文字列を幾
つか切り出し、予測制御部103に返す。次に、予測制
御部103は、それぞれの読み文字列を予測辞書検索部
108に送る。予測辞書検索部108は、予測辞書10
9中に登録されている見出し語に対応している読み情報
に対して前方一致検索を行い、前方一致する見出し語の
漢字かな表記とその読み情報および付属する各種情報、
例えば品詞や頻度の情報を取り出して予測制御部103
に返す。次に、予測制御部103はそれぞれの予測候補
( 見出し語) を予測候補評価部110に送る。
The prediction control unit 103 converts the read character string received from the control unit 102 into a read character string cutout unit 107.
Send to The read character string cutout unit 107 cuts out some partial character strings necessary for predictive dictionary search from the received read character string, and returns the partial character strings to the prediction control unit 103. Next, the prediction control unit 103 sends each read character string to the prediction dictionary search unit 108. The prediction dictionary search unit 108 outputs the prediction dictionary 10
A head-match search is performed on the reading information corresponding to the headword registered in No. 9, and the kanji kana notation of the headword matching the head word and its reading information and various attached information are obtained.
For example, the information of the part of speech and the frequency is taken out and the prediction control unit 103
To return. Next, the prediction control unit 103 sets each prediction candidate
(Headword) to the prediction candidate evaluation unit 110.

【0021】予測候補評価部110は送られてきた見出
し語に対し、付属する各種情報により各種評価点を算出
・付与し、さらにそれらを代表する代表評価点を算出・
付与して予測制御部103に返す。次に、予測制御部1
03は、各予測候補の各種評価点を予測候補絞り込み部
111に送る。予測候補絞り込み部111は、各種評価
点に対して設定可能な閾値を参照し、各種評価点が設定
されている閾値以上の候補のみを選別して、判別結果を
予測制御部103に返す。予測制御部103では予測候
補絞り込み部111の判別条件を満たした候補を代表評
価点順にソートし上位の候補を制御部102に送る。
The prediction candidate evaluation unit 110 calculates and assigns various evaluation points to the sent headwords based on various kinds of attached information, and further calculates and calculates representative evaluation points representative of them.
And returns it to the prediction control unit 103. Next, the prediction control unit 1
03 sends the various evaluation points of each prediction candidate to the prediction candidate narrowing unit 111. The prediction candidate narrowing unit 111 refers to thresholds that can be set for various evaluation points, selects only candidates that are equal to or larger than the threshold for which various evaluation points are set, and returns a determination result to the prediction control unit 103. The prediction control unit 103 sorts the candidates satisfying the determination conditions of the prediction candidate narrowing unit 111 in the order of the representative evaluation points, and sends the upper candidate to the control unit 102.

【0022】次に、上述した各処理の詳細をフローチャ
ートならびに表を用いて説明する。
Next, the details of each of the above-described processes will be described with reference to flowcharts and tables.

【0023】まず、図2のフローチャートを用いて、読
み文字列切り出し部107の処理の流れを説明する。最
初に、ステップ201で読み文字列リストを初期化す
る。次にステップ202で読み文字列バッファを初期化
する。ステップ203で、予測制御部103から受け取
った読み文字列を読み文字列バッファに記憶する。ステ
ップ204で、読み文字列バッファに記憶されている文
字列の長さを変数lenにセットする。ステップ205
で、変数iを0、変数startを1とする。ステップ
206で、変数startの値と変数lenの値を比較
し、変数startの値が変数lenの値以下であれ
ば、ステップ207に進む。ステップ207では、読み
文字列バッファ中の文字列の、第start番目の文字
から、第len番目の文字までを、読み文字列リストの
第i番目の要素にコピーし、ステップ208に進む。ス
テップ208では、変数iと変数startをそれぞれ
1加算し、ステップ206に戻る。
First, the flow of processing of the read character string cutout unit 107 will be described with reference to the flowchart of FIG. First, in step 201, a reading character string list is initialized. Next, in step 202, the reading character string buffer is initialized. In step 203, the read character string received from the prediction control unit 103 is stored in the read character string buffer. In step 204, the length of the character string stored in the read character string buffer is set in a variable len. Step 205
Then, the variable i is set to 0 and the variable start is set to 1. In step 206, the value of the variable start is compared with the value of the variable len. If the value of the variable start is equal to or less than the value of the variable len, the process proceeds to step 207. In step 207, the characters from the first character to the lenth character of the character string in the reading character string buffer are copied to the ith element of the reading character string list, and the process proceeds to step 208. In step 208, the variable i and the variable start are each incremented by 1, and the process returns to step 206.

【0024】一方、ステップ206で、変数start
の値が変数lenの値より大きい時には処理を終了す
る。以上の処理によって受け取った読み文字列から、そ
の読み文字列の最後尾の文字を含むような部分読み文字
列が、読み文字列リスト中に格納される( 読み文字列リ
ストに格納されているのは、それぞれ、受け取った読み
文字列の最後尾の文字を含む部分読み文字列である) 。
On the other hand, in step 206, the variable start
Is larger than the value of the variable len, the process ends. From the reading character string received by the above processing, a partial reading character string including the last character of the reading character string is stored in the reading character string list (the reading character string is stored in the reading character string list. Are partial reading strings that include the last character of the received reading string, respectively.)

【0025】図3は、読み文字列リストのフォーマット
と、その処理結果の例を示す。これは、予測制御部10
3から「かなかんじへん」という読み文字列を受け取っ
た時の処理の結果である。番号の欄が、図2に示すフロ
ーチャートの変数iにあたる番号で、部分読み文字列の
欄が、ステップ207で記憶された部分読み文字列であ
る。例えば、第2番目の読み文字列リストには、「かな
かんじへん」という読み文字列の部分読み文字列である
「かんじへん」という文字列が格納されている。
FIG. 3 shows an example of the format of the read character string list and the processing result. This is the prediction control unit 10
This is the result of processing when a reading character string “Kanakanji” is received from No.3. The column of numbers is the number corresponding to the variable i in the flowchart shown in FIG. 2, and the column of partial reading character strings is the partial reading character string stored in step 207. For example, the second reading character string list stores a character string "kanjihen" which is a partial reading character string of the reading character string "kanakanhen".

【0026】図4に、予測辞書109に登録されている
情報の一実施形態を示す。予測辞書109には、読み情
報、漢字かな表記情報、品詞情報、表記頻度情報、読み
頻度情報がそれぞれ記憶されている。例えば、「かな漢
字変換」という表記に対しては、「かなかんじへんか
ん」という読み、“サ変”という品詞が付与されてお
り、また表記の頻度を表す数値として“60”、読みの
頻度を表す数値として“12980,890,230,
90,80,80,80,80”が付与されている。こ
こで表記頻度情報“60”は、「かな漢字変換」という
表記が使用される頻度を示す数値であり、具体的には例
えば、あるコーパス中で「かな漢字変換」という表記の
出現した回数などで代表することができる。また、読み
頻度情報は、それぞれ、“ , ”で区切られており、
この例では「かなかんじへんかん」という9文字の読み
に対しその部分文字列8個に対する8個の数値が付与さ
れていて、第1番目の“12980”は「かな」という
部分読み文字列の頻度、第2番目の“890”は「かな
か」という読みの頻度、以降、“230”は「かなか
ん」、“90”は「かなかんじ」、“80”は「かなか
んじへ」、次の“80”は「かなかんじへん」、次の
“80”は「かなかんじへんか」、次の“80”は「か
なかんじへんかん」という読みの使用される頻度を示す
数値であり、具体的には例えばあるコーパスに対する読
みを付与したコーパス中で「かな」「かなか」「かなか
ん」などの文字列の出現した回数等で代表することがで
きる。
FIG. 4 shows an embodiment of the information registered in the prediction dictionary 109. The prediction dictionary 109 stores reading information, kanji kana notation information, part of speech information, notation frequency information, and reading frequency information. For example, for the notation “kana-kanji conversion”, the reading “kanakanjihenkan” and the part of speech “sa-hen” are given, and the numerical value representing the notation frequency is “60”, indicating the reading frequency. "12980, 890, 230,
90, 80, 80, 80, 80 ". Here, the notation frequency information" 60 "is a numerical value indicating the frequency at which the notation" kana-kanji conversion "is used. It can be represented by the number of times the notation “kana-kanji conversion” appears in the corpus. In addition, the reading frequency information is delimited by “,”, respectively.
In this example, nine readings of “Kanakanjihenkan” are assigned with eight numerical values for eight partial character strings, and the first “12980” is a partial reading character string of “Kana”. Frequency, the second “890” is the reading frequency of “Kanaka”, and thereafter “230” is “Kanakan”, “90” is “Kanakan”, “80” is “Kanakanji”, and the next “80” is a numerical value indicating the frequency of reading “Kanakanjikan”, the next “80” is “Kanakanjikan”, and the next “80” is a numerical value indicating the frequency of reading “Kanakanjikan”. Specifically, for example, it can be represented by the number of appearances of a character string such as “Kana”, “Kanaka”, “Kanakan”, etc. in a corpus to which a certain corpus is given a reading.

【0027】以下、同様に、「神奈川県」という表記に
対して「かながわけん」という読み、「地名」という品
詞、“1050”という「神奈川県」という表記の頻
度、「かながわけん」という読みに対する部分読み文字
列「かな」「かなが」「かながわ」「かながわけ」「か
ながわけん」に対するそれぞれの頻度情報“1298
0”、“1720”、“1590”、“1050”、
“1050”が、「株式会社」という表記に対してまた
それぞれの情報が、というように各々の情報がそれぞれ
登録されている。
Similarly, for the notation "Kanagawa prefecture", the pronunciation of "Kanakawa prefecture", the part of speech of "place name", the frequency of the notation "1050" of "Kanagawa prefecture", and the reading of "Kanagawa prefecture" The respective frequency information “1298” for the partial reading character strings “kana”, “kanaga”, “kanagawa”, “kanakaze”, and “kanagahan”
0 "," 1720 "," 1590 "," 1050 ",
“1050” is registered as “stock company”, and the respective information is registered.

【0028】予測辞書109に登録する情報の別の実施
形態を図5に示す。この例では、「読み」「表記」「品
詞」「表記頻度」の各情報は、図4に示した予測辞書と
同様であるが、図4に示す予測辞書と異なり、「読み頻
度情報」の代わりに「確率情報」を付与してある。これ
は、各々の部分読み文字列の頻度の代わりに、その部分
読み文字列が出現した時に対応する表記が出現する確率
(条件付き確率)をベイズの公式等に従って求めたもの
である。この例では、先にあげた図4の例で、表記頻度
情報を、各々の部分読み文字列頻度情報の数値で割って
百分率で表示したものが、図5に示す確率情報となって
いる。例えば、「かな漢字変換:かなかんじへんかん」
に対して“60”をそれぞれ“12980”、“89
0”、“230”、“90”、“80”、“80”、
“80”、“80”で割った値を100倍して小数点以
下を四捨五入した値が、“0”、“7”、“26”、
“67”、“75”、“75”、“75”、“75”で
ある。これらはそれぞれ「かな」「かなか」「かなか
ん」「かなかんじ」「かなかんじへ」「かなかんじへ
ん」「かなかんじへんか」「かなかんじへんかん」とい
う読みが出現した時に「かな漢字変換」という表記が出
現する確率の近似値として以降の処理で用いることがで
きる。
FIG. 5 shows another embodiment of the information registered in the prediction dictionary 109. In this example, the information of “reading”, “notation”, “part of speech”, and “notation frequency” are the same as the prediction dictionary shown in FIG. 4, but different from the prediction dictionary shown in FIG. Instead, “probability information” is added. In this method, instead of the frequency of each partial reading character string, a probability (conditional probability) that a corresponding notation appears when the partial reading character string appears according to Bayes' formula or the like. In this example, the probability information shown in FIG. 5 is obtained by dividing the notation frequency information by the numerical value of each partial reading character string frequency information and displaying the result as a percentage in the example of FIG. 4 described above. For example, "kana-kanji conversion: kanakanjihenkan"
To "12980" and "89" respectively.
0 "," 230 "," 90 "," 80 "," 80 ",
Values obtained by multiplying the value obtained by dividing by “80” and “80” by 100 and rounding the decimal point are “0”, “7”, “26”,
"67", "75", "75", "75", "75". These are `` Kana-Kanji conversion '' when the readings `` Kana '', `` Kanakan '', `` Kanakan '', `` Kanakanji '', `` Kanakanji '', `` Kanakanjihen '', `` Kanakanjihenka '' and `` Kanakanjihenkan '' appear, respectively. Can be used in subsequent processing as an approximate value of the probability of appearance.

【0029】図6に、予測辞書検索部108により、図
5に示した予測辞書109を前方一致検索した結果を格
納した辞書検索結果リストの例を示す。図6の(a)
は、「かなかんじへん」という読み文字列情報により辞
書検索を行った結果の格納例である。図5に示した予測
辞書中には「かなかんじへん」という読み文字列で始ま
る(=前方一致検索の条件に該当する) 見出しは「かな漢
字変換」という見出しのみであるため、リストには1項
目のみが格納される。リスト中の、読み、表記、品詞、
表記頻度情報、確率情報は、辞書中の情報のコピーであ
り、一致長さ情報は、前方一致検索でー致した読み文字
列の長さ、即ち、この場合は「かなかんじへん」という
読みの長さを格納している。図6の(b)は「へん」と
いう読み文字列情報により辞書検索を行った結果の格納
例である。同じく該当する見出しは、「変換装置」のみ
であるため、リストには1項目が格納される。一致長さ
情報は前方一致した読み「へん」の長さである。図6の
(c)は「かな」という読み文字列情報により辞書検索
を行った結果の格納例である。この場合、該当する見出
しは、「かな漢字変換」と「神奈川県」の2つがあるた
め、2項目がリストに格納される。
FIG. 6 shows an example of a dictionary search result list in which the results of forward matching search of the prediction dictionary 109 shown in FIG. 5 by the prediction dictionary search unit 108 are stored. FIG. 6 (a)
Is a storage example of the result of performing a dictionary search based on the read character string information “Kanakanji”. In the predictive dictionary shown in FIG. 5, the heading that starts with the reading character string “Kanakanjihen” (= corresponding to the condition of the prefix search) is only one heading “Kana-Kanji conversion”, so one item is included in the list. Only is stored. Reading, notation, part of speech,
The notation frequency information and the probability information are copies of the information in the dictionary, and the match length information is the length of the read character string found by the prefix search, that is, in this case, the reading of "kanakanjihen" Stores the length. FIG. 6B is an example of storing a result of a dictionary search using the read character string information “Hen”. Similarly, since the corresponding heading is only “conversion device”, one item is stored in the list. The matching length information is the length of the reading “unsatisfactory” that matches the beginning. FIG. 6C is an example of storing a result of a dictionary search using the read character string information “kana”. In this case, since there are two corresponding headings, “Kana-Kanji conversion” and “Kanagawa prefecture”, two items are stored in the list.

【0030】次に、図7に示すフローチャートを用いて
予測制御部103の処理の流れを説明する。はじめにス
テップ701で、制御部102から受け取った読み文字
列を、読み文字列切り出し部107に送り、ステップ7
02で、結果の読み文字列リストと、部分読み文字列の
個数、例えば、図3に示したリストでは7(=即ち、図2
のフローチャートではiの値) を受け取り、変数max
に部分読み文字列の個数、即ち、部分読み文字列リスト
の項目数を代入する。次にステップ703に進み、変数
iに0を、変数cntに0を代入する。ステップ704
では、変数iと変数maxの値を比較し、変数iの値が
変数maxの値より小さければ、ステップ705へ進
む。変数iの値が変数max以上になったらステップ7
08に進む。ステップ705では、部分読み文字列リス
トの第i番目の読み文字列を、予測辞書検索部108に
送る。予測辞書検索部108では、先に説明したよう
に、送られてきた部分読み文字列により辞書を前方一致
検索し、検索結果を辞書検索結果リストに格納し、予測
制御部103に返す。例えば、図3にあげた部分読み文
字列リストの例では、第0番目の部分読み文字列「かな
かんじへん」が予測辞書検索部108に送られ、図6の
(a)に挙げたような検索結果リストが作成される。予
測制御部103はステップ706の処理に進み、検索結
果リストに格納されたn個の検索結果を、予測候補リス
トのcnt番目からcnt+n−1番目までに順にコピ
ーした後に、cntの値をn加算する。予測候補リスト
の形式例については後に説明する。次にステップ707
の処理に進み、変数iを1加算し、ステップ704の処
理に進む。先に述べたようにステップ704でのiとm
axの比較により条件が満たされている間はこのステッ
プ707までの処理が繰り返され、例えばi=5の時に
は「へん」という読みが予測辞書検索部108に送ら
れ、図6の(b)に挙げたような検索結果が作成され
る。
Next, the flow of processing of the prediction control unit 103 will be described with reference to the flowchart shown in FIG. First, in step 701, the read character string received from the control unit 102 is sent to the read character string cutout unit 107, and step 7 is executed.
02, the resulting read character string list and the number of partial read character strings, for example, 7 (= that is, FIG.
In the flowchart of the above, the value of i) is received and the variable max
To the number of partial reading character strings, that is, the number of items in the partial reading character string list. Next, the routine proceeds to step 703, where 0 is substituted for the variable i and 0 for the variable cnt. Step 704
Then, the value of the variable i is compared with the value of the variable max. If the value of the variable i is smaller than the value of the variable max, the process proceeds to step 705. Step 7 when the value of the variable i is equal to or greater than the variable max
Proceed to 08. In step 705, the i-th read character string in the partial read character string list is sent to the prediction dictionary search unit 108. As described above, the prediction dictionary search unit 108 performs a forward match search of the dictionary based on the sent partial reading character string, stores the search result in the dictionary search result list, and returns it to the prediction control unit 103. For example, in the example of the partial reading character string list shown in FIG. 3, the 0th partial reading character string “Kanakanjihen” is sent to the prediction dictionary search unit 108, and as shown in FIG. A search result list is created. The prediction control unit 103 proceeds to the process of step 706, copies n search results stored in the search result list in order from the cnt-th to the cnt + n-1-th in the prediction candidate list, and then adds the value of cnt by n. I do. An example of the format of the prediction candidate list will be described later. Next, step 707
, The variable i is incremented by 1, and the process proceeds to step 704. As described above, i and m in step 704 are used.
As long as the condition is satisfied by the comparison of ax, the processing up to step 707 is repeated. For example, when i = 5, the reading “Hen” is sent to the prediction dictionary search unit 108, and FIG. The search result as described above is created.

【0031】ここで図8に予測候補リストの例を示す。
予測候補リストのフォーマットは、図のように、それぞ
れの予測候補に対し、番号、読み、表記、品詞、表記頻
度情報、確率情報、一致長さ情報、尤度、有用度、po
int、判定の各情報で構成されている。このうち、読
み、表記、品詞、表記頻度情報、確率情報、一致長さ情
報は、辞書検索結果リストからコピーするものであり、
尤度、有用度、point、判定の各情報は、ステップ
708以降で付与されるものである。図8の例では、ま
ず図7でi=0の時にステップ706で図6の(a)の
情報が図8の第1番目にコピーされ、i=5の時に同じ
くステップ706で図6の(b)の情報が図8の第2番
目にコピーされる。iの値が1,2,4,6の時には予
測辞書109中に該当する見出しが登録されていないの
で検索の結果n=0となり、予測候補リストには何も格
納されない。以上の処理により、図7のステップ708
までに、図8に示したような予測候補リストが作成され
ている。
FIG. 8 shows an example of the prediction candidate list.
As shown in the figure, the format of the prediction candidate list is, for each prediction candidate, the number, reading, notation, part of speech, notation frequency information, probability information, match length information, likelihood, usefulness, and po.
It is composed of information of int and judgment. Of these, reading, notation, part of speech, notation frequency information, probability information, and match length information are copied from the dictionary search result list,
Information on likelihood, usefulness, point, and determination is given in step 708 and subsequent steps. In the example of FIG. 8, first, when i = 0 in FIG. 7, the information of FIG. 6A is copied first in FIG. 8 at step 706, and when i = 5, the information of FIG. The information of b) is copied second in FIG. When the value of i is 1, 2, 4, or 6, the corresponding headline is not registered in the prediction dictionary 109, so that the search result is n = 0, and nothing is stored in the prediction candidate list. By the above processing, step 708 in FIG.
By now, the prediction candidate list as shown in FIG. 8 has been created.

【0032】図7に戻りステップ708以降の処理を説
明する。ステップ704で条件が満たされなくなるとス
テップ708に進み、変数jに0が代入される。次にス
テップ709で変数jと変数cntの値を比較し、も
し、jが小さければステップ710の処理に進む。ステ
ップ710では、予測候補リストのj番目の候補を予測
候補評価部110に送り、結果を予測候補リストに書き
込んだ後、同じく結果を予測候補絞り込み部111に送
り、判別結果を再び予測候補リストに書き込む。例え
ば、図9の(a)は、図8の予測候補リストの第1番目
の情報を予測候補評価部110に送り、送られた結果を
リストに書き込んだ例である。また、(b)は、予測候
補絞り込み部111に情報を送り結果を書き込んだ例で
ある。
Returning to FIG. 7, the processing after step 708 will be described. If the condition is not satisfied in step 704, the process proceeds to step 708, where 0 is substituted for the variable j. Next, in step 709, the values of the variable j and the variable cnt are compared. If j is smaller, the process proceeds to step 710. In step 710, the j-th candidate in the prediction candidate list is sent to the prediction candidate evaluation unit 110, and the result is written in the prediction candidate list. Write. For example, FIG. 9A shows an example in which the first information of the prediction candidate list in FIG. 8 is transmitted to the prediction candidate evaluation unit 110, and the transmitted result is written in the list. (B) is an example in which information is sent to the prediction candidate narrowing unit 111 and the result is written.

【0033】ここで、図11に示すフローチャートを用
いて予測候補評価部110の処理の流れを説明する。は
じめにステップ1101で、予測制御部107から送ら
れてきた予測候補情報のうち候補の読み文字列の長さを
調べ、変数lenに代入する。例えば、図8の第1番目
の予測候補が送られてきている場合、lenは「かなか
んじへんかん」の長さであるので、len=9となる。
次にステップ1102で、変数baseに、同じく送ら
れてくる予測候補からー致長さ情報を取り出し、代入す
る。例えば図8の第1番目の候補の場合、base=7
となる。ステップ1103では、予測候補リストの該当
する“尤度”の欄に、確率情報の(base−1)番目
の値を代入する。例えば、図8の第1番目の予測候補の
場合、“尤度は、“0”“7”“26”“67”“7
5”“75”“75”“75”の5番目の値である“7
5”となる。この時、図4の形式の予測辞書を用いてい
る場合には、ここで“尤度”の値を計算する。即ち、表
記頻度の値を、読み頻度情報の(base−1)番目の
値で割ったものを100倍した値を“尤度”に代入す
る。
Here, the flow of processing of the prediction candidate evaluation unit 110 will be described with reference to the flowchart shown in FIG. First, in step 1101, the length of a candidate read character string in the prediction candidate information sent from the prediction control unit 107 is checked and assigned to the variable len. For example, when the first prediction candidate in FIG. 8 has been sent, len = 9 because len is the length of “Kanakan Henkan”.
Next, in step 1102, the matching length information is extracted from the prediction candidate similarly sent to the variable base and substituted. For example, in the case of the first candidate in FIG.
Becomes In step 1103, the (base-1) -th value of the probability information is assigned to the corresponding "likelihood" column of the prediction candidate list. For example, in the case of the first prediction candidate in FIG. 8, “the likelihood is“ 0 ”“ 7 ”“ 26 ”“ 67 ”“ 7
"5", "75", "75"
At this time, if a prediction dictionary in the format of FIG. 4 is used, the value of “likelihood” is calculated here. That is, the value of the notation frequency is calculated as (base− 1) A value obtained by multiplying the value obtained by dividing the value by the 100th value by 100 is assigned to “likelihood”.

【0034】次に、ステップ1104では、与えられた
式で“有用度”=len−baseを計算し、予測候補
リストの該当する“有用度”の欄に代入する。例えば、
図8の第1番目の予測候補の場合は、9−7=2とな
る。次に、ステップ1105では、与えられた式に基づ
き、これらの評価点(“尤度”、“有用度”) を代表す
る代表評価点pointを計算する。pointは図1
1に示したような式で計算されるが、必要に応じて適宜
各項目に対する定数倍の値を変えるなど、種々の計算方
法が可能である。ここでは、この式を採用しているの
で、例えば図8の第1番目の予測候補に対しては、75
*10+60+2=752となる。図8の第2番目の候
補が送られてきた時にも同様の処理が行われ、結果とし
て図10(a)の第2番目の結果が得られる。
Next, at step 1104, "usefulness" = len-base is calculated by the given formula, and is substituted in the corresponding "usefulness" column of the prediction candidate list. For example,
In the case of the first prediction candidate in FIG. 8, 9−7 = 2. Next, in step 1105, a representative evaluation point representing these evaluation points (“likelihood” and “usefulness”) is calculated based on the given equation. Figure 1
Although it is calculated by the formula as shown in FIG. 1, various calculation methods are possible, such as changing the value of a constant multiple for each item as needed. Here, since this equation is adopted, for example, for the first prediction candidate in FIG.
* 10 + 60 + 2 = 752. Similar processing is performed when the second candidate in FIG. 8 is sent, and as a result, the second result in FIG. 10A is obtained.

【0035】ここで、図4に示した予測辞書は、辞書中
に表記頻度情報を保持しているが、これとは別に、辞書
中に表記頻度情報を保持しないことも可能である。この
場合、予測候補評価部110は、尤度の値の計算におい
て、読み頻度情報の最後の値を、読み頻度情報の(ba
se−1)番目の値で割ったものを100倍した値を
“尤度”に代入する。また、図5に示した予測辞書は、
辞書中の確率情報として表記頻度情報を部分読み文字列
の頻度情報で割った値の情報を保持しているが、これと
は別に見出しの読み頻度情報を、個々の部分読み文字列
の頻度情報で割った値の情報を保持することも可能であ
る。この場合、予測候補評価部110や、この尤度情報
を用いて評価を行う。
Here, the prediction dictionary shown in FIG. 4 holds the notation frequency information in the dictionary. Alternatively, the notation frequency information may not be held in the dictionary. In this case, the prediction candidate evaluation unit 110 replaces the last value of the reading frequency information with (ba
A value obtained by multiplying the value obtained by dividing the value by the (se-1) -th value by 100 is substituted for the “likelihood”. The prediction dictionary shown in FIG.
As the probability information in the dictionary, the information of the value obtained by dividing the notation frequency information by the frequency information of the partial reading character string is held, but separately from this, the reading frequency information of the heading is divided into the frequency information of each partial reading character string. It is also possible to hold the information of the value divided by. In this case, evaluation is performed using the prediction candidate evaluation unit 110 and the likelihood information.

【0036】これらの表記頻度情報を用いない方式で
は、尤度情報は、部分読み文字列に対する表記文字列の
尤度ではなく、部分読み文字列に対する見出し読み文字
列の尤度となるため、同音語が存在する場合や、見出し
読み文字列と同じ読み文字列となるような他の文節区切
りの存在する場合に、尤度情報の確信度が低くなるが、
予測辞書の見出しが、慣用表現のような句レベルの表現
であり十分長い読み文字列である場合には、見出しの読
み文字列の頻度情報と部分読み文字列の頻度情報のみで
も尤度情報として用いることができる。
In the method that does not use the notation frequency information, the likelihood information is not the likelihood of the notation character string for the partial reading character string but the likelihood of the headline reading character string for the partial reading character string. If there is a word, or if there is another segmentation break that results in the same reading character string as the heading reading character string, the likelihood of the likelihood information decreases,
If the heading of the prediction dictionary is a phrase-level expression such as an idiomatic expression and is a sufficiently long reading character string, only the frequency information of the heading reading character string and the partial reading character string can be used as the likelihood information. Can be used.

【0037】図12に示すフローチャートを参照して予
測候補絞り込みの処理の流れを説明する。はじめに、ス
テップ1201では、予測制御部103から送られてき
た尤度の情報に対して、その値とあらかじめ与えられて
いる値を比較する。ここでは尤度の値が10以上ならば
ステップ1202の処理に進み、10より小さいならば
ステップ1204の処理に進む。ステップ1202で
は、送られてきた有用度の情報に対して、その値とあら
かじめ与えられている値を比較する。ここでは有用度の
値が2以上ならばステップ1203の処理に進み、2よ
り小さいならばステップ1204の処理に進む。ステッ
プ1203では、判定結果を“○”として、予測制御部
103に返る。ステップ1204では、判定結果を
“×”として、予測制御部103に返る。この結果、図
8の予測候補リストの第1番目の候補に対しては、尤度
が10以上、有用度が2以上であるので判定“○”が与
えられ、第2番目の予測候補に対しては、尤度が10よ
り小さいため、判定“×”が与えられる。即ち、図11
のステップ1101で計算された尤度情報に対する下限
の値が設定され、尤度の値がこの下限以上である時の
み、予測候補とされる。また、図11のステップ110
2で計算された有用度情報、即ち、予測候補読み文字列
が与えられた部分読み文字列とー致した残りの読み文字
列の長さが、設定された下限値以上である時のみ、予測
候補とされる。
The flow of processing for narrowing down prediction candidates will be described with reference to the flowchart shown in FIG. First, in step 1201, the value of the likelihood information transmitted from the prediction control unit 103 is compared with a predetermined value. Here, if the likelihood value is 10 or more, the process proceeds to step 1202, and if it is smaller than 10, the process proceeds to step 1204. In step 1202, the value of the sent usefulness information is compared with a predetermined value. If the value of the usefulness is 2 or more, the process proceeds to step 1203. If the value is less than 2, the process proceeds to step 1204. In step 1203, the judgment result is returned to the prediction control unit 103 as “○”. In step 1204, the determination result is returned to the prediction control unit 103 as “x”. As a result, the likelihood is 10 or more and the usefulness is 2 or more, so that a judgment “” ”is given to the first candidate in the prediction candidate list in FIG. Therefore, the judgment “x” is given because the likelihood is smaller than 10. That is, FIG.
Is set as the lower limit value for the likelihood information calculated in step 1101, and only when the value of the likelihood is equal to or more than this lower limit is a candidate for prediction. Step 110 of FIG.
Only when the usefulness information calculated in step 2, ie, the length of the remaining reading character string that matches the partial reading character string of the predicted candidate reading character string, is equal to or greater than the set lower limit, the prediction is performed. Candidate.

【0038】ここで図7に戻り、ステップ712以降を
説明する。即ち、ステップ711までの処理により各予
測候補に対して各種評価点( 尤度、有用度) と代表評価
点pointが付与された後、ステップ709での判定
により処理がステップ712に進む。ここで、ステップ
712では、候補リスト中のうち、判定結果が○である
もののみを選び、pointの値の大きい順にソート
し、上位x個の情報をソート順に出力バッファに代入す
る。出力バッファの形式は、予測候補リストの形式と同
様であるので、ここでは省略する。ここでxは、例え
ば、1、3、10等の任意の正の整数であればよいが、
ここでは3であるとする。図10の(b)に示した予測
候補リストでは、判定が“○”であるものは第1番目の
予測候補1つのみであるので、この予測候補、即ち、表
記「かな漢字変換」他の情報を出力バッファにセットす
る。ステップ713では、出力バッファの情報が予測制
御部103から制御部102に送られる。
Returning to FIG. 7, steps 712 and thereafter will be described. That is, after various evaluation points (likelihood and usefulness) and a representative evaluation point are assigned to each prediction candidate by the processing up to step 711, the processing proceeds to step 712 by the determination in step 709. Here, in step 712, from the candidate list, only those having a judgment result of ○ are selected, sorted in ascending order of the value of point, and the top x pieces of information are assigned to the output buffer in the sorting order. Since the format of the output buffer is the same as the format of the prediction candidate list, the description is omitted here. Here, x may be any positive integer such as 1, 3, 10, etc.
Here, it is assumed to be 3. In the prediction candidate list shown in FIG. 10B, since only one first prediction candidate has a judgment of “○”, this prediction candidate, that is, information such as “Kana-Kanji conversion” Is set in the output buffer. In step 713, the information of the output buffer is sent from the prediction control unit 103 to the control unit 102.

【0039】次に、図13を用いて予測辞書に登録され
る情報の別の実施形態を説明する。
Next, another embodiment of the information registered in the prediction dictionary will be described with reference to FIG.

【0040】この形式では、図4、図5に示した予測辞
書と、読み、表記、品詞、表記頻度情報の部分は同様で
ある。次の、予測開始文字列長情報が、この形態の特徴
であるが、これは予測辞書検索部が辞書検索を行う際
に、受け取った部分読み文字列と前方一致すべき読み文
字数の下限値を各登録見出し毎に設定しているものであ
る。具体的には、図5の確率情報の欄の値が10以上と
なるカラムの序数+1、即ち、確率情報が10以上にな
る読み文字数を与えている。即ちこの場合、予測辞書に
は、読み頻度情報、確率情報は付与されておらず、代わ
りに予測開始文字列長情報が付与されている。
In this format, the parts of reading, notation, part of speech, and notation frequency information are the same as the prediction dictionaries shown in FIGS. The following prediction start character string length information is a feature of this mode. When the predictive dictionary search unit performs a dictionary search, the lower limit value of the number of characters to be read ahead of the received partial read character string is set. This is set for each registered headline. Specifically, the ordinal number of the column in which the value of the probability information column in FIG. 5 is 10 or more, that is, the number of characters to be read in which the probability information is 10 or more is given. That is, in this case, the reading frequency information and the probability information are not added to the prediction dictionary, but the prediction start character string length information is added instead.

【0041】次に、図14を用いて、図13に示す実施
形態をとる予測辞書を用いる場合の、予測辞書検索部1
08の処理の流れを説明する。まずステップ1401で
予測制御部103より受け取った読み文字列をキーとし
て予測辞書に通常の前方一致検索を行い、候補すべてを
バッファにコピーする。バッファの形式は図6に示した
検索結果リストと同様であるのでここでは省略するが、
確率情報の欄の代わりに予測開始文字列長情報の欄が設
けられている。変数kouhoに候補の数を代入し、ス
テップ1402に進む。ステップ1402では、変数i
に1を、変数jに1を代入する。次にステップ1403
では、変数iと変数kouhoの値を比較し、変数iが
変数kouho以下であれば、ステップ1404に進
む。変数kouhoより大きければ、処理を終了する。
ステップ1404では、変数len1にバッファのi番
目の候補の前方一致した読み文字列長、即ちー致長さ情
報を代入し、変数len2にバッファのi番目の候補の
予測開始文字列長情報を代入する。ステップ1405に
進み、変数len1と変数len2の値を比較し、変数
len1が変数len2以上であればステップ1406
に、それより小さければステップ1408に進む。ステ
ップ1406では、バッファのi番目の予測候補を検索
結果リストのj番目にコピーする。検索結果リストの形
式は先に述べたバッファの形式と同様である。次にステ
ップ1407でjを1加算した後、ステップ1408に
進む。ステップ1408ではiを1加算して、ステップ
1403に戻る。以上の処理により、各登録見出し毎に
設定された、受け取った部分読み文字列と前方一致すべ
き読み文字数の下限値以上が前方一致する見出しのみが
予測候補として残される。
Next, referring to FIG. 14, the prediction dictionary search unit 1 in the case of using the prediction dictionary according to the embodiment shown in FIG.
The flow of the process 08 will be described. First, in step 1401, a normal prefix search is performed in the prediction dictionary using the read character string received from the prediction control unit 103 as a key, and all candidates are copied to a buffer. The format of the buffer is the same as the search result list shown in FIG.
A column for prediction start character string length information is provided instead of the column for probability information. The number of candidates is substituted for the variable kouho, and the process proceeds to step 1402. In step 1402, the variable i
And 1 to a variable j. Next, step 1403
Then, the value of the variable i is compared with the value of the variable kouho. If the variable i is equal to or smaller than the variable kouho, the process proceeds to step 1404. If it is larger than the variable kouho, the process ends.
In step 1404, the length of the read-out character string of the i-th candidate in the buffer, that is, the matching length information, is substituted into the variable len1, and the predicted start character string length information of the i-th candidate in the buffer is substituted into the variable len2. I do. Proceeding to step 1405, the values of the variables len1 and len2 are compared, and if the variable len1 is greater than or equal to the variable len2, step 1406
Otherwise, if it is smaller, the process proceeds to step 1408. In step 1406, the i-th prediction candidate in the buffer is copied to the j-th search result list. The format of the search result list is the same as the format of the buffer described above. Next, after adding 1 to j in step 1407, the process proceeds to step 1408. In step 1408, i is added by 1, and the process returns to step 1403. As a result of the above processing, only a heading set for each registered heading and whose front part matches at least the lower limit of the number of characters to be read that should start with the received partial reading character string is left as a prediction candidate.

【0042】次に、図15を用いて、図11に示す実施
形態をとる予測辞書を用いる場合の、予測制御部103
の処理の流れを説明する。まずステップ1501で、受
け取った読み文字列を読み文字列切り出し部107に送
り、ステップ1502で結果を受け取り、ステップ15
05で予測辞書検索部108に情報を送り、ステップ1
506で結果を候補リストにセットする。ステップ15
02から1506までは、図7に示したフローチャート
のステップ701からステップ706までの処理と同様
の処理である。但し、候補リストには、特に、“尤
度”、“優先度”、“point”、“判定”の各情報
の欄は必要ない。ステップ1504でiがmaxの値以
上になった時ステップ1508に進むが、ステップ15
08では、候補リストを表記頻度の順にソートし、上位
の候補を出力バッファにセットし、ステップ1509で
出力バッファの情報を制御部102に送る。即ち、この
場合、“尤度”や“優先度”や“point”を読み出
したり計算したりする予測候補評価部110や、予測候
補の絞り込みを行う予測候補絞り込み部111は必要な
い。
Next, referring to FIG. 15, the prediction control unit 103 in the case of using the prediction dictionary according to the embodiment shown in FIG.
The flow of the process will be described. First, in step 1501, the received read character string is sent to the read character string cutout unit 107. In step 1502, the result is received.
In step 05, information is sent to the prediction dictionary search unit 108, and
At 506, the result is set in the candidate list. Step 15
The processing from 02 to 1506 is the same as the processing from step 701 to step 706 in the flowchart shown in FIG. It should be noted that the candidate list does not need to include columns for information on “likelihood”, “priority”, “point”, and “judgment”. When i becomes equal to or greater than the value of max in step 1504, the process proceeds to step 1508.
In step 08, the candidate list is sorted in the order of the notation frequency, the top candidate is set in the output buffer, and the information of the output buffer is sent to the control unit 102 in step 1509. That is, in this case, the prediction candidate evaluation unit 110 that reads and calculates “likelihood”, “priority”, and “point”, and the prediction candidate narrowing unit 111 that narrows down the prediction candidates are not required.

【0043】次に、図16を用いて、予測候補の表示例
とそれに関わる制御部102の動きを説明する。図16
の(c)は、制御部102が予測制御部103から予測
結果を受け取り、入力された読み情報と予測された漢字
かな表記をディスプレー画面上に表示してユーザに提示
した例である。ここでは、「か」「な」「か」と順番に
読み文字列が入力され、「かなか」まで入力が進んだ時
点で、先に述べたような予測制御部103の処理によ
り、該当する予測候補が出力された場合の例を示してい
る。先に述べた予測辞書109と予測制御部103の処
理によると、「か」と入力された時点では予測制御部1
03から制御部102に送られる予測候補が1つもな
く、図16の(a)のように予測候補の表示は行われな
い。次に「かな」と入力されると、「かな」という読み
文字列が予測制御部103に送られて「神奈川県」とい
う予測候補が予測制御部103から制御部102に返さ
れ、図16の(b)のように候補表示が行われる。ここ
で次の「か」が入力されると前の候補表示は取り消さ
れ、次の「かなか」という読み文字列が予測制御部10
3に送られて「かな漢字変換」という予測候補が予測制
御部103から制御部102に返され、図16の(c)
のように候補表示が行われる。
Next, referring to FIG. 16, a display example of a prediction candidate and the movement of the control unit 102 related thereto will be described. FIG.
(C) is an example in which the control unit 102 receives the prediction result from the prediction control unit 103, displays the input reading information and the predicted kanji notation on a display screen, and presents it to the user. Here, the reading character string is input in the order of “KA”, “NA”, and “KA”, and when the input proceeds up to “KANA”, the input is performed by the processing of the prediction control unit 103 as described above. An example in which a prediction candidate is output is shown. According to the processing of the prediction dictionary 109 and the prediction control unit 103 described above, when the “?” Is input, the prediction control unit 1
No prediction candidates are sent from 03 to the control unit 102, and no prediction candidates are displayed as shown in FIG. Next, when "kana" is input, a reading character string "kana" is sent to the prediction control unit 103, and a prediction candidate "kanagawa prefecture" is returned from the prediction control unit 103 to the control unit 102. A candidate is displayed as shown in FIG. Here, when the next “KA” is input, the previous candidate display is cancelled, and the next read character string “KANAKA” is displayed in the prediction control unit 10.
3 and the prediction candidate “kana-kanji conversion” is returned from the prediction control unit 103 to the control unit 102, and FIG.
Is displayed as shown in FIG.

【0044】ここでユーザが予測候補採用キー、例えば
上矢印キー↑を押すと、表示されていた予測候補中の反
転予測候補(予測候補が1つの場合にはその予測候補)
が採用され、図16の(d)のようにディスプレーの表
示が変更される。予測候補は1つとは限らないので複数
個の表示が行われる場合もある。その時には、予測制御
部103の出力バッファの上位から順番に予測候補ウィ
ンドウに表示され、はじめは第1番目の候補が反転表示
される。そこで、例えばユーザが予測候補移動キー例え
ば右矢印キー→を押すと、反転表示される予測候補がひ
とつずつ移動し、望まれる候補が反転表示されたところ
で↑キーが押されると、その候補が採用される。
Here, when the user presses a prediction candidate adoption key, for example, the up arrow key ↑, the inverted prediction candidate among the displayed prediction candidates (if there is only one prediction candidate, the prediction candidate is used).
Is adopted, and the display of the display is changed as shown in FIG. Since the number of prediction candidates is not limited to one, a plurality of displays may be performed. At that time, the prediction buffer is displayed in the prediction candidate window in order from the top of the output buffer of the prediction control unit 103, and the first candidate is initially highlighted. Therefore, for example, when the user presses a prediction candidate moving key, for example, a right arrow key →, the prediction candidates to be highlighted are moved one by one, and when the desired key is pressed when the desired candidate is highlighted, the candidate is adopted. Is done.

【0045】次に、図17を用いて、読み文字列のかな
漢字変換部104と予測制御部103への受け渡しに関
わる、制御部102の処理を説明する。まずステップ1
701で変換対象読み文字列バッファと予測対象読み文
字列バッファの内容を初期化する。ステップ1702
で、ユーザーのキーボード入力を待ち、入力があったら
ステップ1703に進む。キーボードからの入力が読み
文字入力か否かを調べ、読み文字列以外の場合ステップ
1704に、読み文字列の場合ステップ1707に進
む。入力が読み文字であるか否かはあらかじめ与えられ
たテーブルを参照する等の処理で行うことが可能であ
る。ここで句読点は読み文字列ではないとする。また入
力がいわゆるローマ字入力である場合には、読み1文字
にあたる入力があるまでここでバッファリングを行う。
ステップ1707では、変換対象読み文字列バッファ
に、入力された読み1文字を追加し、次のステップ17
08へ進む。ステップ1708では予測対象読み文字列
バッファに入力された読み1文字を追加し、次に進む。
ステップ1709では、予測制御部103に予測対象読
み文字列バッファ中の読み文字列情報を送り、予測処理
がスタートする。予測制御部103は先に述べたような
処理を行い、結果を制御部102に返す。予測制御部1
03から結果を受け取った制御部102はステップ17
10に処理を進め、先に述べたような結果の表示処理を
行い、ステップ1702の処理に戻る。
Next, the processing of the control unit 102 relating to the transfer of the read character string to the kana-kanji conversion unit 104 and the prediction control unit 103 will be described with reference to FIG. First step 1
In step 701, the contents of the conversion target read character string buffer and the prediction target read character string buffer are initialized. Step 1702
Then, the process waits for a user's keyboard input. It is checked whether or not the input from the keyboard is a reading character input. If the input is not a reading character string, the flow proceeds to step 1704, and if the input is a reading character string, the flow proceeds to step 1707. Whether or not the input is a reading character can be performed by processing such as referring to a table given in advance. Here, it is assumed that the punctuation is not a reading character string. If the input is a so-called Roman character input, buffering is performed here until an input corresponding to one character is read.
In step 1707, the input one-character reading is added to the conversion-target reading character string buffer.
Proceed to 08. In step 1708, one character input to the predicted target character string buffer is added, and the process proceeds to the next step.
In step 1709, the read character string information in the predicted read character string buffer is sent to the prediction control unit 103, and the prediction process starts. The prediction control unit 103 performs the processing described above, and returns a result to the control unit 102. Prediction control unit 1
The control unit 102 having received the result from step 03 executes step 17
The process proceeds to step S10, where the result display process as described above is performed, and the process returns to step S1702.

【0046】ステップ1704では、キーボード入力が
予測選択キー、例えば先に述べた矢印キー↑であるか否
かを調べ、該当すればステップ1711の処理に、それ
以外であればステップ1705の処理に進む。ステップ
1711では、変換対象読み文字列バッファに選択キー
により選択された予測候補のうちキーボードからの入力
読み文字列ではない部分、即ち、予測補完された読み文
字列を追加する。例えば図16(c)から(d)の例で
は、既に「かなか」という読み文字列まではステップ1
707により変換対象読み文字列バッファに記憶されて
おり、ここにステップ1711で「んじへんかん」とい
う読み文字列が追加される結果、「かなかんじへんか
ん」という読み文字列が予測対象読み文字列バッファに
記憶される。同様にステップ1712では予測対象読み
文字列バッファに予測補完された読み文字列が追加され
る。図16(c)から(d)の例では、既に「かなか」
という読み文字列まではステップ1707により予測対
象読み文字列バッファに記憶されており、ここにステッ
プ1711で「んじへんかん」という読み文字列が追加
される結果、「かなかんじへんかん」という読み文字列
が予測対象読み文字列バッファに記憶される。
In step 1704, it is checked whether or not the keyboard input is a predictive selection key, for example, the above-mentioned arrow key 、. If so, the process proceeds to step 1711; otherwise, the process proceeds to step 1705. . In step 1711, a part of the prediction candidate selected by the selection key that is not the input reading character string from the keyboard, that is, the prediction-completed reading character string is added to the conversion target reading character string buffer. For example, in the examples of FIGS. 16C to 16D, the steps up to the reading character string of “Kanaka”
The reading character string stored in the conversion target reading character string buffer 707 is added to the reading character string “Kanjihenkan” in step 1711. As a result, the reading character string “Kanakanjikan” becomes the prediction target reading character. Stored in the column buffer. Similarly, in step 1712, the predicted and complemented reading character string is added to the prediction target reading character string buffer. In the examples of FIGS. 16C to 16D, “Kanaka” has already been set.
The reading character string up to the reading character string is stored in the prediction target reading character string buffer in step 1707, and as a result of adding the reading character string “kanjihankan” in step 1711, the reading character “kankanjihenkan” is obtained. The character string is stored in the predicted reading character string buffer.

【0047】次にステップ1713で、制御部102は
かな漢字変換部104に変換対象読み文字列バツファの
情報を送り、かな漢字変換処理がスタートする。かな漢
字変換部104は結果を制御部102に返す。制御部1
02はステップ1714に進み表示処理を行う。かな漢
字変換処理部と、それにかかわる表示処理については、
広く公知であるのでここでは言及しない。次に処理がス
テップ1718に進み、変換対象読み文字列バッファの
内容がクリアされた後、ステップ1702の処理に戻
る。次にステップ1705で、キーボードからの入力が
変換指示キー、例えば変換キーであった場合、処理はス
テップ1713に進み、以下同様に進む。それ以外の時
はステップ1706に進む。次にステップ1706で、
キーボードからの入力が句読点キーであった時、ステッ
プ1715に進み、それ以外のキーであれば、別途定義
されているそれ以外の処理に進む。ステップ1715で
は、かな漢字変換部104に変換対象読み文字列バッフ
ァの情報を送り、ステップ1716でその結果を受け取
り、表示処理を行う。続いて、ステップ1717で予測
対象読み文字列バッファをクリアした後、ステップ17
18に進んで変換対象読み文字列バッファの情報をクリ
アし、ステップ1702に戻る。
Next, in step 1713, the control unit 102 sends the information on the character string buffer to be converted to the kana-kanji conversion unit 104, and the kana-kanji conversion process starts. The kana-kanji conversion unit 104 returns the result to the control unit 102. Control unit 1
02 proceeds to step 1714 to perform display processing. For the Kana-Kanji conversion processing unit and the related display processing,
Since it is widely known, it will not be described here. Next, the process proceeds to step 1718, and after the content of the conversion target read character string buffer is cleared, the process returns to step 1702. Next, in step 1705, if the input from the keyboard is a conversion instruction key, for example, a conversion key, the process proceeds to step 1713, and so on. Otherwise, the process proceeds to step 1706. Next, in step 1706,
When the input from the keyboard is the punctuation key, the process proceeds to step 1715. If the input is any other key, the process proceeds to another process defined separately. In step 1715, the information of the conversion target read character string buffer is sent to the kana-kanji conversion unit 104, and in step 1716, the result is received and a display process is performed. Subsequently, after clearing the prediction target read character string buffer in step 1717, the process proceeds to step 1717.
The program proceeds to step S18, where the information in the conversion target read character string buffer is cleared, and the procedure returns to step S1702.

【0048】以上の処理を繰り返すことにより、制御部
102は、入力された読み文字列と予測補完された読み
文字列の情報をかな漢字変換部104と予測制御部10
3へと受け渡し、結果を受け取って次の処理へと進む。
例えば、図16(d)の状態に統けて「そ」という読み
文字列が入力された場合、ステップ1708で「そ」と
いう読み文字列が予測対象読み文字列バッファに追加さ
れ、ステップ1709で「かなかんじへんかんそ」とい
う読み文字列が予測制御部103に送られる。
By repeating the above processing, the control unit 102 converts the information on the input read character string and the predicted and complemented read character string into the kana-kanji conversion unit 104 and the prediction control unit 10.
3 and receive the result to proceed to the next process.
For example, when the reading character string “so” is input according to the state of FIG. 16D, the reading character string “so” is added to the prediction target reading character string buffer in step 1708, and in step 1709 The read character string “Kanakanjikankanso” is sent to the prediction control unit 103.

【0049】ここで先に述べたような処理により、予測
制御部103では「へんかんそ」という部分文字列に対
し、図18に示したような予測候補リストを作成し、こ
れを出力バッファを介して制御部102に返す。ステッ
プ1710で表示処理が行われた結果を示したのが図1
9(a)、これが↑キーにより選択された後の表示が図
(b)である。
With the processing described above, the prediction control unit 103 creates a prediction candidate list as shown in FIG. 18 for the partial character string “ Returned to control unit 102 via FIG. 1 shows the result of the display processing performed in step 1710.
9 (a), the display after this is selected by the の key is shown in FIG.

【0050】ここで、例えば図10(b)に示したよう
に「かなかんじへ」という入力に対しては「変換装置」
という候補は判定が“×”になり表示されないが、「か
なかんじへんかんそ」まで入力が確定した時点では「変
換装置」という候補の判定が○になり、候補表示が行わ
れる。また、例えば、「さ」「い」「き」「ん」「の」
「か」「な」「か」と入力が進んだ時には、ステップ1
709で「さいきんのかなか」という読み文字列が予測
制御部103に送られ、先の「かなか」の入力例と同様
に「かなか」という部分読み文字列に対する処理の結果
「かな漢字変換」という予測結果が予測制御部103か
ら戻ってきて図20(a)のように表示されるが、ここ
で予測採用選択キー例えば↑キーにより候補が選択され
ると処理がステップ1713まで進んで「さいきんのか
なかんじへんかん」という読み文字列がかな漢字変換部
104に送られ、結果として図20(b)のように「最
近のかな漢字変換」という変換結果が表示される。
Here, for example, as shown in FIG. 10 (b), for the input of "to Kanagawa", the "converter"
The candidate "" is not displayed because the determination is "x", but when the input is determined up to "Kanakan Henkanso", the candidate "conversion device" is determined to be ○ and the candidate is displayed. Also, for example, "sa""i""ki""n""no"
When the input of “KA”, “NA” and “KA” is advanced, step 1
In step 709, the reading character string "Saikin no Kanaka" is sent to the prediction control unit 103, and the result of the processing on the partial reading character string "Kanaka" is performed in the same manner as in the previous input example of "Kanaka". The prediction result returns from the prediction control unit 103 and is displayed as shown in FIG. 20A. If a candidate is selected by using a prediction adoption selection key, for example, the ↑ key, the process proceeds to step 1713 and proceeds to step 1713. The reading character string “Nonkanakanjihenkan” is sent to the kana-kanji conversion unit 104, and as a result, a conversion result “recent kana-kanji conversion” is displayed as shown in FIG.

【0051】ここで、図17に示した予測制御部103
の処理では、ステップ1712の処理の後、ステップ1
713で変換対象読み文字列バッファの情報をかな漢字
変換部に送っているが、別の形態として、図24に示す
フローチャートのように、ステップ1712の直後には
かな漢字変換を行わず、ステップ1719に進み、ディ
スプレー上には変換対象読み文字列バッファ中の読み文
字列のうち、予測候補に含まれない部分を読みのまま、
予測候補を漢字かな表記で表示するという処理も可能で
ある。例えば、先に挙げた「さ」「い」「き」「ん」
「の」「か」「な」「か」の例では、図20(a)のよ
うに表示された後に、予測採用選択キーが押された時、
図25のように「さいきんのかな漢字変換」というよう
に表示される。その後、ステップ1702に戻り、ユー
ザからの入力が変換指示キーかまたは句読点だった時点
で残りの漢字かな表記が未確定だった読みの部分も漢字
かな表記に変換される。
Here, the prediction control unit 103 shown in FIG.
In the process of step 1712, after the process of step 1712, step 1
In 713, the information of the conversion target reading character string buffer is sent to the Kana-Kanji conversion unit. As another form, as shown in the flowchart of FIG. 24, Kana-Kanji conversion is not performed immediately after Step 1712, and the process proceeds to Step 1719. , On the display, the part of the reading character string in the conversion target reading character string buffer that is not included in the prediction candidate is read,
It is also possible to perform a process of displaying the prediction candidates in kanji kana notation. For example, "sa""i""ki""n"
In the example of “no”, “ka”, “na”, and “ka”, when the prediction adoption selection key is pressed after the display as shown in FIG.
As shown in FIG. 25, it is displayed as “Saiki no kana kanji conversion”. Thereafter, the process returns to step 1702, and the rest of the readings for which the input from the user was a conversion instruction key or a punctuation mark for which the remaining Kanji Kana notation was undetermined are also converted to Kanji Kana notation.

【0052】次に、図21を用いて予測補完された読み
文字列の情報を含めた読み文字列が予測制御部103に
受け渡される場合の、予測辞書の別の形態を示す。この
図において、読み情報から確率情報までは図5に示した
予測辞書と同形式であるが、それに追加して、各見出し
は分割可能位置の情報を持つ。
Next, another form of the prediction dictionary in the case where a read character string including information on a read character string that has been predicted and complemented is transferred to the prediction control unit 103 will be described with reference to FIG. In this figure, the format from the reading information to the probability information is the same as that of the prediction dictionary shown in FIG. 5, but in addition, each heading has information on a dividable position.

【0053】図22は、分割可能位置情報を持つ予測辞
書を使用した場合の、図17のフローチャートで説明し
た予測対象読み文字列バッファの形式である。ここで、
予測対象読み文字列バッファは、読み文字列バッファの
情報以外に、分割可能位置情報を持つ。ステップ171
2で、予測補完された読み文字列を予測対象読み文字列
バッファに追加する際、対応する予測候補の分割可能位
置情報を参照し、予測対象読み文字列バッファ中の読み
文字列の対応する位置情報を算出して、図22のように
分割可能位置情報を書き込む。例えば「かなか」という
入力に対して「かな漢字変換」という予測候補が選択さ
れた場合、ステップ1712で「んじへんかん」という
読み文字列を読み文字列バッファに追加し、辞書情報で
ある「かなかんじへんかん」が読み文字列バッファの
「かなかんじへんかん」のm番目の文字から始まってい
るかを調べ( この場合、m=0) 、m+1の値、即ち、
この場合“1”と、辞書情報である分割可能位置“6”
にmを足した値、この場合“6”と、「かなかんじへん
かん」という読み文字列の長さをm+1に足した値、こ
の場合“10”を、分割可能位置情報に書き込む。
FIG. 22 shows the format of the read target character string buffer described in the flowchart of FIG. 17 when a prediction dictionary having dividable position information is used. here,
The prediction target read character string buffer has dividable position information in addition to the information of the read character string buffer. Step 171
In step 2, when adding the predicted and completed reading character string to the prediction target reading character string buffer, reference is made to the dividable position information of the corresponding prediction candidate, and the corresponding position of the reading character string in the prediction target reading character string buffer is read. The information is calculated, and the dividable position information is written as shown in FIG. For example, when a prediction candidate of “kana-kanji conversion” is selected in response to the input of “kana”, in step 1712, a reading character string of “njihenkan” is added to the reading character string buffer, and dictionary information “ It is checked whether "Kanakanjikan" starts from the m-th character of "Kanakanjikan" in the reading character string buffer (in this case, m = 0), and the value of m + 1, that is,
In this case, “1” and the dividable position “6” which is the dictionary information
Is added to m, in this case, "6", and the value obtained by adding the length of the read character string "Kanakanjikan" to m + 1, in this case, "10" is written in the dividable position information.

【0054】図23は、分割可能位置情報を持つ予測対
象読み文字列バッファを使用した場合の、読み文字列切
り出し部107の処理の流れを示すフローチャートであ
る。図のステップ2301からステップ2306までの
処理は図2のステップ201からステップ206と同様
であるのでここでは説明を省略する。ステップ2307
では、変数startの値が、予測対象読み文字列バッ
ファの分割可能位置情報とー致するか否かを調べ、もし
ー致すればステップ2308に進んで、読み文字列バッ
ファのstart番目の文字からlen番目の文字まで
を読み文字列バッファのi番目にコピーし、iを1加算
した後にステップ2309に進む。もしステップ230
7で値がー致しなければそのままステップ2309の処
理に進む。ステップ2309では、startの値を1
加算し、ステップ2306の処理に戻る。
FIG. 23 is a flowchart showing the flow of processing of the read character string cutout unit 107 when a prediction target read character string buffer having dividable position information is used. The processing from step 2301 to step 2306 in the figure is the same as that from step 201 to step 206 in FIG. Step 2307
Then, it is checked whether or not the value of the variable “start” matches the dividable position information of the prediction target read string buffer. If the value of the variable “start” matches, the process proceeds to step 2308 to start from the start character of the read string buffer. Up to the len-th character is copied to the i-th character string in the read character string buffer. If step 230
If the value does not match in step 7, the process directly proceeds to step 2309. In step 2309, the value of start is set to 1
Then, the process returns to step 2306.

【0055】以上の処理により、「かなかんじへんか
ん」という読み文字列までが確定しており、次に「そ」
という読みが入力された際、図2に示した読み文字列切
り出し処理によると、「かなかんじへんかんそ」「なか
んじへんかんそ」「かんじへんかんそ」「んじへんかん
そ」「じへんかんそ」「へんかんそ」「かんそ」「ん
そ」「そ」という9個の部分読み文字列が切り出され、
このそれぞれに対して予測辞書検索を行うことになるた
め、不必要な辞書検索処理時間がかかる他、例えば予測
辞書中に「乾燥機」などの候補がありこれが条件を満足
して予測候補として表示された場合、図16(d)のよ
うに「かな漢字変換」という候補がすでに表示されてい
るところに「乾燥機」という予測候補が表示されること
になり、不必要な候補の表示が行われることになるが、
図23に示した処理によると「かなかんじへんかんそ」
「へんかんそ」「そ」という3個の部分読み文字列のみ
が切り出され、予測辞書検索を行うことになるため、不
要な処理時間が省略され、また不要な予測候補表示が抑
制されることになり、処理の品質が向上する。
By the above processing, the character string up to the character string "Kanakanjikankan" has been determined.
According to the reading character string cutout processing shown in FIG. 2, when the reading of “Yomi” is input, “Kanakan Henkanso”, “Nakanji Henkanso”, “Kanji Henkanso”, “Kanji Henkanso”, Nine partial reading character strings of "Henkanso", "Henkanso", "Kanso", "Nenso" and "So" are cut out,
Since a predictive dictionary search is performed for each of these, unnecessary dictionary search processing time is required. In addition, for example, there is a candidate such as "dryer" in the predictive dictionary, which satisfies the conditions and is displayed as a predictive candidate. In this case, as shown in FIG. 16D, a candidate “dryer” is displayed where a candidate “kana-kanji conversion” is already displayed, and unnecessary candidates are displayed. That means
According to the processing shown in FIG. 23, “Kanakan Henkanso”
Since only three partial reading character strings “Henkanso” and “So” are cut out and a prediction dictionary search is performed, unnecessary processing time is omitted and unnecessary prediction candidate display is suppressed. And the quality of processing is improved.

【0056】尚、本発明は日本語入力のみ例示して説明
したが、これに制限されるものでなく、例えば機械翻訳
にも同様に応用できるものである。
Although the present invention has been described by exemplifying only Japanese input, the present invention is not limited to this and can be applied to, for example, machine translation.

【0057】[0057]

【発明の効果】以上、本発明によれば、予測制御部10
3から読み文字列切り出し部107に送られた読み文字
列に対して対応する部分読み文字列のリストが作成さ
れ、その各々に対して前方一致する予測候補が予測辞書
検索部108によって予測辞書109から読み出されて
予測候補リストが作成され、さらに予測辞書109に記
憶されていた読み文字列の部分文字列の頻度情報、見出
し漢字かな表記文字列の頻度情報、または、部分読み文
字列に対する見出し漢字かな表記の確率情報によって予
測候補評価部110で前方一致した読み文字列に対する
見出し漢字かな表記の尤度情報と、それに基づく評価点
が計算され、予測制御部103で前記評価点の順に予測
候補が優先順位付けされて、その上位n位がユーザに呈
示されることにより、文章入力中の任意の位置から自動
的に入力予測を行った結果を高精度に優先順位付けして
ユーザに呈示することができることにより、文書入力の
効率が向上し、簡易に日本語入力を行うことができる。
As described above, according to the present invention, the prediction control unit 10
3, a list of partial reading character strings corresponding to the reading character string sent to the reading character string cutout unit 107 is created, and the prediction dictionary search unit 108 predicts a prediction candidate having a forward match for each of them. , A prediction candidate list is created, and further, the frequency information of the partial character string of the reading character string, the frequency information of the heading kanji kana notation character string, or the heading for the partial reading character string stored in the prediction dictionary 109 Based on the probability information of the Kanji Kana notation, the likelihood information of the heading Kanji Kana notation with respect to the read character string that matches forward is calculated by the prediction candidate evaluation unit 110, and the evaluation points based thereon are calculated, and the prediction control unit 103 predicts the prediction candidates in the order of the evaluation points. Are prioritized, and the top n places are presented to the user, thereby automatically performing input prediction from an arbitrary position during text input. By being able to present the results to the user prioritizes high precision, increases the efficiency of document input, it is possible to perform Japanese input easily.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の日本語予測入力システムの実施形態を
示すブロック図、
FIG. 1 is a block diagram showing an embodiment of a Japanese predictive input system according to the present invention;

【図2】本発明の日本語予測入力方法に従う、読み文字
列切り出し部の処理の流れを示すフローチャート、
FIG. 2 is a flowchart showing a processing flow of a reading character string cutout unit according to the Japanese predictive input method of the present invention;

【図3】読み文字列リストのフォーマットと、処理結果
の格納例を示す図、
FIG. 3 is a diagram showing a format of a reading character string list and a storage example of a processing result;

【図4】予測辞書に登録される情報の実施形態を示す
図、
FIG. 4 is a diagram showing an embodiment of information registered in a prediction dictionary,

【図5】予測辞書に登録される情報の別の実施形態を示
す図、
FIG. 5 is a diagram showing another embodiment of information registered in a prediction dictionary,

【図6】辞書検索結果リストのフォーマットと、処理結
果の格納例を示す図、
FIG. 6 is a diagram showing a format of a dictionary search result list and a storage example of a processing result;

【図7】本発明の日本語予測入力方法を実現する予測制
御部の処理の流れを示すフローチャート、
FIG. 7 is a flowchart showing a processing flow of a prediction control unit for realizing the Japanese prediction input method of the present invention;

【図8】予測候補リストのフォーマットと格納例を示す
図、
FIG. 8 is a diagram showing a format and a storage example of a prediction candidate list;

【図9】予測候補リストの格納例を示す図、FIG. 9 is a diagram showing a storage example of a prediction candidate list;

【図10】予測候補リストの格納例を示す図、FIG. 10 is a diagram showing a storage example of a prediction candidate list;

【図11】本発明の日本語予測入力方法を実現する予測
候補評価部の処理の流れを示すフローチャート、
FIG. 11 is a flowchart showing a processing flow of a prediction candidate evaluation unit for realizing the Japanese prediction input method of the present invention;

【図12】本発明の日本語予測入力方法を実現する予測
候補絞り込み部の処理の流れを示すフローチャート、
FIG. 12 is a flowchart showing a processing flow of a prediction candidate narrowing-down unit for realizing the Japanese prediction input method of the present invention;

【図13】予測辞書に登録される情報の別の実施形態を
示す図、
FIG. 13 is a diagram showing another embodiment of information registered in the prediction dictionary;

【図14】本発明の日本語予測入力方法を実現する予測
辞書検索部の処理の流れを示すフローチャート、
FIG. 14 is a flowchart showing a processing flow of a predictive dictionary search unit for realizing the Japanese predictive input method of the present invention;

【図15】本発明の日本語予測入力方法を実現する予測
制御部の処理の流れを示すフローチャート、
FIG. 15 is a flowchart showing a processing flow of a prediction control unit for realizing the Japanese prediction input method of the present invention;

【図16】予測候補の表示例を示す図、FIG. 16 is a diagram showing a display example of prediction candidates;

【図17】本発明の日本語予測入力方法を実現する制御
部の処理の流れを示すフローチャート、
FIG. 17 is a flowchart showing a processing flow of a control unit for realizing the Japanese predictive input method of the present invention;

【図18】予測候補リストの格納例を示す図、FIG. 18 is a diagram showing a storage example of a prediction candidate list,

【図19】予測候補の表示例を示す図、FIG. 19 is a diagram showing a display example of prediction candidates.

【図20】予測候補の表示例を示す図、FIG. 20 is a diagram showing a display example of prediction candidates;

【図21】予測辞書に登録される情報の別の実施形態を
示す図、
FIG. 21 is a diagram showing another embodiment of information registered in the prediction dictionary,

【図22】予測対象読み文字列バッファのフォーマット
と格納例を示す図、
FIG. 22 is a diagram showing a format and a storage example of a prediction target read character string buffer;

【図23】本発明の日本語予測入力方法を実現する読み
文字列切り出し部の処理の流れを示すフローチャート、
FIG. 23 is a flowchart showing a processing flow of a reading character string cutout unit for realizing the Japanese predictive input method of the present invention;

【図24】本発明の日本語予測入力方法を実現する制御
部の処理の流れを示すフローチャート、
FIG. 24 is a flowchart showing a processing flow of a control unit for realizing the Japanese predictive input method of the present invention;

【図25】予測候補の表示例を示す図、FIG. 25 is a diagram showing a display example of prediction candidates.

【符号の説明】[Explanation of symbols]

101…入力部、102…制御部、103…予測制御
部、104…かな漢字変換部、105…かな漢字変換辞
書検索部、106…かな漢字変換辞書、107…読み文
字列切り出し部、108…予測辞書検索部、109…予
測辞書、110…予測候補評価部、111…予測候補絞
り込み部
101 input unit, 102 control unit, 103 prediction control unit, 104 kana-kanji conversion unit, 105 kana-kanji conversion dictionary search unit, 106 kana-kanji conversion dictionary, 107 reading character string cutout unit, 108 prediction dictionary search unit , 109: prediction dictionary, 110: prediction candidate evaluation unit, 111: prediction candidate narrowing unit

Claims (22)

【特許請求の範囲】[Claims] 【請求項1】 読み文字列を入力し、この入力あるいは
予測補完された読み文字列から少なくとも一部の部分文
字列群を取り出し、取り出された部分文字列と読みが前
方一致する漢字かな表記を辞書を用いて検索し、前記辞
書中にある漢字かな表記文字列に対する頻度情報と読み
文字列の部分文字列の少なくとも一部に対する頻度情報
を用いて検索された漢字かな表記の優先順位付けを行な
い日本語予測入力することを特徴とする日本語予測入力
方法。
1. A reading character string is input, at least a part of a partial character string group is extracted from the input or predicted and completed reading character string, and a kanji kana notation in which the extracted partial character string and the reading match in front is obtained. A search is performed using a dictionary, and priority is given to the kanji kana notation searched using the frequency information for the kanji kana notation character string in the dictionary and the frequency information for at least a part of the partial character string of the reading character string. A Japanese predictive input method characterized by Japanese predictive input.
【請求項2】 読み文字列を入力し、この入力あるいは
予測補完された読み文字列から少なくとも一部の部分文
字列群を取り出し、取り出された部分文字列と読みが前
方一致する漢字かな表記を辞書を用いて検索し、前記辞
書中にある漢字かな表記文字列に対する、前方一致した
読み文字列毎の尤度情報を用いて検索された漢字かな表
記の優先順位付けを行ない日本語予測入力することを特
徴とする日本語予測入力方法。
2. A reading character string is input, at least a partial character string group is extracted from the input or prediction-completed reading character string, and a kanji kana notation in which the extracted partial character string and the reading are in front of each other is obtained. Searching using a dictionary, prioritizing the kanji Kana notation searched using the likelihood information for each of the kanji kana notation character strings in the dictionary that matches the leading character string, and inputting Japanese prediction A Japanese predictive input method characterized in that:
【請求項3】 前記辞書中にある漢字かな表記文字列に
対する、前方一致した読み文字列毎の尤度情報を、前記
漢字かな表記文字列に対する頻度情報と前記読み文字列
の部分文字列に対する頻度情報から算定し、算定された
尤度情報を用いて検索された漢字かな表記の優先順位付
けを行うことを特徴とする請求項2記載の日本語予測入
力方法。
3. The likelihood information for each reading character string that matches forward with respect to a kanji kana written character string in the dictionary is expressed by frequency information for the kanji kana written character string and frequency for a partial character string of the read character string. 3. The method according to claim 2, further comprising: calculating from the information, and prioritizing the kanji kana notation retrieved using the calculated likelihood information.
【請求項4】 読み文字列を入力し、この入力あるいは
予測補完された読み文字列から少なくとも一部の部分文
字列群を取り出し、取り出された部分文字列と読みが前
方一致する漢字かな表記を辞書を用いて検索し、前記辞
書中にある読み文字列の部分文字列の少なくとも一部に
対する頻度情報を用いて検索された漢字かな表記の優先
順位付けを行い日本語予測入力することを特徴とする日
本語予測入力方法。
4. A reading character string is input, and at least a partial character string group is extracted from the input or prediction-completed reading character string. Searching using a dictionary, prioritizing the searched kanji kana notation using frequency information for at least a part of the partial character string of the reading character string in the dictionary, and performing Japanese prediction input. Japanese prediction input method.
【請求項5】 読み文字列を入力し、この入力あるいは
予測補完された読み文字列から少なくとも一部の部分文
字列群を取り出し、取り出された部分文字列と読みが前
方一致する漢字かな表記を辞書を用いて検索し、前記辞
書中にある読み文字列に対する、前方一致した読み文字
列毎の尤度情報を用いて検索された漢字かな表記の優先
順位付けを行い日本語予測入力を行なうことを特徴とす
る日本語入力予測方法。
5. A reading character string is input, and at least a partial character string group is extracted from the input or prediction-completed reading character string, and a kanji kana notation in which the extracted partial character string and the reading match in front is obtained. Searching using a dictionary, prioritizing the kanji kana notation searched using the likelihood information for each of the reading character strings that match the head of the reading character string in the dictionary, and performing Japanese prediction input Japanese input prediction method characterized by the following.
【請求項6】 前記辞書中にある漢字かな表記文字列に
対する、前方一致した読み文字列毎の尤度情報を前記読
み文字列の部分文字列に対する頻度情報から算定し、こ
の尤度情報を用いて検索された漢字かな表記の優先順位
付けを行うことを特徴とする請求項5記載の日本語予測
入力方法。
6. The likelihood information for each of the reading character strings that match the head of the kanji kana notation character string in the dictionary is calculated from the frequency information for the partial character string of the reading character string, and this likelihood information is used. 6. The method according to claim 5, wherein priorities of the kanji kana notations searched are determined.
【請求項7】 更に、優先順位付けされた漢字かな表記
中の上位n位(nは任意)を出力することを特徴とする
請求項1乃至6記載の日本語予測入力方法。
7. The Japanese predictive input method according to claim 1, further comprising the step of outputting the top n places (n is arbitrary) in the prioritized Kanji Kana notation.
【請求項8】 日本語文の一部を構成する漢字かな表記
およびその読み文字列を記憶した辞書と、読み文字列を
入力する手段と、入力あるいは予測補完された読み文字
列から部分文字列群のー部または全部を取り出す手段
と、取り出された部分文字列と読みが前方一致する漠宇
かな表記を前記辞書から検索する手段と、前記辞書中に
ある漢字かな表記文字列に対する頻度情報と、読み文字
列の部分文字列のー部または全部に対する頻度情報を用
いて検索された漢字かな表記の優先順位付けする手段と
を具備することを特徴とする日本語予測入力システム。
8. A dictionary in which a kanji kana notation constituting a part of a Japanese sentence and its reading character string are stored, means for inputting a reading character string, and a partial character string group based on the input or prediction-completed reading character string. Means for retrieving a part or the whole, means for retrieving from the dictionary a vague notation whose reading is in agreement with the retrieved partial character string, frequency information for a kanji kana notation character string in the dictionary, Means for prioritizing kanji kana notations retrieved using frequency information for all or part of a partial character string of a reading character string.
【請求項9】 日本語文の一部を構成する漢字かな表記
およびその読み文字列を記憶した辞書と、読み文字列を
入力する手段と、入力あるいは予測補完された読み文字
列から部分文字列群のー部または全部を取り出す手段
と、取り出された部分文字列と読みが前方一致する漢字
かな表記を前記辞書から検索する手段と、前記辞書中に
ある漢字かな表記文字列に対する、前方一致した読み文
字列毎の尤度情報を用いて検索された漢字かな表記の優
先順位付けを行う手段とを具備することを特徴とする日
本語予測入力システム。
9. A dictionary in which a kanji kana notation constituting a part of a Japanese sentence and its reading character string are stored, means for inputting the reading character string, and a partial character string group based on the input or prediction-completed reading character string Means for retrieving a part or all of the characters, means for retrieving from the dictionary a kanji kana notation whose reading matches the retrieved partial character string, and a reading which matches the kanji kana notation character string in the dictionary. Means for prioritizing kanji kana notations retrieved using likelihood information for each character string.
【請求項10】 前記辞書中にある漢字かな表記文字列
に対する、前方一致した読み文字列ごとの尤度情報を、
前記漢字かな表記文字列に対する頻度情報と、前記読み
文字列の部分文字列に対する頻度情報とから算定する手
段と、この尤度情報を用いて検索された漢字かな表記の
優先順位付けを行う手段とを具備することを特徴とす
る、請求項9記載の日本語予測入力システム。
10. The likelihood information for each reading character string whose head matches with the Kanji Kana notation character string in the dictionary,
Means for calculating from the frequency information for the kanji kana notation character string and frequency information for the partial character string of the reading character string, and means for prioritizing the kanji kana notation searched using the likelihood information The Japanese predictive input system according to claim 9, comprising:
【請求項11】 日本語文のー部を構成する漢字かな表
記およびその読み文字列を記憶した辞書と、読み文字列
を入力する手段と、入力あるいは予測補完された読み文
字列から部分文字列群のー部または全部を取り出す手段
と、取り出された部分文字列と読みが前方一致する漢字
かな表記を前記辞書から検索する手段と、前記辞書中に
ある読み文字列の部分文字列のー部または全部に対する
頻度情報を用いて検索された漢字かな表記の優先順位付
けを行なう手段とを具備することを特徴とする、日本語
予測入力システム。
11. A dictionary that stores Kanji Kana notation and its reading character string that constitutes a part of a Japanese sentence, a means for inputting a reading character string, and a partial character string group based on the input or prediction-completed reading character string. Means for retrieving a part or all of the part, means for retrieving from the dictionary a kanji kana notation whose reading matches the retrieved partial character string in front, and a part of the partial character string of the read character string in the dictionary or Means for prioritizing kanji kana notations retrieved using frequency information for all of them.
【請求項12】 日本語文のー部を構成する漢字かな表
記およびその読み文字列を記憶した辞書と、読み文字列
を入力する手段と、入力あるいは予測補完された読み文
字列から部分文字列群を取り出す手段と、取り出された
部分文字列と読みが前方一致する漢字かな表記を前記辞
書から検索する手段と、前記辞書中にある読み文字列に
対する、前方一致した読み文字列毎の尤度情報を用いて
検索された漢字かな表記の優先順位付けを行う手段とを
具備することを特徴とする、日本語予測入力システム。
12. A dictionary storing kanji kana notation and its reading character string constituting a part of a Japanese sentence, means for inputting a reading character string, and a partial character string group based on the input or prediction-completed reading character string. Means for retrieving a kanji kana notation whose pronunciation matches with the retrieved partial character string from the dictionary, and likelihood information for each of the reading character strings whose prefix matches the reading character string in the dictionary. Means for prioritizing kanji kana notations retrieved by using a Japanese language predictive input system.
【請求項13】 前記辞書中にある漢字かな表記文字列
に対する、前方一致した読み文字列毎の尤度情報を、前
記読み文字列の部分文字列に対する頻度情報から算定す
る手段と、この尤度情報を用いて検索された漢字かな表
記の優先順位付けを行う手段とを具備することを特徴と
する、請求項12記載の日本語予測入力システム。
13. A means for calculating likelihood information for each reading character string whose head matches with a kanji kana notation character string in the dictionary from frequency information for a partial character string of the reading character string, 13. The Japanese predictive input system according to claim 12, further comprising means for prioritizing kanji kana notations searched using the information.
【請求項14】 優先順位付けされた漢字かな表記中の
上位n 位(nは任意) を出力する手段を更に具備すること
を特徴とする、請求項8乃至13記載の日本語予測入力
システム。
14. The Japanese predictive input system according to claim 8, further comprising: means for outputting the n most significant places (n is arbitrary) in the prioritized Kanji Kana notation.
【請求項15】 既に入力した文字を手掛かりに入力さ
れる文字列を予測し、入力する日本語予測入力システム
において用いられ、入力される読み文字列を取り込むス
テップと、取り込まれた読み文字列あるいは予測補完さ
れた読み文字列から少なくとも一部の部分文字列群を切
り出すステップと、切り出された部分文字列と読みが前
方一致する漢字かな表記を辞書を用いて検索するステッ
プと、前記辞書中にある漢字かな表記文字列に対する頻
度情報と読み文字列の部分文字列の少なくともー部に対
する頻度情報、もしくは前記辞書中にある読み文字列の
少なくとも一部に対する頻度情報を用いて検索された漢
字かな表記の優先順位付けを行なうステップとがプログ
ラムされ記録されるコンピュータ読み取り可能な記録媒
体。
15. A method of predicting a character string to be inputted by using a character already inputted as a clue, a step of capturing a reading character string to be used, which is used in a Japanese predictive input system for inputting; Extracting at least a partial character string group from the predicted and completed reading character string, searching for a kanji kana notation in which the cut-out partial character string and the reading match in front using a dictionary, and Kanji Kana notation searched using frequency information for a certain Kanji notation character string and frequency information for at least a part of a partial character string of the reading character string, or frequency information for at least a part of the reading character string in the dictionary And computer-readable recording medium in which the step of prioritizing is programmed and recorded.
【請求項16】 既に入力した文字を手掛かりに入力さ
れる文字列を予測し、入力する日本語予測入力システム
において用いられ、入力される読み文字列を取り込むス
テップと、取り込まれた読み文字列あるいは予測補完さ
れた読み文字列から少なくとも一部の部分文字列群を切
り出すステップと、切り出された部分文字列と読みが前
方一致する漢字かな表記を辞書を用いて検索するステッ
プと、前記辞書中にある漢字かな表記文字列に対する前
方一致した読み文字列毎の尤度情報、もしくは前記辞書
中にある読み文字列に対する前方一致した読み文字列毎
の尤度情報を用いて検索された漢字かな表記の優先順位
付けを行なうステップとがプログラムされ記録されるコ
ンピュータ読み取り可能な記録媒体。
16. A step of predicting a character string to be inputted by using a character already inputted as a clue, used in a Japanese predictive input system for inputting, and capturing a reading character string to be inputted; Extracting at least a partial character string group from the predicted and completed reading character string, searching for a kanji kana notation in which the cut-out partial character string and the reading match in front using a dictionary, and The likelihood information of each kanji kana spelling character string that matches forward with respect to a certain kanji character string, or the kanji kana notation searched using the likelihood information of each kanji kana notation character string that matches the leading characters of a reading character string in the dictionary. A computer-readable recording medium in which the step of prioritizing is programmed and recorded.
【請求項17】 読み文字列リスト、読み文字列バッフ
ァを初期化するステップと、入力される読み文字列を上
記読み文字列バッファにセットするステップと、読み文
字列バッファにセットされた文字列長を変数とし、入力
される読み文字列の先頭から、その読み文字列の最後部
の文字を含む部分読み文字列を逐一上記読み文字列リス
トに格納するステップとがプログラムされ記録されるコ
ンピュータ読み取り可能な請求項15乃至16記載の記
録媒体。
17. A step of initializing a read character string list and a read character string buffer, a step of setting an input read character string in the read character string buffer, and a step of setting a character string length set in the read character string buffer. Storing a partial reading character string including the last character of the reading character string one by one from the beginning of the input reading character string in the above reading character string list. 17. The recording medium according to claim 15, wherein:
【請求項18】 読み文字列リストの内容とその部分読
み文字列の個数を受け取るステップと、部分読み文字列
の個数を変数とし、逐一送られてくる部分文字列により
辞書を前方一致検索し、その検索結果を辞書検索結果リ
ストに格納するステップと、検索結果リストに格納され
たn個の検索結果を予測候補リストに複写するととも
に、予測候補リストの個数を変数とし、複写される表記
頻度情報、読み頻度情報に基づき、あるいは複写される
情報の他に少なくとも尤度を計算することによって予測
評価を行ない、上記予測候補リストの該当個所に書き込
むステップとがプログラムされ記録されるコンピュータ
読み取り可能な請求項15乃至16記載の記録媒体。
18. A step of receiving the contents of a reading character string list and the number of partial reading character strings thereof, using the number of partial reading character strings as a variable, performing a forward match search of a dictionary with the partial character strings sent one by one, Storing the search result in a dictionary search result list; copying the n search results stored in the search result list into a prediction candidate list; Performing a prediction evaluation based on the reading frequency information or by calculating at least the likelihood in addition to the information to be copied, and writing the predicted evaluation in a corresponding portion of the prediction candidate list. Item 17. The recording medium according to Item 15 or 16.
【請求項19】 予測候補リストを介して送られてきた
予測候補情報から候補の読み文字列の長さ(len)を
調べるとともに一致長さ情報(base)を取り出すス
テップと、確率情報の(base−1)の値、もしくは
辞書に含まれる表記頻度を読み頻度情報の(base−
1)番目の値を尤度として計算するステップと、(le
n−base)を計算することによって有用度を求める
ステップと、尤度、有用度に基づく任意のポイント計算
を行い予測評価を行なうステップとがプログラムされ記
録されるコンピュータ読み取り可能な請求項16記載の
記録媒体。
19. A step of examining the length (len) of a candidate read character string and extracting matching length information (base) from the prediction candidate information sent via the prediction candidate list, -1) or the notation frequency included in the dictionary is read as (base-
(1) calculating a value as a likelihood;
17. The computer-readable program according to claim 16, wherein a step of calculating usefulness by calculating (n-base) and a step of performing arbitrary point calculation based on likelihood and usefulness and performing prediction evaluation are programmed and recorded. recoding media.
【請求項20】 送られてくる尤度の情報に対しあらか
じめ定義された第1の値と比較するステップと、送られ
てくる有用度の情報に対しあらかじめ定義される第2の
値と比較するステップと、これら比較の結果に従い予測
候補の絞り込みを行なうステップとがプログラムされ記
録されるコンピュータ読み取り可能な請求項16記載の
記録媒体。
20. A step of comparing the transmitted likelihood information with a predefined first value, and comparing the transmitted usefulness information with a predefined second value. 17. The computer-readable recording medium according to claim 16, wherein a step and a step of narrowing down prediction candidates according to a result of the comparison are programmed and recorded.
【請求項21】 受け取った読み文字列をキーに辞書を
用いて前方一致検索を行ない、候補をバッファに複写す
るステップと、前方一致した候補を変数として、バッフ
ァのi番目候補の前方一致読み文字列長とバッファのi
番目候補の、上記検索結果リストに格納されてある予測
開始文字列長情報との比較を行なうステップと、比較の
結果によっては予測候補としてバッファのi番目の内容
を検索結果リストの該当個所に反映させるステップとが
プログラムされ記録されるコンピュータ読み取り可能な
請求項15記載の記録媒体。
21. Performing a forward match search using a dictionary using the received read character string as a key and copying candidates to a buffer; and using the forward match candidate as a variable, an i-th candidate forward match read character in the buffer. Column length and buffer i
A step of comparing the i-th candidate with the predicted start character string length information stored in the search result list, and, depending on the result of the comparison, reflecting the i-th content of the buffer as a predicted candidate in a corresponding portion of the search result list The computer-readable recording medium according to claim 15, wherein the steps of programming and recording are programmed and recorded.
【請求項22】 既に入力された文字を手掛かりに、入
力される文字列を予測し入力することのできる日本語予
測入力システムにおいて用いられ、変換対象読み文字列
バッファと予測対象読み文字列バッファを初期化するス
テップと、読み文字入力をチェックし、入力された読み
文字を変換対象読み文字列バッファに追加するステップ
と、読み文字入力以外の予測を指示していたとき、変換
対象読み文字列バッファに予測補完された読み文字を、
予測対象読み文字列バッファに予測補完された読み文字
を追加するステップと、読み文字入力以外の予測指示、
あるいは変換指示があったとき、変換対象読み文字列バ
ッファにある読み文字列のかな漢字変換処理を行い、結
果を画面表示するステップとがプログラムされ記録され
るコンピュータ読み取り可能な請求項15乃至16記載
の記録媒体。
22. A Japanese predictive input system capable of predicting and inputting a character string to be input based on a character already input as a clue, wherein a conversion target reading character string buffer and a prediction target reading character string buffer are used. Initializing, checking the input of the reading character, adding the input reading character to the conversion target reading character string buffer, and when instructing prediction other than the reading character input, the conversion target reading character string buffer The predicted reading is
A step of adding a predicted and completed reading character to a prediction target reading character string buffer; a prediction instruction other than a reading character input;
17. A computer-readable program according to claim 15, wherein when a conversion instruction is issued, a step of performing a kana-kanji conversion process of a reading character string in a conversion target reading character string buffer and displaying a result on a screen is programmed and recorded. recoding media.
JP10038990A 1998-02-20 1998-02-20 Predictive japanese input method/system and medium for programming/recording the method Pending JPH11238056A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10038990A JPH11238056A (en) 1998-02-20 1998-02-20 Predictive japanese input method/system and medium for programming/recording the method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10038990A JPH11238056A (en) 1998-02-20 1998-02-20 Predictive japanese input method/system and medium for programming/recording the method

Publications (1)

Publication Number Publication Date
JPH11238056A true JPH11238056A (en) 1999-08-31

Family

ID=12540587

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10038990A Pending JPH11238056A (en) 1998-02-20 1998-02-20 Predictive japanese input method/system and medium for programming/recording the method

Country Status (1)

Country Link
JP (1) JPH11238056A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012132767A1 (en) * 2011-03-31 2012-10-04 株式会社エヌ・ティ・ティ・ドコモ Mobile terminal

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012132767A1 (en) * 2011-03-31 2012-10-04 株式会社エヌ・ティ・ティ・ドコモ Mobile terminal
JPWO2012132767A1 (en) * 2011-03-31 2014-07-28 株式会社Nttドコモ Mobile device

Similar Documents

Publication Publication Date Title
KR100330801B1 (en) Language identifiers and language identification methods
EP0235739B1 (en) Machine translation system
JP2741575B2 (en) Character recognition character completion method and computer system
EP0370774A2 (en) Machine translation system
JPH11282832A (en) Document processing device and method
JPH10326275A (en) Method and device for morpheme analysis and method and device for japanese morpheme analysis
CN101667099B (en) A kind of method and apparatus of stroke connection keyboard text event detection
JPH11238056A (en) Predictive japanese input method/system and medium for programming/recording the method
JPH07271774A (en) Document input device
JP2000010969A (en) Japanese predication input method/system and recording medium programming and recording method
JPH11242670A (en) Method and system for predictively inputting japanese and storage medium for programming and recording the same method
JP2959769B2 (en) Japanese character string morphological analysis method and device
JPH0561902A (en) Mechanical translation system
JPH05282360A (en) Multi-language input device
JP2000330984A (en) Device and method for processing document
JP2000057133A (en) Input prediction device, input predicting method and recording medium having recorded input prediction program thereon
JPH01229369A (en) Character processor
JP2000048019A (en) Input prediction device, its method and recording medium recording input prediction program
JPH0793345A (en) Document retrieval device
KR0164405B1 (en) Word processor of mode selection
JPH06149790A (en) Document processor
JPH0128977B2 (en)
JP2000276466A (en) Device and method for predicting character string and storage medium stored with character string predicting program
JPH0567080A (en) Kana/kanji converter
JPH0773174A (en) Processing system of japanese language

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050301

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050420

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060620

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060810

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070313