JP2000276466A - Device and method for predicting character string and storage medium stored with character string predicting program - Google Patents

Device and method for predicting character string and storage medium stored with character string predicting program

Info

Publication number
JP2000276466A
JP2000276466A JP11085109A JP8510999A JP2000276466A JP 2000276466 A JP2000276466 A JP 2000276466A JP 11085109 A JP11085109 A JP 11085109A JP 8510999 A JP8510999 A JP 8510999A JP 2000276466 A JP2000276466 A JP 2000276466A
Authority
JP
Japan
Prior art keywords
character string
prediction
kana
data
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11085109A
Other languages
Japanese (ja)
Inventor
Yumi Ichimura
由美 市村
Yoshimi Saito
佳美 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP11085109A priority Critical patent/JP2000276466A/en
Publication of JP2000276466A publication Critical patent/JP2000276466A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To make a prediction result easy for a user to understand and to lighten the load of input operation by converting only a partial character string before a prediction start position from KANA (Japanese syllabary) to KANJI (Chinese character) and presenting it additionally before a prediction candidate. SOLUTION: A syllabary string to be predicted in information inputted from an input part 101 is sent to a prediction control part 104 through a control part 102. The prediction control part 104 generates a character string group for retrieval including the character at the tail of the syllabary string by a retrieval character string generation part 105 and a prediction dictionary retrieval part 106 retrieves index data that the syllbary string corresponds to as a perdition candidate by referring to a prediction dictionary 107. Then a KANA-KANJI conversion control part 114 performs a KANA-KANJI converting process on the partial character string except the prediction candidate in the syllabary string to be predicted using a KANA-KANJI conversion part 108 to obtain a KANA-KANJI mixed character string candidate and sends it as a conversion candidate back to the control part 102 together with the prediction candidate. The sent-back KANA-KANJI conversion candidate is outputted through an output part 103 and displayed on a display, etc.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、パーソナルコンピ
ュータやワードプロセッサ等の文書作成装置に用いられ
るものであって、キーボード等の入力装置により入力さ
れた文字列をもとに、それに続いて入力しようとする文
字列を予測する文字列予測装置、文字列予測方法及び文
字列予測プログラムを記憶した記憶媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention is used in a document creation device such as a personal computer or a word processor, and is intended to be subsequently input based on a character string input by an input device such as a keyboard. The present invention relates to a character string prediction device, a character string prediction method, and a storage medium that stores a character string prediction program.

【0002】[0002]

【従来の技術】近年、ネットワークが急速に整備され、
計算機を用いたコミュニケーションが一般化しつつあ
る。それに伴い、デスクトップ計算機を用いたビジネス
文書の作成、論文の執筆といった、文書作成の従来から
の主な用途に加えて、携帯情報機器を利用した電子メー
ルの利用、メモの作成といった、より個人的な場面でも
計算機で日本語文章を入力する機会が増大し、キーボー
ド操作に熟練していない人でも、少ないキータッチで情
報を正確に入力するための技術が求められている。また
一方、コンピュータを初めとする種々の電子装置は小型
化し、携帯機器の普及も著しい。携帯機器においては、
入力操作部のサイズが小さいことから、文書の入力作業
の負担はさらに大きく、ユーザの入力に関わる負担を軽
減することが望まれる。
2. Description of the Related Art In recent years, networks have been rapidly developed,
Communication using computers is becoming popular. Along with this, in addition to the traditional main uses of document creation, such as creating business documents using a desktop computer and writing a dissertation, more personal use, such as using e-mail using a portable information device and creating memos, has been made. Even in unusual situations, the chances of entering Japanese sentences with a computer are increasing, and even people who are not skilled in keyboard operation are required to have a technique for accurately inputting information with few key touches. On the other hand, various electronic devices such as computers have become smaller, and portable devices have been widely used. For mobile devices,
Since the size of the input operation unit is small, the burden of inputting a document is further increased, and it is desired to reduce the burden associated with user input.

【0003】このような要請に対する一つの解決方法と
して、入力したい熟語の読みの先頭を入力し、それをキ
ーとして入力する熟語を検索して提示する文書入力装置
(特開昭60−105029号公報)や、変換確定され
た単語に連接する単語を検索提示するワードプロセッサ
(特開平1−260568号公報)、入力したい読みの
先頭を入力し、それをキーとして入力する読みを検索し
て提示するかな漢辞変換システム(特開平8−1472
89号公報)などが提案されている。
One solution to such a request is to input the beginning of a phrase to be entered, search for the phrase as a key, and present the phrase by inputting it (Japanese Patent Laid-Open No. 60-105029). ) Or a word processor (Japanese Patent Laid-Open Publication No. 1-260568) for searching for and presenting a word connected to a word whose conversion has been confirmed, inputting the head of the reading to be input, and searching for and presenting the reading to be input using the key as a key. Kanji conversion system (Japanese Patent Laid-Open No. 8-1472)
No. 89) has been proposed.

【0004】前述の特開昭60−105029号公報で
は、熟語の読みの頻度情報を記憶し、これによって候補
の順位付けを行っている。また、特開平1−26056
8号公報では、過去の入力履歴により候補の優先度付け
を行っている。さらに、特開平8−147289号公報
では、変換候補の単語の頻度情報を記憶し、これによっ
て候補の優先度付けを行っている。
[0004] In the above-mentioned Japanese Patent Application Laid-Open No. 60-105029, the frequency information of reading idioms is stored, and the ranking of candidates is performed based on the information. Also, Japanese Patent Application Laid-Open No. 1-26056
In Japanese Patent Publication No. 8, priorities are assigned to candidates based on past input histories. Further, in Japanese Patent Application Laid-Open No. 8-147289, frequency information of conversion candidate words is stored, and the priorities of the candidates are assigned based on the frequency information.

【0005】しかし、これらの方法はいずれも、入力し
たい文字列の先頭が入力されることを前提とし、これを
キーに辞書を前方一致検索して予測を行う仕組みとなっ
ており、文章の入力中に任意の位置で、そこに続く入力
を自動的に予測できる仕組みを備えていない。そのた
め、近年一般的となっている連文節変換方式での入力中
に使用する際には、変換の途中で一度変換キーを押して
入力操作を中断した後改めて入力したい文字列の先頭を
入力したり、また、予測を行いたい位置で予測検索を指
示したりというキー操作が必要になり、操作が繁雑にな
っている。
However, all of these methods are based on the premise that the beginning of the character string to be input is input, and use this as a key to perform a forward match search of the dictionary to perform prediction. There is no mechanism for automatically predicting the input that follows at an arbitrary position inside. Therefore, when using during the input in the continuous phrase conversion method that has become popular in recent years, press the conversion key once in the middle of the conversion, interrupt the input operation, and then enter the beginning of the character string you want to input again, Further, key operations such as instructing a prediction search at a position where prediction is desired are required, and the operation is complicated.

【0006】一方、入力中された文字列の先頭以外の位
置から予測を行うためには、予測開始位置の前側にある
部分文字列に関する処理の開発が必要であった。この問
題を解決するために、入力文字列と予測補完された文字
列とをかな漢字変換し、得られた変換結果を予測候補の
前に付加して出力するという日本語入力予測方法が提案
されている。
On the other hand, in order to perform prediction from a position other than the head of the input character string, it is necessary to develop a process relating to a partial character string in front of the prediction start position. In order to solve this problem, a Japanese input prediction method has been proposed in which an input character string and a predicted and complemented character string are converted to kana-kanji characters, and the obtained conversion result is added before a prediction candidate and output. I have.

【0007】しかし、この方法は予測補完された読み文
字列を含む入力の先頭からの文字列全てをかな漢字変換
しているため、読み表記文字列の予測ではなく漢字表記
文字列の予測を行う場合には、すでに漢字表記されてい
る部分まで再度読みに戻してかな漢字変換を行うことに
なり無駄が多い。また、かな漢字変換候補とユーザが選
択した予測候補との整合性を取らなければならないな
ど、効率的ではなかった。
However, in this method, since the entire character string from the beginning of the input including the predicted and completed reading character string is converted to Kana-Kanji characters, the prediction of the Kanji notation character string is performed instead of the prediction of the reading notation character string. In this case, it is necessary to return to reading again up to the portion already written in kanji and perform kana-kanji conversion, which is wasteful. In addition, it is not efficient because it is necessary to ensure consistency between the kana-kanji conversion candidates and the prediction candidates selected by the user.

【0008】[0008]

【発明が解決しようとする課題】以上述べたように、従
来の予測方式では、文章入力中に任意の箇所で自動的に
予測を行い提示するための、効率的な仕組みを備えてい
なかった。本発明は、この点に鑑み、予測開始位置の前
側にある部分文字列のみをかな漢字変換し、予測候補の
前に付加して提示することにより、予測結果をユーザに
分かりやすく提示し、入力操作の負担を軽減することの
できる文字列予測装置、文字列予測方法及び文字列予測
プログラムを記憶した記憶媒体を提供することを目的と
する。
As described above, the conventional prediction method does not have an efficient mechanism for automatically predicting and presenting an arbitrary part during text input. In view of this point, the present invention converts only a partial character string in front of a prediction start position into a kana-kanji character and adds and presents it before a prediction candidate, thereby presenting a prediction result to a user in an easy-to-understand manner, and performing input operation. It is an object of the present invention to provide a character string predicting apparatus, a character string predicting method, and a storage medium storing a character string predicting program, which can reduce the burden on the user.

【0009】[0009]

【課題を解決するための手段】そこで、本発明の文字列
予測装置は、文字列データを入力する入力手段と、部分
文字列データとそれに対応した見出しデータが格納され
た予測辞書と、前記入力手段より入力された文字列デー
タより、前記予測辞書を検索するための部分文字列デー
タ群を生成する部分文字列生成手段と、この部分文字列
生成手段で生成された部分文字列データ群を用いて、前
記予測辞書から部分文字列が対応する見出しデータを予
測候補データとして検索する辞書検索手段と、前記入力
文字列データのうち前記辞書検索に用いた文字列データ
を除く部分文字列データを用いてかな漢字変換処理を行
うかな漢字変換手段と、このかな漢字変換手段で得たか
な漢字混じり文字列候補データと前記辞書検索手段によ
って得られた予測候補データを合わせたものを出力する
出力手段とを具備したことを特徴とするものである。
Therefore, a character string predicting apparatus according to the present invention comprises an input means for inputting character string data, a prediction dictionary storing partial character string data and heading data corresponding thereto, and A partial character string generating unit for generating a partial character string data group for searching the prediction dictionary from the character string data input from the unit, and using the partial character string data group generated by the partial character string generating unit. A dictionary search means for searching the prediction dictionary for heading data corresponding to a partial character string as prediction candidate data; and using partial character string data of the input character string data excluding the character string data used for the dictionary search. Kana-kanji conversion means for performing kana-kanji conversion processing, kana-kanji mixed character string candidate data obtained by this kana-kanji conversion means, and prediction obtained by the dictionary search means It is characterized in that and an output means for outputting to the combined auxiliary data.

【0010】このような構成によれば、入力文字列から
最後尾の文字を含む部分文字列群を生成し、これを検索
文字列として辞書検索することで、入力中の任意の位置
から予測が可能となる。この場合、予測開始位置の前側
に入力文字列が残っている場合、候補の表示方法が問題
になるが、入力文字列のうち上記辞書検索に用いた文字
列を除いた部分文字列をかな漢字変換し、かな漢字変換
で得られた文字列を予測候補の前に付加して出力するこ
とにより、かな漢字変換と入力予測とが自然な形で融合
し、ユーザは通常のかな漢字変換システムと同じような
感覚で、違和感なく入力予測システムを利用することが
できる。
According to such a configuration, a partial character string group including the last character is generated from the input character string, and the partial character string group is subjected to a dictionary search as a search character string, whereby prediction can be made from an arbitrary position in the input. It becomes possible. In this case, if an input character string remains before the prediction start position, the display method of candidates becomes problematic, but a partial character string excluding the character string used for the dictionary search in the input character string is converted to a kana-kanji conversion. By adding the character string obtained by Kana-Kanji conversion before the prediction candidate and outputting it, the Kana-Kanji conversion and the input prediction are merged in a natural manner, and the user can feel like a normal Kana-Kanji conversion system. Thus, the input prediction system can be used without discomfort.

【0011】また、前記かな漢字混じり文字列候補デー
タには、かな漢字変換処理する際の候補順位を表す評価
値と予測候補データと部分文字列データとの間の関連性
を示す評価値とに基づいて求められた優先順位を示す評
価値を含み、前記出力手段による出力の際には、前記か
な漢字混じり文字列候補データが持つ優先順位を示す評
価値に基づいて出力の順位を決定することにより、精度
の良いかな漢字変換候補を生成することができる。
The kana-kanji mixed character string candidate data is based on an evaluation value indicating a candidate rank in kana-kanji conversion processing and an evaluation value indicating relevance between the predicted candidate data and the partial character string data. In the case of output by the output means, the output order is determined based on the evaluation value indicating the priority order of the kana-kanji mixed character string candidate data. Kanji conversion candidates can be generated.

【0012】[0012]

【発明の実施の形態】以下、図面を参照して本発明の一
実施形態を説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings.

【0013】図1は本発明の一実施形態に係る文字列予
測装置の構成を示すブロック図である。なお、本実施形
態における文字列予測装置は、例えば磁気ディスク等の
記憶媒体に記録されたプログラムを読み込み、このプロ
グラムによって動作が制御されるコンピュータによって
実現される。
FIG. 1 is a block diagram showing a configuration of a character string prediction device according to one embodiment of the present invention. The character string prediction device according to the present embodiment is realized by a computer that reads a program recorded on a storage medium such as a magnetic disk and the operation of which is controlled by the program.

【0014】図1において、入力手段としての入力部1
01は、例えばキーボード、マウス、ペン入力装置など
からなり、文字列の入力、もしくは、カーソルの移動、
文字列の挿入・削除などの編集指示、次候補表示、候補
選択などの操作指示などのコマンド入力を取り込む。
In FIG. 1, an input unit 1 as input means
01 includes, for example, a keyboard, a mouse, and a pen input device, and is used to input a character string or move a cursor;
A command input such as an editing instruction such as insertion / deletion of a character string, an operation instruction such as display of a next candidate, selection of a candidate, etc. is taken in.

【0015】制御部102は入力部101が取り込んだ
情報を受け取り解析した後、各処理部へ必要な情報を送
る。各処理部での処理結果は再び制御部102に返さ
れ、必要な情報は出力部103を介して出力され、例え
ばディスプレイに表示される。
After the control unit 102 receives and analyzes the information captured by the input unit 101, it sends necessary information to each processing unit. The processing result of each processing unit is returned to the control unit 102 again, and necessary information is output via the output unit 103 and displayed on, for example, a display.

【0016】ここで、入力部101から入力される各種
の情報のうち、読み文字列は制御部102を介して、予
測制御部104に送られる。予測制御部104では、取
り込んだ入力情報を解析して各処理部へ必要な情報を送
り、予測候補を制御部102に返す。次に、制御部10
2は、入力部101から予測候補選択キーに関するデー
タを受け取ると、入力された読み文字列と選択された予
測候補をかな漢字変換制御部114に送る。かな漢字変
換制御部114では、取り込んだ情報を解析して各処理
部へ必要な情報を送り、かな漢字変換候補を制御部10
2に返す。
Here, among various types of information input from the input unit 101, the read character string is sent to the prediction control unit 104 via the control unit 102. The prediction control unit 104 analyzes the received input information, sends necessary information to each processing unit, and returns a prediction candidate to the control unit 102. Next, the control unit 10
2 receives the data related to the prediction candidate selection key from the input unit 101, and sends the input reading character string and the selected prediction candidate to the kana-kanji conversion control unit 114. The kana-kanji conversion control unit 114 analyzes the acquired information, sends necessary information to each processing unit, and outputs kana-kanji conversion candidates to the control unit 10.
Return to 2.

【0017】メモリ113は、各処理の結果を一時的に
保持するための記憶領域であり、例えばRAMなどから
なる。このメモリ113には、予測対象文字列バッファ
113a、検索文字列バッファ113b、予測候補バッ
ファ113c、選択候補バッファ113d、変換候補バ
ッファ113eなどが設けられている。
The memory 113 is a storage area for temporarily storing the result of each processing, and is, for example, a RAM. The memory 113 includes a prediction target character string buffer 113a, a search character string buffer 113b, a prediction candidate buffer 113c, a selection candidate buffer 113d, a conversion candidate buffer 113e, and the like.

【0018】ここで、予測対象文字列バッファ113a
は、入力された読み文字列を予測対象として格納するも
のである。その様子を図11に示す。
Here, the prediction target character string buffer 113a
Stores the input character string as a prediction target. This is shown in FIG.

【0019】また、検索文字列バッファ113bは、検
索文字列生成部105によって作成される検索用の部分
文字列群を格納するものである。検索文字列バッファ1
13bは、図12に示すように、予測開始位置を変化さ
せて生成した検索文字列の数に合わせた番号を示す項目
12a、予測対象文字列に対する予測開始位置を示す項
目12b、予測文字位置を変化させて得られる検索文字
列を示す項目12cからなる。
The search character string buffer 113b stores a group of partial character strings for search created by the search character string generation unit 105. Search string buffer 1
13b, as shown in FIG. 12, item 12a indicating a number corresponding to the number of search character strings generated by changing the prediction start position, item 12b indicating the prediction start position for the prediction target character string, and prediction character position It consists of an item 12c indicating a search character string obtained by changing.

【0020】予測候補バッファ113cは、予測辞書検
索部106によって予測候補として得られる文字列を格
納する。予測候補バッファ113cは、図13に示すよ
うに、予測辞書107を検索して得られた検索結果の数
に合わせた番号を示す項目13a、予測辞書107を検
索する際に用いた予測開始位置を示す項目13b、予測
辞書107を検索した結果である辞書番号、読み、表記
にそれぞれ対応する項目13c、13d、13eからな
る。
The prediction candidate buffer 113c stores a character string obtained as a prediction candidate by the prediction dictionary search unit 106. As illustrated in FIG. 13, the prediction candidate buffer 113 c stores an item 13 a indicating a number corresponding to the number of search results obtained by searching the prediction dictionary 107 and a prediction start position used when searching the prediction dictionary 107. The item 13b includes items 13c, 13d, and 13e corresponding to dictionary numbers, readings, and notations obtained by searching the prediction dictionary 107, respectively.

【0021】選択候補バッファ113dは、予測候補の
うちユーザが選択した候補を格納する。選択候補バッフ
ァ113dは、図14に示すように、ユーザが選択した
予測候補が記憶され、その項目として、予測開始位置を
示す項目14a、予測辞書107の辞書番号を示す項目
14b、そして読みと表記の項目14c、14dからな
る。
The selection candidate buffer 113d stores the candidates selected by the user among the prediction candidates. As shown in FIG. 14, the selection candidate buffer 113d stores the prediction candidates selected by the user, and includes, as its items, an item 14a indicating the prediction start position, an item 14b indicating the dictionary number of the prediction dictionary 107, and reading and notation. Items 14c and 14d.

【0022】変換候補バッファ113eは、かな漢字変
換部108によって得られる候補や、変換候補再評価部
109によって得られる評価値を格納する。変換候補バ
ッファ113eは、図15に示すように、かな漢字変換
によって得られた候補に関連して、その候補の数を示す
項目15a、かな漢字変換辞書110に対応した辞書番
号、読み、表記にそれぞれ対応する項目15b、15
c、15d、該候補についての付属語を示す項目15
e、例えば、かな漢字辞書110の頻度情報のような変
換評価値を示す項目15f、そして、共起辞書検索部1
11、変換候補再評価部109でそれぞれで求めた共起
評価値及び再評価値を示す項目15g、15hからな
る。
The conversion candidate buffer 113e stores candidates obtained by the kana-kanji conversion unit 108 and evaluation values obtained by the conversion candidate re-evaluation unit 109. As shown in FIG. 15, the conversion candidate buffer 113e is associated with an item 15a indicating the number of candidates, a dictionary number corresponding to the kana-kanji conversion dictionary 110, a reading, and a notation in relation to the candidates obtained by the kana-kanji conversion. Items 15b, 15
c, 15d, item 15 indicating an adjunct word for the candidate
e, for example, an item 15f indicating a conversion evaluation value such as frequency information of the kana-kanji dictionary 110, and a co-occurrence dictionary search unit 1
11, items 15g and 15h indicating the co-occurrence evaluation value and the re-evaluation value obtained by the conversion candidate re-evaluation unit 109, respectively.

【0023】次に予測制御部104に関わる処理につい
て説明する。予測制御部104は、制御部102を介し
て予測対象の読み文字列を受け取る。受け取った読み文
字列は、まず検索文字列生成部105に送られる。検索
文字列生成部105は、検索用の文字列群を生成し、予
測制御部104に検索用の文字列群を返す。
Next, processing related to the prediction control unit 104 will be described. The prediction control unit 104 receives a read character string to be predicted via the control unit 102. The received character string is first sent to the search character string generation unit 105. The search character string generation unit 105 generates a search character string group, and returns the search character string group to the prediction control unit 104.

【0024】この検索用の文字列群は、入力読み文字列
の最後尾の文字を含む部分文字列の集合である。たとえ
ば、「かきのかいぎ」といった読み文字列の入力では、
「かきのかいぎ」に加えて、「きのかいぎ」「のかい
ぎ」「かいぎ」「いぎ」といったように、先頭から1文
字ずつ短くした部分文字列を作成することである。
The character string group for search is a set of partial character strings including the last character of the input read character string. For example, when inputting a reading string such as "Kaki no Kai",
In addition to "Kaki no Kagi", a partial character string shortened by one character from the beginning such as "Kino Kagi", "No Kagi", "Kagi", "Kagi" is to be created.

【0025】予測制御部104は受け取った検索用の文
字列群を予測辞書検索部106に送る。予測辞書検索部
106は、予測辞書107を参照しながら、検索用の読
み文字列と辞書の読みが前方一致あるいは完全一致する
見出しを検索し、その検索結果を予測制御部104に返
す。予測制御部104は、受け取った検索結果を予測候
補として制御部102に返す。制御部102に返された
予測候補は、出力部103に出力される。
The prediction control unit 104 sends the received search character string group to the prediction dictionary search unit 106. The prediction dictionary search unit 106 searches the prediction dictionary 107 for a heading in which the character string for search and the dictionary reading match forward or completely, and returns the search result to the prediction control unit 104. The prediction control unit 104 returns the received search result to the control unit 102 as a prediction candidate. The prediction candidates returned to the control unit 102 are output to the output unit 103.

【0026】検索結果から予測候補を得る際、各候補の
評価値を計算し、その評価値に従って候補の優先度付け
を行うこともできる。
When obtaining prediction candidates from search results, it is also possible to calculate an evaluation value of each candidate and assign a priority to the candidates according to the evaluation value.

【0027】次に、かな漢字変換制御部114に関わる
処理について説明する。かな漢字変換制御部114は、
例えば、ディスプレイ上に提示された予測候補がユーザ
によって選択されると、選択された予測候補と予測対象
の読み文字列(入力した文字列)を制御部102から受
け取る。受け取った予測対象の読み文字列のうち、1文
字目から予測開始位置の1文字前までの読み文字列をか
な漢字変換部108に送る。かな漢字変換部108はか
な漢字変換辞書110を参照して変換候補をかな漢字変
換制御部114に返す。つぎに、かな漢字変換制御部1
14は、受け取った変換候補と、選択された予測候補を
変換候補再評価部109に送る。変換候補再評価部10
9は、受け取った2つの情報を共起辞書検索部111に
送り、変換候補の再評価を行い、その結果をかな漢字変
換制御部114に返す。かな漢字変換制御部114は受
け取ったかな漢字変換候補を制御部102に返す。制御
部102に返されたかな漢字変換候補は、出力部103
に出力される。
Next, processing related to the kana-kanji conversion control unit 114 will be described. The kana-kanji conversion control unit 114
For example, when the user selects a prediction candidate presented on the display, the control unit 102 receives the selected prediction candidate and a read target character string (input character string) to be predicted. The read character string from the first character to one character before the prediction start position in the received predicted read character string is sent to the kana-kanji conversion unit 108. The kana-kanji conversion unit 108 refers to the kana-kanji conversion dictionary 110 and returns conversion candidates to the kana-kanji conversion control unit 114. Next, Kana-Kanji conversion control unit 1
14 sends the received conversion candidate and the selected prediction candidate to the conversion candidate re-evaluation unit 109. Conversion candidate reevaluation unit 10
9 sends the received two pieces of information to the co-occurrence dictionary search unit 111, reevaluates the conversion candidates, and returns the result to the kana-kanji conversion control unit 114. The kana-kanji conversion control unit 114 returns the received kana-kanji conversion candidate to the control unit 102. The kana-kanji conversion candidates returned to the control unit 102 are output to the output unit 103
Is output to

【0028】以上が本システムの概要である。次に、各
処理の詳細についてフローチャートを用いて説明する。
The above is the outline of the present system. Next, details of each process will be described using a flowchart.

【0029】(a)制御部102の処理動作 まず、制御部102の処理動作について説明する。図2
は同実施形態における制御部102の処理動作を示すフ
ローチャートである。
(A) Processing Operation of Control Unit 102 First, the processing operation of the control unit 102 will be described. FIG.
4 is a flowchart illustrating a processing operation of the control unit 102 according to the first embodiment.

【0030】まず、ステップS201で、メモリ113
に設けられた予測対象文字列バッファ113aと選択候
補バッファ113dを初期化した後、以下のような処理
を実行する。
First, in step S201, the memory 113
After initializing the prediction target character string buffer 113a and the selection candidate buffer 113d provided in, the following processing is executed.

【0031】すなわち、ステップS202で、入力部1
01を介してのユーザの入力を待ち、入力があったらス
テップS203に進む。ステップS203で、入力が読
み文字入力かどうかを判定し、そうである場合はステッ
プS206に進み、そうでない場合はステップS204
に進む。入力が読み文字入力であるかどうかの判定は、
あらかじめ与えられたテーブルを参照する等の処理で行
うことが可能である。ここでは句読点は読み文字入力で
はないとする。また、入力がいわゆるローマ字入力であ
る場合には、読み1文字にあたる入力があるまでここで
バッファリングを行う。
That is, in step S202, the input unit 1
The process waits for an input by the user via 01, and if there is an input, the process proceeds to step S203. In step S203, it is determined whether the input is a reading character input, and if so, the process proceeds to step S206; otherwise, the process proceeds to step S204.
Proceed to. To determine whether the input is a phonetic character input,
This can be performed by processing such as referring to a table given in advance. Here, it is assumed that punctuation is not a reading character input. If the input is a so-called Roman character input, buffering is performed here until there is an input corresponding to one character to be read.

【0032】ステップS206で、予測対象文字列バッ
ファ113aに、入力された読み1文字を追加し、ステ
ップS207に進む。ステップS207で、予測対象文
字列が2文字以上であるかどうかを判定する。そうであ
る場合はステップS208に進み、そうでない場合はス
テップS202に戻り、読み文字入力が2文字以上にな
るまでユーザ入力を待つ。ステップS208で、予測制
御部104に、予測対象文字列バッファ113aの情報
を送り、予測をスタートさせる。
In step S206, the input one-character reading is added to the prediction target character string buffer 113a, and the flow advances to step S207. In step S207, it is determined whether the character string to be predicted is two or more characters. If so, the process proceeds to step S208; otherwise, the process returns to step S202, and waits for a user input until the number of characters to be read becomes two or more. In step S208, the information of the prediction target character string buffer 113a is sent to the prediction control unit 104, and the prediction is started.

【0033】ここで処理は一旦、予測制御部104に移
る。そして、予測制御部104は予測候補バッファ11
3cの情報を制御部102に返すので、ステップS20
9で、その情報を受け取り、入力予測候補ウインドウに
表示し、ステップS202に戻り、次のユーザ入力を待
つ。表示処理については後に詳述する。
Here, the process temporarily moves to the prediction control unit 104. Then, the prediction control unit 104 sets the prediction candidate buffer 11
Since the information of 3c is returned to the control unit 102, step S20
In step 9, the information is received and displayed on the input prediction candidate window, and the process returns to step S202 to wait for the next user input. The display processing will be described later in detail.

【0034】ステップS204では、入力が句読点であ
るかどうかを判定する。そうである場合はステップS2
10に進み、そうでない場合はステップS205に進
む。ステップS210で、予測対象文字列バッファ11
3aをクリアし、ステップS202に戻り、次のユーザ
入力を待つ。
In step S204, it is determined whether the input is a punctuation mark. If so, step S2
Proceed to step S10, otherwise proceed to step S205. In step S210, the prediction target character string buffer 11
Clear 3a and return to step S202 to wait for the next user input.

【0035】ステップS205では、入力部101を介
して入力されたデータが予測候補選択を指示するキー、
例えば予測候補選択キーであるかどうかを判定する。そ
うでない場合はステップS216に進み、別途定義され
ている処理を行う。一方、そうである場合はステップS
211に進み、選択された予測候補についての情報を選
択候補バッファ113dにセットし、ステップS212
に進む。ステップS212で、選択候補バッファ113
dに記述されている予測開始位置14aの内容が1文字
目を示すものかどうかを判定する。そうである場合には
S215に進み、そうでない場合にはステップS213
に進む。
In step S205, the data input through the input unit 101 is a key for instructing selection of a prediction candidate.
For example, it is determined whether the key is a prediction candidate selection key. If not, the process proceeds to step S216, where a separately defined process is performed. On the other hand, if so, step S
In step S212, information about the selected prediction candidate is set in the selection candidate buffer 113d.
Proceed to. In step S212, the selection candidate buffer 113
It is determined whether or not the content of the prediction start position 14a described in d indicates the first character. If so, proceed to S215; otherwise, go to step S213.
Proceed to.

【0036】ステップS213で、予測対象文字列バッ
ファ113aの情報と選択候補バッファ113dの情報
をかな漢字変換制御部114に送り、かな漢字変換をス
タートさせる。かな漢字変換処理については広く公知で
あるので、ここでは省略する。ここで処理は一旦、かな
名漢字変換制御部114に移る。そして、かな漢字変換
制御部114は変換候補バッファ113eの情報を制御
部102に返すので、ステップS214でその情報を受
け取り、入力領域に表示し、ステップS215に進む。
ステップS215で、選択候補バッファ113dの情報
を入力領域に表示し、ステップS202に戻り、次のユ
ーザ入力を待つ。
In step S213, the information of the prediction target character string buffer 113a and the information of the selection candidate buffer 113d are sent to the kana-kanji conversion control unit 114, and the kana-kanji conversion is started. Since the kana-kanji conversion process is widely known, the description is omitted here. Here, the process temporarily moves to the kana name-kanji conversion control unit 114. Then, since the kana-kanji conversion control unit 114 returns the information of the conversion candidate buffer 113e to the control unit 102, the kana-kanji conversion control unit 114 receives the information in step S214, displays it in the input area, and proceeds to step S215.
In step S215, the information of the selection candidate buffer 113d is displayed in the input area, and the process returns to step S202 to wait for the next user input.

【0037】以上の繰り返しにより、制御部102は、
入力された読み文字列の情報を予測制御部104へ、ま
た、入力された読み文字列と選択された予測候補の情報
をかな漢字変換制御部114へと受け渡し、それぞれ結
果を受け取って次の処理へと進む。
By repeating the above, the control unit 102
The input reading character string information is transferred to the prediction control unit 104, and the input reading character string and selected prediction candidate information are transferred to the kana-kanji conversion control unit 114. The results are received and the next processing is performed. And proceed.

【0038】(b)予測制御部104の処理動作 次に、予測制御部104の処理動作について説明する。
図3は同実施形態における予測制御部104の処理動作
を示すフローチャートである。
(B) Processing Operation of Prediction Control Unit 104 Next, the processing operation of the prediction control unit 104 will be described.
FIG. 3 is a flowchart showing the processing operation of the prediction control unit 104 in the embodiment.

【0039】まず、ステップS301で、メモリ113
に設けられた予測候補バッファ113cを初期化した
後、以下のような処理を実行する。
First, in step S301, the memory 113
After initializing the prediction candidate buffer 113c provided in, the following processing is executed.

【0040】すなわち、ステップS302で、制御部1
02から、予測対象文字列バッファ113aの情報を受
け取り、ステップS303に進む。ステップS303
で、受け取った予測対象文字列バッファ113aの情報
を検索文字列生成部105に送る。ここで処理は一旦、
検索文字列生成部105へ移る。そして、検索文字列生
成部105は検索文字列バッファ113bの情報を返す
ので、ステップS304でその情報を受け取り、ステッ
プS305に進む。ステップS305で、検索文字列バ
ッファ113bに格納された検索用の読み文字列の件数
を変数KRにセットし、ステップS306に進む。ステ
ップS306で、カレントの検索文字列を示す変数iを
1とし、ステップS307に進む。
That is, in step S302, the control unit 1
From 02, the information of the prediction target character string buffer 113a is received, and the process proceeds to step S303. Step S303
Then, the information of the received prediction target character string buffer 113a is sent to the search character string generation unit 105. Here, once the process
The process proceeds to the search character string generation unit 105. Then, since the search character string generation unit 105 returns the information of the search character string buffer 113b, the information is received in step S304, and the process proceeds to step S305. In step S305, the number of read character strings for search stored in the search character string buffer 113b is set in a variable KR, and the process proceeds to step S306. In step S306, the variable i indicating the current search character string is set to 1, and the process proceeds to step S307.

【0041】ステップS307で、i≦KRであるかど
うか判定する。i≦KRである場合、すなわち、まだ辞
書検索を行っていない検索文字列がある場合にはステッ
プS308に進み、そうでない場合はステップS312
に進む。ステップS308で、検索文字列バッファ11
3bのi番目の読み文字列を予測辞書検索部106に送
る。予測辞書検索部106は、予測辞書107を参照し
て検索結果を返すので、ステップS309でその結果を
受け取る。
In step S307, it is determined whether or not i ≦ KR. If i ≦ KR, that is, if there is a search character string for which dictionary search has not been performed, the process proceeds to step S308; otherwise, the process proceeds to step S312.
Proceed to. In step S308, the search character string buffer 11
The i-th read character string of 3b is sent to the prediction dictionary search unit 106. The prediction dictionary search unit 106 returns a search result with reference to the prediction dictionary 107, and receives the result in step S309.

【0042】ここで、入力予測に用いられる予測辞書1
07の構成について説明する。図8に予測辞書107に
格納される情報の例を示す。予測辞書107は、「辞書
番号」、「読み」、「表記」の各項目8a、8b、8c
からなっている。例えば、辞書番号Y01には、読みが
「かきのがっしゅく」、表記(見出し)が「夏期の合
宿」といった情報が記述されている。
Here, the prediction dictionary 1 used for input prediction
07 will be described. FIG. 8 shows an example of information stored in the prediction dictionary 107. The prediction dictionary 107 includes items 8a, 8b, 8c of "dictionary number", "reading", and "notation".
Consists of For example, in the dictionary number Y01, information such as a reading “Kaki no Gashoku” and a notation (heading) “Summer training camp” is described.

【0043】図3の説明に戻り、続けて、ステップS3
10に進む。ステップS310で、受け取った検索結果
を予測候補バッファ113cにセットし、ステップS3
11に進む。S311で、iを1インクリメントし、ス
テップS307に戻る。ステップS312で、予測候補
バッファ113cの情報を制御部102に送り、処理を
終了する。
Returning to the description of FIG. 3, step S3 follows.
Go to 10. In step S310, the received search result is set in the prediction candidate buffer 113c, and in step S3
Proceed to 11. In step S311, i is incremented by one, and the process returns to step S307. In step S312, the information of the prediction candidate buffer 113c is sent to the control unit 102, and the process ends.

【0044】このように、入力文字列から検索用の部分
文字列を作成して予測辞書107を検索し、その検索結
果を予測候補として制御部102に渡す処理を行う。以
上が予測制御部104の処理の流れである。
As described above, a process of creating a partial character string for search from the input character string, searching the prediction dictionary 107, and passing the search result to the control unit 102 as a prediction candidate is performed. The above is the processing flow of the prediction control unit 104.

【0045】(c)検索文字列生成部105の処理動作 次に、検索文字列生成部105の処理動作について説明
する。図4は同実施形態における検索文字列生成部10
5の処理動作を示すフローチャートである。
(C) Processing Operation of Search Character String Generation Unit 105 Next, the processing operation of the search character string generation unit 105 will be described. FIG. 4 shows a search character string generation unit 10 according to the embodiment.
5 is a flowchart illustrating a processing operation of No. 5;

【0046】まず、ステップS401で、メモリ113
に設けられた検索文字列バッファ113bを初期化した
後、以下のような処理を実行する。
First, in step S401, the memory 113
After initializing the search character string buffer 113b provided in, the following processing is executed.

【0047】すなわち、ステップS402で、予測制御
部104から予測対象文字列バッファ113aの情報を
受け取り、ステップS403に進む。ステップS403
で、予測対象文字列の長さを変数Lにセットし、ステッ
プS404に進む。ステップS404で、予測開始位置
を示す変数iに1をセットし、ステップS405に進
む。検索用の文字列は2文字以上とするため、ステップ
S405で、i≦L−1であるかどうか判定する。i≦
L−1である場合、すなわち、部分文字列が2文字以上
であればステップS406に進む。そうでない場合、す
なわち部分文字列が2文字に満たない場合ステップS4
08に進む。ステップS406で、i文字目からL文字
目までの文字列と、予測開始位置iを、検索文字列バッ
ファ113bにセットし、ステップS407に進む。ス
テップS407で、iを1インクリメントし、ステップ
S405に戻る。ステップS408で、検索文字列バッ
ファ113bの情報を予測制御部104に送り、処理を
終了する。
That is, in step S402, information on the character string buffer 113a to be predicted is received from the prediction control unit 104, and the flow advances to step S403. Step S403
Then, the length of the character string to be predicted is set in a variable L, and the process proceeds to step S404. In step S404, 1 is set to a variable i indicating the prediction start position, and the flow advances to step S405. In order to make the search character string two or more characters, it is determined in step S405 whether or not i ≦ L−1. i ≦
If it is L-1, that is, if the partial character string is two or more characters, the process proceeds to step S406. Otherwise, that is, when the partial character string is less than two characters, step S4
Proceed to 08. In step S406, the character strings from the i-th character to the L-th character and the prediction start position i are set in the search character string buffer 113b, and the process proceeds to step S407. In step S407, i is incremented by one, and the process returns to step S405. In step S408, the information of the search character string buffer 113b is sent to the prediction control unit 104, and the process ends.

【0048】このように、入力された文字列の最後尾の
文字を含む部分文字列群を、予測開始位置(検索文字列
の開始位置)とともに予測制御部104に返す。以上
が、検索文字列生成部105の処理の流れである。
As described above, the partial character string group including the last character of the input character string is returned to the prediction control unit 104 together with the prediction start position (start position of the search character string). The above is the processing flow of the search character string generation unit 105.

【0049】(d)かな漢字変換制御部114の処理動
作 次に、かな漢字変換制御部114の処理動作にについて
説明する。図7は、同実施形態におけるかな漢字変換制
御部114の処理動作を示すフローチャートである。
(D) Processing Operation of Kana-Kanji Conversion Control Unit 114 Next, the processing operation of the kana-kanji conversion control unit 114 will be described. FIG. 7 is a flowchart showing a processing operation of the kana-kanji conversion control unit 114 in the embodiment.

【0050】まず、ステップS701でメモリ113に
設けられた変換候補バッファ113eを初期化してか
ら、以下のような処理を実行する。
First, in step S701, the conversion candidate buffer 113e provided in the memory 113 is initialized, and the following processing is executed.

【0051】すなわち、ステップS702で、制御部1
02から予測対象文字列バッファ113aの情報と選択
候補バッファ113dの情報を受け取り、ステップS7
03に進む。ステップS703で、選択候補バッファ1
13dの予測開始位置を変数Mにセットし、ステップS
704に進む。ステップS704で、予測対象文字列バ
ッファの1文字目からM−1文字目の文字列をかな漢字
変換部108に送る。ここで処理は一旦、かな漢字変換
部108に移る。そして、かな漢字変換部108はかな
漢字変換辞書110を参照してかな漢字変換を実行し、
変換候補バッファ113eに変換結果をセットして返す
ので、ステップS705で受け取る。
That is, in step S702, the control unit 1
02, the information of the prediction target character string buffer 113a and the information of the selection candidate buffer 113d are received.
Go to 03. In step S703, the selection candidate buffer 1
The prediction start position of 13d is set in a variable M, and step S
Proceed to 704. In step S704, the character string from the first character to the (M-1) th character of the prediction target character string buffer is sent to the kana-kanji conversion unit 108. Here, the process temporarily shifts to the kana-kanji conversion unit 108. Then, the kana-kanji conversion unit 108 performs kana-kanji conversion with reference to the kana-kanji conversion dictionary 110,
Since the conversion result is set and returned in the conversion candidate buffer 113e, it is received in step S705.

【0052】ここで、かな漢字変換の方法やかな漢字変
換に用いられる辞書の構成方法については広く公知であ
るが、後に説明する共起辞書112との関連で、同実施
形態で利用されるかな漢字変換辞書110の構成につい
て説明する。
The kana-kanji conversion method and the dictionary construction method used for kana-kanji conversion are widely known. However, in connection with the co-occurrence dictionary 112 described later, the kana-kanji conversion dictionary used in the embodiment is used. The configuration of 110 will be described.

【0053】図9にかな漢字変換辞書110に格納され
る情報の例を示す。かな漢字変換辞書110は、「辞書
番号」、「読み」、「表記」、「品詞」、「頻度」の各
項目9a、9b、9c、9d、9eからなっている。例
えば、辞書番号「K01」が示す位置には、読みが
「か」、表記(見出し)が「欠」、品詞が「カ行5段動
詞」、頻度が「2」といった情報が記述されている。
FIG. 9 shows an example of information stored in the kana-kanji conversion dictionary 110. The kana-kanji conversion dictionary 110 includes items 9a, 9b, 9c, 9d, and 9e of "dictionary number", "reading", "notation", "part of speech", and "frequency". For example, at the position indicated by the dictionary number "K01", information such as "ka" for the reading, "missing" for the notation (heading), "part-of-line verb" for the part of speech, and "2" for the frequency are described. .

【0054】図7の説明に戻り、続けてステップS70
6に進む。ステップS706で、変換候補バッファ11
3eの情報と選択候補バッファ113dの情報を変換候
補再評価部109に送る。変換候補再評価部109は、
受け取った2つの情報を共起辞書検索部111に送り、
再評価値が追加された変換候補バッファ113eの情報
を返すので、ステップS707でその情報を受け取る。
続いてステップS708に進み、ステップS708で、
変換候補バッファ113eの情報を制御部102に返
し、処理を終了する。
Returning to the description of FIG. 7, step S70 follows.
Proceed to 6. In step S706, the conversion candidate buffer 11
The information of 3e and the information of the selection candidate buffer 113d are sent to the conversion candidate reevaluation unit 109. The conversion candidate reevaluation unit 109
The two pieces of information received are sent to the co-occurrence dictionary search unit 111,
Since the information of the conversion candidate buffer 113e to which the reevaluation value is added is returned, the information is received in step S707.
Subsequently, the process proceeds to step S708, and in step S708,
The information of the conversion candidate buffer 113e is returned to the control unit 102, and the process ends.

【0055】このように、入力された予測対象文字列の
うち予測開始位置の前側にある文字列のかな漢字変換を
行い、さらにユーザが選択した予測候補の情報を利用し
て、かな漢字変換結果の再評価を行い、高い精度でかな
漢字変換候補を作成する。
As described above, the kana-kanji conversion of the character string in front of the prediction start position in the input prediction target character string is performed, and the kana-kanji conversion result is re-used by using the information of the prediction candidate selected by the user. Evaluate and create Kana-Kanji conversion candidates with high accuracy.

【0056】(e)変換候補再評価部109の処理動作 次に、変換候補再評価部109の処理動作にについて説
明する。図5は、同実施形態における変換候補再評価部
109の処理動作を示すフローチャートである。
(E) Processing Operation of Conversion Candidate Re-Evaluation Unit 109 Next, the processing operation of the conversion candidate re-evaluation unit 109 will be described. FIG. 5 is a flowchart showing the processing operation of the conversion candidate reevaluation unit 109 in the embodiment.

【0057】まず、ステップS501で、かな漢字変換
制御部114から選択候補バッファ113dの情報と変
換候補バッファ113eの情報を受け取り、ステップS
502に進む。ステップS502で、変換候補バッファ
113eに格納される候補の件数を変数HRにセット
し、ステップS503に進む。ステップS503で、カ
レントの変換候補を示す変数iに1をセットし、ステッ
プS504に進む。ステップS504で、i≦HRであ
るかどうか判定する。i≦HRである場合、すなわち、
再評価値を計算していない変換候補が残っている場合に
はステップS505に進み、そうでない場合にはステッ
プS510に進む。
First, in step S501, information of the selection candidate buffer 113d and information of the conversion candidate buffer 113e are received from the kana-kanji conversion control unit 114, and
Proceed to 502. In step S502, the number of candidates stored in the conversion candidate buffer 113e is set in a variable HR, and the process proceeds to step S503. In step S503, the variable i indicating the current conversion candidate is set to 1, and the process proceeds to step S504. In step S504, it is determined whether or not i ≦ HR. When i ≦ HR, that is,
If conversion candidates for which re-evaluation values have not been calculated remain, the process proceeds to step S505; otherwise, the process proceeds to step S510.

【0058】ステップS505で、i番目の変換評価値
を変数Pt(h)にセットし、ステップS506に進
む。ステップS506で、i番目の変換候補と選択候補
バッファ113dの情報を共起辞書検索部111に送
る。共起辞書検索部111は、共起評価値を返すので、
ステップS507でその情報を受け取り、変数Pt
(k)にセットし、ステップS508に進む。
In step S505, the ith conversion evaluation value is set in a variable Pt (h), and the flow advances to step S506. In step S506, the i-th conversion candidate and the information of the selection candidate buffer 113d are sent to the co-occurrence dictionary search unit 111. Since the co-occurrence dictionary search unit 111 returns the co-occurrence evaluation value,
In step S507, the information is received, and the variable Pt
(K) is set, and the process proceeds to step S508.

【0059】ステップS508では、以下に示す式
(1)によりPt(r)を計算し、Pt(r)を再評価
として変換候補バッファ113eにセットする。
In step S508, Pt (r) is calculated by the following equation (1), and Pt (r) is set in the conversion candidate buffer 113e as reevaluation.

【0060】 Pt(r)=Pt(h)+10×Pt(k)‥‥‥式(1) 続いて、ステップS509に進み、iを1インクリメン
トし、ステップS504に戻る。
Pt (r) = Pt (h) + 10 × Pt (k) Equation (1) Subsequently, the process proceeds to step S509, i is incremented by 1, and the process returns to step S504.

【0061】ステップS510で、再評価値Pt(r)
に基づき変換候補バッファ113eの情報をソートし、
ステップS511に進む。ステップS511で、変換候
補バッファ113eの情報をかな漢字変換制御部114
に返し、処理を終了する。
In step S510, the reevaluation value Pt (r)
Sorts the information of the conversion candidate buffer 113e based on
Proceed to step S511. In step S511, the information in the conversion candidate buffer 113e is
To end the process.

【0062】このように、ユーザが選択した予測候補の
情報を利用して、かな漢字変換候補の再評価を行う。
As described above, the kana-kanji conversion candidate is reevaluated using the information on the prediction candidate selected by the user.

【0063】(f)共起辞書検索部111の処理動作 次に、共起辞書検索部111の処理動作にについて説明
する。図6は、同実施形態における共起辞書検索部11
1の処理動作を示すフローチャートである。
(F) Processing Operation of Co-occurrence Dictionary Search Unit 111 Next, the processing operation of the co-occurrence dictionary search unit 111 will be described. FIG. 6 shows a co-occurrence dictionary search unit 11 according to the embodiment.
3 is a flowchart showing a processing operation of No. 1.

【0064】まず、ステップS601で、変換候補再評
価部109から選択候補バッファ113dの情報と変換
候補バッファ113eのi番目の情報を受け取り、ステ
ップS602に進む。ステップS602で、共起辞書1
12に登録されている共起の件数を変数CRにセットす
る。
First, in step S601, the information of the selection candidate buffer 113d and the i-th information of the conversion candidate buffer 113e are received from the conversion candidate re-evaluation unit 109, and the flow advances to step S602. In step S602, the co-occurrence dictionary 1
The number of co-occurrences registered in No. 12 is set in a variable CR.

【0065】ここで、変換候補再評価に用いられる共起
辞書112の構成について説明する。図10に共起辞書
112に格納される情報の例を示す。共起辞書112
は、「前側辞書番号」、「後側辞書番号」、「付属
語」、「結合度」の各項目10a、10b、10c、1
0dからなっている。たとえば、1行目は、辞書番号K
03の見出し、すなわち「下記」と、予測辞書107の
辞書番号「Y03」が示す見出し、すなわち「会議を開
催しますのでご参集願います」が、付属語「の」を介し
て共起関係にあり、その共起の結合度は「2」であるこ
とを示している。
Here, the configuration of the co-occurrence dictionary 112 used for the re-evaluation of the conversion candidate will be described. FIG. 10 shows an example of information stored in the co-occurrence dictionary 112. Co-occurrence dictionary 112
Are items 10a, 10b, 10c, 1 of "front dictionary number", "rear dictionary number", "attached word", and "coupling degree".
0d. For example, the first line contains the dictionary number K
Heading 03, ie, “below”, and the heading indicated by dictionary number “Y03” of the prediction dictionary 107, ie, “Please hold a meeting so please join us”, form a co-occurrence relationship via the auxiliary word “no”. This indicates that the co-occurrence degree of coupling is “2”.

【0066】図6の説明に戻り、続けて、ステップS6
03に進む。ステップS603で、共起評価値の初期値
として変数Pt(k)に0をセットし、ステップS60
4に進む。ステップS604で、カレントの共起を示す
番号kに1をセットし、ステップS605に進む。ステ
ップS605で、k≦CRであるかどうか判定する。k
≦CRである場合、すなわち、共起辞書にまだチェック
していない共起が残っている場合にはステップS606
に進み、そうでない場合にはステップS611に進む。
Returning to the description of FIG. 6, step S6 follows.
Go to 03. In step S603, 0 is set in a variable Pt (k) as an initial value of the co-occurrence evaluation value, and in step S60
Proceed to 4. In step S604, 1 is set to the number k indicating the current co-occurrence, and the process proceeds to step S605. In step S605, it is determined whether or not k ≦ CR. k
If ≦ CR, that is, if there is any unchecked co-occurrence in the co-occurrence dictionary, step S606
Otherwise, to step S611.

【0067】ステップS606で、選択候補バッファ1
13dの辞書番号と共起辞書112のk番目の後側辞書
番号が一致するかどうか判定する。そうである場合には
ステップS607に進み、そうでない場合にはステップ
S610に進む。ステップS607で、i番目の変換候
補の辞書番号と共起辞書112のk番目の前側辞書番号
が一致するかどうか判定する。そうである場合にはステ
ップS608に進み、そうでない場合にはステップS6
10に進む。ステップS608で、i番目の変換候補の
付属語と共起辞書112のk番目の付属語が一致するか
どうか判定する。そうである場合にはステップS609
に進み、そうでない場合にはステップS610に進む。
ステップS609で、k番目の結合度を共起評価値とし
て変数Pt(k)にセットし、ステップS611に進
む。ステップS611で、変換候補再評価部109に共
起評価値Pt(k)を返し、処理を終了する。
In step S606, the selection candidate buffer 1
It is determined whether the 13d dictionary number matches the k-th rear dictionary number of the co-occurrence dictionary 112. If so, the process proceeds to step S607; otherwise, the process proceeds to step S610. In step S607, it is determined whether the dictionary number of the i-th conversion candidate matches the k-th preceding dictionary number of the co-occurrence dictionary 112. If so, go to step S608; otherwise, go to step S6.
Go to 10. In step S608, it is determined whether the attached word of the i-th conversion candidate matches the k-th attached word of the co-occurrence dictionary 112. If so, step S609
Otherwise, to step S610.
In step S609, the k-th coupling degree is set as a co-occurrence evaluation value in the variable Pt (k), and the flow advances to step S611. In step S611, the co-occurrence evaluation value Pt (k) is returned to the conversion candidate re-evaluation unit 109, and the process ends.

【0068】このように、受け取ったかな漢字変換候補
と選択された予測候補を共起辞書と照合して、共起評価
値を返す。
Thus, the received kana-kanji conversion candidate and the selected prediction candidate are collated with the co-occurrence dictionary, and the co-occurrence evaluation value is returned.

【0069】次に、図16に示す画面表示の例を参照し
ながら、本システムを利用した場合の実際の処理の流れ
を説明する。
Next, an actual processing flow when the present system is used will be described with reference to an example of a screen display shown in FIG.

【0070】「か」「き」と順に読みを入力していき、
「の」まで入力した時点での処理を考える。この場合、
前述した制御部102の制御に基づきステップS203
乃至ステップS209の処理が進められる。この場合、
予測対象文字列バッファ113aには、予測対象文字列
として読み文字列「かきの」が記憶される(ステップS
206)。また、この文字列(予測対象文字列)が2文
字以上なので(ステップS207)、予測制御部104
に処理が一旦移り(ステップS208)、予測辞書10
7を用いた予測処理が行われる(図3のフローチャート
の内容)。
The readings are input in the order of “ka” and “ki”,
Consider the process at the point when "no" is input. in this case,
Step S203 based on the control of the control unit 102 described above.
Then, the process from step S209 is advanced. in this case,
In the prediction target character string buffer 113a, a read character string “Kakino” is stored as a prediction target character string.
206). Further, since this character string (character string to be predicted) is two or more characters (step S207), the prediction control unit 104
The processing is temporarily shifted to (step S208), and the prediction dictionary 10
7 is performed (contents of the flowchart of FIG. 3).

【0071】さらに予測制御部104では、処理を検索
文字列生成部105に移し(S303、S304)予測
対象文字列「かきの」に対する検索文字列「かきの」
「きの」を受け取る。これら検索文字列は、検索文字列
バッファ113bに記憶される。さらに処理を予測辞書
検索部106に移し(ステップS308、S309)検
索文字列「かきの」に基づき予測辞書107を検索した
結果を受け取る。ここで、予測辞書を検索して得た結果
は、図8の予測辞書107の辞書番号Y01及びY02
の内容が該当する。これら、検索結果は予測候補バッフ
ァ113cに記憶される。
Further, the prediction control unit 104 shifts the processing to the search character string generation unit 105 (S303, S304), and searches the prediction target character string "Kakino" for the search character string "Kakino".
Receive "kino". These search character strings are stored in the search character string buffer 113b. Further, the process is transferred to the prediction dictionary search unit 106 (steps S308 and S309), and the result of searching the prediction dictionary 107 based on the search character string "Kakino" is received. Here, the results obtained by searching the prediction dictionary are the dictionary numbers Y01 and Y02 of the prediction dictionary 107 in FIG.
The above applies. These search results are stored in the prediction candidate buffer 113c.

【0072】そして、予測制御部104での処理が終わ
り、再び制御部102の処理に戻り、予測候補バッファ
113cの内容が出力部103を介して表示される(ス
テップS209)。具体的には、図16に示されるよう
に入力予測候補ウインドウが開き、「夏季の合宿」「火
器の使用」という2つの候補が表示される。
Then, the processing in the prediction control section 104 ends, and the processing returns to the processing in the control section 102 again, and the contents of the prediction candidate buffer 113c are displayed via the output section 103 (step S209). Specifically, as shown in FIG. 16, an input prediction candidate window is opened, and two candidates “summer training camp” and “use of firearms” are displayed.

【0073】ここでは、カレント候補として、1番目の
候補「夏季の合宿」が反転表示されている。望む候補が
ある場合にはカーソルで選択し、望む候補がない場合は
読みを続けて入力する。
Here, the first candidate “Summer Training Camp” is highlighted as a current candidate. If there is a desired candidate, select it with the cursor. If there is no desired candidate, continue reading and input.

【0074】この場合は、望む候補がないので続けて
「か」と入力する(ステップS202)と、再び入力デ
ータが読み文字列かが判断され(ステップS203)、
ステップS206以降の処理が行われる。また、「か」
と入力した時点で、図17に示すように入力予測候補ウ
インドウが消える。さらに、「い」「ぎ」と入力した場
合にも、ステップS203で入力データは読み文字列と
判断されるので、ステップS206以降の処理が繰り返
される。
In this case, since there is no desired candidate, if "?" Is continuously input (step S202), it is determined again whether the input data is a read character string (step S203),
The processing after step S206 is performed. again"
At the point of input, the input prediction candidate window disappears as shown in FIG. Further, also when "i" and "gi" are input, the input data is determined to be a read character string in step S203, so that the processing from step S206 is repeated.

【0075】これ以降に本願発明の特徴である、入力文
字列中の任意の箇所で予測を行う場合について、具体的
な例を示して説明する。なお、予測候補を求め表示する
までの処理は、上記で説明したものと同様である。
Hereinafter, a case where prediction is performed at an arbitrary position in an input character string, which is a feature of the present invention, will be described with reference to a specific example. The processing up to obtaining and displaying the prediction candidate is the same as that described above.

【0076】先に示した「ぎ」と入力した時点で、予測
対象文字列バッファ113aには、図11に示すように
「かきのかいぎ」という文字列が格納された状態とな
る。
At the point of time when the above-mentioned "Gi" is input, the character string "Kaki no Kaigi" is stored in the prediction target character string buffer 113a as shown in FIG.

【0077】制御部102(図2のフローチャート)に
おいて、ステップS207で、予測対象文字列が2文字
以上であるかどうか判定され、ここでは予測対象文字列
は6文字であるので、ステップS208に進む。ステッ
プS208で、予測対象文字列「かきのかいぎ」が予測
制御部104に送られ、予測処理がスタートする。
In the control unit 102 (the flowchart of FIG. 2), it is determined in step S207 whether or not the character string to be predicted is two or more characters. Since the character string to be predicted is six characters, the process proceeds to step S208. . In step S208, the prediction target character string “Kaki no Kagi” is sent to the prediction control unit 104, and the prediction process starts.

【0078】予測制御部104(図3のフローチャー
ト)において、ステップS303で、「かきのかいぎ」
が検索文字列生成部105に送られる。
In the prediction control unit 104 (the flowchart of FIG. 3), in step S303, "Kaki no key"
Is sent to the search character string generation unit 105.

【0079】そして、検索文字列生成部105(図4の
フローチャート)において、長さ6文字(Lに6がセッ
トされる:ステップS403)の予測対象文字列に対し
て、「かきのかいぎ」「きのかいぎ」「のかいぎ」「か
いぎ」「いぎ」の5つの検索文字列群が生成され、この
生成された検索文字列とともに、その文字列が予測対象
文字列の何文字目から始まるのかという位置(予測開始
位置)の情報が、検索文字列バッファ113bにセット
される(ステップS406)。この時の検索文字列バッ
ファ113bの状態を図12に示す。そして、検索文字
列バッファ113bの情報は、予測制御部104に返さ
れる(ステップS408)。
Then, in the search character string generation unit 105 (flowchart in FIG. 4), for the character string to be predicted having the length of 6 characters (L is set to 6: step S403), Five search character strings, "Kinokaigi", "Nokaigi", "Kaigi", and "Igi" are generated, and the generated search character string and the number of characters in the prediction target character string Information of a position (prediction start position) as to whether to start from the eye is set in the search character string buffer 113b (step S406). FIG. 12 shows the state of the search character string buffer 113b at this time. Then, the information of the search character string buffer 113b is returned to the prediction control unit 104 (Step S408).

【0080】処理は再び予測制御部104に戻る。予測
制御部104(図3のフローチャート)において、ステ
ップS308からステップS311の繰り返しにより、
検索文字列バッファ113bに格納されるすべての検索
文字列が予測辞書検索部106に送られ、検索文字列と
予測辞書107の読みが前方一致あるいは完全一致する
見出しが検索され、予測候補バッファ113cにセット
される。
The processing returns to the prediction control section 104 again. In the prediction control unit 104 (the flowchart of FIG. 3), by repeating steps S308 to S311,
All the search character strings stored in the search character string buffer 113b are sent to the prediction dictionary search unit 106, and a heading in which the search character string matches the reading of the prediction dictionary 107 with a forward match or a perfect match is searched for, and is stored in the prediction candidate buffer 113c. Set.

【0081】ここまでの処理により、予測候補バッファ
113cには、予測辞書107の読みが検索文字列「か
いぎ」に前方一致する候補として、図13に示す「会議
を開催しますのでご参集願います」「会議を開催しま
す」「会議を行います」「会議を執り行います」の4つ
の候補が格納される。
By the processing up to this point, in the prediction candidate buffer 113c, as a candidate whose reading in the prediction dictionary 107 matches the search character string "Kaigi" in front, "A meeting will be held as shown in FIG. Four candidates are stored: "I hold a meeting", "I hold a meeting", "I hold a meeting", and "I hold a meeting".

【0082】再び処理は、制御部102(図2のフロー
チャート)に戻り、ステップS209で予測候補の表示
処理が行われる。その結果、図18に示すように入力予
測候補ウインドウが開き、「会議を開催しますのでご参
集願います」「会議を開催します」「会議を行います」
「会議を執り行います」の4つの候補が出力部103を
介して例えばディスプレイ上に表示される。
The processing returns to the control unit 102 (the flowchart of FIG. 2), and the display processing of the prediction candidates is performed in step S209. As a result, the input prediction candidate window opens as shown in Fig. 18, and "We will hold a meeting so please join us""We will hold a meeting""We will hold a meeting"
Four candidates of “I will hold a meeting” are displayed on the display via the output unit 103, for example.

【0083】ここで、1番目の候補が望む候補であると
想定する。ユーザは、望む候補であれば、予測候補選択
キーを押す。すると、ユーザからの入力データを受け
て、データの種別が逐次判別される(ステップS20
3、S204、S205)。この場合、入力データは
「予測候補選択キー」なので処理は、ステップS211
へ進む。
Here, it is assumed that the first candidate is a desired candidate. The user presses a prediction candidate selection key if the candidate is desired. Then, upon receiving the input data from the user, the type of the data is sequentially determined (step S20).
3, S204, S205). In this case, since the input data is the “prediction candidate selection key”, the process proceeds to step S211.
Proceed to.

【0084】ステップS211において、選択された1
番目の予測候補「会議を開催しますのでご参集願いま
す」が選択候補バッファ113dにセットされる。この
時の選択候補バッファ113dの状態を図14に示す。
ステップS212で、選択候補バッファ113dに格納
されている候補の予測開始位置が1文字目かどうか判定
する。いま予測開始位置の項目14aは「4」であるの
で、ステップS213に進む。ステップS213で、予
測対象文字列バッファ113a(図11)に格納された
予測対象文字列「かきのかいぎ」と、選択候補バッファ
113d(図14)に格納された選択候補「会議を開催
しますのでご参集願います」の2つの情報がかな漢字変
換制御部114に送られ、かな漢字変換処理がスタート
する。
In step S211, the selected 1
The first prediction candidate “We will hold a meeting so please join us” is set in the selection candidate buffer 113d. FIG. 14 shows the state of the selection candidate buffer 113d at this time.
In step S212, it is determined whether the prediction start position of the candidate stored in the selection candidate buffer 113d is the first character. Since the item 14a of the prediction start position is “4”, the process proceeds to step S213. In step S213, the prediction target character string "Kaki no Kaigi" stored in the prediction target character string buffer 113a (FIG. 11) and the selection candidate "meeting held" in the selection candidate buffer 113d (FIG. 14) are held. Please join us "is sent to the Kana-Kanji conversion control unit 114, and the Kana-Kanji conversion process starts.

【0085】かな漢字変換制御部114(図7のフロー
チャート)において、ステップS702で上記予測対象
文字列バッファ113a及び選択候補バッファ113d
に格納された情報を受け取る。この場合、選択候補バッ
ファ113dの予測開始位置の項目14aには「4」が
格納されているので、M=4とセットされる(ステップ
S703)。ステップS704で、予測対象文字列「か
きのかいぎ」の1文字目から3文字目(M−1の値)の
文字列、すなわち「かきの」が、かな漢字変換部108
に送られる。
In the kana-kanji conversion control unit 114 (the flowchart in FIG. 7), the prediction target character string buffer 113a and the selection candidate buffer 113d are set in step S702.
Receive the information stored in. In this case, since "4" is stored in the item 14a of the prediction start position of the selection candidate buffer 113d, M is set to 4 (step S703). In step S704, the character string from the first character to the third character (value of M-1) of the prediction target character string "Kakinokai", that is, "Kakino" is converted to the kana-kanji conversion unit 108.
Sent to

【0086】かな漢字変換部108は、かな漢字変換辞
書110を参照して、「かきの」に対する読みと一致す
る変換候補を抽出し、変換候補バッファ113eに、そ
の結果をセットする。この時点での変換候補バッファ1
13eの状態を図15(A)に示す。ここでは、変換評
価値の項目15fには、かな漢字変換辞書110の頻度
がセットされている。この段階では、共起評価値と再評
価値の項目15g、15hは空欄である。
The Kana-Kanji conversion unit 108 refers to the Kana-Kanji conversion dictionary 110, extracts conversion candidates that match the pronunciation of “Kakino”, and sets the result in the conversion candidate buffer 113e. Conversion candidate buffer 1 at this time
The state of 13e is shown in FIG. Here, the frequency of the kana-kanji conversion dictionary 110 is set in the conversion evaluation value item 15f. At this stage, the items 15g and 15h of the co-occurrence evaluation value and the re-evaluation value are blank.

【0087】処理は、かな漢字変換制御部114に戻
り、続いて、ステップS706で、変換候補バッファ1
13e(図15(A))に格納された変換候補と、選択
候補バッファ113d(図14)に格納された選択候補
が、変換候補再評価部109に送られる。
The processing returns to the kana-kanji conversion control section 114, and then in step S706, the conversion candidate buffer 1
The conversion candidates stored in 13e (FIG. 15A) and the selection candidates stored in the selection candidate buffer 113d (FIG. 14) are sent to the conversion candidate reevaluation unit 109.

【0088】変換候補再評価部109(図5のフローチ
ャート)において、ステップS505からステップS5
09の繰り返しにより、変換候補バッファ113eに共
起評価値と再評価値がセットされることになる。変換候
補バッファ113eの情報と、選択候補バッファ113
dの情報を受け取り(ステップS501)、この場合、
変換候補バッファ113dの候補数件数は「3」なの
で、HR=3がセットされる(ステップS502)。以
後、ステップS504からステップS509の処理が候
補件数の数だけ繰り返される。ステップS505で、変
換候補バッファ113eの1番目の候補の変換評価値
「2」がPt(h)にセットされる。ステップS506
で、変換候補バッファ113eのi番目の候補と、選択
候補バッファ113dの情報が共起辞書検索部111に
送られる。
In the conversion candidate re-evaluation unit 109 (the flowchart of FIG. 5), steps S505 to S5 are executed.
By repeating step 09, the co-occurrence evaluation value and the re-evaluation value are set in the conversion candidate buffer 113e. Information on the conversion candidate buffer 113e and the selection candidate buffer 113
d (step S501), and in this case,
Since the number of candidates in the conversion candidate buffer 113d is “3”, HR = 3 is set (step S502). Thereafter, the processing from step S504 to step S509 is repeated by the number of candidates. In step S505, the conversion evaluation value “2” of the first candidate in the conversion candidate buffer 113e is set to Pt (h). Step S506
Then, the i-th candidate in the conversion candidate buffer 113e and the information in the selection candidate buffer 113d are sent to the co-occurrence dictionary search unit 111.

【0089】共起辞書検索部111(図6のフローチャ
ート)において、変換候補バッファ113eのi番目の
候補と、選択候補バッファ113dの情報を受け取る
(ステップS601)。共起辞書112の登録件数に応
じた値がCRにセットされる(ステップS602)。そ
して、登録件数の数に応じて共起辞書の検索が行われ共
起評価値を求める(ステップS605からステップS6
10)。
The co-occurrence dictionary search unit 111 (the flowchart of FIG. 6) receives the i-th candidate of the conversion candidate buffer 113e and the information of the selection candidate buffer 113d (step S601). A value corresponding to the number of registered co-occurrence dictionaries 112 is set in CR (step S602). Then, the co-occurrence dictionary is searched according to the number of registered cases, and a co-occurrence evaluation value is obtained (from step S605 to step S6).
10).

【0090】この例では、変換候補バッファ113eの
1番目(k=1)の候補の辞書番号15bはK03、付
属語15eは「の」、選択候補バッファ113dの辞書
番号14bはY03であるので、共起辞書112から前
側辞書番号がK03、後側辞書番号がY03、付属語が
「の」の条件に該当する共起が存在するかどうかを検索
する。存在する場合には、その結合度10dの値を、ま
た存在しない場合には0を、変換候補再評価部109に
返す(S611)。この場合、共起辞書112の1行目
に該当する共起があるので、共起評価値として「2」が
返される。
In this example, the dictionary number 15b of the first (k = 1) candidate of the conversion candidate buffer 113e is K03, the attached word 15e is "no", and the dictionary number 14b of the selection candidate buffer 113d is Y03. The co-occurrence dictionary 112 is searched for a co-occurrence that satisfies the condition that the front dictionary number is K03, the rear dictionary number is Y03, and the attached word is “no”. If it exists, the value of the coupling degree 10d is returned to the conversion candidate re-evaluation unit 109 if it does not exist, and 0 is returned (S611). In this case, since there is a co-occurrence corresponding to the first line of the co-occurrence dictionary 112, “2” is returned as the co-occurrence evaluation value.

【0091】処理は、変換候補再評価部109に戻り、
ステップS507で共起評価値がPt(k)にセットさ
れる。ステップS508で、再評価値Pt(r)が計算
され、計算された再評価値Pt(r)は、変換候補バッ
ファ113eにセットされる。この場合は次のようにな
る。
The processing returns to the conversion candidate re-evaluation unit 109.
In step S507, the co-occurrence evaluation value is set to Pt (k). In step S508, the reevaluation value Pt (r) is calculated, and the calculated reevaluation value Pt (r) is set in the conversion candidate buffer 113e. In this case, it becomes as follows.

【0092】Pt(r)=Pt(h)+10×Pt
(k)=2+2×10=22 変換候補バッファ113eに格納される全ての候補につ
いて再評価値の計算が終了すると、ステップS510
で、再評価値に基づいて変換候補バッファ113eの内
容をソートする。以上の処理により、変換候補バッファ
113eの内容は、図15(B)に示す状態となる。変
換候補バッファ113eの内容は、順次かな漢字変換制
御部114、制御部102に戻される(ステップS51
1、S707−S708)。
Pt (r) = Pt (h) + 10 × Pt
(K) = 2 + 2 × 10 = 22 When the calculation of the reevaluation values is completed for all the candidates stored in the conversion candidate buffer 113e, step S510
Then, the contents of the conversion candidate buffer 113e are sorted based on the reevaluation value. By the above processing, the contents of the conversion candidate buffer 113e are in the state shown in FIG. The contents of the conversion candidate buffer 113e are sequentially returned to the kana-kanji conversion control unit 114 and the control unit 102 (step S51).
1, S707-S708).

【0093】そして制御部102において、ステップS
214で、変換候補バッファ113eの1行目に格納さ
れた情報、すなわち予測開始位置の前側部分のかな漢字
変換候補が表示され、続いてステップS215で、選択
候補バッファ113dの1行目に格納された情報、すな
わち予測候補が表示される。画面上では、図19に示す
ように入力予測候補ウインドウが消え、入力領域に予測
候補「会議を開催しますのでご参集願います」が挿入さ
れ、「かきの」の部分が「下記の」とかな漢字変換され
て表示される。
Then, in the control unit 102, step S
At 214, the information stored in the first line of the conversion candidate buffer 113e, that is, the kana-kanji conversion candidate in the front part of the prediction start position is displayed, and then, at step S215, the information stored in the first line of the selection candidate buffer 113d is displayed. Information, that is, prediction candidates are displayed. On the screen, as shown in FIG. 19, the input prediction candidate window disappears, and the prediction candidate “I will hold a meeting so please join us” is inserted in the input area, and the “Kakino” part is “below”. Kana-Kanji characters are converted and displayed.

【0094】このように、予測開始位置の前側部分のみ
をかな漢字変換して、予測候補の前側に付加して表示す
ることにより、文章入力中の任意の箇所で自動的に予測
を行っても、予測開始位置の前側にある文字列の処理に
ついて別途変換指示操作は必要なく、ユーザは通常のか
な漢字変換システムと同じような感覚で、本システムを
利用することが可能になる。
As described above, only the front part of the prediction start position is converted to Kana-Kanji characters and added to the front of the prediction candidate and displayed. Thus, even if the prediction is automatically performed at an arbitrary position in the text input, There is no need for a separate conversion instruction operation for the processing of the character string in front of the prediction start position, and the user can use this system as if it were a normal Kana-Kanji conversion system.

【0095】なお、上記実施形態では、図10に示すよ
うに2つの語からなる共起辞書を利用したが、共起は2
語に限らず3語以上からなるものでもよいし、連接して
いなくてもよい。また、結合度は1以上の値のみを記述
しているが、マイナスの値を与えてもよい。すなわち、
その場合には、非適用あるいは非優先の共起条件が記述
されていることと同じである。つまり、かな漢字変換候
補と選択された予測候補の条件が、共起辞書に記述され
る条件に適合したときには、そのかな漢字変換候補は棄
却される、あるいは、非優先される、というように利用
することも可能である。
In the above embodiment, a co-occurrence dictionary consisting of two words is used as shown in FIG.
It is not limited to words, and may be composed of three or more words, and may not be connected. Further, although the coupling degree describes only one value or more, a negative value may be given. That is,
In that case, it is the same as the description of the non-applied or non-priority co-occurrence condition. In other words, if the conditions of the kana-kanji conversion candidate and the selected prediction candidate meet the conditions described in the co-occurrence dictionary, the kana-kanji conversion candidate is rejected or given priority. Is also possible.

【0096】また、上記実施形態では、かな変換候補の
再評価値の計算に式(1)を用いているが、この計算式
は本発明を限定するものではない。
In the above embodiment, the expression (1) is used for calculating the re-evaluation value of the kana conversion candidate, but this expression does not limit the present invention.

【0097】また、上記実施形態では、かなで表現され
る読み文字列をキーボード等で入力する場合を例にとっ
て説明したが、入力する文字列の形態はかなの読みに限
定されるものではなく、たとえばタブレット等の入力装
置に文字認識処理を備えたものでは、漢字も直接入力す
ることができるので、この場合は、入力される文字列は
漢字かな混じり文字列となる。このように漢字かな文字
列を部分文字列として辞書を検索するようにしてもよ
い。
Further, in the above-described embodiment, the case where the reading character string expressed by the kana is input using a keyboard or the like has been described as an example. However, the form of the input character string is not limited to the kana reading. For example, an input device such as a tablet provided with a character recognition process can directly input kanji. In this case, the input character string is a mixed kanji character string. As described above, a dictionary may be searched using a Kanji Kana character string as a partial character string.

【0098】要するに、本発明は、上記実施形態に限定
されず、要旨を変更しない範囲で適宜変更して実施可能
である。
In short, the present invention is not limited to the above-described embodiment, and can be implemented by appropriately changing the scope without changing the gist.

【0099】また、上述した実施形態において記載した
手法は、コンピュータに実行させることのできるプログ
ラムとして、たとえば磁気ディスク(フロッピーディス
ク、ハードディスク等)、光ディスク(CD−ROM、
DVD等)、半導体メモリ等の記録媒体に書き込んで各
種装置に適用したり、通信媒体により伝送して各種装置
に適用することも可能である。本装置を実現するコンピ
ュータは、記録媒体に記録されたプログラムを読み込
み、このプログラムによって動作が制御されることによ
り、上述した処理を実行する。
Further, the method described in the above-described embodiment is, for example, a magnetic disk (floppy disk, hard disk, etc.), an optical disk (CD-ROM,
It can be applied to various devices by writing to a recording medium such as a DVD or a semiconductor memory, or can be applied to various devices by transmission via a communication medium. A computer that realizes the present apparatus reads the program recorded on the recording medium, and executes the above-described processing by controlling the operation of the program.

【0100】[0100]

【発明の効果】以上説明したように、本発明によれば、
予測開始位置の前側部分のみをかな漢字変換して、予測
候補の前側に付加して表示することにより、文章入力中
の任意の箇所で自動的に予測を行っても、予測開始位置
の前側にある文字列の処理について別途変換指示操作は
必要なく、ユーザは通常のかな漢字変換システムと同じ
ような感覚で本システムを利用することが可能になり、
文書入力の効率が向上し、簡易に日本語入力を行うこと
ができる。
As described above, according to the present invention,
By converting only the front part of the prediction start position into Kana-Kanji characters and adding it to the front of the prediction candidate and displaying it, even if the prediction is automatically made at an arbitrary position during text input, it is in front of the prediction start position. No separate conversion instruction operation is required for character string processing, and the user can use this system with the same feeling as a normal Kana-Kanji conversion system.
The efficiency of document input is improved, and Japanese input can be easily performed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態に係る入力予測装置の概略
構成を示すブロック図。
FIG. 1 is a block diagram showing a schematic configuration of an input prediction device according to an embodiment of the present invention.

【図2】同実施形態における制御部の処理動作を示すフ
ローチャート。
FIG. 2 is a flowchart showing a processing operation of a control unit in the embodiment.

【図3】同実施形態における予測制御部の処理動作を示
すフローチャート。
FIG. 3 is a flowchart showing a processing operation of a prediction control unit according to the embodiment.

【図4】同実施形態における検索文字列生成部の処理動
作を示すフローチャート。
FIG. 4 is an exemplary flowchart showing the processing operation of a search character string generation unit in the embodiment.

【図5】同実施形態における変換候補再評価部の処理動
作を示すフローチャート。
FIG. 5 is an exemplary flowchart showing the processing operation of a conversion candidate reevaluation unit in the embodiment.

【図6】同実施形態における共起辞書検索部の処理動作
を示すフローチャート。
FIG. 6 is an exemplary flowchart showing the processing operation of the co-occurrence dictionary search unit in the embodiment.

【図7】同実施形態におけるかな漢字変換制御部の処理
動作を示すフローチャート。
FIG. 7 is an exemplary flowchart showing the processing operation of a kana-kanji conversion control unit in the embodiment.

【図8】同実施形態における予測辞書に格納される情報
の例を示す図。
FIG. 8 is an exemplary view showing an example of information stored in a prediction dictionary in the embodiment.

【図9】同実施形態におけるかな漢字変換辞書に格納さ
れる情報の例を示す図。
FIG. 9 is an exemplary view showing an example of information stored in a kana-kanji conversion dictionary in the embodiment.

【図10】同実施形態における共起辞書に格納される情
報の例を示す図。
FIG. 10 is an exemplary view showing an example of information stored in a co-occurrence dictionary in the embodiment.

【図11】同実施形態における予測対象文字列バッファ
に格納される情報の例を示す図。
FIG. 11 is an exemplary view showing an example of information stored in a prediction target character string buffer in the embodiment.

【図12】同実施形態における検索文字列バッファに格
納される情報の例を示す図。
FIG. 12 is an exemplary view showing an example of information stored in a search character string buffer in the embodiment.

【図13】同実施形態における予測候補バッファに格納
される情報の例を示す図。
FIG. 13 is an exemplary view showing an example of information stored in a prediction candidate buffer in the embodiment.

【図14】同実施形態における選択候補バッファに格納
される情報の例を示す図。
FIG. 14 is an exemplary view showing an example of information stored in a selection candidate buffer in the embodiment.

【図15】同実施形態における変換候補バッファに格納
される情報の例を示す図。
FIG. 15 is an exemplary view showing an example of information stored in a conversion candidate buffer in the embodiment.

【図16】同実施形態における文書入力時の画面表示を
示す図。
FIG. 16 is an exemplary view showing a screen display when a document is input in the embodiment.

【図17】同実施形態における文書入力時の画面表示を
示す図。
FIG. 17 is an exemplary view showing a screen display when a document is input in the embodiment.

【図18】同実施形態における文書入力時の画面表示を
示す図。
FIG. 18 is an exemplary view showing a screen display at the time of inputting a document in the embodiment.

【図19】同実施形態における文書入力時の画面表示を
示す図。
FIG. 19 is an exemplary view showing a screen display when a document is input in the embodiment.

【符号の説明】[Explanation of symbols]

101…入力部 102…制御部 103…出力部 104…予測制御部 105…検索文字列生成部 106…予測辞書検索部 107…予測辞書 108…かな漢字変換部 109…変換候補再評価部 110…かな漢字変換辞書 111…共起辞書検索部 112…共起辞書 113…メモリ 113a…予測対象文字列バッファ 113b…検索文字列バッファ 113c…予測候補バッファ 113d…選択候補バッファ 113e…変換候補バッファ 114…かな漢字変換制御部 Reference Signs List 101 input unit 102 control unit 103 output unit 104 prediction control unit 105 search character string generation unit 106 prediction dictionary search unit 107 prediction dictionary 108 kana-kanji conversion unit 109 conversion candidate re-evaluation unit 110 kana-kanji conversion Dictionary 111: Co-occurrence dictionary search unit 112: Co-occurrence dictionary 113: Memory 113a: Prediction target character string buffer 113b: Search character string buffer 113c: Prediction candidate buffer 113d: Selection candidate buffer 113e: Conversion candidate buffer 114: Kana-kanji conversion control unit

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】文字列データを入力する入力手段と、 部分文字列データとそれに対応した見出しデータが格納
された予測辞書と、 前記入力手段より入力された文字列データより、前記予
測辞書を検索するための部分文字列データ群を生成する
部分文字列生成手段と、 この部分文字列生成手段で生成された部分文字列データ
群を用いて、前記予測辞書から部分文字列が対応する見
出しデータを予測候補データとして検索する辞書検索手
段と、 前記入力文字列データのうち前記辞書検索に用いた文字
列データを除く部分文字列データを用いてかな漢字変換
処理を行うかな漢字変換手段と、 このかな漢字変換手段で得たかな漢字混じり文字列候補
データと前記辞書検索手段によって得られた予測候補デ
ータを合わせたものを出力する出力手段とを具備するこ
とを特徴とする文字列予測装置。
An input unit for inputting character string data; a prediction dictionary storing partial character string data and corresponding heading data; and a search for the prediction dictionary based on character string data input from the input unit. Using a partial character string data group generated by the partial character string data generation means, using the partial character string data group generated by the partial character string data generation means to generate heading data corresponding to the partial character string from the prediction dictionary. Dictionary search means for searching as prediction candidate data; kana-kanji conversion means for performing kana-kanji conversion processing using partial character string data of the input character string data excluding the character string data used for the dictionary search; And output means for outputting a combination of the kana-kanji mixed character string candidate data obtained in and the prediction candidate data obtained by the dictionary search means. String prediction apparatus characterized by Bei.
【請求項2】前記かな漢字混じり文字列候補データに
は、かな漢字変換処理する際の候補順位を表す評価値と
予測候補データと部分文字列データとの間の関連性を示
す評価値とに基づいて求められた優先順位を示す評価値
を含み、 前記出力手段による出力の際には、前記かな漢字混じり
文字列候補データが持つ優先順位を示す評価値に基づい
て出力の順位を決定することを特徴とする請求項1記載
の文字列予測装置。
2. The method according to claim 1, wherein the kana-kanji mixed character string candidate data is based on an evaluation value indicating a candidate rank in kana-kanji conversion processing and an evaluation value indicating relevance between the predicted candidate data and the partial character string data. The output means includes an evaluation value indicating the determined priority, and in the case of output by the output means, determines the order of output based on the evaluation value indicating the priority of the kana-kanji mixed character string candidate data. The character string prediction device according to claim 1.
【請求項3】入力装置より入力された文字列データから
部分文字列データ群を作成し、 この部分文字列データ群を用いて、記憶装置に記憶され
ている部分文字列データとそれに対応した見出しデータ
が格納された予測辞書情報より、前記部分文字列データ
に対応する見出しデータを予測候補データとして求め、 前記入力された文字列データのうち予測辞書の検索に用
いなかった部分文字列を対象にかな漢字変換し、 前記かな漢字変換手段により求めたかな漢字混じり文字
列候補データと前記予測辞書の検索によって求められた
予測候補データとを合わせたものを出力装置へ出力させ
ることを特徴とした文字列予測方法。
3. A partial character string data group is created from character string data input from an input device, and the partial character string data stored in the storage device and a corresponding heading are created using the partial character string data group. From the prediction dictionary information in which the data is stored, the index data corresponding to the partial character string data is obtained as prediction candidate data, and the partial character strings not used for searching the prediction dictionary among the input character string data are targeted. A character string prediction method comprising: converting kana-kanji characters; and combining kana-kanji mixed character string candidate data obtained by the kana-kanji conversion means with prediction candidate data obtained by searching the prediction dictionary, and outputting the combined data to an output device. .
【請求項4】コンピュータに、 入力装置より入力された文字列データから部分文字列デ
ータ群を作成させ、 この部分文字列データ群を用いて、記憶装置に記憶され
ている部分文字列データとそれに対応した見出しデータ
が格納された予測辞書情報より、前記部分文字列データ
に対応する見出しデータを予測候補データとして求めさ
せ、 前記入力された文字列データのうち予測辞書の検索に用
いなかった部分文字列を対象にかな漢字変換させ、 前記かな漢字変換手段により求めたかな漢字混じり文字
列候補データと前記予測辞書の検索によって求められた
予測候補データとを合わせたものを出力装置へ出力させ
るための文字列予測プログラムを記憶した記憶媒体。
4. A computer causes a computer to create a partial character string data group from character string data input from an input device, and uses the partial character string data group to store partial character string data stored in a storage device. From the predicted dictionary information in which the corresponding heading data is stored, the heading data corresponding to the partial character string data is obtained as prediction candidate data, and the partial characters of the input character string data that are not used for searching the prediction dictionary A character string prediction for converting a sequence into kana-kanji characters and outputting to the output device a combination of kana-kanji mixed character string candidate data obtained by the kana-kanji conversion means and prediction candidate data obtained by searching the prediction dictionary A storage medium that stores a program.
【請求項5】入力された文字列データに基づいて、その
部分文字列データを含む予測文字列データを生成する文
字列予測手段と、 この文字列予測手段で予測文字列データの生成に用いな
かった残りの部分文字列データをかな漢字変換してかな
漢字混じり文字列データを生成するかな漢字変換手段
と、 前記文字列予測手段で生成された予測文字列データと前
記かな漢字変換手段かな漢字混じり文字列データとを合
わせた文字列データを表示する表示手段とを具備したこ
とを特徴とする文字列予測装置。
5. A character string predicting means for generating predicted character string data including partial character string data based on input character string data, wherein the character string predicting means does not use the character string predicting means to generate predicted character string data. Kana-kanji conversion means for converting the remaining partial character string data into kana-kanji character data to generate kana-kanji mixed character string data, and kana-kanji conversion means for predicting character string data generated by the character string prediction means and kana-kanji character string data. A character string prediction device comprising: display means for displaying combined character string data.
【請求項6】入力装置より入力された文字列データに基
づいて、その部分文字列データを含む予測文字列データ
を生成し、 予測文字列データの生成に用いなかった残りの部分文字
列データをかな漢字変換してかな漢字混じり文字列デー
タを生成し、 前記生成された予測文字列データと前記生成されたかな
漢字混じり文字列データとを合わせたものを出力するこ
とを特徴とした文字列予測方法。
6. Based on character string data input from an input device, predictive character string data including the partial character string data is generated, and the remaining partial character string data not used for generating the predicted character string data is generated. A character string prediction method, comprising: converting kana-kanji characters to generate kana-kanji mixed character string data; and outputting a combination of the generated predicted character string data and the generated kana-kanji mixed character string data.
【請求項7】コンピュータに、 入力装置より入力された文字列データに基づいて、その
部分文字列データを含む予測文字列データを生成させ、 予測文字列データの生成に用いなかった残りの部分文字
列データをかな漢字変換してかな漢字混じり文字列デー
タを生成させ、 前記生成された予測文字列データと前記生成されたかな
漢字混じり文字列データとを合わせたものを出力させる
ための文字列予測プログラムを記憶した記憶媒体。
7. A computer, based on character string data input from an input device, generating predicted character string data including the partial character string data, and the remaining partial characters not used for generating the predicted character string data. Stores a character string prediction program for converting column data to Kana-Kanji characters to generate Kana-Kanji mixed character string data, and outputting a combination of the generated predicted character string data and the generated Kana-Kanji mixed character string data. Storage media.
JP11085109A 1999-03-29 1999-03-29 Device and method for predicting character string and storage medium stored with character string predicting program Pending JP2000276466A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11085109A JP2000276466A (en) 1999-03-29 1999-03-29 Device and method for predicting character string and storage medium stored with character string predicting program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11085109A JP2000276466A (en) 1999-03-29 1999-03-29 Device and method for predicting character string and storage medium stored with character string predicting program

Publications (1)

Publication Number Publication Date
JP2000276466A true JP2000276466A (en) 2000-10-06

Family

ID=13849470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11085109A Pending JP2000276466A (en) 1999-03-29 1999-03-29 Device and method for predicting character string and storage medium stored with character string predicting program

Country Status (1)

Country Link
JP (1) JP2000276466A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002117024A (en) * 2000-10-11 2002-04-19 Allied Brains Inc Sentence input method
JP2010266948A (en) * 2009-05-12 2010-11-25 Ntt Data Corp Device, method, and program for inputting character string
JP2012190211A (en) * 2011-03-10 2012-10-04 Fujitsu Ltd Program, device and method for input support

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002117024A (en) * 2000-10-11 2002-04-19 Allied Brains Inc Sentence input method
JP2010266948A (en) * 2009-05-12 2010-11-25 Ntt Data Corp Device, method, and program for inputting character string
JP2012190211A (en) * 2011-03-10 2012-10-04 Fujitsu Ltd Program, device and method for input support

Similar Documents

Publication Publication Date Title
EP0201324B1 (en) Language forming system
JPH05324702A (en) Information processing unit
JP2000276466A (en) Device and method for predicting character string and storage medium stored with character string predicting program
JPH09245038A (en) Sentence preparation device
JPH11238051A (en) Chinese input conversion processor, chinese input conversion processing method and recording medium stored with chinese input conversion processing program
JP2000057133A (en) Input prediction device, input predicting method and recording medium having recorded input prediction program thereon
JPS60254367A (en) Sentence analyzer
JP2003178087A (en) Retrieval device and method for electronic foreign language dictionary
JPH07271774A (en) Document input device
JP2000048018A (en) Input prediction device, its method and recording medium recording input prediction program
JP2000048019A (en) Input prediction device, its method and recording medium recording input prediction program
JPH01214963A (en) Device for consulting dictionary
JP3934774B2 (en) Character processing method and apparatus
JP2000235571A (en) Example dictionary generation device
JP3443239B2 (en) Character processor
JP2002351869A (en) Document processor
JP2000010973A (en) Character input system/method and recording medium which computer can read
JPS6389976A (en) Language analyzer
JP2012027729A (en) Search device, search method, and program
JPS60112175A (en) Abbreviation conversion system of kana (japanese syllabary)/kanji (chinese character) convertor
JPH05151199A (en) Document preparation device
JP2002183135A (en) Registering and converting word processing device for language for world word candidate, and used software system and/or registering and converting method
JP2009265845A (en) Device and program for retrieving example sentence
JP2002049616A (en) Device and method for kana-kanji conversion
JPH0798703A (en) Document processor

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050225

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050414

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050426

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060606

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061010