JPH10143501A

JPH10143501A - 文字列予測方法及びこの文字列予測方法を用いた文書作成装置

Info

Publication number: JPH10143501A
Application number: JP8300495A
Authority: JP
Inventors: Toshiya Tamura; 俊哉田村
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1996-11-12
Filing date: 1996-11-12
Publication date: 1998-05-29

Abstract

(57)【要約】【課題】文字列予測とかな漢字変換を融合して予測候補
を出力する場合に、利用者の意図する候補を優先的に表
示できるようにする。【解決手段】入力文字列を先頭部分に持つ文字列を予測
文字列の候補として単語辞書から検索する（２０１〜２
０４）。入力文字列の文字種をチェックし（２０６）、
入力文字列がひらがな文字列であった場合に予測文字列
の各候補を表示する際に、その候補数が予め設定された
値よりも多ければ上記予測文字列の各候補を読みで表示
し、上記設定値よりも少なければ予測文字列の各候補を
見出しで表示する（２０７〜２１１）。これにより、候
補数が設定値よりも多い場合に同音語の重複を避けて表
示することができ、結果的に表示候補数を少なくして利
用者の意図する候補を画面内に表示することが可能にな
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力装置により入
力された文字列をもとに、その入力された文字列に続く
文字列を予測する文字列予測方法に係り、特に文字列予
測とかな漢字変換を融合した場合での予測候補の表示方
法に特徴を有する文字列予測方法及びこの文字列予測方
法を用いた文書作成装置に関する。

【０００２】

【従来の技術】従来、例えば日本語ワードプロセッサ等
の文書作成装置において、手書き文字認識装置などを用
いて文字列を入力する際には、キーボードからの入力な
どとは異なり、１文字を入力するのに時間がかかるた
め、入力者に対する負担が大きかった。

【０００３】そこで、入力者に対する負担を軽くするた
めに、入力しようとしている文字列の一部が入力された
段階で、入力された文字列をもとにその文字列に続く文
字列を予測するという方法が考えられてきた。

【０００４】これに対して考えられたのが入力予測と呼
ぶ方法で、例えば、文献（第４８回情報処理学会全国大
会予稿集４Ｊ−１１他）で報告されているような、最初
の数文字が入力された時点で単語辞書を検索して、その
数文字で始まる文字列（単語）を抽出する方法がある。

【０００５】これは、例えば「漢字辞書」という文字列
の入力では、入力者が「漢字」と入力した段階で、その
「漢字」に続く文字列として「辞書」を予測し、最終的
に「漢字辞書」を出力するものである。

【０００６】

【発明が解決しようとする課題】上記したような入力予
測方法では、予測を始める時点での入力文字数が少ない
ほど候補の絞り込みはできにくく、候補となる文字列は
多数存在することになるため、候補の出力方法に関して
工夫を施す必要がある。これまでの入力予測方法では、
予測候補の数が多数あり、画面が小さくて全ての候補を
一括して表示できないような場合には、利用者の意図し
た予測文字列がなかなか得られないといった不具合があ
った。

【０００７】特に、文字列予測とかな漢字変換を融合し
た装置では、読み（ひらがな表記）で入力された文字列
を予測後、その予測文字列の各候補を見出し（漢字表
記）で出力するため、例えば「せいかい」→「正解」、
「盛会」、「政界」といったように同音語が複数存在す
る候補の場合には、予測候補数を増加させる１つの要因
となる問題がある。

【０００８】本発明は上記のような点に鑑みなされたも
ので、文字列予測とかな漢字変換を融合して予測候補を
出力する場合に、利用者の意図する候補を優先的に表示
することのできる文字列予測方法及びこの文字列予測方
法を用いた文書作成装置を提供することを目的とする。

【０００９】

【課題を解決するための手段】

（１）本発明は、少なくとも単語の読みとそれに対応す
る見出しを格納した単語辞書を有し、予測対象となる文
字列の入力により、この入力文字列を先頭部分に持つ文
字列を予測文字列の候補として上記単語辞書から検索
し、上記入力文字列の文字種を判定し、上記入力文字列
がひらがな文字列であった場合に、上記検索された予測
文字列の各候補を表示する際に、その候補数が予め設定
された値よりも多ければ上記予測文字列の各候補を読み
で表示し、上記設定値よりも少なければ上記予測文字列
の各候補を見出しで表示するようにしたものである。

【００１０】（２）さらに、本発明は、上記（１）の構
成において、上記予測文字列の各候補が読みで表示され
た場合に、その中で選択された候補の読みを見出しに変
換し、この変換された候補の見出しを最終的な予測結果
として出力するようにしたものである。

【００１１】このような構成によれば、入力文字列がひ
らがな文字列であった場合に、予測文字列の各候補を表
示する際に、その候補数が予め設定された値よりも多け
れば各候補を読みで表示する。この場合、各候補を読み
（ひらがな表記）で表示することで、見出し（漢字表
記）での同音語の重複を避けて表示することができる。
これにより、結果的に表示候補数を少なくすることがで
き、文字表示画面が小さい場合でも利用者の意図する候
補を画面内に表示することが可能になる。また、見出し
で表示された各候補の中から所望の候補を選択すれば、
その候補を表記変換して見出しで得ることができる。

【００１２】（３）また、本発明は、少なくとも単語の
読みとそれに対応する見出しを格納した単語辞書を有
し、予測対象となる文字列の入力により、この入力され
た文字列を先頭部分に持つ文字列を予測文字列の候補と
して上記単語辞書から検索し、上記入力文字列の文字種
を判定し、上記入力文字列がひらがな文字列であった場
合に、上記検索された予測文字列の各候補の中で上記入
力文字列に対応する部分が漢字表記可能なものは、その
漢字の画数に応じた優先度を付けて見出しで表示するよ
うにしたものである。

【００１３】このような構成によれば、入力文字列がひ
らがな文字列であった場合に、予測文字列の各候補の中
で入力文字列に対応する部分が漢字表記可能なものは、
その漢字の画数に応じた優先度を付けて見出しで表示す
る。通常、入力文字列が漢字の場合には、その画数が少
なければ漢字でそのまま入力し、逆に画数が多ければひ
らがなで入力することが多い。したがって、予測文字列
の候補を見出し（漢字表記）で表示する際に、画数が多
い順に優先度を高して表示すれば、利用者の意図する候
補を優先的に表示できるようになる。

【００１４】（４）また、本発明は、少なくとも単語の
読みとそれに対応する見出しを格納した単語辞書を有
し、予測対象となる文字列の入力により、この入力され
た文字列を先頭部分に持つ文字列を予測文字列の候補と
して上記単語辞書から検索し、上記入力文字列の文字種
を判定し、上記入力文字列が漢字文字列であった場合
に、その漢字の画数毎の入力数を漢字入力学習テーブル
に記憶し、この漢字入力学習テーブルに記憶された漢字
画数毎の入力数に基づいて漢字入力推定値を決定し、上
記入力文字列がひらがな文字列であった場合に、上記検
索された予測文字列の各候補の中で上記入力文字列に対
応する部分が漢字表記可能なものは、上記漢字入力推定
値より画数の多いものを優先して見出しで表示するよう
にしたものである。

【００１５】このような構成によれば、入力文字列がひ
らがな文字列であった場合に、予測文字列の各候補の中
で入力文字列に対応する部分が漢字表記可能なものは、
漢字入力推定値より画数の多いものを優先して見出しで
表示する。漢字入力推定値とは、漢字で入力する可能性
が高くなる画数の閾値であり、その値は利用者の漢字入
力を学習した結果から求められている。したがって、予
測文字列の候補を見出し（漢字表記）で表示する際に、
この漢字入力推定値より画数の多いものを優先表示すれ
ば、利用者の意図する候補が優先表示される可能性が高
くなる。

【００１６】

【発明の実施の形態】以下、図面を参照して本発明の一
実施形態を説明する。図１は本発明の一実施形態に係る
文書作成装置の構成を示すブロック図である。本装置
は、文字列予測機能を備えた日本語ワードプロセッサで
ある。図１において、入力装置１０１は、タブレット等
の手書き文字の入力装置であり、ぺン入力されたストロ
ークを座標データとして出力する。文字認識部１０４
は、入力装置１０１から得られる座標データから文字認
識辞書１０５を参照して手書き文字を認識することによ
って、入力情報を文字コードとして出力する。出力装置
１１８は、例えばＣＲＴ (Cathode Ray Tube) やＬＣＤ
(Liquid Crystal Display)等の画面表示装置であり、
利用者はこれらにより対話的に文書の作成作業を進める
ことができる。

【００１７】文字列入力部１０２は、文字認識部１０４
に指示して入力された座標データを文字認識した結果の
文字データを、入力バッファ１０３に文字認識処理など
の間一旦バッファリングして漢字かな混じり文字列を作
り、予測対象となった後に文字列を辞書検索部１０６へ
と送る。単語辞書１０８は、少なくとも単語の読み（ひ
らがな表記）とそれに対応する見出し（漢字混じり表
記）とを格納したものである。辞書検索部１０６は、入
力された文字列を先頭部分に持つ文字列を予測文字列の
候補として単語辞書１０８から検索し、その辞書アドレ
スをアドレスバッファ１０７に格納する。

【００１８】文字種判定部１１２は、入力された文字列
を構成する各文字の文字種をチェックする。漢字入力推
定値バッファ１１１は、過去に入力された漢字の画数か
ら算出された、利用者が直接漢字で入力すると推定され
る漢字の画数を記憶する。文字列表示部１０９は、文字
種判定部１１２の判定の結果、入力文字列がひらがな文
字列でない場合にはアドレスバッファ１０７を参照して
単語辞書を検索し、その検索した文字列つまり予測文字
列の各候補を見出し（漢字混じり表記）で表示する。

【００１９】一方、入力文字列がひらがな文字列である
場合、第１の実施形態（請求項１または請求項２）で
は、アドレスバッファ１０７を参照して検索した単語数
が予め設定された値よりも多ければ検索した文字列つま
り予測文字列の各候補を読み（ひらがな表記）で表示
し、予め設定された値よりも少なければ見出し（漢字混
じり表記）で表示する。

【００２０】また、第２の実施形態（請求項３）では、
アドレスバッファ１０７を参照して単語辞書を検索し、
検索した文字列つまり予測文字列の各候補の中で入力文
字列に対応する部分が漢字表記可能なものについては該
漢字の画数に応じて優先度を付けて見出し（漢字混じり
表記）で表示する。この場合、画数の多い漢字ほど優先
度を高くする。

【００２１】また、第３の実施形態（請求項４）では、
検索した文字列つまり予測文字列の各候補の中で入力文
字列に対応する部分が漢字表記可能なものについては該
漢字の画数が漢字入力推定値バッファ１１１よりも多い
漢字であるものを優先的に表示する。

【００２２】表記変換部１１５は、読み（ひらがな表
記）で表示された予測文字列の各候補に対し、利用者か
ら表記変換が指示された場合に単語辞書を検索して、そ
の候補を見出し（漢字混じり表記）に置換する。漢字入
力学習テーブル１１７は、入力された漢字について、画
数毎に漢字とその入力回数を保持する。

【００２３】漢字入力学習部１１６は、利用者によって
漢字が入力された場合に文字認識辞書１０５を参照して
該漢字の画数を求めて漢字入力学習テーブル１１７を更
新し、該テーブル１１７を参照して漢字入力推定値バッ
ファ１１１を更新する。この場合、画数毎に漢字入力数
を計上しておき、漢字入力数が最も変化する画数を漢字
入力推定値とする。

【００２４】文字列出力部１１３は、利用者による予測
文字列の候補選択処理を行い、確定した予測文字列の候
補を出力バッファ１１４へと格納する。特に、請求項２
では、選択された候補に対して漢字混じり表記への表記
変換が指示された場合に、表記変換手段１１５に指示し
てひらがな表記を漢字混じり表記に置換する。

【００２５】次に、本発明の第１の実施形態の動作を説
明する。図２は本発明の第１の実施形態としての処理の
流れを示すフローチャートである。入力装置１０１で入
力された文字パターンは、文字認識部１０４において文
字認識辞書１０５を参照して文字データに置換され（ス
テップ２０１）、入力バッファ１０３に格納される（ス
テップ２０２）。文字列入力部１０２は、入力文字列が
予測対象となるまで順次入力される文字を入力バッファ
１０３に格納し、予測対象となった後に入力文字列を辞
書検索部１０６へと送る（ステップ２０１〜２０３）。

【００２６】辞書検索部１０６では、入力文字列を先頭
部分に持つ文字列を予測文字列の候補として単語辞書１
０８から検索し（ステップ２０４）、該当する文字列の
辞書アドレスをアドレスバッファ１０７に格納する（ス
テップ２０５）。辞書検索が終了すると、文字列表示部
１０９は文字種判定部１１２に指示して入力文字列の構
成文字の文字種をチェックする（ステップ２０６）。

【００２７】その結果、入力文字列がひらがな文字列で
ない場合には（ステップ２０７のＮｏ）、文字列表示部
１０９はアドレスバッファ１０７に格納された辞書アド
レスから単語辞書１０８を参照し、該当する単語の見出
し、すなわち漢字かな混じり表記を候補バッファ１１０
に格納する（ステップ２１２）。

【００２８】一方、入力文字列がひらがな文字列である
場合には（ステップ２０７のＹｅｓ）、文字列表示部１
０９は検索した単語数が予め設定された値よりも多いか
否かをチェックする（ステップ２０８）。

【００２９】その結果、単語数（予測文字列の候補数）
が設定値よりも多ければ（ステップ２０９のＹｅｓ）、
文字列表示部１０９はアドレスバッファ１０７に格納さ
れた辞書アドレスから単語辞書１０８を参照し、検索し
た単語の読み、すなわちひらがな表記を候補バッファ１
１０に格納する（ステップ２１０）。この際、同音語に
ついては重複は避けられる。また、単語数（予測文字列
の候補数）が設定値よりも少なければ（ステップ２０９
のＮｏ）、文字列表示部１０９はアドレスバッファ１０
７に格納された辞書アドレスから単語辞書１０８を参照
し、検索した単語の見出し、すなわち漢字かな混じり表
記を候補バッファ１１０に格納する（ステップ２１
１）。

【００３０】次に、文字列出力部１１３において、利用
者による予測文字列の候補選択処理が行われる（ステッ
プ２１３）。この場合、候補バッファ１１０に格納され
た各単語（予測文字列の候補）が表示され、その中から
任意の単語を１つ選択することになる。このとき選択さ
れた単語の文字列は出力バッファ１１４に格納される
（ステップ２１６）。

【００３１】また、選択された単語の文字列に対し、利
用者から表記変換が指示された場合には（ステップ２１
４のＹｅｓ）、文字列出力部１１３は単語辞書１０８を
参照してその文字列を漢字混じり表記に置換し（ステッ
プ２１５）、出力バッファ１１４に格納する（ステップ
２１６）。

【００３２】出力装置１１７は、出力バッファ１１４に
格納された文字列を画面表示する（ステップ２１７）。
最後に、次の文字列予測処理に備えて各バッファが初期
化される（ステップ２１８）。

【００３３】このように、第１の実施形態では、入力文
字列がひらがな文字列であった場合に、予測文字列の各
候補を表示する際に、その候補数が予め設定された値よ
りも多ければ各候補を読みで表示する。この場合、各候
補を読み（ひらがな表記）で表示することで、見出し
（漢字表記）での同音語の重複を避けて表示することが
できる。これにより、結果的に表示候補数を少なくする
ことができ、文字表示画面が小さい場合でも利用者の意
図する候補を画面内に表示することが可能になる。ま
た、見出しで表示された各候補の中から所望の候補を選
択すれば、その候補を表記変換して見出しで得ることが
できる。

【００３４】次に、本発明の第２の実施形態の動作を説
明する。図３は本発明の第２の実施形態としての処理の
流れを示すフローチャートである。なお、図中のステッ
プ３０１〜３０６の文字列入力から入力文字列の文字種
チェックまでの処理は図２のステップ２０１〜２０６の
処理と同様である。

【００３５】すなわち、入力装置１０１で入力された文
字パターンは、文字認識部１０４において文字認識辞書
１０５を参照して文字データに置換され（ステップ３０
１）、入力バッファ１０３に格納される（ステップ３０
２）。文字列入力部１０２は、入力文字列が予測対象と
なるまで順次入力される文字を入力バッファ１０３に格
納し、予測対象となった後に入力文字列を辞書検索部１
０６へと送る（ステップ３０１〜３０３）。

【００３６】辞書検索部１０６では、入力文字列を先頭
部分に持つ文字列を予測文字列の候補として単語辞書１
０８から検索し（ステップ３０４）、該当する文字列の
辞書アドレスをアドレスバッファ１０７に格納する（ス
テップ３０５）。辞書検索が終了すると、文字列表示部
１０９は文字種判定部１１２に指示して入力文字列の構
成文字の文字種をチェックする（ステップ３０６）。

【００３７】ここで、第２の実施形態において、文字列
表示部１０９は文字種判定部１１２における入力文字列
の文字種をチェック後、アドレスバッファ１０７に格納
された辞書アドレスから単語辞書１０８を参照し、検索
された単語の見出し、すなわち漢字かな混じり表記を候
補バッファ１１０に格納する（ステップ３０７）。

【００３８】そして、文字種判定部１１２でのチェック
の結果、入力文字列がひらがな文字列であった場合には
（ステップ３０８のＹｅｓ）、文字列表示部１０９は検
索された文字列の中で入力文字列に対応する部分の漢字
の画数をチェックし（ステップ３０９）、その漢字の画
数に応じて予測文字列の各候補を並べ替える（ステップ
３１０）。この場合、画数が多い順に優先度を高くし、
入力文字列に対応する部分が漢字表記不可能である文字
列を該部分が漢字表記可能な単語の後になるように並べ
替える。

【００３９】次に、文字列出力部１１３において、利用
者による予測文字列の候補選択処理が行われる（ステッ
プ３１１）。この場合、候補バッファ１１０に格納され
た各単語（予測文字列の候補）が表示され、その中から
任意の単語を１つ選択することになる。このとき選択さ
れた単語の文字列は出力バッファ１１４に格納される
（ステップ３１２）。

【００４０】出力装置１１７は、出力バッファ１１４に
格納された文字列を画面表示する（ステップ３１３）。
最後に、次の文字列予測処理に備えて各バッファが初期
化される（ステップ３１４）。

【００４１】このように、第２の実施形態では、入力文
字列がひらがな文字列であった場合に、予測文字列の各
候補の中で入力文字列に対応する部分が漢字表記可能な
ものは、その漢字の画数に応じた優先度を付けて見出し
で表示する。通常、入力文字列が漢字の場合には、その
画数が少なければ漢字でそのまま入力し、逆に画数が多
ければひらがなで入力することが多い。したがって、予
測文字列の候補を見出し（漢字表記）で表示する際に、
画数が多い順に優先度を高して表示すれば、利用者の望
む候補を優先的に表示できるようになる。

【００４２】次に、本発明の第３の実施形態の動作を説
明する。図４は本発明の第３の実施形態としての処理の
流れを示すフローチャートである。なお、図中のステッ
プ４０１〜４０６の文字列入力から入力文字列の文字種
チェックまでの処理は図２のステップ２０１〜２０６の
処理と同様である。

【００４３】すなわち、入力装置１０１で入力された文
字パターンは、文字認識部１０４において文字認識辞書
１０５を参照して文字データに置換され（ステップ４０
１）、入力バッファ１０３に格納される（ステップ４０
２）。文字列入力部１０２は、入力文字列が予測対象と
なるまで順次入力される文字を入力バッファ１０３に格
納し、予測対象となった後に入力文字列を辞書検索部１
０６へと送る（ステップ４０１〜４０３）。

【００４４】辞書検索部１０６では、入力文字列を先頭
部分に持つ文字列を予測文字列の候補として単語辞書１
０８から検索し（ステップ４０４）、該当する文字列の
辞書アドレスをアドレスバッファ１０７に格納する（ス
テップ４０５）。辞書検索が終了すると、文字列表示部
１０９は文字種判定部１１２に指示して入力文字列の構
成文字の文字種をチェックする（ステップ４０６）。

【００４５】ここで、第３の実施形態において、文字列
表示部１０９は文字種判定部１１２における入力文字列
の文字種をチェック後、アドレスバッファ１０７に格納
された辞書アドレスから単語辞書１０８を参照し、検索
された単語の見出し、すなわち漢字かな混じり表記を候
補バッファ１１０に格納する（ステップ４０７）。

【００４６】そして、文字種判定部１１２でのチェック
の結果、入力文字列がひらがな文字列であった場合には
（ステップ４０８のＹｅｓ）、文字列表示部１０９は検
索された文字列の中で入力文字列に対応する部分の漢字
の画数をチェックすると共に（ステップ４０９）、漢字
入力推定値バッファ１１１に現在格納されている漢字入
力推定値をチェックすることにより（ステップ４１
０）、漢字入力推定値よりも多いものが優先となるよう
に予測文字列の各候補を並ベ替える（ステップ４１
１）。

【００４７】一方、入力文字列がひらがな文字列でない
場合には（ステップ４０８のＮｏ）、漢字入力学習部１
１６が入力文字列の漢字の画数を文字認識辞書１０５を
参照して求めて、各漢字の画数毎に漢字の入力回数を保
持した漢字入力学習テーブル１１７を更新し（ステップ
４１２）、該テーブル１１７を参照して漢字入力推定値
バッファ１１１内の漢字入力推定値を更新する（ステッ
プ４１３）。この場合、画数毎に漢字入力数を記憶した
漢字入力学習テーブル１１７を参照し、漢字入力数が最
も変化する画数を漢字入力推定値とする。

【００４８】次に、文字列出力部１１３において、利用
者による予測文字列の選択処理が行われる（ステップ４
１４）。この場合、候補バッファ１１０に格納された各
単語（予測文字列の候補）が表示され、その中から任意
の単語を１つ選択することになる。このとき選択された
単語の文字列は出力バッファ１１４に格納される（ステ
ップ４１５）。

【００４９】出力装置１１７は、出力バッファ１１４に
格納された文字列を画面表示する（ステップ４１６）。
最後に、次の文字列予測処理に備えて各バッファが初期
化される（ステップ４１７）。

【００５０】このように、第３の実施形態では、入力文
字列がひらがな文字列であった場合に、予測文字列の各
候補の中で入力文字列に対応する部分が漢字表記可能な
ものは、漢字入力推定値より画数の多いものを優先して
見出しで表示する。漢字入力推定値とは、漢字で入力す
る可能性が高くなる画数の閾値であり、その値は利用者
の漢字入力を学習した結果から求められている。したが
って、予測文字列の候補を見出し（漢字表記）で表示す
る際に、この漢字入力推定値より画数の多いものを優先
表示すれば、利用者の意図する候補が優先表示される可
能性が高くなる。

【００５１】次に、上述した各実施形態について具体例
を用いて説明する。図５は第１の実施形態における文字
列予測を説明するための具体例であり、これは本発明の
請求項１に対応する。図５（ａ）に示すように、例えば
「せい」といった文字列を入力すると、「せい」を先頭
部分に持つ文字列を予測文字列の候補として検索した場
合に、読み（ひらがな表記）だけでも「せいじ」、「せ
いふ」、「せいかい」、「せいかく」…といったよう
に、文字列長が未定であるためにその候補数は必然的に
多数となる。

【００５２】しかも、読み（ひらがな表記）に対応する
見出し（漢字表記）を含めると、図５（ｅ）に示すよう
に、「せいじ」については「政治」、「清司」、「誠
司」…、「せいふ」については「政府」、「正負」、
「せいかい」については「正解」、「政界」、「盛
会」、「精解」、「せいかく」については「正確」、
「性格」といったように各候補毎に複数の同音語が存在
するために候補数はさらに増加することになる。

【００５３】そこで、第１の実施形態では、入力文字列
がひらがな文字列である場合に、予測文字列の候補数が
予め設定された値よりも多ければ、図５（ｂ）に示すよ
うに、それらの候補を読み（ひらがな表記）の状態で表
示する。これにより、見出し（漢字表記）での同音語の
重複を避けて表示することができ、結果的に表示候補を
少なくすることができる。

【００５４】一方、入力文字列がひらがな文字列である
場合に、予測文字列の候補数が予め設定された値よりも
少なければ、図５（ｄ）に示すように、それらの候補を
見出し（漢字表記）で表示する。

【００５５】すなわち、図５（ｃ）に示すように、例え
ば「せいふ」と入力した場合には、「せいふ」、「せい
ふく」、「せいふう」が予測文字列の候補として挙げら
れるが、見出し（漢字表記）を含めても、その全体的な
候補数は設定値以下である。このように、候補数がある
程度絞り込められると、図５（ｄ）に示すように、それ
らの候補が見出し（漢字表記）で表示される。これによ
り、利用者の意図する候補を見出しの状態（つまりかな
漢字変換した状態）で得ることができる。

【００５６】図６は第１の実施形態における文字列予測
後の表記変換を説明するための具体例であり、これは本
発明の請求項２に対応する。「せい」という入力文字列
に対し、図６（ａ）に示すような読み（ひらがな表記）
で予測文字列の候補が表示されたとする。このとき、利
用者が「せいふ」を選択し、さらに表記変換を指示する
と、図６（ｂ）に示すように該文字列の見出し（漢字表
記）である「政府」と「正負」が表示される。この場
合、読みに対応する見出しは既に検索されているため、
改めて辞書引くする必要はない。

【００５７】図７は第２の実施形態における文字列予測
を説明するための具体例であり、これは本発明の請求項
３に対応する。図７（ａ）に示すように、例えば「せい
ふ」とひらがな文字列が入力された場合、入力文字列に
対応する部分が漢字表記可能なものは該漢字の画数に応
じて出力順が決定される。この場合、一文字目の漢字の
画数の多い順に優先されるとすると、図７（ｂ）に示し
たような順で予測文字列の候補が表示される。通常、入
力文字列が漢字の場合には、その画数が少なければ漢字
でそのまま入力し、逆に画数が多ければひらがなで入力
することが多いので、このように画数が多い順に優先度
を高して表示すれば、利用者の意図する候補が優先表示
される可能性が高くなる。

【００５８】図８は第３の実施形態における文字列予測
を説明するための具体例であり、これは本発明の請求項
４に対応する。図８（ａ）に示すように「じょうほ」と
ひらがな文字列が入力された場合を想定する。図８
（ｂ）は漢字入力推定値を算出するために、各漢字の画
数毎に漢字とその漢字の入力回数を記憶した漢字入力学
習テーブル１１７の内容を示したものである。この漢字
入力学習テーブル１１７から、９画の漢字と１０画の漢
字の間で入力回数の変化量が多いことが分かる。つま
り、９画を境にして文字列が漢字で入力される可能性が
低くなり、逆にひらがな入力の可能性が高くなることが
分かる。したがって、このときの漢字入力推定値は９画
となる。

【００５９】これにより、「じょうほ」といったひらが
な文字列の入力では、図８（ｃ）に示すように、予測文
字列の各候補の中で一文字目の漢字の画数が漢字入力推
定値（９画）よりも多い「譲（２０画）歩」、情（１１
画）報」が優先的に表示されることになる。このように
漢字入力推定値より画数の多いものを優先表示すれば、
利用者の意図する候補が優先表示される可能性が高くな
る。

【００６０】なお、本発明は、上記各実施形態で説明し
たような手書き文字入力に限らず、キーボード等の他の
漢字入力可能な入力手段においても応用可能であり、利
用者の文書作成効率を向上させることができる。

【００６１】

【発明の効果】以上のように本発明によれば、入力文字
列がひらがな文字列であった場合に、予測文字列の各候
補を表示する際に、その候補数が予め設定された値より
も多ければ各候補を読みで表示するようにしたため、見
出し（漢字表記）での同音語の重複を避けて表示するこ
とができる。これにより、結果的に表示候補数を少なく
することができ、文字表示画面が小さい場合でも利用者
の意図する候補を画面内に表示することが可能になる。

【００６２】また、見出しで表示された各候補の中から
所望の候補を選択すれば、その候補を表記変換して見出
しで得ることができる。また、入力文字列がひらがな文
字列であった場合に、予測文字列の各候補の中で入力文
字列に対応する部分が漢字表記可能なものは、その漢字
の画数に応じた優先度を付けて見出しで表示するように
したため、予測文字列の候補を見出し（漢字表記）で表
示する際に、利用者の意図する候補を優先的に表示でき
るようになる。

【００６３】また、入力文字列がひらがな文字列であっ
た場合に、予測文字列の各候補の中で入力文字列に対応
する部分が漢字表記可能なものは、漢字入力推定値より
画数の多いものを優先して見出しで表示するようにした
ため、予測文字列の候補を見出し（漢字表記）で表示す
る際に、利用者の意図する候補が優先表示される可能性
が高くなる。

【図面の簡単な説明】

【図１】本発明の一実施形態に係る文書作成装置の構成
を示すブロック図。

【図２】本発明の第１の実施形態としての処理の流れを
示すフローチャート。

【図３】本発明の第２の実施形態としての処理の流れを
示すフローチャート。

【図４】本発明の第３の実施形態としての処理の流れを
示すフローチャート。

【図５】上記第１の実施形態における文字列予測を説明
するための具体例を示す図。

【図６】上記第１の実施形態における文字列予測後の表
記変換を説明するための具体例を示す図。

【図７】上記第２の実施形態における文字列予測を説明
するための具体例を示す図。

【図８】上記第３の実施形態における文字列予測を説明
するための具体例を示す図。

【符号の説明】

１０１…入力装置１０２…文字列入力部１０３…入力バッファ１０４…文字認識部１０５…文字認識辞書１０６…辞書検索部１０７…アドレスバッファ１０８…単語辞書１０９…文字列表示部１１０…候補バッファ１１１…漢字入力推定値１１２…文字種判定部１１３…文字列出力部１１４…出力バッファ１１５…表記変換部１１６…漢字入力学習部１１７…漢字入力学習テーブル１１８…出力装置

Claims

【特許請求の範囲】

【請求項１】少なくとも単語の読みとそれに対応する
見出しを格納した単語辞書を有し、予測対象となる文字列の入力により、この入力文字列を先頭部分に持つ文字列を予測文字列の
候補として上記単語辞書から検索し、上記入力文字列の文字種を判定し、上記入力文字列がひらがな文字列であった場合に、上記
検索された予測文字列の各候補を表示する際に、その候
補数が予め設定された値よりも多ければ上記予測文字列
の各候補を読みで表示し、上記設定値よりも少なければ
上記予測文字列の各候補を見出しで表示するようにした
ことを特徴とする文字列予測方法。
【請求項２】上記予測文字列の各候補が読みで表示さ
れた場合に、その中で選択された候補の読みを見出しに
変換し、この変換された候補の見出しを最終的な予測結果として
出力するようにしたことを特徴とする請求項１記載の文
字列予測方法。
【請求項３】少なくとも単語の読みとそれに対応する
見出しを格納した単語辞書を有し、予測対象となる文字列の入力により、この入力された文字列を先頭部分に持つ文字列を予測文
字列の候補として上記単語辞書から検索し、上記入力文字列の文字種を判定し、上記入力文字列がひらがな文字列であった場合に、上記
検索された予測文字列の各候補の中で上記入力文字列に
対応する部分が漢字表記可能なものは、その漢字の画数
に応じた優先度を付けて見出しで表示するようにしたこ
とを特徴とする文字列予測方法。
【請求項４】少なくとも単語の読みとそれに対応する
見出しを格納した単語辞書を有し、予測対象となる文字列の入力により、この入力された文字列を先頭部分に持つ文字列を予測文
字列の候補として上記単語辞書から検索し、上記入力文字列の文字種を判定し、上記入力文字列が漢字文字列であった場合に、その漢字
の画数毎の入力数を漢字入力学習テーブルに記憶し、この漢字入力学習テーブルに記憶された漢字画数毎の入
力数に基づいて漢字入力推定値を決定し、上記入力文字列がひらがな文字列であった場合に、上記
検索された予測文字列の各候補の中で上記入力文字列に
対応する部分が漢字表記可能なものは、上記漢字入力推
定値より画数の多いものを優先して見出しで表示するよ
うにしたことを特徴とする文字列予測方法。
【請求項５】予測対象となる文字列を入力する入力手
段と、少なくとも単語の読みとそれに対応する見出しを格納し
た単語辞書と、上記入力手段から入力された文字列を先頭部分に持つ文
字列を予測文字列の候補として上記単語辞書から検索す
る辞書検索手段と、上記入力文字列の文字種を判定する文字種判定手段と、この文字種判定手段の結果、上記入力文字列がひらがな
文字列であった場合に、上記辞書検索手段によって検索
された予測文字列の各候補を表示する際に、その候補数
が予め設定された値よりも多ければ上記予測文字列の各
候補を読みで表示し、上記設定値よりも少なければ上記
予測文字列の各候補を見出しで表示する表示手段とを具
備したことを特徴とする文書作成装置。
【請求項６】上記予測文字列の各候補が読みで表示さ
れた場合に、その中の１つを選択する選択手段と、この選択手段によって選択された候補の読みを見出しに
変換する表記変換手段と、この表記変換手段によって変換された候補の見出しを最
終的な予測結果として出力する出力手段とをさらに具備
したことを特徴とする請求項６記載の文書作成装置。
【請求項７】予測対象となる文字列を入力する入力手
段と、少なくとも単語の読みとそれに対応する見出しを格納し
た単語辞書と、上記入力手段から入力された文字列を先頭部分に持つ文
字列を予測文字列の候補として上記単語辞書から検索す
る辞書検索手段と、上記入力文字列の文字種を判定する文字種判定手段と、この文字種判定手段の結果、上記入力文字列がひらがな
文字列であった場合に、上記辞書検索手段によって検索
された予測文字列の各候補の中で上記入力文字列に対応
する部分が漢字表記可能なものは、その漢字の画数に応
じた優先度を付けて見出しで表示する表示手段とを具備
したことを特徴とする文書作成装置。
【請求項８】予測対象となる文字列を入力する入力手
段と、少なくとも単語の読みとそれに対応する見出しを格納し
た単語辞書と、上記入力手段から入力された文字列を先頭部分に持つ文
字列を予測文字列の候補として上記単語辞書から検索す
る辞書検索手段と、上記入力文字列の文字種を判定する文字種判定手段と、この文字種判定手段の結果、上記入力文字列が漢字文字
列であった場合に、その漢字の画数毎に入力数を記憶す
る漢字入力学習テーブルと、この漢字入力学習テーブルに記憶された漢字画数毎の入
力数に基づいて漢字入力推定値を決定する漢字入力推定
手段と、上記文字種判定手段の結果、上記入力文字列がひらがな
文字列であった場合に、上記辞書検索手段によって検索
された予測文字列の各候補の中で上記入力文字列に対応
する部分が漢字表記可能なものは、上記漢字入力推定手
段によって決定された漢字入力推定値より画数の多いも
のを優先して見出しで表示する表示手段とを具備したこ
とを特徴とする文書作成装置。