JPH10143501A - 文字列予測方法及びこの文字列予測方法を用いた文書作成装置 - Google Patents

文字列予測方法及びこの文字列予測方法を用いた文書作成装置

Info

Publication number
JPH10143501A
JPH10143501A JP8300495A JP30049596A JPH10143501A JP H10143501 A JPH10143501 A JP H10143501A JP 8300495 A JP8300495 A JP 8300495A JP 30049596 A JP30049596 A JP 30049596A JP H10143501 A JPH10143501 A JP H10143501A
Authority
JP
Japan
Prior art keywords
character string
input
kanji
candidate
predicted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8300495A
Other languages
English (en)
Inventor
Toshiya Tamura
俊哉 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP8300495A priority Critical patent/JPH10143501A/ja
Publication of JPH10143501A publication Critical patent/JPH10143501A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】文字列予測とかな漢字変換を融合して予測候補
を出力する場合に、利用者の意図する候補を優先的に表
示できるようにする。 【解決手段】入力文字列を先頭部分に持つ文字列を予測
文字列の候補として単語辞書から検索する(201〜2
04)。入力文字列の文字種をチェックし(206)、
入力文字列がひらがな文字列であった場合に予測文字列
の各候補を表示する際に、その候補数が予め設定された
値よりも多ければ上記予測文字列の各候補を読みで表示
し、上記設定値よりも少なければ予測文字列の各候補を
見出しで表示する(207〜211)。これにより、候
補数が設定値よりも多い場合に同音語の重複を避けて表
示することができ、結果的に表示候補数を少なくして利
用者の意図する候補を画面内に表示することが可能にな
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力装置により入
力された文字列をもとに、その入力された文字列に続く
文字列を予測する文字列予測方法に係り、特に文字列予
測とかな漢字変換を融合した場合での予測候補の表示方
法に特徴を有する文字列予測方法及びこの文字列予測方
法を用いた文書作成装置に関する。
【0002】
【従来の技術】従来、例えば日本語ワードプロセッサ等
の文書作成装置において、手書き文字認識装置などを用
いて文字列を入力する際には、キーボードからの入力な
どとは異なり、1文字を入力するのに時間がかかるた
め、入力者に対する負担が大きかった。
【0003】そこで、入力者に対する負担を軽くするた
めに、入力しようとしている文字列の一部が入力された
段階で、入力された文字列をもとにその文字列に続く文
字列を予測するという方法が考えられてきた。
【0004】これに対して考えられたのが入力予測と呼
ぶ方法で、例えば、文献(第48回情報処理学会全国大
会予稿集4J−11他)で報告されているような、最初
の数文字が入力された時点で単語辞書を検索して、その
数文字で始まる文字列(単語)を抽出する方法がある。
【0005】これは、例えば「漢字辞書」という文字列
の入力では、入力者が「漢字」と入力した段階で、その
「漢字」に続く文字列として「辞書」を予測し、最終的
に「漢字辞書」を出力するものである。
【0006】
【発明が解決しようとする課題】上記したような入力予
測方法では、予測を始める時点での入力文字数が少ない
ほど候補の絞り込みはできにくく、候補となる文字列は
多数存在することになるため、候補の出力方法に関して
工夫を施す必要がある。これまでの入力予測方法では、
予測候補の数が多数あり、画面が小さくて全ての候補を
一括して表示できないような場合には、利用者の意図し
た予測文字列がなかなか得られないといった不具合があ
った。
【0007】特に、文字列予測とかな漢字変換を融合し
た装置では、読み(ひらがな表記)で入力された文字列
を予測後、その予測文字列の各候補を見出し(漢字表
記)で出力するため、例えば「せいかい」→「正解」、
「盛会」、「政界」といったように同音語が複数存在す
る候補の場合には、予測候補数を増加させる1つの要因
となる問題がある。
【0008】本発明は上記のような点に鑑みなされたも
ので、文字列予測とかな漢字変換を融合して予測候補を
出力する場合に、利用者の意図する候補を優先的に表示
することのできる文字列予測方法及びこの文字列予測方
法を用いた文書作成装置を提供することを目的とする。
【0009】
【課題を解決するための手段】
(1)本発明は、少なくとも単語の読みとそれに対応す
る見出しを格納した単語辞書を有し、予測対象となる文
字列の入力により、この入力文字列を先頭部分に持つ文
字列を予測文字列の候補として上記単語辞書から検索
し、上記入力文字列の文字種を判定し、上記入力文字列
がひらがな文字列であった場合に、上記検索された予測
文字列の各候補を表示する際に、その候補数が予め設定
された値よりも多ければ上記予測文字列の各候補を読み
で表示し、上記設定値よりも少なければ上記予測文字列
の各候補を見出しで表示するようにしたものである。
【0010】(2)さらに、本発明は、上記(1)の構
成において、上記予測文字列の各候補が読みで表示され
た場合に、その中で選択された候補の読みを見出しに変
換し、この変換された候補の見出しを最終的な予測結果
として出力するようにしたものである。
【0011】このような構成によれば、入力文字列がひ
らがな文字列であった場合に、予測文字列の各候補を表
示する際に、その候補数が予め設定された値よりも多け
れば各候補を読みで表示する。この場合、各候補を読み
(ひらがな表記)で表示することで、見出し(漢字表
記)での同音語の重複を避けて表示することができる。
これにより、結果的に表示候補数を少なくすることがで
き、文字表示画面が小さい場合でも利用者の意図する候
補を画面内に表示することが可能になる。また、見出し
で表示された各候補の中から所望の候補を選択すれば、
その候補を表記変換して見出しで得ることができる。
【0012】(3)また、本発明は、少なくとも単語の
読みとそれに対応する見出しを格納した単語辞書を有
し、予測対象となる文字列の入力により、この入力され
た文字列を先頭部分に持つ文字列を予測文字列の候補と
して上記単語辞書から検索し、上記入力文字列の文字種
を判定し、上記入力文字列がひらがな文字列であった場
合に、上記検索された予測文字列の各候補の中で上記入
力文字列に対応する部分が漢字表記可能なものは、その
漢字の画数に応じた優先度を付けて見出しで表示するよ
うにしたものである。
【0013】このような構成によれば、入力文字列がひ
らがな文字列であった場合に、予測文字列の各候補の中
で入力文字列に対応する部分が漢字表記可能なものは、
その漢字の画数に応じた優先度を付けて見出しで表示す
る。通常、入力文字列が漢字の場合には、その画数が少
なければ漢字でそのまま入力し、逆に画数が多ければひ
らがなで入力することが多い。したがって、予測文字列
の候補を見出し(漢字表記)で表示する際に、画数が多
い順に優先度を高して表示すれば、利用者の意図する候
補を優先的に表示できるようになる。
【0014】(4)また、本発明は、少なくとも単語の
読みとそれに対応する見出しを格納した単語辞書を有
し、予測対象となる文字列の入力により、この入力され
た文字列を先頭部分に持つ文字列を予測文字列の候補と
して上記単語辞書から検索し、上記入力文字列の文字種
を判定し、上記入力文字列が漢字文字列であった場合
に、その漢字の画数毎の入力数を漢字入力学習テーブル
に記憶し、この漢字入力学習テーブルに記憶された漢字
画数毎の入力数に基づいて漢字入力推定値を決定し、上
記入力文字列がひらがな文字列であった場合に、上記検
索された予測文字列の各候補の中で上記入力文字列に対
応する部分が漢字表記可能なものは、上記漢字入力推定
値より画数の多いものを優先して見出しで表示するよう
にしたものである。
【0015】このような構成によれば、入力文字列がひ
らがな文字列であった場合に、予測文字列の各候補の中
で入力文字列に対応する部分が漢字表記可能なものは、
漢字入力推定値より画数の多いものを優先して見出しで
表示する。漢字入力推定値とは、漢字で入力する可能性
が高くなる画数の閾値であり、その値は利用者の漢字入
力を学習した結果から求められている。したがって、予
測文字列の候補を見出し(漢字表記)で表示する際に、
この漢字入力推定値より画数の多いものを優先表示すれ
ば、利用者の意図する候補が優先表示される可能性が高
くなる。
【0016】
【発明の実施の形態】以下、図面を参照して本発明の一
実施形態を説明する。図1は本発明の一実施形態に係る
文書作成装置の構成を示すブロック図である。本装置
は、文字列予測機能を備えた日本語ワードプロセッサで
ある。図1において、入力装置101は、タブレット等
の手書き文字の入力装置であり、ぺン入力されたストロ
ークを座標データとして出力する。文字認識部104
は、入力装置101から得られる座標データから文字認
識辞書105を参照して手書き文字を認識することによ
って、入力情報を文字コードとして出力する。出力装置
118は、例えばCRT (Cathode Ray Tube) やLCD
(Liquid Crystal Display)等の画面表示装置であり、
利用者はこれらにより対話的に文書の作成作業を進める
ことができる。
【0017】文字列入力部102は、文字認識部104
に指示して入力された座標データを文字認識した結果の
文字データを、入力バッファ103に文字認識処理など
の間一旦バッファリングして漢字かな混じり文字列を作
り、予測対象となった後に文字列を辞書検索部106へ
と送る。単語辞書108は、少なくとも単語の読み(ひ
らがな表記)とそれに対応する見出し(漢字混じり表
記)とを格納したものである。辞書検索部106は、入
力された文字列を先頭部分に持つ文字列を予測文字列の
候補として単語辞書108から検索し、その辞書アドレ
スをアドレスバッファ107に格納する。
【0018】文字種判定部112は、入力された文字列
を構成する各文字の文字種をチェックする。漢字入力推
定値バッファ111は、過去に入力された漢字の画数か
ら算出された、利用者が直接漢字で入力すると推定され
る漢字の画数を記憶する。文字列表示部109は、文字
種判定部112の判定の結果、入力文字列がひらがな文
字列でない場合にはアドレスバッファ107を参照して
単語辞書を検索し、その検索した文字列つまり予測文字
列の各候補を見出し(漢字混じり表記)で表示する。
【0019】一方、入力文字列がひらがな文字列である
場合、第1の実施形態(請求項1または請求項2)で
は、アドレスバッファ107を参照して検索した単語数
が予め設定された値よりも多ければ検索した文字列つま
り予測文字列の各候補を読み(ひらがな表記)で表示
し、予め設定された値よりも少なければ見出し(漢字混
じり表記)で表示する。
【0020】また、第2の実施形態(請求項3)では、
アドレスバッファ107を参照して単語辞書を検索し、
検索した文字列つまり予測文字列の各候補の中で入力文
字列に対応する部分が漢字表記可能なものについては該
漢字の画数に応じて優先度を付けて見出し(漢字混じり
表記)で表示する。この場合、画数の多い漢字ほど優先
度を高くする。
【0021】また、第3の実施形態(請求項4)では、
検索した文字列つまり予測文字列の各候補の中で入力文
字列に対応する部分が漢字表記可能なものについては該
漢字の画数が漢字入力推定値バッファ111よりも多い
漢字であるものを優先的に表示する。
【0022】表記変換部115は、読み(ひらがな表
記)で表示された予測文字列の各候補に対し、利用者か
ら表記変換が指示された場合に単語辞書を検索して、そ
の候補を見出し(漢字混じり表記)に置換する。漢字入
力学習テーブル117は、入力された漢字について、画
数毎に漢字とその入力回数を保持する。
【0023】漢字入力学習部116は、利用者によって
漢字が入力された場合に文字認識辞書105を参照して
該漢字の画数を求めて漢字入力学習テーブル117を更
新し、該テーブル117を参照して漢字入力推定値バッ
ファ111を更新する。この場合、画数毎に漢字入力数
を計上しておき、漢字入力数が最も変化する画数を漢字
入力推定値とする。
【0024】文字列出力部113は、利用者による予測
文字列の候補選択処理を行い、確定した予測文字列の候
補を出力バッファ114へと格納する。特に、請求項2
では、選択された候補に対して漢字混じり表記への表記
変換が指示された場合に、表記変換手段115に指示し
てひらがな表記を漢字混じり表記に置換する。
【0025】次に、本発明の第1の実施形態の動作を説
明する。図2は本発明の第1の実施形態としての処理の
流れを示すフローチャートである。入力装置101で入
力された文字パターンは、文字認識部104において文
字認識辞書105を参照して文字データに置換され(ス
テップ201)、入力バッファ103に格納される(ス
テップ202)。文字列入力部102は、入力文字列が
予測対象となるまで順次入力される文字を入力バッファ
103に格納し、予測対象となった後に入力文字列を辞
書検索部106へと送る(ステップ201〜203)。
【0026】辞書検索部106では、入力文字列を先頭
部分に持つ文字列を予測文字列の候補として単語辞書1
08から検索し(ステップ204)、該当する文字列の
辞書アドレスをアドレスバッファ107に格納する(ス
テップ205)。辞書検索が終了すると、文字列表示部
109は文字種判定部112に指示して入力文字列の構
成文字の文字種をチェックする(ステップ206)。
【0027】その結果、入力文字列がひらがな文字列で
ない場合には(ステップ207のNo)、文字列表示部
109はアドレスバッファ107に格納された辞書アド
レスから単語辞書108を参照し、該当する単語の見出
し、すなわち漢字かな混じり表記を候補バッファ110
に格納する(ステップ212)。
【0028】一方、入力文字列がひらがな文字列である
場合には(ステップ207のYes)、文字列表示部1
09は検索した単語数が予め設定された値よりも多いか
否かをチェックする(ステップ208)。
【0029】その結果、単語数(予測文字列の候補数)
が設定値よりも多ければ(ステップ209のYes)、
文字列表示部109はアドレスバッファ107に格納さ
れた辞書アドレスから単語辞書108を参照し、検索し
た単語の読み、すなわちひらがな表記を候補バッファ1
10に格納する(ステップ210)。この際、同音語に
ついては重複は避けられる。また、単語数(予測文字列
の候補数)が設定値よりも少なければ(ステップ209
のNo)、文字列表示部109はアドレスバッファ10
7に格納された辞書アドレスから単語辞書108を参照
し、検索した単語の見出し、すなわち漢字かな混じり表
記を候補バッファ110に格納する(ステップ21
1)。
【0030】次に、文字列出力部113において、利用
者による予測文字列の候補選択処理が行われる(ステッ
プ213)。この場合、候補バッファ110に格納され
た各単語(予測文字列の候補)が表示され、その中から
任意の単語を1つ選択することになる。このとき選択さ
れた単語の文字列は出力バッファ114に格納される
(ステップ216)。
【0031】また、選択された単語の文字列に対し、利
用者から表記変換が指示された場合には(ステップ21
4のYes)、文字列出力部113は単語辞書108を
参照してその文字列を漢字混じり表記に置換し(ステッ
プ215)、出力バッファ114に格納する(ステップ
216)。
【0032】出力装置117は、出力バッファ114に
格納された文字列を画面表示する(ステップ217)。
最後に、次の文字列予測処理に備えて各バッファが初期
化される(ステップ218)。
【0033】このように、第1の実施形態では、入力文
字列がひらがな文字列であった場合に、予測文字列の各
候補を表示する際に、その候補数が予め設定された値よ
りも多ければ各候補を読みで表示する。この場合、各候
補を読み(ひらがな表記)で表示することで、見出し
(漢字表記)での同音語の重複を避けて表示することが
できる。これにより、結果的に表示候補数を少なくする
ことができ、文字表示画面が小さい場合でも利用者の意
図する候補を画面内に表示することが可能になる。ま
た、見出しで表示された各候補の中から所望の候補を選
択すれば、その候補を表記変換して見出しで得ることが
できる。
【0034】次に、本発明の第2の実施形態の動作を説
明する。図3は本発明の第2の実施形態としての処理の
流れを示すフローチャートである。なお、図中のステッ
プ301〜306の文字列入力から入力文字列の文字種
チェックまでの処理は図2のステップ201〜206の
処理と同様である。
【0035】すなわち、入力装置101で入力された文
字パターンは、文字認識部104において文字認識辞書
105を参照して文字データに置換され(ステップ30
1)、入力バッファ103に格納される(ステップ30
2)。文字列入力部102は、入力文字列が予測対象と
なるまで順次入力される文字を入力バッファ103に格
納し、予測対象となった後に入力文字列を辞書検索部1
06へと送る(ステップ301〜303)。
【0036】辞書検索部106では、入力文字列を先頭
部分に持つ文字列を予測文字列の候補として単語辞書1
08から検索し(ステップ304)、該当する文字列の
辞書アドレスをアドレスバッファ107に格納する(ス
テップ305)。辞書検索が終了すると、文字列表示部
109は文字種判定部112に指示して入力文字列の構
成文字の文字種をチェックする(ステップ306)。
【0037】ここで、第2の実施形態において、文字列
表示部109は文字種判定部112における入力文字列
の文字種をチェック後、アドレスバッファ107に格納
された辞書アドレスから単語辞書108を参照し、検索
された単語の見出し、すなわち漢字かな混じり表記を候
補バッファ110に格納する(ステップ307)。
【0038】そして、文字種判定部112でのチェック
の結果、入力文字列がひらがな文字列であった場合には
(ステップ308のYes)、文字列表示部109は検
索された文字列の中で入力文字列に対応する部分の漢字
の画数をチェックし(ステップ309)、その漢字の画
数に応じて予測文字列の各候補を並べ替える(ステップ
310)。この場合、画数が多い順に優先度を高くし、
入力文字列に対応する部分が漢字表記不可能である文字
列を該部分が漢字表記可能な単語の後になるように並べ
替える。
【0039】次に、文字列出力部113において、利用
者による予測文字列の候補選択処理が行われる(ステッ
プ311)。この場合、候補バッファ110に格納され
た各単語(予測文字列の候補)が表示され、その中から
任意の単語を1つ選択することになる。このとき選択さ
れた単語の文字列は出力バッファ114に格納される
(ステップ312)。
【0040】出力装置117は、出力バッファ114に
格納された文字列を画面表示する(ステップ313)。
最後に、次の文字列予測処理に備えて各バッファが初期
化される(ステップ314)。
【0041】このように、第2の実施形態では、入力文
字列がひらがな文字列であった場合に、予測文字列の各
候補の中で入力文字列に対応する部分が漢字表記可能な
ものは、その漢字の画数に応じた優先度を付けて見出し
で表示する。通常、入力文字列が漢字の場合には、その
画数が少なければ漢字でそのまま入力し、逆に画数が多
ければひらがなで入力することが多い。したがって、予
測文字列の候補を見出し(漢字表記)で表示する際に、
画数が多い順に優先度を高して表示すれば、利用者の望
む候補を優先的に表示できるようになる。
【0042】次に、本発明の第3の実施形態の動作を説
明する。図4は本発明の第3の実施形態としての処理の
流れを示すフローチャートである。なお、図中のステッ
プ401〜406の文字列入力から入力文字列の文字種
チェックまでの処理は図2のステップ201〜206の
処理と同様である。
【0043】すなわち、入力装置101で入力された文
字パターンは、文字認識部104において文字認識辞書
105を参照して文字データに置換され(ステップ40
1)、入力バッファ103に格納される(ステップ40
2)。文字列入力部102は、入力文字列が予測対象と
なるまで順次入力される文字を入力バッファ103に格
納し、予測対象となった後に入力文字列を辞書検索部1
06へと送る(ステップ401〜403)。
【0044】辞書検索部106では、入力文字列を先頭
部分に持つ文字列を予測文字列の候補として単語辞書1
08から検索し(ステップ404)、該当する文字列の
辞書アドレスをアドレスバッファ107に格納する(ス
テップ405)。辞書検索が終了すると、文字列表示部
109は文字種判定部112に指示して入力文字列の構
成文字の文字種をチェックする(ステップ406)。
【0045】ここで、第3の実施形態において、文字列
表示部109は文字種判定部112における入力文字列
の文字種をチェック後、アドレスバッファ107に格納
された辞書アドレスから単語辞書108を参照し、検索
された単語の見出し、すなわち漢字かな混じり表記を候
補バッファ110に格納する(ステップ407)。
【0046】そして、文字種判定部112でのチェック
の結果、入力文字列がひらがな文字列であった場合には
(ステップ408のYes)、文字列表示部109は検
索された文字列の中で入力文字列に対応する部分の漢字
の画数をチェックすると共に(ステップ409)、漢字
入力推定値バッファ111に現在格納されている漢字入
力推定値をチェックすることにより(ステップ41
0)、漢字入力推定値よりも多いものが優先となるよう
に予測文字列の各候補を並ベ替える(ステップ41
1)。
【0047】一方、入力文字列がひらがな文字列でない
場合には(ステップ408のNo)、漢字入力学習部1
16が入力文字列の漢字の画数を文字認識辞書105を
参照して求めて、各漢字の画数毎に漢字の入力回数を保
持した漢字入力学習テーブル117を更新し(ステップ
412)、該テーブル117を参照して漢字入力推定値
バッファ111内の漢字入力推定値を更新する(ステッ
プ413)。この場合、画数毎に漢字入力数を記憶した
漢字入力学習テーブル117を参照し、漢字入力数が最
も変化する画数を漢字入力推定値とする。
【0048】次に、文字列出力部113において、利用
者による予測文字列の選択処理が行われる(ステップ4
14)。この場合、候補バッファ110に格納された各
単語(予測文字列の候補)が表示され、その中から任意
の単語を1つ選択することになる。このとき選択された
単語の文字列は出力バッファ114に格納される(ステ
ップ415)。
【0049】出力装置117は、出力バッファ114に
格納された文字列を画面表示する(ステップ416)。
最後に、次の文字列予測処理に備えて各バッファが初期
化される(ステップ417)。
【0050】このように、第3の実施形態では、入力文
字列がひらがな文字列であった場合に、予測文字列の各
候補の中で入力文字列に対応する部分が漢字表記可能な
ものは、漢字入力推定値より画数の多いものを優先して
見出しで表示する。漢字入力推定値とは、漢字で入力す
る可能性が高くなる画数の閾値であり、その値は利用者
の漢字入力を学習した結果から求められている。したが
って、予測文字列の候補を見出し(漢字表記)で表示す
る際に、この漢字入力推定値より画数の多いものを優先
表示すれば、利用者の意図する候補が優先表示される可
能性が高くなる。
【0051】次に、上述した各実施形態について具体例
を用いて説明する。図5は第1の実施形態における文字
列予測を説明するための具体例であり、これは本発明の
請求項1に対応する。図5(a)に示すように、例えば
「せい」といった文字列を入力すると、「せい」を先頭
部分に持つ文字列を予測文字列の候補として検索した場
合に、読み(ひらがな表記)だけでも「せいじ」、「せ
いふ」、「せいかい」、「せいかく」…といったよう
に、文字列長が未定であるためにその候補数は必然的に
多数となる。
【0052】しかも、読み(ひらがな表記)に対応する
見出し(漢字表記)を含めると、図5(e)に示すよう
に、「せいじ」については「政治」、「清司」、「誠
司」…、「せいふ」については「政府」、「正負」、
「せいかい」については「正解」、「政界」、「盛
会」、「精解」、「せいかく」については「正確」、
「性格」といったように各候補毎に複数の同音語が存在
するために候補数はさらに増加することになる。
【0053】そこで、第1の実施形態では、入力文字列
がひらがな文字列である場合に、予測文字列の候補数が
予め設定された値よりも多ければ、図5(b)に示すよ
うに、それらの候補を読み(ひらがな表記)の状態で表
示する。これにより、見出し(漢字表記)での同音語の
重複を避けて表示することができ、結果的に表示候補を
少なくすることができる。
【0054】一方、入力文字列がひらがな文字列である
場合に、予測文字列の候補数が予め設定された値よりも
少なければ、図5(d)に示すように、それらの候補を
見出し(漢字表記)で表示する。
【0055】すなわち、図5(c)に示すように、例え
ば「せいふ」と入力した場合には、「せいふ」、「せい
ふく」、「せいふう」が予測文字列の候補として挙げら
れるが、見出し(漢字表記)を含めても、その全体的な
候補数は設定値以下である。このように、候補数がある
程度絞り込められると、図5(d)に示すように、それ
らの候補が見出し(漢字表記)で表示される。これによ
り、利用者の意図する候補を見出しの状態(つまりかな
漢字変換した状態)で得ることができる。
【0056】図6は第1の実施形態における文字列予測
後の表記変換を説明するための具体例であり、これは本
発明の請求項2に対応する。「せい」という入力文字列
に対し、図6(a)に示すような読み(ひらがな表記)
で予測文字列の候補が表示されたとする。このとき、利
用者が「せいふ」を選択し、さらに表記変換を指示する
と、図6(b)に示すように該文字列の見出し(漢字表
記)である「政府」と「正負」が表示される。この場
合、読みに対応する見出しは既に検索されているため、
改めて辞書引くする必要はない。
【0057】図7は第2の実施形態における文字列予測
を説明するための具体例であり、これは本発明の請求項
3に対応する。図7(a)に示すように、例えば「せい
ふ」とひらがな文字列が入力された場合、入力文字列に
対応する部分が漢字表記可能なものは該漢字の画数に応
じて出力順が決定される。この場合、一文字目の漢字の
画数の多い順に優先されるとすると、図7(b)に示し
たような順で予測文字列の候補が表示される。通常、入
力文字列が漢字の場合には、その画数が少なければ漢字
でそのまま入力し、逆に画数が多ければひらがなで入力
することが多いので、このように画数が多い順に優先度
を高して表示すれば、利用者の意図する候補が優先表示
される可能性が高くなる。
【0058】図8は第3の実施形態における文字列予測
を説明するための具体例であり、これは本発明の請求項
4に対応する。図8(a)に示すように「じょうほ」と
ひらがな文字列が入力された場合を想定する。図8
(b)は漢字入力推定値を算出するために、各漢字の画
数毎に漢字とその漢字の入力回数を記憶した漢字入力学
習テーブル117の内容を示したものである。この漢字
入力学習テーブル117から、9画の漢字と10画の漢
字の間で入力回数の変化量が多いことが分かる。つま
り、9画を境にして文字列が漢字で入力される可能性が
低くなり、逆にひらがな入力の可能性が高くなることが
分かる。したがって、このときの漢字入力推定値は9画
となる。
【0059】これにより、「じょうほ」といったひらが
な文字列の入力では、図8(c)に示すように、予測文
字列の各候補の中で一文字目の漢字の画数が漢字入力推
定値(9画)よりも多い「譲(20画)歩」、情(11
画)報」が優先的に表示されることになる。このように
漢字入力推定値より画数の多いものを優先表示すれば、
利用者の意図する候補が優先表示される可能性が高くな
る。
【0060】なお、本発明は、上記各実施形態で説明し
たような手書き文字入力に限らず、キーボード等の他の
漢字入力可能な入力手段においても応用可能であり、利
用者の文書作成効率を向上させることができる。
【0061】
【発明の効果】以上のように本発明によれば、入力文字
列がひらがな文字列であった場合に、予測文字列の各候
補を表示する際に、その候補数が予め設定された値より
も多ければ各候補を読みで表示するようにしたため、見
出し(漢字表記)での同音語の重複を避けて表示するこ
とができる。これにより、結果的に表示候補数を少なく
することができ、文字表示画面が小さい場合でも利用者
の意図する候補を画面内に表示することが可能になる。
【0062】また、見出しで表示された各候補の中から
所望の候補を選択すれば、その候補を表記変換して見出
しで得ることができる。また、入力文字列がひらがな文
字列であった場合に、予測文字列の各候補の中で入力文
字列に対応する部分が漢字表記可能なものは、その漢字
の画数に応じた優先度を付けて見出しで表示するように
したため、予測文字列の候補を見出し(漢字表記)で表
示する際に、利用者の意図する候補を優先的に表示でき
るようになる。
【0063】また、入力文字列がひらがな文字列であっ
た場合に、予測文字列の各候補の中で入力文字列に対応
する部分が漢字表記可能なものは、漢字入力推定値より
画数の多いものを優先して見出しで表示するようにした
ため、予測文字列の候補を見出し(漢字表記)で表示す
る際に、利用者の意図する候補が優先表示される可能性
が高くなる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る文書作成装置の構成
を示すブロック図。
【図2】本発明の第1の実施形態としての処理の流れを
示すフローチャート。
【図3】本発明の第2の実施形態としての処理の流れを
示すフローチャート。
【図4】本発明の第3の実施形態としての処理の流れを
示すフローチャート。
【図5】上記第1の実施形態における文字列予測を説明
するための具体例を示す図。
【図6】上記第1の実施形態における文字列予測後の表
記変換を説明するための具体例を示す図。
【図7】上記第2の実施形態における文字列予測を説明
するための具体例を示す図。
【図8】上記第3の実施形態における文字列予測を説明
するための具体例を示す図。
【符号の説明】
101…入力装置 102…文字列入力部 103…入力バッファ 104…文字認識部 105…文字認識辞書 106…辞書検索部 107…アドレスバッファ 108…単語辞書 109…文字列表示部 110…候補バッファ 111…漢字入力推定値 112…文字種判定部 113…文字列出力部 114…出力バッファ 115…表記変換部 116…漢字入力学習部 117…漢字入力学習テーブル 118…出力装置

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも単語の読みとそれに対応する
    見出しを格納した単語辞書を有し、 予測対象となる文字列の入力により、 この入力文字列を先頭部分に持つ文字列を予測文字列の
    候補として上記単語辞書から検索し、 上記入力文字列の文字種を判定し、 上記入力文字列がひらがな文字列であった場合に、上記
    検索された予測文字列の各候補を表示する際に、その候
    補数が予め設定された値よりも多ければ上記予測文字列
    の各候補を読みで表示し、上記設定値よりも少なければ
    上記予測文字列の各候補を見出しで表示するようにした
    ことを特徴とする文字列予測方法。
  2. 【請求項2】 上記予測文字列の各候補が読みで表示さ
    れた場合に、その中で選択された候補の読みを見出しに
    変換し、 この変換された候補の見出しを最終的な予測結果として
    出力するようにしたことを特徴とする請求項1記載の文
    字列予測方法。
  3. 【請求項3】 少なくとも単語の読みとそれに対応する
    見出しを格納した単語辞書を有し、 予測対象となる文字列の入力により、 この入力された文字列を先頭部分に持つ文字列を予測文
    字列の候補として上記単語辞書から検索し、 上記入力文字列の文字種を判定し、 上記入力文字列がひらがな文字列であった場合に、上記
    検索された予測文字列の各候補の中で上記入力文字列に
    対応する部分が漢字表記可能なものは、その漢字の画数
    に応じた優先度を付けて見出しで表示するようにしたこ
    とを特徴とする文字列予測方法。
  4. 【請求項4】 少なくとも単語の読みとそれに対応する
    見出しを格納した単語辞書を有し、 予測対象となる文字列の入力により、 この入力された文字列を先頭部分に持つ文字列を予測文
    字列の候補として上記単語辞書から検索し、 上記入力文字列の文字種を判定し、 上記入力文字列が漢字文字列であった場合に、その漢字
    の画数毎の入力数を漢字入力学習テーブルに記憶し、 この漢字入力学習テーブルに記憶された漢字画数毎の入
    力数に基づいて漢字入力推定値を決定し、 上記入力文字列がひらがな文字列であった場合に、上記
    検索された予測文字列の各候補の中で上記入力文字列に
    対応する部分が漢字表記可能なものは、上記漢字入力推
    定値より画数の多いものを優先して見出しで表示するよ
    うにしたことを特徴とする文字列予測方法。
  5. 【請求項5】 予測対象となる文字列を入力する入力手
    段と、 少なくとも単語の読みとそれに対応する見出しを格納し
    た単語辞書と、 上記入力手段から入力された文字列を先頭部分に持つ文
    字列を予測文字列の候補として上記単語辞書から検索す
    る辞書検索手段と、 上記入力文字列の文字種を判定する文字種判定手段と、 この文字種判定手段の結果、上記入力文字列がひらがな
    文字列であった場合に、上記辞書検索手段によって検索
    された予測文字列の各候補を表示する際に、その候補数
    が予め設定された値よりも多ければ上記予測文字列の各
    候補を読みで表示し、上記設定値よりも少なければ上記
    予測文字列の各候補を見出しで表示する表示手段とを具
    備したことを特徴とする文書作成装置。
  6. 【請求項6】 上記予測文字列の各候補が読みで表示さ
    れた場合に、その中の1つを選択する選択手段と、 この選択手段によって選択された候補の読みを見出しに
    変換する表記変換手段と、 この表記変換手段によって変換された候補の見出しを最
    終的な予測結果として出力する出力手段とをさらに具備
    したことを特徴とする請求項6記載の文書作成装置。
  7. 【請求項7】 予測対象となる文字列を入力する入力手
    段と、 少なくとも単語の読みとそれに対応する見出しを格納し
    た単語辞書と、 上記入力手段から入力された文字列を先頭部分に持つ文
    字列を予測文字列の候補として上記単語辞書から検索す
    る辞書検索手段と、 上記入力文字列の文字種を判定する文字種判定手段と、 この文字種判定手段の結果、上記入力文字列がひらがな
    文字列であった場合に、上記辞書検索手段によって検索
    された予測文字列の各候補の中で上記入力文字列に対応
    する部分が漢字表記可能なものは、その漢字の画数に応
    じた優先度を付けて見出しで表示する表示手段とを具備
    したことを特徴とする文書作成装置。
  8. 【請求項8】 予測対象となる文字列を入力する入力手
    段と、 少なくとも単語の読みとそれに対応する見出しを格納し
    た単語辞書と、 上記入力手段から入力された文字列を先頭部分に持つ文
    字列を予測文字列の候補として上記単語辞書から検索す
    る辞書検索手段と、 上記入力文字列の文字種を判定する文字種判定手段と、 この文字種判定手段の結果、上記入力文字列が漢字文字
    列であった場合に、その漢字の画数毎に入力数を記憶す
    る漢字入力学習テーブルと、 この漢字入力学習テーブルに記憶された漢字画数毎の入
    力数に基づいて漢字入力推定値を決定する漢字入力推定
    手段と、 上記文字種判定手段の結果、上記入力文字列がひらがな
    文字列であった場合に、上記辞書検索手段によって検索
    された予測文字列の各候補の中で上記入力文字列に対応
    する部分が漢字表記可能なものは、上記漢字入力推定手
    段によって決定された漢字入力推定値より画数の多いも
    のを優先して見出しで表示する表示手段とを具備したこ
    とを特徴とする文書作成装置。
JP8300495A 1996-11-12 1996-11-12 文字列予測方法及びこの文字列予測方法を用いた文書作成装置 Pending JPH10143501A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8300495A JPH10143501A (ja) 1996-11-12 1996-11-12 文字列予測方法及びこの文字列予測方法を用いた文書作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8300495A JPH10143501A (ja) 1996-11-12 1996-11-12 文字列予測方法及びこの文字列予測方法を用いた文書作成装置

Publications (1)

Publication Number Publication Date
JPH10143501A true JPH10143501A (ja) 1998-05-29

Family

ID=17885503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8300495A Pending JPH10143501A (ja) 1996-11-12 1996-11-12 文字列予測方法及びこの文字列予測方法を用いた文書作成装置

Country Status (1)

Country Link
JP (1) JPH10143501A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002211528A (ja) * 2001-01-19 2002-07-31 Ishida Co Ltd 商品処理システム
JP2007172662A (ja) * 2007-03-22 2007-07-05 Microsoft Corp 日本語入力装置および方法
JP2015135546A (ja) * 2014-01-16 2015-07-27 株式会社東芝 電子機器、方法及びプログラム
JP2017033410A (ja) * 2015-08-04 2017-02-09 カシオ計算機株式会社 文字入力装置、サーバ装置、およびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002211528A (ja) * 2001-01-19 2002-07-31 Ishida Co Ltd 商品処理システム
JP2007172662A (ja) * 2007-03-22 2007-07-05 Microsoft Corp 日本語入力装置および方法
JP2015135546A (ja) * 2014-01-16 2015-07-27 株式会社東芝 電子機器、方法及びプログラム
JP2017033410A (ja) * 2015-08-04 2017-02-09 カシオ計算機株式会社 文字入力装置、サーバ装置、およびプログラム

Similar Documents

Publication Publication Date Title
JPH06332610A (ja) 手書き情報入力処理方式
US7711541B2 (en) Chinese input method, Chinese input device, and computer-readable medium
JP2003044214A (ja) 手書き文字入力装置及びそれを実現するプログラム
JPH10143501A (ja) 文字列予測方法及びこの文字列予測方法を用いた文書作成装置
JPH0256053A (ja) 文書作成装置
US20030177289A1 (en) Method, device and program for input prediction processing, and recording medium for recording program thereof
JPH09288666A (ja) 文字列予測方法及びこの文字列予測方法を用いた文書作成装置
JPH06337857A (ja) 漢字入力方式
JPH0638222B2 (ja) 漢字選択装置
JPH10207880A (ja) 文字列予測装置及び文字列予測方法
JPH0630105B2 (ja) 同音語表示方法
JP2715971B2 (ja) 情報入力装置
JPH07191986A (ja) 文章入力装置
JPH06187327A (ja) 漢字選択装置
JPH08161320A (ja) 文書作成装置及びその表示処理方法
JPH1040245A (ja) 漢字入力装置
JPH02177726A (ja) 漢字入力装置
JP2000099635A (ja) 文字列予測装置及び文字列予測方法
JPH10269209A (ja) 文字列予測装置及び文字列予測方法
JPH09274613A (ja) 文字列予測方法及びこの文字列予測方法を用いた文書作成装置
JPS63262750A (ja) デ−タ入力方式
JPH0623973B2 (ja) 文字処理装置の頻度変更方式
JPH0922411A (ja) 文書処理方法及びその装置
JPH09146935A (ja) データ処理装置
JPH04332074A (ja) 文字処理方法及びその装置