JPH0736884A - 文字認識入力装置 - Google Patents

文字認識入力装置

Info

Publication number
JPH0736884A
JPH0736884A JP5181395A JP18139593A JPH0736884A JP H0736884 A JPH0736884 A JP H0736884A JP 5181395 A JP5181395 A JP 5181395A JP 18139593 A JP18139593 A JP 18139593A JP H0736884 A JPH0736884 A JP H0736884A
Authority
JP
Japan
Prior art keywords
kanji
character
character string
kana
katakana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5181395A
Other languages
English (en)
Inventor
Yutaka Oyama
裕 大山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5181395A priority Critical patent/JPH0736884A/ja
Publication of JPH0736884A publication Critical patent/JPH0736884A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 字種に関する情報が有効に保持され、漢字変
換結果の確度の高い文字認識入力装置を提供する。 【構成】 文字認識部20の形成する文字候補にカタカ
ナが含まれている場合に、漢字列形成部80は、カタカ
ナをカナ漢字変換して少なくとも漢字を含む漢字かな文
字列候補を形成し、文字列決定部60がひとつの文字列
を選択する候補である文字列候補に加える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば、タブレット装
置に記入される日本語の手書き文字や紙面上に印刷され
た日本語の印刷文字等、日本語の文字図形を認識して文
字列を作成する文字認識入力装置に関し、さらに詳細に
は、カタカナを含む文字図形をもとにこれに対応する漢
字かな文字列を出力するものに関する。
【0002】
【従来の技術】日本語の文字列を入力する手段として、
キーボードからの入力をかな漢字変換する方式の他に、
上記日本語の文字図形を認識して文字列を作成する文字
認識入力方式がある。かな漢字変換入力方式では、利用
者が一旦、漢字かな文字列を読みの形態に変換して入力
するため、漢字やかななどの字種に関する情報が欠落す
る。これに対して、文字認識入力方式では、字種の情報
を保存したまま入力することが出来る。さらに、文字認
識入力とかな漢字変換を組み合わせることで、漢字かな
文字列の一部をかな書きして入力することも可能であ
る。
【0003】文字認識入力に関する従来技術としては、
特開平2−112058号公報に開示された文字認識入
力方式等がある。特開平2−112058号公報では、
日本語の漢字かな混じり文字列をタブレット装置より入
力する際に、一部または全部の漢字をかな書きすること
を可能としている。
【0004】図2は、特開平2−112058号公報に
おける文字認識入力方式に相当する構成を示すブロック
図である。以下、図2を用いて、特開平2−11205
8号公報における文字認識入力方式を説明する。
【0005】図2において、符号210は日本語の文字
図形を入力する文字図形入力部であり、220は文字図
形入力部210で得られた文字図形を文字認識する文字
認識部220であり、230は文字認識部220で得ら
れた文字候補を一時記憶する文字候補記憶部であり、2
40は文字候補記憶部230内の文字候補をもとに文字
列候補を形成する文字列形成部であり、250は文字列
形成部240で得られた文字列候補を一時記憶する文字
列候補記憶部であり、260は文字列候補記憶部250
内の文字列候補から最も確からしい最尤文字列を決定す
る文字列決定部であり、270は最尤文字列を出力する
出力部である。
【0006】図2において、文字図形入力部210は手
書きタブレットやスキャナなどの画像入力装置で、文字
認識部220はオンライン文字図形認識装置やOCR装
置で、文字列形成部240および文字列決定部260は
CPUおよび処理プログラムで、文字候補記憶部230
および文字列候補記憶部250はメモリで、出力部27
0はCRTや液晶ディスプレイなどの表示装置で、それ
ぞれ実現することができる。
【0007】ここで、利用者が「会議に」を得るために
「会ぎに」を入力するものとする。利用者が文字図形入
力部210で文字画像を入力し、文字認識部220が認
識した結果、「会」、「ぎ」および「に」の各文字が文
字候補記憶部230に納められる。このとき、文字認識
結果が一意に決定しない場合には、各文字図形に対して
複数の文字候補が文字候補記憶部230に納められるこ
ともある。本説明では、各文字図形の認識結果は一意に
得られているものとする。文字列形成部240は、得ら
れた文字を組み合わせて文字列「会議に」を形成して文
字列候補記憶部250に納める。文字列形成部240の
処理手順は、特開平2−112058号公報に詳しく述
べられているので省略する。尚、利用者が「会ぎに」と
いう文字列自体を所望している可能性もあるため、文字
列候補記憶部250には「会ぎに」をも文字列候補とし
て納めてもよい。ここで、文字列決定部260が「会議
に」が「会ぎに」より確からしいと判定すると、「会議
に」が出力部270に表示される。
【0008】以上述べたように、特開平2−11205
8号公報では、一部の文字を漢字のまま入力すること
で、「会議に」を「かいぎに」と読みで入力する場合
に、同音語「懐疑に」を生じてしまうかな漢字変換方式
に比べて、同音語候補を抑制することができる。
【0009】
【発明が解決しようとする課題】特開平2−11205
8号公報では、一部または全部の漢字をかな書きして入
力することを可能としている。しかしながら、かな書き
した部分については、その部分の字種に関する情報が欠
落するため、例えば「覚え書き」を所望して「覚えが
き」と入力した場合、「覚え書」「覚え書き」の両方が
候補として得られてしまう。同様に、「ご自愛くださ
い」と入力した場合、「ご自愛下さい」「御自愛下さ
い」「ご自愛ください」「御自愛ください」のどれであ
るかを特定することは出来ない。
【0010】このように、従来の文字認識入力装置で
は、単に読みをひらがな文字列として入力するため、字
種に関する情報が不十分となり、漢字変換結果の曖昧さ
が増加するという問題点がある。
【0011】本発明の課題は、字種に関する情報が有効
に保持され、漢字変換結果の確度の高い文字認識入力装
置を提供することである。
【0012】
【課題を解決するための手段】本発明は、前述した従来
技術にみられる欠点に鑑み、一部または全部の漢字をか
な書きして入力する際に、漢字対応部分をカタカナ書き
した入力を受け付ける得る構成とすることで、字種に関
する情報を保持しつつ漢字の読みがな化を可能としてい
る。
【0013】即ち、本発明によれば、入力される日本語
の文字図形を文字認識して文字候補を形成する文字認識
部と、前記文字候補に基いて文字列候補を形成する文字
列形成部と、前記文字列候補の中からひとつの文字列を
選択する文字列決定部とを有する文字認識装置におい
て、前記文字認識部の形成する前記文字候補にカタカナ
が含まれている場合に、カタカナをカナ漢字変換して少
なくとも漢字を含む漢字かな文字列候補を形成して前記
文字列候補に加える漢字列形成部を有することを特徴と
する文字認識入力装置が得られる。
【0014】本発明によればまた、前記漢字列形成部
は、前記文字認識部の形成する前記文字候補にカタカナ
が含まれている場合に、少なくともカタカナを含む漢字
カナ文字列候補を形成する漢字カナ文字列形成器と、前
記漢字カナ文字列形成器の形成する前記該漢字カナ文字
列候補に含まれるカタカナをカナ漢字変換して少なくと
も漢字を含む漢字かな文字列候補を形成して前記文字列
候補に加える漢字列形成器とを有することを特徴とする
前記文字認識入力装置が得られる。
【0015】
【作用】本発明の作用は以下の通りである。利用者は、
文字図形を入力する際に、漢字に加えて部分的に読みの
形式で入力することができる。このとき、漢字に変換し
たい部分をカタカナ書きして入力する。本発明は、入力
した日本語の文字図形を文字認識し、得られた文字候補
をもとに文字列候補を形成する。次に、文字候補の中に
カタカナ文字が含まれている場合には、カタカナ文字お
よび隣接する漢字かな文字列を組み合わせて漢字カナ文
字列を形成する。そして、漢字カナ文字列に対応する漢
字かな列が得られる場合にはこれを文字列候補に加え
る。その後、追加した漢字かな文字列候補も含めた全文
字列候補の中から最も確からしい最尤文字列を決定して
出力する。
【0016】
【実施例】以下、本発明による文字認識入力装置につい
て図面を参照して説明する。
【0017】図1は、本発明の一実施例による文字認識
入力装置を示すブロック図である。図1において、文字
図形入力部10乃至出力部70は、図2に示した従来例
における文字図形入力部210乃至出力部270と同様
の構成であるので説明を省略する。
【0018】符号80は、漢字列形成部であり、漢字列
形成部80は、漢字カナ文字列形成器81と、漢字列形
成器82とを有している。漢字カナ文字列形成器81
は、文字候補記憶部30内の文字候補の中から、カタカ
ナ文字および隣接する漢字かな文字列を組み合わせて漢
字カナ文字列を形成するものであり、漢字列形成器82
は、漢字カナ文字列形成器81で作成した漢字カナ文字
列に対応する漢字かな文字列を文字列候補記憶部50の
記憶情報に加えるものである。
【0019】次に、利用者が「覚え書」を所望して「覚
えガキ」と入力した場合および「覚え書き」を所望して
「覚えガき」と入力した場合を例にとり、本実施例を説
明する。
【0020】いま、利用者が「覚えガキ」と入力する
と、図2に示した従来例と同様の流れで、文字候補記憶
部30に「覚」、「え」、「ガ」および「キ」が納めら
れる。文字列形成部40は、これらの文字をもとに文字
列候補「覚えガキ」を作成し、文字列候補記憶部50に
納める。
【0021】一方、漢字カナ文字列形成器81は、文字
候補記憶部30内の文字候補「覚」、「え」、「ガ」お
よび「キ」の中にカタカナ文字「ガ」および「キ」が存
在するので、動作を開始する。即ち、漢字カナ文字列形
成器81は、文字候補「覚」、「え」、「ガ」および
「キ」に基いて、少なくともカタカナを含む漢字カナ文
字列「覚えガキ」を形成し、漢字列形成器82へ出力す
る。
【0022】続いて、漢字列形成器82は、漢字カナ文
字列「覚えガキ」をもとに、「ガキ」を「書」にカナ漢
字変換して漢字かな文字列「覚え書」を形成し、文字列
候補記憶部50に加える。したがって、文字列候補記憶
部50内には、文字列形成部40からの「覚えガキ」と
漢字列形成器82からの「覚え書」とが文字列候補とし
て記憶される。尚、漢字列形成器82における漢字かな
文字列の形成の方法としては、例えば、図3のような辞
書を設けて、これを参照して当該漢字かな文字列「覚え
書」を抽出することで実現できる。
【0023】この後、文字列決定部60が、文字列候補
記憶部50内の文字列候補「覚え書」、「覚えガキ」の
中で「覚え書」が最も確からしいと判定すると、「覚え
書」が出力部70で表示される。
【0024】また、利用者が「覚えガき」と入力した場
合には、上記に同様の手順で文字列候補記憶部50内
に、文字列形成部40からの「覚えガき」と漢字列形成
器82からの「覚え書き」とが文字列候補として記憶さ
れ、文字列決定部60の判定により「覚え書き」が選択
決定され、出力部70によって表示される。
【0025】尚、本実施例では、漢字カナ文字列形成器
81はカタカナ文字を含む全文字列を漢字列形成器82
に渡しているが、例えば利用者が「ゴ自愛クダさい」と
入力した場合に、「ゴ自愛クダさい」から「御自愛下さ
い」へのような完全一致パターンを用意しなくても処理
を可能にすることができる。即ち、漢字カナ文字列形成
器81が部分列を形成して漢字列形成器82に渡す方
式、あるいは、漢字列形成器82が漢字カナ文字列形成
器81から渡された漢字カナ文字列の部分列を漢字かな
文字列に対応づけて文字列候補記憶部50に加える方式
とすれば、図4のような部分列の対応辞書で処理が可能
である。
【0026】また、本説明では、漢字カナ文字列を単に
漢字かな文字列に対応づける構成となっているが、漢字
列形成器82の中に文法処理(形態素解析など)を導入
することもできる。
【0027】さらに、本説明では、文字認識部20によ
る文字認識結果が一意に決定するものとしているが、各
文字図形に対して複数の文字候補が存在する場合につい
ても、文字列形成部40および漢字カナ文字列形成器8
1がそれらを組み合わせて文字列を複数作成することで
処理することができる。
【0028】また、本説明では、漢字カナ文字列形成器
81はカタカナ文字および隣接する漢字かな文字列を組
み合わせて漢字カナ文字列を形成するものとしている
が、実際には、カタカナ文字列があれば隣接する漢字か
な文字列は必ずしも必要ない。例えば「ヘンカン」のよ
うな全部カタカナ文字列の場合や、「変カン」のように
漢字とカタカナのみの文字列や、「ヘンカンする」のよ
うにカタカナとひらがなのみの文字列が入力された場合
でも処理することができる。
【0029】
【発明の効果】本発明の文字認識入力装置は、文字認識
部の形成する文字候補にカタカナが含まれている場合
に、カタカナをカナ漢字変換して少なくとも漢字を含む
漢字かな文字列候補を形成して文字列候補に加える漢字
列形成部を有するため、利用者は、読みはわかるが正し
い字形を覚えていない漢字や複雑な文字で入力が面倒な
ものなどについて、漢字部分の一部を読みの形式で入力
して所望の漢字列を得ることが出来る。さらに、漢字部
分の読みをカタカナで入力するため、単に読みをひらが
な文字列として入力する場合と比較して、字種に関する
情報を保持したままで読み入力が可能となるため、漢字
変換結果の曖昧さを減少させることができる。
【図面の簡単な説明】
【図1】本発明の一実施例による文字認識入力装置を示
すブロック図である。
【図2】従来例による文字認識入力装置を示すブロック
図である。
【図3】図1に示す装置における漢字列形成器82で使
用する辞書の一部の例を示す概念図である。
【図4】図1に示す装置における漢字列形成器82で使
用する辞書の一部の他の例を示す概念図である。
【符号の説明】
10、210 文字図形入力部 20、220 文字認識部 30、230 文字候補記憶部 40、240 文字列形成部 50、250 文字列候補記憶部 60、260 文字列決定部 70、270 出力部 81 漢字カナ文字列形成器 82 漢字列形成器

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力される日本語の文字図形を文字認識
    して文字候補を形成する文字認識部と、前記文字候補に
    基いて文字列候補を形成する文字列形成部と、前記文字
    列候補の中からひとつの文字列を選択する文字列決定部
    とを有する文字認識装置において、前記文字認識部の形
    成する前記文字候補にカタカナが含まれている場合に、
    カタカナをカナ漢字変換して少なくとも漢字を含む漢字
    かな文字列候補を形成して前記文字列候補に加える漢字
    列形成部を有することを特徴とする文字認識入力装置。
  2. 【請求項2】 前記漢字列形成部は、前記文字認識部の
    形成する前記文字候補にカタカナが含まれている場合
    に、少なくともカタカナを含む漢字カナ文字列候補を形
    成する漢字カナ文字列形成器と、前記漢字カナ文字列形
    成器の形成する前記該漢字カナ文字列候補に含まれるカ
    タカナをカナ漢字変換して少なくとも漢字を含む漢字か
    な文字列候補を形成して前記文字列候補に加える漢字列
    形成器とを有することを特徴とする請求項1記載の文字
    認識入力装置。
JP5181395A 1993-07-22 1993-07-22 文字認識入力装置 Pending JPH0736884A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5181395A JPH0736884A (ja) 1993-07-22 1993-07-22 文字認識入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5181395A JPH0736884A (ja) 1993-07-22 1993-07-22 文字認識入力装置

Publications (1)

Publication Number Publication Date
JPH0736884A true JPH0736884A (ja) 1995-02-07

Family

ID=16099996

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5181395A Pending JPH0736884A (ja) 1993-07-22 1993-07-22 文字認識入力装置

Country Status (1)

Country Link
JP (1) JPH0736884A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012194769A (ja) * 2011-03-16 2012-10-11 Sharp Corp 手書き文字入力方法及び手書き文字入力装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5559578A (en) * 1978-10-27 1980-05-06 Fujitsu Ltd Character recognition/kana-chinese character conversion device
JPS59194231A (ja) * 1983-04-16 1984-11-05 Tadayoshi Kajiyama 漢字変換方式
JPS61260354A (ja) * 1985-05-15 1986-11-18 Hitachi Ltd カナ筆記漢字変換方式
JPS62209667A (ja) * 1986-03-10 1987-09-14 Fujitsu Ltd 文章作成装置
JPS6346566A (ja) * 1986-08-14 1988-02-27 Canon Inc 文字処理装置
JPH02112058A (ja) * 1988-10-20 1990-04-24 Sharp Corp 文字認識入力装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5559578A (en) * 1978-10-27 1980-05-06 Fujitsu Ltd Character recognition/kana-chinese character conversion device
JPS59194231A (ja) * 1983-04-16 1984-11-05 Tadayoshi Kajiyama 漢字変換方式
JPS61260354A (ja) * 1985-05-15 1986-11-18 Hitachi Ltd カナ筆記漢字変換方式
JPS62209667A (ja) * 1986-03-10 1987-09-14 Fujitsu Ltd 文章作成装置
JPS6346566A (ja) * 1986-08-14 1988-02-27 Canon Inc 文字処理装置
JPH02112058A (ja) * 1988-10-20 1990-04-24 Sharp Corp 文字認識入力装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012194769A (ja) * 2011-03-16 2012-10-11 Sharp Corp 手書き文字入力方法及び手書き文字入力装置

Similar Documents

Publication Publication Date Title
US6658397B2 (en) Computer method and apparatus for storing and reproducing handwritten characters
JPH05233630A (ja) 日本語又は中国語を記載する方法
JPH0736884A (ja) 文字認識入力装置
JP2000200268A (ja) 手書き文字入力変換装置及び文書作成装置とコンピュ―タ読み取り可能な記録媒体
JPH1166061A (ja) 情報処理装置および情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3164086B2 (ja) 手書き文字フォント作成方法及びそれを適用した手書き文字情報処理装置
JPH07210629A (ja) 文字認識方式
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JPH0640325B2 (ja) 文章作成装置
JPS62209667A (ja) 文章作成装置
JPH0778133A (ja) 文書作成装置および文字パターン出力方法
JPH06290299A (ja) 文字入力装置
JPH1027173A (ja) 人名変換装置
JPS61292774A (ja) 手書き入力ワ−ドプロセツサ
JPH07254044A (ja) 手書き文字認識装置
JPH07182328A (ja) 文書処理装置
JPH0682366B2 (ja) 文字列訂正方式
JPH0934890A (ja) 手書き文字入力装置及び仮名漢字変換方法
JPS6120176A (ja) ロ−マ字−中国語変換装置
JPH04357550A (ja) 文字列登録/学習方式
JPH0836571A (ja) 文書処理装置
JPH05282113A (ja) 文字データ入力装置
JPS58155440A (ja) 日本語処理装置
JPS62269263A (ja) 日本語文書処理装置における仮名漢字変換処理方式

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19971007