JPH06124364A - 文字切り出し装置 - Google Patents

文字切り出し装置

Info

Publication number
JPH06124364A
JPH06124364A JP4274265A JP27426592A JPH06124364A JP H06124364 A JPH06124364 A JP H06124364A JP 4274265 A JP4274265 A JP 4274265A JP 27426592 A JP27426592 A JP 27426592A JP H06124364 A JPH06124364 A JP H06124364A
Authority
JP
Japan
Prior art keywords
character
network
stroke
cutout
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4274265A
Other languages
English (en)
Other versions
JP2940747B2 (ja
Inventor
Hideto Yamamoto
英人 山本
Masayoshi Okamoto
正義 岡本
Takatoshi Yoshikawa
隆敏 吉川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP4274265A priority Critical patent/JP2940747B2/ja
Publication of JPH06124364A publication Critical patent/JPH06124364A/ja
Application granted granted Critical
Publication of JP2940747B2 publication Critical patent/JP2940747B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字切り出し特徴の適切な組み合わせを実現
することによって、文字列の連続筆記を可能とするもの
である。また、文字切り出しに失敗した場合にも容易に
修正ができ、ユーザに負担の少ない文字切り出し装置を
実現するものである。 【構成】 入力手段(1)で入力された筆跡データから
基本セグメント抽出手段(2)で基本セグメントを抽出
する。次に前記ストローク集合抽出手段(2)で前記基
本セグメントを組み合わせてなるストローク集合を抽出
する。更に、ネットワーク構成手段(2)で前記ストロ
ーク集合をノードとし、そのノード間をリンク接続した
ネットワークを構成し、該ストローク集合抽出手段で抽
出されたストローク集合の文字としての評価値を前記ノ
ードの重み、前記ストローク集合間の文字間としての評
価値を前記リンクの重みとする。しかる後、前記文字切
り出し位置決定手段(2)で、前記ネットワーク構成手
段で構成されたネットワークの経路探索することによっ
て文字切り出し位置を決定することによって適切な文字
切り出し特徴の組み合わせを実現することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、連続筆記された文字列
を認識し、各文字に対応する文字コードを得る文字認識
装置に適用される文字切り出し装置に関する。
【0002】
【従来の技術】近年、日本語文字認識技術の研究の成果
として、手書き入力を行える装置が商品化されている。
しかし、それらは一文字ずつの枠を設けるなど筆記文字
列から正確に文字が切り出されることを前提としてい
る。しかし、より自由度の高い手書き入力を実現するた
めには、一文字ずつの枠が存在しない領域に連続して筆
記された文字列を認識できることが不可欠である。この
実現には、筆記文字列から一文字ずつを分離する文字切
り出し技術が必要となる。
【0003】この種の装置としては、ストローク間隔、
ペンアップ時間、文字の大きさ、位置、形状、縦横比、
文字ピッチなどの文字切り出し特徴を用いて行うのが一
般的である。また最近では、電子情報通信学会論文誌
(D)、J68−D、4、PP.765−772(19
85)記載のもののように言語情報を切り出し特徴とし
て用いたものもあり、これらの切り出し特徴が文字切り
出しに有効であることは分かっている。しかし、それら
の切り出し特徴をどのように組み合わせて用いれば最も
有効であるかは明らかにされていない。
【0004】また、文字切り出しに失敗した場合の対処
については、誤認識した文字を書き直すことで対処して
いる。しかし、例えば1行単位の文字列を処理する場合
に、誤った文字全てを書き直すのは非常に苦痛である。
また、多くの場合には文字間の位置さえ確実に分かれば
正確な認識結果が得られるケースが多数ある。そこで文
字切り出し位置を手動で簡単に修正できる手段が必要と
なる。また、個人対応化についての研究も盛んに行われ
ており(例えば電子情報通信論文誌(D−2)、J72
−D−2、PP.132−139(1989)記載のも
の)、その個人筆記特性抽出にその切り出し位置の修正
をどのようにしたかという情報も使える可能性がある。
【0005】
【発明が解決しようとする課題】本発明の文字切り出し
装置は、上述の実情を考慮してなされたものであって、
文字切り出し特徴の適切な組み合わせを実現することに
よって、文字列の連続筆記を可能とするものである。ま
た、文字切り出しに失敗した場合にも容易に修正がで
き、ユーザに負担の少ない文字切り出し装置を実現する
ものである。
【0006】
【課題を解決するための手段】本発明の文字切り出し装
置は、筆跡データを入力する入力手段と、該入力手段で
入力された筆跡データから文字を構成する基本セグメン
トを抽出する基本セグメント抽出手段と、該基本セグメ
ント抽出手段で抽出された基本セグメントを組み合わせ
てなるストローク集合を抽出するストローク集合抽出手
段と、該ストローク集合抽出手段で抽出されたストロー
ク集合をノードとし、そのノード間をリンク接続したネ
ットワークを構成し、該ストローク集合抽出手段で抽出
されたストローク集合の文字としての評価値を前記ノー
ドの重み、前記ストローク集合間の文字間としての評価
値を前記リンクの重みとするネットワーク構成手段と、
該ネットワーク構成手段で構成されたネットワークの経
路探索することによって文字切り出し位置を決定する文
字切り出し位置決定手段を備えている。
【0007】また、本発明の文字切り出し装置は、筆跡
データを入力する入力手段と、該入力手段で入力された
筆跡データから文字を構成する基本セグメントを抽出す
る基本セグメント抽出手段と、該基本セグメント抽出手
段で抽出された基本セグメントを組み合わせてなるスト
ローク集合を抽出するストローク集合抽出手段と、該ス
トローク集合抽出手段で抽出されたストローク集合をノ
ードとし、そのノード間をリンク接続したネットワーク
を構成し、該ストローク集合抽出手段で抽出されたスト
ローク集合の文字としての評価値を前記ノードの重み、
前記ストローク集合間の文字間としての評価値を前記リ
ンクの重みとするネットワーク構成手段と、該ネットワ
ーク構成手段で構成されたネットワークの経路探索する
ことによって複数の文字切り出し位置候補と該候補の切
り出し得点を決定する文字切り出し位置候補決定手段
と、前記ストローク集合抽出手段で抽出されたストロー
ク集合に対して文字認識し、認識候補と該候補の認識得
点を得る文字認識手段と、該文字認識手段で得られた認
識候補を前記ネットワークの経路にそって組み合わせ単
語あるいは文節候補を抽出すると共に、該候補の得点を
該候補に含まれる文字に対応する前記文字認識手段での
得点に基づいて求めることによって得る言語処理手段と
を設けたものであって、前記文字切り出し位置候補決定
手段で得られた複数の文字切り出し位置候補の中から前
記文字切り出し位置候補決定手段で得られた切り出し得
点と前記言語処理手段で得られた得点に基ずいて最適な
文字切り出し位置候補を決定する最適文字切り出し位置
候補決定手段を備えている。
【0008】更に、本発明の文字切り出し装置は、筆跡
データを入力する入力手段と、該入力手段で入力された
筆跡データから文字を構成する基本セグメントを抽出す
る基本セグメント抽出手段と、該基本セグメント抽出手
段で抽出された基本セグメントを組み合わせてなるスト
ローク集合を抽出するストローク集合抽出手段と、該ス
トローク集合抽出手段で抽出されたストローク集合をノ
ードとし、そのノード間をリンク接続したネットワーク
を構成し、該ストローク集合抽出手段で抽出されたスト
ローク集合の文字としての評価値をノードの重みとし、
前記ストローク集合間の文字間としての評価値をリンク
の重みとする第1のネットワークを構成する第1ネット
ワーク構成手段と、前記ストローク集合抽出手段で抽出
されたストローク集合に対応する文字認識候補を得る文
字認識手段と、該文字認識手段で得られた文字認識候補
を前記第1のネットワークの経路にそって組み合わせて
単語あるいは文節を抽出する言語処理手段と、該言語処
理手段で抽出された単語あるいは文節の評価値をノード
の重みとし、該単語あるいは文節間の評価値をリンクの
重みとして第2のネットワークを構成する第2ネットワ
ーク構成手段と、該第2ネットワーク構成手段で構成さ
れた第2のネットワークのノードの重みに該ノードに対
応する前記第1のネットワークのノード及びリンクの重
みを加えたものを第2のネットワークのリンクの重みと
するネットワーク統合手段とを備えたものであって、前
記ネットワーク統合手段で得られたネットワークの経路
探索することによって文字切り出し位置を決定する統合
文字切り出し位置決定手段を備えたものである。
【0009】
【作用】本発明の文字切り出し装置においては、前記入
力手段で入力された筆跡データから前記基本セグメント
抽出手段で基本セグメントを抽出する。次に前記ストロ
ーク集合抽出手段で前記基本セグメントを組み合わせて
なるストローク集合を抽出する。更に、前記ネットワー
ク構成手段で前記ストローク集合をノードとし、そのノ
ード間をリンク接続したネットワークを構成し、該スト
ローク集合抽出手段で抽出されたストローク集合の文字
としての評価値を前記ノードの重み、前記ストローク集
合間の文字間としての評価値を前記リンクの重みとす
る。しかる後、前記文字切り出し位置決定手段で、前記
ネットワーク構成手段で構成されたネットワークの経路
探索することによって文字切り出し位置を決定する。
【0010】
【実施例】図1は本発明の文字切り出し装置の一実施例
の概略構成を示すブロック図である。同図において、1
は入力部であり、主にタブレットからなり、一定時間間
隔でペンの座標(x,y)、及びペンの状態(ペンアッ
プ、ペンダウン)を検出し、その筆跡データをデジタル
で入力している。2は装置全体を制御する演算処理用の
中央処理装置(以下、CPUという)を示している。3
はROMで、CPU2の制御プログラムや各種データを
格納している。4はメモリ(RAM)で、CPU2のワ
ークエリアとして使用されると共に、入力部1から入力
された筆跡データを記憶する領域をも備えている。5は
言語処理部であり、公知の言語処理プロセッサからな
り、この処理部に入力された文字列から単語あるいは文
節を言語辞書8を参照することによって抽出し、その言
語処理結果を返す。6は認識部であり、公知の文字認識
プロセッサからなり、この認識部に入力された筆跡デー
タに対して文字認識を行い認識候補(文字コード)とそ
の得点を返す。7は表示部であり、ディスプレイからな
り、入力部1から入力された筆跡データなどを表示す
る。10は内部バスであり、CPU2からのデータバ
ス、アドレスバス及び制御信号バスなどを含んでいる。
【0011】また、この構成図では入力部1と表示部7
を分けて表しているが、表示入力一体型タブレットを用
いれば一体となる。図2は本発明の文字切り出し装置の
一実施例の入力部1に文字列「本日は、」が入力された
場合のCPU2による基本セグメント、及びストローク
集合抽出方法を示している。
【0012】同図において、21には入力文字列「本日
は、」を横に並べて表示している。また22にはその入
力文字列を構成するストロークを各文字毎にまとめて表
示し、識別できるように、各ストローク間には矢印記号
を挿入している。またその矢印の指し示す位置23にそ
のストローク間の状態値が示されている。即ち、「1」
は切れることが確定している位置(以下、切り出し確定
位置という)、「0」は切れないことが確定している位
置(以下、不切り出し確定位置という)、「2」は切れ
るか切れないか確定しない位置(以下、未確定位置とい
う)である。
【0013】この状態値の算出は、OFF時間(ペンの
離れが約1cm以下の時間)が切り出し確定OFF時間
閾値(約0.5sec)を越えた場合、あるいはFAR
時間(ぺんの離れが約1cm以上の時間)が切り出し確
定FAR時間閾値(約0.0sec)を越えた場合、あ
るいはスペース幅(X方向)が切り出し確定スペース幅
閾値(約3.0mm)を越えた場合は状態値を「1」に
設定する。一方、OFF時間が不切り出し確定OFF時
間閾値(約0.1sec)より小さい場合、あるいはF
AR時間が不切り出し確定FAR時間閾値(約0.0s
ec)より小さい場合、あるいはスペース幅(X方向)
が不切り出し確定スペース幅閾値(約−1.0mm)よ
り小さい場合は状態値を「0」に設定する。それ以外の
状態では「2」を設定する。この状態値は手動で再設定
することも可能であり、その方法については後で説明す
る。
【0014】次にこの状態値に基づいて、基本セグメン
ト24を抽出する。即ち、ストローク間で切り出し確定
位置「1」(始点、終点を含む)か、あるいは未確定位
置「2」の間に含まれるストローク列を一つの基本セグ
メントとする。つまり、これより細かく切れないことを
意味する。更に、その基本セグメントを基にストローク
集合25を求める。即ち、一文字として考えられる基本
セグメントの全ての組み合わせをストローク集合として
抽出する。つまり切り出し確定位置から次の切り出し確
定位置の間で、切り出し確定位置と切り出し確定位置の
間、あるいは切り出し確定位置と未確定位置の間、ある
いは未確定位置と未確定位置の間にあるストローク列を
1つのストローク集合とする。この例では8個のストロ
ーク集合が抽出されたことになる。
【0015】但し、この例では直感的理解を容易にする
ために、ほとんどのストローク間を不切り出し確定位置
としているが実際には、未確定位置が多くなり、もっと
多くのストローク集合が抽出されることとなる。また、
閾値の値を適宜変更することも可能であるし、基本セグ
メント抽出の際に一文字を構成する文字数の制限などを
用いて更に細かく分解しても良い。
【0016】次に本発明の文字切り出し装置の一実施例
の文字切り出し特徴の統合方法について説明する。文字
切り出し特徴を評価単位という観点から以下のように分
類できる。 (1)ストローク間で評価値が定義できるもの。ストロ
ーク間隔、ペンアップ時間など (2)ストロークが集合(文字)して評価値が定義でき
るもの。
【0017】文字の大きさ(幅)、位置、形状、縦横
比、文字認識類似度など (3)ストロークの集合(文字)間で評価値が定義でき
るもの。文字ピッチなど (4)ストロークの集合が集合(単語、文節)して評価
値が定義できるもの。
【0018】単語照合など (5)ストロークの集合(単語、文節)間で評価値が定
義できるもの。単語間接続など また、このレベル以上の文字切り出し特徴も考えられる
が今回は利用していない。しかし、同じように考えるこ
とができる。
【0019】これらの特徴を統合することによって適切
な文字切り出しを実現する。 (文字切り出し特徴の統合方法1)まず、文字切り出し
特徴(1)〜(3)を統合するために図3に示す第1の
ネットワークを構成する。同図において、ネットワーク
のノードは、図2に示す8個のストローク集合25と同
じ番号同士が対応している。また、隣接するノード(ス
トローク集合)は文字間としてリンク接続されている。
そして、(1)、(2)の文字切り出し特徴(一文字ら
しさ)はノードの重みとして、(1)、(3)の特徴量
(文字間らしさ)はリンクの重みとして表される。但
し、上で挙げた文字切り出し特徴全てを用いる必要はな
いし、更に他の特徴量を用いても良いことは言うまでも
ない。例えば文字認識類似度は以下で述べる第2のネッ
トワークの単語、あるいは文節らしさの評価値を算出す
る際に用いる場合にはこの段階で用いる必要はない。
【0020】また、実際のノード、及びリンクの重みの
算出は、各ノ−ド、リンク毎に以下の特徴量を計算し、
その総和を求めることによって行う。 (一文字らしさを表す特徴量)
【0021】
【数1】
【0022】(文字間らしさを表す特徴量)
【0023】
【数2】
【0024】以上のようにして、得られたネットワーク
の経路を決定することが即ち切り出し結果である。そし
て、最適な経路を求めることが最適な切り出し結果(書
式情報のみを適用した場合における)である。経路を求
めるアルゴリズムは、一般的なものを用いているので説
明を省略する。(必要なら特開平4−92992号公報
に詳しい) (文字切り出し特徴の統合方法2)次に、文字切り出し
特徴(4)〜(5)を統合するために図4に示す第2の
ネットワークを構成する。
【0025】このネットワークでは、文字切り出し特徴
(4)の特徴量(文節らしさ)をノード、(5)の特徴量
(文節間らしさ)をリンクの重みとして表す。実際に
は、まず、上述方法で得た全てのストローク集合に対し
て、図1の認識部6で文字認識を行い、複数の認識候補
及び文字認識類似度を得る。次に、言語処理部5でその
得られた認識候補群から文字を選択し、可能な限りの単
語、あるいは文節を抽出する。抽出される文節は単語辞
書に記述された自立語だけでなく、動詞、形容詞、形容
動詞の活用語尾、及び助詞、助動詞などの付属語に対す
る処理も行う。また、抽出されたそれぞれの文節には文
字認識処理での類似度、文節長、出現頻度を基に文節評
価得点を与える。また、その文節間の結び付きの強さを
文節間評価得点で表す。
【0026】しかる後、得られた単語あるいは文節をノ
ードとし、文節評価得点をノードの重みとする。また、
その文節間をリンクとし、文節間評価得点をリンクの重
みとして表現する。この例では、図2のストローク集合
(1)の認識候補として1位より順に「本」、「占」、
「木」、(3)の認識候補として「日」、「目」、
(6)の認識候補として「は」が得られ、他のストロー
ク集合の認識結果は文節を形成しないとすると、得られ
る文節候補は、「本日は」、「日は」、「木目は」、
「目は」と残りの一文字単語の「本」、「木」となる。
これをネットワークで表すと図4が得られる。同図にお
いてノード(5)と(4)及び(3)と(6)の間の接
続は直感的理解の妨げになるので便宜上表示していない
が実際には接続されている。また認識候補の数など適宜
設定することも可能である。 (文字切り出し特徴の統合方法3)次に、上述方法で得
られた第1のネットワークと第2のネットワークを統合
する方法について説明する。
【0027】統合は図5、図6に示した処理手順で行
う。まず図5の処理について述べる。同図において、図
1の入力部1から入力された筆跡データに対して、CP
U2で以下の処理を行う。STEP1は切り出し前処理
部であり、横書き/縦書き判定、及び切り出しのための
基礎データ(標準文字ピッチ、標準文字幅、標準の文字
の大きさ、一文字の最大幅)算出を行う。
【0028】STEP2は確定切り出し処理部であり、
ストローク間の評価値により、切り出し・不切り出しが
確定する個所を求める。STEP3はネットワーク
(A)(第1のネットワークに対応する)生成部であり
上述した手順でストロークの集合をノード、隣接するス
トロークの集合間をリンクで表現したネットワークを構
成し、各切り出し特徴量をネットワーク上のノード、リ
ンクの重みとして与える。
【0029】STEP4はネットワーク(A)から切り
出し候補を求める処理部であり、ネットワーク(A)に
対するK次最短経路を求めることにより、K番目までの
切り出し候補(各々切り出し評価得点を有する)を得
る。STEP5は各切り出し候補に対してネットワーク
(B)(第2のネットワークに対応する)生成部であ
り、STEP4で得られたK番目までの各切り出し候補
に対して、ネットワーク(B)を生成する。
【0030】STEP6はネットワーク(B)より最適
文節組み合わせを求める処理部であり、STEP5で得
られたネットワーク(B)の最短経路を求めることによ
り、最適文節組み合わせ(総文節評価得点)を得る。S
TEP7はネットワーク(A)、(B)の結果を統合す
る処理部であり、STEP4で得られた各候補の切り出
し評価得点に、STEP6で得られた総文節評価得点を
加えて、最終的な切り出し結果を決定する。
【0031】以上の統合方法を図6を用いて更に詳述す
る。筆記データ「本日は」が入力された場合、STEP
2の結果として、ストローク間で切り出し確定位置(図
中、1で示す)と、未確定位置(図中、2で示す)を求
める。次に、その結果に基づいてSTEP3でネットワ
ーク(A)を生成し、STEP4でそのネットワークの
K次最短経路を求めることにより、K番目までの切り出
し候補(各々切り出し評価得点を有する)を得る。この
例では3番目まで求めており、1位から順に536点、
587点、715点という切り出し評価得点が得られて
いる。更に、STEP5でそのネットワーク(A)で得
られたK番目までの各切り出し候補に対して、ネットワ
ーク(B)を作成し、STEP6でそのネットワーク
(B)の最短経路を求めることにより、最適文節組み合
わせ(総文節評価得点)を得る。この例では上で得られ
た3つの切り出し候補に対して、それを構成する各スト
ローク集合について文字認識を行い、3位までの文字認
識結果が得られた場合であり、この結果に基づいてネッ
トワーク(B)を生成する。実際には1位から3位まで
の各文字認識結果を組み合わせてできる文節候補を全て
抽出し、その抽出された文節をノードとするネットワー
クを生成する。次にそのネットワークの最短経路を求め
る。この場合では、1位の切り出し候補については、文
節候補が抽出できず、結果なしでリジェクトされ、2位
については「本日は」639点、3位については「本き
りを」956点が得られている。
【0032】しかる後、STEP7で上で得られた言語
処理結果の得点(文字認識得点+言語処理得点)に文字
切り出し得点を加えて最終的な文字切り出し結果を決定
する。この例では2位の文字切り出し候補が最終結果と
なる。次に図7に示す統合処理について説明する。同図
において、図1の入力部1から入力された筆跡データに
対して、CPU2で以下の処理を行う。
【0033】STEP8は切り出し前処理部であり、横
書き/縦書き判定、及び切り出しのための基礎データ
(標準文字ピッチ、標準文字幅、標準の文字の大きさ、
一文字の最大幅)算出を行う。STEP9は確定切り出
し処理部であり、ストローク間の評価値により、切り出
し確定位置、及び不切り出し確定位置を求める。
【0034】STEP10はネットワーク(A)(第1
のネットワークに対応する)生成部であり、ストローク
の集合をノードで、隣接するストロークの集合間をリン
クで表現したネットワークを構成し、各切り出し特徴量
をネットワーク上のノード、リンクの重みとして与え
る。STEP11はネットワーク(B)(第2のネット
ワークに対応する)生成部であり、ストロークの集合の
集合をノードで、隣接するストロークの集合の集合間を
リンクで表現したネットワークを構成し、各切り出し特
徴量をネットワーク上のノード、リンクの重みとして与
える。
【0035】STEP12はネットワーク融合であり、
ネットワーク(A)のノード及びリンクの重みで表現さ
れた特徴量をネットワーク(B)のノードあるいはリン
クの重みとして統合する。(詳細については後で説明す
る) STEP13はネットワーク探索部であり、STEP1
2で融合し、得られたネットワークのノードの重みをリ
ンクの重みで表現するネットワーク変換を行った後で、
ネットワークの最短経路問題を解くことにより、最適な
切り出し結果を得る。
【0036】次に、図8を用いてSTEP12のネット
ワーク(A)とネットワーク(B)の統合方法について
詳述する。同図において、統合は、下位レベルのネット
ワーク(この例ではネットワーク(A))から上位レベ
ルのネットワーク(この例ではネットワーク(B))へ
順次行う。下位レベルから上位レベルへのネットワーク
の進行は、隣接するノード列の集合という概念である。
即ち、下位レベルの複数個のノードが集合して、上位レ
ベルのノードが1つ生成される。この時、下位レベルの
ネットワークのノード及びリンクの重み、即ち特徴量は
図8に示す方法で上位レベルのネットワークへ継承して
いく。上位レベルのノードの重みは、上位レベルのノ−
ドの重みにそのノードに対応する下位レベルのノード及
びリンクの重みを加えたものとする。この例では下位レ
ベルの重みWN1、WN2、WN3、WL1、WL2を元の上位レ
ベルのノードの重みに加えW’N1が得られ、WN4、WN
5、WL4を加えW’N2が得られている。また、上位レベ
ルのリンクの重みはそのリンクに対応する下位レベルの
重みを元のリンクの重みに加えることによって得られ
る。この例では下位レベルの重みWL3を元の上位レベル
の重みに加えることによってW’L1が得られ、WL3を加
えることによってW’L2が得られる。
【0037】最後に、図9を用いて確定切り出し位置を
図1の表示部7に表示し、設定あるいは修正する方法に
ついて説明する。同図において実線91、92は入力さ
れた筆跡データから抽出した確定切り出し位置である。
この例では「本」と「日」の間は正しく切り出しが行わ
れているが「日」と「は」の間は誤った切り出しが行わ
れている。そこで実線92で示した文字間を不切り出し
確定位置とし、実線93で示した位置を切り出し確定位
置と設定し直す。その方法としては例えば、消去アイコ
ン94を指示した後、ペンで対象となる実線92を指定
することによって不切り出し確定位置を設定し、追加ア
イコン95を指示した後、ペンで追加位置を指定するこ
とによって切り出し確定位置を設定する。しかる後、実
行アイコン96を指示することによって切り出し、及び
認識を行う。この消去、追加は編集記号認識を用いても
良いし、他の方法でもかまわない。
【0038】また、実線を本発明の文字切り出し装置の
結果の文字切り出し位置と見ることもでき、その場合に
は修正した位置を確定切り出し位置として再認識するこ
とも可能である。更に、ここでは、切り出し確定位置に
ついてのみ説明したが不切り出し確定位置、未確定位置
についても同様の表示、及び修正(設定)ができるもの
とする。またそれらを一緒に表示するときには記号を付
けたり、線の色、形を変えることによって区別する。
【0039】
【発明の効果】本発明の文字切り出し装置によれば、文
字切り出し特徴の適切な組み合わせを実現することによ
って、文字列の連続筆記が可能となる。また、文字切り
出しに失敗した場合にも容易に修正ができ、ユーザに負
担の少ない文字切り出し装置が実現できる。
【0040】その結果、コンピュータの文字入力の際の
ユーザの負担が著しく軽減すると共に、文書作成効率の
向上が望める。
【図面の簡単な説明】
【図1】本発明の文字切り出し装置の一実施例の概略構
成を示すブロック図。
【図2】本発明の文字切り出し装置の一実施例の基本セ
グメント、ストローク集合抽出方法を説明するための
図。
【図3】本発明の文字切り出し装置の一実施例の第1の
ネットワーク構成図。
【図4】本発明の文字切り出し装置の一実施例の第2の
ネットワーク構成図。
【図5】本発明の文字切り出し装置の一実施例のネット
ワーク統合処理を示すブロック図。
【図6】本発明の文字切り出し装置の一実施例のネット
ワーク統合処理を詳細説明するための図。
【図7】本発明の文字切り出し装置の一実施例のネット
ワーク統合処理を示すブロック図。
【図8】本発明の文字切り出し装置の一実施例のネット
ワーク統合処理の重みの統合を詳細説明するための図。
【図9】本発明の文字切り出し装置の一実施例の確定切
り出し位置の設定あるいは修正する方法について説明す
るための図。
【符号の説明】
1 入力部 2 CPU 3 ROM 4 RAM 5 言語処理部 6 認識部 7 表示部 8 言語辞書 9 認識辞書 10 内部バス

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 筆跡データを入力する入力手段と、該入
    力手段で入力された筆跡データから文字を構成する基本
    セグメントを抽出する基本セグメント抽出手段と、該基
    本セグメント抽出手段で抽出された基本セグメントを組
    み合わせてなるストローク集合を抽出するストローク集
    合抽出手段と、該ストローク集合抽出手段で抽出された
    ストローク集合をノードとし、そのノード間をリンク接
    続したネットワークを構成し、該ストローク集合抽出手
    段で抽出されたストローク集合の文字としての評価値を
    前記ノードの重み、前記ストローク集合間の文字間とし
    ての評価値を前記リンクの重みとするネットワーク構成
    手段と、該ネットワーク構成手段で構成されたネットワ
    ークの経路探索することによって文字切り出し位置を決
    定する文字切り出し位置決定手段を備えたことを特徴と
    した文字切り出し装置。
  2. 【請求項2】 筆跡データを入力する入力手段と、該入
    力手段で入力された筆跡データから文字を構成する基本
    セグメントを抽出する基本セグメント抽出手段と、該基
    本セグメント抽出手段で抽出された基本セグメントを組
    み合わせてなるストローク集合を抽出するストローク集
    合抽出手段と、該ストローク集合抽出手段で抽出された
    ストローク集合をノードとし、そのノード間をリンク接
    続したネットワークを構成し、該ストローク集合抽出手
    段で抽出されたストローク集合の文字としての評価値を
    前記ノードの重み、前記ストローク集合間の文字間とし
    ての評価値を前記リンクの重みとするネットワーク構成
    手段と、該ネットワーク構成手段で構成されたネットワ
    ークの経路探索することによって複数の文字切り出し位
    置候補と該候補の切り出し得点を決定する文字切り出し
    位置候補決定手段と、前記ストローク集合抽出手段で抽
    出されたストローク集合に対して文字認識し、認識候補
    と該候補の認識得点を得る文字認識手段と、該文字認識
    手段で得られた認識候補を前記ネットワークの経路にそ
    って組み合わせ単語あるいは文節候補を抽出すると共
    に、該候補の得点を該候補に含まれる文字に対応する前
    記文字認識手段での得点に基づいて求めることによって
    得る言語処理手段とを設けたものであって、 前記文字切り出し位置候補決定手段で得られた複数の文
    字切り出し位置候補の中から前記文字切り出し位置候補
    決定手段で得られた切り出し得点と前記言語処理手段で
    得られた得点に基ずいて最適な文字切り出し位置候補を
    決定する最適文字切り出し位置候補決定手段を備えたこ
    とを特徴とした文字切り出し装置。
  3. 【請求項3】 筆跡データを入力する入力手段と、該入
    力手段で入力された筆跡データから文字を構成する基本
    セグメントを抽出する基本セグメント抽出手段と、該基
    本セグメント抽出手段で抽出された基本セグメントを組
    み合わせてなるストローク集合を抽出するストローク集
    合抽出手段と、該ストローク集合抽出手段で抽出された
    ストローク集合をノードとし、そのノード間をリンク接
    続したネットワークを構成し、該ストローク集合抽出手
    段で抽出されたストローク集合の文字としての評価値を
    ノードの重みとし、前記ストローク集合間の文字間とし
    ての評価値をリンクの重みとする第1のネットワークを
    構成する第1ネットワーク構成手段と、前記ストローク
    集合抽出手段で抽出されたストローク集合に対応する文
    字認識候補を得る文字認識手段と、該文字認識手段で得
    られた文字認識候補を前記第1のネットワークの経路に
    そって組み合わせて単語あるいは文節を抽出する言語処
    理手段と、該言語処理手段で抽出された単語あるいは文
    節の評価値をノードの重みとし、該単語あるいは文節間
    の評価値をリンクの重みとして第2のネットワークを構
    成する第2ネットワーク構成手段と、該第2ネットワー
    ク構成手段で構成された第2のネットワークのノードの
    重みに該ノードに対応する前記第1のネットワークのノ
    ード及びリンクの重みを加えたものを第2のネットワー
    クのノードの重みとし、前記第2のネットワークのリン
    クの重みに該リンクに対応する前記第1のネットワーク
    のリンクの重みを加えたものを第2のネットワークのリ
    ンクの重みとするネットワーク統合手段とを備えたもの
    であって、 前記ネットワーク統合手段で得られたネットワークの経
    路探索することによって文字切り出し位置を決定する統
    合文字切り出し位置決定手段を備えたことを特徴とした
    文字切り出し装置。
  4. 【請求項4】 前記ネットワーク統合手段は、前記入力
    手段で入力された筆跡データがひらがなあるいはカタカ
    ナ列で構成されていると前記文字認識手段で得られた文
    字認識結果、あるいは入力ストロークの数及び位置から
    判明した場合には第1のネットワークの重みを第2のネ
    ットワークの重みより優先して統合することを特徴とし
    た請求項3記載の文字切り出し装置。
  5. 【請求項5】 前記基本セグメント抽出手段は、短いス
    トロークに対応する基本セグメントを位置関係に基づき
    他の基本セグメントと融合することを特徴とした請求項
    1、2、3記載の文字切り出し装置。
  6. 【請求項6】 前記基本セグメント抽出手段は、OFF
    時間あるいはFAR時間あるいはスペース幅が第1の閾
    値を越えたストローク間、及び前記筆跡データの先頭、
    及び末尾の位置を切り出し確定位置とし、OFF時間あ
    るいはFAR時間あるいはスペース幅が第2の閾値を越
    えたストローク間を不切り出し確定位置とし、それ以外
    のストローク間を未確定位置と決定するストローク間属
    性決定手段と、該ストローク間属性決定手段で決定され
    た切り出し確定位置から次の切り出し確定位置あるいは
    未確定位置間、または未確定位置から次の切り出し確定
    位置あるいは未確定位置間を基本セグメントとして決定
    する基本セグメント決定手段とからなることを特徴とし
    た請求項1、2、3記載の文字切り出し装置。
  7. 【請求項7】 前記切り出し確定位置、あるいは前記不
    切り出し確定位置を手動で設定することを可能としたこ
    とを特徴とした請求項6記載の文字切り出し装置。
  8. 【請求項8】 文字及び、線分あるいは記号を表示可能
    な表示手段を設け、前記切り出し確定位置あるいは不切
    り出し確定位置あるいは未確定位置を前記表示手段に表
    示された前記筆跡データの対応する位置に線分あるいは
    記号あるいは文字を使って印を付ける手段か、または前
    記文字切り出し位置決定手段あるいは最適文字切り出し
    位置候補決定手段あるいは前記統合文字切り出し位置決
    定手段で得られた文字切り出し位置に印を付ける手段を
    備えたことを特徴とした請求項1、2、3記載の文字切
    り出し装置。
  9. 【請求項9】 文字及び、線分あるいは記号を表示可能
    な表示手段を設け、前記切り出し確定位置あるいは不切
    り出し確定位置あるいは未確定位置を前記表示手段に表
    示された前記筆跡データの対応する位置に線分あるいは
    記号あるいは文字を使って印を付ける手段か、または前
    記文字切り出し位置決定手段あるいは最適文字切り出し
    位置候補決定手段あるいは前記統合文字切り出し位置決
    定手段で得られた文字切り出し位置に印を付ける手段を
    備えたことを特徴とした請求項1、2、3記載の文字切
    り出し装置。
  10. 【請求項10】 前記ストローク集合抽出手段は、前記
    切り出し確定位置から次の切り出し確定位置の間で、切
    り出し確定位置と切り出し確定位置の間あるいは切り出
    し確定位置と未確定切り出し位置の間あるいは未確定切
    り出し位置と未確定切り出し位置の間に含まれるストロ
    ークを1つのストローク集合として決定するストローク
    集合決定手段からなることを特徴とした請求項1、2、
    3記載の文字切り出し装置。
  11. 【請求項11】 筆跡データを入力する入力手段と、該
    入力手段で入力された筆跡データから文字切り出し候補
    位置を抽出する文字切り出し候補位置抽出手段と、該文
    字切り出し候補位置抽出手段で抽出された文字切り出し
    候補位置に基づいて各文字毎に対応するストローク列を
    文字認識する文字認識手段と、前記入力手段で入力され
    た筆跡データあるいは前記文字認識手段の認識結果、及
    び線分を表示することを可能とした表示手段とを備えた
    ものであって、 前記表示手段で前記文字切り出し候補位置を示す印を前
    記筆跡データの対応する位置に付けることを特徴とした
    文字切り出し装置。
  12. 【請求項12】 前記印の位置を変更、消去、追加する
    手段を設け、その位置を文字切り出し候補位置として再
    切り出し処理を行うことを可能とした請求項11記載の
    文字切り出し装置。
JP4274265A 1992-10-13 1992-10-13 文字切り出し装置 Expired - Fee Related JP2940747B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4274265A JP2940747B2 (ja) 1992-10-13 1992-10-13 文字切り出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4274265A JP2940747B2 (ja) 1992-10-13 1992-10-13 文字切り出し装置

Publications (2)

Publication Number Publication Date
JPH06124364A true JPH06124364A (ja) 1994-05-06
JP2940747B2 JP2940747B2 (ja) 1999-08-25

Family

ID=17539264

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4274265A Expired - Fee Related JP2940747B2 (ja) 1992-10-13 1992-10-13 文字切り出し装置

Country Status (1)

Country Link
JP (1) JP2940747B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6519363B1 (en) 1999-01-13 2003-02-11 International Business Machines Corporation Method and system for automatically segmenting and recognizing handwritten Chinese characters
JP2010039609A (ja) * 2008-08-01 2010-02-18 Tokyo Univ Of Agriculture & Technology プログラム、情報記憶媒体及び文字列認識装置
JP2013186906A (ja) * 2012-03-09 2013-09-19 Fujitsu Ltd 画像中の文字列を認識する方法及び装置
US9171218B2 (en) 2011-11-24 2015-10-27 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and computer readable medium that recognize overlapping elements in handwritten input
JP2017531262A (ja) * 2014-09-16 2017-10-19 アイフライテック カンパニー, リミテッドIflytek Co., Ltd. 記述式問題のための知的採点方法およびシステム
JP2020013460A (ja) * 2018-07-20 2020-01-23 富士通株式会社 情報処理装置、文字認識方法、および文字認識プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6519363B1 (en) 1999-01-13 2003-02-11 International Business Machines Corporation Method and system for automatically segmenting and recognizing handwritten Chinese characters
US6665436B2 (en) 1999-01-13 2003-12-16 International Business Machines Corporation Method and system for automatically segmenting and recognizing handwritten chinese characters
JP2010039609A (ja) * 2008-08-01 2010-02-18 Tokyo Univ Of Agriculture & Technology プログラム、情報記憶媒体及び文字列認識装置
US9171218B2 (en) 2011-11-24 2015-10-27 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and computer readable medium that recognize overlapping elements in handwritten input
JP2013186906A (ja) * 2012-03-09 2013-09-19 Fujitsu Ltd 画像中の文字列を認識する方法及び装置
JP2017531262A (ja) * 2014-09-16 2017-10-19 アイフライテック カンパニー, リミテッドIflytek Co., Ltd. 記述式問題のための知的採点方法およびシステム
US10339428B2 (en) 2014-09-16 2019-07-02 Iflytek Co., Ltd. Intelligent scoring method and system for text objective question
JP2020013460A (ja) * 2018-07-20 2020-01-23 富士通株式会社 情報処理装置、文字認識方法、および文字認識プログラム

Also Published As

Publication number Publication date
JP2940747B2 (ja) 1999-08-25

Similar Documents

Publication Publication Date Title
EP0844583B1 (en) Method and apparatus for character recognition
JP3425408B2 (ja) 文書読取装置
JP2009026287A (ja) 文字画像抽出装置および文字画像抽出方法
KR20070110399A (ko) 인식 그래프
JPH06124364A (ja) 文字切り出し装置
JP3216800B2 (ja) 手書き文字認識方法
JP2002063548A (ja) 手書き文字認識方法
WO2000036530A1 (fr) Methode de recherche et dispositif correspondant, support enregistre
JP3309174B2 (ja) 文字認識方法及び装置
JP2003331214A (ja) 文字認識誤り訂正方法、装置及びプログラム
JP3419251B2 (ja) 文字認識装置及び文字認識方法
JPH09274645A (ja) 文字認識方法および装置
JPH07141472A (ja) 文字列認識装置
CN109376339B (zh) 一种基于用户行为的文本转换候选规则信息提取方法
JP3548372B2 (ja) 文字認識装置
JP3442548B2 (ja) 文字認識方法および装置
JPH07271921A (ja) 文字認識装置および文字認識方法
JP3075808B2 (ja) 文書処理装置
JP2882327B2 (ja) 線図形整合装置
JPH0651900A (ja) オンライン文字入力装置
JP3444561B2 (ja) 文字認識方法及び文字認識装置
JPH0944599A (ja) 情報処理装置及び方法
JPH11203406A (ja) 文字切り出し方法、文字認識方法、文字認識装置および記録媒体
JPS6330991A (ja) 文字認識装置
CN113901795A (zh) 基于行为数据统计的中文拼写纠错方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080618

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090618

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees