JP2940747B2 - 文字切り出し装置 - Google Patents

文字切り出し装置

Info

Publication number
JP2940747B2
JP2940747B2 JP4274265A JP27426592A JP2940747B2 JP 2940747 B2 JP2940747 B2 JP 2940747B2 JP 4274265 A JP4274265 A JP 4274265A JP 27426592 A JP27426592 A JP 27426592A JP 2940747 B2 JP2940747 B2 JP 2940747B2
Authority
JP
Japan
Prior art keywords
character
network
cutout
stroke
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4274265A
Other languages
English (en)
Other versions
JPH06124364A (ja
Inventor
英人 山本
正義 岡本
隆敏 吉川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Denki Co Ltd
Original Assignee
Sanyo Denki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Denki Co Ltd filed Critical Sanyo Denki Co Ltd
Priority to JP4274265A priority Critical patent/JP2940747B2/ja
Publication of JPH06124364A publication Critical patent/JPH06124364A/ja
Application granted granted Critical
Publication of JP2940747B2 publication Critical patent/JP2940747B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、連続筆記された文字列
を認識し、各文字に対応する文字コードを得る文字認識
装置に適用される文字切り出し装置に関する。
【0002】
【従来の技術】近年、日本語文字認識技術の研究の成果
として、手書き入力を行える装置が商品化されている。
しかし、それらは一文字ずつの枠を設けるなど筆記文字
列から正確に文字が切り出されることを前提としてい
る。しかし、より自由度の高い手書き入力を実現するた
めには、一文字ずつの枠が存在しない領域に連続して筆
記された文字列を認識できることが不可欠である。この
実現には、筆記文字列から一文字ずつを分離する文字切
り出し技術が必要となる。
【0003】この種の装置としては、ストローク間隔、
ペンアップ時間、文字の大きさ、位置、形状、縦横比、
文字ピッチなどの文字切り出し特徴を用いて行うのが一
般的である。また最近では、電子情報通信学会論文誌
(D)、J68−D、4、PP.765−772(19
85)記載のもののように言語情報を切り出し特徴とし
て用いたものもあり、これらの切り出し特徴が文字切り
出しに有効であることは分かっている。しかし、それら
の切り出し特徴をどのように組み合わせて用いれば最も
有効であるかは明らかにされていない。
【0004】また、文字切り出しに失敗した場合の対処
については、誤認識した文字を書き直すことで対処して
いる。しかし、例えば1行単位の文字列を処理する場合
に、誤った文字全てを書き直すのは非常に苦痛である。
また、多くの場合には文字間の位置さえ確実に分かれば
正確な認識結果が得られるケースが多数ある。そこで文
字切り出し位置を手動で簡単に修正できる手段が必要と
なる。また、個人対応化についての研究も盛んに行われ
ており(例えば電子情報通信論文誌(D−2)、J72
−D−2、PP.132−139(1989)記載のも
の)、その個人筆記特性抽出にその切り出し位置の修正
をどのようにしたかという情報も使える可能性がある。
【0005】
【発明が解決しようとする課題】本発明の文字切り出し
装置は、上述の実情を考慮してなされたものであって、
文字切り出し特徴の適切な組み合わせを実現することに
よって、文字列の連続筆記を可能とするものである。ま
た、文字切り出しに失敗した場合にも容易に修正がで
き、ユーザに負担の少ない文字切り出し装置を実現する
ものである。
【0006】
【課題を解決するための手段】本発明の文字切り出し装
置は、筆跡データを入力する入力手段と、該入力手段で
入力された筆跡データから文字を構成する基本セグメン
トを抽出する基本セグメント抽出手段と、該基本セグメ
ント抽出手段で抽出された基本セグメントを組み合わせ
てなるストローク集合を抽出するストローク集合抽出手
段と、該ストローク集合抽出手段で抽出されたストロー
ク集合をノードとし、そのノード間をリンク接続したネ
ットワークを構成し、該ストローク集合抽出手段で抽出
されたストローク集合の文字としての評価値を前記ノー
ドの重み、前記ストローク集合間の文字間としての評価
値を前記リンクの重みとするネットワーク構成手段と、
該ネットワーク構成手段で構成されたネットワークの経
路探索することによって文字切り出し位置を決定する文
字切り出し位置決定手段を備えている。
【0007】また、本発明の文字切り出し装置は、筆跡
データを入力する入力手段と、該入力手段で入力された
筆跡データから文字を構成する基本セグメントを抽出す
る基本セグメント抽出手段と、該基本セグメント抽出手
段で抽出された基本セグメントを組み合わせてなるスト
ローク集合を抽出するストローク集合抽出手段と、該ス
トローク集合抽出手段で抽出されたストローク集合をノ
ードとし、そのノード間をリンク接続したネットワーク
を構成し、該ストローク集合抽出手段で抽出されたスト
ローク集合の文字としての評価値を前記ノードの重み、
前記ストローク集合間の文字間としての評価値を前記リ
ンクの重みとするネットワーク構成手段と、該ネットワ
ーク構成手段で構成されたネットワークの経路探索する
ことによって複数の文字切り出し位置候補と該候補の切
り出し得点を決定する文字切り出し位置候補決定手段
と、前記ストローク集合抽出手段で抽出されたストロー
ク集合に対して文字認識し、認識候補と該候補の認識得
点を得る文字認識手段と、該文字認識手段で得られた認
識候補を前記ネットワークの経路にそって組み合わせ単
語あるいは文節候補を抽出すると共に、該候補の得点を
該候補に含まれる文字に対応する前記文字認識手段での
得点に基づいて求めることによって得る言語処理手段と
を設けたものであって、前記文字切り出し位置候補決定
手段で得られた複数の文字切り出し位置候補の中から前
記文字切り出し位置候補決定手段で得られた切り出し得
点と前記言語処理手段で得られた得点に基ずいて最適な
文字切り出し位置候補を決定する最適文字切り出し位置
候補決定手段を備えている。
【0008】更に、本発明の文字切り出し装置は、筆跡
データを入力する入力手段と、該入力手段で入力された
筆跡データから文字を構成する基本セグメントを抽出す
る基本セグメント抽出手段と、該基本セグメント抽出手
段で抽出された基本セグメントを組み合わせてなるスト
ローク集合を抽出するストローク集合抽出手段と、該ス
トローク集合抽出手段で抽出されたストローク集合をノ
ードとし、そのノード間をリンク接続したネットワーク
を構成し、該ストローク集合抽出手段で抽出されたスト
ローク集合の文字としての評価値をノードの重みとし、
前記ストローク集合間の文字間としての評価値をリンク
の重みとする第1のネットワークを構成する第1ネット
ワーク構成手段と、前記ストローク集合抽出手段で抽出
されたストローク集合に対応する文字認識候補を得る文
字認識手段と、該文字認識手段で得られた文字認識候補
を前記第1のネットワークの経路にそって組み合わせて
単語あるいは文節を抽出する言語処理手段と、該言語処
理手段で抽出された単語あるいは文節の評価値をノード
の重みとし、該単語あるいは文節間の評価値をリンクの
重みとして第2のネットワークを構成する第2ネットワ
ーク構成手段と、該第2ネットワーク構成手段で構成さ
れた第2のネットワークのノードの重みに該ノードに対
応する前記第1のネットワークのノード及びリンクの重
みを加えたものを第2のネットワークのリンクの重みと
するネットワーク統合手段とを備えたものであって、前
記ネットワーク統合手段で得られたネットワークの経路
探索することによって文字切り出し位置を決定する統合
文字切り出し位置決定手段を備えたものである。
【0009】
【作用】本発明の文字切り出し装置においては、前記入
力手段で入力された筆跡データから前記基本セグメント
抽出手段で基本セグメントを抽出する。次に前記ストロ
ーク集合抽出手段で前記基本セグメントを組み合わせて
なるストローク集合を抽出する。更に、前記ネットワー
ク構成手段で前記ストローク集合をノードとし、そのノ
ード間をリンク接続したネットワークを構成し、該スト
ローク集合抽出手段で抽出されたストローク集合の文字
としての評価値を前記ノードの重み、前記ストローク集
合間の文字間としての評価値を前記リンクの重みとす
る。しかる後、前記文字切り出し位置決定手段で、前記
ネットワーク構成手段で構成されたネットワークの経路
探索することによって文字切り出し位置を決定する。
【0010】
【実施例】図1は本発明の文字切り出し装置の一実施例
の概略構成を示すブロック図である。同図において、1
は入力部であり、主にタブレットからなり、一定時間間
隔でペンの座標(x,y)、及びペンの状態(ペンアッ
プ、ペンダウン)を検出し、その筆跡データをデジタル
で入力している。2は装置全体を制御する演算処理用の
中央処理装置(以下、CPUという)を示している。3
はROMで、CPU2の制御プログラムや各種データを
格納している。4はメモリ(RAM)で、CPU2のワ
ークエリアとして使用されると共に、入力部1から入力
された筆跡データを記憶する領域をも備えている。5は
言語処理部であり、公知の言語処理プロセッサからな
り、この処理部に入力された文字列から単語あるいは文
節を言語辞書8を参照することによって抽出し、その言
語処理結果を返す。6は認識部であり、公知の文字認識
プロセッサからなり、この認識部に入力された筆跡デー
タに対して文字認識を行い認識候補(文字コード)とそ
の得点を返す。7は表示部であり、ディスプレイからな
り、入力部1から入力された筆跡データなどを表示す
る。10は内部バスであり、CPU2からのデータバ
ス、アドレスバス及び制御信号バスなどを含んでいる。
【0011】また、この構成図では入力部1と表示部7
を分けて表しているが、表示入力一体型タブレットを用
いれば一体となる。図2は本発明の文字切り出し装置の
一実施例の入力部1に文字列「本日は、」が入力された
場合のCPU2による基本セグメント、及びストローク
集合抽出方法を示している。
【0012】同図において、21には入力文字列「本日
は、」を横に並べて表示している。また22にはその入
力文字列を構成するストロークを各文字毎にまとめて表
示し、識別できるように、各ストローク間には矢印記号
を挿入している。またその矢印の指し示す位置23にそ
のストローク間の状態値が示されている。即ち、「1」
は切れることが確定している位置(以下、切り出し確定
位置という)、「0」は切れないことが確定している位
置(以下、不切り出し確定位置という)、「2」は切れ
るか切れないか確定しない位置(以下、未確定位置とい
う)である。
【0013】この状態値の算出は、OFF時間(ペンの
離れが約1cm以下の時間)が切り出し確定OFF時間
閾値(約0.5sec)を越えた場合、あるいはFAR
時間(ぺんの離れが約1cm以上の時間)が切り出し確
定FAR時間閾値(約0.0sec)を越えた場合、あ
るいはスペース幅(X方向)が切り出し確定スペース幅
閾値(約3.0mm)を越えた場合は状態値を「1」に
設定する。一方、OFF時間が不切り出し確定OFF時
間閾値(約0.1sec)より小さい場合、あるいはF
AR時間が不切り出し確定FAR時間閾値(約0.0s
ec)より小さい場合、あるいはスペース幅(X方向)
が不切り出し確定スペース幅閾値(約−1.0mm)よ
り小さい場合は状態値を「0」に設定する。それ以外の
状態では「2」を設定する。この状態値は手動で再設定
することも可能であり、その方法については後で説明す
る。
【0014】次にこの状態値に基づいて、基本セグメン
ト24を抽出する。即ち、ストローク間で切り出し確定
位置「1」(始点、終点を含む)か、あるいは未確定位
置「2」の間に含まれるストローク列を一つの基本セグ
メントとする。つまり、これより細かく切れないことを
意味する。更に、その基本セグメントを基にストローク
集合25を求める。即ち、一文字として考えられる基本
セグメントの全ての組み合わせをストローク集合として
抽出する。つまり切り出し確定位置から次の切り出し確
定位置の間で、切り出し確定位置と切り出し確定位置の
間、あるいは切り出し確定位置と未確定位置の間、ある
いは未確定位置と未確定位置の間にあるストローク列を
1つのストローク集合とする。この例では8個のストロ
ーク集合が抽出されたことになる。
【0015】但し、この例では直感的理解を容易にする
ために、ほとんどのストローク間を不切り出し確定位置
としているが実際には、未確定位置が多くなり、もっと
多くのストローク集合が抽出されることとなる。また、
閾値の値を適宜変更することも可能であるし、基本セグ
メント抽出の際に一文字を構成するストローク数の制限
などを用いて更に細かく分解しても良い。
【0016】次に本発明の文字切り出し装置の一実施例
の文字切り出し特徴の統合方法について説明する。文字
切り出し特徴を評価単位という観点から以下のように分
類できる。 (1)ストローク間で評価値が定義できるもの。ストロ
ーク間隔、ペンアップ時間など (2)ストロークが集合(文字)して評価値が定義でき
るもの。
【0017】文字の大きさ(幅)、位置、形状、縦横
比、文字認識類似度など (3)ストロークの集合(文字)間で評価値が定義でき
るもの。文字ピッチなど (4)ストロークの集合が集合(単語、文節)して評価
値が定義できるもの。
【0018】単語照合など (5)ストロークの集合(単語、文節)間で評価値が定
義できるもの。単語間接続など また、このレベル以上の文字切り出し特徴も考えられる
が今回は利用していない。しかし、同じように考えるこ
とができる。
【0019】これらの特徴を統合することによって適切
な文字切り出しを実現する。 (文字切り出し特徴の統合方法1)まず、文字切り出し
特徴(1)〜(3)を統合するために図3に示す第1の
ネットワークを構成する。同図において、ネットワーク
のノードは、図2に示す8個のストローク集合25と同
じ番号同士が対応している。また、隣接するノード(ス
トローク集合)は文字間としてリンク接続されている。
そして、(1)、(2)の文字切り出し特徴(一文字ら
しさ)はノードの重みとして、(1)、(3)の特徴量
(文字間らしさ)はリンクの重みとして表される。但
し、上で挙げた文字切り出し特徴全てを用いる必要はな
いし、更に他の特徴量を用いても良いことは言うまでも
ない。例えば文字認識類似度は以下で述べる第2のネッ
トワークの単語、あるいは文節らしさの評価値を算出す
る際に用いる場合にはこの段階で用いる必要はない。
【0020】また、実際のノード、及びリンクの重みの
算出は、各ノ−ド、リンク毎に以下の特徴量を計算し、
その総和を求めることによって行う。ここで、文字列の
高さは、例えば、その文字列を囲み外接する矩形枠の高
さとして算出することができる。また、文字幅を算出す
る際に文字列の高さに乗算される定数は、文字の高さに
対する標準的な文字の幅を比率で規定したものである
(文字の標準的な縦横比)。さらに、文字の大きさ(文
字を囲み外接する矩形の面積)を算出する際に文字列の
高さに乗算される定数は、文字の高さに対する標準的な
文字の大きさを比率で規定したものである。これらの標
準的な比率は、通常の統計的データを得る場合と同様、
複数の人が実際に筆記したサンプルデータを平均化する
ことにより得られる。(一文字らしさを表す特徴量)
【0021】
【数1】
【0022】(文字間らしさを表す特徴量)
【0023】
【数2】
【0024】以上のようにして、得られたネットワーク
の経路を決定することが即ち切り出し結果である。そし
て、最適な経路を求めることが最適な切り出し結果(書
式情報のみを適用した場合における)である。経路を求
めるアルゴリズムは、一般的なものを用いているので説
明を省略する。(必要なら特開平4−92992号公報
に詳しい) (文字切り出し特徴の統合方法2)次に、文字切り出し
特徴(4)〜(5)を統合するために図4に示す第2の
ネットワークを構成する。
【0025】このネットワークでは、文字切り出し特徴
(4)の特徴量(文節らしさ)をノード、(5)の特徴量
(文節間らしさ)をリンクの重みとして表す。実際に
は、まず、上述方法で得た全てのストローク集合に対し
て、図1の認識部6で文字認識を行い、複数の認識候補
及び文字認識類似度を得る。次に、言語処理部5でその
得られた認識候補群から文字を選択し、可能な限りの単
語、あるいは文節を抽出する。抽出される文節は単語辞
書に記述された自立語だけでなく、動詞、形容詞、形容
動詞の活用語尾、及び助詞、助動詞などの付属語に対す
る処理も行う。また、抽出されたそれぞれの文節には文
字認識処理での類似度、文節長、出現頻度を基に文節評
価得点を与える。また、その文節間の結び付きの強さを
文節間評価得点で表す。
【0026】しかる後、得られた単語あるいは文節をノ
ードとし、文節評価得点をノードの重みとする。また、
その文節間をリンクとし、文節間評価得点をリンクの重
みとして表現する。この例では、図2のストローク集合
(1)の認識候補として1位より順に「本」、「占」、
「木」、(2)の認識候補として「日」、「目」、
(5)の認識候補として「は」が得られ、他のストロー
ク集合の認識結果は文節を形成しないとすると、得られ
る文節候補は、「本日は」、「日は」、「木目は」、
「目は」と残りの一文字単語の「本」、「木」となる。
これをネットワークで表すと図4が得られる。同図にお
いてノード(5)と(4)及び(3)と(6)の間の接
続は直感的理解の妨げになるので便宜上表示していない
が実際には接続されている。また認識候補の数など適宜
設定することも可能である。 (文字切り出し特徴の統合方法3) 次に、上述方法で得られた第1のネットワークと第2の
ネットワークを統合する方法について説明する。
【0027】統合は図5、図6に示した処理手順で行
う。まず図5の処理について述べる。同図において、図
1の入力部1から入力された筆跡データに対して、CP
U2で以下の処理を行う。STEP1は切り出し前処理
部であり、横書き/縦書き判定、及び切り出しのための
基礎データ(標準文字ピッチ、標準文字幅、標準の文字
の大きさ、一文字の最大幅)算出を行う。
【0028】STEP2は確定切り出し処理部であり、
ストローク間の評価値により、切り出し・不切り出しが
確定する個所を求める。STEP3はネットワーク
(A)(第1のネットワークに対応する)生成部であり
上述した手順でストロークの集合をノード、隣接するス
トロークの集合間をリンクで表現したネットワークを構
成し、各切り出し特徴量をネットワーク上のノード、リ
ンクの重みとして与える。
【0029】STEP4はネットワーク(A)から切り
出し候補を求める処理部であり、ネットワーク(A)に
対するK次最短経路を求めることにより、K番目までの
切り出し候補(各々切り出し評価得点を有する)を得
る。STEP5は各切り出し候補に対してネットワーク
(B)(第2のネットワークに対応する)生成部であ
り、STEP4で得られたK番目までの各切り出し候補
に対して、ネットワーク(B)を生成する。
【0030】STEP6はネットワーク(B)より最適
文節組み合わせを求める処理部であり、STEP5で得
られたネットワーク(B)の最短経路を求めることによ
り、最適文節組み合わせ(総文節評価得点)を得る。S
TEP7はネットワーク(A)、(B)の結果を統合す
る処理部であり、STEP4で得られた各候補の切り出
し評価得点に、STEP6で得られた総文節評価得点を
加えて、最終的な切り出し結果を決定する。
【0031】以上の統合方法を図6を用いて更に詳述す
る。筆記データ「本日は」が入力された場合、STEP
2の結果として、ストローク間で切り出し確定位置(図
中、1で示す)と、未確定位置(図中、2で示す)を求
める。次に、その結果に基づいてSTEP3でネットワ
ーク(A)を生成し、STEP4でそのネットワークの
K次最短経路を求めることにより、K番目までの切り出
し候補(各々切り出し評価得点を有する)を得る。この
例では3番目まで求めており、1位から順に536点、
587点、715点という切り出し評価得点が得られて
いる。更に、STEP5でそのネットワーク(A)で得
られたK番目までの各切り出し候補に対して、ネットワ
ーク(B)を作成し、STEP6でそのネットワーク
(B)の最短経路を求めることにより、最適文節組み合
わせ(総文節評価得点)を得る。この例では上で得られ
た3つの切り出し候補に対して、それを構成する各スト
ローク集合について文字認識を行い、3位までの文字認
識結果が得られた場合であり、この結果に基づいてネッ
トワーク(B)を生成する。実際には1位から3位まで
の各文字認識結果を組み合わせてできる文節候補を全て
抽出し、その抽出された文節をノードとするネットワー
クを生成する。次にそのネットワークの最短経路を求め
る。この場合では、1位の切り出し候補については、文
節候補が抽出できず、結果なしでリジェクトされ、2位
については「本日は」639点、3位については「本き
りを」956点が得られている。
【0032】しかる後、STEP7で上で得られた言語
処理結果の得点(文字認識得点+言語処理得点)に文字
切り出し得点を加えて最終的な文字切り出し結果を決定
する。この例では2位の文字切り出し候補が最終結果と
なる。次に図7に示す統合処理について説明する。同図
において、図1の入力部1から入力された筆跡データに
対して、CPU2で以下の処理を行う。
【0033】STEP8は切り出し前処理部であり、横
書き/縦書き判定、及び切り出しのための基礎データ
(標準文字ピッチ、標準文字幅、標準の文字の大きさ、
一文字の最大幅)算出を行う。STEP9は確定切り出
し処理部であり、ストローク間の評価値により、切り出
し確定位置、及び不切り出し確定位置を求める。
【0034】STEP10はネットワーク(A)(第1
のネットワークに対応する)生成部であり、ストローク
の集合をノードで、隣接するストロークの集合間をリン
クで表現したネットワークを構成し、各切り出し特徴量
をネットワーク上のノード、リンクの重みとして与え
る。STEP11はネットワーク(B)(第2のネット
ワークに対応する)生成部であり、ストロークの集合の
集合をノードで、隣接するストロークの集合の集合間を
リンクで表現したネットワークを構成し、各切り出し特
徴量をネットワーク上のノード、リンクの重みとして与
える。
【0035】STEP12はネットワーク融合であり、
ネットワーク(A)のノード及びリンクの重みで表現さ
れた特徴量をネットワーク(B)のノードあるいはリン
クの重みとして統合する。(詳細については後で説明す
る) STEP13はネットワーク探索部であり、STEP1
2で融合し、得られたネットワークのノードの重みをリ
ンクの重みで表現するネットワーク変換を行った後で、
ネットワークの最短経路問題を解くことにより、最適な
切り出し結果を得る。
【0036】次に、図8を用いてSTEP12のネット
ワーク(A)とネットワーク(B)の統合方法について
詳述する。同図において、統合は、下位レベルのネット
ワーク(この例ではネットワーク(A))から上位レベ
ルのネットワーク(この例ではネットワーク(B))へ
順次行う。下位レベルから上位レベルへのネットワーク
の進行は、隣接するノード列の集合という概念である。
即ち、下位レベルの複数個のノードが集合して、上位レ
ベルのノードが1つ生成される。この時、下位レベルの
ネットワークのノード及びリンクの重み、即ち特徴量は
図8に示す方法で上位レベルのネットワークへ継承して
いく。上位レベルのノードの重みは、上位レベルのノ−
ドの重みにそのノードに対応する下位レベルのノード及
びリンクの重みを加えたものとする。この例では下位レ
ベルの重みWN1、WN2、WN3、WL1、WL2を元の上位レ
ベルのノードの重みに加えW’N1が得られ、WN4、WN
5、WL4を加えW’N2が得られている。また、上位レベ
ルのリンクの重みはそのリンクに対応する下位レベルの
重みを元のリンクの重みに加えることによって得られ
る。この例では下位レベルの重みWL3を元の上位レベル
の重みに加えることによってW’L1が得られ、WL3を加
えることによってW’L2が得られる。
【0037】最後に、図9を用いて確定切り出し位置を
図1の表示部7に表示し、設定あるいは修正する方法に
ついて説明する。同図において実線91、92は入力さ
れた筆跡データから抽出した確定切り出し位置である。
この例では「本」と「日」の間は正しく切り出しが行わ
れているが「日」と「は」の間は誤った切り出しが行わ
れている。そこで実線92で示した文字間を不切り出し
確定位置とし、実線93で示した位置を切り出し確定位
置と設定し直す。その方法としては例えば、消去アイコ
ン94を指示した後、ペンで対象となる実線92を指定
することによって不切り出し確定位置を設定し、追加ア
イコン95を指示した後、ペンで追加位置を指定するこ
とによって切り出し確定位置を設定する。しかる後、実
行アイコン96を指示することによって切り出し、及び
認識を行う。この消去、追加は編集記号認識を用いても
良いし、他の方法でもかまわない。
【0038】また、実線を本発明の文字切り出し装置の
結果の文字切り出し位置と見ることもでき、その場合に
は修正した位置を確定切り出し位置として再認識するこ
とも可能である。更に、ここでは、切り出し確定位置に
ついてのみ説明したが不切り出し確定位置、未確定位置
についても同様の表示、及び修正(設定)ができるもの
とする。またそれらを一緒に表示するときには記号を付
けたり、線の色、形を変えることによって区別する。
【0039】
【発明の効果】本発明の文字切り出し装置によれば、文
字切り出し特徴の適切な組み合わせを実現することによ
って、文字列の連続筆記が可能となる。また、文字切り
出しに失敗した場合にも容易に修正ができ、ユーザに負
担の少ない文字切り出し装置が実現できる。
【0040】その結果、コンピュータの文字入力の際の
ユーザの負担が著しく軽減すると共に、文書作成効率の
向上が望める。
【図面の簡単な説明】
【図1】本発明の文字切り出し装置の一実施例の概略構
成を示すブロック図。
【図2】本発明の文字切り出し装置の一実施例の基本セ
グメント、ストローク集合抽出方法を説明するための
図。
【図3】本発明の文字切り出し装置の一実施例の第1の
ネットワーク構成図。
【図4】本発明の文字切り出し装置の一実施例の第2の
ネットワーク構成図。
【図5】本発明の文字切り出し装置の一実施例のネット
ワーク統合処理を示すブロック図。
【図6】本発明の文字切り出し装置の一実施例のネット
ワーク統合処理を詳細説明するための図。
【図7】本発明の文字切り出し装置の一実施例のネット
ワーク統合処理を示すブロック図。
【図8】本発明の文字切り出し装置の一実施例のネット
ワーク統合処理の重みの統合を詳細説明するための図。
【図9】本発明の文字切り出し装置の一実施例の確定切
り出し位置の設定あるいは修正する方法について説明す
るための図。
【符号の説明】
1 入力部 2 CPU 3 ROM 4 RAM 5 言語処理部 6 認識部 7 表示部 8 言語辞書 9 認識辞書 10 内部バス
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭62−147582(JP,A) 特開 昭59−2189(JP,A) 特開 昭61−29982(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06K 9/00 - 9/82

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】 筆跡データを入力する入力手段と、該入
    力手段で入力された筆跡データから文字を構成する基本
    セグメントを抽出する基本セグメント抽出手段と、該基
    本セグメント抽出手段で抽出された基本セグメントを組
    み合わせてなるストローク集合を抽出するストローク集
    合抽出手段と、該ストローク集合抽出手段で抽出された
    ストローク集合をノードとし、そのノード間をリンク接
    続したネットワークを構成し、該ストローク集合抽出手
    段で抽出されたストローク集合の文字としての評価値を
    前記ノードの重み、前記ストローク集合間の文字間とし
    ての評価値を前記リンクの重みとするネットワーク構成
    手段と、該ネットワーク構成手段で構成されたネットワ
    ークの経路探索することによって文字切り出し位置を決
    定する文字切り出し位置決定手段を備えたことを特徴と
    した文字切り出し装置。
  2. 【請求項2】 筆跡データを入力する入力手段と、該入
    力手段で入力された筆跡データから文字を構成する基本
    セグメントを抽出する基本セグメント抽出手段と、該基
    本セグメント抽出手段で抽出された基本セグメントを組
    み合わせてなるストローク集合を抽出するストローク集
    合抽出手段と、該ストローク集合抽出手段で抽出された
    ストローク集合をノードとし、そのノード間をリンク接
    続したネットワークを構成し、該ストローク集合抽出手
    段で抽出されたストローク集合の文字としての評価値を
    前記ノードの重み、前記ストローク集合間の文字間とし
    ての評価値を前記リンクの重みとするネットワーク構成
    手段と、該ネットワーク構成手段で構成されたネットワ
    ークの経路探索することによって複数の文字切り出し位
    置候補と該候補の切り出し得点を決定する文字切り出し
    位置候補決定手段と、前記ストローク集合抽出手段で抽
    出されたストローク集合に対して文字認識し、認識候補
    と該候補の認識得点を得る文字認識手段と、該文字認識
    手段で得られた認識候補を前記ネットワークの経路にそ
    って組み合わせ単語あるいは文節候補を抽出すると共
    に、該候補の得点を該候補に含まれる文字に対応する前
    記文字認識手段での得点に基づいて求めることによって
    得る言語処理手段とを設けたものであって、 前記文字切り出し位置候補決定手段で得られた複数の文
    字切り出し位置候補の中から前記文字切り出し位置候補
    決定手段で得られた切り出し得点と前記言語処理手段で
    得られた得点に基ずいて最適な文字切り出し位置候補を
    決定する最適文字切り出し位置候補決定手段を備えたこ
    とを特徴とした文字切り出し装置。
  3. 【請求項3】 筆跡データを入力する入力手段と、該入
    力手段で入力された筆跡データから文字を構成する基本
    セグメントを抽出する基本セグメント抽出手段と、該基
    本セグメント抽出手段で抽出された基本セグメントを組
    み合わせてなるストローク集合を抽出するストローク集
    合抽出手段と、該ストローク集合抽出手段で抽出された
    ストローク集合をノードとし、そのノード間をリンク接
    続したネットワークを構成し、該ストローク集合抽出手
    段で抽出されたストローク集合の文字としての評価値を
    ノードの重みとし、前記ストローク集合間の文字間とし
    ての評価値をリンクの重みとする第1のネットワークを
    構成する第1ネットワーク構成手段と、前記ストローク
    集合抽出手段で抽出されたストローク集合に対応する文
    字認識候補を得る文字認識手段と、該文字認識手段で得
    られた文字認識候補を前記第1のネットワークの経路に
    そって組み合わせて単語あるいは文節を抽出する言語処
    理手段と、該言語処理手段で抽出された単語あるいは文
    節の評価値をノードの重みとし、該単語あるいは文節間
    の評価値をリンクの重みとして第2のネットワークを構
    成する第2ネットワーク構成手段と、該第2ネットワー
    ク構成手段で構成された第2のネットワークのノードの
    重みに該ノードに対応する前記第1のネットワークのノ
    ード及びリンクの重みを加えたものを第2のネットワー
    クのノードの重みとし、前記第2のネットワークのリン
    クの重みに該リンクに対応する前記第1のネットワーク
    のリンクの重みを加えたものを第2のネットワークのリ
    ンクの重みとするネットワーク統合手段とを備えたもの
    であって、前記ネットワーク統合手段で得られたネット
    ワークの経路探索することによって文字切り出し位置を
    決定する統合文字切り出し位置決定手段を備えたことを
    特徴とした文字切り出し装置。
  4. 【請求項4】 前記基本セグメント抽出手段は、OFF
    時間あるいはFAR時間あるいはスペース幅が第1の閾
    値を越えたストローク間、及び前記筆跡データの先頭、
    及び末尾の位置を切り出し確定位置とし、OFF時間あ
    るいはFAR時間あるいはスペース幅が第2の閾値より
    小さいストローク間を不切り出し確定位置とし、それ以
    外のストローク間を未確定位置と決定するストローク間
    属性決定手段と、該ストローク間属性決定手段で決定さ
    れた切り出し確定位置から次の切り出し確定位置あるい
    は未確定位置間、または未確定位置から次の切り出し確
    定位置あるいは未確定位置間を基本セグメントとして決
    定する基本セグメント決定手段とからなることを特徴と
    した請求項1乃至3の何れかに記載の文字切り出し装
    置。
  5. 【請求項5】 前記切り出し確定位置、あるいは前記不
    切り出し確定位置を手動で設定することを可能としたこ
    とを特徴とした請求項4記載の文字切り出し装置。
  6. 【請求項6】 文字及び、線分あるいは記号を表示可能
    な表示手段を設け、前記切り出し確定位置あるいは不切
    り出し確定位置あるいは未確定位置を前記表示手段に表
    示された前記筆跡データの対応する位置に線分あるいは
    記号あるいは文字を使って印を付ける手段か、または前
    記文字切り出し位置決定手段あるいは最適文字切り出し
    位置候補決定手段あるいは前記統合文字切り出し位置決
    定手段で得られた文字切り出し位置に印を付ける手段を
    備えたことを特徴とした請求項1乃至3の何れかに記載
    の文字切り出し装置。
  7. 【請求項7】 文字及び、線分あるいは記号を表示可能
    な表示手段を設け、前記切り出し確定位置あるいは不切
    り出し確定位置あるいは未確定位置を前記表示手段に表
    示された前記筆跡データの対応する位置に線分あるいは
    記号あるいは文字を使って印を付ける手段か、または前
    記文字切り出し位置決定手段あるいは最適文字切り出し
    位置候補決定手段あるいは前記統合文字切り出し位置決
    定手段で得られた文字切り出し位置に印を付ける手段を
    備えたことを特徴とした請求項1乃至3の何れかに記載
    の文字切り出し装置。
  8. 【請求項8】 前記ストローク集合抽出手段は、前記切
    り出し確定位置から次の切り出し確定位置の間で、切り
    出し確定位置と切り出し確定位置の間あるいは切り出し
    確定位置と未確定切り出し位置の間あるいは未確定切り
    出し位置と未確定切り出し位置の間に含まれるストロー
    クを1つのストローク集合として決定するストローク集
    合決定手段からなることを特徴とした請求項1乃至3の
    何れかに記載の文字切り出し装置。
JP4274265A 1992-10-13 1992-10-13 文字切り出し装置 Expired - Fee Related JP2940747B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4274265A JP2940747B2 (ja) 1992-10-13 1992-10-13 文字切り出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4274265A JP2940747B2 (ja) 1992-10-13 1992-10-13 文字切り出し装置

Publications (2)

Publication Number Publication Date
JPH06124364A JPH06124364A (ja) 1994-05-06
JP2940747B2 true JP2940747B2 (ja) 1999-08-25

Family

ID=17539264

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4274265A Expired - Fee Related JP2940747B2 (ja) 1992-10-13 1992-10-13 文字切り出し装置

Country Status (1)

Country Link
JP (1) JP2940747B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1145872C (zh) 1999-01-13 2004-04-14 国际商业机器公司 手写汉字自动分割和识别方法以及使用该方法的系统
JP5344338B2 (ja) * 2008-08-01 2013-11-20 国立大学法人東京農工大学 プログラム、情報記憶媒体及び文字列認識装置
JP6003047B2 (ja) 2011-11-24 2016-10-05 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
CN103310209A (zh) * 2012-03-09 2013-09-18 富士通株式会社 识别图像中的字符串的方法和装置
CN104268603B (zh) 2014-09-16 2017-04-12 科大讯飞股份有限公司 用于文字性客观题的智能阅卷方法及系统
JP7095450B2 (ja) * 2018-07-20 2022-07-05 富士通株式会社 情報処理装置、文字認識方法、および文字認識プログラム

Also Published As

Publication number Publication date
JPH06124364A (ja) 1994-05-06

Similar Documents

Publication Publication Date Title
KR100454541B1 (ko) 수기 문자 인식 방법 및 시스템
JP3452774B2 (ja) 文字認識方法
US7099507B2 (en) Method and system for extracting title from document image
JP2940747B2 (ja) 文字切り出し装置
JP3216800B2 (ja) 手書き文字認識方法
KR20180106517A (ko) 인공 지능 기술 기반의 머신 러닝을 사용하는 도면 부호를 포함하는 특허 도면 이미지에 도면 부호의 설명을 맵핑 처리하는 방법 및 장치
CN114730241A (zh) 触摸式用户界面输入中的手势笔画识别
JP2021179781A (ja) 文抽出装置及び文抽出方法
CN113283432A (zh) 图像识别、文字排序方法及设备
JP2002063548A (ja) 手書き文字認識方法
JP3187913B2 (ja) 文書処理装置
JP3419251B2 (ja) 文字認識装置及び文字認識方法
JP2006277149A (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP3075808B2 (ja) 文書処理装置
JPH09274645A (ja) 文字認識方法および装置
JP2804660B2 (ja) 文書処理装置
JP3177045B2 (ja) オンライン文字認識装置
JP4328511B2 (ja) パターン認識装置、パターン認識方法、プログラムおよび記憶媒体
JP3817281B2 (ja) 情報処理装置及び方法
JP3115139B2 (ja) 文字切り出し方法
JP2906758B2 (ja) 文字読取装置
JPH11203406A (ja) 文字切り出し方法、文字認識方法、文字認識装置および記録媒体
JP3481850B2 (ja) 文字認識装置
JP2882327B2 (ja) 線図形整合装置
JP2972443B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080618

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090618

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees