JPH0816781A - 画像認識装置 - Google Patents

画像認識装置

Info

Publication number
JPH0816781A
JPH0816781A JP6168969A JP16896994A JPH0816781A JP H0816781 A JPH0816781 A JP H0816781A JP 6168969 A JP6168969 A JP 6168969A JP 16896994 A JP16896994 A JP 16896994A JP H0816781 A JPH0816781 A JP H0816781A
Authority
JP
Japan
Prior art keywords
image
unit
data
information
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6168969A
Other languages
English (en)
Inventor
Manabu Oba
学 大場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP6168969A priority Critical patent/JPH0816781A/ja
Publication of JPH0816781A publication Critical patent/JPH0816781A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 読取り対象が固定用紙に記入した文字に限定
されることなく、人間の指の形状なども認識でき、しか
も複雑な搬送機構部や複雑な辞書を不要とした画像認識
装置を提供する。 【構成】 登録モードでは、例えば指の形状を画像情報
として受光部13で取り込み、所定の処理を行った後、
登録NO入力部14から入力された出力情報と共に、対
応関係を持って画像格納部18に格納する。運用モード
では、あらかじめ登録された形状と同じ指の形状を示す
と、装置内では、その指の形状を画像情報として受光部
13で取り込み、画像照合部19において、画像格納部
18にあらかじめ格納されている画像情報と照合を行
う。そして、一致する画像情報と対応関係をもって格納
されている出力情報を読み出し、数値変換部20で数値
データに変換して上位装置21へ出力する構成とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像認識装置に関する
ものである。
【0002】
【従来の技術】図9に、画像認識装置の基本であるOC
R(Optical Character Reader)装置の構成の一例を示
す。図9において、ホッパ部101には、読取り対象と
なる文字が記入されている用紙102が蓄えられてい
る。このホッパ部101に蓄えられている用紙102
は、読取り開始指令によって紙送り機構部103が駆動
されると、紙送り機構部103のローラによって1枚ず
つ読取り位置まで搬送される。
【0003】また、読取り開始指令に応答して光源部1
04が発光し、読取り位置に到来した用紙102に対し
てレンズ部105を通して光を照射する。この照射光に
基づく用紙102からの反射光は、レンズ部105を通
してCCDセンサ部106に入射する。CCDセンサ部
106は、用紙102からの反射光を受光することによ
って読取り対象の文字情報を読み取る。このCCDセン
サ部106から出力される文字データは認識論理部10
7に供給される。
【0004】認識論理部107は、位相構造化法やパタ
ーンマッチング法等の周知の認識法に従って文字の認識
処理を行う。この認識論理部107で認識された文字
は、読取り結果処理部108に供給されて例えばディス
プレイ上に表示される。そして、文字認識の処理が終了
した用紙102は、紙送り機構部103のローラによっ
てさらに搬送され、スタッカ部109に蓄えられる。
【0005】次に、上記構成のOCR装置の動作につい
て説明する。先ず、ユーザによって読取り開始キーが押
下され、これに応答して紙送り機構部103が動作され
ると、ホッパ部101に予めセットされている用紙10
2が紙送り機構部103によって1枚ずつ読取り位置ま
で搬送される。用紙102の搬送が開始されると同時
に、光源部104が発光を開始し、読取り位置に到来し
た用紙102の文字面を照射する。
【0006】この照射光に基づく用紙102の文字面か
らの反射光は、レンズ部105を経由してCCDセンサ
106に入射する。CCDセンサ106は、画素単位で
入射光を光電変換して文字データを出力する。この文字
データは、認識論理部107に供給されて先述した如き
周知の認識法に従って文字認識の処理が行われる。そし
て、認識された文字は、読取り結果処理部108に供給
されて表示等の処理が行われる。
【0007】
【発明が解決しようとする課題】しかしながら、上述の
如きOCR装置に代表される従来の画像認識装置では、
読取り対象が固定用紙に記された文字などの情報に限ら
れるため、数値のような簡易のデータでも紙に書いて読
み取らせる必要があり、当該装置の用途が限られるとい
う問題があった。また、読取り対象物を読取り位置まで
搬送させなくてはならないため複雑な搬送機構部が必要
となり、さらには認識処理のための複雑な辞書を保有し
なくてはならないという問題もあった。
【0008】本発明は、上記課題に鑑みてなされたもの
であり、その目的とするところは、読取り対象が固定用
紙に記入した文字に限定されることなく、人間の指の形
状なども認識でき、しかも複雑な搬送機構部や複雑な辞
書を不要とした画像認識装置を提供することにある。
【0009】
【課題を解決するための手段】本発明による画像認識装
置は、読取り対象物の画像を取り込む画像取込部と、こ
の画像取込部から出力される画像データを一時保管する
ビデオメモリと、その画像データに対応する出力情報を
登録する情報登録部と、ビデオメモリに保管されている
画像データのうちの特定の部分の画像データのみを切り
出して出力する画像切出部と、この画像切出部によって
切り出された画像データを上記出力情報と共に対応関係
をもって格納する画像格納部と、画像認識すべき入力画
像データをこの画像格納部に格納されている画像データ
と照合する画像照合部と、この画像照合部による照合結
果が一致する画像データと対応関係をもって画像格納部
に格納されている出力情報を所定の情報に変換して出力
する出力部とを具備した構成となっている。
【0010】
【作用】上記構成の画像認識装置において、画像データ
登録モードでは、例えば手の指の形状を画像情報として
取り込み、情報登録部から入力する出力情報と共に、対
応関係をもって画像格納部に格納する。これにより、例
えば、指の形状で示す数字の“0”〜“1”までの画像
データと、登録された数値データとが対応関係をもって
あらかじめ登録される。運用モードでは、あらかじめ登
録された人が指の形状で数値を示す。すると、装置内で
は、その指の形状を画像情報として取り込み、あらかじ
め格納されている画像情報と照合を行い、一致する画像
情報と対応関係をもって格納されている出力情報を所定
の情報に変換して出力する。
【0011】
【実施例】以下、本発明の実施例を図面に基づいて詳細
に説明する。図1は、本発明による画像認識装置の第1
実施例を示すブロック図である。この第1実施例では、
人間の手の形状、特に指の形状を認識し、これを目的の
数値データや音声データ等の情報に変換して出力する画
像認識装置として構成している。図1において、投光部
11は赤外線等を発光する発光素子を光源として構成さ
れ、読取り対象物に対して赤外光を投光する。この投光
部11の起動/停止の制御は、装置全体の電源のON/
OFF制御を行う撮影開始部12の出力によって行われ
る。
【0012】受光部13は、カメラ相当の用品によって
構成され、投光部11によって投光された読取り対象物
からの反射光を受光することにより、読取り対象物の画
像を取り込む。すなわち、この受光部13は投光部11
と共に読取り対象物の画像を取り込む画像取込部として
機能する。投光部11を設けることで、読取り対象物を
明確にできるため、鮮明な画像を取り込める。登録NO
入力部14は、入力する画像データの出力NOを登録す
るためのもので、画像データに対応する出力情報を登録
する情報登録部として機能する。
【0013】受光部13から出力されるアナログ画像情
報は、A/D変換部15でディジタル画像情報に変換さ
れる。このディジタル画像データは、ビデオメモリ16
に一時保管される。画像切出部17は、ビデオメモリ1
6に保管されている画像データのうち、投光部11によ
って赤外光が投射されている部分の画像データのみを切
り出して出力する。
【0014】画像格納部18は、画像切出部17で切り
出された画像データを、登録NO入力部14から入力さ
れた登録NOデータと共に対応関係をもって格納する。
画像照合部19は、画像切出部17からの画像データの
サンプリング集計を行い、画像認識すべき入力画像デー
タを画像格納部18に格納されている画像データと照合
する。
【0015】画像照合部19による照合結果が一致する
と、その旨を示す情報が画像照合部19から画像格納部
18へ供給される。画像格納部18は、画像照合部19
から照合一致情報が供給されると、その画像データと対
応関係をもって格納している登録NOデータを出力す
る。この登録NO情報は、数値変換部20で例えば数値
データに変換されて上位装置21に供給される。
【0016】上記構成の画像認識装置において、装置全
体の制御は、マイクロコンピュータによって構成される
主制御部22によって行われる。また、本装置は、運用
モードと画像データ登録モードの2種類のモードを装備
しており、運用前にあらかじめ、本装置を使用する人の
手や指の形状を登録しておく必要がある。運用モードと
画像データ登録モードの切替えは、モード切替えスイッ
チ23によって行われる。
【0017】次に、上記第1実施例に係る画像認識装置
の動作について説明する。運用に先立って、モード切替
えスイッチ23を登録モードにし、撮影開始部12の電
源スイッチをONにする。すると、投光部11から赤外
光が発光される。この状態において、オペレータはその
赤外光中に、手を差し出して目的の数を指の形状を示
す。
【0018】装置内では、投光した赤外光に基づく読取
り対象物からの反射光を受光部13で受光することによ
って画像を取り込む処理が行われる。このとき、受光部
13においては、読取り対象物を明確にするために、当
該対象物に対する焦点合わせにオートフォーカス機構を
働かせ、焦点が合うと、発信音を発生してその旨をオペ
レータに知らせると同時に、読取り対象物の画像を取り
込む。
【0019】この画像取込みに伴って受光部13から出
力されるアナログ画像情報は、A/D変換部15でディ
ジタル化されてビデオメモリ16に格納される。ビデオ
メモリ16に格納された画像データは、画像切出部17
に送られる。画像切出部17では、目的である指の形状
(輪郭)を鮮明にするために、余分な画像データを削除
する処理が行われる。この削除の方法としては、投光し
た赤外光を反射する反射物のみを取り込み、それ以外の
画像データは切り捨てる方法を用いる。
【0020】このようにして鮮明に切り出された画像デ
ータは、画像照合部19に送られてデータのサンプリン
グが行われる。その後、画像格納部18に、以下に説明
する方法で入力された登録NOデータと共に対応関係を
もって格納される。登録NOの入力方法としては、画像
の取込みの際に受光部13から発信音が発せられると、
その後オペレータが登録NO入力部14において登録N
Oキーを使用して登録NOを入力する。この登録NOキ
ーは、1度押下すると数字の“1”を示し、2度押下す
ると数字の“2”を示すことになる。
【0021】以上の処理を繰り返して実行することによ
り、指の形状で示す数字の“0”〜“9”までの画像デ
ータと、登録NOキーで入力された数値データとを対応
関係をもってあらかじめ登録しておく。基本的に本装置
は、登録された人のみ使用可能であるが、アプリケーシ
ョンレベルで複数の人間で使用する場合は、複数の人の
手文字情報を登録するようにすることも可能である。
【0022】続いて、運用モードでの動作について説明
する。モード切替えスイッチ23を運用モードに切り替
え、撮影開始部12の電源スイッチをONにする。する
と、投光部11から赤外光が発光される。この状態にお
いて、オペレータはその赤外光中に、手を差し出してあ
らかじめ登録している指形と同一の指形を示す。
【0023】装置内では、受光部13において、焦点調
整のためオートフォーカス機構を働かせて焦点を合わ
せ、指形の画像を取り込む。この画像情報は、A/D変
換部15でディジタル情報に変換されて画像切出部17
に送られる。この画像切出部17では、赤外光の照射さ
れている指形の形状を鮮明にする処理が行われる。鮮明
にされた画像データは、画像照合部19に送られる。画
像照合部19では、画像認識すべき入力画像データをサ
ンプリングし、画像格納部18にあらかじめ格納されて
いる画像データとの比較照合を行う。比較照合の結果、
一致する画像データと対応関係をもって画像格納部18
に格納されている登録NO情報を出力する。
【0024】この登録NO情報は、数値変換部20で数
値データに変換されて上位装置21に供給される。数値
変換部20は、目的に応じて柔軟に数値変換できるよう
に、汎用インタフェース構成となっている。そして、例
えば、電話のダイヤル発信機能を組み込むことにより、
手文字情報によって電話をかけることができる、手文字
ダイヤリング装置の実現が可能となる。また、音声発生
装置を組み込むことにより、手話用手文字入力音声発生
装置の実現が可能となる。
【0025】次に、第1実施例に係る画像切出部17及
び画像照合部19における画像切出し及び画像照合の原
理につき、図2に基づいて説明する。なお、図2におい
て、(A)はビデオメモリ16の格納データを、(B)
はその格納データの切出し状態を、(C)はX軸方向の
データサンプリングを、(D)はX軸方向のデータサン
プリングをそれぞれ示している。ビデオメモリ16に格
納されている画像データを取り出し、先ず、水平方向の
ライン数によって読取り対象物の縦方向の大きさを認識
する。続いて、垂直方向のライン数によって読取り対象
物の横方向の大きさを認識する。
【0026】次に、枠内の画像データに対し、X軸方向
の白(データ無し),黒(データ有り)の数を走査し、
データをサンプリングする。例えば、図中での黒の数を
X=98とする。さらに、Y軸方向のデータの数をサン
プリングする。ここでは、Y=121とする。このX=
98,Y=121のデータが認識された数値データであ
る。このデータを基に、同様の方法にてデータサンプリ
ングを行って画像格納部18にあらかじめ格納している
画像データとの比較照合を行うことにより、目的の数値
データを出力する。
【0027】図3に、画像照合部19の構成の一例を示
す。同図において、Xラインデータ集計部31は、画像
切出部17でビデオメモリ16に格納されている画像デ
ータを取り出して水平方向及び垂直方向の枠内にとらえ
られた読取り対象物に対し、X軸方向に走査して読取り
対象物とそうでない部分との切り分けを行うために、赤
外光の照射されている部分を“1”、その他を“0”と
して読み込んでデータサンプリングを行う。Xラインデ
ータ値は、Xラインデータ格納部32に一時格納され
る。
【0028】Yラインデータ集計部33は、Xラインデ
ータ集計部31と同様の方法で、Y軸方向のデータをサ
ンプリングする。Yラインデータ値は、Yラインデータ
格納部34に一時格納される。データ数分布特性照合部
35は、Xラインデータ格納部32に格納されているX
ラインデータ値と、Yラインデータ格納部34に格納さ
れているYラインデータ値を基に、画像格納部18に格
納しているデータ値とを比較照合する。
【0029】図4は、上記画像照合部19の回路構成を
より具体化したブロック図である。画像照合部19は、
DMAC(DMA(Direct Memory Access)コントロー
ラ)41、VRAM(ビデオメモリ)42、X軸集計用
メモリ43、Y軸集計用メモリ44及びデータ数分布特
性照合用ROM45から構成されている。DMAC41
は、画像切出部17からの1ライン分の画像データをV
RAM42に直接格納するように制御する。VRAM4
2は、画像切出部17からの画像データを、1文字分だ
け格納できるメモリ容量を有している。
【0030】主制御部22による命令により、VRAM
42のメモリ領域が読取り対象物の1キャラクタの領域
に分割される。その分割された領域に対し、メモリ上の
X軸方向の数値データ(画像データ有りの場合は
“1”,無しの場合は“0”)を集計し、その集計デー
タをX軸集計用メモリ43に格納する。次に、Y軸方向
のサンプリングを行い、Y軸方向の数値データを集計
し、その集計データをY軸集計用メモリ44に格納す
る。
【0031】このX軸,Y軸の集計データを基に、デー
タ数分布特性照合用ROM45にあらかじめ格納してい
る数値データとの照合を行う。図1の数値変換部19を
構成する数値変換用ROMには、データ数分布特性照合
用ROM45からの認識データを数値データに変換する
ための変換テーブルが格納されている。
【0032】上述したように、第1実施例の構成によれ
ば、本画像認識装置を運用する前に照合対象となる画像
データを、目的とする出力情報と対応関係をもってあら
かじめ登録しておき、運用モードにおいては、画像認識
すべき入力画像データをあらかじめ登録している画像デ
ータと比較照合し、一致する画像データと対応関係をも
って格納されている出力情報を変換して上位装置に出力
するようにしたので、読取り対象は固定用紙に記入した
文字に限定されることはなく、人間の指の形状なども認
識できることになる。
【0033】これにより、人間の手の形状は個人によっ
て多少異なるものであることから、それを認識処理する
ことでセキュリティの高い装置の開発及びシステムの構
築が可能となる。しかも、画像認識された画像データに
対応した情報が出力されるようになっているため、電話
機のダイヤル発信機能を組み込むことにより、手文字入
力によるダイヤリングが可能になり、また音声発生装置
を組み込むことにより、手文字入力によって目的の音声
を発生することが可能となる。
【0034】図5は、本発明による画像認識装置の第2
実施例を示すブロック図であり、図中、図1と同等部分
には同一符号を付して示してある。この第2実施例で
は、人間の身体の動作を認識し、これを目的の音声等の
情報に変換して出力する画像認識装置として構成してい
る。図5において、投光部11は赤外線等を発光する発
光素子を光源として構成され、読取り対象物に対して赤
外線等を投光し、読取り対象物を明確にする。この投光
部11の起動/停止の制御は、装置全体の電源のON/
OFF制御を行う撮影開始部12の出力によって行われ
る。
【0035】一対の受光部13a,13bは、互いに異
なる感応レベルを有し、投光部11と共に読取り対象物
の画像を取り込む画像取込部として機能する。一方の受
光部13aは、カメラ相当の用品によって構成され、投
光部11によって投光された赤外光に対する読取り対象
物の反射率の高い画像を取り込む。また、他方の受光部
13Bは、カメラ相当の用品によって構成され、投光部
11によって投光された赤外光に対する読取り対象物の
反射率の低い画像を取り込む。
【0036】音声入力部24は、入力画像データに関す
る説明として出力される音声情報を登録するためのもの
で、画像データに対応する出力情報を登録する情報登録
部として機能する。動画収録部25は、ビデオテープレ
コーダの如きアナログデータ記録装置により構成され、
一対の受光部13a,13bによって読み込まれた読取
り対象部の動作情報、即ち動画情報を格納する。
【0037】動作分割処理部26は、動画収録部25に
格納されている動画情報を、動作判別可能な程度に各コ
マ単位に分割し、A/D変換部15に1画面のアナログ
画像情報として供給する。このアナログ画像情報は、A
/D変換部15でディジタル情報に変換されてビデオメ
モリ16に一時保管される。画像高速処理部27は、例
えばマイクロコンピュータによって構成され、先述した
連続する画像情報の分割やA/D変換、さらには後述す
る画像の切出しや照合を高速で処理するためのものであ
る。
【0038】画像切出部17は、ビデオメモリ16に保
管されている画像データのうち、投光部11によって赤
外光が投射されている部分の画像データのみを切り出し
て出力する。画像格納部18は、画像切出部17で切り
出された画像データを、音声入力部24から入力された
音声情報と共に対応関係をもって格納する。画像照合部
19は、画像切出部17からの画像データのサンプリン
グ集計を行い、画像認識すべき入力画像データを画像格
納部18に格納されている画像データと照合する。
【0039】画像照合部19による照合結果が一致する
と、その旨を示す情報が画像照合部19から画像格納部
18へ供給される。画像格納部18は、画像照合部19
から照合一致情報が供給されると、その画像データと対
応関係をもって格納している音声データを出力する。照
合格納部28は、画像格納部18から出力される1動作
分の画像データを格納し、1単語単位で音声出力部29
へ音声データを送る。
【0040】上記構成の画像認識装置において、装置全
体の制御は、マイクロコンピュータによって構成される
主制御部22によって行われる。また、本装置は、運用
モードと画像データ登録モードの2種類のモードを装備
しており、運用前にあらかじめ、本装置を使用する人の
手や指の形状を登録しておく必要がある。運用モードと
画像データ登録モードの切替えは、モード切替えスイッ
チ23によって行われる。
【0041】次に、上記第2実施例に係る画像認識装置
の動作について説明する。運用に先立って、モード切替
えスイッチ23を登録モードにし、撮影開始部12の電
源スイッチをONにする。すると、投光部11から赤外
光が発光される。この状態において、オペレータはその
赤外光の投射範囲内で、目的に応じた身体の動きを示
す。
【0042】装置内では、投光した赤外光に基づく読取
り対象物からの反射光を受光部13a,13bで受光す
ることによって画像を取り込む処理が行われる。なお、
受光部13aには読取り対象物の反射率の高い部分の画
像が、受光部13bには読取り対象物の反射率の低い部
分の画像がそれぞれ取り込まれる。このとき、受光部1
3a,13bにおいては、読取り対象物を明確にするた
めに、当該対象物に対する焦点合わせにオートフォーカ
ス機構を働かせ、焦点が合うと、発信音を発生してその
旨をオペレータに知らせると同時に、動画情報を取り込
む。
【0043】この動画取込みに伴って受光部13a,1
3bから出力されるアナログ動画情報は、動画収録部2
5を経て動画分割処理部26にて、画像認識の対象物の
動作が分かるレベルに分割された後、A/D変換部15
でディジタル化されてビデオメモリ16に格納される。
ビデオメモリ16は、画像データを高速で処理するた
め、複数画面分のメモリ容量を有している。このビデオ
メモリ16に格納された画像データは、画像切出部17
に送られる。
【0044】画像切出部17では、目的である人間の身
体の動作を鮮明にするために、余分な画像データを削除
する処理が行われる。この削除の方法としては、第1実
施例の場合と同様に、投光した赤外光を反射する反射物
のみを取り込み、それ以外の画像データは切り捨てる方
法を用いる。
【0045】このようにして鮮明に切り出された画像デ
ータは1つの単語単位に画像格納部18に格納される。
画像格納部18には同時に、音声入力部24から入力さ
れた動画の動作に対応する音声データも、その画像デー
タと対応関係をもって格納される。登録音声の入力方法
としては、1つの画像データを入力した後、登録キーを
押下し、その後オペレータは登録音声データを入力す
る。
【0046】なお、一連の身体の動作は、連続する数十
個の画像として取り扱われるため、画像データを高速に
処理する必要がある。その制御を行うのが、画像高速処
理部27である。以上の処理を繰り返して実行すること
により、目的の動画及びこれに関連する出力音声の登録
を行う。
【0047】続いて、運用モードでの動作について説明
する。モード切替えスイッチ23を運用モードに切り替
え、撮影開始部12の電源スイッチをONにする。する
と、投光部11から赤外光が発光される。この状態にお
いて、オペレータはその赤外光の照射範囲内で、あらか
じめ登録している身体の動作と同一の動作を行う。
【0048】装置内では、受光部13a,13bにおい
て、焦点調整のためオートフォーカス機構を働かせて焦
点を合わせ、画像情報を取り込む。この画像情報は、動
画収録部25に格納される。動画分割処理部26では、
身体の動作の形状を数画面に分割する。この分割された
画像情報は、A/D変換部15でディジタル情報に変換
されてビデオメモリ16に一時保管される。
【0049】ビデオメモリ16に格納された画像データ
は画像切出部17に送られる。この画像切出部17で
は、赤外光の照射されている身体の形状部分のみを切り
出す処理が行われる。切り出された画像データは画像照
合部19に送られる。画像照合部19では、画像認識す
べき入力画像データのサンプリングし、画像格納部18
にあらかじめ格納されている画像データとの比較照合を
行う。
【0050】照合された画像データは、1単語の動作の
照合が済むまで一時的に照合格納部28に格納される。
1単語の動作の終結を知ると、照合格納部28に格納さ
れたデータは音声出力部29を通して音声として出力さ
れる。順次、上述した動作を繰り返すことにより、人間
の身体の動作を、あらかじめ登録されている音声に変換
し、出力することが可能となる。
【0051】次に、第2実施例に係る画像切出部17及
び画像照合部19における画像切出し及び画像照合の原
理につき、図6に基づいて説明する。なお、図6におい
て、(A)はビデオメモリ16の格納データを、(B)
はその格納データの切出し状態を、(C)はX軸方向の
データサンプリングを、(D)はX軸方向のデータサン
プリングをそれぞれ示している。ビデオメモリ16に格
納されている画像データを取り出し、先ず、水平方向の
ライン数によって読取り対象物の縦方向の大きさを認識
する。さらに、垂直方向のライン数によって読取り対象
物の横方向の大きさを認識する。
【0052】投射される赤外光に対する読取り対象物の
反射率は反射部分によって異なるため、反射率の高い部
分のデータサンプリングと反射率の低いデータサンプリ
ングとを行い、画像データとして記憶する。そして、枠
内の画像データに対し、X軸方向に反射率の高い部分の
数と低い部分の数を走査し、データをサンプリングす
る。例えば、図中での反射率の高い部分の数X1=7
2、低い部分の数X2=216とする。さらに、Y軸方
向のデータの数をサンプリングする。ここでは、Y1=
86、Y2=309とする。
【0053】X1=72,X2=216,Y1=86,
Y2=309のデータが認識された数値データである。
このデータを基に、同様の方法にてデータサンプリング
を行って画像格納部18にあらかじめ格納している画像
データとの比較照合を行うことにより、目的の数値デー
タを出力する。認識率を高める方法として、同一動作を
得返して登録することにより、幅広い集合体を作り出す
ことが可能となる。比較照合されたデータは、1画面単
位に照合格納部28に格納され、1単語の動作の照合が
終了後、登録されている音声を発生する。
【0054】図7は、画像照合部19の構成の一例を示
すブロック図であり、図中、図5と同等部分には同一符
号を付して示している。なお、画像切出部17では、ビ
デオメモリ16に格納されている画像データを取り出し
て水平方向及び垂直方向の枠内に読取り対象物をとらえ
る。
【0055】図7において、X1ラインデータ集計部7
1は、枠内の読取り対象物に対し、X軸方向に走査して
反射率の高い赤外光の照射されている部分を“1”、そ
の他を“0”として読み込んでデータサンプリングを行
う。X1ラインデータ値は、X1ラインデータ格納部7
2に一時格納される。また、X2ラインデータ集計部7
3は、枠内の読取り対象物に対し、X軸方向に走査して
反射率の低い赤外光の照射されている部分を“1”、そ
の他を“0”として読み込んでデータサンプリングを行
う。X2ラインデータ値は、X2ラインデータ格納部7
4に一時格納される。
【0056】Y1ラインデータ集計部75は、枠内の読
取り対象物に対し、Y軸方向に走査して反射率の高い赤
外光の照射されている部分を“1”、その他を“0”と
して読み込んでデータサンプリングを行う。Y1ライン
データ値は、Y1ラインデータ格納部76に一時格納さ
れる。また、Y2ラインデータ集計部77は、枠内の読
取り対象物に対し、Y軸方向に走査して反射率の低い赤
外光の照射されている部分を“1”、その他を“0”と
して読み込んでデータサンプリングを行う。Y2ライン
データ値は、Y2ラインデータ格納部78に一時格納さ
れる。
【0057】データ数分布格納部79は、サンプリング
した X1,X2,Y1,Y2の各ラインデータ値を一
時格納する。一方、画像格納部18には、あらかじめ登
録されている画像データが格納されている。集合体分布
特性部80は、あらかじめ登録されて画像格納部18に
格納されている画像データを分析し、各動作単位にデー
タ集計を行う。そして、画像照合部19は、データ数分
布格納部79に格納されたデータと、画像格納部18に
格納されているデータとを比較照合する。
【0058】図8は、上記画像照合部19の回路構成を
より具体化したブロック図であり、図中、図4と同等部
分には同一符号を付して示してある。画像照合部19
は、DMAC41、VRAM42、X軸集計用メモリ4
3、Y軸集計用メモリ44、X軸Y軸集計用メモリ4
6、集合体分布特性用ROM47及び音声変換用ROM
48とから構成されている。DMAC41は、画像切出
部17からの1ライン分の画像データをVRAM42に
直接格納するように制御する。VRAM42は、画像切
出部17からの画像データを、1文字分だけ格納できる
メモリ容量を有している。
【0059】主制御部22による命令により、読取り対
象物の1キャラクタの領域に分割される。その分割され
た領域に対し、メモリ上のX軸方向の数値データを、反
射率の高い部分と低い部分に分けて集計し、その集計デ
ータをX軸集計用メモリ43に格納する。次に、Y軸方
向のサンプリングを行い、Y軸方向の数値データを集計
し、その集計データをY軸集計用メモリ44に格納す
る。
【0060】このX軸,Y軸の集計データを、X軸Y軸
集計用メモリ46に同時に格納し、あらかじめ集合体分
布特性用ROM47に格納されている数値データとの照
合を行う。音声変換用ROM48には、集合体分布特性
用ROM47からの認識データを音声データに変換する
ための変換テーブルが格納されている。
【0061】上述したように、第2実施例の構成によれ
ば、取り込んだ動画情報を動画収録部25に一旦収録
し、この動画情報を動画分割処理部26によって動作判
別可能程度に各コマ単位に分割し後画像認識処理を行う
ようにしたので、第1実施例の場合には指の形状など、
静止画の画像を認識対象としていたのに対し、人間の身
体の動きなどの動画の画像についても画像認識できるこ
とになる。
【0062】したがって、人間の身体の動きを音声とし
て出力するようにすることで、手話用音声変換装置とし
て有用なものとなる。また、第1実施例の場合には、受
光部13が1個であったのに対し、第2実施例では、一
対の受光部13a,13bを持つ構成としたことによ
り、2倍の情報量が得られるので、1個の場合よりも画
像認識率を向上できることになる。
【0063】
【発明の効果】以上詳細に説明したように、本発明によ
れば、人間の手の形状や身体の動作などを画像情報とし
て取り込んで、入力された出力情報と共に対応関係を持
ってあらかじめ登録しておき、あらかじめ登録されてい
る画像情報を入力することで、画像照合を行って一致す
る画像情報と対応する出力情報を所定の情報に変換して
出力するようにしたので、読取り対象が固定用紙に記入
した文字に限定されることはなく、しかも複雑な搬送機
構部や複雑な辞書が不要となる。
【0064】このように、本発明による画像認識装置
は、人間の手の形状や身体の動作などによる画像入力が
可能であるため、電話のダイヤル発信機能を組み込むこ
とにより、手文字入力によって電話をかけることが可能
な手文字ダイヤリング装置の実現が可能となり、さらに
は音声発生装置を組み込むことにより、手文字入力によ
る音声を発生させることが可能な手話用手文字入力音声
発生装置の実現が可能となる。特に、人間の手の形状や
身体の形状は、個人によって多少ことなるものであるこ
とから、それを画像認識することによってセキュリティ
の高い装置の開発及びシステムの構築が可能となる。
【図面の簡単な説明】
【図1】本発明による画像認識装置の第1実施例を示す
ブロック図である。
【図2】第1実施例における画像切出し及び画像照合の
原理説明図である。
【図3】第1実施例における画像照合部の構成の一例を
示すブロック図である。
【図4】第1実施例における画像照合部の回路構成をよ
り具体化して示したブロック図である。
【図5】本発明による画像認識装置の第2実施例を示す
ブロック図である。
【図6】第2実施例における画像切出し及び画像照合の
原理説明図である。
【図7】第2実施例における画像照合部の構成の一例を
示すブロック図である。
【図8】第2実施例における画像照合部の回路構成をよ
り具体化して示したブロック図である。
【図9】OCR装置の一例を示す概略構成図である。
【符号の説明】
11 投光部 13,13a,13b 受光部 14 登録NO入力部 16 ビデオメモリ 17 画像切出部 18 画像格納部 19 画像照合部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 読取り対象物の画像を取り込む画像取込
    部と、 前記画像取込部から出力される画像データを一時保管す
    るビデオメモリと、 前記画像データに対応する出力情報を登録する情報登録
    部と、 前記ビデオメモリに保管されている画像データのうちの
    特定の部分の画像データのみを切り出して出力する画像
    切出部と、 前記画像切出部によって切り出された画像データを前記
    出力情報と共に対応関係をもって格納する画像格納部
    と、 画像認識すべき入力画像データを前記画像格納部に格納
    されている画像データと照合する画像照合部と、 前記画像照合部による照合結果が一致する画像データと
    対応関係をもって前記画像格納部に格納されている前記
    出力情報を所定の情報に変換して出力する出力部とを具
    備したことを特徴とする画像認識装置。
  2. 【請求項2】 前記画像取込部は、読取り対象物に対し
    て光を照射する投光部と、読取り対象物からの反射光を
    受光する受光部とからなることを特徴とする請求項1記
    載の画像認識装置。
  3. 【請求項3】 前記画像取込部は、読取り対象物に対し
    て光を照射する投光部と、互いに異なる感応レベルを有
    して読取り対象物からの反射光を受光する一対の受光部
    とからなることを特徴とする請求項1記載の画像認識装
    置。
  4. 【請求項4】 前記画像取込部から連続して出力される
    動画情報を一時的に収録する動画収録部と、 前記動画収録部に収録された動画情報を動作判別可能程
    度に分割する動作分割処理部とを備え、 前記動作分割処理部から出力される画像データを前記ビ
    デオメモリに一時保管することを特徴とする請求項1記
    載の画像認識装置。
JP6168969A 1994-06-27 1994-06-27 画像認識装置 Pending JPH0816781A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6168969A JPH0816781A (ja) 1994-06-27 1994-06-27 画像認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6168969A JPH0816781A (ja) 1994-06-27 1994-06-27 画像認識装置

Publications (1)

Publication Number Publication Date
JPH0816781A true JPH0816781A (ja) 1996-01-19

Family

ID=15877932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6168969A Pending JPH0816781A (ja) 1994-06-27 1994-06-27 画像認識装置

Country Status (1)

Country Link
JP (1) JPH0816781A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6191773B1 (en) * 1995-04-28 2001-02-20 Matsushita Electric Industrial Co., Ltd. Interface apparatus
JP2006048650A (ja) * 2004-06-16 2006-02-16 Microsoft Corp 赤外線画像作成システムにおける不要信号の影響を低減させるための方法およびシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6191773B1 (en) * 1995-04-28 2001-02-20 Matsushita Electric Industrial Co., Ltd. Interface apparatus
JP2006048650A (ja) * 2004-06-16 2006-02-16 Microsoft Corp 赤外線画像作成システムにおける不要信号の影響を低減させるための方法およびシステム

Similar Documents

Publication Publication Date Title
JP4991079B2 (ja) テキストの所望部分を選択し捕捉するためのイメージ捕捉装置及び方法
JP2881594B2 (ja) 電子光学撮像システム、および電子光学撮像システムにおいて人の手掌部および手の付け根部の、撮像のためのデータを獲得する、方法
AU596655B2 (en) Digital imaging file processing system
JP2000514979A (ja) 電子翻訳機として特に有用な手持ち可能な光学式スキャナー
JPH07114630A (ja) イメージ処理機能付小型情報端末装置
JPH0816781A (ja) 画像認識装置
KR19990006421A (ko) 카메라에 의해 포착된 영상에 관련된 정보 처리 및 디스플레이용 시스템
JP2000020677A (ja) 画像取込み/メッセージ表示装置
JP3582984B2 (ja) 画像状態検出装置及びそれを利用した文書画像補正装置
JPH0223492A (ja) 光学的文字読取装置
CA1296429C (en) Digital imagine file processing system
CN1093297C (zh) 全像扫描装置与方法
JPH0731318Y2 (ja) X線フイルムid自動認識装置
JPH04213179A (ja) 文字読取装置
JPH04174087A (ja) 画像入力装置
JPH10327312A (ja) 画像読み取り装置
JPS5932065A (ja) 文字読取装置
JPH03142579A (ja) イメージ入力機能付小型データ端末装置
JPH04157963A (ja) コードレスイメージスキャナ
JPH06231301A (ja) 光学式文字読取装置
KR19990036555A (ko) 지능 영상 포착 및 메시지 디스플레이 장치
JPH0266690A (ja) 画像処理装置
JPH045780A (ja) 画像入力装置
JPS62284482A (ja) 印影読取付光学文字読取装置
KR20000018582A (ko) 스케닝 각도가 제어되는 스케너