JPS6253840B2 - - Google Patents

Info

Publication number
JPS6253840B2
JPS6253840B2 JP56084595A JP8459581A JPS6253840B2 JP S6253840 B2 JPS6253840 B2 JP S6253840B2 JP 56084595 A JP56084595 A JP 56084595A JP 8459581 A JP8459581 A JP 8459581A JP S6253840 B2 JPS6253840 B2 JP S6253840B2
Authority
JP
Japan
Prior art keywords
signal
circuit
pattern
voice
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56084595A
Other languages
English (en)
Other versions
JPS57200100A (en
Inventor
Kenji Hasegawa
Yoshihisa Tanabe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP56084595A priority Critical patent/JPS57200100A/ja
Publication of JPS57200100A publication Critical patent/JPS57200100A/ja
Publication of JPS6253840B2 publication Critical patent/JPS6253840B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)

Description

【発明の詳細な説明】 本発明は文字、図形等のパターン認識機能をも
つ装置に用いて好適する音声情報入力方式に関す
る。
従来、情報処理装置において、文字(又は図
形)情報と音声情報とを取扱う場合、文字と音声
とのパターンの性質が互に異なることから、認識
方法をそれぞれ異にしていた。従つてハードウエ
アも全く別の回路構成により実現されていた。し
かしながら、文字又は図形のパターン認識機能を
もつ装置、例えばCOR(光学的文字読取装置)
において、キーボードによる操作負担の軽減を計
るべく、音声による、コマンドの入力機能、リジ
エクト文字修正機能を持たせようとする場合、音
声パターンの認識機能部を既存の文字認識機能部
と全く別個に設けたのでは、ハードウエア量が著
しく増加して、装置の大形化、繁雑化を招くとと
もに、コストの大幅な上昇を招き、製品の実現が
困難であつた。
本発明は上記実情に鑑みなされたもので、文字
又は図形のパターン認識機能をもつ装置におい
て、既存の認識回路を有効に用い、少量のハード
ウエアを付加するのみで、安価かつ容易に音声情
報による認識機能を持たせることのできる音声情
報入力方式を提供することを目的とする。
以下図面を参照して本発明の一実施例を説明す
る。
第1図は本発明の一実施例を示すブロツク図で
ある。図中、1は文字パターンを電気信号に変換
する光電変換装置、2は音声を電気信号に変換す
るマイクロホン及び音声の特徴を抽出するために
必要な帯域フイルター群でなる音声入力部であ
る。3は光電変換装置1と音声入力部2の出力信
号を制御部14からのコントロール信号16によ
つて、振分けるマルチプレクサである。4はこの
マルチプレクサより出力された光電変換装置1又
は音声入力部2のアナログ信号をデジタル量の信
号に変換するA/Dコンバータである。5は文
字、音声によつてパターン部分の切り出しを異つ
た方法で行うため、A/Dコンバータ4より出力
される信号を別々の回路に送出制御するゲートで
ある。6はこのゲート5で選択出力された信号か
ら文字パターンを検出する検出切出し回路、7は
音声パターンを切出す音声切出し回路である。8
はコントロール信号16に従つて文字と音声パタ
ーンを振分けるマルチプレクサである。9乃至1
3は認識部の各構成要素をなすもので、9は文
字/音声のパターンを一定のサイズに収納するパ
ターン正規化回路、10はボケの操作によりパタ
ーンの雑音を除去するパターン標本化回路、11
はあらかじめ辞書として記憶された標準の文字/
音声パターンとの類似度を計算する類似度計算回
路、12は文字及び音声の標準パターンを記憶す
る記憶装置、13は類似度計算回路12より出力
された類似度値から答えを決定する回路及び後段
処理へのデータ受渡しのフオーマツトを整える回
路をもつ答え編集回路である。又、14は各認識
処理部に必要なパラメータ15、および各種コン
トロール信号を発生させるためのOCR全体をコ
ントロールする制御部である。ここで、上記光電
変換装置1、A/Dコンバータ4、検出切出し回
路6、パターン正規化回路9、パターン標本化回
路10、類似度計算回路11、記憶装置(但し音
声辞書部を除く)12、答え編集回路13、制御
部14等は既にOCRに設けられている既存の機
能ブロツクである。
第2図および第3図はそれぞれ本発明の音声入
力によるリジエクト文字修正動作を示すタイミン
グ図であり、第2図は即時モードでリジエクト文
字を修正する場合のタイミング図、第3図は一括
モードでリジエクト文字を修正するか、又は
OCRと関係なく、データエントリ用として音声
入力を実行する場合のタイミング図である。
ここで一実施例の動作を説明する。制御部14
はOCRの文字読取モードであるか、又はリジエ
クト文字修正のための音声入力識別モードである
かの判定を行ない、その判定に従い、マルチプレ
クサ3,8、ゲート5等に対して、選択制御のた
めのコントロール信号(モード信号)16を転送
する。同時に各モードに適したパラメータを選択
し、認識部を構成するパターン正規化回路9、パ
ターン標本化回路10、類似度計算回路等11、
答え編集回路13等へ転送する。ここで、OCR
モードすなわち文字読取モードの際は、通常の
OCRとしての動作を実行する。すなわち光電変
換装置1で光電変換された文字パターンがマルチ
プレクサ3を介してA/Dコンバータ4に送られ
てデイジタル量の信号に変換され、ゲート5を経
て検出切出回路6で文字の切出しが行なわれた
後、マルチプレクサ8より選択され出力される。
更にマルチプレクサ8より選択された文字情報は
認識部を構成する各回路(パターン正規化回路
9、パターン標本化回路10、類似度計算回路1
1、答え編集回路13等)を経て順次パターン認
識処理される。
次にリジエクト文字修正時(既存のOCRはこ
の期間、認識部の各回路(9〜13)が休止状態
にある)においては音声入力識別モードとなり、
音声入力部2より入力された音声は電気信号化さ
れた後、マルチプレクサ3を介し、A/Dコンバ
ータ4に送られて、デイジタル量の信号に変換さ
れた後、ゲート5を介して音声切出し回路7に送
られ、音声パターンの切出しが行なわれる。更に
音声切出し回路7より出力された音声パターンデ
ータはマルチプレクサ8を経た後、認識部を構成
するパターン正規化回路9、パターン標本化回路
10、類似度計算回路11、答え編集回路13等
を順次経て認識処理され答え編集回路13より最
終的な出力(ANS−OUT)を得る。ここで、上
述の文字パターンは2次元のビツトパターンとし
て表現され、パターン標本化回路10による処理
の段階でm次元のベクトルに変換されるが、上記
した音声パターンも一例として時間軸と帯域フイ
ルタを他方の軸とした2次元アレイとして表現で
きる。このため上述の如く、文字、音声共に共通
のハードウエアによる処理が可能となる。文字、
音声に最適な次元数等は予め制御部14に格納し
ておき、必要に応じて認識部を構成する各回路
9,10,11,13にパラメータとして供給す
る。文字パターンと音声パターンは標準パターン
として全く同じ構造をもつ記憶装置12に記憶さ
れており、必要に応じてアドレスを指示し、標本
パターンを選択する。又、類似度の計算も全く共
通のハードウエア11により実行される。類似度
計算回路11により識別された答えは、リジエク
ト文字修正の場合、答え編集回路13にて、リジ
エクトコードを音声入力の答えと置換える等の編
集を行ない、最終的な答え(ANS−OUT)を出
力する。
第2図は即時モードでリジエクト文字を修正す
る際のタイミングを示したもので、実際にはa≪
bである。又、第3図は一括モードでリジエクト
文字を修正するか、又はOCRと関係なくデータ
エントリ用として音声入力を実行する場合のタイ
ミングを示すもので、Aは秒乃至日のオーダであ
る。
上述した如く、OCRの文字認識機能部を有効
に利用して文字認識と音声認識とを任意選択的に
行なうことができ、これにより経済的に有利な構
成にて、キーボードによらず、音声によるリジエ
クト文字の修正機能、コマンド入力機能等をもた
せることができる。
なお上記した実施例では、文字パターンの認識
機能部を音声認識に共用する場合を例にとつた
が、音声と共通のパターン構造に変換できるもの
であれば、文字パターンに限らず例えば図形パタ
ーンの認識機能部等を音声認識に共用することも
できる。
以上詳記したように本発明によれば、文字又は
図形等のパターン認識機能をもつ装置において、
既存の認識回路を有効に用い、少量のハードウエ
アを付加するのみで、安価かつ容易に音声情報に
よる認識機能を持たせることのできる音声情報入
力方式が提供できる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロツク図、
第2図および第3図はそれぞれ上記実施例の動作
を説明するためのタイムチヤートである。 1……光電変換装置、2……音声入力部、3,
8……マルチプレクサ、4……A/Dコンバー
タ、5……ゲート、6……検出切出し回路、7…
…音声切出し回路、9……パターン正規化回路、
10……パターン標本化回路、11……類似度計
算回路、12……記憶装置、13……答え編集回
路、14……制御部。

Claims (1)

    【特許請求の範囲】
  1. 1 文字又は図形情報を読取る光電変換部、及び
    音声入力部と、前記光電変換部より得られる第1
    の信号又は音声入力部より得られる第2の信号の
    何れか一方を選択する第1の選択回路と、この第
    1の選択回路で選択された第1又は第2の信号を
    アナログ−デイジタル変換するA/D変換部、及
    びこのA/D変換部でデイジタル化された第1の
    信号と第2の信号とを振分けるゲートと、このゲ
    ートで振分けられた第1の信号を受けて読取パタ
    ーンの切出しを行なう第1の検出切出回路、及び
    前記ゲートで振分けられた第2の信号を受けて音
    声の切出しを行なう第2の検出切出回路と、前記
    第1の検出切出回路より得られる第1のパターン
    信号又は前記第2の検出切出回路より得られる第
    2のパターン信号の何れか一方を選択する第2の
    選択回路と、この第2の選択回路で選択された第
    1又は第2のパターン信号をそれぞれ固有のパラ
    メータ及び辞書によりパターン認識する認識部と
    を有してなることを特徴とした音声情報入力方
    式。
JP56084595A 1981-06-02 1981-06-02 Voice information input system Granted JPS57200100A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56084595A JPS57200100A (en) 1981-06-02 1981-06-02 Voice information input system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56084595A JPS57200100A (en) 1981-06-02 1981-06-02 Voice information input system

Publications (2)

Publication Number Publication Date
JPS57200100A JPS57200100A (en) 1982-12-08
JPS6253840B2 true JPS6253840B2 (ja) 1987-11-12

Family

ID=13835030

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56084595A Granted JPS57200100A (en) 1981-06-02 1981-06-02 Voice information input system

Country Status (1)

Country Link
JP (1) JPS57200100A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02116355A (ja) * 1988-10-27 1990-05-01 Toshiba Corp Ct装置

Also Published As

Publication number Publication date
JPS57200100A (en) 1982-12-08

Similar Documents

Publication Publication Date Title
CN117854492A (zh) 一种基于大模型的智能交互方法、系统、设备及存储介质
JPS6253840B2 (ja)
US6212499B1 (en) Audible language recognition by successive vocabulary reduction
JPH06337876A (ja) 文章読み上げ装置
JPS63149699A (ja) 音声入出力装置
JP3346200B2 (ja) 音声認識装置
JPS58160993A (ja) 文書編集装置の音声確認方法
WO2021166129A1 (ja) 音声認識装置、制御方法、及びプログラム
JP2757356B2 (ja) 単語音声認識方法および装置
JP2007047291A (ja) 音声通訳システムおよび音声通訳方法
JPH0313597B2 (ja)
JP3253753B2 (ja) 文書読み上げ対象テキストの整形方法および装置
JPS62113264A (ja) 音声文書作成装置
JP3428489B2 (ja) 光学文字読取装置
CN115171651A (zh) 一种儿化音合成方法、装置、电子设备及存储介质
JPS58102999A (ja) 音声認識装置
JPH04305730A (ja) 音声情報処理方法
JPH06324696A (ja) 音声認識装置及び方法
KR19980037321A (ko) 텍스트 음성합성 장치 및 방법
JPS63223696A (ja) 音声パタ−ン作成方式
JPS58115540A (ja) 音声応答システムの応答記録方式
JPH02166554A (ja) 文書読み上げ制御装置および文書読み上げ方法
JPS62164097A (ja) 音声判別方式
JPH06214594A (ja) 音声認識方法
JPH06161486A (ja) 言語認識音声出力装置