JPH03288900A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH03288900A
JPH03288900A JP2090714A JP9071490A JPH03288900A JP H03288900 A JPH03288900 A JP H03288900A JP 2090714 A JP2090714 A JP 2090714A JP 9071490 A JP9071490 A JP 9071490A JP H03288900 A JPH03288900 A JP H03288900A
Authority
JP
Japan
Prior art keywords
voice
recognition
section
signal
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2090714A
Other languages
English (en)
Inventor
Yasunaga Miyazawa
宮沢 康永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2090714A priority Critical patent/JPH03288900A/ja
Publication of JPH03288900A publication Critical patent/JPH03288900A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は携帯型端末を用いた音声認識装置に関する。
[従来の技術] 従来の技術では、電子通信学会バタン研究会資料、PR
L79−61に記載される会話音声認識システムのよう
に、音声入力部、特徴抽出部、認識判定部、認識結果処
理部より構成される、不特定話者用音声認識装置が知ら
れていた。
[発明が解決しようとする課題及び目的]しかし、従来
の技術では、不特定話者の音声を認識する必要性のある
装置において、不特定話者の音声認識を行うために、特
徴抽出部、認識判定部の構成が非常に複雑となり、実時
間処理を行うためのハードウェアが大規模かつ高価にな
ってしまい、認識率も低いという問題点を有していた。
現在存在する不特定話者用音声認識装置の認識率は最高
でも95%程度であり、誤認識が確実に起こるという問
題点を有している。
これは人間の音声波形が各個人によって大きく異なるこ
とに起因している。
よって本発明はこのような問題点を解決するもので、そ
の目的とするところは、不特定話者の音声を認識する必
要性のある装置において、各個人用の携帯型端末を使用
し、特定話者の音声認識を行うことによって、認識率を
高くして、音声認識部を小型化するところにある。
[課題を解決するための手段] 特定話者の音声を入力し、その入力された音声により機
械を作動させ、話者の目的とする処理を行う音声認識装
置において、音声を入力し、その音声信号をデジタル信
号に変換する音声入力部、前記音声入力部からの信号を
受け、その特徴パラメータを抽出する特徴抽出部、前記
特徴抽出部からの信号を受け、その信号を音素等の音声
コードとして認識する音声認識部、前記音声認識部から
の信号を受け、その信号を、送出する認識結果送信部、
前記認識結果送信部からの信号を受ける認識結果受信部
、前記認識結果受信部からの信号を受け、意味を解析し
、所定の対応をとる認識結果処理部を有し、前記音声入
力部、前記特徴抽出部、前記認識判定部、及び前記認識
結果送信部が携帯型端末の内部に組み込まれていること
を特徴とする。
[実施例] 以下、本発明の一実施例を図面に沿って説明する。
第1図は本発明の音声認識装置のシステム構成図である
第1図で示されるように、本発明の音声認識装置は、音
声入力部、特徴抽出部、認識判定部、認識結果送信部、
認識結果受信部、及び認識結果処理部より構成され、音
声入力部、特徴抽出部、認識判定部、認識結果送信部が
、携帯型端末の内部に組み込まれ、認識結果受信部、認
識結果処理部がシステム本体に組み込まれた構造となっ
ている。
ここで、携帯型端末の内部で行われる音声認識は、その
所有者個人の音声のみを認識する、特定話者認識である
以下に各部の説明をする。音声入力部は、マイク、高域
強調フィルタ、AD変換器より構成され、音声を8KH
z、12b i t sでサンプリングする。デジタル
信号に変換された音声信号は、特徴抽出部において、周
波数次元に変換され、その変換された信号である音声ス
ペクトルより、音声の周波数領域での特徴パラメータを
抽出する。得られた特徴パラメータを、認識判定部にお
いて、あらかしめ学習されている話者(すなわち携帯型
端末の所有者)の音素の周波数領域での特徴パラメータ
と比較することにより、どのような音素が音声とじて発
話されたのかを認識判定し、音声コード化を行う。
第3図(a)に、ある男性が発声した母音/a/の原波
形lを示す。ここで、2は時間軸であり1目盛り区間は
10m5である。第3図(b)に、その音声信号を周波
数変換した音声スペクトル包絡線3を示す。ここで、横
軸4は周波数軸であり、1目盛り区間はIKHzである
。また、縦軸5は振幅(dB)である。ここで示される
音声スペクトル包絡線3の特性は、各個人毎に非常に高
い再現性を持っている。よって特定話者の音声認識は、
その個人の各音素の周波数特性をあらかじめ学習バタン
データとして音声認識部のメモリーに保存しておき、認
識時には、発声された音声信号の周波数特性に一致する
学習バタンデータを選択することにより、発声された音
素を認識することができる。よって、本発明における音
声認識は非常にM単なアルゴリズムで遠戚できるため、
実時間で処理を行うためのハードウェアの構成も非常に
簡単となり、装置全体の小型化が可能となる。更に、特
定話者認識では、本発明のような簡単な装置においても
100%に近い認識率を得ることが可能となる。
このようにして実時間で処理され、得られた音声コード
列は、携帯型端末の内部の認識結果送信部より随時電波
によって送信され、システム本体の認識結果受信部で受
信される。受信された音声コード列は認識結果処理部に
送られ、その認識結果処理部において各システムで必要
な様々な処理が施される。
一例として、本発明の音声認識装置を切符の自動販売機
に応用した例を説明する。話者は自分の携帯型端末に向
かって、目的駅名、列車時刻、切符の枚数、指定席か否
か、等を発声することにより、システム本体がそれらの
情報を受信し、その列車の座席を予約し、金額を計算す
る等の処理を行い、切符の販売を迅速かつ正確に行う。
また、この音声認識装置は、ジュース、タバコ等の自動
販売機にも応用できる。さらに、携帯型端末より送信さ
れる信号を共通化して処理を行うことにより、全ての装
置を、各人の持つ携帯型端末によって動作させることが
可能となる。すなわち、あらゆる場所であらゆる商品を
、携帯型端末を用いて音声により購入することが可能と
なる。
更に、携帯型端末の認識結果送信部からの信号を、音波
または光として、電話回線につながる構造を加えること
により、音声による非常に膨大な情報の授受を、電話回
線を利用して、このような簡単な音声認識装置でおこな
うことが可能となる。
[発明の効果]・ 本発明の音声認識装置は、以上説明したように、音声入
力部、特徴抽出部、認識判定部、認識結果送信部を携帯
型端末の内部に組み込む構造にしたことにより、不特定
話者の音声を認識する必要性のある装置において、特定
話者音声認識により処理を行うことが可能となるため、
認識率を非常(こ高くする効果がある。
更に、携帯型端末から送出される信号は音声コードであ
るため、信号を圧縮化する効果と、それにより通信方法
を簡単化し、装置を小型化する効果がある。
【図面の簡単な説明】
第1図は、本発明の音声認識装置のシステム構成国。 第2図は、従来例の音声認識装置のシステム構成国。 第3図(a)は、ある男性が発声した母音/a/の原波
形図、第3図(b)は、母音/a/の音声信号を周波数
変換した音声スペクトル包絡線図である。 以  上

Claims (1)

  1. 【特許請求の範囲】 (a)特定話者の音声を入力し、その入力された音声に
    より機械を作動させ、話者の目的とする処理を行う音声
    認識装置において、 (b)音声を入力し、その音声信号をデジタル信号に変
    換する音声入力部、 (c)前記音声入力部からの信号を受け、その特徴パラ
    メータを抽出する特徴抽出部、 (d)前記特徴抽出部からの信号を受け、その信号を音
    素等の音声コードとして認識する音声認識部、 (e)前記音声認識部からの信号を受け、その信号を送
    出する認識結果送信部、 (f)前記認識結果送信部からの信号を受ける認識結果
    受信部、 (g)前記認識結果受信部からの信号を受け、意味を解
    析し、所定の対応をとる認識結果処理部を有し、 (h)前記音声入力部、前記特徴抽出部、前記認識判定
    部、及び前記認識結果送信部が携帯型端末の内部に組み
    込まれていることを特徴とする音声認識装置。
JP2090714A 1990-04-05 1990-04-05 音声認識装置 Pending JPH03288900A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2090714A JPH03288900A (ja) 1990-04-05 1990-04-05 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2090714A JPH03288900A (ja) 1990-04-05 1990-04-05 音声認識装置

Publications (1)

Publication Number Publication Date
JPH03288900A true JPH03288900A (ja) 1991-12-19

Family

ID=14006207

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2090714A Pending JPH03288900A (ja) 1990-04-05 1990-04-05 音声認識装置

Country Status (1)

Country Link
JP (1) JPH03288900A (ja)

Similar Documents

Publication Publication Date Title
CN1119794C (zh) 分布式话音识别系统
RU2291499C2 (ru) Способ передачи речевой активности в распределенной системе распознавания голоса и система для его осуществления
TW557443B (en) Method and apparatus for voice recognition
TW561453B (en) Method and apparatus for transmitting speech activity in distributed voice recognition systems
US8768701B2 (en) Prosodic mimic method and apparatus
JP2002536692A (ja) 分散された音声認識システム
JPH10260692A (ja) 音声の認識合成符号化/復号化方法及び音声符号化/復号化システム
JPS63502145A (ja) 音声認識システムにおけるデ−タ整理の最適方法
US20030061049A1 (en) Synthesized speech intelligibility enhancement through environment awareness
CN111246469B (zh) 人工智能保密通信系统及通信方法
US11763801B2 (en) Method and system for outputting target audio, readable storage medium, and electronic device
JPS63502302A (ja) 外部のボイシングまたはピッチ情報を使用することなく音声を合成する方法および装置
JP3473204B2 (ja) 翻訳装置及び携帯端末装置
US20030135371A1 (en) Voice recognition system method and apparatus
EP0071716A2 (en) Allophone vocoder
JP2000349865A (ja) 音声通信装置
EP1298647B1 (en) A communication device and a method for transmitting and receiving of natural speech, comprising a speech recognition module coupled to an encoder
JPH03288900A (ja) 音声認識装置
CN111199747A (zh) 人工智能通信系统及通信方法
KR100369732B1 (ko) 전문가 시스템을 이용한 음성인식 기반의 지능형 대화장치 및 그 방법
JPH046600A (ja) 音声認識装置
JP2002073074A (ja) 音声による数字列認識方法ならびに装置
KR100553437B1 (ko) 음성 합성을 이용한 음성 메시지 전송 기능을 가지는무선통신 단말기 및 그 방법
JP7296214B2 (ja) 音声認識システム
JPH04324499A (ja) 音声認識装置