JP2845876B2 - 音声情報処理方法 - Google Patents

音声情報処理方法

Info

Publication number
JP2845876B2
JP2845876B2 JP62157625A JP15762587A JP2845876B2 JP 2845876 B2 JP2845876 B2 JP 2845876B2 JP 62157625 A JP62157625 A JP 62157625A JP 15762587 A JP15762587 A JP 15762587A JP 2845876 B2 JP2845876 B2 JP 2845876B2
Authority
JP
Japan
Prior art keywords
voice
information
card
transmitted
switching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62157625A
Other languages
English (en)
Other versions
JPS643700A (en
Inventor
隆 麻生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP62157625A priority Critical patent/JP2845876B2/ja
Publication of JPS643700A publication Critical patent/JPS643700A/ja
Priority to US08/174,172 priority patent/US5497446A/en
Application granted granted Critical
Publication of JP2845876B2 publication Critical patent/JP2845876B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Facsimiles In General (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、通信回線を介して転送された音声を認識す
る音声認識方法に関する。 [従来の技術] 一般に、電話から入力した音声を認識するシステムが
知られている。これらシステムの多くは予め送話者の音
声から抽出したもしくは音声の特徴パターンをパラメー
タとしてメモリに登録されており、音声認識回路がメモ
リに記憶された特徴パターンと電話から送られてくる送
話者の音声(単語)を比較し、送話者が送る音声(単
語)と同じ音声の特徴パターンを持つものを抽出するこ
とにより、音声の意味する単語を認識している。 [発明が解決しようとする問題点] ところが、このようなシステムを多くの人が使用する
場合は、各話者ごとに音声を音声認識回路に登録する作
業が必要であり、話者の数が多くなると各話者の音声を
記憶しておくメモリ容量が膨大となってしまうという問
題点があった。 不特定話者についての音声認識を行う回路も考えられ
ているが、音声の認識確率が低く、未だ実用化に到って
いないのが現状である。 そこで、本発明の目的は、このような問題点を解決
し、大多数の不特定話者が発生する音声を確実に認識で
きる音声認識方法を提供することにある。 [問題点を解決するための手段] このような目的を達成するために、本発明は、相手側
端末に送信する音声を入力する為の音声入力装置と、該
音声の認識に使用する音声の特徴情報を記憶した記憶装
置から前記音声の特徴情報を読み取るための読み取り装
置とを通信回線に対して切り換え装置により切り換え接
続可能な音声情報処理方法であって、前記音声の特徴情
報を前記記憶装置から前記読み取り装置により読み取
り、当該読み取られた音声の特徴情報を、前記切り換え
装置により接続された通信回線を介して相手側端末に送
信し、前記音声の特徴情報が相手側端末に正常に送信さ
れたことを該相手側端末が判定したことにより該相手側
端末が発信する正常受信終了信号を受信し、前記正常受
信終了信号の受信に応じて、前記相手側端末に接続され
ている通信回線を前記読み取り装置から前記音声入力装
置に切り換えるよう、前記切り換え装置を制御すること
を特徴とする。 [作用] 本発明では、相手側端末と情報を送受信するための通
信回線を読み取り装置に接続し、音声入力装置により入
力される音声を認識する場合に用いる音声の特徴情報
を、読み取り装置により記憶装置から読み取り、読み取
られた音声の特徴情報を、接続された通信回線を介して
相手側端末に送信し、音声の特徴情報が相手側端末に正
常に送信されたことを該相手側端末が判定したことによ
り相手側端末が発信する正常受信終了信号を受信し、正
常受信終了信号の受信に応じて、相手側端末に接続され
ている通信回線を読み取り装置から音声入力装置に切り
換えるよう、前記切り換え装置を制御する。 [実施例] 以下に、図面を参照して本発明の一実施例を詳細に説
明する。 第1図は本発明実施例における構成の一例を示す。 第1図において、11はカードリーダであり、このカー
ドリーダ11は磁気カードや光のカードを読み取る一般的
に知られているものを使用することができる。カードに
予め書き込まれた第2の音声情報としての音声における
特徴パターンを読み取る。なお、上記カードには、音声
の特徴パターンとして使用するための予め定められた文
字列に対応する音声情報が記録されている。12は制御部
であり、制御部12はカードリーダ11により読み取られた
音声の特徴パターンを公衆回線に対して出力するように
制御する。 13は第1の音声情報としての音声の入出力を行う受話
器であり、14はカードリーダ11から読み取られた音声の
特徴パターンおよび受話器と送受信する音声情報を択一
的に公衆回線に接続する切り換え部である。 20は公衆回線から送られてくる情報をその種類に応じ
てカードデータ格納部21もしくは音声認識部22へ切り換
え接続する切り換え部である。21は音声の特徴パターン
を記憶しておくカードデータ格納部である。 22は受話器13から送られていくる音声情報の意味を音
声の特徴パターンに基いて認識する音声認識部である。
なお、この音声の特徴パターンはカードデータ格納部21
に記憶された音声の特徴パターンが用いられる。 23は情報処理機器などの電子機器であり、情報処理機
器は音声認識部22により認識されたメッセージ内容に対
応した処理を行う。 動作説明に先立って、このような構成における制御部
12,カードデータ格納部21および音声認識部22の具体的
な構成例について説明する。 第2図は本発明実施例における制御部12の構成の一例
を示す。 第2図において、15はカードリーダ11により読み取ら
れた音声の特徴パターンに関する信号を演算処理装置
(CPU)16に転送するインタフェースである。16は本発
明に係わる第4図示の制御手順を実行するCPUである。1
7は第4図示の制御手順の他、公衆回線へ情報を転送す
るための制御手順を記憶するメモリである。18はCPU16
に送受信される情報を転送するインタフェースである。 19はモデムと呼ばれるアナログデジタル(A/D)変換
・デジタルアナログ(D/A)変換器である。CPU16が処理
する信号はデジタル信号であり、公衆回線が伝える信号
はアナログ信号であるので、モデム19により信号の入出
力に応じて信号をA/D変換もしくはD/A変換を行う。 第3図は本発明実施例におけるカードデータ格納部21
と音声認識処理部の構成の一例を示す。 第3図において、24はモデムであり、25はインタフェ
ースである。26はCPUであり、CPU26は第5図の制御手順
(ステップS24→S28)の処理を実行する。27は公衆回線
を介して送られてきた音声の特徴パターンを記憶してお
く書き換え自在のメモリである。 28は受話器13から送られてきた音声信号をA/D変換す
るA/D変換器である。29はインタフェースである。30は
デジタル変換された音声信号を記憶しておくメモリであ
る。 31はCPUであり、CPU31はカードデータ格納部21のメモ
リ27に格納された音声の特徴パターンに基いて、メモリ
30に格納された音声の認識処理(第5図ステップS30→S
34)を行う。 32はCPU31から送られる制御信号を情報機器23に転送
するインタフェースである。 次に、このような構成における本実施例の動作を第4
図および第5図のフローチャートを参照しながら説明す
る。 第4図は送信側の処理手順の一例を示す。 第4図において、装置利用者がカードをカードリーダ
11に挿入する。そして次に、利用者が受信側の電話番号
を受話器13によりダイヤルし、送信側と受信側の接続を
行う(ステップS13〜S14)。制御部12が受信側との公衆
回線の接続を確認すると、制御部12から切り換え指示信
号を切り換え部14に送り、公衆回線と制御部12とを接続
する(ステップS15)。 次に、制御部12はカードリーダ11にカードから音声の
特徴パターンを読み取るように指示する。すると、カー
ドリーダ11は、カードから読み取った音声の特徴パター
ンを制御部12へ送信する(ステップS16)。 制御部12においては、この音声の特徴パターンをCPU1
6が受信すると、CPU16は音声の特徴パターンをメモリ17
に格納する(ステップS17)。次に、CPU16はメモリ17に
記憶されている音声特徴パターンに関するデータを、公
衆回線を転送するための通信コード体系に従って符号化
を行い、モデム19より公衆回線に出力する(ステップS1
9)。 なお、CPU16は受信側から送られてくる送信情報の受
取りを確認する制御信号を受信し、音声の特徴パターン
の通信にエラーが生じたことを検出したときは、ステッ
プS18に戻り、メモリ17に記憶してある音声の特徴パタ
ーンの送信をやり直す。 音声の特徴パターンの送信が正常に終了したことをCP
U16が確認すると(ステップS20)、CPU16は切り換え部1
4に対して、公衆回線の接続を受話器13へ切り換えるよ
うに指示し、切り換え部14により公衆回線の接続を切り
換える(ステップS21)。 以後、操作者が受話器13により音声により必要なメッ
セージを受信側に送信すると、CPU16は、公衆回線を遮
断し、本制御手順を終了する(ステップS22〜S23)。 次に、受信側の情報処理について第5図を用いて説明
する。 第5図において、受信側において公衆回線との接続が
なされると(ステップS24)、音声認識部22は、切り換
え部20に指示を行い、公衆回線とカードデータ格納部21
を接続する(ステップS25)。 次に、送信側から送られてくる音声の特徴パターンを
カードデータ格納部21のCPU26がメモリ27に記憶する
(ステップS27)。 なお、CPU26は入力情報のコード形態をパリティチェ
ックなどにより確認し、入力情報に異常が生じたときは
エラー情報を送信側に送り、ステップS26から情報の受
信をやり直す。 入力情報が正常なときは、CPU26は音声認識部22のCPU
31に制御を渡す(ステップS28)。 CPU31は、公衆回線を音声認識部22と接続するように
切り換え部20に指示し、送信側から送られてくる送話者
のメッセージを受信する(ステップS29〜S30)。 なお、このメッセージはCPU31によりメモリ30に記憶
される。上記メッセージの受信が終了するまで、CPU31
は、メモリ27に格納された音声の特徴パターンに基い
て、送話者のメッセージが何であるかを認識し、認識結
果に対応した情報処理を、例えば、機器の作動や中止を
情報処理機器23へ指示する(ステップS31〜S33)。送信
側との通話が終了すると、CPU31は公衆回線を遮断し、
本制御手順を終了する。 このように、受信側では送信側から最初に送られてく
る音声の特徴パターンを書き換え自在なメモリ27に記憶
しておき、その後送話者が送るメッセージの内容をメモ
リ27に記憶してある音声の特徴パターンに基き認識する
ので、不特定多数の送信側と交信する場合でも送話者の
音声の特徴パターンのそれぞれを予め受信側のメモリに
登録しておく必要がなくなる。 なお、本実施例の利用形態として、音声の特徴パター
ンはカードを使用する利用者が例えば予めマイクなどか
ら“1"〜“10"までの音声を入力し、入力された音声デ
ータを磁気記録カードや光記録カードに書き込んでお
く。そして本実施例において、送話者が“1"〜“10"な
どのメッセージを受信側に送ると、受信側では最初に送
信されてきた“1"〜“10"の音声の特徴パターンに基い
て、送話者が発生する音声が“1"〜“10"のいずれの数
字かを識別することになる。一例として音声の特徴パタ
ーンとして数字を説明したが、数字に限らず、合い言葉
を用いても可能である。 従って、受信側では、カードを使用している送話者の
音声がカードに登録された音声と一致しているか否かを
も確認することが可能であり、カードの不正利用を防ぐ
ことができる。この不正利用の防止率は、キーワードな
どをキーボードから入力してカードの持ち主とシステム
利用者が一致していることを確認するシステムよりもず
っと高くなる。 次に音声の認識方法については音声の周波数分析を行
い、音声の特徴パターンについての周波数分析結果との
比較を行うDPマッチング(動的計画法)などが知られて
おり、さらに、この比較を行う処理をLSI(集積回路)
化した演算処理回路が知られているので、このLSIを用
いると受信側の装置を小型化できる。 さらに、音声の特徴パターンに使用する特徴パラメー
タとして、音声のピッチ、一定期間ごとの周波数スペク
トルの時間的な推移、ホルマントの位置の推移などが考
えられるが、これは音声認識部22で認識する対象が何で
あるか(例えば限定された単語単位での認識、単音節単
位での認識など)により、その認識に最も必要なパラメ
ータの抽出を行うべきである。 [発明の効果] 以上説明したように本発明では音声の認識に用いる音
声の特徴情報が相手側端末に正常に送信されたことの認
識に応じて、通信回線の接続を音声の特徴情報を読み取
った読み取り装置から音声入力装置に切り換えるので、
音声の特徴情報と認識対象となる音声という異なる種類
の情報を送信を的確に送信できる様な回線の切り替えを
確実に行うことができる。加えて、これにより音声認識
も確実に行える様になる。
【図面の簡単な説明】 第1図は本発明実施例におけるシステム構成の一例を示
すブロック図、 第2図は本発明実施例の制御部12の構成の一例を示すブ
ロック図、 第3図は本発明実施例のカードデータ格納部21および音
声認識部22の構成の一例を示すブロック図、 第4図および第5図は本発明実施例における動作手順の
一例を示すフローチャートである。 11……カードリーダ、12……制御部、13……受話器、1
4,20……切り換え部、21……カードデータ格納部、22…
…音声認識部、23……情報処理機器。

Claims (1)

  1. (57)【特許請求の範囲】 1.相手側端末に送信する音声を入力する為の音声入力
    装置と、該音声の認識に使用する音声の特徴情報を記憶
    した記憶装置から前記音声の特徴情報を読み取るための
    読み取り装置とを通信回線に対して切り換え装置により
    切り換え接続可能な音声情報処理方法であって、 前記音声の特徴情報を前記記憶装置から前記読み取り装
    置により読み取り、 当該読み取られた音声の特徴情報を、前記切り換え装置
    により接続された通信回線を介して相手側端末に送信
    し、 前記音声の特徴情報が相手側端末に正常に送信されたこ
    とを該相手側端末が判定したことにより該相手側端末が
    発信する正常受信終了信号を受信し、 前記正常受信終了信号の受信に応じて、前記相手側端末
    に接続されている通信回線を前記読み取り装置から前記
    音声入力装置に切り換えるよう、前記切り換え装置を制
    御することを特徴とする音声情報処理方法。
JP62157625A 1987-06-26 1987-06-26 音声情報処理方法 Expired - Lifetime JP2845876B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP62157625A JP2845876B2 (ja) 1987-06-26 1987-06-26 音声情報処理方法
US08/174,172 US5497446A (en) 1987-06-26 1993-12-29 Speech information processing method and apparatus connectable to a public line

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62157625A JP2845876B2 (ja) 1987-06-26 1987-06-26 音声情報処理方法

Publications (2)

Publication Number Publication Date
JPS643700A JPS643700A (en) 1989-01-09
JP2845876B2 true JP2845876B2 (ja) 1999-01-13

Family

ID=15653820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62157625A Expired - Lifetime JP2845876B2 (ja) 1987-06-26 1987-06-26 音声情報処理方法

Country Status (2)

Country Link
US (1) US5497446A (ja)
JP (1) JP2845876B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2739990B2 (ja) * 1989-02-17 1998-04-15 株式会社日立製作所 操作システム
JPH10143191A (ja) * 1996-11-13 1998-05-29 Hitachi Ltd 音声認識システム
FI105859B (fi) 1997-02-21 2000-10-13 Nokia Mobile Phones Ltd Menetelmä digitaalisen signaalinkäsittely-yksikön audioparametrien asettamiseksi elektroniikkalaitteessa ja elektroniikkalaite
US6236715B1 (en) 1997-04-15 2001-05-22 Nortel Networks Corporation Method and apparatus for using the control channel in telecommunications systems for voice dialing
JP4524016B2 (ja) * 1999-12-08 2010-08-11 クラリオン株式会社 車載用電子装置
US20050240407A1 (en) * 2004-04-22 2005-10-27 Simske Steven J Method and system for presenting content to an audience

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BE787377A (fr) * 1971-08-09 1973-02-09 Waterbury Nelson J Cartes de securite et systeme d'utilisation de telles cartes
US4053710A (en) * 1976-03-01 1977-10-11 Ncr Corporation Automatic speaker verification systems employing moment invariants
JPS60243768A (ja) * 1984-05-18 1985-12-03 Oki Electric Ind Co Ltd クレジツト方式
JPS61230459A (ja) * 1985-04-04 1986-10-14 Olympus Optical Co Ltd 音声対応無人サ−ビス装置

Also Published As

Publication number Publication date
JPS643700A (en) 1989-01-09
US5497446A (en) 1996-03-05

Similar Documents

Publication Publication Date Title
US7050573B2 (en) Method of generating ring tones using melody and communication terminal apparatus
US5910997A (en) Digitally programmable hearing aid communicable with external apparatus through acoustic signal
JP2001308970A (ja) 携帯電話の音声認識操作方法及びシステム
JP2845876B2 (ja) 音声情報処理方法
US6424822B1 (en) Communication device and method of operation
US5499318A (en) Method and apparatus for access control based on an audible uttering and timing of the audible uttering
US6836668B1 (en) Portable communication apparatus with voice/character conversion direction switch
KR19990015749A (ko) 음성을 인식하여 전자우편
JP3058064B2 (ja) ディジタル無線電話装置
KR101002905B1 (ko) 음성 인식을 이용한 유·무선 단말기 제어 방법 및 그유·무선 단말기
EP0942571A1 (en) Communication device and method of operation
KR100811554B1 (ko) 음성 다이얼링 기능을 갖는 통신 단말기 및 음성 다이얼링방법
JP3278595B2 (ja) 携帯電話
JPH0983633A (ja) 受信装置
JP3119698B2 (ja) コードレス電話機
KR100229766B1 (ko) 메모리된 전화번호를 페이저로 확인하는 방법
JP2970244B2 (ja) ディジタル交換通信装置
JP2000174878A (ja) 通信装置
JP2000151827A (ja) 電話音声認識システム
JPH08307366A (ja) 音声符号化装置
JPH05219176A (ja) 音声認識電話機
JPH05316186A (ja) 音声認識電話機
JP3107097B2 (ja) 電話装置
KR19980067722A (ko) 메모리된 전화번호를 외부에서 확인하는 방법
KR19980067882A (ko) 전화단말기의 통화중 녹음메시지 전송방법

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071030

Year of fee payment: 9