JPH07175495A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPH07175495A
JPH07175495A JP5322662A JP32266293A JPH07175495A JP H07175495 A JPH07175495 A JP H07175495A JP 5322662 A JP5322662 A JP 5322662A JP 32266293 A JP32266293 A JP 32266293A JP H07175495 A JPH07175495 A JP H07175495A
Authority
JP
Japan
Prior art keywords
voice
voice recognition
input
recognition device
output device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5322662A
Other languages
English (en)
Inventor
Kenichi Yada
健一 矢田
Hisao Yamamoto
尚生 山本
Hiromi Nagashima
広海 長島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5322662A priority Critical patent/JPH07175495A/ja
Publication of JPH07175495A publication Critical patent/JPH07175495A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【目的】 通信網を介して複数の利用者が共同利用でき
る音声認識装置を実現する。 【構成】 音声信号は話者によりそれぞれ音声特徴パラ
メータが異なる。この音声特徴パラメータを各利用者が
メモリに格納して所持し、この利用者が話者となって音
声認識装置を利用したいときに、通信回線を介して音声
認識装置にこの音声特徴パラメータを転送する。音声認
識装置はこの転送された音声特徴パラメータにしたがっ
て、音素標準パターンを作成し、音声信号を文字データ
に変換する。 【効果】 利用者が、それぞれ高性能な音声認識装置を
個々に備えることなく、コストパフォーマンスの良い音
声認識・文字データ変換システムを構築することができ
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は公衆電話網に利用する。
特に、公衆電話網の複数の加入者を対象とし、送信側話
者の音声信号を文字データに変換して受信側に伝達する
技術に関する。ここで文字データとは、文字、数字、記
号を含み、文字単体または文章として表現されるデータ
をいう。
【0002】
【従来の技術】従来から知られている音声認識装置は、
音声自体が持つ個人差や入力変動などのため、完全な自
動認識は困難であり、目的別の音声認識装置が開発され
ている。例えば、銀行業務や各種問い合わせなど、認識
に必要な語彙が比較的少ないシステムの場合には、限定
された語彙に対して不特定話者を対象とした音声認識装
置が開発されている。通常の口述音声を認識して文章に
自動変換するシステムの場合には、特定話者に限定する
ことにより認識率の向上をはかった特定話者音声認識装
置が開発されている。特定話者は音声認識装置をトレー
ニング・モードに設定して、あらかじめ定められた言葉
を入力するなどして、その特定話者の特徴パラメータを
生成し記録することが行われる。
【0003】
【発明が解決しようとする課題】音声認識装置はディク
テーション・システムに利用して有用であるが、一般
に、音声認識装置は比較的大きい規模でかつ高速のコン
ピュータ装置を必要とするので高価であって広く普及し
ていない。また、通常の口述音声を認識して文章に変換
するシステムの場合に、特定話者の音声特徴を利用する
ため、認識に先立ち口述者のサンプル音声を入力する必
要があるなど取扱いが不便である。
【0004】音声認識装置は、必ずしも個人所有として
常時使用することは必要でなく、必要なときに借入れて
利用することができれば、使用料金も安価になって広く
利用されることになるだろう。
【0005】本発明は、このような背景に行われたもの
であって、通信網を介して複数の利用者が共同に利用す
ることができる音声認識装置を提供することを目的とす
る。
【0006】
【課題を解決するための手段】本発明は、高性能な音声
認識装置を設置し、通信網を介して複数の利用者がこれ
と接続し、それぞれの利用者がその音声特徴パラメータ
を音声認識装置に転送することにより音声認識装置を共
同利用することを特徴とする。
【0007】本発明は、音声特徴パラメータが格納され
た携帯記憶手段と、この音声特徴パラメータを取込み入
力された音声信号を文字データに変換する音声認識装置
とを備えた音声認識方式である。
【0008】ここで、本発明の特徴とするところは、前
記携帯記憶手段は通信網の通信端末に接続可能であり、
前記音声認識装置はこの通信網に接続され、音声信号は
前記通信端末からこの通信網を介して伝達されるところ
にある。前記携帯記憶手段はICカードであることが望
ましい。
【0009】また、前記音声認識装置には、入力された
音声信号にしたがって音声特徴パラメータを生成する手
段と、生成された音声特徴パラメータを通信端末に転送
する手段とを備え、その通信端末にはICカードにその
音声特徴パラメータを書込む手段を備えることが望まし
い。
【0010】
【作用】本発明では、音声認識装置は例えば通信網の運
用者によって用意され、通信網に接続され、端末からの
アクセスにより接続可能なように構成されている。これ
を利用しようとする者は通信端末から特定番号をダイヤ
ルすることにより、通信網を介して交換接続により接続
される。複数の利用者は、それぞれ自分の音声特徴パラ
メータが格納されたメモリを所持している。例えば、こ
のメモリは、通信端末に着脱自在に接続され、音声認識
装置を利用するときにそのメモリに格納された音声特徴
パラメータを音声認識装置に転送する。
【0011】また、音声認識装置を用いて転送された音
声信号により音声特徴パラメータを作成することができ
る。すなわち、音声認識装置をトレーニング・モードに
設定して音声信号を入力すると、これから音声認識装置
を利用しようとしている話者の音声データの特徴に基づ
く特徴パラメータを作成することができる。本発明での
作成された特徴パラメータを通信網を介して通信端末に
伝送し、通信端末に接続された記憶装置(例えばICカ
ード)に記録することができる。このようにすることに
より、一つの音声認識装置を複数の利用者がその都度ト
レーニング・モードを設定することなく利用することが
できる。
【0012】
【実施例】本発明実施例の構成を図1および図2を参照
して説明する。図1は本発明実施例の全体構成図であ
る。図2は本発明実施例装置のブロック構成図である。
【0013】本発明は、音声特徴パラメータが格納され
たICカード5と、この音声特徴パラメータを取込み入
力された音声信号を文字データに変換する音声認識装置
1とを備えた音声認識方式である。
【0014】ここで、本発明の特徴とするところは、I
Cカード5は通信網としての公衆電話網2の通信端末で
ある電話機能付入出力装置31 に接続可能であり、音声
認識装置1はこの公衆電話網2に接続され、音声信号は
電話機能付入出力装置31 からこの公衆電話網2を介し
て伝送されるところにある。また、音声認識装置1に
は、入力された音声信号にしたがって音声特徴パラメー
タを生成する手段と、生成された音声特徴パラメータを
電話機能付入出力装置31 に転送する手段とを音素標準
パターン学習部59に備え、電話機能付入出力装置31
にはICカード5にその音声特徴パラメータを書込む手
段を備えている。また、受信側の電話機能付入出力装置
2 の入出力端子9には、表示部7およびキーボード8
が接続されている。
【0015】次に、本発明実施例の動作を説明する。図
1に示すように、送信側の電話機能付入出力装置31
送受器6から音声信号を入力して、受信側の電話機能付
入出力装置32 に接続された表示部7に文字データを出
力する場合について説明する。送信側は電話機能付入出
力装置31 から音声認識装置1を呼び出す。送信側と音
声認識装置1との呼設定が完了した後に、送信側は音声
認識装置1からの指示にしたがい、文字データの送り先
(受信側)のアドレス(電話番号)と送信側の話者の音
声特徴パラメータを音声認識装置1に転送する。この音
声特徴パラメータはICカード5に格納され、接続端子
4にこのICカード5を接続することにより、電話機能
付入出力装置31 から音声認識装置1への音声特徴パラ
メータの転送が可能になる。
【0016】音声認識装置1は、電話機能付入出力装置
1 から転送された音声特徴パラメータにしたがって音
素標準パターンを作成し、送信側に音声信号入力を指示
する。指示にしたがい、送信側の話者は音声信号を入力
する。音声認識装置1は、音声認識を行い文字データへ
の変換を行う。このとき、音声認識装置1は認識結果を
一旦送信側に提示して修正を行うようにすることもでき
る。文字データへの変換結果は、一旦蓄積した後に、電
話機能付入出力装置32 を介して受信側に送信され、表
示部7に表示される。前述したように、文字データは文
字単体または文章として表現され、文字、数字、記号が
含まれている。文字データは、受信側が情報の意味を認
識できればいかなる形でもよく、例えば単なるアスキー
コード以外にも、通信端末毎に異なる暗号であってもよ
い。
【0017】次に、音声認識装置1の動作を図3を参照
して説明する。図3は通信制御部60の動作を示すフロ
ーチャートである。呼設定、その他の通信制御は、図2
に示す通信制御部60により行われる。また、ここでは
通信制御部60は、各ブロックの動作も制御していると
して説明する。音声特徴パラメータ作成過程と音声認識
系とを切換えるスイッチ50は、通常は音声認識を行う
端子(イ)側に接続されている(S1)。電話機能付入
出力装置31 からの音声特徴パラメータは音素標準パタ
ーン記憶部51に入力され(S2)、パターンマッチン
グ用のテンプレートとしての音素標準パターンが作成さ
れる(S3)。このとき、入力される音声特徴パラメー
タは日本語すべてでも数10kb程度でよく、ICカー
ド5の容量は充分に音声特徴パラメータの格納に対応で
きる。また、転送時間も実用上問題にはならない。続い
て、電話機能付入出力装置31 の送受器6のマイクロホ
ンから入力された音声信号は、音声分析部52で音声特
徴パラメータの時系列に変換され(S4)、スイッチ5
0を介して音素認識部53に入力される。音素認識部5
3では、音素標準パターン記憶部51からの音素標準パ
ターンと入力の音声特徴パラメータとの照合を行い、音
素信号系列として出力される(S5)。音素認識された
音素記号系列は単語認識部55に入力され、単語辞書5
4を参照することにより語の切れ目毎に単語認識される
(S6)。さらに、単語認識結果は単語毎の音素記号系
列として構文解析部57に入力され、構文意味情報記憶
部56の構文および意味などに関する言語的知識に基づ
いて文章としての修正が加えられ、最終的な認識結果が
出力される(S7)。
【0018】ICカード5に未だ音声特徴パラメータが
格納されていない場合に、音声認識装置1は電話機能付
入出力装置31 からの音声信号により音声特徴パラメー
タを作成し、これを電話機能付入出力装置31 のICカ
ード5に転送する。この場合には、スイッチ50を端子
(ロ)側に接続して行う(S1)。音素標準パターン学
習部59からの、例えば「五十音を最初からゆっくりと
しゃべってください。」などの音声信号入力指示により
(S8)、適当に決められた順序で送受器6から入力さ
れた音声信号は、音声分析部52で音声特徴パラメータ
の時系列に変換され(S9)、さらに音素標準パターン
学習部59で音素標準パターン初期値記憶部58からの
初期値の音素標準パターンと単語辞書54により、音素
境界のセグメンテーションとそれに基づく音声特徴パラ
メータの平均化が行われる(S10)。結果は、再び電
話機能付入出力装置31 を介してICカード5に転送さ
れ(S11)、音声特徴パラメータとして保持される。
【0019】本発明実施例では、通信端末はICカード
5を着脱自在に収容できる電話機能付入出力装置31
2 として説明したが、音声特徴パラメータを格納する
メモリ、音声信号の送受器を含み携帯装置として構成さ
れた装置を用いて入出力端子9に接続して用いてもよ
い。さらに、音声特徴パラメータを格納するメモリ、音
声信号の送受器、表示部7、キーボード8を全て含み携
帯装置として構成された装置を用いてもよい。
【0020】
【発明の効果】以上説明したように、本発明によれば、
通信網を介して複数の利用者が共同に利用することがで
きる音声認識装置が実現できる。これにより、音声信号
を文字データに変換して利用する利用者が、それぞれ高
性能な音声認識装置を個々に備えることなく、共通に設
け安い利用料金で使用することができる。また、利用の
都度トレーニング・モードを設定して自分の音声の特徴
を記憶させる必要はなくなる。
【図面の簡単な説明】
【図1】本発明実施例の全体構成図。
【図2】音声認識装置のブロック構成図。
【図3】通信制御部の動作を示すフローチャート。
【符号の説明】 1 音声認識装置 2 公衆電話網 31 、32 電話機能付入出力装置 4 接続端子 5 ICカード 6 送受器 7 表示部 8 キーボード 9 入出力端子 50 スイッチ 51 音素標準パターン記憶部 52 音声分析部 53 音素認識部 54 単語辞書 55 単語認識部 56 構文意味情報記憶部 57 構文解析部 58 音素標準パターン初期値記憶部 59 音素標準パターン学習部 60 通信制御部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 音声特徴パラメータが格納された携帯記
    憶手段と、この音声特徴パラメータを取込み入力された
    音声信号を文字データに変換する音声認識装置とを備え
    た音声認識方式において、 前記携帯記憶手段は通信網の通信端末に接続可能であ
    り、前記音声認識装置はこの通信網に接続され、音声信
    号は前記通信端末からこの通信網を介して伝達されるこ
    とを特徴とする音声認識方式。
  2. 【請求項2】 前記携帯記憶手段はICカードである請
    求項1記載の音声認識方式。
  3. 【請求項3】 前記音声認識装置には、入力された音声
    信号にしたがって音声特徴パラメータを生成する手段
    と、生成された音声特徴パラメータを通信端末に転送す
    る手段とを備え、 その通信端末にはICカードにその音声特徴パラメータ
    を書込む手段を備えた請求項2記載の音声認識方式。
JP5322662A 1993-12-21 1993-12-21 音声認識方式 Pending JPH07175495A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5322662A JPH07175495A (ja) 1993-12-21 1993-12-21 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5322662A JPH07175495A (ja) 1993-12-21 1993-12-21 音声認識方式

Publications (1)

Publication Number Publication Date
JPH07175495A true JPH07175495A (ja) 1995-07-14

Family

ID=18146204

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5322662A Pending JPH07175495A (ja) 1993-12-21 1993-12-21 音声認識方式

Country Status (1)

Country Link
JP (1) JPH07175495A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10177469A (ja) * 1996-12-16 1998-06-30 Casio Comput Co Ltd 移動端末音声認識/データベース検索/リソースアクセス通信システム
JPH10229448A (ja) * 1997-02-13 1998-08-25 Nec Tohoku Ltd テキスト音声相互変換システム
US6498834B1 (en) 1997-04-30 2002-12-24 Nec Corporation Speech information communication system
US7050974B1 (en) 1999-09-14 2006-05-23 Canon Kabushiki Kaisha Environment adaptation for speech recognition in a speech communication system
JP2007034198A (ja) * 2005-07-29 2007-02-08 Denso Corp 音声認識システム及びそれに用いる携帯端末装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10177469A (ja) * 1996-12-16 1998-06-30 Casio Comput Co Ltd 移動端末音声認識/データベース検索/リソースアクセス通信システム
JPH10229448A (ja) * 1997-02-13 1998-08-25 Nec Tohoku Ltd テキスト音声相互変換システム
US6498834B1 (en) 1997-04-30 2002-12-24 Nec Corporation Speech information communication system
US7050974B1 (en) 1999-09-14 2006-05-23 Canon Kabushiki Kaisha Environment adaptation for speech recognition in a speech communication system
JP2007034198A (ja) * 2005-07-29 2007-02-08 Denso Corp 音声認識システム及びそれに用いる携帯端末装置

Similar Documents

Publication Publication Date Title
US7130801B2 (en) Method for speech interpretation service and speech interpretation server
US6438524B1 (en) Method and apparatus for a voice controlled foreign language translation device
US5752230A (en) Method and apparatus for identifying names with a speech recognition program
JP2002118659A (ja) 電話装置及び翻訳電話装置
JPH07175495A (ja) 音声認識方式
JP2000349865A (ja) 音声通信装置
JPH08163252A (ja) Pbx−コンピュータ連動システム
US7593387B2 (en) Voice communication with simulated speech data
KR100747689B1 (ko) 통신기기 음성인식 문자변환시스템
JPS60152A (ja) 情報システムの加入者端末用操作装置
KR100750729B1 (ko) 음성인식 문자변환기기
JP2655086B2 (ja) 電話回線音声入力システム
JP2002027039A (ja) 通信通訳システム
KR20020080174A (ko) 이동통신 단말기의 음성인식 장치 및 방법
JP2815971B2 (ja) 音声認識データ蓄積システム
JP2002218016A (ja) 携帯電話機及び携帯電話機を用いた翻訳方法
KR100277472B1 (ko) 음성인식 무선전화기에서의 화자종속 이름 및 전화번호 저장 방법
JP2000151827A (ja) 電話音声認識システム
JP2001223816A (ja) 電話機によるテキストメッセージの作成方法および装置
JPS63129765A (ja) 音声認識機能付電話機
JP2002290536A (ja) 携帯端末での電話番号登録方法
JPH04287558A (ja) 障害者用音声通信方式
JP2000122686A (ja) 音声認識装置およびそれを用いた電子機器
JP3975343B2 (ja) 電話番号登録システム、電話機、および電話番号登録方法
JPH05244276A (ja) 通信サービス方式