JP2655086B2 - 電話回線音声入力システム - Google Patents
電話回線音声入力システムInfo
- Publication number
- JP2655086B2 JP2655086B2 JP6138828A JP13882894A JP2655086B2 JP 2655086 B2 JP2655086 B2 JP 2655086B2 JP 6138828 A JP6138828 A JP 6138828A JP 13882894 A JP13882894 A JP 13882894A JP 2655086 B2 JP2655086 B2 JP 2655086B2
- Authority
- JP
- Japan
- Prior art keywords
- grammar
- service system
- information service
- recognition
- vocabulary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
ットワークを介して情報サービスシステムとのやりとり
を行うシステムに関する。
る方式に基づいていた。このため、音声認識装置の認識
語彙が固定されており、したがって、ユーザが情報サー
ビスシステムとネットワークを介して音声によってやり
とりを行うに際しては、情報サービスシステム側で音声
認識機能を持ち、情報サービスシステム固有の語彙や文
法情報に従って認識を行う方法をとる必要があった。
ひとつは、ユーザの音声を電話回線ネットワークを介し
て情報サービスシステムへ送る必要があるため、音声が
歪み音声認識が難しくなるという点である。音声を電話
回線で送る場合には、回線歪等の大きな歪をさけること
ができない。もうひとつの問題は、情報サービスシステ
ムは、多数のユーザの音声を受けて認識処理しなければ
ならないため、不特定話者認識処理をおこなわなければ
ならないという点である。不特定話者認識では、話者に
よっては認識性能が著しく低下するという問題がある。
なお、ユーザ毎に標準パタンを用意することにより性能
を向上させることができるが、情報サービスシステム側
で個々のユーザ毎の標準パタンを用意することは非常に
コストがかかり現実には困難である。
題点を解決するため、音声認識機能はユーザ端末側に用
意し、認識に必要な語彙文法情報を情報サービスシステ
ム側から電話回線ネットワークを介して送ってもらう。
これにより、ユーザ端末側では、ユーザ専用の標準パタ
ンを用意することにより、高い認識精度の音声認識を実
現することが可能である。こうした音声認識として、例
えば、文献1(情報処理学会第47回全国大会講演論文
集、p.2−375からp.2−376)に示されたパ
ソコン音声認識ソフトウェアを使用することが可能であ
る。このソフトウェアによれば、パソコン上に、ユーザ
専用の音声標準パタンを持った音声認識が実現できる。
力システムは、情報サービスシステムとユーザ端末とが
電話回線により接続され、該ユーザ端末から該情報サー
ビスシステムに対し音声により指示を行う電話回線音声
入力システムにおいて、前記情報サービスシステムは、
語彙文法を格納する語彙文法記憶部を備え、前記ユーザ
端末は、前記情報サービスシステムより前記語彙文法を
受け取り格納する語彙文法バッファと、該語彙文法を用
い音声認識を行う音声認識部とを備えることを特徴とす
る。
のアプリケーションによって、また、そのアプリケーシ
ョンの中の場面に応じて変わる。例えば、最初は、どの
ようなサービスを選ぶかを選択するための語彙文法が用
いられ、ついでサービス内容が決まったら、サービスに
応じて入力文の語彙文法が変わる。情報サービスシステ
ムは、サービスの選択等の制御に加えて、場面に従って
認識用語彙文法の切り替えを制御し、ユーザ端末側へ認
識用語彙文法情報を送信する。ユーザ端末側では、音声
認識を作動させるに際して、場面毎に送信されてきた文
法語彙に従って認識動作が行われるように制御する。
辞書情報と、どのような単語の並びを文として入力可能
であるかを表す単語の並びに関する文法情報から成る。
音声入力として、文発声を許容せず離散単語発声のみを
許容する場合は、単語の並びに関する文法情報は不要で
ある。
や音節のように、これらの組み合わせにより任意の単語
を表現できるユニットを認識の単位とした方式に基づく
ものでなければならない。文献1に示された音声認識は
こうした方式のものの一例である。この場合には、語彙
文法情報を情報サービスシステムから受けとり、これを
用いた認識が可能である。従来、一般に使われてきた単
語を単位として単語の標準パタンを登録する方式の音声
認識は本用途には使えない。音声認識部は、ユーザ側に
設置されるのでユーザ用に標準パタンを用意することが
可能である。これにより認識性能を向上させることが可
能であることが知られており、情報サービスシステムの
側に不特定話者認識装置を設置するより高性能の音声認
識を実現できる。また、情報サービスシステム側の音声
認識装置にユーザ用の標準パタンを実現しようとすると
高価となるが、これを避けることができる。
例えば、単語辞書情報については、単語のかな漢字表記
とカナ文字表記で与え、文法情報については、単語名を
アークとする有限状態ネットワークで与えられる。
サービスシステムであり、使用する語彙文法を認識用語
彙文法記憶部12に保持する。制御部11は、ユーザと
システムとの対話の進行場面に従って、各場面で用いら
れる語彙文法情報を語彙文法記憶部12から取り出し、
電話回線ネットワーク2を経由してユーザ端末3へ送出
する。ユーザ端末3は受信した語彙文法情報を語彙文法
バッファ22に格納する。音声認識部23は、語彙文法
バッファ22から語彙文法情報を読みだし、音声入力部
4から入力されたユーザの音声入力信号を認識し、認識
結果を制御部21、電話回線ネットワーク2を経由して
情報サービスシステム1へ送る。情報サービスシステム
1は認識結果に応じた処理、応答を行い、場面を進め
る。以上の処理がサービス完了まで繰り返される。
識用の語彙文法情報を音声認識部とは切り放し、電話回
線ネットワークを介して遠隔の情報サービスシステム側
におくことによって、高い精度の音声認識を実現するこ
とができ、これにより、電話回線ネットワークを介した
情報サービスの利便性を向上させることができる。
Claims (1)
- 【請求項1】情報サービスシステムとユーザ端末とが電
話回線により接続され、該ユーザ端末から該情報サービ
スシステムに対し音声により指示を行う電話回線音声入
力システムにおいて、 前記情報サービスシステムは、語彙文法を格納する語彙
文法記憶部を備え、 前記ユーザ端末は、前記情報サービスシステムより前記
語彙文法を受け取り格納する語彙文法バッファと、該語
彙文法を用い音声認識を行う音声認識部とを備えること
を特徴とする電話回線音声入力システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6138828A JP2655086B2 (ja) | 1994-06-21 | 1994-06-21 | 電話回線音声入力システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6138828A JP2655086B2 (ja) | 1994-06-21 | 1994-06-21 | 電話回線音声入力システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH086589A JPH086589A (ja) | 1996-01-12 |
JP2655086B2 true JP2655086B2 (ja) | 1997-09-17 |
Family
ID=15231179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6138828A Expired - Fee Related JP2655086B2 (ja) | 1994-06-21 | 1994-06-21 | 電話回線音声入力システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2655086B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7225134B2 (en) | 2000-06-20 | 2007-05-29 | Sharp Kabushiki Kaisha | Speech input communication system, user terminal and center system |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3055514B2 (ja) | 1997-12-05 | 2000-06-26 | 日本電気株式会社 | 電話回線用音声認識装置 |
CZ299508B6 (cs) * | 1999-02-19 | 2008-08-20 | Custom Speech Usa, Inc. | Systém automatické transkripce a zpusob užití dvou stupnu konverze reci a pocítacem podporovaná korekce |
JP4791699B2 (ja) * | 2004-03-29 | 2011-10-12 | 中国電力株式会社 | 業務支援システム及び方法 |
JP4658022B2 (ja) * | 2006-11-20 | 2011-03-23 | 株式会社リコー | 音声認識システム |
-
1994
- 1994-06-21 JP JP6138828A patent/JP2655086B2/ja not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
情報処理研究報告[自然言語処理]VOL.91,NO.7,P.95〜102(平成元年) |
電子情報通信学会技術研究報告[音声]SP88−25(昭和63年) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7225134B2 (en) | 2000-06-20 | 2007-05-29 | Sharp Kabushiki Kaisha | Speech input communication system, user terminal and center system |
Also Published As
Publication number | Publication date |
---|---|
JPH086589A (ja) | 1996-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5752232A (en) | Voice activated device and method for providing access to remotely retrieved data | |
US7209880B1 (en) | Systems and methods for dynamic re-configurable speech recognition | |
US7130801B2 (en) | Method for speech interpretation service and speech interpretation server | |
JP3672800B2 (ja) | 音声入力通信システム | |
US20060190268A1 (en) | Distributed language processing system and method of outputting intermediary signal thereof | |
US20020138274A1 (en) | Server based adaption of acoustic models for client-based speech systems | |
US5752230A (en) | Method and apparatus for identifying names with a speech recognition program | |
JP2002528804A (ja) | サービスアプリケーションに対するユーザインタフェースの音声制御 | |
JPH06175682A (ja) | 音声認識装置のコンテキスト切換えシステムおよび方法 | |
KR19980070329A (ko) | 사용자 정의 문구의 화자 독립 인식을 위한 방법 및 시스템 | |
JPH06214587A (ja) | 事前指定ワードスポッティングサブシステム及び事前ワードスポッティング方法 | |
US8126703B2 (en) | Method, spoken dialog system, and telecommunications terminal device for multilingual speech output | |
JP2667408B2 (ja) | 翻訳通信システム | |
JP2655086B2 (ja) | 電話回線音声入力システム | |
JPH01233560A (ja) | 自動翻訳装置 | |
Rabiner | Toward vision 2001: Voice and audio processing considerations | |
JPH1124693A (ja) | 音声認識装置 | |
CN1828723B (zh) | 分散式语言处理系统及其所使用的输出中介信息的方法 | |
JP3478171B2 (ja) | 音声認識装置及び音声認識方法 | |
JPH07175495A (ja) | 音声認識方式 | |
JP2019109567A (ja) | 電子機器、及び、電子機器の制御プログラム | |
JPH11275205A (ja) | 自動ダイヤル用音声コマンドシステム | |
JP3136038B2 (ja) | 通訳装置 | |
JP2000047684A (ja) | 音声認識方法および音声サービス装置 | |
KR100432373B1 (ko) | 독립적 음성처리를 위한 음성인식 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19970415 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090530 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100530 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110530 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110530 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120530 Year of fee payment: 15 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120530 Year of fee payment: 15 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130530 Year of fee payment: 16 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140530 Year of fee payment: 17 |
|
LAPS | Cancellation because of no payment of annual fees |