JPS6348946A - 音声認識処理方式 - Google Patents

音声認識処理方式

Info

Publication number
JPS6348946A
JPS6348946A JP61192283A JP19228386A JPS6348946A JP S6348946 A JPS6348946 A JP S6348946A JP 61192283 A JP61192283 A JP 61192283A JP 19228386 A JP19228386 A JP 19228386A JP S6348946 A JPS6348946 A JP S6348946A
Authority
JP
Japan
Prior art keywords
voice
voice recognition
signal
recognition
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61192283A
Other languages
English (en)
Inventor
Yoshio Ogawa
小川 良夫
Tadayoshi Komachiya
小町谷 忠芳
Sadaji Emori
貞治 江守
Katsumi Hosoya
細谷 克美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP61192283A priority Critical patent/JPS6348946A/ja
Publication of JPS6348946A publication Critical patent/JPS6348946A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は音声認識を利用した電話サービスを提供する
ための音声認識処理装置(二おける音声V、侃識処理方
式に関するものである。
「従来の技術」 電話交換機にトランク形音声認識処理装置等を付加し5
発/着信に対応するガイダンスの送出に伴う詮声入力信
号を上記装置内の音声認識機能を利用して認識し、この
認識結果(一応じて電話サービスメニューを自動選択で
きるシステムが実現しつつある。
このようなシステム(二おいて音声認識を利用した電話
サービスを提供する従来の付加トランク形音声認識処理
装置は第4図(二示す構成をとっていた。音声認識処理
装置11は溝内電話交換機などの′世話交換機12と多
重回線13(二より接続されている。電話機11〜IK
からの音声信号はPBX等の電話交換機12を介して多
重化され、音声認識処理装置11に入力される。この信
号は次C二信号分配器(DMPX)14により独立した
回線信号(二分配され、各音声信号は有音/無音検出回
路(以下DETと略記)21〜2Nおよび音声認識部(
以下VRUと略記)3.〜3N(K>N)(164人力
される。ある回線において音声認識が必要な時点(音声
認識フェーズ)(二なると、CPUC中央処理装置)1
5はその回線(二対窓したVRUへ音声認識開始を命す
る。この命令(二よりそのVRUは音声認識処理を実行
可能となる。
この音声認識フェーズ(:入ってからCPU15は回線
(二対窓したDETの出力値を読み出すことにより音声
入力があったか否かを判定しており(例えば有音区間で
は″1″、無音区間ではo”)、音声入力があった場合
は有音区間から一定期間以上の無音区間が続いたら音声
人力終了と判定し、そのVRUに音声認識終了を命する
。また音声認識フェーズし入ってから一定期間以上無音
区間が続いた場合は音声入力なしと判定し、VRUに音
声認識終了を命するとともに、音声認識フェーズを終了
し次の処理へ移る。
このよう(二従来の技術では1回線に1台のVRUを対
応させるため(文献:吉用他”音声ダイヤル方式の検討
(3)電子通信学会技術報告S E 8 =1−138
参照)、音声認識を利用した電話サービスを同時に提供
すべき回線の数だけV RUが必要となる問題があった
。また1回の電話サービスの時間は通常数十秒以上であ
り、この期間中VRUは保留されるが、認識すべき音声
信号は通常数秒であり、さらに1回の電話サービス(発
呼から終話までの間)で通常数回の音声信号が認識され
るため、VRUの利用率は極めて低くなるという問題が
あった。
この発明の目的は、高価なVRUの所要数を削減し経済
化を図ると共に、VRU利用率を向上することにある。
この発明の音声認識処理方式では、交換機トランクイン
タフェースからの音声入力信号を一旦格納するメモリ手
段と、この音声入力信号な需視して有音信号を検出する
有音検出手段と、複数の音声認識手段と、各手段間のデ
ータ転送制御を行う転送制御手段と、これら各手段間を
接続する結合手段とが設けられた電話交換機の付加トラ
ンク形音声認識処理装置において、少なくとも有音判定
(二係わった直曲の音声人力信号から以降の無音判定ま
での音声入力信号を前記メモリ手段C二格納するよう+
−17+1 i卸すると共(二、有音検出手段による有
音信号検出時点を契機(二、前記転送制御手段は2空き
の音声認識手段がある場合(二は直も(二それを捕捉し
、空きの音声認識手段がない場合には少なくとも一つの
音声認識手段が空いてからそれを捕捉し、前記メモリ手
段に格納中の認識すべき音声入力信号を、捕捉した音声
認識手段に最初から順(二転送して認識動作を行い、引
き続き音声入力信号を監視中の有音検出手段が一定期間
以上の無音信号を検出した時点を契機C二、捕捉した音
声認識手段の対応した有音区間の認識動作を完了させて
この手段を解放する。
従来の技術では利用可能なVRUの選択を認識すべき音
声入力信号単位(二は行っておらず、単(二発呼から終
話まで利用可能なV RU fx長時間保留していた。
この発明は交換機トランクインタフェースから認識すべ
き音声入力信号単位に、利用可能なVRUを選択するこ
とを最も主要な特徴としており、この点で従来の技術と
異なる。
「実施例」 以下、この発明の一実施例(二ついて図面によす説明す
る。第1図はこの発明の一実施例の構成図を示す。第1
図(二おいて電話機11〜IKからの音声信号は電話交
換機12を介して多重化され、音声認識処理装置11に
入力される。この信号は次(二信号分配器(DMPX)
14により独立し定置線信号(二分配され、各回線信号
は有音/無音検出回路(以下DETと略記)2、〜2H
+二人力されるとともにメモリ21へ一旦格納される。
各DET21〜2Nでは入力される音声信号のレベル@
(量子化値)tサンプル周期(例えば125μ5EC)
毎(二積算しており、一定のサンプル数(フレームと呼
ぶ)毎(二この累積値を算出する。各D E T 2゜
〜2Nは、この累fM fUがあらかじめ設定したしき
い値を越えた場合、そのフレームを有音区間と判定し、
しきい値以下では無音区間と判定する。
この判定結果は転送路(例えば共通〕(ス)22を通じ
て転送制御部23により読み出され、転送側i卸部23
はある一定数の有音区間が続いたDET&検出すると、
利用可能なVRUを探す。もし利用可能なVRUがある
場合は、転送制御部23はこの利用可能なV RU l
−音声認識開始を命じ、認識すべき音声信号乞メモリ2
1から読み出し、上記認識開始を命じたVRUヘデータ
転送する。
またもし利用可能なVRUが無い場合は、転送制御部2
3は少なくとも一つのVRUが空きになるかどうかを監
視し、空きのVRUを探した後に1これに音声認識開始
を命じて認識すべき音声信号をメモリ21からこのV 
RUへ小云送する。VRUでは転送制御部23からの音
声認識開始の命令(二より音声認識処理を開始する。一
方、DET2.〜2Nでは常に有音/無音区間の判定を
行っているが。
有音区間からある一定数の無音区間(1変化したDET
を転送制御部23が検出すると、転送制御部23はその
回線からの音声入力信号の認識2行っていたVR1J+
二音声認識終了を命じてそのVRUを解放する。
以上述べたこの発明の動作服念を第2図に示す。
同図で有音区間は音声信号が存在していること?示す。
電話機から出力された音声信号が1番目の回線(二人力
されるとこの回線(二対窓しているDET21が有音区
間の先頭を検出する。同図は有音検出の時点では、VR
U3.〜3Mの全てが音声認識処理中で他の音声信号を
受信不可である場合を想定したものであり、メモIJ 
21へ回線iの音声信号が格納される。vRU3Jの認
識処理終了を命じると、転送制御部z3はその利用可能
となったVRU3jを捕捉後、vRu3jへ音声認識開
始を命すると共(二、−旦メモリ21(二格納した回線
iの音声信号を■RU3jへ転送する。一方、DET2
1で有音区間から無音区間への変化を検出すると、転送
制御部23は■RU3Jへ音声認識終了を命じる。これ
によりvRu3jは解放され次の音声信号の受信が可能
となる。
「発明の効果」 以上説明したよう(二、この発明の方式を適用した音声
認識処理装置では、認識すべき音声人力信号単位(二、
利用可能なVRUを選択するので、必要となるVRUの
台数を交換機との回線数よりも少なくすることが可能で
あり、音声認識を利用した電話サービスの経済化が図れ
る。以下では上記回線数と必要なVRUの台数の関係(
一ついて述べる。
解析モデル ここでは複数のサーバ(VRU)のトラヒックモデルC
M/M/S型の待ち行列モデル)を用いて解析した(第
3図)。すなわち認3j1丁べき音電信号は電話端末か
らランダム(二発生し、音声認識時間(サービス時間)
は指数分布?とるものとする。またVRUは認識すべき
音声信号の入力と同時(二音声認識処理を開始しくVR
Uの捕捉)、上記音声信号の人力後ただち(二認識処理
を終了するものとする(VRUの開放)。
この解析ではVRUY捕捉するための平均待ち時間(列
平均待ち時間)により、妥当なVRUの台数を推定する
。M/M/Sヤ1待ち行911での列平均待ち時間W、
は次式で表わされる(木間鶴千代「待ち行列の理論」理
工学社、等7参l!(i )。
1% = SS lす”−Po/〔SIμ(l−ρ)2
:)−式(1)%式%):)) ここで、S:サーバ数(VRUaの台数)、μ:平均サ
ービス時間(平均音声認識時間)、ρ:サーバ(VRU
)(7)利In率(〈1)、a:全サーバ(全VRU)
に加わる総トラヒック数(erl数)である。
■単語発声の時間は1m常数秒であるので平均サービス
時間μ(平均音声認識時間)暑ここでは2秒とした。電
話端末100台、l電話端末当りの呼Fq O,l 5
 erl、平均端末保留時間80秒、1発呼当り音声認
識回数を2回とするとa = Q、75 erlとなる
y−bの条件におけるVRUの台数とVRUを捕捉する
ための平均待ち時間の関係を表1(二示す。
但し、筒表では平均待ち時間を平均サービス時間μ;二
より正規化した。
表I  VRUの台数と VRUを捕捉するための正規化平均 h:平均待ち時間、μ:平均音声認識時間=2秒%a:
全V RU CjlDわろ総トラヒック数=Q、75e
rl この表より、この発明の音声認識処理装置(二おいて、
VRU’&4〜8台設ければ平均待ち時間はほとんど問
題にならない。一般f二電話端末100台に対して交換
機に約32回線分のサービストランクを用意するのが通
例であり、従来の技術では32台程度のVRUが必要と
なる。従ってこの発明の必用(二より、必要なVRUの
台数を1/4〜1/8と大幅に削減できる。
【図面の簡単な説明】
?51図はこの発明の一実施例の構成暑示すブロック図
、第2図はこの発明の一実施例の動作概念を示す図、第
3図はトラヒック解析モデルを説明する図、第4図は従
来の付加トランク形の音声認識装置の構成を示すブロッ
ク図である。 特許出願人  日本電信電話株式会社 代  理  人   草   野     卓うせ  
1  じ]            普Pま5言虹久化
工里狡1【オ 2 図 j弓準埠ヨーM級軒罎−一 オ 3 Z 第4 図 音声認識処理装置

Claims (1)

    【特許請求の範囲】
  1. (1)電話交換機の付加トランク形音声認識処理装置に
    おいて、 上記電話交換機のトランクの回線数設けられ、その交換
    機トランクインタフェースからの音声入力信号を監視し
    て有音信号を検出する有音検出手段と、 上記音声入力信号を一旦格納するメモリ手段と、 上記回線数より少ない複数の音声認識手段と、各手段間
    のデータ転送制御を行う転送制御手段と、 これら各手段間を接続する結合手段とを備え、少なくと
    も有音判定に係わつた直前の音声入力信号から以降の無
    音判定までの音声入力信号を上記メモリ手段に格納する
    ように制御すると共に、 上記有音検出手段による有音信号検出時点を契機に、上
    記転送制御手段は、空きの音声認識手段がある場合には
    直ちにそれを捕捉し、 空きの音声認識手段がない場合には少なくとも一つの音
    声認識手段が空いてからそれを捕捉し、 上記メモリ手段に格納中の認識すべき音声入力信号を、
    捕捉した音声認識手段に最初から順に転送して認識動作
    を行い、 引き続き音声入力信号を監視中の有音検出手段が一定期
    間以上の無音信号を検出した時点を契機に、捕捉した音
    声認識手段の対応した有音区間の認識動作を完了させて
    その手段を解放することを特徴とする音声認識処理方式
JP61192283A 1986-08-18 1986-08-18 音声認識処理方式 Pending JPS6348946A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61192283A JPS6348946A (ja) 1986-08-18 1986-08-18 音声認識処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61192283A JPS6348946A (ja) 1986-08-18 1986-08-18 音声認識処理方式

Publications (1)

Publication Number Publication Date
JPS6348946A true JPS6348946A (ja) 1988-03-01

Family

ID=16288700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61192283A Pending JPS6348946A (ja) 1986-08-18 1986-08-18 音声認識処理方式

Country Status (1)

Country Link
JP (1) JPS6348946A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001320490A (ja) * 2000-03-29 2001-11-16 Lucent Technol Inc 通話者入力レート制御方法、通話者入力レート制御システム、及び通話者入力レート制御装置
JP2008015209A (ja) * 2006-07-05 2008-01-24 Kddi Corp 音声認識装置およびその認識辞書更新方法、プログラムならびに記憶媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001320490A (ja) * 2000-03-29 2001-11-16 Lucent Technol Inc 通話者入力レート制御方法、通話者入力レート制御システム、及び通話者入力レート制御装置
JP2008015209A (ja) * 2006-07-05 2008-01-24 Kddi Corp 音声認識装置およびその認識辞書更新方法、プログラムならびに記憶媒体

Similar Documents

Publication Publication Date Title
EP0515068B1 (en) Automated voice system for improving agent efficiency and for improving service to parties on hold
CA1243790A (en) Equipment for sending digitally pre-stored voice announcements to the subscribers connected to a telephone network
JPH07177229A (ja) 電話の呼処理方法とその装置
US4640992A (en) Speech response interface circuit
US6556676B1 (en) Adapter card implementing a time-shared digital signal processor
JPS6348946A (ja) 音声認識処理方式
JPH0746321A (ja) 電話を用いた在宅勤務システム
JPS6343035B2 (ja)
JPS607259A (ja) 音声処理交換方式
JPS6016751A (ja) ハンドフリ−電話システム
JPS6159520B2 (ja)
KR970000068B1 (ko) 스위칭 기능을 구비한 정보서비스 시스템
JP2000106603A (ja) 音声認識応答装置および音声認識応答方法ならびに音声ガイダンス方法
JPS6069949A (ja) 着信接続方式
KR100236787B1 (ko) 망접속 다채널 음성데이타 수집시스템
JPH0519734B2 (ja)
JPS59216363A (ja) 音声応答方式
JPS5990486A (ja) 構内通信システム
KR100419151B1 (ko) 피비엑스 내장형 자동 중계 서비스 장치
JP2729704B2 (ja) 内線代表制御装置
JPS61205060A (ja) 自動構内交換装置における内線話中時の自動代行録音受付方式
JPS5854771A (ja) 加入者状態検出方式
JPH06276300A (ja) 音声圧縮回線切換方式
JPH1117809A (ja) リモート加入者の音声モニター方式
JPH0583381A (ja) 局線着信接続制御方式