JP3327213B2 - 音声認識型通信制御装置 - Google Patents

音声認識型通信制御装置

Info

Publication number
JP3327213B2
JP3327213B2 JP16784398A JP16784398A JP3327213B2 JP 3327213 B2 JP3327213 B2 JP 3327213B2 JP 16784398 A JP16784398 A JP 16784398A JP 16784398 A JP16784398 A JP 16784398A JP 3327213 B2 JP3327213 B2 JP 3327213B2
Authority
JP
Japan
Prior art keywords
name
pronunciation
information
called party
certainty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP16784398A
Other languages
English (en)
Other versions
JP2000004298A (ja
Inventor
和彦 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP16784398A priority Critical patent/JP3327213B2/ja
Publication of JP2000004298A publication Critical patent/JP2000004298A/ja
Application granted granted Critical
Publication of JP3327213B2 publication Critical patent/JP3327213B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)

Description

【発明の詳細な説明】
【0001】本発明は、電話交換機等通信制御装置、特
に発呼者の音声を認識してその希望する相手(被呼者)
に回線を接続する音声認識型通信制御装置に関する。
【0002】
【従来の技術】電話交換作業等通信における回線制御に
おいて、交換手を置く必要をなくしてコストを削減する
目的で自動化、特に音声認識による自動化が進められて
いる。
【0003】例えば、特開平5−227272号におい
ては、音声認識部に予め被呼者の名前の発音情報が登録
された音声認識部を設け、この音声認識部において発呼
者の発声した名前を認識する電話取次装置が開示されて
いる。
【0004】また、特開平9―127978号において
は、予め認識対象語彙として登録されていない音声が入
力された場合に対処するために、登録されていない音声
(未知語)を認識し、発呼者に誤りを告知する機能を付
与した電話取次装置が開示されている。
【0005】
【発明が解決しようとする課題】しかしながら、前記従
来技術においては以下のような問題があった。
【0006】まず、特開平5−227272号開示の技
術においては、発呼者の発声する名前を登録された名前
と比較して最も発音の近似したものを認識するため、電
話の掛け違えや名前の記憶違い等により発呼者が登録外
の名前を発声した場合、全く異なった相手に回線を接続
してしまい、発呼者に誤りを告知することができないと
いう問題があった。
【0007】また、特開平9−127978号開示の技
術においては、登録された名前以外の発音を認識するに
当たっては特に制限を設けておらず、人名に相当しない
発音として認識してしまうことがある。その結果、発呼
者が登録された名前を発声したつもりであっても、発音
の仕方によっては別の発音と認識されてしまい、確実性
に欠けるという問題があった。
【0008】そこで、本発明の課題は、発呼者が予め登
録されていない名前を発声した場合にそれを確実に判断
して誤りを告知することが可能な通信制御装置を提供す
ることである。
【0009】
【課題を解決するための手段】上記課題を解決するため
の本発明の音声認識型通信制御装置は、回線接続制御さ
れる端末に対応する者の名前についてその発音情報を登
録した被呼者名発音辞書と、前記被呼者名発音辞書を検
索して発呼者の発音した名前に最も近い発音の名前を
識してその名前と名前の確実性とを制御部へと転送する
被呼者名認識部と、回線接続制御される端末に対応する
者の名前の発音情報以外の発音情報を有する人名につい
てその発音情報を登録した非被呼者名発音辞書と、前記
非被呼者名発音辞書を検索して発呼者の発音した名前に
最も近い発音の名前を認識してその名前と名前の確実性
とを制御部へと転送する非被呼者名認識部とを備え、
つ前記制御部において前記被呼者名認識部から転送され
た名前と前記非被呼者名認識部から転送された名前とを
比較して確実性の高い方を選択し、その結果により以後
の動作を決定することを特徴とする。
【0010】また、本発明の音声認識型通信制御装置
は、前記非被呼者名発音辞書が、人名漢字の発音情報の
うち回線接続される端末に対応する者の名前の発音情報
以外の発音情報を登録した辞書であり、かつ前記非被呼
者名発音辞書に登録された発音情報を連続単語認識によ
り検索して発呼者が発音した名前に最も近い発音の名前
を認識し、その名前と名前の確実性とを制御部へと転送
する非被呼者名認識部を備えてなることを特徴とする。
【0011】また、本発明の音声認識型通信制御装置
は、前記非被呼者名発音辞書が、人名の一文字目に使用
される頻度の高い漢字の発音情報のうち回線接続される
端末に対応する者の名前の発音情報以外の発音情報と、
人名の二文字目に使用される頻度の高い漢字の発音情報
のうち回線接続される端末に対応する者の名前の発音情
報以外の発音情報とをそれぞれ別に登録した辞書であ
、かつ前記非被呼者名発音辞書に登録された発音情報
を連続単語認識により検索して発呼者が発音した名前に
最も近い発音の名前を認識し、その名前と名前の確実性
とを制御部へと転送する非被呼者名認識部を備えてなる
ことを特徴とする。
【0012】また、本発明の音声認識型通信制御装置
は、前記非被呼者名発音辞書が、人名に使用される頻度
の高い複音節連鎖の発音情報のうち回線接続される端末
に対応する者の名前の発音情報以外の発音情報を登録し
た辞書であり、かつ前記非被呼者名発音辞書に登録され
た発音情報を連続単語認識により検索して発呼者が発音
した名前に最も近い発音の名前を認識し、その名前と名
前の確実性とを制御部へと転送する非被呼者名認識部を
備えてなることを特徴とする。
【0013】また、本発明の音声認識型通信制御装置
は、被呼者名認識部から転送された名前の確実性と非被
呼者名認識部から転送された名前の確実性とを比較し
て、被呼者名認識部から転送された名前の確実性が高い
場合には該当する被呼者へと回線を接続し、非被呼者名
認識部から転送された名前の確実性が高い場合には該当
する者がないことを発呼者に対して告知する制御部を備
えてなることを特徴とする。
【0014】本発明においては、従来と同様に回線接続
制御される端末に対応する者の名前の発音情報を登録し
被呼者名発音辞書を設けるが、その他に上記被呼者名
発音辞書に登録した名前以外の人名、すなわち回線接続
制御される端末に対応する者の名前の発音情報以外の発
音情報を有する名前についてその発音情報を登録した非
被呼者名発音辞書をも同時に設けている。発呼者が発声
した名前について、被呼者名発音辞書と非被呼者名辞書
とをそれぞれ検索してそれぞれ最も発音の近い名前を認
識し、それらのうち確実性高い方の名前を選択する。
【0015】非被呼者名発音辞書に登録する発音情報
は、例えば回線接続制御される端末に対応する者の名前
以外の発音情報を有する人名すべてについて登録してお
いても良いが、その数は膨大である。一方、人名に用い
られる漢字はそれよりもはるかに少数であり、ひとつの
漢字に複数の読みがあることを考慮しても、すべての人
名を登録するよりも効率的なことが明らかであり、人名
に使用される漢字のみを登録してこれを連続音声認識す
ることにより、「非被呼者名発音辞書」の中から発呼者
の発生した名前に最も発音の近い名前を認識することが
できる。
【0016】さらに、人名に一文字目に使用される頻度
の高い漢字の発音情報と、二文字目に使用される頻度の
高い漢字の発音情報とをそれぞれ別に登録しておき、こ
れらを連続音声認識により検索すれば、さらに登録数が
少なくて済むのでより好ましい。人名は必ずしも二文字
ではなく三文字以上の場合もあるので、さらに三文字目
に使用される頻度の高い漢字、四文字目に使用される頻
度の高い漢字等を登録し、長い名前に対応させることも
できる。
【0017】また、人名漢字ではなく、人名に使用され
る頻度の高い複音節連鎖を登録しておき、これらを連続
単語音声認識により検索しても良い。この場合、登録す
る複音節連鎖は2音節連鎖のみ、又は2音節連鎖と3音
節連鎖程度に留めることがコストの面で好ましい。
【0018】このようにして非被呼者名発音辞書から検
索された名前は制御部へと転送される。また、被呼者名
発音辞書から検索された名前も同様に制御部へと転送さ
れる。制御部はこれらの名前を比較して確実性の高い方
を選択する。被呼者名認識部から転送された名前を選択
した場合、その名前に相当する被呼者へと回線を接続す
る。非被呼者名認識部から転送された名前を選択した場
合、発呼者に対して誤りを告知し、対処を促すことがで
きる。
【0019】
【発明の実施形態】本発明の第一の実施形態について以
下に示す。図1に本実施形態における通信制御装置の装
置構成概略図を示す。また、図2に実際の動作のフロー
チャートを示すとともに以下に装置各部の詳細及び作用
を説明する。
【0020】発呼者が発呼者端末101から通信回線網
102を通じて通信制御装置103へと通信を開始す
る。通信制御装置103内に設置された制御部104は
通信を検出して接続を開始し、発呼者が発声した名前を
被呼者名認識部105及び非被呼者名認識部107に転
送する。このとき、発呼者が名前を確実に発声するよう
な音声ガイド、例えば「回線接続を希望する相手の名前
をはっきりとお知らせください。」等を出力すること
が、より好ましい。
【0021】被呼者名認識部105は、予め被呼者の名
前の発音情報が格納された被呼者名発音辞書106を検
索して発呼者が発声した名前の発音に最も近いものを認
識し、その名前と名前の確実性を制御部104に転送す
る。
【0022】一方、非被呼者名発音辞書108には人名
漢字の発音情報が予め登録されている。非被呼者名認識
部107は、非被呼者名発音辞書108を連続単語音声
認識により検索して発呼者が発声した名前の発音に最も
近いものを認識し、その名前と名前の確実性とを制御部
104に転送する。
【0023】制御部104は、被呼者名認識部105か
ら転送された名前の確実性と、非被呼者名認識部107
から転送された名前の確実性とを比較して、確実性の高
い方を選択する。被呼者名認識部105から転送された
名前の確実性が高い場合には、その名前に該当する被呼
者端末109へと回線を接続する。
【0024】このとき、誤認識による回線接続の間違い
を回避するために、発呼者に対する確認をさらに行って
も良い。このとき、接続先が正しいことが確認されれば
そのまま被呼者端末109へと回線を接続し、誤ってい
る場合にはもう一度名前を発声してもらい、再び検索作
業を行う。その際、音声ガイド例えば「接続先は某(認
識された名前)でよろしいですか?よろしければそのま
まお待ちください。間違っている場合はもう一度回線接
続を希望する相手の名前をはっきりとお知らせくださ
い。」等を出力し、発呼者が対処しやすいようにするこ
とが好ましい。
【0025】非被呼者名認識部107から転送された名
前の確実性が高い場合には、該当する者がないことを発
呼者に対して告知する。例えば、「某(認識された名
前)というものはおりません。もう一度回線接続を希望
する相手の名前をおっしゃるか、番号をお確かめの上お
掛け直しください。」等の音声ガイドを出力することが
望ましい。
【0026】次に本発明の第二の実施形態を説明する。
本実施形態においては、非被呼者名発音辞書108に、
人名の一文字目に使用される頻度の高い漢字の発音情報
と、二文字目に使用される頻度の高い漢字の発音情報と
がそれぞれ別に予め登録されている。非被呼者名認識部
107は、非被呼者名発音辞書108を連続単語音声認
識により検索して発呼者が発生した名前の発音に最も近
いものを認識し、その名前と名前の確実性とを制御部1
04に転送する。
【0027】本実施形態においては、登録する情報が人
名の一文字目に使用される頻度の高い漢字の発音情報と
二文字目に使用される頻度の高い漢字の発音情報とに限
定されており、使用する記憶媒体に要求される容量はよ
り小さくなり、コストが抑制される。また、発音の認識
範囲が限定されることから、誤認識が少なくなり、装置
の信頼性が向上する。
【0028】次に、本発明の第三の実施形態について説
明する。本実施形態においては、非被呼者名発音辞書1
08に、人名に使用される頻度の高い複音節連鎖、より
具体的には2音節連鎖の発音情報が予め登録されてい
る。非被呼者名認識部107は、非被呼者名発音辞書1
08を連続単語音声認識により検索して発呼者が発生し
た名前の発音に最も近いものを認識し、その名前と名前
の確実性とを制御部104に転送する。
【0029】本実施形態においては、登録する情報が人
名に使用される頻度の高い複音節連鎖の発音情報に限定
されており、使用する記憶媒体に要求される容量は第二
の実施形態と同様に小さくなり、コストが抑制される。
また、発音の認識範囲が限定されることから、誤認識が
少なくなり、装置の信頼性が向上する。なお、本実施形
態においては複音節連鎖を2音節連鎖に限定したが、さ
らに3音節連鎖、4音節連鎖等を登録してもかまわな
い。ただし、実際の検索を行う際には3音節程度まで登
録されておれば十分である。また、上述のように、記憶
媒体の容量をなるべく小さくする方が望ましいので、2
音節又は、2及び3音節連鎖を登録しておくことが望ま
しい。
【0030】
【発明の効果】以上のように、本発明によれば、発呼者
が予め登録されていない名前を発声した場合にそれを確
実に判断して誤りを告知することが可能な通信制御装置
を提供することができる。
【図面の簡単な説明】
【図1】本発明の第一の実施形態における装置構成概略
図である。
【図2】本発明の第一の実施形態における動作のフロー
チャートである。
【符号の説明】
101 発呼者端末 102 通信回線網 103 通信制御装置 104 制御部 105 被呼者名認識部 106 被呼者名発音辞書 107 非被呼者名認識部 108 非被呼者名発音辞書 109 被呼者端末
フロントページの続き (51)Int.Cl.7 識別記号 FI G10L 15/28 G10L 3/00 571C (58)調査した分野(Int.Cl.7,DB名) H04M 1/00 H04M 1/24 - 1/62 H04M 1/66 - 1/82 H04M 3/42 - 3/58 H04M 11/00 - 11/10 H04Q 3/58 G10L 13/00 G10L 15/00 - 15/20

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 回線接続制御される端末に対応する者の
    名前についてその発音情報を登録した被呼者名発音辞書
    と、前記被呼者名発音辞書を検索して発呼者の発音した
    名前に最も近い発音の名前を認識してその名前と名前の
    確実性とを制御部へと転送する被呼者名認識部と、回線
    接続制御される端末に対応する者の名前の発音情報以外
    の発音情報の人名についてその発音情報を登録した非被
    呼者名発音辞書と、前記非被呼者名発音辞書を検索して
    発呼者の発音した名前に最も近い発音の名前を認識して
    その名前と名前の確実性とを制御部へと転送する非被呼
    者名認識部とを備え、かつ前記制御部において前記被呼
    者名認識部から転送された名前と前記非被呼者名認識部
    から転送された名前とを比較して確実性の高い方を選択
    し、その結果により以後の動作を決定することを特徴と
    する音声認識型通信制御装置。
  2. 【請求項2】 前記非被呼者名発音辞書が、人名漢字の
    発音情報のうち回線接続される端末に対応する者の名前
    の発音情報以外の発音情報を登録した辞書であり、かつ
    前記非被呼者名発音辞書に登録された発音情報を連続単
    語認識により検索して発呼者が発音した名前に最も近い
    発音の名前を認識し、その名前と名前の確実性とを制御
    部へと転送する非被呼者名認識部を備えてなることを特
    徴とする請求項1に記載の音声認識型通信制御装置。
  3. 【請求項3】 前記非被呼者名発音辞書が、人名の一文
    字目に使用される頻度の高い漢字の発音情報のうち回線
    接続される端末に対応する者の名前の発音情報以外の発
    音情報と、人名の二文字目に使用される頻度の高い漢字
    の発音情報のうち回線接続される端末に対応する者の名
    前の発音情報以外の発音情報とをそれぞれ別に登録した
    辞書であり、かつ前記非被呼者名発音辞書に登録された
    発音情報を連続単語認識により検索して発呼者が発音し
    た名前に最も近い発音の名前を認識し、その名前と名前
    の確実性とを制御部へと転送する非被呼者名認識部を備
    えてなることを特徴とする請求項1又は請求項2に記載
    の音声認識型通信制御装置。
  4. 【請求項4】 前記非被呼者名発音辞書が、人名に使用
    される頻度の高い複音節連鎖の発音情報のうち回線接続
    される端末に対応する者の名前の発音情報以外 の発音情
    報を登録した辞書であり、かつ前記非被呼者名発音辞書
    に登録された発音情報を連続単語認識により検索して
    呼者が発音した名前に最も近い発音の名前を認識し、
    の名前と名前の確実性とを制御部へと転送する非被呼者
    名認識部を備えてなることを特徴とする請求項1に記載
    の音声認識型通信制御装置。
  5. 【請求項5】 被呼者名認識部から転送された名前の確
    実性と非被呼者名認識部から転送された名前の確実性と
    を比較して、被呼者名認識部から転送された名前の確実
    性が高い場合には該当する被呼者へと回線を接続し、非
    被呼者名認識部から転送された名前の確実性が高い場合
    には該当する者がないことを発呼者に対して告知する制
    御部を備えてなることを特徴とする請求項1乃至請求項
    4のいずれか一項に記載の音声認識型通信制御装置。
JP16784398A 1998-06-16 1998-06-16 音声認識型通信制御装置 Expired - Fee Related JP3327213B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16784398A JP3327213B2 (ja) 1998-06-16 1998-06-16 音声認識型通信制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16784398A JP3327213B2 (ja) 1998-06-16 1998-06-16 音声認識型通信制御装置

Publications (2)

Publication Number Publication Date
JP2000004298A JP2000004298A (ja) 2000-01-07
JP3327213B2 true JP3327213B2 (ja) 2002-09-24

Family

ID=15857122

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16784398A Expired - Fee Related JP3327213B2 (ja) 1998-06-16 1998-06-16 音声認識型通信制御装置

Country Status (1)

Country Link
JP (1) JP3327213B2 (ja)

Also Published As

Publication number Publication date
JP2000004298A (ja) 2000-01-07

Similar Documents

Publication Publication Date Title
KR100383352B1 (ko) 음성작동서비스
US7058573B1 (en) Speech recognition system to selectively utilize different speech recognition techniques over multiple speech recognition passes
JP3388845B2 (ja) 混同するほど類似した語句の入力を防止する方法と装置
US6925154B2 (en) Methods and apparatus for conversational name dialing systems
US6018708A (en) Method and apparatus for performing speech recognition utilizing a supplementary lexicon of frequently used orthographies
US5832063A (en) Methods and apparatus for performing speaker independent recognition of commands in parallel with speaker dependent recognition of names, words or phrases
US7974843B2 (en) Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer
US5983177A (en) Method and apparatus for obtaining transcriptions from multiple training utterances
US7627096B2 (en) System and method for independently recognizing and selecting actions and objects in a speech recognition system
US20070016421A1 (en) Correcting a pronunciation of a synthetically generated speech object
US6687673B2 (en) Speech recognition system
JP4173207B2 (ja) 発声音に関する話者の検証を行うためのシステム及び方法
US20090067590A1 (en) System and method of utilizing a hybrid semantic model for speech recognition
EP0890249A1 (en) Apparatus and method for reducing speech recognition vocabulary perplexity and dynamically selecting acoustic models
JP2007504490A (ja) 補足情報を用いた改良型音声認識の方法および装置
KR19980070329A (ko) 사용자 정의 문구의 화자 독립 인식을 위한 방법 및 시스템
US7401023B1 (en) Systems and methods for providing automated directory assistance using transcripts
JP2006058390A (ja) 音声認識装置
JP3327213B2 (ja) 音声認識型通信制御装置
JP2003177788A (ja) 音声対話システムおよびその方法
EP1187431B1 (en) Portable terminal with voice dialing minimizing memory usage
EP1160767B1 (en) Speech recognition with contextual hypothesis probabilities
JP4067483B2 (ja) 電話受け付け翻訳システム
JP3478171B2 (ja) 音声認識装置及び音声認識方法
JP2005283797A (ja) 音声認識装置および音声認識方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees