JPH11205430A - 音声ダイアル機能付き電話機 - Google Patents

音声ダイアル機能付き電話機

Info

Publication number
JPH11205430A
JPH11205430A JP10008557A JP855798A JPH11205430A JP H11205430 A JPH11205430 A JP H11205430A JP 10008557 A JP10008557 A JP 10008557A JP 855798 A JP855798 A JP 855798A JP H11205430 A JPH11205430 A JP H11205430A
Authority
JP
Japan
Prior art keywords
voice
string
telephone
recognized
telephone number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10008557A
Other languages
English (en)
Inventor
Tetsuya Takahashi
哲也 高橋
Takayuki Hiekata
孝之 稗方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP10008557A priority Critical patent/JPH11205430A/ja
Publication of JPH11205430A publication Critical patent/JPH11205430A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 ダイアル操作への意識の集中を防止し,運転
中などでも安全にダイアルすることが可能な音声ダイア
ル機能付き電話機を提供する。 【解決手段】 音声による数字列入力中の任意時に発生
する所定の確認要求により,認識されている数字列をい
つでも何度でも確認することができる。従って,発呼者
は自分の区切りやすい一連の数字列単位で発声,及び確
認を行うことができ。また,予め任意の数字列を登録電
話番号として記憶しておく場合には,認識された数字列
と登録電話番号との類似度を計算し,該類似度に基づい
て1又は複数の登録電話番号を選択するように構成す
る。これにより,入力された数字列が,登録されている
電話番号と多少間違って認識されたとしても,最初から
入力しなおすことなく,正しい電話番号でダイアルする
ことが可能となる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,例えば車載電話な
どのように,ハンズフリー,アイフリーが求められる状
況で使用するために,音声によって発信電話番号をダイ
アル可能な機能を持つ音声ダイアル機能付き電話機に関
するものである。
【0002】
【従来の技術】例えば車載電話においては,運転中にボ
タンを押してダイアルすることは非常に危険である。そ
こで,ハンズフリー,アイフリーでのダイアルを可能と
するため,音声によって発信電話番号をダイアル可能な
機能を持つ音声ダイアル機能付き電話機が提案されてい
る。しかしながら,現在の音声認識技術にあっては常に
誤認識の可能性を伴っており,特に走行中の車内などで
は入力音声からのノイズ除去処理を行ったとしても認識
率の低下は免れない。そのため,音声ダイアル機能付き
電話機においては,入力(認識)された電話番号の確認
操作や,誤入力(誤認識)があった場合の訂正操作に関
する機能が必須である。このような,入力された電話番
号の確認や訂正の機能を持つ従来の音声ダイアル機能付
き電話機は,例えば特開昭62−61451号公報,特
開平2−202253号公報,特開平6−54042号
公報に提案されている。上記特開昭62−61451号
公報に提案されている音声ダイアル機能付き電話機に
は,電話番号が音声で入力された後,その認識結果を合
成音で出力する機能が搭載されている。これにより,発
呼者が目線を移動させることなく,認識された電話番号
の確認を行うことを可能としている。また,上記特開平
2−202253号公報,及び特開平6−54042号
公報に提案されている音声ダイアル機能付き電話機で
は,音声入力された電話番号を予め登録された電話番号
と比較し,一致するものがあった場合にのみその電話番
号でのダイアルを可能とすることで,誤った番号での発
信を防止している。
【0003】
【発明が解決しようとする課題】しかしながら,上記特
開昭62−61451号公報に提案されている音声ダイ
アル機能付き電話機では,合成音の出力による認識番号
確認は電話番号を全て入力した後に行うため,電話番号
の最初から最後までを一度に確認する必要があり,ま
た,認識された電話番号に誤りがあった場合には最初か
ら全て入力しなおす必要があるため,長時間ダイアル操
作に意識を集中しなければならず,運転への意識の集中
を妨げてしまうという問題点があった。また,上記特開
平2−202253号公報,及び特開平6−54042
号公報に提案されている音声ダイアル機能付き電話機で
は,予め登録されている電話番号でしかダイアルするこ
とができないという問題点があった。更に,音声認識さ
れた電話番号の数字に1つでも誤りがあると,また最初
から全て入力しなおす必要があり,長時間ダイアル操作
に意識を集中しなければならず,運転への意識の集中を
妨げることになり非常に危険である。本発明は上記事情
に鑑みてなされたものであり,その目的とするところ
は,ダイアル操作への意識の集中を防止し,運転中など
でも安全にダイアルすることが可能な音声ダイアル機能
付き電話機を提供することである。更に具体的には,第
1に音声入力途中であっても既に認識された電話番号を
自由に確認・訂正することができ,第2に音声入力され
た電話番号と予め登録された電話番号とが完全に一致し
ていなくても,容易に正しい電話番号でダイアルするこ
とが可能な音声ダイアル機能付き電話機を提供すること
を目的とする。
【0004】
【課題を解決するための手段】上記目的を達成するため
に第1の発明は,音声により入力された数字列を認識す
る音声認識手段と,上記音声認識手段により認識された
数字列を順次記憶する認識数字列記憶手段と,上記認識
数字列記憶手段に記憶された上記数字列に基づいて発信
を行う第1の発信手段とを具備する音声ダイアル機能付
き電話機において,音声による数字列入力中の任意時に
発生する所定の確認要求に基づいて,上記認識数字列記
憶手段に記憶された数字列のうちの未確認部分の確認処
理を行う入力数字列確認手段を具備してなることを特徴
とする音声ダイアル機能付き電話機として構成されてい
る。上記入力数字列確認手段は,例えば上記認識数字列
記憶手段に記憶されている数字列のうちの少なくとも未
確認部分を音声にて出力して確認を求め,その結果訂正
要求があった場合に,上記未確認部分の数字列を上記認
識数字列記憶手段から削除すると共に再度数字列の入力
を要求するように構成できる。また,上記所定の確認要
求としては,例えば上記音声認識手段による所定時間以
上の連続した無声部分,若しくは無効部分の検出をそれ
と見做すようにしてもよいし,「確認」などの音声入力
により行うようにしてもよい。また,上記目的を達成す
るために第2の発明は,予め,任意の数字列を登録電話
番号として記憶する登録電話番号記憶手段と,音声によ
り入力された数字列を認識する音声認識手段と,上記登
録電話番号記憶手段に記憶された上記登録電話番号の中
から上記音声認識手段により認識された数字列に対応す
る登録電話番号を選択する電話番号選択手段とを具備す
る音声ダイアル機能付き電話機において,上記電話番号
選択手段が,上記音声認識手段により認識された数字列
と上記登録電話番号記憶手段に記憶された各登録電話番
号との類似度を計算し,該類似度に基づいて1又は複数
の登録電話番号を選択することを特徴とする音声ダイア
ル機能付き電話機として構成されている。
【0005】更に,上記電話番号選択手段により選択さ
れた登録電話番号,若しくは上記音声認識手段により認
識された数字列のいずれかに基づいて発信を行う第2の
発信手段を具備して構成すれば,登録されている電話番
号以外の電話番号でのダイアルも可能となる。更に,上
記電話番号選択手段が,上記選択された登録電話番号及
び/若しくは上記音声認識手段により認識された数字列
を音声で出力して確認を求めるようにすれば,誤った番
号でのダイアルが効果的に防止できる。また,上記類似
度としては,例えば上記音声認識手段により認識された
数字列と上記登録電話番号記憶手段に記憶された各登録
電話番号との間の対応する数字の一致個数に基づくも
の,上記音声認識手段により認識された数字列の任意位
置に1又は複数の任意の数字を挿入し,その数字列と上
記登録電話番号記憶手段に記憶された各登録電話番号と
の間で一致する数字の個数に基づくもの,上記音声認識
手段により認識された数字列から1又は複数の任意の数
字を削除し,その数字列と上記登録電話番号記憶手段に
記憶された各登録電話番号との間で一致する数字の個数
に基づくもの,或いはそれらの組み合わせなどが考えら
れる。また,上記第1,第2の発明において,上記音声
認識手段による認識中に入力取りやめを意味する音声入
力があると,それまでに認識された数字列を削除して初
期状態に戻すようにすれば,いつでも音声入力をやり直
すことができる。更に,上記第1,第2の発明におい
て,上記音声認識手段による認識中に,所定時間以上無
声部分,若しくは無効部分が継続した場合に所定の警告
を行うようにすれば,例えば運転に集中しないといけな
い状況が継続するなどしてダイアル操作中であることを
忘れてしまったような場合に有効である。
【0006】
【作用】上記第1の発明によれば,音声入力中,例えば
数字の発声に区切りを入れて所定時間以上の無声区間を
作るなどの上記所定の確認要求を行うことにより,認識
されている数字列をいつでも何度でも確認することがで
きる。従って,発呼者は自分の区切りやすい一連の数字
列単位(例えば,市外局番などの区切り)で発声,及び
確認を行うことができるため,全ての番号を続けて発声
し,まとめて確認しなければならない従来技術に比べて
意識を長時間集中する必要がない。また,誤って認識さ
れた場合の訂正も上記区切り毎にできるため,これも意
識の長時間の集中を防止する上で望ましい。更に,もし
も音声出力を聞き逃しても確認ができるという安心感を
与えることができるため,運転中に過度にダイアル操作
に集中することを防止できる。このように,運転中など
でも安全にダイアルすることが可能となり,ダイアル操
作への意識の集中が許されない車載電話などにおいて特
に望ましい。また,上記第2の発明によれば,音声入力
された数字列が,登録されている電話番号と多少間違っ
て認識されたとしても,最初から入力しなおすことな
く,正しい電話番号でダイアルすることが可能となる。
また,登録されている電話番号以外の電話番号でのダイ
アルも可能となる。
【0007】
【発明の実施の形態】以下,添付図面を参照して本発明
の実施の形態及び実施例につき説明し,本発明の理解に
供する。尚,以下の実施の形態及び実施例は,本発明を
具体化した一例であって,本発明の技術的範囲を限定す
る性格のものではない。ここに,図1は本発明の実施の
形態に係る音声ダイアル機能付き電話機A1の概略構成
を示すブロック図,図2は上記音声ダイアル機能付き電
話機A1の状態遷移図,図3は[初期状態]における処
理手順を示すフローチャート,図4は[数字入力]にお
ける処理手順を示すフローチャート,図5は[未確認部
処理]における処理手順を示すフローチャート,図6は
[途中確認]における処理手順を示すフローチャート,
図7は[取りやめ確認]における処理手順を示すフロー
チャート,図8は[最終確認]における処理手順を示す
フローチャート,図9は本発明の実施例に係る音声ダイ
アル機能付き電話機A2の概略構成を示すブロック図,
図10は[最終確認]における処理手順を示すフローチ
ャートである。本実施の形態に係る音声ダイアル機能付
き電話機A1は,図1に示すように,マイク1,A/D
変換部2,音響エコー防止装置3,ノイズ除去装置4,
音声検出器5,音声認識装置6,パターンデータ記憶メ
モリ7,状態制御装置8,数字列記憶メモリ9,発信装
置10,音声合成装置11,圧縮音声データ記憶メモリ
12,D/A変換部13,及びスピーカ14を具備して
構成されている。
【0008】上記音響エコー防止装置3は,スピーカ1
4からマイク1への音の回り込みによるエコーを防止す
るもので,例えば適応フィルタによるエコーキャンセラ
や,ボイススイッチでの双方向通話制御などが用いられ
る。上記ノイズ除去装置4は,上記マイク1から入力さ
れた音声データから周辺騒音などのノイズを除去するも
ので,例えばスペクトルサブトラクション法などの周知
の技術を用いることができる。上記音声検出器5は,上
記ノイズ除去装置4によりノイズが除去された音声デー
タに対して,音声が含まれる有声区間と背景雑音のみの
無声区間との区分けを行う。この場合の有声/無声の判
断手法としては,パワーの最低値をモニタすることによ
りノイズのパワーレベルを推定し,ノイズレベルよりも
ある程度パワーが大きくなった区間を有声区間とする方
法が最も簡単である。これ以外にも,信号のゼロクロス
をカウントしたり,信号の周期性を求めるなど,各種の
周知技術を用いることができる。上記パターンデータ記
憶メモリ7には,「いち(1)」,「に(2)」などの
数字に対応する音声パターンデータや,「かくにん(確
認)」,「ていせい(訂正)」などの所定の指示音声に
対応する音声パターンデータが予め記憶されている。上
記音声認識装置6(音声認識手段に相当)では,上記音
声検出器5により検出された有声区間の音声データと,
上記パターンデータ記憶メモリ7に記憶されている各音
声パターンデータとを比較してそれぞれ類似度を計算
し,この類似度が所定値以上で且つ最大となった場合に
両者が一致したものと判断する。そして,上記音声デー
タと一致した音声パターンデータ若しくはそのパターン
番号などを上記状態制御装置8に出力する。ここでは,
例えばHMM(隠れマルコフモデル)などの音声認識手
法を用いることができる。また,複数の連続した単語の
発声にも対応できるように,2段DPマッチングやOn
e Passアルゴリズムなどが有効であることが知ら
れている。
【0009】上記状態制御装置8(入力数字列確認手段
に相当)は,上記音声検出器5で得られた有声/無声区
間の情報や,上記音声認識装置6で得られた音声パター
ンデータに基づいて,音声入力の状況を監視し,電話機
の動作の制御を行う。例えば,上記音声認識装置6で得
られた数字データを順次上記数字列記憶メモリ9(認識
数字列記憶手段に相当)内に格納すると共に,所定の確
認要求や訂正要求(後述する)に基づいて上記数字列記
憶メモリ9内の数字列の確認や訂正の処理を行う。ま
た,上記数字列記憶メモリ9内の数字列が最終的に全て
確認されると,発信装置10(第1の発信手段に相当)
により,上記数字列に基づいて発信(ダイアル)を行
う。上記圧縮音声データ記憶メモリ12には,「いち
(1)」,「に(2)」などの数字に対応する圧縮音声
データや,「よろしいですか」,「とりやめます」など
の所定の確認音声に対応する圧縮音声データが予め記憶
されている。上記音声合成装置11では,上記状態制御
装置8からの指示に基づき,上記圧縮音声データ記憶メ
モリ12に記憶された圧縮音声データを用いて音声を合
成し,出力する。ここで用いる音声合成の手法として
は,例えばLPC−10が少ないメモリで実現できるな
ど実用的であるが,CELPやADPCMといったよく
知られた音声圧縮・復元手法を用いてもよく,特に限定
するものではない。上記音声合成装置11から出力され
た合成音声は,上記音響エコー防止装置3を通って上記
D/A変換部13でアナログ変換され,スピーカ14よ
り出力される。
【0010】続いて,音声ダイアル機能付き電話機A1
における音声によるダイアル動作について更に具体的に
説明する。図2は,上記音声ダイアル機能付き電話機A
1の状態遷移図を示しており,それらの各状態において
なされる処理フローを図3〜図8のフローチャートに示
す。以下,上記各フローチャートに従って各処理フロー
について詳述する。 (a)[初期状態] 図3を用いて[初期状態]での処理について説明する。
まず,状態制御装置8は数字列記憶メモリ9をクリアし
(ステップS1),マイク1,A/D変換部2,音響エ
コー防止装置3,ノイズ除去装置4を介して入力される
音声データの上記音声検出器5による有声/無声区間の
区分け判断を監視する。また,上記音声検出器5により
有声区間であると判断された場合には,上記状態制御装
置8は上記音声認識装置6によって認識された音声の内
容を監視する。そして,上記認識された音声が例えば
「ダイアル」であった場合,即ち,上記音声認識装置6
において,入力された音声がパターンデータ記憶メモリ
7内に予め記憶されている「だいある」に対応する音声
パターンデータとの一致が検出された場合にのみ,次の
[数字入力]の処理へ移る(ステップS2,S3)。即
ち,電話をかけようとする者(以下,発呼者という)
は,数字(電話番号)入力を行うことを電話機に対して
要求するためには,「ダイアル」という声を発すればよ
い。
【0011】(b)[数字入力] 図4を用いて[数字入力]処理について説明する。[数
字入力]処理に入ると,上記状態制御装置8は,上記マ
イク1から入力される音声データの上記音声検出器5に
よる有声/無声区間の区分け判断を監視する。そして,
有声区間が続く限り上記音声認識装置6によって認識さ
れた音声の内容を監視し(ステップS11,S12),
認識された音声が「いち(1)」,「に(2)」など数
字に対応する音声であれば,上記状態制御装置8はその
数字を順次上記数字列記憶メモリ9内に未確認部分とし
て格納する(ステップS13)。例えば,発呼者が「ぜ
ろ なな はち」と発声すると,その時点で上記数字列
記憶メモリ9には「078」という数字列が未確認の部
分として格納される。ここで,例えば各数字「0」
「7」「8」が認識される毎に,確認のために個々の数
字を合成音声により出力するようにしてもよい。また,
上記音声認識装置6によって「取りやめ」,「終了」,
「確認」のいずれかの音声が認識された場合には,それ
ぞれ後述する[取りやめ確認],[最終確認],[途中
確認]の各処理に移る。なお,長時間継続して有効入力
がない場合には(ステップS14),後述する「取りや
め確認」の処理に移る。上記数字列の入力中に無声区間
が所定時間以上継続すると(ステップS11),次に説
明する[未確認部処理]に移る。
【0012】(c)[未確認部処理] 図5を用いて[未確認部処理]について説明する。[数
字入力]処理中に無声区間が所定時間以上継続すると
(所定の確認要求の一例),上記状態制御装置8は,上
記数字列記憶メモリ9内に格納されている未確認部分の
数字列の確認要求であると解釈し,以下の処理を開始す
る。まず,上記音声合成装置11により,上記数字列記
憶メモリ9内に格納されている数字列のうちの未確認部
分が合成音声により出力される(ステップS21)。例
えば,上記数字列記憶メモリ9内に「078」という数
字列が全て未確認部分として格納されている場合,上記
音声合成装置11によってスピーカ14から「ぜろ な
な はち」と出力される。もちろん,確認済みの部分が
ある場合には,その部分も含めて出力するようにしても
よい。その後,上記状態制御装置8は,上記マイク1か
ら入力される音声データの上記音声検出器5による有声
/無声区間の区分け判断を監視する。そして,有声区間
が続く限り上記音声認識装置6によって認識された音声
の内容を監視し(ステップS22,S23),認識され
た音声が「いち(1)」,「に(2)」など数字に対応
する音声であれば,上記未確認数字列,例えば上記の例
では「078」のすべてが確認済みとして確定された上
で(ステップS24),新たに認識された数字列が順次
上記数字列記憶メモリ9内に未確認部分として追加格納
される(ステップS24)。即ち,未確認数字列確認の
ための音声が出力された後に続けて数字列が入力される
と,未確認数字列は確認されたものと見做される。例え
ば,「078」という確認のための音声がスピーカ14
から出力された後で,「きゅう きゅう に」という
数字に対応する音声が認識されると,その時点で上記数
字列記憶メモリ9には「078(992)」(括弧でく
くられた部分が未確認数字列,以下同様)という数字列
が記憶される。仮に,ここで音声認識に誤りが発声し,
上記数字列記憶メモリ9に「078(922)」と記憶
され,再び所定時間以上の無声区間が検出されると,上
記音声合成装置11によってスピーカ14から「きゅう
に に」と出力される。この場合,発呼者は,認識され
た数字列の誤りの訂正を要求するため,「ていせい」と
発声する。これにより,上記音声認識装置6によって
「ていせい」という音声が認識されると,上記数字列記
憶メモリ9内の未確認数字列がクリアされ(ステップS
25),新たに[数字入力]処理が行われる。例えば上
記の例では,この時点で上記数字列記憶メモリ9の記憶
内容は「078」となる。
【0013】また,上記音声認識装置6によって「とり
やめ(取りやめ)」,「しゅうりょう(終了)」,「か
くにん(確認)」のいずれかの音声が認識された場合に
は,それぞれ後述する[取りやめ確認],[最終確
認],[途中確認]の各処理に移る。なお,長時間継続
して有効入力がない場合にも(ステップS26),後述
する「取りやめ確認」の処理に移る。以上のような[数
字入力],[未確認部処理]を行うことにより,次のよ
うな効果が得られる。まず,発呼者は自分の区切りやす
い一連の数字列単位(例えば,市外局番などの区切り)
で発声,及び確認を行うことができるため,全ての番号
を続けて発声し,まとめて確認しなければならない従来
技術に比べて意識を長時間集中する必要がなく,車載電
話などには極めて望ましい。また,誤って認識された場
合の訂正も上記区切り毎にできるため,これも意識の長
時間の集中を防止する上で望ましい。
【0014】(d)[途中確認] 図6を用いて[途中確認]処理について説明する。上記
[数字入力]におけるステップS12,若しくは上記
[未確認部処理]におけるステップS23において「か
くにん(確認)」という音声が認識された場合には,上
記音声合成装置11により,上記数字列記憶メモリ9内
に格納されている数字列の全てが合成音声により出力さ
れる(ステップS31)。例えば,上記数字列記憶メモ
リ9内に「078(992)」という数字列が格納され
ている場合,上記音声合成装置11によってスピーカ1
4から「ぜろ なな はち きゅう きゅう に」と出
力され,上記[数字入力]処理に移る。即ち,発呼者
は,数字入力中に「確認」と発声することにより,現在
認識されている数字列をいつでも何度でも確認すること
ができる。これにより,発呼者はもしも音声出力を聞き
逃しても確認ができるという安心感を持つことができる
ため,運転中に過度にダイアル操作に集中することを防
止できる。
【0015】(e)「取りやめ確認」 図7を用いて[取りやめ確認]処理について説明する。
上記[数字入力]におけるステップS12,若しくは上
記[未確認部処理]におけるステップS23において
「とりやめ(取りやめ)」という音声(入力取りやめを
意味する音声入力に相当)が認識された場合,或いは長
時間継続して有効入力がない場合には,以下のような処
理が行われる。まず,音声合成装置11により,例えば
「初期状態に戻してよろしいですか」などの取りやめ確
認のための音声が出力される(ステップS41)。その
後,上記状態制御装置8は,上記マイク1から入力され
る音声データの上記音声検出器5による有声/無声区間
の区分け判断を監視する。そして,有声区間が続く限り
上記音声認識装置6によって認識された音声の内容を監
視し(ステップS42,S43),認識された音声が
「はい」,「いいえ」という音声であれば,それぞれ上
記[初期状態],[数字入力]の各処理に移る。また,
ここで長時間継続して有効入力がない場合には(ステッ
プS44),音声合成装置11により,例えば「初期状
態に戻します」などの取りやめ通告のための音声が出力
された後(ステップS45),上記[初期状態]の処理
に移る。このように,発呼者はいつでも自由に数字入力
を最初からやり直したり,取りやめたりすることができ
る。以上の「取りやめ確認」処理は,運転に集中しない
といけない状況が継続するなどして,発呼者がダイアル
操作中であることを忘れてしまったような場合に特に有
効である。
【0016】(f)「最終確認」 図8を用いて[最終確認]処理について説明する。上記
[数字入力]におけるステップS12,若しくは上記
[未確認部処理]におけるステップS23において「し
ゅうりょう(終了)」という音声が認識された場合に
は,以下のような処理が行われる。まず,音声合成装置
11により,上記数字列記憶メモリ9内に格納されてい
る数字列の全てが合成音声により出力される(ステップ
S51)。その後,上記状態制御装置8は,上記マイク
1から入力される音声データの上記音声検出器5による
有声/無声区間の区分け判断を監視する。そして,有声
区間が続く限り上記音声認識装置6によって認識された
音声の内容を監視し(ステップS52,S53),認識
された音声が「はい」という音声であれば,上記発信装
置10により上記数字列記憶メモリ9内に格納されてい
る数字列にてダイアルされる(ステップS54)。一
方,上記認識された音声が「いいえ」であれば,上記
[初期状態]の処理に移る。また,ここで長時間継続し
て有効入力がない場合には(ステップS55),音声合
成装置11により,例えば「初期状態に戻します」など
の取りやめ通告のための音声が出力された後(ステップ
S56),上記[初期状態]の処理に移る。以上の一連
の処理により,音声によるダイアル操作が行われる。
【0017】以上説明したように,本実施の形態に係る
音声ダイアル機能付き電話機A1によれば,発呼者は数
字入力中,数字の発声に区切りを入れて所定時間以上の
無声区間を作ることにより,認識されている数字列をい
つでも何度でも確認することができる。従って,発呼者
は自分の区切りやすい一連の数字列単位(例えば,市外
局番などの区切り)で発声,及び確認を行うことができ
るため,全ての番号を続けて発声し,まとめて確認しな
ければならない従来技術に比べて意識を長時間集中する
必要がない。また,誤って認識された場合の訂正も上記
区切り毎にできるため,これも意識の長時間の集中を防
止する上で望ましい。更に,発呼者はもしも音声出力を
聞き逃しても確認ができるという安心感を持つことがで
きるため,運転中に過度にダイアル操作に集中すること
を防止できる。このように,運転中などでも安全にダイ
アルすることが可能となり,ダイアル操作への意識の集
中が許されない車載電話などにおいて特に望ましい。
【0018】
【実施例】本実施例では,上記実施の形態に係る音声ダ
イアル機能付き電話機A1に,更に電話番号リストを予
め登録する機能を搭載した例を説明する。本実施例に係
る音声ダイアル機能付き電話機A2の概略構成を図9に
示す。本電話機A2が上記電話機A1と構成上異なるの
は,番号リスト検索装置21と電話番号リスト記憶部2
2を具備する点である。上記電話番号リスト記憶部22
(登録電話番号記憶手段に相当)には,相手先の名称と
それに対応する電話番号とが予め登録されている。上記
番号リスト検索装置21(電話番号選択手段に相当)
は,上記音声認識装置6で認識され,発呼者によって確
認された最終的な数字列と,上記電話番号リスト記憶部
22に登録された電話番号とを比較してそれぞれ類似度
を計算し,該類似度に基づいて1又は複数の電話番号を
選択する。以下,本実施例に係る音声ダイアル機能付き
電話機A2におけるダイアル動作について具体的に説明
する。尚,[最終確認]処理以外の処理については上記
実施の形態で説明したものと同様であるため,ここでは
[最終確認]処理についてのみ説明する。
【0019】(g)[最終確認] 図10を用いて,音声ダイアル機能付き電話機A2にお
ける[最終確認]処理について説明する。上記[数字入
力]におけるステップS12,若しくは上記[未確認部
処理]におけるステップS23において「しゅうりょう
(終了)」という音声が認識された場合に,以下のよう
な処理が行われる。まず,上記番号リスト検索装置21
により,上記電話番号リスト記憶部22に登録された電
話番号から上記数字列記憶メモリ9内に格納されている
数字列と類似する電話番号が検索される(ステップS6
1)。具体的には,上記数字列記憶メモリ9内に格納さ
れている数字列と上記電話番号リスト記憶部22に登録
された各電話番号との類似度をそれぞれ計算し,その中
で最も類似度の高い電話番号が選択される。ここで,上
記類似度の計算方法としては,例えば次のようなものが
考えられる。 数字列記憶メモリ9内に記憶されている数字列と上
記電話番号リスト記憶部22に登録された電話番号と
を,1数字ごとに前から順番に比較し,一致した数字の
個数を類似度とする。 数字列記憶メモリ9内に記憶されている数字列の任
意位置にダミーの数字xを入れ(例えばx078992
5640,0x789925640,07x89925
640,…0789925640xなど),これらと上
記電話番号リスト記憶部22に登録された電話番号とを
1数字ごとに前から順番に比較し,一致した数字の個数
を類似度とする。 数字列記憶メモリ9内に記憶されている数字列から
任意の数字を削除し(例えば789925640,08
9925640,079925640,…078992
564など),これらと上記電話番号リスト記憶部22
に登録された電話番号とを1数字ごとに前から順番に比
較し,一致した数字の個数を類似度とする。
【0020】例えば上記〜による類似度を全て計算
し,その中で類似度最大となるものを選択すればよい。
ここで,上記,について考慮するのは,音声認識の
過程で関係のない音声を余分に数字として認識してしま
ったり,発声した数字を認識し損ねて数字が欠落する場
合も考えられるからである。このような方法をとること
により,従来技術と異なり,登録されている電話番号と
多少間違って認識されたとしても,正しい電話番号を選
択することが可能となる。尚,上記〜は一例であ
り,これに限られるものではない。のみでもそれなり
の効果は得られ,また上記,では1数字の追加/欠
落に限らず,複数数字の追加/欠落まで考慮することも
できる。上記ステップS61において登録電話番号の一
つが選択されると,その登録電話番号に対応する相手先
名を用いて,例えば「タナカさんへの電話でよろしいで
すか」などの通話先相手確認メッセージが音声合成装置
11により出力される(ステップS62)。その後,状
態制御装置8は,上記マイク1から入力される音声デー
タの上記音声検出器5による有声/無声区間の区分け判
断を監視する。そして,有声区間が続く限り上記音声認
識装置6によって認識された音声の内容を監視し(ステ
ップS63,S64),認識された音声が「はい」とい
う音声であれば,上記発信装置10(第2の発信手段に
相当)により,上記選択された登録電話番号にてダイア
ルされる(ステップS65)。一方,上記認識された音
声が「いいえ」であれば,以下のステップS66以降の
処理に移り,長時間継続して有効入力がない場合には
(ステップS72),上記[初期状態]の処理に移る。
【0021】上記認識された音声が「いいえ」であれ
ば,上記ステップS61で選択された登録電話番号では
なく,上記数字列記憶メモリ9に格納されている数字列
が,音声合成装置11により出力される(ステップS6
6)。例えば「0789925650でよろしいです
か」などのような確認メッセージが出力される。その
後,上記状態制御装置8は,上記マイク1から入力され
る音声データの上記音声検出器5による有声/無声区間
の区分け判断を監視する。そして,有声区間が続く限り
上記音声認識装置6によって認識された音声の内容を監
視し(ステップS67,S68),認識された音声が
「はい」という音声であれば,上記発信装置10によ
り,上記数字列記憶メモリ9内に格納されている数字列
にてダイアルされる(ステップS69)。一方,上記認
識された音声が「いいえ」であれば,上記[初期状態]
の処理に移る。また,ここで長時間継続して有効入力が
ない場合には(ステップS70),音声合成装置11に
より,例えば「初期状態に戻します」などの取りやめ通
告のための音声が出力された後(ステップS71),上
記[初期状態]の処理に移る。
【0022】以上のような[最終確認]処理を行うこと
により,入力された数字列が,登録されている電話番号
と多少間違って認識されたとしても,最初から入力しな
おすことなく,正しい電話番号でダイアルすることが可
能となる。また,登録されている電話番号以外の電話番
号でのダイアルも可能である。尚,上記ステップS61
の説明では最も類似度の高い登録電話番号を1つ選択す
ることとしたが,例えばここで類似度の高い順に複数の
登録電話番号を選択し,それらをステップS62におい
て順に音声出力して発呼者に選択を求めるようにしても
よい。上記音声ダイアル機能付き電話機A2についての
説明は以上である。尚,上記実施の形態及び実施例にお
いて使用する音声,例えば「確認」,「訂正」などにつ
いては任意に設定できる。また,以上の説明では,所定
の確認要求の一例として,無声区間が所定時間以上続い
た場合に確認要求があったものと見做すこととしたが,
上記無声区間だけでなく,音声が検出されてもそれが有
効な音声として認識されない無効区間についても上記無
声区間と同様に扱うようにしてもよい。
【0023】
【発明の効果】以上説明したように,第1の発明は,音
声により入力された数字列を認識する音声認識手段と,
上記音声認識手段により認識された数字列を順次記憶す
る認識数字列記憶手段と,上記認識数字列記憶手段に記
憶された上記数字列に基づいて発信を行う第1の発信手
段とを具備する音声ダイアル機能付き電話機において,
音声による数字列入力中の任意時に発生する所定の確認
要求に基づいて,上記認識数字列記憶手段に記憶された
数字列のうちの未確認部分の確認処理を行う入力数字列
確認手段を具備してなることを特徴とする音声ダイアル
機能付き電話機として構成されているため,認識されて
いる数字列をいつでも何度でも確認することができる。
従って,発呼者は自分の区切りやすい一連の数字列単位
(例えば,市外局番などの区切り)で発声,及び確認を
行うことができるため,全ての番号を続けて発声し,ま
とめて確認しなければならない従来技術に比べて意識を
長時間集中する必要がない。このように,運転中などで
も安全にダイアルすることが可能となり,ダイアル操作
への意識の集中が許されない車載電話などにおいて特に
望ましい。また,第2の発明は,予め,任意の数字列を
登録電話番号として記憶する登録電話番号記憶手段と,
音声により入力された数字列を認識する音声認識手段
と,上記登録電話番号記憶手段に記憶された上記登録電
話番号の中から上記音声認識手段により認識された数字
列に対応する登録電話番号を選択する電話番号選択手段
とを具備する音声ダイアル機能付き電話機において,上
記電話番号選択手段が,上記音声認識手段により認識さ
れた数字列と上記登録電話番号記憶手段に記憶された各
登録電話番号との類似度を計算し,該類似度に基づいて
1又は複数の登録電話番号を選択することを特徴とする
音声ダイアル機能付き電話機として構成されているた
め,入力された数字列が,登録されている電話番号と多
少間違って認識されたとしても,最初から入力しなおす
ことなく,正しい電話番号でダイアルすることが可能と
なり,意識の長時間の集中を防止する上で望ましい。
【0024】更に,上記電話番号選択手段により選択さ
れた登録電話番号,若しくは上記音声認識手段により認
識された数字列のいずれかに基づいて発信を行う第2の
発信手段を具備して構成すれば,登録されている電話番
号以外の電話番号でのダイアルも可能となる。更に,上
記電話番号選択手段が,上記選択された登録電話番号及
び/若しくは上記音声認識手段により認識された数字列
を音声で出力して確認を求めるようにすれば,誤った番
号でのダイアルが効果的に防止できる。また,上記類似
度を,例えば上記音声認識手段により認識された数字列
の任意位置に1又は複数の任意の数字を挿入し,その数
字列と上記登録電話番号記憶手段に記憶された各登録電
話番号との間で一致する数字の個数に基づいて計算した
り,上記音声認識手段により認識された数字列から1又
は複数の任意の数字を削除し,その数字列と上記登録電
話番号記憶手段に記憶された各登録電話番号との間で一
致する数字の個数に基づいて計算することにより,音声
認識の過程で関係のない音声を余分に数字として認識し
てしまったり,発声した数字を認識し損ねて数字が欠落
してしまった場合にも正しい登録電話番号を選択するこ
とが可能となる。また,上記第1,第2の発明におい
て,上記音声認識手段による認識中に入力取りやめを意
味する音声入力があると,それまでに認識された数字列
を削除して初期状態に戻すようにすれば,いつでも音声
入力をやり直すことができる。更に,上記第1,第2の
発明において,上記音声認識手段による認識中に,所定
時間以上無声部分,若しくは無効部分が継続した場合に
所定の警告を行うようにすれば,例えば運転に集中しな
いといけない状況が継続するなどしてダイアル操作中で
あることを忘れてしまったような場合に有効である。
【図面の簡単な説明】
【図1】 本発明の実施の形態に係る音声ダイアル機能
付き電話機A1の概略構成を示すブロック図。
【図2】 上記音声ダイアル機能付き電話機A1の状態
遷移図。
【図3】 [初期状態]における処理手順を示すフロー
チャート。
【図4】 [数字入力]における処理手順を示すフロー
チャート。
【図5】 [未確認部処理]における処理手順を示すフ
ローチャート。
【図6】 [途中確認]における処理手順を示すフロー
チャート。
【図7】 [取りやめ確認]における処理手順を示すフ
ローチャート。
【図8】 [最終確認]における処理手順を示すフロー
チャート。
【図9】 本発明の実施例に係る音声ダイアル機能付き
電話機A2の概略構成を示すブロック図。
【図10】 [最終確認]における処理手順を示すフロ
ーチャート。
【符号の説明】
6…音声認識装置(音声認識手段に相当) 8…状態制御装置(入力数字列確認手段に相当) 9…数字列記憶メモリ(認識数字列記憶手段に相当) 10…発信装置(第1,第2の発信手段に相当) 21…番号リスト検索装置(電話番号選択手段に相当) 22…電話番号リスト記憶部(登録電話番号記憶手段に
相当)

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 音声により入力された数字列を認識する
    音声認識手段と,上記音声認識手段により認識された数
    字列を順次記憶する認識数字列記憶手段と,上記認識数
    字列記憶手段に記憶された上記数字列に基づいて発信を
    行う第1の発信手段とを具備する音声ダイアル機能付き
    電話機において,音声による数字列入力中の任意時に発
    生する所定の確認要求に基づいて,上記認識数字列記憶
    手段に記憶された数字列のうちの未確認部分の確認処理
    を行う入力数字列確認手段を具備してなることを特徴と
    する音声ダイアル機能付き電話機。
  2. 【請求項2】 上記入力数字列確認手段が,上記認識数
    字列記憶手段に記憶されている数字列のうちの少なくと
    も未確認部分を音声にて出力して確認を求め,その結果
    訂正要求があった場合に,上記未確認部分の数字列を上
    記認識数字列記憶手段から削除すると共に再度数字列の
    入力を要求する請求項1記載の音声ダイアル機能付き電
    話機。
  3. 【請求項3】 上記音声認識手段による所定時間以上の
    連続した無声部分,若しくは無効部分の検出により上記
    所定の確認要求があったものとみなす請求項1又は2記
    載の音声ダイアル機能付き電話機。
  4. 【請求項4】 上記所定の確認要求が,音声入力により
    行われる請求項1〜3のいずれかに記載の音声ダイアル
    機能付き電話機。
  5. 【請求項5】 予め,任意の数字列を登録電話番号とし
    て記憶する登録電話番号記憶手段と,音声により入力さ
    れた数字列を認識する音声認識手段と,上記登録電話番
    号記憶手段に記憶された上記登録電話番号の中から上記
    音声認識手段により認識された数字列に対応する登録電
    話番号を選択する電話番号選択手段とを具備する音声ダ
    イアル機能付き電話機において,上記電話番号選択手段
    が,上記音声認識手段により認識された数字列と上記登
    録電話番号記憶手段に記憶された各登録電話番号との類
    似度を計算し,該類似度に基づいて1又は複数の登録電
    話番号を選択することを特徴とする音声ダイアル機能付
    き電話機。
  6. 【請求項6】 上記電話番号選択手段により選択された
    登録電話番号,若しくは上記音声認識手段により認識さ
    れた数字列に基づいて発信を行う第2の発信手段を具備
    する請求項5記載の音声ダイアル機能付き電話機。
  7. 【請求項7】 上記電話番号選択手段が,上記選択され
    た登録電話番号及び/若しくは上記音声認識手段により
    認識された数字列を音声で出力して確認を求める請求項
    5又は6記載の音声ダイアル機能付き電話機。
  8. 【請求項8】 上記類似度が,上記音声認識手段により
    認識された数字列と上記登録電話番号記憶手段に記憶さ
    れた各登録電話番号との間の対応する数字の一致個数に
    基づいて計算される請求項5〜7のいずれかに記載の音
    声ダイアル機能付き電話機。
  9. 【請求項9】 上記類似度が,上記音声認識手段により
    認識された数字列の任意位置に1又は複数の任意の数字
    を挿入し,その数字列と上記登録電話番号記憶手段に記
    憶された各登録電話番号との間で一致する数字の個数に
    基づいて計算される請求項5〜8のいずれかに記載の音
    声ダイアル機能付き電話機。
  10. 【請求項10】 上記類似度が,上記音声認識手段によ
    り認識された数字列から1又は複数の任意の数字を削除
    し,その数字列と上記登録電話番号記憶手段に記憶され
    た各登録電話番号との間で一致する数字の個数に基づい
    て計算される請求項5〜8のいずれかに記載の音声ダイ
    アル機能付き電話機。
  11. 【請求項11】 上記音声認識手段による認識中に,入
    力取りやめを意味する音声入力があると,それまでに認
    識された数字列を削除して初期状態に戻す請求項1〜1
    0のいずれかに記載の音声ダイアル機能付き電話機。
  12. 【請求項12】 上記音声認識手段による認識中に,所
    定時間以上無声部分,若しくは無効部分が継続した場合
    に所定の警告を行う請求項1〜11のいずれかに記載の
    音声ダイアル機能付き電話機。
JP10008557A 1998-01-20 1998-01-20 音声ダイアル機能付き電話機 Pending JPH11205430A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10008557A JPH11205430A (ja) 1998-01-20 1998-01-20 音声ダイアル機能付き電話機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10008557A JPH11205430A (ja) 1998-01-20 1998-01-20 音声ダイアル機能付き電話機

Publications (1)

Publication Number Publication Date
JPH11205430A true JPH11205430A (ja) 1999-07-30

Family

ID=11696414

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10008557A Pending JPH11205430A (ja) 1998-01-20 1998-01-20 音声ダイアル機能付き電話機

Country Status (1)

Country Link
JP (1) JPH11205430A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073074A (ja) * 2000-08-31 2002-03-12 Pioneer Electronic Corp 音声による数字列認識方法ならびに装置
US6771982B1 (en) 1999-10-20 2004-08-03 Curo Interactive Incorporated Single action audio prompt interface utlizing binary state time domain multiple selection protocol
US6804539B2 (en) 1999-10-20 2004-10-12 Curo Interactive Incorporated Single action audio prompt interface utilizing binary state time domain multiple selection protocol
JP2011176879A (ja) * 1999-01-06 2011-09-08 Koninkl Philips Electronics Nv 注目期間を有する音声入力装置
JP2012108557A (ja) * 1999-10-05 2012-06-07 Research In Motion Ltd ローカルなインターラプト検出に基づく音声認識技術
US9232037B2 (en) 1999-10-20 2016-01-05 Curo Interactive Incorporated Single action sensory prompt interface utilising binary state time domain selection protocol
WO2019123775A1 (ja) * 2017-12-22 2019-06-27 ソニー株式会社 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
JP2023008600A (ja) * 2021-07-06 2023-01-19 アルインコ株式会社 無線通信装置及び無線通信システム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011176879A (ja) * 1999-01-06 2011-09-08 Koninkl Philips Electronics Nv 注目期間を有する音声入力装置
JP2012108557A (ja) * 1999-10-05 2012-06-07 Research In Motion Ltd ローカルなインターラプト検出に基づく音声認識技術
US6771982B1 (en) 1999-10-20 2004-08-03 Curo Interactive Incorporated Single action audio prompt interface utlizing binary state time domain multiple selection protocol
US6804539B2 (en) 1999-10-20 2004-10-12 Curo Interactive Incorporated Single action audio prompt interface utilizing binary state time domain multiple selection protocol
US8155708B2 (en) 1999-10-20 2012-04-10 Curo Interactive Incorporated Single action audio prompt interface utilising binary state time domain multiple selection protocol
US8611955B2 (en) 1999-10-20 2013-12-17 Curo Interactive Incorporated Single action audio interface utilising binary state time domain multiple selection protocol
US9232037B2 (en) 1999-10-20 2016-01-05 Curo Interactive Incorporated Single action sensory prompt interface utilising binary state time domain selection protocol
JP2002073074A (ja) * 2000-08-31 2002-03-12 Pioneer Electronic Corp 音声による数字列認識方法ならびに装置
JP4486235B2 (ja) * 2000-08-31 2010-06-23 パイオニア株式会社 音声認識装置
WO2019123775A1 (ja) * 2017-12-22 2019-06-27 ソニー株式会社 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
JPWO2019123775A1 (ja) * 2017-12-22 2020-10-22 ソニー株式会社 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
JP2023008600A (ja) * 2021-07-06 2023-01-19 アルインコ株式会社 無線通信装置及び無線通信システム

Similar Documents

Publication Publication Date Title
EP1159732B1 (en) Endpointing of speech in a noisy signal
US7941313B2 (en) System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system
US7203643B2 (en) Method and apparatus for transmitting speech activity in distributed voice recognition systems
EP1058925B1 (en) System and method for noise-compensated speech recognition
KR100383353B1 (ko) 음성인식장치및음성인식장치용어휘발생방법
US5640485A (en) Speech recognition method and system
US20070057798A1 (en) Vocalife line: a voice-operated device and system for saving lives in medical emergency
US20060215821A1 (en) Voice nametag audio feedback for dialing a telephone call
JP4246703B2 (ja) 自動音声認識の方法
KR20080107376A (ko) 화자 독립 음성 인식을 구비한 통신 장치
JP5431282B2 (ja) 音声対話装置、方法、プログラム
JPH11205430A (ja) 音声ダイアル機能付き電話機
EP1477965A1 (en) Spoken keyword recognition apparatus and method
US20070129945A1 (en) Voice quality control for high quality speech reconstruction
JPH03248199A (ja) 音声認識方式
JP2000338991A (ja) 認識率信頼性表示機能付き音声操作電話装置及びその音声認識方法
JP2003177788A (ja) 音声対話システムおよびその方法
JP3285704B2 (ja) 音声対話のための音声認識方法及び装置
JP4408665B2 (ja) 音声認識用発話データ収集装置、音声認識用発話データ収集方法、及びコンピュータプログラム
KR20170089670A (ko) 차량 및 그 제어방법
JP3588929B2 (ja) 音声認識装置
JP3443874B2 (ja) 音声認識装置および方法
KR100811554B1 (ko) 음성 다이얼링 기능을 갖는 통신 단말기 및 음성 다이얼링방법
JPH11109987A (ja) 音声認識装置
JPH06161488A (ja) 音声認識装置