JPH11275205A - 自動ダイヤル用音声コマンドシステム - Google Patents

自動ダイヤル用音声コマンドシステム

Info

Publication number
JPH11275205A
JPH11275205A JP806099A JP806099A JPH11275205A JP H11275205 A JPH11275205 A JP H11275205A JP 806099 A JP806099 A JP 806099A JP 806099 A JP806099 A JP 806099A JP H11275205 A JPH11275205 A JP H11275205A
Authority
JP
Japan
Prior art keywords
module
variable
key
data
entry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP806099A
Other languages
English (en)
Inventor
Chu Yaacherun
チュ ヤ−チェルン
Rin Too-Hoa
リン トォ−ホア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JPH11275205A publication Critical patent/JPH11275205A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】 【課題】 本発明は音声コマンドによって自動ダイヤル
する音声コマンドシステムの提供を目的とする。 【解決手段】 本発明は、文字列ではなく音標表記を電
話帳のエントリーに使用する。音標表記は表1に定義さ
れた特別に設計されたキー入力系列に従ってキーパッド
で入力され得る。或いは、標準中国語の場合、1文字毎
に1音節であるため、エントリーは、音節を一つずつ電
話機の受話器に発話することにより音声認識で実現され
得る。音標表記は音声コマンドモデルに自動的に変換さ
れるので、利用者は口述コマンドにより電話番号をダイ
ヤルすることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電話機に組み込ま
れるように音声コマンドによって自動ダイヤルする自動
ダイヤル用音声コマンドシステムに関する。
【0002】
【従来の技術】所望の電話番号を入力するためキーパッ
ドを順番に押下するだけではなく、市販されている電話
機は、後でダイヤルするため電話番号を記憶するためホ
ットキー(hot key) を利用するような他の特徴を提供す
る。この種のアプローチは、一般手金い、利用者が電話
番号を入力する前に“記憶”キーを押下することを要求
し、この電話番号は対応したホットキーを押下すること
により記憶される。初期設定後、利用者は、意図した電
話番号をダイヤルするため対応したホットキーを押下す
ることにより登録された電話番号、すなわち、エントリ
ーを呼び出す。
【0003】
【発明が解決しようとする課題】しかし、従来の番号を
ダイヤルすることは簡単な方法であるが、以下の通り幾
つかの欠点がある。(1)ホットキーと電話帳エントリ
ーとの間の対応関係を記憶することが困難である。
(2)他の人には利用者が設定した電話帳エントリーが
分からない。(3)作成された電話帳エントリーの対応
関係リストは、電話帳エントリーが変更される毎に更新
される必要がある。
【0004】本発明の目的は、音声コマンドによって自
動ダイヤルすることを特徴とする自動ダイヤル用音声コ
マンドシステムを提供することである。本発明の別の目
的は、キーパッドを用いて漢字エントリーを入力するた
め使用される以下の表1に記載されるような音(おん)
と音節のための写像スキームを提供することである。表
1に掲載された符号化スキーム並びに本発明に記載され
た方法とを使用することにより、電話機のキーパッドを
用いて漢字エントリーを容易に入力できるようになる。
全ての漢字エントリーは、音標記号系列によって入力、
表示される。また、名前エントリーは音声コマンドモデ
ルに自動的に変換され、利用者は、補助的な学習をしな
くても、各エントリーを編集した後に口述コマンドによ
ってダイヤルできるようになる。
【0005】
【課題を解決するための手段】本発明による自動ダイヤ
ル用音声コマンドシステムは、多数の基本構成要素を含
む。動作選択モジュールは、コマンドモード、編集モー
ド、又は、通常モードの三つのモードの中から電話機の
動作モードを決定する。変更モジュールは、対応した音
及び音標記号の形の名前エントリーと、電話番号エント
リーとを格納する電話帳データベースに、電話番号エン
トリーを追加する機能を特徴とする。音響データベース
は、基本音響モデルと、基本音響モデルを順番に連結す
ることにより形成される音声コマンドモデルとを含む。
音声認識モジュールは、利用者の入力発声を復号化し、
N個の最良結果を得るため、音響データベースに格納さ
れた音響モデル及び音声コマンドモデルを使用する。表
示モジュールは、変更モジュール及び音声認識モジュー
ルの結果を表示し、変更された結果を照合後に変更モジ
ュールに送り、所望の電話番号をダイヤルするため、復
号化された結果をダイヤルモジュールに送る。
【0006】
【発明の実施の形態】以下、添付図面を参照して本発明
を詳細に説明する。図1は、本発明の一実施例による自
動ダイヤル用音声コマンドシステムを説明するブロック
図である。同図に示される如く、音声コマンドシステム
は、コマンドモード27、編集モード28又は通常モー
ド26の中で現在動作モードを決定する動作選択モジュ
ール10を含む。コマンドモード27は、入力発声を受
け容れ、対応した電話番号を検出し、利用者の代わりに
その電話番号をダイヤルする。編集モード28は電話帳
データベース12の機能を提供する。通常モード26は
典型的な電話機能と同じである。変更モジュール11
は、登録、問い合わせ、変更の3種類の編集機能を提供
する。登録機能は、利用者が新しい名前及び番号のエン
トリーを電話帳データベース12に追加できるように
し、音声コマンドモデルを形成するため名前エントリー
を表現する基本音響モデルを順番に接続する。問い合わ
せ機能は、利用者が特定のデータエントリーを見つける
手助けを行い、利用者が自分でダイヤルすることを可能
にさせる。変更機能は、電話番号エントリーの追加・削
除と、データレコードの削除のユーティリティを提供す
る。電話帳データベース12は、対応した音標記号で表
された名前エントリーと、電話番号エントリーとを格納
する。音響データベース13は、隠れマルコフモデルを
採用し、(a)408個の音節用の音響モデルと、
(b)名前エントリーの対応した音響モデルによって形
成された音声コマンドモデルとを格納する。音声認識モ
ジュール14は、入力発声を音響モデルに類似した特徴
ベクトルに復号化し、N個の最良音響モデル又はN個の
最良音声コマンドモデルを見つけるためビタビ復号化手
続きを使用する。表示モジュール15は、変更モジュー
ル11及び音声認識モジュール14の結果を表示する。
フォント16は、表示モジュール15によって使用され
るアラビア数字、音標記号及び特殊サインの表示用フォ
ントを格納する。
【0007】図2乃至10は、本発明の一実施例による
自動ダイヤル用音声コマンドシステムの処理を説明する
フローチャートである。動作手続きは図2乃至10を参
照して詳細に説明される。図2は図1に示された動作選
択モジュール10の処理を説明するフローチャートであ
る。動作選択モジュール10は、コマンドモード27、
編集モード28又は通常モード26の中から現在動作モ
ードを決定する。同図に示されるように、受話器が受話
器受けから外された後(ステップ21)、動作選択モジ
ュール10はダイヤルトーンを検出する(ステップ2
2)。ダイヤルトーンが無い場合、電話機は通常モード
26に設定される。ダイヤルトーンが検出された場合、
音声コマンドシステムは、ダイヤル用のオンライン状態
に入る。動作選択モジュール10は、次に、利用者の発
声があるかどうかを判定する(ステップ23)。何らか
の入力発声の出現は自動ダイヤルを意図した音声コマン
ドを表し、システムはコマンドモード27に入る。コマ
ンドモード27の処理は図10に詳細に示されている。
利用者の発声が無い場合、動作選択モジュール10は、
“#”キーが押下されたかどうかを判定する(ステップ
25)。“#”キーが押下された場合、システムは編集
モード28に入る。編集モード28の詳細は図3に示さ
れている。利用者によって“#”キー以外のキーの押下
は、利用者のダイヤルを回す行動を意味するので、シス
テムは通常モード26に入る。本発明の自動ダイヤル用
音声コマンドシステムが通常モードにはいるとき、電話
機は通常の電話機と同じように使用される。
【0008】図3乃至9は、図1に示された変更モジュ
ール11の処理を示すフローチャートである。変更モジ
ュール11は、利用者が名前エントリー及び電話番号エ
ントリーを電話帳データベース12に追加することがで
きる編集機能を提供する。また、変更モジュール11
は、音声コマンドモデルを形成するため、発音記号リス
トに従って基本音響モデルを合成する。図3は編集モー
ドの処理を表すフローチャートであり、図4及び5は編
集モードの中の登録機能の処理を表すフローチャートで
あり、図6は編集モードの中の音声登録機能の処理を表
すフローチャートであり、図7は編集モードの中の問い
合わせ機能の処理を表すフローチャートであり、図8及
び9は編集モードの中の変更機能の処理を表すフローチ
ャートである。
【0009】図3には、音声登録機能37と、登録機能
38と、問い合わせ機能39と、変更機能40の4種類
の機能を実現する編集モード28の処理を説明するフロ
ーチャートが示されている。編集モードに入ると、 “1.音声、2. 登録、3.問い合わせ、4.変更” というメッセージが表示される(ステップ31)。ステ
ップ32において、押下されたキーが読まれる(key=ge
tkey())。システムは、キー“1”が押下されたとき
“音声登録”機能37に進み、キー“2”が押下された
とき“登録”機能38に進み、キー“3”が押下された
とき“問い合わせ”機能39に進み、キー“4”が押下
されたとき“変更”機能に進む。
【0010】図4は、編集モード28下の登録機能38
の処理を説明するフローチャートである。登録機能38
は、名前エントリーを編集するユーティリティと、電話
番号エントリーを編集するユーティリティと、音声コマ
ンドモデル408を形成するため発音記号リストに従っ
て基本音響モデル357を合成するユーティリティと、
名前エントリー及び電話番号エントリーを電話帳データ
ベース12に追加するユーティリティと、音声コマンド
モデルを音響データベース13に追加するユーティリテ
ィのようなユーティリティを実現する。図4の登録機能
のフローチャートにおいて、変数Nflag は、最初、1に
設定される(ステップ310)。Nflag=1 は、システム
が名前登録ユーティリティに入ることを意味する。次
に、システムは、変数Tcnt, cnt1, cnt2を1に設定する
(ステップ310)。変数Tcntは、電話番号エントリー
の長さ(最大15個の数字)を表し、Tcnt=0は数字エン
トリーが存在しないことを表す。キーが押下されると、
キー入力エントリーが変数key に記憶される(ステップ
311)。システムは、次に、変数Nflag=1 であるかど
うかを検出する(ステップ312)。変数Nflag=1 の場
合、システムは名前登録ループに進み、システムは、図
5に示される如く、変数key="*" を検出する(ステップ
330)。変数key="*" の場合、表示装置のカーソルは
前のエントリーに移動し(ステップ343)、システム
はステップ311に戻る。変数key="*"ではない場合、
キー入力エントリーは名前バッファに入れられる(ステ
ップ331)。システムは、次に、変数key="#" である
かどうかを検出する(ステップ332)。変数key ≠"
#" の場合、キー"#" の連続的な押下の回数をカウント
する変数cnt1は0にリセットされ(ステップ344)、
システムはステップ311に戻る。変数key="#" の場
合、値1が変数cnt1に加算される(ステップ333)。
次に、システムは、変数cnt1=2を検出する(ステップ3
34)。変数cnt1=2ではない場合、システムはステップ
311に戻る。変数cnt1=2の場合、利用者はキー”#”
を2回押下しているので、名前登録セッションの終了を
意味し、変数cnt1は0にリセットされる(ステップ33
5)。システムは、次に、名前エントリーに対応するキ
ー入力音標表記が表1に示されるような音標記号の符号
化定義を満たすかどうかを確認する(ステップ33
6)。
【0011】
【表1】
【0012】名前エントリーが符号化定義を満たさない
場合、エラーメッセージが表示され(ステップ337及
び346)、システムはステップ311に戻る。さもな
ければ、名前エントリーは表1のマッピング345に従
って音標記号に変換される。システムは、名前エントリ
ーが表1に示されるような408個の音節の定義を満た
すかどうかを確認する(ステップ338)。名前エント
リーがマッピング定義を満たさない場合(ステップ33
9)、エラーメッセージが表示され(ステップ34
8)、システムはステップ311に戻る。名前エントリ
ーがマッピング定義を満たす場合、システムは名前エン
トリーが重複しているかどうかを確認する(ステップ3
40)。名前が重複している場合、重複メッセージが表
示され(ステップ349)、システムはステップ311
に戻る。さもなければ、システムは、利用者にキー入力
された名前エントリーを照合するよう問い合わせるメッ
セージを表示する(ステップ341)。肯定的な確認が
得られない場合、システムはステップ311に戻る。さ
もなければ、変数Nflag は0にリセットされる(ステッ
プ342)。変数Nflag=1 の場合、システムが電話番号
登録ユーティリティに入ることを示し、システムはステ
ップ311に戻る。以下、名前登録ユーティリティの一
例を説明する。
【0013】利用者が中国語の名前“李小華”を入力し
たい場合、最初に文字列を音標表記
【0014】
【外1】
【0015】に変換する。次に、利用者は、音標表記に
対応したキー入力シーケンスを表1から見つける。表1
の数字より前にキー“#”が置かれるべきであることに
注意する必要がある。
【0016】
【外2】
【0017】に対し得られるキー入力シーケンスは、
“58#72#3”#64#72#81#3#61#7
3375#2##”であり、2重のキー“##”は名前
登録セッションの終了を示す。文字列は名前バッファに
移され、表示モジュールによって、
【0018】
【外3】
【0019】のように表示される。他の一実施例におい
て、システムは、個々の音標記号に対応した数字を表示
するため表示モジュール15を使用し、これにより、使
用者は対応したキーを押下して所望の音標記号を選択で
きる。例えば、表示モジュール15の1ページ目に、音
標記号
【0020】
【外4】
【0021】と、対応した数字“0123456
7...”を最初に表示してもよい。漢字文字列“李小
華”を入力するため、音標記号
【0022】
【外5】
【0023】を表現する数字“7”が最初に選択され
る。所望の音標記号が1ページ目に表示できない場合、
2ページ目に、名前エントリーを同じ方法で完全に入力
するように表示される。図5において、変数Nflag を0
にすることは名前登録セッションの終了を表し(ステッ
プ342)、システムは電話番号登録の準備ができてい
る。図4は、番号登録ユーティリティのフローチャート
である。キーが押下された後、キーエントリーは変数ke
y に記憶される(ステップ311)。システムは、変数
Nflag=1であるかどうかを検出する(ステップ31
2)。変数Nflag=1 ではない場合、システムは番号登録
ループに入る。次にシステムは変数key="*" であるかど
うかを検出する(ステップ313)。変数key="*" の場
合、カーソルは前のエントリーに移動し(ステップ31
9)、システムはステップ311に戻る。さもなけれ
ば、システムは、変数key="#" であるかどうかを検出す
る(ステップ314)。変数key ≠"#" の場合、変数cn
t1は0にリセットされる(ステップ315)。変数cnt1
は、キー“#”の連続的な押下の回数をカウントする。
システムは、変数key が0以上かつ9以下の範囲に収ま
るかどうか、並びに、変数Tcntが15未満であるかどう
かを検出する(ステップ316)。否定的な結果は、変
数key が無効エントリーであることを意味し、システム
は何もすることなくステップ311に戻る。変数key が
有効エントリーである場合、キー入力エントリーは、番
号バッファに一時的に入れられる(ステップ317)。
次に、ステップ318において変数Tcntに値1が加算さ
れ(数字1を電話番号に加算する)、システムはステッ
プ311に戻る。ステップ314において、変数key="
#" の場合、値1が変数cnt1に加算される(ステップ3
20)。システムは、次に、変数cnt1=2であるかどうか
を検出する(ステップ321)。変数cntl≠2 の場合、
1個の電話番号エントリーが完全に登録されている可能
性がある。システムは、変数Tcnt>0であるかどうかを検
出する(ステップ326)。否定的な結果は電話番号エ
ントリーが無いことを示し、システムは何もしないでス
テップ311に戻る。肯定的な結果の場合、電話番号エ
ントリーが有効であり、記憶された電話番号エントリー
数(最大4)を表す変数cnt2に値1が加算される(ステ
ップ327)。システムは変数Tcntを0にリセットす
る。システムは、変数cnt2=4であるかどうかを検出する
(ステップ328)。否定的な結果の場合、システムは
ステップ311に戻る。変数cnt2=4の場合、4個全ての
電話番号エントリーが利用者によって完全に設定されて
いる。名前バッファ及び番号バッファに一時的に収容さ
れた名前エントリー及び電話番号エントリーは、電話帳
データベース12に移され(ステップ324)、システ
ムは図3の編集モードの開始点に戻る。ステップ321
において変数cnt1=2の場合、番号登録セッションが終了
する。システムは変数cnt1を0にリセットし(ステップ
322)、変数cnt2>0であるかどうかを検出する(ステ
ップ323)。否定的な結果は、番号バッファに電話番
号エントリーが無いことを表し、システムは何も動作す
ることなくステップ311に戻る。肯定的な結果の場
合、電話番号エントリーは一時的に番号バッファに収容
され、システムはステップ324に進み、前述の通り、
音響モデルを音声コマンドモデルに変換し、名前エント
リー及び電話番号エントリーを電話帳データベース12
に移す。番号登録動作の一例を以下に説明する。
【0024】“李小華”が2個の電話番号:212−7
827657及び7556133を保有する場合を想定
する。これらは、シーケンス“2127827657#
7556133##”によって入力され、単独のキー
“#”は別々の電話番号を分離するため使用され、2重
のキー“##”は番号エントリーの最後を表す。キー入
力された名前エントリー及び電話番号エントリーは、表
1に示されたデータ構造を有する電話帳データベース1
2に記憶される。表1の第1列は、音声コマンドモジュ
ールの通し番号と一致したシリアル番号を表す。第2列
は、名前エントリーを対応した音標記号の形式で表現す
る。第3乃至6列は、番号エントリーを記憶するため使
用される。表1に示されるように、キー入力エントリー
は、“李小華”を表現する文字列“58 783 64
72 81 3 6173 75 2”を含み、その
番号エントリーは、212−7827657及び755
6133である。
【0025】音声コマンドモジュール13は、基本音響
モデル357と、基本音響モデル357を連結すること
により形成される音声コマンドモデル408とを含む。
基本音響モデル357は、トーン(声調)を含まない音
節モデルである。各音節モデルは、ライトコンテクスト
依存性(RCD)頭音及び末尾音の組合せである。全部
で109個のRCD頭音及び38個の末尾音が使用され
る。これらのRCD頭音及び末尾音は、多数話者音声デ
ータベースを用いるセグメンタルk−平均法によって学
習された隠れマルコフモデルである。これらの隠れマル
コフモデルの特徴ベクトルは、12メル−周波数ケプス
トラム(Mel-frequency cepstrum)係数と、12デルタメ
ル−周波数ケプストラム(Delta Mel-frequency cepstru
m)係数とからなる。名前“李小華”は、音響モデルがR
CD頭音及び末尾音から合成される態様を説明するため
一例として使用される。音節
【0026】
【外6】
【0027】は、RCD頭音“l_i”及び末尾音
“i”とにより形成される。記号
【0028】
【外7】
【0029】は、
【0030】
【外8】
【0031】の音節モデルを表現するため使用される。
同様に、記号
【0032】
【外9】
【0033】及び
【0034】
【外10】
【0035】は、夫々、
【0036】
【外11】
【0037】及び
【0038】
【外12】
【0039】の音節モデルを表現するため使用される。
音声コマンドモデルは、音節モデルを同様に連結するこ
とによって形成される。例えば、名前“李小華”に対す
る音声コマンドモデルは、音節モデル
【0040】
【外13】
【0041】
【外14】
【0042】及び
【0043】
【外15】
【0044】を連結することにより形成される。記号
【0045】
【外16】
【0046】は、“李小華”に対する音声コマンドモデ
ルを表現するため使用される。図6は、編集モード中の
音声登録機能を説明するフローチャートである。上記の
通り、図4に示された登録機能は、名前エントリーを編
集するため表1に示された音標記号に対する符号化スキ
ームを使用して名前エントリーを編集する方法を提供す
る。編集モード中の音声登録機能は、利用者が口述入力
によって名前エントリーを編集し得る別の方法を提供す
る。音声登録過程において、変数Scntは0に初期セット
される(ステップ351)。変数Scntが0であるとき、
入力発声が無い。次に、音節が受話器に発声される(ス
テップ352)。変数kcntは0にセットされる(ステッ
プ353)。変数kcntが0であるとき、音節が更なる照
合を必要とすることを意味する。入力音節は更なる処理
のため音声認識モジュール14に供給される。音声認識
モジュール14は、端点検出段階と、特徴抽出段階と、
パターンマッチング段階の3段階により構成される。端
点検出モジュール354は、音声信号を背景ノイズから
分離する。特徴抽出モジュール355は、12個のメル
−周波数ケプストラム係数及び12個のデルタメル−周
波数ケプストラム係数とからなる特徴ベクトルを抽出す
るため入力音声のスペクトル解析を行う。パターンマッ
チングモジュール355は、入力音声に最も類似したN
個の最良音節モデル357を見つけるため、ビタビ復号
化手続を使用する。得られた結果は、入力音声と408
個の音節モデル357との間の類似度を表現するマッチ
ングスコアに応じて分類される。得られた結果は、次
に、マッチングスコアに従って対応した音標記号の形で
順番に表示される(ステップ358)。最高のマッチン
グスコアの結果が最初に表示される。システムは、キー
入力値を要求し(ステップ360)、キー入力値を表現
する変数key が0と4の範囲に収まるかどうかを決定す
る。肯定的な結果は、現在表示中の音標記号が入力音節
に対応することを意味し、変数key の値は入力音節のト
ーンを表す。システムは、次に、変数kcnt=0であるかど
うかを検出する(ステップ369)。肯定的な結果は、
音節が更なる照合を要求することを意味し、音節及びそ
のトーンは、名前バッファに一時的に格納される(ステ
ップ370)。値1が変数Scntに加算され、文字が名前
エントリーに追加されたことを表す。変数kcntは1にセ
ットされ、入力音節が選択されたことを示す(ステップ
367)。
【0047】一方、変数kcntが0ではない場合、入力音
節が選択されたことを示す。入力音節のトーンは、変数
key の値によって置換される(ステップ368)。シス
テムは次のキー入力値のためステップ360に戻る。変
数key が0と4の間に収まらないとき、システムは、変
数key=8 であるかどうかを検出する(ステップ36
2)。肯定的な結果は、マッチング結果の次の候補を調
べるべきであることを意味し、システムはステップ35
8に戻る。否定的な結果の場合、システムは変数key=7
であるかどうかを検出する(ステップ363)。肯定的
な結果は、次の音節が受話器に発声される準備ができて
いることを表し、システムはステップ352に戻る。さ
もなければ、システムは、変数key=0 であるかどうかを
検出する(ステップ364)。否定的な結果の場合、シ
ステムはステップ360に戻り、キー入力値が要求され
る。変数key が0である場合、名前登録セッションの終
了を表す。システムは、次に、変数Scnt>0であるかどう
かを検出する(ステップ365)。否定的な結果は、名
前エントリーが名前バッファに格納されていないことを
表し、システムはステップ352に戻り、利用者に音声
で名前エントリーを入力するよう要求する。変数Scntが
0よりも大きい場合、名前登録セッションの終了を示
す。システムは、変数Nflag, Tcnt, cnt1,cnt2 を0に
リセットする(ステップ356)。変数設定は、後続の
番号登録機能のため図4に示された結合ポイントat
(ステップ350)に進む前に行われる必要がある。
【0048】一例として、名前“李小華”を入力するた
め、最初に、音節
【0049】
【外17】
【0050】が受話器に向けて発話される。音声認識モ
ジュール14によって見つけられたN個の最良音響モデ
ルが
【0051】
【外18】
【0052】である場合を考える。表示モジュール15
は、最初に、音標記号
【0053】
【外19】
【0054】を表示する。この音標記号は単語“李”を
表現する音標記号ではないので、キー“8”が押下され
る。表示モジュールは、次に、単語“李”を表現しない
音標記号
【0055】
【外20】
【0056】を表示するので、再度キー“8”が押下さ
れる。表示モジュールは、次に、単語“李”の音標記号
に対応した音標記号
【0057】
【外21】
【0058】を表示するので、その音標記号のトーン
(声調)を表示するためキー“3”が押下される。変更
が必要である場合、値1から4までのキーが次の音声入
力の前に入力される。例えば、キー“4”は、
【0059】
【外22】
【0060】を
【0061】
【外23】
【0062】に変更する。次に、キー“7”を押下する
ことにより、名前エントリーは、次の音声入力
【0063】
【外24】
【0064】及び、後続の音声入力
【0065】
【外25】
【0066】に関して照合される。利用者は、名前登録
セッションの終了を示すためキー“0”を押下する。こ
のとき、名前バッファは、“李小華”を表現する文字列
“#58#72#2”#64#72#81#3#61#
73#75#2##”を含む。システムは、変更モジュ
ールの電話番号登録エントリー機能38に進む。図7は
編集モジュール28の問い合わせ機能39を示すフロー
チャートである。問い合わせ機能39は、前のデータエ
ントリーを表示し(ステップ379)若しくは次のデー
タエントリーを表示し(ステップ380)、利用者が現
在表示中のデータエントリーをダイヤルできるようにす
る(ステップ378)。利用者が問い合わせ機能39に
進んだ後、システムは、電話帳データベース12にデー
タエントリーが存在するかどうかを検出する(ステップ
371)。データエントリーが存在しない場合、問い合
わせ機能は注視され、システムは図3の編集モード28
の開始点に戻る。データエントリーが存在する場合、シ
ステムは、最後に使用されたデータエントリーを表示す
る(ステップ372)。キーの入力が要求され、キー入
力値は変数key に格納される(ステップ373)。シス
テムは、変数key="*" であるかどうかを検出する(ステ
ップ374)。肯定的な結果の場合、前のデータエント
リーが表示され(ステップ379)、システムはステッ
プ373に戻る。否定的な結果の場合、システムは、変
数key="#" であるかどうかを検出する(ステップ37
5)。肯定的な結果の場合、次のデータエントリーが表
示され(ステップ380)、システムはステップ373
に戻る。否定的な結果の場合、システムは、変数key=0
であるかどうかを検出する(ステップ376)。肯定的
な結果は、問い合わせセッションの終了を示し、システ
ムは図3の編集モジュールの開始点28に戻る。否定的
な結果の場合、システムは、変数key が現在表示中の電
話番号と一致するかどうかを検出する(ステップ37
7)。肯定的な結果の場合、システムは、選択された電
話番号をダイヤルし、通常モジュール26に進む。否定
的な結果の場合、システムはキー入力値を無視し、次の
キー入力値のためステップ373に戻る。
【0067】図8及び9は、編集モード28における変
更機能40を示すフローチャートである。変更機能は、
番号エントリーの追加/削除ユーティリティと、データ
ベース中のレコードの削除ユーティリティを実現する。
利用者が変更機能40に入った後、システムは、最初
に、データエントリーが電話帳データベース12に存在
するかどうかを検出する(ステップ381)。否定的な
結果の場合、変更機能は中止され、システムは図3の編
集モードの開始点28に戻る。肯定的な結果の場合、シ
ステムは、最後に使用されたデータエントリーを表示し
(ステップ382)、変数Aflag, Dflag, Tcntを0にセ
ットする(ステップ383)。変数Aflag=1 は追加ユー
ティリティの選択を表し、変数Dflag=1 は削除ユーティ
リティの選択を表し、変数Tcntは電話番号エントリーの
長さ(最大15個の数字)を示す。利用者は、キーを押
下することにより命令を入力することができ、キー入力
値は変数key に格納される(ステップ384)。システ
ムは、変数key="*" であるかどうかを検出する(ステッ
プ385)。肯定的な結果は、削除が選択されたことを
表し、変数Dflag は1にセットされ、変数Aflag は0に
セットされる(ステップ390)。システムはステップ
384に戻る。システムは、変数key="#" であるかどう
かを検出する(ステップ386)。肯定的な結果は追加
ユーティリティが選択され、変数Dflag は0にセットさ
れる(ステップ398)。システムは、次に、変数Tcnt
>0であるかどうかを検出する(ステップ399)。肯定
的な結果は、追加ユーティリティの終了を表し、番号バ
ッファに一時的に格納された番号エントリーは電話番号
データベース12に移される(ステップ402)。値1
が先に記憶されている電話番号エントリーの総数を表現
する変数TelCntに加算され、1を加算することにより、
追加の番号エントリーが入力されたことを表す(最大
4)。また、変数Aflag は追加ユーティリティを終了さ
せるため0にリセットされ、変数Tcntは0にリセットさ
れる(ステップ403)。システムは次にステップ38
4に戻る。変数Tcntが0であるとき、番号エントリーが
存在しない。追加ユーティリティに入った後、システム
は、最初に、電話番号エントリーの数が4を超えるかど
うかを検出する(ステップ400)。換言すれば、シス
テムは、変数TelCnt=4であるかどうかを検出する。肯定
的な結果は、これ以上の番号登録はできないことを意味
し、システムはキー“#”を無視し、ステップ384に
戻る。否定的な結果の場合、追加電話番号エントリーが
加えられ、追加ユーティリティに入るため、変数Aflag
は1にセットされる(ステップ401)。次に、システ
ムはステップ384に戻る。変数key が“*”でも
“#”でも無い場合、システムは、変数Dflag=1 である
かどうかを検出する(ステップ387)。肯定的な結果
は削除ユーティリティの開始を示す。削除ユーティリテ
ィに入った後、システムは、最初に、変数key が表示中
のいずれかの電話番号と一致するかどうかを検出する
(ステップ391)。肯定的な結果の場合、システムは
対応した番号エントリーを電話帳データベースから削除
する(ステップ397)。否定的な結果の場合、システ
ムは、変数key=5 であるかどうかを検出する(ステップ
392)。肯定的な結果は、名前エントリーと、電話番
号エントリーと、名前エントリーを表現する音声コマン
ドモデル408とを含むデータベースのレコードが削除
されるべきことを示す(ステップ392)。このとき、
システムは、レコード全体を削除すべきかどうかを問い
合わせるメッセージを表示する(ステップ393)。否
定的な応答の場合、システムは何も動作しないでステッ
プ384に戻る。肯定的な応答の場合、レコード全体が
電話帳データベース12から削除され、名前エントリー
に対応する音声コマンドモデル408は音響データベー
ス13から削除される。その後、システムは他のエント
リーが電話帳データベース12に存在するかどうかを検
出する(ステップ395)。肯定的な結果の場合、シス
テムは、次の変更コマンドのため、変更機能の開始点4
0に戻る。さもなければ、システムは次の編集コマンド
のため、図3の編集モードの開始点28に戻る。削除ユ
ーティリティにおいて、変数key が表示中のいずれの電
話番号とも一致せず、また、変数key=5 ではない場合、
システムはステップ389に進む。変数key が“*”で
も“#”でも無く、変数Dflag ≠1 である場合、システ
ムは変数Aflag=1 であるかどうかを検出する(ステップ
388)。肯定的な結果の場合、追加ユーティリティが
選択され、システムは追加ユーティリティに進む。次
に、システムは、ステップ404において、変数key が
0から9の範囲に収まるか、並びに、変数Tcnt<15 (電
話番号エントリーの最大長さ)であるかどうかを検出す
る。肯定的な結果は、変数key を番号バッファに一時的
に格納させ(ステップ405)、値1が変数Tcntに加算
され(ステップ406)、電話番号の数字の追加を示
す。システムはステップ384に戻る。変数key が0か
ら9間での範囲に収まらないか、或いは、変数Tcntが1
5未満ではない場合、キー入力値は無効であるか、若し
くは、番号エントリーの数字が15個以上であることを
意味するので、システムは何も動作しないでステップ3
84に戻る。変数key が“*”或いは“#”のいずれで
もなく、変数Dflag 及びAflag が共に1ではないとき、
システムは、変数key=0 であるかどうかを検出する(ス
テップ389)。変数key ≠0 である場合、システムは
キー入力値を無視し、ステップ384に戻る。変数値が
0である場合、変更機能40の終了を示し、システムは
次の編集コマンドのため図3の編集モードの開始点28
に戻る。変更機能の一例を以下に説明する。
【0068】利用者が電話帳データベース12に記憶さ
れた3番目のデータレコードを問い合わせ機能を用いて
選択する場合を考える。このレコードは、
【0069】
【外26】
【0070】に対する4組の電話番号エントリーを有す
る。表示モジュール15はデータエントリーを以下の通
り表示する。
【0071】
【外27】
【0072】4番目の電話番号エントリーを85566
94から5862699に変更する必要がある場合、最
初に、キー“*4”を押下することにより4番目の番号
が削除される。ここで、“*”は削除ユーティリティを
表し、“4”は4番目の番号エントリーを表す。次に、
新しい番号エントリーが系列“#5862699#0”
によって入力される。ここで、最初の“#”は番号エン
トリーの先頭を表し、2番目の“#”は番号エントリー
の末尾を表す。系列中の最後の“0”は、変更セッショ
ンの終了を意味する。上記処理の実行後、システムは、
変更されたデータレコードを以下の通り表示する。
【0073】
【外28】
【0074】図10は、図1の音声認識モジュール14
のコマンドモード27を説明するフローチャートであ
る。コマンドモード27は、利用者が音声コマンドを用
いて記憶された電話番号エントリーをダイヤルすること
ができる。コマンドモード27に入った後、利用者は、
最初に相手先の名前を受話器に向けて発話する(ステッ
プ407)。但し、相手先の名前は、上記の編集モジュ
ール28を用いて、予め音声コマンドモデル408に変
換され、相手先の電話番号は電話帳データベース12に
記憶されていると仮定する。音声セグメントは、処理の
ため音声認識モジュール14に送られる。音声認識モジ
ュール14は、音声認識モジュール14は、端点検出段
階と、特徴抽出段階と、パターンマッチング段階の3段
階により構成される。端点検出モジュール354は、音
声セグメントを背景ノイズから分離する。特徴抽出モジ
ュール355は、12個のメル−周波数ケプストラム係
数及び12個のデルタメル−周波数ケプストラム係数と
からなる音声コマンドモデル13の特徴ベクトルを抽出
するため音声セグメントのスペクトル解析を行う。パタ
ーンマッチングモジュール355は、入力音声セグメン
トに最も類似したN個の最良音声コマンドモデル408
を見つけるため、ビタビ復号化手続を使用する。得られ
た結果は、入力音声セグメントと音声コマンドデル40
8との間の類似度を表現するマッチングスコアに応じて
分類される。得られた結果は、次に、分類された順番で
対応した音標記号の形で表示される(ステップ35
8)。最高のマッチングスコアの結果が最初に表示され
る。システムは、変数key に格納されたキー入力値を要
求する(ステップ409)。次に、システムは、変数ke
y=8 であるかどうかを検出する(ステップ410)。肯
定的な結果は、現在表示中のデータエントリーが正しく
ないことを意味し、システムは、次の実現可能なデータ
エントリーのためステップ358に戻る。変数key が8
では無い場合、表示されたデータエントリーが正しい、
若しくは、利用者が再度受話器に発話すべきであるのい
ずれかを示す。システムは、変数key=7 であるかどうか
を検出する(ステップ411)。肯定的な結果の場合、
システムは、コマンドモードの開始点27に戻り、口述
入力が期待される。変数key=7 では無い場合、表示され
たデータエントリーは正しいことを意味するので、シス
テムは、変数key が表示されたいずれかの電話番号エン
トリーと一致するかどうかを検出する(ステップ41
2)。肯定的な結果は、システムが選択された電話番号
を直ちにダイヤルすることを許可し(ステップ41
3)、システムを通常モード26に進める。否定的な結
果の場合、システムは、次のキー入力値のためステップ
409に進む。音声コマンドを使用して記憶された電話
番号をダイヤルする方法を以下に説明する。
【0075】利用者が“李小華”と通話したい場合、利
用者は最初に受話器を取り上げ、受話器に向かって“李
小華”と発話する。この場合、音声認識モジュール14
は、“王大明”が最高マッチングスコアを有するを候補
であると認識し、“李小華”を2番目にマッチする候補
であると認識し、表示モジュール15は、最初に以下の
通り表示する。
【0076】
【外29】
【0077】“王大明”は所望のエントリーではないた
め、利用者は、次の候補を表示するためキー“8”を押
下し、表示モジュール15は以下の通り表示する。
【0078】
【外30】
【0079】“李小華”は所望のエントリーであり、こ
の人の1番目の電話番号エントリーである755613
3が所望の電話番号エントリーであるため、利用者はキ
ー“1”を押下し、システムは、選択された番号エント
リーをダイヤルするため、復号化された結果をダイヤル
モジュールに送る。“李小華”は2個の番号エントリー
しか含まないので、キー“3”又は“4”を押下しても
何も起こらない。
【0080】
【発明の効果】上記の通り、本発明は、音声コマンドを
用いて自動的にダイヤルすることを特徴とする自動ダイ
ヤル用音声コマンドシステムを提案する。また、本発明
において明らかにされたマッピングスキーム及び編集方
法は、中国語の名前を対応した音標記号で表現、表示す
るため使用することができる。さらに、名前エントリー
は、自動的に音声コマンドモデルに変換され、利用者
は、補助的な学習をすることなく、各エントリーを編集
した後、ダイヤルすることが可能になる。
【0081】本発明は、上記実施例に制限されることが
なく、本発明の範囲内で変更をする限り、実際的に変更
し得ることに注意する必要がある。例えば、音響データ
ベース13に格納された音響モデル357は、図6に示
された音声登録機能が、音声入力として、音節
【0082】
【外31】
【0083】の代わりに、頭音
【0084】
【外32】
【0085】及び、末尾音
【0086】
【外33】
【0087】を使用する場合、109個のRCD頭音及
び39個の末尾音により置き換えてもよい。さらに、特
徴ベクトルは、12個のメル−周波数ケプストラム係数
及び12個のデルタメル−周波数ケプストラム係数の他
に、エネルギー成分又はLPC成分のような別の特徴に
より構成してもよい。その上、本発明の応用は中国語に
限定されない。本発明は、特定の言語の特徴を組み込む
ことによって音響データベース13、フォント及び変更
モジュール11に適切な変更を加えることにより、いか
なる言語においても実施することが可能である。本発明
の範囲は特許請求の範囲に記載されている。
【図面の簡単な説明】
【図1】本発明の一実施例による自動ダイヤル用音声コ
マンドシステムを示すブロック図である。
【図2】本発明の一実施例による動作選択モジュールを
説明するフローチャートである。
【図3】本発明の一実施例による編集モードを説明する
フローチャートである。
【図4】本発明の一実施例による編集モードにおける登
録機能を説明するフローチャートである。
【図5】本発明の一実施例による編集モードにおける登
録機能を説明するフローチャートである。
【図6】本発明の一実施例による編集モードにおける音
声登録機能を説明するフローチャートである。
【図7】本発明の一実施例による編集モードにおける問
い合わせ機能を説明するフローチャートである。
【図8】本発明の一実施例による編集モードにおける変
更機能を説明するフローチャートである。
【図9】本発明の一実施例による編集モードにおける変
更機能を説明するフローチャートである。
【図10】本発明の一実施例によるコマンドモードを説
明するフローチャートである。
【符号の説明】
10 動作選択モジュール 11 変更モジュール 12 電話帳データベース 13 音響データベース 14 音声認識モジュール 15 表示モジュール 16 フォント
───────────────────────────────────────────────────── フロントページの続き (71)出願人 590000248 Groenewoudseweg 1, 5621 BA Eindhoven, Th e Netherlands (72)発明者 トォ−ホア リン 台湾,ケールン 204,ケールン,ジジン ファースト ロード 214,4エフ

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 自動ダイヤル用音声コマンドシステムに
    おいて、 コマンドモード、編集モード又は通常モードの中から上
    記システムの動作モードを決定する動作選択モジュール
    と、 編集機能を行い、データをデータベースに格納する変更
    モジュールと、 基本音響モデルから音声コマンドモデルを生成する音響
    データベースと、 利用者の入力発声を復号化し、上記入力発声に類似した
    N個の最良復号化結果を認識する音声認識モジュール
    と、 上記変更モジュール及び/又は上記音声認識モジュール
    の結果を表示し、上記変更された結果を上記データベー
    スに格納し、及び/又は、ダイヤルするため上記認識さ
    れた結果をダイヤルモジュールに送る表示モジュールと
    を含むシステム。
  2. 【請求項2】 上記変更モジュールは、声調及び音標記
    号に対応した電話機のキーパッドを押下することにより
    上記データを入力するため、声調及び音標記号用のマッ
    ピングスキームを利用する登録機能を有する請求項1記
    載のシステム。
  3. 【請求項3】 上記変更モジュールは、音声コマンドに
    よって上記データを入力するため使用される声調及び音
    標記号用のマッピングスキームを利用する登録機能を有
    する請求項1記載のシステム。
  4. 【請求項4】 上記変更モジュールは、声調及び音標記
    号に対応した電話機のキーパッドを押下することにより
    上記データを入力するため、上記表示モジュールによっ
    て表示された声調及び音標記号用のマッピングスキーム
    を利用する登録機能を有する請求項1記載のシステム。
  5. 【請求項5】 上記変更モジュールは、音声コマンドに
    よって上記データを入力するため、上記表示モジュール
    によって表示された声調及び音標記号用のマッピングス
    キームを利用する登録機能を有する請求項1記載のシス
    テム。
  6. 【請求項6】 上記変更モジュールは、アルファベット
    に対応した電話機のキーパッドを押下することにより上
    記データを入力するため、所与のアルファベット用のマ
    ッピングスキームを利用する登録機能を有する請求項1
    記載のシステム。
  7. 【請求項7】 上記変更モジュールは、音声コマンドに
    よって上記データを入力するため、所与のアルファベッ
    ト用のマッピングスキームを利用する登録機能を有する
    請求項1記載のシステム。
  8. 【請求項8】 上記変更モジュールは、アルファベット
    に対応した電話機のキーパッドを押下することにより上
    記データを入力するため使用される上記表示モジュール
    によって表示された所与のアルファベット用のマッピン
    グスキームを利用する登録機能を有する請求項1記載の
    システム。
  9. 【請求項9】 上記変更モジュールは、音声コマンドに
    より上記データを入力するため使用される上記表示モジ
    ュールによって表示された所与のアルファベット用のマ
    ッピングスキームを利用する登録機能を有する請求項1
    記載のシステム。
  10. 【請求項10】 上記データは名前データ及び電話番号
    データを含む請求項1記載のシステム。
JP806099A 1998-01-16 1999-01-14 自動ダイヤル用音声コマンドシステム Withdrawn JPH11275205A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP98200122 1998-01-16
EP98200122:4 1998-01-16

Publications (1)

Publication Number Publication Date
JPH11275205A true JPH11275205A (ja) 1999-10-08

Family

ID=8233303

Family Applications (1)

Application Number Title Priority Date Filing Date
JP806099A Withdrawn JPH11275205A (ja) 1998-01-16 1999-01-14 自動ダイヤル用音声コマンドシステム

Country Status (2)

Country Link
JP (1) JPH11275205A (ja)
CN (1) CN1182694C (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100339339B1 (ko) * 1999-10-28 2002-06-03 서평원 전화기에서 음성 인식 기능 제어 방법
JP2004507944A (ja) * 2000-08-21 2004-03-11 スイノ・オイ ボイスメールショートメッセージサービス方法および手段および加入者端末

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1642196B (zh) * 2004-01-08 2011-10-05 华为技术有限公司 一种接收电话用户输入信息的方法
KR100571831B1 (ko) * 2004-02-10 2006-04-17 삼성전자주식회사 음성 식별 장치 및 방법
CN101185115B (zh) * 2005-05-27 2011-07-20 松下电器产业株式会社 语音编辑装置及方法和语音识别装置及方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100339339B1 (ko) * 1999-10-28 2002-06-03 서평원 전화기에서 음성 인식 기능 제어 방법
JP2004507944A (ja) * 2000-08-21 2004-03-11 スイノ・オイ ボイスメールショートメッセージサービス方法および手段および加入者端末
USRE42476E1 (en) 2000-08-21 2011-06-21 Dot Assets No. 14 Llc Instant video- and voicemail messaging method and means
US8086222B2 (en) 2000-08-21 2011-12-27 Dot Assets No. 14 Llc Voicemail short message service method and means and a subscriber terminal
JP4903350B2 (ja) * 2000-08-21 2012-03-28 ドット・アセッツ・ナンバー・14・エルエルシー ボイスメールショートメッセージサービス方法および手段および加入者端末
US8406746B2 (en) 2000-08-21 2013-03-26 Dot Assets No. 14 Llc Server and subscriber terminal for voicemail transmissions via packet switched data communication
US8611863B2 (en) 2000-08-21 2013-12-17 Dot Assets No. 14 Llc Instant video and voicemail messaging method and means

Also Published As

Publication number Publication date
CN1182694C (zh) 2004-12-29
CN1232336A (zh) 1999-10-20

Similar Documents

Publication Publication Date Title
TWI281146B (en) Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition
US6041300A (en) System and method of using pre-enrolled speech sub-units for efficient speech synthesis
US6119086A (en) Speech coding via speech recognition and synthesis based on pre-enrolled phonetic tokens
KR100383353B1 (ko) 음성인식장치및음성인식장치용어휘발생방법
JP2927891B2 (ja) 音声ダイヤル装置
US7689417B2 (en) Method, system and apparatus for improved voice recognition
JP5311348B2 (ja) 音声データ内の音声キーワード照合システム、その方法及び音声データ内の音声キーワード照合プログラム
CN100521708C (zh) 移动信息终端的语音识别与语音标签记录和调用方法
US5752230A (en) Method and apparatus for identifying names with a speech recognition program
JP2003515816A (ja) 音声制御された外国語翻訳デバイスのための方法及び装置
WO2004044887A1 (ja) 音声認識用辞書作成装置および音声認識装置
WO2004036939A1 (fr) Appareil de communication mobile numerique portable, procede de commande vocale et systeme
KR20010076508A (ko) Mp3 플레이어 겸용 휴대폰에서 음성 인식에 의한 선곡방법
US20060190260A1 (en) Selecting an order of elements for a speech synthesis
JPH11275205A (ja) 自動ダイヤル用音声コマンドシステム
JP4230142B2 (ja) 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術
KR100366601B1 (ko) 음절 단위로 음성인식을 수행하는 방법 및 그 장치
KR100433550B1 (ko) 스피드 음성 다이얼 장치와 방법
CA2597826C (en) Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance
KR100827074B1 (ko) 이동 통신 단말기의 자동 다이얼링 장치 및 방법
JP2000122678A (ja) 音声認識機器制御装置
US20080133240A1 (en) Spoken dialog system, terminal device, speech information management device and recording medium with program recorded thereon
JPH0863185A (ja) 音声認識装置
JP2002532763A (ja) 音声によって動作される自動問合せシステム
CA2256781A1 (en) Method and apparatus for automatically dialling a desired telephone number using speech commands

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060111

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20060518