JP2000112497A

JP2000112497A - 音声認識方法及び装置と通信装置及びその制御方法

Info

Publication number: JP2000112497A
Application number: JP10281654A
Authority: JP
Inventors: Hiroshi Shinoda; 弘志信田; Yasuhide Ueno; 康秀上野; Susumu Matsuzaki; 進松崎; Muneki Nakao; 宗樹中尾; Naoki Sugawara; 尚樹菅原; Takeshi Toyama; 猛外山
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1998-10-02
Filing date: 1998-10-02
Publication date: 2000-04-21

Abstract

(57)【要約】【課題】入力された音声に対する音声認識に失敗した場
合に、その理由をオペレータに通知可能とする。【解決手段】ステップＳ６１〜Ｓ６４において、電話帳
機能による宛名検索のための入力音声と、複数の入力音
声に対応する音声認識のための音声データを照合するこ
とにより音声認識を行なう。そして、ステップＳ７３〜
Ｓ７８で、音声認識の結果に基づいて電話帳に登録され
たダイヤルが選択され、通信が実行される。ここで、ス
テップＳ６６，Ｓ７０〜Ｓ７２において、当該音声認識
による入力音声の認識の成否が判定され、認識に失敗し
たと判定された場合は、その理由情報を取得して通知す
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声認識装置及び
方法及び該音声認識装置を用いた通信装置及びその制御
方法に関するものである。

【０００２】

【従来の技術】従来より、電話機やファクシミリ装置に
おいて、宛先を簡便にダイヤルするために、複数の宛先
の番号をワンタッチキーや短縮キーに登録しておく機能
がある。更には、宛先の略称や番号を登録しておいて、
それらを表示させながらその中から目的の宛先を選択す
る電話帳機能が搭載されて実用化されている。また、さ
らなる利便性向上のために音声認識機能を搭載し、宛先
のダイヤル番号を認識させたりすることが提案されてい
る。

【０００３】

【発明が解決しようとする課題】一般に、音声認識で
は、特定話者に対応した音声認識処理の方が、認識精度
も良いし、認識処理も簡単である。従って、上述のよう
な通信装置における電話帳機能に適用するには、原理的
に特定話者を前提とした音声認識アルゴリズムを適用す
る方が好ましい。

【０００４】原理的に特定話者を前提とした音声認識ア
ルゴリズムによる音声データ識別では、所定の人間が登
録しておいた音声データを照合認識するためには該登録
した本人が発声しないと正しく照合されない場合が多
い。また、認識のための音声入力時に環境ノイズが混入
して誤認識の原因になることもある。さらには、登録し
た本人であるにも関わらず、体調を崩すなどして発声す
ると誤認識されるケースもありうる。この結果、オペレ
ータが誤認識して選択された宛先ダイヤルにきずかずに
間違いＦＡＸや間違い電話をかけてしまうことになる。
これら誤認識を極力防止するためには、認識時に照合検
索する対象となる音声データの登録が正しく行われてい
る必要がある。音声データの登録の条件が悪いと、音声
認識時に認識精度が低下する。従って音声データの登録
時には、同じ音声データを登録するために複数回の登録
試行を行って最も条件が良いと判断されたデータを音声
メモリに登録するのが一般的である。このように、オペ
レータに同じデータを複数回発声させて登録することに
なるが、各発声時に正しく登録されているか、また、登
録に失敗しても、その理由はオペレータには判断できな
かった。

【０００５】また、音声認識によって登録された音声デ
ータのなかから合致するものを検索照合することによ
り、合致した音声データに対応する宛先ダイヤルを選択
する音声認識宛先選択機能においては、入力した音声に
周囲環境のノイズが載ったり声が小さかったり大きかっ
たりして認識不能となるケースもある。このため、１回
目に発声して結果が宛先認識不能となった場合、音声認
識をやり直しても２回目には正しく認識されるとは限ら
ない。１回目と同じ環境下で試行すれば、結果も同じ
（認識不能）になる可能性がある。このような場合、オ
ペレータが、何故認識不能になるのかという理由が分か
らないと、何回やっても音声認識がうまく行かなくなっ
てしまう。例えば、周囲の騒音がひどい、声が小さい、
声が大きいなど、装置が何故うまく認識しないのかの理
由が分かれば、そのような要因を排除した対応をとるこ
とも可能である。

【０００６】本発明は上記の問題に鑑みてなされたもの
であり、入力された音声に対する音声認識に失敗した場
合に、その理由をオペレータに通知可能とすることを目
的とする。

【０００７】また、本発明の目的は、音声認識用の音声
データを入力された音声に基づいて登録するに際して、
その登録処理に失敗した場合、その理由をオペレータに
通知可能とすることにある。

【０００８】

【課題を解決するための手段】上記の目的を達成するた
めの本発明の一態様による音声認識装置は、例えば以下
の構成を備える。すなわち、複数の入力音声に対応する
音声認識のための音声データを記憶する音声データ記憶
手段と、前記音声データ記憶手段に記憶された音声デー
タと入力音声とを照合することにより音声認識を行なう
音声認識手段と、前記音声認識手段による入力音声の認
識の成否を判定する第１判定手段と、前記判定手段で音
声認識による入力音声の認識に失敗したと判定された場
合、その理由情報を取得して通知する第１通知手段とを
備える。

【０００９】また、上記の目的を達成する、本発明の他
の態様による通信装置は例えば以下の構成を備える。す
なわち、回線に接続して遠隔装置との通信を行なう通信
装置であって、宛先と前記回線上のアドレスとを対にし
た宛先情報と、該宛先を表す入力音声に対応した音声認
識のための音声データを登録する登録手段と、前記登録
手段に登録された音声データと入力音声とを照合するこ
とにより音声認識を行なう音声認識手段と、前記音声認
識手段による認識の成否を判定する第１判定手段と、前
記第１判定手段により音声認識が成功したと判定された
場合、前記音声認識手段による認識結果に基づいて宛先
情報を特定し、対応するアドレスを得る検索手段と、前
記第１判定手段により音声認識が失敗したと判定された
場合、その理由情報を取得して通知する第１通知手段と
を備える。

【００１０】また、本発明によれば、上記音声認識装置
によって達成される音声認識方法が提供される。

【００１１】また、本発明によれば、上記通信装置によ
って達成される通信装置の制御方法が提供される。

【００１２】さらに本発明によれば、上記音声認識方法
もしくは上記通信装置の制御方法をコンピュータに実現
させるための制御プログラムを格納する記憶媒体が提供
される。

【００１３】

【発明の実施の形態】以下、添付の図面を参照して本発
明の好適な一実施形態を説明する。

【００１４】本実施形態では、アナログ小電力方式のコ
ードレス電話機機能を搭載し、ＩＴＵ勧告Ｇ３規格を満
足する機能を有するファクシミリ装置に本発明を適用し
た例を説明する。なお、本実施形態のファクシミリ装置
は、カラー読み取り部とカラー記録部とを具備し、カラ
ーコピー機能やカラー画像の通信機能を有する。更に、
本実施形態のファクシミリ装置は、ファクシミリや通話
の目的で、記憶してある宛先略称を選択することで対応
する宛先番号に自動宛先ダイヤルを行う電話帳機能を有
する。特に、その電話帳機能を利用し、音声認識部によ
り音声を認識して得られた認識結果に基づいて自動宛先
ダイヤルをする機能も有している。

【００１５】またカラー読み取り部は本体から着脱自在
なハンドスキャナユニットで構成されており、シート状
原稿の読み取りはもとより、ブック原稿なども読み取る
ことが可能である。スキャナの読み取りセンサは線順次
でＲＧＢ各色を出力する密着型のカラーセンサであっ
て、読み取り幅はＢ４幅、読み取り解像度は２００ｄｐ
ｉである。

【００１６】また、カラー記録部はインク吐出方式によ
って記録を行なうものであり、ＣＭＹＫ各色のインクタ
ンクとインク吐出部とが一体となったカラーカートリッ
ジと、黒インクのみのインクタンクとインク吐出部が一
体となったモノクロカートリッジのいずれか一方を装着
することにより３６０ｄｐｉの記録解像度で記録紙に２
値データを記録する。いずれのカートリッジを装着して
もモノクロ記録時の記録幅は最大Ｂ４幅であるが、カラ
ーカートリッジを装着した場合のカラー記録時には、そ
の記録幅が最大Ａ４幅となる。

【００１７】通信時にはＧ３モードで最高９６００ｂｐ
ｓのモデム速度を有し、画像伝送の誤り再送機能である
ＥＣＭモードを具備している。以下、本実施形態のファ
クシミリ装置の構成、動作について説明する。

【００１８】図１は実施形態によるファクシミリ装置の
システムブロック図である。図１において、1-1-1は本
装置の制御部であるＣＰＵ、1-1-21はプログラムや各種
固定データを格納するＲＯＭ、1-1-18は各種プログラム
のワークメモリ、留守録などの音声データおよびモノク
ロ画像・カラー画像データ用の蓄積メモリとして使用さ
れるＤＲＡＭである。ＤＲＡＭ1-1-18の容量は全体で２
ＭＢあり、内０．５ＭＢ分はワークメモリとして使用さ
れ、残りの１．５ＭＢは画像データ（送受信データ）の
蓄積と音声データの蓄積のために使用される。1-1-24は
システムに必要な登録データ（各種ソフトスイッチ、電
話帳データ、音声認識のための音声登録データ、装置の
電話番号、略称などの装置用ＩＤデータ）を登録記憶す
るためのＳＲＡＭであって、電源断によりデータが失わ
れないよう電池でバックアップされている。

【００１９】1-1-2はＩＴＵ勧告Ｇ３モードに必要な機
能を持つ公知のファクシミリ用モデム（本実施形態で
は、V.29，V.21，V27terのほかにＤＴＭＦ認識機能、Ｄ
ＲＡＭ1-1-18への音声録音・ＤＲＡＭ1-1-18等からの音
声再生のための音声コーデック機能も具備するタイプを
使用）である。また、1-1-3は子機電話1-1-5とアナログ
小電力方式の無線通信を行うベースユニットであって、
ＣＰＵ1-1-1からの指示により無線通信を制御する公知
のユニットである。1-1-4はアナログ信号用接続スイッ
チ（クロスポイントスイッチ）であって、ＣＰＵ1-1-1
からの設定によりハンドセット1-1-6、マイク1-1-7、ス
ピーカ1-1-8、ＮＣＵ1-1-9、ＣＰＵ1-1-1の音声入力端
子、モデム1-1-2およびベースユニット1-1-3との間のア
ナログ信号の接続を自在に切り替える公知の回路であ
る。

【００２０】1-1-6は、装置本体の電話機ハンドセッ
ト、1-1-7は音声入力用のマイク、1-1-8はスピーカ、1-
1-9は回線とインタフェースするための公知のＮＣＵで
ある。

【００２１】1-1-10はモノクロ２値生画像データからラ
ンレングス符号を生成し、またはランレングス符号を入
力してモノクロ２値生画像データを出力する公知のラン
レングス回路である。1-1-11は公知の時計ＩＣ（ＲＴ
Ｃ）である。、また、1-1-25はハンドスキャナユニット
（ＨＳＵ）であり、画像読み取りのためのカラーコンタ
クトセンサ1-1-12と原稿上を移動した距離を測定するた
めのロータリーエンコーダ1-1-16が内蔵されている。ス
キャナユニット1-1-16は装置本体とカールコードにより
接続されて着脱自在な構成になっている。1-1-13はエン
コーダ検出部であり、エンコーダ1-1-16の出力信号から
移動距離データ（ロータリーエンコーダの回転数情報）
を生成してＣＰＵ1-1-1に通知する。

【００２２】1-1-14は画像処理部であって、ＣＰＵ1-1-
1の指示により、カラー生画像データをＤＲＡＭ1-1-18
に蓄積する場合は、カラーコンタクトセンサ1-1-12から
出力されたアナログＲＧＢ信号（線順次で解像度２００
ｄｐｉ）を入力して、ＲＧＢ各８ビット（１画素あたり
では２４ビット）の９０ｄｐｉデジタルデータに変換
し、得られた変換データをＤＭＡコントローラ1-1-17に
供給する。また、カラーコピーをダイレクトで行う場合
であれば、カラーコンタクトセンサ1-1-12から出力され
たアナログＲＧＢ信号（線順次で解像度２００ｄｐｉ）
を入力して３６０ｄｐｉ、２値ＹＭＣＫのデジタルデー
タに変換し、得られた変換データをＤＭＡコントローラ
1-1-17に供給する。

【００２３】ＤＭＡコントローラ1-1-17は、カラー生画
像データ（９０ｄｐｉ、ＲＧＢ）をＤＲＡＭ1-1-18に蓄
積する場合にはＤＲＡＭ1-1-18にカラー生画像データを
転送し、カラーコピーをダイレクトで行う場合には記録
制御部1-1-19に３６０ｄｐｉの２値ＹＭＣＫデータを転
送する。

【００２４】モノクロ生画像データをＤＲＡＭ1-1-18に
蓄積する場合には、画像処理部1-1-14は、カラーコンタ
クトセンサ1-1-12から出力されたアナログＲＧＢ信号
（線順次２００ｄｐｉ）を入力して、モノクロ２値の２
００ｄｐｉデジタルデータに変換し、得られた変換デー
タをＤＭＡコントローラ1-1-17に供給する。

【００２５】また、モノクロコピーをダイレクトで行う
場合は、カラーコンタクトセンサ1-1-12から出力された
アナログＲＧＢ信号（線順次２００ｄｐｉ）を入力し
て、モノクロ２値の３６０ｄｐｉデジタルデータに変換
し、ＤＭＡコントローラ1-1-17に供給する。

【００２６】そして、ＤＭＡコントローラ1-1-17は、モ
ノクロ生画像データをＤＲＡＭに蓄積する場合にはＤＲ
ＡＭ1-1-18にモノクロ２値画像データを転送し、モノク
ロコピーをダイレクトで行う場合には記録制御部1-1-19
にモノクロ２値画像データを転送する。

【００２７】更に、上記動作について補足すると、（１）本体にスキャナを装着した状態でのコピーはダイ
レクトモードとなり、読み取りデータをＤＲＡＭ1-1-18
へ1ページ分のデータを蓄積（以下、ページ蓄積）する
ことなく、シート状原稿を読み取りながら記録部に印字
する。ＤＲＡＭ1-1-18へのページ蓄積が不要のために高
解像度でもメモリオーバーフローしない理由から、解像
度は記録部1-1-20に整合させてあり、読み取りデータは
副走査方向360dpiとなる。また、コピーサイズもモノク
ロ時はＢ４幅まで、カラー時は記録部1-1-20の仕様でＡ
４幅までとなる。

【００２８】（２）本体からスキャナを取り出してハン
ドスキャナとしてコピー使用する場合は、メモリモード
となり、読み取りデータは必ずＤＲＡＭ1-1-18にページ
蓄積される。これは、記録部1-1-20の印字速度が人間が
ストレス無くハンドスキャンを実行する速度に対して遅
いための処置であり、一旦ＤＲＡＭ1-1-18にページ蓄積
することによってハンドスキャンを高速で実行終了でき
るよう構成されている。また、読み取り解像度を記録部
1-1-20に整合させて３６０ｄｐｉとすると１ページのデ
ータ容量が大きすぎてＤＲＡＭ1-1-18を占有してしま
い、装置動作に支障をきたす、もしくはＤＲＡＭ1-1-18
の容量を上げるとコストがかかる等の理由から、読み取
り解像度はモノクロ時では２００ｄｐｉ、カラー時では
９０ｄｐｉにおさえてある。

【００２９】また、同様の理由から、モノクロ時のコピ
ーサイズはＢ４幅までであるが、カラー時のコピーサイ
ズはＡ６（もしくは官製はがきサイズ）以下に制限して
ある。ちなみにモノクロ２００ｄｐｉでＢ４サイズ１ペ
ージ分のデータ容量は約７００ＫＢ、カラー９０ｄｐｉ
でＡ６サイズの１ページ分のデータ容量は約６００ＫＢ
となり、ＤＲＡＭ1-1-18に蓄積可能である。

【００３０】データを圧縮符号化してＤＲＡＭ1-1-18に
蓄積すればサイズ・解像度をもっと上げることは出来る
が、後に述べるように圧縮符号化はソフトウエアで行う
ために時間がかかりハンドスキャンの実行速度が下がっ
てしまうというデメリットがある。また、高速の圧縮符
号化のためにハードウエアを追加することも考えられる
が、大幅なコスト増をまねく。

【００３１】（３）本体にスキャナを装着した状態での
原稿送信はダイレクトモードとなり、読み取りデータを
ページ蓄積することなくＤＲＡＭ1-1-18経由でモデムに
転送して、シート状原稿を読み取りながら相手ファクシ
ミリに送信してゆく。

【００３２】（４）本体からスキャナを取り出してハン
ドスキャナとして使用し、原稿送信する場合は、メモリ
モードとなり、読み取りデータは必ずＤＲＡＭ1-1-18に
ページ蓄積される。これは、モデム1-1-2の通信速度
が、人間がストレス無くハンドスキャンを実行する速度
に対して遅いための処置であり、一旦ＤＲＡＭ1-1-18に
ページ蓄積することによってハンドスキャンを高速で実
行終了できるよう構成されている。読み取り解像度やサ
イズに関しては上記の項目（２）と同じ理由で同様の仕
様としている。

【００３３】1-1-19は記録制御部であり、記録部1-1-20
が記録可能なデータ形式に入力データを変換する。1-1-
20は記録部であり、インク吐出方式の公知のカラープリ
ンタで構成され、インクタンクとインク吐出部が一体に
なっているカートリッジを記録紙の主走査方向に移動さ
せながら画像を記録してゆく。カラーカートリッジとモ
ノクロカートリッジのいずれが装着されているかは、記
録部1-1-20とカートリッジの電気的接点の構成によりＣ
ＰＵ1-1-1が判別できるようになっている。

【００３４】1-1-15は解像度変換部であり、モノクロ２
値画像データを入力して解像度変換を行う公知の回路で
構成される。解像度変換部1-1-15は、モノクロ画像の拡
大・縮小などのために使用されるとともに、記録部1-1-
20の解像度に対して回線から受信したモノクロ画像の解
像度を整合させる用途にも使用される。

【００３５】1-1-22は操作パネルであり、本ファクシミ
リ装置の各種操作入力及び表示出力を行なう。操作パネ
ル1-1-22は、図３に示すような各種キーや表示ランプ、
およびＬＣＤディスプレイを具備する。また、機構とし
ては、マイク1-1-7、スピーカ1-1-8が配備されている。

【００３６】1-1-26はハンドスキャナ着脱センサであ
り、ハンドスキャナユニット1-1-25と装置本体との着脱
状態を検出する。ハンドスキャナ着脱センサ1-1-26の出
力によって、ＣＰＵ1-1-1はシート状原稿を読み取るダ
イレクトモードであるか、ブック原稿など立体物を読み
取るメモリモードであるかを決定する。

【００３７】図３は、本実施形態のファクシミリ装置の
概観を示し、特に操作パネル（図１の1-1-22）の構成を
示す図である。

【００３８】図３において、1-3-1は本体用ハンドセッ
ト（図１の1-1-6と同一）である。1-3-2は各種登録や設
定のための「機能キー」、1-3-3は伝言や通話内容を音
声データとしてＤＲＡＭ1-1-18に録音するとき使用する
「録音キー」、1-3-4はモデム1-1-2の音声コーデックに
よってＣＰＵ1-1-1がＤＲＡＭ1-1-18に録音した音声デ
ータを再生するとき使用する「再生キー」、1-3-5はメ
モリに格納された各種データを消去する際に使用する
「消去キー」である。

【００３９】1-3-6は１６文字分のキャラクタを２行表
示できるバックライト付ＬＣＤであって、装置の状態や
各種メッセージを出力するために使われる。1-3-7は
「カラーＬＥＤ」で、1-3-8の「カラー/白黒キー」でカ
ラーモードが選択されると点灯する。1-3-9はモノクロ
モードでの画質を選択するための「画質キー」である。

【００４０】1-3-10は電話帳を呼び出すための「電話帳
キー」と、登録などの内容を確定させるための「セット
キー」を兼用するキーであって、簡単のために以降「セ
ットキー」と呼ぶことにする。1-3-11は「上カーソルキ
ー」、1-3-12は「下カーソルキー」、1-3-13は「左カー
ソルキー」、1-3-14は「右カーソルキー」である。いず
れも表示制御の操作で使用される。

【００４１】1-3-15はファクシミリ送信のための「送信
キー」、1-3-16はファクシミリ受信および受信画像をプ
リントするための「受信／プリントキー」である。1-3-
17はコピーを実行するための「コピーキー」、1-3-18は
実行中の装置動作を中断するための「ストップキー」で
ある。1-3-19はマイク1-1-7の開口部、1-3-20はテンキ
ー部、1-3-21は回線を接続したままマイク1-1-7をアク
ティブにして回線上に音声出力し、また、回線上の音を
スピーカ1-1-8に出力する状態にするための「スピーカ
ホンキー」である。

【００４２】1-3-22は音声認識によって宛先自動ダイヤ
ルを実行するための「音声認識キー」、1-3-23は着信し
た電話の相手通話内容を自動的にＤＲＡＭ1-1-18に録音
するための「留守キー」、1-3-24は本体からコードレス
子機電話を呼び出して内線通話を実行するための「子機
キー」、1-3-25は通話状態を保留したまま相手にメロデ
ィを送出する「保留キー」、1-3-26は前回かけた相手の
電話番号を自動的にダイヤルするための「リダイヤルキ
ー」、1-3-27は外線通話中にキャッチホンがはいったと
き、キャッチホンの呼に通話を切り替えるためと、切り
替えたキャッチホン通話から元の通話に切り替えるため
に使用する「キャッチキー」である。

【００４３】次に、本実施形態のファクシミリ装置の制
御について説明する。図２は、本実施形態のファクシミ
リ装置におけるタスク構成を示すブロック図である。本
装置のソフトウエアは、マルチタスクＯＳ1-2-12によっ
て、各タスクが同時に平行して動作できる環境を与えら
れている。以下、各タスクについて説明してゆく。

【００４４】1-2-1は状態監視タスクで、装置内に発生
する各イベントを監視し、装置状態を変化させる必要の
あるイベントの発生を検出すると、必要なタスクにその
情報を通知する機能を持つ。たとえば、操作パネルから
のキー情報を検出すると、オペレートタスク1-2-2や回
線制御タスク1-2-3に必要なキー情報を伝達して、装置
の機能を起動する。

【００４５】1-2-2はオペレートタスクで、状態監視タ
スク1-2-1からのキーコードＡ情報を受けて動作モード
を判定し、必要な機能を実行するタスクにスタートコマ
ンドを発行するとともに、キーコードＡ情報に基づい
て、操作パネル1-1-22上の表示機能を制御する。

【００４６】1-2-3は回線制御タスクであり、ＮＣＵを
制御して、回線からの着呼を受け付けたり、オペレート
タスク1-2-2からのダイヤル要求コマンドに応じてダイ
ヤル信号を送出するために回線を捕捉したり、回線断を
実行して通信を終了させたりするシーケンスを実行す
る。また、回線接続状態における状態監視タスク1-2-1
からのキーコードＢ情報で「送信キー」や「受信/プリ
ントキー」を検出するか、発信元の相手が電話かファク
シミリかを回線上の信号を分析することにより自動判別
して、ファクシミリならば通信タスク1-2-5にファクシ
ミリ通信のための通信スタートコマンドを発行したりす
るものである。

【００４７】1-2-4はダイヤル制御タスクであり、回線
制御タスク1-2-3あるいは通信タスク1-2-5からのダイヤ
ルスタートコマンドに応じて各種ダイヤル信号を交換機
に送出する機能を持つ。1-2-5は通信タスクであり、回
線制御タスク1-2-3からの通信スタートコマンドによっ
て各種ファクシミリ通信（通信手順の実行や画像データ
伝送）を実行する。

【００４８】1-2-6は読み取りタスクであり、オペレー
トタスク1-2-2からの読み取りスタートコマンドに応じ
て、ハンドスキャナユニット1-1-25と画像処理部1-1-14
を制御し、原稿の読み取りを実行する。1-2-7は符号・
復号タスクであり、通信タスク1-2-5、読み取りタスク1
-2-6、記録タスク1-2-9からの各種符号復号スタートコ
マンドに応じて、画像データの符号化、復号化の処理を
ソフトウエアで実行する。このため本装置は、符号復号
化のためのハードウエアコストを大きく削減している
（ただしハードウエアでの実施に比べて処理時間はかか
る）。なお、モノクロ画像には公知のＭＨ符号を適用
し、カラー画像に関してはＲＧＢ多値ＤＰＣＭ方式（Ｒ
ＧＢの各８ビット値で隣接画素間の差分値を計算する方
式）にハフマン符号を割り当てた公知の符号化方式を適
用する。

【００４９】1-2-8は音声認識タスクであり、ハンドセ
ット1-3-1から入力された使用者の発声音声を分析し
て、あらかじめ登録されてある音声データ（複数可）と
比較し一致するものを検出し通知する、公知の音声認識
アルゴリズムを含むソフトウエアである。音声認識タス
ク1-2-8は、オペレートタスク1-2-2からの音声認識スタ
ートコマンドにより起動される。また、音声認識タスク
1-2-8の終了は、音声認識タスク1-2-8自身によるもので
あり、音声トレーニング（音声登録）および音声認識の
結果を音声認識結果コマンドとして、オペレートタスク
1-2-2に返送した後に終了する。

【００５０】1-2-9は記録タスクであり、レポートタス
ク1-2-10やプリントタスク1-2-11からの記録スタートコ
マンドに応じて、要求された画像データを記録部1-1-20
で印字させる機能をもつ。1-2-10はレポートタスクであ
り、通信履歴が記録される通信管理レポートやＳＲＡＭ
1-1-24の登録情報などの機能設定リストをキャラクタデ
ータで作成し、それを画像データに展開して記録タスク
1-2-9に記録依頼する、各種レポート作成用のソフトウ
エアである。1-2-11はプリントタスクであり、常時、自
動的に記録する必要のある画像データがＤＲＡＭ1-1-18
に蓄積されていないかをチェックしており、記録する必
要のある画像データを検出すると、記録スタートコマン
ドを記録タスクに発行する監視機能を持つ。

【００５１】以上のような構成を備えた、本実施形態の
ファクシミリ装置における、電話帳機能、音声登録機能
及び音声認識機能について説明する。図４は、本実施形
態による電話帳機能、音声登録及び音声認識に関わる制
御の概要を説明する図である。

【００５２】（１）電話帳機能相手先略称と相手先電話番号を対応させて電話帳データ
（図４の4-2）として登録しておき、所望の相手先略称
を検索し、検索された相手先略称に対応する相手先電話
番号でダイヤルを行なう。本実施形態では、相手先の検
索に際して、電話帳データに登録された相手先略称を順次（たとえ
ば、あいうえお順）ＬＣＤ表示器1-3-6に表示すること
により所望の相手先を選択し、必要な相手先番号を得る
方法と、相手先略称を音声登録（以下の（２）項参照）してお
き、相手先略称を音声によって入力し、これを音声認識
（以下の（３）項参照）することで得られた相手先略称
で電話帳データを検索して、対応する相手先番号を得る
方法とを用いることができる。

【００５３】（２）音声登録音声認識の為の比較分析対象データを、ＳＲＡＭ1-1-24
内の音声登録メモリに作成する。ハンドセット1-1-6、
マイク1-1-7から入力された音声を、或いはＮＣＵ1-1-9
を通じて回線から、もしくはベースユニット1-1-3を通
じて子機1-1-5から入力された音声をクロスポイントＳ
Ｗ1-1-4を通して音声データとしてＣＰＵ1-1-1に入力す
る。ＣＰＵ1-1-1では、オペレートタスク1-2-2及び音声
認識タスク1-2-8を実行することにより、当該音声デー
タに種々の演算を施し、音声認識の為のデータを作成
し、ＳＲＡＭ1-1-24内の音声登録メモリ4-1に登録す
る。なお、このときの結果ＯＫ／ＮＧを音声認識結果コ
マンドとして、オペレートタスク1-2-2に返送する。

【００５４】ここで、オペレートタスク1-2-2は、音声
認識結果コマンドとして「ＯＫ」を受け取ると、電話帳
データにおける相手先略称と、その音声認識用データと
を対応付ける（詳細は後述する）。

【００５５】（３）音声認識音声認識においては、入力された音声について、音声登
録メモリ4-1を参照して認識を行ない、対応する相手先
電話番号を電話帳データ4-2から抽出する。音声登録時
と同様に、音声は、ハンドセット1-1-6、マイク1-1-7か
ら、或いはＮＣＵ1-1-9を通じて回線から、もしくはベ
ースユニット1-1-3を通じて子機1-1-5から入力される。
入力された音声は、クロスポイントＳＷ1-1-4を介して
音声データとしてＣＰＵ1-1-1に入力される。ＣＰＵ1-1
-1では、オペレートタスク1-2-2及び音声認識タスク1-2
-8を実行することにより、入力された音声データに種々
の演算を施し、得られたデータと音声登録メモリ4-1に
登録されているデータを比較し、最も近いデータを選択
し、その結果を音声認識結果コマンドとして、オペレー
トタスク1-2-2に返送する。

【００５６】なお、図４において、電話帳への音声登録
を行う場合と、音声認識による電話帳検索とダイヤルを
実行する場合、オペレートタスク1-2-2は音声認識タス
ク1-2-8に音声認識スタートコマンドを発行し、音声認
識タスクに音声登録処理や認識処理をスタートさせる。

【００５７】音声認識タスク1-2-8は、ハンドセット1-1
-6やマイク1-1-7から入力したアナログ音声データをＣ
ＰＵ1-1-1に内蔵されたＡ／Ｄ変換回路によってサンプ
リングし、デジタルデータに変換し、音声入力データと
してタスク（音声認識タスク1-2-8）に取り込み、演算
処理をかける。処理が終了すると、音声認識結果コマン
ドが音声認識タスク1-2-8からオペレートタスク1-2-2に
返送される。

【００５８】以下、上述した各機能（電話帳機能、音声
登録、音声認識）に関して更に詳細な説明を行なう。

【００５９】図５は本実施形態による電話帳データ及び
音声登録メモリのデータ構成例を説明する図である。図
５の上部点線内は、ＳＲＡＭ1-1-24上でオペレートタス
クが管理する電話帳データ4-2である。電話帳データ4-2
は大きく２種類に別れており、一つは全ユーザに共通の
電話帳データであり、もう一つは、個人別電話帳データ
である。

【００６０】共通の電話帳データは、電話帳データテー
ブル5-1を備える。電話帳データテーブル5-1には、相手
先の略称を示す「略称」、対応する相手先の「電話番
号」、音声データが登録されているかを表すフラグであ
るところの「音声登録」、音声データが登録されている
場合にその音声データを特定する「登録番号」で構成さ
れるデータブロックが複数記憶されている。

【００６１】個人別の電話帳データは、個人用ＩＤテー
ブル5-2と個人用電話帳テーブル5-3で構成される。個人
用ＩＤテーブル5-2には、個人用電話帳テーブルを所有
するユーザの略称を示す「略称」、この略称に対応する
音声データが登録されているかどうかを表す「音声登
録」、音声データが登録されている場合にその音声デー
タを特定する「登録番号」、及び対応する個人用電話帳
テーブルを特定するための「個人用電話帳テーブルアド
レス」で構成されるデータブロックが格納される。ま
た、個人用電話帳テーブル5-3は、個人用ＩＤテーブル
で登録されたユーザの数分存在する。各テーブルのデー
タの構造は、電話帳データテーブル5-1と同じである。

【００６２】音声登録メモリ4-1は、ＳＲＡＭ1-1-24上
で音声認識タスクが管理するもので、音声登録テーブル
5-4と音声データ登録領域5-5を格納する。音声登録テー
ブル5-4は、「登録番号」、「状態」、「除外フラ
グ」、「登録アドレス」を備える。「登録番号」は、音
声データ登録領域5-5を特定するものである。「登録番
号」は、先の「電話帳データテーブル」「個人用ＩＤテ
ーブル」「個人用電話帳テーブル」に記述される「登録
番号」と１対１に対応して関連している。「状態」は、
対応する音声データ登録領域5-5にデータが格納されて
いるか否かを示す。「除外フラグ」はオペレートタスク
から認識処理の比較対象としない旨の指定を受けたかど
うかを表す。「除外フラグ」は図６で後述のコマンド
０、１、２、３、４のいずれかを受信したとき全てＯＦ
Ｆにリセットされ、同じくコマンド５、６のいずれかを
受信したときコマンドで指定された登録番号の「除外フ
ラグ」がＯＮにセットされる。また、「登録アドレス」
は、デジタル符号化された音声データが記憶されている
ＲＡＭエリアの実体アドレスである。音声データ登録領
域5-5には、音声認識を行なうのに必要な音声データが
登録される。

【００６３】以上のようなデータ構成において、電話帳
データと音声データは「登録番号」によってリンクされ
ている。従って、たとえば、入力された音声について、
音声データ登録領域5-5のデータを参照して音声認識を
行ない、認識結果として登録番号「ＮＯ．２」を得た場
合、この登録番号で電話帳データテーブル5-1及び個人
用ＩＤテーブル5-2が検索され、この場合は、電話帳デ
ータテーブル5-1から「マナブ」という略称で登録され
た電話番号が獲得される。

【００６４】なお、音声認識の結果として登録番号「Ｎ
Ｏ.７」を得た場合、個人用ＩＤテーブル5-2に一致する
データブロックが存在するので、当該音声入力は個人別
電話帳の指定であったと判断する。そして、次に入力さ
れる音声に対する音声認識は、指定された個人別電話帳
(個人用電話帳テーブル5-3)に登録された範囲内で音声
認識による相手先の特定を行なう。なお、図５では略称
が３文字のものしか示されていないが、３文字に限られ
ないことは言うまでもないであろう。

【００６５】本実施形態では、上述のような個人別の電
話帳データを用いることにより、特定話者認識のごとき
音声認識環境が得られるので、音声認識の認識率を向上
させることができる。なお、共通の電話帳データと、個
人別の電話帳データの利用についての更なる詳細は後述
する。

【００６６】図６はオペレートタスクから音声認識タス
クへ発行される音声認識スタートコマンドの種類と内容
を説明する図である。図６に示されるように、コマンド
の種類としてコマンド０からコマンド６まで存在する。
コマンド０は指定の音声登録データを音声登録メモリか
ら消去するため使用される。なお、図６の「登録番号」
に○が付されているのは、そのコマンドが登録番号を指
定することを表す。また、ここで指定される登録番号
は、図５で説明した登録番号と対応するものである。

【００６７】コマンド１および２は、音声認識タスク1-
2-8に音声登録処理を依頼するため使用される。コマン
ド３および４は音声認識タスク1-2-8に音声認識処理を
依頼するため使用される。コマンド５および６も音声認
識処理を依頼するため使用されるが、これらを受取った
音声認識タスクは、当該コマンドで指定された登録番号
の音声登録データを比較対象から削除して認識する（図
５の音声登録テーブル5-4における「除外フラグ」をＯ
Ｎにする）。

【００６８】図７は音声認識タスクからオペレートタス
クへ発行される音声認識結果コマンドの種類と内容を説
明する図である。図７に示されるように、コマンド種別
がコマンド１からコマンド４まで存在する。コマンド１
および２は、音声登録結果をオペレートタスク1-2-2に
通知するため使用される。コマンド３および４は音声認
識結果を通知するために使用される。

【００６９】なお、本装置のＳＲＡＭ1-1-24上には、
「理由コード表示する」のスイッチ項目が設けられてお
り、「機能設定」モードにおいて、オペレータの所望す
る状態（ＯＮ/ＯＦＦ）を設定できる。これがＯＮされ
ているときには、音声登録／認識の各処理でＮＧだった
場合に、ＮＧの理由を示す「理由コード」が結果コマン
ドに反映される。すなわち、「理由コードを表示する」
がＯＮとなっている場合には、音声登録／認識の各処理
において、オペレートタスク1-2-2はそれぞれコマンド
４／コマンド６（ＮＧ発生時にその理由コードを付す旨
の指示を含むコマンド）を用いて音声認識タスク1-2-8
に指示を行なう。そして、このコマンドを受けた音声認
識タスク1-2-8は、音声認識結果コマンド２もしくは４
を用いて返答を行なうことになる。ここで、例えば入力
した音声の所定の区間（長さ）で無音を検知した場合に
は「有効データ無し」であると、また、所定の区間（長
さ）で有音（音声部分）が終了しないことを検知した場
合は「入力時間超過」であると音声認識タスク1-2-8は
判断し、このエラー状態に対応する理由コードを音声認
識結果コマンド２もしくは４に含ませる。

【００７０】図８は、本実施形態による理由コードと、
処理種別、理由内容の関係の一例を示す図である。図８
に示されるような内容を取扱説明書等に載せておくこと
により、オペレータは発生したＮＧの理由を知ることが
できる。本実施形態のファクシミリ装置では、「理由コ
ードを表示する」がＯＮとなっていれば、操作パネル上
のＬＣＤ1-3-6に、ＮＧの旨の表示と共に、図示のよう
な理由コードが表示される。このため、製造検査時やユ
ーザー使用時の重要なガイダンスを提供することが出来
る。ＮＧ発生時の表示は、理由コードのみならず、理由
内容をも表示しても良い。そのためには、理由コードに
対応する理由内容を表す文字コード列、或いはＬＣＤ1-
3-6に表示する理由内容を表すパターンデータそのもの
を予め記憶しておき、発生した理由コードに対応するデ
ータを読み出してＬＣＤ1-3-6に表示する。また、理由
内容に替えて、対処方法を表示しても良い。

【００７１】以下、本実施形態のファクシミリ装置にお
ける電話帳機能の登録と操作、および音声認識による宛
先ダイヤルを行う際の詳細な動作について説明してゆ
く。

【００７２】＜電話帳登録関連＞電話帳登録関連の処理
としては、個人別電話帳の作成、共通の電話帳及び個人
別電話帳のそれぞれに対する「新規登録」、「登録内容
修正」、「登録内容消去」及び「音声データ消去」があ
る。各処理を実行させるためには、メニューから所望の
機能を選択したりするなど、種々の方法が考えられる。
本実施形態では、処理の選択操作について限定はしな
い。

【００７３】（１）個人別電話帳の作成図９は本実施形態による個人別電話帳の作成処理操作に
おける表示内容を説明する図である。また、図１０は本
実施形態による個人別電話帳の登録処理手順を表すフロ
ーチャートである。

【００７４】機能メニュー等を操作して、個人別電話帳
の作成処理を選択すると、ステップＳ１１において図９
の（ａ）に示すような初期画面を表示する。この状態
で、セットキー1-3-10を押すと、処理はステップＳ１２
からＳ１３へ進み、図９の（ｂ）に示すような略称入力
画面を表示して、ユーザに略称を入力させる。操作とし
ては、下段から所望の文字を選択すると、上段の■カー
ソルの位置に文字が順次配置され、下段の「オワリ」に
カーソルを移動することで略称入力の完了とする。こう
して略称入力の完了が示されると、処理はステップＳ１
４からステップＳ１５へと進む。

【００７５】ステップＳ１５では、個人用ＩＤテーブル
5-2に新たなデータブロックを追加し、その「略称」の
欄にステップＳ１３で入力された略称を登録し、新たに
割り当てた個人用電話帳テーブルのアドレスをその個人
用ＩＤテーブル5-2の「個人用電話帳テーブルアドレ
ス」の欄に登録する。そして、ステップＳ１６におい
て、図９の（ｃ）の如く、個人別電話帳の登録完了を示
す表示を行なう。

【００７６】引き続き、ステップＳ１７において、図９
の（ｅ）のごとき画面を表示し、音声データの登録を行
なうか否かを問い合わせる。ここで、ユーザが「シナ
イ」を選択すれば、そのまま本処理を終了する。

【００７７】一方、音声データの登録を「スル」とした
場合、処理はステップＳ１８からステップＳ１９へ進
み、音声認識用データを生成するための音声登録処理を
実行する。音声登録処理については図１５により後述す
る。この音声登録処理によって得られたデータは、音声
データ登録領域5-5に登録される。そして、ステップＳ
２０において、音声登録テーブル5-4及び個人用ＩＤテ
ーブル5-2の各欄に、略称と音声データとをリンクする
ための適切なデータが書き込まれる。

【００７８】（２）電話帳登録処理電話帳へのデータ登録について説明する。なお、データ
登録に先立って、登録先が個人別電話帳か共通電話帳か
を指定し、個人別電話帳であればどのユーザの電話帳で
あるかが指定される。電話帳の特定は、たとえば次のよ
うに行なわれる。すなわち、機能キー1-3-2を押し、
上下カーソルキー1-3-11、1-3-12を操作することで、
「共通電話帳」か「個人別電話帳」のいずれかがメニュ
ーから指定され、個人別電話帳が指定された場合は、
ＬＣＤ1-3-6上に、個人用ＩＤテーブル5-2に登録されて
いる略称が順次表示される。所望の略称を選択するこ
とにより処理対象とする個人別電話帳が選択される。従
って、この状態で、「データ登録」を開始すれば、選択
された個人別電話帳への新規登録が行なわれることにな
る。この時点で、共通電話帳への登録処理も個人別電話
帳への登録処理も同じものとなる。

【００７９】図１１は電話帳へのデータ登録における画
面表示例を示す図である。図１２及び図１３は電話帳へ
の音声データ登録における画面表示例を示す図である。
図１４は電話帳へのデータ登録処理を説明するフローチ
ャートである。また、図１５は電話帳への音声データ登
録処理を説明するフローチャートである。

【００８０】電話帳を選択し、電話帳へのデータ登録が
メニューから選択されると、ステップＳ２１において、
ＬＣＤ1-3-6上に、図１１の（ａ）に示すごとき表示を
行なう。なお、この表示において「アキ70ケン」は、電話帳
へ登録が可能な残り件数を表す。本実施形態において、
登録可能件数を１００件とすれば、図１１の（ａ）の表
示の時点では３０件のデータがすでに登録されている。

【００８１】次に、セットキー1-3-10が押されると、ス
テップＳ３２からＳ３３へ処理が進み、図１１の（ｂ）
に示すような画面を表示して、ユーザに略称（宛名）を
入力させる。

【００８２】入力が完了すると（図１１（ｂ）において
「オワリ」が選択されると）、ステップＳ３４からステッ
プＳ３５へ処理が進み、電話番号の入力を行なわせる。
電話番号の入力はダイヤルにより行なうものとする。図
１１の（ｃ）では、電話番号の入力を行なった状態が示
されている。この状態で、セットキー1-3-10が押される
と、ステップＳ３６からステップＳ３７へ処理が進み、
電話帳データテーブル5-1（個人別電話帳への登録であ
れば、指定された個人用電話帳テーブル5-3）へ、入力
された略称と電話番号が登録される。

【００８３】その後、ステップＳ３８へ進み、図１１の
（ｅ）に示すような画面表示を行なって、音声データの
登録を行なうか否かをユーザに問い合わせる。図１１
（ｅ）において「シナイ」が選択された場合は、ステップ
Ｓ４１へ進み、続けて当該電話帳へのデータ登録を行な
うかどうかを問い合わせる（図１１の（ｆ））。続けて
登録するのであれば、処理をステップＳ３３へ戻し、そ
うでなければ本処理を終了する。

【００８４】一方、ステップＳ３８において、音声登録
を行なう旨の指示がなされると、処理はステップＳ３９
へ進み、音声登録処理を行なう。そして、ステップＳ４
０において、図１０のステップＳ２０において上述した
ように、音声登録処理によって得られたデータは、音声
データ登録領域5-5に登録される。すなわち、音声登録
テーブル5-4及び電話帳データテーブル5-1（個人別電話
帳への登録であれば、指定された個人用電話帳テーブル
5-3）の各欄に、略称と音声データとをリンクするため
の適切なデータが書き込まれる。

【００８５】次に音声登録処理を説明する。

【００８６】図１５のステップＳ４５において、装置の
音声登録可能件数と、音声の登録件数とを比較し、音声
登録が可能かどうかを判断する。本実施形態では、最大
１５件の音声データを登録できるものとする。音声登録
ができなければ、エラー処理を行なう（ステップＳ５
７）。なお、このエラー処理は、後述の図２２のフロー
チャートにおけるステップＳ７０〜Ｓ７２と同様の処理
行なうもので、音声登録が不可と判断された理由を表す
コードを図８に示される理由コードから選択し、ユーザ
に提示する（ここでは、図８のＲ０４「登録件数フル」
が選択されることになる。

【００８７】音声登録が可能であれば、ステップＳ４６
において図１２の（ａ）に示すような初期画面を表示す
るとともに、カウンタＮに３をセットする。本実施形態
では、音声登録において、音声入力を３回行なわせるこ
とにより、音声認識処理の精度を向上させるが、このカ
ウンタＮはその音声入力回数をカウントするものであ
る。

【００８８】画面の指示にしたがってユーザが受話器を
上げると、ステップＳ４７からステップＳ４８へ進み、
ガイダンス表示及びガイドトーンの発生を行なう。ガイ
ダンス表示では、まず図１２の（ｂ）のごとき表示を行
ない、ガイドトーン（ピー音）を発生した後に図１２の
（ｃ）のごとき表示を行なう。

【００８９】この状態でユーザが登録する名前を受話器
に向かって話し、音声を感知すると、ステップＳ４９に
おいて図１２の（ｄ）のごとき表示を行なう。そして、
音声の入力を終えると、ステップＳ４９からステップＳ
５０へ進み、図１２の（ｅ）のごとき表示を行なうと共
に、入力された音声の解析を行なう。そして、この解析
が正常に行なわれたと判断されたならばステップＳ５１
からステップＳ５２へ進み、異常であると判断された場
合はステップＳ４７からエラー処理へ移行する（ステッ
プＳ５８）。なお、このエラー処理は、後述の図２２の
フローチャートにおけるステップＳ７０〜Ｓ７２と同様
の処理行なうもので、音声登録が不可であると判断され
た理由をあらわすコードを図８に示される理由コードか
ら選択し、ユーザに提示する。

【００９０】音声解析が正常に行なわれると、ステップ
Ｓ５２においてカウンタＮの値を１減少させ、ステップ
Ｓ５３において、その結果としてＮ＝０となったかどう
かを判定する。Ｎ＝０でなければ、また音声解析処理を
行なう必要がある（本実施形態では３回行なう）ので、
ステップＳ５４において、例えば図１３の（ａ）に示す
ごとく音声解析が正常に行なわれたことを報知し、残り
発生必要回数を報知する画面の表示を行なう。なお、図
１３の（ａ）において、残り回数の表示（「アト2カイ」）
は、カウンタＮの値を表示すれば良い。

【００９１】以上のようにして、３回の音声登録を終了
すると、カウンタＮの値が０となり、処理はステップＳ
５３からステップＳ５５へ進む。ステップＳ５５では、
未使用の音声データ登録領域5-5へ発声された複数回の
音声データ全てを、ステップＳ３３及びＳ３５で入力さ
れたデータに対応させて登録する。ここで登録する音声
データは、全ての音声データではなく、条件の良いもの
のみを選択しても良いし、或いは複数の発声データから
最良のデータを作成したものでも良い。この間、図１３
の（ｂ）のような、音声登録処理中であることを報知す
る画面の表示を行なう。そして、音声データの登録を完
了すると、ステップＳ５６において後処理を行なう。す
なわち、図１３の（ｃ）に示すような表示を行なって、
受話器を元に戻すよう指示し、受話器が戻されたことの
検知に応じて、図１３の（ｄ）のような音声登録処理の
完了を報知する画面の表示を行なって、登録が完了した
ことを示す。そして、図１３の（ｅ）に示すような、別
項目の音声登録を続けて行なうか否かをオペレータが指
示するための画面を表示し、「シナイ」が指示された場
合には、呼び出しもとのルーチン（図１０或いは図１
４）に戻り、「スル」が指示された場合にはステップＳ
３３に戻る。

【００９２】（３）電話帳登録内容修正電話帳に登録された内容を修正する操作を説明する。な
お、本処理の制御手順は、以下に説明する操作の手順と
それにしたがった表示画面の提示により明らかであるの
で、ここでは図１６を参照して操作手順のみを説明す
る。図１６は、本実施形態における電話帳データの登録
内容の修正操作を説明する図である。

【００９３】例えば、本装置のスタンバイ状態で「電話
帳」キー（セットアップキー1-3-10）を押下し、上下カ
ーソルキーで登録修正したい略称（あて先）を選択す
る。この時点における画面表示例は、図１６の（ａ）の
ようになる。なお、表示の右端に「Ｖ」が表示されてい
るのは、その登録データに音声認識用のデータが登録さ
れていることを表す。次に、「カナ／英数字」キーを押
下すると、図１６の（ｂ）のような修正用画面の表示と
なる。なお、上下左右カーソルで下段の候補文字選択を
行ない、上段のカーソルは「＊＃」キーで移動を行なう
ものとする。

【００９４】ここで、「キムラ」の「キ」を「タ」に修
正すると、図１６の（ｃ）のようになる。そして、「オワ
リ」を選択すると、略称の修正操作を終えて、番号の修
正操作を行なうべく、図１６の（ｄ）の表示となる。番
号を変更する場合は、「消去」キーによって現在登録さ
れている番号をいったん消去し、その後ダイヤルにより
入力しなおす。図１６の（ｅ）は番号の入れなおしを行
なっている状態を示す。

【００９５】番号を入れなおしたならば、セットキーを
押下することで修正処理を終了する。一方、番号の変更
がなければ、図１６（ｄ）の状態からセットキーを押下
する。

【００９６】次に、音声データについて修正を行なうか
どうかをユーザに指示させるために、図１６（ｆ）のご
とき画面表示を行なう。すでに当該データに関して音声
データが登録されている場合、図１６（ｆ）の画面で
「スル」が選択されると、更に図１６の（ｇ）のごとき
画面を表示し、音声データの入れ替えを行うか問い合わ
せる。すなわち、本修正操作によれば、音声データが未
登録の登録データについては図１６（ｆ）の画面で「ス
ル」を選択することにより音声データ登録が開始され
る。また、音声データがすでに登録されているデータに
ついては、図１６（ｆ）の画面で「スル」が選択された
場合に、更に図１６（ｇ）のような画面表示を行なっ
て、音声データの入れ替えを行なっても良いかどうかを
問い合わせる（すなわち、登録済みの音声データが消え
ても良いかどうかを問い合わせている）。図１６（ｇ）
の画面で「シナイ」が選択された場合は、音声データの登
録処理は行なわれないことになる。

【００９７】（４）電話帳登録内容削除電話帳に登録された内容を削除する操作を説明する。な
お、本処理の制御手順は、以下に説明する操作の手順と
それにしたがった表示画面の内容の提示により明らかで
あるので、ここでは図１７を参照して操作手順のみを説
明する。図１７は、本実施形態における電話帳データの
登録内容の削除操作を説明する図である。

【００９８】本装置のスタンバイ状態で「電話帳」キー
（セットアップキー1-3-10）を押下し、上下カーソルキ
ーで登録修正したい略称（あて先）を選択する。この時
点における画面表示例は、図１７の（ａ）のようにな
る。

【００９９】この状態で、消去キー1-3-5を押下する
と、図１７の（ｂ）のようになる。そして、セットアッ
プキー1-3-10を押下すると、図１７の（ｃ）のように表
示される。この時点で、略称が「キムラタクヤ」として登録
された電話帳データは、電話帳データテーブル5-1（個
人別電話帳への登録であれば、指定された個人用電話帳
テーブル5-3）から削除される。このとき、消去したデ
ータに音声データが登録されていた場合は、当該音声デ
ータもいっしょに消去される。すなわち、電話帳データ
テーブルにおいて、削除対象のデータブロックにおける
「登録番号」で音声登録テーブル5-4を検索し、対応す
るデータブロックの「状態」を空きにする。

【０１００】以上のようにして消去処理を終えると、図
１７の（ｃ）のように表示され、所定時間経過後に図１
７の（ｄ）のように表示される。

【０１０１】（５）音声データの削除次に、登録されている音声データのみを削除する方法説
明する。図１８は音声データの削除手順を説明する図で
ある。音声データの削除に際しては、まず、電話帳機能
により、音声データを削除したい略称（宛先略称であっ
ても個人別電話帳の略称であっても良い）を表示させ
る。そして、「カナ／英字」キー（本実施形態では、リ
ダイヤルキー1-3-26で代用）を押下し、略称と電話番号
をそのまま確定すると、図１８（ａ）に示す如く表示さ
れる。ここで、「シナイ」を選択すると、図１８の（ｂ）
に示す如く表示され、当該音声データを消去するかどう
かを問い合わせる。ここでさらに「スル」が選択される
と、当該登録データの音声データが消去され、図１７の
（ｃ）に示すような表示が行なわれる。

【０１０２】なお、電話帳で略称を表示して、「カナ／
英字」キーを押下し、名前と電話番号をそのまま確定し
た後、図１８（ａ）の表示において「スル」を選択する
と、図１８の（ｄ）のように表示され、当該登録データ
に関する音声データの入れ替えを行なうことができる。

【０１０３】（６）電話帳検索操作次に、電話帳データの検索について説明する。図１９は
電話帳検索時の操作に応じた画面表示例を示す図であ
る。スタンバイ状態、又は回線捕捉後に電話帳キー（セ
ットキー1-3-10）を押下し、上下カーソル移動キー1-3-
11,1-3-12を操作することにより、ＬＣＤ1-3-6上に、電
話帳に登録されている略称が順次（例えばあいうえお順
で）表示される（図１９の（ａ）から（ｃ））。図１９
の（ａ）の状態から下カーソルキーを押下すると図１９
の（ｂ）のようになり、この状態で上カーソルキーを押
下すると図１９（ｃ）のようになる。

【０１０４】表示されている略称を選択し、右カーソル
キーを押下すると、図１９の（ｄ）のような詳細表示
（番号表示）となる。

【０１０５】この状態で、上下カーソルキーを操作する
と、詳細表示の直前の状態から上下カーソルキーを押下
したのと同じ動作を行なう。また、ストップキー1-3-18
を押下すると、スタンバイ状態へ、或いは回線捕捉中で
あれば「ＴＥＬ＝」の表示へ戻る。

【０１０６】さて、図１９の（ａ）〜（ｃ）のいずれか
の状態において（本例では図１９の（ｃ）の状態とす
る）、セットキー1-3-10が押下されると、回線捕捉中で
あれば図１９の（ｅ）のように表示して、ダイヤル発呼
を行なう。また、回線捕捉中でなければセットキーの押
下は無視され、図１９の（ｃ）の表示状態を維持する。（７）音声認識による電話帳検索次に、音声認識による電話帳検索について説明する。音
声認識キー1-3-22を押して、宛先の略称を発声し、それ
を音声認識することで、共通の電話帳を使った宛先ダイ
ヤルが実行されることになる。或いは、音声認識キー1-
3-22を押して個人用ＩＤ（図５ではミユキやテツヤなど）を発
声すると、これを音声認識することによって個人用ＩＤ
テーブル5-2から個人用電話帳テーブルが指定される。
個人用電話帳テーブルが選択された場合は、更に宛先の
略称を続けて発声し、それを音声認識することで、当該
個人用の電話帳を使った宛先ダイヤルが実行されること
になる。

【０１０７】図２０及び図２１は、音声認識による電話
帳検索の操作手順を説明する図である。また、図２２
は、音声認識による電話帳検索の処理手順を説明する図
である。

【０１０８】本機が待機状態で音声認識キー1-3-22が押
されると、オペレートタスク1-2-2は、音声認識による
電話帳検索処理を開始する。まず、ステップＳ６１にお
いて、図２０の（ａ）に示される初期画面の表示を行な
うと共に、カウンタＮの値を０にセットするという初期
化処理を行なう。また、この初期化処理において、オペ
レートタスク1-2-2は音声登録テーブル5-4の「除外フラ
グ」を全てＯＦＦにセットする。

【０１０９】ステップＳ６２において、ユーザがハンド
セット1-3-1をオフフックしたことを検知すると、ステ
ップＳ６３に進み、図２０の（ｂ）に示すようなガイダ
ンス表示を行なうと共に、ガイドトーン（ピー音）を出
力する。その後、図２０の（ｃ）のようにユーザに発声
開始可能状態を報知する画面の表示を行ない、ユーザが
音声入力するのを待つ。

【０１１０】ステップＳ６４では、ユーザによる音声の
入力を検知すると、オペレートタスク1-2-2は、図２０
の（ｄ）に示すような、音声の入力を検知し、メモリに
音声データを格納中であること、すなわち音声の装置へ
の取り込み中であること、をユーザに報知する画面の表
示を行なうと共に、音声認識スタートコマンド（ここで
は、図６のコマンド３か４が発行される）を音声認識タ
スク1-2-8に対して発行する。そして、ステップＳ６５
にて、音声認識タスク1-2-8より音声認識結果コマンド
（図７）が入力されるのを待つ。

【０１１１】音声認識結果コマンドの入力に応じて、処
理はステップＳ６６へ進み、入力した認識結果コマンド
に基づいて当該認識結果が正常に終了したかどうかを判
定する。もしも、結果コマンドが「ＮＧ」を表すコマン
ドであれば、ステップＳ７０へ進む。ステップＳ７０で
は、ＳＲＡＭ1-1-24上の「理由コード表示する」のスイ
ッチ項目がＯＮされているかどうかを判定し、ＯＮされ
ていればステップＳ７１で理由コードに従ってパネルに
ＮＧ理由を表示し、待機状態へ移行する。

【０１１２】一方、認識結果がＯＫならば、ステップＳ
６７において、認識結果コマンドに含まれている登録番
号を基に電話帳データ4-2内の各種テーブルを検索し
て、その登録番号を有する該当項目を見つける。ここ
で、該当項目が個人用ＩＤテーブルに登録されたもので
あった場合は、ステップＳ６８からステップＳ６９へ進
み、その略称とともに個人用電話帳が指定された旨をパ
ネルに表示する。そして「個人用電話帳テーブル」の宛
先検索のために再び音声認識処理を行なうべく、ステッ
プＳ６３へ処理を戻す。なお、このとき（ステップＳ６
９において）、個人用電話帳テーブルによる宛先検索へ
の処理の移行を許可する旨をユーザが指示するようにし
てもよい。ここで、ユーザが個人用電話帳テーブルによ
る宛先検索への移行を拒否した場合は、再度電話帳デー
タテーブル5-1と個人用ＩＤテーブル5-2を対象とした宛
先検索が行なわれる。

【０１１３】また、該当項目が共通の「電話帳データテ
ーブル」に登録されたものであった場合、或いは個人用
電話帳テーブルが選択された後にその選択された「個人
用電話帳テーブル」に登録されたものであった場合に
は、ステップＳ６８からステップＳ７３へ進み、認識結
果をユーザに示すため、図２０の（ｅ）で示す如く、Ｌ
ＣＤ1-3-6にその項目の「宛先略称」表示を行う。

【０１１４】次に、ステップＳ７４において、当該ダイ
ヤル発呼がファクシミリ送信であるどうかを判定する。
ファクシミリ送信であるか否かの判定は、原稿入り口に
原稿がセット済みである場合、或いはファクシミリ送信
のための画質情報がセット済みである場合等により、フ
ァクシミリ送信であると判断する。ファクシミリ送信で
なければ、ステップＳ７５へ進み、「セットキー待ち」
が指定されているかどうかを判定する。ＳＲＡＭ1-1-24
内のスイッチ「音声ダイヤルのセットキー待ち」の項目
が「セットキー待ち」に設定されている場合は、ステッ
プＳ７９でセットキー1-3-10の入力を待ち、セットキー
1-3-10を押すことでダイヤル実行に移行する。ＳＲＡＭ
1-1-24内のスイッチ「音声ダイヤルのセットキー待ち」
の項目が「自動」に設定されている場合は、ステップＳ
７５からステップＳ７６へ進み、セットキー入力を待た
ずにダイヤル発呼の実行に移行する。なお、ファクシミ
リ送信の操作を実施している場合はスイッチに関係なく
セットキー1-3-10の押下が必要である（誤認識による送
信の可能性を避けるため）。そのため、ファクシミリ送
信であれば、ステップＳ７５をスキップし、ステップＳ
７９へ進む。

【０１１５】なお、自動的にダイヤル実行へ移行する場
合は、宛先表示をユーザが確認する時間が必要なため、
タイマーＴ時間だけ遅延させてダイヤルを実行をスター
トする（ステップＳ７６、Ｓ７８）。ＴはあらかじめＳ
ＲＡＭに設定された所定値であるが、ユーザの操作で変
更することも出来る。また、この状態でストップキーを
押下すると、ステップＳ７７から待機状態へ移行するの
で、処理を中断させることができる。

【０１１６】さて、上記ダイヤル実行のためにセットキ
ー1-3-10の押下を待っている状態で、ユーザがパネルに
表示された略称を見て、宛先誤認識を発見した場合はこ
こで音声認識キー1-3-22を押すことにより、そのとき選
択されている宛先を取り消し、新たな宛先の入力の開始
を指示することができる（ステップＳ７９、ステップＳ
８０）。音声認識キー1-3-22が押下された場合は、ステ
ップＳ８１へ進み、カウンタＮの値を１つ増加する。そ
して、ステップＳ８２において、音声データの登録数と
比較し、Ｎが音声データの登録数以上であった場合は、
該当する認識結果はないとして、ステップＳ７２でエラ
ー表示を行なう。

【０１１７】一方、Ｎが音声データの登録数より小さけ
れば、オペレートタスク1-2-2は、表示中の宛先を除外
して再び音声認識するように音声認識タスクに依頼す
る。すなわち、ステップＳ８３において、そのとき選択
されている宛先を除外するべく、当該音声データの登録
番号を限定認識の音声認識スタートコマンド（コマンド
５か６）に付加して音声認識タスク1-2-8に発行する
（ステップＳ８４）。そしてステップＳ６５へ戻る。音
声認識タスクは、入力したコマンドに付加されていた登
録番号に対応する除外対象の音声登録データの「除外フ
ラグ」をＯＮにして再び音声認識処理を実行する。

【０１１８】再度音声認識した結果、認識された略称表
示が再び誤認識であったならば、セットキー1-3-10を押
さずに再度音声認識キー1-3-22を押せば良い。こうする
ことにより、前回の認識宛先に加えて今回の認識宛先が
除外されたまま新たな音声認識が実行されることにな
る。すなわち、音声登録テーブル5-4において、該当す
る除外フラグがＯＮとなり、対応する音声データは次回
の音声認識に用いられない。

【０１１９】なお、図２１に示される操作手順は、ハン
ドセットをオフフックしてから音声認識キーを押して電
話をかける（ファクシミリ送信を行なう）場合を示して
いる。まず、ハンドセットをオフフックすることで、図
２１の（ａ）のごとき電話番号の入力をオペレータに促
す画面の表示が行なわれる。この状態では、通常のダイ
ヤル通話が可能である。ここで、音声認識キーを押す
と、図２１の（ｂ）に示す表示がなされ、以降、図２０
の（ｂ）〜（ｅ）と同じである。また、その処理内容
も、図２２のフローチャートで示したものと同様とな
る。

【０１２０】なお、図２２に示した例では、再試行の回
数は音声データの登録数と一致するが、これに限らな
い。例えば、ステップＳ８２で比較する数を３回等の所
定数としても良い。また、ステップＳ７７でストップキ
ーを検出した場合に、ダイヤルの実行を行なわずに本処
理を終了するが、このタイミングで音声認識キーを押す
ことで音声認識の再試行が行なえるようにしても良い
（すなわち、ステップＳ７７からステップＳ８１へ処理
を移す）。

【０１２１】また、上記の手順では、除外フラグのリセ
ットを音声認識の開始時（ステップＳ６１）に行なうが
これに限らない。例えば、エラーによってステップＳ７
２から待機状態へ移行したとき、ストップキーによりス
テップＳ７７から待機状態へ移行したとき、或いはダイ
ヤルが実行されたときに除外フラグをリセットするよう
にしても良い。

【０１２２】以上説明したように、上記実施形態によれ
ば、音声認識実行時において誤認識（音声を登録した環
境と、認識のために音声を入力した環境が違う等によ
る）が発生した場合、オペレータが装置を停止させて待
機状態に戻し、再び操作をやり直すという必要がなくな
り、誤認識発生時に即時に再試行をさせることが出来
る。そして、この再試行時には、前回までの試行で誤認
識した音声データの候補が除外されるので操作性、信頼
性を大幅に向上させることが可能になる。

【０１２３】また、この音声認識から除外された音声デ
ータは、次の新たな操作において自動的に復帰されるの
で、オペレータは音声認識の再試行時に音声データの消
去や再登録の必要が無くなり、操作性、信頼性を大幅に
向上させることが可能になる。

【０１２４】すなわち、音声認識実行時に誤認識が発生
した場合に、音声データの削除や再登録を行うことなく
簡単に再試行が可能になり、さらには再試行時の認識確
率を大幅に向上させることが可能になる。ここで、音声
認識の再試行では、再度音声入力から行なうことにな
る。例えば、発声したときに限って他人の声や自動車の
音などが入力されてしまうと、その音声で認識した候補
群（第１位候補や下位候補を含む）は全く信頼性の低い
ものとなる。従って、明らかに誤認識した宛先を除いて
再度音声入力させることは効率的でもあり、信頼性にと
って重要である。

【０１２５】また、上記実施形態によれば、共通電話帳
に加えて、個人別の電話帳データを登録可能とし、これ
に音声データを対応付けることができる。すなわち、個
人別電話帳毎に、特定話者を前提とした音声認識アルゴ
リズムによる音声認識ダイヤルを実現できる。このた
め、複数の使用者が使用したとしても、認識精度の高い
認識ダイヤル機能を提供することが出来、利便性・信頼
性が大幅に向上する。

【０１２６】また、上記実施形態によれば、音声認識の
ための音声データを登録するに際して複数回の発声デー
タを登録して、認識精度の向上を図っている。また、こ
のような音声登録処理において、音声データを登録する
ための必要試行回数を表示するようにしたので、必要回
数分の音声入力を行なわずにオペレータが処理を中断し
てしまうことを防ぎ、現在何回目の登録を行なっている
かをいちいち記憶することからユーザを解放し、操作に
著しいストレスを感じたりすることなく、登録操作が行
なえる。

【０１２７】また、上記実施形態によれば、音声認識実
行時に認識不能（音声を登録した環境と、認識のために
音声を入力した環境が違う等による）であった場合、オ
ペレータに理由情報を通知することが可能である。この
ため、再試行時の認識精度が改善され、さらに操作性、
信頼性を大幅に向上させることが可能になる。例えば、
登録時に前記音声変換手段が音声を変換する際に特徴抽
出に失敗した場合、前記音声変換手段から音声登録に失
敗した理由情報が出力されてオペレータに通知される。
このため、例えば声が大きすぎる場合は小さい声で、声
が小さ過ぎる場合は大きい声で、騒音がひどい場合は静
かな場所で登録をし直せば、音声データが正しく登録さ
れるようになり、認識精度も大幅に向上する。

【０１２８】なお、上記実施形態では、ファクシミリ装
置に本発明を適用し、登録される宛先として電話番号を
例に挙げて説明した。しかしながら、本発明はこれに限
られるものではなく、例えば、インターネットアドレス
を宛先として音声に対応付けることも出来る。このよう
にすれば、宛先略称を音声入力するだけで、例えばイン
ターネットのＵＲＬを獲得でき、煩雑キー入力を行なわ
ずにすむので、操作性が著しく向上する。すなわち、本
発明はファクシミリ装置（電話機）や、ＬＡＮに接続さ
れた、或いはモデムを介して回線に接続されたコンピュ
ータ等、通信網における相手先のアドレスを指定して通
信を行なう装置（これらを通信装置と称する）にも適用
可能であることは明らかである。

【０１２９】なお、本発明は、複数の機器（例えばホス
トコンピュータ，インタフェイス機器，リーダ，プリン
タなど）から構成されるシステムに適用しても、一つの
機器からなる装置（例えば、複写機，ファクシミリ装置
など）に適用してもよい。

【０１３０】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ（またはＣＰＵ
やＭＰＵ）が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。

【０１３１】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。

【０１３２】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク，ハードディス
ク，光ディスク，光磁気ディスク，ＣＤ−ＲＯＭ，ＣＤ
−Ｒ，磁気テープ，不揮発性のメモリカード，ＲＯＭな
どを用いることができる。

【０１３３】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているＯＳ（オペレ
ーティングシステム）などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。

【０１３４】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るＣＰＵなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。

【０１３５】以上説明したように、本実施形態によれ
ば、音声認識実行時の認識不能（音声を登録した環境
と、認識のために音声を入力した環境が違う等による）
発生時、オペレータにその理由を（例えば理由コードに
より）通知することによって、再試行時の認識精度を改
善し、さらに操作性、信頼性を大幅に向上させることが
可能になる。

【０１３６】また、上記実施形態によれば、音声認識の
ための音声データを登録するにおいて、入力された音声
を変換する際に特徴抽出に失敗した場合、オペレータに
その理由が通知される。このため、例えば声が大きすぎ
る場合は小さい声で、声が小さ過ぎる場合は大きい声
で、騒音がひどい場合は静かな場所で登録をし直せば、
音声データが正しく登録されるようになり、認識精度も
大幅に向上する。

【０１３７】

【発明の効果】以上説明したように本発明によれば、入
力された音声に対する音声認識に失敗した場合に、その
理由をオペレータに通知可能となる。また、音声認識用
の音声データを入力された音声に基づいて登録するに際
して、その登録処理に失敗した場合、その理由をオペレ
ータに通知可能となる。

【０１３８】

【図面の簡単な説明】

【図１】実施形態によるファクシミリ装置のシステムブ
ロック図である。

【図２】本実施形態のファクシミリ装置におけるタスク
構成を示すブロック図である。

【図３】本実施形態のファクシミリ装置の概観を示し、
特に操作パネル（図１の1-1-22）の構成を示す図であ
る。

【図４】本実施形態による電話帳機能、音声登録及び音
声認識に関わる制御の概要を説明する図である。

【図５】本実施形態による電話帳データ及び音声登録メ
モリのデータ構成例を説明する図である。

【図６】オペレートタスクから音声認識タスクへ発行さ
れる音声認識スタートコマンドの種類と内容を説明する
図である。

【図７】音声認識タスクからオペレートタスクへ発行さ
れる音声認識結果コマンドの種類と内容を説明する図で
ある。

【図８】本実施形態による理由コードの一例を示す図で
ある。

【図９】本実施形態による個人別電話帳の作成処理操作
における表示内容を説明する図である。

【図１０】本実施形態による個人別電話帳の登録処理手
順を表すフローチャートである。

【図１１】電話帳へのデータ登録における画面表示例を
示す図である。

【図１２】電話帳への音声データ登録における画面表示
例を示す図である。

【図１３】電話帳への音声データ登録における画面表示
例を示す図である。

【図１４】電話帳へのデータ登録処理を説明するフロー
チャートである。

【図１５】電話帳への音声データ登録処理を説明するフ
ローチャートである。

【図１６】本実施形態における電話帳データの登録内容
の修正操作を説明する図である。

【図１７】本実施形態における電話帳データの登録内容
の削除操作を説明する図である。

【図１８】音声データの削除手順を説明する図である。

【図１９】電話帳検索時の操作に応じた画面表示例を示
す図である。

【図２０】音声認識による電話帳検索時の画面表示例を
示す図である。

【図２１】音声認識による電話帳検索時の画面表示例を
示す図である。

【図２２】音声認識による電話帳検索の処理手順を説明
するフローチャートである。

フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｈ０４Ｎ 1/32 Ｈ０４Ｎ 1/32 Ｚ (72)発明者松崎進東京都大田区下丸子３丁目30番２号キヤノン株式会社内 (72)発明者中尾宗樹東京都大田区下丸子３丁目30番２号キヤノン株式会社内 (72)発明者菅原尚樹東京都大田区下丸子３丁目30番２号キヤノン株式会社内 (72)発明者外山猛東京都大田区下丸子３丁目30番２号キヤノン株式会社内Ｆターム(参考） 5C075 BA08 CD02 CD13 CD18 5D015 LL03 LL05 5K027 BB02 FF22 HH20 HH21 HH23 5K036 AA15 BB01 DD17 DD32 FF06 JJ10 JJ13 KK09

Claims

【特許請求の範囲】

【請求項１】複数の入力音声に対応する音声認識のた
めの音声データを記憶する音声データ記憶手段と、前記音声データ記憶手段に記憶された音声データと入力
音声とを照合することにより音声認識を行なう音声認識
手段と、前記音声認識手段による入力音声の認識の成否を判定す
る第１判定手段と、前記判定手段で音声認識による入力音声の認識に失敗し
たと判定された場合、その理由情報を取得して通知する
第１通知手段とを備えることを特徴とする音声認識装置。
【請求項２】入力された音声に基づいて、前記音声デ
ータ記憶手段に音声認識のための音声データを登録する
登録手段と、前記登録手段において、前記入力された音声から前記音
声認識のための音声データを登録することに失敗したか
否かを判定する第２判定手段と、場合、その理由情報を取得して通知する第２通知手段と
を更に備えることを特徴とする請求項１に記載の音声認
識装置。
【請求項３】前記第１通知手段を動作させるか否かを
設定する設定手段を更に備えることを特徴とする請求項
１に記載の音声認識装置。
【請求項４】前期第２通知手段を動作させるか田舎を
設定する設定手段を更に備えることを特徴とする請求項
２に記載の音声認識装置。
【請求項５】複数の入力音声に対応する音声認識のた
めの音声データをメモリに記憶する音声データ記憶工程
と、前記メモリに記憶された音声データと入力音声とを照合
することにより音声認識を行なう音声認識工程と、前記音声認識工程による入力音声の認識の成否を判定す
る第１判定工程と、前記判定工程で音声認識による入力音声の認識に失敗し
たと判定された場合、その理由情報を取得して通知する
第１通知工程とを備えることを特徴とする音声認識方
法。
【請求項６】入力された音声に基づいて、メモリに音
声認識のための音声データを登録する登録工程と、前記登録工程において、前記入力された音声から前記音
声認識のための音声データを登録することに失敗したか
否かを判定する第２判定工程と、場合、その理由情報を取得して通知する第２通知工程と
を更に備えることを特徴とする請求項５に記載の音声認
識方法。
【請求項７】前記第１通知工程を動作させるか否かを
設定する設定工程を更に備えることを特徴とする請求項
１に記載の音声認識方法。
【請求項８】前記第２通知工程を動作させるか田舎を
設定する設定工程を更に備えることを特徴とする請求項
７に記載の音声認識方法。
【請求項９】回線に接続して遠隔装置との通信を行な
う通信装置であって、宛先と前記回線上のアドレスとを対にした宛先情報と、
該宛先を表す入力音声に対応した音声認識のための音声
データを登録する登録手段と、前記登録手段に登録された音声データと入力音声とを照
合することにより音声認識を行なう音声認識手段と、前記音声認識手段による認識の成否を判定する第１判定
手段と、前記第１判定手段により音声認識が成功したと判定され
た場合、前記音声認識手段による認識結果に基づいて宛
先情報を特定し、対応するアドレスを得る検索手段と、前記第１判定手段により音声認識が失敗したと判定され
た場合、その理由情報を取得して通知する第１通知手段
とを備えることを特徴とする通信装置。
【請求項１０】前記第１通知手段は、取得した理由情
報に基づく表示を行なうことを特徴とする請求項９に記
載の通信装置。
【請求項１１】前記登録手段は、入力された音声に基
づいて音声認識のための音声データの登録を行ない、前記登録手段において、前記入力された音声に基づいて
前記音声認識のための音声データを登録することに失敗
したか否かを判定する第２判定手段と、前記第２判定手段で音声データの登録に失敗したと判定
された場合、その理由情報を取得して通知する第２通知
手段とを更に備えることを特徴とする請求項９に記載の
通信装置。
【請求項１２】前記第２通知手段は、取得した理由情
報に基づく表示を行なうことを特徴とする請求項１１に
記載の通信装置。
【請求項１３】回線に接続して遠隔装置との通信を行
なう通信装置の制御方法であって、宛先と前記回線上のアドレスとを対にした宛先情報と、
該宛先を表す入力音声に対応した音声認識のための音声
データをメモリに登録する登録工程と、前記メモリに記憶された音声データと入力音声とを照合
することにより音声認識を行なう音声認識工程と、前記音声認識工程による認識の成否を判定する第１判定
工程と、前記第１判定工程により音声認識が成功したと判定され
た場合、前記音声認識工程による認識結果に基づいて宛
先情報を特定し、対応するアドレスを得る検索工程と、前記第１判定工程により音声認識が失敗したと判定され
た場合、その理由情報を取得して通知する第１通知工程
とを備えることを特徴とする通信装置の制御方法。
【請求項１４】前記第１通知工程は、取得した理由情
報に基づく表示を行なうことを特徴とする請求項１３に
記載の通信装置の制御方法。
【請求項１５】前記登録工程は、入力された音声に基
づいて音声認識のための音声データの登録を行ない、前記登録工程において、前記入力された音声に基づいて
前記音声認識のための音声データを登録することに失敗
したか否かを判定する第２判定工程と、前記第２判定工程で音声データの登録に失敗したと判定
された場合、その理由情報を取得して通知する第２通知
工程とを更に備えることを特徴とする請求項１３に記載
の通信装置の制御方法。
【請求項１６】前記第２通知工程は、取得した理由情
報に基づく表示を行なうことを特徴とする請求項１５に
記載の通信装置の制御方法。
【請求項１７】コンピュータに、複数の入力音声に対
応する音声データを記憶した音声データメモリを用いた
音声認識を行なわせるための制御プログラムを格納する
記憶媒体であって、該制御プログラムが、複数の入力音声に対応する音声認識のための音声データ
をメモリに記憶する音声データ記憶工程のコードと、前記メモリに記憶された音声データと入力音声とを照合
することにより音声認識を行なう音声認識工程のコード
と、前記音声認識工程による入力音声の認識の成否を判定す
る第１判定工程のコードと、前記判定工程で音声認識による入力音声の認識に失敗し
たと判定された場合、その理由情報を取得して通知する
第１通知工程のコードとを備えることを特徴とする記憶
媒体。
【請求項１８】コンピュータに、回線に接続して遠隔
装置との通信を行なう通信装置を制御させるための制御
プログラムを格納する記憶媒体であって、該制御プログ
ラムが、宛先と前記回線上のアドレスとを対にした宛先情報と、
該宛先を表す入力音声に対応した音声認識のための音声
データをメモリに登録する登録工程のコードと、前記メモリに記憶された音声データと入力音声とを照合
することにより音声認識を行なう音声認識工程のコード
と、前記音声認識工程による認識の成否を判定する第１判定
工程のコードと、前記第１判定工程により音声認識が成功したと判定され
た場合、前記音声認識工程による認識結果に基づいて宛
先情報を特定し、対応するアドレスを得る検索工程のコ
ードと、前記第１判定工程により音声認識が失敗したと判定され
た場合、その理由情報を取得して通知する第１通知工程
のコードとを備えることを特徴とする記憶媒体。