JP2000112497A - 音声認識方法及び装置と通信装置及びその制御方法 - Google Patents

音声認識方法及び装置と通信装置及びその制御方法

Info

Publication number
JP2000112497A
JP2000112497A JP10281654A JP28165498A JP2000112497A JP 2000112497 A JP2000112497 A JP 2000112497A JP 10281654 A JP10281654 A JP 10281654A JP 28165498 A JP28165498 A JP 28165498A JP 2000112497 A JP2000112497 A JP 2000112497A
Authority
JP
Japan
Prior art keywords
voice
recognition
data
voice recognition
registration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10281654A
Other languages
English (en)
Inventor
Hiroshi Shinoda
弘志 信田
Yasuhide Ueno
康秀 上野
Susumu Matsuzaki
進 松崎
Muneki Nakao
宗樹 中尾
Naoki Sugawara
尚樹 菅原
Takeshi Toyama
猛 外山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP10281654A priority Critical patent/JP2000112497A/ja
Publication of JP2000112497A publication Critical patent/JP2000112497A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Telephone Function (AREA)
  • Facsimile Transmission Control (AREA)

Abstract

(57)【要約】 【課題】入力された音声に対する音声認識に失敗した場
合に、その理由をオペレータに通知可能とする。 【解決手段】ステップS61〜S64において、電話帳
機能による宛名検索のための入力音声と、複数の入力音
声に対応する音声認識のための音声データを照合するこ
とにより音声認識を行なう。そして、ステップS73〜
S78で、音声認識の結果に基づいて電話帳に登録され
たダイヤルが選択され、通信が実行される。ここで、ス
テップS66,S70〜S72において、当該音声認識
による入力音声の認識の成否が判定され、認識に失敗し
たと判定された場合は、その理由情報を取得して通知す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識装置及び
方法及び該音声認識装置を用いた通信装置及びその制御
方法に関するものである。
【0002】
【従来の技術】従来より、電話機やファクシミリ装置に
おいて、宛先を簡便にダイヤルするために、複数の宛先
の番号をワンタッチキーや短縮キーに登録しておく機能
がある。更には、宛先の略称や番号を登録しておいて、
それらを表示させながらその中から目的の宛先を選択す
る電話帳機能が搭載されて実用化されている。また、さ
らなる利便性向上のために音声認識機能を搭載し、宛先
のダイヤル番号を認識させたりすることが提案されてい
る。
【0003】
【発明が解決しようとする課題】一般に、音声認識で
は、特定話者に対応した音声認識処理の方が、認識精度
も良いし、認識処理も簡単である。従って、上述のよう
な通信装置における電話帳機能に適用するには、原理的
に特定話者を前提とした音声認識アルゴリズムを適用す
る方が好ましい。
【0004】原理的に特定話者を前提とした音声認識ア
ルゴリズムによる音声データ識別では、所定の人間が登
録しておいた音声データを照合認識するためには該登録
した本人が発声しないと正しく照合されない場合が多
い。また、認識のための音声入力時に環境ノイズが混入
して誤認識の原因になることもある。さらには、登録し
た本人であるにも関わらず、体調を崩すなどして発声す
ると誤認識されるケースもありうる。この結果、オペレ
ータが誤認識して選択された宛先ダイヤルにきずかずに
間違いFAXや間違い電話をかけてしまうことになる。
これら誤認識を極力防止するためには、認識時に照合検
索する対象となる音声データの登録が正しく行われてい
る必要がある。音声データの登録の条件が悪いと、音声
認識時に認識精度が低下する。従って音声データの登録
時には、同じ音声データを登録するために複数回の登録
試行を行って最も条件が良いと判断されたデータを音声
メモリに登録するのが一般的である。このように、オペ
レータに同じデータを複数回発声させて登録することに
なるが、各発声時に正しく登録されているか、また、登
録に失敗しても、その理由はオペレータには判断できな
かった。
【0005】また、音声認識によって登録された音声デ
ータのなかから合致するものを検索照合することによ
り、合致した音声データに対応する宛先ダイヤルを選択
する音声認識宛先選択機能においては、入力した音声に
周囲環境のノイズが載ったり声が小さかったり大きかっ
たりして認識不能となるケースもある。このため、1回
目に発声して結果が宛先認識不能となった場合、音声認
識をやり直しても2回目には正しく認識されるとは限ら
ない。1回目と同じ環境下で試行すれば、結果も同じ
(認識不能)になる可能性がある。このような場合、オ
ペレータが、何故認識不能になるのかという理由が分か
らないと、何回やっても音声認識がうまく行かなくなっ
てしまう。例えば、周囲の騒音がひどい、声が小さい、
声が大きいなど、装置が何故うまく認識しないのかの理
由が分かれば、そのような要因を排除した対応をとるこ
とも可能である。
【0006】本発明は上記の問題に鑑みてなされたもの
であり、入力された音声に対する音声認識に失敗した場
合に、その理由をオペレータに通知可能とすることを目
的とする。
【0007】また、本発明の目的は、音声認識用の音声
データを入力された音声に基づいて登録するに際して、
その登録処理に失敗した場合、その理由をオペレータに
通知可能とすることにある。
【0008】
【課題を解決するための手段】上記の目的を達成するた
めの本発明の一態様による音声認識装置は、例えば以下
の構成を備える。すなわち、複数の入力音声に対応する
音声認識のための音声データを記憶する音声データ記憶
手段と、前記音声データ記憶手段に記憶された音声デー
タと入力音声とを照合することにより音声認識を行なう
音声認識手段と、前記音声認識手段による入力音声の認
識の成否を判定する第1判定手段と、前記判定手段で音
声認識による入力音声の認識に失敗したと判定された場
合、その理由情報を取得して通知する第1通知手段とを
備える。
【0009】また、上記の目的を達成する、本発明の他
の態様による通信装置は例えば以下の構成を備える。す
なわち、回線に接続して遠隔装置との通信を行なう通信
装置であって、宛先と前記回線上のアドレスとを対にし
た宛先情報と、該宛先を表す入力音声に対応した音声認
識のための音声データを登録する登録手段と、前記登録
手段に登録された音声データと入力音声とを照合するこ
とにより音声認識を行なう音声認識手段と、前記音声認
識手段による認識の成否を判定する第1判定手段と、前
記第1判定手段により音声認識が成功したと判定された
場合、前記音声認識手段による認識結果に基づいて宛先
情報を特定し、対応するアドレスを得る検索手段と、前
記第1判定手段により音声認識が失敗したと判定された
場合、その理由情報を取得して通知する第1通知手段と
を備える。
【0010】また、本発明によれば、上記音声認識装置
によって達成される音声認識方法が提供される。
【0011】また、本発明によれば、上記通信装置によ
って達成される通信装置の制御方法が提供される。
【0012】さらに本発明によれば、上記音声認識方法
もしくは上記通信装置の制御方法をコンピュータに実現
させるための制御プログラムを格納する記憶媒体が提供
される。
【0013】
【発明の実施の形態】以下、添付の図面を参照して本発
明の好適な一実施形態を説明する。
【0014】本実施形態では、アナログ小電力方式のコ
ードレス電話機機能を搭載し、ITU勧告G3規格を満
足する機能を有するファクシミリ装置に本発明を適用し
た例を説明する。なお、本実施形態のファクシミリ装置
は、カラー読み取り部とカラー記録部とを具備し、カラ
ーコピー機能やカラー画像の通信機能を有する。更に、
本実施形態のファクシミリ装置は、ファクシミリや通話
の目的で、記憶してある宛先略称を選択することで対応
する宛先番号に自動宛先ダイヤルを行う電話帳機能を有
する。特に、その電話帳機能を利用し、音声認識部によ
り音声を認識して得られた認識結果に基づいて自動宛先
ダイヤルをする機能も有している。
【0015】またカラー読み取り部は本体から着脱自在
なハンドスキャナユニットで構成されており、シート状
原稿の読み取りはもとより、ブック原稿なども読み取る
ことが可能である。スキャナの読み取りセンサは線順次
でRGB各色を出力する密着型のカラーセンサであっ
て、読み取り幅はB4幅、読み取り解像度は200dp
iである。
【0016】また、カラー記録部はインク吐出方式によ
って記録を行なうものであり、CMYK各色のインクタ
ンクとインク吐出部とが一体となったカラーカートリッ
ジと、黒インクのみのインクタンクとインク吐出部が一
体となったモノクロカートリッジのいずれか一方を装着
することにより360dpiの記録解像度で記録紙に2
値データを記録する。いずれのカートリッジを装着して
もモノクロ記録時の記録幅は最大B4幅であるが、カラ
ーカートリッジを装着した場合のカラー記録時には、そ
の記録幅が最大A4幅となる。
【0017】通信時にはG3モードで最高9600bp
sのモデム速度を有し、画像伝送の誤り再送機能である
ECMモードを具備している。以下、本実施形態のファ
クシミリ装置の構成、動作について説明する。
【0018】図1は実施形態によるファクシミリ装置の
システムブロック図である。図1において、1-1-1は本
装置の制御部であるCPU、1-1-21はプログラムや各種
固定データを格納するROM、1-1-18は各種プログラム
のワークメモリ、留守録などの音声データおよびモノク
ロ画像・カラー画像データ用の蓄積メモリとして使用さ
れるDRAMである。DRAM1-1-18の容量は全体で2
MBあり、内0.5MB分はワークメモリとして使用さ
れ、残りの1.5MBは画像データ(送受信データ)の
蓄積と音声データの蓄積のために使用される。1-1-24は
システムに必要な登録データ(各種ソフトスイッチ、電
話帳データ、音声認識のための音声登録データ、装置の
電話番号、略称などの装置用IDデータ)を登録記憶す
るためのSRAMであって、電源断によりデータが失わ
れないよう電池でバックアップされている。
【0019】1-1-2はITU勧告G3モードに必要な機
能を持つ公知のファクシミリ用モデム(本実施形態で
は、V.29,V.21,V27terのほかにDTMF認識機能、D
RAM1-1-18への音声録音・DRAM1-1-18等からの音
声再生のための音声コーデック機能も具備するタイプを
使用)である。また、1-1-3は子機電話1-1-5とアナログ
小電力方式の無線通信を行うベースユニットであって、
CPU1-1-1からの指示により無線通信を制御する公知
のユニットである。1-1-4はアナログ信号用接続スイッ
チ(クロスポイントスイッチ)であって、CPU1-1-1
からの設定によりハンドセット1-1-6、マイク1-1-7、ス
ピーカ1-1-8、NCU1-1-9、CPU1-1-1の音声入力端
子、モデム1-1-2およびベースユニット1-1-3との間のア
ナログ信号の接続を自在に切り替える公知の回路であ
る。
【0020】1-1-6は、装置本体の電話機ハンドセッ
ト、1-1-7は音声入力用のマイク、1-1-8はスピーカ、1-
1-9は回線とインタフェースするための公知のNCUで
ある。
【0021】1-1-10はモノクロ2値生画像データからラ
ンレングス符号を生成し、またはランレングス符号を入
力してモノクロ2値生画像データを出力する公知のラン
レングス回路である。1-1-11は公知の時計IC(RT
C)である。、また、1-1-25はハンドスキャナユニット
(HSU)であり、画像読み取りのためのカラーコンタ
クトセンサ1-1-12と原稿上を移動した距離を測定するた
めのロータリーエンコーダ1-1-16が内蔵されている。ス
キャナユニット1-1-16は装置本体とカールコードにより
接続されて着脱自在な構成になっている。1-1-13はエン
コーダ検出部であり、エンコーダ1-1-16の出力信号から
移動距離データ(ロータリーエンコーダの回転数情報)
を生成してCPU1-1-1に通知する。
【0022】1-1-14は画像処理部であって、CPU1-1-
1の指示により、カラー生画像データをDRAM1-1-18
に蓄積する場合は、カラーコンタクトセンサ1-1-12から
出力されたアナログRGB信号(線順次で解像度200
dpi)を入力して、RGB各8ビット(1画素あたり
では24ビット)の90dpiデジタルデータに変換
し、得られた変換データをDMAコントローラ1-1-17に
供給する。また、カラーコピーをダイレクトで行う場合
であれば、カラーコンタクトセンサ1-1-12から出力され
たアナログRGB信号(線順次で解像度200dpi)
を入力して360dpi、2値YMCKのデジタルデー
タに変換し、得られた変換データをDMAコントローラ
1-1-17に供給する。
【0023】DMAコントローラ1-1-17は、カラー生画
像データ(90dpi、RGB)をDRAM1-1-18に蓄
積する場合にはDRAM1-1-18にカラー生画像データを
転送し、カラーコピーをダイレクトで行う場合には記録
制御部1-1-19に360dpiの2値YMCKデータを転
送する。
【0024】モノクロ生画像データをDRAM1-1-18に
蓄積する場合には、画像処理部1-1-14は、カラーコンタ
クトセンサ1-1-12から出力されたアナログRGB信号
(線順次200dpi)を入力して、モノクロ2値の2
00dpiデジタルデータに変換し、得られた変換デー
タをDMAコントローラ1-1-17に供給する。
【0025】また、モノクロコピーをダイレクトで行う
場合は、カラーコンタクトセンサ1-1-12から出力された
アナログRGB信号(線順次200dpi)を入力し
て、モノクロ2値の360dpiデジタルデータに変換
し、DMAコントローラ1-1-17に供給する。
【0026】そして、DMAコントローラ1-1-17は、モ
ノクロ生画像データをDRAMに蓄積する場合にはDR
AM1-1-18にモノクロ2値画像データを転送し、モノク
ロコピーをダイレクトで行う場合には記録制御部1-1-19
にモノクロ2値画像データを転送する。
【0027】更に、上記動作について補足すると、 (1)本体にスキャナを装着した状態でのコピーはダイ
レクトモードとなり、読み取りデータをDRAM1-1-18
へ1ページ分のデータを蓄積(以下、ページ蓄積)する
ことなく、シート状原稿を読み取りながら記録部に印字
する。DRAM1-1-18へのページ蓄積が不要のために高
解像度でもメモリオーバーフローしない理由から、解像
度は記録部1-1-20に整合させてあり、読み取りデータは
副走査方向360dpiとなる。また、コピーサイズもモノク
ロ時はB4幅まで、カラー時は記録部1-1-20の仕様でA
4幅までとなる。
【0028】(2)本体からスキャナを取り出してハン
ドスキャナとしてコピー使用する場合は、メモリモード
となり、読み取りデータは必ずDRAM1-1-18にページ
蓄積される。これは、記録部1-1-20の印字速度が人間が
ストレス無くハンドスキャンを実行する速度に対して遅
いための処置であり、一旦DRAM1-1-18にページ蓄積
することによってハンドスキャンを高速で実行終了でき
るよう構成されている。また、読み取り解像度を記録部
1-1-20に整合させて360dpiとすると1ページのデ
ータ容量が大きすぎてDRAM1-1-18を占有してしま
い、装置動作に支障をきたす、もしくはDRAM1-1-18
の容量を上げるとコストがかかる等の理由から、読み取
り解像度はモノクロ時では200dpi、カラー時では
90dpiにおさえてある。
【0029】また、同様の理由から、モノクロ時のコピ
ーサイズはB4幅までであるが、カラー時のコピーサイ
ズはA6(もしくは官製はがきサイズ)以下に制限して
ある。ちなみにモノクロ200dpiでB4サイズ1ペ
ージ分のデータ容量は約700KB、カラー90dpi
でA6サイズの1ページ分のデータ容量は約600KB
となり、DRAM1-1-18に蓄積可能である。
【0030】データを圧縮符号化してDRAM1-1-18に
蓄積すればサイズ・解像度をもっと上げることは出来る
が、後に述べるように圧縮符号化はソフトウエアで行う
ために時間がかかりハンドスキャンの実行速度が下がっ
てしまうというデメリットがある。また、高速の圧縮符
号化のためにハードウエアを追加することも考えられる
が、大幅なコスト増をまねく。
【0031】(3)本体にスキャナを装着した状態での
原稿送信はダイレクトモードとなり、読み取りデータを
ページ蓄積することなくDRAM1-1-18経由でモデムに
転送して、シート状原稿を読み取りながら相手ファクシ
ミリに送信してゆく。
【0032】(4)本体からスキャナを取り出してハン
ドスキャナとして使用し、原稿送信する場合は、メモリ
モードとなり、読み取りデータは必ずDRAM1-1-18に
ページ蓄積される。これは、モデム1-1-2の通信速度
が、人間がストレス無くハンドスキャンを実行する速度
に対して遅いための処置であり、一旦DRAM1-1-18に
ページ蓄積することによってハンドスキャンを高速で実
行終了できるよう構成されている。読み取り解像度やサ
イズに関しては上記の項目(2)と同じ理由で同様の仕
様としている。
【0033】1-1-19は記録制御部であり、記録部1-1-20
が記録可能なデータ形式に入力データを変換する。1-1-
20は記録部であり、インク吐出方式の公知のカラープリ
ンタで構成され、インクタンクとインク吐出部が一体に
なっているカートリッジを記録紙の主走査方向に移動さ
せながら画像を記録してゆく。カラーカートリッジとモ
ノクロカートリッジのいずれが装着されているかは、記
録部1-1-20とカートリッジの電気的接点の構成によりC
PU1-1-1が判別できるようになっている。
【0034】1-1-15は解像度変換部であり、モノクロ2
値画像データを入力して解像度変換を行う公知の回路で
構成される。解像度変換部1-1-15は、モノクロ画像の拡
大・縮小などのために使用されるとともに、記録部1-1-
20の解像度に対して回線から受信したモノクロ画像の解
像度を整合させる用途にも使用される。
【0035】1-1-22は操作パネルであり、本ファクシミ
リ装置の各種操作入力及び表示出力を行なう。操作パネ
ル1-1-22は、図3に示すような各種キーや表示ランプ、
およびLCDディスプレイを具備する。また、機構とし
ては、マイク1-1-7、スピーカ1-1-8が配備されている。
【0036】1-1-26はハンドスキャナ着脱センサであ
り、ハンドスキャナユニット1-1-25と装置本体との着脱
状態を検出する。ハンドスキャナ着脱センサ1-1-26の出
力によって、CPU1-1-1はシート状原稿を読み取るダ
イレクトモードであるか、ブック原稿など立体物を読み
取るメモリモードであるかを決定する。
【0037】図3は、本実施形態のファクシミリ装置の
概観を示し、特に操作パネル(図1の1-1-22)の構成を
示す図である。
【0038】図3において、1-3-1は本体用ハンドセッ
ト(図1の1-1-6と同一)である。1-3-2は各種登録や設
定のための「機能キー」、1-3-3は伝言や通話内容を音
声データとしてDRAM1-1-18に録音するとき使用する
「録音キー」、1-3-4はモデム1-1-2の音声コーデックに
よってCPU1-1-1がDRAM1-1-18に録音した音声デ
ータを再生するとき使用する「再生キー」、1-3-5はメ
モリに格納された各種データを消去する際に使用する
「消去キー」である。
【0039】1-3-6は16文字分のキャラクタを2行表
示できるバックライト付LCDであって、装置の状態や
各種メッセージを出力するために使われる。1-3-7は
「カラーLED」で、1-3-8の「カラー/白黒キー」でカ
ラーモードが選択されると点灯する。1-3-9はモノクロ
モードでの画質を選択するための「画質キー」である。
【0040】1-3-10は電話帳を呼び出すための「電話帳
キー」と、登録などの内容を確定させるための「セット
キー」を兼用するキーであって、簡単のために以降「セ
ットキー」と呼ぶことにする。1-3-11は「上カーソルキ
ー」、1-3-12は「下カーソルキー」、1-3-13は「左カー
ソルキー」、1-3-14は「右カーソルキー」である。いず
れも表示制御の操作で使用される。
【0041】1-3-15はファクシミリ送信のための「送信
キー」、1-3-16はファクシミリ受信および受信画像をプ
リントするための「受信/プリントキー」である。1-3-
17はコピーを実行するための「コピーキー」、1-3-18は
実行中の装置動作を中断するための「ストップキー」で
ある。1-3-19はマイク1-1-7の開口部、1-3-20はテンキ
ー部、1-3-21は回線を接続したままマイク1-1-7をアク
ティブにして回線上に音声出力し、また、回線上の音を
スピーカ1-1-8に出力する状態にするための「スピーカ
ホンキー」である。
【0042】1-3-22は音声認識によって宛先自動ダイヤ
ルを実行するための「音声認識キー」、1-3-23は着信し
た電話の相手通話内容を自動的にDRAM1-1-18に録音
するための「留守キー」、1-3-24は本体からコードレス
子機電話を呼び出して内線通話を実行するための「子機
キー」、1-3-25は通話状態を保留したまま相手にメロデ
ィを送出する「保留キー」、1-3-26は前回かけた相手の
電話番号を自動的にダイヤルするための「リダイヤルキ
ー」、1-3-27は外線通話中にキャッチホンがはいったと
き、キャッチホンの呼に通話を切り替えるためと、切り
替えたキャッチホン通話から元の通話に切り替えるため
に使用する「キャッチキー」である。
【0043】次に、本実施形態のファクシミリ装置の制
御について説明する。図2は、本実施形態のファクシミ
リ装置におけるタスク構成を示すブロック図である。本
装置のソフトウエアは、マルチタスクOS1-2-12によっ
て、各タスクが同時に平行して動作できる環境を与えら
れている。以下、各タスクについて説明してゆく。
【0044】1-2-1は状態監視タスクで、装置内に発生
する各イベントを監視し、装置状態を変化させる必要の
あるイベントの発生を検出すると、必要なタスクにその
情報を通知する機能を持つ。たとえば、操作パネルから
のキー情報を検出すると、オペレートタスク1-2-2や回
線制御タスク1-2-3に必要なキー情報を伝達して、装置
の機能を起動する。
【0045】1-2-2はオペレートタスクで、状態監視タ
スク1-2-1からのキーコードA情報を受けて動作モード
を判定し、必要な機能を実行するタスクにスタートコマ
ンドを発行するとともに、キーコードA情報に基づい
て、操作パネル1-1-22上の表示機能を制御する。
【0046】1-2-3は回線制御タスクであり、NCUを
制御して、回線からの着呼を受け付けたり、オペレート
タスク1-2-2からのダイヤル要求コマンドに応じてダイ
ヤル信号を送出するために回線を捕捉したり、回線断を
実行して通信を終了させたりするシーケンスを実行す
る。また、回線接続状態における状態監視タスク1-2-1
からのキーコードB情報で「送信キー」や「受信/プリ
ントキー」を検出するか、発信元の相手が電話かファク
シミリかを回線上の信号を分析することにより自動判別
して、ファクシミリならば通信タスク1-2-5にファクシ
ミリ通信のための通信スタートコマンドを発行したりす
るものである。
【0047】1-2-4はダイヤル制御タスクであり、回線
制御タスク1-2-3あるいは通信タスク1-2-5からのダイヤ
ルスタートコマンドに応じて各種ダイヤル信号を交換機
に送出する機能を持つ。1-2-5は通信タスクであり、回
線制御タスク1-2-3からの通信スタートコマンドによっ
て各種ファクシミリ通信(通信手順の実行や画像データ
伝送)を実行する。
【0048】1-2-6は読み取りタスクであり、オペレー
トタスク1-2-2からの読み取りスタートコマンドに応じ
て、ハンドスキャナユニット1-1-25と画像処理部1-1-14
を制御し、原稿の読み取りを実行する。1-2-7は符号・
復号タスクであり、通信タスク1-2-5、読み取りタスク1
-2-6、記録タスク1-2-9からの各種符号復号スタートコ
マンドに応じて、画像データの符号化、復号化の処理を
ソフトウエアで実行する。このため本装置は、符号復号
化のためのハードウエアコストを大きく削減している
(ただしハードウエアでの実施に比べて処理時間はかか
る)。なお、モノクロ画像には公知のMH符号を適用
し、カラー画像に関してはRGB多値DPCM方式(R
GBの各8ビット値で隣接画素間の差分値を計算する方
式)にハフマン符号を割り当てた公知の符号化方式を適
用する。
【0049】1-2-8は音声認識タスクであり、ハンドセ
ット1-3-1から入力された使用者の発声音声を分析し
て、あらかじめ登録されてある音声データ(複数可)と
比較し一致するものを検出し通知する、公知の音声認識
アルゴリズムを含むソフトウエアである。音声認識タス
ク1-2-8は、オペレートタスク1-2-2からの音声認識スタ
ートコマンドにより起動される。また、音声認識タスク
1-2-8の終了は、音声認識タスク1-2-8自身によるもので
あり、音声トレーニング(音声登録)および音声認識の
結果を音声認識結果コマンドとして、オペレートタスク
1-2-2に返送した後に終了する。
【0050】1-2-9は記録タスクであり、レポートタス
ク1-2-10やプリントタスク1-2-11からの記録スタートコ
マンドに応じて、要求された画像データを記録部1-1-20
で印字させる機能をもつ。1-2-10はレポートタスクであ
り、通信履歴が記録される通信管理レポートやSRAM
1-1-24の登録情報などの機能設定リストをキャラクタデ
ータで作成し、それを画像データに展開して記録タスク
1-2-9に記録依頼する、各種レポート作成用のソフトウ
エアである。1-2-11はプリントタスクであり、常時、自
動的に記録する必要のある画像データがDRAM1-1-18
に蓄積されていないかをチェックしており、記録する必
要のある画像データを検出すると、記録スタートコマン
ドを記録タスクに発行する監視機能を持つ。
【0051】以上のような構成を備えた、本実施形態の
ファクシミリ装置における、電話帳機能、音声登録機能
及び音声認識機能について説明する。図4は、本実施形
態による電話帳機能、音声登録及び音声認識に関わる制
御の概要を説明する図である。
【0052】(1)電話帳機能 相手先略称と相手先電話番号を対応させて電話帳データ
(図4の4-2)として登録しておき、所望の相手先略称
を検索し、検索された相手先略称に対応する相手先電話
番号でダイヤルを行なう。本実施形態では、相手先の検
索に際して、 電話帳データに登録された相手先略称を順次(たとえ
ば、あいうえお順)LCD表示器1-3-6に表示すること
により所望の相手先を選択し、必要な相手先番号を得る
方法と、 相手先略称を音声登録(以下の(2)項参照)してお
き、相手先略称を音声によって入力し、これを音声認識
(以下の(3)項参照)することで得られた相手先略称
で電話帳データを検索して、対応する相手先番号を得る
方法とを用いることができる。
【0053】(2)音声登録 音声認識の為の比較分析対象データを、SRAM1-1-24
内の音声登録メモリに作成する。ハンドセット1-1-6、
マイク1-1-7から入力された音声を、或いはNCU1-1-9
を通じて回線から、もしくはベースユニット1-1-3を通
じて子機1-1-5から入力された音声をクロスポイントS
W1-1-4を通して音声データとしてCPU1-1-1に入力す
る。CPU1-1-1では、オペレートタスク1-2-2及び音声
認識タスク1-2-8を実行することにより、当該音声デー
タに種々の演算を施し、音声認識の為のデータを作成
し、SRAM1-1-24内の音声登録メモリ4-1に登録す
る。なお、このときの結果OK/NGを音声認識結果コ
マンドとして、オペレートタスク1-2-2に返送する。
【0054】ここで、オペレートタスク1-2-2は、音声
認識結果コマンドとして「OK」を受け取ると、電話帳
データにおける相手先略称と、その音声認識用データと
を対応付ける(詳細は後述する)。
【0055】(3)音声認識 音声認識においては、入力された音声について、音声登
録メモリ4-1を参照して認識を行ない、対応する相手先
電話番号を電話帳データ4-2から抽出する。音声登録時
と同様に、音声は、ハンドセット1-1-6、マイク1-1-7か
ら、或いはNCU1-1-9を通じて回線から、もしくはベ
ースユニット1-1-3を通じて子機1-1-5から入力される。
入力された音声は、クロスポイントSW1-1-4を介して
音声データとしてCPU1-1-1に入力される。CPU1-1
-1では、オペレートタスク1-2-2及び音声認識タスク1-2
-8を実行することにより、入力された音声データに種々
の演算を施し、得られたデータと音声登録メモリ4-1に
登録されているデータを比較し、最も近いデータを選択
し、その結果を音声認識結果コマンドとして、オペレー
トタスク1-2-2に返送する。
【0056】なお、図4において、電話帳への音声登録
を行う場合と、音声認識による電話帳検索とダイヤルを
実行する場合、オペレートタスク1-2-2は音声認識タス
ク1-2-8に音声認識スタートコマンドを発行し、音声認
識タスクに音声登録処理や認識処理をスタートさせる。
【0057】音声認識タスク1-2-8は、ハンドセット1-1
-6やマイク1-1-7から入力したアナログ音声データをC
PU1-1-1に内蔵されたA/D変換回路によってサンプ
リングし、デジタルデータに変換し、音声入力データと
してタスク(音声認識タスク1-2-8)に取り込み、演算
処理をかける。処理が終了すると、音声認識結果コマン
ドが音声認識タスク1-2-8からオペレートタスク1-2-2に
返送される。
【0058】以下、上述した各機能(電話帳機能、音声
登録、音声認識)に関して更に詳細な説明を行なう。
【0059】図5は本実施形態による電話帳データ及び
音声登録メモリのデータ構成例を説明する図である。図
5の上部点線内は、SRAM1-1-24上でオペレートタス
クが管理する電話帳データ4-2である。電話帳データ4-2
は大きく2種類に別れており、一つは全ユーザに共通の
電話帳データであり、もう一つは、個人別電話帳データ
である。
【0060】共通の電話帳データは、電話帳データテー
ブル5-1を備える。電話帳データテーブル5-1には、相手
先の略称を示す「略称」、対応する相手先の「電話番
号」、音声データが登録されているかを表すフラグであ
るところの「音声登録」、音声データが登録されている
場合にその音声データを特定する「登録番号」で構成さ
れるデータブロックが複数記憶されている。
【0061】個人別の電話帳データは、個人用IDテー
ブル5-2と個人用電話帳テーブル5-3で構成される。個人
用IDテーブル5-2には、個人用電話帳テーブルを所有
するユーザの略称を示す「略称」、この略称に対応する
音声データが登録されているかどうかを表す「音声登
録」、音声データが登録されている場合にその音声デー
タを特定する「登録番号」、及び対応する個人用電話帳
テーブルを特定するための「個人用電話帳テーブルアド
レス」で構成されるデータブロックが格納される。ま
た、個人用電話帳テーブル5-3は、個人用IDテーブル
で登録されたユーザの数分存在する。各テーブルのデー
タの構造は、電話帳データテーブル5-1と同じである。
【0062】音声登録メモリ4-1は、SRAM1-1-24上
で音声認識タスクが管理するもので、音声登録テーブル
5-4と音声データ登録領域5-5を格納する。音声登録テー
ブル5-4は、「登録番号」、「状態」、「除外フラ
グ」、「登録アドレス」を備える。「登録番号」は、音
声データ登録領域5-5を特定するものである。「登録番
号」は、先の「電話帳データテーブル」「個人用IDテ
ーブル」「個人用電話帳テーブル」に記述される「登録
番号」と1対1に対応して関連している。「状態」は、
対応する音声データ登録領域5-5にデータが格納されて
いるか否かを示す。「除外フラグ」はオペレートタスク
から認識処理の比較対象としない旨の指定を受けたかど
うかを表す。「除外フラグ」は図6で後述のコマンド
0、1、2、3、4のいずれかを受信したとき全てOF
Fにリセットされ、同じくコマンド5、6のいずれかを
受信したときコマンドで指定された登録番号の「除外フ
ラグ」がONにセットされる。また、「登録アドレス」
は、デジタル符号化された音声データが記憶されている
RAMエリアの実体アドレスである。音声データ登録領
域5-5には、音声認識を行なうのに必要な音声データが
登録される。
【0063】以上のようなデータ構成において、電話帳
データと音声データは「登録番号」によってリンクされ
ている。従って、たとえば、入力された音声について、
音声データ登録領域5-5のデータを参照して音声認識を
行ない、認識結果として登録番号「NO.2」を得た場
合、この登録番号で電話帳データテーブル5-1及び個人
用IDテーブル5-2が検索され、この場合は、電話帳デ
ータテーブル5-1から「マナブ」という略称で登録され
た電話番号が獲得される。
【0064】なお、音声認識の結果として登録番号「N
O.7」を得た場合、個人用IDテーブル5-2に一致する
データブロックが存在するので、当該音声入力は個人別
電話帳の指定であったと判断する。そして、次に入力さ
れる音声に対する音声認識は、指定された個人別電話帳
(個人用電話帳テーブル5-3)に登録された範囲内で音声
認識による相手先の特定を行なう。なお、図5では略称
が3文字のものしか示されていないが、3文字に限られ
ないことは言うまでもないであろう。
【0065】本実施形態では、上述のような個人別の電
話帳データを用いることにより、特定話者認識のごとき
音声認識環境が得られるので、音声認識の認識率を向上
させることができる。なお、共通の電話帳データと、個
人別の電話帳データの利用についての更なる詳細は後述
する。
【0066】図6はオペレートタスクから音声認識タス
クへ発行される音声認識スタートコマンドの種類と内容
を説明する図である。図6に示されるように、コマンド
の種類としてコマンド0からコマンド6まで存在する。
コマンド0は指定の音声登録データを音声登録メモリか
ら消去するため使用される。なお、図6の「登録番号」
に○が付されているのは、そのコマンドが登録番号を指
定することを表す。また、ここで指定される登録番号
は、図5で説明した登録番号と対応するものである。
【0067】コマンド1および2は、音声認識タスク1-
2-8に音声登録処理を依頼するため使用される。コマン
ド3および4は音声認識タスク1-2-8に音声認識処理を
依頼するため使用される。コマンド5および6も音声認
識処理を依頼するため使用されるが、これらを受取った
音声認識タスクは、当該コマンドで指定された登録番号
の音声登録データを比較対象から削除して認識する(図
5の音声登録テーブル5-4における「除外フラグ」をO
Nにする)。
【0068】図7は音声認識タスクからオペレートタス
クへ発行される音声認識結果コマンドの種類と内容を説
明する図である。図7に示されるように、コマンド種別
がコマンド1からコマンド4まで存在する。コマンド1
および2は、音声登録結果をオペレートタスク1-2-2に
通知するため使用される。コマンド3および4は音声認
識結果を通知するために使用される。
【0069】なお、本装置のSRAM1-1-24上には、
「理由コード表示する」のスイッチ項目が設けられてお
り、「機能設定」モードにおいて、オペレータの所望す
る状態(ON/OFF)を設定できる。これがONされ
ているときには、音声登録/認識の各処理でNGだった
場合に、NGの理由を示す「理由コード」が結果コマン
ドに反映される。すなわち、「理由コードを表示する」
がONとなっている場合には、音声登録/認識の各処理
において、オペレートタスク1-2-2はそれぞれコマンド
4/コマンド6(NG発生時にその理由コードを付す旨
の指示を含むコマンド)を用いて音声認識タスク1-2-8
に指示を行なう。そして、このコマンドを受けた音声認
識タスク1-2-8は、音声認識結果コマンド2もしくは4
を用いて返答を行なうことになる。ここで、例えば入力
した音声の所定の区間(長さ)で無音を検知した場合に
は「有効データ無し」であると、また、所定の区間(長
さ)で有音(音声部分)が終了しないことを検知した場
合は「入力時間超過」であると音声認識タスク1-2-8は
判断し、このエラー状態に対応する理由コードを音声認
識結果コマンド2もしくは4に含ませる。
【0070】図8は、本実施形態による理由コードと、
処理種別、理由内容の関係の一例を示す図である。図8
に示されるような内容を取扱説明書等に載せておくこと
により、オペレータは発生したNGの理由を知ることが
できる。本実施形態のファクシミリ装置では、「理由コ
ードを表示する」がONとなっていれば、操作パネル上
のLCD1-3-6に、NGの旨の表示と共に、図示のよう
な理由コードが表示される。このため、製造検査時やユ
ーザー使用時の重要なガイダンスを提供することが出来
る。NG発生時の表示は、理由コードのみならず、理由
内容をも表示しても良い。そのためには、理由コードに
対応する理由内容を表す文字コード列、或いはLCD1-
3-6に表示する理由内容を表すパターンデータそのもの
を予め記憶しておき、発生した理由コードに対応するデ
ータを読み出してLCD1-3-6に表示する。また、理由
内容に替えて、対処方法を表示しても良い。
【0071】以下、本実施形態のファクシミリ装置にお
ける電話帳機能の登録と操作、および音声認識による宛
先ダイヤルを行う際の詳細な動作について説明してゆ
く。
【0072】<電話帳登録関連>電話帳登録関連の処理
としては、個人別電話帳の作成、共通の電話帳及び個人
別電話帳のそれぞれに対する「新規登録」、「登録内容
修正」、「登録内容消去」及び「音声データ消去」があ
る。各処理を実行させるためには、メニューから所望の
機能を選択したりするなど、種々の方法が考えられる。
本実施形態では、処理の選択操作について限定はしな
い。
【0073】(1)個人別電話帳の作成 図9は本実施形態による個人別電話帳の作成処理操作に
おける表示内容を説明する図である。また、図10は本
実施形態による個人別電話帳の登録処理手順を表すフロ
ーチャートである。
【0074】機能メニュー等を操作して、個人別電話帳
の作成処理を選択すると、ステップS11において図9
の(a)に示すような初期画面を表示する。この状態
で、セットキー1-3-10を押すと、処理はステップS12
からS13へ進み、図9の(b)に示すような略称入力
画面を表示して、ユーザに略称を入力させる。操作とし
ては、下段から所望の文字を選択すると、上段の■カー
ソルの位置に文字が順次配置され、下段の「オワリ」に
カーソルを移動することで略称入力の完了とする。こう
して略称入力の完了が示されると、処理はステップS1
4からステップS15へと進む。
【0075】ステップS15では、個人用IDテーブル
5-2に新たなデータブロックを追加し、その「略称」の
欄にステップS13で入力された略称を登録し、新たに
割り当てた個人用電話帳テーブルのアドレスをその個人
用IDテーブル5-2の「個人用電話帳テーブルアドレ
ス」の欄に登録する。そして、ステップS16におい
て、図9の(c)の如く、個人別電話帳の登録完了を示
す表示を行なう。
【0076】引き続き、ステップS17において、図9
の(e)のごとき画面を表示し、音声データの登録を行
なうか否かを問い合わせる。ここで、ユーザが「シナ
イ」を選択すれば、そのまま本処理を終了する。
【0077】一方、音声データの登録を「スル」とした
場合、処理はステップS18からステップS19へ進
み、音声認識用データを生成するための音声登録処理を
実行する。音声登録処理については図15により後述す
る。この音声登録処理によって得られたデータは、音声
データ登録領域5-5に登録される。そして、ステップS
20において、音声登録テーブル5-4及び個人用IDテ
ーブル5-2の各欄に、略称と音声データとをリンクする
ための適切なデータが書き込まれる。
【0078】(2)電話帳登録処理 電話帳へのデータ登録について説明する。なお、データ
登録に先立って、登録先が個人別電話帳か共通電話帳か
を指定し、個人別電話帳であればどのユーザの電話帳で
あるかが指定される。電話帳の特定は、たとえば次のよ
うに行なわれる。すなわち、機能キー1-3-2を押し、
上下カーソルキー1-3-11、1-3-12を操作することで、
「共通電話帳」か「個人別電話帳」のいずれかがメニュ
ーから指定され、個人別電話帳が指定された場合は、
LCD1-3-6上に、個人用IDテーブル5-2に登録されて
いる略称が順次表示される。所望の略称を選択するこ
とにより処理対象とする個人別電話帳が選択される。従
って、この状態で、「データ登録」を開始すれば、選択
された個人別電話帳への新規登録が行なわれることにな
る。この時点で、共通電話帳への登録処理も個人別電話
帳への登録処理も同じものとなる。
【0079】図11は電話帳へのデータ登録における画
面表示例を示す図である。図12及び図13は電話帳へ
の音声データ登録における画面表示例を示す図である。
図14は電話帳へのデータ登録処理を説明するフローチ
ャートである。また、図15は電話帳への音声データ登
録処理を説明するフローチャートである。
【0080】電話帳を選択し、電話帳へのデータ登録が
メニューから選択されると、ステップS21において、
LCD1-3-6上に、図11の(a)に示すごとき表示を
行なう。なお、この表示において「アキ70ケン」は、電話帳
へ登録が可能な残り件数を表す。本実施形態において、
登録可能件数を100件とすれば、図11の(a)の表
示の時点では30件のデータがすでに登録されている。
【0081】次に、セットキー1-3-10が押されると、ス
テップS32からS33へ処理が進み、図11の(b)
に示すような画面を表示して、ユーザに略称(宛名)を
入力させる。
【0082】入力が完了すると(図11(b)において
「オワリ」が選択されると)、ステップS34からステッ
プS35へ処理が進み、電話番号の入力を行なわせる。
電話番号の入力はダイヤルにより行なうものとする。図
11の(c)では、電話番号の入力を行なった状態が示
されている。この状態で、セットキー1-3-10が押される
と、ステップS36からステップS37へ処理が進み、
電話帳データテーブル5-1(個人別電話帳への登録であ
れば、指定された個人用電話帳テーブル5-3)へ、入力
された略称と電話番号が登録される。
【0083】その後、ステップS38へ進み、図11の
(e)に示すような画面表示を行なって、音声データの
登録を行なうか否かをユーザに問い合わせる。図11
(e)において「シナイ」が選択された場合は、ステップ
S41へ進み、続けて当該電話帳へのデータ登録を行な
うかどうかを問い合わせる(図11の(f))。続けて
登録するのであれば、処理をステップS33へ戻し、そ
うでなければ本処理を終了する。
【0084】一方、ステップS38において、音声登録
を行なう旨の指示がなされると、処理はステップS39
へ進み、音声登録処理を行なう。そして、ステップS4
0において、図10のステップS20において上述した
ように、音声登録処理によって得られたデータは、音声
データ登録領域5-5に登録される。すなわち、音声登録
テーブル5-4及び電話帳データテーブル5-1(個人別電話
帳への登録であれば、指定された個人用電話帳テーブル
5-3)の各欄に、略称と音声データとをリンクするため
の適切なデータが書き込まれる。
【0085】次に音声登録処理を説明する。
【0086】図15のステップS45において、装置の
音声登録可能件数と、音声の登録件数とを比較し、音声
登録が可能かどうかを判断する。本実施形態では、最大
15件の音声データを登録できるものとする。音声登録
ができなければ、エラー処理を行なう(ステップS5
7)。なお、このエラー処理は、後述の図22のフロー
チャートにおけるステップS70〜S72と同様の処理
行なうもので、音声登録が不可と判断された理由を表す
コードを図8に示される理由コードから選択し、ユーザ
に提示する(ここでは、図8のR04「登録件数フル」
が選択されることになる。
【0087】音声登録が可能であれば、ステップS46
において図12の(a)に示すような初期画面を表示す
るとともに、カウンタNに3をセットする。本実施形態
では、音声登録において、音声入力を3回行なわせるこ
とにより、音声認識処理の精度を向上させるが、このカ
ウンタNはその音声入力回数をカウントするものであ
る。
【0088】画面の指示にしたがってユーザが受話器を
上げると、ステップS47からステップS48へ進み、
ガイダンス表示及びガイドトーンの発生を行なう。ガイ
ダンス表示では、まず図12の(b)のごとき表示を行
ない、ガイドトーン(ピー音)を発生した後に図12の
(c)のごとき表示を行なう。
【0089】この状態でユーザが登録する名前を受話器
に向かって話し、音声を感知すると、ステップS49に
おいて図12の(d)のごとき表示を行なう。そして、
音声の入力を終えると、ステップS49からステップS
50へ進み、図12の(e)のごとき表示を行なうと共
に、入力された音声の解析を行なう。そして、この解析
が正常に行なわれたと判断されたならばステップS51
からステップS52へ進み、異常であると判断された場
合はステップS47からエラー処理へ移行する(ステッ
プS58)。なお、このエラー処理は、後述の図22の
フローチャートにおけるステップS70〜S72と同様
の処理行なうもので、音声登録が不可であると判断され
た理由をあらわすコードを図8に示される理由コードか
ら選択し、ユーザに提示する。
【0090】音声解析が正常に行なわれると、ステップ
S52においてカウンタNの値を1減少させ、ステップ
S53において、その結果としてN=0となったかどう
かを判定する。N=0でなければ、また音声解析処理を
行なう必要がある(本実施形態では3回行なう)ので、
ステップS54において、例えば図13の(a)に示す
ごとく音声解析が正常に行なわれたことを報知し、残り
発生必要回数を報知する画面の表示を行なう。なお、図
13の(a)において、残り回数の表示(「アト2カイ」)
は、カウンタNの値を表示すれば良い。
【0091】以上のようにして、3回の音声登録を終了
すると、カウンタNの値が0となり、処理はステップS
53からステップS55へ進む。ステップS55では、
未使用の音声データ登録領域5-5へ発声された複数回の
音声データ全てを、ステップS33及びS35で入力さ
れたデータに対応させて登録する。ここで登録する音声
データは、全ての音声データではなく、条件の良いもの
のみを選択しても良いし、或いは複数の発声データから
最良のデータを作成したものでも良い。この間、図13
の(b)のような、音声登録処理中であることを報知す
る画面の表示を行なう。そして、音声データの登録を完
了すると、ステップS56において後処理を行なう。す
なわち、図13の(c)に示すような表示を行なって、
受話器を元に戻すよう指示し、受話器が戻されたことの
検知に応じて、図13の(d)のような音声登録処理の
完了を報知する画面の表示を行なって、登録が完了した
ことを示す。そして、図13の(e)に示すような、別
項目の音声登録を続けて行なうか否かをオペレータが指
示するための画面を表示し、「シナイ」が指示された場
合には、呼び出しもとのルーチン(図10或いは図1
4)に戻り、「スル」が指示された場合にはステップS
33に戻る。
【0092】(3)電話帳登録内容修正 電話帳に登録された内容を修正する操作を説明する。な
お、本処理の制御手順は、以下に説明する操作の手順と
それにしたがった表示画面の提示により明らかであるの
で、ここでは図16を参照して操作手順のみを説明す
る。図16は、本実施形態における電話帳データの登録
内容の修正操作を説明する図である。
【0093】例えば、本装置のスタンバイ状態で「電話
帳」キー(セットアップキー1-3-10)を押下し、上下カ
ーソルキーで登録修正したい略称(あて先)を選択す
る。この時点における画面表示例は、図16の(a)の
ようになる。なお、表示の右端に「V」が表示されてい
るのは、その登録データに音声認識用のデータが登録さ
れていることを表す。次に、「カナ/英数字」キーを押
下すると、図16の(b)のような修正用画面の表示と
なる。なお、上下左右カーソルで下段の候補文字選択を
行ない、上段のカーソルは「*#」キーで移動を行なう
ものとする。
【0094】ここで、「キムラ」の「キ」を「タ」に修
正すると、図16の(c)のようになる。そして、「オワ
リ」を選択すると、略称の修正操作を終えて、番号の修
正操作を行なうべく、図16の(d)の表示となる。番
号を変更する場合は、「消去」キーによって現在登録さ
れている番号をいったん消去し、その後ダイヤルにより
入力しなおす。図16の(e)は番号の入れなおしを行
なっている状態を示す。
【0095】番号を入れなおしたならば、セットキーを
押下することで修正処理を終了する。一方、番号の変更
がなければ、図16(d)の状態からセットキーを押下
する。
【0096】次に、音声データについて修正を行なうか
どうかをユーザに指示させるために、図16(f)のご
とき画面表示を行なう。すでに当該データに関して音声
データが登録されている場合、図16(f)の画面で
「スル」が選択されると、更に図16の(g)のごとき
画面を表示し、音声データの入れ替えを行うか問い合わ
せる。すなわち、本修正操作によれば、音声データが未
登録の登録データについては図16(f)の画面で「ス
ル」を選択することにより音声データ登録が開始され
る。また、音声データがすでに登録されているデータに
ついては、図16(f)の画面で「スル」が選択された
場合に、更に図16(g)のような画面表示を行なっ
て、音声データの入れ替えを行なっても良いかどうかを
問い合わせる(すなわち、登録済みの音声データが消え
ても良いかどうかを問い合わせている)。図16(g)
の画面で「シナイ」が選択された場合は、音声データの登
録処理は行なわれないことになる。
【0097】(4)電話帳登録内容削除 電話帳に登録された内容を削除する操作を説明する。な
お、本処理の制御手順は、以下に説明する操作の手順と
それにしたがった表示画面の内容の提示により明らかで
あるので、ここでは図17を参照して操作手順のみを説
明する。図17は、本実施形態における電話帳データの
登録内容の削除操作を説明する図である。
【0098】本装置のスタンバイ状態で「電話帳」キー
(セットアップキー1-3-10)を押下し、上下カーソルキ
ーで登録修正したい略称(あて先)を選択する。この時
点における画面表示例は、図17の(a)のようにな
る。
【0099】この状態で、消去キー1-3-5を押下する
と、図17の(b)のようになる。そして、セットアッ
プキー1-3-10を押下すると、図17の(c)のように表
示される。この時点で、略称が「キムラ タクヤ」として登録
された電話帳データは、電話帳データテーブル5-1(個
人別電話帳への登録であれば、指定された個人用電話帳
テーブル5-3)から削除される。このとき、消去したデ
ータに音声データが登録されていた場合は、当該音声デ
ータもいっしょに消去される。すなわち、電話帳データ
テーブルにおいて、削除対象のデータブロックにおける
「登録番号」で音声登録テーブル5-4を検索し、対応す
るデータブロックの「状態」を空きにする。
【0100】以上のようにして消去処理を終えると、図
17の(c)のように表示され、所定時間経過後に図1
7の(d)のように表示される。
【0101】(5)音声データの削除 次に、登録されている音声データのみを削除する方法説
明する。図18は音声データの削除手順を説明する図で
ある。音声データの削除に際しては、まず、電話帳機能
により、音声データを削除したい略称(宛先略称であっ
ても個人別電話帳の略称であっても良い)を表示させ
る。そして、「カナ/英字」キー(本実施形態では、リ
ダイヤルキー1-3-26で代用)を押下し、略称と電話番号
をそのまま確定すると、図18(a)に示す如く表示さ
れる。ここで、「シナイ」を選択すると、図18の(b)
に示す如く表示され、当該音声データを消去するかどう
かを問い合わせる。ここでさらに「スル」が選択される
と、当該登録データの音声データが消去され、図17の
(c)に示すような表示が行なわれる。
【0102】なお、電話帳で略称を表示して、「カナ/
英字」キーを押下し、名前と電話番号をそのまま確定し
た後、図18(a)の表示において「スル」を選択する
と、図18の(d)のように表示され、当該登録データ
に関する音声データの入れ替えを行なうことができる。
【0103】(6)電話帳検索操作 次に、電話帳データの検索について説明する。図19は
電話帳検索時の操作に応じた画面表示例を示す図であ
る。スタンバイ状態、又は回線捕捉後に電話帳キー(セ
ットキー1-3-10)を押下し、上下カーソル移動キー1-3-
11,1-3-12を操作することにより、LCD1-3-6上に、電
話帳に登録されている略称が順次(例えばあいうえお順
で)表示される(図19の(a)から(c))。図19
の(a)の状態から下カーソルキーを押下すると図19
の(b)のようになり、この状態で上カーソルキーを押
下すると図19(c)のようになる。
【0104】表示されている略称を選択し、右カーソル
キーを押下すると、図19の(d)のような詳細表示
(番号表示)となる。
【0105】この状態で、上下カーソルキーを操作する
と、詳細表示の直前の状態から上下カーソルキーを押下
したのと同じ動作を行なう。また、ストップキー1-3-18
を押下すると、スタンバイ状態へ、或いは回線捕捉中で
あれば「TEL=」の表示へ戻る。
【0106】さて、図19の(a)〜(c)のいずれか
の状態において(本例では図19の(c)の状態とす
る)、セットキー1-3-10が押下されると、回線捕捉中で
あれば図19の(e)のように表示して、ダイヤル発呼
を行なう。また、回線捕捉中でなければセットキーの押
下は無視され、図19の(c)の表示状態を維持する。 (7)音声認識による電話帳検索 次に、音声認識による電話帳検索について説明する。音
声認識キー1-3-22を押して、宛先の略称を発声し、それ
を音声認識することで、共通の電話帳を使った宛先ダイ
ヤルが実行されることになる。或いは、音声認識キー1-
3-22を押して個人用ID(図5ではミユキやテツヤなど)を発
声すると、これを音声認識することによって個人用ID
テーブル5-2から個人用電話帳テーブルが指定される。
個人用電話帳テーブルが選択された場合は、更に宛先の
略称を続けて発声し、それを音声認識することで、当該
個人用の電話帳を使った宛先ダイヤルが実行されること
になる。
【0107】図20及び図21は、音声認識による電話
帳検索の操作手順を説明する図である。また、図22
は、音声認識による電話帳検索の処理手順を説明する図
である。
【0108】本機が待機状態で音声認識キー1-3-22が押
されると、オペレートタスク1-2-2は、音声認識による
電話帳検索処理を開始する。まず、ステップS61にお
いて、図20の(a)に示される初期画面の表示を行な
うと共に、カウンタNの値を0にセットするという初期
化処理を行なう。また、この初期化処理において、オペ
レートタスク1-2-2は音声登録テーブル5-4の「除外フラ
グ」を全てOFFにセットする。
【0109】ステップS62において、ユーザがハンド
セット1-3-1をオフフックしたことを検知すると、ステ
ップS63に進み、図20の(b)に示すようなガイダ
ンス表示を行なうと共に、ガイドトーン(ピー音)を出
力する。その後、図20の(c)のようにユーザに発声
開始可能状態を報知する画面の表示を行ない、ユーザが
音声入力するのを待つ。
【0110】ステップS64では、ユーザによる音声の
入力を検知すると、オペレートタスク1-2-2は、図20
の(d)に示すような、音声の入力を検知し、メモリに
音声データを格納中であること、すなわち音声の装置へ
の取り込み中であること、をユーザに報知する画面の表
示を行なうと共に、音声認識スタートコマンド(ここで
は、図6のコマンド3か4が発行される)を音声認識タ
スク1-2-8に対して発行する。そして、ステップS65
にて、音声認識タスク1-2-8より音声認識結果コマンド
(図7)が入力されるのを待つ。
【0111】音声認識結果コマンドの入力に応じて、処
理はステップS66へ進み、入力した認識結果コマンド
に基づいて当該認識結果が正常に終了したかどうかを判
定する。もしも、結果コマンドが「NG」を表すコマン
ドであれば、ステップS70へ進む。ステップS70で
は、SRAM1-1-24上の「理由コード表示する」のスイ
ッチ項目がONされているかどうかを判定し、ONされ
ていればステップS71で理由コードに従ってパネルに
NG理由を表示し、待機状態へ移行する。
【0112】一方、認識結果がOKならば、ステップS
67において、認識結果コマンドに含まれている登録番
号を基に電話帳データ4-2内の各種テーブルを検索し
て、その登録番号を有する該当項目を見つける。ここ
で、該当項目が個人用IDテーブルに登録されたもので
あった場合は、ステップS68からステップS69へ進
み、その略称とともに個人用電話帳が指定された旨をパ
ネルに表示する。そして「個人用電話帳テーブル」の宛
先検索のために再び音声認識処理を行なうべく、ステッ
プS63へ処理を戻す。なお、このとき(ステップS6
9において)、個人用電話帳テーブルによる宛先検索へ
の処理の移行を許可する旨をユーザが指示するようにし
てもよい。ここで、ユーザが個人用電話帳テーブルによ
る宛先検索への移行を拒否した場合は、再度電話帳デー
タテーブル5-1と個人用IDテーブル5-2を対象とした宛
先検索が行なわれる。
【0113】また、該当項目が共通の「電話帳データテ
ーブル」に登録されたものであった場合、或いは個人用
電話帳テーブルが選択された後にその選択された「個人
用電話帳テーブル」に登録されたものであった場合に
は、ステップS68からステップS73へ進み、認識結
果をユーザに示すため、図20の(e)で示す如く、L
CD1-3-6にその項目の「宛先略称」表示を行う。
【0114】次に、ステップS74において、当該ダイ
ヤル発呼がファクシミリ送信であるどうかを判定する。
ファクシミリ送信であるか否かの判定は、原稿入り口に
原稿がセット済みである場合、或いはファクシミリ送信
のための画質情報がセット済みである場合等により、フ
ァクシミリ送信であると判断する。ファクシミリ送信で
なければ、ステップS75へ進み、「セットキー待ち」
が指定されているかどうかを判定する。SRAM1-1-24
内のスイッチ「音声ダイヤルのセットキー待ち」の項目
が「セットキー待ち」に設定されている場合は、ステッ
プS79でセットキー1-3-10の入力を待ち、セットキー
1-3-10を押すことでダイヤル実行に移行する。SRAM
1-1-24内のスイッチ「音声ダイヤルのセットキー待ち」
の項目が「自動」に設定されている場合は、ステップS
75からステップS76へ進み、セットキー入力を待た
ずにダイヤル発呼の実行に移行する。なお、ファクシミ
リ送信の操作を実施している場合はスイッチに関係なく
セットキー1-3-10の押下が必要である(誤認識による送
信の可能性を避けるため)。そのため、ファクシミリ送
信であれば、ステップS75をスキップし、ステップS
79へ進む。
【0115】なお、自動的にダイヤル実行へ移行する場
合は、宛先表示をユーザが確認する時間が必要なため、
タイマーT時間だけ遅延させてダイヤルを実行をスター
トする(ステップS76、S78)。TはあらかじめS
RAMに設定された所定値であるが、ユーザの操作で変
更することも出来る。また、この状態でストップキーを
押下すると、ステップS77から待機状態へ移行するの
で、処理を中断させることができる。
【0116】さて、上記ダイヤル実行のためにセットキ
ー1-3-10の押下を待っている状態で、ユーザがパネルに
表示された略称を見て、宛先誤認識を発見した場合はこ
こで音声認識キー1-3-22を押すことにより、そのとき選
択されている宛先を取り消し、新たな宛先の入力の開始
を指示することができる(ステップS79、ステップS
80)。音声認識キー1-3-22が押下された場合は、ステ
ップS81へ進み、カウンタNの値を1つ増加する。そ
して、ステップS82において、音声データの登録数と
比較し、Nが音声データの登録数以上であった場合は、
該当する認識結果はないとして、ステップS72でエラ
ー表示を行なう。
【0117】一方、Nが音声データの登録数より小さけ
れば、オペレートタスク1-2-2は、表示中の宛先を除外
して再び音声認識するように音声認識タスクに依頼す
る。すなわち、ステップS83において、そのとき選択
されている宛先を除外するべく、当該音声データの登録
番号を限定認識の音声認識スタートコマンド(コマンド
5か6)に付加して音声認識タスク1-2-8に発行する
(ステップS84)。そしてステップS65へ戻る。音
声認識タスクは、入力したコマンドに付加されていた登
録番号に対応する除外対象の音声登録データの「除外フ
ラグ」をONにして再び音声認識処理を実行する。
【0118】再度音声認識した結果、認識された略称表
示が再び誤認識であったならば、セットキー1-3-10を押
さずに再度音声認識キー1-3-22を押せば良い。こうする
ことにより、前回の認識宛先に加えて今回の認識宛先が
除外されたまま新たな音声認識が実行されることにな
る。すなわち、音声登録テーブル5-4において、該当す
る除外フラグがONとなり、対応する音声データは次回
の音声認識に用いられない。
【0119】なお、図21に示される操作手順は、ハン
ドセットをオフフックしてから音声認識キーを押して電
話をかける(ファクシミリ送信を行なう)場合を示して
いる。まず、ハンドセットをオフフックすることで、図
21の(a)のごとき電話番号の入力をオペレータに促
す画面の表示が行なわれる。この状態では、通常のダイ
ヤル通話が可能である。ここで、音声認識キーを押す
と、図21の(b)に示す表示がなされ、以降、図20
の(b)〜(e)と同じである。また、その処理内容
も、図22のフローチャートで示したものと同様とな
る。
【0120】なお、図22に示した例では、再試行の回
数は音声データの登録数と一致するが、これに限らな
い。例えば、ステップS82で比較する数を3回等の所
定数としても良い。また、ステップS77でストップキ
ーを検出した場合に、ダイヤルの実行を行なわずに本処
理を終了するが、このタイミングで音声認識キーを押す
ことで音声認識の再試行が行なえるようにしても良い
(すなわち、ステップS77からステップS81へ処理
を移す)。
【0121】また、上記の手順では、除外フラグのリセ
ットを音声認識の開始時(ステップS61)に行なうが
これに限らない。例えば、エラーによってステップS7
2から待機状態へ移行したとき、ストップキーによりス
テップS77から待機状態へ移行したとき、或いはダイ
ヤルが実行されたときに除外フラグをリセットするよう
にしても良い。
【0122】以上説明したように、上記実施形態によれ
ば、音声認識実行時において誤認識(音声を登録した環
境と、認識のために音声を入力した環境が違う等によ
る)が発生した場合、オペレータが装置を停止させて待
機状態に戻し、再び操作をやり直すという必要がなくな
り、誤認識発生時に即時に再試行をさせることが出来
る。そして、この再試行時には、前回までの試行で誤認
識した音声データの候補が除外されるので操作性、信頼
性を大幅に向上させることが可能になる。
【0123】また、この音声認識から除外された音声デ
ータは、次の新たな操作において自動的に復帰されるの
で、オペレータは音声認識の再試行時に音声データの消
去や再登録の必要が無くなり、操作性、信頼性を大幅に
向上させることが可能になる。
【0124】すなわち、音声認識実行時に誤認識が発生
した場合に、音声データの削除や再登録を行うことなく
簡単に再試行が可能になり、さらには再試行時の認識確
率を大幅に向上させることが可能になる。ここで、音声
認識の再試行では、再度音声入力から行なうことにな
る。例えば、発声したときに限って他人の声や自動車の
音などが入力されてしまうと、その音声で認識した候補
群(第1位候補や下位候補を含む)は全く信頼性の低い
ものとなる。従って、明らかに誤認識した宛先を除いて
再度音声入力させることは効率的でもあり、信頼性にと
って重要である。
【0125】また、上記実施形態によれば、共通電話帳
に加えて、個人別の電話帳データを登録可能とし、これ
に音声データを対応付けることができる。すなわち、個
人別電話帳毎に、特定話者を前提とした音声認識アルゴ
リズムによる音声認識ダイヤルを実現できる。このた
め、複数の使用者が使用したとしても、認識精度の高い
認識ダイヤル機能を提供することが出来、利便性・信頼
性が大幅に向上する。
【0126】また、上記実施形態によれば、音声認識の
ための音声データを登録するに際して複数回の発声デー
タを登録して、認識精度の向上を図っている。また、こ
のような音声登録処理において、音声データを登録する
ための必要試行回数を表示するようにしたので、必要回
数分の音声入力を行なわずにオペレータが処理を中断し
てしまうことを防ぎ、現在何回目の登録を行なっている
かをいちいち記憶することからユーザを解放し、操作に
著しいストレスを感じたりすることなく、登録操作が行
なえる。
【0127】また、上記実施形態によれば、音声認識実
行時に認識不能(音声を登録した環境と、認識のために
音声を入力した環境が違う等による)であった場合、オ
ペレータに理由情報を通知することが可能である。この
ため、再試行時の認識精度が改善され、さらに操作性、
信頼性を大幅に向上させることが可能になる。例えば、
登録時に前記音声変換手段が音声を変換する際に特徴抽
出に失敗した場合、前記音声変換手段から音声登録に失
敗した理由情報が出力されてオペレータに通知される。
このため、例えば声が大きすぎる場合は小さい声で、声
が小さ過ぎる場合は大きい声で、騒音がひどい場合は静
かな場所で登録をし直せば、音声データが正しく登録さ
れるようになり、認識精度も大幅に向上する。
【0128】なお、上記実施形態では、ファクシミリ装
置に本発明を適用し、登録される宛先として電話番号を
例に挙げて説明した。しかしながら、本発明はこれに限
られるものではなく、例えば、インターネットアドレス
を宛先として音声に対応付けることも出来る。このよう
にすれば、宛先略称を音声入力するだけで、例えばイン
ターネットのURLを獲得でき、煩雑キー入力を行なわ
ずにすむので、操作性が著しく向上する。すなわち、本
発明はファクシミリ装置(電話機)や、LANに接続さ
れた、或いはモデムを介して回線に接続されたコンピュ
ータ等、通信網における相手先のアドレスを指定して通
信を行なう装置(これらを通信装置と称する)にも適用
可能であることは明らかである。
【0129】なお、本発明は、複数の機器(例えばホス
トコンピュータ,インタフェイス機器,リーダ,プリン
タなど)から構成されるシステムに適用しても、一つの
機器からなる装置(例えば、複写機,ファクシミリ装置
など)に適用してもよい。
【0130】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0131】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0132】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
【0133】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0134】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0135】以上説明したように、本実施形態によれ
ば、音声認識実行時の認識不能(音声を登録した環境
と、認識のために音声を入力した環境が違う等による)
発生時、オペレータにその理由を(例えば理由コードに
より)通知することによって、再試行時の認識精度を改
善し、さらに操作性、信頼性を大幅に向上させることが
可能になる。
【0136】また、上記実施形態によれば、音声認識の
ための音声データを登録するにおいて、入力された音声
を変換する際に特徴抽出に失敗した場合、オペレータに
その理由が通知される。このため、例えば声が大きすぎ
る場合は小さい声で、声が小さ過ぎる場合は大きい声
で、騒音がひどい場合は静かな場所で登録をし直せば、
音声データが正しく登録されるようになり、認識精度も
大幅に向上する。
【0137】
【発明の効果】以上説明したように本発明によれば、入
力された音声に対する音声認識に失敗した場合に、その
理由をオペレータに通知可能となる。また、音声認識用
の音声データを入力された音声に基づいて登録するに際
して、その登録処理に失敗した場合、その理由をオペレ
ータに通知可能となる。
【0138】
【図面の簡単な説明】
【図1】実施形態によるファクシミリ装置のシステムブ
ロック図である。
【図2】本実施形態のファクシミリ装置におけるタスク
構成を示すブロック図である。
【図3】本実施形態のファクシミリ装置の概観を示し、
特に操作パネル(図1の1-1-22)の構成を示す図であ
る。
【図4】本実施形態による電話帳機能、音声登録及び音
声認識に関わる制御の概要を説明する図である。
【図5】本実施形態による電話帳データ及び音声登録メ
モリのデータ構成例を説明する図である。
【図6】オペレートタスクから音声認識タスクへ発行さ
れる音声認識スタートコマンドの種類と内容を説明する
図である。
【図7】音声認識タスクからオペレートタスクへ発行さ
れる音声認識結果コマンドの種類と内容を説明する図で
ある。
【図8】本実施形態による理由コードの一例を示す図で
ある。
【図9】本実施形態による個人別電話帳の作成処理操作
における表示内容を説明する図である。
【図10】本実施形態による個人別電話帳の登録処理手
順を表すフローチャートである。
【図11】電話帳へのデータ登録における画面表示例を
示す図である。
【図12】電話帳への音声データ登録における画面表示
例を示す図である。
【図13】電話帳への音声データ登録における画面表示
例を示す図である。
【図14】電話帳へのデータ登録処理を説明するフロー
チャートである。
【図15】電話帳への音声データ登録処理を説明するフ
ローチャートである。
【図16】本実施形態における電話帳データの登録内容
の修正操作を説明する図である。
【図17】本実施形態における電話帳データの登録内容
の削除操作を説明する図である。
【図18】音声データの削除手順を説明する図である。
【図19】電話帳検索時の操作に応じた画面表示例を示
す図である。
【図20】音声認識による電話帳検索時の画面表示例を
示す図である。
【図21】音声認識による電話帳検索時の画面表示例を
示す図である。
【図22】音声認識による電話帳検索の処理手順を説明
するフローチャートである。
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 1/32 H04N 1/32 Z (72)発明者 松崎 進 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 中尾 宗樹 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 菅原 尚樹 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 外山 猛 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 Fターム(参考) 5C075 BA08 CD02 CD13 CD18 5D015 LL03 LL05 5K027 BB02 FF22 HH20 HH21 HH23 5K036 AA15 BB01 DD17 DD32 FF06 JJ10 JJ13 KK09

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 複数の入力音声に対応する音声認識のた
    めの音声データを記憶する音声データ記憶手段と、 前記音声データ記憶手段に記憶された音声データと入力
    音声とを照合することにより音声認識を行なう音声認識
    手段と、 前記音声認識手段による入力音声の認識の成否を判定す
    る第1判定手段と、 前記判定手段で音声認識による入力音声の認識に失敗し
    たと判定された場合、その理由情報を取得して通知する
    第1通知手段と を備えることを特徴とする音声認識装置。
  2. 【請求項2】 入力された音声に基づいて、前記音声デ
    ータ記憶手段に音声認識のための音声データを登録する
    登録手段と、 前記登録手段において、前記入力された音声から前記音
    声認識のための音声データを登録することに失敗したか
    否かを判定する第2判定手段と、 場合、その理由情報を取得して通知する第2通知手段と
    を更に備えることを特徴とする請求項1に記載の音声認
    識装置。
  3. 【請求項3】 前記第1通知手段を動作させるか否かを
    設定する設定手段を更に備えることを特徴とする請求項
    1に記載の音声認識装置。
  4. 【請求項4】 前期第2通知手段を動作させるか田舎を
    設定する設定手段を更に備えることを特徴とする請求項
    2に記載の音声認識装置。
  5. 【請求項5】 複数の入力音声に対応する音声認識のた
    めの音声データをメモリに記憶する音声データ記憶工程
    と、 前記メモリに記憶された音声データと入力音声とを照合
    することにより音声認識を行なう音声認識工程と、 前記音声認識工程による入力音声の認識の成否を判定す
    る第1判定工程と、 前記判定工程で音声認識による入力音声の認識に失敗し
    たと判定された場合、その理由情報を取得して通知する
    第1通知工程とを備えることを特徴とする音声認識方
    法。
  6. 【請求項6】 入力された音声に基づいて、メモリに音
    声認識のための音声データを登録する登録工程と、 前記登録工程において、前記入力された音声から前記音
    声認識のための音声データを登録することに失敗したか
    否かを判定する第2判定工程と、 場合、その理由情報を取得して通知する第2通知工程と
    を更に備えることを特徴とする請求項5に記載の音声認
    識方法。
  7. 【請求項7】 前記第1通知工程を動作させるか否かを
    設定する設定工程を更に備えることを特徴とする請求項
    1に記載の音声認識方法。
  8. 【請求項8】 前記第2通知工程を動作させるか田舎を
    設定する設定工程を更に備えることを特徴とする請求項
    7に記載の音声認識方法。
  9. 【請求項9】 回線に接続して遠隔装置との通信を行な
    う通信装置であって、 宛先と前記回線上のアドレスとを対にした宛先情報と、
    該宛先を表す入力音声に対応した音声認識のための音声
    データを登録する登録手段と、 前記登録手段に登録された音声データと入力音声とを照
    合することにより音声認識を行なう音声認識手段と、 前記音声認識手段による認識の成否を判定する第1判定
    手段と、 前記第1判定手段により音声認識が成功したと判定され
    た場合、前記音声認識手段による認識結果に基づいて宛
    先情報を特定し、対応するアドレスを得る検索手段と、 前記第1判定手段により音声認識が失敗したと判定され
    た場合、その理由情報を取得して通知する第1通知手段
    とを備えることを特徴とする通信装置。
  10. 【請求項10】 前記第1通知手段は、取得した理由情
    報に基づく表示を行なうことを特徴とする請求項9に記
    載の通信装置。
  11. 【請求項11】 前記登録手段は、入力された音声に基
    づいて音声認識のための音声データの登録を行ない、 前記登録手段において、前記入力された音声に基づいて
    前記音声認識のための音声データを登録することに失敗
    したか否かを判定する第2判定手段と、 前記第2判定手段で音声データの登録に失敗したと判定
    された場合、その理由情報を取得して通知する第2通知
    手段とを更に備えることを特徴とする請求項9に記載の
    通信装置。
  12. 【請求項12】 前記第2通知手段は、取得した理由情
    報に基づく表示を行なうことを特徴とする請求項11に
    記載の通信装置。
  13. 【請求項13】 回線に接続して遠隔装置との通信を行
    なう通信装置の制御方法であって、 宛先と前記回線上のアドレスとを対にした宛先情報と、
    該宛先を表す入力音声に対応した音声認識のための音声
    データをメモリに登録する登録工程と、 前記メモリに記憶された音声データと入力音声とを照合
    することにより音声認識を行なう音声認識工程と、 前記音声認識工程による認識の成否を判定する第1判定
    工程と、 前記第1判定工程により音声認識が成功したと判定され
    た場合、前記音声認識工程による認識結果に基づいて宛
    先情報を特定し、対応するアドレスを得る検索工程と、 前記第1判定工程により音声認識が失敗したと判定され
    た場合、その理由情報を取得して通知する第1通知工程
    とを備えることを特徴とする通信装置の制御方法。
  14. 【請求項14】 前記第1通知工程は、取得した理由情
    報に基づく表示を行なうことを特徴とする請求項13に
    記載の通信装置の制御方法。
  15. 【請求項15】 前記登録工程は、入力された音声に基
    づいて音声認識のための音声データの登録を行ない、 前記登録工程において、前記入力された音声に基づいて
    前記音声認識のための音声データを登録することに失敗
    したか否かを判定する第2判定工程と、 前記第2判定工程で音声データの登録に失敗したと判定
    された場合、その理由情報を取得して通知する第2通知
    工程とを更に備えることを特徴とする請求項13に記載
    の通信装置の制御方法。
  16. 【請求項16】 前記第2通知工程は、取得した理由情
    報に基づく表示を行なうことを特徴とする請求項15に
    記載の通信装置の制御方法。
  17. 【請求項17】 コンピュータに、複数の入力音声に対
    応する音声データを記憶した音声データメモリを用いた
    音声認識を行なわせるための制御プログラムを格納する
    記憶媒体であって、該制御プログラムが、 複数の入力音声に対応する音声認識のための音声データ
    をメモリに記憶する音声データ記憶工程のコードと、 前記メモリに記憶された音声データと入力音声とを照合
    することにより音声認識を行なう音声認識工程のコード
    と、 前記音声認識工程による入力音声の認識の成否を判定す
    る第1判定工程のコードと、 前記判定工程で音声認識による入力音声の認識に失敗し
    たと判定された場合、その理由情報を取得して通知する
    第1通知工程のコードとを備えることを特徴とする記憶
    媒体。
  18. 【請求項18】 コンピュータに、回線に接続して遠隔
    装置との通信を行なう通信装置を制御させるための制御
    プログラムを格納する記憶媒体であって、該制御プログ
    ラムが、 宛先と前記回線上のアドレスとを対にした宛先情報と、
    該宛先を表す入力音声に対応した音声認識のための音声
    データをメモリに登録する登録工程のコードと、 前記メモリに記憶された音声データと入力音声とを照合
    することにより音声認識を行なう音声認識工程のコード
    と、 前記音声認識工程による認識の成否を判定する第1判定
    工程のコードと、 前記第1判定工程により音声認識が成功したと判定され
    た場合、前記音声認識工程による認識結果に基づいて宛
    先情報を特定し、対応するアドレスを得る検索工程のコ
    ードと、 前記第1判定工程により音声認識が失敗したと判定され
    た場合、その理由情報を取得して通知する第1通知工程
    のコードとを備えることを特徴とする記憶媒体。
JP10281654A 1998-10-02 1998-10-02 音声認識方法及び装置と通信装置及びその制御方法 Withdrawn JP2000112497A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10281654A JP2000112497A (ja) 1998-10-02 1998-10-02 音声認識方法及び装置と通信装置及びその制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10281654A JP2000112497A (ja) 1998-10-02 1998-10-02 音声認識方法及び装置と通信装置及びその制御方法

Publications (1)

Publication Number Publication Date
JP2000112497A true JP2000112497A (ja) 2000-04-21

Family

ID=17642124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10281654A Withdrawn JP2000112497A (ja) 1998-10-02 1998-10-02 音声認識方法及び装置と通信装置及びその制御方法

Country Status (1)

Country Link
JP (1) JP2000112497A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8650036B2 (en) 2011-12-30 2014-02-11 Samsung Electronics Co., Ltd. Electronic apparatus and method of controlling electronic apparatus
CN106356062A (zh) * 2015-07-17 2017-01-25 深圳前海智云谷科技有限公司 机器智能识别与人工服务相结合的语音识别方法及系统
US9972342B2 (en) 2015-11-20 2018-05-15 JVC Kenwood Corporation Terminal device and communication method for communication of speech signals

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8650036B2 (en) 2011-12-30 2014-02-11 Samsung Electronics Co., Ltd. Electronic apparatus and method of controlling electronic apparatus
US9148688B2 (en) 2011-12-30 2015-09-29 Samsung Electronics Co., Ltd. Electronic apparatus and method of controlling electronic apparatus
CN106356062A (zh) * 2015-07-17 2017-01-25 深圳前海智云谷科技有限公司 机器智能识别与人工服务相结合的语音识别方法及系统
US9972342B2 (en) 2015-11-20 2018-05-15 JVC Kenwood Corporation Terminal device and communication method for communication of speech signals

Similar Documents

Publication Publication Date Title
JP2000196787A (ja) 通信システムおよびファクシミリ装置
JPH04211565A (ja) 画像蓄積機能付きファクシミリ装置
JP2000112497A (ja) 音声認識方法及び装置と通信装置及びその制御方法
US6785366B1 (en) Apparatus for making outgoing call
JP2002202791A (ja) 通信装置、制御方法および記憶媒体
JP2000112493A (ja) 音声認識装置及び通信装置とそれらの制御方法
JP2000112492A (ja) 音声認識方法及び装置と通信装置及びその制御方法
JP2000112495A (ja) 音声認識方法及び装置と通信装置及びその制御方法
JP2003195885A (ja) 通信装置およびその制御方法
JP2000115325A (ja) 通信装置、方法および記憶媒体
JP2002073083A (ja) 音声認識装置、音声認識方法、通信装置、通信制御方法および記憶媒体
JP2000115327A (ja) 通信装置、方法および記憶媒体
JP2000115335A (ja) 通信装置、登録データ管理方法および記憶媒体
JP2000253171A (ja) 通信装置、方法および記憶媒体
JP3700583B2 (ja) 据置型電話機および記憶媒体
JP3057170B2 (ja) ファクシミリ装置、電話機及びその発信方法と電話番号認識方法
JP2000115328A (ja) 通信装置、方法および記憶媒体
JP2000115347A (ja) 通信装置、方法および記憶媒体
JP2000115326A (ja) 通信装置、方法および記憶媒体
JP2000115337A (ja) 通信装置、登録データ管理方法および記憶媒体
JPH06266636A (ja) 通信記憶インタフェース装置
JP3941117B2 (ja) 通信装置
JP2000115338A (ja) 通信装置、登録データ管理方法および記憶媒体
JP2000115336A (ja) 通信装置、登録データ管理方法および記憶媒体
JP3244899B2 (ja) 通信装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060110