JP2002073083A - 音声認識装置、音声認識方法、通信装置、通信制御方法および記憶媒体 - Google Patents
音声認識装置、音声認識方法、通信装置、通信制御方法および記憶媒体Info
- Publication number
- JP2002073083A JP2002073083A JP2000260794A JP2000260794A JP2002073083A JP 2002073083 A JP2002073083 A JP 2002073083A JP 2000260794 A JP2000260794 A JP 2000260794A JP 2000260794 A JP2000260794 A JP 2000260794A JP 2002073083 A JP2002073083 A JP 2002073083A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- input
- data
- recognition
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
- Facsimile Transmission Control (AREA)
Abstract
(57)【要約】
【課題】 ダイヤル時にユーザが選択した音声入力装置
から容易に音声認識ダイヤル操作を行うことができる音
声認識装置を提供する。 【解決手段】 音声認識キー72により電話帳検索処理
を開始すると、初期化処理後、ガイダンス表示を行うと
ともに、ガイドトーン(ピー音)を出力する(S61
A)。その直後、ハンドセット6がオフフック状態かオ
ンフック状態かを判断する(S61B)。オフフック状
態である場合、音声入力をハンドセット6に切り替える
(S61C)。一方、オンフック状態である場合、音声
入力をマイク7に切り替える(S61D)。ユーザに発
声開始可能状態を報知する画面の表示を行い、ユーザが
音声入力するのを待つ。ユーザによる音声の入力を検知
すると、音声認識動作を行う。
から容易に音声認識ダイヤル操作を行うことができる音
声認識装置を提供する。 【解決手段】 音声認識キー72により電話帳検索処理
を開始すると、初期化処理後、ガイダンス表示を行うと
ともに、ガイドトーン(ピー音)を出力する(S61
A)。その直後、ハンドセット6がオフフック状態かオ
ンフック状態かを判断する(S61B)。オフフック状
態である場合、音声入力をハンドセット6に切り替える
(S61C)。一方、オンフック状態である場合、音声
入力をマイク7に切り替える(S61D)。ユーザに発
声開始可能状態を報知する画面の表示を行い、ユーザが
音声入力するのを待つ。ユーザによる音声の入力を検知
すると、音声認識動作を行う。
Description
【0001】
【発明の属する技術分野】本発明は、音声認識装置、音
声認識方法、通信装置、通信制御方法および記憶媒体に
関する。
声認識方法、通信装置、通信制御方法および記憶媒体に
関する。
【0002】
【従来の技術】従来、電話機や携帯電話において、宛先
を簡便にダイヤルするために、複数の宛先の番号をメモ
リに登録しておく機能が知られている。また、宛先の略
称や番号を登録しておき、それらを表示しながらその中
から目的の宛先を選択する電話帳機能も搭載され、実用
化されている。
を簡便にダイヤルするために、複数の宛先の番号をメモ
リに登録しておく機能が知られている。また、宛先の略
称や番号を登録しておき、それらを表示しながらその中
から目的の宛先を選択する電話帳機能も搭載され、実用
化されている。
【0003】さらに、利便性向上のために、音声認識機
能を搭載し、宛先のダイヤル番号を認識させることも提
案されている。音声認識による宛先選択では、音声認識
によって登録された音声データの中から合致するものを
検索して照合することにより、合致した音声データに対
応する宛先ダイヤルを選択することが提案されている。
能を搭載し、宛先のダイヤル番号を認識させることも提
案されている。音声認識による宛先選択では、音声認識
によって登録された音声データの中から合致するものを
検索して照合することにより、合致した音声データに対
応する宛先ダイヤルを選択することが提案されている。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
音声認識に用いられる音声入力装置は、ファクシミリ装
置などの通信装置に接続されている受話器に固定されて
おり、例えばハンズフリーモードで電話をかけたい場
合、一旦、受話器を使用して音声認識ダイヤルを行い、
先方に接続された後、ハンズフリーキーを押下してハン
ズフリーモードにした後、受話器を戻し、ハンズフリー
モードで通話を行う必要があり、手間がかかっていた。
また、従来、受話器の使用に障害がある人にとっては、
受話器で音声認識を行うことができず、使用できないと
いう不具合が生じていた。
音声認識に用いられる音声入力装置は、ファクシミリ装
置などの通信装置に接続されている受話器に固定されて
おり、例えばハンズフリーモードで電話をかけたい場
合、一旦、受話器を使用して音声認識ダイヤルを行い、
先方に接続された後、ハンズフリーキーを押下してハン
ズフリーモードにした後、受話器を戻し、ハンズフリー
モードで通話を行う必要があり、手間がかかっていた。
また、従来、受話器の使用に障害がある人にとっては、
受話器で音声認識を行うことができず、使用できないと
いう不具合が生じていた。
【0005】一方、移動体電話の発展に伴い、安全上の
問題から自動車等で音声認識ダイヤルの重要性が高まっ
ている。携帯電話の内蔵マイクのみならず携帯電話に接
続されたハンズフリーマイク装置からの音声認識ダイヤ
ルを容易に使用する操作方法が求められている。
問題から自動車等で音声認識ダイヤルの重要性が高まっ
ている。携帯電話の内蔵マイクのみならず携帯電話に接
続されたハンズフリーマイク装置からの音声認識ダイヤ
ルを容易に使用する操作方法が求められている。
【0006】そこで、本発明は、ダイヤル時にユーザが
選択した音声入力装置から容易に音声認識ダイヤル操作
を行うことができる音声認識装置、音声認識方法、通信
装置、通信制御方法および記憶媒体を提供することを目
的とする。
選択した音声入力装置から容易に音声認識ダイヤル操作
を行うことができる音声認識装置、音声認識方法、通信
装置、通信制御方法および記憶媒体を提供することを目
的とする。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、本発明の請求項1に記載の音声認識装置は、複数の
音声データを複数の名称情報と関連付けて記憶する音声
データ記憶手段と、該記憶された音声データと入力音声
とを照合することにより、音声認識を行う音声認識手段
と、複数の音声入力装置の中から音声入力を行う経路を
選択する入力経路選択手段と、ユーザによって音声入力
が行われる音声入力装置を検出する音声入力装置検出手
段とを備え、前記入力経路選択手段は、前記検出結果に
応じて前記音声入力を行う経路を選択することを特徴と
する。
に、本発明の請求項1に記載の音声認識装置は、複数の
音声データを複数の名称情報と関連付けて記憶する音声
データ記憶手段と、該記憶された音声データと入力音声
とを照合することにより、音声認識を行う音声認識手段
と、複数の音声入力装置の中から音声入力を行う経路を
選択する入力経路選択手段と、ユーザによって音声入力
が行われる音声入力装置を検出する音声入力装置検出手
段とを備え、前記入力経路選択手段は、前記検出結果に
応じて前記音声入力を行う経路を選択することを特徴と
する。
【0008】また、通信装置に適用され、前記複数の音
声入力装置は、前記通信装置に接続された受話器、およ
び前記通信装置の内蔵マイクの2つを含み、前記音声入
力装置検出手段は前記受話器のフックセンサであり、該
フックセンサは、前記受話器が持ち上げられている状態
では前記受話器を前記音声入力装置として検出し、前記
フックセンサは、前記受話器が持ち上げられていない状
態では前記内蔵マイクを前記音声入力装置として検出
し、音声認識開始操作にしたがって、前記検出された音
声入力装置を用いて音声認識を行うことを特徴とする。
声入力装置は、前記通信装置に接続された受話器、およ
び前記通信装置の内蔵マイクの2つを含み、前記音声入
力装置検出手段は前記受話器のフックセンサであり、該
フックセンサは、前記受話器が持ち上げられている状態
では前記受話器を前記音声入力装置として検出し、前記
フックセンサは、前記受話器が持ち上げられていない状
態では前記内蔵マイクを前記音声入力装置として検出
し、音声認識開始操作にしたがって、前記検出された音
声入力装置を用いて音声認識を行うことを特徴とする。
【0009】さらに、前記音声認識開始操作後、ユーザ
に音声入力を促す通知を所定時間行い、該通知を所定時
間行った後、前記音声入力装置検出手段により前記ユー
ザによって音声入力が行われる音声入力装置を検出し、
前記入力経路選択手段は、前記音声入力を行う経路を選
択する経路選択スイッチを有し、前記検出結果に応じ
て、前記経路選択スイッチを切り替えてから前記音声認
識を開始することを特徴とする。
に音声入力を促す通知を所定時間行い、該通知を所定時
間行った後、前記音声入力装置検出手段により前記ユー
ザによって音声入力が行われる音声入力装置を検出し、
前記入力経路選択手段は、前記音声入力を行う経路を選
択する経路選択スイッチを有し、前記検出結果に応じ
て、前記経路選択スイッチを切り替えてから前記音声認
識を開始することを特徴とする。
【0010】また、前記経路選択スイッチを切り替えて
から前記音声認識を開始した後、前記音声入力装置検出
手段により検出される前記音声入力装置が変化した場
合、前記経路選択スイッチを新たな経路に切り替えて音
声認識をやり直すことを特徴とする。
から前記音声認識を開始した後、前記音声入力装置検出
手段により検出される前記音声入力装置が変化した場
合、前記経路選択スイッチを新たな経路に切り替えて音
声認識をやり直すことを特徴とする。
【0011】請求項5に記載の音声認識方法は、複数の
音声データを複数の名称情報と関連付けて記憶する工程
と、該記憶された音声データと入力音声とを照合するこ
とにより、音声認識を行う工程と、ユーザによって音声
入力が行われる音声入力装置を複数の音声入力装置の中
から検出する工程と、該検出結果に応じて、前記音声入
力を行う経路を選択する工程とを有することを特徴とす
る。
音声データを複数の名称情報と関連付けて記憶する工程
と、該記憶された音声データと入力音声とを照合するこ
とにより、音声認識を行う工程と、ユーザによって音声
入力が行われる音声入力装置を複数の音声入力装置の中
から検出する工程と、該検出結果に応じて、前記音声入
力を行う経路を選択する工程とを有することを特徴とす
る。
【0012】請求項6に記載の通信装置は、音声認識が
行われた宛先情報にしたがって、通信を行う通信装置に
おいて、複数の音声データを複数の宛先情報と関連付け
て記憶する音声データ記憶手段と、該記憶された音声デ
ータと入力音声とを照合することにより、前記音声認識
を行う音声認識手段と、複数の音声入力装置の中から音
声入力を行う経路を選択する入力経路選択手段と、ユー
ザによって音声入力が行われる音声入力装置を検出する
音声入力装置検出手段とを備え、前記入力経路選択手段
は、前記検出結果に応じて前記音声入力を行う経路を選
択することを特徴とする。
行われた宛先情報にしたがって、通信を行う通信装置に
おいて、複数の音声データを複数の宛先情報と関連付け
て記憶する音声データ記憶手段と、該記憶された音声デ
ータと入力音声とを照合することにより、前記音声認識
を行う音声認識手段と、複数の音声入力装置の中から音
声入力を行う経路を選択する入力経路選択手段と、ユー
ザによって音声入力が行われる音声入力装置を検出する
音声入力装置検出手段とを備え、前記入力経路選択手段
は、前記検出結果に応じて前記音声入力を行う経路を選
択することを特徴とする。
【0013】請求項7に記載の通信制御方法は、音声認
識が行われた宛先情報にしたがって、通信を行う通信制
御方法において、複数の音声データを複数の宛先情報と
関連付けて記憶する工程と、該記憶された音声データと
入力音声とを照合することにより、前記音声認識を行う
工程と、ユーザによって音声入力が行われる音声入力装
置を複数の音声入力装置の中から検出する工程と、該検
出結果に応じて、前記音声入力を行う経路を選択する工
程とを有することを特徴とする。
識が行われた宛先情報にしたがって、通信を行う通信制
御方法において、複数の音声データを複数の宛先情報と
関連付けて記憶する工程と、該記憶された音声データと
入力音声とを照合することにより、前記音声認識を行う
工程と、ユーザによって音声入力が行われる音声入力装
置を複数の音声入力装置の中から検出する工程と、該検
出結果に応じて、前記音声入力を行う経路を選択する工
程とを有することを特徴とする。
【0014】請求項8に記載の記憶媒体は、音声認識が
行われた宛先情報にしたがって通信を行う通信装置を制
御するコンピュータによって実行され、前記音声認識を
行うためのプログラムが格納された記憶媒体において、
前記プログラムは、複数の音声データを複数の宛先情報
と関連付けて記憶する手順と、該記憶された音声データ
と入力音声とを照合することにより、前記音声認識を行
う手順と、ユーザによって音声入力が行われる音声入力
装置を複数の音声入力装置の中から検出する手順と、該
検出結果に応じて、前記音声入力を行う経路を選択する
手順とを含むことを特徴とする。
行われた宛先情報にしたがって通信を行う通信装置を制
御するコンピュータによって実行され、前記音声認識を
行うためのプログラムが格納された記憶媒体において、
前記プログラムは、複数の音声データを複数の宛先情報
と関連付けて記憶する手順と、該記憶された音声データ
と入力音声とを照合することにより、前記音声認識を行
う手順と、ユーザによって音声入力が行われる音声入力
装置を複数の音声入力装置の中から検出する手順と、該
検出結果に応じて、前記音声入力を行う経路を選択する
手順とを含むことを特徴とする。
【0015】
【発明の実施の形態】本発明の音声認識装置、音声認識
方法、通信装置、通信制御方法および記憶媒体の実施の
形態を図面を参照しながら説明する。本実施形態の通信
装置は、アナログ小電力方式のコードレス電話機機能を
搭載し、ITU勧告のG3規格の機能を有するファクシ
ミリ装置に適用した場合を示す。
方法、通信装置、通信制御方法および記憶媒体の実施の
形態を図面を参照しながら説明する。本実施形態の通信
装置は、アナログ小電力方式のコードレス電話機機能を
搭載し、ITU勧告のG3規格の機能を有するファクシ
ミリ装置に適用した場合を示す。
【0016】本実施形態のファクシミリ装置は、カラー
読取部およびカラー記録部を備え、カラーコピー機能や
カラー画像の通信機能を有する。さらに、本実施形態の
ファクシミリ装置は、ファクシミリや通話の目的で記憶
されている宛先略称を選択し、対応する宛先番号に自動
宛先ダイヤルを行う電話帳機能を有する。特に、その電
話帳機能を利用し、音声認識部により音声を認識して得
られた認識結果に基づき、自動宛先ダイヤルを行う機能
も有する。
読取部およびカラー記録部を備え、カラーコピー機能や
カラー画像の通信機能を有する。さらに、本実施形態の
ファクシミリ装置は、ファクシミリや通話の目的で記憶
されている宛先略称を選択し、対応する宛先番号に自動
宛先ダイヤルを行う電話帳機能を有する。特に、その電
話帳機能を利用し、音声認識部により音声を認識して得
られた認識結果に基づき、自動宛先ダイヤルを行う機能
も有する。
【0017】また、カラー読取部は、本体から着脱自在
なハンドスキャナユニットで構成されており、シート状
の原稿読み取りはもとよりブック原稿なども読み取るこ
とが可能である。スキャナの読み取りセンサは、線順次
でRGB各色を出力する密着型のカラーセンサであり、
読み取り幅はB4幅、読み取り解像度は200dpiで
ある。
なハンドスキャナユニットで構成されており、シート状
の原稿読み取りはもとよりブック原稿なども読み取るこ
とが可能である。スキャナの読み取りセンサは、線順次
でRGB各色を出力する密着型のカラーセンサであり、
読み取り幅はB4幅、読み取り解像度は200dpiで
ある。
【0018】また、カラー記録部はインク吐出方式によ
って記録を行うものであり、CMYK各色のインクタン
クとインク吐出部とが一体となったカラーカートリッジ
と、黒インクのみのインクタンクおよびインク吐出部が
一体となったモノクロカートリッジのいずれか一方を装
着することにより、360dpiの記録解像度で記録紙
に2値データを記録する。いずれのカートリッジを装着
してもモノクロ記録時の記録幅は最大B4幅であるが、
カラーカートリッジを装着した場合のカラー記録時に
は、その記録幅が最大A4幅となる。
って記録を行うものであり、CMYK各色のインクタン
クとインク吐出部とが一体となったカラーカートリッジ
と、黒インクのみのインクタンクおよびインク吐出部が
一体となったモノクロカートリッジのいずれか一方を装
着することにより、360dpiの記録解像度で記録紙
に2値データを記録する。いずれのカートリッジを装着
してもモノクロ記録時の記録幅は最大B4幅であるが、
カラーカートリッジを装着した場合のカラー記録時に
は、その記録幅が最大A4幅となる。
【0019】通信時には、G3モードで最高9600b
ppsのモデム速度を有し、画像伝送の誤り再送機能で
あるECMモードを具備する。以下、本実施形態のファ
クシミリ装置の構成および動作を示す。
ppsのモデム速度を有し、画像伝送の誤り再送機能で
あるECMモードを具備する。以下、本実施形態のファ
クシミリ装置の構成および動作を示す。
【0020】図1は実施の形態におけるファクシミリ装
置の構成を示すブロック図である。図において、1は制
御部であるCPUである。21はプログラムや各種固定
データを格納するROMである。18は各種プログラム
のワークメモリであり、留守録などの音声データおよび
モノクロ画像・カラー画像データ用の蓄積メモリとして
使用されるDRAMである。
置の構成を示すブロック図である。図において、1は制
御部であるCPUである。21はプログラムや各種固定
データを格納するROMである。18は各種プログラム
のワークメモリであり、留守録などの音声データおよび
モノクロ画像・カラー画像データ用の蓄積メモリとして
使用されるDRAMである。
【0021】DRAM18の容量は全体で2MBであ
り、そのうちの0.5MB分はワークメモリとして使用
され、残りの1.5MB分は画像データ(送受信デー
タ)の蓄積と音声データの蓄積のために使用される。2
4はシステムに必要な登録データ(各種ソフトスイッ
チ、電話帳データ、音声認識のための音声登録データ、
装置の電話番号、略称などの装置用IDデータ)を登録
・記憶するSRAMであり、電源断によりデータが失わ
れないように電池でバックアップされている。
り、そのうちの0.5MB分はワークメモリとして使用
され、残りの1.5MB分は画像データ(送受信デー
タ)の蓄積と音声データの蓄積のために使用される。2
4はシステムに必要な登録データ(各種ソフトスイッ
チ、電話帳データ、音声認識のための音声登録データ、
装置の電話番号、略称などの装置用IDデータ)を登録
・記憶するSRAMであり、電源断によりデータが失わ
れないように電池でバックアップされている。
【0022】12はITU勧告G3モードに必要な機能
を持つ公知のファクシミリ用モデム(本実施形態では、
V.29、V.21、V27terの他に、DTMF認
識機能、DRAM18への音声録音、DRAM18など
からの音声再生のための音声コーデック機能も具備する
タイプを使用)である。3は子機電話5とアナログ小電
力方式の無線通信を行うベースユニットであり、CPU
1からの指示により無線通信を制御する公知のユニット
である。
を持つ公知のファクシミリ用モデム(本実施形態では、
V.29、V.21、V27terの他に、DTMF認
識機能、DRAM18への音声録音、DRAM18など
からの音声再生のための音声コーデック機能も具備する
タイプを使用)である。3は子機電話5とアナログ小電
力方式の無線通信を行うベースユニットであり、CPU
1からの指示により無線通信を制御する公知のユニット
である。
【0023】4はアナログ信号用接続スイッチ(クロス
ポイントスイッチ)であって、CPU1からの設定によ
りハンドセット6、マイク7、スピーカ8、NCU9、
CPU1の音声入力端子、モデム2およびベースユニッ
ト3間のアナログ信号の接続を自在に切り替える公知の
回路である。
ポイントスイッチ)であって、CPU1からの設定によ
りハンドセット6、マイク7、スピーカ8、NCU9、
CPU1の音声入力端子、モデム2およびベースユニッ
ト3間のアナログ信号の接続を自在に切り替える公知の
回路である。
【0024】6は装置本体の電話機ハンドセットであ
る。7は音声入力用のマイクである。8はスピーカであ
る。9は回線とインタフェースを行うための公知のNC
Uである。10はモノクロ2値生画像データからランレ
ングス符号を生成し、またはランレングス符号を入力し
てモノクロ2値生画像データを出力する公知のランレン
グス回路である。
る。7は音声入力用のマイクである。8はスピーカであ
る。9は回線とインタフェースを行うための公知のNC
Uである。10はモノクロ2値生画像データからランレ
ングス符号を生成し、またはランレングス符号を入力し
てモノクロ2値生画像データを出力する公知のランレン
グス回路である。
【0025】11は公知の時計IC(RTC)である。
また、25はハンドスキャナユニット(HSU)であ
り、画像読み取りのためのカラーコンタクトセンサ12
と原稿上を移動した距離を測定するためのロータリーエ
ンコーダ16が内蔵されている。ロータリーエンコーダ
16は装置本体とカールコードにより着脱自在に接続さ
れる。13はエンコーダ検出部であり、エンコーダ16
の出力信号から移動距離データ(ロータリーエンコーダ
の回転数情報)を生成してCPU1に通知する。
また、25はハンドスキャナユニット(HSU)であ
り、画像読み取りのためのカラーコンタクトセンサ12
と原稿上を移動した距離を測定するためのロータリーエ
ンコーダ16が内蔵されている。ロータリーエンコーダ
16は装置本体とカールコードにより着脱自在に接続さ
れる。13はエンコーダ検出部であり、エンコーダ16
の出力信号から移動距離データ(ロータリーエンコーダ
の回転数情報)を生成してCPU1に通知する。
【0026】14は画像処理部であり、CPU1の指示
により、カラー生画像データをDRAM18に蓄積する
場合、カラーコンタクトセンサ12から出力されたアナ
ログRGB信号(線順次で解像度200dpi)を入力
し、RGB各8ビット(1画素当たり24ビット)の9
0dpiデジタルデータに変換し、得られた変換データ
をDMAコントローラ17に供給する。また、カラーコ
ピーをダイレクトで行う場合、カラーコンタクトセンサ
12から出力されたアナログRGB信号(線順次で解像
度200dpi)を入力して360dpi、2値YMC
Kのデジタルデータに変換し、得られた変換データをD
MAコントローラ17に供給する。
により、カラー生画像データをDRAM18に蓄積する
場合、カラーコンタクトセンサ12から出力されたアナ
ログRGB信号(線順次で解像度200dpi)を入力
し、RGB各8ビット(1画素当たり24ビット)の9
0dpiデジタルデータに変換し、得られた変換データ
をDMAコントローラ17に供給する。また、カラーコ
ピーをダイレクトで行う場合、カラーコンタクトセンサ
12から出力されたアナログRGB信号(線順次で解像
度200dpi)を入力して360dpi、2値YMC
Kのデジタルデータに変換し、得られた変換データをD
MAコントローラ17に供給する。
【0027】DMAコントローラ17は、カラー生画像
データ(90dpi、RGB)をDRAM18に蓄積す
る場合、DRAM18にカラー生画像データを転送し、
カラーコピーをダイレクトで行う場合、記録制御部19
に360dpiの2値YMCKデータを転送する。
データ(90dpi、RGB)をDRAM18に蓄積す
る場合、DRAM18にカラー生画像データを転送し、
カラーコピーをダイレクトで行う場合、記録制御部19
に360dpiの2値YMCKデータを転送する。
【0028】モノクロ生画像データをDRAM18に蓄
積する場合、画像処理部14は、カラーコンタクトセン
サ12から出力されたアナログRGB信号(線順次20
0dpi)を入力して、モノクロ2値の200dpiデ
ジタルデータに変換し、得られた変換データをDMAコ
ントローラ17に供給する。
積する場合、画像処理部14は、カラーコンタクトセン
サ12から出力されたアナログRGB信号(線順次20
0dpi)を入力して、モノクロ2値の200dpiデ
ジタルデータに変換し、得られた変換データをDMAコ
ントローラ17に供給する。
【0029】また、モノクロコピーをダイレクトで行う
場合、カラーコンタクトセンサ12から出力されたアナ
ログRGB信号(線順次200dpi)を入力して、モ
ノクロ2値の360dpiデジタルデータに変換し、D
MAコントローラ17に供給する。
場合、カラーコンタクトセンサ12から出力されたアナ
ログRGB信号(線順次200dpi)を入力して、モ
ノクロ2値の360dpiデジタルデータに変換し、D
MAコントローラ17に供給する。
【0030】DMAコントローラ17は、モノクロ生画
像データをDRAM18に蓄積する場合、DRAM18
にモノクロ2値画像データを転送し、モノクロコピーを
ダイレクトで行う場合、記録制御部19にモノクロ2値
画像データを転送する。さらに、上記動作について補足
する。
像データをDRAM18に蓄積する場合、DRAM18
にモノクロ2値画像データを転送し、モノクロコピーを
ダイレクトで行う場合、記録制御部19にモノクロ2値
画像データを転送する。さらに、上記動作について補足
する。
【0031】(1)本体にスキャナを装着した状態での
コピーはダイレクトモードとなり、読み取りデータをD
RAM18に1ページ分蓄積(以下、ページ蓄積)する
ことなく、シート状原稿を読み取りながら記録部に印字
する。DRAM18へのページ蓄積が不要であるので、
高解像度でもメモリオーバーフローしないという理由か
ら、解像度は記録部20に整合させており、読み取りデ
ータは副走査方向360dpiとなる。また、コピーサ
イズもモノクロ時にB4幅まで、カラー時に記録部20
の仕様でA4幅までとなる。
コピーはダイレクトモードとなり、読み取りデータをD
RAM18に1ページ分蓄積(以下、ページ蓄積)する
ことなく、シート状原稿を読み取りながら記録部に印字
する。DRAM18へのページ蓄積が不要であるので、
高解像度でもメモリオーバーフローしないという理由か
ら、解像度は記録部20に整合させており、読み取りデ
ータは副走査方向360dpiとなる。また、コピーサ
イズもモノクロ時にB4幅まで、カラー時に記録部20
の仕様でA4幅までとなる。
【0032】(2)本体からスキャナを取り出してハン
ドスキャナとしてコピー使用する場合、メモリモードと
なり、読み取りデータは必ずDRAM18にページ蓄積
される。これは、記録部20の印字速度がハンドスキャ
ンを実行する速度に比べて遅いことによるストレスを人
間に与えないようにするための処置であり、一旦、DR
AM18にページ蓄積することによって、ハンドスキャ
ンを高速で実行終了できるように構成されている。
ドスキャナとしてコピー使用する場合、メモリモードと
なり、読み取りデータは必ずDRAM18にページ蓄積
される。これは、記録部20の印字速度がハンドスキャ
ンを実行する速度に比べて遅いことによるストレスを人
間に与えないようにするための処置であり、一旦、DR
AM18にページ蓄積することによって、ハンドスキャ
ンを高速で実行終了できるように構成されている。
【0033】また、読み取り解像度を記録部20に整合
させて360dpiとすると、1ページのデータ容量が
大き過ぎてDRAM18を占有してしまい、装置動作に
支障をきたす、あるいはDRAM18の容量を上げる
と、コストがかかる等の理由から、読み取り解像度は、
モノクロ時に200dpi、カラー時に90dpiに抑
えられている。
させて360dpiとすると、1ページのデータ容量が
大き過ぎてDRAM18を占有してしまい、装置動作に
支障をきたす、あるいはDRAM18の容量を上げる
と、コストがかかる等の理由から、読み取り解像度は、
モノクロ時に200dpi、カラー時に90dpiに抑
えられている。
【0034】また、同様の理由から、モノクロ時のコピ
ーサイズはB4幅までであるが、カラー時のコピーサイ
ズはA6(もしくは官製はがきサイズ)以下に制限され
ている。ちなみに、モノクロ200dpiでB4サイズ
1ページ分のデータ容量は約700KB、カラー90d
piでA6サイズの1ページ分のデータ容量は約600
KBとなり、DRAM18に蓄積可能である。
ーサイズはB4幅までであるが、カラー時のコピーサイ
ズはA6(もしくは官製はがきサイズ)以下に制限され
ている。ちなみに、モノクロ200dpiでB4サイズ
1ページ分のデータ容量は約700KB、カラー90d
piでA6サイズの1ページ分のデータ容量は約600
KBとなり、DRAM18に蓄積可能である。
【0035】データを圧縮符号化してDRAM18に蓄
積する場合、サイズ・解像度をもっと上げることは可能
であるが、後述するように、圧縮符号化はソフトウェア
で行うために時間がかかり、ハンドスキャンの実行速度
が下がってしまうというデメリットがある。また、高速
の圧縮符号化のためにハードウェアを追加することも考
えられるが、大幅なコスト増を招く。
積する場合、サイズ・解像度をもっと上げることは可能
であるが、後述するように、圧縮符号化はソフトウェア
で行うために時間がかかり、ハンドスキャンの実行速度
が下がってしまうというデメリットがある。また、高速
の圧縮符号化のためにハードウェアを追加することも考
えられるが、大幅なコスト増を招く。
【0036】(3)本体にスキャナを装着した状態での
原稿送信は、ダイレクトモードとなり、読み取りデータ
をページ蓄積することなく、DRAM18経由でモデム
に転送し、シート状原稿を読み取りながら相手ファクシ
ミリに送信していく。
原稿送信は、ダイレクトモードとなり、読み取りデータ
をページ蓄積することなく、DRAM18経由でモデム
に転送し、シート状原稿を読み取りながら相手ファクシ
ミリに送信していく。
【0037】(4)本体からスキャナを取り出してハン
ドスキャナとして使用し、原稿を送信する場合、メモリ
モードとなり、読み取りデータは必ずDRAM18にペ
ージ蓄積される。これは、人間がストレス無くハンドス
キャンを実行する速度に比べ、モデム12の通信速度が
遅いための処置であり、一旦、DRAM18にページ蓄
積することによって、ハンドスキャンを高速で実行して
終了できるように構成されている。読み取り解像度やサ
イズに関しては、上記項目(2)と同じ理由で同様の仕
様である。
ドスキャナとして使用し、原稿を送信する場合、メモリ
モードとなり、読み取りデータは必ずDRAM18にペ
ージ蓄積される。これは、人間がストレス無くハンドス
キャンを実行する速度に比べ、モデム12の通信速度が
遅いための処置であり、一旦、DRAM18にページ蓄
積することによって、ハンドスキャンを高速で実行して
終了できるように構成されている。読み取り解像度やサ
イズに関しては、上記項目(2)と同じ理由で同様の仕
様である。
【0038】19は記録制御部であり、記録部20が記
録可能なデータ形式に入力データを変換する。20は記
録部であり、インク吐出方式の公知のカラープリンタで
構成され、インクタンクとインク吐出部が一体になって
いるカートリッジを記録紙の主走査方向に移動させなが
ら画像を記録していく。カラーカートリッジとモノクロ
カートリッジのいずれが装着されているかについては、
記録部20とカートリッジの電気的接点の構成により、
CPU1が判別できるようになっている。
録可能なデータ形式に入力データを変換する。20は記
録部であり、インク吐出方式の公知のカラープリンタで
構成され、インクタンクとインク吐出部が一体になって
いるカートリッジを記録紙の主走査方向に移動させなが
ら画像を記録していく。カラーカートリッジとモノクロ
カートリッジのいずれが装着されているかについては、
記録部20とカートリッジの電気的接点の構成により、
CPU1が判別できるようになっている。
【0039】15は解像度変換部であり、モノクロ2値
画像データを入力して解像度変換を行う公知の回路で構
成される。解像度変換部15は、モノクロ画像の拡大・
縮小などのために使用されるとともに、記録部20の解
像度に対して回線から受信したモノクロ画像の解像度を
整合させる用途にも使用される。
画像データを入力して解像度変換を行う公知の回路で構
成される。解像度変換部15は、モノクロ画像の拡大・
縮小などのために使用されるとともに、記録部20の解
像度に対して回線から受信したモノクロ画像の解像度を
整合させる用途にも使用される。
【0040】22は操作パネルであり、本ファクシミリ
装置の各種操作入力および表示出力を行う。操作パネル
22は、後述する図2に示すように、各種キー、表示ラ
ンプおよびLCDディスプレイを有する。また、マイク
7およびスピーカ8が設けられている。
装置の各種操作入力および表示出力を行う。操作パネル
22は、後述する図2に示すように、各種キー、表示ラ
ンプおよびLCDディスプレイを有する。また、マイク
7およびスピーカ8が設けられている。
【0041】26はハンドスキャナ着脱センサであり、
ハンドスキャナユニット25と装置本体との着脱状態を
検出する。ハンドスキャナ着脱センサ26の出力によっ
て、CPU1はシート状原稿を読み取るダイレクトモー
ドであるか、あるいはブック原稿など立体物を読み取る
メモリモードであるかを決定する。
ハンドスキャナユニット25と装置本体との着脱状態を
検出する。ハンドスキャナ着脱センサ26の出力によっ
て、CPU1はシート状原稿を読み取るダイレクトモー
ドであるか、あるいはブック原稿など立体物を読み取る
メモリモードであるかを決定する。
【0042】図2はファクシミリ装置の操作パネルを示
す図である。図において、51は本体用ハンドセットで
ある。52は各種登録や設定のための機能キーである。
53は伝言や通話内容を音声データとしてDRAM18
に録音するときに使用する録音キーである。54はモデ
ム2の音声コーデックによってCPU1がDRAM18
に録音した音声データを再生するときに使用する再生キ
ーである。55はメモリに格納された各種データを消去
する際に使用する消去キーである。
す図である。図において、51は本体用ハンドセットで
ある。52は各種登録や設定のための機能キーである。
53は伝言や通話内容を音声データとしてDRAM18
に録音するときに使用する録音キーである。54はモデ
ム2の音声コーデックによってCPU1がDRAM18
に録音した音声データを再生するときに使用する再生キ
ーである。55はメモリに格納された各種データを消去
する際に使用する消去キーである。
【0043】56は16文字分のキャラクタを2行表示
できるバックライト付きLCDであり、装置の状態や各
種メッセージを出力するために使用される。57はカラ
ーLEDであり、カラー/白黒キー58でカラーモード
が選択されると点灯する。59はモノクロモードでの画
質を選択する画質キーである。
できるバックライト付きLCDであり、装置の状態や各
種メッセージを出力するために使用される。57はカラ
ーLEDであり、カラー/白黒キー58でカラーモード
が選択されると点灯する。59はモノクロモードでの画
質を選択する画質キーである。
【0044】60は電話帳を呼び出すための電話帳キ
ー、登録などの内容を確定させるためのセットキーを兼
用するキーであり、ここでは単にセットキーという。6
1は上カーソルキーである。62は下カーソルキーであ
る。63は左カーソルキーである。64は右カーソルキ
ーである。いずれも表示制御の操作で使用される。
ー、登録などの内容を確定させるためのセットキーを兼
用するキーであり、ここでは単にセットキーという。6
1は上カーソルキーである。62は下カーソルキーであ
る。63は左カーソルキーである。64は右カーソルキ
ーである。いずれも表示制御の操作で使用される。
【0045】65はファクシミリ送信のための送信キー
である。66はファクシミリ受信および受信画像をプリ
ントするための受信/プリントキーである。67はコピ
ーを実行するためのコピーキーである。68は実行中の
装置動作を中断するためのストップキーである。69は
マイク7の開口部である。70はテンキー部である。7
1は回線を接続したままマイク7をアクティブにして回
線上に音声を出力し、また、回線上の音をスピーカ8に
出力する状態にするスピーカホンキーである。
である。66はファクシミリ受信および受信画像をプリ
ントするための受信/プリントキーである。67はコピ
ーを実行するためのコピーキーである。68は実行中の
装置動作を中断するためのストップキーである。69は
マイク7の開口部である。70はテンキー部である。7
1は回線を接続したままマイク7をアクティブにして回
線上に音声を出力し、また、回線上の音をスピーカ8に
出力する状態にするスピーカホンキーである。
【0046】72は音声認識によって宛先自動ダイヤル
を実行するための音声認識キーである。73は着信した
電話の相手通話内容を自動的にDRAM18に録音する
ための留守キーである。74は本体からコードレス子機
電話を呼び出して内線通話を実行するための子機キーで
ある。75は通話状態を保留したまま相手にメロディを
送出する保留キーである。76は前回かけた相手の電話
番号を自動的にダイヤルするためのリダイヤルキーであ
る。77は外線通話中にキャッチホンが入ったとき、キ
ャッチホンの呼に通話を切り替えるため、および切り替
えたキャッチホン通話から元の通話に切り替えるために
使用するキャッチキーである。
を実行するための音声認識キーである。73は着信した
電話の相手通話内容を自動的にDRAM18に録音する
ための留守キーである。74は本体からコードレス子機
電話を呼び出して内線通話を実行するための子機キーで
ある。75は通話状態を保留したまま相手にメロディを
送出する保留キーである。76は前回かけた相手の電話
番号を自動的にダイヤルするためのリダイヤルキーであ
る。77は外線通話中にキャッチホンが入ったとき、キ
ャッチホンの呼に通話を切り替えるため、および切り替
えたキャッチホン通話から元の通話に切り替えるために
使用するキャッチキーである。
【0047】上記構成を有するファクシミリ装置の制御
動作を示す。図3はファクシミリ装置におけるタスク構
成を示す図である。本装置のソフトウェアには、マルチ
タスクOS42によって、各タスクが同時に並行して動
作可能な環境が与えられる。以下、各タスクについて示
す。
動作を示す。図3はファクシミリ装置におけるタスク構
成を示す図である。本装置のソフトウェアには、マルチ
タスクOS42によって、各タスクが同時に並行して動
作可能な環境が与えられる。以下、各タスクについて示
す。
【0048】31は状態監視タスクであり、装置内で発
生する各イベントを監視し、装置の状態を変化させる必
要のあるイベントの発生を検出すると、必要なタスクに
その情報を通知する機能を持つ。例えば、操作パネルか
らのキー情報を検出すると、オペレートタスク32や回
線制御タスク33に必要なキー情報を伝達し、装置の機
能を起動する。
生する各イベントを監視し、装置の状態を変化させる必
要のあるイベントの発生を検出すると、必要なタスクに
その情報を通知する機能を持つ。例えば、操作パネルか
らのキー情報を検出すると、オペレートタスク32や回
線制御タスク33に必要なキー情報を伝達し、装置の機
能を起動する。
【0049】32はオペレートタスクであり、状態監視
タスク31からのキーコードA情報を受けて動作モード
を判定し、必要な機能を実行するタスクにスタートコマ
ンドを発行するとともに、キーコードA情報に基づい
て、操作パネル22上の表示機能を制御する。
タスク31からのキーコードA情報を受けて動作モード
を判定し、必要な機能を実行するタスクにスタートコマ
ンドを発行するとともに、キーコードA情報に基づい
て、操作パネル22上の表示機能を制御する。
【0050】33は回線制御タスクであり、NCUを制
御して回線からの着呼を受け付けたり、オペレートタス
ク32からのダイヤル要求コマンドに応じてダイヤル信
号を送出するために回線を捕捉したり、回線断を実行し
て通信を終了させるシーケンスを実行する。また、回線
接続状態における状態監視タスク31からのキーコード
B情報で送信キーや受信/プリントキーを検出するか、
発信元の相手が電話かファクシミリかを回線上の信号を
分析することによって自動判別し、ファクシミリである
場合、通信タスク35にファクシミリ通信のための通信
スタートコマンドを発行するものである。
御して回線からの着呼を受け付けたり、オペレートタス
ク32からのダイヤル要求コマンドに応じてダイヤル信
号を送出するために回線を捕捉したり、回線断を実行し
て通信を終了させるシーケンスを実行する。また、回線
接続状態における状態監視タスク31からのキーコード
B情報で送信キーや受信/プリントキーを検出するか、
発信元の相手が電話かファクシミリかを回線上の信号を
分析することによって自動判別し、ファクシミリである
場合、通信タスク35にファクシミリ通信のための通信
スタートコマンドを発行するものである。
【0051】34はダイヤル制御タスクであり、回線制
御タスク33あるいは通信タスク35からのダイヤルス
タートコマンドに応じて、各種ダイヤル信号を交換機に
送出する機能を有する。35は通信タスクであり、回線
制御タスク33からの通信スタートコマンドによって各
種ファクシミリ通信(通信手順の実行や画像データ伝
送)を実行する。
御タスク33あるいは通信タスク35からのダイヤルス
タートコマンドに応じて、各種ダイヤル信号を交換機に
送出する機能を有する。35は通信タスクであり、回線
制御タスク33からの通信スタートコマンドによって各
種ファクシミリ通信(通信手順の実行や画像データ伝
送)を実行する。
【0052】36は読取タスクであり、オペレートタス
ク32からの読み取りスタートコマンドに応じて、ハン
ドスキャナユニット25および画像処理部14を制御
し、原稿の読み取りを実行する。37は符号・復号化タ
スクであり、通信タスク35、読取タスク36、記録タ
スク39からの各種符号復号スタートコマンドに応じ
て、画像データの符号化、復号化の処理をソフトウェア
で実行する。
ク32からの読み取りスタートコマンドに応じて、ハン
ドスキャナユニット25および画像処理部14を制御
し、原稿の読み取りを実行する。37は符号・復号化タ
スクであり、通信タスク35、読取タスク36、記録タ
スク39からの各種符号復号スタートコマンドに応じ
て、画像データの符号化、復号化の処理をソフトウェア
で実行する。
【0053】このため、本装置は、符号復号化のための
ハードウェアコストを大きく削減している。但し、ハー
ドウェアでの実施に比べて処理時間はかかる。尚、モノ
クロ画像には、公知のMH符号を適用し、カラー画像に
関しては、RGB多値DPCM方式(RGBの各8ビッ
ト値で隣接画素間の差分値を計算する方式)にハフマン
符号を割り当てた公知の符号化方式を適用する。
ハードウェアコストを大きく削減している。但し、ハー
ドウェアでの実施に比べて処理時間はかかる。尚、モノ
クロ画像には、公知のMH符号を適用し、カラー画像に
関しては、RGB多値DPCM方式(RGBの各8ビッ
ト値で隣接画素間の差分値を計算する方式)にハフマン
符号を割り当てた公知の符号化方式を適用する。
【0054】38は音声認識タスクであり、ハンドセッ
ト6から入力された使用者の発生・音声を分析し、予め
登録されている音声データ(複数可)と比較し、一致す
るものを検出し、通知する公知の音声認識アルゴリズム
を含むソフトウェアである。音声認識タスク38はオペ
レートタスク32からの音声認識スタートコマンドによ
り起動する。また、音声認識タスク38の終了は、音声
認識タスク38自身によるものであり、音声トレーニン
グ(音声登録)および音声認識の結果を音声認識結果コ
マンドとして、オペレートタスク32に返送した後、音
声認識タスク38は終了する。
ト6から入力された使用者の発生・音声を分析し、予め
登録されている音声データ(複数可)と比較し、一致す
るものを検出し、通知する公知の音声認識アルゴリズム
を含むソフトウェアである。音声認識タスク38はオペ
レートタスク32からの音声認識スタートコマンドによ
り起動する。また、音声認識タスク38の終了は、音声
認識タスク38自身によるものであり、音声トレーニン
グ(音声登録)および音声認識の結果を音声認識結果コ
マンドとして、オペレートタスク32に返送した後、音
声認識タスク38は終了する。
【0055】39は記録タスクであり、レポートタスク
40やプリントタスク41からの記録スタートコマンド
に応じて、要求された画像データを記録部20で印字さ
せる機能を有する。40はレポートタスクであり、通信
履歴が記録される通信管理レポート、SRAM24の登
録情報などの機能設定リストをキャラクタデータで作成
し、それを画像データに展開して記録タスク39に記録
・依頼する、各種レポート作成用のソフトウェアであ
る。41はプリントタスクであり、常時、自動的に記録
する必要のある画像データがDRAM18に蓄積されて
いないかをチェックしており、記録する必要のある画像
データを検出すると、記録スタートコマンドを記録タス
クに発行する監視機能を有する。
40やプリントタスク41からの記録スタートコマンド
に応じて、要求された画像データを記録部20で印字さ
せる機能を有する。40はレポートタスクであり、通信
履歴が記録される通信管理レポート、SRAM24の登
録情報などの機能設定リストをキャラクタデータで作成
し、それを画像データに展開して記録タスク39に記録
・依頼する、各種レポート作成用のソフトウェアであ
る。41はプリントタスクであり、常時、自動的に記録
する必要のある画像データがDRAM18に蓄積されて
いないかをチェックしており、記録する必要のある画像
データを検出すると、記録スタートコマンドを記録タス
クに発行する監視機能を有する。
【0056】このような構成を有する本実施形態のファ
クシミリ装置における電話帳機能、音声登録機能および
音声認識機能を示す。図4は電話帳機能、音声登録およ
び音声認識に係わる制御を示す図である。
クシミリ装置における電話帳機能、音声登録機能および
音声認識機能を示す。図4は電話帳機能、音声登録およ
び音声認識に係わる制御を示す図である。
【0057】(1)電話帳機能 相手先略称と相手先電話番号を対応させて電話帳データ
82として登録しておき、所望の相手先略称を検索し、
検索された相手先略称に対応する相手先電話番号でダイ
ヤルを行う。本実施形態では、相手先の検索に際し、
電話帳データに登録された相手先略称を順次(例えば、
あいうえお順)、LCD表示器56に表示することによ
り所望の相手先を選択し、必要な相手先番号を得る方法
と、相手先略称を音声登録(以下の(2)項参照)し
ておき、相手先略称を音声によって入力し、これを音声
認識(以下の(3)項参照)することで得られた相手先
略称で電話帳データを検索し、対応する相手先番号を得
る方法とを用いることができる。
82として登録しておき、所望の相手先略称を検索し、
検索された相手先略称に対応する相手先電話番号でダイ
ヤルを行う。本実施形態では、相手先の検索に際し、
電話帳データに登録された相手先略称を順次(例えば、
あいうえお順)、LCD表示器56に表示することによ
り所望の相手先を選択し、必要な相手先番号を得る方法
と、相手先略称を音声登録(以下の(2)項参照)し
ておき、相手先略称を音声によって入力し、これを音声
認識(以下の(3)項参照)することで得られた相手先
略称で電話帳データを検索し、対応する相手先番号を得
る方法とを用いることができる。
【0058】(2)音声登録 音声認識のための比較分析対象データを、SRAM24
内の音声登録メモリ81に作成する。ハンドセット6、
マイク7から入力された音声を、あるいはNCU9を通
じて回線から、もしくはベースユニット3を通じて子機
5から入力された音声をクロスポイントSW4を通して
音声データとしてCPU1に入力する。
内の音声登録メモリ81に作成する。ハンドセット6、
マイク7から入力された音声を、あるいはNCU9を通
じて回線から、もしくはベースユニット3を通じて子機
5から入力された音声をクロスポイントSW4を通して
音声データとしてCPU1に入力する。
【0059】CPU1では、オペレートタスク32およ
び音声認識タスク38を実行することにより、この音声
データに種々の演算を施し、音声認識のためのデータを
作成し、SRAM24内の音声登録メモリ81に登録す
る。尚、このとき、OK/NGの結果を音声認識結果コ
マンドとして、オペレートタスク32に返送する。ここ
で、オペレートタスク32は、音声認識結果コマンドと
して、「OK」を受け取ると、電話帳データにおける相
手先略称と、その音声認識用データとを対応付ける。こ
の詳細については後述する。
び音声認識タスク38を実行することにより、この音声
データに種々の演算を施し、音声認識のためのデータを
作成し、SRAM24内の音声登録メモリ81に登録す
る。尚、このとき、OK/NGの結果を音声認識結果コ
マンドとして、オペレートタスク32に返送する。ここ
で、オペレートタスク32は、音声認識結果コマンドと
して、「OK」を受け取ると、電話帳データにおける相
手先略称と、その音声認識用データとを対応付ける。こ
の詳細については後述する。
【0060】(3)音声認識 音声認識では、入力された音声に対し、音声登録メモリ
81を参照して認識処理を行い、対応する相手先電話番
号を電話帳データ82から抽出する。音声は、ハンドセ
ット6あるいはマイク7から入力される。どちらの経路
から入力されるかについては、入力装置検出部27の状
態によって決定される。本実施形態では、入力装置検出
部27として、ハンドセット(受話器)6のフックセン
サを機能させる場合を示す。
81を参照して認識処理を行い、対応する相手先電話番
号を電話帳データ82から抽出する。音声は、ハンドセ
ット6あるいはマイク7から入力される。どちらの経路
から入力されるかについては、入力装置検出部27の状
態によって決定される。本実施形態では、入力装置検出
部27として、ハンドセット(受話器)6のフックセン
サを機能させる場合を示す。
【0061】入力装置検出部27がフックアップ(受話
器が上げられた状態)で操作パネル22の音声認識キー
72が押下された場合、一定時間入力を促すLCD表示
を行ったり、一定時間経過後に音声入力を促す報知音の
鳴動を行うなど、ユーザ音声入力の開始を伝えると共
に、音声をハンドセット6の経路から入力されるように
クロスポイントSW4を制御する。
器が上げられた状態)で操作パネル22の音声認識キー
72が押下された場合、一定時間入力を促すLCD表示
を行ったり、一定時間経過後に音声入力を促す報知音の
鳴動を行うなど、ユーザ音声入力の開始を伝えると共
に、音声をハンドセット6の経路から入力されるように
クロスポイントSW4を制御する。
【0062】また、入力装置検出部27がオンフック
(受話器が置かれている状態)で操作パネル22の音声
認識キー72が押下された場合、一定時間入力を促すL
CD表示を行ったり、一定時間経過後に音声入力を促す
報知音の鳴動を行うなどで、ユーザ音声入力の開始を伝
えると共に、音声をマイク7の経路から入力されるよう
にクロスポイントSW4を制御する。
(受話器が置かれている状態)で操作パネル22の音声
認識キー72が押下された場合、一定時間入力を促すL
CD表示を行ったり、一定時間経過後に音声入力を促す
報知音の鳴動を行うなどで、ユーザ音声入力の開始を伝
えると共に、音声をマイク7の経路から入力されるよう
にクロスポイントSW4を制御する。
【0063】入力された音声は、クロスポイントSW4
を介して音声データとして、CPU1に入力される。C
PU1では、オペレートタスク32および音声認識タス
ク38を実行することにより、入力された音声データに
種々の演算を施し、得られたデータと音声登録メモリ8
1に登録されているデータを比較し、最も近いデータを
選択し、その結果を音声認識結果コマンドとして、オペ
レートタスク32に返送する。
を介して音声データとして、CPU1に入力される。C
PU1では、オペレートタスク32および音声認識タス
ク38を実行することにより、入力された音声データに
種々の演算を施し、得られたデータと音声登録メモリ8
1に登録されているデータを比較し、最も近いデータを
選択し、その結果を音声認識結果コマンドとして、オペ
レートタスク32に返送する。
【0064】尚、図4では、電話帳への音声登録を行う
場合、音声認識による電話帳検索とダイヤルを実行する
場合、オペレートタスク32は音声認識タスク38に音
声認識スタートコマンドを発行し、音声認識タスク38
に音声登録処理や認識処理をスタートさせる。
場合、音声認識による電話帳検索とダイヤルを実行する
場合、オペレートタスク32は音声認識タスク38に音
声認識スタートコマンドを発行し、音声認識タスク38
に音声登録処理や認識処理をスタートさせる。
【0065】音声認識タスク38は、ハンドセット6や
マイク7から入力したアナログ音声データをCPU1に
内蔵されたA/D変換回路によってサンプリングしてデ
ジタルデータに変換し、音声入力データとしてタスク
(音声認識タスク38)に取り込み、演算処理を行う。
この処理が終了すると、音声認識結果コマンドが音声認
識タスク38からオペレートタスク32に返送される。
マイク7から入力したアナログ音声データをCPU1に
内蔵されたA/D変換回路によってサンプリングしてデ
ジタルデータに変換し、音声入力データとしてタスク
(音声認識タスク38)に取り込み、演算処理を行う。
この処理が終了すると、音声認識結果コマンドが音声認
識タスク38からオペレートタスク32に返送される。
【0066】以下、上記各機能(電話帳機能、音声登
録、音声認識)に関して、さらに詳細な説明を行う。図
5は電話帳データおよび音声登録メモリのデータ構成を
示す図である。図中、上部点線内は、SRAM24上で
オペレートタスクが管理する電話帳データ82を示す。
電話帳データ82は大きく2種類に分かれており、1つ
は全ユーザに共通の電話帳データであり、他の1つは個
人別電話帳データである。
録、音声認識)に関して、さらに詳細な説明を行う。図
5は電話帳データおよび音声登録メモリのデータ構成を
示す図である。図中、上部点線内は、SRAM24上で
オペレートタスクが管理する電話帳データ82を示す。
電話帳データ82は大きく2種類に分かれており、1つ
は全ユーザに共通の電話帳データであり、他の1つは個
人別電話帳データである。
【0067】共通の電話帳データは、電話帳データテー
ブル91を有する。電話帳データテーブル91には、相
手先の略称を示す「略称」、対応する相手先の「電話番
号」、音声データが登録されているか否かを表すフラグ
である「音声登録」、音声データが登録されている場合
にその音声データを特定する「登録番号」から構成され
るデータブロックが複数記憶されている。
ブル91を有する。電話帳データテーブル91には、相
手先の略称を示す「略称」、対応する相手先の「電話番
号」、音声データが登録されているか否かを表すフラグ
である「音声登録」、音声データが登録されている場合
にその音声データを特定する「登録番号」から構成され
るデータブロックが複数記憶されている。
【0068】個人別の電話帳データは、個人用IDテー
ブル92および個人用電話帳テーブル93から構成され
る。個人用IDテーブル92には、個人用電話帳テーブ
ルを所有するユーザの略称を示す「略称」、この略称に
対応する音声データが登録されているか否かを表す「音
声登録」、音声データが登録されている場合にその音声
データを特定する「登録番号」、および対応する個人用
電話帳テーブルを特定するための「個人用電話帳テーブ
ルアドレス」で構成されるデータブロックが格納され
る。また、個人用電話帳テーブル93は、個人用IDテ
ーブルで登録されたユーザの数分存在する。各テーブル
のデータの構造は、電話帳データテーブル91と同じで
ある。
ブル92および個人用電話帳テーブル93から構成され
る。個人用IDテーブル92には、個人用電話帳テーブ
ルを所有するユーザの略称を示す「略称」、この略称に
対応する音声データが登録されているか否かを表す「音
声登録」、音声データが登録されている場合にその音声
データを特定する「登録番号」、および対応する個人用
電話帳テーブルを特定するための「個人用電話帳テーブ
ルアドレス」で構成されるデータブロックが格納され
る。また、個人用電話帳テーブル93は、個人用IDテ
ーブルで登録されたユーザの数分存在する。各テーブル
のデータの構造は、電話帳データテーブル91と同じで
ある。
【0069】音声登録メモリ81は、SRAM24上で
音声認識タスクが管理するものであり、音声登録テーブ
ル94および音声データ登録領域95を格納する。音声
登録テーブル94は、「登録番号」、「状態」、「除外
フラグ」および「登録アドレス」を備える。「登録番
号」は音声データ登録領域95を特定するものである。
「登録番号」は前述した「電話帳データテーブル」、
「個人用IDテーブル」、「個人用電話帳テーブル」に
記述される「登録番号」と1対1に対応するように、関
連付けられている。「状態」は、対応する音声データ登
録領域95にデータが格納されているか否かを示す。
音声認識タスクが管理するものであり、音声登録テーブ
ル94および音声データ登録領域95を格納する。音声
登録テーブル94は、「登録番号」、「状態」、「除外
フラグ」および「登録アドレス」を備える。「登録番
号」は音声データ登録領域95を特定するものである。
「登録番号」は前述した「電話帳データテーブル」、
「個人用IDテーブル」、「個人用電話帳テーブル」に
記述される「登録番号」と1対1に対応するように、関
連付けられている。「状態」は、対応する音声データ登
録領域95にデータが格納されているか否かを示す。
【0070】「除外フラグ」はオペレートタスク32か
ら認識処理の比較対象としない旨の指定を受けたか否か
を示す。「除外フラグ」は後述する図6に示すように、
コマンド0、1、2、3、4のいずれかを受信したとき
に全て0FFにリセットされ、同じくコマンド5、6の
いずれかを受信したとき、コマンドで指定された登録番
号の「除外フラグ」がONにセットされる。
ら認識処理の比較対象としない旨の指定を受けたか否か
を示す。「除外フラグ」は後述する図6に示すように、
コマンド0、1、2、3、4のいずれかを受信したとき
に全て0FFにリセットされ、同じくコマンド5、6の
いずれかを受信したとき、コマンドで指定された登録番
号の「除外フラグ」がONにセットされる。
【0071】また、「登録アドレス」は、デジタル符号
化された音声データが記憶されているRAMエリアの実
体アドレスである。音声データ登録領域95には、音声
認識を行うために必要な音声データが登録される。
化された音声データが記憶されているRAMエリアの実
体アドレスである。音声データ登録領域95には、音声
認識を行うために必要な音声データが登録される。
【0072】このようなデータ構成において、電話帳デ
ータと音声データは、「登録番号」によってリンクされ
ている。したがって、例えば、入力された音声につい
て、音声データ登録領域95のデータを参照して音声認
識を行い、認識結果として登録番号「NO.2」を得た
場合、この登録番号で電話帳データテーブル91および
個人用IDテーブル92が検索され、この場合、電話帳
データテーブル91から「マナブ」という略称で登録さ
れた電話番号が獲得される。
ータと音声データは、「登録番号」によってリンクされ
ている。したがって、例えば、入力された音声につい
て、音声データ登録領域95のデータを参照して音声認
識を行い、認識結果として登録番号「NO.2」を得た
場合、この登録番号で電話帳データテーブル91および
個人用IDテーブル92が検索され、この場合、電話帳
データテーブル91から「マナブ」という略称で登録さ
れた電話番号が獲得される。
【0073】尚、音声認識の結果として、登録番号「N
O.7」を得た場合、個人用IDテーブル92に一致す
るデータブロックが存在するので、この音声入力は、個
人別電話帳の指定であったと判断する。そして、次に入
力される音声に対する音声認識は、指定された個人別電
話帳(個人用電話帳テーブル93)に登録された範囲内
で音声認識による相手先の特定を行う。尚、図5では、
略称が3文字のものしか示されていないが、3文字に限
られないことは勿論である。
O.7」を得た場合、個人用IDテーブル92に一致す
るデータブロックが存在するので、この音声入力は、個
人別電話帳の指定であったと判断する。そして、次に入
力される音声に対する音声認識は、指定された個人別電
話帳(個人用電話帳テーブル93)に登録された範囲内
で音声認識による相手先の特定を行う。尚、図5では、
略称が3文字のものしか示されていないが、3文字に限
られないことは勿論である。
【0074】本実施形態では、上記個人別の電話帳デー
タを用いることにより、特定話者認識のように音声認識
環境が得られるので、音声認識の認識率を向上させるこ
とができる。尚、共通の電話帳データと個人別の電話帳
データの利用についての更なる詳細は後述する。
タを用いることにより、特定話者認識のように音声認識
環境が得られるので、音声認識の認識率を向上させるこ
とができる。尚、共通の電話帳データと個人別の電話帳
データの利用についての更なる詳細は後述する。
【0075】図6はオペレートタスク32から音声認識
タスク38に発行される音声認識スタートコマンドの種
類と内容を示す図である。コマンドの種類として、コマ
ンド0からコマンド6まで存在する。コマンド0は指定
の音声登録データを音声登録メモリから消去するために
使用される。尚、図6の「登録番号」に○が付されてい
るのは、そのコマンドが登録番号を指定することを示
す。また、ここで指定される登録番号は、図5の登録番
号に対応するものである。
タスク38に発行される音声認識スタートコマンドの種
類と内容を示す図である。コマンドの種類として、コマ
ンド0からコマンド6まで存在する。コマンド0は指定
の音声登録データを音声登録メモリから消去するために
使用される。尚、図6の「登録番号」に○が付されてい
るのは、そのコマンドが登録番号を指定することを示
す。また、ここで指定される登録番号は、図5の登録番
号に対応するものである。
【0076】コマンド1および2は、音声認識タスク3
8に音声登録処理を依頼するために使用される。コマン
ド3および4は、音声認識タスク38に音声認識処理を
依頼するために使用される。コマンド5および6は音声
認識処理を依頼するために使用されるが、これらを受け
取った音声認識タスクは、このコマンドで指定された登
録番号の音声登録データを比較対象から削除して認識す
る。図5の音声登録テーブル94における「除外フラ
グ」をONにする。
8に音声登録処理を依頼するために使用される。コマン
ド3および4は、音声認識タスク38に音声認識処理を
依頼するために使用される。コマンド5および6は音声
認識処理を依頼するために使用されるが、これらを受け
取った音声認識タスクは、このコマンドで指定された登
録番号の音声登録データを比較対象から削除して認識す
る。図5の音声登録テーブル94における「除外フラ
グ」をONにする。
【0077】図7は音声認識タスク38からオペレート
タスク32に発行される音声認識結果コマンドの種類お
よび内容を示す図である。コマンド種別はコマンド1か
らコマンド4まで存在する。コマンド1および2は音声
登録結果をオペレートタスク32に通知するために使用
される。コマンド3および4は音声認識結果を通知する
ために使用される。
タスク32に発行される音声認識結果コマンドの種類お
よび内容を示す図である。コマンド種別はコマンド1か
らコマンド4まで存在する。コマンド1および2は音声
登録結果をオペレートタスク32に通知するために使用
される。コマンド3および4は音声認識結果を通知する
ために使用される。
【0078】尚、SRAM24には、「理由コードを表
示する」のスイッチ項目が設けられており、「機能設
定」モードにおいて、オペレータの所望する状態(ON
/OFF)を設定可能である。これがONになっている
とき、音声登録/認識の各処理でNGだった場合、NG
の理由を示す「理由コード」が結果コマンドに反映され
る。
示する」のスイッチ項目が設けられており、「機能設
定」モードにおいて、オペレータの所望する状態(ON
/OFF)を設定可能である。これがONになっている
とき、音声登録/認識の各処理でNGだった場合、NG
の理由を示す「理由コード」が結果コマンドに反映され
る。
【0079】すなわち、「理由コードを表示する」がO
Nになっている場合、音声登録/認識の各処理では、オ
ペレートタスク32はそれぞれコマンド4/コマンド6
(NG発生時にその理由コードを付す旨の指示を含むコ
マンド)を用いて、音声認識タスク38に指示を行う。
そして、このコマンドを受けた音声認識タスク38は、
音声認識結果コマンド2もしくは4を用いて、返答を行
うことになる。ここで、例えば、入力した音声の所定の
区間(長さ)で無音を検知した場合、「有効データ無
し」であると、また、所定の区間(長さ)で有音(音声
部分)が終了しないことを検知した場合、「入力時間超
過」であると、音声認識タスク38は判断し、このエラ
ー状態に対応する理由コードを音声認識結果コマンド2
もしくは4に含ませる。
Nになっている場合、音声登録/認識の各処理では、オ
ペレートタスク32はそれぞれコマンド4/コマンド6
(NG発生時にその理由コードを付す旨の指示を含むコ
マンド)を用いて、音声認識タスク38に指示を行う。
そして、このコマンドを受けた音声認識タスク38は、
音声認識結果コマンド2もしくは4を用いて、返答を行
うことになる。ここで、例えば、入力した音声の所定の
区間(長さ)で無音を検知した場合、「有効データ無
し」であると、また、所定の区間(長さ)で有音(音声
部分)が終了しないことを検知した場合、「入力時間超
過」であると、音声認識タスク38は判断し、このエラ
ー状態に対応する理由コードを音声認識結果コマンド2
もしくは4に含ませる。
【0080】図8は理由コード、処理種別および理由内
容の関係を示す図である。図8に示す内容を取扱説明書
等に載せておくことにより、オペレータは発生したNG
の理由を知ることができる。本実施形態のファクシミリ
装置では、「理由コードを表示する」がONになってい
る場合、操作パネル上のLCD56にNGの旨が表示さ
れるとともに、理由コードが表示される。このため、製
造検査時やユーザ使用時の重要なガイダンスを提供する
ことができる。
容の関係を示す図である。図8に示す内容を取扱説明書
等に載せておくことにより、オペレータは発生したNG
の理由を知ることができる。本実施形態のファクシミリ
装置では、「理由コードを表示する」がONになってい
る場合、操作パネル上のLCD56にNGの旨が表示さ
れるとともに、理由コードが表示される。このため、製
造検査時やユーザ使用時の重要なガイダンスを提供する
ことができる。
【0081】NG発生時の表示は、理由コードのみなら
ず、理由内容を表示してもよい。そのためには、理由コ
ードに対応する理由内容を表す文字コード列、あるいは
LCD56に表示される理由内容を表すパターンデータ
そのものを予め記憶しておき、発生した理由コードに対
応するデータを読み出してLCD56に表示する。ま
た、理由内容に代えて、対処方法を表示してもよい。
ず、理由内容を表示してもよい。そのためには、理由コ
ードに対応する理由内容を表す文字コード列、あるいは
LCD56に表示される理由内容を表すパターンデータ
そのものを予め記憶しておき、発生した理由コードに対
応するデータを読み出してLCD56に表示する。ま
た、理由内容に代えて、対処方法を表示してもよい。
【0082】つぎに、ファクシミリ装置における電話帳
機能の登録と操作、および音声認識による宛先ダイヤル
を行う際の動作を示す。 [電話帳登録関連]電話帳登録関連の処理としては、個
人別電話帳の作成、共通の電話帳および個人別電話帳の
それぞれに対する「新規登録」、「登録内容修正」およ
び「音声データ消去」がある。各処理を実行させるため
には、メニューから所望の機能を選択するなど、種々の
方法が考えられる。本実施形態では、処理の選択操作に
ついては限定しない。 (1)個人別電話帳の作成 図9は個人別電話帳の作成処理操作における画面表示を
示す図である。図10は個人別電話帳の登録処理手順を
示すフローチャートである。この処理プログラムはRO
M21に格納されており、CPU1によって実行され
る。機能メニュー等を操作し、個人別電話帳の作成処理
が選択されると、図9(a)に示す初期画面を表示する
(ステップS11)。この状態で、セットキー60を押
すと(ステップS12)、図9(b)に示す略称入力画
面を表示し、ユーザに略称を入力させる(ステップS1
3)。
機能の登録と操作、および音声認識による宛先ダイヤル
を行う際の動作を示す。 [電話帳登録関連]電話帳登録関連の処理としては、個
人別電話帳の作成、共通の電話帳および個人別電話帳の
それぞれに対する「新規登録」、「登録内容修正」およ
び「音声データ消去」がある。各処理を実行させるため
には、メニューから所望の機能を選択するなど、種々の
方法が考えられる。本実施形態では、処理の選択操作に
ついては限定しない。 (1)個人別電話帳の作成 図9は個人別電話帳の作成処理操作における画面表示を
示す図である。図10は個人別電話帳の登録処理手順を
示すフローチャートである。この処理プログラムはRO
M21に格納されており、CPU1によって実行され
る。機能メニュー等を操作し、個人別電話帳の作成処理
が選択されると、図9(a)に示す初期画面を表示する
(ステップS11)。この状態で、セットキー60を押
すと(ステップS12)、図9(b)に示す略称入力画
面を表示し、ユーザに略称を入力させる(ステップS1
3)。
【0083】操作としては、下段から所望の文字を選択
すると、上段の黒い四角で示すカーソルの位置に文字が
順次配置され、下段の「オワリ」にカーソルを移動させ
ることで略称入力の完了とする。
すると、上段の黒い四角で示すカーソルの位置に文字が
順次配置され、下段の「オワリ」にカーソルを移動させ
ることで略称入力の完了とする。
【0084】こうして略称入力の完了が示されると、個
人用IDテーブル92に新たなデータブロックを追加
し、その「略称」の欄にステップS13で入力された略
称を登録し、新たに割り当てた個人用電話帳テーブルの
アドレスをその個人用IDテーブル92の「個人用電話
帳テーブルアドレス」の欄に登録する。そして、図9
(c)のように、個人別電話帳の登録完了を示す表示を
行う(ステップS16)。
人用IDテーブル92に新たなデータブロックを追加
し、その「略称」の欄にステップS13で入力された略
称を登録し、新たに割り当てた個人用電話帳テーブルの
アドレスをその個人用IDテーブル92の「個人用電話
帳テーブルアドレス」の欄に登録する。そして、図9
(c)のように、個人別電話帳の登録完了を示す表示を
行う(ステップS16)。
【0085】引き続き、図9(d)の画面を表示し、音
声データの登録を行うか否かを問い合わせる(ステップ
S17、S18)。ここで、ユーザが「シナイ」を選択
した場合、そのまま処理を終了する。
声データの登録を行うか否かを問い合わせる(ステップ
S17、S18)。ここで、ユーザが「シナイ」を選択
した場合、そのまま処理を終了する。
【0086】一方、音声データの登録を「スル」とした
場合、音声認識用データを生成するための音声登録処理
を実行する(ステップS19)。音声登録処理の詳細に
ついては、図15を用いて後述する。この音声登録処理
によって得られたデータは、音声データ登録領域95に
登録される。そして、音声登録テーブル94および個人
用IDテーブル92の各欄に、略称と音声データをリン
クするための適切なデータを書き込む(ステップS2
0)。この後、処理を終了する。 (2)電話帳登録処理 電話帳へのデータ登録について説明する。尚、データ登
録に先立って、登録先が個人別電話帳か共通電話帳かを
指定し、個人別電話帳である場合、どのユーザの電話帳
であるかが指定される。電話帳の特定は、例えば次のよ
うに行われる。
場合、音声認識用データを生成するための音声登録処理
を実行する(ステップS19)。音声登録処理の詳細に
ついては、図15を用いて後述する。この音声登録処理
によって得られたデータは、音声データ登録領域95に
登録される。そして、音声登録テーブル94および個人
用IDテーブル92の各欄に、略称と音声データをリン
クするための適切なデータを書き込む(ステップS2
0)。この後、処理を終了する。 (2)電話帳登録処理 電話帳へのデータ登録について説明する。尚、データ登
録に先立って、登録先が個人別電話帳か共通電話帳かを
指定し、個人別電話帳である場合、どのユーザの電話帳
であるかが指定される。電話帳の特定は、例えば次のよ
うに行われる。
【0087】すなわち、機能キー52を押し、上下カ
ーソルキー61、62を操作することで、「共通電話
帳」か「個人別電話帳」のいずれかがメニューから指定
され、個人別電話帳が指定された場合、LCD56上
に個人用IDテーブル82に登録されている略称が順次
表示される。所望の略称を選択することにより、処理
対象とする個人別電話帳が選択される。したがって、こ
の状態で、「データ登録」を開始することで、選択され
た個人別電話帳への新規登録が行われることになる。こ
の時点で、共通電話帳への登録処理も個人別電話帳への
登録処理も同じものとなる。
ーソルキー61、62を操作することで、「共通電話
帳」か「個人別電話帳」のいずれかがメニューから指定
され、個人別電話帳が指定された場合、LCD56上
に個人用IDテーブル82に登録されている略称が順次
表示される。所望の略称を選択することにより、処理
対象とする個人別電話帳が選択される。したがって、こ
の状態で、「データ登録」を開始することで、選択され
た個人別電話帳への新規登録が行われることになる。こ
の時点で、共通電話帳への登録処理も個人別電話帳への
登録処理も同じものとなる。
【0088】図11は電話帳へのデータ登録における画
面表示を示す図である。図12および図13は電話帳へ
の音声データ登録における画面表示を示す図である。図
14は電話帳へのデータ登録処理手順を示すフローチャ
ートである。この処理プログラムはROM21に格納さ
れており、CPU1によって実行される。
面表示を示す図である。図12および図13は電話帳へ
の音声データ登録における画面表示を示す図である。図
14は電話帳へのデータ登録処理手順を示すフローチャ
ートである。この処理プログラムはROM21に格納さ
れており、CPU1によって実行される。
【0089】電話帳を選択し、電話帳へのデータ登録が
メニューから選択されると、LCD56上に、図11
(a)に示す表示を行う(ステップS31)。尚、この
表示において、「アキ70ケン」は、電話帳への登録が
可能な残り件数を表す。本実施形態では、登録可能件数
を100件とすると、図11(a)の表示の時点では、
30件のデータが既に登録されている。
メニューから選択されると、LCD56上に、図11
(a)に示す表示を行う(ステップS31)。尚、この
表示において、「アキ70ケン」は、電話帳への登録が
可能な残り件数を表す。本実施形態では、登録可能件数
を100件とすると、図11(a)の表示の時点では、
30件のデータが既に登録されている。
【0090】次に、セットキー60が押されるのを待ち
(ステップS32)、セットキー60が押されると、図
11(b)に示す画面を表示してユーザに略称を入力さ
せる(ステップS33)。入力完了を待ち(ステップS
34)、入力が完了すると、つまり図11(b)におい
て、「オワリ」が選択されると、電話番号の入力を行わ
せる(ステップS35)。電話番号の入力は、ダイヤル
により行うものである。図11(c)では、電話番号の
入力を行った状態が示されている。この状態で、セット
キー60が押されると(ステップS36)、電話帳デー
タテーブル91(個人別電話帳への登録である場合、指
定された個人用電話帳テーブル93)に、入力された略
称と電話番号が登録される。
(ステップS32)、セットキー60が押されると、図
11(b)に示す画面を表示してユーザに略称を入力さ
せる(ステップS33)。入力完了を待ち(ステップS
34)、入力が完了すると、つまり図11(b)におい
て、「オワリ」が選択されると、電話番号の入力を行わ
せる(ステップS35)。電話番号の入力は、ダイヤル
により行うものである。図11(c)では、電話番号の
入力を行った状態が示されている。この状態で、セット
キー60が押されると(ステップS36)、電話帳デー
タテーブル91(個人別電話帳への登録である場合、指
定された個人用電話帳テーブル93)に、入力された略
称と電話番号が登録される。
【0091】この後、図11(e)に示す画面表示を行
って、音声データの登録を行う否かをユーザに問い合わ
せる(ステップS38)。図11(e)において、「シ
ナイ」が選択された場合、続けてこの電話帳への登録を
行うか否かを問い合わせる(図11(f)、ステップS
41)。続けて登録する場合、ステップS33の処理に
戻り、一方、続けて登録しない場合、処理を終了する。
って、音声データの登録を行う否かをユーザに問い合わ
せる(ステップS38)。図11(e)において、「シ
ナイ」が選択された場合、続けてこの電話帳への登録を
行うか否かを問い合わせる(図11(f)、ステップS
41)。続けて登録する場合、ステップS33の処理に
戻り、一方、続けて登録しない場合、処理を終了する。
【0092】一方、ステップS38で、音声登録を行う
旨の指示があった場合、音声登録処理を行う(ステップ
S39)。そして、図10のステップS20と同様、音
声登録処理によって得られたデータを音声データ登録領
域95に登録する(ステップS40)。すなわち、音声
登録テーブル94および電話帳データテーブル91(個
人別電話帳への登録である場合、指定された個人用電話
帳テーブル93)の各欄に略称と音声データをリンクす
るための適切なデータが書き込まれる。
旨の指示があった場合、音声登録処理を行う(ステップ
S39)。そして、図10のステップS20と同様、音
声登録処理によって得られたデータを音声データ登録領
域95に登録する(ステップS40)。すなわち、音声
登録テーブル94および電話帳データテーブル91(個
人別電話帳への登録である場合、指定された個人用電話
帳テーブル93)の各欄に略称と音声データをリンクす
るための適切なデータが書き込まれる。
【0093】次に音声登録処理を示す。図15は電話帳
への音声データ登録処理手順を示すフローチャートであ
る。この処理プログラムはROM21に格納されてお
り、CPU1によって実行される。装置の音声登録可能
件数と、音声の登録件数とを比較して音声登録が可能で
あるか否かを判別する(ステップS45)。本実施形態
では、最大15件の音声データを登録できる。
への音声データ登録処理手順を示すフローチャートであ
る。この処理プログラムはROM21に格納されてお
り、CPU1によって実行される。装置の音声登録可能
件数と、音声の登録件数とを比較して音声登録が可能で
あるか否かを判別する(ステップS45)。本実施形態
では、最大15件の音声データを登録できる。
【0094】音声登録できない場合、エラー処理を行う
(ステップS57)。尚、このエラー処理は、後述する
図22、図23および図24のフローチャートにおける
ステップS70〜S72と同様の処理を行うものであ
り、音声登録が不可能であると判断された理由を表すコ
ードを図8に示される理由コードから選択し、ユーザに
提示する。ここでは、図8のR04「登録件数フル」が
選択されることになる。
(ステップS57)。尚、このエラー処理は、後述する
図22、図23および図24のフローチャートにおける
ステップS70〜S72と同様の処理を行うものであ
り、音声登録が不可能であると判断された理由を表すコ
ードを図8に示される理由コードから選択し、ユーザに
提示する。ここでは、図8のR04「登録件数フル」が
選択されることになる。
【0095】一方、ステップS45で音声登録可能であ
る場合、図12(a)に示す初期画面を表示するととも
に、カウンタNに値3をセットする(ステップS4
6)。本実施形態では、音声登録において、音声入力を
3回行わせることにより、音声認識処理の精度を向上さ
せるが、このカウンタNはその音声入力回数をカウント
するものである。
る場合、図12(a)に示す初期画面を表示するととも
に、カウンタNに値3をセットする(ステップS4
6)。本実施形態では、音声登録において、音声入力を
3回行わせることにより、音声認識処理の精度を向上さ
せるが、このカウンタNはその音声入力回数をカウント
するものである。
【0096】画面の指示にしたがって、ユーザが受話器
を上げると、ガイダンス表示およびガイドトーンの発生
を行う(ステップS48)。ガイダンス表示では、図1
2(b)に示す表示を行い、ガイドトーン(ピー音)を
発生した後に、図12(c)に示す表示を行う。このと
き、表示部には、「オハナシクダサイ」というメッセー
ジ表示とともに、ステップS33でユーザが入力を行っ
た略称(宛名)の表示を行う(図12(c))。
を上げると、ガイダンス表示およびガイドトーンの発生
を行う(ステップS48)。ガイダンス表示では、図1
2(b)に示す表示を行い、ガイドトーン(ピー音)を
発生した後に、図12(c)に示す表示を行う。このと
き、表示部には、「オハナシクダサイ」というメッセー
ジ表示とともに、ステップS33でユーザが入力を行っ
た略称(宛名)の表示を行う(図12(c))。
【0097】この状態でユーザが登録する名前を、表示
されている略称の通り、受話器に向かって話し、音声を
感知すると、図12(d)に示す表示を行う。そして、
音声の入力を完了したか否かを判別し(ステップS4
9)、音声の入力を終えると、図12(e)に示す表示
を行うとともに、入力された音声の解析を行う(ステッ
プS50)。
されている略称の通り、受話器に向かって話し、音声を
感知すると、図12(d)に示す表示を行う。そして、
音声の入力を完了したか否かを判別し(ステップS4
9)、音声の入力を終えると、図12(e)に示す表示
を行うとともに、入力された音声の解析を行う(ステッ
プS50)。
【0098】解析された音声が正常であるか否かを判別
し(ステップS51)、異常であると判断された場合、
エラー処理を行う(ステップS58)。尚、このエラー
処理は、図22、図23および図24のフローチャート
におけるステップS70〜S72と同様の処理であり、
音声登録が不可であると判断された理由を表すコードを
図8に示される理由から選択してユーザに提示する。
し(ステップS51)、異常であると判断された場合、
エラー処理を行う(ステップS58)。尚、このエラー
処理は、図22、図23および図24のフローチャート
におけるステップS70〜S72と同様の処理であり、
音声登録が不可であると判断された理由を表すコードを
図8に示される理由から選択してユーザに提示する。
【0099】一方、ステップS51で、音声解析が正常
に行われたと判断された場合、カウンタNの値を「1」
減少し、その結果、N=0になったか否かを判別する
(ステップS53)。N=0でない場合、再び音声解析
処理を行う必要があるので(本実施形態では、全部で3
回行う)、例えば、図13(a)に示すように、音声解
析が正常に行われたことを報知し(ステップS54)、
残り発声必要回数を報知する画面を表示する。尚、図1
3(a)において、残り回数の表示(「アト 2カ
イ」)には、カウンタNの値が用いられる。
に行われたと判断された場合、カウンタNの値を「1」
減少し、その結果、N=0になったか否かを判別する
(ステップS53)。N=0でない場合、再び音声解析
処理を行う必要があるので(本実施形態では、全部で3
回行う)、例えば、図13(a)に示すように、音声解
析が正常に行われたことを報知し(ステップS54)、
残り発声必要回数を報知する画面を表示する。尚、図1
3(a)において、残り回数の表示(「アト 2カ
イ」)には、カウンタNの値が用いられる。
【0100】このように、3回の音声登録を終了する
と、カウンタNの値が「0」となり、未使用の音声デー
タ登録領域95に発声された複数回の音声データを、ス
テップS33およびS35で入力されたデータに対応さ
せて全て登録する(ステップS55)。尚、ここで登録
される音声データは、全ての音声データではなく、選択
した条件の良いものだけでもよいし、あるいは複数の発
声データから作成した最良のデータでもよい。
と、カウンタNの値が「0」となり、未使用の音声デー
タ登録領域95に発声された複数回の音声データを、ス
テップS33およびS35で入力されたデータに対応さ
せて全て登録する(ステップS55)。尚、ここで登録
される音声データは、全ての音声データではなく、選択
した条件の良いものだけでもよいし、あるいは複数の発
声データから作成した最良のデータでもよい。
【0101】この間、図13(b)に示すように、音声
登録処理中であることを報知する画面の表示を行う。そ
して、音声データの登録を完了すると、終了処理を行い
(ステップS56)、処理を終了する。すなわち、この
終了処理では、図13(c)に示す表示を行い、受話器
を元に戻すよう指示し、受話器が戻されたことの検知に
応じて、図13(d)に示す音声登録処理の完了を報知
する画面の表示を行い、登録が完了したことを示す。
登録処理中であることを報知する画面の表示を行う。そ
して、音声データの登録を完了すると、終了処理を行い
(ステップS56)、処理を終了する。すなわち、この
終了処理では、図13(c)に示す表示を行い、受話器
を元に戻すよう指示し、受話器が戻されたことの検知に
応じて、図13(d)に示す音声登録処理の完了を報知
する画面の表示を行い、登録が完了したことを示す。
【0102】そして、図13(e)に示すように、別項
目の音声登録を続けて行うか否かを、オペレータが指示
するための画面を表示し、「シナイ」が指示された場
合、呼び出し元のルーチン(図10のステップS19あ
るいは図14のステップS39)に戻り、「スル」が指
示された場合、ステップS33に戻る。 (3)電話帳登録内容修正 電話帳に登録された内容を修正する操作を示す。尚、こ
の処理の制御手順は、以下に示す操作の手順とそれにし
たがった表示画面の提示により明らかであるので、ここ
では図16を参照して操作手順だけを説明する。
目の音声登録を続けて行うか否かを、オペレータが指示
するための画面を表示し、「シナイ」が指示された場
合、呼び出し元のルーチン(図10のステップS19あ
るいは図14のステップS39)に戻り、「スル」が指
示された場合、ステップS33に戻る。 (3)電話帳登録内容修正 電話帳に登録された内容を修正する操作を示す。尚、こ
の処理の制御手順は、以下に示す操作の手順とそれにし
たがった表示画面の提示により明らかであるので、ここ
では図16を参照して操作手順だけを説明する。
【0103】図16は電話帳データの登録内容の修正操
作における画面表示を示す図である。例えば、本装置の
スタンバイ状態で「電話帳」キー(セットキー60)を
押下し、上下カーソルキーで登録修正したい略称(宛
先)を選択する。この時点における画面表示例は、図1
6(a)のようになる。尚、表示の右端に「V」が表示
されている場合、その登録データに音声認識用のデータ
が登録されていることを表す。次に、「カナ/英数字」
キーを押下すると、図16(b)に示す修正用画面の表
示となる。尚、上下左右カーソルで下段の候補文字の選
択を行い、上段のカーソルは「*#」キーで移動を行う
ものとする。
作における画面表示を示す図である。例えば、本装置の
スタンバイ状態で「電話帳」キー(セットキー60)を
押下し、上下カーソルキーで登録修正したい略称(宛
先)を選択する。この時点における画面表示例は、図1
6(a)のようになる。尚、表示の右端に「V」が表示
されている場合、その登録データに音声認識用のデータ
が登録されていることを表す。次に、「カナ/英数字」
キーを押下すると、図16(b)に示す修正用画面の表
示となる。尚、上下左右カーソルで下段の候補文字の選
択を行い、上段のカーソルは「*#」キーで移動を行う
ものとする。
【0104】ここで、「キムラ」の「キ」を「タ」に修
正すると、図16(c)のようになる。そして、「オワ
リ」を選択すると、略称の修正操作を終え、番号の修正
操作を行うために、図16(d)の表示となる。番号を
変更する場合、「消去」キー55によって現在登録され
ている番号を一旦、消去し、その後、ダイヤルにより入
力し直す。図16(e)は番号の入れ直しを行っている
状態を示す。
正すると、図16(c)のようになる。そして、「オワ
リ」を選択すると、略称の修正操作を終え、番号の修正
操作を行うために、図16(d)の表示となる。番号を
変更する場合、「消去」キー55によって現在登録され
ている番号を一旦、消去し、その後、ダイヤルにより入
力し直す。図16(e)は番号の入れ直しを行っている
状態を示す。
【0105】番号を入れ直した場合、セットキー60を
押下することで修正処理を終了する。一方、番号の変更
がない場合、図16(d)の状態からセットキーを押下
する。
押下することで修正処理を終了する。一方、番号の変更
がない場合、図16(d)の状態からセットキーを押下
する。
【0106】つぎに、音声データについて修正を行うか
否かをユーザに指示させるために、図16(f)の画面
表示を行う。既に、このデータに関して音声データが登
録されている場合、図16(f)の画面で「スル」が選
択されると、さらに図16(g)の画面を表示し、音声
データの入れ替えを行うか否かを問い合わせる。すなわ
ち、本修正操作によれば、音声データが未登録の登録デ
ータについては、図16(f)の画面で「スル」が選択
された場合、さらに図16(g)の画面表示を行い、音
声データの入れ替えを行ってよいか否かを問い合わせ
る。すなわち、登録済みの音声データが消えてもよいか
否かを問い合わせる。図16(g)の画面で「シナイ」
が選択された場合、音声データの登録処理は行われな
い。 (4)電話帳登録内容削除 電話帳に登録された内容を削除する操作を示す。尚、本
処理の制御手順は、以下に示す操作の手順とそれにした
がった表示画面の内容の提示により明らかであるので、
ここでは図17を参照して操作手順だけを示す。図17
は電話帳データの登録内容の削除操作における画面表示
を示す図である。
否かをユーザに指示させるために、図16(f)の画面
表示を行う。既に、このデータに関して音声データが登
録されている場合、図16(f)の画面で「スル」が選
択されると、さらに図16(g)の画面を表示し、音声
データの入れ替えを行うか否かを問い合わせる。すなわ
ち、本修正操作によれば、音声データが未登録の登録デ
ータについては、図16(f)の画面で「スル」が選択
された場合、さらに図16(g)の画面表示を行い、音
声データの入れ替えを行ってよいか否かを問い合わせ
る。すなわち、登録済みの音声データが消えてもよいか
否かを問い合わせる。図16(g)の画面で「シナイ」
が選択された場合、音声データの登録処理は行われな
い。 (4)電話帳登録内容削除 電話帳に登録された内容を削除する操作を示す。尚、本
処理の制御手順は、以下に示す操作の手順とそれにした
がった表示画面の内容の提示により明らかであるので、
ここでは図17を参照して操作手順だけを示す。図17
は電話帳データの登録内容の削除操作における画面表示
を示す図である。
【0107】本装置のスタンバイ状態で「電話帳」キー
(セットキー60)を押下し、上下カーソルキーで登録
修正したい略称(宛先)を選択する。この時点における
画面表示例は図17(a)に示す通りである。
(セットキー60)を押下し、上下カーソルキーで登録
修正したい略称(宛先)を選択する。この時点における
画面表示例は図17(a)に示す通りである。
【0108】この状態で、消去キー55を押下すると、
図17(b)に示す画面が表示される。そして、セット
キー60を押下すると、図17(c)に示す画面が表示
される。この時点で、略称が「キムラ タクヤ」として
登録された電話帳データは、電話帳データテーブル91
(個人別電話帳への登録である場合、指定された個人用
電話帳テーブル93)から削除される。
図17(b)に示す画面が表示される。そして、セット
キー60を押下すると、図17(c)に示す画面が表示
される。この時点で、略称が「キムラ タクヤ」として
登録された電話帳データは、電話帳データテーブル91
(個人別電話帳への登録である場合、指定された個人用
電話帳テーブル93)から削除される。
【0109】このとき、消去したデータに音声データが
登録されていた場合、この音声データも一緒に消去され
る。すなわち、電話帳データテーブル91において、削
除対象のデータブロックにおける「登録番号」で音声登
録テーブル94を検索し、対応するデータブロックの
「状態」を空きにする。
登録されていた場合、この音声データも一緒に消去され
る。すなわち、電話帳データテーブル91において、削
除対象のデータブロックにおける「登録番号」で音声登
録テーブル94を検索し、対応するデータブロックの
「状態」を空きにする。
【0110】このように消去処理を終えると、図17
(c)に示す画面が表示され、所定時間経過後、図17
(d)に示す画面が表示される。 (5)音声データの削除 つぎに、登録されている音声データだけを削除する方法
を示す。図18は音声データの削除操作における画面表
示を示す図である。音声データの削除に際し、まず、電
話帳機能により音声データを削除したい略称(宛先略称
でも個人別電話帳の略称でもよい)を表示させる。
(c)に示す画面が表示され、所定時間経過後、図17
(d)に示す画面が表示される。 (5)音声データの削除 つぎに、登録されている音声データだけを削除する方法
を示す。図18は音声データの削除操作における画面表
示を示す図である。音声データの削除に際し、まず、電
話帳機能により音声データを削除したい略称(宛先略称
でも個人別電話帳の略称でもよい)を表示させる。
【0111】そして、「カナ/英字」キー(本実施形態
では、リダイヤルキー76で代用)を押下し、略称と電
話番号をそのまま確定すると、図18(a)に示す画面
が表示される。ここで、「シナイ」を選択すると、図1
8(b)に示す画面が表示され、この音声データを消去
するか否かを問い合わせる。ここで、さらに「スル」が
選択されると、この登録データの音声データが消去さ
れ、図17(c)に示す画面が表示される。
では、リダイヤルキー76で代用)を押下し、略称と電
話番号をそのまま確定すると、図18(a)に示す画面
が表示される。ここで、「シナイ」を選択すると、図1
8(b)に示す画面が表示され、この音声データを消去
するか否かを問い合わせる。ここで、さらに「スル」が
選択されると、この登録データの音声データが消去さ
れ、図17(c)に示す画面が表示される。
【0112】尚、電話帳で略称を表示して「カナ/英
字」キーを押下し、名前と電話番号をそのまま確定した
後、図18(a)の表示において「スル」を選択する
と、図18(d)の画面が表示され、この登録データに
関する音声データの入れ替えを行うことができる。 (6)電話帳検索操作 つぎに、電話帳データの検索を示す。図19は電話帳検
索時の操作における画面表示を示す図である。スタンバ
イ状態、または回線捕捉後に電話帳キー(セットキー6
0)を押下し、上下カーソル移動キー61、62を操作
することにより、LCD56上に電話帳に登録されてい
る略称が順次(例えば、あいうえお順で)表示される
(図19(a)〜(c))。図19(a)の状態から下
カーソルキー62を押下すると、図19(b)の画面が
表示され、この状態で上カーソルキー61を押下する
と、図19(c)の画面が表示される。表示されている
略称を選択し、右カーソルキー64を押下すると、図1
9(d)の詳細表示(番号表示)の画面となる。
字」キーを押下し、名前と電話番号をそのまま確定した
後、図18(a)の表示において「スル」を選択する
と、図18(d)の画面が表示され、この登録データに
関する音声データの入れ替えを行うことができる。 (6)電話帳検索操作 つぎに、電話帳データの検索を示す。図19は電話帳検
索時の操作における画面表示を示す図である。スタンバ
イ状態、または回線捕捉後に電話帳キー(セットキー6
0)を押下し、上下カーソル移動キー61、62を操作
することにより、LCD56上に電話帳に登録されてい
る略称が順次(例えば、あいうえお順で)表示される
(図19(a)〜(c))。図19(a)の状態から下
カーソルキー62を押下すると、図19(b)の画面が
表示され、この状態で上カーソルキー61を押下する
と、図19(c)の画面が表示される。表示されている
略称を選択し、右カーソルキー64を押下すると、図1
9(d)の詳細表示(番号表示)の画面となる。
【0113】この状態で、上下カーソルキーを操作する
と、詳細表示の直前の状態から上下カーソルキーを押下
したのと同じ動作を行う。また、ストップキー68を押
下すると、スタンバイ状態に、あるいは回線捕捉中であ
る場合、「TEL=」の表示に戻る。
と、詳細表示の直前の状態から上下カーソルキーを押下
したのと同じ動作を行う。また、ストップキー68を押
下すると、スタンバイ状態に、あるいは回線捕捉中であ
る場合、「TEL=」の表示に戻る。
【0114】さて、図19の(a)〜(c)のいずれか
の状態において(本実施形態では、図19の(c)の状
態とする)、セットキー60が押下されると、回線捕捉
中である場合、図19(e)の画面が表示され、ダイヤ
ル発呼を行う。また、回線捕捉中でない場合、セットキ
ー60の押下は無視され、図19の(c)の表示状態を
維持する。 (7)音声認識による電話帳検索 つぎに、音声認識による電話帳検索について示す。音声
認識キー72を押し、宛先の略称を発声し、それを音声
認識することで、共通の電話帳を使った宛先ダイヤルが
実行される。あるいは、音声認識キー72を押して個人
用ID(図5では、ミユキやテツヤなど)を発声する
と、これを音声認識することによって個人用IDテーブ
ル92から個人用電話帳テーブル93が指定される。個
人用電話帳テーブル93が選択された場合、さらに宛先
の略称を続けて発声し、それを音声認識することで、こ
の個人用の電話帳を使った宛先ダイヤルが実行される。
の状態において(本実施形態では、図19の(c)の状
態とする)、セットキー60が押下されると、回線捕捉
中である場合、図19(e)の画面が表示され、ダイヤ
ル発呼を行う。また、回線捕捉中でない場合、セットキ
ー60の押下は無視され、図19の(c)の表示状態を
維持する。 (7)音声認識による電話帳検索 つぎに、音声認識による電話帳検索について示す。音声
認識キー72を押し、宛先の略称を発声し、それを音声
認識することで、共通の電話帳を使った宛先ダイヤルが
実行される。あるいは、音声認識キー72を押して個人
用ID(図5では、ミユキやテツヤなど)を発声する
と、これを音声認識することによって個人用IDテーブ
ル92から個人用電話帳テーブル93が指定される。個
人用電話帳テーブル93が選択された場合、さらに宛先
の略称を続けて発声し、それを音声認識することで、こ
の個人用の電話帳を使った宛先ダイヤルが実行される。
【0115】図20および図21は音声認識による電話
帳検索操作における画面表示を示す図である。図22、
図23および図24は音声認識による電話帳検索処理手
順を示すフローチャートである。この処理プログラムは
ROM21に格納されており、CPU1によって実行さ
れる。
帳検索操作における画面表示を示す図である。図22、
図23および図24は音声認識による電話帳検索処理手
順を示すフローチャートである。この処理プログラムは
ROM21に格納されており、CPU1によって実行さ
れる。
【0116】本ファクシミリ装置が待機状態である場
合、音声認識キー72による電話帳検索処理を開始す
る。まず、図20(a)に示される初期画面の表示を行
うとともに、カウンタNの値を「0」にセットするとい
う初期化処理を行う(ステップS61)。また、この初
期化処理において、オペレートタスク32は音声登録テ
ーブル94の「除外フラグ」を全てOFFにセットす
る。
合、音声認識キー72による電話帳検索処理を開始す
る。まず、図20(a)に示される初期画面の表示を行
うとともに、カウンタNの値を「0」にセットするとい
う初期化処理を行う(ステップS61)。また、この初
期化処理において、オペレートタスク32は音声登録テ
ーブル94の「除外フラグ」を全てOFFにセットす
る。
【0117】図20(b)に示すようなガイダンス表示
を行うとともに、ガイドトーン(ピー音)を所定時間出
力する(ステップS61A)。その直後、ハンドセット
6がオフフック状態かオンフック状態かを判断する(ス
テップS61B)。
を行うとともに、ガイドトーン(ピー音)を所定時間出
力する(ステップS61A)。その直後、ハンドセット
6がオフフック状態かオンフック状態かを判断する(ス
テップS61B)。
【0118】オフフック状態である場合、音声入力装置
をハンドセット6に切り替える(ステップS61C)。
一方、オンフック状態である場合、音声入力装置をマイ
ク7に切り替える(ステップS61D)。オンフック状
態かオフフック状態かの判断は、入力装置検出部27の
検出結果に基づいて行われ、音声入力装置をハンドセッ
ト6あるいはマイク7のいずれかに切り替える制御は、
クロスポイントSW4によって行われる。
をハンドセット6に切り替える(ステップS61C)。
一方、オンフック状態である場合、音声入力装置をマイ
ク7に切り替える(ステップS61D)。オンフック状
態かオフフック状態かの判断は、入力装置検出部27の
検出結果に基づいて行われ、音声入力装置をハンドセッ
ト6あるいはマイク7のいずれかに切り替える制御は、
クロスポイントSW4によって行われる。
【0119】そして、ハンドセット6がオフフックであ
るか否かを判別し(ステップS62)、ハンドセット6
がオンフックである場合、そのままステップS64の処
理に移行し、ハンドセット6がオフフックである場合、
図21(a)、(b)に示すようなガイダンス表示を行
うとともに、ガイドトーン(ピー音)を所定時間出力す
る(ステップS63)。
るか否かを判別し(ステップS62)、ハンドセット6
がオンフックである場合、そのままステップS64の処
理に移行し、ハンドセット6がオフフックである場合、
図21(a)、(b)に示すようなガイダンス表示を行
うとともに、ガイドトーン(ピー音)を所定時間出力す
る(ステップS63)。
【0120】この後、図20(c)あるいは図21
(c)のように、ユーザに発声開始可能状態を報知する
画面の表示を行い、ユーザが音声入力するのを待つ。ユ
ーザによる音声の入力を検知すると、オペレートタスク
32は、図20(d)あるいは図21(d)に示すよう
に、音声の入力を検知し、メモリに音声データを格納中
であること、すなわち、音声取り込み中であることを、
ユーザに報知する画面の表示を行うとともに、音声認識
スタートコマンド(本実施形態では、図6の3か4が発
行される)を音声認識タスク38に対して発行する(ス
テップS64)。そして、音声認識タスク38より音声
認識結果コマンド(図7参照)が入力されるのを待つ
(ステップS65)。
(c)のように、ユーザに発声開始可能状態を報知する
画面の表示を行い、ユーザが音声入力するのを待つ。ユ
ーザによる音声の入力を検知すると、オペレートタスク
32は、図20(d)あるいは図21(d)に示すよう
に、音声の入力を検知し、メモリに音声データを格納中
であること、すなわち、音声取り込み中であることを、
ユーザに報知する画面の表示を行うとともに、音声認識
スタートコマンド(本実施形態では、図6の3か4が発
行される)を音声認識タスク38に対して発行する(ス
テップS64)。そして、音声認識タスク38より音声
認識結果コマンド(図7参照)が入力されるのを待つ
(ステップS65)。
【0121】音声認識結果コマンドを入力し、入力した
音声認識結果コマンドに基づき、この認識結果が正常に
終了したか否かを判定する(ステップS66)。この認
識結果コマンドが「NG」を表すコマンドである場合、
SRAM24上の「理由コード表示する」のスイッチ項
目がONされているか否かを判別し(ステップS7
0)、ONされている場合、理由コードにしたがって操
作パネル22上のLCD56にNG理由を表示し(ステ
ップS71)、さらにエラーを表示し(ステップS7
2)、待機状態に移行する。
音声認識結果コマンドに基づき、この認識結果が正常に
終了したか否かを判定する(ステップS66)。この認
識結果コマンドが「NG」を表すコマンドである場合、
SRAM24上の「理由コード表示する」のスイッチ項
目がONされているか否かを判別し(ステップS7
0)、ONされている場合、理由コードにしたがって操
作パネル22上のLCD56にNG理由を表示し(ステ
ップS71)、さらにエラーを表示し(ステップS7
2)、待機状態に移行する。
【0122】一方、ステップS66での認識結果がOK
である場合、音声認識結果コマンドに含まれている登録
番号を基に電話帳データ82内の各種テーブルを検索
し、その登録番号を有する該当項目を見つける。ここ
で、該当項目が個人用IDテーブルに登録されたもので
あった場合、その略称とともに個人用電話帳が指定され
た旨を操作パネル22上のLCD56に表示する(ステ
ップS69)。そして、「個人用電話帳テーブル」の宛
先検索用として、再び音声認識処理を行うために、ステ
ップS61Aの処理に戻る。
である場合、音声認識結果コマンドに含まれている登録
番号を基に電話帳データ82内の各種テーブルを検索
し、その登録番号を有する該当項目を見つける。ここ
で、該当項目が個人用IDテーブルに登録されたもので
あった場合、その略称とともに個人用電話帳が指定され
た旨を操作パネル22上のLCD56に表示する(ステ
ップS69)。そして、「個人用電話帳テーブル」の宛
先検索用として、再び音声認識処理を行うために、ステ
ップS61Aの処理に戻る。
【0123】尚、このとき、ステップS69において、
個人用電話帳テーブル93による宛先検索への処理の移
行を許可する旨を、ユーザが指示するようにしてもよ
い。ここで、ユーザが個人用電話帳テーブルによる宛先
検索への移行を拒否した場合、再度、電話帳データテー
ブル91と個人用IDテーブル92を対象とした宛先検
索が行われる。
個人用電話帳テーブル93による宛先検索への処理の移
行を許可する旨を、ユーザが指示するようにしてもよ
い。ここで、ユーザが個人用電話帳テーブルによる宛先
検索への移行を拒否した場合、再度、電話帳データテー
ブル91と個人用IDテーブル92を対象とした宛先検
索が行われる。
【0124】また、該当項目が共通の「電話帳データテ
ーブル」に登録されたものである場合、あるいは個人用
電話帳テーブルが選択された後にその選択された「個人
用電話帳テーブル」に登録されたものであった場合、認
識結果をユーザに示すため、図20(e)あるいは図2
1(e)に示すように、LCD56にその項目の「宛先
略称」を表示する。
ーブル」に登録されたものである場合、あるいは個人用
電話帳テーブルが選択された後にその選択された「個人
用電話帳テーブル」に登録されたものであった場合、認
識結果をユーザに示すため、図20(e)あるいは図2
1(e)に示すように、LCD56にその項目の「宛先
略称」を表示する。
【0125】つぎに、このダイヤル発呼がファクシミリ
送信であるか否かを判別する(ステップS74)。ファ
クシミリ送信であるか否かを判別する際、原稿入り口に
原稿がセット済みであるか、あるいはファクシミリ送信
のための画質情報がセット済みであるか等により、ファ
クシミリ送信であることが判別される。ファクシミリ送
信でない場合、「セットキー待ち」が指定されているか
否かを判別する(ステップS75)。
送信であるか否かを判別する(ステップS74)。ファ
クシミリ送信であるか否かを判別する際、原稿入り口に
原稿がセット済みであるか、あるいはファクシミリ送信
のための画質情報がセット済みであるか等により、ファ
クシミリ送信であることが判別される。ファクシミリ送
信でない場合、「セットキー待ち」が指定されているか
否かを判別する(ステップS75)。
【0126】SRAM24内のスイッチ「音声ダイヤル
のセットキー待ち」の項目が「セットキー待ち」に設定
されている場合、セットキー60の入力を待ち(ステッ
プS79)、セットキー60を押すことで、ダイヤル実
行に移行する。
のセットキー待ち」の項目が「セットキー待ち」に設定
されている場合、セットキー60の入力を待ち(ステッ
プS79)、セットキー60を押すことで、ダイヤル実
行に移行する。
【0127】一方、ステップS75でSRAM24内の
スイッチ「音声ダイヤルのセットキー待ち」の項目が
「自動」に設定されている場合、セットキー60の入力
を待たずにダイヤル発呼の実行に移行する。尚、ファク
シミリ送信の操作を実施している場合、スイッチに関係
なくセットキー60の押下が必要である。これは、誤認
識による送信の可能性を避けるためである。したがっ
て、ファクシミリ送信である場合、ステップS79の処
理に進む。
スイッチ「音声ダイヤルのセットキー待ち」の項目が
「自動」に設定されている場合、セットキー60の入力
を待たずにダイヤル発呼の実行に移行する。尚、ファク
シミリ送信の操作を実施している場合、スイッチに関係
なくセットキー60の押下が必要である。これは、誤認
識による送信の可能性を避けるためである。したがっ
て、ファクシミリ送信である場合、ステップS79の処
理に進む。
【0128】自動的にダイヤル実行に移行する場合、ユ
ーザが宛先表示を確認する時間が必要となるので、タイ
マ時間Tだけ遅延させてダイヤルの実行をスタートする
(ステップS76、S77、S78)。
ーザが宛先表示を確認する時間が必要となるので、タイ
マ時間Tだけ遅延させてダイヤルの実行をスタートする
(ステップS76、S77、S78)。
【0129】時間Tは予めSRAM24に設定された所
定値であるが、ユーザの操作で変更することも可能であ
る。また、この状態でストップキー68を押下すると、
ステップS77の判別処理で待機状態に移行するので、
処理を中断することができる。
定値であるが、ユーザの操作で変更することも可能であ
る。また、この状態でストップキー68を押下すると、
ステップS77の判別処理で待機状態に移行するので、
処理を中断することができる。
【0130】ダイヤル実行のために、セットキー60の
押下を待っている状態で、ユーザが操作パネル22上の
LCD56に表示された略称を見て、宛先誤認識を発見
した場合、ここで、音声認識キー72を押すことによ
り、その選択されている宛先を取り消し、新たな宛先の
入力の開始を指示することができる。すなわち、ステッ
プS79でセットキー60が押下されない場合、音声認
識キー72が押下されたか否かを判別し(ステップS8
0)、音声認識キー72が押下された場合、カウンタN
の値を「1」増加させる(ステップS81)。そして、
カウンタNの値と音声データの登録数とを比較し(ステ
ップS82)、カウンタNが音声データの登録数以上で
ある場合、該当する認識結果はないとして、エラー表示
を行い(ステップS72)、待機状態に移行する。
押下を待っている状態で、ユーザが操作パネル22上の
LCD56に表示された略称を見て、宛先誤認識を発見
した場合、ここで、音声認識キー72を押すことによ
り、その選択されている宛先を取り消し、新たな宛先の
入力の開始を指示することができる。すなわち、ステッ
プS79でセットキー60が押下されない場合、音声認
識キー72が押下されたか否かを判別し(ステップS8
0)、音声認識キー72が押下された場合、カウンタN
の値を「1」増加させる(ステップS81)。そして、
カウンタNの値と音声データの登録数とを比較し(ステ
ップS82)、カウンタNが音声データの登録数以上で
ある場合、該当する認識結果はないとして、エラー表示
を行い(ステップS72)、待機状態に移行する。
【0131】一方、ステップS82でカウンタNの値が
音声データの登録数より小さい場合、オペレートタスク
32は表示中の宛先を除外し、再び音声認識するように
音声認識タスクに依頼する。すなわち、このとき選択さ
れている宛先を除外するように、この音声データの登録
番号を限定認識の音声認識スタートコマンド(コマンド
5か6)に付加し(ステップS83)、音声認識タスク
38に発行する(ステップS84)。この後、ステップ
S65の処理に戻る。このとき、音声認識タスク38
は、入力したコマンドに付加されている登録番号に対応
する除外対象の音声登録データの「除外フラグ」をON
にして再び音声認識処理を実行する。
音声データの登録数より小さい場合、オペレートタスク
32は表示中の宛先を除外し、再び音声認識するように
音声認識タスクに依頼する。すなわち、このとき選択さ
れている宛先を除外するように、この音声データの登録
番号を限定認識の音声認識スタートコマンド(コマンド
5か6)に付加し(ステップS83)、音声認識タスク
38に発行する(ステップS84)。この後、ステップ
S65の処理に戻る。このとき、音声認識タスク38
は、入力したコマンドに付加されている登録番号に対応
する除外対象の音声登録データの「除外フラグ」をON
にして再び音声認識処理を実行する。
【0132】再度、音声認識した結果、認識された略称
表示が再び誤認識である場合、セットキー60を押さず
に再度、音声認識キー72を押せばよい。こうすること
により、前回の認識宛先に加えて今回の認識宛先が除外
されたまま、新たな音声認識が実行されることになる。
すなわち、音声登録テーブル94において、該当する除
外フラグがONとなり、対応する音声データは次回の音
声認識に用いられない。
表示が再び誤認識である場合、セットキー60を押さず
に再度、音声認識キー72を押せばよい。こうすること
により、前回の認識宛先に加えて今回の認識宛先が除外
されたまま、新たな音声認識が実行されることになる。
すなわち、音声登録テーブル94において、該当する除
外フラグがONとなり、対応する音声データは次回の音
声認識に用いられない。
【0133】また、図21に示される操作手順は、ハン
ドセット6をオフフックしてから音声認識キー72を押
して電話をかける(ファクシミリ送信を行う)場合を示
している。すなわち、ハンドセット6をオフフックする
ことで、図21(a)のように、電話番号の入力をオペ
レータに促す画面の表示が行われる。この状態では、通
常のダイヤル通話が可能である。ここで、音声認識キー
72を押すと、図21(b)に示す画面が表示され、以
降、図20の(b)、(e)と同じである。また、その
処理内容も図22、図23および図24のフローチャー
トで示したものと同様である。
ドセット6をオフフックしてから音声認識キー72を押
して電話をかける(ファクシミリ送信を行う)場合を示
している。すなわち、ハンドセット6をオフフックする
ことで、図21(a)のように、電話番号の入力をオペ
レータに促す画面の表示が行われる。この状態では、通
常のダイヤル通話が可能である。ここで、音声認識キー
72を押すと、図21(b)に示す画面が表示され、以
降、図20の(b)、(e)と同じである。また、その
処理内容も図22、図23および図24のフローチャー
トで示したものと同様である。
【0134】尚、図22、図23および図24に示した
例では、再試行の回数は音声データの登録数と一致して
いるが、これに限らず、例えば、ステップS82で比較
される回数を登録数以外の所定数に設定してもよい。ま
た、ステップS77でストップキー68が検出された場
合、ダイヤルの実行を行わずに待機状態に移行して本処
理を終了するが、このタイミングで音声認識キー72を
押すことで、音声認識の再試行が行われるようにしても
よい。すなわち、ステップS77からS80に処理を移
すようにしてもよい。
例では、再試行の回数は音声データの登録数と一致して
いるが、これに限らず、例えば、ステップS82で比較
される回数を登録数以外の所定数に設定してもよい。ま
た、ステップS77でストップキー68が検出された場
合、ダイヤルの実行を行わずに待機状態に移行して本処
理を終了するが、このタイミングで音声認識キー72を
押すことで、音声認識の再試行が行われるようにしても
よい。すなわち、ステップS77からS80に処理を移
すようにしてもよい。
【0135】また、上記処理手順では、除外フラグのリ
セットを音声認識の開始時(ステップS61)に行う
が、開始時に限らず、例えば、エラーによってステップ
S72から待機状態に移行したとき、ストップキー68
によりステップS77から待機状態に移行したとき、あ
るいはダイヤルが実行されたときに除外フラグをリセッ
トするようにしてもよい。
セットを音声認識の開始時(ステップS61)に行う
が、開始時に限らず、例えば、エラーによってステップ
S72から待機状態に移行したとき、ストップキー68
によりステップS77から待機状態に移行したとき、あ
るいはダイヤルが実行されたときに除外フラグをリセッ
トするようにしてもよい。
【0136】このように、本実施形態では、音声認識実
行時、誤認識(音声を登録した環境と、認識のために音
声を入力した環境が違う等による)が発生した場合、オ
ペレータが装置を停止させて待機状態に戻し、再び操作
をやり直すという必要がなくなり、誤認識発生時、即座
に再試行することができる。そして、この再試行時、前
回までの試行で誤認識した音声データの候補が除外され
るので、操作性、信頼性を大幅に向上させることが可能
となる。
行時、誤認識(音声を登録した環境と、認識のために音
声を入力した環境が違う等による)が発生した場合、オ
ペレータが装置を停止させて待機状態に戻し、再び操作
をやり直すという必要がなくなり、誤認識発生時、即座
に再試行することができる。そして、この再試行時、前
回までの試行で誤認識した音声データの候補が除外され
るので、操作性、信頼性を大幅に向上させることが可能
となる。
【0137】また、この音声認識から除外された音声デ
ータは、次の新たな操作において、自動的に復帰される
ので、オペレータは音声認識の再試行時に音声データの
消去や再登録の必要が無くなり、操作性、信頼性を大幅
に向上させることができる。
ータは、次の新たな操作において、自動的に復帰される
ので、オペレータは音声認識の再試行時に音声データの
消去や再登録の必要が無くなり、操作性、信頼性を大幅
に向上させることができる。
【0138】すなわち、音声認識実行時に誤認識が発生
した場合、音声データの削除や再登録を行うことなく簡
単に再試行が可能になり、さらには再試行時の認識確率
を大幅に向上させることが可能になる。ここで、音声認
識の再試行では、再度、音声入力から行うことになる。
例えば、発声したときに限って他人の声や自動車の音な
どが入力されてしまうと、その音声で認識した候補群
(第1位候補や下位候補を含む)は全く信頼性の低いも
のとなる。したがって、明らかに誤認識した宛先を除い
て再度、音声入力を行うことは効率的でもあり、信頼性
を高める上で重要である。
した場合、音声データの削除や再登録を行うことなく簡
単に再試行が可能になり、さらには再試行時の認識確率
を大幅に向上させることが可能になる。ここで、音声認
識の再試行では、再度、音声入力から行うことになる。
例えば、発声したときに限って他人の声や自動車の音な
どが入力されてしまうと、その音声で認識した候補群
(第1位候補や下位候補を含む)は全く信頼性の低いも
のとなる。したがって、明らかに誤認識した宛先を除い
て再度、音声入力を行うことは効率的でもあり、信頼性
を高める上で重要である。
【0139】また、上記実施形態によれば、共通電話帳
に加えて、個人別の電話帳データを登録可能とし、これ
に音声データを対応付けることができる。すなわち、個
人別電話帳毎に、特定話者を前提とした音声認識アルゴ
リズムによる音声認識ダイヤルを実現できる。このた
め、複数の使用者が使用したとしても、認識精度の高い
認識ダイヤル機能を提供することができ、利便性・信頼
性が大幅に向上する。
に加えて、個人別の電話帳データを登録可能とし、これ
に音声データを対応付けることができる。すなわち、個
人別電話帳毎に、特定話者を前提とした音声認識アルゴ
リズムによる音声認識ダイヤルを実現できる。このた
め、複数の使用者が使用したとしても、認識精度の高い
認識ダイヤル機能を提供することができ、利便性・信頼
性が大幅に向上する。
【0140】さらに、上記実施形態によれば、音声認識
のための音声データを登録する際、複数回の発声データ
を登録し、認識精度の向上を図っている。また、このよ
うな音声登録処理において、音声データを登録するため
の必要試行回数を表示するようにしたので、必要回数分
の音声入力を行わずにオペレータが処理を中断してしま
うことを防ぎ、現在何回目の登録を行っているかをいち
いち記憶することからユーザを解散し、操作に著しいス
トレスを感じたりすることなく、登録操作を行うことが
できる。
のための音声データを登録する際、複数回の発声データ
を登録し、認識精度の向上を図っている。また、このよ
うな音声登録処理において、音声データを登録するため
の必要試行回数を表示するようにしたので、必要回数分
の音声入力を行わずにオペレータが処理を中断してしま
うことを防ぎ、現在何回目の登録を行っているかをいち
いち記憶することからユーザを解散し、操作に著しいス
トレスを感じたりすることなく、登録操作を行うことが
できる。
【0141】また、上記実施形態によれば、音声認識の
ための音声データを登録する際、ユーザが音声入力しよ
うとする時に登録略称を同時に表示し、登録内容と同じ
言葉の入力をユーザに促すことで、登録略称に対して正
しい音声データを関連付けることが可能となる。さら
に、登録略称表示にしたがって、音声データを登録する
場合、表示略称を話した程度の程よい長さの音声データ
長となり、不必要に長い音声データとならないので、登
録メモリを効率的に使用することができる。
ための音声データを登録する際、ユーザが音声入力しよ
うとする時に登録略称を同時に表示し、登録内容と同じ
言葉の入力をユーザに促すことで、登録略称に対して正
しい音声データを関連付けることが可能となる。さら
に、登録略称表示にしたがって、音声データを登録する
場合、表示略称を話した程度の程よい長さの音声データ
長となり、不必要に長い音声データとならないので、登
録メモリを効率的に使用することができる。
【0142】そして、後から電話をかけようとした時に
電話をかけようとする宛先に何を話せば良いかを忘れて
しまった場合でも、電話帳の略称を見ることで正しい言
葉を見つけ出すことが可能となる。
電話をかけようとする宛先に何を話せば良いかを忘れて
しまった場合でも、電話帳の略称を見ることで正しい言
葉を見つけ出すことが可能となる。
【0143】また、上記実施形態によれば、音声認識実
行時に認識不能(音声を登録した環境と、認識のために
音声を入力した環境が違う等による)であった場合、オ
ペレータに理由情報を通知することが可能である。この
ため、再試行時の認識精度が改善され、さらに操作性、
信頼性を大幅に向上させることが可能になる。例えば、
登録時に音声変換手段が音声を変換する際に特徴抽出に
失敗した場合、音声変換手段から音声登録に失敗した理
由情報が出力されてオペレータに通知される。これによ
り、例えば、声が大き過ぎる場合、小さい声で、声が小
さ過ぎる場合、大きい声で、騒音がひどい場合、静かな
場所で登録し直すことにより、音声データが正しく登録
されるようになり、認識精度も大幅に向上する。
行時に認識不能(音声を登録した環境と、認識のために
音声を入力した環境が違う等による)であった場合、オ
ペレータに理由情報を通知することが可能である。この
ため、再試行時の認識精度が改善され、さらに操作性、
信頼性を大幅に向上させることが可能になる。例えば、
登録時に音声変換手段が音声を変換する際に特徴抽出に
失敗した場合、音声変換手段から音声登録に失敗した理
由情報が出力されてオペレータに通知される。これによ
り、例えば、声が大き過ぎる場合、小さい声で、声が小
さ過ぎる場合、大きい声で、騒音がひどい場合、静かな
場所で登録し直すことにより、音声データが正しく登録
されるようになり、認識精度も大幅に向上する。
【0144】尚、以上が本発明の実施の形態の説明であ
るが、本発明は、これら実施の形態の構成に限られるも
のではなく、特許請求の範囲で示した機能、または実施
の形態の構成が持つ機能が達成できる構成であればどの
ようなものであっても適用可能である。
るが、本発明は、これら実施の形態の構成に限られるも
のではなく、特許請求の範囲で示した機能、または実施
の形態の構成が持つ機能が達成できる構成であればどの
ようなものであっても適用可能である。
【0145】例えば、上記実施形態では、ステップS6
1Bにおいてハンドセットがオンフックであった場合、
ステップS61Dにおいて音声入力を本体マイクから行
う経路に切り替えて音声認識を開始したが、音声認識を
開始した後、一定時間内にハンドセットのオフフックが
検出された場合、音声入力をハンドセットから行う経路
に切り替えて音声認識をやり直すようにしてもよい。
1Bにおいてハンドセットがオンフックであった場合、
ステップS61Dにおいて音声入力を本体マイクから行
う経路に切り替えて音声認識を開始したが、音声認識を
開始した後、一定時間内にハンドセットのオフフックが
検出された場合、音声入力をハンドセットから行う経路
に切り替えて音声認識をやり直すようにしてもよい。
【0146】上記実施形態では、ファクシミリ装置に本
発明を適用し、登録される宛先として電話番号を例示し
た。しかし、本発明はこれに限られるものではなく、例
えばインターネットアドレスを宛先として音声に対応付
けることも可能である。これにより、宛先略称を音声入
力するだけで、例えばインターネットのURLを獲得で
き、煩雑なキー入力を行わずに済むので、操作性が著し
く向上する。
発明を適用し、登録される宛先として電話番号を例示し
た。しかし、本発明はこれに限られるものではなく、例
えばインターネットアドレスを宛先として音声に対応付
けることも可能である。これにより、宛先略称を音声入
力するだけで、例えばインターネットのURLを獲得で
き、煩雑なキー入力を行わずに済むので、操作性が著し
く向上する。
【0147】すなわち、本発明は、ファクシミリ装置
(電話機)を含め、LANに接続された、あるいはモデ
ムを介して回線に接続されたコンピュータ等、通信網に
おける相手先のアドレスを指定して通信を行う装置(こ
れらを通信装置と称する)に適用可能である。
(電話機)を含め、LANに接続された、あるいはモデ
ムを介して回線に接続されたコンピュータ等、通信網に
おける相手先のアドレスを指定して通信を行う装置(こ
れらを通信装置と称する)に適用可能である。
【0148】また、本発明は複数の機器(例えば、ホス
トコンピュータ、インターフェース機器、リーダ、プリ
ンタなど)から構成されるシステムに適用してもよい
し、1つの機器からなる装置に適用してもよい。
トコンピュータ、インターフェース機器、リーダ、プリ
ンタなど)から構成されるシステムに適用してもよい
し、1つの機器からなる装置に適用してもよい。
【0149】また、本発明は、前述した実施形態の機能
を実現するソフトウェアのプログラムコードを記憶した
記録媒体を、システムあるいは装置にプログラムを供給
することによって達成される場合にも適用できることは
いうまでもない。この場合、記憶媒体から読み出された
プログラムコード自体が本発明の新規な機能を実現する
ことになり、そのプログラムを記憶した記憶媒体は本発
明を構成することになる。
を実現するソフトウェアのプログラムコードを記憶した
記録媒体を、システムあるいは装置にプログラムを供給
することによって達成される場合にも適用できることは
いうまでもない。この場合、記憶媒体から読み出された
プログラムコード自体が本発明の新規な機能を実現する
ことになり、そのプログラムを記憶した記憶媒体は本発
明を構成することになる。
【0150】上記実施形態では、図10、図14、図1
5、図22、図23、図24のフローチャートに示すプ
ログラムコードは記憶媒体であるROMに格納されてい
る。プログラムコードを供給する記憶媒体としては、例
えばフロッピー(登録商標)ディスク、ハードディス
ク、光ディスク、光磁気ディスク、CD−ROM、CD
−R、DVD、磁気テープ、不揮発性のメモリカードな
どを用いることができる。
5、図22、図23、図24のフローチャートに示すプ
ログラムコードは記憶媒体であるROMに格納されてい
る。プログラムコードを供給する記憶媒体としては、例
えばフロッピー(登録商標)ディスク、ハードディス
ク、光ディスク、光磁気ディスク、CD−ROM、CD
−R、DVD、磁気テープ、不揮発性のメモリカードな
どを用いることができる。
【0151】また、コンピュータが読み出したプログラ
ムコードを実行することにより、前述した実施形態の機
能が実現されるだけでなく、そのプログラムコードの指
示に基づき、コンピュータ上で稼働しているOSなどが
実際の処理の一部または全部を行い、その処理によって
前述した実施形態の機能が実現される場合も含まれるこ
とは言うまでもない。
ムコードを実行することにより、前述した実施形態の機
能が実現されるだけでなく、そのプログラムコードの指
示に基づき、コンピュータ上で稼働しているOSなどが
実際の処理の一部または全部を行い、その処理によって
前述した実施形態の機能が実現される場合も含まれるこ
とは言うまでもない。
【0152】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された拡張機能ボー
ドやコンピュータに接続された機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
ラムコードが、コンピュータに挿入された拡張機能ボー
ドやコンピュータに接続された機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0153】またさらに、上記実施形態によれば、音声
認識処理によって個人用IDテーブル92に登録された
ユーザが特定された場合、その特定されたユーザの個人
用電話帳テーブル93を用いて、後述の音声入力を音声
認識することにより、宛先(略称)および電話番号を獲
得する。したがって、個人用電話帳テーブル93を用い
た音声認識処理は、特定話者による認識処理を効果的に
適用でき、認識精度が向上する。
認識処理によって個人用IDテーブル92に登録された
ユーザが特定された場合、その特定されたユーザの個人
用電話帳テーブル93を用いて、後述の音声入力を音声
認識することにより、宛先(略称)および電話番号を獲
得する。したがって、個人用電話帳テーブル93を用い
た音声認識処理は、特定話者による認識処理を効果的に
適用でき、認識精度が向上する。
【0154】また、上記実施形態では、個人用IDテー
ブル92におけるユーザ名(略称)が入力音声によって
特定された場合、その特定されたユーザ名を表示した
後、使用者の操作指示を待って個人用電話帳テーブル9
3を用いた音声認識に移行することにより、使用者の意
図を確実に反映したダイヤル発信を行うことができるよ
うになり、信頼性が向上するとともに、不要な回線の捕
捉を減少させることができる。
ブル92におけるユーザ名(略称)が入力音声によって
特定された場合、その特定されたユーザ名を表示した
後、使用者の操作指示を待って個人用電話帳テーブル9
3を用いた音声認識に移行することにより、使用者の意
図を確実に反映したダイヤル発信を行うことができるよ
うになり、信頼性が向上するとともに、不要な回線の捕
捉を減少させることができる。
【0155】
【発明の効果】本発明によれば、音声認識ダイヤル時、
例えば単一のキー操作による音声認識開始操作を行うだ
けで、ユーザの行いたい通話方法と同じ音声入力経路で
音声認識ダイヤルを行うことができ、ユーザ操作を簡便
にし、さらには受話器を使うことなく音声認識ダイヤル
を行うことができる。
例えば単一のキー操作による音声認識開始操作を行うだ
けで、ユーザの行いたい通話方法と同じ音声入力経路で
音声認識ダイヤルを行うことができ、ユーザ操作を簡便
にし、さらには受話器を使うことなく音声認識ダイヤル
を行うことができる。
【0156】例えば、受話器を上げた状態で音声認識キ
ーを押下することにより、受話器からの音声認識ダイヤ
ルを行い、また、受話器を置いた状態で音声認識キーを
押下することにより、本体マイクからの音声認識ダイヤ
ルを行う。さらに、受話器を置いた状態で音声認識キー
を押下した後、一定時間内に受話器を上げた場合、受話
器からの音声認識ダイヤルを行う。このよう、ユーザの
意図する操作方法で音声認識ダイヤル操作を行うことを
可能にすることで、ユニバーサルデザインを実現でき
る。
ーを押下することにより、受話器からの音声認識ダイヤ
ルを行い、また、受話器を置いた状態で音声認識キーを
押下することにより、本体マイクからの音声認識ダイヤ
ルを行う。さらに、受話器を置いた状態で音声認識キー
を押下した後、一定時間内に受話器を上げた場合、受話
器からの音声認識ダイヤルを行う。このよう、ユーザの
意図する操作方法で音声認識ダイヤル操作を行うことを
可能にすることで、ユニバーサルデザインを実現でき
る。
【0157】したがって、ダイヤル時にユーザが選択し
た音声入力装置から容易に音声認識ダイヤル操作を行う
ことができる。
た音声入力装置から容易に音声認識ダイヤル操作を行う
ことができる。
【図1】実施の形態におけるファクシミリ装置の構成を
示すブロック図である。
示すブロック図である。
【図2】ファクシミリ装置の操作パネルを示す図であ
る。
る。
【図3】ファクシミリ装置におけるタスク構成を示す図
である。
である。
【図4】電話帳機能、音声登録および音声認識に係わる
制御を示す図である。
制御を示す図である。
【図5】電話帳データおよび音声登録メモリのデータ構
成を示す図である。
成を示す図である。
【図6】オペレートタスク32から音声認識タスク38
に発行される音声認識スタートコマンドの種類と内容を
示す図である。
に発行される音声認識スタートコマンドの種類と内容を
示す図である。
【図7】音声認識タスク38からオペレートタスク32
に発行される音声認識結果コマンドの種類および内容を
示す図である。
に発行される音声認識結果コマンドの種類および内容を
示す図である。
【図8】理由コード、処理種別および理由内容の関係を
示す図である。
示す図である。
【図9】個人別電話帳の作成処理操作における画面表示
を示す図である。
を示す図である。
【図10】個人別電話帳の登録処理手順を示すフローチ
ャートである。
ャートである。
【図11】電話帳へのデータ登録における画面表示を示
す図である。
す図である。
【図12】電話帳への音声データ登録における画面表示
を示す図である。
を示す図である。
【図13】電話帳への音声データ登録における画面表示
を示す図である。
を示す図である。
【図14】電話帳へのデータ登録処理手順を示すフロー
チャートである。
チャートである。
【図15】電話帳への音声データ登録処理手順を示すフ
ローチャートである。
ローチャートである。
【図16】電話帳データの登録内容の修正操作における
画面表示を示す図である。
画面表示を示す図である。
【図17】電話帳データの登録内容の削除操作における
画面表示を示す図である。
画面表示を示す図である。
【図18】音声データの削除操作における画面表示を示
す図である。
す図である。
【図19】電話帳検索時の操作における画面表示を示す
図である。
図である。
【図20】音声認識による電話帳検索操作における画面
表示を示す図である。
表示を示す図である。
【図21】音声認識による電話帳検索操作における画面
表示を示す図である。
表示を示す図である。
【図22】音声認識による電話帳検索処理手順を示すフ
ローチャートである。
ローチャートである。
【図23】図22につづく音声認識による電話帳検索処
理手順を示すフローチャートである。
理手順を示すフローチャートである。
【図24】図22および図23につづく音声認識による
電話帳検索処理手順を示すフローチャートである。
電話帳検索処理手順を示すフローチャートである。
1 CPU 4 クロスポイントSW 6 ハンドセット 7 マイク 21 ROM 22 操作パネル 24 SRAM 27 入力装置検出部 32 オペレートタスク 38 音声認識タスク 56 LCD 60 セットキー 72 音声認識キー 81 音声登録メモリ 82 電話帳データ 91 電話帳データテーブル 92 個人用IDテーブル 94 音声登録テーブル
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 1/32 G10L 3/00 551A 571A Fターム(参考) 5C075 BA05 BA08 CD07 CD25 FF90 5D015 AA03 BB01 GG01 GG02 KK02 LL04 LL12 5K027 BB02 DD11 FF22 FF25 HH02 HH20 5K036 AA15 CC04 DD17 FF06 KK09 5K101 KK01 LL01 NN07 NN08 NN21
Claims (8)
- 【請求項1】 複数の音声データを複数の名称情報と関
連付けて記憶する音声データ記憶手段と、 該記憶された音声データと入力音声とを照合することに
より、音声認識を行う音声認識手段と、 複数の音声入力装置の中から音声入力を行う経路を選択
する入力経路選択手段と、 ユーザによって音声入力が行われる音声入力装置を検出
する音声入力装置検出手段とを備え、 前記入力経路選択手段は、前記検出結果に応じて前記音
声入力を行う経路を選択することを特徴とする音声認識
装置。 - 【請求項2】 通信装置に適用され、 前記複数の音声入力装置は、前記通信装置に接続された
受話器、および前記通信装置の内蔵マイクの2つを含
み、 前記音声入力装置検出手段は前記受話器のフックセンサ
であり、 該フックセンサは、前記受話器が持ち上げられている状
態では前記受話器を前記音声入力装置として検出し、 前記フックセンサは、前記受話器が持ち上げられていな
い状態では前記内蔵マイクを前記音声入力装置として検
出し、 音声認識開始操作にしたがって、前記検出された音声入
力装置を用いて音声認識を行うことを特徴とする請求項
1記載の音声認識装置。 - 【請求項3】 前記音声認識開始操作後、ユーザに音声
入力を促す通知を所定時間行い、 該通知を所定時間行った後、前記音声入力装置検出手段
により前記ユーザによって音声入力が行われる音声入力
装置を検出し、 前記入力経路選択手段は、前記音声入力を行う経路を選
択する経路選択スイッチを有し、前記検出結果に応じ
て、前記経路選択スイッチを切り替えてから前記音声認
識を開始することを特徴とする請求項2記載の音声認識
装置。 - 【請求項4】 前記経路選択スイッチを切り替えてから
前記音声認識を開始した後、前記音声入力装置検出手段
により検出される前記音声入力装置が変化した場合、前
記経路選択スイッチを新たな経路に切り替えて音声認識
をやり直すことを特徴とする請求項3記載の音声認識装
置。 - 【請求項5】 複数の音声データを複数の名称情報と関
連付けて記憶する工程と、 該記憶された音声データと入力音声とを照合することに
より、音声認識を行う工程と、 ユーザによって音声入力が行われる音声入力装置を複数
の音声入力装置の中から検出する工程と、 該検出結果に応じて、前記音声入力を行う経路を選択す
る工程とを有することを特徴とする音声認識方法。 - 【請求項6】 音声認識が行われた宛先情報にしたがっ
て、通信を行う通信装置において、 複数の音声データを複数の宛先情報と関連付けて記憶す
る音声データ記憶手段と、 該記憶された音声データと入力音声とを照合することに
より、前記音声認識を行う音声認識手段と、 複数の音声入力装置の中から音声入力を行う経路を選択
する入力経路選択手段と、 ユーザによって音声入力が行われる音声入力装置を検出
する音声入力装置検出手段とを備え、 前記入力経路選択手段は、前記検出結果に応じて前記音
声入力を行う経路を選択することを特徴とする通信装
置。 - 【請求項7】 音声認識が行われた宛先情報にしたがっ
て、通信を行う通信制御方法において、 複数の音声データを複数の宛先情報と関連付けて記憶す
る工程と、 該記憶された音声データと入力音声とを照合することに
より、前記音声認識を行う工程と、 ユーザによって音声入力が行われる音声入力装置を複数
の音声入力装置の中から検出する工程と、 該検出結果に応じて、前記音声入力を行う経路を選択す
る工程とを有することを特徴とする通信制御方法。 - 【請求項8】 音声認識が行われた宛先情報にしたがっ
て通信を行う通信装置を制御するコンピュータによって
実行され、前記音声認識を行うためのプログラムが格納
された記憶媒体において、 前記プログラムは、 複数の音声データを複数の宛先情報と関連付けて記憶す
る手順と、 該記憶された音声データと入力音声とを照合することに
より、前記音声認識を行う手順と、 ユーザによって音声入力が行われる音声入力装置を複数
の音声入力装置の中から検出する手順と、 該検出結果に応じて、前記音声入力を行う経路を選択す
る手順とを含むことを特徴とする記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000260794A JP2002073083A (ja) | 2000-08-30 | 2000-08-30 | 音声認識装置、音声認識方法、通信装置、通信制御方法および記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000260794A JP2002073083A (ja) | 2000-08-30 | 2000-08-30 | 音声認識装置、音声認識方法、通信装置、通信制御方法および記憶媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002073083A true JP2002073083A (ja) | 2002-03-12 |
Family
ID=18748749
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000260794A Pending JP2002073083A (ja) | 2000-08-30 | 2000-08-30 | 音声認識装置、音声認識方法、通信装置、通信制御方法および記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002073083A (ja) |
-
2000
- 2000-08-30 JP JP2000260794A patent/JP2002073083A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH04211565A (ja) | 画像蓄積機能付きファクシミリ装置 | |
JP2002202791A (ja) | 通信装置、制御方法および記憶媒体 | |
US6785366B1 (en) | Apparatus for making outgoing call | |
JP2002073083A (ja) | 音声認識装置、音声認識方法、通信装置、通信制御方法および記憶媒体 | |
JP2000112497A (ja) | 音声認識方法及び装置と通信装置及びその制御方法 | |
JP2003195885A (ja) | 通信装置およびその制御方法 | |
JP2000115327A (ja) | 通信装置、方法および記憶媒体 | |
US7340041B2 (en) | Telephone device having operation function by voice input | |
JP4706675B2 (ja) | 通信装置及び通信プログラム | |
JP2000115335A (ja) | 通信装置、登録データ管理方法および記憶媒体 | |
JP2000115325A (ja) | 通信装置、方法および記憶媒体 | |
JP2000112493A (ja) | 音声認識装置及び通信装置とそれらの制御方法 | |
JP2000253171A (ja) | 通信装置、方法および記憶媒体 | |
JP2000115328A (ja) | 通信装置、方法および記憶媒体 | |
JP2000115347A (ja) | 通信装置、方法および記憶媒体 | |
JP2000112492A (ja) | 音声認識方法及び装置と通信装置及びその制御方法 | |
JP2000115326A (ja) | 通信装置、方法および記憶媒体 | |
JP2000112495A (ja) | 音声認識方法及び装置と通信装置及びその制御方法 | |
JP3057170B2 (ja) | ファクシミリ装置、電話機及びその発信方法と電話番号認識方法 | |
JP3589040B2 (ja) | 通信装置および記憶媒体 | |
JP2000115337A (ja) | 通信装置、登録データ管理方法および記憶媒体 | |
JP2000115336A (ja) | 通信装置、登録データ管理方法および記憶媒体 | |
JP2000115338A (ja) | 通信装置、登録データ管理方法および記憶媒体 | |
JP2008010962A (ja) | 電話機 | |
JPH06268786A (ja) | カラーファクシミリ装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20060330 |
|
RD05 | Notification of revocation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7425 Effective date: 20070626 |