JP2000115325A - 通信装置、方法および記憶媒体 - Google Patents

通信装置、方法および記憶媒体

Info

Publication number
JP2000115325A
JP2000115325A JP10292785A JP29278598A JP2000115325A JP 2000115325 A JP2000115325 A JP 2000115325A JP 10292785 A JP10292785 A JP 10292785A JP 29278598 A JP29278598 A JP 29278598A JP 2000115325 A JP2000115325 A JP 2000115325A
Authority
JP
Japan
Prior art keywords
data
voice
input
destination
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10292785A
Other languages
English (en)
Inventor
Hiroshi Shinoda
弘志 信田
Yasuhide Ueno
康秀 上野
Susumu Matsuzaki
進 松崎
Muneki Nakao
宗樹 中尾
Naoki Sugawara
尚樹 菅原
Takeshi Toyama
猛 外山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP10292785A priority Critical patent/JP2000115325A/ja
Priority to US09/408,348 priority patent/US6785366B1/en
Publication of JP2000115325A publication Critical patent/JP2000115325A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Facsimiles In General (AREA)
  • Facsimile Transmission Control (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】 【課題】 音声認識によって宛先ダイヤルを選択する際
に誤認識が発生した場合、即時に再試行させることがで
き、操作性を大幅に向上できる通信装置を提供する。 【解決手段】 ファクシミリ装置では、音声認識処理に
より特定された宛先略称を表示し、セットキー待ち状態
でセットキー310の入力があった場合、ダイヤル発信
を行い、音声認識キー322の入力があった場合、待機
状態に戻すことなく、再度、音声認識処理を行う。した
がって、音声認識処理で誤認識が発生した場合、オペレ
ータは装置を停止させて一旦、待機状態に戻し、再び操
作をやり直す必要がなくなり、即時に再試行させること
ができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ファクシミリ装置
等の通信装置、方法および記憶媒体に関する。
【0002】
【従来の技術】従来、ファクシミリ装置では、宛先を簡
便にダイヤルするために、複数の宛先の番号をワンタッ
チキーや短縮キーに登録しておく機能や、宛先の略称や
番号を登録しておき、それらを表示させながらその中か
ら目的の宛先を選択する電話帳機能が搭載されたものが
知られており、それらの機能が使われている。
【0003】また、利便性向上のために、音声認識機能
を搭載して宛先のダイヤル番号を認識させる技術が提案
されている。
【0004】
【発明が解決しようとする課題】しかしながら、音声認
識によって登録された音声データの中から合致するもの
を検索して照合することにより、合致した音声データに
対応する宛先ダイヤルを選択する音声認識宛先選択機能
では、入力した音声に周囲環境のノイズが乗ったり、入
力する際に声が小さかったり大きかったりして誤認識す
る場合があった。すなわち、誤認識は音声登録時の環境
と音声認識時の環境の違いによって発生していた。
【0005】このため、1回目に発声した結果が宛先誤
認識となった場合、オペレータは装置をストップさせて
ダイヤル発信への移行を中止させ、もう一度音声認識に
よる宛先選択の操作を最初からやり直さなくてはならな
かった。このように、誤認識となった場合、操作が非常
に煩わしかった。
【0006】そこで、本発明は、音声認識によって宛先
ダイヤルを選択する際に誤認識が発生した場合、オペレ
ータが装置を停止させて待機状態に戻してから再び操作
をやり直す必要がなく、即時に再試行させることがで
き、操作性を大幅に向上できる通信装置、方法および記
憶媒体を提供することを目的とする。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、本発明の請求項1に記載の通信装置は、入力された
音声データを認識する音声認識手段と、該音声認識手段
が起動して前記音声データの認識を完了した後、該認識
された音声データと対応する宛先データを出力する出力
手段と、前記宛先データを出力した後、確認操作の入力
があった場合、ダイヤル発信を行うダイヤル発信手段
と、前記宛先データを出力した後、再試行操作の入力が
あった場合、待機状態になることなく、再び前記音声認
識手段を起動する再起動手段とを備えた。
【0008】請求項2に記載の通信装置は、請求項1に
係る通信装置において、音声データを音声メモリに登録
する音声データ登録手段と、宛先データを電話帳データ
に登録する電話帳データ登録手段と、前記音声メモリに
登録された音声データと前記電話帳データに登録された
宛先データとを対応させて管理する管理手段と、入力さ
れた音声データと前記登録された音声データとを比較す
る比較手段とを備え、前記出力手段は、前記比較手段に
よって前記入力された音声データに一致すると判別され
た前記音声メモリに登録された音声データと対応する前
記電話帳データに登録された宛先データを出力すること
を特徴とする。
【0009】請求項3に記載の通信装置は、請求項1に
係る通信装置において、回線に接続して遠隔の通信装置
と通信する通信手段と、原稿を読み取る読取手段と、該
読み取った原稿を前記通信手段によって送信する送信手
段と、前記通信手段によって前記回線から受信したデー
タを記録媒体に記録する記録手段と、通話を行う通話手
段とを備えたことを特徴とする。
【0010】請求項4に記載の通信装置では、請求項1
に係る通信装置において、前記電話帳データ登録手段
は、少なくとも宛先略称および宛先番号を含む宛先デー
タを複数登録していることを特徴とする。
【0011】請求項5に記載の通信装置は、請求項2に
係る通信装置において、前記入力された音声データの特
徴を抽出したデジタルデータに変換する音声変換手段を
備え、前記音声データ登録手段は、前記変換されたデジ
タルデータを登録することを特徴とする。
【0012】請求項6に記載の通信装置では、請求項1
に係る通信装置において、前記出力手段は前記宛先デー
タを表示することを特徴とする。
【0013】請求項7に記載の通信装置では、請求項1
に係る通信装置において、前記ダイアル発信手段は、キ
ー入力による確認操作の入力があった場合、ダイヤル発
信を行うことを特徴とする。
【0014】請求項8に記載の通信装置では、請求項1
に係る通信装置において、前記再起動手段は、キー入力
による再試行操作の入力があった場合、再び前記音声認
識手段を起動することを特徴とする。
【0015】請求項9に記載の通信方法は、入力された
音声データを認識する工程と、該音声データを認識する
工程を行って前記音声データの認識を完了した後、該認
識された音声データと対応する宛先データを出力する工
程と、前記宛先データを出力した後、確認操作の入力が
あった場合、ダイヤル発信を行う工程と、前記宛先デー
タを出力した後、再試行操作の入力があった場合、待機
状態になることなく、再び音声データを認識する工程に
復帰する工程とを有する。
【0016】請求項10に記載の通信方法は、請求項9
に係る通信方法において、音声データを音声メモリに登
録する工程と、宛先データを電話帳データに登録する工
程と、前記登録された音声データと前記登録された宛先
データとを対応させて管理する工程と、入力された音声
データと前記登録された音声データとを比較する工程と
を有し、前記出力する工程では、前記比較する工程で前
記入力された音声データに一致すると判別された前記登
録された音声データと対応する前記登録された宛先デー
タを出力することを特徴とする。
【0017】請求項11に記載の通信方法は、請求項1
0に係る通信方法において、前記宛先データを登録する
工程では、少なくとも宛先略称および宛先番号を含む宛
先データを複数登録することを特徴とする。
【0018】請求項12に記載の通信方法は、請求項1
0に係る通信方法において、前記入力された音声データ
の特徴を抽出したデジタルデータに変換する工程を有
し、前記音声データを登録する工程では、前記変換され
たデジタルデータを登録することを特徴とする。
【0019】請求項13に記載の通信方法は、請求項9
に係る通信方法において、前記出力する工程では、前記
宛先データを表示することを特徴とする。
【0020】請求項14に記載の通信方法は、請求項9
に係る通信方法において、前記ダイアル発信を行う工程
では、キー入力による確認操作の入力があった場合、ダ
イヤル発信を行うことを特徴とする。
【0021】請求項15に記載の通信方法は、請求項9
に係る通信方法において、前記復帰する工程では、キー
入力による再試行操作の入力があった場合、再び前記音
声データを認識する工程を行うことを特徴とする。
【0022】請求項16に記載の記憶媒体は、通信装置
内のCPUによって実行されるプログラムが格納された
記憶媒体において、前記プログラムは、入力された音声
データを認識する手順と、該音声データを認識する手順
を行って前記音声データの認識を完了した後、該認識さ
れた音声データと対応する宛先データを出力する手順
と、前記宛先データを出力した後、確認操作の入力があ
った場合、ダイヤル発信を行う手順と、前記宛先データ
を出力した後、再試行操作の入力があった場合、待機状
態になることなく、再び前記音声データを認識する手順
に復帰する手順とを含むことを特徴とする。
【0023】請求項17に記載の記憶媒体では、請求項
16に係る記憶媒体において、前記プログラムは、入力
された音声データと登録された音声データとを比較する
手順とを含み、前記出力する手順では、前記比較する手
順で前記入力された音声データに一致すると判別された
前記登録された音声データと対応する前記登録された宛
先データを出力することを特徴とする。
【0024】請求項18に記載の記憶媒体は、請求項1
6記載に係る記憶媒体において、前記出力する手順で
は、前記宛先データを表示することを特徴とする。
【0025】請求項19に記載の記憶媒体は、請求項1
6に係る記憶媒体において、前記ダイアル発信を行う手
順では、キー入力による確認操作の入力があった場合、
ダイヤル発信を行うことを特徴とする。
【0026】請求項20に記載の記憶媒体は、請求項1
6に係る記憶媒体において、前記復帰する手順では、キ
ー入力による再試行操作の入力があった場合、再び前記
音声データを認識する手順を行うことを特徴とする。
【0027】
【発明の実施の形態】本発明の通信装置、方法および記
憶媒体の実施の形態について説明する。本実施形態の通
信装置は、アナログ小電力方式のコードレス電話機を搭
載し、ITU勧告G3規格を満足する機能を有するファ
クシミリ装置に適用される。
【0028】このファクシミリ装置は、カラー読み取り
部とカラー記録部を具備し、カラーコピー機能やカラー
画像の通信機能を有するとともに、ファクシミリや通話
の目的で記憶されている宛先略称を選択することで対応
する宛先番号に自動宛先ダイヤルを行う電話帳機能と、
その電話帳機能で選択される宛先略称を音声認識部によ
り音声で認識する音声認識機能とを有する。
【0029】カラー読み取り部は、本体から着脱自在な
ハンドスキャナユニットで構成されており、シート状原
稿の読み取りの他、ブック原稿などの読み取りも可能で
ある。ハンドスキャナユニットに組み込まれている読み
取りセンサは、線順次でRGB各色を出力する密着型の
カラーセンサである。その読み取り幅はB4幅、読み取
り解像度は200dpiである。
【0030】カラー記録部は、インク吐出方式のもので
あり、CMYK各色のインクタンクとインク吐出部が一
体となったカラーカートリッジと、黒インクだけのイン
クタンクとインク吐出部が一体となったモノクロカート
リッジとのいずれか一方を装着して360dpiの記録
解像度で記録紙に2値データを印字する。
【0031】カラー記録部の仕様では、いずれのカート
リッジを装着しても、モノクロ記録の場合、その記録幅
は最大B4幅であるが、カラーカートリッジを装着して
カラー記録を行う場合、その記録幅は最大A4幅であ
る。
【0032】また、ファクシミリ装置は、通信時にG3
モードで最高9600bpsのモデム速度を実現し、画
像伝送の誤り再送機能であるECMモードを具備してい
る。
【0033】図1はファクシミリ装置のハードウェア構
成を示すブロック図である。図において、101は本装
置の制御部としてのCPUである。121はプログラム
や各種固定データを格納するROMである。118は各
種プログラムのワークメモリ、留守録などの音声データ
およびモノクロ画像・カラー画像データ用の蓄積メモリ
として使用されるDRAMである。DRAMの容量は全
体で2MBであり、そのうち0.5MB分をワークメモ
リとして使用する。残り1.5MB分を画像データの蓄
積と音声データの蓄積のために使用する。
【0034】124はシステムに必要な登録データ(各
種ソフトスイッチ、電話帳データ、音声認識のための音
声登録データ、装置の電話番号、略称などの装置用ID
データ)を登録して記憶するためのSRAMであり、電
源断によりデータが失われないように電池でバックアッ
プされている。
【0035】102はITU勧告G3モードに必要な機
能を有する公知のファクシミリ用モデムである。このフ
ァクシミリ用モデム102は、V.29,V.21,V
27terの他、DTMF認識機能、DRAMへの音声
録音・DRAM等からの音声再生のための音声コーデッ
ク機能を具備するタイプのものである。
【0036】103は子機電話105とアナログ小電力
方式の無線通信を行うベースユニットであり、CPU1
01からの指示により無線通信を制御する公知のユニッ
トである。104はアナログ信号用接続スイッチ(クロ
スポイントSW)であり、CPU101からの設定によ
り、ハンドセット106、マイク107、スピーカ10
8、NCU109、CPU101の音声入力端子、モデ
ム102およびベースユニット103との間のアナログ
信号の接続を自在に切り替える公知の回路である。
【0037】106は装置本体の電話機ハンドセット、
107は音声入力用のマイク、108はスピーカ、10
9は回線とインターフェースするための公知のNCUで
ある。
【0038】120はモノクロ2値生画像データからラ
ンレングス符号を生成し、ランレングス符号を入力して
モノクロ2値生画像データを出力する公知のランレング
ス回路である。111は時計ICとしてのリアルタイム
クロック(RTC)である。
【0039】125はハンドスキャナユニット(HS
U)であり、カラーコンタクトセンサ(CS)112と
原稿上の移動距離を測定するロータリエンコーダ116
を内蔵し、装置本体とカールコードにより接続されて着
脱自在である。113はロータリエンコーダ116の出
力信号から移動距離データ(ロータリエンコーダの回転
数情報)を生成してCPU101に通知するエンコーダ
検出回路である。
【0040】114は画像処理部であり、CPU101
の指示により、カラー生画像データをDRAM118に
蓄積する場合、カラーコンタクトセンサ112から出力
されたアナログRGB信号(線順次で解像度200dp
i)を入力し、RGB各8ビット(1画素当たり24ビ
ット)の90dpiデジタルデータに変換し、また、カ
ラーコピーをダイレクトで行う場合、カラーコンタクト
センサ112から出力されたアナログRGB信号(線順
次で解像度200dpi)を入力し、360dpi2値
YMCKのデジタルデータに変換し、いずれの変換デー
タもDMAコントローラ117に供給する。
【0041】また、カラー生画像データ(90dpi、
RGB)をDRAM118に蓄積する場合、DMAコン
トローラ117はDRAM118にカラー生画像データ
を転送し、カラーコピーをダイレクトで行う場合、DM
Aコントローラ117は記録制御部119に360dp
iの2値YMCKデータを転送する。
【0042】さらに、モノクロ生画像データをDRAM
118に蓄積する場合、カラーコンタクトセンサ112
から出力されたアナログRGB信号(線順次で解像度2
00dpi)を入力し、モノクロ2値の200dpiデ
ジタルデータに変換し、DMAコントローラ117に供
給する。モノクロコピーをダイレクトで行う場合、カラ
ーコンタクトセンサ112から出力されたアナログRG
B信号(線順次で解像度200dpi)を入力し、モノ
クロ2値の360dpiデジタルデータに変換し、DM
Aコントローラ117に供給する。モノクロ生画像デー
タをDRAM118に蓄積する場合、DMAコントロー
ラ117はDRAM118にモノクロ2値画像データを
転送し、モノクロコピーをダイレクトで行う場合、DM
Aコントローラ117は記録制御部119にモノクロ2
値画像データを転送する。
【0043】このようなファクシミリ装置の動作につい
て補足する。
【0044】(1)本体にスキャナを装着した状態での
コピーはダイレクトモードとなり、読み取りデータをD
RAM118にページ蓄積することなく、シート状原稿
を読み取りながら記録部120で印字する。DRAM1
18へのページ蓄積が不要であり、高解像度でもメモリ
オーバーフローしないなどの理由から、読み取り解像度
を記録部120に整合させると、読み取りデータは副走
査方向360dpiのデータとなる。また、コピーサイ
ズはモノクロの場合、B4幅までとなり、カラーの場
合、記録部120の仕様でA4幅までとなる。
【0045】(2)本体からスキャナを取り出してハン
ドスキャナとしてコピー使用する場合、メモリモードと
なり、読み取りデータは必ずDRAM118にページ蓄
積される。これは、記録部120の印字速度が人間がス
トレス無くハンドスキャンを実行する速度に対して遅い
ための処置であり、一旦、DRAM118にページ蓄積
することによってハンドスキャンを高速で実行させて終
了することができる。
【0046】また、読み取り解像度を記録部120に整
合させて360dpiとすると、1ページのデータ容量
が大き過ぎてDRAM118を占有してしまい、装置動
作に支障を来す、もしくはDRAM118の容量を増や
すと、コストがかかる等の理由から、読み取り解像度を
モノクロの場合で200dpi、カラーの場合で90d
piに抑えている。
【0047】また、同様の理由から、モノクロの場合、
コピーサイズはB4幅まであるが、カラーの場合、コピ
ーサイズはA6(もしくは官製はがきサイズ)以下に制
限されている。ちなみにモノクロ200dpiでB4サ
イズ1ページ分のデータ容量は約700KB、カラー9
0dpiでA6サイズの1ページ分のデータ容量は約6
00KBであり、DRAM118に蓄積可能である。
【0048】データを圧縮符号化してDRAM118に
蓄積する場合、サイズ・解像度をもっと上げることは可
能であるが、後述するように圧縮符号化はソフトウェア
で行うために時間がかかり、ハンドスキャンの実行速度
が下がってしまうデメリットがある。高速の圧縮符号化
のためにハードウェアを追加することは大幅なコスト増
を招いてしまう。
【0049】(3)本体にスキャナを装着した状態での
原稿送信は、ダイレクトモードとなり、読み取りデータ
をページ蓄積することなく、DRAM118を経由して
モデム102に転送される。ファクシミリ装置はシート
上の原稿を読み取りながら相手のファクシミリ装置に送
信する。
【0050】(4)本体からスキャナを取り出してハン
ドスキャナとして使用して原稿送信を行う場合、メモリ
モードとなり、読み取りデータは必ずDRAM118に
ページ蓄積される。これは、モデム102の通信速度が
人間がストレス無くハンドスキャンを実行する速度に対
して遅いための処置であり、一旦、DRAM118にペ
ージ蓄積することによってハンドスキャンを高速で実行
させて終了することができる。読み取り解像度やサイズ
は、前述した項目(2)と同じ理由で同様の仕様であ
る。
【0051】記録制御部119は、記録部120が記録
可能なデータ形式に入力データを変換する。記録部12
0はインク吐出方式の公知のカラープリンタ部分であ
り、インクタンクとインク吐出部が一体になっているカ
ートリッジを記録紙の主走査方向に移動させながら画像
を記録してゆくものである。カラーカートリッジとモノ
クロカートリッジのいずれが装着されているかは、記録
部120とカートリッジの電気的接点の配置により、C
PU101が判別できるようになっている。
【0052】解像度変換回路115はモノクロ2値画像
データを入力して解像度変換を行う公知の回路であり、
モノクロ画像の拡大・縮小などのために使用されるとと
もに、記録部120の解像度に対して回線から受信した
モノクロ画像の解像度を整合させる用途にも使用され
る。
【0053】122は本装置の操作部としての操作パネ
ルであり、図3に示すように各種キーや表示ランプ、お
よびLCDディスプレイを具備する。また、マイク11
7およびスピーカ118は操作パネル122上に配置さ
れる。
【0054】126はハンドスキャナユニット125と
装置本体との着脱状態を検出するセンサであり、そのセ
ンサの出力によってCPU101はシート状原稿を読み
取るシートモードであるか、ブック原稿など立体物を読
み取るハンドスキャンモードであるかを決定する。
【0055】図3は操作パネル122の外観を示す図で
ある。図において、106は前述した本体用ハンドセッ
トである。302は各種登録や設定のための機能キーで
ある。303は伝言や通話内容を音声データとしてDR
AM118に録音するとき使用する録音キーである。
【0056】304はMODEMの音声コーデックによ
ってCPU101がDRAM118に録音した音声デー
タを再生するとき使用する再生キーである。305はメ
モリに格納された各種データを消去するとき使用する消
去キーである。306は16文字分のキャラクタを2行
表示できるバックライト付きLCDであり、装置の状態
や各種メッセージの出力およびオペレータの入力を行う
ために使われる。
【0057】307はカラーLEDであり、カラー/白
黒キー308でカラーモードが選択されると、点灯す
る。309はモノクロモードでの画質を選択するための
画質キーである。
【0058】310は電話帳を呼び出すための電話帳キ
ーと、登録などの内容を確定させるためのセットキーを
兼用するキーであり、以降、セットキーあるいは電話帳
キーと呼ぶことにする。311は上カーソルキーであ
る。312は下カーソルキーである。313は左カーソ
ルキーである。314は右カーソルキーである。これら
のキーは表示制御の操作で使用される。
【0059】315はファクシミリ送信のための送信キ
ーである。316はファクシミリ受信および受信画像を
プリントするための受信/プリントキーである。317
はコピーを実行するためのコピーキーである。318は
実行中の装置動作を中断するためのストップキーであ
る。319はマイクの開口部である。320はテンキー
部である。321は回線を接続したまま、マイク319
をアクティブにして回線上に出力し、回線上の音をスピ
ーカ108に出力する状態にするためのスピーカホンキ
ーである。
【0060】322は音声認識によって宛先自動ダイヤ
ルを実行するための音声認識キーである。323は着信
した電話相手の通信内容を自動的にDRAM118に録
音するための留守キーである。324は本体からコード
レス子機電話105を呼び出して内線通話を実行するた
めの子機キーである。325は通話状態を保留したまま
相手にメロディを送出する保留キーである。326は前
回かけた相手の電話番号を自動的にダイヤルするための
リダイヤルキーである。
【0061】本実施形態では、リダイアルキー326を
押下することにより、後述する文字入力モードをカタカ
ナ入力モードとアルファベット入力モードとに切り替え
ることができる。例えば、LCD306の画面にカタカ
ナを入力する場合、リダイアルキー326を押してカタ
カナ入力モードを選ぶ。上下カーソルキー311、31
2を押下してLCD306に例えば「カ」行を表示させ
る。左右カーソルキー313、314を押下し、例えば
「ク」の下に文字選択カーソル(_)を移動させた後、
セットキー310を押下することで文字入力を確定させ
る。
【0062】327は外線通話中にキャッチホンが入っ
たとき、キャッチホンの呼に通話を切り替えるためと、
切り替えたキャッチホン通話から元の通話に切り替える
ために使用するキャッチキーである。
【0063】図2は通信装置のタスクの構成を示す図で
ある。本装置のソフトウェアは、マルチタスクOS21
2により、各タスクが同時に並列動作を行うことができ
る環境を与えている。以下、各タスクについて示す。
【0064】201は状態監視タスクであり、装置内に
発生する各イベントを監視し、装置状態を変化させる必
要のあるイベントの発生を検出すると、必要なタスクに
その情報を通知する機能を持つ。例えば、操作パネル1
22からのキー情報を検出すると、オペレートタスク2
02や回線制御タスク203に必要なキー情報を伝達
し、装置の機能を起動する。
【0065】202はオペレートタスクであり、状態監
視タスク201からのキーコードA情報を受けて動作モ
ードを判定して機能を実行するタスクにスタートコマン
ドを発行するとともに、キーコードA情報に基づいて、
操作パネル122上の表示機能を制御する。
【0066】203は回線制御タスクであり、NCU1
09を制御して回線からの着呼を受け付けたり、オペレ
ートタスク202からのダイヤル要求コマンドに応じて
ダイヤル信号を送出するために回線を捕捉したり、回線
断を実行して通信を終了させるシーケンスを実行する。
また、回線接続状態における状態監視タスク201から
のキーコードB情報で送信キー315や受信/プリント
キー316を検出するか、発信元の相手が電話かファク
シミリかを回線上の信号を分析することにより自動判別
し、ファクシミリである場合、通信タスク205にファ
クシミリのための通信スタートコマンドを発行する。
【0067】204はダイヤル制御タスクであり、回線
制御タスク203あるいは通信タスク205からのダイ
ヤルスタートコマンドに応じて各種ダイヤル信号を交換
機に送出する機能を持つ。205は通信タスクであり、
回線制御タスク203からの通信スタートコマンドによ
って各種ファクシミリ通信(通信手順の実行や画像デー
タ伝送)を実行する。
【0068】206は読取タスクであり、オペレートタ
スク202からの読取スタートコマンドに応じて、ハン
ドスキャナユニット125と画像処理部114を制御し
て原稿の読み取りを実行する。
【0069】207は符号復号タスクであり、通信タス
ク205、読取タスク206、記録タスク209からの
各種符号復号スタートコマンドに対応して画像データの
符号化、復号化の処理をソフトウェアで実行する。この
ため、本装置は符号復号化のためのハードウェアコスト
を大きく削減している。但し、ハードウェアでの実施に
比べて処理時間はかかる。モノクロ画像には公知のMH
符号方式を適用し、カラー画像にはRGB多値DPCM
方式(RGBの各ビット値で隣接画素間の差分値を計算
する方式)にハフマン符号を割り当てた公知の符号化方
式を適用する。
【0070】208は音声認識タスクであり、ハンドセ
ット106から入力された使用者の発生音声を分析して
あらかじめ登録されている音声データ(複数可)と比較
し、一致するものを検出して通知する公知の音声認識ア
ルゴリズムを含むソフトウェアである。音声認識タスク
208はオペレートタスク202からの音声認識スター
トコマンドにより起動する。音声認識タスク208の終
了は音声認識タスク208自身による。
【0071】音声トレーニング(音声登録)および音声
認識の結果を音声認識結果コマンドとして、オペレート
タスク202に返送する。
【0072】(1)音声登録音声認識のための比較分析
対象データを、SRAM124内の音声登録メモリに作
成する。ハンドセット106、マイク107、NCU1
09から入力された音声、あるいは回線もしくはベース
ユニット103を通じて子機105から入力された音声
をクロスポイントSW104を通して音声データとして
CPU101に入力する。CPU101は音声データに
種々の演算を施し、音声認識のためのデータを作成して
SRAM124内の音声登録メモリに登録する。例え
ば、CPU101は音声データの特徴を抽出し、抽出後
にデジタルデータに変換して登録する。そして、音声登
録の結果(OK/NG)を音声認識結果コマンドとし
て、オペレートタスク202に返送する。
【0073】(2)音声認識ハンドセット106、マイ
ク107、NCU109から入力された音声、あるいは
回線もしくはベースユニット103を通じて子機105
から入力された音声をクロスポイントSW104を通し
て音声データとしてCPU101に入力する。CPU1
01は音声データに種々の演算を施し、得られたデータ
とSRAM124内の音声登録メモリに登録されている
データを比較し、最も近いデータを選択し、その結果を
音声認識結果コマンドとして、オペレートタスク202
に返送する。
【0074】209は記録タスクであり、レポートタス
ク210やプリントタスク211からの記録スタートコ
マンドに応じて、要求された画像データを記録部120
で印字させる機能を持つ。210はレポートタスクであ
り、通信履歴が記録される通信管理レポートやSRAM
124の登録情報などの機能設定リストをキャラクタデ
ータで作成し、それを画像データに展開して記録タスク
209に記録を依頼する各種レポート作成用のソフトウ
ェアである。
【0075】211はプリントタスクであり、常時、自
動的に記録する必要のある画像データがDRAM118
に蓄積されていないかをチェックしており、記録する必
要のある画像データを検出すると、記録スタートコマン
ドを記録タスク209に発行する監視機能を持つ。
【0076】つぎに、ファクシミリ装置における電話帳
機能の登録と操作について示す。
【0077】[電話帳登録(新規登録)]電話帳データ
の登録個数は最大100件である。操作パネル122上
に配置されたLCD306に、機能メニューの上下カー
ソルキー311、312を操作して電話帳登録の表示画
面を設定する。図4は電話帳登録の表示画面を示す図で
ある。LCD306の画面では、2行×16桁の文字の
入力および表示が可能である。図4の1行目には「テ゛
ンワチョウ アキ70ケン」が表示され、2行目に
は「 セットキーテ゛トウロク」が表示され
ている。
【0078】図5は電話帳を登録する際の入力画面を示
す図である。図4の画面で、セットキー310を押下す
ると、図5(a)に示す画面に切り替わり、1行目の編
集カーソル(図中、反転表示(■)で示す)部分に文字
を入力することが可能になる。2行目には「イウエオ
ァィゥェォ →オワリ」と表示され、文字の入力方法
が示されている。 そして、同図(b)に示すように、
その1行目に「ヤマシタ」と入力し、2行目に「TEL
=03 1234 5963」と入力すると、同図
(c)に示すように、1行目に「ヤマシタ」、2行目に
「トウロク シマシタ」が表示される。これにより、電
話帳に1件のデータが登録された後、図6に示す次の画
面に切り替わる。
【0079】図6は音声データの登録画面を示す図であ
る。音声データの最大登録数は15件である。同図
(a)の画面の1行目に「オンセイデータ ヲ トウロ
ク?」、2行目に「 スル →シナイ ノコリ1
5」が表示される。ここで、「ノコリ15」は残り登録
可能件数を表している。音声データを登録する場合、
「スル」を選択する。そして、「スル」が選択されて音
声データが登録された場合、同図(b)に示す画面が表
示される。画面の1行目に「ツツ゛ケテトウロク?」、
2行目に「 スル →シナイ」が表示される。「スル」
の選択で次の宛先を入力する。「シナイ」の選択でスタ
ンバイ(待機)状態に復帰する。
【0080】[電話帳登録(登録内容修正)]図7は電
話帳の登録内容を修正する際の表示画面を示す図であ
る。スタンバイ状態で電話帳キー310を押下し、上下
カーソルキー311、312を操作して登録の修正した
い電話番号を選択すると、同図(a)の1行目に「→キ
ムラ タクヤ」、2行目に「 キムラ マサシ」が表示
される。ここで、音声認識用の音声データが登録されて
いる場合、右端に「V」の字が表示される。
【0081】同図(a)の状態でリダイアルキー326
を押下すると、同図(b)に示す表示になる。画面の1
行目に「■ムラ タクヤ」と表示され、2行目に「
ウエオ ァィゥェォ →オワリ」と表示され、文字の入
力方法が示される。そして、カーソル(編集カーソル
■、文字選択カーソル_)で示された部分に文字入力が
可能である。
【0082】図8は候補文字の選択移動を示す図であ
る。同図(a)の1行目に「タ■ラタクヤ」、2行目に
チツテト →オワリ」が表示されてい
る。上下左右カーソルキー311、312、313、3
14で候補文字の選択移動を行う際、上段の編集カーソ
ル(■)の移動は「*#」キーで行う。略称の修正は
「オワリ」を左右カーソルキー313、314で移動し
て選択する。同図(b)の1行目に「タムラ タク
ヤ」、2行目に「TEL=04 0123 0123」
が表示される。
【0083】番号の変更がない場合、そのままセットキ
ー310を押下する。一方、番号の変更を行う場合、消
去キー305を押下して同図(c)に示すように、ダイ
ヤルを入力し直す。
【0084】変更前の登録で音声データが設定されてい
る場合、音声データを変更するか否かを選択する。図9
は音声データの登録画面を示す図である。同図(a)の
1行目に「オンセイデータ ヲ トウロク?」、2行目
に「→スル シナイ」が表示される。ここで、「ス
ル」を選択すると、音声データを入れ替えて登録するか
否かを設定する。同図(b)の1行目に「オンセイデー
タ イレカエ?」、2行目に「→スル シナイ」と表
示され、通常の音声データの登録と同じ操作方法で登録
する。
【0085】[電話帳登録(削除)]電話帳キー310
を押下し、上下カーソルキー311、312を操作して
消去したい電話番号を選択する。図10は電話帳データ
を削除する際の画面を示す図である。同図(a)の1行
目に「→キムラ タクヤ」、2行目に「キムラ マサ
シ」が表示されている。ここで、消去キー305を押下
すると、同図(b)に示す画面に切り替わる。その1行
目に「キムラ タクヤ」、2行目に「セットキーテ゛
ショウキョ」と表示される。
【0086】セットキー310を押下すると、同図
(c)に示す画面に切り替わる。その1行目に「キムラ
タクヤ」、2行目に「ショウキョシマシタ」が表示さ
れる。消去後、電話帳の表示は同図(d)のような表示
となる。1行目に「→キムラ マサシ」、2行目に「ヤ
ナキ゛タ゛」が表示される。ここで、矢印「→」は消去
した次の候補を示している。このとき、消去したデータ
に音声データが登録されていた場合、音声データも一緒
に消去される。
【0087】[電話帳のサーチ]図11は電話帳のサー
チを行う際の画面を示す図である。スタンバイ状態また
は回線捕捉後に電話帳キー310を押下すると、同図
(a)に示す画面になる。その1行目に「→アイカ
ワ」、2行目に「イノウエ V」が表
示される。50音順にソートされて登録されている略称
が表示される。下カーソルキー312を押下すると、同
図(b)に示す表示に切り替わる。その1行目に「アイ
カワ」、2行目に「→イノウエ V」
が表示される。
【0088】さらに、ここで上カーソル311を押下す
ると、同図(c)に示す表示に切り替わる。その1行目
に「→イノウエ V」、2行目に「イ
シカワ」が表示される。ユーザの略称を選択し、右カー
ソルキー314を押下すると、詳細表示(番号表示)と
なる。
【0089】図12は番号表示(詳細表示)を行う際の
画面を示す図である。同図(a)の1行目に「→イノウ
エ V」、2行目に「 イシカワ」が
表示されている状態で右カーソルキー314が押下され
ると、同図(b)に切り替わる。その1行目に「→イノ
ウエ V」、2行目に「TEL=04
74 12 1234」が表示される。この状態から上
下カーソルキー311、312を押下すると、詳細表示
する直前の状態から上下カーソルキー311、312を
押下した場合と同様の動作を行う。そして、ストップキ
ー318を押下するとスタンバイ状態に、回線捕捉中で
ある場合、「TEL=」の表示に戻る。
【0090】図13はユーザの略称を選択してセットキ
ー310を押下した際の画面を示す図である。同図
(a)の1行目に「→イノウエ
V」、2行目に「イシカワ」が表示された状態で、セッ
トキー310を押下すると、回線捕捉中である場合、セ
ットキー310の押下で同図(b)のように表示し、ダ
イヤル発呼を行う。その1行目に「イノウエ」、2行目
に「0474 12 1234」が表示される。
【0091】回線捕捉中でない場合、セットキー310
の押下は無視される。この場合、同図(c)に示すよう
に、1行目に「→イノウエ V」、2
行目に「イシカワ」が表示されたままの状態となる。
【0092】[音声データの登録]電話帳登録時に電話
番号を登録した後で次の画面が表示される。図14、図
15および図16は音声データの登録時の画面を示す図
である。同図(a)の1行目に「オンセイデータ ヲ
トウロク」、2行目に「→スル シナイ」が表示
される。ここで、「スル」を選択すると、同図(b)に
示す音声登録の画面に切り替わる。その1行目に「シ゛
ュワキヲ アケ゛テクタ゛サイ」が表示される。
【0093】ここで、受話器を上げると、同図(c)の
画面に切り替わる。その1行目に「ヒ゜ーオンノ アト
ニ」、2行目に「オハナシクタ゛サイ」が表示される。
「ピー」という音がなり、同図(d)の画面に切り替わ
る。その1行目に「オハナシクタ゛サイ」が表示され
る。
【0094】登録する名前を受話器に向かって話す。音
声を感知すると、図15(a)の画面が表示される。そ
の1行目に「オンセイ ニュウリョクチュウ」が表示さ
れる。音声入力は1件につき続けて3回行う。そして、
同図(b)の1行目に「カイセキチュウ」が表示され
る。
【0095】音声データの音声登録は1件につき続けて
3回行うので、同図(c)の画面であと2回音声登録す
ることが表示される。すなわち、その1行目に「カイセ
キセイシ゛ョウ」、2行目に「アト 2カイ」が表示さ
れる。
【0096】1回目と同じように、2回目、3回目も音
声を登録する。3回まで正常に登録することができた場
合、図16の画面を表示して音声データの登録を終了す
る。同図(a)の1行目に「オンセイヲ トウロク シ
テイマス」と表示された後、画面が切り替わり、同図
(b)の1行目に「シ゛ュワキヲ オイテ クタ゛サ
イ」が表示される。そして、受話器を置くと、同図
(c)の画面が表示される。その1行目に「オンセイデ
ータ ヲ」、2行目に「トウロク シマシタ」が表示さ
れる。
【0097】1つの音声データが登録されると、同図
(d)の画面で次の登録を行うか否かを選択する。その
1行目に「ツツ゛ケテ トウロク」、2行目に「→スル
シナイ」が表示される。「スル」を選択すると、電
話帳登録時の略称登録の画面に戻る。
【0098】[音声認識で電話をかける操作]図17お
よび図18は音声認識で電話をかける際の画面を示す図
である。音声認識キー322を押下してからハンドセッ
ト106をオフフックして電話をかける場合、音声認識
キー322を押下すると、図17(a)の画面が表示さ
れる。その1行目に「シ゛ュワキヲ アケ゛テクタ゛サ
イ」が表示される。受話器を上げると、同図(b)の1
行目に「ヒ゜ーオンノ アトニ」、2行目に「オハナシ
クタ゛サイ」が表示される。
【0099】「ピー」という音が鳴り、同図(c)の画
面に切り替わる。その1行目に「オハナシクタ゛サイ」
が表示される。この画面の時に登録してある名前を受話
器に向かって言うと、同図(d)の画面に切り替わる。
その1行目に「オンセイ ニュウリョクチュウ」が表示
される。
【0100】言った名前が登録されているものと一致し
た場合、その登録されている名前と電話番号を、図18
(a)のように表示する。その1行目に「キムラタク
ヤ」、2行目に「TEL= 0123456789」
が表示される。
【0101】ここで、装置の設定で「オンセイニンシキ
ジノドウサ」で「ジドウ」に設定されている場合、その
まま発呼を始める。「セットキーマチ」に設定されてい
る場合、同図(b)の画面に切り替わり、セットキー3
10の押下により図18(a)の画面になり発呼を始め
る。
【0102】[ハンドセットをオフフックしてから音声
認識キーを押下して電話をかける操作]図19および図
20はハンドセットをオフフックしてから音声認識キー
を押下して電話をかける際の画面を示す図である。同図
(a)の1行目に「TEL=」が表示されている。音声
認識キー322を押下すると、同図(b)に切り替わ
る。その1行目に「ヒ゜ーオンノ アトニ」、2行目に
「オハナシクタ゛サイ」が表示される。
【0103】「ピー」という音が鳴り、同図(c)の画
面に切り替わる。その1行目に「オハナシクタ゛サイ」
が表示される。この画面の時に、登録してある名前を受
話器に向かって言うと、同図(d)の画面に切り替わ
る。その1行目に「オンセイニュウリョクチュウ」が表
示される。言った名前が登録されているものと一致した
場合、その登録されている名前と電話番号を、図20
(a)に示すように表示する。その1行目に「キムラタ
クヤ」、2行目に「TEL= 012345678
9」が表示される。
【0104】ここで、設定で「オンセイニンシキジノド
ウサ」で「ジドウ」に設定されている場合、そのまま発
呼を始める。「セットキーマチ」に設定されている場
合、同図(b)の画面に切り替わり、セットキー310
の押下により図20(a)の画面になり発呼を始める。
【0105】[音声データの削除]図21は音声データ
を削除する際の画面を示す図である。電話帳で音声デー
タを削除したい略称を表示させる。リダイアルキー32
6を押下し、名前と電話番号をそのまま確定すると、図
21(a)の音声データの設定画面に切り替わる。その
1行目に「オンセイデータ ヲ トウロク」、2行目に
「→スル シナイ」が表示される。
【0106】「シナイ」を選択すると、同図(b)の画
面に切り替わる。その1行目に「コノホ゛イステ゛ータ
ヲ」、2行目に「ショウキョ? →スル シナイ」
が表示される。「スル」を選択すると、音声データが消
去され、同図(c)のように表示される。その1行目に
「ホ゛イス ヲ」、2行目に「ショウキョ シマシタ」
が表示される。この後、電話帳の画面に戻り、終了す
る。
【0107】[音声データの入れ替え]図22は音声デ
ータを入れ替える際の画面を示す図である。電話帳で略
称を表示してリダイアルキー326を押下し、名前と電
話番号をそのまま確定した後、音声データの登録を「ス
ル・シナイ」の選択で、「スル」を選択すると、図22
に示すように表示され、音声データの入れ替えを行うこ
とができる。その1行目に「オンセイテ゛ータ イレカ
エ?」、2行目に「→スル シナイ」が表示される。
音声データを入れ替えるときの手順は音声データを登録
するときの操作と同様である。
【0108】つぎに、音声認識によって宛先ダイヤルを
行う際の詳細な動作について示す。図23は音声認識処
理の概略を示す図である。電話帳に音声登録を行う場合
や音声認識キー322によって音声認識を実行する場
合、オペレートタスク202は音声認識タスク208に
音声認識スタートコマンドを発行し、音声登録処理や音
声認識処理を開始させる。
【0109】音声認識タスク208は、ハンドセット1
06やマイク107から入力したアナログ音声データを
CPU内蔵のA/D変換回路によってサンプリングして
デジタルデータに変換し、音声入力データとしてタスク
に取り込み、演算処理をかける。演算処理が終了する
と、音声認識結果コマンドが音声認識タスク208から
オペレートタスク202に返送されてくる。
【0110】図24は音声認識スタートコマンドの内容
を示す図である。コマンド種別はコマンド0からコマン
ド6までに分かれている。コマンド0は指定の音声登録
データをSRAM124内の音声登録メモリから消去す
るために使用される。コマンド1および2は音声登録処
理を依頼するために使用される。コマンド3および4は
音声認識処理を依頼するために使用される。コマンド5
および6は音声認識処理を依頼するために使用される
が、これらのコマンドを受け取った音声認識タスク20
8はコマンドで指定された登録番号の音声登録データを
比較対象から削除して認識する。また、コマンド2、
4、6は結果がNGであった場合に理由コードを要求す
る。
【0111】図25は音声認識結果コマンドの内容を示
す図である。コマンド種別はコマンド1からコマンド4
までに分かれている。コマンド1および2は音声登録結
果を通知するために使用される。コマンド3および4は
音声認識結果を通知するために使用される。
【0112】SRAM124上のソフトスイッチである
「理由コードを表示する」のスイッチ項目がONになっ
ている場合、音声登録処理あるいは音声認識処理でNG
であった際、NGの理由を示す「理由コード」が音声認
識結果コマンドに反映される(コマンド2、4)。図2
6は理由コードの内容を示す図である。これらの理由コ
ードを基に、操作パネル122にNGの理由を表示する
ことにより、製造検査時やユーザ使用時の重要なガイダ
ンスを提供することができる。
【0113】理由コードR01は比較すべき音声登録デ
ータが無いことを示す。理由コードR02は無音あるい
はノイズにより有効な音声入力データが無いことを示
す。理由コードR03は一致するデータが無いことを示
す。理由コードR04はRAM124内の音声登録メモ
リの容量オーバーにより登録件数が一杯であることを示
す。理由コードR05は3秒以上の音声入力により入力
時間が超過であることを示す。理由コードR06は声が
大きすぎるかマイクに近すぎるかにより入力音量が過多
であることを示す。理由コードR07はストップキー3
18のONあるいはハンドセット106のオンフックに
よりユーザによる処理中断であることを示す。
【0114】図27はオペレートタスク202が管理す
る電話帳データと音声認識タスク208が管理する音声
登録メモリとの関係および各テーブルのデータの内容を
示す図である。図中、上部点線内にはオペレートタスク
202が管理する電話帳データが示されている。電話帳
データは大きく2種類に分かれており、1つはユーザ共
通の電話帳データテーブルである。電話帳データテーブ
ルは、略称、宛先番号(電話番号)、音声登録フラグ
(音声登録)、音声登録番号(登録番号)などの宛先デ
ータからなる複数のブロックで構成されている。
【0115】電話帳データテーブルを使う場合、音声認
識キー322を押して宛先の略称を発声し、それを音声
認識することで共通の電話帳を使った宛先ダイヤルが実
行されることになる。
【0116】もう1つは個人用電話帳テーブルである。
この個人用電話帳テーブルの構造は電話帳データテーブ
ルと同じであるが、個人用IDテーブルによって管理さ
れている。個人用IDテーブルは、略称、音声登録フラ
グ(音声登録)、音声登録番号(登録番号)、個人用電
話帳テーブルアドレスからなる複数のブロックで構成さ
れている。
【0117】個人用電話帳テーブルを使う場合、音声認
識キー322を押して個人用ID(図27の例では、
「ミユキ」、「テツヤ」)を発声する。これを音声認識
することによって個人用IDテーブルから個人用電話帳
テーブルが指定される。そして、宛先の略称を続けて発
声し、それを音声認識することで個人用の電話帳を使っ
た宛先ダイヤルが実行されることになる。
【0118】図27の下部点線内には、SRAM124
上で音声認識タスク208が管理する音声登録メモリの
構造が示されている。音声登録メモリは登録番号、状
態、除外フラグ、登録アドレスの各データからなる全部
で15のブロックからなるテーブルで構成される。登録
番号は登録アドレスに対応しており、登録アドレスはデ
ジタル符号化された音声データが記憶されているRAM
エリアの実体アドレスである。状態は登録状態と空き状
態を示している。
【0119】除外フラグは図24のコマンド0、1、
2、3、4のいずれかを受信したときに全てOFFにリ
セットされ、同じくコマンド5、6のいずれかを受信し
たときにコマンドで指定された登録番号の除外フラグが
ONにセットされる。除外フラグがONであると、音声
認識処理時に比較対象から除外される。音声登録メモリ
内の登録番号は、前述した電話帳データテーブル、個人
用IDテーブル、個人用電話帳テーブルに記述された登
録番号と1対1に対応している。
【0120】図28および図29は音声認識処理手順を
示すフローチャートである。この処理プログラムはRO
M121に格納されており、CPU101によって実行
される。まず、変数Nを値0に初期化する(ステップS
101)。ファクシミリ装置が待機状態にあって音声認
識キー322が押下されるのを待ち(ステップS10
2)、音声認識キー322が押下されると、表示および
ガイドトーンを出力する(ステップS103)。このと
き出力される表示は、前述した図17および図19に示
す画面内容であり、表示とともにスピーカ108から
「ピッ」というガイドトーンが出力される。
【0121】そして、オペレートタスク202から音声
認識スタートコマンド(コマンド3あるいは4)を音声
認識タスク208に発行し(ステップS104)、音声
認識タスク208による音声認識処理を起動させる。こ
のとき、音声認識タスク208は音声登録データの除外
フラグを全てOFFにセットする。
【0122】ユーザが宛先略称を発声し、音声認識処理
が終了するのを待ち(ステップS105)、音声認識処
理が終了すると、音声認識タスク208から音声認識結
果コマンドがオペレートタスク202に返送される。
【0123】そして、音声認識処理の結果がOKである
かNGであるかを判別する(ステップS106)。NG
である場合、理由コード付けを行うか否かを、音声認識
結果コマンドにより判別し(ステップS121)、理由
コード付けを行う場合、理由コードに応じたNG理由を
操作パネル122に表示し(ステップS122)、続け
てエラー表示を行い(ステップS123)、待機状態に
移行する。一方、理由コード付けを行わない場合、その
ままエラー表示を行って待機状態に移行する。
【0124】一方、ステップS106で音声認識処理の
結果がOKであった場合、音声認識結果コマンドで回答
された登録番号を基に、電話帳データテーブルを検索
し、該当する項目を見つける(ステップS107)。該
当項目が「個人用ID」であるか否かを判別し(ステッ
プS108)、個人用IDである場合、個人用電話帳デ
ータを操作パネル122に表示し(ステップS12
4)、ステップS103の処理に戻り、個人用電話帳テ
ーブルの宛先検索のため、再び音声認識処理を行う。
【0125】一方、ステップS107での該当項目が共
通の電話帳データテーブルにあった場合、あるいは個人
電話帳テーブルにあった場合、音声認識結果をユーザに
示すため、操作パネル122に宛先略称の表示を行う
(ステップS109)。すなわち、個人電話帳テーブル
から宛先ダイヤルを行う場合、ユーザは個人用IDと宛
先略称の2回発声を行うことになる。
【0126】そして、ファクシミリ送信の操作が行われ
ているか否かを判別し(ステップS110)、ファクシ
ミリ送信の操作が行われている場合、ステップS112
に進み、ファクシミリ送信の操作が行われていない場
合、SRAM124上の「音声データのセットキー待
ち」のスイッチ項目がセットキー待ちに設定されている
否かを判別する(ステップS111)。
【0127】セットキー待ちに設定されている場合、あ
るいはファクシミリ装置の操作が行われている場合、セ
ットキー310が押下されたか否かを判別し(ステップ
S112)、セットキーが押下された場合、ダイヤル発
信を実行する。一方、ステップS111でスイッチ項目
がセットキー待ちに設定されておらず、自動に設定され
ている場合、セットキー310の押下なしでダイヤル実
行に移行する。
【0128】このように、ファクシミリ送信の操作が行
われている場合、誤認識による送信の可能性を避けるた
め、セットキー310の押下が必要となる。
【0129】一方、通話のための操作中で、セットキー
310の押下なしでダイヤル実行に移行する場合、宛先
表示をユーザが確認する時間が必要であるので、タイマ
によるT時間だけ遅延させてダイヤル実行に移行する。
すなわち、RTC111内にあるタイマにT時間を設定
した後(ステップS118)、ストップキー318が押
下されたか否かを判別し(ステップS119)、押下さ
れていない場合、タイマがT時間を越えたか否かを判別
する(ステップS120)。タイマがT時間を越えた場
合、ダイヤル発信を実行する。一方、タイマがT時間を
越えていない場合、ステップS119の処理に戻る。ま
た一方、ステップS119でストップキー318が押さ
れた場合、待機状態に移行する。
【0130】ここで、タイマに設定されるT時間はあら
かじめSRAM124に登録された時間であり、ユーザ
の操作によって変更自在である。
【0131】一方、ステップS112でダイヤル実行の
ため、セットキー310が押下されるのを待っている状
態で、ユーザが操作パネル122に表示された略称を見
て、宛先誤認識を発見した場合、音声認識キー322を
押して再度、音声認識処理を行わせるようにしてもよ
く、音声認識キー322が押下されたか否かを判別する
(ステップS113)。音声認識キー322が押下され
ない場合、ステップS112の処理に戻り、音声認識キ
ー322が押下された場合、変数Nに値1を加える(ス
テップS114)。
【0132】そして、変数Nが登録数以上であるか否か
を判別し(ステップS115)、登録数以上である場
合、ステップS123に移行してエラー表示を行う。一
方、変数Nが登録数以上でない場合、オペレートタスク
202は、表示中の宛先を除外し(ステップS11
6)、再び音声認識を行うように音声認識タスク208
に依頼するため、限定認識の音声認識スタートコマンド
(コマンド5あるいはコマンド6)を発行する(ステッ
プS117)。この後、ステップS105の処理に戻
る。
【0133】音声認識タスク208は除外対象の音声登
録データの除外フラグをONにして再び音声認識処理を
実行する。この結果、認識された略称表示が再び誤認識
であった場合、セットキー310を押下せず、再び音声
認識キー322を押下してもよい。前回の認識された宛
先と今回の認識された宛先が除外された状態で、新たな
音声認識処理が実行される。
【0134】このように、本実施形態のファクシミリ装
置では、音声認識処理により特定された宛先略称を表示
し、セットキー待ち状態でセットキー310の入力があ
った場合、ダイヤル発信を行い、音声認識キー322の
入力があった場合、待機状態に戻すことなく、再度、音
声認識処理を行う。したがって、音声認識処理で誤認識
が発生した場合、オペレータは装置を停止させて一旦、
待機状態に戻し、再び操作をやり直す必要がなくなり、
即時に再試行させることができる。これにより、操作性
を大幅に向上できる。
【0135】尚、上記実施形態では、音声認識処理によ
り認識された宛先を表示していたが、表示の代わりにあ
るいは表示とともに音声で出力するようにしてもよい。
【0136】また、上記実施形態では、オペレータによ
るセットキー310の押下によりダイヤル発信を実行
し、同じくオペレータによる音声認識キー322の押下
により再度、音声認識スタートコマンドを発行させるよ
うにしていたが、このようなキー入力の代わりに、所定
の音声を発生させることにより実行させてもよい。
【0137】さらに、上記実施形態では、ファクシミリ
装置に適用した場合を示したが、携帯情報端末やパーソ
ナルコンピュータなどの情報処理装置に適用することも
可能である。
【0138】また、本発明は複数の機器から構成される
システムに適用してもよいし、1つの機器からなる装置
に適用してもよい。また、本発明はシステムあるいは装
置にプログラムを供給することによって達成される場合
にも適用できることはいうまでもない。この場合、本発
明を達成するためのソフトウェアによって表されるプロ
グラムを格納した記憶媒体をシステムあるいは装置に読
み出すことによってそのシステムあるいは装置が本発明
の効果を享受することが可能となる。
【0139】図30は記憶媒体としてのROM121の
メモリマップを示す図である。ROM121には、マル
チタスクOSの管理の下に実行される図28および図2
9のフローチャートに示す音声認識処理プログラムモジ
ュールなどが格納されている。
【0140】記憶媒体としては、ROMに限らず、例え
ばフロッピーディスク、ハードディスク、光ディスク、
光磁気ディスク、CD−ROM、CD−R、DVD、磁
気テープ、不揮発性のメモリカードなどを用いることが
できる。
【0141】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張ボー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書き込まれた後、そのプログラムコードの指
示に基づき、その機能拡張ボードや機能拡張ユニットに
備わるCPUなどが実際の処理の一部または全部を行
い、その処理によって前述した実施形態の機能が実現さ
れる場合も含まれる。
【0142】
【発明の効果】本発明の請求項1に記載の通信装置によ
れば、音声認識手段により入力された音声データを認識
し、該音声認識手段が起動して前記音声データの認識を
完了した後、出力手段により該認識された音声データと
対応する宛先データを出力し、前記宛先データを出力し
た後、確認操作の入力があった場合、ダイヤル発信手段
によりダイヤル発信を行う一方、前記宛先データを出力
した後、再試行操作の入力があった場合、再起動手段に
より待機状態になることなく、再び前記音声認識手段を
起動するので、音声認識によって宛先ダイヤルを選択す
る際に誤認識が発生した場合、オペレータが装置を停止
させて待機状態に戻してから再び操作をやり直す必要が
なく、即時に再試行させることができ、操作性を大幅に
向上できる。尚、請求項9に記載の通信方法および請求
項16に記載の記憶媒体においても、同様の効果を得る
ことができる。
【0143】請求項2に記載の通信装置によれば、音声
データ登録手段により音声データを音声メモリに登録
し、電話帳データ登録手段により宛先データを電話帳デ
ータに登録し、管理手段により前記音声メモリに登録さ
れた音声データと前記電話帳データに登録された宛先デ
ータとを対応させて管理し、比較手段により入力された
音声データと前記登録された音声データとを比較し、前
記出力手段は、前記比較手段によって前記入力された音
声データに一致すると判別された前記音声メモリに登録
された音声データと対応する前記電話帳データに登録さ
れた宛先データを出力するので、音声データに対応する
宛先データを正確に出力することができる。尚、請求項
10に記載の通信方法および請求項17に記載の記憶媒
体においても、同様の効果を得ることができる。
【0144】請求項3に記載の通信装置によれば、回線
に接続して遠隔の通信装置と通信する通信手段と、原稿
を読み取る読取手段と、該読み取った原稿を前記通信手
段によって送信する送信手段と、前記通信手段によって
前記回線から受信したデータを記録媒体に記録する記録
手段と、通話を行う通話手段とを備えたので、ファクシ
ミリ装置などに適用することができる。
【0145】請求項4に記載の通信装置によれば、前記
電話帳データ登録手段は、少なくとも宛先略称および宛
先番号を含む宛先データを複数登録しているので、複数
の通信相手の宛先データを登録することができる。尚、
請求項11に記載の通信方法においても、同様の効果を
得ることができる。
【0146】請求項5に記載の通信装置によれば、前記
入力された音声データの特徴を抽出したデジタルデータ
に変換する音声変換手段を備え、前記音声データ登録手
段は、前記変換されたデジタルデータを登録するので、
音声データの認識率を高めることができるともに、特徴
部分だけを記憶することでメモリ容量を抑えるこができ
る。尚、請求項12に記載の通信方法においても、同様
の効果を得ることができる。
【0147】請求項6に記載の通信装置によれば、前記
出力手段は前記宛先データを表示するので、オペレータ
は表示画面を見て、通信相手の宛先データを把握するこ
とができ、確実にオペレータに知らせることができる。
尚、請求項13に記載の通信方法および請求項18に記
載の記憶媒体においても、同様の効果を得ることができ
る。
【0148】請求項7に記載の通信装置によれば、前記
ダイアル発信手段は、キー入力による確認操作の入力が
あった場合、ダイヤル発信を行うので、オペレータのキ
ー操作により簡単に確認操作を行うことができる。尚、
請求項14に記載の通信方法および請求項19に記載の
記憶媒体においても、同様の効果を得ることができる。
【0149】請求項8に記載の通信装置によれば、前記
再起動手段は、キー入力による再試行操作の入力があっ
た場合、再び前記音声認識手段を起動するので、オペレ
ータのキー操作により簡単に再試行操作を行うことがで
きる。尚、請求項15に記載の通信方法および請求項2
0に記載の記憶媒体においても、同様の効果を得ること
ができる。
【0150】請求項16に記載の記憶媒体によれば、通
信装置内のCPUによって実行されるプログラムが格納
された記憶媒体において、前記プログラムは、入力され
た音声データを認識する手順と、該音声データを認識す
る手順を行って前記音声データの認識を完了した後、該
認識された音声データと対応する宛先データを出力する
手順と、前記宛先データを出力した後、確認操作の入力
があった場合、ダイヤル発信を行う手順と、前記宛先デ
ータを出力した後、再試行操作の入力があった場合、待
機状態になることなく、再び前記音声データを認識する
手順に復帰する手順とを含むので、通信装置の拡張性、
汎用性を高めることができる。尚、請求項17、請求項
18およひ請求項20に記載の記憶媒体においても、同
様の効果を得ることができる。
【図面の簡単な説明】
【図1】ファクシミリ装置のハードウェア構成を示すブ
ロック図である。
【図2】通信装置のタスクの構成を示す図である。
【図3】操作パネル122の外観を示す図である。
【図4】電話帳登録の表示画面を示す図である。
【図5】電話帳を登録する際の入力画面を示す図であ
る。
【図6】音声データの登録画面を示す図である。
【図7】電話帳の登録内容を修正する際の表示画面を示
す図である。
【図8】候補文字の選択移動を示す図である。
【図9】音声データの登録画面を示す図である。
【図10】電話帳データを削除する際の画面を示す図で
ある。
【図11】電話帳のサーチを行う際の画面を示す図であ
る。
【図12】番号表示(詳細表示)を行う際の画面を示す
図である。
【図13】ユーザの略称を選択してセットキー310を
押下した際の画面を示す図である。
【図14】音声データの登録時の画面を示す図である。
【図15】音声データの登録時の画面を示す図である。
【図16】音声データの登録時の画面を示す図である。
【図17】音声認識で電話をかける際の画面を示す図で
ある。
【図18】音声認識で電話をかける際の画面を示す図で
ある。
【図19】ハンドセットをオフフックしてから音声認識
キーを押下して電話をかける際の画面を示す図である。
【図20】ハンドセットをオフフックしてから音声認識
キーを押下して電話をかける際の画面を示す図である。
【図21】音声データを削除する際の画面を示す図であ
る。
【図22】音声データを入れ替える際の画面を示す図で
ある。
【図23】音声認識処理の概略を示す図である。
【図24】音声認識スタートコマンドの内容を示す図で
ある。
【図25】音声認識結果コマンドの内容を示す図であ
る。
【図26】理由コードの内容を示す図である。
【図27】オペレートタスク202が管理する電話帳デ
ータと音声認識タスク208が管理する音声登録メモリ
との関係および各テーブルのデータの内容を示す図であ
る。
【図28】音声認識処理手順を示すフローチャートであ
る。
【図29】音声認識処理手順を示すフローチャートであ
る。
【図30】記憶媒体としてのROM121のメモリマッ
プを示す図である。
【符号の説明】
101 CPU 102 モデム 121 ROM 122 操作パネル 124 SRAM 125 ハンドスキャナユニット(スキャナ) 202 オペレートタスク 208 音声認識タスク 306 LCD 310 セットキー(電話帳キー) 322 音声認識キー
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 1/00 H04N 1/00 C 1/32 1/32 Z (72)発明者 松崎 進 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 中尾 宗樹 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 菅原 尚樹 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 外山 猛 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 Fターム(参考) 5C062 AA02 AB17 AB20 AB21 AB23 AB38 AB42 AC21 AC27 AC35 AC38 AC51 AE11 AF02 BA04 5C075 BA04 BA13 CD07 5D015 AA03 BB01 GG01 GG02 GG03 5K036 AA15 BB01 DD17 DD19 DD25 DD46 DD48 FF06 GG04 JJ03 JJ13 KK09 5K101 KK01 LL01 NN08 NN14 NN17 NN21 PP04 RR12

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声データを認識する音声認
    識手段と、 該音声認識手段が起動して前記音声データの認識を完了
    した後、該認識された音声データと対応する宛先データ
    を出力する出力手段と、 前記宛先データを出力した後、確認操作の入力があった
    場合、ダイヤル発信を行うダイヤル発信手段と、 前記宛先データを出力した後、再試行操作の入力があっ
    た場合、待機状態になることなく、再び前記音声認識手
    段を起動する再起動手段とを備えた通信装置。
  2. 【請求項2】 音声データを音声メモリに登録する音声
    データ登録手段と、 宛先データを電話帳データに登録する電話帳データ登録
    手段と、 前記音声メモリに登録された音声データと前記電話帳デ
    ータに登録された宛先データとを対応させて管理する管
    理手段と、 入力された音声データと前記登録された音声データとを
    比較する比較手段とを備え、 前記出力手段は、前記比較手段によって前記入力された
    音声データに一致すると判別された前記音声メモリに登
    録された音声データと対応する前記電話帳データに登録
    された宛先データを出力することを特徴とする請求項1
    記載の通信装置。
  3. 【請求項3】 回線に接続して遠隔の通信装置と通信す
    る通信手段と、 原稿を読み取る読取手段と、 該読み取った原稿を前記通信手段によって送信する送信
    手段と、 前記通信手段によって前記回線から受信したデータを記
    録媒体に記録する記録手段と、 通話を行う通話手段とを備えたことを特徴とする請求項
    1記載の通信装置。
  4. 【請求項4】 前記電話帳データ登録手段は、少なくと
    も宛先略称および宛先番号を含む宛先データを複数登録
    していることを特徴とする請求項1記載の通信装置。
  5. 【請求項5】 前記入力された音声データの特徴を抽出
    したデジタルデータに変換する音声変換手段を備え、 前記音声データ登録手段は、前記変換されたデジタルデ
    ータを登録することを特徴とする請求項2記載の通信装
    置。
  6. 【請求項6】 前記出力手段は前記宛先データを表示す
    ることを特徴とする請求項1記載の通信装置。
  7. 【請求項7】 前記ダイアル発信手段は、キー入力によ
    る確認操作の入力があった場合、ダイヤル発信を行うこ
    とを特徴とする請求項1記載の通信装置。
  8. 【請求項8】 前記再起動手段は、キー入力による再試
    行操作の入力があった場合、再び前記音声認識手段を起
    動することを特徴とする請求項1記載の通信装置。
  9. 【請求項9】 入力された音声データを認識する工程
    と、 該音声データを認識する工程を行って前記音声データの
    認識を完了した後、該認識された音声データと対応する
    宛先データを出力する工程と、 前記宛先データを出力した後、確認操作の入力があった
    場合、ダイヤル発信を行う工程と、 前記宛先データを出力した後、再試行操作の入力があっ
    た場合、待機状態になることなく、再び音声データを認
    識する工程に復帰する工程とを有する通信方法。
  10. 【請求項10】 音声データを音声メモリに登録する工
    程と、 宛先データを電話帳データに登録する工程と、 前記登録された音声データと前記登録された宛先データ
    とを対応させて管理する工程と、 入力された音声データと前記登録された音声データとを
    比較する工程とを有し、 前記出力する工程では、前記比較する工程で前記入力さ
    れた音声データに一致すると判別された前記登録された
    音声データと対応する前記登録された宛先データを出力
    することを特徴とする請求項9記載の通信方法。
  11. 【請求項11】 前記宛先データを登録する工程では、
    少なくとも宛先略称および宛先番号を含む宛先データを
    複数登録することを特徴とする請求項10記載の通信方
    法。
  12. 【請求項12】 前記入力された音声データの特徴を抽
    出したデジタルデータに変換する工程を有し、 前記音声データを登録する工程では、前記変換されたデ
    ジタルデータを登録することを特徴とする請求項10記
    載の通信方法。
  13. 【請求項13】 前記出力する工程では、前記宛先デー
    タを表示することを特徴とする請求項9記載の通信方
    法。
  14. 【請求項14】 前記ダイアル発信を行う工程では、キ
    ー入力による確認操作の入力があった場合、ダイヤル発
    信を行うことを特徴とする請求項9記載の通信方法。
  15. 【請求項15】 前記復帰する工程では、キー入力によ
    る再試行操作の入力があった場合、再び前記音声データ
    を認識する工程を行うことを特徴とする請求項9記載の
    通信方法。
  16. 【請求項16】 通信装置内のCPUによって実行され
    るプログラムが格納された記憶媒体において、 前記プログラムは、 入力された音声データを認識する手順と、 該音声データを認識する手順を行って前記音声データの
    認識を完了した後、該認識された音声データと対応する
    宛先データを出力する手順と、 前記宛先データを出力した後、確認操作の入力があった
    場合、ダイヤル発信を行う手順と、 前記宛先データを出力した後、再試行操作の入力があっ
    た場合、待機状態になることなく、再び音声データを認
    識する手順に復帰する手順とを含むことを特徴とする記
    憶媒体。
  17. 【請求項17】 前記プログラムは、 入力された音声データと登録された音声データとを比較
    する手順とを含み、 前記出力する手順では、前記比較する手順で前記入力さ
    れた音声データに一致すると判別された前記登録された
    音声データと対応する前記登録された宛先データを出力
    することを特徴とする請求項16記載の記憶媒体。
  18. 【請求項18】 前記出力する手順では、前記宛先デー
    タを表示することを特徴とする請求項16記載の記憶媒
    体。
  19. 【請求項19】 前記ダイアル発信を行う手順では、キ
    ー入力による確認操作の入力があった場合、ダイヤル発
    信を行うことを特徴とする請求項16記載の記憶媒体。
  20. 【請求項20】 前記復帰する手順では、キー入力によ
    る再試行操作の入力があった場合、再び前記音声データ
    を認識する手順を行うことを特徴とする請求項16記載
    の記憶媒体。
JP10292785A 1998-10-01 1998-10-01 通信装置、方法および記憶媒体 Pending JP2000115325A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP10292785A JP2000115325A (ja) 1998-10-01 1998-10-01 通信装置、方法および記憶媒体
US09/408,348 US6785366B1 (en) 1998-10-01 1999-09-29 Apparatus for making outgoing call

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10292785A JP2000115325A (ja) 1998-10-01 1998-10-01 通信装置、方法および記憶媒体

Publications (1)

Publication Number Publication Date
JP2000115325A true JP2000115325A (ja) 2000-04-21

Family

ID=17786316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10292785A Pending JP2000115325A (ja) 1998-10-01 1998-10-01 通信装置、方法および記憶媒体

Country Status (1)

Country Link
JP (1) JP2000115325A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106453871A (zh) * 2016-09-29 2017-02-22 努比亚技术有限公司 拨号管理方法、装置及终端

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106453871A (zh) * 2016-09-29 2017-02-22 努比亚技术有限公司 拨号管理方法、装置及终端

Similar Documents

Publication Publication Date Title
US6785366B1 (en) Apparatus for making outgoing call
JP2002202791A (ja) 通信装置、制御方法および記憶媒体
JP2000115325A (ja) 通信装置、方法および記憶媒体
JP2000115327A (ja) 通信装置、方法および記憶媒体
JP2000253171A (ja) 通信装置、方法および記憶媒体
JP2000115328A (ja) 通信装置、方法および記憶媒体
JP2000115347A (ja) 通信装置、方法および記憶媒体
JP2000115326A (ja) 通信装置、方法および記憶媒体
JP2000115335A (ja) 通信装置、登録データ管理方法および記憶媒体
JP2000112497A (ja) 音声認識方法及び装置と通信装置及びその制御方法
JP2003195885A (ja) 通信装置およびその制御方法
JP2000115337A (ja) 通信装置、登録データ管理方法および記憶媒体
JP2000115336A (ja) 通信装置、登録データ管理方法および記憶媒体
JP2000115338A (ja) 通信装置、登録データ管理方法および記憶媒体
JP2002073083A (ja) 音声認識装置、音声認識方法、通信装置、通信制御方法および記憶媒体
JP2000112493A (ja) 音声認識装置及び通信装置とそれらの制御方法
JP2000112492A (ja) 音声認識方法及び装置と通信装置及びその制御方法
JP2000112495A (ja) 音声認識方法及び装置と通信装置及びその制御方法
JPH10276256A (ja) 画像通信装置
JP3057170B2 (ja) ファクシミリ装置、電話機及びその発信方法と電話番号認識方法
JP3607030B2 (ja) 通信装置
JP2000069199A (ja) ファクシミリ通信機能付き親子電話機
KR100301997B1 (ko) 복합기의음성단축다이얼방법및장치
JP2628778B2 (ja) ファクシミリ装置
JP3498700B2 (ja) ファクシミリ装置