JP2003150183A - 通信装置 - Google Patents

通信装置

Info

Publication number
JP2003150183A
JP2003150183A JP2001349730A JP2001349730A JP2003150183A JP 2003150183 A JP2003150183 A JP 2003150183A JP 2001349730 A JP2001349730 A JP 2001349730A JP 2001349730 A JP2001349730 A JP 2001349730A JP 2003150183 A JP2003150183 A JP 2003150183A
Authority
JP
Japan
Prior art keywords
voice
data
unit
communication device
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001349730A
Other languages
English (en)
Inventor
Shingo Nishizaki
伸吾 西崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001349730A priority Critical patent/JP2003150183A/ja
Publication of JP2003150183A publication Critical patent/JP2003150183A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【課題】 音声録音時の不具合を解消し、音声の登録作
業を容易にでき、かつ音声メッセージ(又は画像デー
タ)を文字データ又は音声データとして送信相手に確実
に通知する。 【解決手段】 通信装置1は、文字データLT_Dを記
憶する音声用データメモリ154と、文字データLT_
Dを再生音声データRVC_Dに変換する音声合成部1
8と、音声データRVC_Dを音声信号RVC_Aに変
換する音声出力部21と、文字データLT_Dを表示す
る表示部16と、ネットワーク300に接続された他の
通信装置と情報の送受信を行う通信部19とを有し、音
声メッセージSMを、通信部19により通信装置に送信
するに際して、音声用データメモリ154に記憶された
文字データLT_Dを音声信号に変換することなく送信
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声メッセージの
録音・再生機能を有するファクシミリ装置等の通信装置
に関し、具体的には、音声録音時の不具合を解消し、音
声の登録作業を容易にでき、かつ音声メッセージを文字
データまたは音声データとして送信相手に確実に通知す
ることができる、および/または、読み取った画像デー
タから文字情報のみを認識し文字データまたは音声デー
タとして送信相手に確実に通知することができる通信装
置に関する。
【0002】
【従来の技術】近年、ファクシミリ装置,電話機等の通
信装置においては、例えば、留守番電話対応メッセージ
機能付きのファクシミリ装置、駅構内,コンビニエンス
ストアに備え付けられる音声ガイダンス機能付きの有料
ファクシミリ装置等、音声メッセージの録音・再生機能
を有するものが一般的となっている。
【0003】この種の録音・再生機能付き通信装置で
は、メッセージ等を録音した場合に、ユーザは、録音し
たメッセージを、当該通信装置で再生することで、録音
が正常に行われたか否か等、録音状態の確認をすること
ができる。
【0004】
【発明が解決しようとする課題】しかし、従来の録音・
再生機能付き通信装置では、録音が適正に行われたか否
か等の判断、例えば録音時の音声レベルが適当であるか
否かの判断は、個々のユーザの感覚や周囲環境等によっ
てばらつくため、必ずしも信頼性が高いとは言えない。
【0005】例えば、音声レベルが低すぎる場合には、
送受信相手の側でメッセージが聞き取りにくくなる。逆
に、音声レベルが高すぎる場合には、音声波形に歪みが
生じて聞き取りにくくなり、また通信回線への出力レベ
ルが規格値を超えてしまうおそれが生じる。
【0006】また、録音・再生機能付き通信装置におい
て、複数のメッセージを入力する場合には、ユーザの声
の大きさ、マイクの使い方、周囲環境等の影響により、
それぞれの音声メッセージの音声レベルが異なってしま
う。メッセージごとに再生される音声レベルが異なる
と、相手側でメッセージが聞き取りにくくなる。また、
録音したメッセージの内容に修正の必要ない場合であっ
ても、録音レベルが不適正だと、再度録音する必要が生
じるため、ユーザに余計な負担を与えてしまう。なお、
メッセージごとの音声レベルを揃えた、留守番電話機、
留守番電話機能付きファクシミリ装置も知られている
(特開平7−319499号公報参照)。このファクシ
ミリ装置は、録音に際して、半導体メモリに記憶される
音声データについて音声レベルを算定しておき、再生時
に音声レベルを基準レベルにシフトさせるものであり、
プロセッサによる演算処理が複雑になってしまう。
【0007】さらに、従来の録音・再生機能付き通信装
置による、マイクを用いた音声メッセージは、ユーザ自
身の声でしか登録できない。このため、自分の声でメッ
セージを登録することに抵抗があるユーザには、この種
の通信装置は利用しにくい。
【0008】加えて、従来の録音・再生機能付き通信装
置では、マイクから入力された音声は、符号化されてメ
モリに保存されるものが多いが、録音時間を長くしたい
場合、音質を良くしたい場合、ともにデータ量が増える
ため、ユーザにとってメモリ容量に応じたメッセージの
管理に注意が必要となる。例えば、複数のメッセージを
登録したいときには、ユーザは、録音時間を優先する
か、登録時間を優先するかの煩わしい選択をしなければ
ならない。
【0009】本発明は、音声録音時の不具合を解消し、
音声の登録作業を容易にでき、かつ音声メッセージを文
字データまたは音声データとして送信相手に確実に通知
することができる通信装置を提供することを目的とす
る。また、本発明は、このような音声メッセージを文字
データまたは音声データとして送信相手に通知すること
ができる機能に代えて、あるいはこの機能と共に、スキ
ャナーで読み取った画像データから登録したいメッセー
ジの内容を文字データとしてメモリに保存しておき、こ
の文字データを音声に再変換して出力することで、上記
音声録音時の不具合を解消し、ユーザが音声メッセージ
を登録する際の負担を軽減することができる通信装置を
提供することをも目的とする。
【0010】
【課題を解決するための手段】本発明の通信装置は、音
声メッセージを文字データとして、および/または画像
データから文字情報を認識し文字データとして記憶する
記憶手段と、前記記憶手段に記憶された文字データを読
み出し、この文字データを音声データに変換する音声合
成手段と、前記音声合成手段により変換された音声デー
タをアナログ音声信号に変換して音声出力する音声出力
手段と、前記記憶手段に記憶された文字データにかかる
文字列を表示する表示部と、ネットワークに接続された
他の通信装置と情報の送受信を行う通信手段とを有する
ものであって、前記音声メッセージを、前記通信手段に
より、前記他の通信装置に送信するに際して、前記記憶
手段に記憶された文字データを前記他の通信装置に送信
し、または前記記憶手段に記憶された文字データを前記
音声合成手段により音声データに変換し、さらにこれを
アナログ音声信号に変換して前記他の通信装置に送信す
ることを特徴とする。
【0011】本発明の通信装置は、音声通知機能(送信
相手に音声情報を送信する機能)を持つファクシミリ装
置,コピー機・プリンタ・ファクシミリ複合機,電話機
等である。本発明においては、通信メッセージは、必ず
しも、マイク等の音声入力手段や、スキャナー等の画像
データ読取り手段を利用して登録しなくても、例えば通
信装置に備えら得た操作手段から文字データをキー操作
により登録することもできる。
【0012】通信手段によりメッセージを送信する場合
には、記憶手段に記憶されている文字データをそのまま
(音声合成手段により音声データに変換することな
く)、前記他の通信装置に送信する場合には、当該他の
通信装置は、受信したデータを文字列として液晶ディス
プレイ等の表示部に表示することもできるし、当該他の
通信装置が、本発明の通信装置と同様に文字データの音
声合成機能を有している場合には、前記文字データを音
声データに変換し、さらにこれをアナログ音声信号に変
換してスピーカ等の音声出力手段により音声として出力
することもできる。
【0013】本発明の通信装置は、さらに、入力された
音声メッセージから音声信号を生成する音声入力手段
と、前記音声入力手段により生成された音声信号の認識
処理を行い当該音声信号を文字データに変換する音声認
識手段とを有し、この音声認識手段により変換された文
字データを前記記憶手段に記憶するようにもできる。
【0014】通常、音声入力手段は、マイク、A/D変
換器等を含み、音声出力手段はD/A変換器、音声出力
用アンプ、スピーカ等を含む。音声認識手段や音声合成
手段は、例えば通信装置のCPUとソフトウェア(通常
ROMに搭載されている)とにより実現される。もちろ
ん、CPUに代えてDSPがその機能を果たすこともで
きる。記憶手段は、通常は揮発性メモリであるが、フラ
ッシュメモリ等の不揮発性メモリであってもよい。
【0015】本発明の通信装置では、音声メッセージを
文字データに変換して、あるいは画像データから文字情
報のみを認識し文字データに変換して、記憶手段に保存
するので、音声信号を符号化して保存する方式、あるい
は画像データをそのまま保存する方式、に比べて大幅に
メモリの使用量が少なくなる。したがって、音声登録の
ために用意されているメモリ領域に、録音時間が長いメ
ッセージを多数保存することができる。
【0016】本発明の通信装置では、再生時において、
音声メッセージにかかる文字データ、および/または画
像データから認識した音声メッセージにかかる文字デー
タを、音声合成手段により音声信号に変換する場合に
は、音声の再生レベルは一定に保たれるので、再生時の
音声レベルが録音時の環境等によって、ばらつくことが
なくなる。すなわち、音声メッセージにかかる文字デー
タ、および/または画像データから認識した文字データ
を、送信先の通信装置に送信した場合には、当該送信先
の通信装置で均一なレベルで音声再生ができる。音声メ
ッセージ、および/または画像データから認識した文字
データにかかるアナログ音声信号を送信先の通信装置に
送信する場合には、当該音声信号を均一なレベルで通信
回線に出力できる。
【0017】また、本発明の通信装置では、前記音声メ
ッセージは、当該音声メッセージを構成する複数の音声
フレーズそれぞれについて、前記音声入力手段による音
声の入力、および前記音声認識手段による文字データへ
の変換が行われて、前記記憶手段に記憶されるようにし
てもよい。この場合、前記音声メッセージは、当該音声
メッセージを構成する前記複数の音声フレーズの少なく
とも1音声フレーズについて、前記音声入力手段による
音声の再入力、前記音声認識手段による文字データへの
再変換、前記記憶手段による前記文字データの再記憶、
および前記音声合成手段による前記文字データの再音声
合成が行われて、前記記憶装置に記憶されるようにもで
きる。もちろん、前記音声出力手段による音声の再出力
を、前記1音声フレーズごとに行えるようにしてもよい
し、再音声合成が行われた後に、音声メッセージ全体を
通して、音声の再出力を行えるようにしてもよい。これ
により、ユーザは、1つの音声メッセージを、複数の音
声フレーズに分解して音声入力(録音)を行うことがで
き、しかも、例えば音声フレーズ単位での修正や、フレ
ーズの追加等を、表示部を参照しながら行うことができ
るので、ユーザにとっては利便性が高い。
【0018】さらに、本発明の通信装置では、前記画像
データが、当該画像データの読取り時に登録用メッセー
ジであることが識別できる識別パターンを付加したシー
トを使用して読み込むようにすることもでき、このよう
にすれば、画像データの読取り時に認識パターンを検出
した際に、自動的に文字情報の認識などの処理が行われ
るように構成することができる。
【0019】加えて、本発明の通信装置では、前記記憶
手段に記憶された文字データを画像データに変換し、プ
ロッタ等で記録紙上にプリントアウトする印刷手段を有
していてもよく、メモリ内の文字データを再利用し易い
画像データ(例えば、文字コードをビットで表したドッ
ト群)に変換して記録紙上に出力することで、記録紙で
の保存や再利用ができるようにすることもできる。この
出力紙は、メッセージを再度登録したい場合や、複製を
作成したい場合などに、容易に使用することが可能とな
る。
【0020】加えて、本発明の通信装置は、音声合成手
段が複数の音色データの選択手段を有し、記憶手段に記
憶されている文字データに、音色データの何れかを使用
して音声合成を行うようにできる。これにより、自分の
声でメッセージを登録することに抵抗があるユーザにと
っては、利便性が高い通信装置を提供できる。
【0021】
【発明の実施の形態】本発明の実施形態を図面に基づい
て説明する。図1は、本発明の一実施形態を、音声メッ
セージの録音・再生機能付きのファクシミリ装置を用い
て実現したときのブロック構成図である。
【0022】図1において、ファクシミリ装置1は、制
御部11と、スキャナー部12と、プロッタ部13と、
符号化復号化部14と、記憶部15と、操作部16と、
音声認識部17と、音声合成部18と、通信部19とを
含んで構成され、これらはシステムバス100により接
続されている。また、音声認識部17には音声入力部2
0が接続されており、音声合成部18には音声出力部2
1が接続されている。なお、記憶部15,音声認識部1
7,音声合成部18,通信部19、音声入力部20およ
び音声出力部21は、それぞれ本発明における、記憶手
段、音声認識手段,音声合成手段、通信手段および音声
入力手段に対応している。
【0023】制御部11は、CPU(またはCPUを含
む回路)からなり、上記各構成要素の制御を統括的に行
う。スキャナー部12は、ファクシミリ送信時、情報サ
ービス用の画像登録時、コピー時等において、原稿上画
像を光学的に読み取る。プロッタ部13は、画像を記録
紙上に出力するもので、一般にレーザ方式やインクジェ
ット方式のプリンタが使用される。符号化復号化部14
は、送信する画像情報を一定の符号化法によりデータ圧
縮する一方、受信した圧縮画像情報を復号化して元の画
像に伸張する。
【0024】記憶部15は、ROM151と、RAM1
52と、画像用データメモリ153と、音声用データメ
モリ154とからなる。ROM151は、制御部11が
実行する各種制御プログラム等が格納された不揮発性メ
モリであり、RAM152はシステム制御部が各種の制
御を実行するときに使用される作業エリア用の揮発性メ
モリである。
【0025】また、画像用データメモリ153は、送受
信時に画像データを一時的に蓄積する揮発性記憶装置で
あり、音声用データメモリ154は、録音した音声メッ
セージの保存用の揮発性記憶装置である。なお、同一の
メモリ,メモリモジュールを二分割して、一方を画像用
データメモリ153、他方を音声用データメモリ154
とすることもできる。
【0026】操作部16は、テンキーを含むキーボード
等の入力部と、LEDや液晶ディスプレイからなる表示
部とからなるユーザインタフェースであり、ユーザは入
力部から各種登録や設定の操作を行うことができ、表示
部には動作状態等が表示される。
【0027】音声認識部17は、音声入力部20から入
力された音声信号を認識処理し、文字データに変換す
る。
【0028】音声合成部18は、文字データを音声デー
タに変換する。後述するように(図5参照)、この変換
に際しては音色データとの合成が行われる。また、さら
に音声の、抑揚データをさらに合成することもできる。
音声合成部18の変換対象となる文字データは、(1)
ファクシミリ装置1において、ユーザが音声メッセージ
を作成する際に入力された文字データ、(2)他のファ
クシミリ装置から着信があったときに、受信データに含
まれる、音声メッセージとしての文字データである。
【0029】通信部19は、ネットワーク制御装置19
1とモデム192とにより構成される。ネットワーク制
御装置191は、電話回線が接続されるもので、送受信
(発着信)の際に所定の回線制御を行い、モデム192
は、画像情報と伝送制御のためのプロトコルを送受信す
る。
【0030】音声入力部20は、音声信号を入力するマ
イク201と、A/D変換器202とからなり、マイク
201から入力された音声信号を、A/D変換器202
でデジタルデータに変換する。
【0031】音声出力部21は、D/A変換器211
と、音声出力用アンプ212と、スピーカ213とから
なり、音声合成部で再生されたデジタル音声信号をD/
A変換器211でアナログ信号に変換することで音声波
形を生成し、これを音声出力用アンプ212により増幅
してスピーカ213から出力することができる。また、
他のファクシミリ装置から着信があったときに、当該他
のファクシミリ装置からの音声信号を、音声出力用アン
プ212により増幅してスピーカ213から出力するこ
ともできる。
【0032】図2のフローチャートを用いて、音声メッ
セージを音声フレーズに分割せずに録音する場合のファ
クシミリ装置1の動作を説明する。なお、図1に、各信
号,データの流れを併せて記す。
【0033】この場合には、ユーザは、まず、操作部1
6上で、音声メッセージの録音処理を選択する(A0
1)。
【0034】次に、音声入力部20のマイク201を使
用して、音声メッセージSMの録音を行う(A01)。
音声メッセージSMはマイク201から入力されてアナ
ログ音声信号VC_Aに変換され、さらにA/D変換器
202によりデジタルデータ(音声データVC_D)に
変換される。
【0035】ユーザは、録音が不適切だと判断したとき
は録音のやり直しができ、ステップA01に処理を戻す
ことができる。録音が適切であると判断したときは、操
作部16を操作して、音声認識処理のステップに処理を
進めることができる(A02)。
【0036】ユーザが音声認識処理のステップに処理を
進めたときは、音声データVC_Dは、音声認識手段1
7に入力される。音声認識手段17では、入力された音
声データVC_Dを音声認識処理(パターン照合等)
し、文字データLT_Dへの変換処理を行う(A0
3)。この文字データLT_Dは、音声用データメモリ
154に保存される。
【0037】ユーザは、音声メッセージSMの録音を終
了したときは、操作部16を操作することで、音声メッ
セージの確認処理をするか否かを選択する(A04)。
確認処理をしない場合には、処理は、後述する登録処理
A08に移行し、登録が完了する。
【0038】確認処理をする場合には、音声合成部18
は、音声用データメモリ154に保存された文字データ
LT_Dを読み出し、これを再生音声データRVC_D
に変換する。この再生音声データRVC_Dは、音声出
力部21のD/A変換器211により再生アナログ音声
信号RVC_Aに変換された後、音声出力用アンプ21
2により増幅され、スピーカ213から再生音声メッセ
ージRSMとして出力される(A05)。
【0039】ユーザは再生音声メッセージRSMを耳に
より確認することができ、音声メッセージSMが正常に
録音されていないときは、操作部16を用いて音声メッ
セージSMの再入力を選択することができる。音声メッ
セージSMの再入力が選択されたときは、処理はステッ
プA01に戻される(A06)。
【0040】一方、ユーザは音声メッセージSMが正常
に録音できているときには、操作部16を用いて登録を
行うことができ(A07)、これにより音声メッセージ
の登録処理は終了する。
【0041】ところで、音声認識処理で、文字データへ
の変換を行うが、音声認識による誤変換の可能性は避け
ることができない。例えば、音声メッセージSMの録音
終了後に、登録された文字データ(音声用データメモリ
154に保存された文字データLT_D)を音声合成部
18により再生し、スピーカ213から出力すること
で、録音した内容が正確な文字データに変換されている
かを確認することができる。この場合、誤変換があった
場合には、再度録音をしなければならない。このような
不都合は、次に述べる処理により解決される。
【0042】以下、図4のフローチャートを用いて、音
声メッセージを音声フレーズに分割して録音する場合の
ファクシミリ装置1の動作を説明する。なお、図3に、
図1に示した音声認識部17,音声合成部18,音声入
力部20,音声出力部21,音声用データメモリ154
を抜き出して示すとともに、各信号,データの流れを併
せて記す。
【0043】まず、ユーザが音声メッセージSMを録音
しようとする場合、操作部16を使用して、音声メッセ
ージSMの録音処理を選択する(B01)。
【0044】次に、音声入力部20のマイク201を使
用して、音声フレーズSF1の録音を行う(B01)。
この音声フレーズSF1は、図2のステップA01の場
合と同様、マイク201から入力されてアナログ音声信
号VC_A1に変換され、さらにA/D変換器202に
より音声データVC_D1に変換される。
【0045】この段階で、ユーザが音声フレーズSF1
の録音が不適切であると判断したときは録音のやり直し
ができ、処理をステップB01に戻すことができる。録
音が適切であると判断したときは、ユーザは操作部16
を操作して、音声認識処理のステップに処理を進めるこ
とができる(B02)。
【0046】ユーザが音声認識処理のステップに処理を
進めたときは、音声データVC_D1は、音声認識手段
17に入力される。音声認識手段17では、入力された
音声データVC_D1を音声認識処理(パターン照合
等)し、文字データLT_D1への変換処理を行う。こ
の文字データLT_D1は、音声用データメモリ154
に保存される(B03)。
【0047】このステップB03の処理が終了すると、
操作部16の表示部(図示せず)に文字データLT_D
1が表示される(B04)。
【0048】ユーザは、操作部16に表示された内容
と、録音した音声フレーズSF1の比較を行い(B0
5)、誤変換がない場合は、操作部16の所定キーを操
作することで、文字データLT_D1を音声用データメ
モリ154にそのまま保存する(B06)。一方、誤変
換がある場合には、操作部16の所定キーを操作し、ス
テップB01に処理を戻し、音声入力部20のマイク2
01を使用して、音声フレーズSF1の録音を再度行
う。
【0049】以下、音声フレーズSF2〜SFKを入力
し終えるまで、上記の処理(B01〜B06)が繰り返
される(B07)。
【0050】ユーザは、音声フレーズSF1〜SFKの
録音を終了したときは、操作部16を操作することで、
確認処理を選択すること、すなわち音声メッセージの確
認をすることができる(B08)。この確認処理が選択
されると、音声合成部18は、音声用データメモリ15
4に保存された音声メッセージSM(SF1,SF2,
・・・,SFK)の文字データLT_D1,LT_D
2,・・・,LT_DKを読み出し、これを結合して文
字データLT_Dを生成し、これを再生音声データRV
C_Dに変換する。
【0051】この再生音声データRVC_Dは、音声出
力部21のD/A変換器211により、再生アナログ音
声信号RVC_Aに変換された後、音声出力用アンプ2
12により増幅され、スピーカ213から再生音声メッ
セージRSMとして出力される(B09)。
【0052】ユーザは再生音声メッセージRSMを耳に
より確認し、登録するか音声メッセージの再入力をする
か否かを選択することができる(B10)。
【0053】音声メッセージSMが正常に録音されてい
ないときは、操作部16を用いて音声メッセージSMの
再音声入力を選択することができる。なお、この場合に
は、音声用データメモリ154に保存された文字データ
LT_D1,LT_D2,・・・,LT_DKのうち、
所望の文字データにかかる音声フレーズ(SF1,SF
2,・・・,SFKの少なくとも1つ)の再音声入力を
行うこともできる。
【0054】音声メッセージSMの再入力、または音声
フレーズSF1,SF2,・・・,SFKの再入力が選
択されたときは、処理はステップB01に戻される。な
お、音声フレーズSF1,SF2,・・・,SFKの再
音声入力を行わず、操作部16に文字データLT_D
1,LT_D2,・・・,LT_DKを表示させ、ファ
クシミリ装置1に備えられた文字編集機能により、当該
文字データを編集することもできる。
【0055】一方、ユーザは音声メッセージSMが正常
に録音できていると判断したときには、操作部16を用
いて登録を行うことができ(B11)、これにより音声
メッセージの登録処理は終了する。
【0056】図2および図4に述べた処理では、音声メ
ッセージの音色については説明しなかったが、ユーザ
は、相手先やメッセージの内容によって、あるいは複数
のユーザごとに異なった音色で音声メッセージを登録す
ることもできる。すなわち、音声合成部18に用いる音
色データのテーブルを複数用意し、当該テーブルを選択
できる構成とすることができる。音色データのテーブル
は、予めROM151に格納しておいてもよいし、適宜
の入力手段により(例えば、コンピュータからのデータ
転送により)、音声用データメモリ154に格納できる
ようにしてもよい。
【0057】例えば、図2のフローチャートで示した例
では、音声合成部18で文字データに変換された音声メ
ッセージを音声合成する場合、音声用データメモリ15
4に保存された文字データLT_Dを読み出し、これを
所定の音色データのテーブルを用いて、所定の音色の再
生音声データRVC_Dに変換することができる。
【0058】音色データの選択方法として、図5に示す
ように、画像の線密度や濃度の選択と同じように、操作
表示部16に音色選択スイッチ(本発明における、選択
手段)SWを設け、女性・男性のように音色を選択でき
る構成とすることができる。また、高音〜低音の範囲
で、段階的に設定できるスイッチを設けることもでき
る。また、ユーザは音声メッセージSMを文字データL
T_Dとして音声用メモリ16に保存する際に、当該文
字データに音色データの種類を識別する情報を付加して
保存することができる。
【0059】次に、ファクシミリ装置1により音声メッ
セージSMを送受信するときの動作を図6のシステム構
成図および図7のフローチャートにより説明する。
【0060】図6では、図1に示したファクシミリ装置
1と同一構成のファクシミリ装置1Aから、同じく図1
に示したファクシミリ装置1と同一構成のファクシミリ
装置1Bに音声メッセージを転送する様子を示してい
る。
【0061】音声メッセージSMを、ファクシミリ装置
1Aからファクシミリ装置1Bに、文字データLT_D
の状態で転送する場合を実線で示し、再生アナログ音声
信号RVC_Aの状態で転送する場合を破線で示してあ
る。なお、図6では、ファクシミリ装置1A,1Bの、
表示部(図1に示した操作部16の一部を構成する)を
符号161A,161Bで、音声合成部を符号18A,
18Bで、通信部を符号19A,19Bで、音声出力部
を符号21A,21Bで、通信回線を符号200で示し
てある。
【0062】音声メッセージSMを、文字データLT_
Dの状態で転送する場合には、ファクシミリ装置1Bか
らのメッセージ要求があったときに、要求されたメッセ
ージに対応する文字データLT_Dを音声用データメモ
リ154から読み出して転送することができる。また、
ファクシミリ装置1Bからのメッセージ要求の有無によ
らずに、文字データLT_Dを音声用データメモリ15
4から読み出して転送することもできる。
【0063】図7では、ダイヤルすると(「STAR
T」)、接続処理(接続プロトコル)が実行され(C0
1)、ファクシミリ装置1A,1B間で情報のやりとり
が行われる。ファクシミリ装置1Aでは、音声メッセー
ジSMの情報(文字データLT_Dや、再生アナログ音
声信号RVC_A)を転送したものとする。文字データ
LT_Dは、ファクシミリ装置1Aの音声データ用メモ
リ154から、モデム(図1の符号191参照)を介し
て通信回線300に送信される。また、再生アナログ音
声信号RVC_Aは、文字データLT_Dを、音声合成
部18において再生音声データRVC_Dに変換し音声
出力部21のD/A変換器211により、ネットワーク
制御装置192を介して通信回線200に送出される。
【0064】ファクシミリ装置1Bでは、ステップC0
1の接続処理の実行に際して、応答情報に音声メッセー
ジSMの情報が含まれるか否かが判断され(C02)、
音声メッセージSMの情報が含まれていない場合には、
ファクシミリデータ(画像データ)の転送が行われ(C
07)、転送終了後に切断処理(切断プロトコル)が実
行され(C08)、処理は終了する(「END」)。
【0065】一方、ステップC02において、応答情報
に音声メッセージSMの情報が含まれる場合には、その
情報が文字データLT_Dであるか否かが判断される
(C03)。音声メッセージSMの情報が文字データL
T_Dである場合には、文字データLT_Dは表示部1
61Bに表示されるとともに(C04)、文字データL
T_Dは音声合成部18Bにより再生アナログ音声信号
RVC_Aに変換される(C05)。この再生アナログ
音声信号RVC_Aは、音声出力部21Bにより音声と
して出力される(C06)。この後、ファクシミリデー
タの転送が行われ(C07)、転送終了後に切断処理
(切断プロトコル)が実行され(C08)、処理は終了
する(「 END」 )。なお、文字データLT_Dは、
文字列として、ファクシミリ装置1Bにおいてプリント
出力した際に、適宜のシートに文字列として表示するこ
ともできる。例えば、ファクシミリ装置1Bは、文字デ
ータLT_Dにかかる文字列を、プリント出力される1
枚目の用紙に表示することで、ファクシミリ装置1Aの
ユーザは、ファクシミリ装置1Bのユーザに、音声メッ
セージSMを文字列として、正確に伝えることができ
る。
【0066】図8は、本発明の他の実施形態を、図1に
示すファクシミリ装置に適応して実現したときのブロッ
ク構成図である。図8において、図1と同一符号は図1
と同一機能部を示しており、ファクシミリ装置に付加し
た文字認識部22が追加されている。文字認識部22
は、スキャナー部12で読み取った画像データから文字
情報のみを抽出し、文字認識処理し、文字データに変換
する機能を有している。なお、図8の態様において、画
像データ用メモリ153と、音声用データ用メモリ15
4とRAM152とは、同一のメモリを共用するような
構成としてもよい。
【0067】図9のフローチャートを用いて、スキャナ
ー部12で読み取った画像データから文字情報のみを認
識処理して文字データに変換する場合のファクシミリ装
置1の動作を説明する。ユーザは、まず、操作部16上
で、画像メッセージの登録処理を選択する(登録処理開
始)。この画像メッセージの登録には、例えば、図10
(A)に示すような、メッセージ記載欄S11が設けら
れたメッセージ登録用シートS1が使用される。なお、
このメッセージ登録用シートS1に代えては、メッセー
ジの登録用であることが判別できる識別パターンを付加
した所定のシートを使用し、読取り時にこの識別パター
ンを検出した場合は、自動的にメッセージの登録処理に
移行する構成とすることもできる。
【0068】次に、スキャナー部12でメッセージが記
載された原稿(例えば、上記のメッセージ登録用シート
S1)の読込みを行う(D01)。読み取られた画像デ
ータは文字認識部22に送られる文字認識が行われれ
る。文字認識部22は、まず画像データから文字の抽出
を行い、次に抽出した文字画像について文字認識処理を
行って、文字データに変換する処理を行い、文字データ
は、音声データ用メモリ154に保存される(D0
2)。
【0069】一方、ユーザは、文字データへの変換が不
適切だと判断したときは文字認識処理のやり直しがで
き、ステップD01に処理を戻すことができる。変換が
適切であると判断したときは、操作部16を操作して、
音声再生のステップに処理を進めることができる(D0
3)。
【0070】音声再生のステップD04では、音声デー
タ用メリモ154に保存されている上記文字データを読
み出し、音声合成部18において当該文字データから音
声データを生成する。生成された音声データは、音声出
力部21で音声信号に変換され、さらにアンプ212で
増幅されスピーカー213から再生音が出力される。ユ
ーザは、再生された音声を確認し(D05)、メッセー
ジが正確に登録されている場合は、登録処理を行って
(D06)、一連の音声メッセージの登録処理動作を終
了させる。なお、確認の方法は、上記のような音声再生
方法に限らず、音声再生と同時に表示部(図6の161
A,161B)に認識後の文字データを表示するように
することもできる。
【0071】メッセージの内容に間違いがある場合は、
再入力処理を選択し、再びステップD01に戻って、メ
ッセージの読込みを行うことができる(D05)。以上
のようにして、音声メッセージの登録処理動作を完了す
る。
【0072】音声メッセージの再生時の動作は、相手側
からの要求があったときに、要求されたメッセージに該
当する文字データを音声データ用メモリ154から読み
出し、これを音声合成部18で音声信号に変換し、音声
出力部21で、通信回線(図6の符号200)に出力す
るのに最適なレベルに変換して、通信回線に音声信号を
出力する。このようにして、音声メッセージの再生処理
が行われる。
【0073】本発明では、音声データ用メモリ154に
蓄積された音声データをプロッタ部13で出力すること
もできる。プロッタ部13への出力は、図9に示すメッ
セージ登録時の確認処理(D03)が終了した時点以降
に行う。また、ユーザが表示部(図6の161A,16
1B)を用いて、音声データ用メモリ154に蓄積され
たメッセージデータを閲覧し、必要なものを選択して出
力するようにしてもよい。
【0074】プロッタ部13で出力するに際しては、音
声データ用メモリ154に蓄積されたメッセージデータ
を、例えば、図10(B)に示すフォーマットに変換し
て行うようにすることができる。すなわち、図10
(B)では、文字認識した結果を、シートS2のメッセ
ージ記載欄S21に文字で出力すると共に、再利用する
際に(すなわち、スキャナー部12で再び読込ませる際
に)認識し易いように、ドット群出力欄S22に、文字
コードをビットで表した白と黒のドット群(言い換えれ
ば、画像データ)でも出力している。
【0075】この文字データから画像データへの変換方
式は、既知の方法で行うことができ、この際のドットの
大きさは、スキャナー部12での解像度より大きなドッ
トを使用する。また、スキャナー部12での読込み時
に、原稿の汚れなどでの誤認識が生じないようにパリテ
ィ情報を追加して冗長性を持たせ、さらに特定部分に情
報が密集しないようにデータを配置するなどの配慮を行
うこともできる。このシートS2上に出力したデータを
用いてメッセージの登録を行う場合、スキャナー部12
での読込みまでは図9に示すステップ(D01)で行う
が、読込んだ画像に対して文字認識(図9のステップD
03)は行わず、白と黒のドット群のフォーマットに変
換して出力されたデータ領域(S22欄)からデータを
復元し、メッセージデータとして音声データ用メモリ1
54に蓄積する(図9のステップD06)。
【0076】
【発明の効果】本発明の通信装置では、音声メッセージ
にかかる文字データを、送信先の通信装置に送信した場
合には、当該送信先の通信装置で均一なレベルで音声再
生ができる。音声メッセージにかかるアナログ音声信号
を送信先の通信装置に送信する場合には、当該音声信号
を均一なレベルで通信回線に出力できる。
【0077】また、再生される音声は、登録したユーザ
の音声ではなく、音声合成手段による合成音で出力され
るので、自分の声を登録することに抵抗があるユーザに
とって利便性が高い。
【0078】さらに、本発明では、音声メッセージの登
録に際して、音声認識された結果が操作部に表示される
ので、録音中にユーザが音声の変換状況を確認しなが
ら、例えば1音声フレーズ単位で登録を行うこともでき
る。ユーザは、所望の長さごとに音声メッセージを音声
入力することで、音声認識手段が誤認識した場合には、
その部分のみを修正しながら、音声メッセージ全体を録
音することができる。これにより、誤変換が発生した場
合であってもユーザの負担は小さく、録音操作が簡易と
なる。
【0079】加えて、本発明では、音色データを選択す
るだけで、容易に音声メッセージの再生音の音色を変更
することができる、メッセージごとに異なる音色を設定
することや、複数のユーザで使用する場合にそれぞれ異
なった音色データを設定することもできるので、ユーザ
の利便性が向上する。
【0080】また、本発明では、上記の音声メッセージ
に代えて、あるいは音声メッセージと共に、画像データ
をスキャナーなどで読取り、この画像データの中から文
字情報のみを認識し文字データとして使用することもで
きるため、(1)登録したいメッセージのデータを容易
に作成することができる、(2)通常のマイクで入力し
た音声信号を符号化してメモリに保存する方式に比し
て、メモリ使用量を大幅に少なくすることができるなど
の効果を奏することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態を、音声装置のメッセージ
の録音・再生機能付きのファクシミリ装置を用いて実現
したときのブロック構成図である。
【図2】音声認識手段により変換される文字データを操
作部に表示することなく、音声メッセージを録音する場
合の、図1のファクシミリ装置の動作を示すフローチャ
ートである。
【図3】音声メッセージを音声フレーズに分割して録音
する場合を説明するための、ファクシミリ装置の部分ブ
ロック構成図である。
【図4】音声認識手段により変換される文字データを操
作部に表示して、音声メッセージを録音するときの、図
1のファクシミリ装置の動作を示すフローチャートであ
る。
【図5】音色データの選択をするための操作表示部に設
けたスイッチを示す図である。
【図6】図1のファクシミリ装置により音声メッセージ
を送受信するときの動作を示すシステム構成図である。
【図7】図1のファクシミリ装置により音声メッセージ
を送受信するときの動作を示すフローチャートである。
【図8】本発明の他の実施形態を図1と同様のファクシ
ミリ装置を用いて実現したときのブロック構成図であ
る。
【図9】図8のファクシミリ装置の動作を示すフローチ
ャートである。
【図10】(A)は図8のファクシミリ装置のスキャナ
ー部での画像読取りに用いられるメッセージ登録用シー
トを示す図、(B)は図8のファクシミリ装置のプロッ
タ部での印刷に用いられるメッセージ登録用シートを示
す図である。
【符号の説明】
1,1A,1B ファクシミリ装置 11 制御部 12 スキャナー部 13 プロッタ部 14 符号化復号化部 15 記憶部 16 操作部 17 音声認識部 18,18A,18B 音声合成部 19,19A,19B 通信部 20 音声入力部 21,21A,21B 音声出力部 22 文字認識部 100 システムバス 151 ROM 152 RAM 153 画像用データメモリ 154 音声用データメモリ 161A,161B 表示部 211 D/A変換器 212 音声出力用アンプ 213 スピーカ 191 ネットワーク制御装置 192 モデム 201 マイク 202 A/D変換器 300 通信回線
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 21/06 G10L 3/00 Q H04M 11/00 302 R S 9/18 J 3/00 561C

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 音声メッセージを文字データとして、お
    よび/または画像データから文字情報を認識しこれを音
    声メッセージにかかる文字データとして記憶する記憶手
    段と、 前記記憶手段に記憶された文字データを読み出し、当該
    文字データを音声データに変換する音声合成手段と、 前記音声合成手段により変換された音声データを音声信
    号に変換して音声出力する音声出力手段と、 前記記憶手段に記憶された文字データにかかる文字列を
    表示する表示部と、ネットワークに接続された他の通信
    装置と情報の送受信を行う通信手段とを有する通信装置
    であって、 前記音声メッセージを、前記通信手段により、前記他の
    通信装置に送信するに際して、前記記憶手段に記憶され
    た文字データを前記他の通信装置に送信し、または、前
    記記憶手段に記憶された文字データを前記音声合成手段
    により音声データに変換し、さらにこれを音声信号に変
    換して前記他の通信装置に送信することを特徴とする通
    信装置。
  2. 【請求項2】 入力された音声メッセージから音声信号
    を生成する音声入力手段と、前記音声入力手段により生
    成された音声信号の認識処理を行い当該音声信号を文字
    データに変換する音声認識手段とを有し、 前記音声認識手段により変換された文字データが前記記
    憶手段に記憶されることを特徴とする請求項1に記載の
    通信装置。
  3. 【請求項3】 前記音声メッセージは、当該音声メッセ
    ージを構成する複数の音声フレーズそれぞれについて、
    前記音声入力手段による音声の入力、および前記音声認
    識手段による文字データへの変換が行われて、前記記憶
    手段に記憶されることを特徴とする請求項2に記載の通
    信装置。
  4. 【請求項4】 前記音声メッセージは、当該音声メッセ
    ージを構成する前記複数の音声フレーズの少なくとも1
    音声フレーズについて、前記音声入力手段による音声の
    再入力、前記音声認識手段による文字データへの再変
    換、前記記憶手段による前記文字データの再記憶、およ
    び、前記音声合成手段による前記文字データの再音声合
    成が行われて、前記記憶装置に記憶されることを特徴と
    する請求項3に記載の通信装置。
  5. 【請求項5】 前記画像データは、当該画像データの読
    取り時に登録用メッセージであることが識別できる識別
    パターンを付加したシートを使用して読み取られたもの
    であることを特徴とする請求項1〜4の何れかに記載の
    通信装置。
  6. 【請求項6】 前記記憶手段に記憶された文字データを
    画像データに変換し、印刷する印刷手段を有することを
    特徴とする請求項1〜5の何れかに記載の通信装置。
  7. 【請求項7】 前記画像データが、文字コードをビット
    で表したドット群であることを特徴とする請求項1〜6
    の何れかに記載の通信装置。
  8. 【請求項8】 前記音声合成手段は、複数の音色の選択
    手段を有し、前記記憶手段に記憶されている文字データ
    に、前記音色データの何れかを使用して音声合成を行う
    ことを特徴とする請求項1〜4の何れかに記載の通信装
    置。
  9. 【請求項9】 ファクシミリ機能を備えたことを特徴と
    する請求項1〜5の何れかに記載の通信装置。
JP2001349730A 2001-08-27 2001-11-15 通信装置 Pending JP2003150183A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001349730A JP2003150183A (ja) 2001-08-27 2001-11-15 通信装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001255991 2001-08-27
JP2001-255991 2001-08-27
JP2001349730A JP2003150183A (ja) 2001-08-27 2001-11-15 通信装置

Publications (1)

Publication Number Publication Date
JP2003150183A true JP2003150183A (ja) 2003-05-23

Family

ID=26621017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001349730A Pending JP2003150183A (ja) 2001-08-27 2001-11-15 通信装置

Country Status (1)

Country Link
JP (1) JP2003150183A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007104497A (ja) * 2005-10-06 2007-04-19 Kyocera Mita Corp ファクシミリ装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007104497A (ja) * 2005-10-06 2007-04-19 Kyocera Mita Corp ファクシミリ装置

Similar Documents

Publication Publication Date Title
JP2000196787A (ja) 通信システムおよびファクシミリ装置
RU98106499A (ru) Факсимильная система для интернета
JP2003150183A (ja) 通信装置
US20050111404A1 (en) Wireless communication apparatus, method and program therefor
JPH08223346A (ja) ファクシミリ装置
JP2003195885A (ja) 通信装置およびその制御方法
JPH10313379A (ja) 電子メール送信機能付きファクシミリ装置
JPH05292222A (ja) ボイスメール機能付ファクシミリ装置
JPH04302561A (ja) マルチメディア通信システム
JPS5869162A (ja) フアクシミリ伝送報知方式
JP2994774B2 (ja) 通信装置
JPH10276256A (ja) 画像通信装置
JPH08335998A (ja) 通信端末装置
JPH11191824A (ja) マルチメディア通信装置
KR100253157B1 (ko) 팩시밀리에서음성인식정보확인방법
JPH0514483A (ja) 文字記録式留守番電話機
JP2000115325A (ja) 通信装置、方法および記憶媒体
JP2000341432A (ja) 複合通信装置、受信表示方法、及び記憶媒体
JP2001127939A (ja) 音声データ伝送機能付きファクシミリ装置および画像伝送装置
JP2002290641A (ja) ファクシミリ装置
JP2003125074A (ja) 通信装置
JPH10257205A (ja) 音声機能付き通信端末装置
JPH05227347A (ja) ファクシミリ伝送方法および情報記録装置
JP2001169043A (ja) ファクシミリ装置
JP2004007192A (ja) 通信装置および通信制御の記憶装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040927

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070219

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080624