JP2000032108A - 通信装置 - Google Patents

通信装置

Info

Publication number
JP2000032108A
JP2000032108A JP10195708A JP19570898A JP2000032108A JP 2000032108 A JP2000032108 A JP 2000032108A JP 10195708 A JP10195708 A JP 10195708A JP 19570898 A JP19570898 A JP 19570898A JP 2000032108 A JP2000032108 A JP 2000032108A
Authority
JP
Japan
Prior art keywords
voice
input
data
unit
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10195708A
Other languages
English (en)
Inventor
Wataru Tomita
渡 富田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP10195708A priority Critical patent/JP2000032108A/ja
Publication of JP2000032108A publication Critical patent/JP2000032108A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Telephone Function (AREA)

Abstract

(57)【要約】 【課題】 より使いやすい音声制御の通信装置を提供す
る。 【解決手段】 音声入力を認識する音声認識手段10,
110と、登録データを記憶する登録データ記憶手段1
24と、音声認識手段10,110の認識結果と一致す
る登録データ記憶手段124の登録データを検索する検
索手段122と、音声の再入力を促す音声メッセージを
再生するためのデータを記憶するメッセージデータ記憶
手段128と、検索手段122の検索結果に基づき、少
なくとも認識結果に一致する登録データが検出されない
場合に音声メッセージを再生する再生手段127,14
と、を有することを特徴とする通信装置。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、通信装置に関し、
特に、音声入力により操作可能な通信装置に関するもの
である。
【0002】
【従来の技術】従来より、短縮ダイヤルの登録や、登録
された短縮ダイヤルを利用した発呼等の種々の操作を音
声入力により行うことができる音声制御の通信装置、例
えば電話機が開発されている。
【0003】このような通信装置においては、予め登録
されたデータと、音声入力の認識結果が、比較認識手段
によって比較され、一致するデータがある場合に、該当
するデータが呼び出されて、所定の動作が実行される。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
音声認識機能を備える通信装置では、認識結果に一致す
るデータが発見されないと、全く動作しない。このた
め、利用者が再入力又は操作のやり直しの必要性に気づ
くまでに時間がかかり、使いにくいという問題があっ
た。
【0005】本発明は、上記課題に鑑みてなされたもの
であり、その目的は、より使いやすい音声制御の通信装
置を提供することにある。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、請求項1記載の通信装置は、音声入力を認識する音
声認識手段と、登録データを記憶する登録データ記憶手
段と、音声認識手段の認識結果と一致する登録データ記
憶手段の登録データを検索する検索手段と、音声の再入
力を促す音声メッセージを再生するためのデータを記憶
するメッセージデータ記憶手段と、検索手段の検索結果
に基づき、少なくとも前記認識結果に一致する前記登録
データが検出されない場合に前記音声メッセージを再生
する再生手段とを有している。
【0007】請求項1記載の通信装置によれば、音声入
力の認識結果と一致する登録データが検出されない場合
に、再入力を促すメッセージが音声出力されるため、入
力者が再入力の必要性に気づきやすい。このため、無駄
に長時間待つことなく、直ちに再入力を行って、所期の
動作を迅速に実現することができる。従って、使いやす
い音声制御の通信装置を得ることができる。
【0008】なお、ここで登録データには、音データ、
単語データ、数字データ、電話番号の桁数データ、氏名
又は名称のデータ等、種々のデータが含まれる。そし
て、この登録データは、通信装置の出荷時に予め登録さ
れているデータの他、購入者等によって事後的に登録さ
れたデータを含んでいてもよい。
【0009】請求項2記載の通信装置は、請求項1記載
の通信装置において、前記再生手段が、前記音声認識手
段が前記音声入力を認識できない場合に前記音声メッセ
ージを再生するものである。
【0010】また、請求項3記載の通信装置は、音声入
力を認識する音声認識手段と、音声の再入力を促す音声
メッセージを再生するためのデータを記憶するメッセー
ジデータ記憶手段と、前記音声認識手段が前記音声入力
を認識できない場合に前記音声メッセージを再生する再
生手段と、を有するものである。
【0011】請求項2又は請求項3記載の通信装置によ
れば、音声認識そのものができなかった場合に、再入力
が音声で促されるため、入力者が再入力の必要性に気づ
きやすい。このため、無駄に長時間待つことなく、直ち
に再入力を行って、所期の動作を迅速に実現することが
できる。
【0012】特に、請求項2記載の通信装置において
は、音声認識に失敗した場合と、一致する登録データが
検出されない場合の両方の場合に、再入力を促すメッセ
ージが音声出力される。従って、入力者が再入力の必要
性に気づかないまま長時間待つ事態の発生が、より確実
に防止され、一層使いやすい通信装置を得ることが可能
となる。
【0013】請求項4記載の通信装置は、音声入力を認
識する音声認識手段と、登録データを記憶する登録デー
タ記憶手段と、音声認識手段の認識結果と一致する登録
データ記憶手段の登録データ及び近似する前記登録デー
タを検索する検索手段と、少なくとも音声の再入力を促
す音声メッセージを再生するためのデータを記憶するメ
ッセージデータ記憶手段と、前記検索手段の検索結果に
基づき、前記認識結果に一致する前記登録データ又は近
似する前記登録データのいずれも検出されない場合に前
記音声メッセージを再生する再生手段と、を有するもの
である。
【0014】請求項4記載の通信装置によれば、認識結
果に近似する登録データまで検索されることから、音声
入力による操作が一層容易となる。つまり、音声入力そ
のものに誤りがある場合や、音声認識手段が音声認識に
失敗した場合でも、近似する登録データが検索されるこ
とで、再入力することなく、所期の登録データに到達す
ることが可能となる。
【0015】また、認識結果に一致する登録データ又は
近似する登録データのいずれも検出されない場合に、再
入力が音声で促されることから、入力者が再入力の必要
性に気づきやすい。このため、再入力が必要な場合に
は、直ちに再入力作業を行って、ロスタイムを最低限に
留めることが可能となる。
【0016】従って、便利で使いやすい通信装置を得る
ことができる。
【0017】請求項5記載の通信装置は、請求項4記載
の通信装置において、前記メッセージデータ記憶手段
が、前記検索手段で検出された近似する前記登録データ
に基づいて後続の処理を続けるか否かの確認を促す確認
メッセージを音声で再生するためのデータを記憶し、前
記再生手段が、前記検索手段で近似する前記登録データ
が検出された場合に、前記確認メッセージを再生するも
のである。
【0018】請求項5記載の通信装置によれば、近似す
る登録データが検出されたときに、このデータに基づい
て後続の処理を行うかの確認が促されることから、誤処
理の防止が可能となる。つまり、検出された近似する登
録データが所期の登録データと異なる場合に、後続する
処理を中止することができる。また、確認メッセージが
音声で出力されることから、入力者が気付きやすい。
【0019】請求項6記載の通信装置は、請求項1から
請求項3までのいずれかに記載の通信装置において、前
記認識手段又は前記検索手段の処理結果を目視可能な形
態で出力する結果出力手段を含み、前記結果出力手段
は、前記認識結果に一致する前記登録データが検出され
ない場合又は前記音声入力が認識されない場合に所定の
記号を出力するものである。
【0020】また、請求項7記載の通信装置は、請求項
4又は請求項5記載の通信装置において、前記認識結果
に一致する前記登録データ又は近似する前記登録データ
のいずれも検出されない場合に所定の記号を出力する記
号出力手段を有するものである。
【0021】請求項6又は請求項7記載の通信装置によ
れば、再入力が必要な場合に所定の記号が出力されるこ
とから、入力者は、再入力が必要な箇所を一目で把握す
ることができる。そのため、再入力を確実に行うことが
可能となる。
【0022】
【発明の実施の形態】次に、本発明の好適な実施の形態
を、図面を参照して説明する。
【0023】図1は、本発明にかかる通信装置におけ
る、音声入力処理に関する機能ブロックの構成例を示す
図である。
【0024】図1において、本実施形態では、音声入力
部10、処理部100、情報記録媒体130、画像表示
部12,及び音声出力部14を用いて、音声入力が処理
される。
【0025】ここで、音声入力部10は、通信装置の利
用者が発する音声を通信装置に取り込むためのものであ
る。この音声入力部10にて得られた音声入力は、処理
部100に入力される。
【0026】処理部100は、上記音声入力及び所与の
プログラムに基づいて、表示画像や出力音声を生成した
り、データの記憶や読み出し等の各種処理を行うもので
ある。この処理部100の機能は、CPU、DSP、画
像生成IC、及び音声生成IC等のハードウェアにより
実現することができる。
【0027】情報記録媒体130は、プログラムやデー
タを記憶するものである。この情報記録媒体130の機
能は、CD−ROM、ICカード、MO、FD、DV
D、ハードディスク、及び各種メモリ等のハードウェア
により実現することができる。そして、処理部100
は、この情報記録媒体130に記録されたプログラムに
基づいて、種々の処理を行う。
【0028】より詳しくは、処理部100は、音声認識
部110と、制御部120とを含んでなる。そして、制
御部120は、さらに、検索部122と、登録データ記
憶部124と、結果出力部126と、再生部127と、
メッセージデータ記憶部128と、を含む。
【0029】音声認識部110は、音声入力部10から
処理部100に入力された音声入力を認識する処理を行
うものである。この音声認識部110における処理の結
果、音声入力を認識できた場合には、認識結果が検索部
122に入力される。一方、音声認識部110が、音声
入力を認識できなかった場合には、認識できなかった旨
の結果が再生部127及び結果出力部126に入力され
る。
【0030】具体的には、例えば、「ケイ」という音声
入力があった場合に、音声認識部110がその音声入力
に対して認識処理を行い、正確に「ケイ」と認識できた
場合には、その認識結果が検索部122に入力される。
仮に、正確に「ケイ」と認識できず、それに近い「エ
イ」、「レイ」といった認識結果であっても、文字や数
字として表現可能な認識結果であれば検索部122に入
力される。
【0031】また、音声入力時の発音が不明瞭であった
り、音声入力が小さすぎる等の種々の理由により、音声
認識部110が処理自体を実行できないような場合に
は、認識できなかった旨の結果が再生部127及び結果
出力部126に入力される。
【0032】制御部120は、音声認識部110におけ
る処理の結果と、所与のプログラムに従って、種々の処
理及び制御を行う。
【0033】検索部122は、音声認識部110からの
認識結果と、登録データ記憶部124に予め登録されて
いる登録データとを対比して、認識結果に一致する登録
データを検索するものである。この検索部122におい
て、認識結果に一致する登録データが検出された場合に
は、検出された登録データに基づいて、所与のプログラ
ムに従った処理が実行されると共に、またその登録デー
タは結果出力部126に入力される。一方、認識結果に
一致する登録データが検出されない場合には、一致デー
タがない旨の結果が、結果出力部126及び再生部12
7に入力される。
【0034】なお、登録データ記憶部124の登録デー
タには、音データ、数字データ、電話番号データ、氏名
又は名称のデータ、住所データ等、種々のデータが含ま
れる。また、登録データは、通信装置の製造時に予め登
録されるデータの他、事後的に追加された登録データを
含むことができる。
【0035】検索部122が認識結果をどの登録データ
と対比するかは、所与のプログラムに従う。例えば、上
述の「ケイ」という音声入力がなされたときに、電話番
号登録プログラムが実行されている場合には、「ケイ」
という認識結果と数字データとが対比される。よって、
この例の場合には、一致する登録データがないという検
索結果が得られる。
【0036】結果出力部126は、検索部122で検出
された登録データに基づき、対応する画像や音声を生成
するものである。例えば、検索部122で「ケイ」とい
う登録データが検出された場合には、結果出力部126
にて、「ケイ」という文字画像データ及び音声データが
生成される。生成された画像データは、画像表示部12
において表示され、音声データは、音声出力部14にて
出力される。
【0037】再生部127は、音声認識部110又は検
索部122からの入力があった場合に、再入力を促すメ
ッセージを再生する。1音声を処理する毎にメッセージ
を再生するか、音声群毎にメッセージを再生するかは、
情報記録媒体130に記録されたプログラムに従う。
【0038】再生部127で再生されるメッセージは、
メッセージデータ記憶部128に予め記憶されている。
そして、再生された音声は、音声出力部14において出
力される。
【0039】なお、本実施形態では、音声入力部10及
び音声認識部110が音声認識手段に相当する。また、
登録データ記憶部124、検索部122、メッセージデ
ータ記憶部128は、それぞれ、登録データ記憶手段、
検索手段、メッセージデータ記憶手段に相当する。そし
て、再生部127及び音声出力部14が再生手段に相当
し、結果出力部126及び画像表示部12が結果出力手
段に相当する。
【0040】次に、本実施形態の通信装置において、音
声入力により、短縮ダイヤル登録をする場合の手順を、
図2及び図3を用いて説明する。
【0041】なお、図2は本実施形態における短縮ダイ
ヤル登録の手順を示すフローチャートであり、図3は本
実施形態における画像表示の例を示す図である。また、
これらの図の説明においては、適宜図1を参照する。
【0042】図2において、まず、入力者により短縮ダ
イヤル登録処理の開始を示す所定の音声、例えば、「短
縮ダイヤル登録」の入力がなされる(S1)と、情報記
録媒体130に格納されたプログラムに基づいて、入力
された音声が処理部100にて処理され、短縮ダイヤル
登録モードに入る(S2)。このとき、画像表示部12
には、図3(a)のような画像が表示される。
【0043】次に、通信装置側からのガイダンス等に従
って、入力者が、音声によって、電話番号を登録したい
短縮ダイヤル番号を選択する(S3)。例えば、「5
番」と音声入力されると、短縮ダイヤル5番の入力モー
ドに入る(S4)。このときの画像表示は、図3(b)
のようになる。
【0044】続いて、登録したい電話番号の数字を、音
声により入力する(S5)。このとき、数字を1つずつ
区切りながら音声入力を行うことが好ましい。
【0045】音声入力された数字は、処理部100に
て、1数字ずつ処理される(S6)。
【0046】このステップS6において、入力数字が認
識できた場合とは、音声認識部110が音声入力を認識
し、検索部122が、登録データ記憶部124に登録さ
れた数字データ中から、認識結果に一致する数字データ
を検出した場合をいう。そして、音声認識部110が音
声入力を認識できなかった場合や、認識できても、検索
部122が、認識データに一致する数字データを検出で
きなかった場合は、いずれも入力数字が認識できなかっ
たと判断される。
【0047】例えば、「ゼロ・ゴ・ニ・ハチ・ニ」とい
う音声入力に対し、音声認識部110が音声認識処理を
行い、認識できたものに付いてはその認識結果が検索部
122に送られる。そして、登録データ記憶部124の
数字データ中に一致するものがあれば検出結果として結
果出力部126に送られる。従って、上記の音声入力が
正確に認識されていれば、「0」、「5」、「2」、
「8」、「2」が検索部122において検出され、結果
出力部126に送られる。
【0048】これに対し、上記の音声入力の内、仮に5
桁目の「ニ」が何らかの原因により認識できなかった場
合、あるいは間違った認識を行ったために検索部122
で検索できなかった場合は、5桁目が認識できなかった
旨が結果出力部126及び再生部127に送られる。
【0049】ステップS6で認識できた数字については
(S6:YES)、結果出力部126において数字画像
が生成され、図3(c)に示すように、画像表示部12
に数字画像が表示される(S7)。認識できなかった数
字の箇所については(S6:NO)、音声認識部110
からの入力と所与のプログラムに基づいて、結果出力部
126で所定の記号画像が生成され、図3(d)に示す
ように、その記号画像が画像表示部12に表示される
(S8)。本実施形態の場合には、認識できなかった数
字を記号「*」で表している。
【0050】上述の一連の処理は、数字入力作業の終了
を示す音声、例えば「終了」の入力があるまで、繰り返
される(S9)。その間、再入力を促すメッセージは再
生されない。そして、数字入力作業の終了を示す音声入
力があって(S9:YES)、初めて、次のステップS
10に進む。
【0051】ステップS10においては、認識できなか
った数字があったか否かを判断しており、認識できなか
った数字があった場合とは、ステップS6において認識
できないと判断されて再生部127に入力があった場合
をいい、再生部127に何も入力がなかった場合には、
全ての数字が認識されたと判断される。
【0052】認識できなかった数字があったと判断され
た場合には(S10:YES)、画像表示部12にて、
図3(e)に示すように、記号*のところにカーソルが
表示される(S11)。このとき、*が複数ある場合に
は、最初の*のところにカーソルが表示される。併せ
て、再生部127にて、再入力を促すメッセージが再生
され、音声出力部14にて出力される(S12)。本実
施形態では、「X桁目が認識できませんでした」という
メッセージを使用するが、入力者が再入力の必要性に気
づく内容である限り、どのようなメッセージであっても
よい。
【0053】ステップS12においては、上記メッセー
ジを出力すると共に、X桁目の数字の再入力を受け付け
る状態とし、ステップS5へ戻る。そして、入力者によ
って再度X桁目の数字が音声入力されると、ステップS
6以降の処理を繰り返す。認識できなかった数字、即ち
*記号が複数ある場合には、ステップS9において「終
了」と入力されるまで、ステップS5に戻り順番に再入
力を受け付ける。
【0054】認識できなかった数字がないと判断された
場合には(S10:NO)、図3(f)に示すように、
全ての入力数字が画像表示部12に表示される。また、
結果出力部126において、入力数字を表す音声が生成
され、音声出力部14から出力される(S13)。
【0055】入力数字の音声出力(S13)が正しい旨
の音声、例えば「OK」の入力がなされる(S14:Y
ES)と、所与のプログラムに基づき、数字がダイヤル
番号としてメモリに記憶され(S15)、短縮ダイヤル
登録モードが解除される。
【0056】また、入力数字を表す音声が生成され(S
13)、所定時間(例えば30秒)経過しても「OK」
の入力がなされない場合は(S14:NO)、ステップ
S5に戻り再度音声入力を受け付ける。
【0057】ここで、ステップS14でNOと判断され
た場合、そのまま本処理を終了するように構成してもよ
く、また、図示しない入力キー等を用いて再入力したい
部分を指定した後、音声入力を受け付けるように構成し
てもよい。
【0058】なお、ダイヤル番号に対応する氏名又は名
称等を登録するための手順を、ダイヤル番号入力手順
(S4〜S14)の前後に挿入してもよい。
【0059】このような手順によれば、音声入力によっ
て正確なダイヤル登録を実現することができる。つま
り、入力者が音声入力した電話番号等に対して、その音
声が全て認識できれば入力結果が音声出力され、認識で
きない音声があれば再入力を促すメッセージが音声出力
されるというように、いずれかの音声情報が入力者に与
えられるため、再入力又は入力結果の確認が促される。
そのため、音声入力内容の正確性が保たれる。さらに、
認識結果及び記号が画像表示部12に表示されることか
ら、認識結果等を視覚的にも確認することができ、登録
ミスの発生を、一層確実に防止することができる。従っ
て、登録ミスによる通信装置の動作不良を、より確実に
防止することが可能となる。
【0060】また、音声入力の認識結果と一致する登録
データが検出されない場合に、再入力を促すメッセージ
が音声出力されるため、入力者が再入力の必要性に気づ
きやすい。このため、通信装置が動作しないまま無駄に
長時間待つことなく、直ちに再入力を行って、短縮ダイ
ヤル登録を迅速に行うことができる。このことは、特に
目の不自由な人にとって有益である。
【0061】従って、使いやすい音声制御の通信装置を
得ることができる。
【0062】登録された短縮ダイヤルを利用して、音声
入力により所期の相手先にダイヤルする場合は、図4の
フローチャートに示す手順に従う。
【0063】なお、図4は、ダイヤル番号と併せて、氏
名又は名称が短縮ダイヤル登録されている場合の手順を
示すものである。
【0064】図4に示すように、短縮ダイヤル処理の開
始を示す音声、例えば「短縮ダイヤル」の入力がなされ
ると(S20)、短縮ダイヤル検索モードに切り替わり
(S21)、ダイヤル先を特定する情報を音声入力する
ことが可能な状態となる(S22)。
【0065】ここで、短縮ダイヤルは、例えば図5に模
式的に示すように、登録データ記憶部124内に設けら
れた短縮ダイヤルテーブル124aにおいて管理され
る。短縮ダイヤルテーブル124aは、管理番号領域1
24b、氏名又は名称領域124c、及び電話番号(フ
ァクシミリ番号)領域124dによって構成され、先の
短縮ダイヤル登録処理等によって、必要な情報が格納さ
れる。
【0066】ステップS22においては、氏名又は名称
領域124cに格納されている内容、あるいは管理番号
領域124bの番号を音声入力することにより、ダイヤ
ル先を特定できる。例えば、入力者が「とうきょうして
ん(東京支店)」を音声入力すると、周知の方法を用い
て入力音声に対する音声認識処理が行われ、その認識結
果が検索部122に送られる。そして、短縮ダイヤルテ
ーブル124aの氏名又は名称領域124cを参照し、
認識結果に一致する登録データが検索され(S23)、
一致する登録データとして「東京支店」が検索されれば
(S24:YES)、結果出力部126を介して画像表
示部12に「東京支店」及びその電話番号を表示する
(S25)。続いて、確認の音声、例えば「OK」が入
力されると(S26)、「東京支店」に対応する電話番
号が読み出され、ダイヤル送出処理が開始される(S2
7)。
【0067】一方、ステップS24において、一致する
ものがない場合は(S24:NO)、例えば、「一致す
るものがありません。もう一度入力して下さい。」とい
うメッセージを再生部127を介して音声出力部14か
ら出力させ(S28)、ステップS22に戻り再度音声
入力を受け付ける。
【0068】このため、入力者が再入力の必要性に気づ
きやすく、直ちに再入力を行って、所期の相手先へのダ
イヤルを迅速に行うことができる。また、再入力が促さ
れることにより、音声入力そのものが誤っていることに
気づく場合もある。
【0069】なお、ステップS28において出力される
メッセージは上記に限定されるものではなく、入力者が
再入力の必要性に気付く内容であれば、どのようなメッ
セージであってもよい。また、ステップS26において
所定時間が経過しても「OK」が入力されない場合は、
本処理を終了するように構成してもよい。
【0070】図6は、本実施形態を実現するためのハー
ドウェアの構成例を説明する図である。図6において、
通信装置は、CPU1000、ROM1002、RAM
1004、情報記録媒体1006、音声生成IC100
8、画像生成IC1010,I/Oポート1012,1
014,1016,1018が、システムバス1020
によって、相互にデータ送受信可能に接続される。そし
て、画像生成IC1010にはディスプレイ1022が
接続され、音声生成IC1008にはスピーカ1024
が接続され、各I/Oポート1012,1014,10
16,1018には、プリンタ1026,マイクロホン
1028、キー入力装置1030、モデム1032が接
続される。
【0071】情報記録媒体1006は、主として、制御
プログラムや、記号等を表現するための画像データ、音
データ、その他各種データが格納されるものであり、例
えば、CD−ROM、FD、MO,ハードディスク等が
用いられる。図2及び図4に示される手順を実行するた
めの制御プログラム及びその実行に必要なデータは、基
本的にこの情報記録媒体1006に格納される。電話装
置やファクシミリ装置等の通信専用の装置において、R
OM等のメモリに制御プログラム等が格納される場合に
は、ROM1002が情報記録媒体1006を兼ねるこ
ととなる。
【0072】マイクロホン1028は、入力者が音声入
力を行うためのものである。例えば、パーソナルコンピ
ュータでは、外付けマイクロホンがマイクロホン102
8となり、電話装置やファクシミリ装置においては、ハ
ンドセットや本体部に内蔵されたマイクロホンがマイク
ロホン1028となる。
【0073】キー入力装置1030は、数字や文字等を
キーによって入力するためのものである。例えば、パー
ソナルコンピュータのキーボードや、電話装置又はファ
クシミリ装置のテンキー、機能キー等が、キー入力装置
1030となる。
【0074】モデム1032は、図示しない通信回線に
接続され、通信回線を通じて送受信される画像データや
音声データの変調・復調を行うものである。
【0075】CPU1000は、情報記録媒体1006
やROM1002に格納される制御プログラム、マイク
ロホン1028からの入力信号、キー入力装置1030
からの入力信号、モデム1032からの入力信号等に従
って、通信装置全体の制御や、各種のデータ処理を行
う。
【0076】RAM1004は、CPU1000の作業
領域等として用いられる記憶手段であり、CPU100
0の処理結果や、情報記録媒体1006又はROM10
02の所与の内容等が一時的に格納される。
【0077】音声生成IC1008は、モデム1032
又はマイクロホン1028を通じて入ってくる音声信号
や、ROM1002・情報記録媒体1006に格納され
たデータに基づいて、CPU1000の制御の下に、鳴
動音やメッセージ音声等を生成する集積回路である。こ
こで生成された音データは、スピーカ1024にて音声
として出力される。
【0078】画像生成IC1010は、RAM100
4、ROM1002、情報記録媒体1006、モデム1
032等から送られる画像情報に基づいて、ディスプレ
イ1022に出力する画素情報を生成する集積回路であ
る。
【0079】ディスプレイ1022は、画像生成IC1
010から送られた情報に基づいて、画像を表示するも
のであり、LCDや、ブラウン管を用いたディスプレイ
等がある。
【0080】この例においては、マイクロホン102
8、ディスプレイ1022,スピーカ1024が、それ
ぞれ、図1の音声入力部10、画像表示部12、音声出
力部14に相当する。また、音生成IC1008が、結
果出力部126及び再生部127に相当し、画像生成I
C1010が結果出力部126に相当する。さらに、情
報記録媒体1006及びROM1002が、情報記録媒
体130、登録データ記憶部124,及びメッセージデ
ータ記憶部128に相当する。そして、CPU1000
が、音声認識部110及び検索部122に相当する。
【0081】従って、この例においてマイクロホン10
28から入力された音声は、I/Oポート1014及び
システムバス1020を介してCPU1000に送ら
れ、このCPU1000によって、音声認識処理され
る。CPU1000における音声認識処理の具体的手法
及び手順等は、情報記録媒体1006に格納された音声
認識プログラムに従う。また、CPU1000による音
声認識処理の結果は、RAM1004に一時的に格納さ
れる。そして、音声認識処理が完了すると、CPU10
00は、RAM1004に格納された認識結果を用い
て、他の制御プログラムに従い、例えば図2のダイヤル
登録処理や図4のダイヤル処理のように、さらなる処理
を実行する。
【0082】なお、音声認識処理専用の回路を設けて、
CPU1000の負担を軽減し得る構成とすることも可
能である。
【0083】次に、図7及び図8を参照して、本発明の
通信装置をファクシミリ装置に適用した例を説明する。
【0084】まず、図7は、ファクシミリ装置の外観を
示す斜視図である。
【0085】図7において、ファクシミリ装置1100
は、本体1110と、この本体に接続されたハンドセッ
ト1120からなる。本体1110の前面には原稿排出
口1111が設けられ、上面には、キー入力装置111
2と、LCD1114と、原稿受け部1113と,記録
紙排出口1115と,給紙ケース1119と、が設けら
れ、側面には、スピーカ1116が形成されている。
【0086】そして、このファクシミリ装置1100
は、図8のブロック図に示されるような電気的構造を有
する。つまり、CPU1200、ROM1202、EE
PROM1204、RAM1206、画像メモリ120
8、音声メモリ1210、センサ1212、ネットワー
ク・コントロール・ユニット(以下「NCU」という)
1216、モデム1218、バッファ1220、スキャ
ナ1222、符号化部1224、復号化部1226、プ
リンタ1228、キー入力部1112、LCD1114
及びアンプ1230が設けられ、システムバス1234
を介して互いに接続されている。また、NCU1216
に受話器1217及び電話回線1236が接続され、ア
ンプ1230にスピーカ1116が接続されている。
【0087】より詳しくは、CPU1200は、システ
ムバス1234を介して接続された各部を制御する。こ
のCPU1200にて実行される制御プログラム及びこ
の制御プログラムの実行に必要な各種のデータは、RO
M1202、EEPROM1204に格納される。
【0088】ここで、ROM1202に格納される制御
プログラムとしては、例えば、音声認識プログラム、図
2に示す短縮ダイヤル登録を実行するためのプログラ
ム、図4に示す短縮ダイヤル処理を実行するためのプロ
グラム等がある。また、ROM1202には、音声認識
プログラムにおいて参照される音データ、数データ等の
各種データが格納される。
【0089】EEPROM1204には、図5に示され
るようなデータテーブルが格納される他、各種音声メッ
セージを出力するためのデータが格納される。
【0090】RAM1206には、入力者からの入力音
声が格納される他、CPU1200による動作実行時の
各種データが一時的に格納される。
【0091】画像メモリ1208は、通信履歴、画像デ
ータ及び印刷のためのビットイメージを記憶し、音声メ
モリ1210は、相手側装置へ送出される応答メッセー
ジや、相手側装置から送られてきた入来メッセージを記
憶する。センサ1212は、記録紙カバーの開閉状態を
検出する。NCU1216は、電話回線1236、12
38及び交換機1232を介して接続される図示しない
相手側装置との間の信号の送受信を行う。モデム121
8は、このNCU1216にて送受信される画像データ
や音声データ等の通信データの変調・復調を行う。そし
て、バッファ1220は、相手側装置との間で送受信さ
れる符号化された画像情報を含むデータを一時的に記憶
する。スキャナ1222は、原稿受け部1113に挿入
された原稿の読み取り面に記された文字・図形を、画像
データとして読みとり、符号化部23は、スキャナ12
22が読みとった画像データを符号化する。一方、復号
化部1226は、バッファ1220又は画像メモリ12
08に記憶された画像データを読み出して、これを復号
化する。プリンタ1228は、この複合化されたデータ
を記録紙に印刷する。キー入力装置1112は、テンキ
ーや機能キーを介して、各種の設定操作や電話番号入力
操作を行うことを可能とする。アンプ1230は、スピ
ーカ1116にて鳴動音や通話音声として出力されるべ
き音声信号を増幅する。
【0092】このようなファクシミリ装置1100の利
用者は、受話器1120からの音声入力によって、先に
説明した図2及び図4のような短縮ダイヤル登録や、短
縮ダイヤル操作等、種々の操作を行うことができる。
【0093】なお、音声入力によって実現可能な動作
は、キー入力装置1112からの入力によっても実現で
きるように設定されている。
【0094】図9は、本実施形態の変形例を示すフロー
チャートである。同図は、特に、図4のフローチャート
に示された手順の変形例を示す。
【0095】図9に示すように、短縮ダイヤル処理の開
始を示す音声入力がなされると(S30)、短縮ダイヤ
ル検索モードに切り替わり(S31)、ダイヤル先を特
定する情報を音声入力することが可能な状態となる(S
32)。図4の場合と同様の処理により音声入力に対応
する登録データが検出されれば(S33,S34:YE
S)、画像として表示され(S35)、確認の音声入力
を待って(S36)、検出された登録データに基づくダ
イヤルが開始される(S37)。一方、音声入力(S3
2)の認識結果に一致する登録データが検出されない場
合(S34:NO)には、認識結果に近似する登録デー
タが検索される(S38)。そして、近似する登録デー
タが検出された場合(S38:YES)には、検出結果
が画像表示されると共に、例えば「東京支店」の音声入
力に対して「東部支店ですか」というように、近似する
登録データに基づいて後続する処理を行うかの確認を促
す音声メッセージが出力される(S39)。確認を促す
音声メッセージに対して、処理を続行する旨の音声、例
えば「OK」の入力がなされると(S40:YES)、
検出された登録データに基づくダイヤルが開始される
(S37)。「OK」の入力がない場合(S40:N
O)は、再入力を促すメッセージが音声出力され(S4
1)、音声入力を受付可能な状態となる。ステップ38
にて近似する登録データも検出されない場合(S38:
NO)にも、ステップS41の処理が行われる。
【0096】このような手順で音声入力が処理されるこ
とにより、誤った音声入力や、音声認識の誤りによる間
違い電話又は誤送信を防止することができる。特に、一
致する登録データがない場合には、近似する登録データ
が検索されることから、音声入力ミスや音声認識ミスが
あっても、入力し直すことなく、簡単に所期の相手先に
ダイヤルすることが可能となる。
【0097】このような手順で処理できる通信装置の機
能ブロック図の例は、図1と同様である。つまり、検索
部122において、認識結果に一致する登録データの検
索と、近似する登録データの検索が行われる。一致する
登録データの検索と、近似する登録データの検索は、順
次に行っても、同時に行っても、どちらでもよい。
【0098】また、近似する登録データに基づいて処理
を続行するかの確認を促す音声メッセージの具体的内容
及び出力するための構成は、特に問わない。例えば、
「XXXですか」という音声メッセージデータを図1に
示すメッセージデータ記憶部128に格納するととも
に、検索部122で検出された近似する登録データが再
生部127に送られるように設定し、再生部127に
て、メッセージデータと登録データを合成することによ
り、出力することができる。あるいは、結果出力部12
6で生成された「東部支店」という音声データと、再生
部127で再生された音声メッセージデータを、音声出
力部14で合成して出力することもできる。
【0099】さらに、図9に示すような処理を実行でき
る通信装置のハードウェアの構成例は、図6と同様であ
る。そして、図7及び図8に示されたファクシミリ装置
においても実現することが可能である。
【0100】なお、本発明の実施形態は、上述の例に限
定されるものではなく、種々の変形が可能である。
【0101】例えば、図1のメッセージデータ記憶部1
28に予め複数パターンの音声メッセージを用意してお
き、図2のステップS10において入力音声が認識でき
なかった場合、どのような要因によって認識できなかっ
たかに基づいて、ステップS12で音声出力されるメッ
セージを適宜変更するように構成することも可能であ
る。具体的には、音声が小さくて認識できなかった場合
には、「大きな声で入力して下さい」という音声メッセ
ージを出力し、周囲の雑音により必要な音声を取り込め
なかった場合には、「周囲の音を下げてから入力して下
さい」という音声メッセージを出力させること等が考え
られる。これによれば、入力者に具体的な指示が与えら
れるため、通信装置に音声を正しく認識させ得る状況
を、入力者が迅速に創り出すことが可能となる。
【0102】あるいは、メッセージを音声出力する代わ
りに、各種の状態を区別可能な音を出力するように構成
してもよい。
【0103】また、日本や外国のダイヤル番号の桁数を
予め登録しておき、ダイヤル番号登録の際、音声入力さ
れた数字の桁数と、登録されている桁数データを比較し
て、一致する桁数データがない場合に、再入力を促すメ
ッセージを音声出力させることもできる。これにより、
ダイヤル番号の登録ミスの防止が図られる。
【0104】そして、ファクシミリ装置以外に、携帯電
話やコードレス子機等を含む電話装置や、通信機能を備
えるコンピュータ等にも、本発明を適用することができ
る。
【0105】さらに、本発明を適用可能な通信装置は、
有線式であると、無線式であるとを問わない。
【図面の簡単な説明】
【図1】本実施形態の通信装置における、音声入力処理
に関する機能ブロックの構成例を示す図である。
【図2】本実施形態における短縮ダイヤル登録の手順を
示すフローチャートである。
【図3】本実施形態における画像表示の例を示す図であ
る。
【図4】本実施形態における短縮ダイヤル実行手順を示
すフローチャートである。
【図5】短縮ダイヤルテーブルを示す図である。
【図6】本実施形態を実現するためのハードウェアの構
成例を説明する図である。
【図7】本発明にかかる通信装置をファクシミリ装置に
適用した場合の例を示す斜視図である。
【図8】図7に示すファクシミリ装置の電気的構成を示
すブロック図である。
【図9】本実施形態の変形例を示すフローチャートであ
る。
【符号の説明】
10,110 音声認識手段 122 検索手段 124 登録データ記憶手段 12,126 結果出力手段 14,127 再生手段 128 メッセージデータ記憶手段

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 音声入力を認識する音声認識手段と、 登録データを記憶する登録データ記憶手段と、 前記音声認識手段の認識結果と一致する前記登録データ
    記憶手段の登録データを検索する検索手段と、 音声の再入力を促す音声メッセージを再生するためのデ
    ータを記憶するメッセージデータ記憶手段と、 前記検索手段の検索結果に基づき、少なくとも前記認識
    結果に一致する前記登録データが検出されない場合に前
    記音声メッセージを再生する再生手段と、 を有することを特徴とする通信装置。
  2. 【請求項2】 請求項1記載の通信装置において、 前記再生手段は、前記音声認識手段が前記音声入力を認
    識できない場合に前記音声メッセージを再生することを
    特徴とする通信装置。
  3. 【請求項3】 音声入力を認識する音声認識手段と、 音声の再入力を促す音声メッセージを再生するためのデ
    ータを記憶するメッセージデータ記憶手段と、 前記音声認識手段が前記音声入力を認識できない場合に
    前記音声メッセージを再生する再生手段と、 を有することを特徴とする通信装置。
  4. 【請求項4】 音声入力を認識する音声認識手段と、 登録データを記憶する登録データ記憶手段と、 前記音声認識手段の認識結果と一致する前記登録データ
    記憶手段の登録データ及び近似する前記登録データを検
    索する検索手段と、 少なくとも音声の再入力を促す音声メッセージを再生す
    るためのデータを記憶するメッセージデータ記憶手段
    と、 前記検索手段の検索結果に基づき、前記認識結果に一致
    する前記登録データ又は近似する前記登録データのいず
    れも検出されない場合に前記音声メッセージを再生する
    再生手段と、 を有することを特徴とする通信装置。
  5. 【請求項5】 請求項4記載の通信装置において、 前記メッセージデータ記憶手段は、さらに前記検索手段
    により近似する登録データが検出された場合に、その登
    録データに基づいて後続の処理を続けるか否かの確認を
    促す確認メッセージを音声で再生するためのデータを記
    憶しており、 前記再生手段は、前記検索手段で近似する前記登録デー
    タが検出された場合に、前記確認メッセージを再生する
    ことを特徴とする通信装置。
  6. 【請求項6】 請求項1から請求項3までのいずれかに
    記載の通信装置において、 前記認識手段又は前記検索手段の処理結果を目視可能な
    形態で出力する結果出力手段を有し、 前記結果出力手段は、前記認識結果に一致する前記登録
    データが検出されない場合又は前記音声入力が認識され
    ない場合に所定の記号を出力することを特徴とする通信
    装置。
  7. 【請求項7】 請求項4又は請求項5記載の通信装置に
    おいて、 前記検索手段の検索結果を目視可能な形態で出力する結
    果出力手段を含み、 前記結果出力手段は、前記認識結果に一致する前記登録
    データ又は近似する前記登録データのいずれも検出され
    ない場合に所定の記号を出力することを特徴とする通信
    装置。
JP10195708A 1998-07-10 1998-07-10 通信装置 Pending JP2000032108A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10195708A JP2000032108A (ja) 1998-07-10 1998-07-10 通信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10195708A JP2000032108A (ja) 1998-07-10 1998-07-10 通信装置

Publications (1)

Publication Number Publication Date
JP2000032108A true JP2000032108A (ja) 2000-01-28

Family

ID=16345663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10195708A Pending JP2000032108A (ja) 1998-07-10 1998-07-10 通信装置

Country Status (1)

Country Link
JP (1) JP2000032108A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002258873A (ja) * 2001-03-01 2002-09-11 Sony Corp 音楽認識装置及び音楽サービスシステム
US7477728B2 (en) 2002-05-25 2009-01-13 Samsung Electronics Co., Ltd. Fast voice dialing apparatus and method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002258873A (ja) * 2001-03-01 2002-09-11 Sony Corp 音楽認識装置及び音楽サービスシステム
JP4506004B2 (ja) * 2001-03-01 2010-07-21 ソニー株式会社 音楽認識装置
US7477728B2 (en) 2002-05-25 2009-01-13 Samsung Electronics Co., Ltd. Fast voice dialing apparatus and method

Similar Documents

Publication Publication Date Title
US8611508B2 (en) Method an apparatus for converting a voice signal received from a remote telephone to a text signal
JPH0388462A (ja) 音声ダイヤル装置
JP2001308970A (ja) 携帯電話の音声認識操作方法及びシステム
JP2000032108A (ja) 通信装置
JP2001282788A (ja) 電子辞書装置及び電子辞書装置の使用言語切替方法、記憶媒体
US20020090972A1 (en) Portable telephone terminal
JP2001177622A (ja) 携帯電話機
CN100488214C (zh) 具有话音输入操作功能的电话装置
JP2008252742A (ja) 電話装置、電話装置の動作方法、及び電話装置の動作プログラム
JPH11261683A (ja) 電話装置、プログラムを記録した記録媒体及びデータを記録した記録媒体
JP2002290536A (ja) 携帯端末での電話番号登録方法
JP2003195885A (ja) 通信装置およびその制御方法
KR100393490B1 (ko) 이동통신 단말기의 음성인식을 통한 전화번호 검색방법
JP3278595B2 (ja) 携帯電話
JPH0983633A (ja) 受信装置
JP2002027087A (ja) 通話録音番号変換機能付き電話機
JP2000174878A (ja) 通信装置
KR100309377B1 (ko) 무선 단말기에서 음성 다이얼링 방법
JPH0335646A (ja) ファクシミリ装置
KR950009425B1 (ko) 음성인식 전화기의 다이얼링 제어 방법
JP2000261539A (ja) 移動電話機
JPH07107191A (ja) 多機能電話機
JP2001156912A (ja) 電話機
JP2000138742A (ja) 電話機能を有する端末装置
JP2000209309A (ja) 通信装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050614

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20051214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070228

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070427

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080305