JP2003008745A - 音声補完方法及び音声補完装置ならびに電話端末装置 - Google Patents
音声補完方法及び音声補完装置ならびに電話端末装置Info
- Publication number
- JP2003008745A JP2003008745A JP2001190422A JP2001190422A JP2003008745A JP 2003008745 A JP2003008745 A JP 2003008745A JP 2001190422 A JP2001190422 A JP 2001190422A JP 2001190422 A JP2001190422 A JP 2001190422A JP 2003008745 A JP2003008745 A JP 2003008745A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- information
- telephone terminal
- complement
- voice information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
すことなく、ユーザ自身の声で音声補完をできるように
した音声補完方法を提供することである。 【解決手段】上記課題は、電話端末が他の電話端末と所
定通信網を介して音声通信を行う際に音声情報の補完を
行う音声補完方法において、上記電話端末から音声情報
を所定通信網に接続された音声補完情報格納手段に予め
登録し、上記電話端末と他方の電話端末とが音声通信を
行っている際に、ユーザの音声が入力されたとき、上記
電話端末から送信された音声情報を含む音声情報を該音
声補完情報格納手段に登録されている音声情報から抽出
し、その抽出された音声情報を上記他方の電話端末に送
信する音声補完方法にて解決される。
Description
音声補完装置に係り、詳しくは、音声通話の際に電話端
末ユーザの音声を補完することで電話端末の省電力化が
可能となる音声補完方法及び音声補完装置並びに電話端
末に関する。
自動車電話、携帯電話(例:PDC(Personal Digital
Cellular)方式の移動通信システム)、簡易携帯電話
(例:PHS(Personal Handy phone System)などがあ
る。これらの移動通信システムを使用する際には、移動
端末(例:携帯電話)から相手先の電話番号を入力し、
相手に接続された後に音声あるいはデータを相手先に送
信する。
ザからの入力操作が必要となるケースは、例えば、電
話番号の入力や電話帳の登録などを行う場合、電子メ
ールなどの文字データを作成する場合、受信した文字
データを読む場合、相手との通話を行う場合などがあ
る。従来、これらの入力(〜)を補助する方法とし
て以下のような技術が提案されている。
るような端末操作を補助(上記に対応)する技術とし
て特開平8−23369が提案されている。また、回線
番号をボタンで押すのではなく、「言葉のコード」を用
いてコードを発生することにより接続を可能とする技術
が特開2000−78267で開示されている。更に、
相手先が発した音声から電話番号を抽出し、電話帳に登
録することのできる技術が特願平10−369778で
開示されている。
キストデータを、合成音声にて形態情報端末の使用者に
知らせるような文字データの作成補助(上記に対
応)、受信データの読み出し補助(上記に対応)に関
する技術として特開平9−32184が開示されてい
る。
応)として電話端末に送信すべき内容をデータ入力する
と、合成音声信号に変換し電話回線に送出される技術が
特開平9−32184で開示されている。また、使用者
が特定の音声(言葉)を発生した場合に自動的に電話回
線に接続し、予め記憶してある音声を出力して通報する
技術が特開平6−131583に開示されている。
の方法では、ユーザが文字入力したデータを音声に変え
る方法のみであった。この場合、ユーザが伝えたいこと
を伝えるためにはキー操作を行って文字入力する必要が
あるため、そのキー操作のための時間がかかると共に煩
わしい操作をユーザに強いてしまうという問題があっ
た。また、合成した音声(コンピュータ等に音声を喋ら
せる音声合成)を利用する場合、韻律(アクセントやイ
ントネーション)の制御や明瞭性などに問題が残されて
おり、極めて人間のものに近い音声を生成するのが現状
では難しい。従って、従来の方法では、ユーザ本人の声
と異なるため違和感を生じる。
煩雑な入力操作を課すことなく、ユーザ自身の声で音声
補完をできるようにした音声補完方法及び音声補完装置
並びに電話端末装置を提供することである。
るため、本発明は、請求項1に記載されるように、電話
端末が他の電話端末と所定通信網を介して音声通信を行
う際に音声情報の補完を行う音声補完方法において、上
記電話端末から音声情報を所定通信網に接続された音声
補完情報格納手段に予め登録し、上記電話端末と他方の
電話端末とが音声通信を行っている際に、ユーザの音声
が入力されたとき、上記電話端末から送信された音声情
報を含む音声情報を該音声補完情報格納手段に登録され
ている音声情報から抽出し、その抽出された音声情報を
上記他方の電話端末に送信するように構成される。
ユーザ(以下、ユーザAという)が他の電話端末のユー
ザ(以下、ユーザBという)と通話しているときに、そ
の通話中の音声情報を含む音声情報が所定網に接続され
た音声補完情報格納手段に登録されている音声情報から
抽出され、その抽出された音声情報がユーザBの電話端
末に対して送信される。
う音声情報が送信されると、音声補完情報格納手段は、
予め登録されている音声情報から「おは」を含む「おは
ようございます」という音声情報を抽出する。このよう
にして抽出された「おはようございます」の音声はユー
ザ自身の音声でユーザBの電話端末に送信されるので、
ユーザBは違和感なく聞くことができる。即ち、本発明
によれば、ユーザAから発せられた「おは」の音声情報
から差分となる「ようございます」の音声情報の補完が
行われるようになっている。その結果、ユーザ間の会話
がスムーズに運ぶように支援することが可能である。
は、所定網に接続された通信事業者のネットワーク装
置、あるいは新たなノードとして設けてもよく設置場所
を限定しない。
る音声情報を電話端末にも登録することができるという
観点から、本発明は、請求項2に記載されるように、上
記音声補完方法において、上記音声補完情報格納手段
は、上記電話端末から送信された音声情報を含む音声情
報を抽出した際に、その抽出した音声情報を上記電話端
末に送信し、上記電話端末は、上記音声情報を受信して
登録するように構成される。
頻度の高い音声情報を抽出して自動登録できるという観
点から、本発明は、請求項3に記載されるように、上記
音声補完方法において、上記音声補完情報格納手段は、
上記電話端末と他方の電話端末とが音声通信を行ってい
る際に、ユーザから送信される音声情報のうち出現頻度
の高い音声情報を抽出して自動登録するように構成され
る。
情報を電話端末にも登録できるという観点から、本発明
は、請求項4に記載されるように、上記音声補完方法に
おいて、上記電話端末は、上記音声補完情報格納手段に
て抽出された出現頻度の高い音声情報を該音声補完情報
格納手段より受信して登録するように構成される。
に登録する音声を自由に選択し登録することができると
いう観点から、本発明は、請求項5に記載されるよう
に、上記音声補完方法において、上記音声補完情報格納
手段は、音声情報または出現頻度の高い音声情報のいず
れかを抽出した際に、該抽出で得られた音声情報または
該音声情報を伝達するための情報を上記電話端末に通知
し、上記電話端末は、その通知に基づいて上記音声補完
情報格納手段に登録させるべき音声情報がユーザにて選
択された後、その選択結果を上記音声補完情報格納手段
に報告し、上記音声補完情報格納手段は、上記無線端末
からの報告に基づいて音声情報を登録するように構成さ
れる。
うに、上記音声補完方法において、上記電話端末は、上
記音声補完情報格納手段に登録させるべき音声情報がユ
ーザにて選択された後、その選択結果に基づいて得られ
る音声情報を登録するように構成される。
情報と同一の音声情報を再生させることが可能になると
いう観点から、本発明は、請求項7に記載されるよう
に、上記音声補完方法において、上記電話端末と他方の
電話端末とが音声通信を行っている際に、ユーザの音声
が入力されたとき、音声補完情報格納手段は、上記電話
端末から送信された音声情報を含む音声情報を該音声補
完情報格納手段に登録されている音声情報から抽出し
て、その抽出した音声情報と同一の音声情報を再生させ
るための指示となる信号を上記電話端末に送信し、上記
電話端末は、上記指示に従って予め登録されている音声
情報の再生を行うように構成される。
報格納手段は、ユーザAが発した音声情報から抽出した
音声情報を該ユーザAに対し送信するのでなく、該抽出
した音声情報をユーザAの電話端末に予め登録されてい
る音声情報から読み出して再生させるための指示を送
る。即ち、音声補完情報格納手段は、ユーザAの電話端
末に対し上記指示となる信号のみを該電話端末に送信す
るだけなので、音声情報送信に関する無線リソースの節
約が可能となる。
できるという観点から、本発明は、請求項8に記載され
るように、上記音声補完方法において、上記音声補完情
報格納手段は、該音声補完情報格納手段で抽出された音
声情報と同一の音声情報を再生させるための指示を上記
電話端末に対して送信するときに、上記電話端末が上記
音声補完情報格納手段からの指示に基づいて音声情報を
再生している間、音声情報の送信を停止させる指示を上
記電話端末に送信し、上記電話端末は、上記指示に従っ
て予め登録されている音声情報の再生を行っている間、
ユーザからの音声入力に係らず音声送信を停止するよう
に構成される。
登録された音声を再生している間、ユーザからの音声入
力に係らず音声送信の出力が停止されるので、該電話端
末の消費電力を低減することが可能になる。
うに、電話端末が他の電話端末と所定通信網を介して音
声通信を行う際に音声情報の補完を行う音声補完方法に
おいて、上記電話端末から音声情報を所定通信網に接続
された音声補完情報格納手段に予め登録し、上記電話端
末と他方の電話端末とが音声通信を行っている際に、ユ
ーザの音声が入力されたとき、上記電話端末から送信さ
れた音声情報を含む音声情報を該音声補完情報格納手段
に登録されている音声情報から抽出し、その抽出された
音声情報を上記電話端末及び他方の電話端末に送信する
ように構成される。
携帯電話)を用いることができるという観点から、本発
明は、請求項10に記載されるように、上記音声補完方
法において、上記電話端末として所定の通信網に接続さ
れる移動端末装置を用いるように構成される。
は、請求項11に記載されるように、電話端末が他の電
話端末と所定通信網を介して音声通信を行う際に音声情
報の補完を行う音声補完装置において、所定通信網に接
続され、上記電話端末からの音声情報を予め登録する音
声補完情報格納手段と、上記電話端末と他方の電話端末
とが音声通信を行っている際に、ユーザの音声が入力さ
れたとき、上記電話端末から送信された音声情報を含む
音声情報を該音声補完情報格納手段に登録されている音
声情報から抽出する音声情報抽出手段と、その抽出され
た音声情報を上記他方の電話端末に送信する音声情報送
信手段とを有するように構成される。
発明は、請求項18に記載されるように、所定通信網を
介して通信を行う電話端末装置において、上記電話端末
は、上記音声補完情報格納手段の第1の音声情報送信手
段にて送信された音声情報を受信して登録するように構
成される。
に基づいて説明する。
が適用される移動通信システムは、例えば、図1に示す
ように構成される。
例えば、PHS方式のシステムであり、移動端末10
(携帯電話機)が無線基地局20と無線通信を行い、ネ
ットワーク装置30(例えば、交換局装置)を介して他
の端末(例:固定電話60、移動端末B70)との音声
通信や非通話通信が行えるようになっている。尚、本例
では、発信側の移動端末10を移動端末A、着信側の移
動端末70を移動端末Bと仮定する。
完装置40は、移動端末A10と固定電話60と間で通
話がなされている場合に、その通話の音声情報を認識
し、移動端末A10ユーザと固定電話ユーザ間の会話の
中で頻繁に用いられているフレーズ(複数に分割された
音声情報の一つ)を抽出して登録(=蓄積)する。この
とき、音声補完装置40に登録された上記フレーズは移
動端末A10にも登録(=登録)される。本発明では、
移動端末A10ユーザが発したフレーズの最初の音節が
音声補完装置40に登録されたフレーズと一致した場合
に、音声補完装置40は、そのフレーズを補完して固定
電話60に流すと共に、移動端末A10に対し自移動端
末A10に蓄積されている上記フレーズを流させるため
の指示及び該フレーズを流している間の送信をOFFと
する指示を無線基地局20経由で送出する。
ーザが頻繁に使うフレーズが該ユーザ自身の声で音声補
完装置40と自移動端末A10の双方に登録される。そ
の後、移動端末A10ユーザが音声補完装置40に登録
されているフレーズの最初の音節を発したとき、音声補
完装置40は、そのフレーズの音節と一致するフレーズ
を補完して相手側の固定電話60あるいは移動端末B7
0に流すようにしている。例えば、本発明を会話の中で
定型文句を繰り返すことの多いユーザに適用した場合、
該ユーザは定型文句登録のための入力操作を行わなくて
も容易に該定型文句を相手方に伝えることができるよう
になる。このとき、ユーザが相手方に伝える際の音声は
ユーザ自身の声で録音された声で提供されるので、聞き
手にとって違和感のない音声を聞くことができる。
成について説明する。
ように構成され、音声認識部41、ユーザ特定・音声分
析処理部42、バッファメモリ部43、音声データベー
ス44、比較・検出部45、音声再生部46、中央制御
部47、音声入力部48、ユーザーインターフェース部
49、音声出力部50、基地局制御部51とを具備す
る。
図2を参照しながら説明する。
固定電話60との間の通話パスが確立され、移動端末A
10ユーザと固定電話60ユーザとで会話が開始される
と、その会話の音声が音声入力部48に入力される。こ
の音声入力部48に入力された音声(=音声信号)は、
音声認識部41で音声認識(例:入力された音声から音
素テキスト(発声された文字列)を認識する)され、その
音声認識で得られた結果がユーザ特定・音声分析処理部
42に入力される。
認識部41で得られた認識結果に基づいて移動端末A1
0ユーザ(話者)を特定するための分析処理を行うと共
に、移動端末A10ユーザが固定電話60ユーザとの会
話で使っている頻度の高いフレーズを抽出する役割を担
う。このユーザ特定・音声分析処理部42で抽出された
出現頻度の高いフレーズは一旦バッファメモリ43に蓄
積され、その蓄積されたフレーズと同一のフレーズが一
定回数以上繰り返された場合に、そのフレーズを移動端
末A10ユーザでの利用頻度の高いフレーズとみなして
音声データベース44に登録する。音声データベース4
4には、このようにして登録されるフレーズがユーザ毎
に分類されている。
ズをユーザ毎に登録する音声データベース44の内部構
成例である。
類するフィールド()と、ユーザの選択・非選択を表
すフィールド()と、登録されたフレーズの音声を管
理するフィールド()とで構成される。
ユーザを識別することが可能な加入者番号や識別ID
(例:U1、U2・・・)などが用いられる。また、ユ
ーザの選択・非選択を表すフィールド()は、移動端
末A10ユーザにて「登録」との選択がなされたフレー
ズに対して、選択を表すフラグを立て(「1」)、非選
択の決定がなされたフレーズに対しては非選択を表すフ
ラグ(「0」)を立てる。登録されたフレーズを管理す
るフィールド()は、登録したフレーズ毎に番号(登
録音声認識番号)を割当て管理する。例えば、V00
1、V002・・・などの番号がフレーズごとに割付け
られる。
説明を続ける。
A10ユーザと固定電話60ユーザが通話している間
(通話中)、音声認識部41の音声認識機能により通話
中の音声の音声情報が常にモニタされる。比較・検出部
45は、その通話中の音声の音声情報が音声データベー
ス44に登録されたフレーズの最初の音節の音声情報と
一致したかどうかを比較し、一致したフレーズを含む音
声情報を音声データベース44から検出する。この比較
・検出部45で検出されたフレーズの音声情報は音声再
生部46で再生された後、音声再生信号となって音声出
力部50から固定電話60へと送られる。固定電話60
では、音声出力部50から出力された音声再生信号に基
づいて音声の再生を行う。
ズの音声情報は、音声再生部46で音声再生信号となっ
て音声出力部50から定期的に移動端末A10に通知さ
れ、移動端末A10では、音声データベース44に登録
されたフレーズを聞くことができる。
して、移動端末A10が接続している無線基地局20に
対し移動端末A10に登録されたフレーズの音声情報を
再生させるための指令を送るよう命令する。尚、移動端
末A10でのフレーズの音声情報の登録手順については
後述する。また、ユーザーインターフェース部49はネ
ットワーク装置30が音声データベース44にアクセス
したり、そのアクセスに基づいて音声データベース44
から情報を出力したりする際のインターフェース機能を
有する。
を図4を参照しながら説明する。
声補完制御部11、送受信制御部12、登録音声メモリ
13、入力・再生部14、送受信部15、マイク/スピ
ーカ部16、操作部17、アンテナ部18とを具備して
構成される。
4を参照しながら説明する。
音声出力部50から定期的に通知される無線信号(音声
データベース44に登録されたフレーズの音声情報が含
まれる)を無線基地局20経由で受信した後、送受信部
15に送る。この無線信号は、送受信部15で周波数変
換や復調処理が施された後、フレーズの音声情報が抽出
されて入力・再生部14に送られる。入力・再生部14
から出力されるフレーズの音声情報は操作部17からの
指示によって、登録音声メモリ13に登録すべきかある
いは非登録とすべきかの選択が行えるようになってい
る。
を示した図である。
するフィールド()と、ユーザの選択を表すフィール
ド()と、登録されたフレーズの音声情報を管理する
フィールド()とで構成される。
ユーザを識別するための加入者番号や識別ID(例:U
1)などが用いられる。また、ユーザの選択を表すフィ
ールド()は、移動端末ユーザにて登録するとの選択
がなされたフレーズに対して、選択を表すフラグ
(「1」)を立てる。登録されたフレーズの音声情報を
管理するフィールド()は、登録したフレーズ毎に番
号(登録音声認識番号)を割当て管理する。例えば、V
001、V002・・・などの番号がフレーズごとに割
付けられる。
明を続ける。
される送信機あるいは受信機のON/OFF制御等を行
う。例えば、送受信部15で無線信号を受信する際に
は、送受信制御部12は送受信部15に対し受信機O
N、送信機OFFとなるよう制御し、反対に、送受信部
15で無線信号を送信しる際には、送受信部15に対し
送信機ON、受信機OFFとなるよう制御する。
音声情報は、入力・再生部14に入力された後、音声再
生されてマイク/スピーカ部16に音声出力される。こ
のマイク/スピーカ部16より出力された音声は、その
後、操作部17で「選択」あるいは「非選択」の操作が
移動端末A10ユーザにてなされて、登録音声メモリに
登録される。つまり、ここでは、移動端末A10ユーザ
がどのフレーズを有効とするかどうかの選択を行う。
尚、移動端末A10ユーザの操作に基づいて該当のフレ
ーズの音声を登録音声メモリ13に登録する手順につい
ては後述する。
定がなされたフレーズの音声については、「選択」され
たことを示す通知が送受信部15から出力され、アンテ
ナ部18を介して音声補完装置40に通知される。この
「選択」通知を受信した音声補完装置40内の音声デー
タベース44は該当するフレーズの音声情報をON(有
効)にする。
で述べたように、無線基地局20からは、移動端末A1
0の登録音声メモリ13に登録されたフレーズの音声を
再生させるための指令が当該移動端末A10に対して送
出される。この指令には、移動端末A10の送信をOF
Fにさせるための指令と、該移動端末A10内の登録音
声メモリ13に登録されたフレーズのうち流すべきフレ
ーズを指定する内容の指令が含まれている。
信制御部12は、送受信部15に対し、送信をOFFに
する命令を出す。また、上記指令は、送受信制御部12
から音声補完制御部11に送られ、該音声補完制御部1
1で再生すべきフレーズの音声の登録音声認識番号など
を読取ってその結果を入力・再生部14に伝える。入力
・再生部は登録音声メモリ13にアクセスし、該当する
登録音声認識番号のフレーズの音声情報を取得し音声再
生する。このようにして入力・再生部14で再生される
フレーズの音声は、マイク/スピーカ部16で聞くこと
ができるようになっている。
完の処理手順を図6を参照して詳述する。
音声補完の処理手順の一例を示すフローチャートであ
る。
下、ユーザAという)が固定電話60ユーザ(以下、ユ
ーザBという)との通話をしているときに発したフレー
ズは、音声補完装置40内の音声認識部41で認識され
た後、そのフレーズ(以下、フレーズAという)を発し
たユーザ(この場合、ユーザA)を特定するための分析
がユーザ特定・音声分析処理部42で行われる。このユ
ーザ特定・音声分析処理部42で得られた分析結果は一
旦バッファメモリ43に蓄積(S1)される。つまり、
ここでは、ユーザAが発したフレーズAが一時、バッフ
ァメモリ43に蓄積43される。
蓄積されたユーザAのフレーズAは比較・検出部45に
送られ、そのフレーズAが前回にも使われているか否か
が判定(S2)される。比較・検出部45は、この判定
(S2)で、バッファメモリ43から出力されたユーザ
AのフレーズAが前回にも同じフレーズが使われていな
い判定(S2でNO)された場合、バッファメモリ43
に対し、フレーズAの蓄積を保持しておく指示を出す
が、該判定(S2)で、バッファメモリ43から出力さ
れたユーザAのフレーズAが前回にも同じフレーズが使
われていると判定(S2でYES)された場合、更に、
そのフレーズAの使われている回数が予め定められた回
数(n)以上に達したかどうかの判定(S3)を行う。
例えば、n=3とした場合、(S3)の判定でフレーズ
Aの出現回数Cがn以下の場合(S3でNO)、該出現
回数Cが「1」インクリメント(S4)される。従っ
て、上記判定(S3)で、フレーズAの出現回数Cがn
以上(S3でYES)となったときに次のステップ(S
5)に進む。
数Cがn以上となったと判定(S3でYES)された場
合、比較・検出部45は、音声データベース44にアク
セスして、そのフレーズAが既に登録されているかどう
かを問合せる(S5)。この問合せ(S5)で、フレー
ズAが既に登録されているとの応答を音声データベース
44より得た場合(S5でYES)、比較・検出部45
は、音声データベース44に対し、更に、その登録済み
のフレーズAが移動端末A10ユーザより有効とする旨
の選択がなされているかどうかを問合せ(S7)を行
う。
で、フレーズAの「選択」がなされているとの応答を得
た(S7でYES)場合、中央制御部47を介し基地局
制御部51に移動端末A10の送信停止要求を表す信号
を無線基地局20に出力するよう指示(S9)すると共
に、音声データベース44からフレーズAの音声情報を
検出して音声再生部46に送る。音声再生部46は、フ
レーズAの音声情報を移動端末B70で音声再生可能な
音声再生信号に変換して音声出力部50に送る。この音
声出力部50から出力された音声再生信号は、移動端末
A10の通話相手の(ユーザB)固定電話60に送ら
れ、該固定電話60では受信した音声再生信号からフレ
ーズAの音声を聞くことができる(S10)ようになっ
ている。
ーズAが音声データベース44に登録されていないと判
定(S5でNO)された場合、該フレーズAは音声デー
タベース44に登録される。また、上記判定(S7)
で、フレーズAが移動端末A10ユーザより選択されて
いない場合(S7でNO)は、補完を行わないで処理を
中止する。
ーザAが使う頻度の高いフレーズが音声データベース4
4に自動的に登録される。ユーザAとユーザB間の通話
は、常にモニタされ、ユーザAが音声データベース44
に登録されたフレーズAの最初の音節を発したとき、音
声データベース44に登録されている複数のフレーズか
らそのフレーズAの最初の音節と一致するフレーズが抽
出される。例えば、音声データベース44に登録されて
いるフレーズAを「いつもお世話になっております」と
した場合、ユーザAがフレーズAの最初の音節「いつ
も」を発すると、比較・検出部45は音声データベース
44にアクセスし、「いつも」を最初の音節とするフレ
ーズを音声データベース44に登録されているフレーズ
からサーチする。このサーチで、「いつも」を最初の音
節とするフレーズが「いつもお世話になっております」
しか検出されなければ、このフレーズをフレーズAと一
致したとみなして抽出する。
ユーザBに提供され該ユーザBでは、ユーザAの声で
「いつもお世話になっております」のフレーズを聞くこ
とができる。しかしながら、「いつも」を最初の音節と
するフレーズが複数検出された場合は、次の文字(この
場合、「お」)が付加(「いつもお」)されて再度サー
チが行われる。このような場合、ユーザAに対しては、
「いつも」を最初の音節とするフレーズが複数検出され
た旨が通知されるが、ユーザAはこの通知に基づいて、
次の文字を発すれば音声補完装置40で自動的に該当す
るフレーズAを検出してくれるようになっている。
を発するだけで相手方に意思伝達できるので、会話の中
で定型文句を多く話すユーザにとっては該定型文句を全
て話さなくてもよくなり利便性が向上する。また、高齢
者や話すことが不自由なユーザであれば、予め伝えたい
フレーズを予め登録しておけば、会話をスムーズに進め
ることも可能となる。
データベース44で抽出されたフレーズAの音声をユー
ザBに流すと共に、ユーザAの移動端末A10に対し、
送信をOFFにし、自移動端末A10に登録されている
フレーズAを流すよう指示する。この指示を無線基地局
20を介して受信した移動端末A10は、登録されてい
るフレーズAを流し、その間の送信をOFFにする。即
ち、音声補完により補完したフレーズを流している間は
移動端末A10の送信が停止となるので該移動端末A1
0の消費電力をより低減することが可能となる。
相手方の端末を固定電話60と仮定したが、本発明はこ
れに限定されるものでなく相手方の端末が移動端末B7
0であっても勿論よい。
声データベース44にフレーズを登録する一例として、
移動端末A10ユーザが固定電話60ユーザと通話中、
通話内容が音声認識部41で音声認識された後、バッフ
ァメモリ43に一時蓄積し、同一フレーズが一定回数以
上繰り返されたら、その同一フレーズがユーザの声で音
声データベース44蓄積される場合を例示した。
る方法の一例を以下に示す。
ズを登録する手順の一例を示したフローチャートであ
る。
10は音声補完装置40から音声データベース44に登
録されたフレーズに係る情報(登録通知)を定期的に受
信(S21)する。移動端末A10は、この登録通知を
受信すると、所定タイミングで音声補完装置40の音声
データベース44にアクセスし、該音声データベース4
4に登録されたフレーズの音声情報を受信する。移動端
末A10は、そのフレーズの音声情報を受信後、音声再
生を行い(S23)、その再生されたフレーズのうちど
のフレーズを有効とするか否かの決定(選択あるいは非
選択)が操作部17の操作によってなされる。操作部1
7の操作で「選択」を表す操作が移動端末A10ユーザ
によってなされた場合(S24でYES)、その「選
択」で選ばれたフレーズを自移動端末A10内の登録音
声メモリ13に記憶すると共に、音声補完装置40内の
音声データベース44に対して、該フレーズを有効する
旨の通知(選択通知)を送出(S25)する。一方、操
作部17の操作で「非選択」を表す操作が移動端末A1
0ユーザにてなされた場合(S24でNO)、「非選
択」したフレーズの登録は行われず、かつ音声補完装置
40内の音声データベース44に対し、「非選択」した
フレーズを有効としない旨の通知(非選択通知)を送出
する。続いて、移動端末A10にフレーズを登録する他
の例を図8を参照しながら説明する。
10は音声補完装置40から音声データベース44に登
録されたフレーズに係る情報(登録通知)を定期的に受
信(S31)する。移動端末A10は、この登録通知を
受信すると、iモード(文字情報サービスの一つ)など
を用いて音声補完装置40内の音声データベース44に
アクセス(S32)し、該音声データベース44に登録
されているフレーズの音声情報の一覧をダウンロード
(S33)する。このダウンロードしたフレーズの音声
情報にはそれぞれを識別する番号が割り振られ、移動端
末A10ユーザは、移動端末A10の画面上で番号をク
リック(番号選択)することで該当する番号のフレーズ
の音声を聞けるようになっている。
なされ(S34)、その選択されたフレーズの音声が再
生(S35)されると、その再生されたフレーズのうち
どのフレーズを有効とするか否かの決定(選択あるいは
非選択)が操作部17の操作によってなされる。操作部
17の操作で「選択」を表す操作が移動端末A10ユー
ザによってなされた場合(S36でYES)、その「選
択」で選ばれたフレーズを自移動端末A10内の登録音
声メモリ13に記憶すると共に、音声補完装置40内の
音声データベース44に対して、該フレーズを有効する
旨の通知(選択通知)を送出(S37)する。一方、操
作部17の操作で「非選択」を表す操作が移動端末A1
0ユーザにてなされた場合(S37でNO)、その「非
選択」したフレーズの登録は行われず、かつ音声補完装
置40内の音声データベース44に対し、「非選択」し
たフレーズを有効としない旨の通知(非選択通知)を送
出する。
2)において、音声補完装置40から移動端末A10に
対し定期的に通知されるフレーズに係る情報(登録通
知)は、音声情報であっても電子メールのようなテキス
ト形式になっているものでもかまわない。この場合、音
声データベース44に登録されたフレーズの音声情報が
音声再生部46で音声再生信号となった後、中央制御部
47でその音声信号が読取られ、テキスト形式に変換さ
れた後、基地局制御部51を介して移動端末A10に送
られる。
声データベース44の登録機能が音声補完情報格納手段
に、比較・検出部45の音声比較検出機能が音声情報抽
出手段に、中央制御部47の制御機能及び基地局制御部
51の制御信号送出機能が再生指示手段及び音声送信停
止指示手段に、ユーザ特定・音声分析処理部42のユー
ザ特定・音声分析機能および音声データベース44の登
録機能が音声補完情報自動登録手段に対応する。また、
音声出力部46の音声出力機能が音声情報送信手段及び
第1の音声情報送信手段及び第2の音声情報送信手段に
対応する。更に、同音声補完装置40内の中央制御部4
7の制御機能及び基地局制御部51の通知信号送出機能
が音声情報通知手段に対応する。
メモリ13が第1〜3登録手段に対応し、操作部17の
決定機能が音声情報選択手段に、入力・再生部14の音
声再生機能が音声再生手段に対応する。送受信部15の
送信機能が報告手段に、送受信制御部12の送受信部1
5制御機能が送信停止手段に対応する。
0記載の本願発明によれば、ユーザが特によく使うフレ
ーズが音声補完装置に登録され、そのフレーズを登録し
たユーザが通話中、音声補完装置が登録されたフレーズ
の最初の音節が一致したことを認識した場合、該音声補
完装置はユーザの電話端末が接続している無線基地局に
対し、送信をOFFにし、自電話端末に登録された該当
フレーズを流す指示を送るよう命令する。そして、無線
基地局からその指示を受けた電話端末は、登録された該
当フレーズを流し、その間の送信電力をOFFにする。
同時に相手方の電話端末へは、該音声補完装置で補完し
た音声が流れるようになっている。
ズを発する度に上記のような音声補完がなされて送信電
力がOFFとなることから、より電話端末の消費電力の
軽減が図れる。また、ユーザでは、電話端末からデータ
等の面倒な入力を行う必要がなく、かつ上記音声の補完
に用いられる音声はユーザ自身の音声が用いられるため
自然な音声補完サービスの提供が実現可能になる。
によれば、上記のような音声補完方法に従って音声の補
完が可能となる音声補完装置を実現することができる。
によれば、上記のような音声補完方法に従って音声を再
生している間、送信電力を低減することのできる電話端
末装置を提供することができる。
用される移動通信システムの構成例を示す図である。
装置のブロック図を示す図である。
音声データベースの内部構成例を示す図である。
Aのブロック図を示す図である。図である。
端末の登録音声メモリの内部構成例を示す図である。
順の一例を示すフローチャートである。
の1)を示す図である。
の2)を示す図である。
Claims (24)
- 【請求項1】電話端末が他の電話端末と所定通信網を介
して音声通信を行う際に音声情報の補完を行う音声補完
方法において、 上記電話端末から音声情報を所定通信網に接続された音
声補完情報格納手段に予め登録し、 上記電話端末と他方の電話端末とが音声通信を行ってい
る際に、ユーザの音声が入力されたとき、上記電話端末
から送信された音声情報を含む音声情報を該音声補完情
報格納手段に登録されている音声情報から抽出し、 その抽出された音声情報を上記他方の電話端末に送信す
る音声補完方法。 - 【請求項2】請求項1記載の音声補完方法において、 上記音声補完情報格納手段は、上記電話端末から送信さ
れた音声情報を含む音声情報を抽出した際に、その抽出
した音声情報を上記電話端末に送信し、 上記電話端末は、上記音声情報を受信して登録する音声
補完方法。 - 【請求項3】請求項1記載の音声補完方法において、 上記音声補完情報格納手段は、上記電話端末と他方の電
話端末とが音声通信を行っている際に、ユーザから送信
される音声情報のうち出現頻度の高い音声情報を抽出し
て自動登録する音声補完方法。 - 【請求項4】請求項3記載の音声補完方法において、 上記電話端末は、上記音声補完情報格納手段にて抽出さ
れた出現頻度の高い音声情報を該音声補完情報格納手段
より受信して登録する音声補完方法。 - 【請求項5】請求項2又は4記載の音声補完方法におい
て、 上記音声補完情報格納手段は、音声情報または出現頻度
の高い音声情報のいずれかを抽出した際に、該抽出で得
られた音声情報または該音声情報を伝達するための情報
を上記電話端末に通知し、 上記電話端末は、その通知に基づいて上記音声補完情報
格納手段に登録させるべき音声情報がユーザにて選択さ
れた後、その選択結果を上記音声補完情報格納手段に報
告し、 上記音声補完情報格納手段は、上記無線端末からの報告
に基づいて音声情報を登録する音声補完方法。 - 【請求項6】請求項5記載の音声補完方法において、 上記電話端末は、上記音声補完情報格納手段に登録させ
るべき音声情報がユーザにて選択された後、その選択結
果に基づいて得られる音声情報を登録する音声補完方
法。 - 【請求項7】請求項1乃至6いずれか一項記載の音声補
完方法において、 上記電話端末と他方の電話端末とが音声通信を行ってい
る際に、ユーザの音声が入力されたとき、音声補完情報
格納手段は、上記電話端末から送信された音声情報を含
む音声情報を該音声補完情報格納手段に登録されている
音声情報から抽出して、その抽出した音声情報と同一の
音声情報を再生させるための指示となる信号を上記電話
端末に送信し、 上記電話端末は、上記指示に従って予め登録されている
音声情報の再生を行う音声補完方法。 - 【請求項8】請求項7記載の音声補完方法において、 上記音声補完情報格納手段は、該音声補完情報格納手段
で抽出された音声情報と同一の音声情報を再生させるた
めの指示を上記電話端末に対して送信するときに、上記
電話端末が上記音声補完情報格納手段からの指示に基づ
いて音声情報を再生している間、音声情報の送信を停止
させる指示を上記電話端末に送信し、 上記電話端末は、上記指示に従って予め登録されている
音声情報の再生を行っている間、ユーザからの音声入力
に係らず音声送信を停止する音声補完方法。 - 【請求項9】電話端末が他の電話端末と所定通信網を介
して音声通信を行う際に音声情報の補完を行う音声補完
方法において、 上記電話端末から音声情報を所定通信網に接続された音
声補完情報格納手段に予め登録し、 上記電話端末と他方の電話端末とが音声通信を行ってい
る際に、ユーザの音声が入力されたとき、上記電話端末
から送信された音声情報を含む音声情報を該音声補完情
報格納手段に登録されている音声情報から抽出し、 その抽出された音声情報を上記電話端末及び他方の電話
端末に送信する音声補完方法。 - 【請求項10】請求項1乃至9いずれか一項記載の音声
補完方法において、 上記電話端末として所定の通信網に接続される移動端末
装置を用いる音声補完方法。 - 【請求項11】電話端末が他の電話端末と所定通信網を
介して音声通信を行う際に音声情報の補完を行う音声補
完装置において、 所定通信網に接続され、上記電話端末からの音声情報を
予め登録する音声補完情報格納手段と、 上記電話端末と他方の電話端末とが音声通信を行ってい
る際に、ユーザの音声が入力されたとき、上記電話端末
から送信された音声情報を含む音声情報を該音声補完情
報格納手段に登録されている音声情報から抽出する音声
情報抽出手段と、 その抽出された音声情報を上記他方の電話端末に送信す
る音声情報送信手段とを有する音声補完装置。 - 【請求項12】請求項11記載の音声補完装置におい
て、 上記音声補完情報格納手段は、上記電話端末から送信さ
れた音声情報を含む音声情報を抽出した際に、その抽出
した音声情報を上記電話端末に送信する第1の音声情報
送信手段を有する音声補完装置。 - 【請求項13】請求項11又は12記載の音声補完装置
において、 上記音声補完情報格納手段は、上記電話端末と他方の電
話端末とが音声通信を行っている際に、ユーザから送信
される音声情報のうち出現頻度の高い音声情報を抽出し
て自動登録する音声情報自動登録手段を有する音声補完
完装置。 - 【請求項14】請求項11乃至13いずれか一項記載の
音声補完装置において、 上記音声補完情報格納手段は、音声情報または出現頻度
の高い音声情報のいずれかを抽出した際に、該抽出で得
られた音声情報または該音声情報を伝達するための情報
を上記電話端末に通知する音声情報通知手段と、 上記電話端末が上記音声補完情報格納手段に登録させる
べき音声情報を選択した際に送信する報告に基づいて音
声情報を登録する音声補完装置。 - 【請求項15】請求項11乃至14いずれか一項記載の
音声補完装置において、 上記電話端末と他方の電話端末とが音声通信を行ってい
る際に、ユーザの音声が入力されたとき、音声補完情報
格納手段は、上記電話端末から送信された音声情報を含
む音声情報を該音声補完情報格納手段に登録されている
音声情報から抽出してその抽出した音声情報と同一の音
声情報を再生させるための指示となる信号を上記電話端
末に送信する再生指示手段を有する音声補完装置。 - 【請求項16】請求項11乃至15いずれか一項記載の
音声補完装置において、 上記音声補完情報格納手段は、該音声補完情報格納手段
で抽出された音声情報と同一の音声情報を再生させるた
めの指示を上記電話端末に対して送信するときに、上記
電話端末が上記音声補完情報格納手段からの指示に基づ
いて音声情報を再生している間、音声情報の送信を停止
させる指示を上記電話端末に送信する音声送信停止指示
手段を有する音声補完装置。 - 【請求項17】電話端末が他の電話端末と所定通信網を
介して音声通信を行う際に音声情報の補完を行う音声補
完装置において、 所定通信網に接続され、上記電話端末からの音声情報を
予め登録する音声補完情報格納手段と、 上記電話端末と他方の電話端末とが音声通信を行ってい
る際に、ユーザの音声が入力されたとき、上記電話端末
から送信された音声情報を含む音声情報を該音声補完情
報格納手段に登録されている音声情報から抽出する音声
情報抽出手段と、 その抽出された音声情報を上記電話端末及び他方の電話
端末に送信する第2の音声情報送信手段を有する音声補
完装置。 - 【請求項18】所定通信網を介して通信を行う電話端末
装置において、 上記電話端末は、上記音声補完情報格納手段の第1の音
声情報送信手段にて送信された音声情報を受信して登録
する第1登録手段を有する電話端末。 - 【請求項19】請求項18記載の電話端末において、 上記電話端末は、上記音声補完情報格納手段にて抽出さ
れた出現頻度の高い音声情報を該音声補完情報格納手段
より受信して登録する第2登録手段を有する電話端末。 - 【請求項20】請求項18又は19記載の電話端末にお
いて、 上記電話端末は、上記音声補完情報格納手段の音声情報
通知手段からの通知に基づいて上記音声補完情報格納手
段に登録させるべき音声情報の選択がユーザにてなされ
る音声情報選択手段と、 その選択結果を該音声補完情報格納手段に報告する報告
手段とを有する電話端末。 - 【請求項21】請求項18乃至20いずれか一項記載の
電話端末において、 上記電話端末は、上記音声補完情報格納手段に登録させ
るべき音声情報がユーザにて選択された後、その選択結
果に基づいて得られる音声情報を登録する第3登録手段
を有する電話端末。 - 【請求項22】請求項18乃至21いずれか一項記載の
電話端末において、 上記電話端末は、上記音声補完情報格納手段の再生指示
手段によって指示される指示内容に従って予め登録され
ている音声情報の再生を行う音声再生手段を有する電話
端末。 - 【請求項23】請求項18乃至22いずれか一項記載の
電話端末において、 上記電話端末は、上記音声補完情報格納手段の送信停止
手段にて指示される指示内容に従って予め登録されてい
る音声情報の再生を行っている間、ユーザからの音声入
力に係らず音声送信を停止する送信停止手段を有する電
話端末。 - 【請求項24】請求項18乃至23いずれか一項記載の
電話端末において、 上記電話端末として所定の通信網に接続される移動端末
装置を用いる電話端末。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001190422A JP3885989B2 (ja) | 2001-06-22 | 2001-06-22 | 音声補完方法及び音声補完装置ならびに電話端末装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001190422A JP3885989B2 (ja) | 2001-06-22 | 2001-06-22 | 音声補完方法及び音声補完装置ならびに電話端末装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003008745A true JP2003008745A (ja) | 2003-01-10 |
JP3885989B2 JP3885989B2 (ja) | 2007-02-28 |
Family
ID=19029193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001190422A Expired - Fee Related JP3885989B2 (ja) | 2001-06-22 | 2001-06-22 | 音声補完方法及び音声補完装置ならびに電話端末装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3885989B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006038955A (ja) * | 2004-07-22 | 2006-02-09 | Docomo Engineering Tohoku Inc | 声紋認識システム |
-
2001
- 2001-06-22 JP JP2001190422A patent/JP3885989B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006038955A (ja) * | 2004-07-22 | 2006-02-09 | Docomo Engineering Tohoku Inc | 声紋認識システム |
Also Published As
Publication number | Publication date |
---|---|
JP3885989B2 (ja) | 2007-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100804855B1 (ko) | 음성으로 제어되는 외국어 번역기용 방법 및 장치 | |
US6424945B1 (en) | Voice packet data network browsing for mobile terminals system and method using a dual-mode wireless connection | |
US7305068B2 (en) | Telephone communication with silent response feature | |
US7072686B1 (en) | Voice controlled multimedia and communications device | |
US20050180464A1 (en) | Audio communication with a computer | |
US7164934B2 (en) | Mobile telephone having voice recording, playback and automatic voice dial pad | |
JP2003218999A (ja) | 音声認識機能付き携帯電話装置及びその制御プログラム | |
US20040015353A1 (en) | Voice recognition key input wireless terminal, method, and computer readable recording medium therefor | |
JP2002057752A (ja) | 携帯端末装置 | |
JP3885989B2 (ja) | 音声補完方法及び音声補完装置ならびに電話端末装置 | |
KR100370973B1 (ko) | 통화중 음성에 배경음악을 합성해서 전송하는 방법 및 그장치 | |
EP1238519A1 (en) | Method and system for placing a telephone call | |
JP4100088B2 (ja) | 通信端末、着信通知方法およびプログラム | |
JP3362615B2 (ja) | 携帯電話及び音声データ伝送方法 | |
JP5326539B2 (ja) | 留守番電話システム、留守番電話サービスサーバ及び留守番電話サービス方法 | |
KR100294463B1 (ko) | 호착신음녹음이가능한이동통신단말기및호착신음지정방법 | |
JP2008228055A (ja) | 携帯電話機および留守番録音方法 | |
JP2001127888A (ja) | 音声出力メールシステム | |
JP2003046647A (ja) | 通話中継システム、通話中継方法、通話中継プログラム及びそれを記録した記録媒体 | |
JP2005222410A (ja) | 車載用ハンドフリーメール装置 | |
JP2002218016A (ja) | 携帯電話機及び携帯電話機を用いた翻訳方法 | |
KR20040029810A (ko) | 발신자 정보 음성 출력 장치 및 방법 | |
GB2408171A (en) | Telephone communication with silent response feature | |
JP2002344572A (ja) | 携帯電話端末、プログラム、プログラムを記録した記録媒体 | |
WO2000079770A1 (en) | User customizable announcement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041004 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060901 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060912 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061005 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061116 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101201 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101201 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111201 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111201 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121201 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |