JP2005005899A - 自動応答機能を備えた電話装置 - Google Patents

自動応答機能を備えた電話装置 Download PDF

Info

Publication number
JP2005005899A
JP2005005899A JP2003165601A JP2003165601A JP2005005899A JP 2005005899 A JP2005005899 A JP 2005005899A JP 2003165601 A JP2003165601 A JP 2003165601A JP 2003165601 A JP2003165601 A JP 2003165601A JP 2005005899 A JP2005005899 A JP 2005005899A
Authority
JP
Japan
Prior art keywords
call
call partner
voice
party
family
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003165601A
Other languages
English (en)
Inventor
Masayuki Nakazawa
正幸 中沢
Michiaki Mukai
理朗 向井
Keiko Watanuki
啓子 綿貫
Hideo Mitsuyoshi
秀夫 三吉
Shigeru Ueda
繁 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2003165601A priority Critical patent/JP2005005899A/ja
Publication of JP2005005899A publication Critical patent/JP2005005899A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

【課題】発信者電話番号表示サービスに対応した自動応答機能付き電話装置(留守番電話)において、通知された発信者電話番号による識別を行うのみならず、その通話相手を、その家族の各構成員単位で識別し、それぞれに対応した自動応答(応答メッセージの出力、録音メッセージの記録、電話の転送など)を行うことができるような電話装置を提供する。
【解決手段】通話相手の電話番号と通話相手の家族情報とを関連付けて記憶した家族情報テーブルと、電話を着信した時に発信者の電話番号を取得する手段と、通話相手の音声を取得する手段と、前記家族情報テーブルを参照して、前記発信者の電話番号と、前記通話相手の音声とから、通話相手個人を識別する手段と、前記通話相手識別手段により識別された通話相手個人に対応した応答を行う自動応答手段と、を備えた電話装置。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、通話の音声信号を解析して通話相手を識別することが可能な自動応答機能を備えた電話装置に関し、特に、通話相手が家族である場合に、識別された個人に応じて、応答メッセージの出力、用件メッセージの記録、電話の転送等を行う自動応答機能を備えた電話装置に関するものである。
【0002】
【従来の技術】
近年の固定電話通信では、アナログ電話網、ISDN通信網ともに、発信者の電話番号を着信側に通知する発信者電話番号表示サービス(例えば、NTT社が提供する「ナンバーディスプレイサービス」など)が提供されている。また、このような発信者電話番号表示サービスに対応した固定電話装置が商品化され、広く一般に使用されている。
【0003】
ユーザは、電話通信サービス会社から発信者電話番号表示サービスの提供を受けるとともに、発信者電話番号表示サービスに対応した固定電話装置を設置することにより、着信した電話の発信元の電話番号が、固定電話装置のディスプレイ上に表示されるようになる。
【0004】
また、このような固定電話装置のメモリに、通話相手の名前と電話番号とを関連付けて登録した電話帳を予め記憶させておくことにより、登録された通話相手からの着信があった場合には、通話相手の電話番号に代えて、あるいは電話番号とともに、通話相手の名前がディスプレイ上に表示されるよう設定することができる。
【0005】
このようにして、発信者電話番号表示サービス及びこれに対応した固定電話を利用することにより、ユーザは電話に出なくとも、電話を着信した時点で、ディスプレイ上に表示される電話番号や名前から着信元を識別することができる。
【0006】
このような発信者電話番号表示サービス対応の固定電話装置で、さらに留守番電話機能を備えているものは、留守番応答をした際に、通話相手のメッセージとともに、通話相手の電話番号や、電話帳に登録されている名前を記録する機能を備えているのが一般的である。
【0007】
図16は、上記したような従来の留守番電話装置の構成及び通話態様を概略的に示す図である。
図16において、従来の留守番電話装置103は、音声入力部104、着信時刻記録部105、応答メッセージ出力部106及び用件メッセージ記録部107を備えており、公衆回線網102を通じて、他の電話装置101と通話を行うことができるように構成されている。
【0008】
今、電話装置101から、留守番モードに設定された留守番電話装置103に電話をかけると、留守番電話装置103は電話を着信し、留守番機能が作動する。このとき、音声入力部104は通話相手からの音声信号を受信し、着信時刻記録部105は着信時刻を記録する。応答メッセージ出力部106は所定の応答メッセージを出力し、用件メッセージ記録部107は通話相手が発した音声を用件メッセージとして着信時刻とともに記録する。ここで、着信時刻記録部105と応答メッセージ出力部106の処理が前後していてもよい。
【0009】
図17は、このような構成を有する従来の留守番電話装置103の留守番モードでの動作を示すフローチャートである。
留守番モードに設定された留守番電話装置103は、電話の着信があるまで着信待機処理を行う(ステップS101)。着信があると、発信者電話番号が通知されているかどうか判断した後(ステップS102)、通知されているある場合には、電話番号を受信し(ステップS103)、受信した電話番号をディスプレイ等に表示する(ステップS104)。また、留守番電話装置103は、受信した電話番号をメモリ等に一時的に記憶しておくものとする。ステップS102において、番号通知がない場合には、呼び出し処理(ステップS105)に進む。
【0010】
電話を着信した留守番電話装置103は、呼び出し音を発したり、ディスプレイやランプをフラッシュさせたりして、呼び出し処理を行う(ステップS105)。このとき、ユーザが電話を取ると、呼び出し処理は終了し、通話が開始されるようになっている。
【0011】
呼び出し処理において、呼び出しが一定回数繰り返されるか、もしくは、一定時間継続して行われた後、呼び出し終了の確認処理が行われる(ステップS106)。ユーザが電話を取った場合や、相手が電話を切った場合などには、呼び出しが終了しており、留守番電話装置103は、再びステップS101の着信待機処理に戻る。
【0012】
一方、ステップS106において、呼び出しが継続されている場合には、留守番モードが設定されているかどうかをチェックし(ステップS107)、留守番モードが設定されていない場合には、ステップS105に戻り呼び出し処理が継続される。
【0013】
ステップS107において、留守番電話装置103が留守番モードに設定されている場合には、公衆回線との接続が行われ(ステップS108)、着信時刻記録部105により着信時刻が記録された後(ステップS109)、応答メッセージ出力部106によりユーザが留守であるという応答メッセージが出力される(ステップS110)。応答メッセージは、例えば、「○○です。只今留守にしております。発信音の後に、メッセージをお願い致します。」という音声であり、ユーザが予め記憶させておくことができるものである。
【0014】
応答メッセージの出力後、通話相手の音声を録音する用件メッセージ記録処理が行われる(ステップS111)。留守番電話装置103は、用件メッセージ記録処理を行っている間、記録が終了したかどうかを判断する(ステップS112)。例えば、通話相手が接続を切ったり、一定時間以上無音状態が継続したり、あるいは1件あたりの記録制限時間を超過した場合には、記録が終了したものと判断する。
【0015】
ステップS112において、用件メッセージ記録処理が終了すると、公衆回線への接続の切断処理が行われる(ステップS113)。回線切断処理後は、再び、ステップS101の着信待機処理に戻り、電話の着信を待つ状態となる。
【0016】
以上が、従来の留守番電話装置103の留守番モードでの応答処理であるが、着信時刻の記録処理(ステップS109)は、応答メッセージ出力処理(ステップS110)が行われた後で、実行されてもよい。すなわち、着信時刻記録処理と応答メッセージ出力処理とは、処理の順番が入れ替わってもかまわない。
【0017】
ところで、この留守番電話機能をさらに使いやすくするために、複数パターンの応答メッセージを記憶しておき、識別した発信者電話番号に応じていずれかの応答メッセージを発するような機能や、通話相手の音声を識別し、これに応じて異なる応答メッセージを発する機能などが開発されている。
【0018】
前者の例としては、通話相手が友人であるか、家族・親類であるか、仕事の関係者であるかなどを通知された発信者電話番号に応じて識別し、それぞれに対応したパターンの応答メッセージを出力するような自動応答機能などが考えられる。
【0019】
例えば、特許文献1に記載の電話装置は、外部からかかってきた電話が誰宛の電話であるかを自動的に判別し、利用者ごとに異なる応答メッセージ出力や用件メッセージ録音を可能にすることを特徴とするものであり、グループ別電話帳を備えることで、発信元の電話番号から通話相手を特定することが可能であり、また、グループごとに通話相手を指定したテーブルを備えることで、個人対個人の通話及び留守録メッセージ出力、用件メッセージ録音を可能にしている。
【0020】
後者の例としては、通話相手が発した音声信号を解析し、その特徴から男声女声の識別をし、それぞれに対応したパターンの応答メッセージを出力するような自動応答機能などが考えられる。
【0021】
例えば、特許文献2に記載の応答装置は、留守番モード中に電話をかけてきた相手の音声によって男性、女性の識別を行い、それに基づき適切な応答情報を選択し出力する機能を備えており、例えば、不特定の男性であれば男声で、女性であれば女声で応答メッセージを出力することを特徴としている。
【0022】
尚、特許文献2では、音声による男女の識別の方式は特に限定されておらず、例えば、特許文献3や特許文献4に記載されている男女識別方法を使用するとしている。
【0023】
特許文献3に記載の音声認識方式は、男女別標準パターンとのパターンマッチングによって男女識別を行うものであり、特許文献4に記載の音声認識装置は、入力音声のピッチを検出することによって男女識別を行うものである。
【0024】
【特許文献1】
特開平11−341147号公報。
【特許文献2】
特開平9−312686号公報。
【特許文献3】
特開昭60−129795号公報。
【特許文献4】
特開昭61−43798号公報。
【0025】
【発明が解決しようとする課題】
ところで、上記の発信者電話番号により通話相手を識別する方法では、実際に誰が通話相手なのかを認識する手段が全く考慮されていない。一般家庭に設置された固定電話装置は、通常その家族で共用されるものであり、その家庭から発信者電話番号を通知した電話を着信したとしても、その家族の構成員のうち誰が実際の通話相手なのかを留守番電話装置が自動的に判断する手段はない。したがって、その家族の誰が電話をかけてきても、同じ留守番応答メッセージを出力するほかないことになる。
【0026】
一方、上記の通話相手が発した音声信号を解析し、その特徴から男声女声の識別をして、それぞれに対応したパターンの応答メッセージを出力する方法では、男性又は女性の2パターンの識別を行うのみであり、さらに多くの構成員を含んだ家族の各個人を認識することは不可能である。
【0027】
また、留守番電話装置では、不特定多数の人が発する不特定キーワード音声が入力されるので、入力された音声信号を予め記憶してある男声女声の標準パターンとマッチングしても、必ずしも有意な識別結果が得られるとは限らない。また、そのような不特定な音声信号からピッチを正確に抽出することは、音声情報処理の分野では一般的に困難であるとされている。すなわち、特許文献3に記載の音声認識方式や、特許文献4に記載の音声認識装置を用いても、必ずしも正確な男女識別を行うことができるとは限らないと言える。
【0028】
そこで、本発明は、発信者電話番号表示サービスに対応した自動応答機能付き電話装置(留守番電話)において、通知された発信者電話番号による識別を行うのみならず、その通話相手を、その家族の各構成員単位で識別し、それぞれに対応した自動応答(応答メッセージの出力、録音メッセージの記録、電話の転送など)を行うことができるような電話装置を提供しようとするものである。
【0029】
【課題を解決するための手段】
上記解決課題に鑑みて鋭意研究の結果、本発明者は、発信者電話番号が一家族に対応すると考えて、電話装置において発信者電話番号ごとに対応する家族情報を記憶しておき、電話を着信すると、発信者の電話番号をもとに当該家族の家族情報を参照し、通話相手がその家族のうち誰であるかを識別してから、適切な自動応答を行うことができる電話装置に想到した。
【0030】
すなわち、本発明は、通話相手の電話番号と通話相手の家族情報とを関連付けて記憶した家族情報テーブルと、電話を着信した時に発信者の電話番号を取得する電話番号取得手段と、通話相手の音声を取得する音声取得手段と、を備えており、前記家族情報テーブルを参照して、前記発信者の電話番号と、前記通話相手の音声とから、通話相手個人を識別する電話装置を提供するものである。
【0031】
本発明は、また、通話相手の電話番号と通話相手の家族情報とを関連付けて記憶した家族情報テーブルと、電話を着信した時に発信者の電話番号を取得する電話番号取得手段と、通話相手の音声を取得する音声取得手段と、前記家族情報テーブルを参照して、前記発信者の電話番号と、前記通話相手の音声とから、通話相手個人を識別する通話相手識別手段と、前記通話相手識別手段により識別された通話相手個人に対応した応答を行う自動応答手段と、を備えた電話装置を提供するものである。
【0032】
本発明の電話装置は、また、電話を着信した時刻を記憶する着信時刻記憶手段をさらに備えており、前記通話相手識別手段は、前記家族情報テーブルを参照して、前記発信者の電話番号と、前記通話相手の音声と、前記着信時刻とから、通話相手個人を識別することを特徴とする。
【0033】
以上に示した本発明の電話装置によれば、電話を着信した際に得られる通話相手に関する情報(発信者電話番号、通話相手の音声及び着信時刻)と、家族情報テーブルに記憶された家族情報とから、通話相手が家族の構成員のうち誰であるかを判断することができ、その判断結果に応じた適切な自動応答を行うことが可能となる。
【0034】
本発明の電話装置において、前記家族情報テーブルは、通話相手の家族情報として、家族の各構成員ごとに、年齢、性別、通話時間帯、個人特性情報、転送情報、応答メッセージのうち少なくとも1つを記憶していることを特徴とする。
【0035】
本発明の電話装置において、前記通話相手識別手段は、通話相手の音声のピッチ情報に基づいて、通話相手が成人男性、成人女性又は子供のいずれであるかを判断し、通話相手個人を識別することを特徴とする。
これにより、家族情報テーブルに記憶されている家族の各構成員の年齢及び性別情報から通話相手個人を識別することが可能となる。
【0036】
本発明の電話装置において、前記通話相手識別手段は、通話相手が特定キーワードを発したときの音声のピッチ情報に基づいて、通話相手が成人男性、成人女性又は子供のいずれであるかを判断し、通話相手個人を識別することを特徴とする。
特に、電話会話によく用いられる「もしもし」などの特定キーワードの音声を解析することにより、通話相手個人の識別を高精度で行うことが可能である。
【0037】
本発明の電話装置において、前記通話相手識別手段は、さらに、前記家族情報テーブルに記憶されている通話相手家族の各構成員の年齢情報に基づいて、通話相手個人を識別することを特徴とする。
【0038】
上記した通話相手の音声のピッチ情報による通話相手個人の識別では、成人男性、成人女性又は子供といった大まかな識別しかできないが、家族情報テーブルに記憶されている家族の各構成員の年齢情報を用いれば、音声の経年変化を考慮した補正を行うことができるので、より良い精度で通話相手個人を識別することが可能となる。
【0039】
本発明の電話装置において、前記通話相手識別手段は、さらに、前記家族情報テーブルに記憶されている通話相手家族の各構成員の個人特性情報と、通話相手の音声とを比較し、通話相手個人を識別することを特徴とする。
通話相手家族の各構成員の個人特性情報は、これまでにかかってきた電話での通話や残された用件メッセージなどを分析して予め記憶しておくことができる。
【0040】
本発明の電話装置において、前記通話相手識別手段は、さらに、前記家族情報テーブルに記憶されている通話相手家族の各構成員の通話時間帯情報と、着信時刻とを比較し、通話相手個人を識別することを特徴とする。
【0041】
これにより、通話相手家族の各構成員によって、電話をかけてくる時間帯がほぼ決まっている場合には、その情報を活用して通話相手個人の識別の精度をさらに高めることができる。
【0042】
本発明の電話装置において、前記自動応答手段は、通話相手からの用件メッセージを受け取り、前記家族情報テーブルにおいて、前記用件メッセージを通話相手の電話番号に関連付けて記憶させることを特徴とする。
【0043】
これにより、従来の留守番電話のように、単に着信した時刻順に無造作に用件メッセージを記憶しておくのではなく、通話相手の家族情報に関連付けて記憶させておくことができるので、ユーザが用件メッセージを取り出す際に便利である。また、記憶した用件メッセージの音声情報から、その通話相手の個人特性情報などを生成することも可能となる。
【0044】
本発明の電話装置において、前記自動応答手段は、前記家族情報テーブルにおいてされている、前記識別された通話相手個人についての転送情報に基づいて、電話を転送することを特徴とする。
【0045】
本発明では、通話相手個人によって異なる転送先を設定することも可能なので、通話相手個人にきめ細かに対応した自動応答を行うことが可能である。
本発明の電話装置において、前記自動応答手段は、通話相手から音声が取得されない場合には、通話相手に発話を促すよう音声を発することを特徴とする。
【0046】
これにより、従来の留守番電話のように、ただ一方的に通話相手からの用件メッセージ入力を待つばかりではなく、自然な方法で通話相手に発話を促すことができる。また、通話相手個人の識別のために用いる通話相手の音声の取得を効果的に行うことができる。
【0047】
本発明の電話装置において、前記自動応答手段は、家族情報テーブルにおいて発信者の電話番号に関連付けられた家族情報が記憶されていない場合には、通話相手の音声のピッチ情報に基づいて、通話相手が成人男性、成人女性又は子供のいずれであるかを判断し、判断結果に応じた応答を行うことを特徴とする。
本発明の電話装置において、前記自動応答手段は、発信者の電話番号を取得できない場合には、不特定通話相手に対応した応答を行うことを特徴とする。
【0048】
本発明は、また、通話相手の電話番号と通話相手の家族情報とを関連付けて記憶した家族情報テーブルを備えた電話装置において用いる自動応答プログラムであって、電話を着信した時に発信者の電話番号を取得する電話番号取得手段と、電話を着信した時刻を記憶する着信時刻記憶手段と、通話相手の音声を取得する音声取得手段と、前記家族情報テーブルを参照して、前記発信者の電話番号と、前記着信時刻と、前記通話相手の音声とから、通話相手個人を識別する通話相手識別手段と、前記通話相手識別手段により識別された通話相手個人に対応した応答を行う自動応答手段と、を備えた自動応答プログラムを提供するものである。
【0049】
本発明は、また、通話相手の電話番号と通話相手の家族情報とを関連付けて記憶した家族情報テーブルを備えた電話装置において用いる自動応答プログラムであって、電話を着信した時に発信者の電話番号を取得する電話番号取得手段と、電話を着信した時刻を記憶する着信時刻記憶手段と、通話相手の音声を取得する音声取得手段と、前記家族情報テーブルを参照して、前記発信者の電話番号と、前記着信時刻と、前記通話相手の音声とから、通話相手個人を識別する通話相手識別手段と、前記通話相手識別手段により識別された通話相手個人に対応した応答を行う自動応答手段と、を備えた自動応答プログラムを記録した記録媒体を提供するものである。
【0050】
【発明の実施の形態】
以下、添付図面を参照しながら、本発明の実施の形態を詳細に説明する。
図1〜図15は、本発明の実施の形態を例示する図であり、これらの図中、同一の符号を付した部分は同一物を表わし、基本的な構成及び動作は同様であるものとする。
【0051】
図1は、本発明の自動応答機能を備えた電話装置の一実施形態について、その構成及び通話態様を概略的に示す図である。
図1において、本実施形態の電話装置13は、音声入力部14、着信時刻記録部15、通話相手判断部16、家族情報テーブル17、応答メッセージ生成部18、応答メッセージ出力部19、用件メッセージ記録部20及び電話転送部21を備えており、公衆回線網12を通じて、他の電話装置11と通話を行うことができるように構成されている。
【0052】
通話相手判断部16は、入力された通話相手の音声から、家族情報テーブル17を参照して、通話相手の識別を行う。家族情報テーブル17は、通話相手の電話番号とともに、通話相手の家族の各構成員に関する所定の情報及び各構成員に対応した各応答メッセージなどを記憶している。通話相手の識別は、通知された発信者電話番号及び音声入力部14に入力された通話相手の音声の解析結果と、家族情報テーブル17に記憶されている通話相手家族の各構成員に関する所定の情報とを比較して行う。応答メッセージ生成部18は、通話相手判断部16による通話相手の識別結果に基づいて、家族情報テーブル17を参照して、所定の応答メッセージを生成する。尚、これら各構成部分の詳細については後述する。
図1に示す上記以外の各構成部分は、図16に示した従来の留守番電話装置等と同様であるので、ここでは説明を省略する。
【0053】
図1において、外部の電話装置11から、自動応答モードに設定された電話装置13に電話をかけると、電話装置13は電話を着信し、自動応答機能が作動する。このとき、音声入力部14は通話相手からの音声信号を受信し、着信時刻記録部15は着信時刻を記録する。
【0054】
続いて、通話相手判断部16は、家族情報テーブル17を参照して、通話相手の識別を行う。通話相手が識別された場合には、応答メッセージ生成部18は、家族情報テーブル17に記憶されたその通話相手に関する情報に基づいて、その通話相手に対応した応答メッセージを生成する。
【0055】
家族情報テーブル17において、識別した通話相手について電話の転送先の情報が記憶されている場合には、電話転送部21により、電話の転送が行われる。転送を行わない場合には、応答メッセージ出力部19より、応答メッセージ生成部18で生成した応答メッセージが出力され、用件メッセージ記録部20より、通話相手のメッセージが着信時刻とともに記録される。
【0056】
一方、通話相手判断部16において通話相手が識別されない場合には、家族情報テーブル17に記憶されている不特定の通話相手用の応答メッセージに基づいて、応答メッセージ生成部18により応答メッセージが生成される。応答メッセージ出力部19は、生成された応答メッセージを出力し、用件メッセージ記録部20は通話相手が発した音声を用件メッセージとして着信時刻とともに記録する。
【0057】
図2は、図1に示す本実施形態の電話装置13の自動応答モードでの動作を示すフローチャートである。
自動応答モードに設定された電話装置13は、電話の着信があるまで着信待機処理を行う(ステップS11)。着信があると、発信者電話番号が通知されているかどうか判断した後(ステップS12)、通知されているある場合には、電話番号を受信し(ステップS13)、受信した電話番号をディスプレイ等に表示する(ステップS14)。また、電話装置13は、受信した電話番号をメモリ等に一時的に記憶しておくものとする。ステップS12において、番号通知がない場合には、呼び出し処理(ステップS15)に進む。
【0058】
電話を着信した電話装置13は、呼び出し音を発したり、ディスプレイやランプをフラッシュさせたりして、呼び出し処理を行う(ステップS15)。このとき、ユーザが電話を取ると、呼び出し処理は終了し、通話が開始されるようになっている。
【0059】
呼び出し処理において、呼び出しが一定回数繰り返されるか、もしくは、一定時間継続して行われた後、呼び出し終了の確認処理が行われる(ステップS16)。ユーザが電話を取った場合や、相手が電話を切った場合などには、呼び出しが終了しており、電話装置13は、再びステップS11の着信待機処理に戻る。
【0060】
一方、ステップS16において、呼び出しが継続されている場合には、自動応答モードが設定されているかどうかをチェックし(ステップS17)、自動応答モードが設定されていない場合には、ステップS15に戻り呼び出し処理が継続される。
【0061】
ステップS17において、電話装置13が自動応答モードに設定されている場合には、公衆回線との接続が行われ(ステップS18)、着信時刻記録部15により着信時刻及び発信者電話番号が記録された後(ステップS19)、話者情報の抽出が行われる(ステップS20)。ここで、話者情報とは、通話相手の音声や、発信者電話番号、着信時刻などを含んだ情報であり、その詳細については後述する。
【0062】
電話装置13の通話相手判断部16は、家族情報テーブル17を参照し、ステップS20で抽出した発信者電話番号に対応する家族の家族情報を抽出し(ステップS21)、抽出された家族情報と話者情報とを比較して、通話相手がその家族のうち誰であるかの識別(話者識別)を行う(ステップS22)。
【0063】
通話相手判断部16が通話相手を識別可能であかどうかを判断し(ステップS23)、識別可能である場合には、さらに家族情報テーブル17に転送情報が記憶されているかどうかを判断し(ステップS24)、記憶されている場合には、当該転送情報に従って電話を転送する(ステップS25)。続いて、電話の転送が完了したかどうかを判断し(ステップS26)、完了した場合には、回線の切断処理を行った後(ステップS30)、再び着信待機処理に戻る(ステップS11)。
【0064】
一方、ステップS23において通話相手の識別が不可能な場合、ステップS24において家族情報テーブル17から転送情報が取得できない場合、あるいは、ステップS25において電話の転送処理を行ったものの、一定時間内に転送が完了しない場合には、応答メッセージ出力処理(ステップS27)へと進む。ここで、応答メッセージ生成部18は、家族情報テーブル17を参照して、通話相手に適応した応答メッセージを生成する。生成された応答メッセージは、応答メッセージ出力部19により出力される。尚、ステップS23において通話相手が識別不可能であった場合や、識別されていてもその通話相手に対応した応答メッセージが家族情報テーブル17から取得できない場合には、不特定の通話相手用の応答メッセージが生成され出力されるようになっている(ステップS27)。
【0065】
通話相手が識別できた場合の応答メッセージは、例えば通話相手が日本太郎であるとすると、「日本太郎さんですね。只今留守にしています。」などとなる。また、通話相手が識別できなかった場合の応答メッセージは、「○○(ユーザの苗字等)です。只今留守にしております。発信音の後に、メッセージをお願い致します。」などとなる。これらの音声メッセージは、ユーザが予め記憶させておくことができるものである。
【0066】
応答メッセージの出力後、用件メッセージ記録部20により、通話相手の音声を録音する用件メッセージ記録処理が行われる(ステップS28)。電話装置13は、用件メッセージ記録処理を行っている間、記録が終了したかどうかを判断する(ステップS29)。例えば、通話相手が接続を切ったり、一定時間以上無音状態が継続したり、あるいは1件あたりの記録制限時間を超過した場合には、記録が終了したものと判断する。
【0067】
ステップS29において、用件メッセージ記録処理が終了すると、公衆回線への接続の切断処理が行われる(ステップS30)。回線切断処理後は、再び、ステップS11の着信待機処理に戻り、電話の着信を待つ状態となる。
【0068】
以上が、本実施形態の電話装置13の自動応答モードでの応答処理であるが、着信時刻及び発信者電話番号の記録処理(ステップS19)は、話者情報抽出(ステップS20)が行われた後で、実行されてもよい。すなわち、着信時刻及び発信者電話番号の記録処理と話者情報抽出処理とは、処理の順番が入れ替わってもかまわない。
【0069】
図3は、図2に示した話者情報抽出ステップ(ステップS20)における処理の流れを詳細に示すフローチャートである。この処理では、入力された通話相手の音声から所定の情報を取得することを目的としている。
【0070】
図3において、本実施形態の電話装置13は、まず、話者情報の抽出を試行回数を示すパラメータである応答要求カウントcの値を初期化する(ステップS41)。次に、通話相手の音声が取得できるかどうか、すなわち、音声入力部14に音声信号が入力されているかどうかを判断し(ステップS42)、音声信号が入力されている場合には、音声の取得を行い(ステップS43)、その音声信号から音声特徴量の抽出を行って処理を終了する(ステップS44)。
【0071】
一方、ステップS42において音声信号が入力されていない場合には、応答要求を行うとともに応答要求カウントcを加算する(ステップS45)。その後、応答要求カウントcが所定の値をオーバーしているかどうか判定し(ステップS46)、オーバーしていない場合には、再びステップS42に戻り、音声信号が入力されているかどうかを判定する。ステップS46において、応答要求カウントcが所定の値をオーバーしている場合には、音声特徴量不可と判断して処理を終了する(ステップS47)。
【0072】
ここで、ステップS45における応答要求とは、例えば、「もしもし」や、「はい、○○(ユーザの苗字等)です」など、通常電話通信に用いられる言葉を自動音声などにより通話相手に対して発する動作のことである。上記の「もしもし」という言葉は、電話通信に固有のキーワードであり、一般的に回線が接続された後に、通話者間で互いに通話開始を行うための合図となるものである。また、同時に、通話相手の返答や発話を要求するものでもあるため、自動的に自然な応答を行いつつ、通話相手からの音声入力を促すことができる。
【0073】
また、ステップS45における音声特徴量とは、通話者ごとに異なる音声の特徴を示す情報であり、例えば、音声波形に含まれるピッチ情報を利用することができる。このピッチ情報は話者の音声特徴をおおまかにあらわすものであり、不特定多数の話者の中から各個人を識別するには不十分な情報ではあるが、話者が成人男性であるか、成人女性であるか、あるいは子供であるかという程度の識別には有用な情報となる。
【0074】
ここで、音声信号に含まれるピッチ情報を音声特徴量として用いる方法について説明する。ピッチとは声の高さのことで、声帯の振動周期で決定され、声帯の振動周期が短いと声の高さは高くなり、振動周期が長いと声の高さは低くなるという特性を持つ。これまでの代表的なピッチ抽出法は、音声信号の波形処理、相関処理、スペクトル処理に大別され、このうちの相関処理は、音声のディジタル信号処理において最も広く用いられている。このような音声信号からのピッチ情報の抽出法としては、例えば、「音声のディジタル信号処理(上)」(L.R.Rabiner,R.W.Schafer; 鈴木久喜訳、コロナ社)に記載されている自己相関関数を用いたピッチ周期の推定方法(PP.158)を使用することができる。もちろん、本発明の電話装置においては、ピッチ情報の抽出法は上記に限定されるものではなく、他の知られた方法を利用することもできる。
【0075】
ところで、このような従来技術によるピッチ情報の推定手法を利用しても、不特定話者が発する不特定な音声信号から、安定してピッチ情報を推定することは難しい。例えば、語頭や語尾では声帯振動が完全な周期性を持たないため、ピッチ情報の抽出が難しくなる。また、母音・有声音については定常的に音声信号が入力されるので比較安定してピッチ情報を推定できるのに対して、声帯を振動させずに発声する無声音からは、安定してピッチ情報を推定することが困難である。
【0076】
ただし、特定話者の単語の発声において、単語のモーラ位置、モーラ数が決まればピッチ周波数を、比較的精度良く推定できることが知られている。単一話者が発声した5モーラ語2800件のピッチ周波数平均値と分散を解析した結果からは、ピッチ周波数の分散は非常に小さく、ピッチ周波数は単語に関係なく単語のモーラ数、モーラ位置で表現することが可能であるという研究事例も発表されている。
【0077】
そこで、本発明では、自動応答機能を活用し、電話通信に用いられる特定のキーワードを対象とすることにより、ピッチ情報を安定して精度良く抽出することが可能となっている。例えば、特定キーワードとして、「もしもし」、「こんにちは」、「こんばんは」などの挨拶語があげられる。
【0078】
図15は、成人男子、成人女子及び子供のそれぞれが「もしもし」というキーワードを発声したときのピッチ情報の分布を示す図である。図中、「もしもし」というキーワードを「も」、「し」、「も」、「し」という4つの音素に分割して、それぞれのピッチの軌跡を示している。このように、あらかじめキーワードが分かっている場合には、入力された音声を音素に分割するのが容易となる。図15では、成人男子、成人女子及び子供の各ピッチの軌跡から、それぞれを明確に識別できることが分かる。
【0079】
図4は、図2に示した家族情報抽出ステップ(ステップS21)における処理の流れを詳細に示すフローチャートである。この処理では、話者情報抽出ステップ(ステップS20)において取得した話者情報に基づいて、関連する家族情報を家族情報テーブル17から取得することを目的としている。
【0080】
図4において、本実施形態の電話装置13は、まず、発信者電話番号が通知されているかどうかを判断する(ステップS61)。発信者電話番号が通知されていない場合には、通話相手を不特定話者と判断し、家族情報テーブル17において不特定話者に対応する情報を取得する(ステップS65)。
【0081】
一方、ステップS61において発信者電話番号が通知されている場合には、その番号を着信番号として取得し(ステップS62)、家族情報テーブル17を参照してその着信番号に対応する家族の家族情報が記録されているかどうかをチェックする(ステップS63)。ここで、該当する家族情報が記録されていない場合には、通話相手を不特定話者と判断し、不特定話者情報の取得を行う(ステップS65)。家族情報テーブル17において該当する家族情報が記録されている場合には、その家族情報を取得する(ステップS64)。
【0082】
図5は、家族情報テーブル17のテーブル構造を概念的に示す図である。
図5に示す家族情報テーブル17は、通話相手の電話番号、それに対応する家族の家族情報及び記録された1以上の用件メッセージを含んだ通話相手別レコードを複数有している。家族情報テーブル17は、また、通話相手の電話番号なしという情報、それに対応する不特定話者情報及び記録された1以上の用件メッセージを含んだ不特定話者情報レコードを有している。
【0083】
尚、通話相手別レコードの電話番号と、それに対応する家族情報とは、ユーザが予め設定しておくものとする。例えば、電話番号010−000−0001番のレコードを作成し、その電話番号に対応する家族の家族情報を、各構成員ごとに登録しておく。また、通話相手別レコードに含まれる電話番号からの着信により残された用件メッセージは、当該電話番号を含んだレコードに用件メッセージとして追加され記憶される。
【0084】
図6は、家族情報テーブル17に記憶されている家族情報の構成要素について詳細に示す図である。
図6において、家族情報は、氏名、続柄、呼称、年齢、年代、生年月日、年号、性別、通話時間帯、通話形態切り替え時間、個人特性情報、転送情報及び応答メッセージという構成要素を含んでいる。また、当該家族の各構成員ごとに、これらの構成要素が記憶されているものとする。
【0085】
氏名は、当該家族の構成員の氏名であり、続柄は、当該構成員の家族における続柄、例えば、「父」などを示すものである。また、呼称は、「おとうさん」などような続柄に対応した呼び名を示すものである。この続柄及び呼称は、用件メッセージを検索する時の検索キーして使用できる。
【0086】
年齢は、当該家族の構成員の年齢を示し、年代は、おおよその年齢を示し、生年月日は、生まれた日時を示すものである。年号は、「昭和」、「平成」等生まれた年の年号を示しており、年代よりもさらにおおまかな世代を示すものである。これらの年齢・年代・世代に関する情報は、通話相手の識別を行う際に、年齢によるピッチ情報の補正を行うために使用される。
【0087】
性別は、当該家族の構成員が男性もしくは女性であることを示し、通話時間帯は、当該構成員がよく電話をかけてくる時間帯を示すものである。この通話時間帯の情報は、音声信号の特徴だけから識別できない場合に、各構成員の識別情報として使用することができる。通話切り替え時間は、着信時間に応じて、自動応答モードで対応したり、呼び出し音を鳴らしたりという切り替えを行うための時間情報である。例えば、深夜〜早朝にかけての時間帯には、その通話相手からの着信には自動応答モードで対応するように設定することができる。
【0088】
個人特性情報は、当該家族の構成員の音声特徴を示すものであり、例えば、ピッチ情報、フォルマント情報、もしくは音声信号そのものを情報として含んでいる。この個人特性情報は、例えば、当該構成員が録音した用件メッセージから、ピッチ情報、フォルマント情報もしくは音声信号そのものを取得して記憶することができる。
【0089】
転送情報は、当該家族の構成員から着信があった場合に、無条件で電話を転送する先を示すものであり、通常は電話番号が指定されるが、メールアドレスでもよい。応答メッセージは、当該家族の構成員に対応した応答メッセージである。例えば、通話相手の氏名が日本太郎である場合には、「日本太郎さんですね。只今留守にしていいます。」という応答メッセージを記憶しておくことができる。
尚、家族情報テーブル17の家族情報には、必ずしも上記すべての構成要素を記憶する必要はなく、いずれか1つ以上の組み合わせとして記憶しておけばよい。
【0090】
図7は、図6に示す家族情報テーブル17の家族情報の具体例を示す図である。この例では、電話番号010−000−001に対応する家族は3名の構成員からなり、各構成員の家族情報が記憶されている。
【0091】
1人目として、日本太郎(氏名)、父(続柄)、おとうさん(呼称)、年齢45歳、年代40歳代、生年月日は1957年1月1日、年号は昭和、性別は男性、通話時間帯は18:00−24:00、通話形態切り替え時間は24:00−6:00、個人特性情報はなし、転送情報は090−000−0001、応答メッセージ「日本太郎さんですね。只今留守にしています。」という家族情報が記憶されている。
【0092】
2人目として、日本花子(氏名)、母(続柄)、お母さん(呼称)、年齢42歳、年代40歳代、生年月日1959年1月1日、年号は昭和、性別は女性、通話時間帯は6:00−18:00、通話切り替え時間は24:00−6:00、個人特性情報はなし、転送情報は090−000−0002、応答メッセージ「花子さんですね。今は留守よ。」という家族情報が記憶されている。
【0093】
3人目として、日本洋子(氏名)、続柄はなし、ようちゃん(呼称)、年齢12歳、年代10代、生年月日1989年1月1日、年号は平成、性別は女性、通話時間帯は16:00−22:00、通話切り替え時間は24:00−6:00、個人特性情報はなし、転送情報はなし、応答メッセージ「ようちゃん?今、留守なの。」という家族情報が記憶されている。
【0094】
次に、家族情報テーブル17に記憶されている用件メッセージについて説明する。図8は、図5に示す家族情報テーブル17において、特定の電話番号に関連付けられて記憶されている用件メッセージの具体例を示す図である。
【0095】
図8において、3件の用件メッセージが発信者電話番号010−000−0001に関連付けられて記憶されている。用件メッセージ番号001には、通話相手が日本太郎、着信時間が13:00.00で、「あとでまたかけます。」という用件メッセージが記憶されている。用件メッセージ番号002には、通話相手が日本花子、着信時間が16:00.00で、「あとで、電話ください。」という用件メッセージが記憶されている。用件メッセージ番号003には、通話相手が日本洋子、着信時間が21:00.00で、「あとで電話ちょうだい」という用件メッセージが記憶されている。尚、用件メッセージは、各通話相手が話した音声を磁気テープやICメモリに記憶したものであるから、実際には、図8に示すテーブルには、これらの記憶装置内の各用件メッセージの記憶位置を示す情報(アドレスやポインタ)を記憶しておき、用件メッセージをいつでも参照することができるようになっている。
【0096】
一方、上述したように、発信者電話番号が通知されなかった場合、通知された電話番号に該当する家族の家族情報が記憶されていなかった場合、あるいは、通話相手が識別できなかった場合において、通話相手が残した用件メッセージは、図5に示す家族情報テーブル17において、電話番号情報及び家族情報を持たない不特定話者情報として記憶されることになる。
【0097】
図9は、図5に示す不特定話者情報の構成要素を概念的に示す図である。図9において、不特定話者は、転送情報及び応答メッセージを構成要素として含んでいる。これら不特定話者情報の各構成要素の具体例を図10に例示する。
【0098】
図10において、通話相手が不特定話者である場合には、その電話を090−000−0001番に転送するように設定されており(転送情報)、また、通話相手が不特定話者である場合の応答メッセージとして、「只今留守にしております。御用の方は発信音の後にメッセージをお願いします。」というメッセージが記憶されている。このような場合、本実施形態の電話装置13では、不特定話者からの電話の転送と自動応答のいずれかを優先して行うように設定しておくことができる。
【0099】
上記したように、不特定話者からの電話に対して自動応答を行った場合には、続いて用件メッセージの記憶を行うことになる。図11は、図5に示す家族情報テーブル17において、不特定話者からのものとして記憶されている用件メッセージの具体例を示す図である。
【0100】
図11において、用件メッセージ番号004には、発信者電話番号が010−0000−0980、着信時間が13:00.00で、「○○ですが、またあとで電話します。」という用件メッセージが記憶されている。尚、図8に示す例と同様に、実際には、記憶装置内の各用件メッセージの記憶位置を示す情報を記憶しておき、用件メッセージをいつでも参照することができるようになっている。
【0101】
図12は、図2に示した話者識別ステップ(ステップS22)における処理の流れを詳細に示すフローチャートである。この処理では、発信者電話番号に基づき抽出された家族情報と、話者情報(通話相手の音声や、発信者電話番号、着信時刻など)とを比較して、通話相手が当該家族の構成員の誰であるかを識別することを目的としている。
【0102】
図12において、本実施形態の電話装置13は、まず、通話相手が不特定話者かどうかをチェックする(ステップS81)。通話相手が不特定話者かどうかは、図2の話者情報抽出処理(ステップS20)において既に判断されている。不特定話者からの着信である場合には、話者識別不可能と判断し(ステップS93)処理を終了する。
【0103】
ステップS81において通話相手が不特定話者でない場合には、通知された発信者電話番号に基づき、家族情報テーブル17から年齢情報を取得できるかどうかチェックする(ステップS82)。年齢情報が取得されたら、年齢による確率密度分布の補正処理を行う(ステップS83)。年齢情報が取得されなければこの補正処理は行わない。その後、通話相手の音声信号に含まれるピッチ情報に基づいて、通話相手が成人男性、成人女性又は子供のいずれであるかの確率密度の計算を行う(ステップS84)。
【0104】
続いて、家族情報テーブル17から個人特性情報が取得できるかどうかをチェックする(ステップS85)。ここで、個人特性情報とは、例えば音声信号に含まれるフォルマント情報などである。個人特性情報が取得されたら、通話相手の音声信号を用いて個人特性情報の尤度計算を行う(ステップS86)。個人特性情報が取得できない場合には、個人特性尤度の設定を行う(ステップS87)。この場合、例えば、この個人特性尤度に係数として1を設定する。
【0105】
続いて、家族情報テーブル17から通話時間帯情報が取得できるかどうかをチェックする(ステップS88)。通話時間帯情報が取得できたら、通話時間帯による重み係数の計算を行う(ステップS89)。取得できていなければ、通話時間帯による重み係数の設定を行う(ステップS90)。この場合、例えば、この通話時間帯重み係数には1を設定する。
最後に、各話者ごとの尤度計算を行った後(ステップS91)、計算されたそれぞれの尤度を用いて、最適話者の決定を行う(ステップS92)。
【0106】
ここで、成人男性、成人女性及び子供のそれぞれの音響的特長について説明する。
音声信号に含まれるピッチ情報では、年齢・性別によって発声器官の形状が異なるため、例えば一般には、成人男性と成人女性を比べると、声道の長さは女性の方が約20%ほど短く、成人と子供(10歳ぐらい)では、子供の方が約20%ほど短いと一般に言われている。また、硬口蓋の長さは成人と子供(10歳)を比べると子供の方が約10%ほど短いとされ、声道の調整のしかたも、成人と子供では多少異なるとされている。
【0107】
例えば、「あ」という母音に関しては、一般に成人は咽頭部のほぼ中央を狭めて発声するが、子供は少し口腔よりを狭める。このような発声器官、調音の違いにより、音声のスペクトル、声の高さや大きさなどが異なってくるという現象を伴う。言い換えれば、このような現象を利用することで、ピッチ情報により成人男性、成人女性及び子供の声を識別することが可能であるといえる。
【0108】
成人男性、成人女性及び子供の声の物理的特徴量の違いについては、特に1960〜70年代に盛んに検討されている。例えば、「年齢、性別による日本語5母音のピッチ周波数とフォルマント周波数の変化」、粕谷他、音響学会誌24、1968−5、「男女声の性質情報を決める要素」、佐藤、通研実報24、1975−5、「ディジタル音声処理(第2章)」、古井、東海大学出版会などの文献を参照することができる。
【0109】
これらの研究により、基本周波数、フォルマント、音圧レベルの3つの物理的特徴量に注目し、分析的に調べた結果、以下に示すように、この3つの物理的特徴量の年齢・性別による違いについて重要な知見が得られている。
【0110】
基本周波数に関しては、成人男性及び成人女性については、基本周波数の分布は対数周波数軸上で正規分布となり、男性の基本周波数の平均値と標準偏差はそれぞれ125Hz前後及び20.5Hz前後であり、女性ではそれぞれ男性の約2倍に等しいことが分かった。また、12歳以下(変声期前)の子供については、男女間の差はほとんどないことが分かった。そもそも、基本周波数は声帯長と関係があり、成人男性と子供の識別には有効であるが、成人女性と子供の識別は難しく、それだけで年齢を知ることはできない。
【0111】
しかし、日本語に関して、高次のフォルマント(特に第3フォルマント)は、母音の種類によって変動することが少なく、声道の長さに対応して、男女性別の識別に有効な特徴であるとされている。
【0112】
すなわち、音声信号に含まれるピッチ情報により、成人男性と子供、成人男性と成人女性の識別が可能であるが、成人女性と子供の識別を正確に行うには、例えば、フォルマント情報など、さらに他の情報が必要である。
【0113】
このような実情に基づき、本発明では、この音声信号に含まれるピッチ情報による識別に加え、フォルマント情報に代表される個人特性情報の利用、通話時間帯情報により識別を行うことを特徴としている。
【0114】
次に、年齢の変化による音声のピッチ情報の変動について説明する。
出生時、産声は男女別も各国の差もない万国共通の高さであると言われている。その高さは約440ヘルツと言われる。生後1〜2か月、すなわち、生後5週間を過ぎる頃から、快い感じのときにはやわらかい声、不快なときにはかたい声で泣くとされ、初期の喃語期のはじめの頃と重なり、声の高さは少し下がって、200〜300Hz程度となる。この時の音域は1オクターブ半程度とされる。
【0115】
幼児期、すわなち、歩き始める頃から、だんだん自分の意識で調整出来るようになってくる。3歳児程度だと、生理的声域が200〜440Hzぐらいの1オクターブくらいだとされる。5歳児程度になると、220〜1046Hzぐらいになる。
【0116】
学童期、すなわち、小学校に入学する前後になると、子供の声は一応完成すると言われている。 その時の生理的な音域は349〜1396Hzぐらいまでの2オクターブ程度になる。学童期から次の変声期に至るまでには、年齢に応じて少しずつ声域は変化してくが、個人差も関係する。
【0117】
変声期は、第2次性徴のホルモンによって起こり、発声器官の形の変化がおもな原因で、変声をもたらすと言われている。男性だと小学5〜6年生頃、女性だと男性より半年〜1年早いと言われる。変声が終わるまでの期間は個人差があり、3ヶ月〜1年くらいの期間がある。また、変声の時期は、気候風土や人種によっても違い、暖かい地方のほうが寒い地方より早く、文化程度の高い地方ほど早めの傾向にあるという報告もなされている。
【0118】
発声器官の形の変化は、咽頭が前後・左右・上下などが違った割合で大きくなり、声帯を包む周囲の骨格が発育することで形成される。特に、男性の場合は、咽頭が前後に大きくなるので喉ぼとけの突起が前に出てくる。女性の場合は、前後や左右の変化が少なく、喉ぼとけが出てこない。声帯も、長さ、厚さ、幅などが大きくなるが、男性は長さの変化が著しく、前後に長くなる。女性は男性ほど目立った変化はない。
【0119】
この発声器官の形の変化により、男性の話し声は1オクターブくらい落ち、声が低くなる。女性は、声の高低の変化はあまり大きくなく、話し声が少し低くなるほか、声域も少々上下に広がる程度で、中には変わらない人もいる。
【0120】
変声期が終わっても、すぐ完全な成人の声になるわけではなく、20代のうちは喉頭の発育は少しずつ進んでいて、形状が変化している。軟骨が固まってくるのが24〜25歳程度で、声域はこの辺りでだいたい決まってくるとされる。生理的声域は約3オクターブまで広がる。日本人成人の平均的な声域は、男性が、137〜1046Hz程度、女性は、261〜1568Hz程度とされる。もちろん、個人差もある。
【0121】
女性には、40代〜50歳ぐらいに訪れる第2変声期があり、更年期に女性ホルモンが少なくなることで、男性のような声に変わっていくと言われている。そして、更年期が過ぎ、さらに老化が進むと、今度は男性の声が女性に近づいていく。これは、骨格や筋肉が萎縮してくるのにつれて、喉頭も萎縮して小さくなり、声帯もやや萎縮して短くなるために、声が高くなるとされる。加えて、共鳴腔も狭くなり、軟骨も骨化して、音色もつやのない声になっていく。70歳、80歳とさらに老化が進むと、呼気気流の力が落ち、音声が弱くなったり、喉頭粘膜や共鳴腔が乾燥したり、 弾力性がなくなってくるため、つやのない声、さびた声になっていく。また、声帯もさらに萎縮し、かたくなるので、高い声になる。特に男性の場合、はっきりとした変化が認められる。そして、声の男性の女性化、女性の男性化が進んで、ついに同じような声になっていくと言われている。
【0122】
図13は、このような成人男性、成人女性及び子供の音響的分布状態、及び声の経年変化を示す図である。成人男性、成人女性及び子供それぞれの声の分布状態を確率密度(probability density function、図中「PDF」と記している)として表してある。また、図の上部には、男性及び女性それぞれの声が、出生声・子供時代から、年齢を経るにつれて変化する方向性を矢印で示している。すなわち、女性の子供時代は、男性の子供時代と同様に440Hz前後から始まるが、年齢が進むにつれ、下がり段々低くなっていく。また、男性は、年齢が進むとともに、低くなり、変声期で一段と低くなる。しかし、さらに年齢が進むと、高くなり、ついには、女性と同じような声の高さになっていく。
【0123】
図13では、成人男性の平均ピッチ及びその分散を140Hz及び20Hzとし、成人女性の平均ピッチ及びその分散を250Hz及び33Hzとし、子供の平均ピッチ及びその分散を350Hz及び50Hzとしており、それぞれ正規分布により近似したものを示している。これらの分布は、確率密度分布であるため、それぞれの密度の合計、すなわち累積確率密度は1となる。そのため、各分布は、分散の度合いにより高さが異なっている。
【0124】
このような経年変化による声のピッチの変化を考慮しない場合、成人男性、成人女性及び子供それぞれの確率密度が、実際の声の分布とずれることになるため、最終的に推定する識別率が信頼度の低いものとなる。本発明では、上記したように、図12のステップS83でこの補正を行っている。更に、フォルマント情報などの個人特性情報や、通話時間帯情報が家族情報テーブルに記載されている場合、高い信頼度で、通話相手を識別することが可能になる。例えば、同じ成人男性でも、70歳代の男性と40歳代の男性では、分布の中心となるピッチ周波数が異なるため、そのピッチ中心周波数に合わせて分布の中心位置を補正することにより、通話相手の識別精度を向上させることができる。
【0125】
図12に示す話者識別処理(ステップS22)おける各計算処理方法について、具体例をあげて説明する。以下に示す例では、ベイズの定理を応用し、統計的な枠組みで計算をおこなう。
【0126】
今、明日の天気を知りたいとする。何の事前情報がない時に、明日の天気は晴れか、曇りか、雨かという問いには、いずれも等しい確率で起こり得ると答えるのが自然である。つまり、どうなるか不明ということになる。しかし、近くに猫がいるとする。その猫が顔をなめているとしたら、明日の天気は晴れだろうと高い確率で予想できる。これは、明日の状態は全く不明であるが、猫が顔をなめていると翌日晴れることが多いという事前情報に基づき、明日は晴れる確率が高そうだと予想したためである。
【0127】
この考えを、本発明における話者識別処理に応用することができる。上記したように、電話通信において、通話相手の音声のみから判断すれば、成人男性、成人女性又は子供という大まかな識別しかできない。ところが、通話相手から通知された電話番号から通話相手の家族情報が特定できるならば、通話相手の音声に関する情報と家族情報とから、通話相手個人がその家族のうち誰であるかを高い精度で推定することができる。ここでは、発信者電話番号から得られる家族情報が事前情報となり、通話時の相手の音声情報が事後情報となる。これらの情報に加え、通話相手の音声から得られるピッチ以外の情報(個人特性情報など)や、通話相手がよく電話をかけてくる時間帯などを考慮に加えることにより、更に高い精度で通話相手個人の識別が可能となる。
【0128】
今、事象系Aを通話相手の音声情報とする。また、事象系Bを通話相手の電話番号から得られる家族情報とする。例えば、家族が父、母、姉、弟の構成員から構成されるとき、
A = [ 成人男性の音声情報、成人女性の音声情報、子供の音声情報 ],
B = [ 父、母、姉、弟 ]
とする。なお、それぞれの事象系A、Bのそれぞれの要素について、a = 成人男性、a = 成人女性、a = 子供、b = 父、b = 母、b = 姉、b = 弟とする。
【0129】
通話相手個人の識別は、通話相手の電話番号から得られる家族情報(事前確率)と、通話時に通話相手が発するの「もしもし」等の声から得られる音声情報(事後確率)とを用いて行うことができる。言い変えれば、通話相手個人の識別とは、事象系Aを観測して、もっともらしい事象系Bを推定することであるとすることができる。すなわち、
P (B|A) = P (b|a
を最大化する事象系Bを見つける問題とみなすことができる。ここで、上式は、
【0130】
【数1】
Figure 2005005899
と変形できる。ここで、P(A) は音声情報そのものの生起確率であるので、家族情報には依存しない。よって、通話相手個人を識別するためには、上式の分子であるP (A|B) P(B) を最大化する事象系Bを求めればよいことになる。P (A|B) は、通話相手が家族のうちの誰かであるかということが分かっている場合の音声情報のもっともらしさである(男性の場合、男性らしい音声情報をもつ度合いとなる)。
【0131】
今、通話相手の着信番号から事象系Bに示す家族情報が得られたとする。また、通話相手の音声のピッチ情報として、140Hzという値が得られたとする。このとき、ピッチ情報と図13の確率密度分布を用いて算出される事象系Aの確率P (A|B) は、それぞれ、
P (a|b) = P (’成人男性’|’父’) = 0.02
P (a|b) = P (’成人女性’|’父’) = 0.0001
P (a|b) = P (’子供’|’姉’) = 0.00
P (a|b) = P (’子供’|’弟’) = 0.00
となる。
【0132】
音声のピッチ情報が140Hzということから、通話相手が成人男性である確率P (a|b) は0.02程度であり最も高く、成人女性である確率P (a|b) は0.0001程度である。また、通話相手が子供、すなわち、姉や弟である確率は、ともに0に近い値となっている。
【0133】
上記の例では、P (A|B) のみから、通話相手が’父’であると識別できる。しかしながら、もしこの家族に’祖父’も含まれていた場合には、P (A|B) のみからでは、’父’及び’祖父’ともに等しい確率であると予想され、両者間での識別が不可能もしくは困難となる。このような場合には、着信時刻をもとに、家族情報テーブルに記憶された各個人の通話時間帯情報を参照することで、識別率の向上を図ることができる。これは、P(B) の値に注目することに相当する。
【0134】
例えば、祖父は昼に電話をかけてくることが多いが、夜に電話をかけてくることはめったにはなく、一方で、父は昼に電話かけてくることはほとんどないが、夜には電話をかけてくることがあるという場合には、電話の着信時間に注目することで、両者間を識別することが可能である。以上のような推定を行うには、以下のような計算を行うことになる。
【0135】
【数2】
Figure 2005005899
【0136】
ここで、P (a|b) は、通話相手の電話番号に対応した家族情報から得られる、家族の各構成員の音声情報のもっともらしさの確率を示している(もっともらしさとは、通話相手の音声信号から得られるピッチ情報がぞれぞれの家族の声にどの程度適合しているかという度合いをいうものとする)。このP (a|b) の計算は、図12における確率密度の計算処理(ステップS84)に相当するものである。
【0137】
また、P(α) は、家族の各構成員が電話をよくかけてくる通話時間帯と着信時刻とから求められる正規分布の確率密度関数である。通話時間帯の中間点を頂点とする正規分布の確率密度関数であり、その通話時間帯内の中央では最も確率が高く、通話時間帯をはずれるほど確率が低くなる。このP(α) の計算は、図12における通話時間帯重み係数の計算処理(ステップS89)に相当するものである。
【0138】
図14は、通話時間帯の確率密度分布の例を示す図である。図中、3〜7時の間及び10〜24時の間が通話時間帯として設定されている。ここで、通話時間帯の分布の幅が狭い3〜7時の間では、最大確率は高くなっており、限られた時間に着信があることを示している。一方、通話時間帯の分布の幅が広い10〜24時の間では、最大確率は短い時間帯に比べて低くなっており、限られた時間ではなく、おおよそこのあたりに着信が多いということを示している。
【0139】
また、上式中、
【数3】
Figure 2005005899
のF は、家族情報テーブル17内に記憶されている、家族のi番目の構成要員のk番目の個人特性情報である。さらに、
【0140】
【数4】
Figure 2005005899
は、通話相手の音声信号から得られるk番目の個人特性情報である。具体的には、フォルマント情報などが例としてあげられる。家族のi番目の構成員のk番目の個人特性情報と、通話相手の音声信号から得られるk番目の個人特性情報との差の自乗和をとることにより、個人特性情報の尤度を得ることができる。すなわち、この計算が、図12における個人特性情報の尤度計算処理(ステップS86)に相当することになる。また、εは、個人特性情報の尤度が0の場合に、計算が不可能にならないようにするための定数であり、例えば、ε = 1 としておくことができる。
【0141】
このようにして、P (B|A) に最も大きい値を与えるパラメータiを算出することにより、家族のi番目の構成員が通話相手として識別されるようになっている。
【0142】
以上、本発明の自動応答機能を備えた電話装置について、具体的な実施の形態を示して説明したが、本発明はこれらに限定されるものではない。当業者であれば、本発明の要旨を逸脱しない範囲内において、上記各実施形態又は他の実施形態にかかる発明の構成及び機能に様々な変更・改良を加えることが可能である。
【0143】
【発明の効果】
以上、説明したように、本発明によれば、発信者電話番号表示サービスに対応した自動応答機能付き電話装置(留守番電話)において、通知された発信者電話番号による識別を行うのみならず、その通話相手を、その家族の各構成員単位で識別し、それぞれに対応した自動応答(応答メッセージの出力、録音メッセージの記録、電話の転送など)を行うことができるような電話装置を提供する。
【0144】
また、これまでの留守番電話等における自動応答機能は、単に、留守であることを告げた後、通話相手のメッセージを録音するのみであり、通話相手にとって利便性が低く必ずしもメッセージが残されなかったが、本発明の自動応答機能によれば、通話相手個人に応じた、きめの細かい自動応答を行うことができるようになる。
【0145】
さらに、通話相手が残した用件メッセージの音声情報を用いて、個人特性情報を記憶しておくことにより、次第に通話相手の識別精度を向上させることが可能であり、これにより、例えば、「娘と母親」、「父親と息子」を区別することも可能になる。
【図面の簡単な説明】
【図1】本発明の自動応答機能を備えた電話装置の一実施形態について、その構成及び通話態様を概略的に示す図である。
【図2】図1に示す本実施形態の電話装置13の自動応答モードでの動作を示すフローチャートである。
【図3】図2に示した話者情報抽出ステップ(ステップS20)における処理の流れを詳細に示すフローチャートである。
【図4】図2に示した家族情報抽出ステップ(ステップS21)における処理の流れを詳細に示すフローチャートである。
【図5】図1に示す本実施形態の電話装置13の家族情報テーブル17のテーブル構造を概念的に示す図である。
【図6】家族情報テーブル17に記憶されている家族情報の構成要素について詳細に示す図である。
【図7】図6に示す家族情報テーブル17の家族情報の具体例を示す図である。
【図8】図5に示す家族情報テーブル17において、特定の電話番号に関連付けられて記憶されている用件メッセージの具体例を示す図である。
【図9】図5に示す不特定話者情報の構成要素を概念的に示す図である。
【図10】図9に示す不特定話者情報の各構成要素の具体例を示す図である。
【図11】図5に示す家族情報テーブル17において、不特定話者からのものとして記憶されている用件メッセージの具体例を示す図である。
【図12】図2に示した話者識別ステップ(ステップS22)における処理の流れを詳細に示すフローチャートである。
【図13】成人男性、成人女性及び子供の音響的分布状態、及び声の経年変化を示す図である。
【図14】通話時間帯の確率密度分布の例を示す図である。
【図15】成人男子、成人女子及び子供のそれぞれが「もしもし」というキーワードを発声したときのピッチ情報の分布を示す図である。
【図16】従来の留守番電話装置の構成及び通話態様を概略的に示す図である。
【図17】このような構成を有する従来の留守番電話装置103の留守番モードでの動作を示すフローチャートである。
【符号の説明】
11 電話装置
12 公衆回線網
13 電話装置
14 音声入力部
15 着信時刻記録部
16 通話相手判断部
17 家族情報テーブル
18 応答メッセージ生成部
19 応答メッセージ出力部
20 用件メッセージ記録部
21 電話転送部
101 電話装置
102 公衆回線網
103 留守番電話装置
104 音声入力部
105 着信時刻記録部
106 応答メッセージ出力部
107 用件メッセージ記録部

Claims (16)

  1. 通話相手の電話番号と通話相手の家族情報とを関連付けて記憶した家族情報テーブルと、
    電話を着信した時に発信者の電話番号を取得する電話番号取得手段と、
    通話相手の音声を取得する音声取得手段と、を備えており、
    前記家族情報テーブルを参照して、前記発信者の電話番号と、前記通話相手の音声とから、通話相手個人を識別する電話装置。
  2. 通話相手の電話番号と通話相手の家族情報とを関連付けて記憶した家族情報テーブルと、
    電話を着信した時に発信者の電話番号を取得する電話番号取得手段と、
    通話相手の音声を取得する音声取得手段と、
    前記家族情報テーブルを参照して、前記発信者の電話番号と、前記通話相手の音声とから、通話相手個人を識別する通話相手識別手段と、
    前記通話相手識別手段により識別された通話相手個人に対応した応答を行う自動応答手段と、を備えた電話装置。
  3. 電話を着信した時刻を記憶する着信時刻記憶手段をさらに備えており、
    前記通話相手識別手段は、前記家族情報テーブルを参照して、前記発信者の電話番号と、前記通話相手の音声と、前記着信時刻とから、通話相手個人を識別することを特徴とする請求項2に記載の電話装置。
  4. 前記家族情報テーブルは、通話相手の家族情報として、家族の各構成員ごとに、年齢、性別、通話時間帯、個人特性情報、転送情報、応答メッセージのうち少なくとも1つを記憶していることを特徴とする請求項2又は3に記載の電話装置。
  5. 前記通話相手識別手段は、通話相手の音声のピッチ情報に基づいて、通話相手が成人男性、成人女性又は子供のいずれであるかを判断し、通話相手個人を識別することを特徴とする請求項2から4のいずれか1項に記載の電話装置。
  6. 前記通話相手識別手段は、通話相手が特定キーワードを発したときの音声のピッチ情報に基づいて、通話相手が成人男性、成人女性又は子供のいずれであるかを判断し、通話相手個人を識別することを特徴とする請求項2から5のいずれか1項に記載の電話装置。
  7. 前記通話相手識別手段は、さらに、前記家族情報テーブルに記憶されている通話相手家族の各構成員の年齢情報に基づいて、通話相手個人を識別することを特徴とする請求項5又は6に記載の電話装置。
  8. 前記通話相手識別手段は、さらに、前記家族情報テーブルに記憶されている通話相手家族の各構成員の個人特性情報と、通話相手の音声とを比較し、通話相手個人を識別することを特徴とする請求項5から7のいずれか1項に記載の電話装置。
  9. 前記通話相手識別手段は、さらに、前記家族情報テーブルに記憶されている通話相手家族の各構成員の通話時間帯情報と、着信時刻とを比較し、通話相手個人を識別することを特徴とする請求項5から8のいずれか1項に記載の電話装置。
  10. 前記自動応答手段は、通話相手からの用件メッセージを受け取り、前記家族情報テーブルにおいて、前記用件メッセージを通話相手の電話番号に関連付けて記憶させることを特徴とする請求項2から9のいずれか1項に記載の電話装置。
  11. 前記自動応答手段は、前記家族情報テーブルにおいてされている、前記識別された通話相手個人についての転送情報に基づいて、電話を転送することを特徴とする請求項2から10のいずれか1項に記載の電話装置。
  12. 前記自動応答手段は、通話相手から音声が取得されない場合には、通話相手に発話を促すよう音声を発することを特徴とする請求項2から11のいずれか1項に記載の電話装置。
  13. 前記自動応答手段は、家族情報テーブルにおいて発信者の電話番号に関連付けられた家族情報が記憶されていない場合には、通話相手の音声のピッチ情報に基づいて、通話相手が成人男性、成人女性又は子供のいずれであるかを判断し、判断結果に応じた応答を行うことを特徴とする請求項2から12のいずれか1項に記載の電話装置。
  14. 前記自動応答手段は、発信者の電話番号を取得できない場合には、不特定通話相手に対応した応答を行うことを特徴とする請求項2から13のいずれか1項に記載の電話装置。
  15. 通話相手の電話番号と通話相手の家族情報とを関連付けて記憶した家族情報テーブルを備えた電話装置において用いる自動応答プログラムであって、
    電話を着信した時に発信者の電話番号を取得する電話番号取得手段と、
    電話を着信した時刻を記憶する着信時刻記憶手段と、
    通話相手の音声を取得する音声取得手段と、
    前記家族情報テーブルを参照して、前記発信者の電話番号と、前記着信時刻と、
    前記通話相手の音声とから、通話相手個人を識別する通話相手識別手段と、
    前記通話相手識別手段により識別された通話相手個人に対応した応答を行う自動応答手段と、を備えた自動応答プログラム。
  16. 通話相手の電話番号と通話相手の家族情報とを関連付けて記憶した家族情報テーブルを備えた電話装置において用いる自動応答プログラムであって、
    電話を着信した時に発信者の電話番号を取得する電話番号取得手段と、
    電話を着信した時刻を記憶する着信時刻記憶手段と、
    通話相手の音声を取得する音声取得手段と、
    前記家族情報テーブルを参照して、前記発信者の電話番号と、前記着信時刻と、
    前記通話相手の音声とから、通話相手個人を識別する通話相手識別手段と、
    前記通話相手識別手段により識別された通話相手個人に対応した応答を行う自動応答手段と、を備えた自動応答プログラムを記録した記録媒体。
JP2003165601A 2003-06-10 2003-06-10 自動応答機能を備えた電話装置 Pending JP2005005899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003165601A JP2005005899A (ja) 2003-06-10 2003-06-10 自動応答機能を備えた電話装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003165601A JP2005005899A (ja) 2003-06-10 2003-06-10 自動応答機能を備えた電話装置

Publications (1)

Publication Number Publication Date
JP2005005899A true JP2005005899A (ja) 2005-01-06

Family

ID=34092035

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003165601A Pending JP2005005899A (ja) 2003-06-10 2003-06-10 自動応答機能を備えた電話装置

Country Status (1)

Country Link
JP (1) JP2005005899A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010152866A (ja) * 2008-12-23 2010-07-08 Korea Electronics Telecommun 音声及び映像に基づく性別−年齢識別方法及びその装置
WO2017128653A1 (zh) * 2016-01-28 2017-08-03 中兴通讯股份有限公司 一种来电处理方法及装置
KR20210019272A (ko) * 2019-08-12 2021-02-22 에스케이브로드밴드주식회사 음성 기반 추천서비스장치 및 그 장치의 동작 방법
JP2022046500A (ja) * 2018-06-21 2022-03-23 Tradfit株式会社 情報処理装置、情報処理システム、情報処理方法およびプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02294146A (ja) * 1989-05-09 1990-12-05 Ricoh Co Ltd 話者識別付録音再生装置
JPH09312686A (ja) * 1996-05-22 1997-12-02 Sanyo Electric Co Ltd 男女識別による応答方法および装置
JPH11252244A (ja) * 1997-12-23 1999-09-17 Lucent Technol Inc メッセージソースに格納されたメッセージの遠隔的管理が可能な留守番電話装置及びサービス
JP2000089780A (ja) * 1998-09-08 2000-03-31 Seiko Epson Corp 音声認識方法および音声認識装置
JP2001136272A (ja) * 1999-11-02 2001-05-18 Oki Electric Ind Co Ltd 自動応答装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02294146A (ja) * 1989-05-09 1990-12-05 Ricoh Co Ltd 話者識別付録音再生装置
JPH09312686A (ja) * 1996-05-22 1997-12-02 Sanyo Electric Co Ltd 男女識別による応答方法および装置
JPH11252244A (ja) * 1997-12-23 1999-09-17 Lucent Technol Inc メッセージソースに格納されたメッセージの遠隔的管理が可能な留守番電話装置及びサービス
JP2000089780A (ja) * 1998-09-08 2000-03-31 Seiko Epson Corp 音声認識方法および音声認識装置
JP2001136272A (ja) * 1999-11-02 2001-05-18 Oki Electric Ind Co Ltd 自動応答装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010152866A (ja) * 2008-12-23 2010-07-08 Korea Electronics Telecommun 音声及び映像に基づく性別−年齢識別方法及びその装置
WO2017128653A1 (zh) * 2016-01-28 2017-08-03 中兴通讯股份有限公司 一种来电处理方法及装置
CN107018227A (zh) * 2016-01-28 2017-08-04 中兴通讯股份有限公司 来电处理方法及装置
JP2022046500A (ja) * 2018-06-21 2022-03-23 Tradfit株式会社 情報処理装置、情報処理システム、情報処理方法およびプログラム
JP7297326B2 (ja) 2018-06-21 2023-06-26 Tradfit株式会社 情報処理装置、情報処理システム、情報処理方法およびプログラム
KR20210019272A (ko) * 2019-08-12 2021-02-22 에스케이브로드밴드주식회사 음성 기반 추천서비스장치 및 그 장치의 동작 방법
KR102276591B1 (ko) 2019-08-12 2021-07-12 에스케이브로드밴드주식회사 음성 기반 추천서비스장치 및 그 장치의 동작 방법

Similar Documents

Publication Publication Date Title
JP4263614B2 (ja) リモートコントロール装置及び情報端末装置
US9787830B1 (en) Performing speech recognition over a network and using speech recognition results based on determining that a network connection exists
Benkí Analysis of English nonsense syllable recognition in noise
US8447599B2 (en) Methods and apparatus for generating, updating and distributing speech recognition models
TW323364B (ja)
JP7070544B2 (ja) 学習装置、学習方法、音声合成装置、音声合成方法
KR100383353B1 (ko) 음성인식장치및음성인식장치용어휘발생방법
WO2013182118A1 (zh) 一种语音数据的传输方法及装置
CN107909995B (zh) 语音交互方法和装置
WO2019210556A1 (zh) 通话预约方法、坐席请假处理方法、装置、设备及介质
JP4852584B2 (ja) 禁止語発信防止方法、禁止語発信防止電話、禁止語発信防止サーバ
KR20150017662A (ko) 텍스트-음성 변환 방법, 장치 및 저장 매체
JP2005005899A (ja) 自動応答機能を備えた電話装置
JP2012073361A (ja) 音声認識装置及び音声認識方法
US20050239511A1 (en) Speaker identification using a mobile communications device
JP2006230446A (ja) 健康状態推定装置
JP2010237364A (ja) 合成音声判別装置、方法及びプログラム
JP2021078012A (ja) 留守番電話判定装置、方法及びプログラム
JP2020173342A (ja) 猫型会話ロボット
US11582174B1 (en) Messaging content data storage
US20200296784A1 (en) Routing of communications to a device
JP4230982B2 (ja) 通話補助装置、通話補助方法、通話補助プログラムおよび通話補助システム
JP2000312247A (ja) 電話機
WO2007015319A1 (ja) 音声出力装置、音声通信装置および音声出力方法
JP7218312B2 (ja) 情報処理装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070807

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071204