JP2012078384A - 声紋による話者特定機能を有する電話装置 - Google Patents

声紋による話者特定機能を有する電話装置 Download PDF

Info

Publication number
JP2012078384A
JP2012078384A JP2010220618A JP2010220618A JP2012078384A JP 2012078384 A JP2012078384 A JP 2012078384A JP 2010220618 A JP2010220618 A JP 2010220618A JP 2010220618 A JP2010220618 A JP 2010220618A JP 2012078384 A JP2012078384 A JP 2012078384A
Authority
JP
Japan
Prior art keywords
speaker
voice
data
voiceprint
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010220618A
Other languages
English (en)
Inventor
Takashi Saito
隆 齋藤
Yoshihiro Baba
佳宏 馬場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nakayo Telecommunications Inc
Original Assignee
Nakayo Telecommunications Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nakayo Telecommunications Inc filed Critical Nakayo Telecommunications Inc
Priority to JP2010220618A priority Critical patent/JP2012078384A/ja
Publication of JP2012078384A publication Critical patent/JP2012078384A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)
  • Telephone Function (AREA)

Abstract

【課題】
外部から入力する音声信号のうち、特定の言葉に限定された音声信号から声紋データを抽出するようにして、声紋データの比較処理が軽い、声紋による話者特定機能を有する電話装置を提供する。
【解決手段】
話者の声紋データと、話者のプロファイルに係る情報を対応付けて登録する話者データ登録部130と、話者毎の処理内容を登録する話者別処理内容登録部150と、前記プロファイルに係る質問を音声で相手へ質問する音声質問部120と、質問に対する回答音声から相手の声紋データを抽出する声紋データ抽出部140と、前記抽出した声紋データにより相手の話者を特定する話者特定手段とを有し、特定した話者に対応する処理内容を自動的に起動する。
【選択図】 図1

Description

本発明は、ホームテレホンもしくはボタン電話システムの主装置、または構内交換装置(PBX)等に適用可能な、声紋による話者特定機能を有する電話装置に関する。
ボタン電話装置等において、相手を声紋データにより識別して自動応答する留守応答装置に関する技術が知られている(特許文献1)。特許文献1に記載された技術は、声紋データを記憶可能な第1記憶手段と、声紋データに対応する応答メッセージを格納可能な第2記憶手段と、外部から入力された声紋データが第1記憶手段に記憶されている声紋データに一致するか否かを判定する声紋判定手段と、前記声紋判定手段の判定結果に基づいて第2記憶手段内の対応する応答メッセージを選択的に外部出力可能な留守番制御手段とを設け、外部から入力された声紋データが第1記憶手段内の声紋データに一致するか否かを判定し、それに基づいて第2記憶手段内の対応する応答メッセージを外部出力することで、自動応答を達成する。
しかしながら、特許文献1に記載された技術は、外部から入力する音声信号の言葉が特定されていないため、外部から入力する音声信号の全てから声紋データを抽出して、前述の第1記憶手段に記憶されている声紋データと比較して、一致する声紋データの有無を判定する必要があり膨大な処理が必要であった。
特開平10−271204号公報
そこで、本発明の課題は、外部から入力する音声信号のうち、特定の語句の発音に限定された音声信号から声紋データを抽出するようにして、声紋データの比較処理が軽い、声紋による話者特定機能を有する電話装置を提供することにある。
上記課題を解決するために、第1の発明は、1以上の外線または内線を収容する電話装置において、自電話装置を利用する話者の声紋データを登録する声紋データ登録手段と、話者のプロファイルに係る情報を前記声紋データ登録手段に登録された声紋データと対応付けて登録するプロファイル登録手段と、前記プロファイル登録手段に登録されている話者と対応付けて処理する内容を登録する処理内容登録手段と、前記プロファイル登録手段に登録されているプロファイルに係る質問文を登録する質問文登録手段と、前記質問文登録手段に登録されている質問文のいずれかを話者に音声で質問する音声質問手段と、前記音声質問手段が質問した質問に対して話者が回答する音声信号を受信して前記話者の声紋データを抽出する声紋データ抽出手段と、前記抽出した声紋データと前記声紋データ登録手段に登録されている声紋データを比較して当該声紋データの話者が前記プロファイル登録手段に登録されているいずれかの話者と同一であるか否かを判定して話者を特定する話者特定手段と、を有し、前記話者特定手段が通話中の話者は前記プロファイル登録手段に登録されているいずれかの話者と同一であると判定した場合に、当該話者に対応付けて前記処理内容登録手段に登録されている処理内容を自動的に起動することを特徴とする。
また、第2の発明は、前記第1の発明において、前記音声データ抽出手段が抽出する音声データは、自装置の内線に接続されたインターホン子機から入力する音声データであって、前記処理内容登録手段に登録する処理内容は、自装置の内線に接続された電気錠の開閉に係る処理であることを特徴とする。
本発明によれば、質問に対する回答の語句の発音に限定された音声信号から声紋データを抽出するので、声紋データの比較処理が軽く、声紋による話者特定処理に係るコストを抑えられる。従って、声紋による話者特定機能を有する電話装置の提供価格を抑えることができる。
しかも、限定された語句の発音について声紋データの比較処理を実行するので、一致か否かの精度が高く、さらに、話者に質問する内容は、プロファイル登録手段に登録されている項目に係るランダムな質問なので、認証精度が高く、録音機等を使った成りすましも防止できる。
本装置1のブロック構成図 登録内容の例 本装置1の動作フローチャート
以下、本発明の実施形態として、ホームテレホンに適用した場合について、図面を用いて説明する。
図1は、本発明による電話装置(以下、本装置1と略す)のブロック構成図である。本装置1は、ホームテレホンの親機であって、制御部100、内線対応部101、外線対応部102、話者特定部110、音声質問部120、乱数発生器121、話者データ登録部130、声紋データ抽出部140、話者別処理内容登録部150、話者別処理履歴蓄積部160、話者特定処理起動条件登録部170から構成される。
制御部100は、本装置1の全体を制御する手段であって、内線に接続されたカメラ付インターホン子機2、インターホン親機3、内線電話機4、電気錠5、ネットワーク6との間でデータを中継すると共に、内部の各ブロックのデータ処理を制御する。
内線対応部101は、カメラ付インターホン子機2、インターホン親機3、内線電話機4、電気錠5等が接続される内線とのインタフェースである。外線対応部102は、ネットワーク6に繋がる外線とのインタフェースである。
話者特定部110は、音声質問部120および声紋データ抽出部140を制御して、入力する音声の話者を特定する手段である。音声質問部120は、本装置1に着信して通話状態にある発信元の相手へ話者データ登録部130に登録されている内容に関する質問文を音声で質問する手段である。なお、質問文は複数用意されており、乱数発生器121が生成する乱数によりランダムに選択される。
話者データ登録部130は、本装置1を利用する者の声紋データ、プロファイルデータ(誕生日,趣味,血液型,合言葉等)、質問文を予め登録しておく手段である。この話者データ登録部130に登録される内容の例を図2に示す。詳細は後で説明する。
声紋データ抽出部140は、内線対応部101を介して入力される音声信号から声紋データを抽出する手段である。例えば、カメラ付インターホン子機2からの音声信号から声紋データを抽出する。
話者別処理内容登録部150は、話者(本装置1を利用する者)毎に本装置1が処理すべき内容を登録する手段である。本装置1が処理すべき内容としては、例えば、「電気錠5を開閉する」、「伝言メッセージを残す」、「伝言メッセージを再生する」等である。
話者別処理履歴蓄積部160は、話者特定部110が特定した話者とその話者に応じて話者別処理内容登録部150に登録されている処理が実行された履歴を蓄積しておく手段である。
話者特定処理起動条件登録部170は、話者特定処理を起動する条件を予め登録する手段である。登録する起動条件は、例えば、カメラ付インターホン子機2や特定の内線電話機4から電気錠5の開閉に係る要求コマンドを受信した場合、ネットワーク6経由で着信した呼のうち、本装置1の留守番電話機能の制御や伝言メッセージの再生等のリモート制御(図示せず)に係る要求コマンドを受信した場合等である。
図2は、話者データ登録部130に登録される内容の例であり、本装置1を利用する者の分類201毎に、氏名202の声紋データ203、プロファイルデータ204(誕生日,趣味,血液型,合言葉等)等が登録されている。またプロファイルデータ204に係る質問文も予め登録されている。
図3は本装置1の動作フローチャートである。以下、図1および図2を併用して、本装置1の動作フローを説明する。尚、本フローは本装置1に内線または外線からコマンドもしくは何らかの処理を要求する要求コマンドの着信があった場合にスタートする(S300)。
着信した呼が一般電話着信であった場合(S301、YES)、着信処理/通話等の一般的な電話着信に係る処理を実行し(S302)、終了する(S350)。この電話関連に係る処理は一般的な電話装置と類似なので、その詳細は割愛する。なお、着信した呼が一般電話着信か否かの判定は、例えば、着信信号に一般電話着信ではないことを示す情報(例えば、カメラ付インターホン子機2や内線電話機4からの特定操作コマンド)の有無を検出して判定すればよい。
着信した呼が一般電話着信でない場合(S301、NO)、着信した呼に自動応答して要求コマンドを受信する(S303)。そして、制御部100は話者特定処理起動条件登録部170を参照して、受信した要求コマンドが話者特定を伴うイベントか否かを判定する(S310)。S310でNOであれば、S330へ進む。
受信した要求コマンドが話者特定を伴うイベントであった場合(S310,YES)、制御部100は話者特定部110を起動し、話者特定部110は音声質問部120を起動する。音声質問部120は、話者データ登録部130に登録されている複数の質問文(例えば、図2の質問1〜3)のうち、乱数発生器121が発生した乱数に応じてランダムに選択した質問文(例えば、図2の質問3)を、音声に変換して当該着信の発信元へ送出する(S311)。
質問文送出後、音声質問部120は声紋データ抽出部140を起動し、声紋データ抽出部140は発信元から受話した当該質問に対する回答音声を分析して、発信元の声紋データを抽出する(S312)。そして、話者特定部110は抽出した発信元の声紋データと話者データ登録部130に登録されている当該質問に対する声紋データ(例えば、図2の質問3に対応するデータ□3、□はA〜E)と照合して一致する声紋データが有るか否かを判定する(S320)。
一致する声紋データが有った場合(S320,YES)、話者特定部110は、対応する話者の氏名を制御部100に通知してS322へ進む。一致する声紋データが無い場合または回答音声が無い場合(S320,NO)、要求に対して不許可の旨をコマンドまたは音声で発信元へ通知して(S321)、終了する(S350)。
S322において制御部100はS303で受信した要求コマンドを再度解析して、話者データの変更に係る要求か否かを判定し、話者データの変更に係る要求であった場合(S322,YES)、話者データ登録部130または話者別処理履歴蓄積部160に登録されている該当する話者の関連データを追加または修正または削除に係る処理を実行して(S323)、終了する(S350)。
話者データの変更に係る要求でない場合(S322,NO)、話者別処理内容登録部150を参照して、特定した話者の氏名に対応して登録されている処理内容(例えば、玄関の電気錠5を開く)を実行すると共に、話者別処理履歴蓄積部160にその履歴を残して(S324)、終了する(S350)。
S330で、新規話者データの登録であった場合(S330、YES)、質問項目毎に質問文を提示してそれに対する回答音声を受信し(S331)、回答音声から抽出した声紋データを話者データ登録部130に登録する(S332)。そして、声紋データと対応付けて当該話者が入力するプロファイルデータを話者データ登録部130に、当該話者が指定する処理内容を話者別処理内容登録部150に登録して(S333)、終了する(S350)。
S330でNOの場合は、その他の処理を実行して(S340)、終了する(S350)。なお、その他の処理は、本発明に係らないので説明を割愛するが、例えば、話者の特定および認証を伴わない、カメラ付インターホン子機2とインターホン親機3または内線電話機4との接続処理等である。
ところで、制御部100は話者特定処理起動条件登録部170を参照して、受信した要求コマンドが話者特定を伴うイベントか否かを判定する(S310)と説明したが、これは、本フローが着信時のフローであるためであり、着信以外のイベントで話者特定を伴う処理を実行してもよい。例えば、内線電話機4で外線通話をしている最中に、通話中の相手を確認するために、手動で話者特定部110を起動して(例えば、##0とキー操作)、S311〜S320に相当する処理を実行してもよい。この際、S311に相当する処理を内線電話機4で通話している者が自身の声で相手へ質問し、声紋データ抽出部140に声紋データを抽出させ、話者特定部110が特定した氏名およびプロファイル等を内線電話機4が備える表示部に表示させることも可能である(図示せず)。
以上、本発明の一実施の形態について説明した。本実施形態において、本装置1は外線および複数の内線を収容するホームテレホンの親機として、インターホン親機3や内線電話機4が分離している場合を例に説明したが、本発明はこれに限定されない。例えば、本装置はインターホン親機や内線電話機4の機能が一体化した電話装置であってもよい。
また、本装置はボタン電話システムの主装置、または構内交換装置(PBX)等であってもよい。
1・・・本装置1
2・・・カメラ付インターホン子機
3・・・インターホン親機
4・・・内線電話機
5・・・電気錠
6・・・ネットワーク
100・・・制御部
101・・・内線対応部
102・・・外線対応部
110・・・話者特定部
120・・・音声質問部
121・・・乱数発生器
130・・・話者データ登録部
140・・・声紋データ抽出部
150・・・話者別処理内容登録部
160・・・話者別処理履歴蓄積部
170・・・話者特定処理起動条件登録部

Claims (3)

  1. 1以上の外線または内線を収容する電話装置において、
    自電話装置を利用する話者の声紋データを登録する声紋データ登録手段と、話者のプロファイルに係る情報を前記声紋データ登録手段に登録された声紋データと対応付けて登録するプロファイル登録手段と、前記プロファイル登録手段に登録されている話者と対応付けて処理する内容を登録する処理内容登録手段と、前記プロファイル登録手段に登録されているプロファイルに係る質問文を登録する質問文登録手段と、前記質問文登録手段に登録されている質問文のいずれかを話者に音声で質問する音声質問手段と、前記音声質問手段が質問した質問に対して話者が回答する音声信号を受信して前記話者の声紋データを抽出する声紋データ抽出手段と、前記抽出した声紋データと前記声紋データ登録手段に登録されている声紋データを比較して当該声紋データの話者が前記プロファイル登録手段に登録されているいずれかの話者と同一であるか否かを判定して話者を特定する話者特定手段と、を有し、
    前記話者特定手段が通話中の話者は前記プロファイル登録手段に登録されているいずれかの話者と同一であると判定した場合に、当該話者に対応付けて前記処理内容登録手段に登録されている処理内容を自動的に起動することを特徴とする声紋による話者特定機能を有する電話装置。
  2. 請求項1に記載の電話装置において、
    前記音声データ抽出手段が抽出する音声データは、自装置の内線に接続されたインターホン子機から入力する音声データであって、
    前記処理内容登録手段に登録する処理内容は、自装置の内線に接続された電気錠の開閉に係る処理であることを特徴とする声紋による話者特定機能を有する電話装置。
  3. 請求項2に記載の電話装置において、
    前記インターホン子機は、話者を撮像するカメラを備え、
    前記音声データ抽出手段が抽出する音声データによって前記電気錠を開閉した場合に当該話者と前記電気錠の開閉に係る情報を蓄積するまたは所定の宛先へ通報することを特徴とする声紋による話者特定機能を有する電話装置。
JP2010220618A 2010-09-30 2010-09-30 声紋による話者特定機能を有する電話装置 Pending JP2012078384A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010220618A JP2012078384A (ja) 2010-09-30 2010-09-30 声紋による話者特定機能を有する電話装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010220618A JP2012078384A (ja) 2010-09-30 2010-09-30 声紋による話者特定機能を有する電話装置

Publications (1)

Publication Number Publication Date
JP2012078384A true JP2012078384A (ja) 2012-04-19

Family

ID=46238750

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010220618A Pending JP2012078384A (ja) 2010-09-30 2010-09-30 声紋による話者特定機能を有する電話装置

Country Status (1)

Country Link
JP (1) JP2012078384A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109379499A (zh) * 2018-11-20 2019-02-22 北京千丁互联科技有限公司 一种语音呼叫方法及装置
JP2019514045A (ja) * 2016-03-21 2019-05-30 アマゾン テクノロジーズ インコーポレイテッド 話者照合方法及びシステム
US10923111B1 (en) 2019-03-28 2021-02-16 Amazon Technologies, Inc. Speech detection and speech recognition
CN115050390A (zh) * 2022-08-12 2022-09-13 杭州海康威视数字技术股份有限公司 一种语音隐私保护方法、装置、电子设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019514045A (ja) * 2016-03-21 2019-05-30 アマゾン テクノロジーズ インコーポレイテッド 話者照合方法及びシステム
US11514901B2 (en) 2016-03-21 2022-11-29 Amazon Technologies, Inc. Anchored speech detection and speech recognition
CN109379499A (zh) * 2018-11-20 2019-02-22 北京千丁互联科技有限公司 一种语音呼叫方法及装置
US10923111B1 (en) 2019-03-28 2021-02-16 Amazon Technologies, Inc. Speech detection and speech recognition
CN115050390A (zh) * 2022-08-12 2022-09-13 杭州海康威视数字技术股份有限公司 一种语音隐私保护方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US11979518B2 (en) Handling calls on a shared speech-enabled device
US8737581B1 (en) Pausing a live teleconference call
CN110033774A (zh) 用于隐私保护型语音交互的设备和方法
JPS6340434A (ja) 人工知能機能付留守番電話装置
JP2008053989A (ja) ドアホンシステム
JP2012078384A (ja) 声紋による話者特定機能を有する電話装置
JP4968663B2 (ja) インターホンシステム
JP2006253775A5 (ja)
JP2010103704A (ja) 音声変換装置
JP4230982B2 (ja) 通話補助装置、通話補助方法、通話補助プログラムおよび通話補助システム
US20190214018A1 (en) Method for speech processing and speech processing device
US11445056B1 (en) Telephone system for the hearing impaired
JP6854170B2 (ja) インターホン装置
JPS62278860A (ja) 音声蓄積装置
JP2007096831A (ja) インターホン装置
JPS63153945A (ja) 留守番電話装置
JPH06121021A (ja) 電話装置