JP2003189000A - 通話システム - Google Patents

通話システム

Info

Publication number
JP2003189000A
JP2003189000A JP2001381963A JP2001381963A JP2003189000A JP 2003189000 A JP2003189000 A JP 2003189000A JP 2001381963 A JP2001381963 A JP 2001381963A JP 2001381963 A JP2001381963 A JP 2001381963A JP 2003189000 A JP2003189000 A JP 2003189000A
Authority
JP
Japan
Prior art keywords
speaker
voice
utterance content
information
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001381963A
Other languages
English (en)
Inventor
Hiroko Maeda
裕子 前田
Hiroaki Takeyama
博昭 竹山
Akira Terasawa
章 寺澤
Minoru Fukushima
実 福島
Akihiro Kikuchi
彰洋 菊池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP2001381963A priority Critical patent/JP2003189000A/ja
Publication of JP2003189000A publication Critical patent/JP2003189000A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】マイクによる集音を行うことなく、話者の発話
を捉えて通話が行える通話システムを提供することにあ
る。 【解決手段】発話内容分析部2は、撮像装置1で捉えた
話者M11の口元の映像から話者M1の発話内容を分析
して発話内容を認識し、分析した発話内容の分析データ
をデータ伝送部3を介して受聴者M2側に設けられた音
声再現部4へ送り、この音声再現部4では音声合成によ
る音声で発話内容を再現し、音声送出部5からその音声
を受聴者M2へ送出させる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、住宅の玄関部や集
合住宅のロビー等に設置されるドアホン子器やロビーイ
ンターホンと、住宅内に設置される拡声型のインターホ
ン親機とで構成さされる通話システムに関するものであ
る。
【0002】
【従来の技術】従来の拡声通話システムでは、送話側及
び受話側共に、発話音声集音用のマイク及びマイクアン
プ、音声や音等を送出させるスピーカ及びスピーカアン
プ、音声信号からハンズフリー通話によって生じる不要
な成分を除去して、不要な成分を除去した音声信号を伝
送信号に変換して、通話先の通話機に送信する拡声通話
処理部及び送話と受話の2信号を1対の線路で扱うため
の2線4線変換部により拡声通話を実現している。
【0003】また録音再生機能処理部を備えている場合
には、通話路の一部から音声信号を分離し、録音再生機
能処理部にて分離した音声信号より録音再生処理を行っ
ている。
【0004】
【発明が解決しようとする課題】ところで前記の従来の
通話システムでは、発話音声集音用のマイクで集音した
音声を受話側機器へ精度良好に送出すべく、帰還ループ
形成に起因するハウリングやブロッキングを防止した
り、送出音声音量の自動調整等、発話者の音声をマイク
で集音することに起因する課題があった。
【0005】本発明は、上述の課題に鑑みて為されたも
ので、その目的とするところはマイクによる集音を行う
ことなく、話者の発話を捉えて通話が行え、ハウリング
防止、ブロッキング防止、送出音声音量の自動調整を検
討する必要が無い通話システムを提供することにある。
【0006】
【課題を解決するための手段】請求項1の発明では、時
系列に連続して撮像可能な撮像手段と、撮像手段での撮
像画像を基にして話者の口元の動きを認識することによ
って話者の発話内容を推定する発話内容分析手段と、発
話内容分析手段で得た発話内容推定結果情報を基にして
話者の発話内容を再現提示する提示手段を備えているこ
とを特徴とする。
【0007】請求項2の発明では、請求項1の発明にお
いて、少なくとも、前記撮像手段と前記発話内容分析手
段を送話側機器に、前記発話内容を提示する前記提示手
段を受話側機器に各々備え、前記発話内容分析手段を前
記送話側機器と前記受話側機器の何れか一方に備えたこ
とを特徴とする。
【0008】請求項3の発明では、請求項1又は2の発
明において、前記提示手段が、前記発話内容推定結果情
報を基にして話者の発話内容を推定して音声合成より再
現する音声再現手段と、該音声再現手段で再現された音
声を送出する為のスピーカを含む音声送出手段とから成
ることを特徴とする。
【0009】請求項4の発明では、請求項3の発明にお
いて、前記発話内容分析手段から前記音声再現手段へ送
る発話内容推定結果情報がテキストデータであって、前
記音声再現手段にはテキストデータを基に話者の発話内
容を推定して音声合成より再現する音声再現手段と、該
音声再現手段で再現された音声を送出する為のスピーカ
を含む音声送出手段とから成ることを特徴とする。
【0010】請求項5の発明では、請求項1又は2の発
明において、前記提示手段が、前記発話内容推定結果情
報を基にテキスト形式の表示データを生成するテキスト
表示処理部と、このテキスト表示処理部で生成された表
示データにより話者の発話内容を文字によって表示する
表示モニタとから成ることを特徴とする。
【0011】請求項6の発明では、請求項3の発明にお
いて、話者の発声を来訪に対する対応前に予め集音する
集音処理手段と、当該話者の音質情報やイントネーショ
ン情報等の話者情報を抽出する話者情報分析処理手段
と、話者情報分析処理手段で得た音質情報やイントネー
ション情報等の話者情報を記録しておく記録部と、前記
発話内容推定結果を基にして推定再現した話者の発話内
容を前記音声再現手段により音声合成で再現する際に、
前記記録部にて記録された当該話者情報を付加する話者
情報付加処理部とを備え、該話者情報付加処理部で話者
情報が付加された音声を前記音声送出手段にて送出する
ことを特徴とする。
【0012】請求項7の発明では、請求項6の発明にお
いて、前記記録部にて記録している話者情報を、前記話
者情報分析処理手段にて話者情報を抽出する度に、抽出
した話者情報で更新記録していくことを特徴とする。
【0013】請求項8の発明では、請求項3の発明にお
いて、任意の話者の音質情報やイントネーション情報等
の話者情報を予め記録している記録部と、話者の発話内
容を前記音声再現手段により音声合成で再現する際に前
記記録部に記憶してある任意の前記話者情報を付加する
話者情報付加処理部とを備え、該話者情報付加処理部で
任意の話者情報が付加された音声を前記音声送出手段に
て送出することを特徴とする。
【0014】請求項9の発明では、請求項3の発明にお
いて、前記発話内容推定結果を基にして話者の発話内容
を音声合成にて再現する際に、合成された音声の周波数
帯域を予め指定しておいた周波数帯域にシフト若しくは
変換する処理を行う周波数帯域変換手段を備え、該周波
数帯域変換手段で処理された音声を前記音声送出手段に
て送出することを特徴とする。
【0015】請求項10の発明では、請求項1乃至9の
何れかの発明において、前記撮像手段で撮像された映像
信号を前記発話内容分析処理手段と、来客の様子を表示
モニタで表示させるための来客モニタ映像処理手段とに
分離出力する映像分離処理手段を備えていることを特徴
とする。
【0016】請求項11の発明では、請求項1乃至10
の何れかの発明において、前記発話内容分析手段から出
力される発話内容推定結果情報を記録する記録手段を備
え、該記録手段で記録された前記発話内容推定結果情報
を前記提示手段へ送ることを特徴とする。
【0017】
【発明の実施の形態】以下本発明を、住宅の玄関部や集
合住宅のロビー部等に設置される通話機器であるドアホ
ン子器やロビーインターホンと、住宅内に設置される通
話機器であるインターホン親機とで構成される住宅用通
話システムに適用させた各実施形態により説明する。 (実施形態1)本実施形態は、ドアホン子器やロビーイ
ンターホンからインターホン親機への通話系或いはイン
ターホン親機からドアホン子器やロビーインターホンへ
の通話系、若しくは両通話系に適用させることができる
ものであって、話者M1の口元の動きを撮像する撮像装
置1と、この撮像装置1で捉えた話者M11の口元の映
像から話者M1の発話内容を分析して発話内容を認識
し、分析した発話内容の分析データを発話内容推定結果
情報として出力する発話内容分析部2と、この発話内容
分析部2から出力された分析データを受聴者M2側へ伝
送するデータ伝送部3とを設け、また話者M1側に対応
する受聴者M2側に設けられ、分析データを基に推定し
て音声合成により発話内容に対応する音声を再現する音
声再現部4と、この音声再現部4で音声合成により発話
内容を再現した音声信号をスピーカー5a及びスピーカ
ーアンプ5bからなる音声送出部5とを、発話内容再現
の提示手段として設け、音声送出部5によって話者M1
が発声した内容を音声により受聴者M2へ送出する。
【0018】尚図示する構成を片方の通話系のみに適用
させる場合には他方の通話系に従来のインターホンとし
て構成される通常の通話機器を用いる。
【0019】更に話者の口元の映像から発話内容を分析
する発話内容分析部2としては周知の分析方法はじめ適
切な分析方法を用いれば良いので、ここでは詳説しな
い。また音声再現部4における音声合成方法も周知の分
析方法はじめ適切な分析方法を用いれば良いので、ここ
では詳説しない。
【0020】また少なくとも撮像手段は、送話側機器
に、提示手段は受話側機器に、各々備えてあれば良く、
発話内容分析手段は、送話側機器受話器側の何れか一方
に備えている形態のものもあり得る。この場合データ伝
送部3については、当然にして接続前後段の位置関係を
適宜変える必要がある。
【0021】(実施形態2)本実施形態は実施形態1と
同様にドアホン子器やロビーインターホンとインターホ
ン親機との間の片方の通話系若しくは両方の通話系に適
用するものであって、図2に示すように発話内容分析部
2から出力される発話内容の分析データをテキストデー
タに変換するテキストデータ変換部6を設けるととも
に、音声再現部4として、このテキストデータ変換部6
からのテキストデータを発話内容推定結果情報として受
け取り、このテキストデータに基づいて音声合成をテキ
スト合成する音声再現部を設けた点で実施形態1と相違
する。
【0022】尚その他の構成は実施形態1と同じである
ので、説明を省略して同じ構成要素に同じ符号を付す。
また図示する構成を片方の通話系のみに適用させる場合
には他方の通話系に従来のインターホンとして構成され
る通常の通話機器を用いる。
【0023】而して本実施形態ではテキストデータを音
声再現部4に伝送するので、分析データをそのまま伝送
する場合に比してデータ伝送容量を少なく抑えることが
やり易くなり、そのため誤り符号を付加することが可能
となって、伝送誤りに強いデータ伝送を行い易くなる。 (実施形態3)上記実施形態1,2は共に話者M1の発
話内容を音声によって再現して受聴者M2へ提示する通
話システムであるが、本実施形態は話者M1の発話内容
をテキスト表示で再現提示するようにしたもので、図3
に示すように受聴者M2側に表示モニタ7を備えるとと
もに、データ伝送部3を介して発話内容分析部2から送
られてくる分析データに基づいてテキストデータに変換
し、そのテキストデータに基づいてテロップ式にテキス
ト(文字)を表示モニタ7で表示させる表示データを生
成するテキスト表示処理部8を備え、これら表示モニタ
7及びテキスト表示処理部8で話者M1の発話内容を再
現提示する手段を構成した点に特徴がある。
【0024】尚本実施形態もドアホン子器やロビーイン
ターホンからインターホン親機への通話系或いはインタ
ーホン親機からドアホン子器やロビーインターホン機へ
の通話系、若しくは両通話系に適用させることができる
ものであって、実施形態1と同じ構成要素には同じ符号
を付して説明を省略する。また図示する構成を片方の通
話系のみに適用させる場合には他方の通話系に従来のイ
ンターホンとして構成される通常の通話機器を用いる。
【0025】また また少なくとも撮像手段は、送話側
機器に、提示手段は受話側機器に、各々備えてあれば良
く、発話内容分析手段は、送話側機器受話器側の何れか
一方に備えている形態のものもあり得る。この場合デー
タ伝送部3については、当然にして接続前後段の位置関
係を適宜変える必要がある。
【0026】而して本実施形態では、受聴者M2は表示
モニタ7で表示される文字で表示される内容で話者M1
の発話内容を知ることができるため、受聴者M2が聴覚
障害を持つ場合には特に有効なシステムと言える。
【0027】尚本実施形態では、分析データをデータ伝
送部3を介して伝送し、テキスト表示処理部8でテキス
トデータに変換した後表示データを生成する方法をとっ
ているが、実施形態2と同様に、発話内容分析部2から
出力される発話内容の分析データをテキストデータに変
換するテキストデータ変換部6を設け、テキストデータ
をデータ伝送部3を介して伝送することで、データ伝送
容量を少なく抑えることがやり易くなり、またテキスト
表示処理部8でのデータ変換作業の負担を軽くすること
ができる。
【0028】(実施形態4)上記の実施形態1,2は話
者M1の発話内容を分析して音声合成により再現提示す
る構成であるが、再現される音声は実際の話者M1の音
声から離れた音声となるため、インターホンとして用い
る場合に受聴者M2で来客(話者M1)が誰であるのか
を音声で判断するのは難しい。
【0029】これに対して本実施形態は、図4に示すよ
うに話者M1の発話音声を集音するマイク等からなる集
音装置9と、集音装置9で取り込んだ話者M1の発話音
声の音質情報やイントネーション情報、その他の情報を
分析して話者情報を得る話者情報分析部10と、分析し
た話者情報を記録する記録部11と、データ伝送部3を
介して発話内容分析部2から送られてくる分析データに
基づいて音声再現部4により音声を合成する際に記録部
11で記録された前記話者情報を音声信号に付加する処
理を行う話者情報付加部12とを備え、音声合成によっ
て生成される音声信号に話者情報を付加することで、話
者M1の実音声に近い音声を音声送出部5から再生送出
することができるようになっている。
【0030】集音装置9は話者M1側機器に設ける必要
があるが、話者情報分析部10、記録部11、話者情報
付加処理部12を設けるのは話者M1側機器であって
も、受聴者M2側機器であっても良い。
【0031】尚本実施形態もドアホン子器やロビーイン
ターホンからインターホン親機への通話系或いはインタ
ーホン親機からドアホン子器やロビーインターホンへの
通話系、若しくは両通話系に適用させることができるも
のであって、実施形態1と同じ構成要素には同じ符号を
付して説明を省略する。また図示する構成を片方の通話
系のみに適用させる場合には他方の通話系に従来のイン
ターホンとして構成される通常の通話機器を用いる。 (実施形態5)実施形態4では、集音装置9で集音した
話者M1の音声から話者情報を話者情報分析部10によ
り分析してその分析した話者情報を記録部11で記録さ
せるようになっているが、本実施形態は図5に示すよう
に話者情報分析部10で分析した話者情報のパラメータ
を自動的に更新するためのパラメータ自動更新部13を
設けた点で実施形態4と相違する。
【0032】尚本実施形態もドアホン子器やロビーイン
ターホンからインターホン親機への通話系或いはインタ
ーホン親機からドアホン子器やロビーインターホンへの
通話系、若しくは両通話系に適用させることができるも
のであって、実施形態4と同じ構成要素には同じ符号を
付して説明を省略する。また図示する構成を片方の通話
系のみに適用させる場合には他方の通話系に従来のイン
ターホンとして構成される通常の通話機器を用いる。
【0033】而して本実施形態では、分析された話者情
報を記録部11にて記録する場合、パラメータ自動更新
部13にて話者情報のパラメータの自動更新を行うこと
で、より多くの話者情報を活用し、音声再現部4におい
て音声合成により再現する音声を話者の実音声に近いも
のとすることができることになる。 (実施形態6)上記実施形態4,5では話者情報を来客
である話者M1の発声音を集音装置9で集音し、その集
音した音声を分析することで得るようにしていたが、本
実施形態は、図6に示すように予め任意の話者情報を登
録した話者情報保有部14を設け、話者M1の発話内容
の分析データを基に音声再現部4で音声合成により音声
を再現する際に、話者情報保有部14で保有した任意の
話者情報を話者情報付加処理部12が読み出して音声合
成によって生成される音声信号に付加する点で実施形態
4,5と相違する。
【0034】つまり本実施形態では、任意の話者情報を
合成音声に付加することで、実際話者M1の音声とは異
なる音声で発話内容を再現することができ、例えば女声
を男声に変換するなどができる。従って本実施形態の撮
像装置1側をインターホン親機側に設けることで、女性
宅で、不審者の来訪などがあった場合に男声で応答する
ことが可能となり、防犯上等に有効となる。
【0035】勿論ドアホン子器やロビーインターホンか
らインターホン親機への通話系のみに設けても良く、或
いはインターホン親機からドアホン子器やロビーインタ
ーホンへの通話系、若しくは両通話系に設けても良い。
図示する構成を片方の通話系のみに適用させる場合には
他方の通話系に従来のインターホンとして構成される通
常の通話機器を用いる。
【0036】尚話者情報付加処理部12,話者情報保有
部14以外の構成は実施形態1と同じであるので同じ構
成要素には同じ符号を付して説明は省略する。 (実施形態7)本実施形態は、図7に示すように実施形
態1の構成において、音声再現部4と音声送出部5との
間に音声再現部4で再現される音声の周波数帯域をシフ
ト若しくは変換する周波数帯域変換処理部15を設けた
点に特徴がある。
【0037】而して本実施形態では、音声再現部4で音
声合成により出力される音声信号の周波数帯域を周波数
変換処理部15で高齢者や幼稚者などの受聴者M2が聞
き取り易い周波数帯域にシフト若しくは変換すること
で、受聴者M2に適切な音声を音声送出部5から送出す
ることができることになる。
【0038】尚本実施形態もドアホン子器やロビーイン
ターホンからインターホン親機への通話系或いはインタ
ーホン親機からドアホン子器やロビーインターホンへの
通話系、若しくは両通話系に適用させることができるも
のであって、実施形態1と同じ構成要素には同じ符号を
付して説明を省略する。また図示する構成を片方の通話
系のみに適用させる場合には他方の通話系に従来のイン
ターホンとして構成される通常の通話機器を用いる。 (実施形態8)本実施形態は、図8に示すように撮像装
置1からの映像信号を発話内容分析に用いる映像信号
と、話者M1の様子をモニタするための映像信号とに分
離する映像分離処理手段たる映像分離部16を備えると
ともに、話者M1の様子をモニタするための映像信号を
表示モニタ7で表示させるための映像信号として信号処
理を行い表示モニタ7に送出する来客モニタ映像処理部
17を設けてある。
【0039】表示モニタ7は、話者M1を撮像した映像
を映し出す以外に、実施形態3と同様にテキスト表示処
理部8からの表示データに基づいて発話内容をテキスト
(文字)でテロップ表示するようになっている。
【0040】また音声再現部4と音声送出部5とで音声
による発話内容の再現も実施形態1と同様に行うような
っている。
【0041】以上のように構成される本実施形態では、
実施形態1,3と同様に話者M1の発話内容を音声やテ
キスト表示で再現するとともに、表示モニタ7の映像で
話者M1が誰であるかを確認することができるのであ
る。
【0042】尚本実施形態もドアホン子器やロビーイン
ターホンからインターホン親機への通話系或いはインタ
ーホン親機からドアホン子器やロビーインターホンへの
通話系、若しくは両通話系に適用させることができるも
のであって、実施形態1,3と同じ構成には同じ符号を
付して詳細な説明は省略する。
【0043】また図示する構成を片方の通話系のみに適
用させる場合には他方の通話系に従来のインターホンと
して構成される通常の通話機器を用いる。
【0044】また映像による話者M1の様子を表示する
機能は、表示モニタを備えていれば何れの実施形態(後
述する実施形態を含む)にも付加することができる。 (実施形態9)上述した実施形態1乃至8は、何れも話
者M1からの発話内容をリアルタイム的に音声やテキス
トで再現するものであるが、例えば家人が留守の場合
に、話者M1たる来客のメッセージを記録し、その後家
人たる受聴者M2が記録されているメッセージを再生さ
せて、発話内容(メッセージ)を確認することを可能と
する所謂留守録機能や話中に話し内容を録音する話中録
音機能を上記の実施形態1乃至8に付加しても良い。以
下に上記実施形態1,2,3の構成に上記機能を夫々付
加した実施例を説明する。
【0045】実施例1 図9は実施形態1の構成に上記の機能を付加して例を示
しており、来客がドアホン子器やロビーインターホンを
通じて呼び出しを行っても一定時間応答が無い場合や、
インターホン親機側に設けた話中録音釦(図示せず)の
操作があった場合、発話内容分析部2からの分析データ
をデータ伝送部3内に設けた記録部18に記録させる録
音/再生処理部19を備えている。
【0046】また録音/再生処理部19は、その後家人
である受聴者M2が記録されていることを例えばインタ
ーホン親機に設けている再生釦(図示せず)を操作する
と、記録部18に記録されている分析データを音声再現
部4へ送り出す再生制御機能を備えており、音声再現部
4は記録部18から送り出されてきた分析データに基づ
いて通常時と同様にて発話内容を音声合成による音声に
より再現し、音声送出部5から送出する。これにより受
聴者M2は留守に来訪した話者Mのメッセージや話中録
音した話者M1の発話内容を確認することができるので
ある。
【0047】尚記録部18は、データ伝送部3内に備わ
っており、データ伝送部3は上記留守録が行われる場合
には発話内容分析部2からの分析データを音声再現部1
4へ伝送するのを停止して記録部18へ録音/再生処理
部19の制御の下で入力させ、また話中録音時には分析
データを記録部18に入力させ且つ音声再現部14へ伝
送するようになっている。
【0048】尚ドアホン親機側に図示する構成を備えた
場合には、留守をする場合に、来客者に家人のメッセー
ジを伝えることもできる。
【0049】実施例2 上記実施例1は実施形態1に対応させたものであるが、
本実施例は、実施形態2に対応させたもので、図10に
示すように発音内容分析部2からの分析データからテキ
ストデータ変換部6で変換されたテキストデータをデー
タ伝送部3内の記録部18に記録させるようにした点に
特徴がある。
【0050】記録部18で記録するデータがテキストデ
ータであるか分析データであるかの違いはあるが録音/
再生処理部19の動作は実施例1と同じであるので、録
音/再生の動作についての説明は省略する。
【0051】またその他の構成・動作は実施形態2の場
合と同じであるので、これら構成・動作の説明も省略す
る。
【0052】実施例3 上記実施例1,2は共に音声で話者M1の発話内容を再
現するものであるが、本実施例は、図11に示すように
実施形態3に上記機能を付加したものであり、記録部1
8で記録した分析データをテキスト表示処理部8によっ
てテキスト形式の表示データに変換し、表示モニタ7で
表示させるようなっている点に特徴がある。
【0053】尚録音/再生処理部19の動作は実施例1
と同じであるので、録音/再生の動作についての説明は
省略する。
【0054】またその他の構成及び動作は実施形態3の
場合と同じであるので、これら構成・動作の説明も省略
する。
【0055】
【発明の効果】請求項1の発明は、時系列に連続して撮
像可能な撮像手段と、撮像手段での撮像画像を基にして
話者の口元の動きを認識することによって話者の発話内
容を推定する発話内容分析手段と、発話内容分析手段で
得た発話内容推定結果情報を基にして話者の発話内容を
再現提示する提示手段を備えているので、従来の通話に
は必要であったマイクを用いずに、インターホン親機と
ドアホン子器やロビーインターホンの間での会話を可能
とし、マイクを用いないことにより帰還ループが形成さ
れずハウリングの発生や、ブロッキングが発生せず、周
囲騒音による会話への悪影響等拡声通話システム特有の
問題が本質的になくなり、そのため送出音声音量の自動
調整を検討する必要も無く、更に発声が困難な障害を有
する場合でも、口を動かすことにより、会話相手に発声
したい内容を伝えることが可能となるという効果があ
る。
【0056】請求項2の発明は、請求項1の発明におい
て、少なくとも、前記撮像手段と前記発話内容分析手段
を送話側機器に、前記発話内容を提示する前記提示手段
を受話側機器に各々備え、前記発話内容分析手段を前記
送話側機器と前記受話側機器の何れか一方に備えたの
で、請求項1の発明の効果を奏する通話システムを実現
できる。
【0057】請求項3の発明は、請求項1又は2の発明
において、前記提示手段が、前記発話内容推定結果情報
を基にして話者の発話内容を推定して音声合成より再現
する音声再現手段と、該音声再現手段で再現された音声
を送出する為のスピーカを含む音声送出手段とから成る
ので、音声によって話者の発話内容を受聴者へ伝達する
ことができる。
【0058】請求項4の発明は、請求項3の発明におい
て、前記発話内容分析手段から前記音声再現手段へ送る
発話内容推定結果情報がテキストデータであって、前記
音声再現手段にはテキストデータを基に話者の発話内容
を推定して音声合成より再現する音声再現手段と、該音
声再現手段で再現された音声を送出する為のスピーカを
含む音声送出手段とから成るので、データ伝送容量を少
なく抑えることがやり易くなり、その結果誤り符号を付
加することができて、伝送誤りに強いデータ伝送が可能
となる。
【0059】請求項5の発明は、請求項1又は2の発明
において、前記提示手段が、前記発話内容推定結果情報
を基にテキスト形式の表示データを生成するテキスト表
示処理部と、このテキスト表示処理部で生成された表示
データにより話者の発話内容を文字によって表示する表
示モニタとから成るので、受聴者が聴覚障害を有する場
合でも、話者(来客者)と会話することが可能となる。
【0060】請求項6の発明は、請求項3の発明におい
て、話者の発声を来訪に対する対応前に予め集音する集
音処理手段と、当該話者の音質情報やイントネーション
情報等の話者情報を抽出する話者情報分析処理手段と、
話者情報分析処理手段で得た音質情報やイントネーショ
ン情報等の話者情報を記録しておく記録部と、前記発話
内容推定結果を基にして推定再現した話者の発話内容を
前記音声再現手段により音声合成で再現する際に、前記
記録部にて記録された当該話者情報を付加する話者情報
付加処理部とを備え、該話者情報付加処理部で話者情報
が付加された音声を前記音声送出手段にて送出するの
で、受聴者側に送出される音声を、話者の実音声に近い
ものにすることができる。
【0061】請求項7の発明は、請求項6の発明におい
て、前記記録部にて記録している話者情報を、前記話者
情報分析処理手段にて話者情報を抽出する度に、抽出し
た話者情報で更新記録していくので、より多くの情報を
活用することが可能となり、音声合成にて再現し受聴者
側に送出される音声を、より話者の実音声に近いものに
することができる。
【0062】請求項8の発明は、請求項3の発明におい
て、任意の話者の音質情報やイントネーション情報等の
話者情報を予め記録している記録部と、話者の発話内容
を前記音声再現手段により音声合成で再現する際に前記
記録部に記憶してある任意の前記話者情報を付加する話
者情報付加処理部とを備え、該話者情報付加処理部で任
意の話者情報が付加された音声を前記音声送出手段にて
送出するので、例えば女声男声変換等の音質変換の機能
が可能となる。
【0063】請求項9の発明は、請求項3の発明におい
て、前記発話内容推定結果を基にして話者の発話内容を
音声合成にて再現する際に、合成された音声の周波数帯
域を予め指定しておいた周波数帯域にシフト若しくは変
換する処理を行う周波数帯域変換手段を備え、該周波数
帯域変換手段で処理された音声を前記音声送出手段にて
送出するので、高齢者や幼稚者等、受聴者側の聞き取り
やすい周波数帯域に変換した音声で発話内容を再現送出
することが可能となる。
【0064】請求項10の発明は、請求項1乃至9の何
れかの発明において、前記撮像手段で撮像された映像信
号を前記発話内容分析処理手段と、来客の様子を表示モ
ニタで表示させるための来客モニタ映像処理手段とに分
離出力する映像分離処理手段を備えているので、一つの
撮像手段を、発話内容の画像認識機能と来客のモニタ機
能とに用いることができる。
【0065】請求項11の発明では、請求項1乃至10
の何れかの発明において、前記発話内容分析手段から出
力される発話内容推定結果情報を記録する記録手段を備
え、該記録手段で記録された前記発話内容推定結果情報
を前記提示手段へ送るので、不在時の来客への不在メッ
セージの送出、不在時の来客のメッセージの録音や話中
録音、それらの再生機能を利用することが可能となる。
【図面の簡単な説明】
【図1】本発明の実施形態1の構成図である。
【図2】本発明の実施形態2の構成図である。
【図3】本発明の実施形態3の構成図である。
【図4】本発明の実施形態4の構成図である。
【図5】本発明の実施形態5の構成図である。
【図6】本発明の実施形態6の構成図である。
【図7】本発明の実施形態7の構成図である。
【図8】本発明の実施形態8の構成図である。
【図9】本発明の実施形態9の実施例1の構成図であ
る。
【図10】同上の実施例2の構成図である。
【図11】同上の実施例3の構成図である。
【符号の説明】
1 撮像装置 2 発話内容分析部 3 データ伝送部 4 音声再現部 5 音声送出部 5a スピーカ 5b スピーカアンプ M1 話者 M2 受聴者
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 13/00 H04M 11/00 302 5K101 13/08 11/10 5L096 15/24 G10L 3/00 E 17/00 H 21/06 S H04M 11/00 302 545A 11/10 571S R (72)発明者 寺澤 章 大阪府門真市大字門真1048番地松下電工株 式会社内 (72)発明者 福島 実 大阪府門真市大字門真1048番地松下電工株 式会社内 (72)発明者 菊池 彰洋 大阪府門真市大字門真1048番地松下電工株 式会社内 Fターム(参考) 5B057 BA02 DA16 DA20 DB02 DC33 5D015 LL06 5D045 AA09 AB04 BA01 5E501 AA30 CA03 CA08 CB14 EA00 FA13 FA32 5K038 AA06 CC12 DD23 5K101 NN06 NN16 NN18 5L096 BA02 DA05

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】時系列に連続して撮像可能な撮像手段と、
    撮像手段での撮像画像を基にして話者の口元の動きを認
    識することによって話者の発話内容を推定する発話内容
    分析手段と、発話内容分析手段で得た発話内容推定結果
    情報を基にして話者の発話内容を再現提示する提示手段
    を備えていることを特徴とする通話システム。
  2. 【請求項2】少なくとも、前記撮像手段と前記発話内容
    分析手段を送話側機器に、前記発話内容を提示する前記
    提示手段を受話側機器に各々備え、前記発話内容分析手
    段を前記送話側機器と前記受話側機器の何れか一方に備
    えたことを特徴とする請求項1記載の通話システム。
  3. 【請求項3】前記提示手段が、前記発話内容推定結果情
    報を基にして話者の発話内容を推定して音声合成より再
    現する音声再現手段と、該音声再現手段で再現された音
    声を送出する為のスピーカを含む音声送出手段とから成
    ることを特徴とする請求項1又は2記載の通話システ
    ム。
  4. 【請求項4】前記発話内容分析手段から前記音声再現手
    段へ送る発話内容推定結果情報がテキストデータであっ
    て、前記音声再現手段にはテキストデータを基に話者の
    発話内容を推定して音声合成より再現する音声再現手段
    と、該音声再現手段で再現された音声を送出する為のス
    ピーカを含む音声送出手段とから成ることを特徴とする
    請求項3記載の通話システム。
  5. 【請求項5】前記提示手段が、前記発話内容推定結果情
    報を基にテキスト形式の表示データを生成するテキスト
    表示処理部と、このテキスト表示処理部で生成された表
    示データにより話者の発話内容を文字によって表示する
    表示モニタとから成ることを特徴とする請求項1又は2
    記載の通話システム。
  6. 【請求項6】話者の発声を来訪に対する対応前に予め集
    音する集音処理手段と、当該話者の音質情報やイントネ
    ーション情報等の話者情報を抽出する話者情報分析処理
    手段と、話者情報分析処理手段で得た音質情報やイント
    ネーション情報等の話者情報を記録しておく記録部と、
    前記発話内容推定結果を基にして推定再現した話者の発
    話内容を前記音声再現手段により音声合成で再現する際
    に、前記記録部にて記録された当該話者情報を付加する
    話者情報付加処理部とを備え、該話者情報付加処理部で
    話者情報が付加された音声を前記音声送出手段にて送出
    することを特徴とする請求項3記載の通話システム。
  7. 【請求項7】前記記録部にて記録している話者情報を、
    前記話者情報分析処理手段にて話者情報を抽出する度
    に、抽出した話者情報で更新記録していくことを特徴と
    する請求項6記載の通話システム。
  8. 【請求項8】任意の話者の音質情報やイントネーション
    情報等の話者情報を予め記録している記録部と、話者の
    発話内容を前記音声再現手段により音声合成で再現する
    際に前記記録部に記憶してある任意の前記話者情報を付
    加する話者情報付加処理部とを備え、該話者情報付加処
    理部で任意の話者情報が付加された音声を前記音声送出
    手段にて送出することを特徴とする請求項3記載の通話
    システム。
  9. 【請求項9】前記発話内容推定結果を基にして話者の発
    話内容を音声合成にて再現する際に、合成された音声の
    周波数帯域を予め指定しておいた周波数帯域にシフト若
    しくは変換する処理を行う周波数帯域変換手段を備え、
    該周波数帯域変換手段で処理された音声を前記音声送出
    手段にて送出することを特徴とする請求項3記載の通話
    システム。
  10. 【請求項10】前記撮像手段で撮像された映像信号を前
    記発話内容分析処理手段と、来客の様子を表示モニタで
    表示させるための来客モニタ映像処理手段とに分離出力
    する映像分離処理手段を備えていることを特徴とする請
    求項1乃至9の何れか記載の通話システム。
  11. 【請求項11】前記発話内容分析手段から出力される発
    話内容推定結果情報を記録する記録手段を備え、該記録
    手段で記録された前記発話内容推定結果情報を前記提示
    手段へ送ることを特徴とする請求項1乃至10の何れか
    記載の通話システム。
JP2001381963A 2001-12-14 2001-12-14 通話システム Pending JP2003189000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001381963A JP2003189000A (ja) 2001-12-14 2001-12-14 通話システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001381963A JP2003189000A (ja) 2001-12-14 2001-12-14 通話システム

Publications (1)

Publication Number Publication Date
JP2003189000A true JP2003189000A (ja) 2003-07-04

Family

ID=27592480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001381963A Pending JP2003189000A (ja) 2001-12-14 2001-12-14 通話システム

Country Status (1)

Country Link
JP (1) JP2003189000A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008054253A (ja) * 2006-08-28 2008-03-06 Matsushita Electric Works Ltd 集合住宅用インターホンシステム
JP2010283637A (ja) * 2009-06-05 2010-12-16 Casio Computer Co Ltd 撮影画像処理装置、撮影画像処理プログラム及び撮影画像処理方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63212995A (ja) * 1987-02-28 1988-09-05 シャープ株式会社 音声合成装置
JPH08317363A (ja) * 1995-05-15 1996-11-29 Sharp Corp 画像伝送装置
JPH09134194A (ja) * 1995-08-17 1997-05-20 Ricoh Co Ltd 読話のための画像認識システム
JPH10240283A (ja) * 1997-02-27 1998-09-11 Sanyo Electric Co Ltd 音声処理装置及び電話装置
JPH1152987A (ja) * 1997-07-31 1999-02-26 Hitachi Ltd 話者適応機能を持つ音声合成装置
JPH11219278A (ja) * 1998-02-02 1999-08-10 Mitsubishi Electric Corp 3次元仮想世界システム
JP2000068882A (ja) * 1998-08-17 2000-03-03 Matsushita Electric Ind Co Ltd 無線通信装置
JP2000184077A (ja) * 1998-12-17 2000-06-30 Sharp Corp ドアホンシステム
JP2001100775A (ja) * 1999-09-28 2001-04-13 Atr Interpreting Telecommunications Res Lab 音声合成装置のための音声データ量削減装置及び音声合成装置
JP2001265566A (ja) * 2000-03-15 2001-09-28 Casio Comput Co Ltd 電子書籍装置、及び音声再生システム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63212995A (ja) * 1987-02-28 1988-09-05 シャープ株式会社 音声合成装置
JPH08317363A (ja) * 1995-05-15 1996-11-29 Sharp Corp 画像伝送装置
JPH09134194A (ja) * 1995-08-17 1997-05-20 Ricoh Co Ltd 読話のための画像認識システム
JPH10240283A (ja) * 1997-02-27 1998-09-11 Sanyo Electric Co Ltd 音声処理装置及び電話装置
JPH1152987A (ja) * 1997-07-31 1999-02-26 Hitachi Ltd 話者適応機能を持つ音声合成装置
JPH11219278A (ja) * 1998-02-02 1999-08-10 Mitsubishi Electric Corp 3次元仮想世界システム
JP2000068882A (ja) * 1998-08-17 2000-03-03 Matsushita Electric Ind Co Ltd 無線通信装置
JP2000184077A (ja) * 1998-12-17 2000-06-30 Sharp Corp ドアホンシステム
JP2001100775A (ja) * 1999-09-28 2001-04-13 Atr Interpreting Telecommunications Res Lab 音声合成装置のための音声データ量削減装置及び音声合成装置
JP2001265566A (ja) * 2000-03-15 2001-09-28 Casio Comput Co Ltd 電子書籍装置、及び音声再生システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008054253A (ja) * 2006-08-28 2008-03-06 Matsushita Electric Works Ltd 集合住宅用インターホンシステム
JP2010283637A (ja) * 2009-06-05 2010-12-16 Casio Computer Co Ltd 撮影画像処理装置、撮影画像処理プログラム及び撮影画像処理方法

Similar Documents

Publication Publication Date Title
US6919918B2 (en) Electronic digital door opener
WO2003088636A1 (en) Video doorphone
CN110996308B (zh) 声音播放设备及其控制方法、控制装置和可读存储介质
JP5530272B2 (ja) インターホンシステム
JP2003189000A (ja) 通話システム
JP2001211437A (ja) マルチメディアctiシステム
JP2010178067A (ja) インターホンシステム
JP2006211570A (ja) 撮影装置
JP2004056370A (ja) インターフォンシステムおよび情報提供方法
JP2007060015A (ja) インターホンシステム
JPH07245748A (ja) 音響信号を用いた通信装置
JP4186416B2 (ja) カメラ付きドアホン
JP2007267253A (ja) インターホンシステム
JP2007329873A (ja) インターホン装置
JP2002152393A (ja) ドアフォン装置及びドアフォン装置による呼出転送方法
JP3901153B2 (ja) 集合住宅管理通話システム
JP6854170B2 (ja) インターホン装置
JPH06291863A (ja) 音響信号を用いた通信装置
JP4159127B2 (ja) インターホン装置
JP2898765B2 (ja) 留守番機能付テレビ通話装置
JP5650036B2 (ja) インターホンシステム
JP4107012B2 (ja) インターホンシステム
CN114625336A (zh) 通话方法、装置、终端设备及存储介质
KR20030092220A (ko) 외부 전화단말기와 통화 가능한 인터폰
JPH066806A (ja) 伝言装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040927

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060828

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061102

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20061207

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20061228