JP2010183205A

JP2010183205A - 通話システム

Info

Publication number: JP2010183205A
Application number: JP2009023125A
Authority: JP
Inventors: Kiyotaka Takehara; 清隆竹原; Akira Baba; 朗馬場
Original assignee: Panasonic Electric Works Co Ltd
Current assignee: Panasonic Electric Works Co Ltd
Priority date: 2009-02-03
Filing date: 2009-02-03
Publication date: 2010-08-19

Abstract

【課題】日常的に通話を終了させる言葉を終話コマンドワードとして使用しながら、終話コマンドワードの誤認識を抑制可能な通話システムを提供する。
【解決手段】通話装置１の制御部１ａは、マイクロホンＭに入力された音声データが終話コマンド格納部１ｓに格納している終話コマンドワードに一致した認識結果が音声認識部１ｐから得られた場合に、終話コマンドを含むデータを通話先の通話装置１へ送信し、さらにマイクロホンＭに入力された音声データが終話コマンド格納部１ｓに格納している終話コマンドワードに一致した認識結果が音声認識部１ｐから得られるとタイマ部１００による計時を開始し、当該計時時間が予め設定された終話タイマ値Ｔ１に達するまでに通話先の通話装置１から終話コマンドを含むデータを受信すれば、通話回線を切断する。
【選択図】図１

Description

本発明は、通話システムに関するものである。

従来、ユーザが発話する特定の言葉を音声認識手段が認識することによって、発呼等の各操作をハンズフリーで行う電話機がある（例えば、特許文献１参照）。

例えば、ユーザが発話した発信先の電話番号を音声認識手段が認識した後に、「決定」というコマンドワード発話し、このコマンドワードが音声認識手段で認識された場合に、発信先の電話番号へ発呼するよう電話機が制御される。

特開２００６−５８３９０号公報

音声認識手段によって、通話の開始から終了までの処理をハンズフリーで行う場合、発呼時、および発呼に対する応答時には通話回線がまだつながっていないので、通話先との会話がまだ始まっておらず、会話中の単語によるコマンドワードの誤認識が発生することはない。しかし、通話中は通話回線がつながっているので、通常の会話の中に終話を示す言葉（終話コマンドワード）が入ると、会話中のなにげない言葉であるにも関わらず、音声認識手段が終話コマンドワードであると誤認識して通話回線を切断し、ユーザの意思に反して終話処理が行われてしまう。

例えば、終話コマンドワードに「さよなら」等を用いることが一般的であり、このような一般的に終話を示す言葉は電話機の音声認識手段に予め記憶されているため、ユーザによるコマンドワードの記憶操作が不要となって使い勝手がよい。しかし、「Ｃ君に会ってさよならと言ったけど、返事してくれなかった」のように、通話中の会話に終話コマンドワード「さよなら」が入ることが十分考えられ、音声認識手段がこの「さよなら」を終話コマンドワードであると誤認識すると、通話回線が切断されてしまう。

また、日常会話で使わないような「閉じろゴマ」のような言葉を終話コマンドワードに用いると、終話時に発したそのコマンドワードが通話先にも聞こえてしまい、会話が不自然になってしまう。また、このような日常会話で使わない「閉じろゴマ」のような言葉を終話コマンドワードとして用いる場合は、ユーザによるコマンドワードの記憶操作が必要となって使い勝手も低下する。

本発明は、上記事由に鑑みてなされたものであり、その目的は、日常的に通話を終了させる言葉を終話コマンドワードとして使用しながら、終話コマンドワードの誤認識を抑制可能な通話システムを提供することにある。

請求項１の発明は、一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、制御部は、前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、前記終話音声一致信号が音声認識部から出力された場合に、タイマ部による計時を開始する計時開始手段と、少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第１の所定値に達するまでに通話先から終話コマンドを含むデータを受信する終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段とを具備することを特徴とする。

この発明によれば、通話中の通話装置の双方が第１の所定値に基づいて計時される期間内に終話コマンドワードを発した場合のみ、双方が終話の意思表示をしたものとみなして終話処理を行い、通話回線を切断する。したがって、一方の通話中の会話に入った「さよなら」という言葉や、一定時間以上の間隔で双方から発せられた「さよなら」という言葉によって、通話回線が切断されてしまう誤認識を防止できる。さらに、日常的に通話を終了させる「さよなら」のような言葉を終話コマンドワードとして使用でき、使い勝手がよいものとなる。

請求項２の発明は、一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、制御部は、前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、通話先から終話コマンドを含むデータを受信した場合に、タイマ部による計時を開始する計時開始手段と、少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第１の所定値に達するまでに前記終話音声一致信号が音声認識部から出力される終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段とを具備することを特徴とする。

請求項３の発明は、一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、制御部は、前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、前記終話音声一致信号が音声認識部から出力された場合、または通話先から終話コマンドを含むデータを受信した場合、タイマ部による計時を開始する計時開始手段と、少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第１の所定値に達するまでに通話先から終話コマンドを含むデータを受信する終話処理開始トリガが発生した場合、またはタイマ部による計時が開始されてから計時時間が予め設定された第１の所定値に達するまでに前記終話音声一致信号が音声認識部から出力される終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段とを具備することを特徴とする。

この発明によれば、通話中の通話装置の双方が第１の所定値に基づいて計時される期間内に終話コマンドワードを発した場合のみ、双方が終話の意思表示をしたものとみなして終話処理を行い、通話回線を切断する。したがって、一方の通話中の会話に入った「さよなら」という言葉や、一定時間以上の間隔で双方から発せられた「さよなら」という言葉によって、通話回線が切断されてしまう誤認識を防止できる。さらに、日常的に通話を終了させる「さよなら」のような言葉を終話コマンドワードとして使用でき、使い勝手がよいものとなる。さらに、双方の通話装置がタイマ部による計時動作を個別に行い、第１の所定値内にユーザがコマンドワードを発したか否かを個別に判別するので、一方の通話装置が他方の通話装置へ終話通知を送信する必要がなく、通信トラフィックの低減化を図ることができる。

請求項４の発明は、請求項１乃至３いずれかにおいて、前記制御部の終話処理手段は、前記終話処理開始トリガが発生した後、タイマ部による計時時間が予め設定された第２の所定値に達するまでに通話先との間で通話が行われなければ、通話先との通信を停止することを特徴とする。

この発明によれば、通常の電話であり得るお別れの挨拶の後、受話器を置くまで何も言わないということを利用して、双方の終話コマンドワードを認識した後、双方が何も話さない無音状態が、第２の所定値に基づいて計時される期間、継続した場合にのみ通話回線を切断しており、通常の会話中の終話コマンドワードとお別れの挨拶の終話コマンドワードとを、無音期間の有無によって区別して、終話コマンドワードの誤認識を防止できる。

請求項５の発明は、請求項１乃至３いずれかにおいて、各通話装置は、通話を行うユーザが所定範囲内に存在するか否かを検知するユーザ検知手段を備え、前記制御部の終話処理手段は、前記終話処理開始トリガが発生した後、タイマ部による計時時間が予め設定された第２の所定値に達するまでに、少なくとも一方の通話装置のユーザ検知手段が所定範囲内のユーザを検知しなくなれば、通話先との通信を停止することを特徴とする。

この発明によれば、一般的な会話でお別れの挨拶をした以降にユーザが席を離れることを利用して、双方の終話コマンドワードを認識した後、第２の所定値に基づいて計時される期間に、少なくともいずれか一方が席を離れた場合に通話回線を切断しており、通常の会話中の終話コマンドワードとお別れの挨拶の終話コマンドワードとを、離席の有無によって区別して、終話コマンドワードの誤認識を防止できる。

請求項６の発明は、請求項１乃至３いずれかにおいて、各通話装置は、ユーザを撮像する撮像手段と、終話時にユーザが行う動作の映像データを格納した終話ジェスチャー記憶部と、撮像手段からの映像データが終話ジェスチャー記憶部に格納している映像データに一致するか否かを判定し、一致した場合には終話ジェスチャー一致信号を出力するジェスチャー認識部とを備え、前記制御部の終話処理手段は、前記終話処理開始トリガが発生し、且つタイマ部による計時が開始されてから計時時間が予め設定された第２の所定値に達するまでに、少なくとも一方の通話装置のジェスチャー認識部から終話ジェスチャー一致信号が出力されると、通話先との通信を停止することを特徴とする。

この発明によれば、一般的な会話でお別れの挨拶をした以降に「お辞儀」や「手を振る」等のジェスチャーが行われることを利用して、双方の終話コマンドワードを認識した後、第２の所定値に基づいて計時される期間において、ユーザが「お辞儀」や「手を振る」等のジェスチャーを行った場合にのみ通話回線を切断しており、通常の会話中の終話コマンドワードとお別れの挨拶の終話コマンドワードとを、終話ジェスチャーの有無によって区別して、終話コマンドワードの誤認識を防止できる。

請求項７の発明は、請求項１乃至６いずれかにおいて、各通話装置は、表示手段と、当該表示手段の表示動作を制御する表示制御手段とを備え、表示制御手段は、通話先から終話コマンドを含むデータを受信すると、表示手段の表示を変化させることを特徴とする。

この発明によれば、ユーザは、通話先が終話処理に移行中であることを表示手段によって判断でき、さらには終話処理に至る進行度合も表示手段によって判断できるので、ユーザによる誤切断を抑制できる。

以上説明したように、本発明では、日常的に通話を終了させる言葉を終話コマンドワードとして使用しながら、終話コマンドワードの誤認識を抑制することができるという効果がある。

実施形態１の通話装置の構成を示す図である。同上の通話システムの構成を示す図である。同上のパケット信号の構造を示す図である。同上の通話シーケンスを示す図である。同上の別の通話シーケンスを示す図である。実施形態２の通話シーケンスを示す図である。実施形態３の通話装置の構成を示す図である。同上の通話シーケンスを示す図である。同上の別の通話シーケンスを示す図である。実施形態４の通話装置の構成を示す図である。同上の通話シーケンスを示す図である。実施形態５の通話装置の構成を示す図である。同上の通話シーケンスを示す図である。実施形態６の通話装置の構成を示す図である。同上の通話シーケンスを示す図である。

以下、本発明の実施の形態を図面に基づいて説明する。

（実施形態１）
図２は本実施形態の通話システムの構成を示し、インターネットを含むネットワークＮＴに複数の通話装置１が接続されている。各通話装置１は、ネットワークＮＴを介して１対１で通信可能な電話機であり、音声データおよび映像データを含むパケット信号を互いに送受信し、受信した映像データを表示するためのモニタ装置２が各々接続されている。

通話装置１は、図１に示すように、マイクロホンＭ（音声入力部）、スピーカＳＰ、カメラＣ（撮像手段）を備えており、マイクロホンＭから入力された音声データ、およびカメラＣが撮像した映像データをパケット信号に格納して通話先へ送信する。また、通話先からネットワークＮＴを介してパケット信号を受信すると、当該パケット信号に含まれる音声データをスピーカＳＰから出力し、当該パケット信号に含まれる映像データをモニタ装置２に表示させる。すなわち、双方向で、ユーザ同士が互いの映像を見ながら通話できるテレビ電話機として機能するものである。

まず通話装置１では、ネットワークＩ／Ｆ部１ｈがネットワークＮＴとの間でパケット信号の授受を行っている。パケット信号は、図３に示すように、コマンドエリアＤ１、音声エリアＤ２、映像エリアＤ３で構成されており、コマンドエリアＤ１には通話先に対して各種通知等を行うためのコマンドデータが格納され、音声エリアＤ２には音声データが格納され、映像エリアＤ３には映像データが格納される。なお、全てのエリアにデータが格納される必要はなく、必要なエリアのみにデータが格納されておればよい。

そして、カメラＣが出力する映像データはＡ／Ｄ変換部１ｂによってＡ／Ｄ変換され、マイクロホンＭが出力する音声データはＡ／Ｄ変換部１ｃによってＡ／Ｄ変換された後に、ＣＰＵ等で構成される制御部１ａに入力される。制御部１ａは、マイクロホンＭからの音声データを自己音声蓄積部１ｌに一時保存し、カメラＣからの映像データを自己映像蓄積部１ｊに一時保存する。

制御部１ａは、自己音声蓄積部１ｌおよび自己映像蓄積部１ｊの音声データおよび映像データを順次読み出して、パケット信号の音声エリアＤ２および映像エリアＤ３に各々格納し、ネットワークＩ／Ｆ部１ｈからネットワークＮＴを介して通話先の通話装置１にパケット信号を送信する。

また、制御部１ａは、通話先からネットワークＮＴ、ネットワークＩ／Ｆ部１ｈを介してパケット信号を受信すると、パケット信号の音声エリアＤ２および映像エリアＤ３に格納されている音声データおよび映像データを、相手音声蓄積部１ｋおよび相手映像蓄積部１ｉに各々一時保存する。次に制御部１ａは、相手音声蓄積部１ｋの音声データを順次読み出してＤ／Ａ変換部１ｅに入力し、Ｄ／Ａ変換された音声データがスピーカＳＰから出力される。さらに、制御部１ａは、相手映像蓄積部１ｉの映像データを順次読み出してＤ／Ａ変換部１ｄに入力し、Ｄ／Ａ変換された映像データがモニタ装置２に表示される。

さらに通話装置１は、スピーカＳＰから出力される音声がマイクロホンＭに回りこんで発生するハウリングを防止するためにエコーキャンセラ部１ｆを具備しており、エコーキャンセラ部１ｆは、マイクロホンＭ２が出力する音声データからスピーカＳＰに入力される音声データを減算したデータを、Ａ／Ｄ変換部１ｃに出力している。したがって、送信される音声データは、スピーカＳＰからマイクロホンＭに回りこんだ音声成分がキャンセルされており、ハウリングの発生が防止されている。

そして、通話装置１では、ユーザが発話する特定の言葉を音声認識部１ｐが認識することによって、発呼、応答、終話等の各操作をハンズフリーで行うことを可能としており、以下、通話装置１間の通信における音声認識処理について説明する。

通話装置１は、音声認識手段として、音声認識部１ｐ、発呼コマンド格納部１ｑ、応答コマンド格納部１ｒ、終話コマンド格納部１ｓを備えている。発呼コマンド格納部１ｑには、「Ｂ君につないで」等の発呼操作時にユーザが用いる言葉が発呼コマンドワードとして格納されており、応答コマンド格納部１ｒには、「応答して」等の応答操作時にユーザが用いる言葉が応答コマンドワードとして格納されており、終話コマンド格納部１ｓには、「さよなら」「バイバイ」等の終話操作時にユーザが用いる言葉が終話コマンドワードとして格納されている。音声認識部１ｐは、自己音声蓄積部１ｌに保存されている音声データを、発呼コマンド格納部１ｑ、応答コマンド格納部１ｒ、終話コマンド格納部１ｓに格納している各コマンドワードと比較して、音声データ中にいずれかのコマンドワードと一致する言葉があれば、当該認識結果として、発呼音声一致信号、応答音声一致信号、終話音声一致信号を制御部１ａに出力する。

制御部１ａは、音声認識部１ｐによる認識結果から、一致したコマンドワード［発呼コマンドワード、または応答コマンドワード、または終話コマンドワード］に対応するコマンドデータ［発呼コマンドデータ、または応答コマンドデータ、または終話コマンドデータ］を送信コマンド蓄積部１ｍに一時保存した後に読み出して、パケット信号のコマンドエリアＤ１に格納し（通話回線が接続状態であれば、上記音声データおよび映像データも音声エリアＤ２および映像エリアＤ３に格納し）、ネットワークＩ／Ｆ部１ｈからネットワークＮＴを介して通話先の通話装置１にパケット信号を送信する。

また、制御部１ａは、通話先からネットワークＮＴ、ネットワークＩ／Ｆ部１ｈを介して、コマンドエリアＤ１にコマンドデータが格納されたパケット信号を受信すると、コマンドエリアＤ１に格納されているコマンドデータを、受信コマンド蓄積部１ｎに一時保存する。次に制御部１ａは、受信コマンド蓄積部１ｎのコマンドデータを読み出して、コマンドデータに基づいた処理を行う。すなわちユーザが、発呼、応答、終話の各コマンドワードに設定されている言葉を発すれば、音声認識部１ｐが各コマンドワードに対応する処理を行うことで、ハンズフリー操作が可能となる。

図４は、本通話システムの一対の通話装置１１−１２間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置１１はユーザＡが使用し、通話装置１２はユーザＢが使用するものとする。

まず、発呼動作を行うために、ユーザＡが通話装置１１のマイクロホンＭに対して「Ｂ君につないで」という言葉を入力すると、音声認識部１ｐにおいて、入力された言葉と発呼コマンド格納部１ｑ内のコマンドワード「Ｂ君につないで」とが一致するとして、発呼音声一致信号を制御部１ａへ出力する。制御部１ａは、Ｂ君の電話番号（またはＩＰアドレス）をコマンドワード「Ｂ君につないで」に対応させて予め格納しており、前記認識結果に基づいてユーザＢの通話装置１２へ発呼コマンドデータのみを格納した発呼通知Ｐ１を送信する（発呼処理）。なお、この発呼通知Ｐ１の送信経路については、図示しない呼制御サーバを用いて発信先の電話番号とＩＰアドレスとの対応付けを行う方法や、ＩＰアドレスのみを用いて通話装置１１から通話装置１２へ直接送信する方法等が周知であり、詳細な説明は省略する。

ネットワークＮＴを介して発呼通知Ｐ１を受信した通話装置１２では、制御部１ａがスピーカＳＰから呼び出し音を鳴動させる。この呼出音に反応したユーザＢが通話装置１２のマイクロホンＭに対して「応答して」という言葉を入力すると、音声認識部１ｐにおいて、入力された言葉と応答コマンド格納部１ｒ内のコマンドワード「応答して」とが一致するとして、応答音声一致信号を制御部１ａへ出力する。制御部１ａは、前記認識結果に基づいてユーザＡの通話装置１１へ応答コマンドデータのみを格納した応答通知Ｐ２を送信する（応答処理）。

ネットワークＮＴを介して応答通知Ｐ２を受信した通話装置１１では、制御部１ａが、予め決められた応答確認コマンドデータのみを格納した応答確認Ｐ３を通話装置１２へ送信し、マイクロホンＭからの音声データ、カメラＣからの映像データを格納したパケット信号を生成して送信する通話機能を実行状態にする（応答確認処理）。

ネットワークＮＴを介して応答確認Ｐ３を受信した通話装置１２では、制御部１ａが、マイクロホンＭからの音声データ、カメラＣからの映像データを格納したパケット信号を生成して送信する通話機能を実行状態にすることで、通話装置１１−１２間の通話回線が確立される（回線確立処理）。

以降は、通話装置１１−１２間で、音声データおよび映像データを格納したパケット信号Ｐａを互いに送受信して、通話が行われる。以降、終話コマンドワードが入らない会話がユーザＡ，Ｂ間で行われている間は、パケット信号ＰａのコマンドエリアＤ１には終話コマンドデータが格納されることがない。

そして、ユーザＡが通話を終了させようとして、通話装置１１のマイクロホンＭに対して「さよなら」という言葉を入力すると、音声認識部１ｐにおいて、入力された言葉と終話コマンド格納部１ｓ内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部１ａへ出力する。制御部１ａは、前記認識結果に基づいてユーザＢの通話装置１２へ終話コマンドデータを格納した終話パケット信号Ｐ４を送信すると同時に、内部に具備したタイマ部１００の計時動作を開始する［計時開始手段］。そして制御部１ａは、タイマ部１００の計時時間を、終話タイマ値格納部１ｇに予め設定している終話タイマ値Ｔ１と比較し、タイマ部１００の計時時間が終話タイマ値Ｔ１内であれば、通話装置１１の制御部１ａは通常モードから終話待ちモードとなる。

ネットワークＮＴを介して終話パケット信号Ｐ４を受信した通話装置１２では、表示制御手段としても機能する制御部１ａが、表示手段を構成するＬＥＤ１ｚを点灯させることで、ユーザＢに対して終話待ち状態であること報知する。そして通話装置１２においても、ユーザＡの発した「さよなら」に反応したユーザＢが通話を終了させようとして、マイクロホンＭに対して「さよなら」という言葉を入力すると、音声認識部１ｐにおいて、入力された言葉と終話コマンド格納部１ｓ内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部１ａへ出力する。制御部１ａは、前記認識結果に基づいてユーザＡの通話装置１１へ終話コマンドデータを格納した終話パケット信号Ｐ５を送信する［終話コマンド送信手段］。なお、通話装置１２では、終話パケット信号Ｐ５を送信した時点でＬＥＤ１ｚを消灯させる。

ネットワークＮＴを介して終話パケット信号Ｐ５を受信した通話装置１１において、タイマ部１００の計時時間が終話タイマ値Ｔ１に達しておらず、終話待ちモードを維持しておれば［終話処理開始トリガ］、制御部１ａは、終話処理可能であると判断して、予め決められた終話通知コマンドデータのみを格納した終話通知Ｐ６をユーザＢの通話装置１２へ送信した後に、通話機能を停止して通話回線を切断する［第１の終話処理手段］。そして、ネットワークＮＴを介して終話通知Ｐ６を受信した通話装置１２では、制御部１ａが、通話機能を停止して通話回線を切断する［第２の終話処理手段］（終話処理）。

また、通話装置１１において、終話パケット信号Ｐ５を受信しなければ（すなわち、ユーザＢが通話を終了させるための「さよなら」という言葉を発しておらず、終話処理開始トリガが発生しなければ）、図５に示すように、タイマ部１００の計時時間が終話タイマ値Ｔ１に達した時点で、制御部１ａは、タイマ部１００の計時時間をリセットして終話待ちモードを終了し、予め決められたタイムアウトコマンドデータを格納したタイムアウトパケット信号Ｐ１１を、ユーザＢの通話装置１２へ送信する。以降は、通話装置１１または１２が終話待ちモードに再び切り替わるまで、音声データおよび映像データを格納したパケット信号Ｐａを互いに送受信する通常の通話処理を行う。この場合、通話装置１２では、終話パケット信号Ｐ４を受信した時点でＬＥＤ１ｚを点灯させ、タイムアウトパケット信号Ｐ１１を受信した時点でＬＥＤ１ｚを消灯させる。

而して、通話装置１１は、タイマ部１００の計時時間が終話タイマ値Ｔ１に達した後に、終話パケット信号Ｐ５を受信したとしても、ユーザＢの通話装置１２へ終話通知Ｐ６を送信することはなく、通話機能を停止して通話回線を切断することもない。すなわち、終話処理を行うことはない。

したがって、通話装置１１，１２の双方が終話タイマ値Ｔ１内に終話コマンドワードを発した場合のみ、双方が終話の意思表示をしたものとみなして終話処理を行い、通話回線を切断する。したがって、一方の通話中の会話に入った「さよなら」という言葉や、一定時間以上の間隔で双方から発せられた「さよなら」という言葉によって、通話回線が切断されてしまう誤認識を防止できる。さらに、日常的に通話を終了させる「さよなら」のような言葉を終話コマンドワードとして使用でき、使い勝手がよいものとなる。

（実施形態２）
本実施形態の通話システムは、実施形態１と同様に図１の構成を備えており、説明は省略する。

図６は、本通話システムの一対の通話装置１１−１２間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置１１はユーザＡが使用し、通話装置１２はユーザＢが使用するものとする。

発呼通知Ｐ１を用いた発呼処理、応答通知Ｐ２を用いた応答処理、応答確認Ｐ３を用いた応答確認処理および回線確立処理、音声データおよび映像データを格納したパケット信号Ｐａを用いた通話処理については実施形態１と同様であり、説明は省略する。

そして、ユーザＡが通話を終了させようとして、通話装置１１のマイクロホンＭに対して「さよなら」という言葉を入力すると、音声認識部１ｐにおいて、入力された言葉と終話コマンド格納部１ｓ内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部１ａへ出力する。制御部１ａは、前記認識結果に基づいてユーザＢの通話装置１２へ終話コマンドデータを格納した終話パケット信号Ｐ４を送信する［終話コマンド送信手段］。

ネットワークＮＴを介して終話パケット信号Ｐ４を受信した通話装置１２では、制御部１ａが内部に具備したタイマ部１００の計時動作を開始する［計時開始手段］。そして制御部１ａは、タイマ部１００の計時時間を、終話タイマ値格納部１ｇに予め設定している終話タイマ値Ｔ１と比較し、タイマ部１００の計時時間が終話タイマ値Ｔ１内であれば、通話装置１２の制御部１ａは通常モードから終話待ちモードとなる。さらに、表示制御手段としても機能する制御部１ａが、表示手段を構成するＬＥＤ１ｚを点灯させることで、ユーザＢに対して終話待ち状態であること報知する。

そして、ユーザＡの発した「さよなら」に反応したユーザＢが通話を終了させようとして、通話装置１２のマイクロホンＭに対して「さよなら」という言葉を入力すると、音声認識部１ｐにおいて、入力された言葉と終話コマンド格納部１ｓ内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部１ａへ出力する。終話音声一致信号を受け取った制御部１ａは、タイマ部１００の計時時間が終話タイマ値Ｔ１に達しておらず、終話待ちモードを維持しておれば［終話処理開始トリガ］、終話処理可能であると判断して、予め決められた終話通知コマンドデータのみを格納した終話通知Ｐ６をユーザＡの通話装置１１へ送信した後に、通話機能を停止して通話回線を切断する［第１の終話処理手段］。そして、ネットワークＮＴを介して終話通知Ｐ６を受信した通話装置１１では、制御部１ａが、通話機能を停止して通話回線を切断する［第２の終話処理手段］（終話処理）。なお、通話装置１２では、終話通知Ｐ６を送信した時点でＬＥＤ１ｚを消灯させる。

また、通話装置１２において、ユーザＢが通話を終了させるための「さよなら」という言葉を発することなく、終話処理開始トリガが発生しなければ、タイマ部１００の計時時間が終話タイマ値Ｔ１に達した時点で、制御部１ａは、タイマ部１００の計時時間をリセットして終話待ちモードを終了する。以降は、通話装置１１または１２が終話待ちモードに再び切り替わるまで、音声データおよび映像データを格納したパケット信号Ｐａを互いに送受信する通常の通話処理を行う。

而して、通話装置１２は、タイマ部１００の計時時間が終話タイマ値Ｔ１に達した後に、ユーザＢが通話を終了させるための「さよなら」という言葉を発したとしても、ユーザＡの通話装置１１へ終話通知Ｐ６を送信することはなく、通話機能を停止して通話回線を切断することもない。すなわち、終話処理を行うことはない。

（実施形態３）
図７は本実施形態の通話システムの構成を示し、実施形態１の通話装置１に無音タイマ値格納部１ｔを設けたものであり、実施形態１と同様の構成には同一の符号を付して説明は省略する。

図８は、本通話システムの一対の通話装置１１−１２間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置１１はユーザＡが使用し、通話装置１２はユーザＢが使用するものとする。

ネットワークＮＴを介して終話パケット信号Ｐ４を受信した通話装置１２においても、ユーザＡの発した「さよなら」に反応したユーザＢが通話を終了させようとして、マイクロホンＭに対して「さよなら」という言葉を入力すると、音声認識部１ｐにおいて、入力された言葉と終話コマンド格納部１ｓ内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部１ａへ出力する。制御部１ａは、前記認識結果に基づいてユーザＡの通話装置１１へ終話コマンドデータを格納した終話パケット信号Ｐ５を送信する［終話コマンド送信手段］。

ネットワークＮＴを介して終話パケット信号Ｐ５を受信した通話装置１１において、タイマ部１００の計時時間が終話タイマ値Ｔ１に達しておらず、終話待ちモードを維持しておれば［終話処理開始トリガ］、制御部１ａが、タイマ部１００の計時時間をリセットした後に計時動作を再開し、タイマ部１００の計時時間を、無音タイマ値格納部１ｔに予め設定している無音タイマ値Ｔ２と比較する。そして、タイマ部１００の計時時間が無音タイマ値Ｔ２に達するまでユーザＡ，Ｂの双方が言葉を発することなく無音状態が継続すれば、終話処理可能であると判断して、予め決められた終話通知コマンドデータのみを格納した終話通知Ｐ６をユーザＢの通話装置１２へ送信した後に、通話機能を停止して通話回線を切断する［第１の終話処理手段］。そして、ネットワークＮＴを介して終話通知Ｐ６を受信した通話装置１２では、制御部１ａが、通話機能を停止して通話回線を切断する［第２の終話処理手段］（終話処理）。

また、図９のように、無音タイマ値Ｔ２の計時中にユーザＡが「それでね」という会話を継続させる言葉を発すると、通話装置１１の制御部１ａはタイマ部１００の計時動作をリセットして通常モードに戻るとともに、予め決められた通話継続コマンドデータを格納した通話継続パケット信号Ｐ１２を、ユーザＢの通話装置１２へ送信する。以降は、通話装置１１または１２が終話待ちモードに再び切り替わるまで、音声データおよび映像データを格納したパケット信号Ｐａを互いに送受信する通常の通話処理を行う。

例えば、ユーザＡ−Ｂ間の会話中に、例えば「Ｃ君に会って、さよならと言ったけど返事してくれなかったの」に対して、「そう、さよならも言ってくれなかったの」のように、通常の会話の中で「さよなら」を双方が発する場合が考えられ、この通常の会話中に発せられた双方の「さよなら」を終話コマンドワードと誤認識する虞がある。

しかしながら本実施形態では、通常の電話であり得るお別れの挨拶の後、受話器を置くまで何も言わないということを利用して、双方の「さよなら」を終話コマンドワードとして認識した後、無音タイマ値Ｔ２の間、双方が何も話さない無音状態が継続した場合にのみ通話回線を切断しており、通常の会話中の「さよなら」とお別れの挨拶の「さよなら」とを、無音期間の有無によって区別して、終話コマンドワードの誤認識を防止できる。

なお、本実施形態の無音期間の有無によって終話処理を行か否かを判断する構成は、実施形態２の構成に適用しても上記同様の効果を得ることができる。

（実施形態４）
図１０は本実施形態の通話システムの構成を示し、実施形態１の通話装置１にジェスチャー待ちタイマ値格納部１ｕ、ジェスチャー認識部１ｖ、終話得ジェスチャー記憶部１ｗを設けたものであり、実施形態１と同様の構成には同一の符号を付して説明は省略する。

図１１は、本通話システムの一対の通話装置１１−１２間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置１１はユーザＡが使用し、通話装置１２はユーザＢが使用するものとする。

そして、ユーザＡが通話を終了させようとして、通話装置１１のマイクロホンＭに対して「さよなら」という言葉を入力すると、音声認識部１ｐにおいて、入力された言葉と終話コマンド格納部１ｓ内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部１ａへ出力する。制御部１ａは、前記認識結果に基づいてユーザＢの通話装置１２へ終話コマンドデータを格納した終話パケット信号Ｐ４を送信すると同時に、内部に具備したタイマ部１００の計時動作を開始する［計時開始手段］。そして制御部１ａは、タイマ部１００の計時時間を、終話タイマ値格納部１ｇに予め設定している終話タイマ値Ｔ１、およびジェスチャー待ちタイマ値格納部１ｕに予め設定しているジェスチャー待ちタイマ値Ｔ３と比較し、タイマ部１００の計時時間が終話タイマ値Ｔ１またはジェスチャー待ちタイマ値Ｔ３内であれば、通話装置１１の制御部１ａは通常モードから終話待ちモードとなる。なお、本実施形態では、終話タイマ値Ｔ１＜ジェスチャー待ちタイマ値Ｔ３の関係にあるが、Ｔ１＝Ｔ３、Ｔ１＞Ｔ３の関係に設定してもよい。さらには、終話タイマ値Ｔ１とジェスチャー待ちタイマ値Ｔ３との各計時期間が重複することなく、例えば終話タイマ値Ｔ１を計時した後にジェスチャー待ちタイマ値Ｔ３を計時する構成でもよい。

ネットワークＮＴを介して終話パケット信号Ｐ５を受信した通話装置１１では、タイマ部１００の計時時間が終話タイマ値Ｔ１に達していなければ、終話処理開始トリガの発生を記憶する。

さらに、本実施形態では、終話処理開始トリガが発生し、且つタイマ部１００の計時時間がジェスチャー待ちタイマ値Ｔ３に達するまでに、ユーザＡ，Ｂの双方が終話動作を行えば終話処理可能であると判断する。

各通話装置１において、終話ジェスチャー記憶部１ｗには、「お辞儀」や「手を振る」等の終話時に一般的に行われるジェスチャーを映像データ（終話ジェスチャーデータ）で格納している。そして、ジェスチャー認識部１ｖは、自己映像蓄積部１ｊに保存されている映像データを、終話ジェスチャー記憶部１ｗに格納している終話ジェスチャーデータと比較して、映像データ中に終話ジェスチャーデータと一致する映像があれば、ユーザの終話ジェスチャーを検知したとして、終話ジェスチャー一致信号を制御部１ａに出力する。

制御部１ａは、ジェスチャー認識部１ｖによる認識結果から、終話動作コマンドデータを送信コマンド蓄積部１ｍに一時保存した後に読み出して、パケット信号のコマンドエリアＤ１に格納し（通話回線が接続状態であれば、上記音声データおよび映像データも音声エリアＤ２および映像エリアＤ３に格納し）、ネットワークＩ／Ｆ部１ｈからネットワークＮＴを介して通話先の通話装置１にパケット信号を送信する。

而して、通話装置１１においてジェスチャー待ちタイマ値Ｔ３の計時中に、例えば、通話装置１２がユーザＢの「お辞儀」や「手を振る」等の終話ジェスチャーを検知すると、終話動作コマンドを格納したパケット信号Ｐ７が通話装置１２から通話装置１１へ送信される。ネットワークＮＴを介してパケット信号Ｐ７を受信した通話装置１１においても、ユーザＢの終話ジェスチャーに反応したユーザＡが、終話ジェスチャーを行うと、ジェスチャー認識部１ｖの認識結果に基づいてユーザＢの通話装置１２へ終話動作コマンドデータを格納したパケット信号Ｐ８を送信するとともに、当該認識結果を制御部１ａに出力する。したがって、通話装置１１の制御部１ａは、終話処理開始トリガが発生し、且つ通話装置１１，１２ともにユーザが終話ジェスチャーを行ったので終話処理可能であると判断して、予め決められた終話通知コマンドデータのみを格納した終話通知Ｐ６をユーザＢの通話装置１２へ送信し、通話機能を停止して通話回線を切断する［第１の集話処理手段］。そして、ネットワークＮＴを介して終話通知Ｐ６を受信した通話装置１２では、制御部１ａが、通話機能を停止して通話回線を切断する［第２の集話処理手段］（終話処理）。

このように本実施形態では、一般的な会話でお別れの挨拶をした以降に「お辞儀」や「手を振る」等のジェスチャーが行われることを利用して、双方の「さよなら」を終話コマンドワードとして認識した後、ジェスチャー待ちタイマ値Ｔ３の間に、双方が「お辞儀」や「手を振る」等のジェスチャーを行った場合にのみ通話回線を切断しており、通常の会話中の「さよなら」とお別れの挨拶の「さよなら」とを、終話ジェスチャーの有無によって区別して、終話コマンドワードの誤認識を防止できる。また、ユーザＡ，Ｂのいずれか一方が終話動作を行えば終話処理可能であると判断してもよい。

また、終話パケット信号Ｐ４，Ｐ５、終話動作コマンドを格納したパケット信号Ｐ７，Ｐ８が送信される順番は図１１の例に限定されることなく、例えば、ユーザＡが「さよなら」という終輪コマンドワードを発するとともに「お辞儀」や「手を振る」等の終話ジェスチャーを行い、その後にユーザＢが「さよなら」という終輪コマンドワードを発するとともに「お辞儀」や「手を振る」等の終話ジェスチャーを行う場合でも、上記同様に動作する。この場合、終話パケット信号Ｐ４ → 終話動作コマンドを格納したパケット信号Ｐ７ → 終話パケット信号Ｐ５ → 終話動作コマンドを格納したパケット信号Ｐ８のように、パケット信号Ｐ４〜Ｐ７がタイマ値Ｔ１，Ｔ３内に混在する。

なお、本実施形態の終話ジェスチャーの有無によって終話処理を行か否かを判断する構成は、実施形態２の構成に適用しても上記同様の効果を得ることができる。

（実施形態５）
図１２は本実施形態の通話システムの構成を示し、実施形態１の通話装置１に離席タイマ値格納部１ｘ、測距センサ１ｙを設けたものであり、実施形態１と同様の構成には同一の符号を付して説明は省略する。

図１３は、本通話システムの一対の通話装置１１−１２間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置１１はユーザＡが使用し、通話装置１２はユーザＢが使用するものとする。

ネットワークＮＴを介して終話パケット信号Ｐ５を受信した通話装置１１において、タイマ部１００の計時時間が終話タイマ値Ｔ１に達しておらず、終話待ちモードを維持しておれば［終話処理開始トリガ］、制御部１ａが、タイマ部１００の計時時間をリセットした後に計時動作を再開し、タイマ部１００の計時時間を、離席タイマ値格納部１ｘに予め設定している離席タイマ値Ｔ４と比較する。

そして本実施形態では、タイマ部１００の計時時間が離席タイマ値Ｔ４に達するまでに、少なくともユーザＡ，Ｂのいずれかが、通話を行うための定位置から離席すれば終話処理可能であると判断する。

ここで、通話装置１の測距センサ１ｙは、通話中のユーザを検知対象として当該ユーザまでの距離を測定している。制御部１ａは、ユーザまでの距離が所定距離未満であれば、通話を行うための定位置に着席中であると判定し、ユーザまでの距離が所定距離以上であれば、通話を行うための定位置から離席したと判定するとともに通話先へ離席通知を送信する。

而して、通話装置１２がユーザＢの離席を検知した場合、図１３に示すように、予め決められた離席通知コマンドデータのみを格納した離席通知Ｐ１３をユーザＡの通話装置１１へ送信する。そして、通話装置１１では、タイマ部１００の計時時間が離席タイマ値Ｔ４に達するまでに離席通知Ｐ１３を受信すれば、制御部１ａが、通話機能を停止して通話回線を切断するとともに、予め決められた終話通知コマンドデータのみを格納した終話通知Ｐ６をユーザＢの通話装置１２へ送信する［第１の終話処理手段］。そして、ネットワークＮＴを介して終話通知Ｐ６を受信した通話装置１２では、制御部１ａが、通話機能を停止して通話回線を切断する［第２の終話処理手段］（終話処理）。

また、通話装置１１が、タイマ部１００の計時時間が離席タイマ値Ｔ４に達するまでにユーザＡの離席を検知した場合は、制御部１ａが、通話機能を停止して通話回線を切断するとともに、予め決められた終話通知コマンドデータのみを格納した終話通知Ｐ６をユーザＢの通話装置１２へ送信する［第１の終話処理手段］。そして、ネットワークＮＴを介して終話通知Ｐ６を受信した通話装置１２では、制御部１ａが、通話機能を停止して通話回線を切断する［第２の終話処理手段］（終話処理）。

このように本実施形態では、一般的な会話でお別れの挨拶をした以降にユーザが席を離れることを利用して、双方の「さよなら」を終話コマンドワードとして認識した後、離席タイマ値Ｔ４の間に、少なくともいずれか一方が席を離れた場合に通話回線を切断しており、通常の会話中の「さよなら」とお別れの挨拶の「さよなら」とを、離席の有無によって区別して、終話コマンドワードの誤認識を防止できる。

また、測距センサの代わりに、人感センサや顔認識手段を用いてユーザの離席を検知してもよい。なお、顔認識手段は、撮像範囲におけるユーザの顔の位置を認識するものであり、撮像範囲から顔が外れることによって離席検知を行う。

なお、本実施形態の離席の有無によって終話処理を行か否かを判断する構成は、実施形態２の構成に適用しても上記同様の効果を得ることができる。

（実施形態６）
図１４は本実施形態の通話システムの構成を示し、実施形態３の通話装置１にＬＥＤ１ｚを設けたものであり、実施形態１と同様の構成には同一の符号を付して説明は省略する。

図１５は、本通話システムの一対の通話装置１１−１２間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置１１はユーザＡが使用し、通話装置１２はユーザＢが使用するものとする。

そして、ユーザＡが通話を終了させようとして、通話装置１１のマイクロホンＭに対して「さよなら」という言葉を入力すると、音声認識部１ｐにおいて、入力された言葉と終話コマンド格納部１ｓ内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部１ａへ出力する。制御部１ａは、前記認識結果に基づいてユーザＢの通話装置１２へ終話コマンドデータを格納した終話パケット信号Ｐ４を送信すると同時に［終話コマンド送信手段］、内部に具備したタイマ部１００の計時動作を開始し［計時開始手段］、さらにはＬＥＤ１ｚを黄色点灯させる。そして制御部１ａは、タイマ部１００の計時時間を、終話タイマ値格納部１ｇに予め設定している終話タイマ値Ｔ１と比較し、タイマ部１００の計時時間が終話タイマ値Ｔ１内であれば、通話装置１１の制御部１ａは通常モードから終話待ちモードとなる。

通話装置１２では、ネットワークＮＴを介して終話パケット信号Ｐ４を受信すると、内部に具備したタイマ部１００の計時動作を開始し［計時開始手段］、さらにはＬＥＤ１ｚを黄色点灯させる。そして制御部１ａは、タイマ部１００の計時時間を、終話タイマ値格納部１ｇに予め格納している終話タイマ値Ｔ１と比較し、タイマ部１００の計時時間が終話タイマ値Ｔ１内であれば、通話装置１２の制御部１ａは終話待ちモードとなる。

そして、通話装置１２においても、ユーザＡの発した「さよなら」に反応したユーザＢが通話を終了させようとして、マイクロホンＭに対して「さよなら」という言葉を入力すると、音声認識部１ｐにおいて、入力された言葉と終話コマンド格納部１ｓ内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部１ａへ出力する。終話音声一致信号を受け取った制御部１ａは、タイマ部１００の計時時間が終話タイマ値Ｔ１に達しておらず、終話待ちモードを維持しておれば［終話処理開始トリガ］、ＬＥＤ１ｚを赤色点灯させるとともに、タイマ部１００の計時時間をリセットした後に計時動作を再開し、タイマ部１００の計時時間を、無音タイマ値格納部１ｔに予め設定している無音タイマ値Ｔ２と比較する。さらには、前記認識結果に基づいてユーザＡの通話装置１１へ終話コマンドデータを格納した終話パケット信号Ｐ５を送信する［終話コマンド送信手段］。

ネットワークＮＴを介して終話パケット信号Ｐ５を受信した通話装置１１において、タイマ部１００の計時時間が終話タイマ値Ｔ１に達しておらず、終話待ちモードを維持しておれば［終話処理開始トリガ］、制御部１ａは、ＬＥＤ１ｚを赤色点灯させるとともに、タイマ部１００の計時時間をリセットした後に計時動作を再開し、タイマ部１００の計時時間を、無音タイマ値格納部１ｔに予め設定している無音タイマ値Ｔ２と比較する。

そして本実施形態では、タイマ部１００の計時時間が無音タイマ値Ｔ２に達するまでに、ユーザＡ，Ｂの双方が言葉を発することなく無音状態が継続すれば、終話処理可能であると判断する。

而して、通話装置１１，１２において無音タイマ値Ｔ２の間、無音状態が継続すれば、図１５に示すように、通話装置１１，１２の各制御部１ａは、通話機能を停止して通話回線を切断する（終話処理）。

また、無音タイマ値Ｔ２の計時中にユーザＡが「それでね」という会話を継続させる言葉を発すると、通話装置１１の制御部１ａはタイマ部１００の計時動作をリセットして通常モードに戻るとともに、予め決められた通話継続コマンドデータを格納した通話継続パケット信号（図示なし）を、ユーザＢの通話装置１２へ送信する。通話継続パケット信号を受信した通話装置１２においても、制御部１ａがタイマ部１００の計時動作をリセットして通常モードに戻る。以降は、通話装置１１および１２が終話待ちモードに再び切り替わるまで、音声データおよび映像データを格納したパケット信号Ｐａを互いに送受信する通常の通話処理を行う。

このように本実施形態では、通常の電話であり得るお別れの挨拶の後、受話器を置くまで何も言わないということを利用して、双方の「さよなら」を終話コマンドワードとして認識した後、無音タイマ値Ｔ２の間、双方が何も話さない無音状態が継続した場合にのみ通話回線を切断しており、通常の会話中の「さよなら」とお別れの挨拶の「さよなら」とを、無音期間の有無によって区別して、終話コマンドワードの誤認識を防止できる。

さらに、通話装置１１，１２の双方がタイマ部１００による計時動作を個別に行い、終話タイマ値Ｔ１内にユーザがコマンドワード「さよなら」を発したか否かを個別に判別するので、実施形態３のように終話通知Ｐ６を送信する必要がなく、通信トラフィックの低減化を図ることができる。

さらにユーザは、通話先が終話処理に移行中であることをＬＥＤ１ｚの発光色によって判断でき、さらには終話処理に至る進行度合もＬＥＤ１ｚの発光色によって判断できるので、ユーザによる誤切断を抑制できる。また、ＬＥＤ１ｚの発光色の変化に連動して、モニタ装置２にＬＥＤ１ｚの発光色が意味する内容を文字で表示したり、モニタ装置２の表示色も黄色から赤色に徐々に変化させてもよい。

また、実施形態４，５では、終話パケット信号Ｐ４を送信した通話装置１１のみがタイマ部１００を動作させて、終話タイマ値Ｔ１の計時を行う構成、または終話パケット信号Ｐ４を受信した通話装置１２のみがタイマ部１００を動作させて、終話タイマ値Ｔ１の計時を行う構成を示したが、実施形態４，５においても、実施形態６と同様に終話パケット信号Ｐ４を送受信した通話装置１１，１２の双方がタイマ部１００を動作させて、終話タイマ値Ｔ１の計時を行う構成や、終話処理に至る進行度合をＬＥＤの発光色によって判断する構成を適用することは可能である。

さらに、上記実施形態では、伝送路としてインターネットを用いており、パケット通信によって音声データ、画像データ、各種コマンドデータ等を送信している。しかし、伝送路として一般電話回線を用いてもよく、この場合はコマンドデータとしてトーン信号が用いられる。また、一般電話回線で音声データ、画像データを送信し、インターネットでコマンドデータを送信してもよい。

１通話装置
１００タイマ部
１ａ制御部
１ｇ終話タイマ値格納部
１ｐ音声認識部
１ｓ終話コマンド格納部
Ｃカメラ
Ｍマイクロホン
ＳＰスピーカ
ＮＴインターネット

Claims

一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、
各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、
制御部は、
前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、
前記終話音声一致信号が音声認識部から出力された場合に、タイマ部による計時を開始する計時開始手段と、
少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第１の所定値に達するまでに通話先から終話コマンドを含むデータを受信する終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段と
を具備する
ことを特徴とする通話システム。
一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、
各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、
制御部は、
前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、
通話先から終話コマンドを含むデータを受信した場合に、タイマ部による計時を開始する計時開始手段と、
少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第１の所定値に達するまでに前記終話音声一致信号が音声認識部から出力される終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段と
を具備する
ことを特徴とする通話システム。
一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、
各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、
制御部は、
前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、
前記終話音声一致信号が音声認識部から出力された場合、または通話先から終話コマンドを含むデータを受信した場合、タイマ部による計時を開始する計時開始手段と、
少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第１の所定値に達するまでに通話先から終話コマンドを含むデータを受信する終話処理開始トリガが発生した場合、またはタイマ部による計時が開始されてから計時時間が予め設定された第１の所定値に達するまでに前記終話音声一致信号が音声認識部から出力される終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段と
を具備する
ことを特徴とする通話システム。
前記制御部の終話処理手段は、前記終話処理開始トリガが発生した後、タイマ部による計時時間が予め設定された第２の所定値に達するまでに通話先との間で通話が行われなければ、通話先との通信を停止することを特徴とする請求項１乃至３いずれか記載の通話システム。
各通話装置は、通話を行うユーザが所定範囲内に存在するか否かを検知するユーザ検知手段を備え、
前記制御部の終話処理手段は、前記終話処理開始トリガが発生した後、タイマ部による計時時間が予め設定された第２の所定値に達するまでに、少なくとも一方の通話装置のユーザ検知手段が所定範囲内のユーザを検知しなくなれば、通話先との通信を停止する
ことを特徴とする請求項１乃至３いずれか記載の通話システム。
各通話装置は、ユーザを撮像する撮像手段と、終話時にユーザが行う動作の映像データを格納した終話ジェスチャー記憶部と、撮像手段からの映像データが終話ジェスチャー記憶部に格納している映像データに一致するか否かを判定し、一致した場合には終話ジェスチャー一致信号を出力するジェスチャー認識部とを備え、
前記制御部の終話処理手段は、前記終話処理開始トリガが発生し、且つタイマ部による計時が開始されてから計時時間が予め設定された第２の所定値に達するまでに、少なくとも一方の通話装置のジェスチャー認識部から終話ジェスチャー一致信号が出力されると、通話先との通信を停止する
ことを特徴とする請求項１乃至３いずれか記載の通話システム。
各通話装置は、表示手段と、当該表示手段の表示動作を制御する表示制御手段とを備え、
表示制御手段は、通話先から終話コマンドを含むデータを受信すると、表示手段の表示を変化させることを特徴とする請求項１乃至６いずれか記載の通話システム。