JP6246848B2 - 情報処理装置、音声通信方法、及び音声通話プログラム - Google Patents

情報処理装置、音声通信方法、及び音声通話プログラム Download PDF

Info

Publication number
JP6246848B2
JP6246848B2 JP2016043644A JP2016043644A JP6246848B2 JP 6246848 B2 JP6246848 B2 JP 6246848B2 JP 2016043644 A JP2016043644 A JP 2016043644A JP 2016043644 A JP2016043644 A JP 2016043644A JP 6246848 B2 JP6246848 B2 JP 6246848B2
Authority
JP
Japan
Prior art keywords
data
sound
information processing
processing apparatus
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016043644A
Other languages
English (en)
Other versions
JP2017163212A (ja
Inventor
ティースワンマイ チャン
ティースワンマイ チャン
森 英俊
森  英俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Singapore Pte Ltd
Original Assignee
Lenovo Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Singapore Pte Ltd filed Critical Lenovo Singapore Pte Ltd
Priority to JP2016043644A priority Critical patent/JP6246848B2/ja
Publication of JP2017163212A publication Critical patent/JP2017163212A/ja
Application granted granted Critical
Publication of JP6246848B2 publication Critical patent/JP6246848B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)

Description

本発明は、情報処理装置、音声通信方法、及び音声通話プログラムに関するものである。
ネットワークを介して通信可能に構成され、マイク及びスピーカを含むオーディオデバイスを備えた情報処理装置では、Skype(登録商標)等のVoIP(Voice over Internet Protocol)アプリケーションを用いて音声データを送受信(以下「音声通信」という。)する人が増えている。VoIPは、インターネットやイントラネットなどのTCP/IP(Transmission Control Protocol/Internet Protocol)ネットワークを使って音声データを送受信する技術であり、社内LAN(Local Area Network)を使った内線電話や、インターネット電話などに応用されている。
特開2012−147397号公報
しかしながら、上述の音声通信では、送信側の情報処理装置の周辺環境が良くなく、送信側のユーザの音声とは異なる音がノイズ成分として重畳して受信側の情報処理装置へ送信される場合がある。また、通信異常等を原因として、電気的なノイズが音声に重畳して受信側の情報処理装置へ送信される場合がある。
ノイズが音声に重畳されて受信側の情報処理装置へ送信されると、受信側のユーザは、送信元の音声を聞き取り難い又は全く音声を聞き取れず、受信側のユーザが送信側のユーザへ返答できない場合がある。
このような場合、送信側のユーザは、受信側のユーザが返答しない理由が分からず、ユーザ間の会話に支障が生じる場合がある。
本発明は、このような事情に鑑みてなされたものであって、他の情報処理装置との間で通話を行っている場合に、通話に係る通信状態をユーザが容易に認知できる、情報処理装置、音声通信方法、及び音声通話プログラムを提供することを目的とする。
上記課題を解決するために、本発明の情報処理装置、音声通信方法、及び音声通話プログラムは以下の手段を採用する。
本発明の参考例に係る情報処理装置は、画像を表示する画像表示手段、音が入力される音入力手段、及び音を出力する音出力手段を有し、他の情報処理装置との間で音データの送受信によって通話を行う情報処理装置であって、前記他の情報処理装置からの前記音データの受信を行う受信手段と、前記受信手段が前記他の情報処理装置から送信された前記音データを受信した場合、前記音データを受信したことを示す受信確認データを前記他の情報処理装置へ送信するフィードバック手段と、を備える。
本発明の第態様に係る情報処理装置は、他の情報処理装置との間で音データの送受信によって通話を行う情報処理装置であって、音が入力される音入力手段と、前記音入力手段に入力された音を示す音データを前記他の情報処理装置に送信する送信手段と、前記音入力手段に入力された音を示す前記音データに含まれる人の音声のデータを認識する音声認識手段と、前記他の情報処理装置から、前記音データに含まれる人の音声のデータを認識する音声認識の結果に応じたデータを受信確認データとして受信する受信手段と前記音声認識手段による認識結果と前記受信確認データとに基づいて、前記他の情報処理装置との通話状態を判定し、判定結果をユーザに報知する通話状態報知手段と、を備える。
本発明の第態様に係る音声通信システムは、他の情報処理装置との間で音データの送受信によって通話を行う情報処理装置であって、送信側手段と、受信側手段とを有し、前記送信側手段は、音が入力される音入力手段と、前記音入力手段に入力された音を示す音データを前記他の情報処理装置に送信する送信手段と、前記音入力手段に入力された音を示す前記音データに含まれる人の音声のデータを認識する音声認識手段と、前記他の情報処理装置から、前記音データに含まれる人の音声のデータを認識する音声認識の結果に応じたデータを受信確認データとして受信する受信手段と、前記音声認識手段による認識結果と前記受信確認データとに基づいて、前記他の情報処理装置との通話状態を判定し、判定結果をユーザに報知する通話状態報知手段と、を有し、前記受信側手段は、前記他の情報処理装置から音データを受信する受信手段と、前記受信手段によって受信された前記音データに含まれる人の音声のデータを認識し、音声認識の結果に応じたデータを受信確認データとして前記他の情報処理装置に送信するフィードバック手段とを備える。
本発明の参考例に係る音声通信方法は、画像を表示する画像表示手段、音が入力される音入力手段、及び音を出力する音出力手段を備える情報処理装置によって、他の情報処理装置との間で音データの送受信によって通話を行う音声通信方法であって、前記他の情報処理装置からの前記音データの受信を受信手段を介して行う第1工程と、前記受信手段が前記他の情報処理装置から送信された前記音データを受信した場合、前記音データを受信したことを示す受信確認データを前記他の情報処理装置へ送信する第2工程と、を有する。
本発明の第三態様に係る音声通信方法は、他の情報処理装置との間で音データの送受信によって通話を行う情報処理装置の音声通信方法であって、前記情報処理装置が、音が入力される音入力工程と、前記音入力工程において入力された音を示す音データを前記他の情報処理装置に送信する送信工程と、前記音入力工程において入力された音を示す前記音データに含まれる人の音声のデータを認識する音声認識工程と、前記他の情報処理装置から、前記音データに含まれる人の音声のデータを認識する音声認識の結果に応じたデータを受信確認データとして受信する受信工程と、前記音声認識工程による認識結果と前記受信確認データとに基づいて、前記他の情報処理装置との通話状態を判定し、判定結果をユーザに報知する通話状態報知工程と、を行う音声通信方法である。
本発明の第四態様に係る音声通信方法は、他の情報処理装置との間で音データの送受信によって通話を行う情報処理装置の音声通信方法であって、前記情報処理装置が、送信側工程と、受信側工程とを有し、前記送信側工程は、音が入力される音入力工程と、前記音入力工程において入力された音を示す音データを前記他の情報処理装置に送信する送信工程と、前記音入力工程に入力された音を示す前記音データに含まれる人の音声のデータを認識する音声認識工程と、前記他の情報処理装置から、前記音データに含まれる人の音声のデータを認識する音声認識の結果に応じたデータを受信確認データとして受信する受信工程と、前記音声認識工程による認識結果と前記受信確認データとに基づいて、前記他の情報処理装置との通話状態を判定し、判定結果をユーザに報知する通話状態報知工程と、を有し、前記受信側工程は、前記他の情報処理装置から音データを受信する受信工程と、前記受信工程によって受信された前記音データに含まれる人の音声のデータを認識し、音声認識の結果に応じたデータを受信確認データとして前記他の情報処理装置に送信するフィードバック工程とを行う音声通信方法である。
本発明の参考例に係るプログラムは、画像を表示する画像表示手段、音が入力される音入力手段、及び音を出力する音出力手段を有し、他の情報処理装置との間で音データの送受信によって通話を行うコンピュータを、前記他の情報処理装置からの前記音データの受信を行う受信手段と、前記受信手段が前記他の情報処理装置から送信された前記音データを受信した場合、前記音データを受信したことを示す受信確認データを前記他の情報処理装置へ送信するフィードバック手段と、して機能させる。
本発明の第態様に係る音声通話プログラムは、音が入力される音入力手段をするコンピュータにおいて、他の情報処理装置との間で音データの送受信によって通話を行うためのプログラムであって前記音入力手段に入力された音を示す音データを前記他の情報処理装置に送信する送信処理と、前記音入力手段において入力された音を示す前記音データに含まれる人の音声のデータを認識する音声認識処理と、前記他の情報処理装置から、前記音データに含まれる人の音声のデータを認識する音声認識の結果に応じたデータを受信確認データとして受信する受信処理と、前記音声認識処理による認識結果と前記受信確認データとに基づいて、前記他の情報処理装置との通話状態を判定し、判定結果をユーザに報知する通話状態報知処理と、をコンピュータに実行させる
本発明の第態様に係る音声通話プログラムは、音が入力される音入力手段を有するコンピュータにおいて、他の情報処理装置との間で音データの送受信によって通話を行うためのプログラムであって、送信側処理と、受信側処理とを有し、前記送信側処理は、前記音入力手段に入力された音を示す音データを前記他の情報処理装置に送信する送信処理と、前記音入力手段に入力された音を示す前記音データに含まれる人の音声のデータを認識する音声認識処理と、前記他の情報処理装置から、前記音データに含まれる人の音声のデータを認識する音声認識の結果に応じたデータを受信確認データとして受信する受信処理と、前記音声認識処理による認識結果と前記受信確認データとに基づいて、前記他の情報処理装置との通話状態を判定し、判定結果をユーザに報知する通話状態報知処理と、として機能させ、前記受信側処理は、前記他の情報処理装置から音データを受信する受信処理と、前記受信処理によって受信された前記音データに含まれる人の音声のデータを認識し、音声認識の結果に応じたデータを受信確認データとして前記他の情報処理装置に送信するフィードバック処理として機能させる。
本発明によれば、他の情報処理装置との間で通話を行っている場合に、通話に係る通信状態をユーザが容易に認知できる、という効果を有する。
本発明の実施形態に係るノートPCの外観図である。 本発明の実施形態に係るノートPCのハードウェアの構成を示す概略図である。 本発明の実施形態に係る通話判定機能に関する機能ブロック図である。 本発明の実施形態に係る送信側ノートPCにおける通話判定処理の流れを示すフローチャートである。 本発明の実施形態に係る受信側ノートPCにおける通話判定処理の流れを示すフローチャートである。
以下に、本発明に係る情報処理装置、音声通信方法、及び音声通話プログラムの一実施形態について、図面を参照して説明する。情報処理装置は、特定の1つである場合もあるし、不特定の複数である場合もあり、例えばサーバとして機能するコンピュータや、クライアントとして機能する個々の可搬型のパーソナルコンピュータ(以下「ノートPC」という。)や、あるいは、それらの組み合わせである。なお、本実施形態では、情報処理装置の一例として、情報処理装置がノートPCである場合について説明する。
図1は、本実施形態に係るノートPC1の概略外観図である。
ノートPC1は、同図に示すように、一例として、いずれも略直方体である本体側筐体2及びディスプレイ側筐体3を備える。
本体側筐体2は、入力部4を備える。入力部4は、ユーザが入力操作を行うためのユーザインターフェースであり、文字、コマンド等を入力する各種キーより構成されるキーボードや、画面上のカーソルを移動させたり、各種メニューを選択するタッチパッド等を備えている。
また、本体側筐体2は、音を出力するスピーカ6a,6bを備える。
ディスプレイ側筐体3は、画像を表示する画像表示手段としてのLCD(Liquid Crystal Display)7を備える。LCD7は、入力される表示データをビデオ信号に変換し、変換したビデオ信号に応じた各種情報を表示画面に表示する。なお、画像表示部は、LCDに限らず有機EL(Electroluminescence)ディスプレイ等の他の表示機器、又はタッチパネルとされてもよい。
また、ディスプレイ側筐体3は、マイク5及びカメラ8を備える。マイク5は、ユーザの音声やその周辺の音が入力される。マイク5は、ユーザの音声が選択的に入力されるように指向性を有するマイクが好ましい。カメラ8は、ディスプレイ側筐体3においてLCD7の表示面側でその上方の略中央に配置され、前方の被写体を撮像可能とされている。
本体側筐体2及びディスプレイ側筐体3は、それぞれの端部で左右の一対の連結部9a,9bによって連結されている。連結部9a,9bは、ヒンジであり、本体側筐体2及びディスプレイ側筐体3を開閉自在に支持している。
図2は、本実施形態に係るノートPC1のハードウェアの構成を示す概略図である。
ノートPC1は、同図に示すように、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、メモリ13、HDD(Hard Disk Device)14、LCD7、入力部4、カメラデバイス15、オーディオデバイス17、通信デバイス19、バッテリ21、DC/DC(Direct Current / Direct Current)コンバータ22,AC(Alternating Current)アダプタ23を備えており、各部はバス36を介して直接または間接的に接続されている。
CPU11は、バス36を介して接続されたHDD14に格納されたOS(Operating System)30によりノートPC1全体の制御を行うと共に、HDD14に格納された各種のプログラムに基づいて処理を実行する機能を司る。
ROM12は、BIOS(Basic Input/Output System)12aやデータ等を格納している。
メモリ13は、キャッシュメモリやRAM(Random Access Memory)で構成されており、CPU11の実行プログラムの読み込み領域として、実行プログラムの処理データを書き込む作業領域として利用される書き込み可能メモリである。
HDD14は、ノートPC1全体の制御を行うためのOS30、周辺機器類をハードウェア操作するための各種ドライバ31、音声特性設定用ユーティリティ・プログラム32、VOIP(Voice Over Internet Protocol)アプリケーション・プログラム33、VOIPアプリケーション・プログラム以外のマイク5を使用するアプリケーション・プログラム34、及び他のアプリケーション・プログラム35等を記憶する機能を有する。なお、HDD14の代わりにフラッシュメモリ等、他の記憶媒体が適用されてもよい。
カメラデバイス15は、カメラ8及びカメラ処理回路16を備えている。カメラ8は、CCD(Charge-Coupled Device)等の撮像素子で形成される撮像部及びレンズを備えている。レンズは被写体光を結像し、撮像部は結像された被写体光をR,G,Bの画像信号として出力する。カメラ処理回路16は、A/D(Analog Digital)変換器、画像処理用LSI(Large-Scale Integration)、及びメモリ等を備える。このような構成により、カメラ処理回路16は、撮像部の駆動タイミングや露出制御等を行うと共に、撮像部で得られたRGBの画像信号にA/D変換等のデータ処理をして、CPU11に出力する。
オーディオデバイス17は、マイク5とスピーカ6a,6bと共に、音声処理回路18を備えている。
音声処理回路18は、A/D変換器、D/A変換器、音声処理用LSI、メモリ等を備えており、マイク5で集音された音データ(アナログデータ)をA/D変換してデジタルデータとし、メモリ13やHDD14に出力する。なお、デジタルデータとされた音データは、通信デバイス19を介して他の情報処理装置へ送信される。また、音声処理回路18は、デジタルデータとされた音データをD/A変換してアナログデータとし、スピーカ6a,6b又は不図示のマイクロフォンへ出力する。
通信デバイス19は、ネットワークを介して他の情報処理装置等との間でデータの送受信を行うためのものであり、画像データや音データ等の各種データをネットワークに送信し、又ネットワークを介して送信されてくる各種データを受信する。なお、通信デバイス19は、各種データをコード化して送信してもよく、又コード化された各種データを受信した場合にはデコードしてもよい。
ACアダプタ23は、商用電源に接続して、交流電圧を直流電圧に変換してDC/DCコンバータ22に出力する。DC/DCコンバータ22は、ACアダプタ23から供給されるDC電圧を所定の電圧に変換して各部に電力を供給し、また、バッテリ21の充電を行う。バッテリ21は、DC/DCコンバータ22により充電され、充電した電圧を各部に供給する。バッテリ21は、ACアダプタ23が商用電源に接続されていない場合に使用される。
本実施形態に係るノートPC1は、他の情報処理装置との間で音データの送受信によって通話を行う音声通信を行う。他の情報処理装置は、特定の1つである場合もあるし、不特定の複数である場合もあり、例えばサーバとして機能するコンピュータや、クライアントとして機能する個々のノートPCや、あるいは、それらの組み合わせである。本実施形態では、他の情報処理装置がノートPCであるものとして説明する。
なお、以下における音声通信の説明において、音データの送信元であるノートPC1を送信側ノートPCといい、音データの受信先であるノートPC1を受信側ノートPCという。本実施形態では、少なくとも1台の送信側ノートPCと少なくとも1台の受信側ノートPCによって、本実施形態に係る音声通信システムが構築される。
また、音データをVoIPデータともいう。さらに、送信側ノートPCが送信した音データを送信VoIPデータといい、受信側ノートPCが受信した音データを受信VoIPデータという。
また、本実施形態に係るノートPC1は、人の音声のデータを含む音データを音声通信によって正常に送受信したことを判定する通話判定機能を有する。送信側ノートPCと受信側ノートPCとは、同じ通話判定機能を有する。なお、以下の説明において、人の音声を単に音声という。
通話判定機能は、ノートPC1が受信側ノートPCである場合に機能する受信側通話判定機能、及びノートPC1が送信側ノートPCである場合に機能する送信側通話判定機能を含む。
受信側通話判定機能は、送信側ノートPCから送信された送信VoIPデータを通信デバイス19が受信した場合、送信VoIPデータを受信したことを示す受信確認データを通信デバイス19を介して送信側ノートPCへ送信(フィードバック)する。
送信側通話判定機能は、通信デバイス19が受信確認データを受信した場合、受信確認データを受信したことを示す受信確認画像をLCD7に表示させる。
この通話判定機能によって、送信側のユーザは、自身が発話しているにもかかわらず受信確認画像が送信側ノートPCのLCD7に表示されない場合、受信側ノートPCにVoIPデータが送信されていないこと、すなわち、送信した音声を受信側のユーザが聞き取れていないことを認知できる。
図3は、本実施形態に係るノートPC1が有する通話判定機能に関する機能ブロック図である。なお、図3では、同じ機能を有する2つのノートPC1の機能ブロック図を図示しており、一方が送信側ノートPCとして機能すると、これに対応して他方が受信側ノートPCとして機能する。
音声処理回路18は、送信VoIPデータ生成部40と、受信側通話判定機能として、受信側VR(Voice Recognition)エンジン42、フィードバック部44、及び受信音判定報知部46を備える。
送信VoIPデータ生成部40は、送信側ノートPCのマイク5を介して入力された情報(アナログデータ)をデジタルデータに変換してVoIPデータを生成する。生成されたVoIPデータは、通信デバイス19を介して送信側ノートPCから受信側ノートPCへ送信される。
受信側VRエンジン42は、受信側ノートPCが送信側ノートPCからのVoIPデータを受信すると、受信VoIPデータに含まれる音声のデータを認識する音声認識を行う。換言すると、受信側VRエンジン42は、受信VoIPデータが音声であるか否かを判定する。受信VoIPデータに音声のデータが含まれない場合とは、例えば、無音や雑音の場合や、送信側ノートPCの周辺環境が良くなく、送信側ノートPCのユーザの音声とは異なる音が過剰にノイズ成分として重畳する場合や、通信異常等を原因として、電気的なノイズが音声に過剰に重畳する場合等の送信VoIPデータに音声が含まれると認識できない場合である。なお、音声認識は、従来既知の方法が用いられればよい。
フィードバック部44は、受信VoIPデータに対する受信側VRエンジン42での音声認識結果に応じたデータを受信確認データとして受信側ノートPCから送信側ノートPCへフィードバックする。
具体的には、フィードバック部44は、受信VoIPデータに音声のデータが含まれると受信側VRエンジン42が認識した場合、受信VoIPデータに音声のデータが含まれており、通話状態が良いことを示す音声受信確認データを受信確認データとして、通信デバイス19を介して受信側ノートPCから送信側ノートPCへ送信する。一方、受信VoIPデータに音声のデータが含まれないと受信側VRエンジン42が認識した場合、フィードバック部44は、受信VoIPデータに音声のデータが含まれておらず、通話状態が良くないことを示す非音声受信確認データを受信確認データとして、通信デバイス19を介して受信側ノートPCから送信側ノートPCへ送信する。
受信音判定報知部46は、受信側ノートPCにおいて、受信VoIPデータに対する受信側VRエンジン42の音声認識結果を受信側ノートPCのユーザに報知する。
具体的には、受信音判定報知部46は、受信VoIPデータに人の音声のデータが含まれると受信側VRエンジン42が認識(判定)した場合、受信VoIPデータが音声であることを受信側ノートPCのユーザに報知するために、音声受信画像(以下「通話正常アイコンAv」という。)をLCD7に表示させる。一方、受信VoIPデータに音声のデータが含まれないと受信側VRエンジン42が認識(判定)した場合、受信音判定報知部46は、受信VoIPデータが音声でないことを受信側ノートPCのユーザに報知するために、非音声受信画像(以下「通話異常アイコンAn」という。)をLCD7に表示させる。
また、音声処理回路18は、送信側通話判定機能として、送信側VRエンジン48、通話状態判定部50、及び通話状態報知部52を備える。
送信側VRエンジン48は、送信側ノートPCにおいて、送信VoIPデータに含まれる音声のデータを認識する音声認識を行う。換言すると、送信側VRエンジン48は、送信VoIPデータが音声であるか否かを判定する。
通話状態判定部50は、送信側ノートPCにおいて、送信側ノートPCと受信側ノートPCとの間における通話状態の判定を行う。
具体的には、通話状態判定部50は、送信側VRエンジン48による音声認識結果と送信側ノートPCから送信された音声受信確認データ又は非音声受信確認データに基づいて、正常に音声通信できているか否かを判定する音声通信判定を行う。
通話状態報知部52は、送信側ノートPCにおいて、通信デバイス19が受信側ノートPCからの受信確認データを受信した場合、受信確認データを受信したことを送信側ノートPCのユーザに報知する。これにより、送信側ノートPCのユーザは、受信側ノートPCで送信VoIPデータが受信されたことを認知できる。
なお、通話状態報知部52は、通話状態判定部50の判定結果に応じて異なる報知を行う。換言すると、通話状態報知部52は、送信側ノートPCが受信VoIPデータの音声認識の結果に応じたデータを受信側ノートPCから受信確認データとして受信した場合、受信側ノートPCとの通話状態を送信側ノートPCのユーザに報知するものである。
具体的には、通話状態報知部52は、送信VoIPデータに人の音声のデータが含まれると送信側VRエンジン48が認識(判定)し、かつ音声受信確認データを受信側ノートPCから受信した場合、正常に通話が行われていることを示す正常通話画像(以下「通話正常アイコンBv」という。)をLCD7に表示させる。
これにより、送信側ノートPCのユーザは、通話正常アイコンBvを視認すると、送信側ノートPCと受信側ノートPCとの間で正常に通話が行われていることを容易に認知できる。
また、通話状態報知部52は、送信VoIPデータが音声であると送信側VRエンジン48が認識(判定)し、かつ非音声受信確認データを受信側ノートPCから受信した場合、正常に通話が行われていないことを示す異常通話画像(以下「通話異常アイコンBn」という。)をLCD7に表示させる。
これにより、送信側ノートPCのユーザは、通話異常アイコンBnを視認すると、受信側ノートPCがVoIPデータを受信したものの、送信側ノートPCと受信側ノートPCとの間で正常に通話が行われていないことを容易に認知できる。
さらに、通話状態報知部52は、送信側VRエンジン48が音声を認識していない場合、送信側ノートPCが音声を認識していないことを送信側ノートPCのユーザに報知するために、非音声認識アイコンをLCD7に表示させる。これにより、送信側ノートPCのユーザは、自身が発話しているにもかかわらず、非音声認識アイコンが表示されていると、音声を示すVoIPデータが送信側ノートPCから受信側ノートPCへ送信できていないことを容易に認知できる。
図3を用いて説明したように、ノートPC1は、受信VoIPデータを音声認識する受信側VRエンジン42と、送信VoIPデータを音声認識する送信側VRエンジン48とを備える。このように、送信VoIPデータと受信VoIPデータを各々異なるVRエンジンによって音声認識させることで、送信側ノートPCのユーザと受信側ノートPCのユーザとが同時に発話しても、送信側ノートPCと受信側ノートPCとで同時に音声認識して通話状態を判定することが可能となる。
図4,5は、音声処理回路18によって実行される通話判定処理の流れを示すフローチャートである。図4は、送信側ノートPCにおける通話判定処理の流れを示すフローチャートである。図5は、受信側ノートPCにおける通話判定処理の流れを示すフローチャートである。
まず、送信側ノートPCにおけるステップ100では、送信側ノートPCがVoIPデータを受信側ノートPCへ送信する。
受信側ノートPCにおけるステップ200では、受信側ノートPCが送信側ノートPCから送信されたVoIPデータを受信する。
次のステップ202では、受信VoIPデータに対する音声認識を行う。
次のステップ204では、受信VoIPデータに音声が含まれると認識された場合(肯定判定)はステップ206へ移行し、受信VoIPデータに音声が含まれないと認識された場合(否定判定)はステップ208へ移行する。
ステップ206では、通話正常アイコンAvをLCD7に表示し、ステップ210へ移行する。LCD7に通話正常アイコンAvが表示されることによって、受信側ノートPCのユーザは、送信側ノートPCとの間で正常に通話が行われていることを認知できる。
ステップ208では、通話異常アイコンAnをLCD7に表示し、ステップ210へ移行する。LCD7に通話異常アイコンAnが表示されることによって、受信側ノートPCのユーザは、送信側ノートPCとの間で正常に通話が行われていないことを認知できる。
ステップ210では、音声認識の結果を示すデータを送信側ノートPCに送信(フィードバック)する。すなわち、ステップ204における音声認識結果が肯定判定の場合は、受信確認データとして音声受信確認データが送信側ノートPCへ送信される。ステップ204における音声認識結果が否定判定の場合は、受信確認データとして非音声受信確認データが送信側ノートPCへ送信される。
一方、送信側ノートPCがVoIPデータを受信側ノートPCへ送信した後、ステップ102では、送信VoIPデータに対する音声認識を行う。
次のステップ104では、送信VoIPデータが音声であると認識された場合(肯定判定)はステップ108へ移行し、送信VoIPデータが音声でないと認識された場合(否定判定)はステップ106へ移行する。
ステップ106では、非音声認識アイコンをLCD7に表示する。LCD7に非音声認識アイコンが表示されることによって、送信側ノートPCのユーザは、送信側ノートPCへ音声が送信されていないことを認知できる。
ステップ108では、音声通信判定を行う。すなわち、送信側ノートPCからの音声受信確認データを受信側ノートPCが受信した場合、ステップ108では、正常に音声通信できていると判定しステップ110へ移行する。一方、送信側ノートPCからの非音声受信確認データを受信側ノートPCが受信した場合、ステップ108では、正常に音声通信できていないと判定しステップ112へ移行する。
なお、ステップ102における音声認識から所定時間以内に非音声受信確認データ又は音声受信確認データを受信側ノートPCが受信しなかった場合も、ステップ108では、否定判定とする。非音声受信確認データ又は音声受信確認データを受信しなかった場合とは、送信側ノートPCと受信側ノートPCとの間で通信異常が生じている場合である。
ステップ110では、通話正常アイコンBvをLCD7に表示する。LCD7に通話正常アイコンBvが表示されることによって、送信側ノートPCのユーザは、受信側ノートPCとの間で正常に通話が行われていることを認知できる。
ステップ112では、通話異常アイコンBnをLCD7に表示する。LCD7に通話異常アイコンBnが表示されることによって、送信側ノートPCのユーザは、受信側ノートPCとの間で正常に通話が行われていないことを認知できる。すなわち、通話異常アイコンBnが表示されることによって、送信側ノートPCのユーザは、自身が発話しているにもかかわらず、受信側ノートPCのユーザが聞き取れていないことを認知できる。
以上説明したように、本実施形態に係るノートPC1は、画像を表示するLCD7、音が入力されるマイク5、及び音を出力するスピーカ6a,6bを有し、他の情報処理装置との間でVoIPデータの送受信によって通話を行う。ノートPC1は、通信デバイス19が他の情報処理装置から送信されたVoIPデータを受信した場合、VoIPデータを受信したことを示す受信確認データを通信デバイス19を介して、VoIPデータの送信元である他の情報処理装置へフィードバックする。
従って、本実施形態に係るノートPC1は、他の情報処理装置との間で通話を行っている場合に、通話に係る通信状態をユーザが容易に認知できる。
以上、本発明を、上記実施形態を用いて説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。発明の要旨を逸脱しない範囲で上記実施形態に多様な変更又は改良を加えることができ、該変更又は改良を加えた形態も本発明の技術的範囲に含まれる。また、上記実施形態を適宜組み合わせてもよい。
例えば、上記実施形態では、情報処理装置をノートPC1とする形態について説明したが、本発明は、これに限定されるものではなく、情報処理装置をデスクトップ型PC、タブレット型PC、スマートフォン、及びPDA(Personal Digital Assistance)等、その他の情報処理装置とする形態としてもよい。受信側VRエンジン42、フィードバック部44、及び受信音判定報知部46、送信側VRエンジン48、通話状態判定部50、及び通話状態報知部52を複数の情報処理装置に分散することもできるし、これらの機能の一部を、特定のサーバ装置等の共通の情報処理装置が担うこともできる。
また、上記実施形態では、通話判定処理におけるユーザへの報知として、LCD7に画像(アイコン)を表示する形態について説明したが、本発明は、これに限定されるものではなく、通話判定処理におけるユーザへの報知を例えば音声等、他の手段によって行う形態としてもよい。
また、上記実施形態では、ノートPC1が送信側VRエンジン48及び受信側VRエンジン42を備える形態について説明したが、本発明は、これに限定されるものではなく、送信側VRエンジン48又は受信側VRエンジン42を備えない形態としてもよい。
この形態の場合、受信側ノートPCは、送信側ノートPCからVoIPデータを受信した場合に、VoIPデータに対する音声認識をすることなく、受信確認データを送信側ノートPCへフィードバックする。そして、送信側ノートPCは、受信確認データを受信した場合に、送信側ノートPCとの間で音声通信ができていることを示す通話アイコンをLCD7に表示する。
また、上記実施形態では、2台のノートPC1で通信を行っている形態について説明したが、本発明は、これに限定されるものではなく、複数台のノートPC1で通信を行う形態としてもよい。この形態の場合、通話正常アイコンBvや通話異常アイコンBnは、通話を行っているユーザを識別するための表示と共にLCD7に表示されてもよい。
また、上記実施形態で説明した通話判定処理の流れも一例であり、本発明の主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。
1 ノートPC(情報処理装置)
5 マイク(音入力手段)
7 LCD(画像表示手段)
6a,6b スピーカ(音出力手段)
19 通信デバイス(送受信手段)
42 受信側VRエンジン(音声認識手段)
44 フィードバック部(フィードバック手段)
46 受信音判定報知部(受信音判定報知手段)
48 送信側VRエンジン(音声認識手段)
52 通話状態報知部(通話状態報知手段)

Claims (9)

  1. 他の情報処理装置との間で音データの送受信によって通話を行う情報処理装置であって、
    音が入力される音入力手段と、
    前記音入力手段に入力された音を示す音データを前記他の情報処理装置に送信する送信手段と、
    前記音入力手段に入力された音を示す前記音データに含まれる人の音声のデータを認識する音声認識手段と、
    前記他の情報処理装置から、前記音データに含まれる人の音声のデータを認識する音声認識の結果に応じたデータを受信確認データとして受信する受信手段と、
    前記音声認識手段による認識結果と前記受信確認データとに基づいて、前記他の情報処理装置との通話状態を判定し、判定結果をユーザに報知する通話状態報知手段と、
    を備える情報処理装置。
  2. 前記通話状態報知手段は、前記音入力手段に入力された音を示す前記音データに人の音声のデータが含まれると前記音声認識手段が認識し、かつ前記受信確認データが前記音データに人の音声のデータが含まれていることを示す場合、正常に通話が行われていることをユーザに報知する請求項1記載の情報処理装置。
  3. 前記通話状態報知手段は、前記音入力手段に入力された音を示す前記音データに人の音声のデータが含まれると前記音声認識手段が認識し、かつ前記受信確認データを前記音データに人の音声のデータが含まれていないことを示すものとして受信した場合、正常に通話が行われていないことをユーザに報知する請求項1または2に記載の情報処理装置。
  4. 前記通話状態報知手段は、前記音声認識手段の認識結果をユーザに報知する請求項1から3のいずれか1項に記載の情報処理装置。
  5. 他の情報処理装置との間で音データの送受信によって通話を行う情報処理装置であって、
    送信側手段と、
    受信側手段と
    を有し、
    前記送信側手段は、
    音が入力される音入力手段と、
    前記音入力手段に入力された音を示す音データを前記他の情報処理装置に送信する送信手段と、
    前記音入力手段に入力された音を示す前記音データに含まれる人の音声のデータを認識する音声認識手段と、
    前記他の情報処理装置から、前記音データに含まれる人の音声のデータを認識する音声認識の結果に応じたデータを受信確認データとして受信する受信手段と、
    前記音声認識手段による認識結果と前記受信確認データとに基づいて、前記他の情報処理装置との通話状態を判定し、判定結果をユーザに報知する通話状態報知手段と、
    を有し、
    前記受信側手段は、
    前記他の情報処理装置から音データを受信する受信手段と、
    前記受信手段によって受信された前記音データに含まれる人の音声のデータを認識し、音声認識の結果に応じたデータを受信確認データとして前記他の情報処理装置に送信するフィードバック手段と
    を備える情報処理装置。
  6. 他の情報処理装置との間で音データの送受信によって通話を行う情報処理装置の音声通信方法であって、
    前記情報処理装置が、
    音が入力される音入力工程と、
    前記音入力工程において入力された音を示す音データを前記他の情報処理装置に送信する送信工程と、
    前記音入力工程において入力された音を示す前記音データに含まれる人の音声のデータを認識する音声認識工程と、
    前記他の情報処理装置から、前記音データに含まれる人の音声のデータを認識する音声認識の結果に応じたデータを受信確認データとして受信する受信工程と、
    前記音声認識工程による認識結果と前記受信確認データとに基づいて、前記他の情報処理装置との通話状態を判定し、判定結果をユーザに報知する通話状態報知工程と、
    行う音声通信方法。
  7. 他の情報処理装置との間で音データの送受信によって通話を行う情報処理装置の音声通信方法であって、
    前記情報処理装置が、
    送信側工程と、
    受信側工程と
    を有し、
    前記送信側工程は、
    音が入力される音入力工程と、
    前記音入力工程において入力された音を示す音データを前記他の情報処理装置に送信する送信工程と、
    前記音入力工程に入力された音を示す前記音データに含まれる人の音声のデータを認識する音声認識工程と、
    前記他の情報処理装置から、前記音データに含まれる人の音声のデータを認識する音声認識の結果に応じたデータを受信確認データとして受信する受信工程と、
    前記音声認識工程による認識結果と前記受信確認データとに基づいて、前記他の情報処理装置との通話状態を判定し、判定結果をユーザに報知する通話状態報知工程と、
    を有し、
    前記受信側工程は、
    前記他の情報処理装置から音データを受信する受信工程と、
    前記受信工程によって受信された前記音データに含まれる人の音声のデータを認識し、音声認識の結果に応じたデータを受信確認データとして前記他の情報処理装置に送信するフィードバック工程と
    行う音声通信方法。
  8. 音が入力される音入力手段を有するコンピュータにおいて、他の情報処理装置との間で音データの送受信によって通話を行うための音声通話プログラムであって、
    前記音入力手段に入力された音を示す音データを前記他の情報処理装置に送信する送信処理と、
    前記音入力手段において入力された音を示す前記音データに含まれる人の音声のデータを認識する音声認識処理と、
    前記他の情報処理装置から、前記音データに含まれる人の音声のデータを認識する音声認識の結果に応じたデータを受信確認データとして受信する受信処理と、
    前記音声認識処理による認識結果と前記受信確認データとに基づいて、前記他の情報処理装置との通話状態を判定し、判定結果をユーザに報知する通話状態報知処理と、
    をコンピュータに実行させるためのプログラム。
  9. 音が入力される音入力手段を有するコンピュータにおいて、他の情報処理装置との間で音データの送受信によって通話を行うための音声通話プログラムであって、
    送信側処理と、
    受信側処理と
    を有し、
    前記送信側処理は、
    前記音入力手段に入力された音を示す音データを前記他の情報処理装置に送信する送信処理と、
    前記音入力手段に入力された音を示す前記音データに含まれる人の音声のデータを認識する音声認識処理と、
    前記他の情報処理装置から、前記音データに含まれる人の音声のデータを認識する音声認識の結果に応じたデータを受信確認データとして受信する受信処理と、
    前記音声認識処理による認識結果と前記受信確認データとに基づいて、前記他の情報処理装置との通話状態を判定し、判定結果をユーザに報知する通話状態報知処理と、
    を含み、
    前記受信側処理は、
    前記他の情報処理装置から音データを受信する受信処理と、
    前記受信処理によって受信された前記音データに含まれる人の音声のデータを認識し、音声認識の結果に応じたデータを受信確認データとして前記他の情報処理装置に送信するフィードバック処理と
    を含む音声通話プログラム。
JP2016043644A 2016-03-07 2016-03-07 情報処理装置、音声通信方法、及び音声通話プログラム Active JP6246848B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016043644A JP6246848B2 (ja) 2016-03-07 2016-03-07 情報処理装置、音声通信方法、及び音声通話プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016043644A JP6246848B2 (ja) 2016-03-07 2016-03-07 情報処理装置、音声通信方法、及び音声通話プログラム

Publications (2)

Publication Number Publication Date
JP2017163212A JP2017163212A (ja) 2017-09-14
JP6246848B2 true JP6246848B2 (ja) 2017-12-13

Family

ID=59853126

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016043644A Active JP6246848B2 (ja) 2016-03-07 2016-03-07 情報処理装置、音声通信方法、及び音声通話プログラム

Country Status (1)

Country Link
JP (1) JP6246848B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000349759A (ja) * 1999-06-01 2000-12-15 Nec Corp 移動体通信システムにおける通信装置の試験システム及びその試験方法
JP2003143256A (ja) * 2001-10-30 2003-05-16 Nec Corp 端末装置と通信制御方法
JP2009171197A (ja) * 2008-01-16 2009-07-30 Sony Corp 情報通信装置、通信状態検査方法、通信状態検査プログラムおよび双方向通信システム
JP2010177961A (ja) * 2009-01-28 2010-08-12 Kyocera Corp 通信機器及び通信システム

Also Published As

Publication number Publication date
JP2017163212A (ja) 2017-09-14

Similar Documents

Publication Publication Date Title
US9215409B2 (en) Systems and related methods for controlling audio communications between a relay service and an audio endpoint
CN106463108B (zh) 提供与干扰的隔离
US9794209B2 (en) User interface for multi-modality communication
KR101954774B1 (ko) 문자 데이터를 이용한 음성 통화를 제공하기 위한 전자 장치 및 방법
JP7507859B2 (ja) 対話方法及び電子機器
KR20050004036A (ko) 프로세서 주변장치인 통신 장치
JP6268510B2 (ja) 通信装置、通信方法及びプログラム
CN105874517B (zh) 提供更加安静的开放空间工作环境的服务器
JP5411880B2 (ja) 情報処理装置、その音声設定方法、およびコンピュータが実行するためのプログラム
US9477943B2 (en) Multi-modality communication
JP6246848B2 (ja) 情報処理装置、音声通信方法、及び音声通話プログラム
US20140270100A1 (en) Methods and apparatuses for call management on a hearing-impaired side of hearing-impaired communcation systems
JP6659066B1 (ja) 音声通話システム、音声通話制御装置、音声通話プログラム、及び音声通話方法
JP6787078B2 (ja) 通信装置、方法およびプログラム
KR102075750B1 (ko) 문자 데이터를 이용한 음성 통화를 제공하기 위한 전자 장치 및 방법
WO2003098955A1 (fr) Systeme de communication d'informations
TW200527890A (en) Hands-free modem-on-hold
US11509993B2 (en) Ambient noise detection using a secondary audio receiver
CN111147799B (zh) 一种切换方法及处理设备
JP2018129678A (ja) 情報処理装置、そのマイク使用方法、及びコンピュータが実行するためのプログラム
JP2013251630A (ja) 情報端末およびプログラム
JP2023135870A (ja) 補助装置
JP2022135075A (ja) 制御装置、端末装置、可動装置、制御システムおよび方法
JP5977597B2 (ja) 情報処理装置、通信システム、通信方法、およびプログラム
JP2023081469A (ja) プログラム、装置、方法及びシステム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170815

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170929

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171115

R150 Certificate of patent or registration of utility model

Ref document number: 6246848

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250