JP7404568B1 - プログラム、情報処理装置、及び情報処理方法 - Google Patents

プログラム、情報処理装置、及び情報処理方法 Download PDF

Info

Publication number
JP7404568B1
JP7404568B1 JP2023005771A JP2023005771A JP7404568B1 JP 7404568 B1 JP7404568 B1 JP 7404568B1 JP 2023005771 A JP2023005771 A JP 2023005771A JP 2023005771 A JP2023005771 A JP 2023005771A JP 7404568 B1 JP7404568 B1 JP 7404568B1
Authority
JP
Japan
Prior art keywords
user
sound data
unit
conference
control unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023005771A
Other languages
English (en)
Inventor
洋右 西川
浩太 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2023005771A priority Critical patent/JP7404568B1/ja
Application granted granted Critical
Publication of JP7404568B1 publication Critical patent/JP7404568B1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

【課題】ユーザの発言の一部が伝わらなくなることを抑制する。【解決手段】音声制御プログラムは、情報処理装置1を、情報処理装置1が有する集音部14が集音した音を示す音データを取得する取得部171、取得部171が取得した音データを記憶部16に記憶させる記憶制御部172、取得部171が取得した音データに基づいて、情報処理装置1のユーザの発言を検知する検知部173、及び、検知部173がユーザの発言を検知すると、検知部173がユーザの発言を検知したタイミングよりも所定時間前のタイミングに記憶部16に記憶された音データと、当該音データよりも後に記憶部16に記憶された音データとを、記憶部16に記憶された時刻が古い順に出力する出力部174、として機能させる。【選択図】図2

Description

本発明は、プログラム、情報処理装置、及び情報処理方法に関する。
インターネット等の通信ネットワークを利用してオンラインで会議を行うためのシステムが知られている(例えば、特許文献1を参照)。
特開2022-039129号公報
オンライン会議のシステムでは、ユーザが利用する端末側において、ユーザが発言する場合に限定してユーザの音声を発信することができるように、端末が集音した音を示す音データをサーバに送信するか否かを切り替えることができる。しかしながら、ユーザが発言する際に、音データをサーバに送信することを忘れたり、音データをサーバに送信するように切り替えることを忘れたりして、ユーザの発言の一部が伝わらないという問題が生じていた。
そこで、本発明はこれらの点に鑑みてなされたものであり、ユーザの発言の一部が伝わらなくなることを抑制することを目的とする。
本発明の第1の態様に係るプログラムは、コンピュータを、前記コンピュータが有する集音部が集音した音を示す音データを取得する取得部、前記取得部が取得した前記音データを記憶部に記憶させる記憶制御部、前記取得部が取得した前記音データに基づいて、前記コンピュータのユーザの発言を検知する検知部、及び、前記検知部が前記ユーザの発言を検知すると、前記検知部が前記ユーザの発言を検知したタイミングよりも所定時間前のタイミングに前記記憶部に記憶された音データと、当該音データよりも後に前記記憶部に記憶された音データとを、前記記憶部に記憶された時刻が古い順に出力する出力部、として機能させる。
前記検知部は、前記ユーザの発言が途切れることを検知し、前記出力部は、前記ユーザの発言が途切れたことを検知したタイミングまでに前記記憶部に記憶された音データを出力してもよい。
前記出力部は、前記ユーザの発言が途切れたことを検知したタイミングに前記記憶部に記憶された音データを出力すると、前記取得部が取得した音データを直接出力してもよい。
前記出力部は、前記ユーザの発言が途切れたことを検知したタイミングに前記記憶部に記憶された音データを出力してから所定時間以内に前記検知部が前記ユーザの発言を検知しなくなると、前記取得部が取得した音データを出力しないように制御してもよい。
前記プログラムは、前記コンピュータにおいて仮想の集音部として機能し、前記出力部は、オンラインで会議を行うためのアプリケーションプログラムが実行されることにより機能する会議制御部に対する音データの入力元として前記仮想の集音装置が指定されている場合に、前記会議制御部に音データを出力してもよい。
前記プログラムは、前記コンピュータを、前記検知部が前記ユーザの発言を検知すると、前記会議制御部における音データの外部装置への出力状態を、前記外部装置に音データを送信しない状態から前記外部装置に音データを送信する状態に切り替える切替部、としてさらに機能させてもよい。
前記検知部は、前記ユーザの発言を検知した後に前記ユーザの発言が途切れたことを検知し、前記切替部は、前記ユーザの発言が途切れたことを検知したタイミングに前記記憶部に記憶された音データを前記出力部が出力してから所定時間以内に前記検知部が前記ユーザの発言を検知しなかった場合に、前記会議制御部における音データの前記外部装置への出力状態を、前記外部装置に音データを送信する状態から前記外部装置に音データを送信しない状態に切り替えてもよい。
前記切替部は、前記ユーザから前記会議制御部における音データの前記外部装置への出力状態を切り替えるか否かの選択を受け付け、前記出力状態を切り替える選択を受け付けていることに応じて、前記検知部による前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替えてもよい。
前記切替部は、前記会議制御部により実現されるオンラインの会議において前記ユーザが前記会議の開催者であるか否かを示す情報を取得し、取得した情報が、前記ユーザが前記会議の開催者であることを示している場合に、前記検知部による前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替えてもよい。
前記検知部は、前記音データが示す音の周波数、音量レベル、音の継続時間の少なくともいずれかに基づいて、前記ユーザの発言を検知してもよい。
前記取得部は、前記ユーザの音声を示すユーザ音声データを取得し、前記検知部は、前記ユーザ音声データに基づいて前記ユーザの音声の特徴を示すユーザ特徴データを生成し、前記取得部が取得した音データの特徴を示す特徴データと、前記ユーザ特徴データとの類似度に基づいて前記ユーザの発言を検知してもよい。
本発明の第2の態様に係る情報処理装置は、音データを出力する情報処理装置であって、集音部が集音した音を示す音データを取得する取得部と、前記取得部が取得した前記音データを記憶部に記憶させる記憶制御部と、前記取得部が取得した前記音データに基づいて、ユーザの発言を検知する検知部と、前記検知部が前記ユーザの発言を検知すると、前記検知部が前記ユーザの発言を検知したタイミングよりも所定時間前のタイミングに前記記憶部に記憶された音データと、当該音データよりも後に前記記憶部に記憶された音データとを、前記記憶部に記憶された時刻が古い順に出力する出力部と、を有する。
本発明の第3の態様に係る情報処理方法は、コンピュータが実行する、集音部が集音した音を示す音データを取得するステップと、取得した前記音データを記憶部に記憶させるステップと、取得した前記音データに基づいて、ユーザの発言を検知するステップと、前記ユーザの発言を検知すると、前記ユーザの発言を検知したタイミングよりも所定時間前のタイミングに前記記憶部に記憶された音データと、当該音データよりも後に前記記憶部に記憶された音データとを、前記記憶部に記憶された時刻が古い順に出力するステップと、を有する。
本発明によれば、ユーザの発言の一部が伝わらなくなることを抑制することができるという効果を奏する。
情報処理装置の概要を示す図である。 情報処理装置の機能構成を示す図である。 情報処理装置における処理の流れを示すフローチャートである。
[情報処理装置1の概要]
図1は、情報処理装置1の概要を示す図である。情報処理装置1は、ユーザが他のユーザとオンライン会議を行うために使用するパーソナルコンピュータ、タブレット端末、スマートフォン等のコンピュータである。情報処理装置1は、インターネットや携帯電話回線等の通信ネットワークを介してオンライン会議を制御するオンライン会議サーバ2に通信可能に接続されている。
情報処理装置1は、マイクロフォン等の集音部を有しており、情報処理装置1のユーザの音声等を集音し、音データを生成する。また、情報処理装置1には、オンライン会議を行うための会議アプリケーションプログラムがインストールされている。ユーザは、会議アプリケーションプログラムを実行することにより、オンライン会議サーバ2を介して他のユーザとのオンライン会議を行うことができる。なお、以下の説明において、情報処理装置1のユーザを単にユーザともいう。
情報処理装置1には、仮想の集音部として機能する音声制御プログラムがインストールされている。情報処理装置1は、会議アプリケーションプログラムと、音声制御プログラムとを実行している場合、集音部が生成した音データを、仮想の集音部を介してオンライン会議サーバ2に送信する。
具体的には、情報処理装置1は、音声制御プログラムを実行することにより仮想の集音部として機能し、集音部が生成した音データを自身に設けられている記憶部に記憶させるとともに、当該音データに基づいてユーザの発言を検知する。情報処理装置1は、ユーザの発言を検知すると、ユーザの発言を検知したタイミングよりも所定時間前のタイミングに記憶部に記憶された音データと、当該音データよりも後に記憶部に記憶された音データとを、記憶部に記憶された時刻が古い順に、オンライン会議サーバ2に送信する。これにより、情報処理装置1は、オンライン会議サーバ2に、ユーザが発言を開始した時点の音データから送信することができるので、ユーザの発言の一部が伝わらなくなることを抑制することができる。
[情報処理装置1の機能構成]
続いて、情報処理装置1の構成について説明する。図2は、情報処理装置1の機能構成を示す図である。情報処理装置1は、通信部11と、操作部12と、表示部13と、集音部14と、出音部15と、記憶部16と、制御部17とを有する。
通信部11は、インターネットや携帯電話回線等の通信ネットワークを介してオンライン会議サーバ2等の外部装置とデータを送受信するための通信インターフェースである。
操作部12は、ユーザの操作を受け付ける操作デバイスである。例えば、情報処理装置1がパーソナルコンピュータである場合、操作部12は、マウスやキーボードである。
表示部13は、例えば液晶ディスプレイである。表示部13は、制御部17の制御に基づいて、オンライン会議サーバ2から受信した他のユーザの映像を表示する。
集音部14は、情報処理装置1の周囲の音を集めることが可能なマイクロフォンである。集音部14は、例えば、ユーザが発した音声を含む、情報処理装置1の周囲で発生した音を集音する。集音部14は、集音した音を音データに変換し、制御部17に出力する。
出音部15は、制御部17から入力された音信号に基づいて音を出力するスピーカである。
記憶部16は、各種のデータを記憶する記憶媒体であり、ROM(Read Only Memory)、RAM(Random Access Memory)、及びハードディスク等を有する。記憶部16は、制御部17が実行するプログラムを記憶する。記憶部16は、制御部17を、取得部171、記憶制御部172、検知部173、出力部174、及び切替部175として機能させる音声制御プログラムを記憶する。また、記憶部16は、制御部17を、オンライン会議を実現させるための会議制御部176として機能させる会議アプリケーションプログラムを記憶する。
制御部17は、例えばCPU(Central Processing Unit)である。制御部17は、記憶部16に記憶された音声制御プログラムを実行することにより、取得部171、記憶制御部172、検知部173、出力部174、及び切替部175として機能する。制御部17は、記憶部16に記憶された会議アプリケーションプログラムを実行することにより会議制御部176として機能する。
[初期設定]
オンライン会議を実現させる機能である会議制御部176に対して仮想の集音部が出力する音データを入力するために、情報処理装置1において設定を行う必要がある。まず、ユーザは操作部12を操作することにより、音声制御プログラム及び会議アプリケーションプログラムを情報処理装置1に実行させる。音声制御プログラムが実行されると、会議制御部176が用いる情報処理装置1の集音部として、集音部14と、音声制御プログラムにより実現される仮想の集音部が選択可能となる。
ユーザは、操作部12を介して、会議制御部176において用いる集音部として、仮想の集音部を選択する。これにより、集音部14が集音した音が、音声制御プログラムにより実現される仮想の集音部を介して会議制御部176に出力される。
[仮想の集音部の動作]
続いて、音声制御プログラムにより実現される仮想の集音部の具体的な処理について説明する。取得部171、記憶制御部172、検知部173、出力部174、及び切替部175は、協働することにより、仮想の集音部として機能する。
取得部171は、集音部14が集音した音を示す音データを取得する。
記憶制御部172は、取得部171が取得した音データを記憶部16に記憶させる。記憶制御部172は、例えば、記憶部16に設けられている先入れ先出し方式の記憶領域である音声バッファ領域に取得部171が取得した音データを記憶させる。記憶制御部172は、音データを圧縮する圧縮処理を行い、圧縮された音データを音声バッファ領域に記憶させるようにしてもよい。音声バッファ領域は、現在時刻よりも所定時間(例えば、数百ミリ秒から1秒未満)前のタイミングから現在時刻までの音データが記憶される。記憶制御部172は、所定時間前のタイミングよりも前に取得された音データが音声バッファ領域に記憶されている場合、当該音データを削除する。
検知部173は、取得部171が取得した音データに基づいて、情報処理装置1のユーザの発言を検知する。検知部173は、音データが示す音の周波数、音量レベル、音の継続時間の少なくともいずれかに基づいて、ユーザの発言を検知する。例えば、検知部173は、取得部171が取得した音データが示す音に、人の声に対応する周波数帯の音が含まれているとともに、取得した音データが示す音のレベルが所定のレベルを超えると、ユーザが発言していることを検知する。このようにすることで、情報処理装置1は、ユーザの発言とは異なる雑音がユーザの発言として検知されてしまうことを抑制することができる。
また、検知部173は、取得部171が取得した音データに基づいて、ユーザの発言を検知した後にユーザの発言が途切れることを検知する。例えば、検知部173は、取得部171が取得した音データが示す音に、人の声に対応する周波数帯の音が含まれていない場合、又は、取得した音データが示す音のレベルが所定のレベルを超えていない場合に、ユーザの発言が途切れたことを検知する。
なお、検知部173は、予めユーザの音声の特徴を示すユーザ特徴データを生成し、当該特徴データと、取得部171が取得した音データが示す音の特徴を示す特徴データとに基づいてユーザの発言を検知してもよい。この場合、取得部171は、ユーザの音声を示すユーザ音声データを取得する。例えば、取得部171は、音データの取得を開始してから所定時間経過するまでの間にユーザの音声を特定するためのユーザのテスト音声を受け付けることにより、ユーザの音声を示すユーザ音声データを取得する。
検知部173は、取得部171が取得したユーザ音声データに基づいてユーザの音声の特徴を示すユーザ特徴データを生成し、記憶部16に記憶させておく。そして、検知部173は、取得部171が取得した音データが示す音の特徴を示す特徴データと、記憶部16に記憶されているユーザ特徴データとの類似度に基づいてユーザの発言を検知する。例えば、検知部173は、取得部171が取得した音データに対応する特徴データと、ユーザ特徴データとの類似度を算出し、算出した類似度が所定の閾値を超える場合にユーザの発言を検知する。このようにすることで、情報処理装置1は、ユーザの音声を精度良く検知することができる。
出力部174は、会議アプリケーションプログラムが実行することにより機能する会議制御部176に対する音データの入力元として仮想の集音部が指定されている場合に、会議制御部176に音データを出力する。
具体的には、出力部174は、検知部173がユーザの発言を検知すると、検知部173がユーザの発言を検知したタイミングよりも所定時間前のタイミングに記憶部16に記憶された音データと、当該音データよりも後に記憶部16に記憶された音データとを、記憶部16に記憶された時刻が古い順に出力する。例えば、出力部174は、検知部173がユーザの発言を検知すると、記憶部16に設けられている音声バッファ領域から、記憶された時刻が古い音データから順番に取得して会議制御部176に出力する。
そして、出力部174は、ユーザの発言が途切れたことを検知したタイミングまでに記憶部16に記憶された音データを出力する。この場合、記憶制御部172は、ユーザの発言を検知した後にユーザの発言が途切れることを検知部173が検知したことに応じて、記憶部16の音声バッファ領域に音データを記憶させることを停止する。これにより、音声バッファ領域には、ユーザの発言が途切れた後に取得部171が取得した音データが記憶されなくなる。出力部174は、ユーザの発言が途切れたことを検知したタイミングまでに音声バッファ領域に記憶された音データを出力する。
そして、出力部174は、ユーザの発言が途切れたことを検知したタイミングまでに記憶部16の音声バッファ領域に記憶された音データを出力すると、取得部171が取得した音データを会議制御部176に直接出力する。この場合、出力部174は、音データを圧縮せずに、会議制御部176に出力するようにしてもよい。このようにすることで、情報処理装置1は、ユーザの発言が途切れたタイミングで、ユーザの音声をリアルタイムに会議制御部176に出力することができる。
また、出力部174は、ユーザの発言が途切れたことを検知部173が検知したタイミングに記憶部16の音声バッファ領域に記憶された音データを出力してから所定時間以内に検知部173がユーザの発言を検知しなくなると、取得部171が取得した音データを会議制御部176に出力しないように制御する。このようにすることで、情報処理装置1は、ユーザの発言以外の雑音が他のユーザに聞こえてしまうことを抑制することができる。
切替部175は、会議制御部176を制御することにより、会議制御部176が音データをオンライン会議サーバ2に送信するか否かを切り替えることができる。この機能については後述する。
[会議制御部の動作]
続いて、会議制御部176の動作について説明する。会議制御部176は、通信部11を介して、出力部174から出力された音データをオンライン会議サーバ2に送信する。オンライン会議サーバ2は、情報処理装置1から受信した音データをユーザと会議を行う他のユーザの端末(不図示)に送信する。
会議制御部176は、通信部11を介して、オンライン会議サーバ2が他のユーザの端末から受信した音データを、オンライン会議サーバ2から受信する。会議制御部176は、受信した音データを出音部15に入力し、当該音データが示す音を出音部15に出力させる。これにより、ユーザの音データが示すユーザの音声が他のユーザの端末から出力されるとともに、他のユーザの音データが示す他のユーザの音声が情報処理装置1から出力され、ユーザと他のユーザとの間でオンライン会議を行うことができる。
なお、会議制御部176は、通信部11を介して、情報処理装置1が備える撮像部(不図示)から出力された映像データをオンライン会議サーバ2に送信してもよい。オンライン会議サーバ2は、情報処理装置1から受信した映像データを他のユーザの端末に送信してもよい。また、会議制御部176は、オンライン会議サーバ2が他のユーザの端末から受信した映像データを、オンライン会議サーバ2から受信してもよい。そして、会議制御部176は、受信した映像データを表示部13に表示させてもよい。このようにすることで、ユーザと他のユーザとの間で互いの映像を確認しながらオンライン会議を行うことができる。
また、会議制御部176は、操作部12を介して、出力部174から出力された音データのオンライン会議サーバ2への出力状態である音声出力状態を切り替える操作を受け付ける。会議制御部176は、音声出力状態が、オンライン会議サーバ2に音データを送信する状態であるON状態において、オンライン会議サーバ2に音データを送信しない状態であるOFF状態にする切替操作を受け付けると、音声出力状態をON状態からOFF状態に切り替えることにより、オンライン会議サーバ2に音データを送信しないように制御する。会議制御部176は、音声出力状態がOFF状態である場合に、音声出力状態をON状態に切り替える切替操作を受け付けると、音声出力状態をOFF状態からON状態に切り替えることにより、オンライン会議サーバ2に音データを送信する。
[仮想の集音部による会議制御部の制御]
続いて、仮想の集音部の一部として機能する切替部175による会議制御部176の制御について説明する。
切替部175は、会議制御部176がオンライン会議サーバ2に音データを送信しない状態において検知部173がユーザの発言を検知すると、会議制御部176における音声出力状態を、オンライン会議サーバ2に音データを送信しない状態(OFF状態)からオンライン会議サーバ2に音データを送信する状態(ON状態)に切り替える。具体的には、切替部175は、会議制御部176における音声出力状態がOFF状態である場合に、検知部173がユーザの発言を検知すると、会議制御部176における音声出力状態を、OFF状態からON状態に切り替える。
また、切替部175は、会議制御部176における音声出力状態がON状態である場合に、検知部173がユーザの発言が途切れたことを検知すると、会議制御部176における音声出力状態を、ON状態からOFF状態に切り替える。
具体的には、切替部175は、検知部173がユーザの発言が途切れたことを検知したタイミングに記憶部16の音声バッファ領域に記憶された音データを出力部174が出力してから所定時間以内に検知部173がユーザの発言を検知しなかった場合に、会議制御部176における音声出力状態を、ON状態からOFF状態に切り替える。
このようにすることで、情報処理装置1は、音声バッファ領域に記憶された所定時間分の音データが出力された後に、音声出力状態をON状態からOFF状態に切り替えることができる。これにより、情報処理装置1は、ユーザが発言していたときの音声がオンライン会議サーバ2に途中で送信されなくなることを抑制することができる。
なお、切替部175は、ユーザから操作部12を介して会議制御部176における音声出力状態を自動的に切り替えるか否かの選択を受け付けてもよい。そして、切替部175は、当該音声出力状態を自動的に切り替える選択を受け付けていることに応じて、検知部173によるユーザの発言の検出状況に基づいて、会議制御部176における音声出力状態を切り替えてもよい。このようにすることで、情報処理装置1は、ユーザが会議制御部176における音声出力状態を自動的に切り替えることを選択した場合に、会議制御部176における音データのオンライン会議サーバ2への音声出力状態を切り替えることができる。
また、切替部175は、会議制御部176により実現されるオンラインの会議においてユーザが会議の開催者であるか否かを示す開催者特定用情報を取得してもよい。例えば、切替部175は、オンラインの会議におけるホストを示すホスト情報を開催者特定用情報として取得したり、オンラインの会議の画面を示す会議画面情報を開催者特定用情報として取得したりする。切替部175は、取得した開催者特定用情報に基づいて、ユーザが会議の開催者であるか否かを特定する。
そして、切替部175は、取得した開催者特定用情報が、ユーザが会議の開催者であることを示している場合に、検知部173によるユーザの発言の検出状況に基づいて、会議制御部176における音声出力状態を切り替える。この場合、切替部175は、会議制御部176が、ユーザから音声出力状態を切り替える選択を受け付けているか否かに関わらず、検知部173によるユーザの発言の検出状況に基づいて、会議制御部176における音声出力状態を切り替えてもよい。
ユーザが会議の開催者である場合、オンライン会議サーバ2への発言が多くなり、音声出力状態を頻繁に切り替える必要があるのに対し、ユーザが音声出力状態を切り替えることを忘れてしまうことがある。これに対し、情報処理装置1は、ユーザが会議の開催者である場合に、ユーザから音声出力状態を切り替える選択を受け付けているか否かに関わらず、音声出力状態を自動的に切り替えることができるので、ユーザの発言が他のユーザに伝わらなくなることを抑制することができる。
[動作フロー]
続いて、情報処理装置1における処理の流れについて説明する。図3は、情報処理装置1における処理の流れを示すフローチャートである。なお、本フローチャートに示す処理が行われる前に、会議制御部176において用いる集音部として、仮想の集音部が選択されているものとする。
まず、切替部175は、会議制御部176における音声出力状態をOFFにし、会議制御部176が出力部174から取得する音データをオンライン会議サーバ2に送信しないように会議制御部176を制御する(S1)。
続いて、取得部171は、集音部14が集音した音を示す音データを取得する(S2)。記憶制御部172は、S2において取得された音データを音声バッファ領域に記憶させる(S3)。
続いて、制御部17は、検知部173がユーザの発言を検知したか否かを判定する(S4)。制御部17は、検知部173がユーザの発言を検知したと判定すると(S4のYES)、S5に処理を移し、検知部173がユーザの発言を検知していないと判定すると(S4のNO)、S2に処理を移す。
S5において、切替部175は、会議制御部176における音声出力状態をONにし、会議制御部176が出力部174から取得する音データをオンライン会議サーバ2に送信するように会議制御部176を制御する。
続いて、出力部174は、音声バッファ領域に記憶されている音データを会議制御部176に出力する(S6)。ここで、出力部174は、音声バッファ領域に記憶されている音データのうち、最も古い音データから順に会議制御部176に出力する。記憶制御部172は、会議制御部176に出力された音データを音声バッファ領域から消去する。
続いて、取得部171は、集音部14が集音した音を示す音データを取得する(S7)。記憶制御部172は、S7において取得された音データを音声バッファ領域に記憶させる(S8)。
続いて、制御部17は、検知部173がユーザの発言が途切れたことを検知したか否かを判定する(S9)。制御部17は、検知部173がユーザの発言が途切れたことを検知したと判定すると(S9のYES)、S10に処理を移し、検知部173がユーザの発言が途切れたことを検知していないと判定すると(S9のNO)、S6に処理を移す。
続いて、出力部174は、音声バッファ領域に音データが残存しているか否かを判定する(S10)。出力部174は、音データが残存していると判定すると(S10のYES)、S11に処理を移し、音声バッファ領域に残存している音データを会議制御部176に出力する。出力部174は、音データが残存していないと判定すると(S10のNO)、S12に処理を移し、新たに取得部171が取得した音データを会議制御部176に直接出力する。
続いて、取得部171は、集音部14が集音した音を示す音データを取得する(S13)。続いて、制御部17は、検知部173がユーザの発言を所定時間検出せず、ユーザが所定時間発言しなかったか否かを判定する(S14)。制御部17は、ユーザが所定時間発言しなかったと判定すると(S14のYES)、S15に処理を移し、ユーザが所定時間内に発言したと判定すると(S14のNO)、S10に処理を移す。
続いて、制御部17は、会議制御部176によるオンラインの会議が終了したか否かを判定する(S15)。例えば、制御部17は、会議アプリケーションの実行が終了したか否かを判定することにより、オンラインの会議が終了したか否かを判定する。制御部17は、オンラインの会議が終了したと判定すると(S15のYES)、本フローチャートに係る処理を終了し、オンラインの会議が終了していないと判定すると(S15のNO)、S1に処理を移す。
[変形例1]
なお、上述の実施の形態では、音声制御プログラムと、会議アプリケーションプログラムとが異なるものであることとしたが、これに限らない。会議アプリケーションプログラムが、取得部171、記憶制御部172、検知部173、出力部174、及び切替部175として機能してもよい。これにより、ユーザの発言を検知した場合に限定して、音声をオンライン会議サーバ2に送信する会議アプリケーションプログラムを実現することができる。
[変形例2]
また、上述の実施形態において、出力部174は、ユーザの発言が途切れたことを検知したタイミングまでに記憶部16に記憶された音データを、記憶部16から取得して会議制御部176に出力したが、これに限らない。出力部174は、ユーザの発言を検知したことに応じて、記憶部16の音声バッファ領域に記憶されている音データを、音声バッファ領域に残存する音データがなくなるまで、取得部171が音データを取得する間隔よりも早い間隔、すなわち、ユーザの発言が実際の発言速度に比べて早口になるように会議制御部176に出力してもよい。これにより、情報処理装置1は、ユーザの発言を検知したタイミングよりも前に音声バッファ領域に記憶された音データを早期に出力し、音声バッファ領域から音データを出力することによるユーザの発言の遅れを早期に解消させることができる。
[情報処理装置1による効果]
以上説明したように、本実施の形態に係る情報処理装置1は、集音部14が集音した音を示す音データを取得し、取得した音データを記憶部16に記憶させ、取得した音データに基づいて、ユーザの発言を検知すると、ユーザの発言を検知したタイミングよりも所定時間前のタイミングに記憶部16に記憶された音データと、当該音データよりも後に記憶部16に記憶された音データとを、記憶部16に記憶された時刻が古い順に出力する。このようにすることで、情報処理装置1は、ユーザの発言の一部が伝わらなくなることを抑制することができる。
なお、本発明により、国連が主導する持続可能な開発目標(SDGs)の目標9「産業と技術革新の基盤をつくろう」に貢献することが可能となる。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
1 情報処理装置
2 オンライン会議サーバ
11 通信部
12 操作部
13 表示部
14 集音部
15 出音部
16 記憶部
17 制御部
171 取得部
172 記憶制御部
173 検知部
174 出力部
175 切替部
176 会議制御部

Claims (9)

  1. コンピュータにおいて仮想の集音部として機能し、
    前記コンピュータを、
    前記コンピュータが有する集音部が集音した音を示す音データを取得する取得部、
    前記取得部が取得した前記音データを記憶部に記憶させる記憶制御部、
    前記取得部が取得した前記音データに基づいて、前記コンピュータのユーザの発言を検知する検知部
    オンラインで会議を行うためのアプリケーションプログラムが実行されることにより機能する会議制御部に対する音データの入力元として前記仮想の集音部が指定されている場合に、前記会議制御部に音データを出力する出力部であって、前記検知部が前記ユーザの発言を検知すると、前記検知部が前記ユーザの発言を検知したタイミングよりも所定時間前のタイミングに前記記憶部に記憶された音データと、当該音データよりも後に前記記憶部に記憶された音データとを、前記記憶部に記憶された時刻が古い順に出力する出力部、及び、
    前記検知部が前記ユーザの発言を検知すると、前記会議制御部における音データの外部装置への出力状態を、前記外部装置に音データを送信しない状態から前記外部装置に音データを送信する状態に切り替える切替部であって、前記会議制御部により実現されるオンラインの会議において前記ユーザが前記会議の開催者であるか否かを示す情報を取得し、前記ユーザから前記会議制御部における音データの前記外部装置への出力状態を切り替えるか否かの選択を受け付け、取得した前記ユーザが前記会議の開催者であるか否かを示す情報が、前記ユーザが前記会議の開催者であることを示していない場合には、前記出力状態を切り替える選択を受け付けていることに応じて、前記検知部による前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替え、取得した前記ユーザが前記会議の開催者であるか否かを示す情報が、前記ユーザが前記会議の開催者であることを示している場合には、前記出力状態を切り替える前記選択の状況に関わらず、前記検知部による前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替える切替部、
    として機能させ、
    前記記憶制御部は、前記検知部がユーザの発言を検知する前から、前記取得部が取得した前記音データを前記記憶部に記憶させる、
    プログラム。
  2. 前記検知部は、前記ユーザの発言が途切れることを検知し、
    前記出力部は、前記ユーザの発言が途切れたことを検知したタイミングまでに前記記憶部に記憶された音データを出力する、
    請求項1に記載のプログラム。
  3. 前記出力部は、前記ユーザの発言が途切れたことを検知したタイミングに前記記憶部に記憶された音データを出力し、前記記憶部に記憶された音データを全て出力し終えたタイミングから、前記取得部が取得した音データを直接出力する、
    請求項2に記載のプログラム。
  4. 前記出力部は、前記ユーザの発言が途切れたことを検知したタイミングに前記記憶部に記憶された音データを出力してから所定時間以内に前記検知部が前記ユーザの発言を検知しなくなると、前記取得部が取得した音データを出力しないように制御する、
    請求項3に記載のプログラム。
  5. 前記検知部は、前記ユーザの発言を検知した後に前記ユーザの発言が途切れたことを検知し、
    前記切替部は、前記ユーザの発言が途切れたことを検知したタイミングに前記記憶部に記憶された音データを前記出力部が出力してから所定時間以内に前記検知部が前記ユーザの発言を検知しなかった場合に、前記会議制御部における音データの前記外部装置への出力状態を、前記外部装置に音データを送信する状態から前記外部装置に音データを送信しない状態に切り替える、
    請求項に記載のプログラム。
  6. 前記検知部は、前記音データが示す音の周波数、音量レベル、音の継続時間の少なくともいずれかに基づいて、前記ユーザの発言を検知する、
    請求項1に記載のプログラム。
  7. 前記取得部は、前記ユーザの音声を示すユーザ音声データを取得し、
    前記検知部は、前記ユーザ音声データに基づいて前記ユーザの音声の特徴を示すユーザ特徴データを生成し、前記取得部が取得した音データの特徴を示す特徴データと、前記ユーザ特徴データとの類似度に基づいて前記ユーザの発言を検知する、
    請求項1に記載のプログラム。
  8. 仮想の集音部として機能し、音データを出力する情報処理装置であって、
    集音部が集音した音を示す音データを取得する取得部と、
    前記取得部が取得した前記音データを記憶部に記憶させる記憶制御部と、
    前記取得部が取得した前記音データに基づいて、ユーザの発言を検知する検知部と、
    オンラインで会議を行うためのアプリケーションプログラムが実行されることにより機能する会議制御部に対する音データの入力元として前記仮想の集音部が指定されている場合に、前記会議制御部に音データを出力する出力部であって、前記検知部が前記ユーザの発言を検知すると、前記検知部が前記ユーザの発言を検知したタイミングよりも所定時間前のタイミングに前記記憶部に記憶された音データと、当該音データよりも後に前記記憶部に記憶された音データとを、前記記憶部に記憶された時刻が古い順に出力する出力部と、
    前記検知部が前記ユーザの発言を検知すると、前記会議制御部における音データの外部装置への出力状態を、前記外部装置に音データを送信しない状態から前記外部装置に音データを送信する状態に切り替える切替部であって、前記会議制御部により実現されるオンラインの会議において前記ユーザが前記会議の開催者であるか否かを示す情報を取得し、前記ユーザから前記会議制御部における音データの前記外部装置への出力状態を切り替えるか否かの選択を受け付け、取得した前記ユーザが前記会議の開催者であるか否かを示す情報が、前記ユーザが前記会議の開催者であることを示していない場合には、前記出力状態を切り替える選択を受け付けていることに応じて、前記検知部による前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替え、取得した前記ユーザが前記会議の開催者であるか否かを示す情報が、前記ユーザが前記会議の開催者であることを示している場合には、前記出力状態を切り替える前記選択の状況に関わらず、前記検知部による前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替える切替部と、
    を有し、
    前記記憶制御部は、前記検知部がユーザの発言を検知する前から、前記取得部が取得した前記音データを前記記憶部に記憶させる、
    情報処理装置。
  9. 仮想の集音部として機能するコンピュータが実行する、
    集音部が集音した音を示す音データを取得するステップと、
    取得した前記音データを記憶部に記憶させるステップと、
    取得した前記音データに基づいて、ユーザの発言を検知するステップと、
    オンラインで会議を行うためのアプリケーションプログラムが実行されることにより機能する会議制御部に対する音データの入力元として前記仮想の集音部が指定されている場合に、前記会議制御部に音データを出力するステップであって、前記ユーザの発言を検知すると、前記ユーザの発言を検知したタイミングよりも所定時間前のタイミングに前記記憶部に記憶された音データと、当該音データよりも後に前記記憶部に記憶された音データとを、前記記憶部に記憶された時刻が古い順に出力するステップと、
    前記ユーザの発言を検知すると、前記会議制御部における音データの外部装置への出力状態を、前記外部装置に音データを送信しない状態から前記外部装置に音データを送信する状態に切り替えるステップであって、前記会議制御部により実現されるオンラインの会議において前記ユーザが前記会議の開催者であるか否かを示す情報を取得し、前記ユーザから前記会議制御部における音データの前記外部装置への出力状態を切り替えるか否かの選択を受け付け、取得した前記ユーザが前記会議の開催者であるか否かを示す情報が、前記ユーザが前記会議の開催者であることを示していない場合には、前記出力状態を切り替える選択を受け付けていることに応じて、前記検知するステップにおける前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替え、取得した前記ユーザが前記会議の開催者であるか否かを示す情報が、前記ユーザが前記会議の開催者であることを示している場合には、前記出力状態を切り替える前記選択の状況に関わらず、前記検知するステップにおける前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替えるステップと、
    を有し、
    前記記憶部に記憶させるステップにおいて、前記コンピュータは、前記ユーザの発言を検知する前から、取得した前記音データを前記記憶部に記憶させる、
    情報処理方法。
JP2023005771A 2023-01-18 2023-01-18 プログラム、情報処理装置、及び情報処理方法 Active JP7404568B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023005771A JP7404568B1 (ja) 2023-01-18 2023-01-18 プログラム、情報処理装置、及び情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2023005771A JP7404568B1 (ja) 2023-01-18 2023-01-18 プログラム、情報処理装置、及び情報処理方法

Publications (1)

Publication Number Publication Date
JP7404568B1 true JP7404568B1 (ja) 2023-12-25

Family

ID=89307951

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023005771A Active JP7404568B1 (ja) 2023-01-18 2023-01-18 プログラム、情報処理装置、及び情報処理方法

Country Status (1)

Country Link
JP (1) JP7404568B1 (ja)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005181391A (ja) 2003-12-16 2005-07-07 Sony Corp 音声処理装置および音声処理方法
JP2005202014A (ja) 2004-01-14 2005-07-28 Sony Corp 音声信号処理装置、音声信号処理方法および音声信号処理プログラム
JP2005323308A (ja) 2004-05-11 2005-11-17 Sony Corp 音声集音装置とエコーキャンセル処理方法
JP2006229356A (ja) 2005-02-15 2006-08-31 Sony Corp 音声会議用の通信制御装置,通信制御方法,プログラム及び記録媒体
WO2007013180A1 (ja) 2005-07-27 2007-02-01 Kabushiki Kaisha Audio-Technica 会議用音声システム
JP2008141560A (ja) 2006-12-04 2008-06-19 Yamaha Corp ネットワーク機器
JP2010232780A (ja) 2009-03-26 2010-10-14 Brother Ind Ltd 通信制御装置、通信制御方法、及び通信制御プログラム
JP2011087074A (ja) 2009-10-14 2011-04-28 Lenovo Singapore Pte Ltd 遠隔会話システムの出力制御装置、その方法、およびコンピュータが実行可能なプログラム
JP2020141208A (ja) 2019-02-27 2020-09-03 株式会社沖ワークウェル コミュニケーションシステム
JP2022016997A (ja) 2020-07-13 2022-01-25 ソフトバンク株式会社 情報処理方法、情報処理装置及び情報処理プログラム
CN114268761A (zh) 2021-12-22 2022-04-01 北京达佳互联信息技术有限公司 会议控制方法、装置、电子设备、存储介质和程序产品

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005181391A (ja) 2003-12-16 2005-07-07 Sony Corp 音声処理装置および音声処理方法
JP2005202014A (ja) 2004-01-14 2005-07-28 Sony Corp 音声信号処理装置、音声信号処理方法および音声信号処理プログラム
JP2005323308A (ja) 2004-05-11 2005-11-17 Sony Corp 音声集音装置とエコーキャンセル処理方法
JP2006229356A (ja) 2005-02-15 2006-08-31 Sony Corp 音声会議用の通信制御装置,通信制御方法,プログラム及び記録媒体
WO2007013180A1 (ja) 2005-07-27 2007-02-01 Kabushiki Kaisha Audio-Technica 会議用音声システム
JP2008141560A (ja) 2006-12-04 2008-06-19 Yamaha Corp ネットワーク機器
JP2010232780A (ja) 2009-03-26 2010-10-14 Brother Ind Ltd 通信制御装置、通信制御方法、及び通信制御プログラム
JP2011087074A (ja) 2009-10-14 2011-04-28 Lenovo Singapore Pte Ltd 遠隔会話システムの出力制御装置、その方法、およびコンピュータが実行可能なプログラム
JP2020141208A (ja) 2019-02-27 2020-09-03 株式会社沖ワークウェル コミュニケーションシステム
JP2022016997A (ja) 2020-07-13 2022-01-25 ソフトバンク株式会社 情報処理方法、情報処理装置及び情報処理プログラム
CN114268761A (zh) 2021-12-22 2022-04-01 北京达佳互联信息技术有限公司 会议控制方法、装置、电子设备、存储介质和程序产品

Similar Documents

Publication Publication Date Title
US20230245653A1 (en) Image display apparatus and method of controlling the same
JP6811758B2 (ja) 音声対話方法、装置、デバイス及び記憶媒体
US8701003B2 (en) Methods and apparatus for controlling a user interface based on the emotional state of a user
JP6819672B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US8457963B2 (en) Mechanism for providing user guidance and latency concealment for automatic speech recognition systems
JP2006154724A (ja) 対話システム、対話方法、及びコンピュータプログラム
JP2006505003A (ja) 音声認識システムの動作方法
US20210281682A1 (en) Systems and methods for operating an interactive voice response system
US8868419B2 (en) Generalizing text content summary from speech content
JP7406874B2 (ja) 電子機器、その制御方法、およびそのプログラム
WO2024103926A1 (zh) 语音控制方法、装置、存储介质以及电子设备
CN107680592A (zh) 一种移动终端语音识别方法、及移动终端及存储介质
JP7404568B1 (ja) プログラム、情報処理装置、及び情報処理方法
CN109271480B (zh) 一种语音搜题方法及电子设备
WO2017085815A1 (ja) 困惑状態判定装置、困惑状態判定方法、及びプログラム
CN111785277A (zh) 语音识别方法、装置、计算机可读存储介质以及处理器
US20230098333A1 (en) Information processing apparatus, non-transitory computer readable medium, and information processing method
JP7323210B2 (ja) 音声認識表示装置、音声認識表示方法及びプログラム
CN111816183B (zh) 基于音视频录制的语音识别方法、装置、设备及存储介质
KR102494051B1 (ko) 전자 장치 및 이의 음성 인식 방법
Lundin Söderberg Java/Android application for detecting hearing loss
KR101011630B1 (ko) 전화정보 서비스에서의 사용자 입력신호 누락 방지 방법
CN115497457A (zh) 语音识别方法、装置、电子设备及存储介质
CN116129890A (zh) 语音交互处理方法、装置及存储介质
CN116895275A (zh) 对话系统及其控制方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230331

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230807

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20231016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231024

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231213

R150 Certificate of patent or registration of utility model

Ref document number: 7404568

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150