JP2023080604A - 音声制御装置、および音声制御方法 - Google Patents

音声制御装置、および音声制御方法 Download PDF

Info

Publication number
JP2023080604A
JP2023080604A JP2021194031A JP2021194031A JP2023080604A JP 2023080604 A JP2023080604 A JP 2023080604A JP 2021194031 A JP2021194031 A JP 2021194031A JP 2021194031 A JP2021194031 A JP 2021194031A JP 2023080604 A JP2023080604 A JP 2023080604A
Authority
JP
Japan
Prior art keywords
posture
user
unit
audio
terminal device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021194031A
Other languages
English (en)
Inventor
雅之 永野
Masayuki Nagano
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2021194031A priority Critical patent/JP2023080604A/ja
Publication of JP2023080604A publication Critical patent/JP2023080604A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Studio Devices (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】オンライン会議に参加している場合に、他の参加者に聞かれたくない音を消音すること。【解決手段】音声制御装置は、ユーザの姿勢を検出するセンサ部からユーザの姿勢に関する姿勢情報を取得する姿勢情報取得部と、姿勢情報取得部が取得した姿勢情報に基づいてユーザの姿勢に所定以上の変化があったか否かを判定する姿勢変化判定部と、姿勢変化判定部がユーザの姿勢に所定以上の変化があったと判定した場合にユーザの音声データを収音する音声入力部の状態をミュート待ち状態に遷移させる音声制御部と、を備える。【選択図】図1

Description

本発明は、音声制御装置、および音声制御方法に関する。
会議の参加者が発話した音声を録音する技術が知られている。例えば、特許文献1には、人の顔の向きに基づいて会議に参加しない発話の録音を抑制することができる技術が記載されている。
特開2020-115609号公報
参加者がヘッドセットなどを装着してオンライン会議に参加することがある。この場合、オンライン会議に参加しているときに、オンライン会議の他の参加者に聞かれたくない音をマイクが収音してしまうことがある。他の参加者に聞かれたくない音を他の参加者に聞かれることがないように、制御する技術が求められている。
本発明は、オンライン会議に参加している場合に、他の参加者に聞かれたくない音を消音することのできる音声制御装置、および音声制御方法を提供することを目的とする。
本発明に係る音声制御装置、ユーザの姿勢を検出するセンサ部から前記ユーザの姿勢に関する姿勢情報を取得する姿勢情報取得部と、姿勢情報取得部が取得した姿勢情報に基づいてユーザの姿勢に所定以上の変化があったか否かを判定する姿勢変化判定部と、前記姿勢変化判定部が前記ユーザの姿勢に所定以上の変化があったと判定した場合に前記ユーザの音声データを収音する音声入力部の状態をミュート待ち状態に遷移させる音声制御部と、を備える。
本発明に係る音声制御方法、ユーザの姿勢を検出するセンサ部から前記ユーザの姿勢に関する姿勢情報を取得するステップ、前記姿勢情報に基づいて前記ユーザの姿勢に所定以上の変化があったか否かを判定する姿勢変化判定部と、前記ユーザの姿勢に所定以上の変化があったと判定された場合に前記ユーザの音声データを収音する音声入力部の状態をミュート待ち状態に遷移させる音声制御部と、を含む。
本発明によれば、オンライン会議に参加している場合に、他の参加者に聞かれたくない音を消音することができる。
図1は、第1実施形態に係る端末装置の構成例を示すブロック図である。 図2は、第1実施形態に係る音声制御処理を示すフローチャートである。 図3は、第2実施形態に係る端末装置の構成例を示すブロック図である。 図4は、第2実施形態に係る音声制御処理を示すフローチャートである。 図5は、第3実施形態に係る端末装置の構成例を示すブロック図である。 図6は、第3実施形態に係る音声制御処理を示すフローチャートである。
以下、添付図面を参照して、本発明に係る実施形態を詳細に説明する。なお、この実施形態により本発明が限定されるものではなく、また、以下の実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。
[第1実施形態]
(端末装置)
図1を用いて、第1実施形態に係る端末装置の構成例について説明する。図1は、第1実施形態に係る端末装置の構成例を示すブロック図である。
図1に示すように、端末装置10は、入力部12と、音声入力部14と、音声出力部16と、センサ部18と、通信部20と、制御部(音声制御装置)22と、を備える。端末装置10は、例えば、ユーザに装着して使用される、マイクなどの音声入力装置である。また、端末装置10は、例えば、マイク付きのイヤホン、ヘッドホン、ネック型スピーカなどの音声入出力装置である。端末装置10は、単体の装置で構成してもよいし、パーソナルコンピュータ、タブレットなどの情報端末装置及び演算装置及びサーバ装置などを組み合わせた複数の装置で構成してもよい。
入力部12は、端末装置10に対する各種の入力を受け付ける。入力部12は、例えば、ボタン、スイッチ、およびダイヤルなどを含む。入力部12は、音声コマンドを含んでもよく、この場合、入力部12は後述する音声入力部14によって収音されたユーザの音声を解析して各種の入力コマンドに変換する。
音声入力部14は、端末装置10を使用してオンライン会議に参加しているユーザの音声データなどを収音するマイクである。音声入力部14は、音声制御部32の制御に従って、端末装置10を使用するユーザの音声データを収音させる処理を実行する。
音声出力部16は、オンライン会議に参加している他のユーザの音声を出力するスピーカである。音声出力部16は、音声制御部32の制御に従って、オンライン会議に参加している他のユーザの音声を出力する処理を実行する。なお、端末装置10は必ずしも音声出力部16を備えていなくてもよく、オンライン会議に参加している他のユーザの音声は、ユーザがオンライン会議で使用している図示しない情報端末装置に備えられたスピーカなどから出力されてもよい。
センサ部18は、端末装置10を使用するユーザの各種の状態を検出するセンサである。センサ部18は、例えば、端末装置10の動きを示す角速度を検出するジャイロセンサを含む。
通信部20は、端末装置10と外部装置との間の通信を実行する。通信部20は、例えば、端末装置10と、ユーザがオンライン会議に使用している情報端末装置との間の通信を実行する。通信部20は、無線通信でも有線通信でもよいが、より遠くまで端末装置10を使用するユーザが移動できるため、無線通信の方がより好ましい。通信部20は具体的には例えば、Blutooth(登録商標)を用いて通信を行う。
制御部22は、端末装置10の各部を制御する。制御部22は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などの情報処理装置と、RAM(Random Access Memory)又はROM(Read Only Memory)などの記憶装置とを有する。記憶装置には、制御部22の演算内容、およびプログラム等の情報が記憶されている。制御部22は、本発明に係る端末装置10の動作を制御するプログラムを実行する。制御部22は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。制御部22は、ハードウェアと、ソフトウェアとの組み合わせで実現されてもよい。
制御部22は、入力受付制御部30と、音声制御部32と、姿勢情報取得部34と、姿勢変化判定部36と、通信制御部38と、を備える。
入力受付制御部30は、入力部12に対する各種の入力操作に関する入力情報を取得する。入力受付制御部30は、取得した入力情報に対応した制御信号を出力する。
音声制御部32は、音声入力部14を制御する。音声制御部32は、例えば、音声入力部14を制御して、端末装置10を使用するユーザの音声データを収音させる。音声制御部32は、例えば、音声入力部14を制御して、所定の音声を収音させる。音声制御部32は、通信部20を介して、音声入力部14が収音した音声データを外部装置に送信する。音声制御部32は、姿勢変化判定部36が端末装置10を使用するユーザの姿勢に所定以上の変化があったと判定した場合には、音声入力部14の状態をミュート待ち状態に遷移させる。
音声制御部32は、音声出力部16を制御する。音声制御部32は、例えば、音声出力部16を制御して、オンライン会議に参加している他の参加者の音声を出力させる。
姿勢情報取得部34は、センサ部18から取得した情報に基づき、端末装置10を使用するユーザの姿勢を検出する。姿勢情報取得部34は、例えば、センサ部18に備えられたジャイロセンサの出力値に基づいて、ユーザの姿勢が座っている、又は立っているかを判定する。姿勢情報取得部34は、端末装置10を使用するユーザの姿勢に関する姿勢情報をセンサ部18から取得する。
姿勢変化判定部36は、端末装置10を使用するユーザの姿勢の変化を判定する。姿勢変化判定部36は、姿勢情報取得部34が取得した端末装置10を使用するユーザの姿勢情報に基づいて、姿勢が所定以上の変化をしたか否かを判定する。姿勢変化判定部36は例えば、ユーザが座っている状態から立ち上がったと判定した場合に、姿勢が所定以上の変化をしたと判定する。
通信制御部38は、通信部20を制御して、端末装置10と外部装置との通信を制御する。通信制御部38は、例えば、端末装置10と、端末装置10を使用しているユーザがオンライン会議で使用している情報端末装置との間の通信を制御する。通信制御部38は例えば、通信部20を制御して、Blutooth(登録商標)の通信を行う。
(音声制御処理)
図2を用いて、第1実施形態に係る音声制御処理について説明する。図2は、第1実施形態に係る音声制御処理を示すフローチャートである。
制御部22は、端末装置10を使用しているユーザの、他のユーザとのオンライン会議を開始する(ステップS10)。具体的には、音声制御部32は、音声入力部14に端末装置10を使用しているユーザの音声データを収音させる。音声制御部32は、音声出力部16から他のユーザの音声を出力させる。そして、ステップS12に進む。
姿勢情報取得部34は、端末装置10を使用しているユーザの姿勢に関する姿勢情報を取得する(ステップS12)。具体的には、姿勢情報取得部34は、センサ部18に検出させた端末装置を使用しているユーザの姿勢に関する姿勢情報を取得する。姿勢情報取得部34は、例えば、所定の間隔(例えば、0.1秒から数秒程度)ごとに端末装置10を使用しているユーザの姿勢に関する姿勢情報を取得する。姿勢情報取得部34は、例えば、端末装置10を使用しているユーザの姿勢に関する姿勢情報を常時取得してもよい。ステップS14に進む。
姿勢変化判定部36は、端末装置10を使用しているユーザの姿勢に所定の変化があったか否かを判定する(ステップS14)。具体的には、姿勢変化判定部36は、姿勢情報取得部34が取得した姿勢情報に基づいて、ユーザの姿勢に所定の変化があったか否かを判定する。
姿勢変化判定部36は、例えば、姿勢情報取得部34が取得した姿勢情報に基づいて、端末装置10を使用しているユーザが座っている状態から立ち上がったと判定された場合に、ユーザの姿勢に所定以上の変化があったと判定する。
姿勢変化判定部36は、例えば、姿勢情報取得部34が取得した姿勢情報に基づいて、端末装置10を使用しているユーザが一方向を向いている状態から振り返ったと判定された場合に、ユーザの姿勢に所定以上の変化があったと判定する。
姿勢変化判定部36は、例えば、姿勢情報取得部34が取得した姿勢情報に基づいて、端末装置10を使用しているユーザが歩き始めたと判定された場合に、ユーザの姿勢に所定以上の変化があったと判定する。
端末装置10を使用しているユーザの姿勢に所定の変化があったと判定された場合(ステップS14;Yes)、ステップS16に進む。端末装置10を使用しているユーザの姿勢に所定の変化があったと判定されない場合(ステップS14;No)、ステップS30に進む。
ステップS14でYesと判定された場合、音声制御部32は、音声入力部14の状態を通常状態からミュート待ち状態に遷移させる(ステップS16)。ミュート待ち状態とは、例えば、音声入力部14が所定の音声を収音した場合に、音声入力部14をミュート状態にするか否かを判定するための状態をいう。そして、ステップS18に進む。
音声制御部32は、音声入力部14が所定の音声を収音したか否かを判定する(ステップS18)。具体的には、音声制御部32は、音声入力部14が、音声入力部14をミュート状態に遷移させると判定される音声データを取得したか否かを判定する。すなわち、所定の音声とは、端末装置10を使用しているユーザが、オンライン会議に参加している他の参加者に聞かれたくない音をミュートするための音声データであり得る。
音声制御部32は、例えば、音声入力部14がトイレに鍵をかける音を収音した場合に、所定の音声が収音されたと判定する。音声制御部32は、例えば、図示しない辞書データなどに基づいて、音声入力部14が収音した音がトイレに鍵をかける音であることを判定する。
音声制御部32は、例えば、音声入力部14がトイレの蓋を開ける音、または便座を上げたり下げたりする音を収音した場合に、所定の音声が収音されたと判定する。音声制御部32は、例えば、図示しない辞書データなどに基づいて、音声入力部14が収音した音がトイレの蓋を開ける音、または便座を上げたり下げたりする音であることを判定する。
音声制御部32は、例えば、音声入力部14がベルトの開け閉めやズボンのチャックを上げたり下げたりするような金属音を収音した場合に、所定の音声が収音されたと判定する。音声制御部32は、例えば、図示しない辞書データなどに基づいて、音声入力部14が収音した音がベルトの開け閉めやズボンのチャックを上げ下げする音であることを判定する。
音声制御部32は、例えば、音声入力部14が所定以上の大きな声を収音した場合に、所定の音声が収音されたと判定する。所定以上の大きな声は、例えば、ユーザの怒声、赤ちゃんの泣き声、子供の声などが例示されるが、これに限定されない。所定以上の大きな声は、例えばオンライン会議と関連の薄い声である。この場合、音声制御部32は、例えば、図示しない辞書データなどに基づいて、音声入力部14が収音した音がオンライン会議と関連の薄い声であり、かつ所定以上の大きな声であることを判定する。音声制御部32は、音声入力部14が収音した音声データの音量レベルが任意の閾値以上である場合に、所定以上の大きな声であると判定してもよい。
音声制御部32は音声入力部14がミュート待ち状態である場合には、収音した音声をオンライン会議の他の参加者に聞かれないような、処理を実行してもよい。音声制御部32は、音声入力部14がミュート待ち状態である場合には、通常状態に場合と比べて、比較的大きな音声データのみを収音する、つまり音声入力部14の収音音量レベルに閾値を設定してもよい。音声制御部32は、ミュート待ち状態である場合には、音声入力部14が収音した音声データの音量レベルを小さくして通信部20を介して外部装置に送信してもよい。
音声制御部32は、音声入力部14がミュート待ち状態である場合には、音声入力部14が音声データを収音してから、その音声データをオンライン会議の他の参加者に出力するまでの間に遅延期間を設けてもよい。つまり音声制御部32は、音声入力部14がミュート待ち状態である場合には、音声入力部14が収音した音声データを一定期間遅延させた遅延音声データを外部装置に送信する。具体的には音声制御部32は、図示しない音声入力部14が収音した音声データをFIFO(First-In First-Out)メモリに格納し、該FIFOメモリから読みだしたデータを遅延音声データとする。遅延させる一定期間とは、例えば0.1~数秒である。この場合、音声制御部32は、遅延期間の間に音声入力部14が収音した音声データがオンライン会議に参加している他の参加者に聞かれたくない所定の音声であるか否かを判定(ステップS18)すればよい。
音声制御部32は、音声入力部14がミュート待ち状態である場合に、通常状態と同様に、音声入力部14の収音音量レベルの閾値を設定しなくてもよく、音声入力部14が収音した音声データに何も処理をせずに外部装置に送信してもよい。
音声入力部14が所定の音声を収音したと判定された場合(ステップS18;Yes)、ステップS20に進む。音声入力部14が所定の音声を収音したと判定されない場合(ステップS18;No)、ステップS26に進む。
ステップS18でYesと判定された場合(ステップS18;Yes)、音声制御部32は、音声入力部14の状態をミュート状態に遷移させる(ステップS20)。ミュート状態とは、音声入力部14が音声データの収音を行わない状態をいう。ミュート状態とは、音声入力部14が収音した音声データに対してフィルタ処理などを実行してオンライン会議の他の参加者に聞こえないようにする状態でもよい。音声制御部32は、例えば、端末装置10を使用するユーザがトイレに入り、音声入力部14がトイレに鍵をかけた音を収音した際に、音声入力部14の状態をミュート状態に遷移させる。音声制御部32は、例えば、端末装置10を使用するユーザが立ち上がったり、振り返ったりした後、音声入力部14が赤ちゃんの泣き声および子どもの大声などを収音した場合に、音声入力部14の状態をミュート状態に遷移させる。そして、ステップS22に進む。
音声制御部32は、音声入力部14のミュート状態を解除するか否かを判定する(ステップS22)。音声制御部32は、例えば、入力受付制御部30が入力部12から音声入力部14のミュート状態を解除する旨の入力情報を取得した場合に、音声入力部14のミュート状態を解除すると判定する。言い換えれば、端末装置10を使用しているユーザは、任意のタイミングで音声入力部14のミュート状態を解除することができる。音声入力部14のミュート状態を解除すると判定された場合(ステップS22;Yes)、ステップS24に進む。音声入力部14のミュート状態を解除すると判定されない場合(ステップS22;No)、ステップS22の処理を繰り返す。
ステップS22でYesと判定された場合、音声制御部32は、音声入力部14のミュート状態を解除する(ステップS24)。具体的には、音声制御部32は、音声入力部14をミュート状態から通常状態に戻す。そして、ステップS30に進む。
ステップS18でNoと判定された場合、音声制御部32は、音声入力部14の状態がミュート待ち状態になってから所定時間経過したか否かを判定する(ステップS26)。所定時間は、例えば、数秒から10秒程度であるが、これに限定されない。所定時間は、端末装置10を使用するユーザが任意に設定してよい。音声入力部14の状態がミュート待ち状態になってから所定時間経過したと判定された場合(ステップS26;Yes)、ステップS28に進む。音声入力部14の状態がミュート待ち状態になってから所定時間経過したと判定されない場合(ステップS26;No)、ステップS18に進む。
ステップS26でYesと判定された場合、音声制御部32は、音声入力部14のミュート待ち状態を解除する(ステップS28)。そして、ステップS30に進む。
ステップS26でYesと判定されステップS30に進む前に、ユーザにミュート待ち状態の解除を確認する図示しないステップがあってもよい。例えば音声出力部16から、ユーザにミュート待ち状態を解除してもよいか否かを確認する音声を出力し、ユーザは入力部12を用いて解除してもよいか、解除してはならないかの情報を入力する。ユーザにミュート待ち状態の解除を確認するステップにおいて、ユーザの回答が解除してもよいことを示す場合はステップS28に進む。ユーザにミュート待ち状態の解除を確認するステップにおいて、ユーザの回答が解除してはならないことを示す場合はステップS18に戻る。ユーザにミュート待ち状態の解除を確認するステップは、端末装置10を使用するユーザの設定によって、該ステップを省略するか追加するかを選択できてもよい。
制御部22は、音声制御処理を終了するか否かを判定する(ステップS30)。具体的には、制御部22は、オンライン会議を終了する場合に、音声制御処理を終了すると判定する。音声制御処理を終了すると判定された場合(ステップS30;Yes)、図2の処理を終了する。音声制御処理を終了すると判定されない場合(ステップS30;No)、ステップS12に進む。
上述のとおり、第1実施形態は、ユーザの姿勢をジャイロセンサなどにより検出し、ユーザの姿勢が所定の変化をしたと判定された場合に、音声入力部の状態をミュート待ち状態に遷移させる。これにより、第1実施形態は、オンライン会議の他の参加者に聞かれたくない音を検出した場合に、音声入力部の状態をミュート状態にすることができるので、他の参加者に聞かれたくない音を聞かれてしまうことを防止することができる。
[第1実施形態の第1変形例]
第1実施形態では、センサ部18は、端末装置10が備えるものとして説明したが、本発明は、これに限定されない。センサ部18は、例えば、端末装置10を使用しているユーザが所有するスマートホンおよびスマートウォッチなどに設けられていてもよい。この場合、姿勢情報取得部34は、通信部20を介して、スマートホンなどから端末装置10を使用しているユーザの姿勢に関する姿勢情報を取得すればよい。
[第1実施形態の第2変形例]
第1実施形態では、端末装置10が、端末装置10を使用しているユーザの姿勢の変化を判定するものとして説明したが、本発明はこれに限定されない。端末装置10を使用しているユーザの姿勢の変化は、例えば、オンライン会議で使用されている情報端末装置に備えられた図示しない姿勢変化判定部によって判定してもよい。この場合、端末装置10の音声制御部32は、情報処理装置による判定結果に応じて、音声入力部14を制御すればよい。
[第2実施形態]
次に、本発明の第2実施形態を説明する。
(端末装置)
図3を用いて、第2実施形態に係る端末装置の構成例について説明する。図3は、第2実施形態に係る端末装置の構成例を示すブロック図である。
図3に示すように、端末装置10Aは、制御部22Aが位置情報算出部40を備える点で、図1に示す端末装置10と異なる。
位置情報算出部40は、端末装置10Aの位置情報を算出する。位置情報算出部40は、端末装置10Aを使用しているユーザの位置情報を算出する。位置情報算出部40は、例えば、屋内に設置された図示しない位置ビーコンなどに基づいて、公知の方法により端末装置10Aの位置情報を算出する。位置情報算出部40は、例えば、屋内の地図情報などに基づいて、端末装置10Aの位置情報を算出してもよい。
(音声制御処理)
図4を用いて、第2実施形態に係る音声制御処理について説明する。図4は、第2実施形態に係る音声制御処理を示すフローチャートである。
ステップS40からステップS44の処理は、それぞれ、図2に示すステップS10からステップS14の処理と同一なので、説明を省略する。
位置情報算出部40は、端末装置10Aの位置情報を算出し、端末装置10Aを使用しているユーザが所定の場所に移動したか否かを判定する(ステップS46)。具体的には、位置情報算出部40は、屋内に設置された位置ビーコンなどに基づいて端末装置10Aの位置情報を算出し、端末装置10Aを使用しているユーザが所定の場所に移動したか否かを判定する。位置情報算出部40は、例えば、端末装置10Aを使用しているユーザがトイレに移動したか否かを判定する。所定の場所は、端末装置10Aを使用しているユーザが任意に設定することができる。ユーザは所定の場所を、入力部12を利用して設定してもよいし、ユーザがオンライン会議で使用している情報端末装置に備えられた図示しない入力装置を利用して設定してもよい。
端末装置10Aを使用しているユーザが所定の場所に移動したと判定された場合(ステップS46;Yes)、ステップS48に進む。端末装置10Aを使用しているユーザが所定の場所に移動したと判定されない場合(ステップS46;No)、ステップS62に進む。
ステップS48からステップS62の処理は、それぞれ、図2に示すステップS16からステップS30の処理と同一なので、説明を省略する。
上述のとおり、第2実施形態は、ユーザの姿勢の変化の状況と、ユーザの移動の状況とに基づいて、音声入力部の状態をミュート待ち状態に遷移させる。これにより、第2実施形態は、より適切なタイミングで音声入力部をミュート状態に遷移させることができる。
[第3実施形態]
次に、本発明の第3実施形態を説明する。
(端末装置)
図5を用いて、第3実施形態に係る端末装置の構成例について説明する。図5は、第3実施形態に係る端末装置の構成例を示すブロック図である。
図5に示すように、端末装置10Bは、撮像装置50から映像データを取得する点、および制御部22Bが姿勢変化判定部36Aと映像データ取得部42を備える点で図1に示す端末装置10と異なる。
映像データ取得部42は、端末装置10Bを使用しているユーザを撮像した映像データを取得する。映像データ取得部42は、例えば、撮像装置50から端末装置10Bを使用しているユーザを撮像した映像データを取得する。
姿勢変化判定部36Aは、映像データ取得部42が取得した映像データに基づいて、端末装置10Bを使用しているユーザの姿勢の変化を判定する。
撮像装置50は、端末装置10Bを使用しているユーザを撮像するカメラである。撮像装置50は、例えば、端末装置10Bを使用しているユーザがオンライン会議に使用している情報端末装置が備えるカメラである。撮像装置50は、例えば、端末装置10Bと通信可能なその他のカメラであってもよい。
(音声制御処理)
図6を用いて、第3実施形態に係る音声制御処理について説明する。図6は、第3実施形態に係る音声制御処理を示すフローチャートである。
ステップS70およびステップS72の処理は、それぞれ、図2に示すステップS10およびステップS12の処理と同一なので、説明を省略する。
映像データ取得部42は、端末装置10Bを使用しているユーザの映像データを取得する(ステップS74)。具体的には、映像データ取得部42は、撮像装置50が撮像した端末装置10Bを使用しているユーザの映像データを取得する。そして、ステップS76に進む。
姿勢変化判定部36Aは、端末装置10Bを使用しているユーザの姿勢に所定の変化があったか否かを判定する(ステップS76)。具体的には、姿勢変化判定部36Aは、姿勢情報取得部34が取得した姿勢情報と、映像データ取得部42が取得した映像データに基づいて、ユーザの姿勢に所定の変化があったか否かを判定する。
姿勢変化判定部36Aは、例えば、姿勢情報取得部34が取得した姿勢情報と、映像データ取得部42が取得した映像データとに基づいて、端末装置10Bを使用しているユーザが座っている状態から立ち上がったと判定された場合に、ユーザの姿勢に所定の変化があったと判定する。
姿勢変化判定部36Aは、例えば、姿勢情報取得部34が取得した姿勢情報と、映像データ取得部42が取得した映像データとに基づいて、端末装置10Bを使用しているユーザが一方向を向いている状態から振り返ったと判定された場合に、ユーザの姿勢に所定の変化があったと判定する。
姿勢変化判定部36Aは、例えば、姿勢情報取得部34が取得した姿勢情報と、映像データ取得部42が取得した映像データとに基づいて、端末装置10Bを使用しているユーザが歩き始めたと判定された場合に、所定の変化があったと判定する。
撮像装置50は、端末装置10Bを使用しているユーザが身に着けるカメラでもよい。撮像装置50は例えば、ユーザが頭部に装着する図示しないヘッドマウントディスプレイの筐体外側に備えられ、ユーザの視界方向を撮像する。この場合の姿勢変化判定部36Aは、撮像装置50によって撮像されたユーザの視界方向の映像データが、水平方向に回転した映像であった場合にユーザが一方向を向いている状態から振り返ったと判定する。なおユーザが頭部に装着するヘッドマウントディスプレイが、端末装置10Bを備えていてもよい。
端末装置10Bを使用しているユーザの姿勢に所定の変化があったと判定された場合(ステップS76;Yes)、ステップS78に進む。端末装置10Bを使用しているユーザの姿勢に所定の変化があったと判定されない場合(ステップS76;No)、ステップS92に進む。
ステップS78からステップS92の処理は、それぞれ、図2に示すステップS16からステップS30の処理と同一なので、説明を省略する。
第3実施形態では、端末装置10Bが、端末装置10Bを使用しているユーザの姿勢の変化を判定するものとして説明したが、本発明はこれに限定されない。端末装置10Bを使用しているユーザの姿勢の変化は、例えば、オンライン会議で使用されている情報端末装置に備えられた図示しない姿勢変化判定部によって判定してもよい。
上述のとおり、第3実施形態は、ユーザの姿勢をジャイロセンサなどおよび映像データに基づいて検出し、ユーザの姿勢が所定の変化をしたと判定された場合に、音声入力部の状態をミュート待ち状態に遷移させる。これにより、第3実施形態は、ユーザの姿勢が所定の変化をしたか否かをより精度よく判定することができる。
上述した各実施形態では、オンライン会議で使用しているヘッドホンなどのマイクをミュート待ち状態およびミュート状態に遷移させるものとして説明したが、本発明はこれに限定されない。本発明は、例えば、スマートホンなどで通話している際に、スマートホンのマイクをミュート待ち状態およびミュート状態に遷移させる場合にも適用することができる。
上述した各実施形態では、端末装置10、10Aおよび10Bに備えられた音声制御部32によってオンライン会議で使用しているマイクをミュート待ち状態およびミュート状態に遷移させるものとして説明したが、本発明はこれに限定されない。本発明は、例えば、ユーザがオンライン会議で使用している情報端末装置に備えられた図示しない音声制御部によって、端末装置10、10Aおよび10Bに備えられた音声入力部14をミュート待ち状態およびミュート状態に遷移させてもよい。
以上、本発明の実施形態を説明したが、これら実施形態の内容により本発明が限定されるものではない。また、前述した構成要素には、当業者が容易に想定できるもの、実質的に同一のもの、いわゆる均等の範囲のものが含まれる。さらに、前述した構成要素は適宜組み合わせることが可能である。さらに、前述した実施形態の要旨を逸脱しない範囲で構成要素の種々の省略、置換又は変更を行うことができる。
10,10A,10B 端末装置
12 入力部
14 音声入力部
16 音声出力部
18 センサ部
20 通信部
22,22A,22B 制御部
30 入力受付制御部
32 音声制御部
34 姿勢情報取得部
36,36A 姿勢変化判定部
38 通信制御部
40 位置情報算出部
42 映像データ取得部

Claims (5)

  1. ユーザの姿勢を検出するセンサ部から前記ユーザの姿勢に関する姿勢情報を取得する姿勢情報取得部と、
    前記姿勢情報取得部が取得した前記姿勢情報に基づいて前記ユーザの姿勢に所定以上の変化があったか否かを判定する姿勢変化判定部と、
    前記姿勢変化判定部が前記ユーザの姿勢に所定以上の変化があったと判定した場合に前記ユーザの音声データを収音する音声入力部の状態をミュート待ち状態に遷移させる音声制御部と、
    を備える、音声制御装置。
  2. 前記音声制御部は、前記音声入力部の状態をミュート待ち状態に遷移させた後、前記音声入力部が所定の音声を収音した場合に、前記音声入力部の状態をミュート状態に遷移させる、
    請求項1に記載の音声制御装置。
  3. 前記音声制御部は、前記音声入力部の状態がミュート待ち状態であるとき、前記音声入力部が収音した音声データを一定期間遅延させた遅延音声データを、外部装置との通信を実行する通信部を介して前記外部装置に送信する、
    請求項1または2に記載の音声制御装置。
  4. 前記ユーザを撮像する撮像部から前記ユーザの映像データを取得する映像データ取得部を備え、
    姿勢変化判定部は、前記姿勢情報取得部が取得した前記ユーザの前記姿勢情報と、前記映像データ取得部が取得した前記ユーザの映像データとに基づいて、前記ユーザの姿勢に所定以上の変化があったか否かを判定する、
    請求項1から3のいずれか1項に記載の音声制御装置。
  5. ユーザの姿勢を検出するセンサ部から前記ユーザの姿勢に関する姿勢情報を取得するステップと、
    前記姿勢情報に基づいて前記ユーザの姿勢に所定以上の変化があったか否かを判定する姿勢変化判定部と、
    前記ユーザの姿勢に所定以上の変化があったと判定された場合に前記ユーザの音声データを収音する音声入力部の状態をミュート待ち状態に遷移させる音声制御部と、
    を含む、音声制御方法。
JP2021194031A 2021-11-30 2021-11-30 音声制御装置、および音声制御方法 Pending JP2023080604A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021194031A JP2023080604A (ja) 2021-11-30 2021-11-30 音声制御装置、および音声制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021194031A JP2023080604A (ja) 2021-11-30 2021-11-30 音声制御装置、および音声制御方法

Publications (1)

Publication Number Publication Date
JP2023080604A true JP2023080604A (ja) 2023-06-09

Family

ID=86656790

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021194031A Pending JP2023080604A (ja) 2021-11-30 2021-11-30 音声制御装置、および音声制御方法

Country Status (1)

Country Link
JP (1) JP2023080604A (ja)

Similar Documents

Publication Publication Date Title
US11696063B2 (en) Automatic active noise reduction (ANR) control to improve user interaction
JP4694656B2 (ja) 補聴器
EP3081011B1 (en) Name-sensitive listening device
JP6858699B2 (ja) イヤホン又はイヤホンと通信するメディアプレイヤーの制御装置、及びその制御方法
JP5499633B2 (ja) 再生装置、ヘッドホン及び再生方法
JP6651989B2 (ja) 映像処理装置、映像処理方法、及び映像処理システム
US9900688B2 (en) Beamforming audio with wearable device microphones
EP3695404B1 (en) Audio activity tracking and summaries
US12101621B2 (en) Multimedia information processing method and apparatus, and storage medium
US20150172814A1 (en) Method and system for directional enhancement of sound using small microphone arrays
US12032155B2 (en) Method and head-mounted unit for assisting a hearing-impaired user
US20220312128A1 (en) Hearing aid system with differential gain
US11893997B2 (en) Audio signal processing for automatic transcription using ear-wearable device
US11929087B2 (en) Systems and methods for selectively attenuating a voice
JP2023542968A (ja) 定位されたフィードバックによる聴力増強及びウェアラブルシステム
US10687157B2 (en) Head direction hearing assist switching
JP2023080604A (ja) 音声制御装置、および音声制御方法
JP2001057672A (ja) 通信装置および方法、並びに媒体
WO2023058515A1 (ja) 情報処理方法、情報処理システム、及びプログラム
JP7249371B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
EP4075822B1 (en) Microphone mute notification with voice activity detection
JP2005084628A (ja) カメラ機能付き携帯端末装置のシャッター音の鳴動方式及びその方法