JP6757420B2 - 音声制御装置、音声制御方法及びプログラム - Google Patents

音声制御装置、音声制御方法及びプログラム Download PDF

Info

Publication number
JP6757420B2
JP6757420B2 JP2018554989A JP2018554989A JP6757420B2 JP 6757420 B2 JP6757420 B2 JP 6757420B2 JP 2018554989 A JP2018554989 A JP 2018554989A JP 2018554989 A JP2018554989 A JP 2018554989A JP 6757420 B2 JP6757420 B2 JP 6757420B2
Authority
JP
Japan
Prior art keywords
output
user
voice
distance
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018554989A
Other languages
English (en)
Other versions
JPWO2018105552A1 (ja
Inventor
良雄 宮崎
良雄 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Original Assignee
Sony Interactive Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Interactive Entertainment Inc filed Critical Sony Interactive Entertainment Inc
Publication of JPWO2018105552A1 publication Critical patent/JPWO2018105552A1/ja
Application granted granted Critical
Publication of JP6757420B2 publication Critical patent/JP6757420B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C3/00Measuring distances in line of sight; Optical rangefinders
    • G01C3/02Details
    • G01C3/06Use of electric means to obtain final indication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1041Mechanical or electronic switches, or control elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/15Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Electromagnetism (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Otolaryngology (AREA)
  • User Interface Of Digital Computer (AREA)
  • Controls And Circuits For Display Device (AREA)

Description

本発明は、音声制御装置、音声制御方法及びプログラムに関する。
ユーザが頭部に装着することにより眼前に表示される映像を鑑賞できるヘッドマウントディスプレイ(HMD)が存在する。このようなHMDでは一般的に、HMDに内蔵されているスピーカやHMDとは別体であるヘッドホンを介してユーザは映像と連携した音声を聴くことができるようになっている。
またこのようなHMDに対応したゲーム等のコンテンツのなかには、HMDを装着しているユーザが動いたり頭部の向きを変えたりすることに応じて表示されている映像が変化するものがある。そしてこのようなコンテンツを楽しんでいるユーザがHMDを装着したまま動くと、障害物や壁などといったユーザの周辺に存在する物体にユーザが接近することがある。
ここで物体に接近していることをユーザに知らせるために、ユーザが物体に接近した際にスピーカやヘッドホンから警告音が出力されるようにしたり接近している物体に相当するオブジェクトがHMDに表示されるようにしたりすることが考えられる。
しかしこのようにするとHMDを装着しているユーザの没入感が低減されるおそれがある。
本発明は上記実情に鑑みてなされたものであって、その目的の一つは、ユーザの没入感が低減されることなく物体に接近していることをユーザに知らせることができる音声制御装置、音声制御方法及びプログラムを提供することにある。
上記課題を解決するために、本発明に係る音声制御装置は、ユーザに音声が出力されるよう制御する音声出力制御部と、ヘッドマウントディスプレイを装着しているユーザと当該ユーザの周辺に存在する物体との間の距離を特定する距離特定部と、前記ユーザに前記音声が出力されている際に発生する前記距離の変化に応じて、前記ユーザに出力されている前記音声の出力態様を変化させる変化部と、を含む。
本発明の一態様では、前記変化部は、前記ユーザにより設定される音量で前記音声が出力されている際に発生する前記距離の変化に応じて、前記ユーザに出力されている前記音声の出力態様を変化させる。
また、本発明の一態様では、前記変化部は、前記ユーザに音声が出力されている際に発生する前記距離の変化に応じて、前記ユーザに出力されている前記音声の音量を変化させる。
この態様では、前記変化部は、前記ユーザにより設定される音量に前記距離に応じた倍率を乗じた大きさの音量で出力されるよう、前記ユーザに出力されている前記音声の音量を変化させてもよい。
また、本発明の一態様では、前記変化部は、前記ユーザに音声が出力されている際に発生する前記距離の変化に応じて、前記ユーザに出力されている前記音声の周波数特性を変化させる。
また、本発明の一態様では、前記変化部は、前記ユーザと前記物体との距離が所定距離よりも短くなった場合に、前記ユーザに出力されている前記音声の出力態様を変化させる。
また、本発明の一態様では、前記音声出力制御部は、記憶されている音声ファイル又は受信する音声ストリームを再生し、前記変化部は、前記音声ファイル又は前記音声ストリームが再生されている際に発生する前記距離の変化に応じて、前記音声出力制御部が再生している前記音声ファイル又は前記音声ストリームの再生音量を変化させる。
また、本発明に係る音声制御方法は、ユーザに音声が出力されるよう制御するステップと、ヘッドマウントディスプレイを装着しているユーザと当該ユーザの周辺に存在する物体との間の距離を特定するステップと、前記ユーザに前記音声が出力されている際に発生する前記距離の変化に応じて、前記ユーザに出力されている前記音声の出力態様を変化させるステップと、を含む。
また、本発明に係るプログラムは、ユーザに音声が出力されるよう制御する手順、ヘッドマウントディスプレイを装着しているユーザと当該ユーザの周辺に存在する物体との間の距離を特定する手順、前記ユーザに前記音声が出力されている際に発生する前記距離の変化に応じて、前記ユーザに出力されている前記音声の出力態様を変化させる手順、をコンピュータに実行させる。
本発明の一実施形態に係るエンタテインメントシステムの全体構成の一例を示す図である。 本発明の一実施形態に係るヘッドマウントディスプレイの構成の一例を示す図である。 本発明の一実施形態に係るエンタテインメント装置の構成の一例を示す図である。 本発明の一実施形態に係る中継装置の構成の一例を示す図である。 参照距離と出力されている音声の音量の倍率との関係の一例を示す図である。 参照距離と出力されている音声の音量の倍率との関係の別の一例を示す図である。 参照距離と出力されている音声の音量の倍率との関係のさらに別の一例を示す図である。 本発明の一実施形態に係るエンタテインメント装置で実装される機能の一例を示す機能ブロック図である。 本発明の一実施形態に係るエンタテインメント装置において行われる処理の流れの一例を示すフロー図である。
以下、本発明の一実施形態について、図面を参照しながら説明する。
図1は、本発明の一実施形態に係るエンタテインメントシステム10の全体構成の一例を示す図である。図2Aは、本実施形態に係るヘッドマウントディスプレイ(HMD)12の構成の一例を示す図である。図2Bは、本実施形態に係るエンタテインメント装置14の構成の一例を示す図である。図2Cは、本実施形態に係る中継装置16の構成の一例を示す図である。
図1に示すように、本実施形態に係るエンタテインメントシステム10は、HMD12とエンタテインメント装置14と中継装置16とディスプレイ18とカメラマイクユニット20とコントローラ22とを含んでいる。
本実施形態に係るHMD12には、例えば図2Aに示すように、プロセッサ30、記憶部32、2つの通信部34(第1通信部34a及び第2通信部34b)、入出力部36、表示部38、センサ部40、音声出力部42、カメラ部44、視線検出部46が含まれる。
プロセッサ30は、例えばHMD12にインストールされるプログラムに従って動作するマイクロプロセッサ等のプログラム制御デバイスである。なお、HMD12に、プロセッサ30の代わりに、プロセッサ30によって実行される処理の実装が可能な制御回路が含まれるようにしてもよい。
記憶部32は、例えばROMやRAM等の記憶素子などである。記憶部32には、プロセッサ30によって実行されるプログラムなどが記憶される。
第1通信部34a及び第2通信部34bは、それぞれ例えば無線LANモジュールなどの通信インタフェースである。本実施形態では図1に示すように、第1通信部34a及び第2通信部34bは、HMD12の前側上方に配置されている。
本実施形態では第1通信部34aで行われる通信の通信規格と第2通信部34bで行われる通信の通信規格とは異なっている。例えば第1通信部34aでは60GHz帯での通信が行われ、第2通信部34bでは5GHz帯又は2.4GHz帯での通信が行われる。以下、第1通信部34aによる通信で用いられる周波数帯を高周波数帯と呼び、第2通信部34bによる通信で用いられる周波数帯を低周波数帯と呼ぶこととする。
そして高周波数帯での通信の方が低周波数帯での通信よりも通信可能な最大レートは高い。また高周波数帯での通信の方が低周波数帯での通信よりも直進性が強く、また通信可能距離は短い。
入出力部36は、例えばHDMI(登録商標)(High-Definition Multimedia Interface)ポート、USBポート、AUXポートなどの入出力ポートである。
表示部38は、HMD12の前側に配置されている、例えば液晶ディスプレイや有機ELディスプレイ等のディスプレイであり、エンタテインメント装置14が生成する映像などを表示させる。また表示部38は、HMD12の筐体に収容される。表示部38は、例えばエンタテインメント装置14が出力して中継装置16で中継される映像信号を受信して、当該映像信号が表す映像を出力するようにしてもよい。本実施形態に係る表示部38は、例えば左目用の画像と右目用の画像を表示することによって三次元画像を表示させることができるようになっている。なお表示部38は三次元画像の表示ができず二次元画像の表示のみができるものであっても構わない。
センサ部40は、例えば加速度や角速度を検出可能なモーションセンサなどといったセンサである。センサ部40は、HMD12の回転量、移動量などの検出結果を所定のサンプリングレートで、プロセッサ30に出力する。またセンサ部40が、ユーザによるHMD12の装着を検出可能な近接センサを含んでいてもよい。
音声出力部42は、例えばヘッドホンやスピーカ等であり、エンタテインメント装置14が生成する音声データが表す音声などを出力する。音声出力部42は、例えばエンタテインメント装置14が出力して中継装置16で中継される音声信号を受信して、当該音声信号が表す音声を出力する。
カメラ部44は、例えばデジタルカメラなどのカメラであり、所定のフレームレートでHMD12を装着するユーザの周辺の様子を撮影する。図1に示すように、本実施形態に係るカメラ部44は、表示部38の上方に、表示部38の前方を撮影できるように2つ配置されている。そのため本実施形態に係るカメラ部44は、HMD12を装着するユーザの前方を撮影できることとなる。また本実施形態に係るカメラ部44は、例えば左目用の画像を撮影するためのレンズ及び右目用の画像を生成するためのレンズを備えたステレオカメラである。
視線検出部46は、HMD12を装着したユーザの視線を検出するセンサである。視線検出部46は、例えば、HMD12の筐体の内側に配置される。また視線検出部46は、HMD12を装着したユーザの視線方向を検出する赤外線カメラを含んでいてもよい。
本実施形態に係るエンタテインメント装置14は、例えばゲームコンソール、DVDプレイヤ、Blu−ray(登録商標)プレイヤなどといったコンピュータである。本実施形態に係るエンタテインメント装置14は、例えば記憶されているゲームプログラムの実行や光ディスクに記録されたコンテンツの再生などによって映像や音声を生成する。そして本実施形態に係るエンタテインメント装置14は、生成される映像を表す映像信号や生成される音声を表す音声信号を、中継装置16を経由して、HMD12やディスプレイ18に出力する。
本実施形態に係るエンタテインメント装置14には、例えば図2Bに示すように、プロセッサ50、記憶部52、通信部54、入出力部56が含まれる。
プロセッサ50は、例えばエンタテインメント装置14にインストールされるプログラムに従って動作するCPU等のプログラム制御デバイスである。本実施形態に係るプロセッサ50には、CPUから供給されるグラフィックスコマンドやデータに基づいてフレームバッファに画像を描画するGPU(Graphics Processing Unit)も含まれている。なお、エンタテインメント装置14に、プロセッサ50の代わりに、プロセッサ50によって実行される処理の実装が可能な制御回路が含まれるようにしてもよい。
記憶部52は、例えばROMやRAM等の記憶素子やハードディスクドライブなどである。記憶部52には、プロセッサ50によって実行されるプログラムなどが記憶される。また、本実施形態に係る記憶部52には、GPUにより画像が描画されるフレームバッファの領域が確保されている。
通信部54は、例えば無線LANモジュールなどの通信インタフェースである。
入出力部56は、HDMIポート、USBポートなどの入出力ポートである。
本実施形態に係る中継装置16は、エンタテインメント装置14から出力される映像信号や音声信号を中継してHMD12やディスプレイ18に出力するコンピュータである。
本実施形態に係る中継装置16には、例えば図2Cに示すように、プロセッサ60、記憶部62、2つの通信部64(第1通信部64a及び第2通信部64b)、入出力部66が含まれる。
プロセッサ60は、例えば中継装置16にインストールされるプログラムに従って動作するCPU等のプログラム制御デバイスである。なお、中継装置16に、プロセッサ60の代わりに、プロセッサ60によって実行される処理の実装が可能な制御回路が含まれるようにしてもよい。
記憶部62は、例えばROMやRAM等の記憶素子などである。記憶部62には、プロセッサ60によって実行されるプログラムなどが記憶される。
第1通信部64a及び第2通信部64bは、例えば無線LANモジュールなどの通信インタフェースである。本実施形態では、図1に示すように、中継装置16の前側に、第1通信部64a及び第2通信部64bが含まれている。
本実施形態では第1通信部64aで行われる通信の通信規格と第2通信部64bで行われる通信の通信規格とは異なっている。例えば第1通信部64aでは高周波数帯(例えば60GHz帯)での通信が行われ、第2通信部64bでは低周波数帯(例えば5GHz帯又は2.4GHz帯)での通信が行われる。
入出力部66は、HDMIポート、USBポートなどの入出力ポートである。
本実施形態に係るディスプレイ18は、例えば液晶ディスプレイ等であり、エンタテインメント装置14から出力される映像信号が表す映像などを表示させる。
本実施形態に係るカメラマイクユニット20は、例えば被写体を撮像した画像などといったカメラマイクユニット20の周辺の様子を表すデータをエンタテインメント装置14に出力するカメラ20aを含んでいる。また本実施形態に係るカメラ20aはステレオカメラである。また本実施形態に係るカメラマイクユニット20は、周囲の音声を取得して当該音声を音声データに変換してエンタテインメント装置14に出力するマイク20bを含んでいる。
HMD12と中継装置16とは、例えば、無線通信によるデータの送受信が互いに可能になっている。エンタテインメント装置14と中継装置16とは、例えば、HDMIケーブルやUSBケーブルなどを介して接続されている。中継装置16とディスプレイ18とは、例えば、HDMIケーブルなどを介して接続されている。エンタテインメント装置14とカメラマイクユニット20とは、例えば、AUXケーブルなどを介して接続されている。
本実施形態に係るコントローラ22は、エンタテインメント装置14に対する操作入力を行うための操作入力装置である。ユーザは、コントローラ22が備える方向キーやボタンを押下したり、操作スティックを傾けたりすることで、コントローラ22を用いて各種の操作入力を行うことができる。そして本実施形態では、コントローラ22は、操作入力に対応付けられる入力データをエンタテインメント装置14に出力する。また本実施形態に係るコントローラ22は、USBポートを備えている。そしてコントローラ22は、USBケーブルでエンタテインメント装置14と接続することで、有線で入力データをエンタテインメント装置14に出力することができる。また本実施形態に係るコントローラ22は、無線通信モジュール等を備えており、無線で入力データをエンタテインメント装置14に出力することができるようにもなっている。
本実施形態では、HMD12のユーザがゲームをプレイしており、ゲームプログラムを実行するエンタテインメント装置14が生成してHMD12に出力される映像が表示部38に表示されていることとする。またゲームプログラムを実行するエンタテインメント装置14が生成してHMD12に出力される音声が音声出力部42から出力されていることとする。
また本実施形態では、ユーザはコントローラ22を操作することなどにより、音声出力部42から出力されている音声の音量を設定できることとする。
そして本実施形態では、カメラ20aやカメラ部44が撮影する画像や、センサ部40による検出結果に基づいて、HMD12を装着しているユーザと、壁や障害物などといったユーザの周辺の物体と、の間の距離が特定される。ここでHMD12と、HMD12を装着しているユーザの周辺の物体と、の間の距離が特定されてもよい。また例えば、HMD12とHMD12に最も近い物体との間の距離が特定されてもよい。以下、このようにして特定される、HMD12を装着しているユーザと、当該ユーザの周辺の物体との間の距離を、参照距離と呼ぶこととする。
そして本実施形態では、参照距離の変化に応じて、音声出力部42から出力されている音声の出力態様(例えば音量や周波数特性など)が変化する。
図3Aは、参照距離と出力されている音声の音量の倍率との関係の一例を示す図である。図3Bは、参照距離と出力されている音声の音量の倍率との関係の別の一例を示す図である。図3Cは、参照距離と出力されている音声の音量の倍率との関係のさらに別の一例を示す図である。
ここで例えば、参照距離が短くなるほど大きな音量で音声が出力されるようにしてもよい。例えば図3Aに示すように、参照距離がd1より短くなると、ユーザにより設定されている音量よりも大きな音量で音声が出力されるようにしてもよい。例えば最大でユーザにより設定されている音量の300%の音量で音声が出力されるようにしてもよい。
また例えば、参照距離が短くなるほど小さな音量で音声が出力されるようにしてもよい。例えば図3Bに示すように、参照距離がd1より短くなると、ユーザにより設定されている音量よりも小さな音量で音声が出力されるようにしてもよい。例えば最小でユーザにより設定されている音量の20%の音量で音声が出力されるようにしてもよい。
また例えば、参照距離が短くなるに従って段階的に音量が変化するようにしてもよい。例えば図3Cに示すように、参照距離がd1より短くなると、ユーザにより設定されている音量の150%の音量で音声が出力されるようにしてもよい。そして参照距離がd2より短くなると、ユーザにより設定されている音量の200%の音量で音声が出力されるようにしてもよい。そして参照距離がd3より短くなると、ユーザにより設定されている音量の300%の音量で音声が出力されるようにしてもよい。ここで距離d2は距離d1より短く、距離d3は距離d2よりも短いこととする。
また公知の画像認識技術を用いることにより、特定の物体(例えば壁)とHMD12との間の距離の変化に応じて、音声出力部42から出力されている音声の出力態様が変化してもよい。ここで例えば特定の物体(例えば壁)とHMD12との間の距離の変化に応じて、音声出力部42から出力されている音声の出力態様が変化してもよい。この場合、特定の物体(例えば壁)とHMD12との間の距離が上述の参照距離に相当することとなる。
またHMD12を装着しているユーザと当該ユーザの周辺に存在する物体との間の距離の変化に応じて全体の音量が変化するのではなく、例えば周波数特性が変化するようにしてもよい。例えばHMD12と物体との間の距離の変化に応じて出力される音声をイコライジングして所定の周波数以上の周波数成分の音量が変化するようにしてもよい。
また例えば特定方向(例えば前方方向や左右方向など)に存在する物体とHMD12との間の距離の変化に応じて、出力されている音声の出力態様が変化してもよい。この場合、例えば特定方向に存在する物体とHMD12との間の距離が上述の参照距離に相当することとなる。
以上のように本実施形態では、ゲームの音声などといった音声がユーザに出力されている際に発生する、HMD12を装着しているユーザと当該ユーザの周辺に存在する物体との間の距離の変化に応じて、ユーザに出力されている音声の出力態様が変化する。そのため警告音が出力される場合や接近している物体に相当するオブジェクトがHMD12に表示される場合よりも、ユーザの没入感が低減されることなく物体に接近していることをユーザに知らせることができることとなる。
以下、本実施形態に係るエンタテインメント装置14の機能並びに本実施形態に係るエンタテインメント装置14で実行される処理についてさらに説明する。
図4は、本実施形態に係るエンタテインメント装置14で実装される機能の一例を示す機能ブロック図である。なお、本実施形態に係るエンタテインメント装置14で、図4に示す機能のすべてが実装される必要はなく、また、図4に示す機能以外の機能が実装されていても構わない。
図4に示すように、本実施形態に係るエンタテインメント装置14は、機能的には例えば、音声出力制御部70、音声変化データ記憶部72、基準データ記憶部74、基準設定部76、距離特定部78、倍率決定部80、音声変化部82、を含んでいる。
音声出力制御部70は、プロセッサ50、入出力部56を主として実装される。音声変化データ記憶部72、基準データ記憶部74は、記憶部52を主として実装される。基準設定部76は、プロセッサ50、通信部54、入出力部56を主として実装される。距離特定部78、倍率決定部80、音声変化部82は、プロセッサ50を主として実装される。
以上の機能は、コンピュータであるエンタテインメント装置14にインストールされた、以上の機能に対応する指令を含むプログラムをプロセッサ50で実行することにより実装されてもよい。このプログラムは、例えば、光ディスク、磁気ディスク、磁気テープ、光磁気ディスク、フラッシュメモリ等のコンピュータ読み取り可能な情報記憶媒体を介して、あるいは、インターネットなどを介してエンタテインメント装置14に供給されてもよい。
音声出力制御部70は、本実施形態では例えば、ユーザに音声が出力されるよう制御する。音声出力制御部70は、例えば、HMD12の音声出力部42から出力される音声の音声データをHMD12に送信してもよい。この場合に、HMD12の音声出力部42は、エンタテインメント装置14から受信する音声データが表す音声を出力してもよい。
ここで音声出力制御部70は、記憶部52や光ディスク等の情報記憶媒体に記憶されている音声ファイル又はインターネット等の通信ネットワークを介して受信する音声ストリームを再生するようにしてもよい。
音声変化データ記憶部72は、本実施形態では例えば、出力される音声の出力態様を変化させるための音声変化データを記憶する。ここで音声変化データは、例えば、HMD12を装着しているユーザと当該ユーザの周辺に存在する物体との間の距離の変化に応じた、ユーザに出力される音声の音量や周波数特性などといった出力態様の変化を示すデータであってもよい。例えば図3A、図3B、及び、図3Cに示すような、参照距離とユーザに出力される音声の音量の倍率との関係を示すデータが、音声変化データとして音声変化データ記憶部72に記憶されていてもよい。
基準データ記憶部74は、ユーザに出力される音声の出力態様の基準値を示す基準データを記憶する。ここで基準データは、ユーザに出力される音声の音量の基準値を示すデータであってもよい。また基準データは、複数の周波数のそれぞれについての音声の音量の基準値を示すデータであってもよい。
基準設定部76は、本実施形態では例えば、基準データ記憶部74に記憶されている基準データの値を設定する。ここで基準設定部76は、ユーザが指定する値となるよう基準データの値を設定してもよい。例えば基準設定部76は、コントローラ22からの操作信号の受付に応じて、基準データ記憶部74に記憶されている基準データの値を変化させてもよい。
距離特定部78は、本実施形態では例えば、HMD12を装着しているユーザと当該ユーザの周辺に存在する物体との間の距離を特定する。ここで距離特定部78は、HMD12とHMD12を装着しているユーザの周辺に存在する物体との間の距離を特定してもよい。また距離特定部78は、上述の参照距離を特定してもよい。
ここで例えば距離特定部78は、所定の時間間隔で、カメラ部44が撮影する、HMD12を装着しているユーザの周辺(例えばユーザの前方)の画像を取得してもよい。また例えば距離特定部78は、所定の時間間隔で、カメラ20aが撮影する、HMD12を装着しているユーザが存在する空間の画像を取得してもよい。そして距離特定部78は、これらの取得する画像に基づいて、上述の参照距離などといった、HMD12とHMD12を装着しているユーザの周辺に存在する物体との間の距離を特定してもよい。
また例えば距離特定部78は、所定の時間間隔で、センサ部40による検出結果を取得してもよい。また例えば距離特定部78は、所定の時間間隔で、HMD12を装着しているユーザが存在する部屋に配置された物体の位置、ユーザの位置、HMD12の位置などを特定可能なセンサの検出結果を取得してもよい。そして距離特定部78は、取得する検出結果に基づいて、上述の参照距離などといった、HMD12を装着しているユーザと当該ユーザの周辺に存在する物体との間の距離を特定してもよい。
なお距離特定部78による距離の特定方法は上述のものに限定されない。
倍率決定部80は、本実施形態では例えば、ユーザに出力される音声の音量の倍率を決定する。例えば倍率決定部80が、音声変化データ記憶部72に記憶されている音声変化データと、距離特定部78が特定する参照距離と、に基づいて、出力されるよう制御される音声の音量の倍率を決定してもよい。
音声変化部82は、本実施形態では例えば、HMD12を装着しているユーザに音声が出力されている際に発生する、距離特定部78が特定する距離の変化に応じて、ユーザに出力されている音声の出力態様を変化させる。例えば音声変化部82は、音声出力制御部70が出力制御している音声の出力態様を変化させる。
ここで音声変化部82は、音声出力制御部70が再生している音声ファイル又は音声ストリームの再生音量を変化させてもよい。
また音声変化部82は、ユーザにより設定される音量で音声が出力されている際に発生する、HMD12を装着しているユーザと当該ユーザの周辺に存在する物体との間の距離の変化に応じて、ユーザに出力されている音声の出力態様を変化させてもよい。例えば音声変化部82は、ユーザにより設定される音量で音声が出力されている際に発生する参照距離の変化に応じて、ユーザに出力されている音声の音量や周波数特性などを変化させてもよい。
また音声変化部82は、ユーザにより設定される音量に、参照距離に応じた倍率を乗じた大きさの音量で出力されるよう、ユーザに出力されている音声の音量を変化させてもよい。例えば音声変化部82は、ユーザに出力されている音声の音量を、基準データ記憶部74に記憶されている基準データが示す音量に倍率決定部80が決定した倍率を乗じた音量に変化させてもよい。
また音声変化部82は、図3A、図3B、及び、図3Cに示すように、参照距離が所定距離(例えば距離d1)より短くなった場合に、ユーザに出力されている音声の出力態様を変化させてもよい。この場合、参照距離が所定距離以上(例えば距離d1以上)である際には、音声出力制御部70は、基準データ記憶部74が記憶している基準データが示す出力態様の音声が出力されるよう制御する。
以下、本実施形態に係るエンタテインメント装置14で実行される処理の流れの一例を、図5に例示するフロー図を参照しながら説明する。なお本処理例では、以下に示すS101〜S105に示す処理が繰り返し実行される。
まず距離特定部78が、上述のようにして参照距離を特定する(S101)。すると倍率決定部80が、音声変化データ記憶部72に記憶されている音声変化データと、S101に示す処理で特定された参照距離と、に基づいて、ユーザに出力されている音声の音量の倍率を決定する(S102)。
そして音声変化部82が、基準データ記憶部74に記憶されている基準データの値が示す音量にS102に示す処理で決定された倍率を乗じることで、音声出力制御部70によって出力制御されている音声が出力されるべき音量を決定する(S103)。
そして音声変化部82は、前回のループにおいてS103に示す処理で決定された音量と今回のループにおいてS103に示す処理で決定された音量が同じであるか否かを判定する(S104)。
ここで同じであると判定された場合は(S104:Y)、S101に示す処理に戻る。
一方、同じでないと判定された場合は(S104:N)、音声変化部82は、音声出力制御部70によって出力制御されている音声の音量を、今回のループにおいてS103に示す処理で決定された音量に変化させて(S105)、S101に示す処理に戻る。
このようにして本処理例では、所定の時間間隔で、上述のS101〜S105に示す処理が実行されることとなる。
なお上述の処理において、S104に示す処理が実行される必要はない。例えば、S103に示す処理で音量が決定される度に、音声変化部82が、決定された音量で音声が出力されるよう音声出力制御部70を制御してもよい。
なお、本発明は上述の実施形態に限定されるものではない。
例えば距離特定部78が特定する距離の変化に応じて、ユーザに出力されている音声の出力態様だけでなく、表示部38に表示されている映像が変化するようにしてもよい。
例えば距離d1よりも距離d2が短いこととした場合、参照距離がd1より短くなると、ユーザに出力されている音声の出力態様が変化し、参照距離がd2より短くなると、さらに表示部38に表示されている映像が変化するようにしてもよい。
また例えば、参照距離がd1より短くなると、表示部38に表示されている映像が変化するようにしてもよい。この場合に、参照距離がd2より短くなると、さらにユーザに出力されている音声の出力態様が変化するようにしてもよい。あるいはこの場合に、参照距離がd2より短くなると、参照距離がd1以上である際の状況に表示部38に表示されている映像が戻るとともに、ユーザに出力されている音声の出力態様が変化するようにしてもよい。
また例えばユーザに出力されている音声の出力態様は、音量や周波数特性には限定されない。例えば、ユーザが装着しているHMD12と、壁や障害物などといったユーザの周辺の物体と、の間の距離の変化に応じて、ユーザ出力されている音声に、例えばディレイやエコーなどといったエフェクトがかかるようにしてもよい。
また以上の説明における図4に示す機能の一部又は全部が、HMD12や中継装置16において実装されても構わない。
また、上記の具体的な文字列や数値及び図面中の具体的な文字列や数値は例示であり、これらの文字列や数値には限定されない。

Claims (5)

  1. ユーザに音声が出力されるよう制御する音声出力制御部と、
    ヘッドマウントディスプレイを装着しているユーザと当該ユーザの周辺に存在する物体との間の距離を特定する距離特定部と、
    前記ユーザに前記音声が出力されている際に発生する前記距離の変化に応じて、前記ヘッドマウントディスプレイの表示部に前記物体に相当する映像を表示させることなく前記ユーザに出力されている前記音声の出力態様を変化させる変化部と、を含み、
    前記音声出力制御部は、記憶されている音声ファイル又は受信する音声ストリームを再生し、
    前記変化部は、前記音声ファイル又は前記音声ストリームが再生されている際に発生する前記距離の変化に応じて、前記音声出力制御部が再生している前記音声ファイル又は前記音声ストリームの再生音量を、前記距離が短いほど大きくなるよう変化させる、
    とを特徴とする音声制御装置。
  2. 前記変化部は、前記ユーザに音声が出力されている際に発生する前記距離の変化に応じて、前記ユーザに出力されている前記音声の周波数特性を変化させる、
    ことを特徴とする請求項に記載の音声制御装置。
  3. 前記変化部は、前記ユーザと前記物体との距離が所定距離よりも短くなった場合に、前記ユーザに出力されている前記音声の出力態様を変化させる、
    ことを特徴とする請求項1又は2に記載の音声制御装置。
  4. ユーザに音声が出力されるよう制御する音声出力制御ステップと、
    ヘッドマウントディスプレイを装着しているユーザと当該ユーザの周辺に存在する物体との間の距離を特定する距離特定ステップと、
    前記ユーザに前記音声が出力されている際に発生する前記距離の変化に応じて、前記ヘッドマウントディスプレイの表示部に前記物体に相当する映像を表示させることなく前記ユーザに出力されている前記音声の出力態様を変化させる変化ステップと、を含み、
    前記音声出力制御ステップでは、記憶されている音声ファイル又は受信する音声ストリームを再生し、
    前記変化ステップでは、前記音声ファイル又は前記音声ストリームが再生されている際に発生する前記距離の変化に応じて、前記音声出力制御ステップで再生している前記音声ファイル又は前記音声ストリームの再生音量を、前記距離が短いほど大きくなるよう変化させる、
    とを特徴とする音声制御方法。
  5. ユーザに音声が出力されるよう制御する音声出力制御手順、
    ヘッドマウントディスプレイを装着しているユーザと当該ユーザの周辺に存在する物体との間の距離を特定する距離特定手順、
    前記ユーザに前記音声が出力されている際に発生する前記距離の変化に応じて、前記ヘッドマウントディスプレイの表示部に前記物体に相当する映像を表示させることなく前記ユーザに出力されている前記音声の出力態様を変化させる変化手順、をコンピュータに実行させ、
    前記音声出力制御手順では、記憶されている音声ファイル又は受信する音声ストリームを再生し、
    前記変化手順では、前記音声ファイル又は前記音声ストリームが再生されている際に発生する前記距離の変化に応じて、前記音声出力制御手順で再生している前記音声ファイル又は前記音声ストリームの再生音量を、前記距離が短いほど大きくなるよう変化させる、
    とを特徴とするプログラム。
JP2018554989A 2016-12-09 2017-12-04 音声制御装置、音声制御方法及びプログラム Active JP6757420B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016239645 2016-12-09
JP2016239645 2016-12-09
PCT/JP2017/043459 WO2018105552A1 (ja) 2016-12-09 2017-12-04 音声制御装置、音声制御方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2018105552A1 JPWO2018105552A1 (ja) 2019-06-24
JP6757420B2 true JP6757420B2 (ja) 2020-09-16

Family

ID=62491993

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018554989A Active JP6757420B2 (ja) 2016-12-09 2017-12-04 音声制御装置、音声制御方法及びプログラム

Country Status (3)

Country Link
US (1) US10691405B2 (ja)
JP (1) JP6757420B2 (ja)
WO (1) WO2018105552A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018128161A1 (ja) * 2017-01-06 2018-07-12 株式会社ソニー・インタラクティブエンタテインメント 音声出力装置、ヘッドマウントディスプレイ、音声出力方法及びプログラム
CN109471608A (zh) * 2018-10-31 2019-03-15 北京羽扇智信息科技有限公司 一种音量的调整方法及装置
JP7488906B2 (ja) 2020-09-23 2024-05-22 株式会社ソニー・インタラクティブエンタテインメント ヘッドマウントディスプレイおよび位置情報取得方法
US20230081452A1 (en) * 2021-09-10 2023-03-16 Qualcomm Incorporated Proximity motion sensing for virtual reality systems

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005165778A (ja) 2003-12-03 2005-06-23 Canon Inc 頭部装着型表示装置、及びその制御方法
EP2372512A1 (en) * 2010-03-30 2011-10-05 Harman Becker Automotive Systems GmbH Vehicle user interface unit for a vehicle electronic device
US20150191124A1 (en) * 2014-01-03 2015-07-09 O2Micro Inc. Mounting system for attaching mobile device
JP5851544B2 (ja) 2014-03-28 2016-02-03 ソフトバンク株式会社 非透過型ヘッドマウントディスプレイ及びプログラム
US10007482B2 (en) * 2015-09-16 2018-06-26 Hashplay Inc. Method and system for voice chat in virtual environment
US9998606B2 (en) * 2016-06-10 2018-06-12 Glen A. Norris Methods and apparatus to assist listeners in distinguishing between electronically generated binaural sound and physical environment sound
US10171929B2 (en) * 2016-06-23 2019-01-01 Lightbox Video Inc. Positional audio assignment system

Also Published As

Publication number Publication date
US10691405B2 (en) 2020-06-23
JPWO2018105552A1 (ja) 2019-06-24
WO2018105552A1 (ja) 2018-06-14
US20190294410A1 (en) 2019-09-26

Similar Documents

Publication Publication Date Title
US9712910B2 (en) Glasses apparatus and method for controlling glasses apparatus, audio apparatus and method for providing audio signal and display apparatus
JP6757420B2 (ja) 音声制御装置、音声制御方法及びプログラム
US9219961B2 (en) Information processing system, computer-readable non-transitory storage medium having stored therein information processing program, information processing control method, and information processing apparatus
CN109416562B (zh) 用于虚拟现实的装置、方法和计算机可读介质
JP6055657B2 (ja) ゲームシステム、ゲーム処理制御方法、ゲーム装置、および、ゲームプログラム
US20120207308A1 (en) Interactive sound playback device
JP6450064B2 (ja) 情報処理装置、動画データのデータ構造、情報処理システム、動画再生プログラム、および、動画の再生方法。
KR20160145054A (ko) 시선 추적 방법 및 디바이스에서의 시각적 변경의 비시각적 피드백
JP2017516196A (ja) 会話検出
JP6348665B2 (ja) ヘッドマウントディスプレイ、表示制御方法及びプログラム
KR20100021387A (ko) 가상 현실 시스템에서 사운드 처리를 수행하기 위한 장치 및 방법
JP7382954B2 (ja) Vr酔い低減システム、ヘッドマウントディスプレイ、vr酔い低減方法及びプログラム
US11086587B2 (en) Sound outputting apparatus and method for head-mounted display to enhance realistic feeling of augmented or mixed reality space
JPWO2020203832A1 (ja) 境界表示制御装置、境界表示制御方法及びプログラム
WO2018007779A1 (en) Augmented reality system and method
KR20210056414A (ko) 혼합 현실 환경들에서 오디오-가능 접속된 디바이스들을 제어하기 위한 시스템
EP3573282B1 (en) Communication device, generated data size control method, and program
CN112752190A (zh) 音频调整方法以及音频调整装置
US10965884B2 (en) Head-mounted display, display controlling apparatus, display controlling method, and program
WO2024060959A1 (zh) 虚拟环境中的观影画面调整方法、装置、存储介质及设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200727

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200811

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200828

R150 Certificate of patent or registration of utility model

Ref document number: 6757420

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150