JP2016126188A - 音声情報表示装置 - Google Patents

音声情報表示装置 Download PDF

Info

Publication number
JP2016126188A
JP2016126188A JP2015000235A JP2015000235A JP2016126188A JP 2016126188 A JP2016126188 A JP 2016126188A JP 2015000235 A JP2015000235 A JP 2015000235A JP 2015000235 A JP2015000235 A JP 2015000235A JP 2016126188 A JP2016126188 A JP 2016126188A
Authority
JP
Japan
Prior art keywords
unit
image
sound
sound source
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015000235A
Other languages
English (en)
Inventor
吉村 智也
Tomoya Yoshimura
智也 吉村
功資 大島
Kosuke Oshima
功資 大島
森川 武
Takeshi Morikawa
武 森川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2015000235A priority Critical patent/JP2016126188A/ja
Publication of JP2016126188A publication Critical patent/JP2016126188A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Controls And Circuits For Display Device (AREA)
  • Eyeglasses (AREA)

Abstract

【課題】音源が視界内に存在している場合において発生し得る音源の視認性低下を従来よりも抑制し、音源が視界内に存在しているか否かを従来よりも迅速に判断することが可能となる音声情報表示装置を提供する。【解決手段】音声信号を生成する音声信号生成部200と、音源の位置を特定する音源位置特定部225と、音声信号に基づく画像を生成して表示する画像生成表示部と、音源の位置が視界内であるか否かを判定する判定部250とを備え、画像生成表示部は、表示を、判定部250による判定が肯定的な場合に、判定部250による判定が否定的な場合に比べて視認性が低くなるように行う。【選択図】図2

Description

本発明は、音に基づく画像を表示する音声情報表示装置に関する。
従来、使用者の頭部に装着されて使用され、使用者の視界の一部に、周囲の音に基づく画像を表示する音声情報表示装置が知られている。
例えば、特許文献1に記載されたメガネ型の聴覚障害者用ヘッドマウントディスプレイは、マイクで集音した周囲の音に基づいて文字列を生成し、生成した文字列を、使用者の視界内に表示する。
特開2007−334149号公報 特開2012−185461号公報 特開2014−120963号公報 特開2011−250100号公報 特開2013−122695号公報
ところで、従来の音声情報表示装置は、音源が視界内に存在している場合と視界内に存在していない場合とで、その表示態様を変更しない。このため、音源が視界内に存在している場合に、表示する画像が邪魔になって音源の視認性を低下させてしまうことがある。また、音源が視界内に存在しているか否かを、迅速に判断することが難しい。
本発明は係る問題に鑑みてなされたものであり、音源が視界内に存在している場合において発生し得る音源の視認性低下を従来よりも抑制し、音源が視界内に存在しているか否かを従来よりも迅速に判断することが可能となる音声情報表示装置を提供することを目的とする。
上記課題を解決するために本発明に係る音声情報表示装置は、使用者に装着されて使用される音声情報表示装置であって、複数の位置で集音して音声信号を生成する音声信号生成部と、前記音声信号生成部によって生成された音声信号に基づいて、音源の位置を特定する音源位置特定部と、前記音声信号生成部によって生成された音声信号に基づく画像を生成して表示する画像生成表示部と、前記音源位置特定部によって特定された音源の位置が、前記使用者の視界内であるか否かを判定する判定部とを備え、前記画像生成表示部は、前記表示を、前記判定部による判定が肯定的な場合に、前記判定部による判定が否定的な場合に比べて視認性が低くなるように行うことを特徴とする。
また、前記画像生成表示部は、前記判定部による判定が否定的な場合に、前記表示を、表示する画像と共に、当該画像に対応する音源について前記音源位置特定部によって特定された音源の位置を示す情報が表示されるように行うとしてもよい。
また、前記音声信号生成部によって生成された音声信号に基づいて、前記音源位置特定部によって位置が特定された音源から発せられた音の種類を特定する音種類特定部を備え、前記画像生成表示部は、前記表示を、表示対象となる画像に対応する音源から発せられた音について前記音種類特定部によって特定された音の種類が、所定の種類である場合とない場合とで、互いに異なるように行うとしてもよい。
また、前記音声信号生成部によって生成された音声信号に基づいて、前記音源位置特定部によって位置が特定された音源から発せられた音の音量を算出する音量算出部を備え、前記画像生成表示部は、前記表示を、表示対象となる画像に対応する音源から発せられた音について前記音量算出部によって算出された音量が、所定の閾値を上回る場合と下回る場合とで、互いに異なるように行うとしてもよい。
また、前記音声信号生成部によって生成された音声信号に人の声の音声成分が含まれている場合に、当該音声信号に対して音声認識処理を行って当該人の声に対応する文字列を生成する文字列生成部を備え、前記画像生成表示部は、前記表示を、生成対象となる画像に対応する音源から発せられた音の音声信号に対して、前記文字列生成部によって文字列が生成された場合には、当該文字列が含まれるように行うとしてもよい。
また、前記音声信号生成部によって生成された音声信号に基づいて、前記音源位置特定部によって位置が特定された音源が移動しているか否かを判定する移動判定部を備え、前記画像生成表示部は、前記判定部による判定が肯定的な場合において、前記移動判定部による判定が肯定的なときに、前記表示を、表示する画像と共に当該画像に対応する音源が移動している旨を示す情報が表示されるように行う
としてもよい。
また、前記音声信号生成部によって生成された音声信号が、所定の条件を満たしている場合に、当該音声信号が当該所定の条件を満たしている旨を、前記使用者に振動によって報知する振動報知部を備えるとしてもよい。
また、前記使用者の眼を撮影して画像を生成する眼画像生成部と、前記眼画像生成部によって生成された画像に基づいて、前記使用者の視界を特定する視界特定部とを備え、前記判定部は、前記判定を、前記視界特定部によって特定された視界に基づいて行うとしてもよい。
また、前記使用者の視界を含む領域を撮影して視界画像を生成する視界画像生成部と、前記視界画像生成部によって生成された視界画像に基づいて、前記使用者の視界に、特定機器における表示パネルの表示面が含まれているか否かを判定するパネル判定部と、前記音声信号生成部によって生成された音声信号が、前記特定機器における所定の音声信号成分を含んでいるか否かを判定する成分判定部を備え、前記画像生成表示部は、前記表示を、前記パネル判定部による判定が肯定的な場合において、前記成分判定部による判定が肯定的なときに、表示する画像が、前記表示パネルの表示面に前記使用者の注意を促す旨を示す画像となるように行い、前記パネル判定部による判定が否定的な場合において、前記成分判定部による判定が肯定的なときに、表示する画像が、前記特定の音声信号成分に対応する文字列が含まれるように行うとしてもよい。
また、前記音声信号生成部によって生成された音声信号が、所定の音声ガイダンスに対応付けられた所定の音声信号成分を含んでいるか否かを判定する成分判定部を備え、前記画像生成表示部は、前記成分判定部による判定が肯定的な場合における前記表示を、前記所定の音声ガイダンスの内容を示す文字列が含まれるように行うとしてもよい。
また、前記画像生成表示部は、前記使用者が外景を視認可能に透過する半透明な表示領域を有し、前記表示を、当該表示領域に行うとしてもよい。
上述の音声情報表示装置によると、表示部は、音源の位置が使用者の視界内に存在する場合に、表示対象となる画像を、音源の位置が視界内に存在しない場合よりも視認性が低くなるように表示する。
これにより、この音声情報表示装置は、音源が視界内に存在している場合において発生し得る音源の視認性低下を従来よりも抑制すると共に、その視認性の差異により音源が視界内に存在しているか否かを従来よりも迅速に判断することが可能となる。
音声情報表示装置100の斜視図である。 音声情報表示装置100の機能構成図である。 音種記号対応表300の構成図である。 音量大きさ対応表400の構成図である。 音源位置色対応表500の構成図である。 移動方向拡大率対応表600の構成図である。 視界内外対応表700の構成図である。 危険度ポイント対応表800の構成図である。 音声処理のフローチャートである。 表示処理のフローチャートである。 振動処理のフローチャートである。 (a)、(b) 音声情報表示装置100に表示される画像の例を示す模式図である。 (a)、(b) 音声情報表示装置100に表示される画像の例を示す模式図である。 音声情報表示装置1400の斜視図である。 MFP1500の斜視図である。 音声情報表示装置1400の機能構成図である。 (a)、(b) 音声情報表示装置1400に表示される画像の例を示す模式図である。 (a)、(b) 音声情報表示装置1400に表示される画像の例を示す模式図である。 表示部1670が行う表示の一例を示す模式図である。 機器メッセージ通知処理のフローチャートである。 変形例において音声情報表示装置に表示される画像の例を示す模式図である。
<<実施の形態1>>
以下、本発明に係る音声情報表示装置の一実施形態について、図面を参照しながら説明する。
実施の形態1において例示する音声情報表示装置は、使用者の頭部に装着されて使用されるいわゆるヘッドマウントディスプレイであって、マイクで集音した周囲の音に基づく画像を生成し、生成した画像を使用者の視界内に表示する。
この音声情報表示装置の特徴は、画像を生成すると共に音源の位置を特定し、特定した音源の位置が視界内に存在する場合と存在しない場合とで、音源の位置が視界内に存在する場合の方がより視認性が低くなるように、その画像を表示する点にある。
<構成>
図1は、上記音声情報表示装置100の斜視図である。
同図に示されるように、音声情報表示装置100は、第1マイク110と、第2マイク120と、第3マイク130と、半透明ディスプレイ140と、プロジェクター145と、イメージセンサー150と、バイブレーター160と、プロセッサーモジュール170と、メガネフレーム180と、電池190と、ガラス195とから構成される。
第1マイク110と第2マイク120と第3マイク130とは、それぞれ、入力される周囲の音を、電気信号である音声信号に変換して出力する。
第1マイク110は、メガネフレーム180におけるブリッジに配置され、第2マイク120は、メガネフレーム180における右耳用モダンに配置され、第3マイク130は、メガネフレーム180における左耳用モダンに配置されている。
音声情報表示装置100は、3つのマイクを備えることで、周囲の音を立体的に集音する。
半透明ディスプレイ140は、メガネフレーム180における左目用リムに装着され、ハーフミラーで構成される半透明な表示領域を有し、その表示領域にプロジェクター145によって投影される画像を表示する。音声情報表示装置100を頭部に装着して使用する使用者は、左目で、表示領域に表示される画像と共に、その表示領域を透過して音声情報表示装置100外部の様子を視認することができる。
プロジェクター145は、メガネフレーム180における左目用リムの上部に配置され、半透明ディスプレイ140の表示領域に画像を投影する。
イメージセンサー150は、メガネフレーム180における左目用リムの上部に配置され、音声情報表示装置100を頭部に装着して使用する使用者の左目を撮影して、左目の画像を生成する。
バイブレーター160は、メガネフレーム180における左耳用テンプルに配置され、左耳用テンプルを振動させることができる。
電池190は、音声情報表示装置100を構成する電子機器に電力を供給する。
ガラス195は、メガネフレーム180における右目用リムに装着され、音声情報表示装置100を頭部に装着して使用する使用者は、右目で、ガラス195を透過して外部を視認することができる。
プロセッサーモジュール170は、メガネフレーム180における左耳用テンプルに配置され、図示しないプロセッサーと、図示しないメモリとを含んで構成される。プロセッサーモジュール170に含まれるプロセッサー(以下、単に「プロセッサー」と呼ぶ。)は、プロセッサーモジュール170に含まれるメモリ(以下、単に「メモリ」と呼ぶ。)に記憶されるプログラムを実行することで、音声情報表示装置100を構成する電子機器を制御して、音声情報表示装置100に様々な機能を実現させる。
図2は、音声情報表示装置100の機能構成図である。
同図に示されるように、音声情報表示装置100は、音声信号生成部200と、文字列生成部205と、音量算出部210と、音種特定部215と、移動判定部220と、音源位置特定部225と、視線画像生成部230と、視界特定部240と、判定部250と、画像生成部260と、表示部270と、振動報知部280とを含んで構成される。
音声信号生成部200は、第1マイク110と、第2マイク120と、第3マイク130とを含み、第1マイク110から入力された音に基づく第1音声信号と、第2マイク110から入力された音に基づく第2音声信号と、第3マイク110から入力された音に基づく第3音声信号とを生成する。
文字列生成部205は、音声信号生成部200によって生成された第1音声信号と第2音声信号と第3音声信号とに対して音声認識処理を行って、人の声の音声成分が含まれている場合に、その声に対して認識される文字列を生成する。
音量算出部210は、音声信号生成部200によって生成された第1音声信号を解析して第1マイク110から入力された音の音量である第1音量を算出し、音声信号生成部200によって生成された第2音声信号を解析して第2マイク120から入力された音の音量である第2音量を算出し、音声信号生成部200によって生成された第3音声信号を解析して第3マイク130から入力された音の音量である第3音量を算出する。
音種特定部215は、音量算出部210によって最も音量が大きいと算出された音声信号を解析して、その音声信号の元となる音が、所定の音種のうちのいずれであるか、またはいずれでもないかを特定する。
所定の音種としては、例えば、救急車のサイレン、踏切の警報、車のクラクション等が考えられる。
音種特定部215は、例えば、所定の音種の音声信号をサンプル音声信号として記憶し、解析の対象となる音声信号とサンプル音声信号とを比較することで、音種の特定を行う。
音源位置特定部225は、音量算出部210によって算出された第1音量と第2音量と第3音量とが所定の音量以上の場合に、音声信号生成部200によって生成された第1音声信号と第2音声信号と第3音声信号とを解析して、音源の位置、すなわち、音声情報表示装置100に対する音源の相対位置を特定する。
音源位置特定部225は、例えば、第1マイク110、第2マイク120、第3マイク130のそれぞれに入力された同種の音の入力タイミングの差、及び音量の差に基づいて、音源の位置を特定する。
移動判定部220は、音源位置特定部225によって特定された音源の位置に基づいて、その音源が移動しているか否かを判定し、移動していると判定する場合には、その移動方向を算出する。
移動判定部220は、例えば、音源位置特定部225によって特定された音源の位置が時間と共に変化する場合に、その音源が移動していると判定する。そして、例えば、音源の位置の変異方向に基づいて、音源の移動方向を算出する。
視線画像生成部230は、イメージセンサー150を含み、音声情報表示装置100を頭部に装着して使用する使用者の左目を撮影して、その左目の視線の向きを算出するための視線画像を生成する。
視界特定部240は、視線画像生成部230によって生成された視線画像を解析して、使用者の左目の視線の向きを算出し、使用者の視界、すなわち、メガネフレーム180における左目用リムに対する使用者の視認範囲の相対位置を特定する。
ここで、視界の特定は、一例として、(1)視線画像生成部230によって生成された視線画像から、使用者の左目の瞳孔の位置を算出して、(2)算出した瞳孔の位置から使用者の左目の視線の向きを示す視線ベクトルを算出し、(3)メガネフレーム180における左目用リムによって定められる画角のうち、算出した視線ベクトルの方向を中心とした所定範囲内の領域を視界であると特定することで実現する。
判定部250は、音源位置特定部225によって音源の位置が特定された場合に、その音源の位置が視界特定部240によって特定された視界内に入っているか否かを調べることで、その音源位置が使用者の視界内であるか否かを判定する。
画像生成部260は、音種記号対応表300(後述)と、音量大きさ対応表400(後述)と、音源位置色対応表500(後述)と、移動方向拡大率対応表600(後述)とを記憶し、音源位置特定部225によって音源の位置が特定された場合に、記憶するこれら対応表を参照して、文字列生成部205によって生成された文字列と、音種特定部215によって特定された音種と、音量算出部210によって算出された音量と、移動判定部220によって算出された移動方向と、音源位置特定部225によって特定された音源の位置とに基づいて、表示部270に表示させるための画像を生成する。
図3は、画像生成部260によって記憶される音種記号対応表300の一例についての構成図である。
同図に示されるように、音種記号対応表300は、音種310と、記号320と、表示文字列330とが対応付けられて構成される。
音種310は、音種特定部215によって特定され得る音種である。
記号320は、音種特定部215によって、対応付けられた音種310が特定された場合に、画像生成部260が生成する画像に含ませるための記号(図柄)である。
表示文字列330は、音種特定部215によって特定された音種が、対応付けられた音種310である場合に、画像生成部260が生成する画像に含ませるための文字列である。
図4は、画像生成部260によって記憶される音量大きさ対応表400の一例についての構成図である。
同図に示されるように、音量大きさ対応表400は、音量410と、大きさ420とが対応付けられて構成される。
音量410は、音量算出部210によって算出される音量の範囲を示す情報である。
大きさ420は、音量算出部210によって算出された音量が、対応付けられた音量410で示される範囲である場合に、画像生成部260が生成する画像の大きさを示す情報である。
図5は、画像生成部260によって記憶される音源位置色対応表500の一例についての構成図である。
同図に示されるように、音源位置色対応表500は、音源位置510と、色520とが対応付けられて構成される。
音源位置510は、音源位置特定部225によって特定される音源の位置と、音声情報表示装置100との距離の範囲を示す情報である。
色520は、音源位置特定部225によって特定される音源の位置が、対応付けられた音源位置510で示される距離の範囲である場合に、画像生成部260が生成する画像の色を示す情報である。
図6は、画像生成部260によって記憶される移動方向拡大率対応表600の一例についての構成図である。
同図に示されるように、移動方向拡大率対応表600は、移動方向610と、拡大率620とが対応付けられて構成される。
移動方向610は、移動判定部220によって算出される音源の移動方向の範囲を示す情報である。
拡大率620は、移動判定部220によって算出される音源の移動方向が、対応付けられた移動方向610で示される範囲である場合に、画像生成部260が生成する画像の拡大率を示す情報である。
再び図2に戻って、音声情報表示装置100の構成についての説明を続ける。
表示部270は、半透明ディスプレイ140と、プロジェクター145とを含み、視界内外対応表700(後述)を記憶し、画像生成部260によって画像が生成された場合に、記憶する視界内外対応表700を参照して、移動判定部220によって算出された移動方向と、音源位置特定部225によって特定された音源の位置と、判定部250によって判定された判定結果とに基づいて、音源の位置が視界内である場合における画像のサイズと輝度とが、音源の位置が視界外である場合における画像のサイズと輝度とよりも抑制されるように画像の表示方法を決定し、決定した表示方法で、画像生成部260によって生成された画像を、半透明ディスプレイ140に表示する。
また、表示部270は、音源の位置が視界外である場合に、音源の位置を示す音源位置情報(例えば、音源の方向を向いた矢印)を生成して画像と共に表示し、音源の位置が視界内である場合において音源が移動しているときに、音源の移動方向を示す音源移動情報を生成して画像と共に表示する。
図7は、表示部270によって記憶される視界内外対応表700の一例についての構成図である。
同図に示されるように、視界内外対応表700は、条件710と、表示倍率720と、輝度倍率730とが対応付けられて構成される。
条件710は、判定部250によって判定された判定結果が、視界内であるか視界外であるかを示す情報である。
表示倍率720は、判定部250によって判定された判定結果が、対応付けられた条件710によって示されるものである場合に、画像生成部260によって生成された画像を表示部270が表示する際の表示倍率を示す情報である。
輝度倍率730は、判定部250によって判定された判定結果が、対応付けられた条件710によって示されるものである場合に、画像生成部260によって生成された画像を表示部270が表示する際の輝度倍率を示す情報である。
再び図2に戻って、音声情報表示装置100の構成についての説明を続ける。
振動報知部280は、バイブレーター160を含み、危険度ポイント対応表800(後述)を記憶し、画像生成部260によって画像が生成された場合に、記憶する危険度ポイント対応表800を参照して、文字列生成部205によって生成された文字列と、音量算出部210によって算出された音量と、音種特定部215によって特定された音種と、移動判定部220によって算出された音源の移動方向と、音源位置特定部225によって特定された音源の位置とに基づいて危険度ポイントを算出し、算出した危険度ポイントが所定値以上の場合に、バイブレーター160を振動させる。
図8は、振動報知部280によって記憶される危険度ポイント対応表800の一例についての構成図である。
同図に示されるように、危険度ポイント対応表800は、項目810と、条件820と、ポイント830とが対応付けられて構成される。
項目810は、危険度ポイントの算出対象となる項目を示す情報である。
条件820は、対応付けられた項目810についての条件を示す情報である。
ポイント830は、対応付けられた項目810について、対応付けられた条件820が満たされる場合に、危険度ポイントに加算されるポイントを示す情報である。
振動報知部280は、項目810毎にポイント830を算出して、全ての項目810のポイント830を加算することで危険度ポイントを算出する。
上記各機能ブロックは、プロセッサーがメモリに記憶されているプログラムを実行することで実現される。
<動作>
上記構成の音声情報表示装置100は、その特徴的な動作として、音声処理と、表示処理と、振動処理とを行う。
以下、これらの処理について、フローチャートに基づいて説明する。
(A)音声処理
音声処理は、音声信号生成部200に音が入力された場合に、その音の音量と、音源位置と、音種とを特定し、その音に人の声が含まれている場合には、その人の声に対して認識される文字列を生成する処理である。
図9は、音声処理のフローチャートである。
音声処理は、音声情報表示装置100が起動されることで開始される。
音声処理が開始されると、音声信号生成部200は、第1マイク110から入力された音に基づく第1音声信号と、第2マイク110から入力された音に基づく第2音声信号と、第3マイク110から入力された音に基づく第3音声信号とを生成する(ステップS900)。
第1音声信号と第2音声信号と第3音声信号とが生成されると、音量算出部210は、第1音声信号を解析して第1マイク110から入力された音の音量(以下、「第1音量」と呼ぶ。)を算出し、第2音声信号を解析して第2マイク120から入力された音の音量(以下、「第2音量」と呼ぶ。)を算出し、第3音声信号を解析して第3マイク130から入力された音の音量(以下、「第3音量」と呼ぶ。)を算出する(ステップS910)。
第1音量と第2音量と第3音量とが算出されると、音源位置特定部225は、第1音量と第2音量と第3音量とが所定値以上であるか否かを調べる(ステップS920)。
ステップS920の処理において、第1音量と第2音量と第3音量とが所定値以上である場合に(ステップS920:Yes)、音源位置特定部225は、第1音声信号と、第2音声信号と、第3音声信号とを解析して、音源の位置を特定する(ステップS930)。
音源の位置が特定されると、移動判定部220は、音源位置特定部225によって特定された音源の位置の時間変化に基づいて、音源が移動しているか否かを判定し、移動していると判定した場合には、その移動方向を算出する(ステップS940)。
音源が移動しているか否かが判定されると、音種特定部215は、音量算出部210によって最も音量が大きいと算出された音声信号を解析して、その音声信号の元となる音の音種を特定する(ステップS950)。
音種が特定されると、文字列生成部205は、音量算出部210によって最も音量が大きいと算出された音声信号に対して音声認識処理を行って、人の声の音声成分が含まれている場合に(ステップS960:Yes)、その声に対して認識される文字列を生成する(ステップS970)。
ステップS920の処理において、第1音量と第2音量と第3音量との少なくとも1つが所定値以上でない場合(ステップS920:No)と、ステップS960の処理において、人の声の音声成分が含まれていない場合(ステップS960:No)と、ステップS970の処理が終了した場合とに、再びステップS900の処理に戻って、ステップS900以降の処理を繰り返す。
(B)表示処理
表示処理は、音源位置特定部225によって音源の位置が特定された場合に、音声処理において、(1)算出された音量と移動方向、(2)特定された音種と音源位置、(3)生成された文字列、及び(4)判定された移動の有無に基づいて画像を生成して表示する処理である。
図10は、表示処理のフローチャートである。
表示処理は、上記音声処理において、音源位置特定部225によって音源の位置が特定されることで開始される。
表示処理が開始されると、視線画像生成部230は、使用者の左目を撮影して視線画像を生成する(ステップS1000)。
視線画像が生成されると、視界特定部240は、その視線画像を解析して、使用者の視界を特定する(ステップS1005)。
使用者の視界が特定されると、画像生成部260は、上記音声処理において、文字列生成部205によって生成された文字列と、音量算出部210によって算出された音量と、音種特定部215によって特定された音種と、移動判定部220によって算出された移動方向と、音源位置特定部225によって特定された音源位置とに基づいて画像(以下、便宜上「出力画像」と呼ぶこともある。)を生成する(ステップS1010)。
以下、ステップS1010において画像生成部260の行う画像の生成について説明する。
画像生成部260は、(1)文字列生成部205によって文字列が生成されている場合には、その文字列を含む画像が、出力画像の元となる元画像であると決定し、(2)文字列生成部205によって文字列が生成されていない場合には、音種記号対応表300を参照して、音種特定部215によって特定された音種に対応する記号320と表示文字列330とを含む画像が、出力画像の元となる元画像であると決定する。
元画像を決定すると、画像生成部260は、音量大きさ対応表400を参照して、音量算出部210によって算出された音量から、元画像の大きさを決定し、音源位置色対応表500を参照して、音源位置特定部225によって特定された音源位置から、元画像の色を決定する。
元画像の大きさと色とを決定すると、画像生成部260は、移動方向拡大率対応表600を参照して、移動判定部220によって算出された移動方向から、拡大率620を決定し、決定した拡大率620だけ元画像が拡大された出力画像を生成する。
ステップS1010の処理において画像生成部260によって画像が生成されると、判定部250は、音源の位置が、使用者の視界内であるか否かを判定する(ステップS1015)。
ステップS1015の処理において、使用者の視界内であると判定された場合に(ステップS1015:Yes)、表示部270は、移動判定部220によって音源が移動していると判定されていれば、移動判定部220によって算出された移動方向に基づいて、移動方向を示す音源移動情報を生成する(ステップS1020)。ここでは、一例として、音源移動情報が、移動方向の方向を向いている矢印であるとして説明する。移動判定部220によって音源が移動していると判定されていなければ、音源移動情報を生成しない。
ステップS1020の処理が終了すると、表示部270は、視界内外対応表700を参照して、画像生成部260によって生成された画像を、表示倍率720で示される倍率だけサイズを抑制し、輝度倍率730で示される倍率だけ輝度を抑制して、音源移動情報と共に、音源近傍に表示する(ステップS1025)。但し、ステップS1025の処理において音源移動情報が生成されていない場合には、音源移動情報を表示しない。
ステップS1015の処理において、使用者の視界内であると判定されなかった場合に(ステップS1015:No)、表示部270は、音源位置特定部225によって特定された音源の位置を示す音源位置情報を生成する(ステップS1030)。ここでは、一例として、音源位置情報が、音源の位置の方向を向いている矢印であるとして説明する。
音源位置情報が生成されると、表示部270は、視界内外対応表700を参照して、画像生成部260によって生成された画像を、サイズと輝度とを抑制せずに、音源位置情報と共に表示する(ステップS1035)。
ステップS1025の処理が終了した場合と、ステップS1035の処理が終了した場合とに、表示部270は、所定時間表示を維持した後、再び音源位置特定部225によって音源の位置が特定されているか否かを調べる(ステップS1040)。
音源位置特定部225によって再び音源の位置が特定されている場合に(ステップS1045:Yes)、再びステップS1000の処理に戻って、ステップS1000以降の処理を繰り返す。
音源位置特定部225によって再び音源の位置が特定されていない場合に(ステップS1045:No)、表示部270は、維持している表示を終了する(ステップS1050)
ステップS1050の処理が終わると、音声情報表示装置100は、その表示処理を終了する。
(C)振動処理
振動処理は、音源位置特定部225によって音源の位置が特定された場合に、その音源の危険度を示す危険度ポイントを算出し、算出した危険度ポイントが所定値以上の場合に、バイブレーター160を振動させて、危険な音源が存在する旨を使用者に通知する処理である。
図11は、振動処理のフローチャートである。
振動処理は、上記音声処理において、音源位置特定部225によって音源の位置が特定されることで開始される。
振動処理が開始されると、振動報知部280は、危険度ポイント対応表800を参照して、音声処理において、文字列生成部205によって生成された文字列と、音量算出部210によって算出された音量と、音種特定部215によって特定された音種と、移動判定部220によって算出された移動方向と、音源位置特定部225によって特定された音源位置とから危険度ポイントを算出する(ステップS1100)。
危険度ポイントが算出されると、振動報知部280は、その危険度ポイントが所定値以上であるか否かを調べる(ステップS1110)。
ステップS1110の処理において、危険度ポイントが所定値以上である場合に(ステップS1110:Yes)、振動報知部280は、バイブレーター160を振動させる(ステップS1120)。
ステップS1110の処理が終了した場合と、ステップS1110の処理において、危険度ポイントが所定値以上でない場合(ステップS1110:No)とに、音声情報表示装置100は、その振動処理を終了する。
<具体例>
以下、音声情報表示装置100に表示される画像の具体例について説明する。
図12(a)、図12(b)は、音声情報表示装置100を装着して使用する使用者の周辺に、「危ない、逃げろ」と発声する発声人物がいる場合において、音声情報表示装置100に表示される画像の例である。
図12(a)は、発声人物が使用者の視界内(破線の枠内)にいるときに表示される画像の例であり、図12(b)は、発声人物が使用者の視界外(破線の枠外)にいるときに表示される画像の例である。
図12(a)に示されるように、発声人物1200が視界内にいる場合には、文字列生成部205が音声認識を行うことで生成された「危ない、逃げろ」という表示文字列1210が、サイズと輝度とが抑制されて、発声人物1200の近傍に表示される。
一方で、図12(b)に示されるように、発声人物1250が視界外にいる場合には、文字列生成部205が音声認識を行うことで生成された「危ない、逃げろ」という表示文字列1260が、サイズと輝度とが抑制されずに、発声人物1250の方向を示す矢印1270と共に表示される。
図13(a)、図13(b)は、音声情報表示装置100を装着して使用する使用者の周辺に、サイレンを鳴らしながら移動する救急車が存在する場合において、音声情報表示装置100に表示される画像の例である。
図13(a)は、救急車が使用者の視界内(破線の枠内)に存在するときに表示される画像の例であり、図13(b)は、救急車が使用者の視界外(破線の枠外)に存在するときに表示される画像の例である。
図13(a)に示されるように、救急車1300が視界内に存在する場合には、救急車のサイレンを示す記号1320と表示文字列1340とが、サイズと輝度とが抑制されて、救急車1300の移動の向きを示す矢印1330と共に、救急車1300の近傍に表示される。
一方で、図13(b)に示されるように、救急車1350が視界外に存在する場合には、救急車のサイレンを示す記号1370と表示文字列1390とが、サイズと輝度とが抑制されずに、救急車1350の方向を示す矢印1380と共に表示される。
本実施の形態1によると、音声情報表示装置100は、音源の位置が使用者の視界内に存在する場合に、表示対象となる画像を、音源の位置が視界内に存在しない場合よりも視認性が低くなるように表示する。
これにより、音声情報表示装置100は、音源が視界内に存在している場合において発生し得る音源の視認性低下を従来よりも抑制すると共に、その視認性の差異により音源が視界内に存在しているか否かを従来よりも迅速に判断することが可能となる。
また、音声情報表示装置100は、音源の位置が使用者の視界内に存在しない場合に、その音源の方向を示す矢印を表示する。
これにより、音声情報表示装置100を使用する使用者は、比較的容易にその音源を視認するための行動(例えば、矢印の示す向きに振り向く。)を行うことができるようになる。
さらに、音声情報表示装置100は、音源の音種、音源の音量、音源の位置、音源の移動の方向に応じた画像を表示する。
これにより、音声情報表示装置100を使用する使用者は、その画像を視認するだけで、その音源についての多様な情報、すなわち、音源の音種、音源の音量、音源の位置、音源の移動の方向等の情報を得ることができるようになる。
また、音声情報表示装置100は、危険度ポイントが所定値以上の場合に、振動によって、危険な音源が存在する旨を使用者に通知する。
これにより、音声情報表示装置100を使用する使用者は、いち早く危険な音源に対する認知行動を取ることができるようになる。
<<実施の形態2>>
以下、実施の形態1における音声情報表示装置100の一部が変形された音声情報表示装置1400について説明する。
音声情報表示装置1400は、頭部に装着して使用する使用者の近傍に存在する所定の機器(ここでは、MFP(MultiFunction Peripheral:複合機)1500として説明する。)から、警告音、音声ガイダンス等といったその機器に対処する必要性が生じ得る音が出力された場合に、その音に応じた画像を生成して表示する。
以下、図面を参照しながら、実施の形態1における音声情報表示装置100との相違点を中心に説明する。
<構成>
図14は、音声情報表示装置1400の斜視図である。
同図に示されるように、音声情報表示装置1400は、ハードウエアとしては、実施の形態1における音声情報表示装置100に対して、イメージセンサー150が削除され、撮影カメラ1410が追加されている点が異なる。
撮影カメラ1410は、メガネフレーム180における左耳用テンプルに、前方を向いて配置され、音声情報表示装置1400を頭部に装着して使用する使用者の視界を含む領域を撮影して、画像を生成する。
図15は、上記所定の機器の一例であるMFP1500の斜視図である。
同図に示されるように、MFP1500は、表示パネル1510と、QRコード(登録商標)1520と、スピーカー1530とを備える。
表示パネル1510は、MFP1500の状態に係るメッセージを表示する。
例えば、MFP1500がコピー処理を実行した後に、MFP1500にコピー原稿が残っている場合に、「原稿が残っています。」との文字列からなるメッセージを表示し、例えば、MFP1500に不具合が生じた場合に、「トラブルが発生しました。」との文字列からなるメッセージを表示する。
QRコード(登録商標)1520は、MFP1500の機種を特定する情報を含むQRコード(登録商標)であって、表示パネル1510の表示面に印刷されている。
スピーカー1530は、MFP1500の状態に係る音声を出力する。
例えば、MFP1500がコピー処理を実行した後に、MFP1500にコピー原稿が残っている場合に、「ピーピー」という警告音を出力し、例えば、MFP1500に不具合が生じた場合に、「ブーブー」という警告音を出力し、例えば、コピー原稿が所定位置に置かれたされた場合に、「コピー枚数を設定してコピーボタンを押してください。」という音声ガイダンスを出力する。
音声情報表示装置1400は、上記ハードウエアの変更に加えて、実施の形態1における音声情報表示装置100に対して、メモリに記憶されたプログラムの一部が変更されるようにも変形されており、このため、プロセッサーがプログラムを実行することで実現される機能の一部が変更されるように変形されている。
図16は、音声情報表示装置1400の機能構成図である。
同図に示されるように、音声情報表示装置1400は、実施の形態1における音声情報表示装置100に対して、視界画像生成部1610と、成分判定部1620と、パネル判定部1630とが追加され、視界特定部240が視界特定部1640に変更され、画像生成部260が画像生成部1660に変更され、表示部270が表示部1670に変更されている点が異なる。
視界特定部1640は、使用者の視界を特定する点においては、実施の形態1における視界特定部240と同様であるが、その特定方法が異なっている。
視界特定部1640は、メガネフレーム180における左目用リムによって定められる画角が使用者の視界であるとして特定する。
この構成は、使用者の視線があまり変動しない状況で使用されることが想定される場合において、イメージセンサー150が不要となるため、コストの観点において有効となる。
視界画像生成部1610は、撮影カメラ1410を含み、音声情報表示装置1400を頭部に装着して使用する使用者の視界を含む領域を撮影して、視界画像を生成する。
一例として、視界画像生成部1610は、予め、撮影カメラ1410によって撮影される画像のうち、どの領域が、メガネフレーム180における左目用リムによって定められる画角に相当する領域(すなわち、使用者の視界)であるかを記憶しておき、撮影カメラ1410によって撮影された画像に対してトリミング加工をして、使用者における視界の画像となる視界画像を生成する。
成分判定部1620は、音量算出部210によって最も音量が大きいと算出された音声信号を解析して、その音声信号の元となる音が、MFP1500から出力される所定の音のうちのいずれの音声成分を含んでいるか、またはいずれも含んでいないかを特定する。
所定の音としては、例えば、MFP1500がコピー処理を実行した後に、MFP1500にコピー原稿が残っている場合に出力される「ピーピー」という警告音、MFP1500に不具合が生じた場合に出力される「ブーブー」という警告音、コピー原稿が所定位置に置かれた場合に出力される「コピー枚数を設定してコピーボタンを押してください。」という音声ガイダンス音等が考えられる。
成分判定部1620は、例えば、MFP1500から出力される所定の音の音声信号をサンプル音声信号として記憶し、解析対象となる音声信号とサンプル音声信号とを比較することで、上記判定を行う。
パネル判定部1630は、視界画像生成部1610によって視界画像が生成された場合に、その視界画像を解析して、音声情報表示装置1400を頭部に装着して使用する使用者の視界の中にQRコード(登録商標)1520が含まれていれば、その視界に表示パネル1510の表示面が含まれていると判定し、その視界にQRコード(登録商標)1520が含まれていなければ、その視界に表示パネル1510の表示面が含まれていないと判定する。
画像生成部1660は、実施の形態1における画像生成部260の行う動作に加えて、以下の動作を行う。
画像生成部1660は、成分判定部1620によって、音声信号生成部200によって生成された音声信号に、MFP1500から出力される所定の音のうちのいずれかの音の音声成分が含まれていると特定された場合において、パネル判定部1630によって、使用者の視界に表示パネル1510の表示面が含まれていると判定されたときに、視界画像生成部1610によって生成された視界画像に対して文字認識処理を行って、表示パネル1510に表示されている、その警告音に対応するメッセージの位置を特定し、そのメッセージを取り囲む矩形のマーク(以下、「ボックス」と呼ぶ。)の画像を生成すると共に、その表示位置を示す情報を生成する。
図17(a)、図18(a)には、画像生成部1660が生成するボックスの一例が示されている。
図17(a)には、MFP1500から出力される所定の音が、MFP1500がコピー処理を実行した後に、コピー原稿が残っている場合に出力される「ピーピー」という警告音の場合に生成されるボックス1710が示され、図18(a)には、MFP1500から出力される所定の音が、不具合が生じた場合に出力される「ブーブー」という警告音の場合に生成されるボックス1810が示されている。
再び図16に戻って、画像生成部1660の説明を続ける。
画像生成部1660は、成分判定部1620によって、音声信号生成部200によって生成された音声信号に、MFP1500から出力される所定の音のうちのいずれかの警告音の音声成分が含まれていると特定された場合において、パネル判定部1630によって、使用者の視界に表示パネル1510の表示面が含まれていないと判定されたときに、予めその警告音に対応付けられて記憶している、その警告音の擬音語と、その警告音の意味を示す文字列とを含む画像を生成する。
図17(b)、図18(b)には、画像生成部1660が生成する画像に含まれる擬音語と文字列との一例が示されている。
図17(b)には、MFP1500から出力される所定の音が、MFP1500がコピー処理を実行した後に、コピー原稿が残っている場合に生成される「ピーピー」という警告音の場合に生成される擬音語1760と表示文字列1750とが示され、図18(b)には、MFP1500から出力される所定の音が、不具合が生じた場合に出力される「ブーブー」という警告音の場合に生成される擬音語1860と表示文字列1850とが示されている。
再び図16に戻って、画像生成部1660の説明を続ける。
画像生成部1660は、成分判定部1620によって、音声信号生成部200によって生成された音声信号に、MFP1500から出力される所定の音のうちのいずれかの音声ガイダンスの音声成分が含まれていると特定された場合に、予めその音声ガイダンスに対応付けられて記憶している、その音声ガイダンスの意味を示す文字列を含む画像を生成する。
図19には、画像生成部1660が生成する画像に含まれる音声ガイダンスの意味を示す文字列の一例が示されている。
同図には、音声ガイダンスが、コピー原稿が所定位置に置かれた場合に出力される「コピー枚数を設定してコピーボタンを押してください。」という音声ガイダンスである場合に生成される表示文字列1900が示されている。
再び図16に戻って、音声情報表示装置1400の構成についての説明を続ける。
表示部1670は、実施の形態1における表示部270の行う動作に加えて、以下の動作を行う。
表示部1670は、成分判定部1620によって、音声信号生成部200によって生成された音声信号に、MFP1500から出力される所定の音のうちのいずれかの警告音の音声成分が含まれていると特定された場合において、パネル判定部1630によって、使用者の視界に表示パネル1510の表示面が含まれていると判定されたとき(以下、「条件1が満たされたとき」と呼ぶ。)に、画像生成部1660によって生成されたボックスの画像を、画像生成部1660によって生成されたそのボックスの表示位置を示す情報で示される位置に表示する。
図17(a)、図18(a)は、条件1が満たされたときに、表示部1670が行う表示の例である。図17(a)、図18(a)には、メガネフレーム180の一部が描画されていないが、半透明ディスプレイ140にボックス(ボックス1710、ボックス1810)が表示されることが示されている様子を、メガネフレーム180の描写が省略されて示されている。
図17(a)、図18(a)に示されるように、表示部1670は、画像生成部1660によって生成されたボックス(ボックス1710、ボックス1810)を、画像生成部1660によって生成された表示位置を示す情報で示される位置(すなわち、該当するメッセージを取り囲む位置)に表示する。
再び図16に戻って、表示部1670の説明を続ける。
表示部1670は、成分判定部1620によって、音声信号生成部200によって生成された音声信号に、MFP1500から出力される所定の音のうちのいずれかの警告音の音声成分が含まれていると特定された場合において、パネル判定部1630によって、使用者の視界に表示パネル1510の表示面が含まれていないと判定されたとき(以下、「条件2が満たされたとき」と呼ぶ。)に、MFP1500の位置を示す音源位置情報(例えば、MFP1500の方向を向いた矢印)を生成して、画像生成部1660によって生成された擬音語と文字列と共に表示する。
図17(b)、図18(b)は、条件2が満たされたときに、表示部1670が行う表示の例である。
図17(b)、図18(b)に示されるように、表示部1670は、生成した音源位置情報(矢印1770、矢印1870)を、画像生成部1660によって生成された擬音語(擬音語1760、擬音語1860)と文字列(表示文字列1750、表示文字列1850)と共に表示する。
再び図16に戻って、表示部1670の説明を続ける。
表示部1670は、成分判定部1620によって、音声信号生成部200によって生成された音声信号に、MFP1500から出力される所定の音のうちのいずれかの音声ガイダンスの音声成分が含まれていると特定された場合(以下、「条件3が満たされたとき」と呼ぶ。)に、画像生成部1660によって生成された、音声ガイダンスの意味を示す文字列を、所定位置に表示する。
図19は、条件3が満たされたときに、表示部1670が行う表示の例である。
同図に示されるように、表示部1670は、画像生成部1660によって生成された文字列(表示文字列1900)を、所定位置に表示する。
上記各機能ブロックは、プロセッサーがメモリに記憶されているプログラムを実行することで実現される。
<動作>
上記構成の音声情報表示装置1400は、その特徴的な動作として、実施の形態1における音声情報表示装置100の行う、音声処理と、表示処理と、振動処理とに加えて、機器メッセージ通知処理を行う。
以下、機器メッセージ通知処理にいてフローチャートに基づいて説明する。
機器メッセージ通知処理は、音声情報表示装置1400を頭部に装着して使用する使用者の近傍に存在する所定の機器(ここではMFP1500)から、警告音、音声ガイダンス等といったその機器に対処する必要性が生じる可能性のある所定の音が出力された場合に、その音に応じた画像を生成して表示する処理である。
図20は、機器メッセージ通知処理のフローチャートである。
機器メッセージ通知処理は、音声信号生成部200によって生成された音声信号に、MFP1500から出力される所定の音のうちのいずれかの音の音声成分が含まれていると、成分判定部1620によって特定されることで開始される。
機器メッセージ通知処理が開始されると、成分判定部1620は、対象となる所定の音が、MFP1500の警告音であるか否かを調べる(ステップS2000)。
ステップS2000の処理において、MFP1500の警告音である場合に(ステップS2000:Yes)、視界画像生成部1610は、使用者の視界を含む領域を撮影して、視界画像を生成する(ステップS2005)。
視界画像が生成されると、パネル判定部1630は、視界画像を解析して、使用者の視界にMFP1500の表示パネル1510が含まれているか否かを調べる(ステップS2010)。
ステップS2010の処理において、視界に表示パネル1510が含まれている場合に(ステップS2010:Yes)、画像生成部1660は、表示パネル1510に表示されている、対象となる警告音に対応するメッセージの位置を特定する(ステップS2015)。そして、そのメッセージを取り囲むボックスを生成して(ステップS2020)、その表示位置を示す情報を生成する。すると、表示部1670は、そのボックスを、その表示位置、すなわち、メッセージを取り囲む位置に表示する(ステップS2025)。
ステップS2010の処理において、視界に表示パネル1510が含まれていない場合に(ステップS2010:No)、画像生成部1660は、対象となる警告音に対応付けられている、その警告音の擬音語と、その警告音の意味を示す文字列とを含む画像を生成する(ステップS2030)。すると、表示部1670は、MFP1500の位置を示す音源位置情報(例えば、MFP1500の方向を向いた矢印)を生成して(ステップS2035)、画像生成部1660によって生成された擬音語と文字列と共に表示する(ステップS2040)。
ステップS2025の処理が終了した場合と、ステップS2040の処理が終了した場合とに、成分判定部1620は、ステップS2000:Yesの処理において、MFP1500の警告音であると判定した後に所定時間経過後もその警告音が継続しているか否かを調べる(ステップS2045)。
ステップS2045の処理において、所定時間経過後もその警告音が継続している場合に(ステップS2045:Yes)、再びステップS2005の処理に戻って、ステップS2005以降の処理を繰り返す。
ステップS2045の処理において、所定時間経過後もその警告音が継続していない場合に(ステップS2045:No)、表示部1670は、その表示を終了する(ステップS2050)。
ステップS2000の処理において、MFP1500の警告音でない場合に(ステップS2000:No)、成分判定部1620は、対象となる所定の音が、MFP1500の音声ガイダンスであるか否かを調べる(ステップS2055)。
ステップS2055の処理において、MFP1500の音声ガイダンスである場合に(ステップS2055:Yes)、画像生成部1660は、予めその音声ガイダンスに対応付けられて記憶している、その音声ガイダンスの意味を示す文字列を含む画像を生成する。(ステップS2060)。
音声ガイダンスの意味を示す文字列が生成されると、表示部1670は、その文字列を所定位置に表示する(ステップS2065)。
文字列を表示後所定時間経過すると、表示部1670は、その表示を終了する(ステップS2070)。
ステップS2055の処理において、MFP1500の音声ガイダンスでない場合と(ステップS2055:No)、ステップS2050の処理が終了した場合と、ステップS2070の処理が終了した場合とに、音声情報表示装置1400は、その機器メッセージ通知処理を終了する。
実施の形態2によると、音声情報表示装置1400は、MFP1500から警告音が出力された場合において、MFP1500の表示パネル1510が視界内にあるときに、その警告音に対応して表示パネル1510に表示されるメッセージに対して、そのメッセージを取り囲むボックスを表示する。
これにより、音声情報表示装置1400は、使用者に対して、そのメッセージに着目させることができるようになる。
また、音声情報表示装置1400は、MFP1500から警告音が出力された場合において、MFP1500の表示パネル1510が視界外にあるときに、その警告音の意味を示す文字列を表示する。
これにより、音声情報表示装置1400は、使用者に対して、その警告音の意味を視覚的に認識させることができる。
さらに、音声情報表示装置1400は、MFP1500から音声ガイダンスが出力された場合に、その音声ガイダンスの意味を示す文字列を表示する。
これにより、音声情報表示装置1400は、使用者に対して、その音声ガイダンスの意味を視覚的に認識させることができる。
<補足>
以上、本発明に係る音声情報表示装置の一態様として、実施の形態1と実施の形態2とにおいて、2つの音声情報表示装置を例示して説明したが、以下のように変形することも可能であり、実施の形態1と実施の形態2とにおいて例示した通りの音声情報表示装置に限られないことはもちろんである。
(1)実施の形態1において、音声情報表示装置100は、いわゆるメガネ型のヘッドマウントディスプレイであって、左目側に半透明ディスプレイ140が配され、右目側にガラス195が配される構成の例であった。しかしながら、使用者による外景の視認性を確保しつつ、使用者の視界内に、生成した画像を表示することができる構成であれば、必ずしも、上記構成通りでなくても構わない。例えば、右目側に半透明ディスプレイが配され、左目側にガラスが配される構成、両目共に半透明ディスプレイが配される構成等が考えられる。さらには、例えば、いわゆるゴーグル型のヘッドマウントディスプレイである構成の例等も考えられる。
(2)実施の形態1において、音声情報表示装置100は、3つのマイクを備える構成の例であった。しかしながら、音源の位置を特定することができる構成であれば、必ずしも上記構成通りでなくても構わない。例えば、4つのマイクを備える構成の例も考えられる。
(3)実施の形態1において、音声情報表示装置100は、音量に応じて画像の大きさが定められ、音源位置に応じて画像の色が定められ、音源の移動方向に応じて画像の拡大率が定められる構成の例であった。しかしながら、音量、音源位置、音源の移動方向に応じて画像の形態が変更される構成であれば、必ずしも上記構成通りでなくても構わない。
さらには、別の変形例として、音量、音源位置、音源の移動方向に応じて画像の形態を変更しない構成の例も考えられる。
(4)実施の形態1において、音声情報表示装置100は、例えば、図13(a)、(b)に示されるように、(a)音源が視界内の場合には、表示部270が、記号1320と表示文字列1340とを、サイズと輝度とを抑制して表示し、(b)音源が視界外の場合には、表示部270が、記号1370と表示文字列1390とを、サイズと輝度とを抑制せずに表示する構成の例であった。
これに対して、別の変形例として、例えば、図21(a)、(b)に示されるように、(a)音源が視界内の場合には、表示部270が、記号1320を、サイズと輝度とを抑制して表示し、(b)音源が視界外の場合には、表示部270が、表示文字列1390を、サイズと輝度とを抑制せずに表示する構成の例も考えられる。
(5)実施の形態1において、音声情報表示装置100は、プロジェクター145が、半透明ディスプレイ140の表示面に画像を投影する構成の例であった。
これに対して、別の変形例として、例えば、プロジェクター145を備えずに、半透明ディスプレイ140の表示面に半透明の液晶ディスプレイが配され、その半透明の液晶ディスプレイに直接画像が表示される構成とすることも可能である。
本発明に係る音声情報表示装置は、音声に対応する画像を表示する機器に広く利用することができる。
100 音声情報表示装置
200 音声信号生成部
205 文字列生成部
210 音量算出部
215 音種特定部
220 移動判定部
225 音源位置特定部
230 視線画像生成部
240 視界特定部
250 判定部
260 画像生成部
270 表示部
280 振動報知部

Claims (11)

  1. 使用者に装着されて使用される音声情報表示装置であって、
    複数の位置で集音して音声信号を生成する音声信号生成部と、
    前記音声信号生成部によって生成された音声信号に基づいて、音源の位置を特定する音源位置特定部と、
    前記音声信号生成部によって生成された音声信号に基づく画像を生成して表示する画像生成表示部と、
    前記音源位置特定部によって特定された音源の位置が、前記使用者の視界内であるか否かを判定する判定部とを備え、
    前記画像生成表示部は、前記表示を、前記判定部による判定が肯定的な場合に、前記判定部による判定が否定的な場合に比べて視認性が低くなるように行う
    ことを特徴とする音声情報表示装置。
  2. 前記画像生成表示部は、前記判定部による判定が否定的な場合に、前記表示を、表示する画像と共に、当該画像に対応する音源について前記音源位置特定部によって特定された音源の位置を示す情報が表示されるように行う
    ことを特徴とする請求項1記載の音声情報表示装置。
  3. 前記音声信号生成部によって生成された音声信号に基づいて、前記音源位置特定部によって位置が特定された音源から発せられた音の種類を特定する音種類特定部を備え、
    前記画像生成表示部は、前記表示を、表示対象となる画像に対応する音源から発せられた音について前記音種類特定部によって特定された音の種類が、所定の種類である場合とない場合とで、互いに異なるように行う
    ことを特徴とする請求項1乃至2記載の音声情報表示装置。
  4. 前記音声信号生成部によって生成された音声信号に基づいて、前記音源位置特定部によって位置が特定された音源から発せられた音の音量を算出する音量算出部を備え、
    前記画像生成表示部は、前記表示を、表示対象となる画像に対応する音源から発せられた音について前記音量算出部によって算出された音量が、所定の閾値を上回る場合と下回る場合とで、互いに異なるように行う
    ことを特徴とする請求項1乃至3記載の音声情報表示装置。
  5. 前記音声信号生成部によって生成された音声信号に人の声の音声成分が含まれている場合に、当該音声信号に対して音声認識処理を行って当該人の声に対応する文字列を生成する文字列生成部を備え、
    前記画像生成表示部は、前記表示を、生成対象となる画像に対応する音源から発せられた音の音声信号に対して、前記文字列生成部によって文字列が生成された場合には、当該文字列が含まれるように行う
    ことを特徴とする請求項1乃至4記載の音声情報表示装置。
  6. 前記音声信号生成部によって生成された音声信号に基づいて、前記音源位置特定部によって位置が特定された音源が移動しているか否かを判定する移動判定部を備え、
    前記画像生成表示部は、前記判定部による判定が肯定的な場合において、前記移動判定部による判定が肯定的なときに、前記表示を、表示する画像と共に当該画像に対応する音源が移動している旨を示す情報が表示されるように行う
    ことを特徴とする請求項1乃至5記載の音声情報表示装置。
  7. 前記音声信号生成部によって生成された音声信号が、所定の条件を満たしている場合に、当該音声信号が当該所定の条件を満たしている旨を、前記使用者に振動によって報知する振動報知部を備える
    ことを特徴とする請求項1乃至6記載の音声情報表示装置。
  8. 前記使用者の眼を撮影して画像を生成する眼画像生成部と、
    前記眼画像生成部によって生成された画像に基づいて、前記使用者の視界を特定する視界特定部とを備え、
    前記判定部は、前記判定を、前記視界特定部によって特定された視界に基づいて行う
    ことを特徴とする請求項1乃至7記載の音声情報表示装置。
  9. 前記使用者の視界を含む領域を撮影して視界画像を生成する視界画像生成部と、
    前記視界画像生成部によって生成された視界画像に基づいて、前記使用者の視界に、特定機器における表示パネルの表示面が含まれているか否かを判定するパネル判定部と、
    前記音声信号生成部によって生成された音声信号が、前記特定機器における所定の音声信号成分を含んでいるか否かを判定する成分判定部を備え、
    前記画像生成表示部は、前記表示を、
    前記パネル判定部による判定が肯定的な場合において、前記成分判定部による判定が肯定的なときに、表示する画像が、前記表示パネルの表示面に前記使用者の注意を促す旨を示す画像となるように行い、
    前記パネル判定部による判定が否定的な場合において、前記成分判定部による判定が肯定的なときに、表示する画像が、前記特定の音声信号成分に対応する文字列が含まれるように行う
    ことを特徴とする請求項1記載の音声情報表示装置。
  10. 前記音声信号生成部によって生成された音声信号が、所定の音声ガイダンスに対応付けられた所定の音声信号成分を含んでいるか否かを判定する成分判定部を備え、
    前記画像生成表示部は、前記成分判定部による判定が肯定的な場合における前記表示を、前記所定の音声ガイダンスの内容を示す文字列が含まれるように行う
    ことを特徴とする請求項1記載の音声情報表示装置。
  11. 前記画像生成表示部は、前記使用者が外景を視認可能に透過する半透明な表示領域を有し、前記表示を、当該表示領域に行う
    ことを特徴とする請求項1乃至10記載の音声情報表示装置。
JP2015000235A 2015-01-05 2015-01-05 音声情報表示装置 Pending JP2016126188A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015000235A JP2016126188A (ja) 2015-01-05 2015-01-05 音声情報表示装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015000235A JP2016126188A (ja) 2015-01-05 2015-01-05 音声情報表示装置

Publications (1)

Publication Number Publication Date
JP2016126188A true JP2016126188A (ja) 2016-07-11

Family

ID=56359408

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015000235A Pending JP2016126188A (ja) 2015-01-05 2015-01-05 音声情報表示装置

Country Status (1)

Country Link
JP (1) JP2016126188A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018049010A (ja) * 2016-09-22 2018-03-29 ナビティア・エルエルシー 拡張現実アーキテクチャにおける改善されたデータ統合のためのシステムおよび方法
JP2021507277A (ja) * 2017-12-20 2021-02-22 ビュージックス コーポレーションVuzix Corporation 拡張現実ディスプレイシステム
JP2021043257A (ja) * 2019-09-06 2021-03-18 富士ゼロックス株式会社 情報処理装置、及び情報処理プログラム
JP7216851B1 (ja) 2022-02-21 2023-02-01 真吾 澤田 聴覚支援ウエラブルデバイス、及びプログラム
WO2023176145A1 (ja) * 2022-03-18 2023-09-21 ソニーグループ株式会社 情報処理装置、情報処理方法、及びプログラム
WO2023238721A1 (ja) * 2022-06-08 2023-12-14 富士フイルム株式会社 情報作成方法、及び情報作成装置
JP7476128B2 (ja) 2021-03-11 2024-04-30 株式会社日立製作所 表示システムおよび表示装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018049010A (ja) * 2016-09-22 2018-03-29 ナビティア・エルエルシー 拡張現実アーキテクチャにおける改善されたデータ統合のためのシステムおよび方法
JP2021507277A (ja) * 2017-12-20 2021-02-22 ビュージックス コーポレーションVuzix Corporation 拡張現実ディスプレイシステム
JP7171727B2 (ja) 2017-12-20 2022-11-15 ビュージックス コーポレーション 拡張現実ディスプレイシステム
US11921289B2 (en) 2017-12-20 2024-03-05 Vuzix Corporation Augmented reality display system
JP2021043257A (ja) * 2019-09-06 2021-03-18 富士ゼロックス株式会社 情報処理装置、及び情報処理プログラム
JP7476128B2 (ja) 2021-03-11 2024-04-30 株式会社日立製作所 表示システムおよび表示装置
JP7216851B1 (ja) 2022-02-21 2023-02-01 真吾 澤田 聴覚支援ウエラブルデバイス、及びプログラム
WO2023157912A1 (ja) * 2022-02-21 2023-08-24 真吾 澤田 聴覚支援ウエラブルデバイス、及びプログラム
JP2023121436A (ja) * 2022-02-21 2023-08-31 真吾 澤田 聴覚支援ウエラブルデバイス、及びプログラム
WO2023176145A1 (ja) * 2022-03-18 2023-09-21 ソニーグループ株式会社 情報処理装置、情報処理方法、及びプログラム
WO2023238721A1 (ja) * 2022-06-08 2023-12-14 富士フイルム株式会社 情報作成方法、及び情報作成装置

Similar Documents

Publication Publication Date Title
JP2016126188A (ja) 音声情報表示装置
US9779758B2 (en) Augmenting speech segmentation and recognition using head-mounted vibration and/or motion sensors
US20210082435A1 (en) Multi-mode guard for voice commands
US10289205B1 (en) Behind the ear gesture control for a head mountable device
US10191282B2 (en) Computer display device mounted on eyeglasses
JP5881263B2 (ja) 着用可能な計算機システムへのサウンド状態の表示
US11320655B2 (en) Graphic interface for real-time vision enhancement
JP6551417B2 (ja) ウェアラブルデバイス、表示制御方法、及び表示制御プログラム
JP6112878B2 (ja) ウェアラブル型表示装置及びプログラム
JP6555272B2 (ja) ウェアラブルデバイス、表示制御方法、及び表示制御プログラム
US11482238B2 (en) Audio-visual sound enhancement
US20170243520A1 (en) Wearable device, display control method, and computer-readable recording medium
US20190228639A1 (en) Information processing system, recording medium, and information processing method
JP7048784B2 (ja) 表示制御システム、表示制御方法及びプログラム
JP2016194612A (ja) 視覚認識支援装置および視覚認識支援プログラム
JP2021165864A (ja) 情報処理装置、情報処理方法、及びプログラム
JP7487663B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2015125464A (ja) ウェアラブルデバイス
KR101455830B1 (ko) 안경 및 그 제어방법
JP2017142825A (ja) ウェアラブルデバイス
US20230221583A1 (en) Smart glasses to assist those who are deaf or hard of hearing
WO2023058451A1 (ja) 情報処理装置、情報処理方法、及びプログラム
KR102334319B1 (ko) 증강 현실 표시 장치를 이용한 청각 정보의 시각 변환 및 전달 방법 및 장치
US12032155B2 (en) Method and head-mounted unit for assisting a hearing-impaired user
US20220066207A1 (en) Method and head-mounted unit for assisting a user