JP4891375B2 - 画像聴覚化装置 - Google Patents

画像聴覚化装置 Download PDF

Info

Publication number
JP4891375B2
JP4891375B2 JP2009221956A JP2009221956A JP4891375B2 JP 4891375 B2 JP4891375 B2 JP 4891375B2 JP 2009221956 A JP2009221956 A JP 2009221956A JP 2009221956 A JP2009221956 A JP 2009221956A JP 4891375 B2 JP4891375 B2 JP 4891375B2
Authority
JP
Japan
Prior art keywords
sound
image
axis direction
auralization
emitted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009221956A
Other languages
English (en)
Other versions
JP2011067479A (ja
Inventor
昌弘 黒田
Original Assignee
昌弘 黒田
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 昌弘 黒田 filed Critical 昌弘 黒田
Priority to JP2009221956A priority Critical patent/JP4891375B2/ja
Publication of JP2011067479A publication Critical patent/JP2011067479A/ja
Application granted granted Critical
Publication of JP4891375B2 publication Critical patent/JP4891375B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Studio Devices (AREA)
  • Stereophonic System (AREA)

Description

本発明は、撮像手段によって得られた画像を聴覚的に表現する画像聴覚化装置に関する。
従来、視覚障害者は、杖を周囲の物体に接触させることや、信号機の誘導音などから周囲の状況を確認している。
しかしながら、杖を用いる場合、視覚障害者は杖で周囲の物体に触れることが必要であり、杖の先を継続的に広範囲に動かさなければならない。従って、杖が段差や障害物等に接触せずに、それら段差等を認識し損ねてしまうおそれがある。また、誘導音などを利用するにあたっては、それを発するための設備が設けられていることが必要である。
そこで、特段の設備が設けられていない環境下においても、視覚によることなく周囲に位置する物体などを認識可能とすべく、物体をCCDカメラ等の撮像手段で読み取った上で、読み取られた画像データの輪郭を音に変換し、その音により利用者に聴覚をもって当該画像データを認識させる技術が提案されている(例えば、特許文献1等参照)。当該技術について詳述すると、輪郭情報のX軸は、左右の耳への音の強度差(音量差)により表現され、輪郭情報のY軸は、音の周波数により表現されるようになっている。
特開2003−84784号公報
ところが、音の周波数が比較的大きい(例えば、6000Hzを超える)場合には、X軸方向の位置を識別させるために、左右の音の強度差を比較的大きく(例えば、20db以上と)する必要がある。従って、上記従来技術を用いた場合には、利用者はX軸方向に沿った位置を正確に把握することが難しく、画像データひいては周囲の状況を誤って認識してしまうおそれがある。
本発明は、上記事情を鑑みてなされたものであり、その目的は、視覚障害者等の利用者が、物体に接触することなく、聴覚を持って周囲の物体などをより正確に認識可能な画像聴覚化装置を提供することにある。
以下、上記目的を解決するのに適した各手段につき、項分けして説明する。なお、必要に応じて対応する手段に特有の作用効果を付記する。
手段1.撮像手段と、
利用者の左右の耳に装着され、各耳に対応した発音機を備える発音手段と、
前記撮像手段により得られた撮像画像に基づいて、X軸方向及びY軸方向に沿って延びる複数の走査線により形成された複数のドットからなる処理画像を得る画像処理手段と、
前記処理画像を構成する各ドットに対応して、前記発音手段から発する音を決定する発生音決定手段とを備える画像聴覚化装置であって、
前記発生音決定手段は、
左右の耳への音の到達時間に差を設けることで、前記処理画像中におけるX軸方向に沿った前記ドットの位置を表すとともに、
Y軸方向のプラス側からマイナス側へと向かって増加又は減少し、Y軸方向に沿った前記ドットの各行ごとに割り当てられる周波数により、前記処理画像中におけるY軸方向に沿った前記ドットの位置を表すことを特徴とする画像聴覚化装置。
上記手段1によれば、画像処理手段により、例えば周囲の物体の形状や位置などを示す撮像画像に基づいて、複数のドットからなる処理画像が生成される。そして、処理画像を構成する複数のドットの位置について、左右の耳に対する音の到達時間差を用いることでX軸方向(左右方向)の位置が表され、音の周波数の大小を用いることでY軸方向(上下方向)の位置が表される。従って、処理画像をより容易に、かつ、より正確に聴覚をもって認識することができ、周囲の物体の位置や形状などをより正確に認識することができる。
特に上記手段1によれば、処理画像中におけるX軸方向に沿ったドットの位置は、左右の耳への音の到達時間差を用いることにより表されている。このため、X軸方向に沿った位置を音の強度差を用いて表現する上記従来技術と比較して、周囲の物体の位置や形状などを非常に正確に認識することができる。
手段2.音の強度の大小を用いて、前記処理画像中における前記ドットの濃淡を表すことを特徴とする手段1に記載の画像聴覚化装置。
上記手段2によれば、音の強度(音圧)を調節することで、処理画像中における各ドットの濃淡が表される。そのため、物体の位置などに加えて、物体の凹凸等、物体のより正確な形状を認識することができる。
手段3.前記左右各耳に対応する発音機は、利用者の各耳に装着された際に、利用者の外耳道の上方に配置される第1スピーカと、利用者の外耳道の下方に配置される第2スピーカとをそれぞれ備え、
周波数の高低に対応して、両スピーカのうちの一方から発せられる音の強度を増大させる一方で、両スピーカのうちの他方から発せられる音の強度を低減させることを特徴とする手段1又は2に記載の画像聴覚化装置。
上記手段3によれば、各発音機は、外耳道の上側から音を発する第1スピーカと、外耳道の下側から音を発する第2スピーカとをそれぞれ備えており、例えば、処理画像中の上側にあるドットを表すときには、前記第1スピーカから発する音の強度を増大させる一方で、第2スピーカから発する音の強度を低減させるようになっている。また、処理画像中の下側にあるドットを表すときには、例えば、第1スピーカから発する音の強度が低減される一方で、第2スピーカから発する音の強度を増大させるようになっている。すなわち、本手段3においては、上方側に位置するドットを表現する際には、あたかも上方から音が発せられているかのように両スピーカから発せられる音に強度差が設けられ、一方で、下方側に位置するドットを表現する際には、あたかも利用者の下方から音が発せられているかのように両スピーカから発せられる音に強度差が設けられる。従って、処理画像中におけるドットのY軸方向(上下方向)に沿った位置をより正確に認識することができ、ひいては物体の位置などをより一層正確に認識することができる。
手段4.発音手段が発する音を純音とするとともに、
Y軸方向に沿った前記ドットの行ごとに割り当てられる周波数を、それぞれ異なる素数としたことを特徴とする手段1乃至3のいずれかに記載の画像聴覚化装置。
尚、「純音」とあるのは、正弦波で表すことができる音を意味する。
上記手段4によれば、発音手段により発せられる音が純音とされ、さらに、Y軸方向に沿ったドットの各行ごとに割り当てられる周波数が、それぞれ異なる素数とされている。従って、それぞれの音が他の音と共振してしまうことがなくなり、発音手段から発せられる音をより一層確実に認識することができる。その結果、周囲の物体の位置等をより一層正確に認識することができる。
手段5.各周波数ごとに順次音を発することを特徴とする手段1乃至4のいずれかに記載の画像聴覚化装置。
上記手段5によれば、各周波数の音がそれぞれ個別に発せられるため、音をより一層容易に認識することができる。その結果、周囲物体の位置などを一層正確に、かつ、一層容易に認識することができる。
手段6.前記発生音決定手段により決定された各ドットに対応する音が、前記発音手段から同時に発せられることを特徴とする手段1乃至4のいずれかに記載の画像聴覚化装置。
尚、「同時」とあるのは、各ドットに対応する音が発音手段から厳密に同時に発せられるということではない。すなわち、処理画像中におけるドットのX軸方向に沿った位置を表す際に、一対の発音機から発する音に小さな時間差が設けられることとなるが、このような小さな時間差は許容するということである。
手段6によれば、各ドットに対応する音が発音手段より同時に発せられるため、処理画像を認識するのに要する時間を短縮することができる。これにより、単位時間当たりにより多くの処理画像を認識することが可能となるため、例えば、物体が移動しているといったことや、その物体の速さなどをより正確に、かつ、より確実に知ることができる。
手段7.前記走査線は、X軸方向及びY軸方向に沿ってそれぞれ20本以上存在することを特徴とする手段1乃至6のいずれかに記載の画像聴覚化装置。
上記手段7によれば、X軸方向及びY軸方向に沿ってそれぞれ20以上のドットを備えて(すなわち、20行×20列以上に区画されたドットにより)処理画像が構成されている。従って、物体の形状などをより一層正確に把握することができる。
手段8.前記発音手段から発する音の周波数を60Hz以上1000Hz以下としたことを特徴とする手段1乃至7のいずれかに記載の画像聴覚化装置。
一般に人の可聴域は、20Hz〜20000Hz程度であることが知られている。ところが、この可聴域の範囲内であっても、周波数が低すぎたり、高すぎたりすると、左右の耳への音の到達時間に差を設けた場合であっても、音にある程度(例えば、20db程度)の強度差を設けなくては音の到達時間に差があるものと認識できないおそれがある。
この点、上記手段8によれば、発音手段より発せられる音の周波数が60Hz以上1000Hz以下とされているため、音に強度差を設けなくとも、左右の耳に対する音の到達時間に差があるものとより確実に認識することができる。その結果、Y軸方向の全域に亘ってX軸方向に沿ったドット位置のより確実な認識を図ることができる。
手段9.前記撮像手段は、利用者の視界方向と同一の方向に向くよう、利用者に対し、直接又は間接的に取付可能に構成されるとともに、
前記発生音決定手段は、左右の耳への音の到達時間差を、前記撮像手段の左右方向における撮像画像の取込角度に対応して設定することを特徴とする手段1乃至8のいずれかに記載の画像聴覚化装置。
例えば、前方右45度から音が発せられたときには、右耳に対して音が達してから約0.4msだけ遅れて左耳に音が達し、また、前方右60度から音が発せられたときには、右耳に対して音が達してから約0.47msだけ遅れて左耳に音が達することが知られている。また、左右の耳への音の到達時間差は、人の正面に対する音源のずれ角度に対してほぼ比例する。
この点を利用して、上記手段9によれば、撮像手段の向く方向が利用者の視界方向と同一とされ、さらに、X軸方向に沿ったドットの位置を表現する左右の耳への音の到達時間差が、撮像手段による撮像画像の取込角度に対応して設定されている。例えば、撮像手段による取込角度を左右60度ずつとし、処理画像中におけるX軸方向に沿ったドット数を2M(或いは2M+1)個(つまり、左右にM個ずつ)とした場合には、処理画像のX軸方向中央からSドットずれるごとに、左右の耳に対して0.47ms×(S/M)の到達時間差が設けられるように構成されている。従って、左右方向において、利用者に対する物体の相対位置と、音によって利用者が認識する物体の位置とが一致することとなる。このため、自己と物体との相対的な位置関係を極めて正確に把握することができ、周囲の状況を極めて正確に認識することができる。
画像聴覚化装置の構成を示すブロック図である。 発音手段の構成を示す模式図である。 画像処理手段により生成される処理画像などを示す図である。
以下に、一実施形態について図面を参照して説明する。
図1に示すように、画像聴覚化装置1は、CCDイメージセンサ等の撮像手段2と、利用者の両耳に装着可能な発音手段3と、前記撮像手段2及び発音手段3に対して所定の信号を送受信可能に構成された処理手段4とを備えている。
前記撮像手段2は、利用者の視界方向とほぼ同一の方向に向けられるように、例えば、利用者の眼鏡や帽子等に対して取付可能に構成されている(勿論、利用者に対して直接取付けることとしてもよい)。また、撮像手段2により得られた撮像データは、前記処理手段4に対して伝送されるようになっている。加えて、撮像手段2のX軸方向(左右方向)における画像取込角度が90度に設定されている。すなわち、撮像手段2は、利用者の正面から左右45度ずつの範囲を撮像するように設定されている。
前記発音手段3は、前記処理手段4から出力される音声信号を音波に変換するものであり、図2に示すように、利用者の両耳に装着される一対の発音機31,32を備えている。そして、発音機31は利用者の左耳に装着される一方で、発音機32は利用者の右耳に装着されるようになっている。加えて、一対の発音機31,32は、それぞれ第1スピーカ31U,32U及び第2スピーカ31L,32Lを備えている。前記第1スピーカ31U,32Uは、発音手段3が利用者に装着された際に、利用者の外耳道の上方に位置するように配設されている。一方で、前記第2スピーカ31L,32Lは、発音手段3が利用者に装着された際に、利用者の外耳道の下方に位置するように配設されている。
図1に戻り、前記処理手段4は、所定のマイコン等により構成されており、画像処理手段41と、発生音決定手段42とを備えている。
前記画像処理手段41は、撮像手段2から伝送される撮像データに基づいて、X軸方向及びY軸方向に沿って延びる複数の走査線により形成された複数のドットからなる処理画像を生成するものである。詳述すると、まず、ピクセルを間引くなどの従来公知の手法を用いて撮像データの解像度を減少させることで、X軸方向に沿ってm個のドットを有し、Y軸方向に沿ってn個のドットを有する(つまりm列×n行の)中間画像を生成する。次いで、前記中間画像に濃淡処理を施すことで、図3に示すように、X(例えば、3)階調モノクロで、複数のドットDTを有する処理画像SPを生成する。尚、本実施形態おいて、処理画像SPは、X軸方向に沿って41本、Y軸方向に沿って39本の走査線によって区画され、X軸方向に沿って41個、Y軸方向に沿って39個のドットを有するものとされている。そのため、上述の通り、撮像手段2のX軸方向(左右方向)における画像取込角度が90度であることから、X軸方向に沿った各ドットDTはそれぞれ2.25度ずつの視野に相当している。
前記発生音決定手段42は、処理画像SPにおける各ドットDTの位置に対応して発音手段3から発する音を決定するものである。本実施形態では、発生音決定手段42は、左右の耳に対する音の到達時間の差を利用して処理画像SP中における着色ドット(白色ドットWD以外のドットをいう)BDのX軸(左右)方向に沿った位置を表し、一方で、周波数の高低を利用してY軸(上下)方向に沿った処理画像SP中の着色ドットBDの位置を表すようになっている。
ここで、処理画像SP中における着色ドットBDのX軸方向に沿った位置は、次のように表現される。すなわち、X軸方向に沿って処理画像SPの中央に位置するドットの列を基準列BL(図3中、中央の点線で挟まれる列)として、当該基準列BLよりもX軸方向のプラス側(すなわち利用者の右側)に位置する着色ドットBDについては、基準列BLからその着色ドットBDまでの距離に対応した分だけ、利用者の左耳に装着される発音機31よりも利用者の右耳に装着される発音機32から早く音が発せられるようになっている。一方で、基準列BLよりもX軸方向のマイナス側(すなわち利用者の左側)に位置する着色ドットBDについては、基準列BLからその着色ドットBDまでの距離に対応した分だけ発音機32よりも発音機31から早く音が発せられるようになっている。
また、本実施形態では、X軸方向に沿ったドットDTの位置を表現する左右の耳への音の到達時間差が、撮像手段2による撮像画像の取込角度に対応して設定されている。
詳述すると、前方右45度から音が発せられたときには、右耳に対して音が達してから約0.4msだけ遅れて左耳に音が達し、また、前方左45度から音が発せられたときには、左耳に対して音が達してから約0.4msだけ遅れて右耳に音が達することが知られている。そこで、本実施形態では、上述の通り、撮像手段2の画像取込角度は左右45度ずつに設定されているため、例えば、処理画像SPの最も右側に位置する着色ドットBD(つまり、利用者の前方右45度に位置するもの)を表す際には、発音機32から音を発してから約0.4msだけ遅れて発音機31から音が発せられるように設定されている。また、処理画像SPは左右にそれぞれ20個ずつドットを有して構成されているため、基準列BLから右に1列進むごとに発音機32が音を発してから0.02ms(=0.4ms/20)だけ遅れて発音機31から音が発せられ、一方で、基準列BLから左へ1列進むごとに発音機31が音を発してから0.02msだけ遅れて発音機32から音が発せられるようになっている。例えば、基準列BLから右に10列目の着色ドットBDを表す際には、発音機32が音を発してから0.2ms(=0.02ms×10)だけ遅れて発音機31から音が発せられるようになっている。
加えて、処理画像SP中における着色ドットBDのY軸方向に沿った位置は次のように表現される。すなわち、Y軸方向に沿った各ドットDTの行ごとに発する音の周波数が予め割り当てられており、本実施形態では、Y軸方向のプラス側(すなわち上側)からY軸方向のマイナス側(すなわち下側)へと徐々に減少する周波数が割り当てられている。そして、着色ドットBDのY軸方向に沿った位置を表現するにあたっては、着色ドットBDの存在する行に対応する周波数の音が発音手段3から発せられるようになっている。尚、各ドットDTの行に割り当てられる周波数は、図3に示すように、それぞれ異なる素数とされている。また、用いられる周波数は、人の可聴域内(20Hz〜20000Hz)の中でも、特に聴きやすい60Hz〜1000Hz(約4オクターブ)とされている。加えて、前記発音手段3より発せられる音は、純音とされている。
さらに、本実施形態では、発する音の強度差(音圧差)によって着色ドットBDの濃淡が表現されるようになっている。すなわち、着色ドットBDのうち、比較的濃い着色ドットBD1が比較的大きな音(例えば、50db)で表現される一方で、比較的薄い着色ドットBD2が比較的小さな音(例えば、30db)で表現される(尚、音量は例示であって、これに限定されるものではない)。
また、処理手段4は、発生音決定手段42により各着色ドットBDに対応して決定されたそれぞれの音を信号化して、当該信号を前記発音手段3に送信する。そして、発音手段3によって各着色ドットBDに対応して決定された音が同時に発せられるようになっている。尚、本実施形態では、白色ドットWDに対応した音は発せられないように構成されている。
次いで、図3に示す処理画像SPがどのように表現されるかについて、周波数191Hzの行を例として示す。
まず、周波数191Hzの行に存在する着色ドットBDのうち、基準列BL(利用者の正面)より左側に位置し、色が比較的濃い複数の着色ドットAについては、発音機31から強度の比較的大きな音が発せられてから0.26ms、0.24ms、0.22ms、0.20ms、0.18ms、0.16ms、及び、0.14msだけ遅れて発音機32から強度の比較的大きな音が発せられることで表現される。
さらに、基準列BLの左側に位置し、色の比較的薄い着色ドットBについては、発音機31より強度の比較的小さな音が発せられてから、0.12ms、0.10ms、及び、0.08msだけ遅れて発音機32より強度の比較的小さな音が発せられることで表現される。また、基準列BL側に位置する色の比較的濃い着色ドットCは、発音機31から強度の比較的高い音が発せられてから0.04ms及び0.02msだけ遅れて発音機32より強度の比較的大きな音が発せられることにより表現される。
加えて、基準列BL上(つまり、利用者の正面)に位置し、色の比較的濃い着色ドットDについては、発音機31及び発音機32から同時に強度の比較的大きな音が発せられることで表現される。
併せて、基準列BLの右側に位置し、色の比較的濃い着色ドットEは、発音機32から強度の比較的大きな音が発せられてから0.02ms及び0.04msだけ遅れて発音機31より強度の比較的大きな音が発せられることにより表現される。
また、基準列BLの右側に位置し、色の比較的薄い着色ドットFについては、発音機32から強度の比較的小さな音が発せられてから0.06ms及び0.08msだけ遅れて発音機31より強度の比較的小さな音が発せられることで表現される。尚、上述の通り、白色ドットWDに対応する音は発せられない。
以上詳述したように、本実施形態によれば、処理画像SPを構成する複数の着色ドットBDの位置について、左右の耳に対する音の到達時間差を用いることでX軸方向(左右方向)の位置が表され、周波数の大小を用いることでY軸方向(上下方向)の位置が表される。従って、処理画像SPをより容易に、かつ、より正確に聴覚をもって認識することができ、ひいては周囲の物体の位置や形状などをより正確に認識することができる。
特に本実施形態では、処理画像SP中におけるX軸方向に沿った着色ドットBDの位置は、左右の耳への音の到達時間差を用いることにより表されている。このため、X軸方向に沿った位置を音の強度差を用いて表現する上記従来技術と比較して、周囲の物体の位置や形状などを非常に正確に認識することができる。
さらに、音の強度(音圧)を調節することで、処理画像SP中における着色ドットBDの濃淡が表される。そのため、物体の位置などに加えて、物体の凹凸等、物体のより正確な形状を認識することができる。
加えて、発音手段3により発せられる音が純音とされ、さらに、Y軸方向に沿ったドットDTの各行ごとに割り当てられる周波数が、それぞれ異なる素数とされている。従って、それぞれの音が他の音と共振してしまうことがなくなり、発音手段3から発せられる音をより一層確実に認識することができる。その結果、周囲の物体の位置等をより一層正確に認識することができる。
併せて、各着色ドットBDに対応する音が発音手段3より同時に発せられるため、処理画像SPを認識するのに要する時間を短縮することができる。これにより、単位時間当たりにより多くの処理画像SPを認識することができるため、例えば、物体が移動しているといったことや、物体の早さなどをより正確に、かつ、より確実に知ることができる。
また、X軸方向及びY軸方向に沿ってそれぞれ21以上のドットDTを備えて処理画像SPが構成されているため、物体の形状などを一層正確に把握することができる。
加えて、発音手段3より発せられる音の周波数が60Hz以上1000Hz以下とされているため、音に強度差を設けなくとも、左右の耳に対する音の到達時間に差があるものとより確実に認識することができる。その結果、Y軸方向の全域に亘ってX軸方向に沿ったドットDT位置のより確実な認識を図ることができる。
さらに、撮像手段3の向く方向が利用者の視界方向と同一とされ、さらに、X軸方向に沿った着色ドットBDの位置を表現する左右の耳への音の到達時間差が、撮像画像の取込角度に対応して設定されている。従って、左右方向において、利用者に対する物体の相対位置と、音によって利用者が認識する物体の位置とが一致することとなる。このため、自己と物体との相対的な位置関係を極めて正確に把握することができ、周囲の状況を極めて正確に認識することができる。
尚、上記実施形態の記載内容に限定されず、例えば次のように実施してもよい。勿論、以下において例示しない他の応用例、変更例も当然可能である。
(a)上記実施形態では、発生音決定手段42は、音の大小を用いて処理画像SPの濃淡を表現することとしている。これに対して、第1スピーカ31U,32U及び第2スピーカ31L,32Lから発せられる音に強度差を設けることで、着色ドットBDのY軸方向に沿った位置(上下位置)を表す際に用いることとしてもよい。すなわち、処理画像SP中の上方に位置する着色ドットBDを表現するにあたっては、第1スピーカ31U,32Uから比較的高い周波数で、かつ、強度の比較的大きな音を発する一方で、前記第2スピーカ31L,32Lから同一の高周波数で、強度の比較的小さな音を発し、また、処理画像SP中の下方に位置する着色ドットBDを表現するにあたっては、第1スピーカ31U,32Uから比較的低い周波数で、かつ、強度の比較的小さな音を発する一方で、第2スピーカ31L,32Lから同一の低周波数で、強度の比較的大きな音を発するようにしてもよい。この場合、利用者は、骨伝導や皮膚の触覚等により、上方側に位置する着色ドットBDについては、あたかも自身の上方から音が発せられているように感じ、一方で、下方側に位置する着色ドットBDについては、あたかも自身の下方から音が発せられているように感じることとなる。従って、周波数の違いと併せて、利用者は、処理画像SP中における着色ドットBD(物体)の上下位置をより正確に認識することができる。尚、音の強度差を用いて、着色ドットBDの濃淡、及び、Y軸方向に沿った着色ドットBDの位置を併せて表現することとしてもよい。
(b)上記実施形態において、処理画像SPは、3階調の濃淡画像とされているが、処理画像SPの濃淡の階調はこれに限定されるものではない。従って、例えば、処理画像として白黒画像(2階調)を生成することとしてもよい。
(c)上記実施形態では、発音機31,32は、それぞれ第1スピーカ31U,32U及び第2スピーカ31L,32Lを備えているが、発音機31,32がそれぞれ1つ又は3つ以上のスピーカを備えて構成されることとしてもよい。
(d)上記実施形態では、各着色ドットBDに対応する音を発音手段3から同時に発することとされているが、各周波数ごとに順次音を発することとしてもよい。この場合、利用者は音をより一層容易に認識することができるため、周囲物体の位置などをより確実に、かつ、より容易に認識することができる。
(e)上記実施形態では、着色ドットBDのY軸方向の位置を表す周波数が上方から下方へと減少するように設定されているが、上方から下方へと徐々に増大するように周波数を設定することとしてもよい。また、上記実施形態では、音の周波数が60Hz〜1000Hzとされているが、発する音の周波数の範囲はこれに限定されるものではない。但し、6000Hzを超えるような高周波数は、上述の通り、左右の耳に対する音の到達時間差を認識しにくくなり得る。そのため、周波数の上限を6000Hz以下とすることが好ましく、周波数の上限を3000Hz以下とすることがより好ましい。
(f)上記実施形態における処理画像SPのドット数は例示であって、その数は限定されるものではない。また、画像処理手段41については、生成する処理画像のドット数(行数、列数)を適宜変更可能に構成することとしてもよい。例えば、周囲の状況をより細かく把握したい場合には、処理画像のドット数をより増大させることとしてもよい。また、処理画像のドット数をより減少させれば、利用者が画像を認識する際の負担を軽減することができる。
(g)上記実施形態では、撮像手段2による左右方向の取込角度が左右にそれぞれ45度ずつとされているが、撮像手段2の取込角度はこれに限定されるものではない。
1…画像聴覚化装置、2…撮像手段、3…発音手段、4…処理手段、31,32…発音機、31U,32U…第1スピーカ、31L,32L…第2スピーカ、41…画像処理手段、42…発生音決定手段、DT…ドット。

Claims (9)

  1. 撮像手段と、
    利用者の左右の耳に装着され、各耳に対応した発音機を備える発音手段と、
    前記撮像手段により得られた撮像画像に基づいて、X軸方向及びY軸方向に沿って延びる複数の走査線により形成された複数のドットからなる処理画像を得る画像処理手段と、
    前記処理画像を構成する各ドットに対応して、前記発音手段から発する音を決定する発生音決定手段とを備える画像聴覚化装置であって、
    前記発生音決定手段は、
    左右の耳への音の到達時間に差を設けることで、前記処理画像中におけるX軸方向に沿った前記ドットの位置を表すとともに、
    Y軸方向のプラス側からマイナス側へと向かって増加又は減少し、Y軸方向に沿った前記ドットの各行ごとに割り当てられる周波数により、前記処理画像中におけるY軸方向に沿った前記ドットの位置を表すことを特徴とする画像聴覚化装置。
  2. 音の強度の大小を用いて、前記処理画像中における前記ドットの濃淡を表すことを特徴とする請求項1に記載の画像聴覚化装置。
  3. 前記左右各耳に対応する発音機は、利用者の各耳に装着された際に、利用者の外耳道の上方に配置される第1スピーカと、利用者の外耳道の下方に配置される第2スピーカとをそれぞれ備え、
    周波数の高低に対応して、両スピーカのうちの一方から発せられる音の強度を増大させる一方で、両スピーカのうちの他方から発せられる音の強度を低減させることを特徴とする請求項1又は2に記載の画像聴覚化装置。
  4. 発音手段が発する音を純音とするとともに、
    Y軸方向に沿った前記ドットの行ごとに割り当てられる周波数を、それぞれ異なる素数としたことを特徴とする請求項1乃至3のいずれか1項に記載の画像聴覚化装置。
  5. 各周波数ごとに順次音を発することを特徴とする請求項1乃至4のいずれか1項に記載の画像聴覚化装置。
  6. 前記発生音決定手段により決定された各ドットに対応する音が、前記発音手段から同時に発せられることを特徴とする請求項1乃至4のいずれか1項に記載の画像聴覚化装置。
  7. 前記走査線は、X軸方向及びY軸方向に沿ってそれぞれ20本以上存在することを特徴とする請求項1乃至6のいずれか1項に記載の画像聴覚化装置。
  8. 前記発音手段から発する音の周波数を60Hz以上1000Hz以下としたことを特徴とする請求項1乃至7のいずれか1項に記載の画像聴覚化装置。
  9. 前記撮像手段は、利用者の視界方向と同一の方向に向くよう、利用者に対し、直接又は間接的に取付可能に構成されるとともに、
    前記発生音決定手段は、左右の耳への音の到達時間差を、前記撮像手段の左右方向における撮像画像の取込角度に対応して設定することを特徴とする請求項1乃至8のいずれか1項に記載の画像聴覚化装置。
JP2009221956A 2009-09-28 2009-09-28 画像聴覚化装置 Expired - Fee Related JP4891375B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009221956A JP4891375B2 (ja) 2009-09-28 2009-09-28 画像聴覚化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009221956A JP4891375B2 (ja) 2009-09-28 2009-09-28 画像聴覚化装置

Publications (2)

Publication Number Publication Date
JP2011067479A JP2011067479A (ja) 2011-04-07
JP4891375B2 true JP4891375B2 (ja) 2012-03-07

Family

ID=44013396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009221956A Expired - Fee Related JP4891375B2 (ja) 2009-09-28 2009-09-28 画像聴覚化装置

Country Status (1)

Country Link
JP (1) JP4891375B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107157651A (zh) * 2017-06-13 2017-09-15 浙江诺尔康神经电子科技股份有限公司 一种基于声音刺激的视觉图像感知系统和方法
US11069259B2 (en) 2019-10-01 2021-07-20 Fujifilm Business Innovation Corp. Transmodal translation of feature vectors to audio for assistive devices

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0410045A1 (en) * 1989-07-27 1991-01-30 Koninklijke Philips Electronics N.V. Image audio transformation system, particularly as a visual aid for the blind
JP2001084484A (ja) * 1999-09-13 2001-03-30 Tamotsu Okazawa 景色認識装置及び景色認識方法
JP2001350473A (ja) * 2000-06-08 2001-12-21 Web Logic:Kk 画像情報を音声情報に変換するシステム及び画像情報を音声情報に変換する方法
JP4657532B2 (ja) * 2001-09-12 2011-03-23 株式会社回線媒体研究所 形状伝達装置
JP2004020869A (ja) * 2002-06-14 2004-01-22 Vstone Kk 画像情報伝達方法,音信号作成方法,音信号作成装置,音発生装置及び画像/音変換方法

Also Published As

Publication number Publication date
JP2011067479A (ja) 2011-04-07

Similar Documents

Publication Publication Date Title
US10062303B2 (en) Object tracking for artificial vision
US11579837B2 (en) Audio profile for personalized audio enhancement
JP6771548B2 (ja) 盲人又は視覚障害者が音声や触覚によって周囲環境を解釈することを可能にするポータブルシステム
US11561757B2 (en) Methods and system for adjusting level of tactile content when presenting audio content
JP2022542747A (ja) ヒアスルーオーディオシステムのためのイヤプラグアセンブリ
JP2016194612A (ja) 視覚認識支援装置および視覚認識支援プログラム
JP7403783B2 (ja) 視覚障がい者用行動支援装置
JP5002068B1 (ja) 環境情報伝達装置
JP4891375B2 (ja) 画像聴覚化装置
WO2021169050A1 (zh) 借助振动反馈感知环境图像的系统
US11681492B2 (en) Methods and system for controlling tactile content
JP5275496B1 (ja) 画像聴覚化装置
JP2016036419A (ja) 触覚情報を伝達メディアとして利用したアイウェア
KR100690562B1 (ko) 청각을 이용한 시각 재현 장치 및 제어방법
WO2022209043A1 (ja) 周囲環境情報伝達装置
EP4446869A1 (en) Visualization and customization of sound space
RU2679866C1 (ru) Визуально-звуковая система для слепых и слабовидящих людей
JP2003084784A (ja) 形状伝達装置
JP2007144111A5 (ja)
CN118785080A (en) Visualization and customization of sound space

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111107

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20111107

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20111205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111213

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111215

R150 Certificate of patent or registration of utility model

Ref document number: 4891375

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141222

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees