JP4891375B2

JP4891375B2 - 画像聴覚化装置

Info

Publication number: JP4891375B2
Application number: JP2009221956A
Authority: JP
Inventors: 昌弘黒田
Original assignee: 昌弘黒田
Priority date: 2009-09-28
Filing date: 2009-09-28
Publication date: 2012-03-07
Anticipated expiration: 2029-09-28
Also published as: JP2011067479A

Description

本発明は、撮像手段によって得られた画像を聴覚的に表現する画像聴覚化装置に関する。

従来、視覚障害者は、杖を周囲の物体に接触させることや、信号機の誘導音などから周囲の状況を確認している。

しかしながら、杖を用いる場合、視覚障害者は杖で周囲の物体に触れることが必要であり、杖の先を継続的に広範囲に動かさなければならない。従って、杖が段差や障害物等に接触せずに、それら段差等を認識し損ねてしまうおそれがある。また、誘導音などを利用するにあたっては、それを発するための設備が設けられていることが必要である。

そこで、特段の設備が設けられていない環境下においても、視覚によることなく周囲に位置する物体などを認識可能とすべく、物体をＣＣＤカメラ等の撮像手段で読み取った上で、読み取られた画像データの輪郭を音に変換し、その音により利用者に聴覚をもって当該画像データを認識させる技術が提案されている（例えば、特許文献１等参照）。当該技術について詳述すると、輪郭情報のＸ軸は、左右の耳への音の強度差（音量差）により表現され、輪郭情報のＹ軸は、音の周波数により表現されるようになっている。

特開２００３−８４７８４号公報

ところが、音の周波数が比較的大きい（例えば、６０００Ｈｚを超える）場合には、Ｘ軸方向の位置を識別させるために、左右の音の強度差を比較的大きく（例えば、２０ｄｂ以上と）する必要がある。従って、上記従来技術を用いた場合には、利用者はＸ軸方向に沿った位置を正確に把握することが難しく、画像データひいては周囲の状況を誤って認識してしまうおそれがある。

本発明は、上記事情を鑑みてなされたものであり、その目的は、視覚障害者等の利用者が、物体に接触することなく、聴覚を持って周囲の物体などをより正確に認識可能な画像聴覚化装置を提供することにある。

以下、上記目的を解決するのに適した各手段につき、項分けして説明する。なお、必要に応じて対応する手段に特有の作用効果を付記する。

手段１．撮像手段と、
利用者の左右の耳に装着され、各耳に対応した発音機を備える発音手段と、
前記撮像手段により得られた撮像画像に基づいて、Ｘ軸方向及びＹ軸方向に沿って延びる複数の走査線により形成された複数のドットからなる処理画像を得る画像処理手段と、
前記処理画像を構成する各ドットに対応して、前記発音手段から発する音を決定する発生音決定手段とを備える画像聴覚化装置であって、
前記発生音決定手段は、
左右の耳への音の到達時間に差を設けることで、前記処理画像中におけるＸ軸方向に沿った前記ドットの位置を表すとともに、
Ｙ軸方向のプラス側からマイナス側へと向かって増加又は減少し、Ｙ軸方向に沿った前記ドットの各行ごとに割り当てられる周波数により、前記処理画像中におけるＹ軸方向に沿った前記ドットの位置を表すことを特徴とする画像聴覚化装置。

上記手段１によれば、画像処理手段により、例えば周囲の物体の形状や位置などを示す撮像画像に基づいて、複数のドットからなる処理画像が生成される。そして、処理画像を構成する複数のドットの位置について、左右の耳に対する音の到達時間差を用いることでＸ軸方向（左右方向）の位置が表され、音の周波数の大小を用いることでＹ軸方向（上下方向）の位置が表される。従って、処理画像をより容易に、かつ、より正確に聴覚をもって認識することができ、周囲の物体の位置や形状などをより正確に認識することができる。

特に上記手段１によれば、処理画像中におけるＸ軸方向に沿ったドットの位置は、左右の耳への音の到達時間差を用いることにより表されている。このため、Ｘ軸方向に沿った位置を音の強度差を用いて表現する上記従来技術と比較して、周囲の物体の位置や形状などを非常に正確に認識することができる。

手段２．音の強度の大小を用いて、前記処理画像中における前記ドットの濃淡を表すことを特徴とする手段１に記載の画像聴覚化装置。

上記手段２によれば、音の強度（音圧）を調節することで、処理画像中における各ドットの濃淡が表される。そのため、物体の位置などに加えて、物体の凹凸等、物体のより正確な形状を認識することができる。

手段３．前記左右各耳に対応する発音機は、利用者の各耳に装着された際に、利用者の外耳道の上方に配置される第１スピーカと、利用者の外耳道の下方に配置される第２スピーカとをそれぞれ備え、
周波数の高低に対応して、両スピーカのうちの一方から発せられる音の強度を増大させる一方で、両スピーカのうちの他方から発せられる音の強度を低減させることを特徴とする手段１又は２に記載の画像聴覚化装置。

上記手段３によれば、各発音機は、外耳道の上側から音を発する第１スピーカと、外耳道の下側から音を発する第２スピーカとをそれぞれ備えており、例えば、処理画像中の上側にあるドットを表すときには、前記第１スピーカから発する音の強度を増大させる一方で、第２スピーカから発する音の強度を低減させるようになっている。また、処理画像中の下側にあるドットを表すときには、例えば、第１スピーカから発する音の強度が低減される一方で、第２スピーカから発する音の強度を増大させるようになっている。すなわち、本手段３においては、上方側に位置するドットを表現する際には、あたかも上方から音が発せられているかのように両スピーカから発せられる音に強度差が設けられ、一方で、下方側に位置するドットを表現する際には、あたかも利用者の下方から音が発せられているかのように両スピーカから発せられる音に強度差が設けられる。従って、処理画像中におけるドットのＹ軸方向（上下方向）に沿った位置をより正確に認識することができ、ひいては物体の位置などをより一層正確に認識することができる。

手段４．発音手段が発する音を純音とするとともに、
Ｙ軸方向に沿った前記ドットの行ごとに割り当てられる周波数を、それぞれ異なる素数としたことを特徴とする手段１乃至３のいずれかに記載の画像聴覚化装置。

尚、「純音」とあるのは、正弦波で表すことができる音を意味する。

上記手段４によれば、発音手段により発せられる音が純音とされ、さらに、Ｙ軸方向に沿ったドットの各行ごとに割り当てられる周波数が、それぞれ異なる素数とされている。従って、それぞれの音が他の音と共振してしまうことがなくなり、発音手段から発せられる音をより一層確実に認識することができる。その結果、周囲の物体の位置等をより一層正確に認識することができる。

手段５．各周波数ごとに順次音を発することを特徴とする手段１乃至４のいずれかに記載の画像聴覚化装置。

上記手段５によれば、各周波数の音がそれぞれ個別に発せられるため、音をより一層容易に認識することができる。その結果、周囲物体の位置などを一層正確に、かつ、一層容易に認識することができる。

手段６．前記発生音決定手段により決定された各ドットに対応する音が、前記発音手段から同時に発せられることを特徴とする手段１乃至４のいずれかに記載の画像聴覚化装置。

尚、「同時」とあるのは、各ドットに対応する音が発音手段から厳密に同時に発せられるということではない。すなわち、処理画像中におけるドットのＸ軸方向に沿った位置を表す際に、一対の発音機から発する音に小さな時間差が設けられることとなるが、このような小さな時間差は許容するということである。

手段６によれば、各ドットに対応する音が発音手段より同時に発せられるため、処理画像を認識するのに要する時間を短縮することができる。これにより、単位時間当たりにより多くの処理画像を認識することが可能となるため、例えば、物体が移動しているといったことや、その物体の速さなどをより正確に、かつ、より確実に知ることができる。

手段７．前記走査線は、Ｘ軸方向及びＹ軸方向に沿ってそれぞれ２０本以上存在することを特徴とする手段１乃至６のいずれかに記載の画像聴覚化装置。

上記手段７によれば、Ｘ軸方向及びＹ軸方向に沿ってそれぞれ２０以上のドットを備えて（すなわち、２０行×２０列以上に区画されたドットにより）処理画像が構成されている。従って、物体の形状などをより一層正確に把握することができる。

手段８．前記発音手段から発する音の周波数を６０Ｈｚ以上１０００Ｈｚ以下としたことを特徴とする手段１乃至７のいずれかに記載の画像聴覚化装置。

一般に人の可聴域は、２０Ｈｚ〜２００００Ｈｚ程度であることが知られている。ところが、この可聴域の範囲内であっても、周波数が低すぎたり、高すぎたりすると、左右の耳への音の到達時間に差を設けた場合であっても、音にある程度（例えば、２０ｄｂ程度）の強度差を設けなくては音の到達時間に差があるものと認識できないおそれがある。

この点、上記手段８によれば、発音手段より発せられる音の周波数が６０Ｈｚ以上１０００Ｈｚ以下とされているため、音に強度差を設けなくとも、左右の耳に対する音の到達時間に差があるものとより確実に認識することができる。その結果、Ｙ軸方向の全域に亘ってＸ軸方向に沿ったドット位置のより確実な認識を図ることができる。

手段９．前記撮像手段は、利用者の視界方向と同一の方向に向くよう、利用者に対し、直接又は間接的に取付可能に構成されるとともに、
前記発生音決定手段は、左右の耳への音の到達時間差を、前記撮像手段の左右方向における撮像画像の取込角度に対応して設定することを特徴とする手段１乃至８のいずれかに記載の画像聴覚化装置。

例えば、前方右４５度から音が発せられたときには、右耳に対して音が達してから約０．４ｍｓだけ遅れて左耳に音が達し、また、前方右６０度から音が発せられたときには、右耳に対して音が達してから約０．４７ｍｓだけ遅れて左耳に音が達することが知られている。また、左右の耳への音の到達時間差は、人の正面に対する音源のずれ角度に対してほぼ比例する。

この点を利用して、上記手段９によれば、撮像手段の向く方向が利用者の視界方向と同一とされ、さらに、Ｘ軸方向に沿ったドットの位置を表現する左右の耳への音の到達時間差が、撮像手段による撮像画像の取込角度に対応して設定されている。例えば、撮像手段による取込角度を左右６０度ずつとし、処理画像中におけるＸ軸方向に沿ったドット数を２Ｍ（或いは２Ｍ＋１）個（つまり、左右にＭ個ずつ）とした場合には、処理画像のＸ軸方向中央からＳドットずれるごとに、左右の耳に対して０．４７ｍｓ×（Ｓ／Ｍ）の到達時間差が設けられるように構成されている。従って、左右方向において、利用者に対する物体の相対位置と、音によって利用者が認識する物体の位置とが一致することとなる。このため、自己と物体との相対的な位置関係を極めて正確に把握することができ、周囲の状況を極めて正確に認識することができる。

画像聴覚化装置の構成を示すブロック図である。発音手段の構成を示す模式図である。画像処理手段により生成される処理画像などを示す図である。

以下に、一実施形態について図面を参照して説明する。

図１に示すように、画像聴覚化装置１は、ＣＣＤイメージセンサ等の撮像手段２と、利用者の両耳に装着可能な発音手段３と、前記撮像手段２及び発音手段３に対して所定の信号を送受信可能に構成された処理手段４とを備えている。

前記撮像手段２は、利用者の視界方向とほぼ同一の方向に向けられるように、例えば、利用者の眼鏡や帽子等に対して取付可能に構成されている（勿論、利用者に対して直接取付けることとしてもよい）。また、撮像手段２により得られた撮像データは、前記処理手段４に対して伝送されるようになっている。加えて、撮像手段２のＸ軸方向（左右方向）における画像取込角度が９０度に設定されている。すなわち、撮像手段２は、利用者の正面から左右４５度ずつの範囲を撮像するように設定されている。

前記発音手段３は、前記処理手段４から出力される音声信号を音波に変換するものであり、図２に示すように、利用者の両耳に装着される一対の発音機３１，３２を備えている。そして、発音機３１は利用者の左耳に装着される一方で、発音機３２は利用者の右耳に装着されるようになっている。加えて、一対の発音機３１，３２は、それぞれ第１スピーカ３１Ｕ，３２Ｕ及び第２スピーカ３１Ｌ，３２Ｌを備えている。前記第１スピーカ３１Ｕ，３２Ｕは、発音手段３が利用者に装着された際に、利用者の外耳道の上方に位置するように配設されている。一方で、前記第２スピーカ３１Ｌ，３２Ｌは、発音手段３が利用者に装着された際に、利用者の外耳道の下方に位置するように配設されている。

図１に戻り、前記処理手段４は、所定のマイコン等により構成されており、画像処理手段４１と、発生音決定手段４２とを備えている。

前記画像処理手段４１は、撮像手段２から伝送される撮像データに基づいて、Ｘ軸方向及びＹ軸方向に沿って延びる複数の走査線により形成された複数のドットからなる処理画像を生成するものである。詳述すると、まず、ピクセルを間引くなどの従来公知の手法を用いて撮像データの解像度を減少させることで、Ｘ軸方向に沿ってｍ個のドットを有し、Ｙ軸方向に沿ってｎ個のドットを有する（つまりｍ列×ｎ行の）中間画像を生成する。次いで、前記中間画像に濃淡処理を施すことで、図３に示すように、Ｘ（例えば、３）階調モノクロで、複数のドットＤＴを有する処理画像ＳＰを生成する。尚、本実施形態おいて、処理画像ＳＰは、Ｘ軸方向に沿って４１本、Ｙ軸方向に沿って３９本の走査線によって区画され、Ｘ軸方向に沿って４１個、Ｙ軸方向に沿って３９個のドットを有するものとされている。そのため、上述の通り、撮像手段２のＸ軸方向（左右方向）における画像取込角度が９０度であることから、Ｘ軸方向に沿った各ドットＤＴはそれぞれ２．２５度ずつの視野に相当している。

前記発生音決定手段４２は、処理画像ＳＰにおける各ドットＤＴの位置に対応して発音手段３から発する音を決定するものである。本実施形態では、発生音決定手段４２は、左右の耳に対する音の到達時間の差を利用して処理画像ＳＰ中における着色ドット（白色ドットＷＤ以外のドットをいう）ＢＤのＸ軸（左右）方向に沿った位置を表し、一方で、周波数の高低を利用してＹ軸（上下）方向に沿った処理画像ＳＰ中の着色ドットＢＤの位置を表すようになっている。

ここで、処理画像ＳＰ中における着色ドットＢＤのＸ軸方向に沿った位置は、次のように表現される。すなわち、Ｘ軸方向に沿って処理画像ＳＰの中央に位置するドットの列を基準列ＢＬ（図３中、中央の点線で挟まれる列）として、当該基準列ＢＬよりもＸ軸方向のプラス側（すなわち利用者の右側）に位置する着色ドットＢＤについては、基準列ＢＬからその着色ドットＢＤまでの距離に対応した分だけ、利用者の左耳に装着される発音機３１よりも利用者の右耳に装着される発音機３２から早く音が発せられるようになっている。一方で、基準列ＢＬよりもＸ軸方向のマイナス側（すなわち利用者の左側）に位置する着色ドットＢＤについては、基準列ＢＬからその着色ドットＢＤまでの距離に対応した分だけ発音機３２よりも発音機３１から早く音が発せられるようになっている。

また、本実施形態では、Ｘ軸方向に沿ったドットＤＴの位置を表現する左右の耳への音の到達時間差が、撮像手段２による撮像画像の取込角度に対応して設定されている。

詳述すると、前方右４５度から音が発せられたときには、右耳に対して音が達してから約０．４ｍｓだけ遅れて左耳に音が達し、また、前方左４５度から音が発せられたときには、左耳に対して音が達してから約０．４ｍｓだけ遅れて右耳に音が達することが知られている。そこで、本実施形態では、上述の通り、撮像手段２の画像取込角度は左右４５度ずつに設定されているため、例えば、処理画像ＳＰの最も右側に位置する着色ドットＢＤ（つまり、利用者の前方右４５度に位置するもの）を表す際には、発音機３２から音を発してから約０．４ｍｓだけ遅れて発音機３１から音が発せられるように設定されている。また、処理画像ＳＰは左右にそれぞれ２０個ずつドットを有して構成されているため、基準列ＢＬから右に１列進むごとに発音機３２が音を発してから０．０２ｍｓ（＝０．４ｍｓ／２０）だけ遅れて発音機３１から音が発せられ、一方で、基準列ＢＬから左へ１列進むごとに発音機３１が音を発してから０．０２ｍｓだけ遅れて発音機３２から音が発せられるようになっている。例えば、基準列ＢＬから右に１０列目の着色ドットＢＤを表す際には、発音機３２が音を発してから０．２ｍｓ（＝０．０２ｍｓ×１０）だけ遅れて発音機３１から音が発せられるようになっている。

加えて、処理画像ＳＰ中における着色ドットＢＤのＹ軸方向に沿った位置は次のように表現される。すなわち、Ｙ軸方向に沿った各ドットＤＴの行ごとに発する音の周波数が予め割り当てられており、本実施形態では、Ｙ軸方向のプラス側（すなわち上側）からＹ軸方向のマイナス側（すなわち下側）へと徐々に減少する周波数が割り当てられている。そして、着色ドットＢＤのＹ軸方向に沿った位置を表現するにあたっては、着色ドットＢＤの存在する行に対応する周波数の音が発音手段３から発せられるようになっている。尚、各ドットＤＴの行に割り当てられる周波数は、図３に示すように、それぞれ異なる素数とされている。また、用いられる周波数は、人の可聴域内（２０Ｈｚ〜２００００Ｈｚ）の中でも、特に聴きやすい６０Ｈｚ〜１０００Ｈｚ（約４オクターブ）とされている。加えて、前記発音手段３より発せられる音は、純音とされている。

さらに、本実施形態では、発する音の強度差（音圧差）によって着色ドットＢＤの濃淡が表現されるようになっている。すなわち、着色ドットＢＤのうち、比較的濃い着色ドットＢＤ１が比較的大きな音（例えば、５０ｄｂ）で表現される一方で、比較的薄い着色ドットＢＤ２が比較的小さな音（例えば、３０ｄｂ）で表現される（尚、音量は例示であって、これに限定されるものではない）。

また、処理手段４は、発生音決定手段４２により各着色ドットＢＤに対応して決定されたそれぞれの音を信号化して、当該信号を前記発音手段３に送信する。そして、発音手段３によって各着色ドットＢＤに対応して決定された音が同時に発せられるようになっている。尚、本実施形態では、白色ドットＷＤに対応した音は発せられないように構成されている。

次いで、図３に示す処理画像ＳＰがどのように表現されるかについて、周波数１９１Ｈｚの行を例として示す。

まず、周波数１９１Ｈｚの行に存在する着色ドットＢＤのうち、基準列ＢＬ（利用者の正面）より左側に位置し、色が比較的濃い複数の着色ドットＡについては、発音機３１から強度の比較的大きな音が発せられてから０．２６ｍｓ、０．２４ｍｓ、０．２２ｍｓ、０．２０ｍｓ、０．１８ｍｓ、０．１６ｍｓ、及び、０．１４ｍｓだけ遅れて発音機３２から強度の比較的大きな音が発せられることで表現される。

さらに、基準列ＢＬの左側に位置し、色の比較的薄い着色ドットＢについては、発音機３１より強度の比較的小さな音が発せられてから、０．１２ｍｓ、０．１０ｍｓ、及び、０．０８ｍｓだけ遅れて発音機３２より強度の比較的小さな音が発せられることで表現される。また、基準列ＢＬ側に位置する色の比較的濃い着色ドットＣは、発音機３１から強度の比較的高い音が発せられてから０．０４ｍｓ及び０．０２ｍｓだけ遅れて発音機３２より強度の比較的大きな音が発せられることにより表現される。

加えて、基準列ＢＬ上（つまり、利用者の正面）に位置し、色の比較的濃い着色ドットＤについては、発音機３１及び発音機３２から同時に強度の比較的大きな音が発せられることで表現される。

併せて、基準列ＢＬの右側に位置し、色の比較的濃い着色ドットＥは、発音機３２から強度の比較的大きな音が発せられてから０．０２ｍｓ及び０．０４ｍｓだけ遅れて発音機３１より強度の比較的大きな音が発せられることにより表現される。

また、基準列ＢＬの右側に位置し、色の比較的薄い着色ドットＦについては、発音機３２から強度の比較的小さな音が発せられてから０．０６ｍｓ及び０．０８ｍｓだけ遅れて発音機３１より強度の比較的小さな音が発せられることで表現される。尚、上述の通り、白色ドットＷＤに対応する音は発せられない。

以上詳述したように、本実施形態によれば、処理画像ＳＰを構成する複数の着色ドットＢＤの位置について、左右の耳に対する音の到達時間差を用いることでＸ軸方向（左右方向）の位置が表され、周波数の大小を用いることでＹ軸方向（上下方向）の位置が表される。従って、処理画像ＳＰをより容易に、かつ、より正確に聴覚をもって認識することができ、ひいては周囲の物体の位置や形状などをより正確に認識することができる。

特に本実施形態では、処理画像ＳＰ中におけるＸ軸方向に沿った着色ドットＢＤの位置は、左右の耳への音の到達時間差を用いることにより表されている。このため、Ｘ軸方向に沿った位置を音の強度差を用いて表現する上記従来技術と比較して、周囲の物体の位置や形状などを非常に正確に認識することができる。

さらに、音の強度（音圧）を調節することで、処理画像ＳＰ中における着色ドットＢＤの濃淡が表される。そのため、物体の位置などに加えて、物体の凹凸等、物体のより正確な形状を認識することができる。

加えて、発音手段３により発せられる音が純音とされ、さらに、Ｙ軸方向に沿ったドットＤＴの各行ごとに割り当てられる周波数が、それぞれ異なる素数とされている。従って、それぞれの音が他の音と共振してしまうことがなくなり、発音手段３から発せられる音をより一層確実に認識することができる。その結果、周囲の物体の位置等をより一層正確に認識することができる。

併せて、各着色ドットＢＤに対応する音が発音手段３より同時に発せられるため、処理画像ＳＰを認識するのに要する時間を短縮することができる。これにより、単位時間当たりにより多くの処理画像ＳＰを認識することができるため、例えば、物体が移動しているといったことや、物体の早さなどをより正確に、かつ、より確実に知ることができる。

また、Ｘ軸方向及びＹ軸方向に沿ってそれぞれ２１以上のドットＤＴを備えて処理画像ＳＰが構成されているため、物体の形状などを一層正確に把握することができる。

加えて、発音手段３より発せられる音の周波数が６０Ｈｚ以上１０００Ｈｚ以下とされているため、音に強度差を設けなくとも、左右の耳に対する音の到達時間に差があるものとより確実に認識することができる。その結果、Ｙ軸方向の全域に亘ってＸ軸方向に沿ったドットＤＴ位置のより確実な認識を図ることができる。

さらに、撮像手段３の向く方向が利用者の視界方向と同一とされ、さらに、Ｘ軸方向に沿った着色ドットＢＤの位置を表現する左右の耳への音の到達時間差が、撮像画像の取込角度に対応して設定されている。従って、左右方向において、利用者に対する物体の相対位置と、音によって利用者が認識する物体の位置とが一致することとなる。このため、自己と物体との相対的な位置関係を極めて正確に把握することができ、周囲の状況を極めて正確に認識することができる。

尚、上記実施形態の記載内容に限定されず、例えば次のように実施してもよい。勿論、以下において例示しない他の応用例、変更例も当然可能である。

（ａ）上記実施形態では、発生音決定手段４２は、音の大小を用いて処理画像ＳＰの濃淡を表現することとしている。これに対して、第１スピーカ３１Ｕ，３２Ｕ及び第２スピーカ３１Ｌ，３２Ｌから発せられる音に強度差を設けることで、着色ドットＢＤのＹ軸方向に沿った位置（上下位置）を表す際に用いることとしてもよい。すなわち、処理画像ＳＰ中の上方に位置する着色ドットＢＤを表現するにあたっては、第１スピーカ３１Ｕ，３２Ｕから比較的高い周波数で、かつ、強度の比較的大きな音を発する一方で、前記第２スピーカ３１Ｌ，３２Ｌから同一の高周波数で、強度の比較的小さな音を発し、また、処理画像ＳＰ中の下方に位置する着色ドットＢＤを表現するにあたっては、第１スピーカ３１Ｕ，３２Ｕから比較的低い周波数で、かつ、強度の比較的小さな音を発する一方で、第２スピーカ３１Ｌ，３２Ｌから同一の低周波数で、強度の比較的大きな音を発するようにしてもよい。この場合、利用者は、骨伝導や皮膚の触覚等により、上方側に位置する着色ドットＢＤについては、あたかも自身の上方から音が発せられているように感じ、一方で、下方側に位置する着色ドットＢＤについては、あたかも自身の下方から音が発せられているように感じることとなる。従って、周波数の違いと併せて、利用者は、処理画像ＳＰ中における着色ドットＢＤ（物体）の上下位置をより正確に認識することができる。尚、音の強度差を用いて、着色ドットＢＤの濃淡、及び、Ｙ軸方向に沿った着色ドットＢＤの位置を併せて表現することとしてもよい。

（ｂ）上記実施形態において、処理画像ＳＰは、３階調の濃淡画像とされているが、処理画像ＳＰの濃淡の階調はこれに限定されるものではない。従って、例えば、処理画像として白黒画像（２階調）を生成することとしてもよい。

（ｃ）上記実施形態では、発音機３１，３２は、それぞれ第１スピーカ３１Ｕ，３２Ｕ及び第２スピーカ３１Ｌ，３２Ｌを備えているが、発音機３１，３２がそれぞれ１つ又は３つ以上のスピーカを備えて構成されることとしてもよい。

（ｄ）上記実施形態では、各着色ドットＢＤに対応する音を発音手段３から同時に発することとされているが、各周波数ごとに順次音を発することとしてもよい。この場合、利用者は音をより一層容易に認識することができるため、周囲物体の位置などをより確実に、かつ、より容易に認識することができる。

（ｅ）上記実施形態では、着色ドットＢＤのＹ軸方向の位置を表す周波数が上方から下方へと減少するように設定されているが、上方から下方へと徐々に増大するように周波数を設定することとしてもよい。また、上記実施形態では、音の周波数が６０Ｈｚ〜１０００Ｈｚとされているが、発する音の周波数の範囲はこれに限定されるものではない。但し、６０００Ｈｚを超えるような高周波数は、上述の通り、左右の耳に対する音の到達時間差を認識しにくくなり得る。そのため、周波数の上限を６０００Ｈｚ以下とすることが好ましく、周波数の上限を３０００Ｈｚ以下とすることがより好ましい。

（ｆ）上記実施形態における処理画像ＳＰのドット数は例示であって、その数は限定されるものではない。また、画像処理手段４１については、生成する処理画像のドット数（行数、列数）を適宜変更可能に構成することとしてもよい。例えば、周囲の状況をより細かく把握したい場合には、処理画像のドット数をより増大させることとしてもよい。また、処理画像のドット数をより減少させれば、利用者が画像を認識する際の負担を軽減することができる。

（ｇ）上記実施形態では、撮像手段２による左右方向の取込角度が左右にそれぞれ４５度ずつとされているが、撮像手段２の取込角度はこれに限定されるものではない。

１…画像聴覚化装置、２…撮像手段、３…発音手段、４…処理手段、３１，３２…発音機、３１Ｕ，３２Ｕ…第１スピーカ、３１Ｌ，３２Ｌ…第２スピーカ、４１…画像処理手段、４２…発生音決定手段、ＤＴ…ドット。

Claims

撮像手段と、
利用者の左右の耳に装着され、各耳に対応した発音機を備える発音手段と、
前記撮像手段により得られた撮像画像に基づいて、Ｘ軸方向及びＹ軸方向に沿って延びる複数の走査線により形成された複数のドットからなる処理画像を得る画像処理手段と、
前記処理画像を構成する各ドットに対応して、前記発音手段から発する音を決定する発生音決定手段とを備える画像聴覚化装置であって、
前記発生音決定手段は、
左右の耳への音の到達時間に差を設けることで、前記処理画像中におけるＸ軸方向に沿った前記ドットの位置を表すとともに、
Ｙ軸方向のプラス側からマイナス側へと向かって増加又は減少し、Ｙ軸方向に沿った前記ドットの各行ごとに割り当てられる周波数により、前記処理画像中におけるＹ軸方向に沿った前記ドットの位置を表すことを特徴とする画像聴覚化装置。
音の強度の大小を用いて、前記処理画像中における前記ドットの濃淡を表すことを特徴とする請求項１に記載の画像聴覚化装置。
前記左右各耳に対応する発音機は、利用者の各耳に装着された際に、利用者の外耳道の上方に配置される第１スピーカと、利用者の外耳道の下方に配置される第２スピーカとをそれぞれ備え、
周波数の高低に対応して、両スピーカのうちの一方から発せられる音の強度を増大させる一方で、両スピーカのうちの他方から発せられる音の強度を低減させることを特徴とする請求項１又は２に記載の画像聴覚化装置。
発音手段が発する音を純音とするとともに、
Ｙ軸方向に沿った前記ドットの行ごとに割り当てられる周波数を、それぞれ異なる素数としたことを特徴とする請求項１乃至３のいずれか１項に記載の画像聴覚化装置。
各周波数ごとに順次音を発することを特徴とする請求項１乃至４のいずれか１項に記載の画像聴覚化装置。
前記発生音決定手段により決定された各ドットに対応する音が、前記発音手段から同時に発せられることを特徴とする請求項１乃至４のいずれか１項に記載の画像聴覚化装置。
前記走査線は、Ｘ軸方向及びＹ軸方向に沿ってそれぞれ２０本以上存在することを特徴とする請求項１乃至６のいずれか１項に記載の画像聴覚化装置。
前記発音手段から発する音の周波数を６０Ｈｚ以上１０００Ｈｚ以下としたことを特徴とする請求項１乃至７のいずれか１項に記載の画像聴覚化装置。
前記撮像手段は、利用者の視界方向と同一の方向に向くよう、利用者に対し、直接又は間接的に取付可能に構成されるとともに、
前記発生音決定手段は、左右の耳への音の到達時間差を、前記撮像手段の左右方向における撮像画像の取込角度に対応して設定することを特徴とする請求項１乃至８のいずれか１項に記載の画像聴覚化装置。