JP5275496B1 - 画像聴覚化装置 - Google Patents

画像聴覚化装置 Download PDF

Info

Publication number
JP5275496B1
JP5275496B1 JP2012121453A JP2012121453A JP5275496B1 JP 5275496 B1 JP5275496 B1 JP 5275496B1 JP 2012121453 A JP2012121453 A JP 2012121453A JP 2012121453 A JP2012121453 A JP 2012121453A JP 5275496 B1 JP5275496 B1 JP 5275496B1
Authority
JP
Japan
Prior art keywords
sound
special object
dot
image
axis direction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012121453A
Other languages
English (en)
Other versions
JP2013246738A (ja
Inventor
昌弘 黒田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2012121453A priority Critical patent/JP5275496B1/ja
Application granted granted Critical
Publication of JP5275496B1 publication Critical patent/JP5275496B1/ja
Publication of JP2013246738A publication Critical patent/JP2013246738A/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Traffic Control Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

【課題】物体に接触せずに、聴覚をもって特別対象物をより正確に認識可能とする。
【解決手段】画像聴覚化装置1は、撮像手段2と、発音手段3と、複数のドットDTからなる処理画像SPを得る画像処理手段41と、発音手段3から発する音を決定する発生音決定手段44と、撮像画像中において所定の外観要素を有する部位を所定の特別対象物として認識する特別対象物認識手段42と、処理画像SP中における特別対象物の位置を検出する位置検出手段43とを有する。発生音決定手段44は、左右の耳への音の到達時間差によりX軸方向に沿ったドットDTの位置を表し、ドットDTの各行ごとに割り当てられる周波数によりY軸方向に沿ったドットDTの位置を表する。発音手段3は、ドットDTのうち少なくとも特別対象物が位置する部位に対応して音を発する。
【選択図】 図3

Description

本発明は、周囲に位置する物体を聴覚的に表現する画像聴覚化装置に関する。
従来、視覚障害者は、杖を周囲の物体に接触させることや、信号機の誘導音などから周囲の状況を確認している。
しかしながら、杖を用いる場合、視覚障害者は杖で周囲の物体に触れることが必要であり、杖の先を継続的に広範囲に動かさなければならない。従って、杖が段差や障害物等に接触せずに、それら段差等を認識し損ねてしまうおそれがある。また、誘導音などを利用するにあたっては、それを発するための設備が設けられていることが必要である。
そこで、特段の設備が設けられていない環境下においても、視覚によることなく周囲に位置する物体などを認識可能とすべく、物体をCCDカメラ等の撮像手段で読み取った上で、読み取られた画像データの輪郭を音に変換し、その音により利用者に聴覚をもって当該画像データを認識させる技術が提案されている(例えば、特許文献1等参照)。
特開2003−84784号公報
しかしながら、上記特許文献に記載の技術では、信号機から発せられる信号(赤信号や青信号)や視覚障害者誘導用ブロックなど、視覚障害者にとって特に重要なものや、所定の施設のマークや特定人物の顔など、生活を営む上で必要なもの(以下、これらを特別対象物という)を正確に認識することができないおそれがある。
本発明は、上記事情を鑑みてなされたものであり、その目的は、視覚障害者等の利用者が、物体に接触することなく、聴覚をもって特別対象物をより正確に認識することができる画像聴覚化装置を提供することにある。
以下、上記目的を解決するのに適した各手段につき、項分けして説明する。なお、必要に応じて対応する手段に特有の作用効果を付記する。
手段1.撮像手段と、
利用者の左右の耳に装着され、各耳に対応した発音機を備える発音手段と、
前記撮像手段により得られた撮像画像に基づいて、X軸方向及びY軸方向に沿って延びる複数の走査線により形成された複数のドットからなる処理画像を得る画像処理手段と、
前記発音手段から発する音を決定する発生音決定手段とを備える画像聴覚化装置であって、
前記撮像画像中において所定の外観要素を有する部位を所定の特別対象物として認識する特別対象物認識手段と、
前記処理画像中において前記特別対象物が位置する前記ドットを検出する位置検出手段とを有し、
前記特別対象物認識手段は、前記撮像手段により得られた撮像画像に基づいて、予め設定された所定の外観要素を有する部位を抽出し、予め記憶されたデータを参照して、前記抽出された部位に位置する特別対象物の種別を認識するものであり、
前記発生音決定手段は、
左右の耳への音の到達時間に差を設けることで、前記処理画像中におけるX軸方向に沿った前記ドットの位置を表すとともに、
Y軸方向のプラス側からマイナス側へと向かって増加又は減少し、Y軸方向に沿った前記ドットの各行ごとに割り当てられる周波数により、前記処理画像中におけるY軸方向に沿った前記ドットの位置を表し、
前記発音手段は、少なくとも前記特別対象物が位置する前記ドットに対応して前記発生音決定手段により決定された音を発するものであるとともに、
前記特別対象物が位置する部位以外の前記ドットに対応しても発音可能であり、
前記発生音決定手段は、少なくとも前記特別対象物が位置する前記ドットに対応して発する音を、前記特別対象物以外が位置する前記ドットに対応して発する音と異なる種類の特殊音とし、当該特殊音は、前記認識された特別対象物に対応する直接言語を含むことを特徴とする画像聴覚化装置。
尚、「外観要素」とあるのは、色相や形状、模様など物体の外観に表れ、視覚を通じて把握可能な(すなわち、撮像手段により撮像可能な)要素をいう。また、「特別対象物」とあるのは、信号機から発せられる信号(いわゆる青信号等)や道路上に配置された視覚障害者用誘導ブロック、所定の施設(銀行や郵便局、特定の店舗等)を示すマーク(例えば、銀行などのマークや頻繁に通う店の看板等に示されたマーク)、特定の人物の顔(例えば、知り合いの顔など)等をいう。
上記手段1によれば、画像処理手段により、例えば周囲の物体の形状や位置などを示す撮像画像に基づいて、複数のドットからなる処理画像が生成される。そして、処理画像を構成する複数のドットの位置については、左右の耳に対する音の到達時間差を用いることでX軸方向(左右方向)の位置が表され、音の周波数の大小を用いることでY軸方向(上下方向)の位置が表される。従って、特別対象物をより確実に聴覚をもって認識することができ、周囲の状況をより正確に認識することができる。
また、特別対象物以外の部位に対応しても、音が発せられるように構成されるとともに、特別対象物が位置するドットにおいては、特別対象物以外が位置するドットに対応して発せられる音と異なる種類の特殊音が発せられるように構成されている。従って、特別対象物の認識を妨げることなく、特別対象物の周囲に位置する物体の位置や形状を把握することができる。その結果、周囲の状況をより一層正確に認識することができる。
尚、音の種類としては、純音(正弦波)や楽音(弦楽器や管楽器等による旋律など)、噪音(打楽器などによる音)、直接言語(例えば、人名や施設名を称する声)などを挙げることができるが、特別対象物が位置するドットにおいては、前記認識された特別対象物に対応する直接言語を含む特殊音が発せられる
また、上記手段によれば、発せられる特殊音が、特別対象物の種別(例えば、赤信号や視覚障害者誘導用ブロックなどの種類の相違)に対応している。従って、様々な種別の特別対象物を認識することができ、周囲の状況をより一層正確に把握することができる。
手段.前記特別対象物認識手段は、前記撮像画像中における前記外観要素の輝度に基づいて、前記特別対象物の種別を認識することを特徴とする手段1に記載の画像聴覚化装置。
上記手段によれば、特別対象物認識手段は、外観要素の輝度に基づいて特別対象物の種別を認識するように構成されている。従って、例えば、赤信号と郵便ポストなど、色彩が近いものであっても、それらをより確実に区別することができ、周囲の状況をさらに正確に把握することができる。
手段.前記特別対象物認識手段は、前記撮像画像中における前記外観要素を有する部位の位置に基づいて、前記特別対象物の種別を認識することを特徴とする手段1又は2に記載の画像聴覚化装置。
例えば、水平線が高さ方向(Y軸方向)における中心となるような前記撮像画像を得た場合、視覚障害者用誘導ブロック等は、道路上に配置されるため、前記撮像画像中において前記中心よりも下方側に位置する。また、信号機から発せられる信号等は、撮像画像中において前記中心よりも上方側に位置することが多い。すなわち、特別対象物のうち特定のものは、その配置位置がある程度決まっており、撮像画像中における位置もある程度決まった位置となりやすい。
この点を鑑みて、上記手段によれば、特別対象物認識手段は、撮像画像中における外観要素を有する部位の位置に基づいて、特別対象物の種別を認識するように構成されている。これにより、特別対象物の種別を一層正しく認識することができ、周囲の状況を一段と正確に把握することができる。
画像聴覚化装置の構成を示すブロック図である。 発音手段の構成を示す模式図である。 画像処理手段により生成される処理画像などを示す図である。
以下に、一実施形態について図面を参照して説明する。図1に示すように、画像聴覚化装置1は、CCDイメージセンサ等の撮像手段2と、利用者の両耳に装着可能な発音手段3と、前記撮像手段2及び発音手段3に対して所定の信号を送受信可能に構成された処理手段4とを備えている。
前記撮像手段2は、利用者の視界方向とほぼ同一の方向に向けられるように、例えば、利用者の眼鏡や帽子等に対して取付可能に構成されている(勿論、利用者に対して直接取付けることとしてもよい)。また、撮像手段2により得られた撮像データは、前記処理手段4に対して伝送されるようになっている。加えて、本実施形態では、撮像手段2のX軸方向(左右方向)における画像取込角度が90度に設定されている。すなわち、撮像手段2は、利用者の正面から左右45度ずつの範囲を撮像するように設定されている。
前記発音手段3は、前記処理手段4から出力される音声信号を音波に変換するものであり、図2に示すように、利用者の両耳に装着される一対の発音機31,32を備えている。そして、発音機31は利用者の左耳に装着される一方で、発音機32は利用者の右耳に装着されるようになっている。加えて、一対の発音機31,32は、それぞれ第1スピーカ31U,32U及び第2スピーカ31L,32Lを備えている。前記第1スピーカ31U,32Uは、発音手段3が利用者に装着された際に、利用者の外耳道の上方に位置するように配設されている。一方で、前記第2スピーカ31L,32Lは、発音手段3が利用者に装着された際に、利用者の外耳道の下方に位置するように配設されている。
図1に戻り、前記処理手段4は、所定のマイコン等により構成されており、画像処理手段41と、特別対象物認識手段42と、位置検出手段43と、発生音決定手段44とを備えている。
前記画像処理手段41は、撮像手段2から伝送される撮像データに基づいて、X軸方向及びY軸方向に沿って延びる複数の走査線により形成された複数のドットからなる処理画像を生成するものである。詳述すると、まず、ピクセルを間引くなどの従来公知の手法を用いて撮像データの解像度を減少させることで、X軸方向に沿ってm個のドットを有し、Y軸方向に沿ってn個のドットを有する(つまりm列×n行の)中間画像を生成する。次いで、前記中間画像に濃淡処理を施すことで、図3に示すように、Z(例えば、4)階調モノクロで、複数のドットDTを有する処理画像SPを生成する〔図3では、図示の便宜上、後述する部位X1〜X5に斜線や散点模様を付しているが、実際の処理画像SPでは、部位X1〜X5もモノクロ(白色や黒色、灰色)で示される〕。尚、本実施形態おいて、処理画像SPは、X軸方向に沿って101本、Y軸方向に沿って100本の走査線によって区画され、X軸方向に沿って101個、Y軸方向に沿って100個のドットを有するものとされている。そのため、上述の通り、撮像手段2のX軸方向(左右方向)における画像取込角度が45度であることから、X軸方向に沿った各ドットDTはそれぞれ0.9(45/50)度ずつの視野に相当している。
特別対象物認識手段42は、撮像手段2により得られた撮像画像に基づいて、前記撮像画像中において所定の外観要素を有する部位を所定の特別対象物として認識するものである。具体的には、特別対象物認識手段42は、従来公知の技術を用いて、前記撮像画像から、予め設定された所定の外観要素(本実施形態では、所定の色彩や所定の形状)を有する部位を抽出する。そして、予め記憶された、色相や形状等と特別対象物の種別とを関連付けたデータを参照し、前記抽出された部位に位置する特別対象物の種別を認識する。本実施形態では、前記外観要素の色相や輝度、撮像画像中における前記外観要素を有する部位の位置に基づいて、視覚障害者誘導用ブロック、赤信号、及び、青信号が認識される。
具体的には、撮像画像から抽出された部位(処理画像SP中の部位X1に相当する)において、当該部位で発せられる光線の波長が570nm以上590nm以下(すなわち、色相が黄色)であり、特別対象物に隣接する部位の輝度に対する特別対象物の輝度の比(輝度比、コントラスト)が1.5以上2.5以下であり、撮像画像中における前記部位の位置が下方側〔より詳しくは、水平線が高さ方向(Y軸方向)における中心となるように撮像画像を得たとき、前記部位の位置が前記撮像画像の中心よりも下方側〕であるときに、前記部位(部位X1に相当する部位)は、視覚障害者誘導用ブロックであると認識される。
さらに、撮像画像から抽出された部位(処理画像SP中の部位X2に相当する)において、当該部位で発せられる光線の波長が620nm以上750nm以下(すなわち、色相が赤色)であり、輝度比が2.0以上であり、撮像画像中における前記部位の位置が上方側であるときに、前記部位(部位X2に相当する部位)は、赤信号であると認識される。
加えて、撮像画像から抽出された部位(処理画像SP中の部位X3に相当する)において、当該部位で発せられる光線の波長が495nm以上570nm以下(すなわち、色相が緑色)であり、輝度比が2.0以上であり、撮像画像中における前記部位の位置が上方側であるときに、前記部位(部位X3に相当する部位)は、青信号であると認識される。
併せて、本実施形態では、前記外観要素の色相や形状に基づいて、所定の施設(例えば、地下鉄や郵便局など)を示すマークや特定の人物の顔が認識される。詳述すると、例えば、撮像画像から抽出された部位(処理画像SP中における部位X4に相当する)において、前記部位の形状が予め記憶された郵便記号と一致する場合、前記部位(部位X4に相当する部位)は郵便局のマークであると認識される。また、撮像画像から抽出された部位(処理画像SP中における部位X5に相当する部位)において、当該部位の形状が予め記憶された特定の人物の顔形状と一致する場合、前記部位(部位X5に相当する部位)は特定の人物の顔であると認識される。
位置検出手段43は、処理画像SP中における、前記特別対象物(視覚障害者誘導用ブロックや赤信号等)の位置を検出するものである。具体的には、撮像画像中において特別対象物が位置する範囲を特定するとともに、処理画像SP中において、前記位置範囲に対応するドットDTを特別対象物の位置として検出する。
前記発生音決定手段44は、発音手段3から発する音を決定するものである。本実施形態において、発生音決定手段44は、左右の耳に対する音の到達時間の差を利用して処理画像SP中におけるドットDTのX軸(左右)方向に沿った位置を表し、一方で、周波数の高低を利用してY軸(上下)方向に沿った処理画像SP中のドットDTの位置を表すようになっている。尚、本実施形態では、特別対象物が存在しない位置において前記ドットDTが白色である場合には音が発せられず、ドットDTが、特別対象物の存在部位であったり、黒色や灰色であったりする場合に、音が発せられるようになっている。
ここで、処理画像SP中におけるドットDTのX軸方向に沿った位置は、次のように表現される。すなわち、X軸方向に沿って処理画像SPの中央に位置するドットの列を基準列として、当該基準列よりもX軸方向のプラス側(すなわち利用者の右側)に位置するドットDTについては、前記基準列からそのドットDTまでの距離に対応した分だけ、利用者の左耳に装着される発音機31よりも利用者の右耳に装着される発音機32から早く音が発せられるようになっている。一方で、基準列よりもX軸方向のマイナス側(すなわち利用者の左側)に位置するドットDTについては、基準列からそのドットDTまでの距離に対応した分だけ発音機32よりも発音機31から早く音が発せられるようになっている。
また、本実施形態では、X軸方向に沿ったドットDTの位置を表現する左右の耳への音の到達時間差が、撮像手段2による撮像画像の取込角度に対応して設定されている。
詳述すると、前方右45度から音が発せられたときには、右耳に対して音が達してから約0.4msだけ遅れて左耳に音が達し、また、前方左45度から音が発せられたときには、左耳に対して音が達してから約0.4msだけ遅れて右耳に音が達することが知られている。そこで、本実施形態では、上述の通り、撮像手段2の画像取込角度は左右45度ずつに設定されているため、例えば、処理画像SPの最も右側に位置するドットDT(つまり、利用者の前方右45度に位置するもの)を表す際には、発音機32から音を発してから約0.4msだけ遅れて発音機31から音が発せられるように設定されている。また、処理画像SPは左右にそれぞれ50個ずつドットを有して構成されているため、前記基準列から右に1列進むごとに発音機32が音を発してから0.008ms(=0.4ms/50)だけ遅れて発音機31から音が発せられ、一方で、前記基準列から左へ1列進むごとに発音機31が音を発してから0.008msだけ遅れて発音機32から音が発せられるようになっている。例えば、基準列から右に10列目のドットDTを表す際には、発音機32が音を発してから0.08ms(=0.008ms×10)だけ遅れて発音機31から音が発せられるようになっている。
加えて、処理画像SP中におけるドットDTのY軸方向に沿った位置は次のように表現される。すなわち、Y軸方向に沿った各ドットDTの行ごとに発する音の周波数が予め割り当てられており、本実施形態では、Y軸方向のプラス側(すなわち上側)からY軸方向のマイナス側(すなわち下側)へと徐々に減少する周波数が割り当てられている。そして、ドットDTのY軸方向に沿った位置を表現するにあたっては、ドットDTの存在する行に対応する周波数の音が発音手段3から発せられるようになっている。尚、本実施形態において、各ドットDTの行に割り当てられる周波数は、音の共鳴を防止するために、それぞれ異なる素数とされている。また、用いられる周波数は、人の可聴域内における所定範囲(例えば、20Hz〜6000Hz)とされている。
さらに、本実施形態では、発する音の強度差(音圧差)によってドットDTの濃淡が表現されるようになっている。すなわち、ドットDTのうち比較的濃いドットDTは比較的大きな音(例えば、50db)で表現される一方で、比較的薄いドットDTは比較的小さな音(例えば、30db)で表現される(尚、音量は例示であって、これに限定されるものではない)。
また、処理手段4は、発生音決定手段44により各ドットDTに対応して決定されたそれぞれの音を信号化して、当該信号を前記発音手段3に送信する。そして、発音手段3によって、各ドットDTに対応して決定された音が、各周波数ごとに順次(例えば、Y軸方向のプラス側からマイナス側に順次)発せられるようになっている。
加えて、本実施形態では、前記特別対象物が位置するドットDTにおいて発せられる音が、前記特別対象物以外が位置するドットDTに対応して発せられる音と異なる種類の特殊音とされている。より詳しくは、特別対象物以外が位置するドットDTのうち黒色や灰色のものは、純音(正弦波)により表現されている。これに対して、前記特別対象物が位置するドットDTにおいて発せられる音は、前記純音と種類の異なる特殊音(例えば、楽音や噪音、直接言語など)とされている。すなわち、純音によっていわば背景が表現され、純音と種類の異なる特殊音によって特別対象物が強調して表現されている。また、特別対象物の種別に対応して異なる特殊音が用いられており、特別対象物の種別を認識可能とされている。
本実施形態では、部位X1,X3,X4におけるドットDTを表す音は、発音機32からの発音タイミングが、部位X1,X3,X4におけるX座標に対応する分だけ発音機31からの発音タイミングよりも遅く、部位X1,X3,X4におけるY座標に対応する周波数であり、かつ、純音と異なる種類の噪音とされている。
さらに、部位X2におけるドットDTを表す音は、発音機32からの発音タイミングが、部位X2におけるX座標に対応する分だけ発音機31からの発音タイミングよりも遅く、部位X2におけるY座標に対応する周波数であり、かつ、純音と異なる種類の噪音とされている。
また、部位X5におけるドットDTを表す音は、発音機31からの発音タイミングが、部位X5におけるX座標に対応する分だけ発音機32からの発音タイミングよりも遅く、部位X5におけるY座標に対応する周波数であり、かつ、直接言語(例えば、前記特定人物の名前など)とされている。
尚、特別対象物が位置するドットDTに対応して発する音の種類は、適宜変更可能である。
また、本実施形態では、特別対象物が赤信号や青信号、黄信号である場合、処理画像SPにおいて青信号等は、通常、複数のドットDTからなる面で表示されるため、特別対象物の位置するドットDTの全てに対応して噪音が発せられる。一方で、特別対象物が人の顔や郵便局等のマークである場合には、青信号等と異なり、通常、処理画像SPにおいて人の顔等は面で表示されないため、特別対象物が位置する複数のドットDTのうちの1のドットDT(例えば、複数のドットDTの中心部に位置するドットDT)に対応して、直接言語が発せられる。
以上詳述したように、本実施形態によれば、特別対象物をより確実に聴覚をもって認識することができ、周囲の状況をより正確に認識することができる。
さらに、特別対象物以外のドットDTに対応して音が発せられるとともに、特別対象物が位置するドットDTにおいては、特別対象物以外のドットDTに対応して発せられる音と異なる種類の特殊音が発せられるように構成されている。従って、特別対象物の認識を妨げることなく、特別対象物の周囲に位置する物体の位置や形状を把握することができる。その結果、周囲の状況をより一層正確に認識することができる。
加えて、本実施形態では、特別対象物の種別に対応して、発せられる特殊音が異なるものとなるように構成されている。従って、様々な種別の特別対象物を認識することができ、周囲の状況をより一層正確に把握することができる。
また、特別対象物認識手段42は、前記外観要素の輝度に基づいて特別対象物の種別を認識するように構成されている。従って、特別対象物同士の色彩が近いものであっても、それらをより確実に区別することができ、周囲の状況をさらに正確に把握することができる。
さらに、特別対象物認識手段42は、撮像画像中における前記外観要素を有する部位の位置に基づいて、特別対象物の種別を認識するように構成されている。これにより、特別対象物の種別を一層正しく認識することができ、周囲の状況をより一層正確に把握することができる。
加えて、音の強度(音圧)を調節することで、処理画像SP中におけるドットDTの濃淡が表されている。そのため、物体の位置などに加えて、物体の凹凸等、物体のより正確な形状を認識することができる。
併せて、各ドットDTに対応する音が周波数ごとに順次発せられるため、利用者は音をより一層容易に認識することができる。その結果、特別対象物などの位置をより確実に、かつ、より容易に認識することができる。
さらに、撮像手段2の向く方向が利用者の視界方向と同一とされ、さらに、X軸方向に沿ったドットDTの位置を表現する左右の耳への音の到達時間差が、撮像画像の取込角度に対応して設定されている。従って、左右方向において、利用者に対する物体の相対位置と、音によって利用者が認識する物体の位置とが一致することとなる。このため、自己と物体との相対的な位置関係を極めて正確に把握することができ、周囲の状況を極めて正確に認識することができる。
尚、上記実施形態の記載内容に限定されず、例えば次のように実施してもよい。勿論、以下において例示しない他の応用例、変更例も当然可能である。
(a)上記実施形態では、特別対象物が位置するドットDTに加えて、特別対象物以外が位置するドットDTにおいても音が発せられるように構成されているが、少なくとも特別対象物が位置するドットDTに対応して音が発せられるように構成すればよい。
(b)上記実施形態では、特別対象物が存在しない位置において前記ドットDTが白色である場合には音が発せられず、ドットDTが黒色等である場合に音が発せられるように構成されているが、ドットDTが黒色等である場合に音を発せず、ドットDTが白色である場合に音を発するように構成してもよい。すなわち、ドットの濃淡と、発する音との関係は、特に限定されるものではない。
(c)上記実施形態において、処理画像SPは、4階調の濃淡画像とされているが、処理画像SPにおける濃淡の階調はこれに限定されるものではない。従って、例えば、処理画像として白黒画像(2階調)を生成することとしてもよい。
(d)上記実施形態では、発音機31,32は、それぞれ第1スピーカ31U,32U及び第2スピーカ31L,32Lを備えているが、発音機31,32がそれぞれ1つ又は3つ以上のスピーカを備えて構成されることとしてもよい。
(e)上記実施形態では、各ドットDTに対応する音が各周波数ごとに順次発せられるように構成されているが、各周波数の音を同時に発することとしてもよい。この場合、処理画像SP(特別対象物やその周囲の物体)を認識するのに要する時間を短縮することができる。これにより、単位時間当たりにより多くの処理画像SPを認識することができるため、例えば、特別対象物(例えば、人など)や物体が移動しているといったことや、特別対象物等の早さなどをより正確に、かつ、より確実に知ることができる。
(f)上記実施形態では、Y軸方向の位置を表す周波数が上方から下方へと減少するように設定されているが、上方から下方へと徐々に増大するように周波数を設定することとしてもよい。また、上記実施形態では、音の周波数が20Hz〜6000Hzとされているが、発する音の周波数の範囲はこれに限定されるものではない。但し、6000Hzを超えるような高周波数は、左右の耳に対する音の到達時間差を認識しにくくなり得る。そのため、周波数の上限を6000Hz以下とすることが好ましく、周波数の上限を3000Hz以下とすることがより好ましい。
(g)上記実施形態における処理画像SPのドット数は例示であって、その数は限定されるものではない。また、画像処理手段41については、生成する処理画像のドット数(行数、列数)を適宜変更可能に構成することとしてもよい。例えば、周囲の状況をより細かく把握したい場合には、処理画像のドット数をより増大させることとしてもよい。また、処理画像のドット数をより減少させれば、利用者が画像を認識する際の負担を軽減することができる。
(h)上記実施形態では、撮像手段2による左右方向の取込角度が左右にそれぞれ45度ずつとされているが、撮像手段2の取込角度はこれに限定されるものではない。
1…画像聴覚化装置、2…撮像手段、3…発音手段、41…画像処理手段、42…特別対象物認識手段、43…位置検出手段、44…発生音決定手段、DT…ドット、SP…処理画像。

Claims (3)

  1. 撮像手段と、
    利用者の左右の耳に装着され、各耳に対応した発音機を備える発音手段と、
    前記撮像手段により得られた撮像画像に基づいて、X軸方向及びY軸方向に沿って延びる複数の走査線により形成された複数のドットからなる処理画像を得る画像処理手段と、
    前記発音手段から発する音を決定する発生音決定手段とを備える画像聴覚化装置であって、
    前記撮像画像中において所定の外観要素を有する部位を所定の特別対象物として認識する特別対象物認識手段と、
    前記処理画像中において前記特別対象物が位置する前記ドットを検出する位置検出手段とを有し、
    前記特別対象物認識手段は、前記撮像手段により得られた撮像画像に基づいて、予め設定された所定の外観要素を有する部位を抽出し、予め記憶されたデータを参照して、前記抽出された部位に位置する特別対象物の種別を認識するものであり、
    前記発生音決定手段は、
    左右の耳への音の到達時間に差を設けることで、前記処理画像中におけるX軸方向に沿った前記ドットの位置を表すとともに、
    Y軸方向のプラス側からマイナス側へと向かって増加又は減少し、Y軸方向に沿った前記ドットの各行ごとに割り当てられる周波数により、前記処理画像中におけるY軸方向に沿った前記ドットの位置を表し、
    前記発音手段は、少なくとも前記特別対象物が位置する前記ドットに対応して前記発生音決定手段により決定された音を発するものであるとともに、
    前記特別対象物が位置する部位以外の前記ドットに対応しても発音可能であり、
    前記発生音決定手段は、少なくとも前記特別対象物が位置する前記ドットに対応して発する音を、前記特別対象物以外が位置する前記ドットに対応して発する音と異なる種類の特殊音とし、当該特殊音は、前記認識された特別対象物に対応する直接言語を含むことを特徴とする画像聴覚化装置。
  2. 前記特別対象物認識手段は、前記撮像画像中における前記外観要素の輝度に基づいて、前記特別対象物の種別を認識することを特徴とする請求項1に記載の画像聴覚化装置。
  3. 前記特別対象物認識手段は、前記撮像画像中における前記外観要素を有する部位の位置に基づいて、前記特別対象物の種別を認識することを特徴とする請求項1又は2に記載の画像聴覚化装置。
JP2012121453A 2012-05-29 2012-05-29 画像聴覚化装置 Expired - Fee Related JP5275496B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012121453A JP5275496B1 (ja) 2012-05-29 2012-05-29 画像聴覚化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012121453A JP5275496B1 (ja) 2012-05-29 2012-05-29 画像聴覚化装置

Publications (2)

Publication Number Publication Date
JP5275496B1 true JP5275496B1 (ja) 2013-08-28
JP2013246738A JP2013246738A (ja) 2013-12-09

Family

ID=49179238

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012121453A Expired - Fee Related JP5275496B1 (ja) 2012-05-29 2012-05-29 画像聴覚化装置

Country Status (1)

Country Link
JP (1) JP5275496B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112153461A (zh) * 2020-09-25 2020-12-29 北京百度网讯科技有限公司 用于定位发声物的方法、装置、电子设备及可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5002068B1 (ja) * 2011-07-08 2012-08-15 純二 嶋田 環境情報伝達装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5002068B1 (ja) * 2011-07-08 2012-08-15 純二 嶋田 環境情報伝達装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112153461A (zh) * 2020-09-25 2020-12-29 北京百度网讯科技有限公司 用于定位发声物的方法、装置、电子设备及可读存储介质
CN112153461B (zh) * 2020-09-25 2022-11-18 北京百度网讯科技有限公司 用于定位发声物的方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
JP2013246738A (ja) 2013-12-09

Similar Documents

Publication Publication Date Title
US10629175B2 (en) Smart detecting and feedback system for smart piano
JP6904963B2 (ja) 拡張現実システムにおいてオーディオを指向させるための技法
US7855657B2 (en) Device for communicating environmental information to a visually impaired person
Cavaco et al. Color sonification for the visually impaired
US20140055229A1 (en) Infra red based devices for guiding blind and visually impaired persons
CN204744865U (zh) 基于听觉的为视觉障碍人士传达周围环境信息的装置
KR101524279B1 (ko) Rgb-d 카메라를 이용한 피아노 교육 시스템 및 그 방법
US11468789B2 (en) Electroencephalogram—controlled video input and auditory display blind guiding apparatus and method
CN108957761A (zh) 显示装置及其控制方法、头戴式显示装置及其控制方法
CN106651873B (zh) 一种基于rgb-d相机和立体声的视障人士斑马线检测眼镜
JP6862750B2 (ja) 距離測定装置、距離測定方法及びプログラム
JP5761730B2 (ja) 身体技能習得支援装置
JP2004212129A (ja) 環境状況把握装置
AU2016275789A1 (en) Portable system that allows blind or visually impaired persons to interpret the surrounding environment by sound or touch
CN110208946A (zh) 一种穿戴设备及基于穿戴设备的交互方法
JP2006146778A (ja) ヘッドマウントディスプレイ装置
JP5275496B1 (ja) 画像聴覚化装置
CN107049717B (zh) 一种基于rgb-d相机和立体声的视障人士斑马线检测系统及方法
Cavaco et al. From pixels to pitches: Unveiling the world of color for the blind
CN102688120A (zh) 彩色声像导盲方法及彩色声像导盲仪
JP4891375B2 (ja) 画像聴覚化装置
JP2004020869A (ja) 画像情報伝達方法,音信号作成方法,音信号作成装置,音発生装置及び画像/音変換方法
JP2007089658A (ja) 視力回復訓練装置
KR101455830B1 (ko) 안경 및 그 제어방법
JP5098996B2 (ja) ヘッドマウントディスプレイ

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130515

R150 Certificate of patent or registration of utility model

Ref document number: 5275496

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees