JP2011067479A - Image auralization apparatus - Google Patents

Image auralization apparatus Download PDF

Info

Publication number
JP2011067479A
JP2011067479A JP2009221956A JP2009221956A JP2011067479A JP 2011067479 A JP2011067479 A JP 2011067479A JP 2009221956 A JP2009221956 A JP 2009221956A JP 2009221956 A JP2009221956 A JP 2009221956A JP 2011067479 A JP2011067479 A JP 2011067479A
Authority
JP
Japan
Prior art keywords
sound
image
axis direction
auralization
dots
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009221956A
Other languages
Japanese (ja)
Other versions
JP4891375B2 (en
Inventor
Masahiro Kuroda
昌弘 黒田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2009221956A priority Critical patent/JP4891375B2/en
Publication of JP2011067479A publication Critical patent/JP2011067479A/en
Application granted granted Critical
Publication of JP4891375B2 publication Critical patent/JP4891375B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Studio Devices (AREA)
  • Stereophonic System (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an image auralization apparatus more accurately recognizing a peripheral article aurally without touching an article. <P>SOLUTION: This image auralization apparatus 1 includes: imaging means 2; sound generating means 3 including sound generators 31, 32; an image processing means 41 for acquiring a processed image SP formed of a plurality of dots DT formed by a plurality of scanning lines extending in the X-axis direction and Y-axis direction from a pickup image of the imaging means 2; and generating sound deciding means 42 for deciding sound generated from the sound generating means 3 corresponding to the dots DT. The generating sound deciding means 42 indicates a position of the dot DT along the X-axis direction in the processed image SP by a difference in arrival time of sound between right and left ears, and indicates a position of the dot DT along the Y-axis direction in the processed image SP by a frequency increasing or decreasing from the plus side to the minus side in the Y-axis direction and assigned to each line of the dots DT along the Y-axis direction. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、撮像手段によって得られた画像を聴覚的に表現する画像聴覚化装置に関する。   The present invention relates to an image auralization apparatus that aurally represents an image obtained by an imaging unit.

従来、視覚障害者は、杖を周囲の物体に接触させることや、信号機の誘導音などから周囲の状況を確認している。   Conventionally, visually handicapped persons have confirmed the surrounding situation by bringing a cane into contact with a surrounding object or by a guidance sound of a traffic light.

しかしながら、杖を用いる場合、視覚障害者は杖で周囲の物体に触れることが必要であり、杖の先を継続的に広範囲に動かさなければならない。従って、杖が段差や障害物等に接触せずに、それら段差等を認識し損ねてしまうおそれがある。また、誘導音などを利用するにあたっては、それを発するための設備が設けられていることが必要である。   However, when using a cane, a visually impaired person needs to touch a surrounding object with the cane, and the tip of the cane must be continuously moved over a wide range. Therefore, there is a possibility that the cane may fail to recognize the steps without contacting the steps or obstacles. Moreover, when using a guide sound etc., it is necessary to be provided with the equipment for emitting it.

そこで、特段の設備が設けられていない環境下においても、視覚によることなく周囲に位置する物体などを認識可能とすべく、物体をCCDカメラ等の撮像手段で読み取った上で、読み取られた画像データの輪郭を音に変換し、その音により利用者に聴覚をもって当該画像データを認識させる技術が提案されている(例えば、特許文献1等参照)。当該技術について詳述すると、輪郭情報のX軸は、左右の耳への音の強度差(音量差)により表現され、輪郭情報のY軸は、音の周波数により表現されるようになっている。   Therefore, even in an environment where no special equipment is provided, in order to be able to recognize an object located in the surroundings without visual recognition, the object is read by an imaging means such as a CCD camera and then the read image A technique has been proposed in which the outline of data is converted into sound, and the image data is recognized by the user with the sound (see, for example, Patent Document 1). In detail, the X axis of the contour information is expressed by the difference in sound intensity (volume difference) between the left and right ears, and the Y axis of the contour information is expressed by the frequency of the sound. .

特開2003−84784号公報JP 2003-84784 A

ところが、音の周波数が比較的大きい(例えば、6000Hzを超える)場合には、X軸方向の位置を識別させるために、左右の音の強度差を比較的大きく(例えば、20db以上と)する必要がある。従って、上記従来技術を用いた場合には、利用者はX軸方向に沿った位置を正確に把握することが難しく、画像データひいては周囲の状況を誤って認識してしまうおそれがある。   However, when the sound frequency is relatively high (for example, exceeding 6000 Hz), the difference in intensity between the left and right sounds needs to be relatively large (for example, 20 db or more) in order to identify the position in the X-axis direction. There is. Therefore, when using the above-described conventional technology, it is difficult for the user to accurately grasp the position along the X-axis direction, and there is a possibility that the image data and the surrounding situation may be erroneously recognized.

本発明は、上記事情を鑑みてなされたものであり、その目的は、視覚障害者等の利用者が、物体に接触することなく、聴覚を持って周囲の物体などをより正確に認識可能な画像聴覚化装置を提供することにある。   The present invention has been made in view of the above circumstances, and its purpose is to allow a user such as a visually impaired person to recognize surrounding objects and the like more accurately with hearing without touching the object. An object is to provide an image hearing device.

以下、上記目的を解決するのに適した各手段につき、項分けして説明する。なお、必要に応じて対応する手段に特有の作用効果を付記する。   In the following, each means suitable for solving the above-described object will be described in terms of items. In addition, the effect specific to the means to respond | corresponds as needed is added.

手段1.撮像手段と、
利用者の左右の耳に装着され、各耳に対応した発音機を備える発音手段と、
前記撮像手段により得られた撮像画像に基づいて、X軸方向及びY軸方向に沿って延びる複数の走査線により形成された複数のドットからなる処理画像を得る画像処理手段と、
前記処理画像を構成する各ドットに対応して、前記発音手段から発する音を決定する発生音決定手段とを備える画像聴覚化装置であって、
前記発生音決定手段は、
左右の耳への音の到達時間に差を設けることで、前記処理画像中におけるX軸方向に沿った前記ドットの位置を表すとともに、
Y軸方向のプラス側からマイナス側へと向かって増加又は減少し、Y軸方向に沿った前記ドットの各行ごとに割り当てられる周波数により、前記処理画像中におけるY軸方向に沿った前記ドットの位置を表すことを特徴とする画像聴覚化装置。
Means 1. Imaging means;
A sounding means attached to the left and right ears of the user and provided with a sound generator corresponding to each ear;
Image processing means for obtaining a processed image composed of a plurality of dots formed by a plurality of scanning lines extending along the X-axis direction and the Y-axis direction based on the captured image obtained by the imaging means;
An image auralization device comprising sound generation determination means for determining a sound emitted from the sound generation means corresponding to each dot constituting the processed image,
The generated sound determination means includes
By providing a difference in the arrival time of sound to the left and right ears, the position of the dot along the X-axis direction in the processed image is represented,
The position of the dot along the Y-axis direction in the processed image by a frequency that increases or decreases from the plus side to the minus side in the Y-axis direction and is assigned to each row of the dots along the Y-axis direction An image auralization device characterized by representing.

上記手段1によれば、画像処理手段により、例えば周囲の物体の形状や位置などを示す撮像画像に基づいて、複数のドットからなる処理画像が生成される。そして、処理画像を構成する複数のドットの位置について、左右の耳に対する音の到達時間差を用いることでX軸方向(左右方向)の位置が表され、音の周波数の大小を用いることでY軸方向(上下方向)の位置が表される。従って、処理画像をより容易に、かつ、より正確に聴覚をもって認識することができ、周囲の物体の位置や形状などをより正確に認識することができる。   According to the above means 1, a processed image composed of a plurality of dots is generated by the image processing means based on, for example, a captured image indicating the shape or position of a surrounding object. Then, with respect to the positions of a plurality of dots constituting the processed image, the position in the X-axis direction (left-right direction) is represented by using the difference in sound arrival time with respect to the left and right ears, and the Y-axis is represented by using the magnitude of the sound frequency. The position in the direction (vertical direction) is represented. Therefore, the processed image can be recognized more easily and more accurately with hearing, and the positions and shapes of surrounding objects can be recognized more accurately.

特に上記手段1によれば、処理画像中におけるX軸方向に沿ったドットの位置は、左右の耳への音の到達時間差を用いることにより表されている。このため、X軸方向に沿った位置を音の強度差を用いて表現する上記従来技術と比較して、周囲の物体の位置や形状などを非常に正確に認識することができる。   In particular, according to the means 1, the position of the dot along the X-axis direction in the processed image is represented by using the difference in sound arrival time between the left and right ears. For this reason, it is possible to recognize the position and shape of surrounding objects very accurately as compared with the above-described conventional technique in which the position along the X-axis direction is expressed using the difference in sound intensity.

手段2.音の強度の大小を用いて、前記処理画像中における前記ドットの濃淡を表すことを特徴とする手段1に記載の画像聴覚化装置。   Mean 2. The image auralization apparatus according to claim 1, wherein the intensity of sound is used to represent the density of the dots in the processed image.

上記手段2によれば、音の強度(音圧)を調節することで、処理画像中における各ドットの濃淡が表される。そのため、物体の位置などに加えて、物体の凹凸等、物体のより正確な形状を認識することができる。   According to the means 2, the intensity of each sound (sound pressure) is adjusted to express the shade of each dot in the processed image. Therefore, in addition to the position of the object, a more accurate shape of the object such as the unevenness of the object can be recognized.

手段3.前記左右各耳に対応する発音機は、利用者の各耳に装着された際に、利用者の外耳道の上方に配置される第1スピーカと、利用者の外耳道の下方に配置される第2スピーカとをそれぞれ備え、
周波数の高低に対応して、両スピーカのうちの一方から発せられる音の強度を増大させる一方で、両スピーカのうちの他方から発せられる音の強度を低減させることを特徴とする手段1又は2に記載の画像聴覚化装置。
Means 3. When the sound generators corresponding to the left and right ears are attached to the user's ears, the sound generator is disposed above the user's ear canal and the second speaker is disposed below the user's ear canal. Each with a speaker,
Corresponding to the level of the frequency, the means 1 or 2 is characterized in that the intensity of the sound emitted from one of the two speakers is increased while the intensity of the sound emitted from the other of the two speakers is reduced. The image auralization apparatus described in 1.

上記手段3によれば、各発音機は、外耳道の上側から音を発する第1スピーカと、外耳道の下側から音を発する第2スピーカとをそれぞれ備えており、例えば、処理画像中の上側にあるドットを表すときには、前記第1スピーカから発する音の強度を増大させる一方で、第2スピーカから発する音の強度を低減させるようになっている。また、処理画像中の下側にあるドットを表すときには、例えば、第1スピーカから発する音の強度が低減される一方で、第2スピーカから発する音の強度を増大させるようになっている。すなわち、本手段3においては、上方側に位置するドットを表現する際には、あたかも上方から音が発せられているかのように両スピーカから発せられる音に強度差が設けられ、一方で、下方側に位置するドットを表現する際には、あたかも利用者の下方から音が発せられているかのように両スピーカから発せられる音に強度差が設けられる。従って、処理画像中におけるドットのY軸方向(上下方向)に沿った位置をより正確に認識することができ、ひいては物体の位置などをより一層正確に認識することができる。   According to the means 3, each sound generator includes the first speaker that emits sound from the upper side of the ear canal and the second speaker that emits sound from the lower side of the ear canal, for example, on the upper side in the processed image. When representing a certain dot, the intensity of the sound emitted from the first speaker is increased, while the intensity of the sound emitted from the second speaker is reduced. Further, when representing the lower dot in the processed image, for example, the intensity of the sound emitted from the first speaker is reduced, while the intensity of the sound emitted from the second speaker is increased. That is, in this means 3, when expressing the dot located on the upper side, a difference in intensity is provided in the sound emitted from both speakers as if the sound is emitted from above, When expressing the dots located on the side, a difference in intensity is provided between the sounds emitted from both speakers as if the sound was emitted from below the user. Therefore, it is possible to more accurately recognize the position of the dot in the processed image along the Y-axis direction (up and down direction), and thus more accurately recognize the position of the object.

手段4.発音手段が発する音を純音とするとともに、
Y軸方向に沿った前記ドットの行ごとに割り当てられる周波数を、それぞれ異なる素数としたことを特徴とする手段1乃至3のいずれかに記載の画像聴覚化装置。
Means 4. While the sound produced by the pronunciation means is pure,
The image auralization apparatus according to any one of means 1 to 3, wherein the frequency assigned to each row of dots along the Y-axis direction is a different prime number.

尚、「純音」とあるのは、正弦波で表すことができる音を意味する。   Note that “pure sound” means a sound that can be expressed as a sine wave.

上記手段4によれば、発音手段により発せられる音が純音とされ、さらに、Y軸方向に沿ったドットの各行ごとに割り当てられる周波数が、それぞれ異なる素数とされている。従って、それぞれの音が他の音と共振してしまうことがなくなり、発音手段から発せられる音をより一層確実に認識することができる。その結果、周囲の物体の位置等をより一層正確に認識することができる。   According to the means 4, the sound emitted by the sound generation means is a pure tone, and the frequency assigned to each row of dots along the Y-axis direction is a different prime number. Therefore, each sound does not resonate with other sounds, and the sound emitted from the sound generation means can be recognized more reliably. As a result, the positions of surrounding objects can be recognized more accurately.

手段5.各周波数ごとに順次音を発することを特徴とする手段1乃至4のいずれかに記載の画像聴覚化装置。   Means 5. The image auralization apparatus according to any one of means 1 to 4, wherein a sound is sequentially emitted for each frequency.

上記手段5によれば、各周波数の音がそれぞれ個別に発せられるため、音をより一層容易に認識することができる。その結果、周囲物体の位置などを一層正確に、かつ、一層容易に認識することができる。   According to the means 5, since the sound of each frequency is emitted individually, the sound can be recognized more easily. As a result, the positions of surrounding objects can be recognized more accurately and more easily.

手段6.前記発生音決定手段により決定された各ドットに対応する音が、前記発音手段から同時に発せられることを特徴とする手段1乃至4のいずれかに記載の画像聴覚化装置。   Means 6. The image auralization apparatus according to any one of means 1 to 4, wherein sounds corresponding to the respective dots determined by the generated sound determination means are emitted simultaneously from the sound generation means.

尚、「同時」とあるのは、各ドットに対応する音が発音手段から厳密に同時に発せられるということではない。すなわち、処理画像中におけるドットのX軸方向に沿った位置を表す際に、一対の発音機から発する音に小さな時間差が設けられることとなるが、このような小さな時間差は許容するということである。   Note that “simultaneously” does not mean that sounds corresponding to the dots are emitted from the sound generation means strictly at the same time. That is, when expressing the position of the dot in the processed image along the X-axis direction, a small time difference is provided in the sound emitted from the pair of sound generators, but such a small time difference is allowed. .

手段6によれば、各ドットに対応する音が発音手段より同時に発せられるため、処理画像を認識するのに要する時間を短縮することができる。これにより、単位時間当たりにより多くの処理画像を認識することが可能となるため、例えば、物体が移動しているといったことや、その物体の速さなどをより正確に、かつ、より確実に知ることができる。   According to the means 6, since the sound corresponding to each dot is emitted simultaneously from the sound producing means, the time required to recognize the processed image can be shortened. As a result, it becomes possible to recognize more processed images per unit time. For example, the object is moving and the speed of the object is more accurately and reliably known. be able to.

手段7.前記走査線は、X軸方向及びY軸方向に沿ってそれぞれ20本以上存在することを特徴とする手段1乃至6のいずれかに記載の画像聴覚化装置。   Mean 7 The image auralization apparatus according to any one of means 1 to 6, wherein there are 20 or more scanning lines each along the X-axis direction and the Y-axis direction.

上記手段7によれば、X軸方向及びY軸方向に沿ってそれぞれ20以上のドットを備えて(すなわち、20行×20列以上に区画されたドットにより)処理画像が構成されている。従って、物体の形状などをより一層正確に把握することができる。   According to the means 7, the processed image is configured with 20 or more dots along the X-axis direction and the Y-axis direction (that is, the dots divided into 20 rows × 20 columns or more). Therefore, the shape of the object can be grasped more accurately.

手段8.前記発音手段から発する音の周波数を60Hz以上1000Hz以下としたことを特徴とする手段1乃至7のいずれかに記載の画像聴覚化装置。   Means 8. The image auralization apparatus according to any one of means 1 to 7, wherein a frequency of a sound emitted from the sound generation means is set to 60 Hz or more and 1000 Hz or less.

一般に人の可聴域は、20Hz〜20000Hz程度であることが知られている。ところが、この可聴域の範囲内であっても、周波数が低すぎたり、高すぎたりすると、左右の耳への音の到達時間に差を設けた場合であっても、音にある程度(例えば、20db程度)の強度差を設けなくては音の到達時間に差があるものと認識できないおそれがある。   It is generally known that the human audible range is about 20 Hz to 20000 Hz. However, even within this audible range, if the frequency is too low or too high, even if there is a difference in the arrival time of the sound to the left and right ears, If there is no difference in intensity (approximately 20 db), it may not be recognized that there is a difference in sound arrival time.

この点、上記手段8によれば、発音手段より発せられる音の周波数が60Hz以上1000Hz以下とされているため、音に強度差を設けなくとも、左右の耳に対する音の到達時間に差があるものとより確実に認識することができる。その結果、Y軸方向の全域に亘ってX軸方向に沿ったドット位置のより確実な認識を図ることができる。   In this regard, according to the above means 8, since the frequency of the sound emitted from the sound generation means is 60 Hz or more and 1000 Hz or less, there is a difference in the arrival time of the sound with respect to the left and right ears even if there is no difference in intensity between the sounds. It can be recognized more reliably. As a result, it is possible to more reliably recognize the dot positions along the X-axis direction over the entire Y-axis direction.

手段9.前記撮像手段は、利用者の視界方向と同一の方向に向くよう、利用者に対し、直接又は間接的に取付可能に構成されるとともに、
前記発生音決定手段は、左右の耳への音の到達時間差を、前記撮像手段の左右方向における撮像画像の取込角度に対応して設定することを特徴とする手段1乃至8のいずれかに記載の画像聴覚化装置。
Means 9. The imaging means is configured to be directly or indirectly attachable to the user so as to face the same direction as the user's field of view,
The generated sound determination means sets a difference in arrival time of sounds to the left and right ears in accordance with a captured image capture angle in the left-right direction of the imaging means. The image auralization apparatus described.

例えば、前方右45度から音が発せられたときには、右耳に対して音が達してから約0.4msだけ遅れて左耳に音が達し、また、前方右60度から音が発せられたときには、右耳に対して音が達してから約0.47msだけ遅れて左耳に音が達することが知られている。また、左右の耳への音の到達時間差は、人の正面に対する音源のずれ角度に対してほぼ比例する。   For example, when a sound was emitted from the right front 45 degrees, the sound reached the left ear after about 0.4 ms after the sound reached the right ear, and a sound was emitted from the front right 60 degrees. It is known that sometimes the sound reaches the left ear about 0.47 ms after the sound reaches the right ear. Also, the difference in sound arrival time between the left and right ears is approximately proportional to the angle of deviation of the sound source relative to the front of the person.

この点を利用して、上記手段9によれば、撮像手段の向く方向が利用者の視界方向と同一とされ、さらに、X軸方向に沿ったドットの位置を表現する左右の耳への音の到達時間差が、撮像手段による撮像画像の取込角度に対応して設定されている。例えば、撮像手段による取込角度を左右60度ずつとし、処理画像中におけるX軸方向に沿ったドット数を2M(或いは2M+1)個(つまり、左右にM個ずつ)とした場合には、処理画像のX軸方向中央からSドットずれるごとに、左右の耳に対して0.47ms×(S/M)の到達時間差が設けられるように構成されている。従って、左右方向において、利用者に対する物体の相対位置と、音によって利用者が認識する物体の位置とが一致することとなる。このため、自己と物体との相対的な位置関係を極めて正確に把握することができ、周囲の状況を極めて正確に認識することができる。   Using this point, according to the means 9, the direction to the imaging means is the same as the viewing direction of the user, and the sound to the left and right ears expressing the position of the dot along the X-axis direction. Is set corresponding to the angle at which the captured image is captured by the imaging means. For example, if the capturing angle by the imaging means is 60 degrees left and right, and the number of dots along the X-axis direction in the processed image is 2M (or 2M + 1) (that is, M left and right), Every time S dots are shifted from the center in the X-axis direction of the image, an arrival time difference of 0.47 ms × (S / M) is provided for the left and right ears. Therefore, in the left-right direction, the relative position of the object with respect to the user coincides with the position of the object recognized by the user by sound. For this reason, the relative positional relationship between the self and the object can be grasped very accurately, and the surrounding situation can be recognized very accurately.

画像聴覚化装置の構成を示すブロック図である。It is a block diagram which shows the structure of an image auralization apparatus. 発音手段の構成を示す模式図である。It is a schematic diagram which shows the structure of a sounding means. 画像処理手段により生成される処理画像などを示す図である。It is a figure which shows the processed image etc. which are produced | generated by the image processing means.

以下に、一実施形態について図面を参照して説明する。   Hereinafter, an embodiment will be described with reference to the drawings.

図1に示すように、画像聴覚化装置1は、CCDイメージセンサ等の撮像手段2と、利用者の両耳に装着可能な発音手段3と、前記撮像手段2及び発音手段3に対して所定の信号を送受信可能に構成された処理手段4とを備えている。   As shown in FIG. 1, the image auralization apparatus 1 includes an imaging unit 2 such as a CCD image sensor, a sounding unit 3 that can be worn on both ears of a user, and a predetermined number of units for the imaging unit 2 and the sounding unit 3. And processing means 4 configured to be able to transmit and receive the above signal.

前記撮像手段2は、利用者の視界方向とほぼ同一の方向に向けられるように、例えば、利用者の眼鏡や帽子等に対して取付可能に構成されている(勿論、利用者に対して直接取付けることとしてもよい)。また、撮像手段2により得られた撮像データは、前記処理手段4に対して伝送されるようになっている。加えて、撮像手段2のX軸方向(左右方向)における画像取込角度が90度に設定されている。すなわち、撮像手段2は、利用者の正面から左右45度ずつの範囲を撮像するように設定されている。   The image pickup means 2 is configured to be attachable to, for example, a user's glasses or a hat so as to be directed in the substantially same direction as the user's field of view (of course, directly to the user). May be installed). Further, the imaging data obtained by the imaging means 2 is transmitted to the processing means 4. In addition, the image capture angle in the X-axis direction (left-right direction) of the imaging unit 2 is set to 90 degrees. In other words, the imaging means 2 is set so as to capture a range of 45 degrees left and right from the front of the user.

前記発音手段3は、前記処理手段4から出力される音声信号を音波に変換するものであり、図2に示すように、利用者の両耳に装着される一対の発音機31,32を備えている。そして、発音機31は利用者の左耳に装着される一方で、発音機32は利用者の右耳に装着されるようになっている。加えて、一対の発音機31,32は、それぞれ第1スピーカ31U,32U及び第2スピーカ31L,32Lを備えている。前記第1スピーカ31U,32Uは、発音手段3が利用者に装着された際に、利用者の外耳道の上方に位置するように配設されている。一方で、前記第2スピーカ31L,32Lは、発音手段3が利用者に装着された際に、利用者の外耳道の下方に位置するように配設されている。   The sounding means 3 converts the sound signal output from the processing means 4 into sound waves, and includes a pair of sounding devices 31 and 32 attached to both ears of the user as shown in FIG. ing. The sound generator 31 is attached to the left ear of the user, while the sound generator 32 is attached to the right ear of the user. In addition, the pair of sound generators 31 and 32 includes first speakers 31U and 32U and second speakers 31L and 32L, respectively. The first speakers 31U and 32U are disposed so as to be positioned above the user's external auditory canal when the sound generation means 3 is attached to the user. On the other hand, the second speakers 31L and 32L are disposed so as to be positioned below the user's external auditory canal when the sound generation means 3 is worn by the user.

図1に戻り、前記処理手段4は、所定のマイコン等により構成されており、画像処理手段41と、発生音決定手段42とを備えている。   Returning to FIG. 1, the processing means 4 is constituted by a predetermined microcomputer or the like, and includes an image processing means 41 and a generated sound determination means 42.

前記画像処理手段41は、撮像手段2から伝送される撮像データに基づいて、X軸方向及びY軸方向に沿って延びる複数の走査線により形成された複数のドットからなる処理画像を生成するものである。詳述すると、まず、ピクセルを間引くなどの従来公知の手法を用いて撮像データの解像度を減少させることで、X軸方向に沿ってm個のドットを有し、Y軸方向に沿ってn個のドットを有する(つまりm列×n行の)中間画像を生成する。次いで、前記中間画像に濃淡処理を施すことで、図3に示すように、X(例えば、3)階調モノクロで、複数のドットDTを有する処理画像SPを生成する。尚、本実施形態おいて、処理画像SPは、X軸方向に沿って41本、Y軸方向に沿って39本の走査線によって区画され、X軸方向に沿って41個、Y軸方向に沿って39個のドットを有するものとされている。そのため、上述の通り、撮像手段2のX軸方向(左右方向)における画像取込角度が90度であることから、X軸方向に沿った各ドットDTはそれぞれ2.25度ずつの視野に相当している。   The image processing unit 41 generates a processed image composed of a plurality of dots formed by a plurality of scanning lines extending along the X-axis direction and the Y-axis direction based on the imaging data transmitted from the imaging unit 2. It is. More specifically, first, by using a conventionally known method such as thinning out pixels, the resolution of the imaging data is reduced, so that m dots are provided along the X-axis direction, and n dots are provided along the Y-axis direction. An intermediate image having a number of dots (that is, m columns × n rows) is generated. Next, by performing density processing on the intermediate image, as shown in FIG. 3, a processed image SP having a plurality of dots DT in X (for example, 3) gradation monochrome is generated. In the present embodiment, the processed image SP is partitioned by 41 scanning lines along the X-axis direction and 39 scanning lines along the Y-axis direction, and 41 processed along the X-axis direction and along the Y-axis direction. It is assumed that it has 39 dots along. Therefore, as described above, since the image capture angle in the X-axis direction (left-right direction) of the imaging unit 2 is 90 degrees, each dot DT along the X-axis direction corresponds to a field of view of 2.25 degrees. is doing.

前記発生音決定手段42は、処理画像SPにおける各ドットDTの位置に対応して発音手段3から発する音を決定するものである。本実施形態では、発生音決定手段42は、左右の耳に対する音の到達時間の差を利用して処理画像SP中における着色ドット(白色ドットWD以外のドットをいう)BDのX軸(左右)方向に沿った位置を表し、一方で、周波数の高低を利用してY軸(上下)方向に沿った処理画像SP中の着色ドットBDの位置を表すようになっている。   The generated sound determination means 42 determines the sound emitted from the sound generation means 3 corresponding to the position of each dot DT in the processed image SP. In the present embodiment, the generated sound determination means 42 uses the difference in the arrival time of the sound with respect to the left and right ears, and the X axis (left and right) of the colored dots (referred to as dots other than the white dots WD) BD in the processed image SP. The position along the direction is represented, and on the other hand, the position of the colored dot BD in the processed image SP along the Y-axis (vertical) direction is represented using the frequency level.

ここで、処理画像SP中における着色ドットBDのX軸方向に沿った位置は、次のように表現される。すなわち、X軸方向に沿って処理画像SPの中央に位置するドットの列を基準列BL(図3中、中央の点線で挟まれる列)として、当該基準列BLよりもX軸方向のプラス側(すなわち利用者の右側)に位置する着色ドットBDについては、基準列BLからその着色ドットBDまでの距離に対応した分だけ、利用者の左耳に装着される発音機31よりも利用者の右耳に装着される発音機32から早く音が発せられるようになっている。一方で、基準列BLよりもX軸方向のマイナス側(すなわち利用者の左側)に位置する着色ドットBDについては、基準列BLからその着色ドットBDまでの距離に対応した分だけ発音機32よりも発音機31から早く音が発せられるようになっている。   Here, the position along the X-axis direction of the colored dots BD in the processed image SP is expressed as follows. In other words, a dot row located in the center of the processed image SP along the X-axis direction is defined as a reference row BL (a row sandwiched between dotted lines in the center in FIG. 3), and the plus side in the X-axis direction from the reference row BL. For the colored dot BD located on the right side of the user (that is, on the right side of the user), the user's voice is more than the sound generator 31 attached to the user's left ear by an amount corresponding to the distance from the reference row BL to the colored dot BD. A sound is emitted quickly from the sound generator 32 attached to the right ear. On the other hand, with respect to the colored dots BD located on the minus side in the X-axis direction (that is, the user's left side) with respect to the reference row BL, the sound generator 32 provides an amount corresponding to the distance from the reference row BL to the colored dot BD. Also, the sound generator 31 can emit a sound early.

また、本実施形態では、X軸方向に沿ったドットDTの位置を表現する左右の耳への音の到達時間差が、撮像手段2による撮像画像の取込角度に対応して設定されている。   Further, in the present embodiment, the difference in sound arrival time to the left and right ears representing the position of the dot DT along the X-axis direction is set corresponding to the captured angle of the captured image by the imaging unit 2.

詳述すると、前方右45度から音が発せられたときには、右耳に対して音が達してから約0.4msだけ遅れて左耳に音が達し、また、前方左45度から音が発せられたときには、左耳に対して音が達してから約0.4msだけ遅れて右耳に音が達することが知られている。そこで、本実施形態では、上述の通り、撮像手段2の画像取込角度は左右45度ずつに設定されているため、例えば、処理画像SPの最も右側に位置する着色ドットBD(つまり、利用者の前方右45度に位置するもの)を表す際には、発音機32から音を発してから約0.4msだけ遅れて発音機31から音が発せられるように設定されている。また、処理画像SPは左右にそれぞれ20個ずつドットを有して構成されているため、基準列BLから右に1列進むごとに発音機32が音を発してから0.02ms(=0.4ms/20)だけ遅れて発音機31から音が発せられ、一方で、基準列BLから左へ1列進むごとに発音機31が音を発してから0.02msだけ遅れて発音機32から音が発せられるようになっている。例えば、基準列BLから右に10列目の着色ドットBDを表す際には、発音機32が音を発してから0.2ms(=0.02ms×10)だけ遅れて発音機31から音が発せられるようになっている。   More specifically, when a sound is emitted from the front right 45 degrees, the sound reaches the left ear about 0.4 ms after the sound reaches the right ear, and the sound is emitted from the front left 45 degrees. It is known that the sound reaches the right ear about 0.4 ms after the sound reaches the left ear. Therefore, in the present embodiment, as described above, the image capturing angle of the imaging unit 2 is set to 45 degrees to the left and right, and for example, the colored dot BD (that is, the user located on the rightmost side of the processed image SP) 2) is set so that the sound is emitted from the sound generator 31 with a delay of about 0.4 ms after the sound is emitted from the sound generator 32. Further, since the processed image SP has 20 dots on each of the left and right sides, 0.02 ms (= 0.0 ms) after the sound generator 32 emits sound every time one row moves from the reference row BL to the right. The sound is emitted from the sound generator 31 with a delay of 4 ms / 20). On the other hand, the sound from the sound generator 32 is delayed by 0.02 ms after the sound of the sound generator 31 is advanced by one line from the reference row BL to the left. Can be emitted. For example, when the tenth colored dot BD is displayed to the right of the reference row BL, the sound from the sound generator 31 is delayed by 0.2 ms (= 0.02 ms × 10) after the sound generator 32 emits sound. It is supposed to be emitted.

加えて、処理画像SP中における着色ドットBDのY軸方向に沿った位置は次のように表現される。すなわち、Y軸方向に沿った各ドットDTの行ごとに発する音の周波数が予め割り当てられており、本実施形態では、Y軸方向のプラス側(すなわち上側)からY軸方向のマイナス側(すなわち下側)へと徐々に減少する周波数が割り当てられている。そして、着色ドットBDのY軸方向に沿った位置を表現するにあたっては、着色ドットBDの存在する行に対応する周波数の音が発音手段3から発せられるようになっている。尚、各ドットDTの行に割り当てられる周波数は、図3に示すように、それぞれ異なる素数とされている。また、用いられる周波数は、人の可聴域内(20Hz〜20000Hz)の中でも、特に聴きやすい60Hz〜1000Hz(約4オクターブ)とされている。加えて、前記発音手段3より発せられる音は、純音とされている。   In addition, the position along the Y-axis direction of the colored dots BD in the processed image SP is expressed as follows. That is, the frequency of the sound emitted for each row of dots DT along the Y-axis direction is assigned in advance, and in this embodiment, from the plus side (ie, the upper side) in the Y-axis direction to the minus side (ie, the Y-axis direction). A gradually decreasing frequency is assigned to the lower side. In expressing the position of the colored dot BD along the Y-axis direction, a sound having a frequency corresponding to the row where the colored dot BD is present is emitted from the sound generation means 3. Note that the frequencies assigned to the rows of the dots DT are different prime numbers as shown in FIG. Moreover, the frequency used is set to 60 Hz to 1000 Hz (about 4 octaves) that is particularly easy to hear in the human audible range (20 Hz to 20000 Hz). In addition, the sound emitted from the sound generation means 3 is a pure tone.

さらに、本実施形態では、発する音の強度差(音圧差)によって着色ドットBDの濃淡が表現されるようになっている。すなわち、着色ドットBDのうち、比較的濃い着色ドットBD1が比較的大きな音(例えば、50db)で表現される一方で、比較的薄い着色ドットBD2が比較的小さな音(例えば、30db)で表現される(尚、音量は例示であって、これに限定されるものではない)。   Furthermore, in this embodiment, the density of the colored dots BD is expressed by the intensity difference (sound pressure difference) of the emitted sound. That is, among the colored dots BD, a relatively dark colored dot BD1 is expressed by a relatively loud sound (for example, 50 db), while a relatively thin colored dot BD2 is expressed by a relatively small sound (for example, 30 db). (Note that the sound volume is an example, and is not limited to this.)

また、処理手段4は、発生音決定手段42により各着色ドットBDに対応して決定されたそれぞれの音を信号化して、当該信号を前記発音手段3に送信する。そして、発音手段3によって各着色ドットBDに対応して決定された音が同時に発せられるようになっている。尚、本実施形態では、白色ドットWDに対応した音は発せられないように構成されている。   The processing unit 4 converts each sound determined by the generated sound determination unit 42 corresponding to each colored dot BD into a signal and transmits the signal to the sound generation unit 3. The sound determined by the sounding means 3 corresponding to each colored dot BD is emitted simultaneously. In the present embodiment, the sound corresponding to the white dot WD is not emitted.

次いで、図3に示す処理画像SPがどのように表現されるかについて、周波数191Hzの行を例として示す。   Next, how the processed image SP shown in FIG. 3 is expressed will be described by taking a line with a frequency of 191 Hz as an example.

まず、周波数191Hzの行に存在する着色ドットBDのうち、基準列BL(利用者の正面)より左側に位置し、色が比較的濃い複数の着色ドットAについては、発音機31から強度の比較的大きな音が発せられてから0.26ms、0.24ms、0.22ms、0.20ms、0.18ms、0.16ms、及び、0.14msだけ遅れて発音機32から強度の比較的大きな音が発せられることで表現される。   First, among the colored dots BD present in the row having a frequency of 191 Hz, the intensity comparison is performed from the sound generator 31 for a plurality of colored dots A that are located on the left side of the reference column BL (the front of the user) and have relatively dark colors. Sound with relatively high intensity from the sound generator 32 after 0.26 ms, 0.24 ms, 0.22 ms, 0.20 ms, 0.18 ms, 0.16 ms, and 0.14 ms It is expressed by being emitted.

さらに、基準列BLの左側に位置し、色の比較的薄い着色ドットBについては、発音機31より強度の比較的小さな音が発せられてから、0.12ms、0.10ms、及び、0.08msだけ遅れて発音機32より強度の比較的小さな音が発せられることで表現される。また、基準列BL側に位置する色の比較的濃い着色ドットCは、発音機31から強度の比較的高い音が発せられてから0.04ms及び0.02msだけ遅れて発音機32より強度の比較的大きな音が発せられることにより表現される。   Further, for the relatively light colored dots B located on the left side of the reference row BL, after a sound having a relatively lower intensity than the sound generator 31 is emitted, 0.12 ms, 0.10 ms, and 0. This is expressed by a sound having a relatively low intensity from the sound generator 32 being delayed by 08 ms. Further, the relatively dark colored dot C located on the reference row BL side has a strength higher than that of the sound generator 32 by 0.04 ms and 0.02 ms after the sound having a relatively high intensity is emitted from the sound generator 31. It is expressed by a relatively loud sound.

加えて、基準列BL上(つまり、利用者の正面)に位置し、色の比較的濃い着色ドットDについては、発音機31及び発音機32から同時に強度の比較的大きな音が発せられることで表現される。   In addition, with respect to the colored dots D that are located on the reference row BL (that is, in front of the user) and have a relatively dark color, the sound generator 31 and the sound generator 32 simultaneously emit relatively strong sounds. Expressed.

併せて、基準列BLの右側に位置し、色の比較的濃い着色ドットEは、発音機32から強度の比較的大きな音が発せられてから0.02ms及び0.04msだけ遅れて発音機31より強度の比較的大きな音が発せられることにより表現される。   In addition, the colored dot E, which is located on the right side of the reference row BL and has a relatively dark color, is delayed by 0.02 ms and 0.04 ms after the sound having a relatively high intensity is emitted from the sound generator 32. It is expressed by emitting a relatively loud sound.

また、基準列BLの右側に位置し、色の比較的薄い着色ドットFについては、発音機32から強度の比較的小さな音が発せられてから0.06ms及び0.08msだけ遅れて発音機31より強度の比較的小さな音が発せられることで表現される。尚、上述の通り、白色ドットWDに対応する音は発せられない。   For the colored dot F, which is located on the right side of the reference row BL and has a relatively light color, the sound generator 31 is delayed by 0.06 ms and 0.08 ms after the sound having a relatively low intensity is emitted from the sound generator 32. It is expressed by the sound of a relatively small intensity. As described above, the sound corresponding to the white dot WD is not emitted.

以上詳述したように、本実施形態によれば、処理画像SPを構成する複数の着色ドットBDの位置について、左右の耳に対する音の到達時間差を用いることでX軸方向(左右方向)の位置が表され、周波数の大小を用いることでY軸方向(上下方向)の位置が表される。従って、処理画像SPをより容易に、かつ、より正確に聴覚をもって認識することができ、ひいては周囲の物体の位置や形状などをより正確に認識することができる。   As described above in detail, according to the present embodiment, with respect to the positions of the plurality of colored dots BD constituting the processed image SP, the position in the X-axis direction (left-right direction) is determined by using the arrival time difference of the sound with respect to the left and right ears. And the position in the Y-axis direction (vertical direction) is represented by using the magnitude of the frequency. Therefore, the processed image SP can be recognized more easily and more accurately with hearing, and the position and shape of surrounding objects can be recognized more accurately.

特に本実施形態では、処理画像SP中におけるX軸方向に沿った着色ドットBDの位置は、左右の耳への音の到達時間差を用いることにより表されている。このため、X軸方向に沿った位置を音の強度差を用いて表現する上記従来技術と比較して、周囲の物体の位置や形状などを非常に正確に認識することができる。   In particular, in the present embodiment, the position of the colored dot BD along the X-axis direction in the processed image SP is represented by using a difference in sound arrival time between the left and right ears. For this reason, it is possible to recognize the position and shape of surrounding objects very accurately as compared with the above-described conventional technique in which the position along the X-axis direction is expressed using the difference in sound intensity.

さらに、音の強度(音圧)を調節することで、処理画像SP中における着色ドットBDの濃淡が表される。そのため、物体の位置などに加えて、物体の凹凸等、物体のより正確な形状を認識することができる。   Further, by adjusting the sound intensity (sound pressure), the shade of the colored dots BD in the processed image SP is expressed. Therefore, in addition to the position of the object, a more accurate shape of the object such as the unevenness of the object can be recognized.

加えて、発音手段3により発せられる音が純音とされ、さらに、Y軸方向に沿ったドットDTの各行ごとに割り当てられる周波数が、それぞれ異なる素数とされている。従って、それぞれの音が他の音と共振してしまうことがなくなり、発音手段3から発せられる音をより一層確実に認識することができる。その結果、周囲の物体の位置等をより一層正確に認識することができる。   In addition, the sound emitted by the sound generation means 3 is a pure tone, and the frequency assigned to each row of dots DT along the Y-axis direction is a different prime number. Therefore, each sound does not resonate with other sounds, and the sound emitted from the sound generation means 3 can be recognized more reliably. As a result, the positions of surrounding objects can be recognized more accurately.

併せて、各着色ドットBDに対応する音が発音手段3より同時に発せられるため、処理画像SPを認識するのに要する時間を短縮することができる。これにより、単位時間当たりにより多くの処理画像SPを認識することができるため、例えば、物体が移動しているといったことや、物体の早さなどをより正確に、かつ、より確実に知ることができる。   In addition, since the sound corresponding to each colored dot BD is simultaneously emitted from the sound generation means 3, the time required to recognize the processed image SP can be shortened. As a result, more processed images SP can be recognized per unit time, so that, for example, the fact that the object is moving, the speed of the object, and the like can be more accurately and reliably known. it can.

また、X軸方向及びY軸方向に沿ってそれぞれ21以上のドットDTを備えて処理画像SPが構成されているため、物体の形状などを一層正確に把握することができる。   Further, since the processed image SP is configured with 21 or more dots DT along the X-axis direction and the Y-axis direction, the shape of the object can be grasped more accurately.

加えて、発音手段3より発せられる音の周波数が60Hz以上1000Hz以下とされているため、音に強度差を設けなくとも、左右の耳に対する音の到達時間に差があるものとより確実に認識することができる。その結果、Y軸方向の全域に亘ってX軸方向に沿ったドットDT位置のより確実な認識を図ることができる。   In addition, since the frequency of the sound emitted from the sound generation means 3 is 60 Hz or more and 1000 Hz or less, it is more reliably recognized that there is a difference in the arrival time of the sound with respect to the left and right ears without providing a difference in intensity between the sounds. can do. As a result, the dot DT position along the X-axis direction can be more reliably recognized over the entire area in the Y-axis direction.

さらに、撮像手段3の向く方向が利用者の視界方向と同一とされ、さらに、X軸方向に沿った着色ドットBDの位置を表現する左右の耳への音の到達時間差が、撮像画像の取込角度に対応して設定されている。従って、左右方向において、利用者に対する物体の相対位置と、音によって利用者が認識する物体の位置とが一致することとなる。このため、自己と物体との相対的な位置関係を極めて正確に把握することができ、周囲の状況を極めて正確に認識することができる。   Furthermore, the direction in which the image pickup means 3 faces is the same as the user's field of view, and furthermore, the difference in the arrival time of the sound to the left and right ears representing the position of the colored dot BD along the X-axis direction is the captured image. It is set according to the included angle. Therefore, in the left-right direction, the relative position of the object with respect to the user coincides with the position of the object recognized by the user by sound. For this reason, the relative positional relationship between the self and the object can be grasped very accurately, and the surrounding situation can be recognized very accurately.

尚、上記実施形態の記載内容に限定されず、例えば次のように実施してもよい。勿論、以下において例示しない他の応用例、変更例も当然可能である。   In addition, it is not limited to the description content of the said embodiment, For example, you may implement as follows. Of course, other application examples and modification examples not illustrated below are also possible.

(a)上記実施形態では、発生音決定手段42は、音の大小を用いて処理画像SPの濃淡を表現することとしている。これに対して、第1スピーカ31U,32U及び第2スピーカ31L,32Lから発せられる音に強度差を設けることで、着色ドットBDのY軸方向に沿った位置(上下位置)を表す際に用いることとしてもよい。すなわち、処理画像SP中の上方に位置する着色ドットBDを表現するにあたっては、第1スピーカ31U,32Uから比較的高い周波数で、かつ、強度の比較的大きな音を発する一方で、前記第2スピーカ31L,32Lから同一の高周波数で、強度の比較的小さな音を発し、また、処理画像SP中の下方に位置する着色ドットBDを表現するにあたっては、第1スピーカ31U,32Uから比較的低い周波数で、かつ、強度の比較的小さな音を発する一方で、第2スピーカ31L,32Lから同一の低周波数で、強度の比較的大きな音を発するようにしてもよい。この場合、利用者は、骨伝導や皮膚の触覚等により、上方側に位置する着色ドットBDについては、あたかも自身の上方から音が発せられているように感じ、一方で、下方側に位置する着色ドットBDについては、あたかも自身の下方から音が発せられているように感じることとなる。従って、周波数の違いと併せて、利用者は、処理画像SP中における着色ドットBD(物体)の上下位置をより正確に認識することができる。尚、音の強度差を用いて、着色ドットBDの濃淡、及び、Y軸方向に沿った着色ドットBDの位置を併せて表現することとしてもよい。   (A) In the above embodiment, the generated sound determination means 42 expresses the shade of the processed image SP using the magnitude of the sound. On the other hand, by providing a difference in intensity between the sounds emitted from the first speakers 31U and 32U and the second speakers 31L and 32L, it is used to represent the position (vertical position) of the colored dots BD along the Y-axis direction. It is good as well. That is, in expressing the colored dots BD located above the processed image SP, the second speaker emits a relatively high frequency and relatively strong sound from the first speakers 31U and 32U. 31L and 32L emit relatively low-intensity sounds at the same high frequency, and in expressing the colored dots BD located below in the processed image SP, the first speakers 31U and 32U have a relatively low frequency. In addition, while emitting a relatively small sound, the second speakers 31L and 32L may emit a relatively large sound at the same low frequency. In this case, the user feels that the colored dot BD located on the upper side is emitted from the upper side due to bone conduction, skin tactile sensation, and the like, while being located on the lower side. About the colored dot BD, it will feel as if the sound is emitted from below itself. Therefore, together with the difference in frequency, the user can more accurately recognize the vertical position of the colored dot BD (object) in the processed image SP. In addition, it is good also as expressing the position of the colored dot BD along the Y-axis direction, and the shade of the colored dot BD using the difference in sound intensity.

(b)上記実施形態において、処理画像SPは、3階調の濃淡画像とされているが、処理画像SPの濃淡の階調はこれに限定されるものではない。従って、例えば、処理画像として白黒画像(2階調)を生成することとしてもよい。   (B) In the above-described embodiment, the processed image SP is a grayscale image with three gradations, but the grayscale of the processed image SP is not limited to this. Therefore, for example, a black and white image (2 gradations) may be generated as the processed image.

(c)上記実施形態では、発音機31,32は、それぞれ第1スピーカ31U,32U及び第2スピーカ31L,32Lを備えているが、発音機31,32がそれぞれ1つ又は3つ以上のスピーカを備えて構成されることとしてもよい。   (C) In the above embodiment, the sound generators 31 and 32 include the first speakers 31U and 32U and the second speakers 31L and 32L, respectively, but the sound generators 31 and 32 each have one or three or more speakers. It is good also as comprising.

(d)上記実施形態では、各着色ドットBDに対応する音を発音手段3から同時に発することとされているが、各周波数ごとに順次音を発することとしてもよい。この場合、利用者は音をより一層容易に認識することができるため、周囲物体の位置などをより確実に、かつ、より容易に認識することができる。   (D) In the above embodiment, sounds corresponding to the colored dots BD are simultaneously emitted from the sound generation means 3, but sounds may be emitted sequentially for each frequency. In this case, since the user can recognize the sound more easily, the user can more reliably and more easily recognize the position of the surrounding object.

(e)上記実施形態では、着色ドットBDのY軸方向の位置を表す周波数が上方から下方へと減少するように設定されているが、上方から下方へと徐々に増大するように周波数を設定することとしてもよい。また、上記実施形態では、音の周波数が60Hz〜1000Hzとされているが、発する音の周波数の範囲はこれに限定されるものではない。但し、6000Hzを超えるような高周波数は、上述の通り、左右の耳に対する音の到達時間差を認識しにくくなり得る。そのため、周波数の上限を6000Hz以下とすることが好ましく、周波数の上限を3000Hz以下とすることがより好ましい。   (E) In the above embodiment, the frequency representing the position of the colored dot BD in the Y-axis direction is set so as to decrease from above to below, but the frequency is set so as to gradually increase from above to below. It is good to do. Moreover, in the said embodiment, although the frequency of a sound shall be 60 Hz-1000 Hz, the range of the frequency of the sound to emit is not limited to this. However, as described above, a high frequency exceeding 6000 Hz may make it difficult to recognize the arrival time difference between the left and right ears. Therefore, the upper limit of the frequency is preferably 6000 Hz or less, and the upper limit of the frequency is more preferably 3000 Hz or less.

(f)上記実施形態における処理画像SPのドット数は例示であって、その数は限定されるものではない。また、画像処理手段41については、生成する処理画像のドット数(行数、列数)を適宜変更可能に構成することとしてもよい。例えば、周囲の状況をより細かく把握したい場合には、処理画像のドット数をより増大させることとしてもよい。また、処理画像のドット数をより減少させれば、利用者が画像を認識する際の負担を軽減することができる。   (F) The number of dots of the processed image SP in the above embodiment is an example, and the number is not limited. Further, the image processing means 41 may be configured so that the number of dots (number of rows and columns) of the generated processed image can be changed as appropriate. For example, when it is desired to grasp the surrounding situation in more detail, the number of dots in the processed image may be increased. Further, if the number of dots in the processed image is further reduced, the burden on the user when recognizing the image can be reduced.

(g)上記実施形態では、撮像手段2による左右方向の取込角度が左右にそれぞれ45度ずつとされているが、撮像手段2の取込角度はこれに限定されるものではない。   (G) In the above-described embodiment, the capturing angle in the left-right direction by the imaging unit 2 is 45 degrees to the left and right, but the capturing angle of the imaging unit 2 is not limited to this.

1…画像聴覚化装置、2…撮像手段、3…発音手段、4…処理手段、31,32…発音機、31U,32U…第1スピーカ、31L,32L…第2スピーカ、41…画像処理手段、42…発生音決定手段、DT…ドット。   DESCRIPTION OF SYMBOLS 1 ... Image auralization apparatus, 2 ... Imaging means, 3 ... Sound generation means, 4 ... Processing means, 31 and 32 ... Sound generator, 31U, 32U ... 1st speaker, 31L, 32L ... 2nd speaker, 41 ... Image processing means 42 ... Generated sound determining means, DT ... Dot.

Claims (9)

撮像手段と、
利用者の左右の耳に装着され、各耳に対応した発音機を備える発音手段と、
前記撮像手段により得られた撮像画像に基づいて、X軸方向及びY軸方向に沿って延びる複数の走査線により形成された複数のドットからなる処理画像を得る画像処理手段と、
前記処理画像を構成する各ドットに対応して、前記発音手段から発する音を決定する発生音決定手段とを備える画像聴覚化装置であって、
前記発生音決定手段は、
左右の耳への音の到達時間に差を設けることで、前記処理画像中におけるX軸方向に沿った前記ドットの位置を表すとともに、
Y軸方向のプラス側からマイナス側へと向かって増加又は減少し、Y軸方向に沿った前記ドットの各行ごとに割り当てられる周波数により、前記処理画像中におけるY軸方向に沿った前記ドットの位置を表すことを特徴とする画像聴覚化装置。
Imaging means;
A sounding means attached to the left and right ears of the user and provided with a sound generator corresponding to each ear;
Image processing means for obtaining a processed image composed of a plurality of dots formed by a plurality of scanning lines extending along the X-axis direction and the Y-axis direction based on the captured image obtained by the imaging means;
An image auralization device comprising sound generation determination means for determining a sound emitted from the sound generation means corresponding to each dot constituting the processed image,
The generated sound determination means includes
By providing a difference in the arrival time of sound to the left and right ears, the position of the dot along the X-axis direction in the processed image is represented,
The position of the dot along the Y-axis direction in the processed image by a frequency that increases or decreases from the plus side to the minus side in the Y-axis direction and is assigned to each row of the dots along the Y-axis direction An image auralization device characterized by representing.
音の強度の大小を用いて、前記処理画像中における前記ドットの濃淡を表すことを特徴とする請求項1に記載の画像聴覚化装置。   The image auralization apparatus according to claim 1, wherein the density of the dots in the processed image is expressed using a magnitude of sound intensity. 前記左右各耳に対応する発音機は、利用者の各耳に装着された際に、利用者の外耳道の上方に配置される第1スピーカと、利用者の外耳道の下方に配置される第2スピーカとをそれぞれ備え、
周波数の高低に対応して、両スピーカのうちの一方から発せられる音の強度を増大させる一方で、両スピーカのうちの他方から発せられる音の強度を低減させることを特徴とする請求項1又は2に記載の画像聴覚化装置。
When the sound generators corresponding to the left and right ears are attached to the user's ears, the sound generator is disposed above the user's ear canal and the second speaker is disposed below the user's ear canal. Each with a speaker,
The intensity of the sound emitted from one of the two speakers is increased while the intensity of the sound emitted from the other of the two speakers is reduced corresponding to the level of the frequency. 2. The image auralization apparatus according to 2.
発音手段が発する音を純音とするとともに、
Y軸方向に沿った前記ドットの行ごとに割り当てられる周波数を、それぞれ異なる素数としたことを特徴とする請求項1乃至3のいずれか1項に記載の画像聴覚化装置。
While the sound produced by the pronunciation means is pure,
4. The image auralization apparatus according to claim 1, wherein frequencies assigned to the respective rows of dots along the Y-axis direction are respectively different prime numbers. 5.
各周波数ごとに順次音を発することを特徴とする請求項1乃至4のいずれか1項に記載の画像聴覚化装置。   The image auralization apparatus according to any one of claims 1 to 4, wherein a sound is emitted sequentially for each frequency. 前記発生音決定手段により決定された各ドットに対応する音が、前記発音手段から同時に発せられることを特徴とする請求項1乃至4のいずれか1項に記載の画像聴覚化装置。   5. The image auralization apparatus according to claim 1, wherein sounds corresponding to the respective dots determined by the generated sound determination unit are simultaneously emitted from the sound generation unit. 前記走査線は、X軸方向及びY軸方向に沿ってそれぞれ20本以上存在することを特徴とする請求項1乃至6のいずれか1項に記載の画像聴覚化装置。   The image auralization apparatus according to claim 1, wherein there are 20 or more scanning lines each along the X-axis direction and the Y-axis direction. 前記発音手段から発する音の周波数を60Hz以上1000Hz以下としたことを特徴とする請求項1乃至7のいずれか1項に記載の画像聴覚化装置。   The image auralization apparatus according to any one of claims 1 to 7, wherein a frequency of a sound emitted from the sound generation unit is set to 60 Hz or more and 1000 Hz or less. 前記撮像手段は、利用者の視界方向と同一の方向に向くよう、利用者に対し、直接又は間接的に取付可能に構成されるとともに、
前記発生音決定手段は、左右の耳への音の到達時間差を、前記撮像手段の左右方向における撮像画像の取込角度に対応して設定することを特徴とする請求項1乃至8のいずれか1項に記載の画像聴覚化装置。
The imaging means is configured to be directly or indirectly attachable to the user so as to face the same direction as the user's field of view,
9. The generated sound determining means sets a difference in arrival time of sounds to the left and right ears in accordance with a captured image capture angle in the left-right direction of the imaging means. The image auralization apparatus according to claim 1.
JP2009221956A 2009-09-28 2009-09-28 Image hearing device Expired - Fee Related JP4891375B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009221956A JP4891375B2 (en) 2009-09-28 2009-09-28 Image hearing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009221956A JP4891375B2 (en) 2009-09-28 2009-09-28 Image hearing device

Publications (2)

Publication Number Publication Date
JP2011067479A true JP2011067479A (en) 2011-04-07
JP4891375B2 JP4891375B2 (en) 2012-03-07

Family

ID=44013396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009221956A Expired - Fee Related JP4891375B2 (en) 2009-09-28 2009-09-28 Image hearing device

Country Status (1)

Country Link
JP (1) JP4891375B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107157651A (en) * 2017-06-13 2017-09-15 浙江诺尔康神经电子科技股份有限公司 A kind of visual pattern sensory perceptual system and method based on sonic stimulation

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03184540A (en) * 1989-07-27 1991-08-12 Philips Gloeilampenfab:Nv Image-voice conversion device
JP2001084484A (en) * 1999-09-13 2001-03-30 Tamotsu Okazawa Method and device for scene recognition
JP2001350473A (en) * 2000-06-08 2001-12-21 Web Logic:Kk System and method for converting picture information into speech information
JP2003084784A (en) * 2001-09-12 2003-03-19 Kaisen Baitai Kenkyusho:Kk Shape transmission device
JP2004020869A (en) * 2002-06-14 2004-01-22 Vstone Kk Image information transmission method, sound signal creation method, sound signal creation apparatus, sound generation apparatus and image/sound conversion method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03184540A (en) * 1989-07-27 1991-08-12 Philips Gloeilampenfab:Nv Image-voice conversion device
JP2001084484A (en) * 1999-09-13 2001-03-30 Tamotsu Okazawa Method and device for scene recognition
JP2001350473A (en) * 2000-06-08 2001-12-21 Web Logic:Kk System and method for converting picture information into speech information
JP2003084784A (en) * 2001-09-12 2003-03-19 Kaisen Baitai Kenkyusho:Kk Shape transmission device
JP2004020869A (en) * 2002-06-14 2004-01-22 Vstone Kk Image information transmission method, sound signal creation method, sound signal creation apparatus, sound generation apparatus and image/sound conversion method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107157651A (en) * 2017-06-13 2017-09-15 浙江诺尔康神经电子科技股份有限公司 A kind of visual pattern sensory perceptual system and method based on sonic stimulation

Also Published As

Publication number Publication date
JP4891375B2 (en) 2012-03-07

Similar Documents

Publication Publication Date Title
US10062303B2 (en) Object tracking for artificial vision
JP6771548B2 (en) A portable system that allows the blind or visually impaired to interpret the surrounding environment by voice or touch.
US11579837B2 (en) Audio profile for personalized audio enhancement
CN204744865U (en) Device for environmental information around reception and registration of visual disability personage based on sense of hearing
KR20220066911A (en) Method and system for adjusting the level of tactile content when providing audio content
JP2022542747A (en) Earplug assemblies for hear-through audio systems
JP7403783B2 (en) Behavior support device for visually impaired people
CN112506336A (en) Head mounted display with haptic output
JP2016194612A (en) Visual recognition support device and visual recognition support program
JP5002068B1 (en) Environmental information transmission device
JP4891375B2 (en) Image hearing device
WO2021169050A1 (en) System for perceiving environmental image by means of vibration feedback
JP5275496B1 (en) Image hearing device
US11681492B2 (en) Methods and system for controlling tactile content
CN111586395A (en) Method, computer program and head-mounted device for assisting a subject in acquiring spatial information about an environment
JP2004020869A (en) Image information transmission method, sound signal creation method, sound signal creation apparatus, sound generation apparatus and image/sound conversion method
KR100690562B1 (en) Reproduction of Visual Image using Auditory Stimulation and Method Controlling of the same
WO2022209043A1 (en) Ambient environment information transmission device
JP2003084784A (en) Shape transmission device
Zhang et al. ISEE: a Wearable Image-sound Translation System for Blind People
JP2007144111A5 (en)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111107

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20111107

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20111205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111213

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111215

R150 Certificate of patent or registration of utility model

Ref document number: 4891375

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141222

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees