JP2014027459A - Communication apparatus, communication method, and communication program - Google Patents
Communication apparatus, communication method, and communication program Download PDFInfo
- Publication number
- JP2014027459A JP2014027459A JP2012165902A JP2012165902A JP2014027459A JP 2014027459 A JP2014027459 A JP 2014027459A JP 2012165902 A JP2012165902 A JP 2012165902A JP 2012165902 A JP2012165902 A JP 2012165902A JP 2014027459 A JP2014027459 A JP 2014027459A
- Authority
- JP
- Japan
- Prior art keywords
- environment
- communication
- sound
- sound information
- call
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006854 communication Effects 0.000 title claims abstract description 108
- 238000004891 communication Methods 0.000 title claims abstract description 98
- 238000000034 method Methods 0.000 title claims abstract description 67
- 210000000988 bone and bone Anatomy 0.000 claims description 45
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 230000007613 environmental effect Effects 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 4
- 208000013057 hereditary mucoepithelial dysplasia Diseases 0.000 description 59
- 230000008569 process Effects 0.000 description 41
- 238000012545 processing Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 12
- 239000011521 glass Substances 0.000 description 8
- 210000003128 head Anatomy 0.000 description 8
- 101100347655 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) NAB3 gene Proteins 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000004069 differentiation Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 210000001508 eye Anatomy 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002207 retinal effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 210000005252 bulbus oculi Anatomy 0.000 description 1
- 210000000845 cartilage Anatomy 0.000 description 1
- 210000000860 cochlear nerve Anatomy 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 210000000613 ear canal Anatomy 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 210000003454 tympanic membrane Anatomy 0.000 description 1
Images
Landscapes
- Telephone Function (AREA)
Abstract
Description
本発明は、ユーザの頭部に装着可能に構成され、画像を出力する表示手段を備え、他の装置との間で音情報を含むデータを送受信可能な通信装置、通信方法、及び通信プログラムに関する。 The present invention relates to a communication device, a communication method, and a communication program that are configured to be wearable on a user's head, include display means for outputting an image, and that can transmit and receive data including sound information to and from other devices. .
ユーザの頭部に装着された状態で使用され、ユーザに各種画像を認識させる表示装置が知られている。表示装置の一例として、ヘッドマウントディスプレイが挙げられる。この種の表示装置の中には、周囲の音を考慮して、ユーザに音を認識させる機能を備えものがある。例えば、特許文献1に記載の頭部装着型表示装置は、ユーザに確実に知覚を促す手段として、気導式スピーカと骨導音スピーカとを備え、必要に応じて双方を使い分ける。一方、周囲の音の大きさを考慮して通話を快適に行うための技術が種々検討されている。例えば、特許文献2に記載の携帯電話機は、骨伝導スピーカを備え、周囲騒音が大きい場合には、骨伝導スピーカを骨導音によるレシーバとして用い、周囲騒音が小さい場合には、骨伝導スピーカを気導音によるレシーバとして用いる。 There is known a display device that is used while being worn on a user's head and allows the user to recognize various images. A head mounted display is mentioned as an example of a display device. Some display devices of this type have a function that allows the user to recognize sounds in consideration of surrounding sounds. For example, the head-mounted display device described in Patent Document 1 includes an air-conducting speaker and a bone-conducting sound speaker as means for surely perceiving the user, and uses both as necessary. On the other hand, various techniques for making a comfortable call in consideration of the volume of surrounding sounds have been studied. For example, the mobile phone described in Patent Document 2 includes a bone conduction speaker. When the ambient noise is high, the bone conduction speaker is used as a receiver for bone conduction sound. When the ambient noise is low, the bone conduction speaker is used. Used as a receiver with air conduction sound.
周囲の音を考慮した通話機能を備えた表示装置の開発が望まれている。このような要望に対し、特許文献1に記載の頭部装着型表示装置において、特許文献2に記載の携帯電話機の通話技術を組み込むことが考えられる。しかしながら、特許文献2に記載の携帯電話機の通話技術では、聞き手又は話し手の周囲の音の大きさによっては、相手の音声が依然として聞き取りにくい場合があった。 Development of a display device having a call function in consideration of ambient sounds is desired. In response to such a demand, it is conceivable to incorporate the mobile phone call technology described in Patent Document 2 in the head-mounted display device described in Patent Document 1. However, with the mobile phone call technology described in Patent Document 2, the voice of the other party may still be difficult to hear depending on the volume of sound around the listener or speaker.
本発明の目的は、通話環境の音の大きさを考慮して、音声を用いた通信が可能な、ユーザの頭部に装着可能に構成された表示手段を備える通信装置、通信方法、及び通信プログラムを提供することである。 SUMMARY OF THE INVENTION An object of the present invention is to provide a communication device, a communication method, and a communication including display means configured to be mounted on a user's head, capable of communication using voice in consideration of the volume of sound in a call environment. Is to provide a program.
第1態様に係る通信装置は、ユーザの頭部に装着可能に構成され、画像を出力する表示手段と、他の装置との間で音情報を含むデータの送受信を実行する通信手段と、前記通信手段が受信した前記音情報を音に変換して出力する音出力手段と、通話環境が、騒音を発生する可能性がある環境である騒音環境であるか否かを判断する判断手段と、前記判断手段によって前記通話環境が前記騒音環境であると判断された場合に、前記通信手段が受信した前記音情報が表す音声をテキストに変換する変換手段と、前記変換手段によって生成された前記テキストを表す画像を前記表示手段に表示させる表示制御手段とを備えている。 The communication device according to the first aspect is configured to be wearable on a user's head, and includes a display unit that outputs an image, a communication unit that transmits and receives data including sound information to and from another device, Sound output means for converting the sound information received by the communication means into sound, and determining means for determining whether or not the call environment is a noise environment that may generate noise; When the determination unit determines that the call environment is the noise environment, a conversion unit that converts voice represented by the sound information received by the communication unit into text, and the text generated by the conversion unit Display control means for causing the display means to display an image representing the above.
第1態様に係る通信装置によれば、通話環境が騒音環境であると判断される場合であっても、ユーザは、他の装置から送信された音情報が表す事項を、表示手段に表示されるテキストを見ることによって、認識することができる。したがって、ユーザは第1態様に係る通信装置を用いることによって、通話環境を考慮して、音声を用いた通信が可能である。 According to the communication device according to the first aspect, even when the call environment is determined to be a noise environment, the user displays the matter represented by the sound information transmitted from the other device on the display unit. Can be recognized by looking at the text. Therefore, by using the communication device according to the first aspect, the user can perform communication using voice in consideration of the call environment.
第2態様に係る通信方法は、ユーザの頭部に装着可能に構成され、画像を出力する表示手段と、他の装置との間で音情報を含むデータの送受信を実行する通信手段と、前記通信手段が受信した前記音情報を振動に変換して出力する音出力手段とを備えた通信装置によって実行される通信方法であって、通話環境が、騒音を発生する可能性がある環境である騒音環境であるか否かを判断する判断ステップと、前記判断ステップにおいて前記通話環境が前記騒音環境であると判断された場合に、前記通信手段が受信した前記音情報が表す音声をテキストに変換する変換ステップと、前記変換ステップにおいて生成された前記テキストを表す画像を前記表示手段に表示させる表示制御ステップとを備えている。第2態様に係る通信方法は、通信装置によって上記ステップが実行されることにより、第1態様の通信装置と同様の作用効果が得られる。 The communication method according to the second aspect is configured to be wearable on a user's head, and includes a display unit that outputs an image, a communication unit that performs transmission and reception of data including sound information with another device, A communication method executed by a communication device including sound output means for converting the sound information received by the communication means into vibration and outputting the vibration, wherein the call environment is an environment in which noise may occur. A determination step for determining whether or not the environment is a noise environment; and when the call environment is determined to be the noise environment in the determination step, the voice represented by the sound information received by the communication means is converted into text And a display control step for causing the display means to display an image representing the text generated in the conversion step. In the communication method according to the second aspect, the same steps and effects as those of the communication apparatus according to the first aspect are obtained by executing the above steps by the communication device.
第3態様に係る通信プログラムは、ユーザの頭部に装着可能に構成され、画像を出力する表示手段と、他の装置との間で音情報を含むデータの送受信を実行する通信手段と、前記通信手段が受信した前記音情報を振動に変換して出力する音出力手段とを備えた通信装置のコンピュータによって実行される表示プログラムであって、通話環境が、騒音を発生する可能性がある環境である騒音環境であるか否かを判断する判断ステップと、前記判断ステップにおいて前記通話環境が前記騒音環境であると判断された場合に、前記通信手段が受信した前記音情報が表す音声をテキストに変換する変換ステップと、前記変換ステップにおいて生成された前記テキストを表す画像を前記表示手段に表示させる表示制御ステップとを実行させる。第3態様に係る通信プログラムは、上記ステップをコンピュータに実行させることにより、第1態様の通信装置と同様の作用効果が得られる。 A communication program according to a third aspect is configured to be wearable on a user's head, and includes a display unit that outputs an image, a communication unit that performs transmission and reception of data including sound information with another device, A display program executed by a computer of a communication device comprising sound output means for converting the sound information received by the communication means into vibration and outputting the vibration, wherein the call environment may generate noise A determination step for determining whether or not the noise environment is, and when the call environment is determined to be the noise environment in the determination step, the voice represented by the sound information received by the communication means is converted into a text And a display control step for causing the display means to display an image representing the text generated in the conversion step. The communication program which concerns on a 3rd aspect can obtain the effect similar to the communication apparatus of a 1st aspect by making a computer perform the said step.
以下、本発明の一実施形態について、図面を参照して説明する。図1に示すヘッドマウントディスプレイ1(以下、「HMD1」と言う。)は、他の装置との間で音情報を含むデータを送受信する機能を有する。HMD1は、装着装置2と、制御装置3とを備える。装着装置2は、ユーザの頭部に装着して使用される。装着装置2は、ハーネス4を介して制御装置3と着脱可能に接続する。制御装置3は、例えば、ユーザの腰ベルト等に装着して使用される。制御装置3は、装着装置2を制御する。以下、装着装置2と、制御装置3とのそれぞれについて詳述する。図1の上方向、下方向、右斜め下方向、左斜め上方向、右斜め上方向、左斜め下方向が、それぞれ、HMD1の上方向、下方向、前方向、後方向、右方向、左方向である。 Hereinafter, an embodiment of the present invention will be described with reference to the drawings. The head mounted display 1 (hereinafter referred to as “HMD1”) shown in FIG. 1 has a function of transmitting and receiving data including sound information to and from other devices. The HMD 1 includes a mounting device 2 and a control device 3. The mounting device 2 is used by being mounted on the user's head. The mounting device 2 is detachably connected to the control device 3 via the harness 4. For example, the control device 3 is used by being mounted on a user's waist belt or the like. The control device 3 controls the mounting device 2. Hereinafter, each of the mounting device 2 and the control device 3 will be described in detail. The upward direction, downward direction, downward diagonal direction to the right, upward diagonal direction to the left, upward diagonal direction to the right, and downward diagonal direction to the left in FIG. 1 are the upward direction, downward direction, forward direction, backward direction, right direction, left direction, respectively. Direction.
図1を参照して、装着装置2の構成について説明する。装着装置2は、眼鏡11と、表示装置12と、音情報入出力装置13と、気導式マイク14とを備える。眼鏡11は、通常の眼鏡と同様の形状を有する。ユーザが装着装置2を装着した状態において、眼鏡11は、表示装置12と、音情報入出力装置13と、気導式マイク14とをユーザの頭部において保持する。眼鏡11のフレームの内部には、音情報入出力装置13と、気導式マイク14とに電気的に接続される配線が設けられている。この配線は、電力の供給と、各種信号の送受信とを行うためのものである。
With reference to FIG. 1, the structure of the mounting apparatus 2 is demonstrated. The wearing device 2 includes
表示装置12は、画像信号に応じて変調されたレーザ光を走査させて、画像光として射出し、ユーザの少なくとも一方の眼の網膜に画像を直接投影する網膜走査型ディスプレイである。表示装置12は、筐体15と、支持部19とを備える。筐体15は、内部に画像光を出力するための構成を収容する。画像光を出力するための構成は、画像表示部(図示外)と、接眼光学系(図示外)と、ハーフミラー16(以下「HM16」と言う。)とを含む。画像表示部は、CPU21(図2参照)と、表示制御部29(図2参照)と、ディスプレイ28(図2参照)とを備える。画像表示部は、制御装置3からハーネス4を介して送信される映像信号に基づいて、表示制御部29を駆動させ、ディスプレイ28に画像を表示する。ディスプレイ28は、例えば、液晶表示素子とバックライトとで構成される。接眼光学系は、ディスプレイ28に表示された画像を示す画像光を、ユーザの眼に導くために集光する。HM16は、表示装置12の左側に設けられ、接眼光学系から射出された画像光の少なくとも一部(例えば半分)を反射して、ユーザの左の眼球(図示略)に入射させる。HM16は外界の実像からの光の少なくとも一部を透過するので、ユーザは、自己の視野において実像(外界の風景)に重畳して画像を視認できる。筐体15は、さらに、内部にカメラ17を備える。カメラ17のレンズは、筐体15の前面且つHM16の右側に設けられた小孔部18から露出する。カメラ17は、ユーザの視野前方の外界の風景を表す画像データを生成する。支持部19は、表示装置12の右上部に設けられ、表示装置12を眼鏡11の右上部に取り付けるための部材である。
The display device 12 is a retinal scanning display that scans laser light modulated in accordance with an image signal, emits the laser light as image light, and directly projects an image on the retina of at least one eye of the user. The display device 12 includes a
音情報入出力装置13は、ユーザの耳(図示略)を覆うヘッドフォン型の装置であり、図2に示す、骨伝導式マイク31,気導式イヤホン32,及び骨伝導式イヤホン33を備える。気導式マイク14は、眼鏡11の左前端から下方に設けられる。ユーザが装着装置2を装着した場合、気導式マイク14は、ユーザの口(図示略)付近に配設される。
The sound information input /
制御装置3の構成について説明する。制御装置3は、略直方体状のシステムボックスである。制御装置3は操作部5を備える。ユーザは、他の装置のユーザとの通話を開始する等の各種操作を、操作部5を介して行うことが可能である。制御装置3はコネクタ6を備える。コネクタ6には、通信ケーブルを接続可能である。
The configuration of the control device 3 will be described. The control device 3 is a substantially rectangular parallelepiped system box. The control device 3 includes an
図2を参照して、装着装置2の電気的構成について説明する。装着装置2は、CPU21,ROM23,RAM25,表示制御部29,カメラ17,気導式マイク14,骨伝導式マイク31,気導式イヤホン32,骨伝導式イヤホン33及び第一有線通信部34を備える。CPU21は、装着装置2全体の制御を司り、装着装置2が備える他の電気機器と電気的に接続する。ROM23は、CPU21が実行する各種プログラム等を記憶する。RAM25は、各種データを一時的に記憶する。
With reference to FIG. 2, the electrical configuration of the mounting device 2 will be described. The mounting device 2 includes a
表示制御部29は、ディスプレイ28に画像を表示させるためにディスプレイ28を制御する。以下、ディスプレイ28に表示させる画像を、表示画像と言う。カメラ17は、静止画像又は動画像(以下、「撮影画像」と言う。)を表す画像データを生成する。気導式マイク14は、空気中を伝わる音の振動を音情報に変換する。気導式マイク14としては、例えば、ダイナミックマイク及びコンデンサマイク等、周知の構成が利用できる。空気中を伝わる音の振動に基づき生成された音情報を第1音情報と言う。骨伝導式マイク31は、ユーザの骨導音を収集して音情報に変換する。ユーザの骨導音を収集して生成された音情報を第2音情報と言う。気導式イヤホン32は、音情報を空気中を伝わる音に変換して出力する。骨伝導式イヤホン33は、音情報を、骨導音に変換して出力する。第一有線通信部34は、ハーネス4(図1参照)を介して制御装置3と有線通信を行う。CPU21は、後述する通話処理において、気導式マイク14が生成した第1音情報及び骨伝導式マイク31が生成した第2音情報を、第一有線通信部34及びハーネス4を介して制御装置3に随時送信する。
The
制御装置3の電気的構成について説明する。制御装置3は、CPU41,ROM43,RAM45,フラッシュメモリ47,第二有線通信部46,操作部5,無線通信部53,及び外部通信部55を備える。CPU41は、制御装置3全体の制御を司り、制御装置3が備える他の電子機器と電気的に接続する。ROM43は、CPU41が実行する各種プログラム等を記憶する。RAM45は、各種データを一時的に記憶する。フラッシュメモリ47は、登録画像記憶エリア48,設定記憶エリア49及びその他の記憶エリア50を備える。登録画像記憶エリア48は、通話環境が騒音環境であるか否かの判断に用いる画像(以下、「登録画像」とも言う。)を表す画像データを記憶する。登録画像は、周囲の環境の属性(例えば、作業場、遊戯室、工場、研究所等)を表す標識である。登録画像51は、工場の内部等の「WORK AREA」に貼られる標識を表す。設定記憶エリア49は、後述する通話処理で用いられる閾値を含む各種設定値を記憶する。その他の記憶エリア50は、音声認識を行うための音響モデル、言語モデル、及び単語辞書を含むその他の情報を記憶する。フラッシュメモリ47には、CPU21,41が実行するプログラムが記憶されてもよい。第二有線通信部46は、ハーネス4を介して装着装置2と有線通信を行う。無線通信部53は、他の装置との間で無線通信を行う。外部通信部55は、通信ケーブルを介して他の装置と有線通信を行う。HMD1と無線又は有線通信を行う他の装置は、例えば、他のHMD1,PC,携帯電話、及びスマートフォンである。
The electrical configuration of the control device 3 will be described. The control device 3 includes a
HMD1で実行される通話処理の概要について説明する。HMD1は、無線通信部53を介して、他の装置との間で音情報を含むデータを送受信可能である。通話処理はこの機能を利用して、HMD1のユーザが、他の装置のユーザと通話する場合に実行される。HMD1は、通話処理において、通話環境が騒音環境であるか否かに応じて、音情報の入出力方法を切り替える。通話環境は、処理を実行するHMD1(以下、「自装置1」とも言う。)の周囲の環境及び通信相手である他の装置(以下、「他装置」とも言う。)の周囲の環境のうちの少なくともいずれかである。本実施形態の通話環境は、自装置の周囲の環境及び他装置の周囲の環境の双方を指す。騒音環境は、騒音を発生する可能性がある環境である。本実施形態の騒音環境は、処理実行時に騒音が発生している環境に加え、処理実行期間中に騒音が発生すると予測される環境も含む。HMD1は、通話環境が騒音環境ではないと判断される場合に、気導式マイク14が生成した第1音情報を他装置に送信し、且つ、気導式イヤホン32を用いて音情報を気導音に変換して出力する。HMD1は、通話環境が騒音環境であると判断される場合に、骨伝導式マイク31が生成した第2音情報を他装置に送信し、且つ、骨伝導式イヤホン33を用いて音情報を骨導音に変換して出力する。HMD1はさらに、通話環境が騒音環境であると判断される場合に、他装置から送信された音情報が表す音声をテキストに変換し、生成されたテキストを表す画像をディスプレイ28に表示する。
An outline of call processing executed in the HMD 1 will be described. The HMD 1 can transmit and receive data including sound information to and from other devices via the
図3から図5を参照して、通話処理を説明する。通話処理は、HMD1のユーザが操作部5を操作して、他装置と通信を開始させる指示を入力した場合、又は、他装置から通信を開始させる指示を含む信号を受信した場合に開始される。図3の通話処理は、図2のROM43に記憶されたプログラムに従って、CPU21とCPU41とが協働して実行する。一例として、他のHMD1との間で通信を実行する場合について説明する。
Call processing will be described with reference to FIGS. The call processing is started when the user of the HMD 1 operates the
図3に示すように、CPU41はまず、自装置1と他装置との間の通信を確立する(S5)。次に、CPU41は、通話環境判断処理を実行する(S10)。図4を参照して、通話環境判断処理について説明する。図4に示すように、通話環境判断処理ではまず、CPU41は、環境情報の一態様として、気導式マイク14が生成した第1音情報を取得する(S15)。環境情報は、HMD1のユーザの周囲の環境を表す情報である。CPU41は、CPU21に指示を出力し、制御装置3に第1音情報及び第2音情報の送信を開始させる。CPU21は、受信した指示に基づき、気導式マイク14が生成した第1音情報及び骨伝導式マイク31が生成した第2音情報を、随時制御装置3に送信する処理を開始する。S15で取得された第1音情報は、自装置1の周囲の環境の音を表す。CPU41は、S15で取得した第1音情報に基づき、自装置1の周囲の音レベルを特定し、特定した音レベルを含むデータを他装置に送信する(S20)。音レベルは、周囲の音の大きさの程度を表す周知の指標によって表される。本実施形態のHMD1は、S15で取得した第1音情報から予測される音圧レベル(dB)を用いて音レベルを表す。ここで、S15で取得された第1音情報は、ユーザが発声していた場合、周囲の音だけでなくユーザが発した音声を表す情報も含む。そこで本実施形態のHMD1は、第1音情報が表す音のうち、音声に相当する周波数域の音を除いて音圧レベルを推定する。このためHMD1は、第1音情報に含まれるユーザの音声の影響を除去し、周囲の音の大きさの音圧レベルをより正確に予測できる。次に、CPU41は、他装置から送信されるデータを受信し、受信したデータから他装置の音レベルを取得する(S25)。具体例として、自装置1の音レベルが50dBであり、他装置から送信された音レベルが40dBである場合を想定する。
As shown in FIG. 3, the
CPU41は、自装置1の音レベルが閾値以下であるか否かを判断する(S30)。閾値は、S20で特定された自装置1の音レベルに基づき、自装置1の周囲の環境が騒音環境であるか否かを判断するために予め設定された値である。S30の処理の閾値は、音レベルを表す指標に応じて適宜定められればよく、予め定められた固定値であってもよいし、ユーザが設定した値であってもよい。本実施形態の閾値は、音圧レベル60dBと予め設定されている。具体例では、CPU41は、自装置1の音レベル(50dB)は閾値以下であると判断し(S30:YES)、他装置の音レベルが閾値以下であるか否かを判断する(S35)。S35の処理の閾値は、音レベルを表す指標に応じて適宜定められればよく、予め定められていてもよいし、ユーザが設定した値であってもよい。S35の処理の閾値は、S30の処理の閾値と同じであってもよいし、異なっていてもよい。本実施形態の閾値は、音圧レベル60dBと予め設定されている。具体例では、CPU41は、他装置の音レベル(40dB)は閾値以下であると判断し(S35:YES)、環境情報の一態様として自装置1の画像データを取得する(S40)。CPU41は、S40では、S15で取得した第1音情報とは別の環境情報として、カメラ17が生成した画像データを取得する。具体例において、図5に示す撮影画像70を表す画像データが取得された場合を想定する。
CPU41 judges whether the sound level of the own apparatus 1 is below a threshold value (S30). The threshold is a value set in advance to determine whether or not the environment around the device 1 is a noise environment based on the sound level of the device 1 specified in S20. The threshold value of the process of S30 may be determined as appropriate according to the index representing the sound level, and may be a predetermined fixed value or a value set by the user. The threshold of this embodiment is preset as a sound pressure level of 60 dB. In a specific example, the
CPU41は、S40で取得した画像データに基づき、通話環境が騒音環境であるか否かを判断する(S45)。本実施形態では、CPU41は、S40で取得した画像データによって表される撮影画像中に、登録画像が含まれる場合に、通話環境が騒音環境であると判断する。撮影画像中に、登録画像が含まれるか否かを判断する処理は、公知の技術が適宜採用されて実行される。登録画像は、フラッシュメモリ47に記憶されている画像データによって表される。例えば、S45では以下の手順で判断処理が実行される。まずCPU41は、撮影画像と登録画像とに対してエッジ検出を行う。エッジ検出の手法としては、画像を一次微分し、勾配が極大となる位置を検出する手法、及び画像を二次微分してゼロ交差位置を検出する手法等、周知の方法が用いられる。次にCPU41は、検出されたエッジから特徴点(例えば、頂点位置)を抽出する。次にCPU41は、撮影画像の特徴点と登録画像の特徴点とをパターンマッチングで比較し、撮影画像の特徴点の中に登録画像の特徴点と一致するパターンが含まれていれば、撮影画像中に登録画像が含まれる判断する。
The
図5のように、具体例の撮影画像70には、標識71が含まれる。標識71は、図2のように登録画像51として、フラッシュメモリ47に記憶されている。したがって、CPU41は、通話環境は騒音環境であると判断し(S45:YES)、フラグをONにする(S55)。フラグは、通話環境が騒音環境であるか否かの判断結果を表す。フラグがONである場合、通話環境が騒音環境であると判断されたことを表す。自装置1の音レベルが閾値よりも大きかった場合(S30:NO)、及び他装置の音レベルが閾値よりも大きかった場合(S35:NO)にも、CPU41はフラグをONにする(S55)。一方、CPU41は、S40で取得した画像データに基づき通話環境は騒音環境ではないと判断した場合(S45:NO)、フラグをOFFにする(S50)。フラグがOFFである場合、通話環境が騒音環境ではないと判断されたことを表す。S50又はS55の次に、処理は図3の通話処理に戻る。
As shown in FIG. 5, the captured
S10の次に、CPU41は、他装置の音声を取得したか否かを判断する(S60)。CPU41は、他装置から受信したデータから音情報を取得する。CPU41は、音情報に音声に対応する周波数帯の情報が含まれている場合に、他装置の音声を取得したと判断する(S60:YES)。この場合、CPU41は、具体例のように通話環境判断処理で設定したフラグがONである場合には(S65:YES)、装着装置2に他装置から受信した音情報、及び骨伝導式イヤホン33を用いて音情報を音に変換させるための指示を出力する。CPU21は、制御装置3から受信した指示に基づき、骨伝導式イヤホン33を用いて、他装置から受信した音情報を音に変換して出力する(S70)。次に、CPU41は、S60で取得した音情報の音声を認識し、テキストに変換する(S75)。音声認識の方法は公知の方法が適宜採用されればよい。例えば、CPU41は、音情報を分析し、特徴量を抽出する。CPU41は、必要に応じてフラッシュメモリ47に記憶された単語辞書を参照しつつ、抽出した特徴量と、フラッシュメモリ47に記憶された音響モデル及び言語モデルとのマッチングを行う。その結果、言語モデルで受理可能な文毎に尤度が求まり、尤度が最も高い文が認識結果のテキストとして得られる。具体例において、音情報が表す音声が、テキスト「Hello, this is ABC of X company.」に変換された場合を想定する。
Following S10, the
CPU41は、テキストを表す画像データを生成し、生成した画像データ、及び画像データに基づき表示画像を表示させるための指示を装着装置2に送信する。CPU21は、制御装置3から受信した指示に基づき、表示制御部29を制御して、画像データが表す表示画像をディスプレイ28に表示させる(S80)。具体例では、S80の処理によって、図5の表示画像80がディスプレイ28に表示される。自己の視野において実像が撮影画像70と同様の像であり、表示画像80がディスプレイ28に表示された場合、図5に示すように、ユーザは、自己の視野85において実像に重畳してテキストを表す表示画像80を視認できる。一方、通話環境判断処理で設定したフラグがOFFである場合には(S65:NO)、CPU41は、他装置から受信した音情報及び気導式イヤホン32で音情報を出力するための指示を装着装置2に出力する。CPU21は、制御装置3から受信した指示に基づき、気導式イヤホン32を用いて、他装置から受信した音情報を音に変換して出力する(S85)。
The
他装置から音声を取得していない場合(S60:NO)、S80又はS85の次に、CPU41は、自装置1の音声を取得したか否かを判断する(S90)。CPU41は、装着装置2から取得したデータから音情報を取得する。CPU41は、装着装置2から送信される音情報に音声に対応する周波数帯の情報が含まれている場合に、自装置1の音声を取得したと判断する(S90:YES)。この場合、具体例のようにフラグがONである場合には(S95:YES)、CPU41は、骨伝導式マイク31が生成した第2音情報を取得する(S100)。CPU41は、取得した第2音情報を含むデータを、他装置に出力する(S105)。一方、フラグがOFFである場合には(S95:NO)、CPU41は、気導式マイク14が生成した第1音情報を装着装置2から取得する(S110)。CPU41は、取得した第1音情報を含むデータを、他装置に出力する(S115)。自装置1の音声を取得していない場合(S90:NO)、S105又はS115の次に、通話を終了させる指示がなければ(S120:NO)、処理はS60に戻る。通話を終了させる指示があれば(S120:YES)、通話処理は以上で終了する。
When the voice is not acquired from the other apparatus (S60: NO), the
本実施形態のHMD1において、表示装置12(ディスプレイ28)は本発明の表示手段に相当する。無線通信部53は、本発明の通信手段に相当する。気導式イヤホン32と、骨伝導式イヤホン33とのそれぞれは、本発明の音出力手段に相当する。図4のS30,S35,及びS45のそれぞれは、本発明の判断ステップに相当する。S30,S35,及びS45の処理のそれぞれを実行するCPU41は、本発明の判断手段として機能する。S75は、本発明の変換ステップに相当する。S75の処理を実行するCPU41は、本発明の変換手段として機能する。S80は、本発明の表示制御ステップに相当する。S80の処理を実行するCPU41は、本発明の表示制御手段として機能する。S15及びS40の処理のそれぞれを実行するCPU41は、本発明の取得手段として機能する。気導式マイク14は、本発明の第1音情報生成手段に相当する。S115の処理を実行するCPU41は、第1通信制御手段として機能する。骨伝導式マイク31は、本発明の第2音情報生成手段に相当する。S105の処理を実行するCPU41は、本発明の第2通信制御手段として機能する。
In the HMD 1 of the present embodiment, the display device 12 (display 28) corresponds to the display means of the present invention. The
HMD1によれば、通話環境が騒音環境であると判断される場合であっても、ユーザは、他装置から送信された音情報が表す事項を、ディスプレイ28に表示されるテキストを見ることによって、認識することができる。HMD1は、3つの観点から通話環境が騒音環境であるか否かを判断する。1つ目の観点は、自装置1の周囲の環境が処理実行時に騒音を発生している環境であるか否かという観点であり、HMD1は、環境情報の一態様である自装置1の周囲の音を表す第1音情報に基づき、騒音環境であるか否かを判断する(S30)。気導式マイク14が生成した第1音情報は自装置1の周囲に騒音が発生しているか否かを表すため、気導式マイク14が生成した第1音情報以外の情報に基づき、通話環境が騒音環境であるか否かを判断する場合に比べ、判断結果の信頼性が高い。自装置1の周囲の音の音レベルが大きい場合、通話処理実行中に他装置のユーザの音声が、自装置1の周囲の音の影響で聞き取りにくいことが予想される。HMD1のユーザは、他装置から送信された音情報が表す音声を、自装置1の周囲の音の影響で聞き取りにくい場合でも、ディスプレイ28に表示されるテキストを見ることによって、該音情報が表す事項を認識することができる。
According to HMD1, even when the call environment is determined to be a noise environment, the user can view the matter represented by the sound information transmitted from the other device by looking at the text displayed on the
2つ目の観点は、自装置1の周囲の環境が騒音を発生させる可能性があるか否かという観点であり、HMD1は環境情報の一態様である画像データに基づき、通話環境が騒音環境であるか否かを自動的に判断する(S45)。通話環境が騒音環境であるか否かを判断する処理(判断処理)が実行されるときには、自装置1の周囲の環境に騒音を発生していなくても、判断処理実行後の通話処理実行中に、自装置1の周囲の環境に騒音を発生することがある。そのような場合を考慮し、HMD1では、騒音を発生する可能性がある環境であることを表す情報を、登録画像として予め登録している。これにより、判断処理実行時に騒音が発生している環境に加え、処理実行期間中に騒音が発生すると予測される環境も騒音環境に含ませることができる。 The second point of view is whether or not the surrounding environment of the device 1 may generate noise. The HMD 1 is based on image data that is one form of environmental information, and the call environment is a noise environment. It is automatically determined whether or not (S45). When a process for determining whether or not the call environment is a noise environment (determination process) is executed, the call process is being executed after the determination process is executed even if no noise is generated in the environment around the device 1. In addition, noise may be generated in the environment around the device 1. In consideration of such a case, in the HMD 1, information indicating that there is a possibility of generating noise is registered in advance as a registered image. Thereby, in addition to the environment in which noise is generated during the execution of the determination process, the environment in which noise is predicted to be generated during the process execution period can be included in the noise environment.
3つ目の観点は、他装置のユーザの周囲の環境が騒音を発生する可能性があるか否かという観点であり、HMD1は他装置から送信されるデータに基づき、通話環境が騒音環境であるか否かを判断する(S35)。他装置のユーザの周囲の環境が騒音を発生する可能性がある場合、他装置から送信される音情報には、騒音が含まれ、他装置のユーザの音声が聞き取りにくいことが想定される。これに対し、HMD1は、他装置から送信されるデータに基づき、通話環境が騒音環境であるか否かを判断することによって、他の装置のユーザの周囲の環境が騒音を発生する可能性があるか否かを判断することができる。そして、通話環境が騒音環境であると判断される場合には、他装置から送信された音情報が表す事項が自動的にテキストで表示される。このため、他装置のユーザの周囲の騒音の影響で、他の装置のユーザの音声が聞き取りにくい場合にも、自装置1のユーザは通話内容をテキストを見ることによって認識することができる。HMD1は、上記3つの観点から通話環境が騒音環境であるか否かを判断するための情報を、自動的に取得するため、ユーザが情報を入力する必要はない。 The third viewpoint is whether or not the environment around the user of the other device may generate noise. The HMD 1 is based on data transmitted from the other device, and the call environment is a noise environment. It is determined whether or not there is (S35). When there is a possibility that the environment around the user of the other device may generate noise, it is assumed that the sound information transmitted from the other device includes noise and it is difficult to hear the voice of the user of the other device. On the other hand, the HMD 1 may determine whether or not the call environment is a noise environment based on data transmitted from another device, so that the environment around the user of the other device may generate noise. It can be determined whether or not there is. When it is determined that the call environment is a noise environment, the matter represented by the sound information transmitted from the other device is automatically displayed in text. For this reason, even when it is difficult to hear the voice of the user of the other apparatus due to the influence of the noise around the user of the other apparatus, the user of the own apparatus 1 can recognize the call content by looking at the text. Since the HMD 1 automatically acquires information for determining whether or not the call environment is a noise environment from the above three viewpoints, it is not necessary for the user to input information.
さらにHMD1は、HMD1は、通話環境が騒音環境ではないと判断される場合に、気導式マイク14が生成した第1音情報を他装置に送信し、且つ、気導式イヤホン32を用いて音情報を気導音に変換して出力する。HMD1は、通話環境が騒音環境であると判断される場合に、骨伝導式マイク31が生成した第2音情報を他装置に送信し、且つ、骨伝導式イヤホン33を用いて音情報を骨導音に変換して出力する。自装置1の周囲の環境が騒音が比較的多い環境である場合には、一般的に、第1音情報には周囲の雑音を表す情報が多く含まれるため、第1音情報よりも第2音情報の方が自装置1のユーザが発する音声を精度よく表す。HMD1は、ユーザの周囲の環境が騒音環境と判断される場合には、第2音情報を自動的に他装置に送信する。したがって自装置1のユーザは、自装置1のユーザの周囲の環境が騒音環境である場合にも、自装置1のユーザの音声を他装置のユーザに正確に認識させる可能性を高めることができる。
Further, the HMD 1 transmits the first sound information generated by the
周囲の環境が、騒音が比較的多い環境である場合には、一般的に、振動が空気を介して鼓膜に達する気導音よりも、外耳道内壁近傍の軟骨に伝搬して聴覚神経に達する骨導音の方が、ユーザは音声の内容を認識しやすい。また一般に、音情報を骨導音に変換する場合、第2音情報を骨導音に変換した方が、第1音情報を骨導音に変換する場合よりも、ユーザの音声を精度よく再生できる。したがって、他装置の周囲の環境が騒音環境である場合には、他装置のユーザは骨導音の方が聞き取りやすいと推測される。これに対し、HMD1は、他装置の周囲の環境が騒音環境であると判断した場合には、骨導音に変換されるのに適した第2音情報を自動的に他の装置に送信する。したがって自装置1のユーザは、他装置のユーザの周囲の環境が騒音環境と判断される場合にも、自装置1のユーザの意図を音声によって他装置のユーザに正確に伝える可能性を高めることができる。自装置1が、他のHMD1との間で通話処理を実行する場合には、自装置1と他のHMD1とは同じ通話処理によって、通話環境が騒音環境であると判断された場合に、第2音情報を送受信し、受信した第2音情報を骨導音に変換する。したがって、自装置1と他のHMD1とのユーザはそれぞれ、通話環境が騒音環境と判断される場合にも、騒音の影響を受けにくい骨導音に自動的に切り替えて通話をすることができる。 When the surrounding environment is a relatively noisy environment, generally, the bone that reaches the auditory nerve by propagating to the cartilage near the inner wall of the ear canal rather than the air conduction sound that reaches the eardrum through the air. The user is easier to recognize the content of the sound when the sound is guided. In general, when sound information is converted into bone conduction sound, the user's voice is reproduced more accurately when the second sound information is converted into bone conduction sound than when the first sound information is converted into bone conduction sound. it can. Therefore, when the environment around the other device is a noise environment, it is estimated that the user of the other device can easily hear the bone conduction sound. On the other hand, when the HMD 1 determines that the environment around the other device is a noise environment, the HMD 1 automatically transmits to the other device the second sound information suitable for conversion to the bone conduction sound. . Therefore, the user of the own device 1 increases the possibility that the intention of the user of the own device 1 is accurately conveyed to the user of the other device by voice even when the environment around the user of the other device is determined to be a noise environment. Can do. When the own device 1 executes a call process with another HMD 1, when it is determined that the call environment is a noise environment by the same call process between the own device 1 and the other HMD 1, Two-sound information is transmitted / received, and the received second sound information is converted into a bone conduction sound. Therefore, users of the device 1 and the other HMD 1 can make a call by automatically switching to a bone-conducted sound that is hardly affected by noise even when the call environment is determined to be a noise environment.
本発明の通話装置は、上記した実施形態のHMD1に限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更が加えられてもよい。例えば、以下の(A)から(F)までの変形が適宜加えられてもよい。 The communication device of the present invention is not limited to the HMD 1 of the above-described embodiment, and various modifications may be made without departing from the gist of the present invention. For example, the following modifications (A) to (F) may be added as appropriate.
(A)HMD1の構成、形状、及びデザイン等は適宜変更されてよい。例えば、HMD1の表示装置12は、ユーザが日常的に使用する眼鏡、ヘルメット、及びヘッドフォンなど、他の装着具に取り付けられてもよい。また例えば、装着装置2と、制御装置3とは有線通信ではなく無線通信を行ってもよい。また例えば、制御装置3の機能を装着装置2が有していてもよい。また例えば、表示装置12が備える画像表示部(図示略)は、液晶素子などの空間変調素子及び光源、有機EL(ElectroLuminescent)素子、二次元光スキャナ及び光源からなる網膜走査型表示部等であってよい。また例えば、HMD1の、骨伝導式マイク31,気導式イヤホン32,及び骨伝導式イヤホン33は、音情報入出力装置13に内蔵されていたが、それぞれ別体に設けられてもよい。また例えば、HMD1は、音情報生成装置として、気導式マイク14と、骨伝導式マイク31とを備えていたが、どちらか一方のみを備えてもよい。また例えば、HMD1は、音出力装置として、気導式イヤホン32と、骨伝導式イヤホン33とを備えていたが、どちらか一方のみを備えてもよい。さらにHMD1は、有線通信を利用して他装置との間で通話処理を実行してもよい。
(A) The configuration, shape, design, and the like of the HMD 1 may be changed as appropriate. For example, the display device 12 of the HMD 1 may be attached to other wearing tools such as glasses, a helmet, and headphones that are used on a daily basis by the user. Further, for example, the mounting device 2 and the control device 3 may perform wireless communication instead of wired communication. For example, the mounting device 2 may have the function of the control device 3. Further, for example, the image display unit (not shown) included in the display device 12 is a retinal scanning display unit including a spatial modulation element such as a liquid crystal element and a light source, an organic EL (Electro Luminescent) element, a two-dimensional optical scanner, and a light source. It's okay. Further, for example, the
(B)通話環境が騒音環境であるかの判断方法は適宜変更されてよい。例えば、(B−1)から(B−4)に示す変形が適宜加えられてもよい。 (B) The method for determining whether the call environment is a noise environment may be changed as appropriate. For example, the modifications shown in (B-1) to (B-4) may be added as appropriate.
(B−1)通話環境は、自装置1の周囲の環境及び他装置の周囲の環境のうちの少なくともいずれかであればよい。また上記実施形態では、上記のように3つの観点から通話環境が騒音環境であるか否かを判断していたが、これに限定されない。例えば、上記3つの観点中から選択された1以上の観点に基づき、通話環境が騒音環境であるか否かが判断されてもよい。また例えば、HMD1は、複数の観点のうち、所定数以上の観点(例えば、3つの観点のうち2つ以上の観点)から通話環境が騒音を発生する可能性がある環境であると判断される場合に、通話環境が騒音環境であると判断してもよい。 (B-1) The call environment may be at least one of the environment around the device 1 and the environment around another device. Moreover, in the said embodiment, although the telephone call environment was judged whether it was a noise environment from three viewpoints as mentioned above, it is not limited to this. For example, based on one or more viewpoints selected from the above three viewpoints, it may be determined whether or not the call environment is a noise environment. Further, for example, the HMD 1 is determined to be an environment in which the call environment may generate noise from a predetermined number of viewpoints (for example, two or more viewpoints among the three viewpoints) among a plurality of viewpoints. In this case, it may be determined that the call environment is a noise environment.
(B−2)環境情報の種類及び取得方法は適宜変更されてよい。例えば、環境情報として、カメラ17が生成した画像データを取得する場合、撮影画像を解析して予め登録された物又は人が検出された場合に、通話環境が騒音環境であると判断してもよい。より具体的には、例えば、図5に示す撮影画像70において、機械72が検出された場合に、通話環境が騒音環境であると判断してもよい。また例えば、環境情報が周囲の環境の属性を表す情報である場合、環境情報はRFID(Radio Frequency Identification)によって取得されてもよい。また例えば、ユーザが操作部5を操作して入力した情報が環境情報として取得されてもよい。また例えば、自装置1(他装置)の周囲の環境が特定の時間帯にのみ騒音環境になることがわかっている場合には、CPU41は時刻を環境情報として取得し、取得した時刻に基づき通話環境が騒音環境であるか否かを判断してもよい。この場合には、取得時間に応じて、通話環境が騒音環境であるか否かを適切に判断することができる。また例えば、位置と、該位置が騒音環境であるか否かを表す情報とを対応づけて記憶している場合には、GPS等から自装置1の位置を環境情報として取得してもよい。この場合、取得した自装置1の位置が、予め騒音環境と対応づけて登録した位置である場合に、通話環境が騒音環境であると判断してもよい。
(B-2) The type and acquisition method of environmental information may be changed as appropriate. For example, when acquiring image data generated by the
また例えば、HMD1は、HMD1の音出力装置(気導式イヤホン32又は骨伝導式イヤホン33)の音量に基づき、通話環境が騒音環境であるか否かを判断してもよい。より具体的には、音出力装置の音量が比較的大きく設定されている場合には、通話環境が騒音環境であることに起因して、他装置のユーザの音声が聞き取りにくい状態であると予想される。このため、HMD1は、自装置1又は他装置から音量の設定を取得し、音出力装置の音量が比較的大きい場合(例えば、音量が小さい順に1から10の10段階で設定される音量のレベル9以上)に、通話環境が騒音環境であると判断してもよい。また例えば、自装置1で利用されている、又は所定時間(例えば、10分間)内に利用されたコンテンツに関する情報が、環境情報として取得されてもよい。より具体的には、HMD1で利用可能なコンテンツ(例えば、画像及び音声)には、特定の環境下で利用されるものがある。例えば、HMD1のディスプレイ28に表示されるコンテンツのうち、特定の機械の操作方法を説明するマニュアルは、該特定の機械が配置された工場等の作業環境下で利用されると考えられる。HMD1がコンテンツの付帯情報として、コンテンツの利用環境(例えば、工場、研究施設等)を記憶している場合に、HMD1は付帯情報を環境情報としてもよい。この場合、例えば、コンテンツを再生する処理を実行しつつ、通話処理が実行されてもよい。このようにした場合、例えば、自装置のユーザは、特定の機械の操作方法を知りたい場合に、HMD1で特定の機械の操作方法を説明するマニュアルを再生して確認しつつ、該マニュアルの不明な点等を他装置のユーザに問い合わせることができる。さらに他装置に利用中のコンテンツに関する情報、及び自装置の周囲を表す画像データを送信すれば、自装置のユーザと、他装置のユーザとの間の意思疎通を円滑に進めることができる。なお、コンテンツに関する情報は、コンテンツの利用環境を表す情報の他、例えば、コンテンツの内容を表す情報(例えば、機械の操作方法のマニュアル)、及びコンテンツの利用対象者に関する情報(例えば、工場の作業員、及び研究所の研究員)等が挙げられる。
Further, for example, the HMD 1 may determine whether or not the call environment is a noise environment based on the volume of the sound output device (the air conduction type earphone 32 or the bone conduction type earphone 33) of the HMD1. More specifically, when the volume of the sound output device is set to be relatively large, it is expected that the voice of the user of the other device is difficult to hear due to the call environment being a noise environment. Is done. For this reason, the HMD 1 acquires the volume setting from its own apparatus 1 or another apparatus, and the volume level set in 10 levels from 1 to 10 in the order of decreasing volume, for example, when the volume of the sound output apparatus is relatively large (for example, 9 or more), the call environment may be determined to be a noise environment. Further, for example, information related to content that is used in the device 1 or used within a predetermined time (for example, 10 minutes) may be acquired as environment information. More specifically, some contents (for example, images and sounds) that can be used in the HMD 1 are used in a specific environment. For example, among the contents displayed on the
(B−3)通話環境が騒音環境であるか否かの判断に用いる音レベルを表す指標及び指標の取得方法は適宜変更されてよい。また通話環境が騒音環境であるか否かの判断に用いる閾値は、音レベルを表す指標に応じて適宜変更されてよい。例えば、S20の処理において、CPU41は、S15で取得した第1音情報に基づき、ユーザが発した音声の影響を考慮せずに、音圧レベルを予測してもよい。この場合、ユーザが発声しないと推定されるタイミングで音情報が取得されることが好ましい。また例えば、HMD1が騒音計を備える場合には、音レベルは、騒音計から取得した音圧レベル(dB)によって表されてもよい。また例えば、音レベルは、第1音情報に含まれるS(信号)とN(ノイズ)との比を対数であらわしたS/N比(Signal to Noise ratio)によって表されてもよい。この場合、例えば、HMD1は、音声を表す周波数の振動をS(信号)としてもよい。また例えば、閾値は、予め定められた値であってもよいし、ユーザが設定した値であってもよい。また、閾値を予め定められた値とする場合、例えば、ユーザ、使用時間帯、及び周囲の環境の属性(工場、研究所等)等の条件に応じて、複数の閾値の中から、特定の閾値を選択して用いてもよい。
(B-3) The index indicating the sound level used for determining whether or not the call environment is a noise environment and the method for acquiring the index may be changed as appropriate. Moreover, the threshold value used for determining whether or not the call environment is a noise environment may be changed as appropriate according to an index representing the sound level. For example, in the process of S20, the
(B−4)他装置から受信したデータに基づき、通話環境が騒音環境であるか否かを判断する方法は適宜変更されてよい。例えば、データに含まれる音情報に基づき、音情報が表す音レベルを、自装置1において特定してもよい。また例えば、他装置において、他装置の周囲の環境が騒音環境か否かを判断し、その判断結果を自装置1に送信してもよい。この場合、自装置1では、他装置から受信した判断結果に基づいて通話環境が騒音環境であるか否かを判断してもよい。また例えば、他装置から送信されるデータに他装置の周囲の環境を表す情報が含まれる場合には、他装置から受信したデータに含まれる情報に基づき、通話環境が騒音環境であるか否かを判断してもよい。他装置の情報は、前述の自装置の環境情報のいずれかと同じ種類の情報であってもよい。 (B-4) The method for determining whether or not the call environment is a noise environment based on data received from another device may be changed as appropriate. For example, the own device 1 may specify the sound level represented by the sound information based on the sound information included in the data. Further, for example, in another device, it may be determined whether the environment around the other device is a noise environment, and the determination result may be transmitted to the own device 1. In this case, the own device 1 may determine whether or not the call environment is a noise environment based on the determination result received from another device. Also, for example, when the data transmitted from the other device includes information representing the environment around the other device, whether or not the call environment is a noise environment based on the information included in the data received from the other device. May be judged. The information on the other device may be the same type of information as any of the environment information on the own device.
(C)HMD1は、通話環境が騒音環境であるか否かに応じて、気導式マイク14と、骨伝導式マイク31とを切り替えていたが、これに限定されない。例えば、自装置1が気導式マイク14と、骨伝導式マイク31とのいずれかのみを備える場合には、HMD1は通話環境が騒音環境であるか否かに応じて音情報入力装置を切り替えなくてもよい。同様に、HMD1は、通話環境が騒音環境であるか否かに応じて、気導式イヤホン32と、骨伝導式イヤホン33とを切り替えていたが、これに限定されない。例えば、自装置1が気導式イヤホン32と、骨伝導式イヤホン33とのいずれかのみを備える場合には、HMD1は通話環境が騒音環境であるか否かに応じて音情報出力装置を切り替えなくてもよい。上記のいずれかの変形を加えた場合にも、通話環境が騒音環境であると判断される場合には、ユーザは、他装置から送信された音情報が表す事項を、ディスプレイ28に表示されるテキストを見ることによって、認識することができる。
(C) The HMD 1 switches between the air-
(D)テキストを表す画像中の、テキストの配置、フォント、及び大きさ等は適宜変更されてよい。HM16は外界の実像からの光を透過しない構成とし、ユーザは、自己の視野においてディスプレイ28に表示される画像のみを視認できるようにしてもよい。
(D) The arrangement, font, size, and the like of the text in the image representing the text may be changed as appropriate. The
(E)通話処理を実行させるための指示を含むプログラムは、HMD1がプログラムを実行するまでに、HMD1が備える記憶装置に記憶されればよく、プログラムの取得方法、取得経路及びプログラムを記憶する装置のそれぞれは適宜変更されてよい。したがって、CPU41が実行するプログラムは、通信ケーブル又は無線通信を介して、他の装置から受信し、フラッシュメモリ47等の記憶装置に記憶されてもよい。他の装置は、例えば、PC,及びネットワーク網を介して接続されるサーバを含む。同様に、CPU21が実行するプログラムは、通信ケーブル又は無線通信を介して、他の装置から受信し、RAM25及び不揮発媒体等の記憶装置に記憶されてもよい。この場合の他の装置は、例えば、制御装置3,PC,及びネットワーク網を介して接続されるサーバを含む。
(E) A program including an instruction for executing a call process may be stored in a storage device included in the HMD 1 until the HMD 1 executes the program, and a program acquisition method, an acquisition route, and a device that stores the program Each of these may be changed as appropriate. Therefore, the program executed by the
(F)図3及び図4に示す通信処理の各ステップは、CPU41によって実行される例に限定されず、一部又は全部が他の電子機器(例えば、ASIC)によって実行されてもよい。また、通信処理の各ステップは、複数の電子機器(例えば、複数のCPU)によって分散処理されてもよい。図3及び図4に示す通信処理の各ステップは、必要に応じて順序の変更、ステップの省略、及び追加が可能である。例えば、図3の通話処理のS100と、S110との処理において、HMD1は、S100で入力された自装置1のユーザの音声をテキストに変換し、生成されたテキストを表す画像をディスプレイ28に表示させてもよい。このようにすれば、他装置において自装置1のユーザの音声がどのようにテキストに変換されるかを、自装置1のユーザはディスプレイ28に表示された画像を見ることによって確認することができる。また例えば、通話環境が騒音環境であると判断される場合に(S95:YES)、気導式マイク14から取得された第1音情報と、骨伝導式マイク31から取得された第2音情報との双方が他装置に送信されてもよい。このようにした場合には、他装置は、第1音情報及び第2音情報の中から、音声を聞き取りやすい方の音情報を選択して、音情報を音に変換させることが可能である。さらに、HMD1が備えるCPUからの指示に基づき、HMD1上で稼動しているオペレーティングシステム(OS)等が実際の処理の一部または全部を行い、その処理によって上記実施形態の機能が実現される場合も本発明の範囲に含まれる。
(F) Each step of the communication process shown in FIG. 3 and FIG. 4 is not limited to the example executed by the
1 ヘッドマウントディスプレイ
2 装着装置
3 制御装置
12 表示装置
13 音情報入出力装置
14 気導式マイク
21,41 CPU
23,43 ROM
25,45 RAM
17 カメラ
31 骨伝導式マイク
32 気導式イヤホン
33 骨伝導式イヤホン
34 第一有線通信部
46 第二有線通信部
47 フラッシュメモリ
53 無線通信部
DESCRIPTION OF SYMBOLS 1 Head mounted display 2 Mounting apparatus 3 Control apparatus 12
23, 43 ROM
25, 45 RAM
17
Claims (7)
他の装置との間で音情報を含むデータの送受信を実行する通信手段と、
前記通信手段が受信した前記音情報を音に変換して出力する音出力手段と、
通話環境が、騒音を発生する可能性がある環境である騒音環境であるか否かを判断する判断手段と、
前記判断手段によって前記通話環境が前記騒音環境であると判断された場合に、前記通信手段が受信した前記音情報が表す音声をテキストに変換する変換手段と、
前記変換手段によって生成された前記テキストを表す画像を前記表示手段に表示させる表示制御手段と
を備えたことを特徴とする通信装置。 Display means configured to be worn on the user's head and outputting an image;
A communication means for transmitting and receiving data including sound information to and from other devices;
Sound output means for converting the sound information received by the communication means into sound and outputting the sound;
A determination means for determining whether or not the call environment is a noise environment that may generate noise;
Conversion means for converting the voice represented by the sound information received by the communication means into text when the determination means determines that the call environment is the noise environment;
A communication apparatus comprising: display control means for causing the display means to display an image representing the text generated by the conversion means.
前記判断手段は、前記取得手段によって取得された前記環境情報に少なくとも基づき、前記通話環境が前記騒音環境であるか否かを判断することを特徴とする請求項1に記載の通信装置。 An acquisition unit that acquires environment information representing an environment around the user;
The communication apparatus according to claim 1, wherein the determination unit determines whether or not the call environment is the noise environment based at least on the environment information acquired by the acquisition unit.
前記第1音情報生成手段によって生成された前記第1音情報を、前記通信手段を介して前記他の装置に送信する第1通信制御手段と
をさらに備え、
前記取得手段は、前記第1音情報生成手段が生成した前記第1音情報を前記環境情報の少なくとも一部として取得し、
前記判断手段は、前記第1音情報生成手段が生成した前記第1音情報と、閾値との比較結果に少なくとも基づき、前記通話環境が前記騒音環境であるか否かを判断することを特徴とする請求項2に記載の通信装置。 First sound information generating means for converting vibration of sound transmitted through the air into first sound information;
A first communication control means for transmitting the first sound information generated by the first sound information generating means to the other device via the communication means;
The acquisition means acquires the first sound information generated by the first sound information generation means as at least a part of the environmental information,
The determination means determines whether or not the call environment is the noise environment based at least on a comparison result between the first sound information generated by the first sound information generation means and a threshold value. The communication device according to claim 2.
前記判断手段によって前記通話環境が前記騒音環境であると判断された場合に、前記第2音情報生成手段によって生成された前記第2音情報を、前記通信手段を介して前記他の装置に送信する第2通信制御手段と
をさらに備えたことを特徴とする請求項1から3のいずれかに記載の通信装置。 Second sound information generating means for collecting the bone conduction sound of the user and converting it into second sound information;
When the determination unit determines that the call environment is the noise environment, the second sound information generated by the second sound information generation unit is transmitted to the other device via the communication unit. The communication apparatus according to claim 1, further comprising: a second communication control unit that performs the above-described operation.
通話環境が、騒音を発生する可能性がある環境である騒音環境であるか否かを判断する判断ステップと、
前記判断ステップにおいて前記通話環境が前記騒音環境であると判断された場合に、前記通信手段が受信した前記音情報が表す音声をテキストに変換する変換ステップと、
前記変換ステップにおいて生成された前記テキストを表す画像を前記表示手段に表示させる表示制御ステップと
を備えたことを特徴とする通信方法。 A display unit configured to be mounted on a user's head, outputting an image, a communication unit executing transmission / reception of data including sound information with another device, and the sound information received by the communication unit A communication method executed by a communication device including sound output means for converting to vibration and outputting,
A determination step of determining whether or not the call environment is a noise environment that is an environment that may generate noise;
A conversion step of converting the voice represented by the sound information received by the communication means into text when the call environment is determined to be the noise environment in the determination step;
A display control step of causing the display means to display an image representing the text generated in the conversion step.
通話環境が、騒音を発生する可能性がある環境である騒音環境であるか否かを判断する判断ステップと、
前記判断ステップにおいて前記通話環境が前記騒音環境であると判断された場合に、前記通信手段が受信した前記音情報が表す音声をテキストに変換する変換ステップと、
前記変換ステップにおいて生成された前記テキストを表す画像を前記表示手段に表示させる表示制御ステップと
を実行させるための通信プログラム。 A display unit configured to be mounted on a user's head, outputting an image, a communication unit executing transmission / reception of data including sound information with another device, and the sound information received by the communication unit A communication program executed by a computer of a communication device including sound output means for converting to vibration and outputting,
A determination step of determining whether or not the call environment is a noise environment that is an environment that may generate noise;
A conversion step of converting the voice represented by the sound information received by the communication means into text when the call environment is determined to be the noise environment in the determination step;
A communication program for executing a display control step of causing the display means to display an image representing the text generated in the conversion step.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012165902A JP2014027459A (en) | 2012-07-26 | 2012-07-26 | Communication apparatus, communication method, and communication program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012165902A JP2014027459A (en) | 2012-07-26 | 2012-07-26 | Communication apparatus, communication method, and communication program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014027459A true JP2014027459A (en) | 2014-02-06 |
Family
ID=50200732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012165902A Pending JP2014027459A (en) | 2012-07-26 | 2012-07-26 | Communication apparatus, communication method, and communication program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014027459A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016225755A (en) * | 2015-05-28 | 2016-12-28 | 富士通株式会社 | Telephone call device and program |
JP2018518070A (en) * | 2015-03-27 | 2018-07-05 | インテル コーポレイション | Intelligent switching between air conduction speaker and tissue conduction speaker |
JP2022088133A (en) * | 2020-12-02 | 2022-06-14 | 三菱ロジスネクスト株式会社 | Notification system for cargo handling vehicle and cargo handling vehicle with the same |
WO2023195323A1 (en) * | 2022-04-08 | 2023-10-12 | キヤノン株式会社 | Information conversion system, information processing device, information processing method, and program |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007520943A (en) * | 2004-01-20 | 2007-07-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Extended use of phones in noisy environments |
JP2008252596A (en) * | 2007-03-30 | 2008-10-16 | Temuko Japan:Kk | Handset and telephone set |
JP2009093008A (en) * | 2007-10-10 | 2009-04-30 | Casio Hitachi Mobile Communications Co Ltd | Terminal device and program |
JP2010177961A (en) * | 2009-01-28 | 2010-08-12 | Kyocera Corp | Communication equipment and communication system |
-
2012
- 2012-07-26 JP JP2012165902A patent/JP2014027459A/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007520943A (en) * | 2004-01-20 | 2007-07-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Extended use of phones in noisy environments |
JP2008252596A (en) * | 2007-03-30 | 2008-10-16 | Temuko Japan:Kk | Handset and telephone set |
JP2009093008A (en) * | 2007-10-10 | 2009-04-30 | Casio Hitachi Mobile Communications Co Ltd | Terminal device and program |
JP2010177961A (en) * | 2009-01-28 | 2010-08-12 | Kyocera Corp | Communication equipment and communication system |
Non-Patent Citations (1)
Title |
---|
藤林一師、今村弘樹: "画像を手がかりとした時間的に適応可能な雑音推定による音声認識精度の向上に関する研究", 電子情報通信学会技術研究報告, vol. 第112巻,第141号, JPN6016019565, 12 July 2012 (2012-07-12), JP, pages 19 - 22, ISSN: 0003323761 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018518070A (en) * | 2015-03-27 | 2018-07-05 | インテル コーポレイション | Intelligent switching between air conduction speaker and tissue conduction speaker |
JP2016225755A (en) * | 2015-05-28 | 2016-12-28 | 富士通株式会社 | Telephone call device and program |
JP2022088133A (en) * | 2020-12-02 | 2022-06-14 | 三菱ロジスネクスト株式会社 | Notification system for cargo handling vehicle and cargo handling vehicle with the same |
JP7176830B2 (en) | 2020-12-02 | 2022-11-22 | 三菱ロジスネクスト株式会社 | Notification system for cargo handling vehicles and cargo handling vehicles equipped with such notification systems |
WO2023195323A1 (en) * | 2022-04-08 | 2023-10-12 | キヤノン株式会社 | Information conversion system, information processing device, information processing method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9542958B2 (en) | Display device, head-mount type display device, method of controlling display device, and method of controlling head-mount type display device | |
US10114610B2 (en) | Display device, method of controlling display device, and program | |
JP6738342B2 (en) | System and method for improving hearing | |
JP2022534833A (en) | Audio profiles for personalized audio enhancements | |
US11893997B2 (en) | Audio signal processing for automatic transcription using ear-wearable device | |
JP4445178B2 (en) | Communication system and suitable control unit therefor | |
US11929087B2 (en) | Systems and methods for selectively attenuating a voice | |
CN116134838A (en) | Audio system using personalized sound profile | |
EP3376752A1 (en) | Headset | |
JP2022546161A (en) | Inferring auditory information via beamforming to produce personalized spatial audio | |
JP6364735B2 (en) | Display device, head-mounted display device, display device control method, and head-mounted display device control method | |
JP2014027459A (en) | Communication apparatus, communication method, and communication program | |
CN117981347A (en) | Audio system for spatialization of virtual sound sources | |
KR20150061909A (en) | Smart glasses for hearing-impaired person | |
JP2019040005A (en) | Reading aloud system and reading aloud method | |
CN115150716A (en) | Audio system and method for determining an audio filter based on device location | |
WO2021230180A1 (en) | Information processing device, display device, presentation method, and program | |
US11290837B1 (en) | Audio system using persistent sound source selection for audio enhancement | |
CN113763940A (en) | Voice information processing method and system for AR glasses | |
US20220365375A1 (en) | Ultraminiature dynamic speaker for a fully in-ear monitor | |
CN213934463U (en) | Intelligent audio-visual bone conduction glasses | |
JP6064737B2 (en) | Speech recognition apparatus and speech recognition program | |
JP2018085595A (en) | Head-mounted display device and method for controlling the same | |
KR20170022272A (en) | Recording systems AND METHOD FOR THE SAME | |
CN111343420A (en) | Voice enhancement method and wearing equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150317 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160531 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170131 |