WO2024057498A1

WO2024057498A1 - 文字情報表示装置及び文字情報表示方法

Info

Publication number: WO2024057498A1
Application number: PCT/JP2022/034588
Authority: WO
Inventors: 尚久高見澤; 康宣橋本; 展明甲
Original assignee: マクセル株式会社
Priority date: 2022-09-15
Filing date: 2022-09-15
Publication date: 2024-03-21

Abstract

文字情報表示装置は、カメラと、ディスプレイと、プロセッサと、を備える。プロセッサは、カメラが現実世界を撮像した撮像画像に文字が撮像されているかを判断し、文字の上下方向とディスプレイの上下方向とが不一致である場合、文字の上下方向がディスプレイの上下方向と一致するように文字を回転させて回転後文字情報を生成し、回転後文字情報をディスプレイに表示させる。

Description

文字情報表示装置及び文字情報表示方法

　本発明は、文字情報表示装置及び文字情報表示方法に関する。

　文字の向きを制御する従来例として、特許文献１には「車載システムに搭載されているＡＲ表示装置であるＨＵＤ装置は、カメラで撮像された画像を入力し、画像から物体の領域を選択して抽出する画像選択部と、物体の領域に関する利用者の視認性を指標値に基づいて判断する視認性判断部と、物体の領域の視認性に基づいて、視認性を高めるための画像加工処理を施すことで、物体に関するＡＲ画像を生成するＡＲ画像生成部と、画面に対してＡＲ画像を重畳表示するＡＲ表示部と、を有し、視認性に応じて、ＡＲ画像の表示有無、及び画像加工処理の内容を変えるように制御する。（要約抜粋）」という記載がある。

国際公開第２０１８／１６７９６６号

　複数人で同一の書類やタブレット画面等の周りを取り囲んで読む場合、場所によっては書類の文字の向きが自分の視界の上下軸を基準として上下反転、左方向に回転、又は右方向に回転して読みづらくなることがある。しかし、他人も同一の資料等を見ているため、書類を自分が読みやすい方向には回せない。

　また、縦書きと横書きが混在する資料をＰＣ画面に表示する際、どちらかは横向きのままの表示になる。この場合は、自分のみがその資料を見ていても、縦書き又は横書きの資料のどちらからは自分の視界の上下方向とは異なる。

　特許文献１のＨＵＤ装置は、斜めに見えている看板を正面から見たように補正して表示するものである。よって特許文献１で視認する対象は、看板等正立した状態で読める前提の物であるため、文字の上下方向が横転又は反転する状況までは考慮されていない。

　本発明は上記実情に鑑みてなされたものであり、文字の上下方向がユーザの視界の上下方向に対して反転又は横転している場合に、当該文字の視認性を改善することを目的とする。

　上記課題を解決するために、本発明は、特許請求の範囲に記載の構成を備える。

　本発明によれば、文字の上下方向がユーザの視界の上下方向に対して反転又は横転している場合に、当該文字の視認性を改善することができる。なお、上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。

本実施形態に係る文字情報表示装置の適用シーンの一例を示す図。本実施形態に係る文字情報表示装置の適用シーンの一例を示す図。文字情報表示装置の一例としてのＨＭＤの外観図。ＨＭＤの機能ブロック図。文字情報表示プログラムの機能ブロック図。第１実施形態における文字情報表示装置の処理の流れを示すフローチャート。ブロックの分割処理及び注目ブロックの決定処理を示す図。回転処理後のユーザの視界の一例を示す図。回転処理後のユーザの視界の一例を示す図。回転処理後のユーザの視界の一例を示す図。第２実施形態における処理対象領域の決定処理を示す図。第２実施形態における回転処理後のユーザの視界の一例を示す図。第２実施形態における文字情報表示装置の処理の流れを示すフローチャート。第３実施形態における入力操作を説明する図。第４実施形態における回転処理後のユーザの視界の一例を示す図。第４実施形態におけるＧＵＩ画面例を示す図。第４実施形態における文字情報表示装置の処理の流れを示すフローチャート。第５実施形態の処理の内容を示す図。

＜第１実施形態＞
　以下、図面を用いて本発明の実施形態について説明する。全図を通じて同一の構成には同一の符号を付して重複説明を省略する。

　図１は、本実施形態に係る文字情報表示装置の適用シーンの一例を示す図であって、文字が記載された資料を複数人が囲んで読んでいる状況を示す。以下の説明では主に文字情報表示装置をヘッドマウントディスプレイ（以下「ＨＭＤ」と記載）に適用した事例について説明する。

　図１では、文字が記載された資料Ｄ１を複数人が囲んで視認している。資料Ｄ１を視認するメンバーＡの視界の上下方向と資料Ｄ１に記載された文字の上下方向とは一致する。しかし、メンバーＢの視界の上下方向と資料Ｄ１に記載された文字の上下方向とは反転している。メンバーＣ、Ｄも視界の上下方向に対して資料Ｄ１に記載された文字の上下方向は横転している。よって、メンバーＢ、Ｃ、Ｄは文字を反転又は横転した状態で読んでおり読みにくい。

　そこでメンバーＢ、Ｃ、Ｄの其々は、ヘッドマウントディスプレイ（以下「ＨＭＤ」と記載する）１００を装着し、資料Ｄ１の文字の上下方向を各自の視界の上下方向、厳密にはＨＭＤ１００のディスプレイ１０２（図４参照）の上下方向と一致するように文字を回転させたＡＲ画像Ｄ１＿ＡＲ（ＡＲ：Ａｕｇｍｅｎｔｅｄ　ｒｅａｌｉｔｙ）をＨＭＤ１００に表示させる。メンバーＢはＨＭＤ１００のユーザであるので以下では「ユーザＢ」と記載する。図１では左目用ディスプレイ１０２ａにＡＲ画像Ｄ１＿ＡＲを表示した状態を図示している。

　ＨＭＤ１００は透過型のディスプレイ１０２を備え、ユーザＢがディスプレイ１０２を通じて視認した現実世界に存在する資料Ｄ１の実像に、回転後の文字が重なるようにかさなるように回転後の文字を表示する。これによりユーザＢは、資料Ｄ１にあたかも回転後の文字が表示されているように視認でき、拡張現実表示（以下「ＡＲ表示」と記載する。）を実現することができる。

　なお、ＨＭＤ１００のディスプレイ１０２が非透過型である場合は、ＨＭＤ１００にユーザＢの視界を撮像するカメラを備え、カメラが撮像した映像に映り込んだ資料Ｄ１の文字に回転処理後の文字を重ねて表示してもよい。これにより、ビデオスルータイプのＨＭＤ１００の本実施形態に用いることができる。

　上記ＨＭＤ１００は、本実施形態に係る文字情報表示装置の一態様である。文字情報表示装置は、ＨＭＤ１００の他、スマートグラス、スマートフォン、タブレット端末等に実装してもよい。スマートグラスでは透過型のディスプレイを用いて現実世界を視認した風景に回転後の文字をＡＲ表示してもよいし、ビデオスルーで表示される画像にＡＲ表示を行ってもよい。スマートフォン、タブレットではビデオスルーで表示される画像にＡＲ表示を行う。

　メンバーＣ，Ｄも装着したＨＭＤ１００を通じて資料Ｄ１を視認すると、自分の視界の上下方向とＨＭＤ１００に表示された資料Ｄ１の文字の上下方向とが一致すように文字を回転させてメンバーＣ、Ｄの其々が装着したＨＭＤ１００に表示する。

　図２は、本実施形態に係る文字情報表示装置の適用シーンの一例を示す図であって、上下方向が異なる文字が記載された資料を読んでいる状況を示す。

　図２の資料Ｄ２は、図２における左ページにおける文字の上下方向に対して、右ページにおける文字の上下方向は９０度回転している。

　したがって、資料Ｄ２を読む場合、左ぺージの文字方向をユーザの視界の上下方向と一致させると右ページの文字方向は視界の上下方向に対して横転し、右ぺージの文字方向をユーザの視界の上下方向と一致させると左ページの文字方向は視界の上下方向に対して横転する。

　そこで、図２に示すように、右ページの文字の上下方向をユーザの視界の上下方向と一致させるよう回転したＡＲ画像であるＤ２＿ＡＲを、資料Ｄ２に重ねてＡＲ表示する。左ページの文字方向は視界の上下方向と一致しているので左ページの文字は回転させない。Ｄ１＿ＡＲの生成処理は第１実施形態で、Ｄ２＿ＡＲの生成処理は第２実施形態で説明する。

　図３は、文字情報表示装置の一例としてのＨＭＤの外観図である。

　ＨＭＤ１００は、コントローラ１１０、左目用ディスプレイ１０２ａ、右目用ディスプレイ１０２ｂ、ジャイロセンサ１６２、地磁気センサ１６３、加速度センサ１６４、視線検出センサ１６８、左カメラ１１２ａ、右カメラ１１２ｂ、深度センサ１６７、視線検出センサ１６８、バッテリー１７０を装着用筐体１９０に搭載して構成される。

　図４は、ＨＭＤの機能ブロック図である。

　ＨＭＤ１００は、ＣＰＵやＭＰＵからなるプロセッサ１０１、左目用ディスプレイ１０２ａ及び右目用ディスプレイ１０２ｂを含むディスプレイ１０２、ＲＯＭ１０３、ＲＡＭ１０４、ストレージ１０５、インカメラ１１１、左カメラ１１２ａ及び右カメラ１１２ｂを含む測距カメラ１１２、マイク１２１、スピーカ１２２、操作インタフェース（Ｉ／Ｆ）１３０、無線ＬＡＮ通信器１４１（例えばＷｉｆｉ（登録商標）を使用した機器）、近接無線通信器１４２（例えばＢｌｕｅｔｏｏｔｈ（登録商標）を使用した機器）、バイブレータ１５０、センサ群１６０、及びバッテリー１７０を備え、これらがバス１０６を介して互いに接続されている。

　センサ群１６０は、ＧＰＳ１６１、ジャイロセンサ１６２、地磁気センサ１６３、加速度センサ１６４、照度センサ１６５、近接センサ１６６、深度センサ（ＴｏＦセンサ）１６７及び視線検出センサ１６８を含む。

　測距カメラ１１２は、左カメラ１１２ａ及び右カメラ１１２ｂの其々で前景を撮像し、画像中に撮像された対象物までの距離を測る。

　ディスプレイ１０２はＡＲ画像等を表示するディスプレイであり、左目用ディスプレイ１０２ａ及び右目用ディスプレイ１０２ｂを含む。

　左カメラ１１２ａで撮像する画像及び左目用のＡＲ画像は、左目用ディスプレイ１０２ａに表示する。同様に右カメラ１１２ｂで撮像する画像及び右目用のＡＲ画像は、右目用ディスプレイ１０２ｂに表示する。これにより、現実空間の所定の距離にあるように立体的（３次元的に）に表示する。ＨＭＤ１００の３次元表示の実現技術は上記に限定されず、適宜公知の技術を用いてもよい。

　本実施形態では、測距センサとして測距カメラ１１２を用い、測距カメラ１１２が撮像した測距画像を解析して回転後の文字を含むＡＲ画像の表示位置が決定される。具体的には、ＡＲ画像は、資料Ｄ１又は資料Ｄ２の回転前の文字が記載された位置に重ねて表示される。しかし、外界を撮像する単視点からカメラからなるアウトカメラで資料Ｄ１及び資料Ｄ２を撮像し、同時に深度センサ１６７で資料Ｄ１及び資料Ｄ２の奥行方向の距離、ジャイロセンサ１６２で上下左右方向の位置の変化を測定してもよい。この場合、アウトカメラと深度センサ１６７、ジャイロセンサ１６２とを組み合わせて測距カメラを構成する。

　操作Ｉ／Ｆ１３０は、例えば装着用筐体１９０の側面に備えられたボタンである。また、ジェスチャー入力をする場合は測距カメラ１１２が操作Ｉ／Ｆ１３０の一形態となる。また、視線入力をする際は、視線検出センサ１６８が操作Ｉ／Ｆ１３０の一形態となる。

　図５は、文字情報表示プログラムの機能ブロック図である。

　プロセッサ１０１は、ストレージ１０５にインストールされた文字情報表示プログラムをＲＡＭ１０４にロードして実行することで、後述する実施形態で説明する文字情報表示装置の機能が実現する。この文字情報表示プログラムは、画像取込部２０１、画像分割部２０２、文字ブロック判定部２０３、角度補正部２０４、表示制御部２０５を含む。

　文字ブロック判定部２０３は、判定対象決定部２０３１、文字判定部２０３２、及び文字学習済みモデル記憶部２０３３を含む。

　角度補正部２０４は、傾き角度判定部２０４１、傾き角度学習済みモデル記憶部２０４２、及び回転処理部２０４３を含む。

　回転処理部２０４３は、ストレージ１０５の一部記憶領域に形成される設定情報記憶部１０５１に記憶された設定情報を参照して、文字の傾き角度を補正するための回転の要否を判断する。

　上記各部の機能説明は、各実施形態中の処理の流れを示すフローチャートに沿って後述する。

　本実施形態における文字ブロック判定部２０３及び角度補正部２０４の其々は人工知能（ＡＩ：Ａｒｔｉｆｉｃｉａｌ　Ｉｎｔｅｌｌｉｇｅｎｃｅ）を用いた構成とするが、ＡＩを利用しない従来型のＯＣＲ（Ｏｐｔｉｃａｌ　Ｃｈａｒａｃｔｅｒ　Ｒｅａｄｅｒ）モジュールを用いてもよい。また、角度補正部２０４も、ＡＩを使用しない構成、例えば文字の形状から文字の上下軸を求め、ディスプレイ１０２の上下方向軸に対する文字の上下軸の傾き角を算出する構成であってもよい。

　図６は、第１実施形態における文字情報表示装置の処理の流れを示すフローチャートである。

　ＨＭＤ１００の画像取込部２０１は、測距カメラ１１２が現実世界を撮像した測距画像を取り込む（Ｓ１０１）。測距画像は、ＨＭＤ１００を装着したユーザの視界を撮像した画像である。

　画像分割部２０２は、測距画像を複数のブロックに分割する（Ｓ１０２）。このブロックは、各ブロックに文字が含まれるかを判定するための処理単位となる。したがって、複数の文字が含まれる程度の大きさが好ましい。

　図７は、ブロックの分割処理及び注目ブロックの決定処理を示す図である。

　図７の符号７００は、ブロックの分割処理及び注目ブロックの決定処理を示す部分説明図であり、ＨＭＤ１００には表示されない。

　画像分割部２０２は、資料Ｄ１の測距画像Ｄ１＿ｉｍｇ上に複数の横線Ｌｈ及び複数の縦線Ｌｖを設定し測距画像Ｄ１＿ｉｍｇを複数のブロックに分割する。

　判定対象決定部２０３１は、視線検出センサ１６８から視線情報を取得し、視点Ｐが含まれるブロックを注目ブロックＢＬとして決定する（Ｓ１０３）。

　文字判定部２０３２は、入力層、隠れ層、出力層を含むニューラルネットワークを用いて構成される。本実施形態では画像解析を行って文字ブロックの判定を行うことから、畳み込みニューラルネットワーク（Ｃｏｎｖｏｌｕｔｉｏｎａｌ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ：ＣＮＮ）を用いてもよい。ＣＮＮは、畳み込み層とプーリング層とを含む。畳み込み層ではブロックの画像から特徴を抽出し、プーリング層で画像サイズを小さくしてダウンサンプリングを行う。その後、隠れ層及び出力層に相当する全結合層に接続してもよいし、全結合層を用いずに１つの特徴マップに１つのクラスを対応させたＧｌｏｂａｌ　Ａｖｅｒａｇｅ　Ｐｏｏｌｉｎｇを行ってもよい。

　文字学習済みモデル記憶部２０３３は、ひらがな、漢字、アルファベット等の多くの文字の上下方向を正立させた文字情報、及びそれから例えば９０度、１８０度（上下反転した状態）、２７０度に回転させた各角度に回転させた文字情報を含む教師データを用いて文字判定部２０３２と同じニューラルネットワークを用いて機械学習を行った学習済みモデルを記憶する。教師データとして用いる文字情報の傾き角度は、上記のように９０度ごとに限らず、更に小さい傾き角度毎、例えば４５度ごとや３０度ごとなどでもよい。

　又はひらがな、漢字、アルファベット等の多くの文字の上下方向を正立させた文字情報を教師データして用い、データ拡張をおこなって正立した文字を上下左右にずらした文字、回転させた文字、拡大又は縮小した文字、斜めにゆがめた文字、一部を切り取った文字、コントラストを変えた文字などのデータを擬似的に生成して文字判定部２０３２と同じニューラルネットワークを用いて教師データを入力し、文字学習済みモデルの機械学習を行ってもよい。鏡にうつった文字を読む場合や、裏まで透過した幟(のぼり)や旗等に書かれた文字を逆側から読む場合を考慮して、裏表が反転した文字を学習対象に加えてもよい。

　文字判定部２０３２は、判定対象決定部２０３１が決定した注目ブロックＢＬを入力層に入力し、注目ブロックＢＬが文字ブロックに分類させるか否かの判断する（Ｓ１０４）。注目ブロックＢＬが文字ブロックではない場合（Ｓ１０４：Ｎｏ）、処理を終了する。

　注目ブロックＢＬが文字ブロックである場合（Ｓ１０４：Ｙｅｓ）、判定対象決定部２０３１は、注目ブロックＢＬに隣接する全てのブロックを処理対象と決定する。そして処理対象として決定された隣接する全てのブロックについて文字ブロックか否かの判断処理が終わっていなければ（Ｓ１０５：Ｎｏ）、注目ブロックＢＬに隣接するブロックの一つを新たな処理対象として決定し（Ｓ１０６）、文字判定部２０３２による判定を繰り返す（Ｓ１０４）。

　文字ブロックと判定された注目ブロックＢＬに隣接する全てのブロックについて文字ブロックについての繰り返し処理が終わると（Ｓ１０５：Ｙｅｓ）、判定対象決定部２０３１は、隣接するブロックに文字ブロックがあるかを判断する。隣接するブロックに一つ以上の文字ブロックがあれば（Ｓ１０７：Ｙｅｓ）、それらの文字ブロックを全て新たな注目ブロックＢＬとして決定し（Ｓ１０８）、ステップＳ１０４からの処理を繰り返す。

　隣接ブロックに全く文字ブロックがなければ（Ｓ１０７：Ｎｏ）、角度補正部２０４は文字ブロックの文字の上下方向がＨＭＤ１００のディスプレイ１０２の上下方向に合うように角度を補正する（Ｓ１０９）。

　角度補正部２０４の処理の一例として、傾き角度判定部２０４１を文字判定部２０３２の出力層に接続し、認識された少なくとも一つ以上の文字を取得する。一般的に同一ページ内の文字の上下方向は統一されていることから、文字ブロック内の一文字又は数文字についてディスプレイ１０２の上下方向に対する傾き角度を求めれば足りる。これにより、傾き角度の検出処理負荷を下げて処理速度を向上させることができる。

　傾き角度学習済みモデル記憶部２０４２は、ひらがな、漢字、アルファベット等の多くの文字の上下方向を正立させた文字情報及び例えば１０度ずつ回転させた文字情報を教師データして機械学習をさせた傾き角度学習済みデータを記憶する。

　傾き角度判定部２０４１は、文字判定部２０３２から取得した少なくとも一つ以上の文字を傾き角度学習済みデータに入力して傾き角度の一致度が高いパターン又は一致度が高いパターンの傾き角度を出力する。

　傾き角度が求まると回転処理部２０４３は、傾き角度をオフセットする方向に全ての文字ブロックを回転し回転後文字情報を生成する。その際、回転処理部２０４３は、設定情報記憶部１０５１に記憶された設定情報を参照し、補正対象とする傾き角の角度範囲に属する文字のみを回転対象としもよい。

　表示制御部２０５は、測距画像に基づいて文字情報が記載された現実世界の物体、例えば資料Ｄ１までの距離情報を取得する。そして現実世界で文字情報が記載された位置に回転後文字情報を表示したＡＲ画像が重なるようにディスプレイ１０２に表示する（Ｓ１１０）。

　図８は、回転処理後のユーザの視界の一例を示す図である。

　ユーザＢの視界８００では、ＨＭＤ１００越しに机とその上の置かれた資料Ｄ１が見える。更に資料Ｄ１より前面に、回転処理をした文字情報を表示したＡＲ画像Ｄ１＿ＡＲが表示される。これにより、現実物体である資料Ｄ１に文字の上下方向がディスプレイ１０２の上下方向と一致した文字情報を重ねて視認できる。

　図９も、回転処理後のユーザの視界の一例を示す図である。

　図９に示すパンフレットＤ３では、自動車の写真の下に文字情報が記載されている。

　ユーザＢの視界では自動車の写真及び文字の上下方向がほぼ反転して見える。

　そこで、ＨＭＤ１００ではパンフレットＤ３のうち写真は回転せずに文字情報だけを回転したＡＲ画像Ｄ３＿ＡＲを、パンフレットＤ３の文字情報部分に重ねて表示する。

　図１０も、回転処理後のユーザの視界の一例を示す図である。

　図９のように、現実のパンフレットＤ３の文字がＡＲ表示の背景に見えると、ＡＲ表示した回転処理後の文字が見にくい。そこで表示制御部２０５は、現実のパンフレットＤ３の文字部分の位置をマスクするＡＲ画像Ｍａｓｋ＿ＡＲを表示し、そのＭａｓｋ＿ＡＲの前面に回転処理後の文字情報を含むＡＲ画像Ｄ３＿ＡＲを表示する。ＡＲ画像Ｍａｓｋ＿ＡＲは、例えば現実のパンフレットＤ３の文字と同色の画像をマスク範囲に表示したり、マスク範囲の文字以外の部分のみに表示したりすることで現実の文字の視認性を下げる。そのうえで、ＡＲ画像Ｄ３_ＡＲを現実の文字と異なる色で表示することでＡＲ表示された文字の視認性を向上させることができる。これにより、現実世界の文字にＡＲ表示された回転処理後の文字が重なった場合においても、ＡＲ表示された文字の視認性を向上させることができる。また、電気的に透過度を可変できる液晶シャッターを用いて、部分的に視界を遮ることのできる装置をディスプレイの外側(現実物体側)に重ねて配置しておき、現実のパンフレットＤ３の文字部分の位置のマスク動作を液晶シャッターによって行うことで、現実の文字の視認性をさらに下げ、相対的にＡＲ表示された文字の視認性を向上させることができる。

　本実施形態によれば、現実世界において文字の向きがユーザの視界の上下方向に対して反転又は横転している場合に、ＨＭＤ１００にユーザの視界の上下方向に一致させた文字情報をＡＲ表示することで、文字を読みやすくすることができる。

＜第２実施形態＞
　第２実施形態は、ディスプレイ内に文字ブロックが表示される場合に、その文字ブロックを含む周辺の複数のブロックをまとめて回転させてＡＲ表示させる実施形態である。図１１は、第２実施形態における処理対象領域の決定処理を示す図である。

　図１１の資料Ｄ２には建物の形を示す図形と建物の名称とが混在する地図が記載されている。

　そこで、角度補正部２０４は、注目ブロックＢＬが文字ブロックであると判定すると、注目ブロックＢＬを含む複数のブロックを処理対象領域ＢＬｓと決定し、まとめて回転してＡＲ表示する。

　図１２は、第２実施形態における回転処理後のユーザの視界の一例を示す図である。図１２に示すように、第２実施形態では、文字ブロックではないブロックを含む処理対象領域ＢＬｓを一体的に回転させたＡＲ画像Ｄ２＿ＡＲを資料Ｄ２の前面にＡＲ表示する。これにより、図１２のような非文字情報である地図図形と地図図形上のその場所に関する文字情報の上下左右方向や配置位置が変化すると認識しづらくなる情報は、文字ブロックと共に一体的に回転させるので非文字情報の視認性を低下させることなく文字情報の視認性を向上させることができる。

　図１３は、第２実施形態における文字情報表示装置の処理の流れを示すフローチャートである。

　ステップＳ１０１からＳ１０４までは第１実施形態と同じであるため重複説明を省略する。

　注目ブロックＢＬが文字ブロックである場合（Ｓ１０４：Ｙｅｓ）、判定対象決定部２０３１は、注目ブロックＢＬを含む複数のブロックを１つの処理対象領域ＢＬｓとして決定する（Ｓ２０１）。処理対象領域ＢＬｓの大きさは、ディスプレイ１０２に表示されるブロックを全て含む領域としてもよいし、予め注目ブロックＢＬを中心とするｍ×ｎブロックの範囲と決めておいてもよい。

　角度補正部２０４は、ディスプレイ１０２の上下方向に対する注目ブロックＢＬの文字の上下方向の傾き角度を検出する。そして、処理対象領域全体を注目ブロックの文字の上下方向がディスプレイ１０２の上下方向に合うように角度を補正する（Ｓ２０２）。

　表示制御部２０５は、回転後の処理対象領域をＡＲ表示する（Ｓ２０３）。

　本実施形態によれば、文字ブロックを中心とする複数のブロックを回転して複数のブロックの上下方向をディスプレイ１０２の上下方向に合わせて表示するので、地図などの図形の形状を保ったまま文字の視認性を向上させることができる。

＜第３実施形態＞
　第３実施形態は、文字の傾き角度で閾値を設けて、回転の要否を判断する実施形態である。図１４は、第３実施形態の入力操作を説明する図である。

　図１４に示すように、ＨＭＤ１００のディスプレイ１０２に傾き角度が異なる複数の文字資料のサンプル１４００ａ、１４００ｂ、１４００ｃ、１４００ｄ、１４００ｅを表示し、ユーザに回転させるサンプルと回転させないサンプルとを選択させて、回転の要否を判断する角度範囲を設定する。

　ユーザの視点１４０１を文字資料のサンプル１４００ｂに合わせると、「回転要」、「回転不要」入力するポップアップメニュー１４０２が表示される。ユーザが視点を合わせる、又はジェスチャー動作を行い「回転不要」を選択すると、サンプル１４００ｂに相当する傾き角度は、回転処理を行わないと設定できる。これを各サンプル１４００ａ、１４００ｂ、１４００ｃ、１４００ｄ、１４００ｅについて行うことにより、サンプル１４００ａ、１４００ｂ、１４００ｃが示す傾き角度は「回転しない」、サンプル１４００ｄ、１４００ｅが示す傾き角度は「回転する」と設定する。回転角度は設定情報に書きこまれ、設定情報記憶部１０５１に記憶される。

　回転処理部２０４３は設定された角度範囲に従って、回転処理の要否を判断し、必要な場合にのみ回転処理を行う。

　もしくは、事前に複数のサンプルを表示させるのではなく)回転後のＡＲ表示に重ねてポップアップメニュー１４０２を表示し、ユーザが現実の書類の傾きによる読みにくさ(の主観的許容値)に基づき回転処理の要否を判断し、ポップアップメニュー１４０２で指示することにより回転角度の設定情報の書き込みを行ってもよい。

　本実施形態によれば、回転処理部２０４３による回転の対象とする傾き角度の閾値及び範囲を設定できるので、例えばディスプレイ１０２の上下方向に対して（０時方向に対して）１０度程度の傾きであれば、文字を読むことは困難ではないと判断して回転表示を行わないとすることもできる。

　なお、設定情報はＨＭＤ１００に記憶しておき、前回のユーザが回転を指示した時の角度を記憶して、次回以降の設定に反映してもよい。

＜第４実施形態＞
　第４実施形態は、自動で文字の傾きを識別できない場合に手動で傾き角度を入力する実施形態である。

　図１５は、第４実施形態における回転処理後のユーザの視界の一例を示す図である。図１６は、第４実施形態におけるＧＵＩ画面例を示す図である。

　図１５に示すように、表示制御部２０５は回転後のＡＲ画像Ｄ１＿ＡＲを表示すると共に、手動回転の要否を入力する「手動回転」ボタン１５０１を表示する。ユーザはＡＲ画像を視認した結果、回転処理が不十分であると判断すると、「手動回転」ボタン１５０１を操作する。

　表示制御部２０５は、図１６に示す傾き角を選択するための第１階層画面１６１０を表示する。第１階層画面１６１０では、例えば４５度ずつ回転したサムネイル画像１６００ａ、１６００ｂ、１６００ｃ、１６００ｄと各サムネイル画像の選択ボタン１６０１とを並べて表示される。

　ユーザが視点入力やジェスチャー入力により一つのサムネイル画像、例えばサムネイル画像１６００ｃを選択すると、表示制御部２０５は、第２階層画面１６２０を表示する。第２階層画面１６２０では、サムネイル画像１６００ｃの傾き角を基準として更に小さい傾き角度のピッチで回転させた複数のサムネイル画像１６００ｅ、１６００ｆ、１６００ｇと各サムネイル画像の選択ボタン１６０１とが並べて表示される。

　このように、階層的に傾き角のピッチを小さくした画像を並べた画面を表示することで、特に視点入力を用いた際にも、補正したい傾き角度を精度良く入力できる。

　図１７は、第４実施形態における文字情報表示装置の処理の流れを示すフローチャートである。

　ステップＳ１１０又はＳ２０３でＡＲ表示が行われる。その際、図１５に示す「手動回転ボタン」１５０１も表示される。

　ユーザは視認性が十分でないと判断し「手動回転ボタン」１５０１を操作すると（Ｓ３０１：Ｙｅｓ）、表示制御部２０５は、第１階層画面１６１０を表示する（Ｓ３０２）。

　ユーザが第１階層画面１６１０で１つのサムネイル画像を選択すると（Ｓ３０３：Ｙｅｓ）、表示制御部２０５は、第２階層画面１６２０を表示する（Ｓ３０４）。

　ユーザが第２階層画面１６２０で１つのサムネイル画像を選択すると（Ｓ３０５：Ｙｅｓ）、回転処理部２０４３は、第１実施形態では文字のみ、第２実施形態では処理対象領域をＳ３０５で選択されたサムネイル画像の傾き角に一致するように回転し、表示制御部２０５は、角度を補正したＡＲ画像を表示する（Ｓ３０６）。その後処理を終了する。

　「手動回転」ボタン１５０１が押されない場合（Ｓ３０１：Ｎｏ）、第１階層画面１６１０でサムネイル画像が選択されない場合（Ｓ３０３：Ｎｏ）、第２階層画面１６２０でサムネイル画像が選択されない場合（Ｓ３０５：Ｎｏ）も処理を終了する。

　本実施形態によれば、傾き角度を補正して表示されたＡＲ画像では文字の傾き角の補正が不十分な場合に、ユーザの操作入力により傾き角の補正が行える。これにより、例えば学習済みモデルの機械学習が不十分で傾き角の補正が不十分な場合も視認性を向上させることができる。

　また、本実施形態で傾き角を自動修正した場合には、学習済みモデルに教師データとして追加して学習済みモデルの更新を行ってもよい。これにより、学習済みモデルをユーザの好みに合わせて調整することができる。

＜第５実施形態＞
　第５実施形態は、傾き角を補正する際に回転処理に加えてパースひずみの補正を行う実施形態である。

　図１８は、第５実施形態の処理の内容を示す図であり、パースひずみの補正処理を示す。

　画像１８００は資料Ｄ１を真上から見下ろした状態を示す。

　同じ資料Ｄ１を資料と同じ高さで人の目で見た視界、即ちＨＭＤ１００の測距カメラ１１２により資料Ｄ１と同じ高さから資料Ｄ１を撮像した画像１８０１では、資料Ｄ１の奥行き方向に向かって横幅（図１８の左右方向に相当する）が狭くなる。

　画像１８０１の文字の上下方向をディスプレイ１０２の上下方向と一致するように回転させてＡＲ表示をすると、画像１８０２に示すよう図１８の左右方向において右側が左側に比べて小さい文字で表示される。上下方向は正立しているため文字は読めるものの資料Ｄ１の表示が不自然で読みにくい。

　そこで、画像１８０２のパースを補正した画像１８０３をＡＲ表示してもよい。これにより、パースひずみを補正してＡＲ表示を行うことで、視認性を向上させることができる。

　変形例として、ＡＲ画像を現実世界になじませるために新たにパース加工を加えてもよい。

　上記の例では画像１８０３だけを見れば文字が読みやすいものの、画像１８０３を現実物体の画像１８０１の上に重ねると、画像１８０１は奥行き方向に向かって文字が小さくなるパースひずみが生じているが、画像１８０３のＡＲ画像はディスプレイ１０２の上下方向に対して正立しているため、画像１８０１のパースひずみとは異なる。よって、画像１８０３を画像１８０１に重ねて表示した場合に画像１８０１になじまない。

　そこで、角度補正部２０４は、新たに回転後の画像１８０３に対して画像１８０１のパースに応じたパース加工を付加した画像１８０４を生成し、表示制御部２０５は、パース加工された画像１８０４をＡＲ画像表示してもよい。

　これにより、現実物体を撮像した画像に合わせてパース加工をすることで現実物体とＡＲ画像とのなじみが良くなり、ＡＲ画像を表示した際の不自然さを解消できる。

＜第６実施形態＞
　第６実施形態は、カメラ画像から表示の邪魔になる物体を自動判別して、邪魔にならないところに回転した画像を表示する実施形態である。

　表示制御部２０５は、透過型のディスプレイ１０２にＡＲ表示を行う場合は、ディスプレイ１０２を透過して外界を視認する際の視界の邪魔にならない場所を自動で選んでＡＲ表示を行ってもよい。視界の邪魔にならない場所とは、例えばディスプレイ１０２の中心を含む所定領域はＡＲ画像の非表示領域として設定しておき、非表示領域の周辺にＡＲ画像を配置してもよい。

　また表示制御部２０５は、非透過型のディスプレイ１０２にＡＲ表示を行う場合は、現実世界の画像から対象（書類）を切り出して（自動）表示すればよい。

　本実施形態によれば、周辺の視界を確保しつつ文字を回転させた画像をＡＲ表示することができる。

　本実施形態の変形例として、視界を確保しようとするとＡＲ画像がディスプレイ１０２内に収まらない場合は、表示制御部２０５は、ＧＰＳ１６１から位置情報を、地磁気センサ１６３からＨＭＤ１００のディスプレイ１０２が向いている方向を示す方向情報を取得し、ＡＲ画像に位置情報及び方向情報を紐づけてストレージ１０５に記憶してもよい。そして、ディスプレイ１０２がＡＲ画像に紐づいている位置情報及び方向情報を向いた際に表示制御部２０５はディスプレイ１０２にＡＲ画像を表示してもよい。

　これにより、ＡＲ画像をディスプレイ１０２の表示領域外に配置できるので、ディスプレイ１０２の表示領域に限定されることなくＡＲ画像を表示することができる。

　以上、本発明の実施形態について説明したが、言うまでもなく、本発明の技術を実現する構成は上記実施形態に限られるものではなく、様々な変形例が考えられる。

　例えば、文字ブロック判定部２０３及び角度補正部２０４の構成及びその処理順序は上記に限定されない。例えば、文字の向き判定・回転処理傾き検知補正モジュールを前処理として用い、これとＡＩ―ＯＣＲとを組み合わせて文字ブロック判定部２０３を構成してもよい。ＡＩ―ＯＣＲの前処理として向き判定・回転処理傾き検知補正モジュールが文字の上下方向の向きを修正する。向き判定・回転処理傾き検知補正モジュールが修正対象とする補正した後に、文字認識処理を行ってもよい。

　また、前述した実施の形態は、本発明を分かり易く説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施形態の構成の一部を他の実施形態の構成と置き換えることが可能であり、また、ある実施形態の構成に他の実施形態の構成を加えることも可能である。これらは全て本発明の範疇に属するものである。また、文中や図中に現れる数値やメッセージ等もあくまでも一例であり、異なるものを用いても本発明の効果を損なうことはない。

　また、各処理例で説明したプログラムは、それぞれ独立したプログラムでもよく、複数のプログラムが一つのアプリケーションプログラムを構成していてもよい。また、各処理を行う順番を入れ替えて実行するようにしてもよい。

　前述した本発明の機能等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、マイクロプロセッサユニット、ＣＰＵ等がそれぞれの機能等を実現する動作プログラムを解釈して実行することによりソフトウェアで実現してもよい。また、ソフトウェアの実装範囲を限定するものでなく、ハードウェアとソフトウェアを併用してもよい。また、各機能の一部又は全部をサーバで実現してもよい。なお、サーバは、通信を介して他の構成部分と連携し機能の実行ができればよく、例えば、ローカルサーバ、クラウドサーバ、エッジサーバ、ネットサービス等であり、その形態は問わない。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）等の記録装置、又は、ＩＣカード、ＳＤカード、ＤＶＤ等の記録媒体に格納されてもよいし、通信網上の装置に格納されてもよい。

　また、図中に示した制御線や情報線は説明上必要と考えられるものを示しており、必ずしも製品上の全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。

　前記実施の形態は、以下の形態を含む。

　（付記１）
　第１の実施の形態は文字情報表示装置であって、
　カメラと、
　ディスプレイと、
　プロセッサと、を備え、
　前記プロセッサは、
　前記カメラが現実世界を撮像した撮像画像に文字が撮像されているかを判断し、
　前記文字の上下方向と前記ディスプレイの上下方向とが不一致である場合、前記文字の上下方向が前記ディスプレイの上下方向と一致するように前記文字を回転させて回転後文字情報を生成し、
　前記回転後文字情報を前記ディスプレイに表示させる、
　文字情報表示装置。

　（付記２）
　第２の実施の形態は文字情報表示装置で実行される文字情報表示方法であって、
　プロセッサは、
　現実世界を撮像して撮像画像に文字が撮像されているかを判断するステップと、
　前記文字の上下方向とディスプレイの上下方向とが不一致である場合、前記文字の上下方向が前記ディスプレイの上下方向と一致するように前記文字を回転させて回転後文字情報を生成するステップと、
　前記回転後文字情報を前記ディスプレイに表示させるステップと、
　を実行する文字情報表示方法。

１００：ＨＭＤ、１０１：プロセッサ、１０２：ディスプレイ、１０２ａ：左目用ディスプレイ、１０２ｂ：右目用ディスプレイ、１０３：ＲＯＭ、１０４：ＲＡＭ、１０５：ストレージ、１０６：バス、１１０：コントローラ、１１１：インカメラ、１１２：測距カメラ、１１２ａ：左カメラ、１１２ｂ：右カメラ、１２１：マイク、１２２：スピーカ、１３０：操作Ｉ／Ｆ、１４１：無線ＬＡＮ通信器、１４２：近接無線通信器、１５０：バイブレータ、１６０：センサ群、１６１：ＧＰＳ、１６２：ジャイロセンサ、１６３：地磁気センサ、１６４：加速度センサ、１６５：照度センサ、１６６：近接センサ、１６７：深度センサ、１６８：視線検出センサ、１７０：バッテリー、１９０：装着用筐体、
２０１：画像取込部、２０２：画像分割部、２０３：文字ブロック判定部、２０４：角度補正部、２０５：表示制御部、
８００：視界、
１０５１：設定情報記憶部、
１４００ａ：サンプル、１４００ｂ：サンプル、１４００ｃ：サンプル、１４００ｄ：サンプル、１４００ｅ：サンプル、１４０１：視点、１４０２：ポップアップメニュー、
１５０１：ボタン、
１６００ａ：サムネイル画像、１６００ｂ：サムネイル画像、１６００ｃ：サムネイル画像、１６００ｄ：サムネイル画像、１６００ｅ：サムネイル画像、１６００ｆ：サムネイル画像、１６００ｇ：サムネイル画像、１６０１：選択ボタン、１６１０：第１階層画面、１６２０：第２階層画面、
１８００：画像、１８０１：画像、１８０２：画像、１８０３：画像、１８０４：画像、
２０３１：判定対象決定部、２０３２：文字判定部、２０３３：モデル記憶部、
２０４１：傾き角度判定部、２０４２：モデル記憶部、２０４３：回転処理部、
Ａ：メンバー、Ｂ：ユーザ（メンバー）、
ＢＬ：注目ブロック、ＢＬｓ：処理対象領域、
Ｃ：メンバー、Ｄ：メンバー、
Ｄ１：資料、Ｄ１＿ＡＲ：ＡＲ画像、Ｄ１＿ｉｍｇ：測距画像、
Ｄ２：資料、Ｄ２＿ＡＲ：ＡＲ画像、
Ｄ３：パンフレット、Ｄ３＿ＡＲ：ＡＲ画像、
Ｌｈ：横線、Ｌｖ：縦線、
Ｍａｓｋ＿ＡＲ：ＡＲ画像、Ｐ　：視点

Claims

　文字情報表示装置であって、
　カメラと、
　ディスプレイと、
　プロセッサと、を備え、
　前記プロセッサは、
　前記カメラが現実世界を撮像した撮像画像に文字が撮像されているかを判断し、
　前記文字の上下方向と前記ディスプレイの上下方向とが不一致である場合、前記文字の上下方向が前記ディスプレイの上下方向と一致するように前記文字を回転させて回転後文字情報を生成し、
　前記回転後文字情報を前記ディスプレイに表示させる、
　文字情報表示装置。
　請求項１に記載の文字情報表示装置において、
　前記プロセッサは、
　前記ディスプレイの表示領域の内、前記撮像画像に撮像された文字に前記回転後文字情報が重なる位置に前記回転後文字情報を拡張現実表示させる、
　文字情報表示装置。
　請求項２に記載の文字情報表示装置において、
　前記プロセッサは、
　前記ディスプレイの表示領域の内、前記撮像画像に撮像された文字をマスクし、当該マスクの上に前記回転後文字情報を拡張現実表示させる、
　文字情報表示装置。
　請求項１に記載の文字情報表示装置において、
　前記プロセッサは、
　前記撮像画像を複数のブロックに分割し、各ブロックは前記文字が撮像された文字ブロックであるかを判定し、
　前記ブロックが文字ブロックであると判定すると当該文字ブロックに撮像された文字を回転させて前記回転後文字情報を生成する、
　文字情報表示装置。
　請求項４に記載の文字情報表示装置において、
　ユーザの視線を検出する視線検出センサを更に備え、
　前記プロセッサは、前記視線検出センサが検出した前記ユーザの視線上にあるブロックを注目ブロックとして決定し、当該注目ブロックが前記文字ブロックであるかを判断する、
　文字情報表示装置。
　請求項５に記載の文字情報表示装置において、
　前記プロセッサは、前記注目ブロックが前記文字ブロックであると判断すると、前記注目ブロックを中心とする複数のブロックを処理対象領域として決定し、当該処理対象領域を一つの領域とみなして同じ方向に回転させた前記回転後文字情報を生成する、
　文字情報表示装置。
　請求項１に記載の文字情報表示装置において、
　ユーザから回転させる対象となる前記文字の傾き角度の範囲の入力操作を受け付ける操作インタフェースを更に備え、前記傾き角度は、前記ディスプレイの上下方向軸に対する前記文字の上下方向軸の傾き角度であり、
　前記プロセッサは、前記文字の上下方向軸の前記傾き角度が前記傾き角度の範囲にある場合に前記文字を回転させて前記回転後文字情報を生成する、
　文字情報表示装置。
　請求項１に記載の文字情報表示装置において、
　前記プロセッサは、前記文字のパースひずみを補正して前記回転後文字情報を生成する、
　文字情報表示装置。
　請求項１に記載の文字情報表示装置において、
　前記カメラ、前記ディスプレイ、及び前記プロセッサは、ヘッドマウントディスプレイに搭載される、
　文字情報表示装置。
　文字情報表示装置で実行される文字情報表示方法であって、
　プロセッサは、
　現実世界を撮像して撮像画像に文字が撮像されているかを判断するステップと、
　前記文字の上下方向とディスプレイの上下方向とが不一致である場合、前記文字の上下方向が前記ディスプレイの上下方向と一致するように前記文字を回転させて回転後文字情報を生成するステップと、
　前記回転後文字情報を前記ディスプレイに表示させるステップと、
　を実行する文字情報表示方法。