本明細書に開示された発明の利点及び特徴、また、それらを達成する方法は、添付の図面とともに詳細に後述されている実施形態を参照すれば明確になる。しかし、本明細書が以下で開示される実施形態に制限されるものではなく、互いに異なる様々な形態で実現されることができ、単に、本実施形態は、本明細書の開示を完全にさせ、本明細書の属する技術分野における通常の技術者(以下、「当業者」)に本明細書の範疇を完全に知らせるために提供されるものであり、本明細書の権利範囲は、請求項の範疇によって定義されるだけである。
本明細書において使用された用語は、実施形態を説明するためのものであり、本明細書の権利範囲を制限しようとするものではない。本明細書において、単数形は文句で特に言及しない限り複数形も含む。明細書で使用される「含む(comprises)」及び/又は「含んでいる(comprising)」は、言及された構成要素以外に1つ以上の他の構成要素の存在又は追加を排除しない。
明細書全体に亘って同一の図面符号は同一の構成要素を称し、「及び/又は」は、言及された構成要素のそれぞれ及び1つ以上のすべての組み合わせを含む。たとえ、「第1」、「第2」などが様々な構成要素を述べるために使用されるとしても、これらの構成要素はこれらの用語により制限されないことはもちろんである。これらの用語は単に1つの構成要素を他の構成要素と区別するために使用するものである。よって、以下で言及される第1構成要素は、本発明の技術的思想内で第2構成要素である場合もあることはもちろんである。
他の定義がなければ、本明細書において使用されるすべての用語(技術及び科学的用語を含む)は、本明細書の属する技術分野における通常の技術者に共通的に理解できる意味として使用される。また、一般的に使用される辞書に定義されている用語は、明白に特に定義されていない限り、理想的に又は過度に解析されない。
人工神経網(Artificial Neural Network、ANN)は、人間の脳を構成しているニューロンを数学的にモデリングした人工ニューロンを互いに連結して人工知能を実現したものである。
本明細書において、「人工神経網モデル」とは、一般的にノードと称され得る相互連結された計算単位の集合で構成されることができる。このようなノードは、ニューロン(neuron)とも称され得る。神経網は、少なくとも1つ以上のノードを含んで構成される。神経網を構成するノード(又はニューロン)は、1つ以上のリンクによって相互連結され得る。
神経網内で、リンクを介して連結された1つ以上のノードは、相対的に入力ノード及び出力ノードの関係を形成することができる。入力ノード及び出力ノードの概念は相対的なものであって、1つのノードに対して出力ノード関係にある任意のノードは他のノードとの関係で入力ノード関係にあることができ、その逆も成立されることができる。上述したように、入力ノード対出力ノード関係は、リンクを中心に生成されることができる。1つの入力ノードに1つ以上の出力ノードがリンクを介して連結されることができ、その逆も成立されることができる。
最初入力ノードは、神経網内のノードのうち他のノードとの関係でリンクを経ずにデータが直接入力される1つ以上のノードを意味することができる。又は、神経網ネットワーク内で、リンクを基準にしたノード間の関係において、リンクで連結された他の入力ノードを持たないノードを意味することができる。これと類似するように、最終出力ノードは神経網内のノードのうち他のノードとの関係で、出力ノードを持たない1つ以上のノードを意味することができる。また、ヒドゥンノードは、最初入力ノード及び最後出力ノードではなく神経網を構成するノードを意味することができる。
本明細書において、データを人工神経網モデルに「入力」することは、前記最初入力ノードにある値が入力されることを意味する。本明細書において、人工神経網から「値の獲得」、「データ出力」、「情報の獲得」などは、前記最後出力ノードからあるデータが出力されることを意味する。
ディープニューラルネットワーク(DNN:deep neural network、深層神経網)は、入力レイヤーと出力レイヤーの以外に複数のヒドゥンレイヤーを含む神経網を意味することができる。ディープニューラルネットワークは、畳み込みニューラルネットワーク(CNN:convolutional neural network)、回帰型ニューラルネットワーク(RNN:recurrent neural network)、オートエンコーダ(auto encoder)、GAN(Generative Adversarial Networks)、制限ボルツマンマシン(RBM:restricted boltzmann machine)、深層信念ネットワーク(DBN:deep belief network)、Qネットワーク、Uネットワーク、シャムネットワーク、敵対的生成ネットワーク(GAN:Generative Adversarial Network)などを含むことができる。前述のディープニューラルネットワークの記載は例示であるだけで、本開示はこれに制限されない。
ニューラルネットワークは、教師あり学習(supervised learning)、教師なし学習(unsupervised learning)、半教師あり学習(semisupervised learning)、又は強化学習(reinforcement learning)のうち少なくとも1つの方式で学習されることができる。ニューラルネットワークの学習は、ニューラルネットワークが特定の動作を行うための知識をニューラルネットワークに適用する過程であってよい。
ニューラルネットワークは、出力のエラーを最小化する方向に学習されることができる。ニューラルネットワークの学習で繰り返し学習データをニューラルネットワークに入力させ、学習データに対するニューラルネットワークの出力とターゲットのエラーを計算し、エラーを減らすための方向にニューラルネットワークのエラーをニューラルネットワークの出力レイヤーから入力レイヤー方向に逆伝播(backpropagation)してニューラルネットワークの各ノードの加重値をアップデートする過程である。教師あり学習の場合、それぞれの学習データに正解がラベリングされている学習データを使用し(すなわち、ラベリングされた学習データ)、教師なし学習の場合は、それぞれの学習データに正解がラベリングされていない可能性がある。すなわち、例えば、データ分類に関する教師あり学習の場合の学習データは、学習データそれぞれにカテゴリーがラベリングされたデータであってよい。ラベリングされた学習データがニューラルネットワークに入力され、ニューラルネットワークの出力(カテゴリー)と学習データのラベルとを比較することでエラー(error)が計算されることができる。他の例として、データ分類に関する教師なし学習の場合、入力である学習データがニューラルネットワーク出力と比較されることでエラーが計算されることができる。計算されたエラーは、ニューラルネットワークで逆方向(すなわち、出力レイヤーから入力レイヤー方向)に逆伝播され、逆伝播によってニューラルネットワークの各レイヤーの各ノードの連結加重値がアップデートされることができる。アップデートされる各ノードの連結加重値は、学習率(learning rate)によって変化量が決定されることができる。入力データに対するニューラルネットワークの計算とエラーの逆伝播は、学習サイクル(epoch)を構成することができる。学習率は、ニューラルネットワークの学習サイクルの繰り返し回数によって異なって適用されることができる。例えば、ニューラルネットワークの学習初期には、高い学習率を使用してニューラルネットワークが早く一定の水準の性能を確保するようにして効率性を高め、学習後期には、低い学習率を使用して正確度を高めることができる。
本明細書において、人工神経網モデルの「学習」とは、前記ニューラルネットワークは出力のエラーが最小化されるように各ノードの連結加重値をアップデートすることを意味し、特定学習方法によって本明細書による「学習」が制限されない。
本明細書において、「プロセッサ」は1つ以上のコアで構成されることができ、コンピューティング装置の中央処理装置(CPU:central processing unit)、汎用グラフィック処理装置(GPGPU:general purpose graphics processing unit)、テンソル処理装置(TPU:tensor processing unit)などのデータ分析、ディープラーニングのためのプロセッサを含むことができる。プロセッサは、メモリに保存されたコンピュータプログラムを読み取り、本明細書の一実施形態に係る機械学習のためのデータ処理を行うことができる。本明細書の一実施形態によってプロセッサは神経網の学習のための演算を行うことができる。プロセッサは、ディープラーニング(DL:deep learning)で学習のための入力データの処理、入力データにおける特徴抽出、誤差計算、逆伝播(backpropagation)を利用した神経網の加重値アップデートなどの神経網の学習のための計算を行うことができる。プロセッサのCPU、GPGPU、及びTPUのうち少なくとも1つがネットワーク関数の学習を処理することができる。例えば、CPUとGPGPUが一緒にネットワーク関数の学習、ネットワーク関数を利用したデータ分類を処理することができる。また、本明細書の一実施形態において、複数のコンピューティング装置のプロセッサを一緒に使用してネットワーク関数の学習、ネットワーク関数を利用したデータ分類を処理することができる。また、本明細書の一実施形態に係るコンピューティング装置で行われるコンピュータプログラムは、CPU、GPGPU又はTPU実行可能プログラムであってよい。
以下、添付の図面を参照して本発明の実施形態を詳細に説明する。
図1は、少なくとも1つのカメラで対象者を撮影する場面を図示した参考図である。
図1を参照すれば、本明細書の一実施形態に係る平衡機能管理システムは、n(自然数)個のカメラを通して対象者を撮影したn個の動画を利用して対象者の頭の動き及び眼球の動き情報を生成することができる。
前記n個のカメラは、予め設定された位置に設置されて対象者の顔を撮影することができる。前記n個のカメラは、互いに異なる角度で対象者を撮影することができる。
一例として、1個のカメラが対象者の正面に設置されて対象者の顔を撮影することができる。対象者の正面は、体の前面が向かう方向を意味することができる。
他の例として、2個のカメラが予め設定された位置に設置されて対象者の顔を撮影することができる。このとき、2個のカメラのうち1台は対象者の正面の左側で対象者の顔を撮影し、残りの1台のカメラは対象者の正面の右側で対象者の顔を撮影することができる。
また他の例として、3個のカメラが予め設定された位置に設置されて対象者の顔を撮影することができる。このとき、3個のカメラのうち一台は対象者の正面に設置され、他の一台は対象者の正面の左側に設置され、また他の一台は対象者の正面の右側に設置されて対象者の顔を撮影することができる。
前記カメラの個数及び位置は一例に該当し、これに制限されず、カメラの個数、位置、対象者との距離などによってn個のカメラが様々な方向及び距離で対象者を撮影することができる。
前記平衡機能管理システムは、前記n個のカメラから対象者を撮影した動画データを入力されることができる。前記平衡機能管理システムは、入力された動画データをディスプレイ装置に示すことができる。前記平衡機能管理システムは、第m(1からnまでの自然数)カメラが対象者を撮影した第m動画をディスプレイ装置にそれぞれ示すことができる。以下において、第m動画は、第1動画から第n動画までのすべての動画を意味することができる。
前記平衡機能管理システムは、入力されたn個の動画を利用して対象者の頭及び眼球の動きと関連した情報を生成することができる。前記平衡機能管理システムは、頭及び眼球の動きと関連した情報をディスプレイ装置に示すことができる。また、前記平衡機能管理システムは、頭及び眼球の動きと関連した情報を利用して頭及び眼球の動き速度と関連した情報を生成し、ディスプレイ装置に示すことができる。
図1のディスプレイ装置に示される画面は一例に該当し、前記画面により制限されない。
図2は、端末機に含まれたカメラで対象者を撮影する場面を図示した参考図である。
図2を参照すれば、本明細書の他の実施形態によれば、前記平衡管理システムは、スマートフォン(Smart Phone)、タブレットコンピュータ(Tablet Computer)などの端末機の前面カメラ(図2の左側)及び/又は後面カメラ(図2の右側)を通して撮影された動画を利用して頭及び眼球の動きと関連した情報を生成することができる。前記端末機の後面カメラを利用して対象者を撮影するとき、前記平衡管理システムは、前記端末機の後面に含まれた少なくとも1つ以上のカメラで撮影された映像をディスプレイ装置にそれぞれ示すことができる。前記平衡管理システムは、前記端末機の後面に含まれた少なくとも1つ以上のカメラで撮影されたそれぞれの動画で対象者の頭及び眼球の動きと関連した情報を生成することができる。
前記端末機の前面カメラ及び/又は後面カメラで撮影された映像は、端末機のディスプレイ及び/又は前記端末機と連結されたディスプレイ装置に示されることができる。
図2に図示された端末機の前面カメラ及び/又は後面カメラの個数、位置、端末機の方向は一例に該当し、これに制限されない。また、対象者を撮影する少なくとも1つのカメラがさらに設置されることができる。
本明細書による平衡機能管理システムは、コンピュータ(Computer)、ラップトップ(Laptop)、スマートフォン及び/又はタブレットコンピュータなどのコンピューティングデバイス(Computing Device)の形態で実現されることができ、これは一例に該当し、前記デバイスにより制限されない。
対象者は、コンピューティングデバイスに含まれたカメラ及び/又はコンピューティングデバイスと有線及び/又は無線で連結されるカメラを通して撮影されることができる。前記カメラは、ウェブカム、アクションカメラなど様々な種類のカメラが使用されることができ、これは一例に該当し、前記カメラにより制限されない。
前記平衡機能管理システムは、ビデオ頭部衝動検査(Video Head Impulse Test)、自発眼振検査(Spontaneous Nystagmus)、断続性運動検査(Saccade Test)などを行う対象者を撮影したn個の動画を利用して対象者の平衡機能状態と関連した情報を生成することができ、これは一例に該当し、前記検査により制限されない。
以下においては、本明細書の第1実施形態に係る平衡機能管理システムについて説明する。本明細書の第1実施形態によれば、平衡機能管理システムは少なくとも1つのカメラを利用して対象者を撮影した少なくとも1つの動画を利用して対象者の頭及び眼球の動き情報を生成して、平衡機能状態情報生成及び/又は平衡機能リハビリテーションプログラムを行うことができる。
本明細書の第1実施形態に係る平衡機能管理システムは、少なくとも1つ以上のプロセッサ及び前記プロセッサで遂行可能な命令を保存し、コンピューティングデバイスで実行される少なくとも1つの人工神経網モデルを保存したメモリを含むことができる。
前記平衡機能管理システムは、前記少なくとも1つのプロセッサがn個のカメラを通して対象者を撮影したn個の動画フレームの画像を少なくとも1つの人工神経網モデルに入力してフレーム画像(Frame Image)の順による対象者の頭座標、瞳孔中心座標及び眼球の位相変化と関連した情報のうち少なくとも1つを獲得することができる。前記少なくとも1つのプロセッサは、前記情報を利用して頭の動き情報及び眼球の動き情報を生成することができる。
図3は、本明細書の第1実施形態に係る平衡機能管理システムのブロック図である。
図3を参照すれば、本明細書の第1実施形態に係る平衡機能管理システム10は、メモリ100、頭座標学習部110、眼球座標学習部120、及び眼球回転学習部130、頭座標獲得部140、眼球座標獲得部150、及び位相変化獲得部160を含むことができる。
前記メモリ100は、頭座標と関連した情報を生成する第1人工神経網モデル、瞳孔中心座標と関連した情報を獲得する第2人工神経網モデル及び眼球の位相変化と関連した情報を獲得する第3人工神経網モデルのうち少なくとも1つを保存することができる。
本明細書の一実施形態によれば、前記第1人工神経網モデルは、前記頭座標学習部110によって、人の顔が撮影された少なくとも1つの動画のフレーム画像から抽出された顔の特徴点(Feature Point)及び特徴点の座標を学習データとして利用して学習されることができる。
前記頭座標学習部110は、人の顔が撮影された少なくとも1つの動画を利用して、前記第1人工神経網モデルを学習させることができる。前記人の顔が撮影された少なくとも1つの動画は、撮影された人が頭を回転する姿を撮影した動画であってよい。
一例として、前記人の顔が撮影された動画は、1つのカメラで撮影されることができる。前記人の顔が撮影された動画は、人の顔全体画像が含まれることができる。前記人の顔が撮影された動画は、撮影された人の顔が正面に向かう状態で頭を左右に動かす場面が撮影された映像であってよい。また、前記人の顔が撮影された動画は、撮影された人の顔が正面に向かう状態で頭を上下に動かす場面が撮影された映像であってよい。人の顔が正面に向かう状態は、人の視線方向と体の前面方向が一致する状態であってよい。
また、前記人の顔の撮影された動画は、撮影された人が頭を右に回した後に頭を上下に動かす場面が撮影された映像であってよい。また、前記人の顔が撮影された動画は、撮影された人が頭を左側に回した後に上下に動かす場面が撮影された映像であってよい。
また、前記人の顔が撮影された動画は、撮影された人が特定注視点を見つめた状態で頭を回転する場面が撮影された映像であってよい。
人の顔が撮影された動画は、人の正面に設置されたカメラによって撮影されることができる。又は、人の顔が撮影された動画は、人の正面の左側、右側、左上側、右上側など様々な位置で様々な角度で設置されたカメラによって撮影されることができる。
また、前記人の顔が撮影された動画は、複数個のカメラを通して撮影されることができる。前記複数個のカメラは、様々な位置及び角度で設置されて人を撮影することができる。複数個のカメラを通して撮影された動画は、同じ状況を複数個のカメラで撮影した動画を意味することができる。
前記人の顔が撮影された動画は、カメラの仕様がすべて同じカメラで撮影されることができる。また、前記人の顔が撮影された動画は、互いに異なる仕様を持つカメラで撮影された動画であってよい。また、前記人の顔が撮影された動画は、互いに異なる設定値を持つカメラで撮影された動画であってよい。
以上で説明された人が撮影された動画は一例に該当し、人の頭及び眼球が撮影された動画又は人の頭が撮影されたすべての動画が利用されることができる。また、特定カメラ仕様、設定などにより制限されない。
好ましくは、前記人が撮影された動画は、同じ設定値を持つカメラで撮影された動画であってよい。
前記頭座標学習部110は、前記人の顔が撮影された動画の各フレーム画像から人の顔に対する特徴点を抽出することができる。一例として、前記頭座標学習部110は、前記各フレーム画像から人の顔に位置した特徴点を抽出することができる。一例として、前記特徴点は、人の鼻先、左側外眼角(左側目元で最も外側まぶたが会う箇所)、右側外眼角(右側目元で最も外側の部分まぶたが会う箇所)及び額に対する特徴点を含むことができる。前記特徴点は、人が目を瞬いても位置が変化しないことがある。前記特徴点は一例に該当し、前記特徴点により制限されず、従来の顔認識のために使用される特徴点がさらに含まれることができる。人の頭で特徴点及び特徴点座標を生成する技術は、当業者の間で広く知られている技術であるので、詳しい説明は省略する。
前記頭座標学習部110は、前記各フレーム画像から抽出した特徴点の座標情報を生成することができる。前記頭座標学習部110は、前記各フレーム画像から抽出した特徴点及び特徴点の座標を学習データとして利用して、各フレーム画像に対する3次元頭座標を生成するように第1人工神経網モデルを学習させることができる。前記3次元頭座標は、3次元標準頭モデルによる頭の3次元座標を意味することができる。前記頭の3次元座標は、頭のすべての特徴点に対する座標を含むことができる。頭の3次元座標は、各特徴点に対する索引番号と関連した内容を含むことができる。このとき、前記頭座標学習部110は、鼻先の特徴点を基準に索引番号を生成するように前記第1人工神経網モデルを学習させることができる。また、前記頭座標学習部110は、各フレーム画像から抽出された3次元座標を利用して、頭の動き情報をさらに生成するように学習させることもできる。
また、前記頭座標学習部110は、特徴点が抽出されたフレーム画像、3DMM(3D Morphable Model)、FLAME(Faces Learned with an Articulated Model and Expressions)モデルなどの3次元標準頭モデルに対するデータを学習データとしてさらに利用して前記第1人工神経網モデルを学習させることができ、これは一例に該当し、前記学習データにより制限されず、様々な学習データがさらに利用されることができる。
本明細書の一実施形態によれば、前記頭座標学習部110は、複数個のカメラを利用して人を撮影した複数個の動画から特徴点を抽出するとき、前記複数個の動画のシンク(sync)を調節した以後に特徴点を抽出することができる。前記頭座標学習部110は、前記複数個の動画の特定オーディオ信号、特徴点マッチング基盤同期化などのアルゴリズムを利用して複数個の動画のシンクを調節することができ、これは一例に該当し、これに制限されず、当業者の間で広く知られている様々な技術が利用されることができる。
本明細書の一実施形態によれば、前記頭座標学習部110は、予め設定された基準による座標値を持つ特徴点を学習データとして利用することができる。前記頭座標学習部110は、予め設定された基準による座標値を持つ特徴点を学習データとして選別することができる。
図4は、本明細書の一実施形態に係る平衡機能状態を検査及び/又は平衡機能リハビリテーションプログラムを行う対象者を撮影した場面に対する例示である。
図4を参照すれば、人が撮影された動画は、前記平衡機能管理システム10を利用して平衡機能状態検査及び/又は平衡機能リハビリテーションプログラムを行う動画であってよい。前記動画は、対象者200のみ撮影された動画であってよい。また、前記動画は、対象者200及び検査者201が撮影された動画であってよい。以下において、人が撮影された動画は、平衡機能状態検査及び/又は平衡機能リハビリテーションプログラムを行う動画を意味すると記載する。しかし、これは一例に該当し、前記動画により制限されない。
平衡機能状態検査を実施するとき、対象者200は椅子に座っている状態であり、検査者201は対象者の後ろに立っている状態であってよい。検査者201は医療専門家を意味することができる。前記平衡機能管理システム10は、対象者200の頭の動きによる眼球の動きを分析して対象者の平衡機能の異常有無を判断し、リハビリテーションプログラムを進めるために対象者200の頭の動き及び眼球の動きだけ分析することができる。
前記頭座標学習部110は、前記動画から対象者200の顔に対する特徴点及び特徴点の座標を抽出して、前記第1人工神経網モデルを学習させることができる。
以上で説明したように、対象者200は椅子に座っており、検査者201は立っている状態であるので、対象者200の顔から抽出された特徴点は、検査者201の顔から抽出された特徴点より相対的に下に位置することができる。これは、対象者200の顔から抽出された特徴点のy座標値が検査者201の顔から抽出された特徴点のy座標値より相対的に小さいことを意味することができる。
前記頭座標学習部110は、対象者200及び検査者201の顔から抽出された同じ部分の特徴点のうち相対的にy座標値が小さな特徴点を学習データとして抽出することができる。前記頭座標学習部110は、予め設定されたy座標値の下の領域に位置した特徴点を学習データとして抽出することができる。
また、前記頭座標学習部110は、対象者200及び検査者201の顔から抽出された特徴点をクラスタリングすることができる。以後に、前記頭座標学習部110は、相対的に下に位置する特徴点の集合を学習データとして抽出することができる。
図5は、本明細書の他の実施形態に係る平衡機能状態を検査及び/又は平衡機能リハビリテーションプログラムを行う対象者を撮影した場面に対する例示である。
図5を参照すれば、前記動画で対象者200’及び検査者201’がみんな立っている状態で平衡機能状態検査及び/又は平衡機能リハビリテーションプログラムが行われることができる。この場合、対象者200’の顔から抽出された特徴点は、検査者201’の顔から抽出された特徴点より相対的にディスプレイ画面の中心に近いことができる。前記頭座標学習部110は、ディスプレイ画面の中心点に対する座標値と相対的にさらに近い座標値を持つ特徴点を学習データとして抽出することができる。
また他の例として、対象者は、検査者よりカメラまでの実際距離が相対的にさらに近いことができる。これにより、前記動画で対象者の顔が検査者の顔より相対的にさらに広い領域を占めることができる。前記頭座標学習部110は、対象者の顔から抽出された特徴点の集合及び検査者の顔から抽出された特徴点の集合のうち相対的にさらに広い領域に分散された特徴点の集合を学習データとして抽出することができる。
以上で説明した頭座標学習部110が対象者の顔から抽出された特徴点のみ学習データとして抽出する過程は一例に該当し、これに制限されず、対象者の位置、検査者の位置、カメラの位置、角度などによって様々な基準が設定されることができる。また、対象者と検査者の顔の位置だけでなく、対象者と検査者を区別するためのマーカーなどを通じて対象者の顔から抽出された特徴点のみを学習データとして抽出することができる。よって、平衡機能状態検査及び/又はリハビリテーション検査プログラムを行う様々な状況に応じて様々な実施形態が生じることができる。
前記動画で対象者が頭を速く回転する場合、フレーム画像に対象者の顔が明確に撮影されない可能性がある。この場合、前記頭座標学習部110は、対象者の顔から特徴点を抽出することができない可能性がある。前記頭座標学習部110は、検査者の顔から抽出された特徴点を利用して前記第1人工神経網モデルを学習させ、前記第1人工神経網モデルが不正確な結果を算出することができる。
本明細書の一実施形態によれば、前記頭座標学習部110は、任意のフレーム画像より先立つフレーム画像から抽出された特徴点の座標を追跡することができる。以上で説明したように、任意のフレーム画像で対象者の顔から特徴点を抽出することができない場合、前記頭座標学習部110は、先立つフレーム画像における対象者の画像を利用して学習データを抽出することができる。前記先立つフレーム画像は、任意のフレーム画像より先立つフレーム画像のうち対象者の顔から特徴点を抽出することができる最も近いフレーム画像を意味することができる。
本明細書の一実施形態によれば、前記第2人工神経網モデルは、前記眼球座標学習部120によって、人の顔が撮影された動画フレーム画像で眼球が含まれた領域の画像である眼球領域画像を学習データとして利用して瞳孔中心の座標と関連した情報を生成するように学習されることができる。
前記眼球座標学習部120は、前記動画から対象者の眼球が含まれた領域の画像である対象者の眼球領域画像を抽出することができる。前記眼球座標学習部120は、各フレーム画像から抽出された対象者の眼球領域画像を学習データにして、前記第2人工神経網モデルが瞳孔中心の座標と関連した情報を生成するように学習させることができる。
図6は、本明細書の一実施形態に係る眼球領域画像を前処理する例示を図示した図面である。
図6を参照すれば、前記眼球座標学習部120は、各フレーム画像202に従って眼球領域画像203を抽出することができる。前記眼球座標学習部120は、各フレーム画像202で眼球領域のバウンディングボックス(Bounding Box)内部の画像を眼球領域画像203として抽出することができる。前記眼球座標学習部120は、前記眼球領域画像203で虹彩と瞳孔領域を分割することができる。人の顔から眼球領域を抽出し、虹彩と瞳孔領域を分割する技術は、当業者の間で広く知られている技術であるので、詳しい説明は省略する。
前記眼球座標学習部120は、まぶたによって虹彩及び/又は瞳孔が隠れた部分に対する領域を推定することができる。図6に図示されたように、虹彩の一部が上まぶた及び下まぶたによって隠れることができる。前記眼球座標学習部120は、楕円フィッティング(Ellipse Fitting)、ハフ変換(Circle Hough Transform)アルゴリズムなどを利用して隠れた部分を推定することができる。又は、前記眼球座標学習部120は、虹彩及び瞳孔領域を分割するように予め学習された人工神経網モデルを利用して虹彩及び瞳孔領域を分割することができる。これは一例に該当し、前記方式により制限されない。
前記眼球座標学習部120は、前記眼球領域画像203で虹彩及び/又は瞳孔領域が分割されたデータを利用して、前記第2人工神経網モデルを学習させることができる。一例として、前記眼球座標学習部120は、前記眼球領域画像203で虹彩及び/又は瞳孔領域を分割してマスク画像(Mask Image、204)を生成することができる。前記眼球座標学習部120は、前記眼球領域画像203で虹彩及び/又は瞳孔が占める領域と残り領域が互いに異なるピクセル値を持つマスク画像を生成することができる。前記マスク画像は、虹彩及び/又は瞳孔が占める領域が白色又は黒色で示されることができ、残り領域は黒色又は白色で示されることができ、これは一例に該当し、これに制限されない。
前記眼球座標学習部120は、前記マスク画像204を学習データにして、前記第2人工神経網モデルが瞳孔中心の座標と関連した情報を生成するように学習させることができる。又は、前記眼球座標学習部120は、前記マスク画像204の2次元ピクセル値を学習データにして、前記第2人工神経網モデルを学習させることができる。又は前記眼球座標学習部120は、前記マスク画像204及び2次元ピクセル値を学習データにして、前記第2人工神経網モデルを学習させることができる。
他の例として、前記眼球座標学習部120は、前記眼球領域画像203で虹彩及び/又は瞳孔領域を分割して示したヒートマップ(Heatmap)モデルを利用して、前記第2人工神経網モデルを学習させることができる。
前記眼球座標学習部120は、前記マスク画像及びヒートマップモデルのうち少なくとも1つを利用して、前記第2人工神経網モデルを学習させることができる。
本明細書の一実施形態によれば、前記眼球座標学習部120は、前記眼球領域画像203で眼球の特徴点及び特徴点の座標情報を生成し、予め設定された複数個の特徴点の座標を利用して前記瞳孔中心の水平座標値及び垂直座標値を生成するように前記第2人工神経網モデルを学習させることができる。前記眼球座標学習部120は、前記眼球領域画像203から抽出された複数個の特徴点の座標を利用して、正規化(Normalized)された瞳孔中心座標を抽出することができる。
前記複数個の特徴点座標は、眼球領域画像203でy軸座標が予め設定された範囲内にある特徴点のうちからx軸座標値が相対的に最も小さな特徴点、x軸座標値が相対的に最も大きい特徴点を含むことができる。
前記複数個の特徴点座標は、人の正面で撮影された眼球領域画像203でx軸座標が予め設定された範囲内にある特徴点のうちからy軸座標値が相対的に最も小さな特徴点及びy軸座標値が相対的に最も大きい特徴点を含むことができる。
一例として、前記眼球座標学習部120は、前記眼球領域画像203から抽出された特徴点のうち内眼角に対する特徴点203-1及び外眼角に対する特徴点203-2を利用して、正規化された瞳孔中心の水平座標を抽出することができる。前記眼球座標学習部120は、内眼角に対する特徴点203-1及び外眼角に対する特徴点203-2を連結した線分を瞳孔中心座標に対する水平軸として利用することができる。内眼角に対する特徴点203-1のx座標と外眼角に対する特徴点203-2のx座標は、水平軸の両極値に該当することができる。内眼角に対する特徴点203-1のx座標と外眼角に対する特徴点203-2のx座標との差は、水平軸全体の長さを意味することができる。前記眼球座標学習部120は、前記水平軸全体の長さ対比瞳孔中心の水平座標値を利用して、正規化された瞳孔中心の水平座標を算出することができる。
また、前記眼球座標学習部120は、前記眼球領域画像203から抽出された特徴点のうち上眼瞼及び下眼瞼と関連した特徴点を利用して、正規化された瞳孔中心の垂直座標を抽出することができる。このとき、上眼瞼と関連した特徴点は、眼球から抽出された特徴点のうち相対的にy軸座標が最も大きい特徴点203-3が利用されることができる。以下において、前記特徴点203-3を上眼瞼特徴点と称する。
下眼瞼と関連した特徴点は、眼球から抽出された特徴点のうち相対的にy軸座標が最も小さな特徴点203-4が利用されることができる。以下において、前記特徴点203-4を下眼瞼特徴点と称する。
前記眼球座標学習部120は、前記上眼瞼特徴点203-3及び下眼瞼特徴点203-4を連結した線分を瞳孔中心座標に対する垂直軸として利用することができる。上眼瞼特徴点203-3のy座標と下眼瞼特徴点203-4のy座標は、垂直軸の両極値に該当することができる。上眼瞼特徴点203-3のy座標と下眼瞼特徴点203-4のy座標との差は、垂直軸全体の長さを意味することができる。前記眼球座標学習部120は、前記垂直軸全体の長さ対比瞳孔中心の垂直座標値を利用して、正規化された瞳孔中心の水平座標を算出することができる。これは一例に該当し、前記特徴点により制限されない。
図6において、前記内眼角に対する特徴点203-1と外眼角に対する特徴点203-2は同じ水平線上に位置したと図示し、上眼瞼特徴点203-3及び下眼瞼特徴点203-4は同じ垂直線上に位置したと図示した。しかし、これは、カメラの撮影角度、人の頭角度などによって変わることができる。
一例として、前記眼球領域画像203を基準に時計回りに30°だけ回転された眼球領域画像である場合、前記内眼角に対する特徴点203-1と外眼角に対する特徴点203-2は同じ水平線上に位置せず、上眼瞼特徴点203-3及び下眼瞼特徴点203-4は同じ垂直線上に位置しないことがある。このような場合、前記眼球座標学習部120は、前記回転された眼球領域画像で前記内眼角に対する特徴点203-1と外眼角に対する特徴点203-2が同じ水平線上に位置し、上眼瞼特徴点203-3及び下眼瞼特徴点203-4が同じ垂直線上に位置するように画像を変換することができる。このとき、 前記眼球座標学習部 120は、アフィン変換(Affine Transform)などを利用して前記回転された眼球領域画像を変換することができ、これは一例に該当し、これに制限されない。
前記眼球座標学習部120は、前記生成された正規化された瞳孔中心の水平座標値及び垂直座標値を学習データとしてさらに利用して、前記第2人工神経網モデルを学習させることができる。
また、前記眼球座標学習部120は、複数個のカメラで撮影された複数個の動画のフレーム画像を利用して瞳孔中心の水平座標値及び垂直座標値を生成することができる。前記複数個の動画は、シンクが合わせられた動画であってよい。前記眼球座標学習部120は、複数個の動画でシンクが互いに合う複数個のフレーム画像から算出された瞳孔中心の水平座標値及び垂直座標値の平均値を計算することができる。前記眼球座標学習部120は、前記瞳孔中心の水平座標値及び垂直座標値の平均値を学習データとしてさらに利用して、前記第2人工神経網モデルを学習させることができる。これにより、前記第2人工神経網モデルは、より正確な瞳孔中心座標と関連した情報を生成することができる。前記瞳孔中心座標と関連した情報は、各フレーム画像による瞳孔中心の垂直座標値、水平座標値、瞳孔中心の垂直方向への動き情報、水平方向への動き情報などを含むことができる。前記瞳孔中心座標と関連した情報は、2次元座標に対する内容を含むことができる。
前記眼球座標学習部120は、前記フレーム画像から左眼と右眼に対する眼球領域画像を抽出して、左眼の瞳孔中心座標と関連した情報及び右眼の瞳孔中心座標と関連した情報を生成するように前記第2人工神経網モデルを学習させることができる。
本明細書の他の実施形態によれば、前記メモリ100は、少なくとも1つの仮想オブジェクトのデータを保存することができる。前記第2人工神経網モデルは、前記眼球座標学習部120によって、仮想オブジェクトのパラメーター(Parameter)の頭回転、眼球回転及びカメラ設定と関連したパラメーターのうち少なくとも1つを変更したパラメーター値及び前記パラメーター値に従って獲得した仮想オブジェクトの画像を含む学習データを利用して、瞳孔中心の座標と関連した情報を生成するように学習されることができる。
図7は、本明細書の他の実施形態に係る第2人工神経網モデルの学習データを生成する例示を図示した図面である。
図7を参照すれば、前記眼球座標学習部120は、仮想オブジェクトの頭回転、眼球回転及びカメラ設定と関連したパラメーターのうち少なくとも1つを変更することができる。一例として、前記眼球座標学習部120は、仮想のカメラが仮想のオブジェクトを正面で撮影(図7の上側図面)するようにパラメーター値を設定することができる。前記眼球座標学習部120は、仮想のカメラが仮想のオブジェクトを右側で撮影(図7の下側図面)するようにパラメーター値を変更することができる。また、前記眼球座標学習部120は、仮想のカメラと仮想のオブジェクトとの間の距離に対するパラメーター値を変更することができる。
前記眼球座標学習部120は、仮想のオブジェクトの頭がロール(Roll)、ピッチ(Pitch)及びヨー(Yaw)のうち少なくともいずれか1つの方向に回転するようにパラメーター値を設定することができる。
前記眼球座標学習部120は、仮想のオブジェクトの眼球がロール、ピッチ及びヨーのうち少なくともいずれか1つの方向に回転するようにパラメーター値を設定することができる。
前記眼球座標学習部120は、前記パラメーターのうち少なくともいずれか1つを変更し、前記仮想オブジェクトの画像を獲得することができる。前記眼球座標学習部120は、前記パラメーター値及びパラメーター値による仮想オブジェクトを利用して、前記第2人工神経網モデルを学習させることができる。このとき、前記第2人工神経網モデルを瞳孔中心の2次元座標及び/又は3次元座標に対する情報を生成するように学習されることができる。
前記仮想のオブジェクトは、3Dガウシアンスプラッター(3D Gaussian Splatter)を利用して生成されたガウシアンアバター(Gaussian Avatar)を意味することができる。前記眼球座標学習部120は、前記仮想のオブジェクトの潜在ベクトル(Latent Vector)を制御して仮想オブジェクトの頭と瞳孔のオイラー(Euler)座標を変更することができる。前記ガウシアンアバターは一例に該当し、これに制限されず、当業者の間で広く知られている技術で生成された仮想のオブジェクトが利用されることができる。
また、前記メモリ100は、人の顔が撮影された画像によって頭座標、瞳孔中心座標及びカメラ設定と関連した情報のうち少なくとも1つを含むラベリング(Labeling)データを保存することができる。前記眼球座標学習部120は、前記データを利用して、前記第2人工神経網モデルを学習させることができる。
また、前記眼球座標学習部120は、前記眼球領域画像を利用した学習データ、前記仮想オブジェクトのパラメーター変化に従って獲得した学習データ及びラベリングデータのうち少なくとも1つを利用して、前記第2人工神経網モデルを学習させることができる。
本明細書の一実施形態によれば、前記第3人工神経網モデルは、前記眼球回転学習部130によって、人の顔が撮影された動画の各フレーム画像から抽出された眼球が含まれた領域の画像である眼球領域画像が抽出されることができる。前記眼球回転学習部130は、前記眼球領域画像の時間順によって生成された眼球位相変化と関連した情報を含む学習データを利用して、眼球の回転値を生成するように前記第3人工神経網モデルを学習することができる。
前記眼球回転学習部130は、前記動画の各フレーム画像から前記眼球領域画像を抽出することができる。前記眼球回転学習部130は、任意のフレーム画像から抽出された眼球領域画像を該当フレーム画像を基準に予め設定された時間範囲内のフレーム画像から抽出された眼球領域画像と比較して眼球位相変化と関連した情報を生成することができる。一例として、前記眼球回転学習部130は、任意のフレーム画像から抽出された眼球領域画像を該当フレーム画像を基準に0.1秒前後で獲得したフレーム画像から抽出された眼球領域画像と比較して眼球の位相変化と関連した情報を生成することができる。これは一例に該当し、前記時間により制限されない。
本明細書の一実施形態によれば、前記眼球回転学習部130は、前記眼球領域画像で虹彩が占める領域の画像である虹彩領域画像を抽出することができる。前記虹彩領域画像は、前記眼球領域画像で虹彩を含むバウンディングボックス内の画像を意味することができる。前記眼球回転学習部130は、前記虹彩領域画像の時間順による虹彩の位相変化と関連した情報を利用して、前記第3人工神経網モデルを学習させることができる。
さらに詳しくは、前記眼球回転学習部130は、任意のフレーム画像から抽出された虹彩領域画像を任意のフレーム画像を基準に予め設定された時間範囲内のフレーム画像から抽出された虹彩領域画像と比較することができる。一例として、前記虹彩領域画像は、虹彩が占める領域が他の領域と異なるピクセル値に区分されたマスク画像であってよく、これは一例に該当し、これに制限されない。
また、前記眼球回転学習部130は、前記眼球座標学習部120で生成された虹彩のマスク画像を利用して位相変化と関連した情報を生成することができる。
前記眼球回転学習部130は、任意のフレーム画像から抽出された虹彩領域画像と他の虹彩領域画像とのピクセル値を比較して虹彩の位相の変化と関連した情報を生成することができる。前記眼球回転学習部130は、位相交差相関分析(Phase Cross Correlation)を利用して任意のフレーム画像から抽出された虹彩領域画像と他の虹彩領域画像とのピクセル値に対する位相交差相関関係値を生成することができる。前記位相交差相関分析を利用して算出される位相の変化と関連した情報は、虹彩の角度変化に対する内容を含むことができる。
前記眼球回転学習部130は、速いフーリエ変換(Fast Fourier Transform、FFT)でアップサンプリング(UPsampling)された交差相関の値を求める方法で前記位相交差相関関係値を生成することができる。前記眼球回転学習部130は、FFTを利用して交差相関ピーク初期推定値を算出した後、推定値を基準に予め設定された領域で離散フーリエ変換(Discrete FFT、DFT)でアップサンプリングされた信号の位相移動を精密に推定して前記位相交差相関関係値を生成することができる。これは一例に該当し、前記方式により制限されない。
前記眼球回転学習部130は、前記虹彩領域の画像及び位相交差相関関係値を学習データとして利用して、前記第3人工神経網モデルを学習させることができる。
本明細書の一実施形態によれば、前記眼球回転学習部130は、第m動画のフレーム画像から抽出された眼球領域画像で瞳孔が占める領域のサイズを算出することができる。前記眼球回転学習部130は、予め設定された基準によってターゲット眼球領域画像のサイズを調節することができる。前記ターゲット眼球領域画像は、任意のフレーム画像から抽出された眼球領域画像を意味し、特定眼球領域画像を称する用語ではない。
前記眼球回転学習部130は、任意のフレーム画像から抽出されたターゲット眼球領域画像とすぐ先立つフレーム画像から抽出された先立つ眼球領域画像から算出された瞳孔が占める領域のサイズを比較することができる。前記眼球回転学習部130は、前記ターゲット眼球領域画像から抽出された瞳孔が占める領域のサイズが前記先立つターゲット眼球領域画像から抽出された瞳孔が占める領域のサイズと予め設定された差異値以内の値を持つように、前記ターゲット眼球領域画像のサイズを調節することができる。前記眼球回転学習部130は、各眼球領域画像のサイズを調節した以後に、前記位相交差相関関係値を算出することができる。
また、前記眼球回転学習部130は、前記フレーム画像で眼球が含まれた領域のバウンディングボックスを生成することができる。前記眼球回転学習部130は、前記バウンディングボックス内から瞳孔中心を抽出することができる。又は、前記眼球回転学習部130は、前記第2人工神経網モデルで生成された瞳孔中心の座標と関連した情報を入力されることができる。
前記眼球回転学習部130は、前記瞳孔中心が前記バウンディングボックスの中心に位置するようにバウンディングボックスを調節することができる。前記眼球回転学習部130は、調節されたバウンディングボックス内部の画像を眼球領域画像として抽出することができる。前記眼球回転学習部130は、前記記載された方式に従って眼球領域画像のサイズを調節した以後に前記虹彩領域画像を抽出して前記位相交差相関関係値を算出することができる。
前記眼球回転学習部130は、前記虹彩領域画像及び位相交差相関関係値を利用して、前記第3人工神経網モデルが眼球の回転値を生成するように学習させることができる。前記眼球の回転値は、眼球の中心軸を基準に時計回り又は反時計回りに回転された角度を意味することができる。
前記眼球回転学習部130は、前記フレーム画像から左眼と右眼に対する眼球領域画像を抽出して、左眼と右眼の位相変化と関連した情報を生成するように前記第3人工神経網モデルを学習させることができる。
本明細書の一実施形態によれば、前記眼球座標学習部120は、前記第1人工神経網モデルで生成された情報を利用して、前記第2人工神経網モデルを学習させることができる。また、前記眼球回転学習部130は、前記第2人工神経網モデルで生成された情報を利用して、前記第3人工神経網モデルを学習させることができる。
一例として、前記眼球座標学習部120は、前記第1人工神経網モデルに入力された複数個のフレーム画像及び各フレーム画像から抽出された頭座標と関連した情報を利用して学習データを生成することができる。前記眼球座標学習部120は、前記各フレーム画像及び各フレーム画像から抽出された頭座標と関連した情報を利用して、各フレーム画像で眼球領域画像を生成することができる。前記眼球座標学習部120は、前記頭座標と関連した情報で眼球座標と関連した情報を利用して、各フレーム画像で眼球領域画像を生成することができる。前記眼球座標学習部120は、以上で説明された過程に従って、前記第2人工神経網モデルを学習させることができる。
前記眼球回転学習部130は、前記第2人工神経網モデルで生成された各フレーム画像による瞳孔中心の座標と関連した情報をさらに利用して、前記第3人工神経網モデルを学習させることができる。また、前記眼球回転学習部130は、前記眼球座標学習部120で分割された虹彩及び/又は瞳孔の画像を利用して、以上で説明された過程に従って学習データを生成して、前記第3人工神経網モデルを学習させることができる。
前記第1~第3人工神経網モデルは、互いに独立して学習されることができ、各人工神経網モデルで生成された情報を利用して学習されることもできる。
以下においては、第1実施形態に係る前記平衡機能管理システム10が学習された人工神経網モデルを利用して、平衡機能状態情報生成及び平衡機能リハビリテーションプログラムを行う過程について説明する。
前記平衡機能管理システム10は、n個のカメラから平衡機能状態検査及び/又は平衡機能リハビリテーションプログラムを行う対象者を撮影するn個の動画のフレーム画像をリアルタイムで獲得することができる。
1つのカメラで前記対象者を撮影するとき、カメラは予め設定されたFPS(Frames Per Second)以上の値に設定されることができる。一例として、1つのカメラは240FPSで前記対象者を撮影することができ、これは一例に該当し、前記数値により制限されない。
複数個のカメラで前記対象者を撮影するとき、前記平衡機能管理システム10は少なくとも1つのプロセッサを介して複数個のカメラのシンクを調節することができる。一例として、前記少なくとも1つのプロセッサは、ゲンロック(Genlock)などの技術を利用して複数個のカメラのシンクをリアルタイムで調節することができ、これは一例に該当し、当業者の間で広く知られている技術を通じて複数個のカメラのシンクを調節することができる。
また、前記平衡機能管理システム10は、少なくとも1つのプロセッサを介して複数個のカメラのフレーム画像をサンプリングすることができる。一例として、1つのカメラは100FPSで前記対象者を撮影し、他の1つのカメラは50FPSで前記対象者を撮影することができる。この場合、前記平衡機能管理システム10は少なくとも1つのプロセッサを利用して100FPSで撮影された動画を1/2倍ダウンサンプリング(Down Sampling)するか、50FPSで撮影された動画を2倍アップサンプリングすることができる。これは一例に該当し、これに制限されない。
好ましくは、同じフレームレートを持つ複数個のカメラで前記対象者を撮影することができる。
前記平衡機能管理システム10は、前記第1~第3人工神経網モデルのうち少なくとも1つを利用して、対象者の頭座標、瞳孔中心座標及び眼球の位相変化と関連した情報のうち少なくとも1つを獲得することができる。
前記平衡機能管理システム10は、前記頭座標、瞳孔中心座標及び/又は眼球の位相変化と関連した情報を前記第1~第3人工神経網モデルを利用して獲得することができる。
また、前記平衡機能管理システム10は、少なくとも1つのプロセッサが以上で説明された前記第1~第3人工神経網モデルの学習データを生成するアルゴリズムを利用して、前記頭座標、瞳孔中心座標及び眼球の位相変化と関連した情報を生成することもできる。
以下においては、前記第1~第3人工神経網モデルを利用して、前記頭座標、瞳孔中心座標及び眼球の位相変化と関連した情報を生成すると説明する。しかし、前記情報を生成するために、必ずしも人工神経網モデルを利用しなければならないものではない。
前記頭座標獲得部140は、前記メモリ100に保存された前記第1人工神経網モデルを実行させ、第m動画のフレーム画像を前記第1人工神経網モデルに入力して、第m動画による頭座標と関連した情報を獲得することができる。第m動画による頭座標と関連した情報は、第m動画のフレーム画像の順によって生成された頭座標と関連した情報を意味することができる。
一例として、2個のカメラで前記対象者を撮影するとき、前記頭座標獲得部140は、第1動画のフレーム画像の順による頭座標と関連した情報及び第2動画のフレーム画像の順による頭座標と関連した情報を獲得することができ、これは一例に該当し、前記カメラ及び動画の個数により制限されない。
複数個のカメラで前記対象者を撮影するとき、前記頭座標獲得部140は、第m動画のフレーム画像を独立して、前記第1人工神経網モデルに入力することができる。又は、前記頭座標獲得部140は、第m動画のフレーム画像を順次に前記第1人工神経網モデルに入力することができる。
一例として、2個のカメラで前記対象者を撮影するとき、前記頭座標獲得部140は、第1動画のフレーム画像を前記第1人工神経網モデルに入力することができる。以後に、前記頭座標獲得部140は、第2動画のフレーム画像を前記第1人工神経網モデルに入力することができる。
又は、前記頭座標獲得部140は、第2動画のフレーム画像を前記第1人工神経網モデルに入力した以後に、第1動画のフレーム画像を前記第1人工神経網モデルに入力することができる。
前記頭座標獲得部140は、第m動画のフレーム画像を予め決められた順によって順次に前記第1人工神経網モデルに入力することができる。一例として、前記頭座標獲得部140は、第1動画の一番目のフレーム画像を前記第1人工神経網モデルに入力し、第2動画の一番目のフレーム画像を前記第1人工神経網モデルに入力することができる。以後に、前記頭座標獲得部140は、第1動画の二番目のフレーム画像を前記第1人工神経網モデルに入力し、第2動画の二番目のフレーム画像を前記第1人工神経網モデルに入力することができ、これは一例に該当し、前記順序により制限されない。このとき、前記第1人工神経網モデルに入力されるフレーム画像は、抽出された動画の情報を含むことができる。
前記眼球座標獲得部150は、前記メモリ100に保存された第2人工神経網モデルを実行させ、前記頭座標と関連した情報を前記第2人工神経網モデルに入力して、第m動画による瞳孔中心座標と関連した情報を獲得することができる。第m動画による瞳孔中心座標と関連した情報は、第m動画のフレーム画像の順によって生成された瞳孔中心座標と関連した情報を意味することができる。
一例として、2個のカメラで前記対象者を撮影するとき、前記眼球座標獲得部150は、第1動画のフレーム画像の順による瞳孔中心座標と関連した情報及び第2動画のフレーム画像の順による瞳孔中心座標と関連した情報を獲得することができ、これは一例に該当し、前記カメラ及び動画の個数により制限されない。
前記位相変化獲得部160は、前記メモリ100に保存された第3人工神経網モデルを実行させ、前記第m動画のフレーム画像の時間順による瞳孔中心座標と関連した情報を前記第3人工神経網モデルに入力し、第m動画による眼球の位相変化と関連した情報を獲得することができる。第m動画による眼球の位相変化と関連した情報は、第m動画のフレーム画像の順によって生成された眼球の位相変化と関連した情報を意味することができる。
一例として、2個のカメラで前記対象者を撮影するとき、前記位相変化獲得部160は、第1動画のフレーム画像の順による眼球の位相変化と関連した情報及び第2動画のフレーム画像の順による眼球の位相変化と関連した情報を獲得することができ、これは一例に該当し、前記カメラ及び動画の個数により制限されない。
図8は、本明細書の一実施形態に係る平衡機能状態情報を生成するための平衡機能管理システムのブロック図である。
図8を参照すれば、本明細書の一実施形態に係る平衡機能状態情報を生成するための平衡機能管理システム10-1は、メモリ100、頭座標学習部110、眼球座標学習部120、眼球回転学習部130、頭座標獲得部140、眼球座標獲得部150、位相変化獲得部160、頭の動き生成部1100、眼球の動き生成部1110、速度情報生成部1120、及び平衡機能状態情報生成部1130を含むことができる。
前記メモリ100、頭座標学習部110、眼球座標学習部120、眼球回転学習部130、頭座標獲得部140、眼球座標獲得部150、及び位相変化獲得部160は以上で説明したので、繰り返しの説明は省略する。
前記頭の動き生成部1100は、前記第1人工神経網モデルから獲得した頭座標と関連した情報を利用して、第m動画における頭の動きと関連した情報を生成することができる。前記頭の動きと関連した情報は、時間による頭の水平方向への動き、垂直方向への動き、頭の回転程度などを含むことができる。前記頭の回転程度は、頭のロール、ピッチ及びヨー方向に対する回転角度を意味することができる。前記頭の動きと関連した情報は、時間による頭の水平座標値、垂直座標値のグラフで表現されることができる。
本明細書の一実施形態によれば、前記頭の動き生成部1100は、各フレーム画像で生成された頭の特徴点及び特徴点の座標を利用して、前記対象者の頭のノーマルベクトル(Normal Vector)を計算することができる。前記ノーマルベクトルの方向は、対象者の頭正面が向かう方向を意味することができる。対象者の頭の正面が向かう方向は、鼻先が向かう方向を意味することができる。前記頭の動き生成部1100は、頭の特徴点のうち鼻先の特徴点を基準に前記頭の特徴点を利用して頭のノーマルベクトルを計算することができる。
又は、対象者の頭の正面が向かう方向は、前記鼻先の特徴点を基準に垂直に一直線上にある任意の特徴点(額の端、唇の中心など)に向かう方向を意味することができる。前記頭の動き生成部1100は、前記任意の特徴点のうちいずれか1つを基準に頭のノーマルベクトルを計算することができる。
特徴点を利用して頭の正面に対するノーマルベクトルを計算することは当業者の間で広く知られている技術であるので、詳しい説明は省略する。
前記頭の動き生成部1100は、第m動画のフレーム画像による3次元頭座標情報及びノーマルベクトルを利用して、時間による頭の動きと関連した情報を生成することができる。前記頭の動き生成部1100は、前記頭の動きと関連した情報をグラフで出力することができる。
前記眼球の動き生成部1110は、第2人工神経網モデル及び第3人工神経網モデルで生成された瞳孔中心座標及び眼球の位相変化と関連した情報を利用して、第m動画における眼球の動きと関連した情報を生成することができる。前記眼球の動きと関連した情報は、時間による瞳孔中心の垂直方向の動き、水平方向の動き及び眼球の回転値と関連した情報を含むことができる。前記眼球の動きと関連した情報は、時間による左眼及び右眼の瞳孔中心の垂直座標値、水平座標値、回転角度に対するグラフで表現されることができる。
前記眼球の動き生成部1110は、瞳孔中心の垂直座標値、水平座標値及び回転値を利用して眼球の注視ベクトルを計算することができる。前記瞳孔中心の座標値及び回転値を利用して注視ベクトルを計算することは当業者の間で広く知られている技術であるので、詳しい説明は省略する。
前記眼球の動き生成部1110は、前記眼球の動きと関連した情報をグラフで出力することができる。
本明細書の一実施形態によれば、前記頭の動き生成部1100及び眼球の動き生成部1110は、学習データによる頭の動き及び眼球の動き情報と前記対象者の頭の動き及び眼球の動き情報の間の誤差を補正することができる。
前記学習データによる頭の動き及び眼球の動き情報は、前記人工神経網モデルを学習させるための実際データ値を意味することができる。
一例として、前記実際データ値は、前記眼球座標学習部120から獲得した頭と眼球のオイラー角度のパラメーター値を意味することができる。前記眼球座標学習部120は、平衡機能状態検査及び/又は平衡機能リハビリテーションプログラムにおける実際セッティングと類似するように仮想のカメラのパラメーター値を設定することができる。前記眼球座標学習部120は、平衡機能状態検査及び/又は平衡機能リハビリテーションプログラムによる対象者の頭及び眼球の動きと類似するように前記オイラー角度のパラメーター値を変更することができる。このとき、頭と眼球のパラメーター値の変更による仮想オブジェクトの頭及び眼球の動き情報が実際データ値を意味することができる。これは一例に該当し、前記実際データ値は、前記第1~第3人工神経網モデルを学習させるために使用されることができる実際データ値による頭及び眼球の動き情報を意味することができる。
前記頭の動き生成部1100及び眼球の動き生成部1110は、予め設定された時間内で獲得されたフレーム画像の間における頭の動き及び眼球の動きの誤差を補正することができる。一例として、予め設定された時間が1.5秒であり、カメラが100FPSで対象者を撮影するとき、前記頭の動き生成部1100及び眼球の動き生成部1110は150個のフレーム画像の間における前記頭の動き及び眼球の動きの誤差を補正することができる。これは一例に該当し、前記時間及びフレームレートにより制限されない。
前記頭の動き生成部1100及び眼球の動き生成部1110は、前記頭の動き及び眼球の動きの誤差が予め設定された範囲内の値を持つように補正することができる。
一例として、前記頭の動き生成部1100及び眼球の動き生成部1110は、カメラが100FPSで前記対象者を撮影した動画で150個のフレーム画像(任意のフレーム画像を基準に1.5秒間獲得したフレーム画像)から獲得した頭座標、瞳孔中心座標及び/又は眼球の位相変化と関連した情報を利用して頭の動き及び眼球の動きと関連した情報を生成することができる。前記頭の動き及び眼球の動きと関連した情報は、フレーム画像の順によって時間による頭及び眼球の動き(垂直、水平、回転)の量で算出されることができる。このとき、50番目のフレーム画像(任意のフレーム画像を基準に0.5秒以後に獲得したフレーム画像)に対応する時間の頭及び眼球の動きの量が予め設定された誤差範囲を逸脱することができる。この場合、前記頭の動き生成部1100及び眼球の動き生成部1110は、先立つフレーム画像における情報を利用して生成された頭及び眼球の動きの量の平均値又は中央値などの統計値を計算して、50番目のフレーム画像に対応する時間における動きの量を代替することができる。任意のフレーム画像を基準に1.5秒間獲得したフレーム画像の間で誤差を補正すると記載したが、これは一例に該当し、任意のフレーム画像を基準に1.5秒以前の時間に獲得したフレーム画像、1.5秒前後で獲得したフレーム画像など様々な実施形態が生じることができ、これは一例に該当し、前記時間、フレームレート、統計値などにより制限されない。
他の例として、前記頭の動き生成部1100及び眼球の動き生成部1110は、フィルター(Filter)を適用して前記頭及び眼球の動きの誤差を補正することができる。一例として、前記頭の動き生成部1100及び眼球の動き生成部1110は、Chaining Kalman Filter、Moving Average Filter、Savitzky-Golay filter、High Pass Filter、Low Pass Filter、Band Pass Filterなどのフィルターを利用して前記誤差を補正することができ、これは一例に該当し、これに制限されず、様々な種類のフィルターが使用されることができる。
前記速度情報生成部1120は、前記頭の動き及び眼球の動きと関連した情報を利用して、第m動画における頭と眼球の動き速度と関連した情報を生成することができる。前記速度情報生成部1120は、前記頭の動きと関連した情報を利用して、時間による頭の垂直方向動き速度、水平方向動き速度及び/又は頭の回転速度などを算出することができる。前記速度情報生成部1120は、前記眼球の動きと関連した情報を利用して、時間による眼球の垂直方向動き速度、水平方向動き速度及び/又は眼球の回転速度などを算出することができる。
本明細書の一実施形態によれば、前記速度情報生成部1120は、前記頭及び眼球の動き速度と関連した情報からノイズ(Noise)値をフィルタリングすることができる。一例として、平衡機能状態検査を実施するとき、対象者の目が隠れる場合、対象者が頭を速く回転する場合、頭を遅く回転する場合、頭の位置が変わる場合、などによって頭及び眼球の動きの速度が正確に計算されないノイズ値が発生することができる。前記速度情報生成部1120は、Chaining Kalman Filter、Moving Average Filter、Savitzky-Golay filter、High Pass Filter、Low Pass Filter、Band Pass Filterなどのフィルターを利用して頭及び眼球の動き速度と関連した情報からノイズを除去することができ、これは一例に該当し、これに制限されず、様々なノイズ処理方式が利用されることができる。
本明細書の一実施形態によれば、前記速度情報生成部1120は、頭の動きが予め設定された臨界値以上になる時点を基準に予め設定された時間内における頭の動き速度及び眼球の動き速度と関連した情報を生成することができる。平衡機能状態検査で前記対象者は頭を水平(Lateral Left、Lateral Right)方向に動かすことができる。このとき、前記速度情報生成部1120は、頭の水平方向への動きが予め設定された臨界値以上であるとき、頭及び眼球の動き速度と関連した情報を生成することができる。
また、前記対象者は、右側の前半規管と左側の後半規管(Right Anterior、Left Posterior、RALP)が刺激されるように、顔の右側面が対象者の正面に向かうように回した状態で右下及び右上方向に頭を動かすことができる。また、前記対象者は、右側の後半規管と左側の前半規管(Left Anterior、Right Posterior、LARP)が刺激されるように、顔の左側面が対象者の正面に向かうように回した状態で座下及び左上方向に頭を動かすことができる。このとき、前記速度情報生成部1120は、頭の垂直方向への動きが予め設定された臨界値以上であるとき、頭及び眼球の動き速度と関連した情報を生成することができる。
以下において、対象者が前記RALPが刺激されるように頭を回転する方向をRALP方向と記載し、対象者が前記LARPが刺激されるように頭を回転する方向をLARP方向と記載する。
一例として、前記速度情報生成部1120は、最後に入力されたフレーム画像を基準に予め設定された時間内に存在するフレーム画像による頭の動き情報を利用して、頭の動きが臨界値以上であるか否かを判断することができる。前記速度情報生成部1120は、予め設定された時間内に存在するフレーム画像による頭の動き情報で頭の特徴点座標の最大値と最小値との差を計算して頭の動きが臨界値以上であるか否かを判断することができる。前記予め設定された臨界値は、動画のフレームレート、フレーム画像のサイズなどによって変わることができる。
他の例として、前記メモリ100は、頭の動きに対する情報を生成する第4人工神経網モデルをさらに保存することができる。前記第4人工神経網モデルは、少なくとも1つのプロセッサによって、平衡機能状態検査を行う動画のフレーム画像及び該当フレーム画像で頭のピッチ、ヨー値のデータを利用して学習されることができる。前記第4人工神経網モデルは、時系列モデルやトランスフォーマー(Transformer)モデルであってよく、これは一例に該当し、前記モデルにより制限されない。このとき、前記フレーム画像は、前記Lateral、RALP及びLARP方向に対する情報がラベリングされることができる。前記速度情報生成部1120は、最後に獲得されたフレーム画像を基準に予め設定された時間内に存在するフレーム画像を前記第4人工神経網モデルに入力して頭の動きが臨界値以上であるか否かを確認することができる。
前記速度情報生成部1120は、前記頭の動きが臨界値以上になる時点以後に予め設定された時間の間に生成される頭及び眼球の動きと関連した情報を利用して頭及び眼球の動き速度を計算することができる。一例として、前記速度情報生成部1120は、前記頭の動きが臨界値以上になる時点以後に1.5秒以内に生成される頭及び眼球の動きと関連した情報を利用して頭及び眼球の動き速度を計算することができ、これは一例に該当し、前記時間により制限されない。前記速度情報生成部1120は、第m動画における頭及び眼球の動き速度をそれぞれ計算することができる。
前記速度情報生成部1120は、前記頭及び眼球の動き速度と関連した情報をディスプレイ装置に示すことができる。前記速度情報生成部1120は、ノイズが除去された頭及び眼球の動き速度と関連した情報及び/又はノイズが除去されない頭及び眼球の動き速度と関連した情報をディスプレイに示すことができる。
前記平衡機能状態情報生成部1130は、頭及び眼球の動き速度と関連した情報を利用して対象者の平衡機能の状態情報を生成することができる。
本明細書の一実施形態によれば、前記平衡機能状態情報生成部1130は、予め設定された分析ウィンドウ内で前記対象者の頭の動きの速度が相対的に最も大きいときの時間値(Head Peak Index)及び前記対象者の眼球が頭の動きの方向に動いてからさらに既存位置に戻るとき、眼球の動きの速度が相対的に最も大きいときの時間値(Eye Peak Index)を利用してゲイン係数を計算することができる。前記分析ウィンドウは、頭の動きが臨界値以上になる時点を基準に予め設定された時間範囲を意味することができる。前記分析ウィンドウのサイズは、前記速度情報生成部1120が頭及び眼球の動きの速度と関連した情報を生成する時間範囲に該当することができる。
一例として、頭の動きが臨界値以上になる時点以後に1.5秒の時間が分析ウィンドウのサイズであってよく、これは一例に該当し、これに制限されない。
前記平衡機能状態情報生成部1130は、ノイズが除去された頭及び眼球の動き速度と関連した情報で前記Head Peak Index及びEye Peak Indexを利用して、ゲイン係数を[数式1]を利用して計算することができる。
以後に、前記平衡機能状態情報生成部1130は、前記ゲイン係数を利用してゲイン値(Gain)を計算することができる。
前記平衡機能状態情報生成部1130は、左眼及び右眼に対するゲイン値をそれぞれ計算することができる。
また、前記平衡機能状態情報生成部1130は、第m動画におけるゲイン値をそれぞれ計算することができる。一例として、2個のカメラを利用して前記対象者を撮影した場合、2個の動画に対するゲイン値をそれぞれ計算することができる。この場合、第1動画における左眼及び右眼のゲイン値と第2動画における左眼及び右眼のゲイン値が計算されることができる。前記平衡機能状態情報生成部1130は、前記第1動画及び第2動画で計算された左眼のゲイン値に対する統計値を計算し、前記第1動画及び第2動画で計算された右眼のゲイン値に対する少なくとも1つの統計値を計算することができる。前記統計値は、平均値、中央値、最小値、最大値、標準偏差などに該当することができ、これは一例に該当し、これに制限されない。
本明細書の一実施形態によれば、複数個のカメラ(nが2以上)で前記対象者を撮影するとき、前記頭の動き生成部1100は、第m動画による頭座標と関連した情報の統計値を算出して基準頭の動き情報をさらに生成することができる。前記眼球の動き生成部1110は、第m動画による瞳孔中心座標及び眼球の位相変化と関連した情報の統計値を算出して基準眼球の動き情報をさらに生成することができる。
複数個のカメラで前記対象者を撮影する場合、カメラの位置、角度などによって第m動画のフレーム画像で生成された3次元頭の座標値の差が発生することができる。
一例として、第1カメラが前記対象者を対象者の右側で撮影し、第2カメラが前記対象者を対象者の左側で撮影することができる。この場合、前記対象者が頭を右側に回転すれば、前記第1カメラで撮影された第1動画のフレーム画像では前記対象者の顔右側に位置した特徴点の座標が左側に位置した特徴点の座標より相対的にさらに正確に計算されることができる。また、前記対象者が頭を左側に回転すれば、前記第2カメラで撮影された第2動画のフレーム画像では前記対象者の顔の左側に位置した特徴点の座標が右側に位置した特徴点の座標より相対的にさらに正確に計算されることができる。
他の例として、前記対象者を中心に1m離れた距離に15°間隔で対象者を取り囲むように複数個のカメラが設置されることができる。このとき、複数個のカメラは、前記対象者の目線の高さで前記対象者を撮影することができる。このような場合にも、前記対象者の頭の動き方向によってカメラ別に相対的にさらに正確に測定される特徴点の座標が生成されることができる。このように、複数個のカメラの位置、角度などによって算出される2次元頭の座標の情報が互いに差が生じることができる。
前記頭の動き生成部1100は、第m動画でシンクが互いに合うフレーム画像で生成された3次元頭座標で各特徴点の座標に対する平均値を計算して基準頭座標情報を生成することができる。前記頭の動き生成部1100は、時間による基準頭座標情報を利用して基準頭の動きと関連した情報をさらに生成することができる。
前記眼球の動き生成部1110は、第m動画でシンクが互いに合うフレーム画像で生成された瞳孔中心座標及び眼球の位相変化と関連した情報の平均値を計算して、基準瞳孔中心座標及び基準眼球の位相変化と関連した情報を生成することができる。前記眼球の動き生成部1110は、前記基準瞳孔中心座標及び基準眼球の位相変化と関連した情報を利用して眼球の基準注視ベクトルを生成することができる。前記眼球の動き生成部1110は、前記基準瞳孔中心座標、基準眼球の位相変化と関連した情報及び基準注視ベクトルを利用して基準眼球の動きと関連した情報をさらに生成することができる。
このとき、前記速度情報生成部1120は、前記基準頭の動きが予め設定された臨界値以上になる時点を基準に予め設定された時間内で第m動画に対する頭の動き速度及び眼球の動き速度と関連した情報をそれぞれ生成することができる。
前記平衡機能状態情報生成部1130は、前記基準頭の動きが予め設定された臨界値が以上になる時点を基準に予め設定された時間内で第m動画に対するHead Peak Index及びEye Peak Indexを利用してゲイン値をそれぞれ計算することができる。
図9は、本明細書の一実施形態に係る平衡機能状態情報をディスプレイに出力した例示である。
図9を参照すれば、前記頭の動き生成部1100、眼球の動き生成部1110、速度情報生成部1120、及び平衡機能状態情報生成部1130は、算出した情報をディスプレイ画面で出力することができる。前記ディスプレイ画面には複数個のカメラで撮影された動画がそれぞれ出力されることができる。
前記速度情報生成部1120は、第m動画に対する頭及び眼球の動き速度情報をそれぞれグラフ205で出力することができる。前記頭及び眼球の動き速度のグラフ205で平衡機能状態検査の回数による速度情報が重なって示されることができる。前記頭及び眼球の動きの速度グラフ205で頂点及び/又は谷が現れる時間値が前記Head Peak Index及び/又はEye Peak Indexに該当することができる。前記グラフで垂直軸が速度値であり、水平軸が時間値に該当することができる。図9には、頭及び眼球の水平方向の速度に対するグラフが図示されているが、これは一例に該当し、検査種類によって垂直、回転方向に対する速度に対するグラフがさらに出力されることができる。
前記頭の動き生成部1100及び眼球の動き生成部1110は、頭及び眼球の動き情報をグラフで出力することができる。前記頭の動き生成部1100及び眼球の動き生成部1110は、頭及び眼球の水平方向への動きグラフ206及び垂直方向への動きグラフ207を出力することができる。また、頭及び/又は眼球の回転方向に対する動きグラフをさらに出力することができる。また、前記頭及び眼球の動きグラフは、第m動画に対する動き情報を含むことができ、前記基準頭の動き及び基準眼球の動き情報を含むことができる。
前記平衡機能状態情報生成部1130は、前記対象者に対する平衡機能状態検査と関連した情報208をディスプレイ装置に出力することができる。前記平衡機能状態検査と関連した情報は、頭の回転方向(Lateral、RALP、LARP)、頭の回転方向によるゲイン値と標準偏差、頭の回転方向による平衡機能状態検査の回数、ゲイン値の計算成功回数及びゲイン値の計算失敗回数のうち少なくとも1つ以上を含むことができる。
前記ゲイン値の計算が失敗する場合は、前記対象者が頭を検査の基準より早く動いたとき発生することができる。この場合、前記Head Peak IndexとEye Peak Indexとの間の差が分析ウィンドウサイズの中間を超えることができる。この場合、前記平衡機能状態情報生成部1130は、ゲイン値の計算を失敗することができる。前記平衡機能状態情報生成部1130は、前記ゲイン値の計算成功及び失敗回数に対する情報を生成して、対象者及び/又は検査者がより正確な判断ができる効果を提供することができる。
また、前記平衡機能状態情報生成部1130は、前記ゲイン値に従って半規管の異常有無に対する情報を生成することができる。一例として、前記平衡機能状態情報生成部1130は、平衡機能状態検査で前記左眼及び右眼のゲイン値が予め設定された値以下である場合、半規管の異常情報を生成することができる。
また、平衡機能状態検査で前記対象者が頭をLateral方向に回転することができる。このとき、前記対象者が頭を左側に回転するときと右側に回転するときの左眼及び右眼のゲイン値の差が予め設定された値以上である場合、前記平衡機能状態情報生成部1130は半規管の異常情報を生成することができる。
また、平衡機能状態検査で前記対象者が頭をRALP又はLARP方向に回転することができる。このとき、前記対象者が頭を上側に回転するときと下側に回転するときの左眼及び右眼のゲイン値の差が予め設定された値以上である場合、前記平衡機能状態情報生成部1130は前記RALP又はLARPの異常情報を生成することができる。
また、前記平衡機能状態情報生成部1130は、前記眼球の動きと関連した情報及びゲイン値情報を利用して、中枢性前庭神経機能の異常と末梢性前庭神経機能の異常有無に対する情報をさらに生成することができる。
図10は、本明細書の一実施形態に係る平衡機能リハビリテーションプログラムを行うための平衡機能管理システムのブロック図である。
図10を参照すれば、本明細書の一実施形態に係る平衡機能リハビリテーションプログラムを行うための平衡機能管理システム10-2は、メモリ100、頭座標学習部110、眼球座標学習部120、眼球回転学習部130、頭座標獲得部140、眼球座標獲得部150、位相変化獲得部160、頭の動き生成部1100、眼球の動き生成部1110、ターゲット出力部1140、頭方向提供部1150、及びフィードバック提供部1160を含むことができる。前記メモリ100、頭座標学習部110、眼球座標学習部120、眼球回転学習部130、頭座標獲得部140、眼球座標獲得部150、位相変化獲得部160、頭の動き生成部1100、及び眼球の動き生成部1110は以上で説明したので、繰り返しの説明は省略する。
図11は、本明細書の一実施形態に係る平衡機能リハビリテーションプログラムを行う場面の例示を図示した図面である。
図11を参照すれば、前記ターゲット出力部1140は、ディスプレイ装置に仮想のターゲット209を出力することができる。前記仮想のターゲットは、ディスプレイ装置の任意の位置に示されることができる。図11でターゲットはトランプカードの形状に図示されているが、これは一例に該当し、前記形状により制限されない。
前記頭方向提供部1150は、前記対象者に平衡リハビリテーションプロトコル(Protocol)による頭の回転方向に対する情報を提供することができる。一例として、前記頭方向提供部1150は、前記対象者が頭をLateral方向に回転するように情報を提供することができる。
又は、前記頭方向提供部1150は、前記対象者が頭をRALP又はLARP方向に回転するように情報を提供することができる。
このとき、前記頭方向提供部1150は、前記対象者が頭の右側が正面に向かう状態で頭を上又は下側にのみ回転するように情報を提供することができる。また、前記頭方向提供部1150は、前記対象者が頭の左側が正面に向かう状態で頭を上又は下側にのみ回転するように情報を提供することができる。
また、前記頭方向提供部1150は、前記対象者が頭を回転させた後に予め設定された時間内に頭を回転させる前の状態に復元するように情報を提供することができる。一例として、前記頭方向提供部1150は、1秒以内に頭を回転させた以後に頭を回転させる前の状態に復元するように情報を提供することができる。
前記頭方向提供部1150は、前記情報をディスプレイ装置に視覚的に示すことができる。また、前記頭方向提供部1150は、前記情報をオーディオ装置に出力することができる。
前記フィードバック提供部1160は、前記対象者の頭の動き及び眼球の動きに従ってフィードバック(Feedback)を提供することができる。
前記平衡リハビリテーションプロトコルによって前記対象者が頭を回転させなければならない角度の基準が予め決まることができる。前記フィードバック提供部1160は、前記頭の動き生成部1100から生成された前記対象者の頭の回転角度と前記角度の基準を比較することができる。前記フィードバック提供部1160は、前記対象者の頭の回転角度が前記角度の基準を満たす場合、聴覚的フィードバック及び/又は視覚的フィードバックを提供することができる。また、前記フィードバック提供部1160は、前記対象者の頭の回転角度が前記角度の基準を満たすことができない場合、聴覚的フィードバック及び/又は視覚的フィードバックを提供することができる。前記フィードバック提供部1160は、前記対象者の頭の回転角度が前記角度の基準を満たすか否かによって互いに異なるフィードバックを提供することができる。
また、前記眼球の動き生成部1110は、眼球注視ベクトルを利用してディスプレイ装置上に前記対象者の視線が向かう注視点の座標情報を生成することができる。前記フィードバック提供部1160は、前記眼球の動き生成部1110から生成された注視点の座標情報と前記仮想のターゲット209の座標情報とを比較することができる。
前記注視点の座標が前記仮想のターゲット209の領域内部に位置するとき、前記フィードバック提供部1160は、前記仮想のターゲット209の色相値を変更することができる。また、前記フィードバック提供部1160は、前記仮想のターゲット209内部に前記注視点をさらに示すことができる。
前記注視点の座標が前記仮想のターゲット209の領域外部に位置するとき、前記フィードバック提供部1160は、前記注視点の位置をディスプレイ装置に示すことができる。
前記対象者を複数個のカメラで撮影するとき、前記頭の動き生成部1100及び眼球の動き生成部1110は、以上で説明したように基準頭の動き及び基準眼球の動きと関連した情報を生成することができる。前記フィードバック提供部1160は、前記基準頭の動き及び基準眼球の動きと関連した情報に従ってフィードバックを提供することができる。
図12は、本明細書の一実施形態に係る平衡機能状態情報生成及び平衡機能リハビリテーションプログラムを行う平衡機能管理システムのブロック図である。
図12を参照すれば、平衡機能管理システム10-3は、メモリ100、頭座標学習部110、眼球座標学習部120、眼球回転学習部130、頭座標獲得部140、眼球座標獲得部150、位相変化獲得部160、頭の動き生成部1100、眼球の動き生成部1110、速度情報生成部1120、平衡機能状態情報生成部1130、ターゲット出力部1140、頭方向提供部1150、及びフィードバック提供部1160を含むことができる。前記平衡機能管理システム10-3は、ゲイン値を生成して平衡機能異常有無による平衡機能リハビリテーションプログラムを提供することができる。
以下においては、本明細書の第2実施形態に係る平衡機能管理システムについて説明する。本明細書の第2実施形態によれば、平衡機能管理システムは、複数個のカメラを利用して対象者を撮影した複数個の動画を利用して対象者の頭及び眼球の動き情報を生成して、平衡機能状態情報生成及び/又は平衡機能リハビリテーションプログラムを行うことができる。以下において、nは2以上の自然数を意味することができる。
図13は、本明細書の第2実施形態に係る平衡機能管理システムのブロック図である。
図13を参照すれば、本明細書の第2実施形態に係る平衡機能管理システム10’は、メモリ100’、頭座標学習部110’、眼球座標学習部120’及び眼球回転学習部130’、頭座標獲得部140’、眼球座標獲得部150’、及び位相変化獲得部160’を含むことができる。
前記メモリ100’は、頭座標と関連した情報を生成する第1人工神経網モデル、瞳孔中心座標と関連した情報を獲得する第2人工神経網モデル及び眼球の位相変化と関連した情報を獲得する第3人工神経網モデルのうち少なくとも1つを保存することができる。
本明細書の一実施形態によれば、前記第1人工神経網モデルは、前記頭座標学習部110’によって、人の顔が撮影された複数個の動画のフレーム画像から抽出された顔の特徴点(Feature Point)及び特徴点の座標を含む学習データを利用して学習されることができる。
前記頭座標学習部110’は、人の顔が撮影された少なくとも複数個の動画を利用して、前記第1人工神経網モデルを学習させることができる。前記人の顔が撮影された複数個の動画は、撮影された人が頭を回転する姿を撮影した動画であってよい。
一例として、前記人の顔が撮影された動画は、複数個のカメラを通して撮影されることができる。前記複数個のカメラは、様々な位置及び角度で設置されて人を撮影することができる。前記人の顔が撮影された動画は、人の正面の左側、右側、左上側、右上側など様々な位置で様々な角度で設置されたカメラによって撮影されることができる。複数個のカメラを通して撮影された動画は、同じ状況を複数個のカメラで撮影した動画を意味することができる。
前記人の顔が撮影された動画は、撮影された人の顔が正面に向かう状態で頭を左右に動かす場面が撮影された映像であってよい。また、前記人の顔が撮影された動画は、撮影された人の顔が正面に向かう状態で頭を上下に動かす場面が撮影された映像であってよい。人の顔が正面に向かう状態は、人の視線方向と体の前面方向が一致する状態であってよい。
また、前記人の顔の撮影された動画は、撮影された人が頭を右に回した後に頭を上下に動かす場面が撮影された映像であってよい。また、前記人の顔が撮影された動画は、撮影された人が頭を左側で回した後に上下に動かす場面が撮影された映像であってよい。
また、前記人の顔が撮影された動画は、撮影された人が特定注視点を見つめた状態で頭を回転する場面が撮影された映像であってよい。
前記人の顔が撮影された動画は、カメラの仕様がすべて同じカメラで撮影されることができる。また、前記人の顔が撮影された動画は、互いに異なる仕様を持つカメラで撮影された動画であってよい。また、前記人の顔が撮影された動画は、互いに異なる設定値を持つカメラで撮影された動画であってよい。
以上で説明された人が撮影された動画は一例に該当し、人の頭及び眼球が撮影された動画又は人の頭が撮影されたすべての動画が利用されることができる。また、特定カメラ仕様、設定などにより制限されない。
好ましくは、前記人が撮影された動画は、同じ設定値を持つカメラで撮影された動画であってよい。
本明細書の一実施形態によれば、前記頭座標学習部110’は、複数個のカメラを利用して人を撮影した複数個の動画で特徴点を抽出するとき、前記複数個の動画のシンク(sync)を調節した以後に特徴点を抽出することができる。前記頭座標学習部110’は、前記複数個の動画の特定オーディオ信号、特徴点マッチング基盤同期化などのアルゴリズムを利用して複数個の動画のシンクを調節することができ、これは一例に該当し、これに制限されず、当業者の間で広く知られている様々な技術が利用されることができる。
図14は、本明細書の一実施形態に係る頭座標学習部がフレーム画像を連結する例示を図示した参考図である。
図14を参照すれば、前記人の顔が撮影された動画は、2個のカメラを通して撮影された動画であってよい。前記頭座標学習部110’は、第1カメラで撮影された第1動画300及び第2カメラで撮影された第2動画301のシンクを調節することができる。前記頭座標学習部110’は、前記第1動画300及び第2動画301で互いにシンクが同じフレーム画像を連結して多重フレーム画像310を生成することができる。前記頭座標学習部110’は、シンクが同じフレーム画像を連結(Concatenate)して多重フレーム画像310を生成することができる。一例として、第1動画300の一番目のフレーム画像300-1と第2動画301の一番目のフレーム画像301-1を連結して一番目の多重フレーム画像310-1を生成することができる。前記多重フレーム画像は、シンクが同じ複数個のフレーム画像を連結して生成された1つの画像を意味することができる。前記多重フレーム画像は、前記複数個のフレーム画像が配列された1つの画像を意味することができる。
以下において、多重フレーム画像は、n個の動画のフレーム画像のうちシンクが同じ第m動画のフレーム画像が連結されたと仮定して説明する。
前記頭座標学習部110’は、n個のカメラで撮影されたn個の動画でシンクが同じ第m動画のフレーム画像を連結して多重フレーム画像を生成することができる。前記頭座標学習部110’は、第m動画のフレーム画像を予め設定された基準に従って連結することができる。また、前記頭座標学習部110’は、フレーム画像が抽出された動画の情報をラベリングすることができる。
前記頭座標学習部110’は、前記多重フレーム画像から人の顔に対する特徴点を抽出することができる。一例として、前記頭座標学習部110’は、前記各多重フレーム画像から人の顔に位置した特徴点を抽出することができる。一例として、前記特徴点は、人の鼻先、左側外眼角(左側目元で最も外側まぶたが会う箇所)、右側外眼角(右側目元で最も外側の部分まぶたが会う箇所)及び額に対する特徴点を含むことができる。前記特徴点は、人が目を瞬いても位置が変化しないことがある。前記特徴点は一例に該当し、前記特徴点により制限されず、従来の顔認識のために使用される特徴点がさらに含まれることができる。人の頭で特徴点及び特徴点座標を生成する技術は、当業者の間で広く知られている技術であるので、詳しい説明は省略する。
前記頭座標学習部110’は、前記各フレーム画像から抽出した特徴点の座標情報を生成することができる。前記頭座標学習部110’は、前記各多重フレーム画像から抽出した特徴点及び特徴点の座標を含む学習データを利用して、各多重フレーム画像に対する3次元頭座標を生成するように第1人工神経網モデルを学習させることができる。前記3次元頭座標は、3次元標準頭モデルによる頭の3次元座標を意味することができる。前記頭の3次元座標は、頭のすべての特徴点に対する座標を含むことができる。頭の3次元座標は、各特徴点に対する索引番号と関連した内容を含むことができる。このとき、前記頭座標学習部110’は、鼻先の特徴点を基準に索引番号を生成するように前記第1人工神経網モデルを学習させることができる。
前記頭座標学習部110’は、前記多重フレーム画像で第m動画のフレーム画像に対する頭の3次元座標を生成するように前記第1人工神経網モデルを学習させることができる。一例として、2個の動画のフレーム画像を連結した多重フレーム画像であるとき、前記頭座標学習部110’は、第1動画のフレーム画像に対する頭の3次元座標及び第2動画のフレーム画像に対する頭の3次元座標を生成するように前記第1人工神経網モデルを学習させることができ、これは一例に該当し、前記動画の個数により制限されない。
また、前記頭座標学習部110’は、頭の3次元座標に対する基準頭座標を生成するように前記第1人工神経網モデルを学習させることができる。前記基準頭座標は、第m動画のフレーム画像で生成される頭の3次元座標で各特徴点の座標に対する平均値を意味することができる。前記頭座標学習部110’は、前記平均値を算出して、前記第1人工神経網モデルがカメラの位置及び角度によって頭座標の差が補正された基準頭座標と関連した情報を生成するように学習させることができる。
また、前記頭座標学習部110’は、各多重フレーム画像から抽出された3次元座標を利用して、頭の動き情報をさらに生成するように前記第1人工神経網モデルを学習することができる。
また、前記頭座標学習部110’は、特徴点が抽出されたフレーム画像、3DMM(3D Morphable Model)、FLAME(Faces Learned with an Articulated Model and Expressions)モデルなどの3次元標準頭モデルに対するデータを学習データとしてさらに利用して前記第1人工神経網モデルを学習させることができ、これは一例に該当し、前記学習データにより制限されず、様々な学習データが追加でさらに利用されることができる。
本明細書の一実施形態によれば、前記頭座標学習部110’は、予め設定された基準による座標値を持つ特徴点を学習データとして利用することができる。前記頭座標学習部110’は、予め設定された基準による座標値を持つ特徴点を学習データとして選別することができる。
図15は、本明細書の一実施形態に係る平衡機能状態を検査及び/又は平衡機能リハビリテーションプログラムを行う対象者を撮影した場面の多重フレーム画像に対する例示である。
図15を参照すれば、人が撮影された複数個の動画は、前記平衡機能管理システム10’を利用して平衡機能状態検査及び/又は平衡機能リハビリテーションプログラムを行う複数個の動画であってよい。前記動画は、対象者400のみ撮影された動画であってよい。また、前記動画は、対象者400及び検査者401が撮影された動画であってよい。以下において、人が撮影された動画は、平衡機能状態検査及び/又は平衡機能リハビリテーションプログラムを行う動画を意味すると記載する。しかし、これは一例に該当し、前記動画により制限されない。
平衡機能状態検査を実施するとき、対象者400は椅子に座っている状態であり、検査者401は対象者の後ろに立っている状態であってよい。検査者401は医療専門家を意味することができる。前記平衡機能管理システム10’は、対象者400の頭の動きによる眼球の動きを分析して対象者の平衡機能の異常有無を判断し、リハビリテーションプログラムを進めるために対象者400の頭の動き及び眼球の動きだけ分析することができる。
前記頭座標学習部110’は、前記多重フレーム画像から対象者400の顔の特徴点及び特徴点の座標を抽出して、前記第1人工神経網モデルを学習させることができる。前記頭座標学習部110’は、前記多重フレーム画像で第m動画のフレーム画像から対象者の顔の特徴点及び特徴点の座標を抽出して、前記第1人工神経網モデルを学習させることができる。
以上で説明したように、対象者400は椅子に座っており、検査者401は立っている状態であるので、対象者400の顔から抽出された特徴点は、検査者401の顔から抽出された特徴点より相対的に下に位置することができる。これは、対象者400の顔から抽出された特徴点のy座標値が検査者401の顔から抽出された特徴点のy座標値より相対的に小さいことを意味することができる。
前記頭座標学習部110’は、対象者400及び検査者401の顔から抽出された同じ部分の特徴点のうち相対的にy座標値が小さな特徴点を学習データとして抽出することができる。前記頭座標学習部110’は、予め設定されたy座標値の下の領域に位置した特徴点を学習データとして抽出することができる。
また、前記頭座標学習部110’は、対象者400及び検査者401の顔から抽出された特徴点をクラスタリングすることができる。以後に、前記頭座標学習部110’は、相対的に下に位置する特徴点の集合を学習データとして抽出することができる。
図16は、本明細書の一実施形態に係る平衡機能状態を検査及び/又は平衡機能リハビリテーションプログラムを行う対象者を撮影した場面の多重フレーム画像に対する例示である。
図16を参照すれば、前記動画で対象者400’及び検査者401’がみんな立っている状態で平衡機能状態検査及び/又は平衡機能リハビリテーションプログラムが行われることができる。この場合、対象者400’の顔から抽出された特徴点は、検査者401’の顔から抽出された特徴点より相対的にディスプレイ画面の中心に近いことができる。前記頭座標学習部110’は、ディスプレイ画面の中心点に対する座標値と相対的にさらに近い座標値を持つ特徴点を学習データとして抽出することができる。
また他の例として、対象者は、検査者よりカメラまでの実際距離が相対的にさらに近いことができる。これにより、前記動画で対象者の顔が検査者の顔より相対的にさらに広い領域を占めることができる。前記頭座標学習部110’は、対象者の顔から抽出された特徴点の集合及び検査者の顔から抽出された特徴点の集合のうち相対的にさらに広い領域に分散された特徴点の集合を学習データとして抽出することができる。
前記頭座標学習部110’は、前記多重フレーム画像で第m動画のフレーム画像に含まれた対象者の顔で特徴点及び特徴点の座標情報をそれぞれ生成することができる。
以上で説明した頭座標学習部110’が対象者の顔から抽出された特徴点のみ学習データとして抽出する過程は一例に該当し、これに制限されず、対象者の位置、検査者の位置、カメラの位置、角度などによって様々な基準が設定されることができる。また、対象者と検査者の顔の位置だけでなく、対象者と検査者を区別するためのマーカーなどを通じて対象者の顔から抽出された特徴点のみを学習データとして抽出することができる。よって、平衡機能状態検査及び/又はリハビリテーション検査プログラムを行う様々な状況に応じて様々な実施形態が生じることができる。
前記動画で対象者が頭を速く回転する場合、第m動画のフレーム画像のうち少なくとも1つに対象者の顔が明確に撮影されない可能性がある。この場合、前記頭座標学習部110’は、対象者の顔から特徴点を抽出することができない可能性がある。この場合、前記頭座標学習部110’は、検査者の顔から抽出された特徴点を利用して前記第1人工神経網モデルを学習させ、前記第1人工神経網モデルが不正確な結果を算出することができる。
本明細書の一実施形態によれば、前記頭座標学習部110’は、第m動画の任意のフレーム画像より先立つフレーム画像から抽出された特徴点の座標を追跡することができる。以上で説明したように、第m動画のフレーム画像で対象者の顔から特徴点を抽出することができない場合、前記頭座標学習部110’は、先立つフレーム画像の対象者の画像を利用して学習データを抽出することができる。前記先立つフレーム画像は、任意のフレーム画像より先立つフレーム画像のうち対象者の顔から特徴点を抽出することができる最も近いフレーム画像を意味することができる。
本明細書の一実施形態によれば、前記第2人工神経網モデルは、前記眼球座標学習部120’によって、人の顔が撮影された複数個の動画の多重フレーム画像で眼球が含まれた領域の画像である眼球領域画像を含む学習データを利用して、瞳孔中心の座標と関連した情報を生成するように学習されることができる。
前記眼球座標学習部120’は、複数個の動画のシンクを調節して多重フレーム画像を生成することができる。又は、前記眼球座標学習部120’は、前記頭座標学習部110’で生成された多重フレーム画像を入力されることができる。
前記眼球座標学習部120’は、多重フレーム画像で対象者の眼球が含まれた領域の画像である対象者の眼球領域画像を抽出することができる。前記眼球座標学習部120’は、各フレーム画像から抽出された対象者の眼球領域画像を学習データにして、前記第2人工神経網モデルが瞳孔中心の座標と関連した情報を生成するように学習させることができる。
図17は、本明細書の一実施形態に係る眼球領域画像を前処理する例示を図示した図面である。
図17を参照すれば、前記眼球座標学習部120’は、各多重フレーム画像402から第m動画のフレーム画像による眼球領域画像403-1、403-2を抽出することができる。前記眼球座標学習部120’は、各多重フレーム画像402で眼球領域のバウンディングボックス(Bounding Box)内部の画像を眼球領域画像403-1、403-2として抽出することができる。前記眼球座標学習部120’は、前記眼球領域画像403-1、403-2で虹彩と瞳孔領域を分割することができる。人の顔から眼球領域を抽出し、虹彩と瞳孔領域を分割する技術は、当業者の間で広く知られている技術であるので、詳しい説明は省略する。
前記眼球座標学習部120’は、まぶたによって虹彩及び/又は瞳孔が隠れた部分に対する領域を推定することができる。図17に図示されたように、虹彩の一部が上まぶた及び下まぶたによって隠れることができる。前記眼球座標学習部120’は、楕円フィッティング(Ellipse Fitting)、ハフ変換(Circle Hough Transform)アルゴリズムなどを利用して隠れた部分を推定することができる。又は、前記眼球座標学習部120’は、虹彩及び瞳孔領域を分割するように予め学習された人工神経網モデルを利用して虹彩及び瞳孔領域を分割することができる。これは一例に該当し、前記方式により制限されない。
前記眼球座標学習部120’は、前記眼球領域画像403-1、403-2で虹彩及び/又は瞳孔領域が分割されたデータを利用して、前記第2人工神経網モデルを学習させることができる。一例として、前記眼球座標学習部120’は、前記眼球領域画像403-1、403-2で虹彩及び/又は瞳孔領域を分割してマスク画像404-1、404-2を生成することができる。前記眼球座標学習部120’は、前記眼球領域画像403-1、403-2で虹彩及び/又は瞳孔が占める領域と残り領域が互いに異なるピクセル値を持つマスク画像を生成することができる。前記マスク画像は、虹彩及び/又は瞳孔が占める領域が白色又は黒色で示されることができ、残り領域は黒色又は白色で示されることができ、これは一例に該当し、これに制限されない。
前記眼球座標学習部120’は、前記マスク画像404-1、404-2を学習データにして、前記第2人工神経網モデルが各動画のフレーム画像に対する瞳孔中心の座標と関連した情報を生成するように学習させることができる。又は、前記眼球座標学習部120’は、前記マスク画像404-1、404-2の2次元ピクセル値を学習データにして、前記第2人工神経網モデルを学習させることができる。又は、前記眼球座標学習部120’は、前記マスク画像404-1、404-2及び2次元ピクセル値を学習データにして、前記第2人工神経網モデルを学習させることができる。
他の例として、前記眼球座標学習部120’は、前記眼球領域画像403-1、403-2で虹彩及び/又は瞳孔領域を分割して示したヒートマップ(Heatmap)モデルを利用して、前記第2人工神経網モデルを学習させることができる。
前記眼球座標学習部120’は、前記マスク画像及びヒートマップモデルのうち少なくとも1つを利用して、前記第2人工神経網モデルを学習させることができる。
図17においては、2個の動画に対するフレーム画像が連結された多重フレーム画像を利用して前処理する過程を図示したが、これは一例に該当し、前記動画の個数により制限されない。
本明細書の一実施形態によれば、前記眼球座標学習部120’は、前記眼球領域画像403-1、403-2で眼球の特徴点及び特徴点の座標情報を生成し、予め設定された複数個の特徴点の座標を利用して、各動画のフレーム画像に対する前記瞳孔中心の水平座標値及び垂直座標値を生成するように前記第2人工神経網モデルを学習させることができる。前記眼球座標学習部120’は、前記眼球領域画像403-1、403-2から抽出された複数個の特徴点の座標を利用して、正規化(Normalized)された瞳孔中心座標を抽出することができる。
一例として、前記複数個の特徴点座標は、眼球領域画像403-1でy軸座標が予め設定された範囲内にある特徴点のうちからx軸座標値が相対的に最も小さな特徴点、x軸座標値が相対的に最も大きい特徴点を含むことができる。
前記複数個の特徴点座標は、人の正面で撮影された眼球領域画像403-1でx軸座標が予め設定された範囲内にある特徴点のうちからy軸座標値が相対的に最も小さな特徴点及びy軸座標値が相対的に最も大きい特徴点を含むことができる。
一例として、前記眼球座標学習部120’は、前記眼球領域画像403-1から抽出された特徴点のうち内眼角に対する特徴点403-10及び外眼角に対する特徴点403-11を利用して、正規化された瞳孔中心の水平座標を抽出することができる。前記眼球座標学習部120’は、内眼角に対する特徴点403-10及び外眼角に対する特徴点403-11を連結した線分を瞳孔中心座標に対する水平軸として利用することができる。内眼角に対する特徴点403-10のx座標と外眼角に対する特徴点403-11のx座標は、水平軸の両極値に該当することができる。内眼角に対する特徴点403-10のx座標と外眼角に対する特徴点403-11のx座標との差は、水平軸全体の長さを意味することができる。前記眼球座標学習部120’は、前記水平軸全体の長さ対比瞳孔中心の水平座標値を利用して、正規化された瞳孔中心の水平座標を算出することができる。
また、前記眼球座標学習部120’は、前記眼球領域画像403-1から抽出された特徴点のうち上眼瞼及び下眼瞼と関連した特徴点を利用して、正規化された瞳孔中心の垂直座標を抽出することができる。このとき、上眼瞼と関連した特徴点は、眼球から抽出された特徴点のうち相対的にy軸座標が最も大きい特徴点403-12が利用されることができる。以下において、前記特徴点403-12を上眼瞼特徴点と称する。
下眼瞼と関連した特徴点は、眼球から抽出された特徴点のうち相対的にy軸座標が最も小さな特徴点403-13が利用されることができる。以下において、前記特徴点403-13を下眼瞼特徴点と称する。
前記眼球座標学習部120’は、前記上眼瞼特徴点403-12及び下眼瞼特徴点403-13を連結した線分を瞳孔中心座標に対する垂直軸として利用することができる。上眼瞼特徴点403-12のy座標と下眼瞼特徴点403-13のy座標は、垂直軸の両極値に該当することができる。上眼瞼特徴点403-12のy座標と下眼瞼特徴点403-13のy座標との差は、垂直軸全体の長さを意味することができる。前記眼球座標学習部120’は、前記垂直軸全体の長さ対比瞳孔中心の垂直座標値を利用して、正規化された瞳孔中心の水平座標を算出することができる。これは一例に該当し、前記特徴点により制限されない。
図17において、前記内眼角に対する特徴点403-10と外眼角に対する特徴点403-11は同じ水平線上に位置したと図示し、上眼瞼特徴点403-12及び下眼瞼特徴点403-13は同じ垂直線上に位置したと図示した。しかし、これは、カメラの撮影角度、人の頭角度などによって変わることができる。
一例として、前記眼球領域画像403-10を基準に時計回りに30°だけ回転された眼球領域画像である場合、前記内眼角に対する特徴点403-10と外眼角に対する特徴点403-11は同じ水平線上に位置せず、上眼瞼特徴点403-12及び下眼瞼特徴点403-13は同じ垂直線上に位置しないことがある。このような場合、前記眼球座標学習部120’は、前記回転された眼球領域画像で前記内眼角に対する特徴点403-10と外眼角に対する特徴点403-11が同じ水平線上に位置し、上眼瞼特徴点403-12及び下眼瞼特徴点403-13が同じ垂直線上に位置するように画像を変換することができる。このとき、 前記眼球座標学習部120’は、アフィン変換(Affine Transform)などを利用して前記回転された眼球領域画像を変換することができ、これは一例に該当し、これに制限されない。
前記眼球座標学習部120’は、前記各眼球領域画像403-1、403-2から眼球の特徴点及び特徴点の座標を抽出し、各動画のフレーム画像に対する正規化された瞳孔中心の座標情報を生成することができる。前記眼球座標学習部120’は、前記生成された各動画のフレーム画像に対する正規化された瞳孔中心の水平座標値及び垂直座標値を学習データとしてさらに利用して、前記第2人工神経網モデルを学習させることができる。
また、前記眼球座標学習部120’は、多重フレーム画像から算出された瞳孔中心の水平座標値及び垂直座標値の平均値を計算することができる。前記眼球座標学習部120’は、前記瞳孔中心の水平座標値及び垂直座標値の平均値を学習データとしてさらに利用して、前記第2人工神経網モデルを学習させることができる。前記眼球座標学習部120’は、前記平均値を利用して、前記第2人工神経網モデルがカメラの位置及び角度によって瞳孔中心座標の差が補正された基準瞳孔中心座標と関連した情報を生成するように学習させることができる。
前記瞳孔中心座標と関連した情報は、第m動画のフレーム画像による瞳孔中心の垂直座標値、水平座標値、瞳孔中心の垂直方向への動き情報、水平方向への動き情報などを含むことができる。前記瞳孔中心座標と関連した情報は、2次元座標に対する内容を含むことができる。
前記眼球座標学習部120’は、前記多重フレーム画像から左眼と右眼に対する眼球領域画像を抽出して、第m動画のフレーム画像における左眼の瞳孔中心座標と関連した情報及び右眼の瞳孔中心座標と関連した情報を生成するように前記第2人工神経網モデルを学習させることができる。
本明細書の他の実施形態によれば、前記メモリ100’は、少なくとも1つの仮想オブジェクトのデータを保存することができる。前記第2人工神経網モデルは、前記眼球座標学習部120’によって、仮想オブジェクトのパラメーター(Parameter)の頭回転、眼球回転及びカメラ設定と関連したパラメーターのうち少なくとも1つを変更したパラメーター値及び前記パラメーター値に従って獲得した仮想オブジェクトの画像を含む学習データを利用して、瞳孔中心の座標と関連した情報を生成するように学習されることができる。
さらに図7を参照すれば、前記眼球座標学習部120’は、仮想オブジェクトの頭回転、眼球回転及びカメラ設定と関連したパラメーターのうち少なくとも1つを変更することができる。一例として、前記眼球座標学習部120’は、仮想のカメラが仮想のオブジェクトを正面で撮影(図7の上側図面)するようにパラメーター値を設定することができる。前記眼球座標学習部120’は、仮想のカメラが仮想のオブジェクトを右側で撮影(図7の下側図面)するようにパラメーター値を変更することができる。また、前記眼球座標学習部120’は、仮想のカメラと仮想のオブジェクトとの間の距離に対するパラメーター値を変更することができる。
前記眼球座標学習部120’は、仮想のオブジェクトの頭がロール(Roll)、ピッチ(Pitch)及びヨー(Yaw)のうち少なくともいずれか1つの方向に回転するようにパラメーター値を設定することができる。
前記眼球座標学習部120’は、仮想のオブジェクトの眼球がロール、ピッチ及びヨーのうち少なくともいずれか1つの方向に回転するようにパラメーター値を設定することができる。
前記眼球座標学習部120’は、前記パラメーターのうち少なくともいずれか1つを変更し、前記仮想オブジェクトの画像を獲得することができる。前記眼球座標学習部120’は、前記パラメーター値及びパラメーター値による仮想オブジェクトを利用して、前記第2人工神経網モデルを学習させることができる。このとき、前記第2人工神経網モデルを瞳孔中心の2次元座標及び/又は3次元座標に対する情報を生成するように学習されることができる。
前記仮想のオブジェクトは、3Dガウシアンスプラッター(3D Gaussian Splatter)を利用して生成されたガウシアンアバター(Gaussian Avatar)を意味することができる。前記眼球座標学習部120’は、前記仮想のオブジェクトの潜在ベクトル(Latent Vector)を制御して仮想オブジェクトの頭と瞳孔のオイラー(Euler)座標を変更することができる。前記ガウシアンアバターは一例に該当し、これに制限されず、当業者の間で広く知られている技術で生成された仮想のオブジェクトが利用されることができる。
また、前記メモリ100’は、人の顔が撮影された画像によって頭座標、瞳孔中心座標及びカメラ設定と関連した情報のうち少なくとも1つを含むラベリング(Labeling)データを保存することができる。前記眼球座標学習部120’は、前記データを利用して、前記第2人工神経網モデルを学習させることができる。
また、前記眼球座標学習部120’は、前記眼球領域画像を利用した学習データ、前記仮想オブジェクトのパラメーター変化に従って獲得した学習データ及びラベリングデータのうち少なくとも1つを利用して、前記第2人工神経網モデルを学習させることができる。
本明細書の一実施形態によれば、前記第3人工神経網モデルは、前記眼球回転学習部130’によって、人の顔が撮影された複数個の動画の各多重フレーム画像から抽出された眼球が含まれた領域の画像である眼球領域画像が抽出されることができる。前記眼球回転学習部130’は、各動画による眼球領域画像の時間順によって生成された眼球位相変化と関連した情報を含む学習データを利用して、眼球の回転値を生成するように前記第3人工神経網モデルを学習されることができる。
前記眼球回転学習部130’は、複数個の動画のシンクを調節して前記多重フレーム画像を生成することができる。又は、前記眼球回転学習部130’は、前記頭座標学習部110’で生成された多重フレーム画像を入力されることができる。
前記眼球回転学習部130’は、前記多重フレーム画像で第m動画のフレーム画像に対する眼球領域画像を抽出することができる。前記眼球回転学習部130’は、多重フレーム画像から抽出された前記眼球領域画像を該当多重フレーム画像を基準に予め設定された時間範囲内の多重フレーム画像から抽出された眼球領域画像と比較して眼球位相変化と関連した情報を生成することができる。一例として、前記眼球回転学習部130’は、任意の多重フレーム画像から抽出された眼球領域画像を該当多重フレーム画像を基準に0.1秒前後で獲得した多重フレーム画像から抽出された眼球領域画像と比較して眼球の位相変化と関連した情報を生成することができる。このとき、前記眼球回転学習部130’は、第m動画に対する眼球領域画像を利用して、第m動画による眼球の位相変化と関連した情報を生成することができる。これは一例に該当し、前記時間により制限されない。
本明細書の一実施形態によれば、前記眼球回転学習部130’は、前記眼球領域画像で虹彩が占める領域の画像である虹彩領域画像を抽出することができる。前記虹彩領域画像は、第m動画のフレーム画像における虹彩領域画像を意味することができる。前記虹彩領域画像は、前記眼球領域画像で虹彩を含むバウンディングボックス内の画像を意味することができる。前記眼球回転学習部130’は、前記虹彩領域画像の時間順による虹彩の位相変化と関連した情報を利用して、前記第3人工神経網モデルを学習させることができる。
さらに詳しくは、前記眼球回転学習部130’は、任意の多重フレーム画像から抽出された虹彩領域画像を任意の多重フレーム画像を基準に予め設定された時間範囲内の多重フレーム画像から抽出された虹彩領域画像と比較することができる。前記虹彩領域画像は、虹彩が占める領域が他の領域と異なるピクセル値に区分されたマスク画像であってよく、これは一例に該当し、これに制限されない。
また、前記眼球回転学習部130’は、前記眼球座標学習部120’で生成された虹彩のマスク画像を利用して位相変化と関連した情報を生成することができる。
前記眼球回転学習部130’は、任意の多重フレーム画像から抽出された虹彩領域画像と他の虹彩領域画像とのピクセル値を比較して虹彩の位相の変化と関連した情報を生成することができる。前記眼球回転学習部130’は、位相交差相関分析(Phase Cross Correlation)を利用して任意の多重フレーム画像から抽出された虹彩領域画像と他の虹彩領域画像とのピクセル値に対する位相交差相関関係値を生成することができる。前記位相交差相関分析を利用して算出される位相の変化と関連した情報は、虹彩の角度変化に対する内容を含むことができる。
前記眼球回転学習部130’は、速いフーリエ変換(Fast Fourier Transform、FFT)でアップサンプリング(UPsampling)された交差相関の値を求める方法で前記位相交差相関関係値を生成することができる。前記眼球回転学習部130’は、FFTを利用して交差相関ピーク初期推定値を算出した後、推定値を基準に予め設定された領域で離散フーリエ変換(Discrete FFT、DFT)でアップサンプリングされた信号の位相移動を精密に推定して前記位相交差相関関係値を生成することができる。これは一例に該当し、前記方式により制限されない。
前記眼球回転学習部130’は、前記虹彩領域の画像及び位相交差相関関係値を学習データとして利用して、前記第3人工神経網モデルを学習させることができる。
本明細書の一実施形態によれば、前記眼球回転学習部130’は、前記眼球領域画像で瞳孔が占める領域のサイズを算出することができる。前記眼球回転学習部130’は、予め設定された基準によってターゲット眼球領域画像のサイズを調節することができる。前記ターゲット眼球領域画像は、任意の多重フレーム画像から抽出された眼球領域画像を意味し、特定眼球領域画像を称する用語ではない。
前記眼球回転学習部130’は、任意の多重フレーム画像から抽出されたターゲット眼球領域画像とすぐ先立つ多重フレーム画像から抽出された先立つ眼球領域画像から算出された瞳孔が占める領域のサイズを比較することができる。前記眼球回転学習部130’は、前記ターゲット眼球領域画像から抽出された瞳孔が占める領域のサイズが前記先立つターゲット眼球領域画像から抽出された瞳孔が占める領域のサイズと予め設定された差異値以内の値を持つように、前記ターゲット眼球領域画像のサイズを調節することができる。このとき、前記眼球回転学習部130’は、第m動画に対応する眼球領域画像から抽出された瞳孔が占める領域のサイズを比較して第m動画から抽出されたターゲット眼球領域画像のサイズを調節することができる。前記眼球回転学習部130’は、各眼球領域画像のサイズを調節した以後に、前記位相交差相関関係値を算出することができる。
また、前記眼球回転学習部130’は、前記多重フレーム画像で眼球が含まれた領域のバウンディングボックスを生成することができる。前記眼球回転学習部130’は、前記バウンディングボックス内から瞳孔中心を抽出することができる。前記眼球回転学習部130’は、前記瞳孔中心が前記バウンディングボックスの中心に位置するようにバウンディングボックスを調節することができる。又は、前記眼球回転学習部130’は、前記第2人工神経網モデルで生成された瞳孔中心の座標と関連した情報を入力されることができる。
前記眼球回転学習部130’は、調節されたバウンディングボックス内部の画像を眼球領域画像として抽出することができる。前記眼球回転学習部130’は、前記記載された方式に従って眼球領域画像のサイズを調節した以後に前記虹彩領域画像を抽出して前記位相交差相関関係値を算出することができる。
前記眼球回転学習部130’は、前記虹彩領域画像及び位相交差相関関係値を利用して、前記第3人工神経網モデルが第m動画に対する眼球の回転値を生成するように学習させることができる。前記眼球の回転値は、眼球の中心軸を基準に時計回り又は反時計回りに回転された角度を意味することができる。また、前記眼球回転学習部130’は、第m動画で時間によるフレーム画像から算出した眼球の回転値の平均値を計算することができる。前記眼球回転学習部130’は、前記平均値を利用して、前記第3人工神経網モデルが基準眼球の回転値を生成するように学習させることができる。前記基準眼球の回転値は、カメラの位置、角度などによって各動画で算出される回転値の差が補正された回転値を意味することができる。
前記眼球回転学習部130’は、前記フレーム画像から左眼と右眼に対する眼球領域画像を抽出して、左眼と右眼の位相変化と関連した情報を生成するように前記第3人工神経網モデルを学習させることができる。
本明細書の一実施形態によれば、前記眼球座標学習部120’は、前記第1人工神経網モデルで生成された情報を利用して、前記第2人工神経網モデルを学習させることができる。また、前記眼球回転学習部130’は、前記第2人工神経網モデルで生成された情報を利用して、前記第3人工神経網モデルを学習させることができる。
一例として、前記眼球座標学習部120’は、前記第1人工神経網モデルに入力された複数個の多重フレーム画像及び各多重フレーム画像から抽出された第m動画のフレーム画像における頭座標と関連した情報を利用して学習データを生成することができる。前記眼球座標学習部120’は、前記各多重フレーム画像及び各多重フレーム画像から抽出された頭座標と関連した情報を利用して、各多重フレーム画像で眼球領域画像を生成することができる。前記眼球座標学習部120’は、前記頭座標と関連した情報で眼球座標と関連した情報を利用して、各多重フレーム画像で眼球領域画像を生成することができる。前記眼球座標学習部120’は、以上で説明された過程に従って、前記第2人工神経網モデルを学習させることができる。
前記眼球回転学習部130’は、前記第2人工神経網モデルで生成された各多重フレーム画像による瞳孔中心の座標と関連した情報をさらに利用して、前記第3人工神経網モデルを学習させることができる。また、前記眼球回転学習部130’は、前記眼球座標学習部120’で分割された虹彩及び/又は瞳孔の画像を利用して、以上で説明された過程に従って学習データを生成して、前記第3人工神経網モデルを学習させることができる。
前記第1~第3人工神経網モデルは、互いに独立して学習されることができ、各人工神経網モデルで生成された情報を利用して学習されることもできる。
以下においては、前記平衡機能管理システム10’が前記学習された人工神経網モデルを利用して、平衡機能状態情報生成及び平衡機能リハビリテーションプログラムを行う過程について説明する。
前記平衡機能管理システム10’は、n個のカメラから平衡機能状態検査及び/又は平衡機能リハビリテーションプログラムを行う対象者を撮影するn個の動画のフレーム画像をリアルタイムで獲得することができる。
前記平衡機能管理システム10’は、少なくとも1つのプロセッサを介して複数個のカメラのシンクを調節することができる。一例として、前記少なくとも1つのプロセッサは、ゲンロック(Genlock)などの技術を利用して複数個のカメラのシンクをリアルタイムで調節することができ、これは一例に該当し、当業者の間で広く知られている技術を通じて複数個のカメラのシンクを調節することができる。
また、前記平衡機能管理システム10’は、少なくとも1つのプロセッサを介して複数個のカメラのフレーム画像をサンプリングすることができる。一例として、1つのカメラは100FPSで前記対象者を撮影し、他の1つのカメラは50FPSで前記対象者を撮影することができる。この場合、前記平衡機能管理システム10’は少なくとも1つのプロセッサを利用して100FPSで撮影された動画を1/2倍ダウンサンプリング(Down Sampling)するか、50FPSで撮影された動画を2倍アップサンプリングすることができる。これは一例に該当し、これに制限されない。
好ましくは、前記平衡機能管理システム10’は、同じFPS設定値を持つ複数個のカメラを通して平衡機能状態検査及び/又は平衡機能リハビリテーションプログラムを行う対象者を撮影する動画をリアルタイムで獲得することができる。
前記平衡機能管理システム10’は、前記第1~第3人工神経網モデルのうち少なくとも1つを利用して、対象者の頭座標、瞳孔中心座標及び眼球の位相変化と関連した情報のうち少なくとも1つを獲得することができる。
前記平衡機能管理システム10’は、前記頭座標、瞳孔中心座標及び/又は眼球の位相変化と関連した情報を前記第1~第3人工神経網モデルを利用して獲得することができる。
また、前記平衡機能管理システム10’は、少なくとも1つのプロセッサが以上で説明された前記第1~第3人工神経網モデルの学習データを生成するアルゴリズムを利用して、前記頭座標、瞳孔中心座標及び眼球の位相変化と関連した情報を生成することもできる。
以下においては、前記第1~第3人工神経網モデルを利用して、前記頭座標、瞳孔中心座標及び眼球の位相変化と関連した情報を生成すると説明する。しかし、前記情報を生成するために、必ずしも人工神経網モデルを利用しなければならないものではない。
前記頭座標獲得部140’は、前記メモリ100’に保存された前記第1人工神経網モデルを実行させ、n個の動画のフレーム画像を連結した多重フレーム画像を前記第1人工神経網モデルに入力して、第m動画による頭座標と関連した情報を獲得することができる。第m動画による頭座標と関連した情報は、多重フレーム画像の順によって生成された第m動画に対する頭座標と関連した情報を意味することができる。
前記眼球座標獲得部150’は、前記メモリ100’に保存された第2人工神経網モデルを実行させ、前記頭座標と関連した情報を前記第2人工神経網モデルに入力して、第m動画による瞳孔中心座標と関連した情報を獲得することができる。第m動画による瞳孔中心座標と関連した情報は、多重フレーム画像の順によって生成された第m動画の瞳孔中心座標と関連した情報を意味することができる。
前記位相変化獲得部160’は、前記メモリ100’に保存された第3人工神経網モデルを実行させ、多重フレーム画像の時間順による第m動画の瞳孔中心座標と関連した情報を前記第3人工神経網モデルに入力して、第m動画による眼球の位相変化と関連した情報を獲得することができる。第m動画による眼球の位相変化と関連した情報は、第m動画のフレーム画像の順によって生成された眼球の位相変化と関連した情報を意味することができる。
図18は、本明細書の一実施形態に係る平衡機能状態情報を生成するための平衡機能管理システムのブロック図である。
図18を参照すれば、本明細書の一実施形態に係る平衡機能状態情報を生成するための平衡機能管理システム10’-1は、メモリ100’、頭座標学習部110’、眼球座標学習部120’、眼球回転学習部130’、頭座標獲得部140’、眼球座標獲得部150’、位相変化獲得部160’、頭の動き生成部1100’、眼球の動き生成部1110’、速度情報生成部1120’、及び平衡機能状態情報生成部1130’を含むことができる。
前記メモリ100’、頭座標学習部110’、眼球座標学習部120’、眼球回転学習部130’、頭座標獲得部140’、眼球座標獲得部150’、及び位相変化獲得部160’は以上で説明したので、繰り返しの説明は省略する。
前記頭の動き生成部1100’は、前記第1人工神経網モデルから獲得した頭座標と関連した情報を利用して、第m動画における頭の動きと関連した情報を生成することができる。前記頭の動きと関連した情報は、時間による頭の水平方向への動き、垂直方向への動き、頭の回転程度などを含むことができる。前記頭の回転程度は、頭のロール、ピッチ及びヨー方向に対する回転角度を意味することができる。前記頭の動きと関連した情報は、時間による頭の水平座標値、垂直座標値のグラフで表現されることができる。
本明細書の一実施形態によれば、前記頭の動き生成部1100’は、各フレーム画像で生成された頭の特徴点及び特徴点の座標を利用して、前記対象者の頭のノーマルベクトル(Normal Vector)を計算することができる。前記ノーマルベクトルの方向は、対象者の頭正面が向かう方向を意味することができる。対象者の頭の正面が向かう方向は、鼻先が向かう方向を意味することができる。前記頭の動き生成部1100’は、頭の特徴点のうち鼻先の特徴点を基準に前記頭の特徴点を利用して頭のノーマルベクトルを計算することができる。
又は、対象者の頭の正面が向かう方向は、前記鼻先の特徴点を基準に垂直に一直線上にある任意の特徴点(額の端、唇中心など)が向かう方向を意味することができる。前記頭の動き生成部1100’は、前記任意の特徴点のうちいずれか1つを基準に頭のノーマルベクトルを計算することができる。
特徴点を利用して頭の正面に対するノーマルベクトルを計算することは当業者の間で広く知られている技術であるので、詳しい説明は省略する。
前記頭の動き生成部1100’は、第m動画のフレーム画像による3次元頭座標情報及びノーマルベクトルを利用して、時間による頭の動きと関連した情報を生成することができる。前記頭の動き生成部1100’は、前記頭の動きと関連した情報をグラフで出力することができる。
前記眼球の動き生成部1110’は、第2人工神経網モデル及び第3人工神経網モデルで生成された瞳孔中心座標及び眼球の位相変化と関連した情報を利用して、第m動画における眼球の動きと関連した情報を生成することができる。前記眼球の動きと関連した情報は、時間による瞳孔中心の垂直方向の動き、水平方向の動き及び眼球の回転値と関連した情報を含むことができる。前記眼球の動きと関連した情報は、時間による左眼及び右眼の瞳孔中心の垂直座標値、水平座標値、回転角度に対するグラフで表現されることができる。
前記眼球の動き生成部1110’は、瞳孔中心の垂直座標値、水平座標値及び回転値を利用して眼球の注視ベクトルを計算することができる。前記瞳孔中心の座標値及び回転値を利用して注視ベクトルを計算することは当業者の間で広く知られている技術であるので、詳しい説明は省略する。
前記眼球の動き生成部1110’は、前記眼球の動きと関連した情報をグラフで出力することができる。
本明細書の一実施形態によれば、前記頭の動き生成部1100’及び眼球の動き生成部1110’は、学習データによる頭の動き及び眼球の動き情報と前記対象者の頭の動き及び眼球の動き情報の間の誤差を補正することができる。
前記学習データによる頭の動き及び眼球の動き情報は、前記人工神経網モデルを学習させるための実際データ値を意味することができる。
一例として、前記実際データ値は、前記眼球座標学習部120’から獲得した頭と眼球のオイラー角度のパラメーター値を意味することができる。前記眼球座標学習部120’は、平衡機能状態検査及び/又は平衡機能リハビリテーションプログラムにおける実際セッティングと類似するように仮想のカメラのパラメーター値を設定することができる。前記眼球座標学習部120’は、平衡機能状態検査及び/又は平衡機能リハビリテーションプログラムによる対象者の頭及び眼球の動きと類似するように前記オイラー角度のパラメーター値を変更することができる。このとき、頭と眼球のパラメーター値の変更による仮想オブジェクトの頭及び眼球の動き情報が実際データ値を意味することができる。これは一例に該当し、前記実際データ値は、前記第1~第3人工神経網モデルを学習させるために使用されることができる実際データ値による頭及び眼球の動き情報を意味することができる。
前記頭の動き生成部1100’及び眼球の動き生成部1110’は、予め設定された時間内で獲得されたフレーム画像の間における頭の動き及び眼球の動きの誤差を補正することができる。一例として、予め設定された時間が1.5秒であり、カメラが100FPSで対象者を撮影するとき、前記頭の動き生成部1100’及び眼球の動き生成部1110’は150個のフレーム画像の間における前記頭の動き及び眼球の動きの誤差を補正することができる。これは一例に該当し、前記時間及びフレームレートにより制限されない。
前記頭の動き生成部1100’及び眼球の動き生成部1110’は、前記頭の動き及び眼球の動きの誤差が予め設定された範囲内の値を持つように補正することができる。
一例として、前記頭の動き生成部1100’及び眼球の動き生成部1110’は、複数個のカメラが100FPSで前記対象者を撮影した動画で150個のフレーム画像(任意のフレーム画像を基準に1.5秒間獲得したフレーム画像)から獲得した頭座標、瞳孔中心座標及び/又は眼球の位相変化と関連した情報を利用して頭の動き及び眼球の動きと関連した情報を生成することができる。前記頭の動き及び眼球の動きと関連した情報は、フレーム画像の順によって時間による頭及び眼球の動き(垂直、水平、回転)の量で算出されることができる。このとき、50番目のフレーム画像(任意のフレーム画像を基準に0.5秒以後に獲得したフレーム画像)に対応する時間における頭及び眼球の動きの量が予め設定された誤差範囲を逸脱することができる。この場合、前記頭の動き生成部1100’及び眼球の動き生成部1110’は、先立つフレーム画像における情報を利用して生成された頭及び眼球の動きの量の平均値又は中央値などの統計値を計算して、50番目のフレーム画像に対応する時間における動きの量を代替することができる。
任意のフレーム画像を基準に1.5秒間獲得したフレーム画像の間で誤差を補正すると記載したが、これは一例に該当し、任意のフレーム画像を基準に1.5秒以前の時間に獲得したフレーム画像、1.5秒前後で獲得したフレーム画像など様々な実施形態が生じることができ、これは一例に該当し、前記時間、フレームレート、統計値などにより制限されない。
他の例として、前記頭の動き生成部1100’及び眼球の動き生成部1110’は、フィルター(Filter)を適用して前記頭及び眼球の動きの誤差を補正することができる。一例として、前記頭の動き生成部1100’及び眼球の動き生成部1110’は、Chaining Kalman Filter、Moving Average Filter、Savitzky-Golay filter、High Pass Filter、Low Pass Filter、Band Pass Filterなどのフィルターを利用して前記誤差を補正することができ、これは一例に該当し、これに制限されず、様々な種類のフィルターが使用されることができる。
本明細書の他の実施形態によれば、前記頭座標学習部110’、眼球座標学習部120’及び眼球回転学習部130’は、前記誤差を補正するように前記第1~第3人工神経網モデルを学習させることができる。前記第1~第3人工神経網は、前記誤差が補正された頭座標、瞳孔中心座標及び眼球の位相変化と関連した情報を生成することができる。
前記速度情報生成部1120’は、前記頭の動き及び眼球の動きと関連した情報を利用して、第m動画における頭と眼球の動き速度と関連した情報を生成することができる。前記速度情報生成部1120’は、前記頭の動きと関連した情報を利用して、時間による頭の垂直方向動き速度、水平方向動き速度及び/又は頭の回転速度などを算出することができる。前記速度情報生成部1120’は、前記眼球の動きと関連した情報を利用して、時間による眼球の垂直方向動き速度、水平方向動き速度及び/又は眼球の回転速度などを算出することができる。
本明細書の一実施形態によれば、前記速度情報生成部1120’は、前記頭及び眼球の動き速度と関連した情報からノイズ(Noise)値をフィルタリングすることができる。一例として、平衡機能状態検査を実施するとき、対象者の目が隠れる場合、対象者が頭を速く回転する場合、頭を遅く回転する場合、頭の位置が変わる場合、などによって頭及び眼球の動きの速度が正確に計算されないノイズ値が発生することができる。前記速度情報生成部1120’は、Chaining Kalman Filter、Moving Average Filter、Savitzky-Golay filter、High Pass Filter、Low Pass Filter、Band Pass Filterなどのフィルターを利用して頭及び眼球の動き速度と関連した情報からノイズを除去することができ、これは一例に該当し、これに制限されず、様々なノイズ処理方式が利用されることができる。
本明細書の一実施形態によれば、前記速度情報生成部1120’は、頭の動きが予め設定された臨界値以上になる時点を基準に予め設定された時間内における頭の動き速度及び眼球の動き速度と関連した情報を生成することができる。平衡機能状態検査で前記対象者は頭を水平(Lateral Left、Lateral Right)方向に動かすことができる。このとき、前記速度情報生成部1120’は、頭の水平方向への動きが予め設定された臨界値以上であるとき、頭及び眼球の動き速度と関連した情報を生成することができる。
また、前記対象者は、右側の前半規管と左側の後半規管(Right Anterior、Left Posterior、RALP)が刺激されるように、顔の右側面が対象者の正面に向かうように回した状態で右下及び右上方向に頭を動かすことができる。また前記対象者は、右側の後半規管と左側の前半規管(Left Anterior、Right Posterior、RALP)が刺激されるように、顔の左側面が対象者の正面に向かうように回した状態で座下及び左上方向に頭を動かすことができる。このとき、前記速度情報生成部1120’は、頭の垂直方向への動きが予め設定された臨界値以上であるとき、頭及び眼球の動き速度と関連した情報を生成することができる。
以下において、対象者がRALPが刺激されるように頭を回転する方向をRALP方向と記載し、対象者がLARPが刺激されるように頭を回転する方向をLARP方向と記載する。
一例として、前記速度情報生成部1120’は、最後に入力されたフレーム画像を基準に予め設定された時間内に存在するフレーム画像による頭の動き情報を利用して、頭の動きが臨界値以上であるか否かを判断することができる。前記速度情報生成部1120’は、予め設定された時間内に存在するフレーム画像による頭の動き情報で頭の特徴点座標の最大値と最小値との差を計算して頭の動きが臨界値以上であるか否かを判断することができる。前記予め設定された臨界値は、動画のフレームレート、フレーム画像のサイズなどによって変わることができる。
他の例として、前記メモリ100’は、頭の動きに対する情報を生成する第4人工神経網モデルをさらに保存することができる。前記第4人工神経網モデルは、少なくとも1つのプロセッサによって、平衡機能状態検査を行う動画のフレーム画像及び該当フレーム画像で頭のピッチ、ヨー値のデータを利用して学習されることができる。前記第4人工神経網モデルは、時系列モデルやトランスフォーマー(Transformer)モデルであってよく、これは一例に該当し、前記モデルにより制限されない。このとき、前記フレーム画像は、前記LAteral、RALP及びLARP方向に対する情報がラベリングされることができる。前記速度情報生成部1120’は、最後に獲得されたフレーム画像を基準に予め設定された時間内に存在するフレーム画像を前記第4人工神経網モデルに入力して頭の動きが臨界値以上であるか否かを確認することができる。
前記速度情報生成部1120’は、前記頭の動きが臨界値以上になる時点以後に予め設定された時間の間に生成される頭及び眼球の動きと関連した情報を利用して頭及び眼球の動き速度を計算することができる。一例として、前記速度情報生成部1120’は、前記頭の動きが臨界値以上になる時点以後に1.5秒以内に生成される頭及び眼球の動きと関連した情報を利用して頭及び眼球の動き速度を計算することができ、これは一例に該当し、前記時間により制限されない。前記速度情報生成部1120’は、第m動画における頭及び眼球の動き速度をそれぞれ計算することができる。
前記速度情報生成部1120’は、前記頭及び眼球の動き速度と関連した情報をディスプレイ装置に示すことができる。前記速度情報生成部1120’は、ノイズが除去された頭及び眼球の動き速度と関連した情報及び/又はノイズが除去されない頭及び眼球の動き速度と関連した情報をディスプレイに示すことができる。
前記平衡機能状態情報生成部1130’は、頭及び眼球の動き速度と関連した情報を利用して対象者の平衡機能の状態情報を生成することができる。
本明細書の一実施形態によれば、前記平衡機能状態情報生成部1130’は、予め設定された分析ウィンドウ内で前記対象者の頭の動きの速度が相対的に最も大きいときの時間値(Head Peak Index)及び前記対象者の眼球が頭の動きの方向に動いてからさらに既存位置に戻るとき、眼球の動きの速度が相対的に最も大きいときの時間値(Eye Peak Index)を利用してゲイン係数を計算することができる。前記分析ウィンドウは、頭の動きが臨界値以上になる時点を基準に予め設定された時間範囲を意味することができる。前記分析ウィンドウのサイズは、前記速度情報生成部1120’が頭及び眼球の動きの速度と関連した情報を生成する時間範囲に該当することができる。
一例として、頭の動きが臨界値以上になる時点以後に1.5秒の時間が分析ウィンドウのサイズであってよく、これは一例に該当し、これに制限されない。
前記平衡機能状態情報生成部1130’は、ノイズが除去された頭及び眼球の動き速度と関連した情報で前記Head Peak Index及びEye Peak Indexを利用して、ゲイン係数を前記[数式1]を利用して計算することができる。
以後に、前記平衡機能状態情報生成部1130’は、前記[数式2]を利用してゲイン値(Gain)を計算することができる。
前記平衡機能状態情報生成部1130’は、左眼及び右眼に対するゲイン値をそれぞれ計算することができる。
前記平衡機能状態情報生成部1130’は、第m動画におけるゲイン値をそれぞれ計算することができる。一例として、2個のカメラを利用して前記対象者を撮影した場合、2個の動画に対するゲイン値をそれぞれ計算することができる。この場合、第1動画における左眼及び右眼のゲイン値と第2動画における左眼及び右眼のゲイン値が計算されることができる。前記平衡機能状態情報生成部1130’は、前記第1動画及び第2動画で計算された左眼のゲイン値に対する統計値を計算し、前記第1動画及び第2動画で計算された右眼のゲイン値に対する少なくとも1つの統計値を計算することができる。前記統計値は、平均値、中央値、最小値、最大値、標準偏差などに該当することができ、これは一例に該当し、これに制限されない。
本明細書の一実施形態によれば、前記頭の動き生成部1100’は、第m動画による頭座標と関連した情報の統計値を算出して基準頭の動き情報をさらに生成することができる。前記頭の動き生成部1100’は、多重フレーム画像で生成された第m動画による頭座標と関連した情報の統計値を算出して基準頭の動き情報をさらに生成することができる。
前記眼球の動き生成部1110’は、第m動画による瞳孔中心座標及び眼球の位相変化と関連した情報の統計値を算出して基準眼球の動き情報をさらに生成することができる。前記眼球の動き生成部1110’は、多重フレーム画像で生成されたそれぞれの動画による瞳孔中心座標及び眼球の位相変化と関連した情報の統計値を算出して基準眼球の動き情報をさらに生成することができる。
複数個のカメラで前記対象者を撮影する場合、カメラの位置、角度などによって第m動画のフレーム画像で生成された3次元頭の座標値の差が発生することができる。
一例として、第1カメラが前記対象者を対象者の右側で撮影し、第2カメラが前記対象者を対象者の左側で撮影することができる。この場合、前記対象者が頭を右側に回転すれば、前記第1カメラで撮影された第1動画のフレーム画像では前記対象者の顔右側に位置した特徴点の座標が左側に位置した特徴点の座標より相対的にさらに正確に計算されることができる。また、前記対象者が頭を左側に回転すれば、前記第2カメラで撮影された第2動画のフレーム画像では前記対象者の顔の左側に位置した特徴点の座標が右側に位置した特徴点の座標より相対的にさらに正確に計算されることができる。
他の例として、前記対象者を中心に1m離れた距離に15°間隔で対象者を取り囲むように複数個のカメラが設置されることができる。このとき、複数個のカメラは、前記対象者の目線の高さで前記対象者を撮影することができる。このような場合にも、前記対象者の頭の動き方向によってカメラ別に相対的にさらに正確に測定される特徴点の座標が生成されることができる。
このように、複数個のカメラの位置、角度などによって算出される2次元頭の座標の情報が互いに差が生じることができる。
前記頭の動き生成部1100’は、第m動画でシンクが互いに合うフレーム画像で生成された3次元頭座標の平均値を計算して基準頭座標情報を生成することができる。前記頭の動き生成部1100’は、時間による基準頭座標情報を利用して基準頭の動きと関連した情報をさらに生成することができる。
又は、前記頭座標獲得部110’は、前記第1人工神経網モデルから前記基準頭座標を獲得することができる。前記頭の動き生成部1100’は、前記基準頭座標を利用して基準頭の動きと関連した情報をさらに生成することができる。
前記眼球の動き生成部1110’は、第m動画でシンクが互いに合うフレーム画像で生成された瞳孔中心座標及び眼球の位相変化と関連した情報の平均値を計算して、基準瞳孔中心座標及び基準眼球の位相変化と関連した情報を生成することができる。前記眼球の動き生成部1110’は、前記基準瞳孔中心座標及び基準眼球の位相変化と関連した情報を利用して眼球の基準注視ベクトルを生成することができる。前記眼球の動き生成部1110’は、前記基準瞳孔中心座標、基準眼球の位相変化と関連した情報及び基準注視ベクトルを利用して基準眼球の動きと関連した情報をさらに生成することができる。
又は、前記眼球座標獲得部150’及び位相変化獲得部160’は、前記第2及び第3人工神経網モデルから基準瞳孔中心座標と関連した情報及び基準眼球の回転値情報を獲得することができる。前記眼球の動き生成部1110’は、前記基準瞳孔中心座標と関連した情報及び基準眼球の回転値情報を利用して前記基準眼球の動きと関連した情報を生成することができる。
このとき、前記速度情報生成部1120’は、前記基準頭の動きが予め設定された臨界値以上になる時点を基準に予め設定された時間内で第m動画に対する頭の動き速度及び眼球の動き速度と関連した情報をそれぞれ生成することができる。
前記平衡機能状態情報生成部1130’は、前記基準頭の動きが予め設定された臨界値が以上になる時点を基準に予め設定された時間内で第m動画に対するHead Peak Index及びEye Peak Indexを利用してゲイン値をそれぞれ計算することができる。
図9に図示されたように、前記頭の動き生成部1100’、眼球の動き生成部1110’、速度情報生成部1120’、及び平衡機能状態情報生成部1130’は、算出した情報をディスプレイ画面で出力することができる。前記ディスプレイ画面には複数個のカメラで撮影された動画がそれぞれ出力されることができる。
前記速度情報生成部1120’は、第m動画に対する頭及び眼球の動き速度情報をそれぞれグラフ205で出力することができる。前記頭及び眼球の動き速度のグラフ205で平衡機能状態検査の回数による速度情報が重なって示されることができる。前記頭及び眼球の動きの速度グラフ205で頂点及び/又は谷が現れる時間値が前記Head Peak Index及び/又はEye Peak Indexに該当することができる。前記グラフで垂直軸が速度値であり、水平軸が時間値に該当することができる。図9には、頭及び眼球の水平方向の速度に対するグラフが図示されているが、これは一例に該当し、検査種類によって垂直、回転方向に対する速度に対するグラフがさらに出力されることができる。
前記頭の動き生成部1100’及び眼球の動き生成部1110’は、頭及び眼球の動き情報をグラフで出力することができる。前記頭の動き生成部1100’及び眼球の動き生成部1110’は、頭及び眼球の水平方向への動きグラフ206及び垂直方向への動きグラフ207を出力することができる。また、頭及び/又は眼球の回転方向に対する動きグラフをさらに出力することができる。また、前記頭及び眼球の動きグラフは、第m動画に対する動き情報を含むことができ、前記基準頭の動き及び基準眼球の動き情報を含むことができる。
前記平衡機能状態情報生成部1130’は、前記対象者に対する平衡機能状態検査と関連した情報208をディスプレイ装置に出力することができる。前記平衡機能状態検査と関連した情報は、頭の回転方向(Lateral、RALP、LARP)、頭の回転方向によるゲイン値と標準偏差、頭の回転方向による平衡機能状態検査の回数、ゲイン値の計算成功回数及びゲイン値の計算失敗回数のうち少なくとも1つ以上を含むことができる。
前記ゲイン値の計算が失敗する場合は、前記対象者が頭を検査の基準より早く動いたとき発生することができる。この場合、前記Head Peak IndexとEye Peak Indexとの間の差が分析ウィンドウサイズの中間を超えることができる。この場合、前記平衡機能状態情報生成部1130’は、ゲイン値の計算を失敗することができる。前記平衡機能状態情報生成部1130’は、前記ゲイン値の計算成功及び失敗回数に対する情報を生成して、対象者及び/又は検査者がより正確な判断ができる効果を提供することができる。
また、前記平衡機能状態情報生成部1130’は、前記ゲイン値に従って半規管の異常有無に対する情報を生成することができる。一例として、前記平衡機能状態情報生成部1130’は、平衡機能状態検査で前記左眼及び右眼のゲイン値が予め設定された値以下である場合、半規管の異常情報を生成することができる。
また、平衡機能状態検査で前記対象者が頭をLateral方向に回転することができる。このとき、前記対象者が頭を左側に回転するときと右側に回転するときの左眼及び右眼のゲイン値の差が予め設定された値以上である場合、前記平衡機能状態情報生成部1130’は半規管の異常情報を生成することができる。
また、平衡機能状態検査で前記対象者が頭をRALP又はLARP方向に回転することができる。このとき、前記対象者が頭を上側に回転するときと下側に回転するときの左眼及び右眼のゲイン値の差が予め設定された値以上である場合、前記平衡機能状態情報生成部1130’は半規管の異常情報を生成することができる。
また、前記平衡機能状態情報生成部1130’は、前記眼球の動きと関連した情報及びゲイン値情報を利用して、中枢性平衡神経機能の異常と末梢性平衡神経機能の異常有無に対する情報をさらに生成することができる。
図19は、本明細書の一実施形態に係る平衡機能リハビリテーションプログラムを行うための平衡機能管理システムのブロック図である。
図19を参照すれば、本明細書の一実施形態に係る平衡機能リハビリテーションプログラムを行うための平衡機能管理システム10’-2は、メモリ100’、頭座標学習部110’、眼球座標学習部120’、眼球回転学習部130’、頭座標獲得部140’、眼球座標獲得部150’、位相変化獲得部160’、頭の動き生成部1100’、眼球の動き生成部1110’、ターゲット出力部1140’、頭方向提供部1150’、及びフィードバック提供部1160’を含むことができる。前記メモリ100’、頭座標学習部110’、眼球座標学習部120’、眼球回転学習部130’、頭座標獲得部140’、眼球座標獲得部150’、位相変化獲得部160’、頭の動き生成部1100’、及び眼球の動き生成部1110’は以上で説明したので、繰り返しの説明は省略する。
図11に図示されたように、前記ターゲット出力部1140’は、ディスプレイ装置に仮想のターゲット209を出力することができる。前記仮想のターゲットは、ディスプレイ装置の任意の位置に示されることができる。図11でターゲットはトランプカードの形状に図示されているが、これは一例に該当し、前記形状により制限されない。
前記頭方向提供部1150’は、前記対象者に平衡リハビリテーションプロトコル(Protocol)による頭の回転方向に対する情報を提供することができる。一例として、前記頭方向提供部1150’は、前記対象者が頭をLateral方向に回転するように情報を提供することができる。
又は、前記頭方向提供部1150’は、前記対象者が頭をRALP又はLARP方向に回転するように情報を提供することができる。
このとき、前記頭方向提供部1150’は、前記対象者が頭の右側が正面に向かう状態で頭を上又は下側にのみ回転するように情報を提供することができる。また、前記頭方向提供部1150’は、前記対象者が頭の左側が正面に向かう状態で頭を上又は下側にのみ回転するように情報を提供することができる。
また、前記頭方向提供部1150’は、前記対象者が頭を回転させた後に予め設定された時間内に頭を回転させる前の状態に復元するように情報を提供することができる。一例として、前記頭方向提供部1150’は、1秒以内に頭を回転させた以後に頭を回転させる前の状態に復元するように情報を提供することができる。
前記頭方向提供部1150’は、前記情報をディスプレイ装置に視覚的に示すことができる。また、前記頭方向提供部1150’は、前記情報をオーディオ装置に出力することができる。
前記フィードバック提供部1160’は、前記対象者の頭の動き及び眼球の動きに従ってフィードバック(Feedback)を提供することができる。
前記平衡リハビリテーションプロトコルによって前記対象者が頭を回転させなければならない角度の基準が予め決まることができる。前記フィードバック提供部1160’は、前記頭の動き生成部1100’から生成された前記対象者の頭の回転角度と前記角度の基準を比較することができる。前記フィードバック提供部1160’は、前記対象者の頭の回転角度が前記角度の基準を満たす場合、聴覚的フィードバック及び/又は視覚的フィードバックを提供することができる。また、前記フィードバック提供部1160’は、前記対象者の頭の回転角度が前記角度の基準を満たすことができない場合、聴覚的フィードバック及び/又は視覚的フィードバックを提供することができる。前記フィードバック提供部1160’は、前記対象者の頭の回転角度が前記角度の基準を満たすか否かによって互いに異なるフィードバックを提供することができる。
また、前記眼球の動き生成部1110’は、眼球注視ベクトルを利用してディスプレイ装置上に前記対象者の視線が向かう注視点の座標情報を生成することができる。前記フィードバック提供部1160’は、前記眼球の動き生成部1110’から生成された注視点の座標情報と前記仮想のターゲット209の座標情報とを比較することができる。
前記注視点の座標が前記仮想のターゲット209の領域内部に位置するとき、前記フィードバック提供部1160’は、前記仮想のターゲット209の色相値を変更することができる。また、前記フィードバック提供部1160’は、前記仮想のターゲット209内部に前記注視点をさらに示すことができる。
前記注視点の座標が前記仮想のターゲット209の領域外部に位置するとき、前記フィードバック提供部1160’は、前記注視点の位置をディスプレイ装置に示すことができる。
前記対象者を複数個のカメラで撮影するとき、前記頭の動き生成部1100’及び眼球の動き生成部1110’は、以上で説明したように基準頭の動き及び基準眼球の動きと関連した情報を生成することができる。前記フィードバック提供部1160’は、前記基準頭の動き及び基準眼球の動きと関連した情報に従ってフィードバックを提供することができる。
図20は、本明細書の一実施形態に係る平衡機能状態情報生成及び平衡機能リハビリテーションプログラムを行う平衡機能管理システムのブロック図である。
図20を参照すれば、平衡機能管理システム10’-3は、メモリ100’、頭座標学習部110’、眼球座標学習部120’、眼球回転学習部130’、頭座標獲得部140’、眼球座標獲得部150’、位相変化獲得部160’、頭の動き生成部1100’、眼球の動き生成部1110’、速度情報生成部1120’、平衡機能状態情報生成部1130’、ターゲット出力部1140’、頭方向提供部1150’、及びフィードバック提供部1160’を含むことができる。前記平衡機能管理システム10’-3は、ゲイン値を生成して平衡機能異常有無による平衡機能リハビリテーションプログラムを提供することができる。
前記頭座標学習部110、110’、眼球座標学習部120、120’、眼球回転学習部130、130’、頭座標獲得部140、140’、眼球座標獲得部150、150’、位相変化獲得部160、160’、頭の動き生成部1100、1100’、眼球の動き生成部1110、1110’、速度情報生成部1120、1120’、平衡機能状態情報生成部1130、1130’、ターゲット出力部1140、1140’、頭方向提供部1150、1150’、及びフィードバック提供部1160、1160’は、算出及び様々な制御ロジックを実行するために本発明が属する技術分野に知られているプロセッサ、ASIC(application-specific integrated circuit)、他のチップセット、論理回路、レジスター、通信モデム、データ処理装置などを含むことができる。また、上述した制御ロジックがソフトウェアで実現されるとき、前記頭座標学習部110、110’、眼球座標学習部120、120’、眼球回転学習部130、130’、頭座標獲得部140、140’、眼球座標獲得部150、150’、位相変化獲得部160、160’、頭の動き生成部1100、1100’、眼球の動き生成部1110、1110’、速度情報生成部1120、1120’、平衡機能状態情報生成部1130、1130’、ターゲット出力部1140、1140’、頭方向提供部1150、1150’、及びフィードバック提供部1160、1160’は、プログラムモジュールの集合で実現されることができる。このとき、プログラムモジュールは、前記メモリ装置に保存され、プロセッサによって実行されることができる。
以下においては、本明細書による平衡機能管理システムを利用した平衡機能状態情報生成方法及び平衡機能リハビリテーション方法について開示する。ただし、本明細書による平衡機能状態情報生成方法及び平衡機能リハビリテーション方法を説明するに当たり、各構成要素に対する繰り返しの説明は省略する。
図21は、本明細書の一実施形態に係る平衡機能状態情報生成方法のフローチャートである。
図21を参照すれば、ステップS10で少なくとも1つのプロセッサがn個の動画のフレーム画像を第1人工神経網モデルに入力して頭座標と関連した情報を獲得することができる。n個の動画は、n個のカメラで平衡機能状態検査を行う対象者を撮影した動画を意味することができる。n個の動画のフレーム画像は、以上で説明したように順次に入力されることができ、n個の動画に対する多重フレーム画像が入力されることができる。以後に、前記少なくとも1つのプロセッサがn個の動画に対する頭座標と関連した情報を第2人工神経網モデルに入力して瞳孔中心座標と関連した情報を獲得することができる。以後に、前記少なくとも1つのプロセッサがn個の動画に対する瞳孔中心座標と関連した情報を前記第3人工神経網モデルに入力して眼球の位相変化と関連した情報を獲得することができる。前記第1~第3人工神経網モデルの学習過程は以上で説明したので、繰り返しの説明は省略する。
ステップS11において、前記少なくとも1つのプロセッサが頭座標、瞳孔中心座標及び眼球の位相変化と関連した情報を利用して頭及び眼球の動き情報を生成することができる。前記少なくとも1つのプロセッサは、第m動画に対する頭及び眼球の動き情報をそれぞれ生成することができる。又は、前記少なくとも1つのプロセッサは、第m動画に対する基準頭の動き情報及び基準眼球の動き情報をさらに生成することができる。
ステップS12において、前記対象者の第m動画で頭の動きが予め設定された臨界値以上であるとき、前記少なくとも1つのプロセッサは、第m動画に対する頭及び眼球の動きの速度情報を生成することができる。また、前記対象者の基準頭の動きが予め設定された臨界値以上であるとき、前記少なくとも1つのプロセッサは、第m動画に対する頭及び眼球の動きの速度情報を生成することができる。
ステップS13において、前記少なくとも1つのプロセッサは、前記[数式1]及び[数式2]を利用してゲイン値を計算することができる。前記少なくとも1つのプロセッサは、前記ゲイン値を利用して平衡機能状態情報を生成することができる。
図22は、本明細書の一実施形態に係る平衡機能リハビリテーション方法のフローチャートである。
図22を参照すれば、ステップS20において少なくとも1つのプロセッサがn個の動画のフレーム画像を第1人工神経網モデルに入力して頭座標と関連した情報を獲得することができる。n個の動画は、n個のカメラで平衡機能リハビリテーションプログラムを行う対象者を撮影した動画を意味することができる。n個の動画のフレーム画像は、以上で説明したように順次に入力されることができ、n個の動画に対する多重フレーム画像が入力されることができる。以後に、前記少なくとも1つのプロセッサがn個の動画に対する頭座標と関連した情報を第2人工神経網モデルに入力して瞳孔中心座標と関連した情報を獲得することができる。以後に、前記少なくとも1つのプロセッサがn個の動画に対する瞳孔中心座標と関連した情報を前記第3人工神経網モデルに入力して眼球の位相変化と関連した情報を獲得することができる。前記第1~第3人工神経網モデルの学習過程は以上で説明したので、繰り返しの説明は省略する。
ステップS21において、前記少なくとも1つのプロセッサが頭座標、瞳孔中心座標及び眼球の位相変化と関連した情報を利用して頭及び眼球の動き情報を生成することができる。前記少なくとも1つのプロセッサは、第m動画に対する頭及び眼球の動き情報をそれぞれ生成することができる。また、前記少なくとも1つのプロセッサは、第m動画に対する基準頭の動き情報及び基準眼球の動き情報をさらに生成することができる。前記少なくとも1つのプロセッサは、前記基準眼球の動き情報を利用して対象者の視線による注視点の座標情報を生成することができる。
ステップS22において、前記少なくとも1つのプロセッサは仮想のターゲットをディスプレイで出力することができる。
ステップS23において、前記少なくとも1つのプロセッサは、前記対象者に頭の回転方向に対する情報を提供することができる。前記頭の回転方向に対する情報は以上で説明したので、繰り返しの説明は省略する。
ステップS24において、前記少なくとも1つのプロセッサは、頭及び眼球の動き情報を利用して前記対象者に聴覚的フィードバック及び/又は視覚的フィードバックを提供することができる。
前記平衡機能状態情報生成方法及び平衡機能リハビリテーション方法は、コンピュータで各ステップを行うように作成され、コンピュータで読み出し可能な記録媒体に記録されたコンピュータプログラムの形態で実現されることができる。前述のコンピュータプログラムは、前記コンピュータがプログラムを読み込んでプログラムで実現された前記方法を実行させるために、前記コンピュータのプロセッサ(CPU)が前記コンピュータの装置インターフェースを通じて読まれるC/C++、C#、JAVA(登録商標)、Python(登録商標)、機械語などのコンピュータ言語でコード化されたコード(Code)を含むことができる。このようなコードは、前記方法を実行するために必要な機能を定義した関数などと関連した機能的なコード(Functional Code)を含むことができ、前記機能を前記コンピュータのプロセッサが所定の手続きどおり実行させるのに必要な実行手続き関連制御コードを含むことができる。また、このようなコードは、前記機能を前記コンピュータのプロセッサが実行させるのに必要な追加情報やメディアが前記コンピュータの内部又は外部メモリのどの位置(アドレス番地)で参照されなければならないかに対するメモリ参照関連コードをさらに含むことができる。また、前記コンピュータのプロセッサが前記機能を実行させるために遠隔(Remote)にある如何なる他のコンピュータやサーバーなどと通信が必要な場合、コードは前記コンピュータの通信モジュールを利用して遠隔にある如何なる他のコンピュータやサーバーなどとどのように通信しなければならないのか、通信時に如何なる情報やメディアを送受信しなければならないのかなどに対する通信関連コードをさらに含むことができる。
前記保存される媒体は、レジスター、キャッシュ、メモリなどのように、短い瞬間の間データを保存する媒体ではなく、半永久的にデータを保存し、機器によって読み取り(reading)が可能な媒体を意味する。具体的には、前記保存される媒体の例としては、ROM、RAM、CD-ROM、磁気テープ、フロッピーディスク、光データ保存装置などがあるが、これに制限されない。すなわち、前記プログラムは、前記コンピュータが接続することができる様々なサーバー上の様々な記録媒体又は使用者の前記コンピュータ上の様々な記録媒体に保存されることができる。また、前記媒体は、ネットワークで連結されたコンピュータシステムに分散して、分散方式でコンピュータが読むことができるコードが保存されることができる。
以上、添付の図面を参照して本明細書の実施形態を説明したが、本明細書の属する技術分野における通常の技術者は、本発明がその技術的思想や必須的な特徴を変更せずに他の具体的な形態で実施されることができるということを理解するであろう。そのため、以上で記述した実施形態はすべての面で例示的なものであり、制限的ではないものと理解しなければならない。