JP7041244B1

JP7041244B1 - 表現的ボトルネック現象が最小化された人工ニューラルネットワークに基づく電子装置およびその動作方法

Info

Publication number: JP7041244B1
Application number: JP2020219478A
Authority: JP
Inventors: ドンユンハン; サンドゥユン; ビョンホホ; ヨンジュンユ
Original assignee: Naver Corp
Current assignee: Naver Corp
Priority date: 2020-09-18
Filing date: 2020-12-28
Publication date: 2022-03-23
Anticipated expiration: 2040-12-28
Also published as: KR20220037711A; JP2022051484A; KR102427737B1

Abstract

【課題】多様な実施形態に係る電子装置およびその動作方法は、複数の中間層を有する人工ニューラルネットワークに基づき、入力されるデータを処理するように構成される。【解決手段】多様な実施形態によると、人工ニューラルネットワークは、中間層での表現的ボトルネック現象が最小化されるように中間層の加重値マトリックスに対するランクを拡張させるために、中間層のそれぞれに対して入力チャネルサイズが増加され、非線形活性化関数を利用し、中間層の間で拡張層の個数が増加されるように設計される。【選択図】図１

Description

特許法第３０条第２項適用２０２０年７月２日に「ｈｔｔｐｓ：／／ａｒｘｉｖ．ｏｒｇ／ａｂｓ／２００７．００９９２」のウェブサイトで公開

多様な実施形態は、表現的ボトルネック現象が最小化された人工ニューラルネットワークに基づく電子装置およびその動作方法に関する。

畳み込みニューラルネットワーク（ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋ：ＣＮＮ）は、人工ニューラルネットワーク（ａｒｔｉｆｉｃｉａｌｎｅｕｒａｌｎｅｔｗｏｒｋ）の一種であり、データ処理のために幅広く利用されている。畳み込みニューラルネットワークの計算速度を改善するために、中間層（ｉｎｔｅｒｍｅｄｉａｔｅｌａｙｅｒ）のディメンション（ｄｉｍｅｎｓｉｏｎ）が減少されている。しかしながら、中間層のディメンションの減少により、中間層の限定的なランク（ｒａｎｋ）によって表現的ボトルネック現象（ｒｅｐｒｅｓｅｎｔａｔｉｏｎａｌｂｏｔｔｌｅｎｅｃｋ）が発生し、これは情報の損失を誘発する。これにより、畳み込みニューラルネットワークの正確性および効率性が低下することがある。

多様な実施形態は、表現的ボトルネック現象が最小化された人工ニューラルネットワークに基づく電子装置およびこの動作方法を提供する。

多様な実施形態に係る電子装置の動作方法は、入力されるデータを検出する段階、および複数の中間層を有する人工ニューラルネットワークに基づき、前記データを処理する段階を含み、前記人工ニューラルネットワークは、前記中間層での表現的ボトルネック現象が最小化されるように、前記中間層の加重値マトリックス（ｗｅｉｇｈｔｍａｔｒｉｘ）に対するランク（ｒａｎｋ）が拡張されるように設計されてよい。

多様な実施形態に係るコンピュータプログラムは、前記動作方法を前記電子装置に実行させるために非一時的なコンピュータ読み取り可能な記録媒体に記録されてよい。

多様な実施形態に係る記録媒体は、前記動作方法を前記電子装置に実行させるためのプログラムが記録されている、非一時的なコンピュータ読み取り可能なものとして構成されてよい。

多様な実施形態に係る電子装置は、メモリ、および前記メモリと連結し、前記メモリに記録される少なくとも１つの命令を実行するように構成されたプロセッサを含み、前記プロセッサは、複数の中間層を有する人工ニューラルネットワークに基づき、入力されるデータを処理するように構成され、前記人工ニューラルネットワークは、前記中間層での表現的ボトルネック現象が最小化されるように、前記中間層の加重値マトリックスに対するランクが拡張されるように設計されてよい。

多様な実施形態によると、電子装置は、表現的ボトルネック現象が最小化された人工ニューラルネットワークに基づき、データを処理してよい。このとき、人工ニューラルネットワークは、中間層の加重値マトリックスに対するランクが拡張されるように設計され、これにより、人工ニューラルネットワークで発生し得る表現的ボトルネック現象が最小化される。より詳細には、人工ニューラルネットワークは、中間層のそれぞれに対して入力チャネルサイズが増加され、非線形活性化関数を利用し、中間層の間で拡張層の個数が増加されるように設計されることにより、中間層の加重値マトリックスに対するランクが拡張される。これにより、人工ニューラルネットワークで表現的ボトルネック現象による情報の損失を防ぎ、人工ニューラルネットワークの正確性および効率性のような性能を向上させることができる。

多様な実施形態に係る、電子装置を示した図である。多様な実施形態に係る、人工ニューラルネットワークを説明するための図である。多様な実施形態に係る、人工ニューラルネットワークを説明するための図である。多様な実施形態に係る、人工ニューラルネットワークを説明するための図である。多様な実施形態に係る、電子装置の動作方法を示した図である。

以下、本文書の多様な実施形態について、添付の図面を参照しながら説明する。

図１は、多様な実施形態に係る、電子装置１００を示した図である。

図２、図３、および図４は、多様な実施形態に係る、人工ニューラルネットワークを説明するための図である。

図１を参照すると、多様な実施形態に係る電子装置１００は、カメラモジュール１１０、連結端子１２０、通信モジュール１３０、入力モジュール１４０、表示モジュール１５０、オーディオモジュール１６０、メモリ１７０、またはプロセッサ１８０のうちの少なくともいずれか１つを含んでよい。一実施形態において、電子装置１００の構成要素のうちの少なくともいずれか１つが省略されてもよいし、少なくとも１つの他の構成要素が追加されてもよい。一実施形態では、少なくとも、電子装置１００の構成要素のうちのいずれか２つが、１つの統合された回路によって実現されてよい。例えば、電子装置１００は、スマートフォン（ｓｍａｒｔｐｈｏｎｅ）、携帯電話、ナビゲーション、コンピュータ、ノート型ＰＣ、デジタル放送用端末、ＰＤＡ（ｐｅｒｓｏｎａｌｄｉｇｉｔａｌａｓｓｉｓｔａｎｔｓ）、ＰＭＰ（ｐｏｒｔａｂｌｅｍｕｌｔｉｍｅｄｉａｐｌａｙｅｒ）、タブレット、ゲームコンソール（ｇａｍｅｃｏｎｓｏｌｅ）、ウェアラブルデバイス（ｗｅａｒａｂｌｅｄｅｖｉｃｅ）、ＩｏＴ（ｉｎｔｅｒｎｅｔｏｆｔｈｉｎｇｓ）デバイス、家電機器、医療機器、ロボット（ｒｏｂｏｔ）、またはサーバのうちの少なくともいずれか１つを含んでよい。

カメラモジュール１１０は、電子装置１００で映像を撮影してよい。このとき、カメラモジュール１１０は、電子装置１００の予め定められた位置に設置され、映像を撮影してよい。また、カメラモジュール１１０は、映像データを生成してよい。例えば、カメラモジュール１１０は、少なくとも、レンズ、少なくとも１つのイメージセンサ、イメージシグナルプロセッサ、またはフラッシュのうちのいずれか１つを含んでよい。

連結端子１２０は、電子装置１００と外部装置１０２とを物理的に連結してよい。例えば、外部装置１０２は、他の電子装置を含んでよい。このために、連結端子１２０は、少なくとも１つのコネクタを含んでよい。例えば、コネクタは、少なくとも、ＨＤＭＩコネクタ、ＵＳＢコネクタ、ＳＤカードコネクタ、またはオーディオコネクタのうちのいずれか１つを含んでよい。

通信モジュール１３０は、電子装置１００と外部装置１０２、１０４との通信を実行してよい。通信モジュール１３０は、電子装置１００と外部装置１０２、１０４との間の通信チャネルを樹立し、通信チャネルを介し、外部装置１０２、１０４との通信を実行してよい。ここで、外部装置１０２、１０４は、少なくとも、衛星、基地局、サーバ、または他の電子装置のうちのいずれか１つを含んでよい。通信モジュール１３０は、少なくとも、有線通信モジュールまたは無線通信モジュールのうちのいずれか１つを含んでよい。有線通信モジュールは、連結端子１２０を介し、外部装置１０２と有線で連結し、有線で通信してよい。無線通信モジュールは、少なくとも、近距離通信モジュールまたは遠距離通信モジュールのうちのいずれか１つを含んでよい。近距離通信モジュールは、外部装置１０２と近距離通信方式によって通信してよい。例えば、近距離通信方式は、少なくとも、ブルートゥース（Ｂｌｕｅｔｏｏｔｈ）（登録商標）、Ｗｉ－Ｆｉダイレクト（Ｗｉ－Ｆｉｄｉｒｅｃｔ）、または赤外線通信（ＩｒＤＡ：ｉｎｆｒａｒｅｄｄａｔａａｓｓｏｃｉａｔｉｏｎ）のうちのいずれか１つを含んでよい。遠距離通信モジュールは、外部装置１０４と遠距離通信方式によって通信してよい。ここで、遠距離通信モジュールは、ネットワーク１９０を介して外部装置１０４と通信してよい。例えば、ネットワーク１９０は、少なくとも、セルラネットワーク、インターネット、またはＬＡＮ（ｌｏｃａｌａｒｅａｎｅｔｗｏｒｋ）やＷＡＮ（ｗｉｄｅａｒｅａｎｅｔｗｏｒｋ）のようなコンピュータネットワークのうちのいずれか１つを含んでよい。

入力モジュール１４０は、電子装置１００の少なくとも１つの構成要素に使用される信号を入力してよい。入力モジュール１４０は、少なくとも、ユーザが電子装置１００に直接的に信号を入力するように構成される入力装置、または周辺環境を感知して信号を発生するように構成されるセンサ装置のうちのいずれか１つを含んでよい。例えば、入力装置は、少なくとも、マイクロフォン（ｍｉｃｒｏｐｈｏｎｅ）、マウス（ｍｏｕｓｅ）、またはキーボード（ｋｅｙｂｏａｒｄ）のうちのいずれか１つを含んでよい。一実施形態において、センサ装置は、少なくとも、タッチを感知するように設定されたタッチ回路（ｔｏｕｃｈｃｉｒｃｕｉｔｒｙ）、またはタッチによって発生する力の強度を測定するように設定されたセンサ回路のうちのいずれか１つを含んでよい。

表示モジュール１５０は、電子装置１００で視覚的に情報を表示してよい。例えば、表示モジュール１５０は、少なくとも、ディスプレイ、ホログラム装置、またはプロジエクタのうちのいずれか１つを含んでよい。一例として、表示モジュール１５０は、少なくとも、入力モジュール１４０のタッチ回路またはセンサ回路のうちのいずれか１つと組み立てられ、タッチスクリーンとして実現されてよい。

オーディオモジュール１６０は、電子装置１００でオーディオ信号を処理してよい。オーディオモジュール１６０は、少なくとも、オーディオ入力モジュールまたはオーディオ出力モジュールのうちのいずれか１つを含んでよい。オーディオ入力モジュールは、入力モジュール１４０に入力される音からオーディオ信号を取得してよい。オーディオ出力モジュールは、オーディオ信号を音として出力してよい。例えば、オーディオ出力装置は、少なくとも、スピーカまたはレシーバのうちのいずれか１つを含んでよい。

メモリ１７０は、電子装置１００の少なくとも１つの構成要素が使用する多様なデータを記録してよい。例えば、メモリ１７０は、少なくとも、揮発性メモリまたは不揮発性メモリのうちのいずれか１つを含んでよい。データは、少なくとも１つのプログラム、およびこれと関連する入力データまたは出力データを含んでよい。プログラムは、メモリ１７０に少なくとも１つの命令を含むソフトウェアとして記録されてよく、例えば、少なくとも、オペレーティングシステム、ミドルウェア、またはアプリケーションのうちのいずれか１つを含んでよい。

プロセッサ１８０は、メモリ１７０のプログラムを実行し、電子装置１００の少なくとも１つの構成要素を制御してよい。これにより、プロセッサ１８０は、データ処理または演算を実行してよい。このとき、プロセッサ１６０は、メモリ１７０に記録された命令を実行してよい。プロセッサ１８０は、人工ニューラルネットワーク（ａｒｔｉｆｉｃｉａｌｎｅｕｒａｌｎｅｔｗｏｒｋ）に基づき、データを処理してよい。人工ニューラルネットワークは、入力層（ｉｎｐｕｔｌａｙｅｒ）、出力層（ｏｕｔｐｕｔｌａｙｅｒ）、および入力層と出力層との間の複数の中間層（ｉｎｔｅｒｍｅｄｉａｔｅｌａｙｅｒ）を含んでよい。各中間層は、少なくとも、入力側層または出力側層のうちのいずれか１つであってよい。言い換えれば、隣接する２つの中間層のそれぞれが、入力側層と出力側層とであってよい。ここで、拡張層（ｅｘｐａｎｄｌａｙｅｒ）および圧縮層（ｃｏｎｄｅｎｓｅｌａｙｅｒ）が定義されてよい。拡張層は、出力側層のディメンション（ｄ_ｉ）が入力側層のディメンション（ｄ_ｉ－１）よりも大きいとき（ｄ_ｉ＞ｄ_ｉ－１）の出力側層としての中間層を示してよい。圧縮層は、入力側層のディメンションが出力側層のディメンションよりも大きいとき（ｄ_ｉ－１＞ｄ_ｉ）の出力側層としての中間層を示してよい。

多様な実施形態によると、中間層での表現的ボトルネック現象（ｒｅｐｒｅｓｅｎｔａｔｉｏｎａｌｂｏｔｔｌｅｎｅｃｋ）を最小化するために、人工ニューラルネットワークは、中間層の加重値マトリックス（ｗｅｉｇｈｔｍａｔｒｉｘ）に対するランク（ｒａｎｋ）が拡張されるように設計されてよい。このために、人工ニューラルネットワークは、次の３つの条件に基づいて設計されてよい。例えば、人工ニューラルネットワークは、畳み込みニューラルネットワーク（ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋ：ＣＮＮ）を含んでよい。一例として、畳み込みニューラルネットワークの中間層、例えば、畳み込み層（ｃｏｎｖｏｌｕｔｉｏｎａｌｌａｙｅｒ）が、次の条件に基づいて設計されてよい。他の例として、畳み込みニューラルネットワークの中間層のうちのペナルト層（ｐｅｎｕｌｔｉｍａｔｅｌａｙｅｒ）が、次の条件に基づいて設計されてよい。

最初の条件は、中間層のそれぞれに対して入力チャネルサイズ（ｉｎｐｕｔｃｈａｎｎｅｌｓｉｚｅ）が増加されるように設計されなければならないという点であってよい。入力チャネルサイズとは、各中間層でのインプットディメンション（ｉｎｐｕｔｄｉｍｅｎｓｉｏｎ）（ｄ_ｉｎ）に対するアウトプットディメンション（ｏｕｔｐｕｔｄｉｍｅｎｓｉｏｎ）（ｄ_ｏｕｔ）の割合（ｄ_ｉｎ／ｄ_ｏｕｔ）を示してよい。ここで、アウトプットディメンション（ｄ_ｏｕｔ）は、該当の中間層のディメンション（ｄ_ｉ）を示し、インプットディメンション（ｄ_ｉｎ）は、該当の中間層に対する入力側層のディメンション（ｄ_ｉ－１）を示してよい。すなわち、該当の中間層のディメンション（ｄ_ｉ）が固定されるとき、該当の中間層に対する入力側層のディメンション（ｄ_ｉ－１）が拡張されることにより、入力チャネルサイズが増加されてよい。

次の条件は、非線形活性化関数（ｎｏｎｌｉｎｅａｒａｃｔｉｖａｔｉｏｎｆｕｎｃｔｉｏｎ）を利用するように設計されなければならないという点であってよい。ここで、非線形活性化関数は、０が少ない関数として決定されてよい。

ｉ－番目の中間層の加重値マトリックスＷ_iに基づき、該当の中間層によって生成されるｉ－番目の特徴（ｆｅａｔｕｒｅ）が

として与えられるとき、加重値マトリックスＷ_iに対するランクrank(Ｘ_i)は、該当の中間層のディメンション

と該当の中間層の入力側層のディメンション（ｄ_ｉ－１）のうちの最小値に限定されてよい。

であるが、ここで、ｏは、他の点ごとの乗算関数ｇとの点ごとの乗算（ｐｏｉｎｔｗｉｓｅｍｕｌｔｉｐｌｉｃａｔｉｏｎ）を示してよい。不等式

によると、加重値マトリックスＷ_iに対するランクrank(Ｘ_i)は、下記の数式（１）のように、rank(Ｗ_iＸ_i-1)と点ごとの乗算関数ｇによって限定されてよい。

前記数式（１）によると、ｉ－番目の中間層の加重値マトリックスＷ_iに対するランクrank(Ｘ_i)は、rank(Ｗ_iＸ_i-1)が増加されることにより、拡張されてよい。すなわち、ｉ－番目の中間層の加重値マトリックスＷ_iに対するランクrank(Ｘ_i)は、該当の中間層の入力側層のディメンションｄ_ｉ－１が増加されることにより、拡張されてよい。同時に、前記数式（１）によると、ｉ－番目の中間層の加重値マトリックスＷ_iに対するランクrank(Ｘ_i)は、適切な点ごとの乗算関数ｇ_iが利用されることにより、拡張されてよい。すなわち、ｉ－番目の中間層の加重値マトリックスＷ_iに対するランクrank(Ｘ_i)は、非線形活性化関数を点ごとの乗算関数ｇ_iとして利用することにより、拡張されてよい。

最初の条件と次の条件とに基づいて人工ニューラルネットワークが設計される場合、図２に示すように、入力チャネルサイズが増加されることにより、ランクが線形的に拡張されてよい。具体的には、図２（ａ）に示すように、各中間層に対して入力チャネルサイズが増加されることにより、ランクが線形的に拡張されてよい。また、図２（ｂ）に示すように、複数の中間層に対して入力チャネルサイズが増加されることにより、ランクが線形的に拡張されてよい。

最後の条件は、中間層の間で拡張層の個数が増加されるように設計されなければならないという点であってよい。ここで、拡張層の個数は、２と中間層の個数よりも１だけ少ない数との間のある１つの値であってよい。例えば、中間層の個数が５つであるとき、拡張層の個数は、２つ、３つ、または４つであってよい。ここで、中間層の個数が５つであるとき、下記の表１のように、拡張層の個数および中間層のディメンション構成により、ランクが検出されてよい。

最後の条件に基づいて人工ニューラルネットワークが設計される場合、図３に示すように、拡張層の個数が増加されることにより、ランクが線形的に拡張されてよい。例えば、中間層の個数が５つであるとき、図３（ａ）に示すように、中間層の間で拡張層の個数が増加されることにより、ランクが拡張されてよい。また、中間層の個数が５つであるとき、図３（ｂ）に示すように、表現的ボトルネック現象が発生したとしても、中間層の間で拡張層の個数が増加されることにより、ランクが線形的に拡張されてよい。

多様な実施形態によると、上述した３つの条件に基づいて人工ニューラルネットワークが設計されることにより、ランクが拡張されてよい。具体的に、図４（ａ）は、従来の人工ニューラルネットワークの特異値分布を示しており、図４（ｂ）は、多様な実施形態に係る人工ニューラルネットワークの特異値分布を示している。図４の（ａ）と（ｂ）とを比較すると、多様な実施形態に係る人工ニューラルネットワークに比べ、従来の人工ニューラルネットワークは、０に近い特異値を有していることが分かる。ここで、特異値が０に近いということは、ランクが低いということを意味する。すなわち、従来の人工ニューラルネットワークに比べ、多様な実施形態に係る人工ニューラルネットワークは、より拡張されたランクを有することができる。

上述したようなランクの拡張により、多様な実施形態に係る人工ニューラルネットワークのデータの処理性能を向上させることができる。これを確認するために、下記の表２のように、従来の人工ニューラルネットワークと多様な実施形態に係る人工ニューラルネットワークのそれぞれに基づき、多様なタイプのイメージが処理された。ここで、イメージから特徴、例えば、食べ物に関する特徴、自動車に関する特徴、航空機に関する特徴、および花に関する特徴を区別する性能が測定された。この結果、従来の人工ニューラルネットワークに比べ、多様な実施形態に係る人工ニューラルネットワークは、少ない数のパラメータを利用しながらも、高い性能でイメージから特徴を区別した。言い換えれば、多様な実施形態に係る人工ニューラルネットワークが上述した３つの条件に基づいて設計されることにより、より高い性能でデータを処理することができる。

例えば、多様な実施形態に係る人工ニューラルネットワークは、下記の表３または表４のようなディメンション構成で設計されてよい。一例として、人工ニューラルネットワークは、下記の表３のように、中間層に対して約１１．５ずつ増加されるディメンション構成で設計されてよい。他の例として、人工ニューラルネットワークは、下記の表４のように、中間層に対して約４８ずつ増加されるディメンション構成で設計されてよい。

図５は、多様な実施形態における、電子装置１００の動作方法を示した図である。

図５を参照すると、電子装置１００は、段階５１０で、入力されるデータを検出してよい。次に、電子装置１００は、段階５２０で、人工ニューラルネットワークに基づき、データを処理してよい。例えば、人工ニューラルネットワークは、畳み込みニューラルネットワーク（ＣＮＮ）を含んでよい。

多様な実施形態によると、中間層での表現的ボトルネック現象が最小化されるように、人工ニューラルネットワークは、中間層の加重値マトリックスに対するランクが拡張されるように設計されてよい。このために、人工ニューラルネットワークは、次の３つの条件に基づき、設計されてよい。

最初の条件は、中間層のそれぞれに対して入力チャネルサイズが増加されるように設計されなければならないという点であってよい。入力チャネルサイズとは、各中間層でのインプットディメンション（ｄ_ｉｎ）に対するアウトプットディメンション（ｄ_ｏｕｔ）の割合（ｄ_ｉｎ／ｄ_ｏｕｔ）を示してよい。ここで、アウトプットディメンション（ｄ_ｏｕｔ）は、該当の中間層のディメンション（ｄ_ｉ）を示し、インプットディメンション（ｄ_ｉｎ）は、該当の中間層に対する入力側層のディメンション（ｄ_ｉ－１）を示してよい。すなわち、該当の中間層のディメンション（ｄ_ｉ）が固定されるとき、該当の中間層に対する入力側層のディメンション（ｄ_ｉ－１）が拡張されることにより、入力チャネルサイズが増加されてよい。

次の条件は、非線形活性化関数を利用するように設計されなければならないという点であってよい。ここで、非線形活性化関数は、０が少ない関数として決定されてよい。

最後の条件は、中間層の間で拡張層の個数が増加されるように設計されなければならないという点であってよい。ここで、拡張層の個数は、２と中間層の個数よりも１だけ少ない数との間のある１つの値であってよい。例えば、中間層の個数が５つであるとき、拡張層の個数は、２つ、３つ、または４つであってよい。

多様な実施形態によると、電子装置１００は、表現的ボトルネック現象が最小化された人工ニューラルネットワークに基づいてデータを処理してよい。このとき、人工ニューラルネットワークは、中間層の加重値マトリックスに対するランクが拡張されるように設計され、これにより、人工ニューラルネットワークで発生し得る表現的ボトルネック現象が最小化されてよい。より詳細には、人工ニューラルネットワークは、中間層のそれぞれに対して入力チャネルサイズが増加され、非線形活性化関数を利用し、中間層の間で拡張層の個数が増加されるように設計されることにより、中間層の加重値マトリックスに対するランクが拡張されてよい。これにより、人工ニューラルネットワークで表現的ボトルネック現象による情報の損失を防ぎ、人工ニューラルネットワークの正確性および効率性のような性能を向上させることができる。

多様な実施形態に係る電子装置１００の動作方法は、入力されるデータを検出する段階５１０、および複数の中間層を有する人工ニューラルネットワークに基づき、データを処理する段階５２０を含んでよい。

多様な実施形態によると、人工ニューラルネットワークは、中間層での表現的ボトルネック現象が最小化するように、中間層のそれぞれの加重値マトリックスに対するランクが拡張されるように設計されてよい。

多様な実施形態によると、人工ニューラルネットワークは、中間層のランクを拡張させるために、中間層のそれぞれに対して入力チャネルサイズが増加されるように設計されてよい。

多様な実施形態によると、人工ニューラルネットワークは、中間層のランクを拡張させるために、非線形活性化関数を利用するように設計されてよい。

多様な実施形態によると、人工ニューラルネットワークは、中間層のランクを拡張させるために、中間層の間で拡張層の個数が増加されるように設計されてよい。

多様な実施形態によると、入力チャネルサイズは、インプットディメンション（ｉｎｐｕｔｄｉｍｅｎｓｉｏｎ）に対するアウトプットディメンション（ｏｕｔｐｕｔｄｉｍｅｎｓｉｏｎ）の割合を示してよい。

多様な実施形態によると、拡張層のそれぞれは、出力側層のディメンションが入力側層のディメンションよりも大きいときの出力側層であり、入力側層は、中間層のうちのいずれか１つであり、出力側層は、中間層のうちの他の１つであって、入力側層に隣接するものであってよい。

多様な実施形態によると、ランクは、入力チャネルサイズが増加されることにより、線形的に拡張されてよい。

多様な実施形態によると、ランクは、拡張層の個数が増加されることにより、線形的に拡張されてよい。

多様な実施形態によると、拡張層の個数は、２と中間層の個数よりも１だけ少ない数との間のある１つの値であってよい。

多様な実施形態に係る電子装置１００は、メモリ１７０、およびメモリ１７０と連結し、メモリ１７０に記録される少なくとも１つの命令を実行するように構成された、プロセッサ１８０とを含んでよい。

多様な実施形態によると、プロセッサ１８０は、複数の中間層を有する人工ニューラルネットワークに基づき、入力されるデータを処理するように構成されてよい。

多様な実施形態によると、人工ニューラルネットワークは、中間層での表現的ボトルネック現象が最小化されるように、中間層の加重値マトリックスに対するランクが拡張されるように設計されてよい。

多様な実施形態によると、入力チャネルサイズは、インプットディメンションに対するアウトプットディメンションの割合を示してよい。

上述した装置は、ハードウェア構成要素、ソフトウェア構成要素、および／またはハードウェア構成要素とソフトウェア構成要素との組み合わせによって実現されてよい。例えば、実施形態で説明された装置および構成要素は、プロセッサ、コントローラ、ＡＬＵ（ａｒｉｔｈｍｅｔｉｃｌｏｇｉｃｕｎｉｔ）、デジタル信号プロセッサ、マイクロコンピュータ、ＦＰＧＡ（ｆｉｅｌｄｐｒｏｇｒａｍｍａｂｌｅｇａｔｅａｒｒａｙ）、ＰＬＵ（ｐｒｏｇｒａｍｍａｂｌｅｌｏｇｉｃｕｎｉｔ）、マイクロプロセッサ、または命令を実行して応答することができる様々な装置のように、１つ以上の汎用コンピュータまたは特殊目的コンピュータを利用して実現されてよい。処理装置は、オペレーティングシステム（ＯＳ）およびＯＳ上で実行される１つ以上のソフトウェアアプリケーションを実行してよい。また、処理装置は、ソフトウェアの実行に応答し、データにアクセスし、データを記録、操作、処理、および生成してもよい。理解の便宜のために、１つの処理装置が使用されるものとして説明される場合もあるが、当業者は、処理装置が複数個の処理要素および／または複数種類の処理要素を含んでもよいことを理解できるであろう。例えば、処理装置は、複数個のプロセッサまたは１つのプロセッサおよび１つのコントローラを含んでよい。また、並列プロセッサのような、他の処理構成も可能である。

ソフトウェアは、コンピュータプログラム、コード、命令、またはこれらのうちの１つ以上の組み合わせを含んでもよく、思うままに動作するように処理装置を構成したり、独立的または集合的に処理装置に命令したりしてよい。ソフトウェアおよび／またはデータは、処理装置に基づいて解釈されたり、処理装置に命令またはデータを提供したりするために、いかなる種類の機械、コンポーネント、物理装置、コンピュータ記録媒体または装置に具現化されてもよい。ソフトウェアは、ネットワークによって接続されたコンピュータシステム上に分散され、分散された状態で記録されても実行されてもよい。ソフトウェアおよびデータは、１つ以上のコンピュータ読み取り可能な記録媒体に記録されてよい。

多様な実施形態に係る方法は、多様なコンピュータ手段によって実行可能なプログラム命令の形態で実現されてコンピュータ読み取り可能な媒体に記録されてよい。ここで、媒体は、コンピュータ実行可能なプログラムを継続して記録するものであっても、実行またはダウンロードのために一時記録するものであってもよい。また、媒体は、単一または複数のハードウェアが結合した形態の多様な記録手段または格納手段であってよく、あるコンピュータシステムに直接接続する媒体に限定されることはなく、ネットワーク上に分散して存在するものであってもよい。媒体の例としては、ハードディスク、フロッピディスク、および磁気テープのような磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤのような光媒体、フロプティカルディスク（ｆｌｏｐｔｉｃａｌｄｉｓｋ）のような光磁気媒体、およびＲＯＭ、ＲＡＭ、フラッシュメモリなどを含み、プログラム命令が記録されるように構成されたものであってよい。また、媒体の他の例として、アプリケーションを配布するアプリケーションストアやその他の多様なソフトウェアを供給または配布するサイト、サーバなどで管理する記録媒体または格納媒体が挙げられる。

本文書の多様な実施形態およびこれに使用された用語は、本文書に記載された技術を特定の実施形態に対して限定しようとするものではなく、該当の実施形態の多様な変更、均等物、および／または置換物を含むものと理解されなければならない。図面の説明に関し、類似する構成要素には類似の参照符号が付与されてよい。単数の表現は、文脈において明らかに異なるように意味されない限り、複数の表現を含んでよい。本文書において、「ＡまたはＢ」、「Ａおよび／またはＢのうちの少なくとも１つ」、「Ａ、Ｂ、またはＣ」、または「Ａ、Ｂ、および／またはＣのうちの少なくとも１つ」などの表現は、ともに羅列された項目のすべての可能な組み合わせを含んでよい。「第１」、「第２」、「１番目」、または「２番目」などの表現は、該当の構成要素を、順序または重要度に関係なく修飾してよく、ある構成要素を他の構成要素と区分するために使用されるものに過ぎず、該当の構成要素を限定しない。ある（例：第１）構成要素が他の（例：第２）構成要素に「（機能的にまたは通信的に）連結されて」いるとか「接続されて」いるとされるときには、前記ある構成要素が前記他の構成要素に直接的に連結されてもよいし、他の構成要素（例：第３構成要素）を介して連結されてもよい。

本文書で使用された用語「モジュール」は、ハードウェア、ソフトウェア、またはファームウェアで構成されたユニットを含み、例えば、ロジック、論理ブロック、部品、または回路などの用語と相互互換的に使用されてよい。モジュールは、一体で構成された部品、または１つまたはそれ以上の機能を実行する最小単位、またはその一部となってよい。例えば、モジュールは、ＡＳＩＣ（ａｐｐｌｉｃａｔｉｏｎ－ｓｐｅｃｉｆｉｃｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ）で構成されてよい。

多様な実施形態によると、記述した構成要素のそれぞれの構成要素（例：モジュールまたはプログラム）は、単数または複数の個体を含んでよい。多様な実施形態によると、上述した該当の構成要素のうちの１つ以上の構成要素または段階が省略されてもよいし、または１つ以上の他の構成要素または段階が追加されてもよい。大体的にまたは追加的に、複数の構成要素（例：モジュールまたはプログラム）は、１つの構成要素として統合されてよい。このような場合、統合された構成要素は、複数の構成要素それぞれの構成要素の１つ以上の機能を、統合以前に複数の構成要素のうちの該当の構成要素によって実行されることと同一または類似に実行してよい。多様な実施形態によると、モジュール、プログラム、または他の構成要素によって実行される段階は、順次的に、並列的に、反復的に、または発見的に実行されてもよいし、段階のうちの１つ以上が他の順序で実行されてもよいし、省略されてもよいし、または１つ以上の他の段階が追加されてもよい。

１００：電子装置
１０２、１０４：外部装置
１１０：カメラモジュール
１２０：連結端子
１３０：通信モジュール
１４０：入力モジュール
１５０：表示モジュール
１６０：オーディオモジュール
１７０：メモリ
１８０：プロセッサ
１９０：ネットワーク

Claims

電子装置の動作方法であって、
入力されるデータを検出する段階、および
複数の中間層を有する人工ニューラルネットワークに基づき、前記データを処理する段階を含み、
前記人工ニューラルネットワークは、
前記中間層での表現的ボトルネック現象が最小化されるように、前記中間層のそれぞれの加重値マトリックスに対するランクが拡張されるように設計される、
動作方法。
前記人工ニューラルネットワークは、
前記中間層の前記ランクを拡張させるために、前記中間層のそれぞれに対して入力チャネルサイズが増加されるように設計される、
請求項１に記載の動作方法。
前記人工ニューラルネットワークは、
前記中間層の前記ランクを拡張させるために、非線形活性化関数を利用するように設計される、
請求項１に記載の動作方法。
前記人工ニューラルネットワークは、
前記中間層の前記ランクを拡張させるために、前記中間層の間で拡張層の個数が増加されるように設計される、
請求項１に記載の動作方法。
前記入力チャネルサイズは、
インプットディメンションに対するアウトプットディメンションの割合を示す、
請求項２に記載の動作方法。
前記拡張層のそれぞれは、出力側層のディメンションが入力側層のディメンションよりも大きいときの前記出力側層であり、
前記入力側層は、前記中間層のうちのいずれか１つであり、前記出力側層は、前記中間層のうちの他の１つであって、前記入力側層に隣接するものである、
請求項４に記載の動作方法。
前記ランクは、
前記入力チャネルサイズが増加されることにより、線形的に拡張される、
請求項２に記載の動作方法。
前記ランクは、
前記拡張層の個数が増加されることにより、線形的に拡張される、
請求項４に記載の動作方法。
前記拡張層の個数は、
２と前記中間層の個数よりも１だけ少ない数との間のある１つの値である、
請求項４に記載の動作方法。
請求項１～９のうちのいずれか一項に記載の動作方法を前記電子装置に実行させる、コンピュータプログラム。
請求項１～９のうちのいずれか一項に記載の動作方法を前記電子装置に実行させるためのプログラムが記録されている、非一時的なコンピュータ読み取り可能な記録媒体。
電子装置であって、
メモリ、および
前記メモリと連結し、前記メモリに記録された少なくとも１つの命令を実行するように構成された、プロセッサを含み、
前記プロセッサは、
複数の中間層を有する人工ニューラルネットワークに基づき、入力されるデータを処理するように構成され、
前記人工ニューラルネットワークは、
前記中間層での表現的ボトルネック現象が最小化されるように、前記中間層の加重値マトリックスに対するランクが拡張されるように設計される、
電子装置。
前記人工ニューラルネットワークは、
前記中間層の前記ランクを拡張させるために、前記中間層のそれぞれに対して入力チャネルサイズが増加されるように設計される、
請求項１２に記載の電子装置。
前記人工ニューラルネットワークは、
前記中間層の前記ランクを拡張させるために、非線形活性化関数を利用するように設計される、
請求項１２に記載の電子装置。
前記人工ニューラルネットワークは、
前記中間層の前記ランクを拡張させるために、前記中間層の間で拡張層の個数が増加されるように設計される、
請求項１２に記載の電子装置。
前記入力チャネルサイズは、
インプットディメンションに対するアウトプットディメンションの割合を示す、
請求項１３に記載の電子装置。
前記拡張層のそれぞれは、出力側層のディメンションが入力側層のディメンションよりも大きいときの前記出力側層であり、
前記入力側層は、前記中間層のうちのいずれか１つであり、前記出力側層は、前記中間層のうちの他の１つであって、前記入力側層に隣接するものである、
請求項１５に記載の電子装置。
前記ランクは、
前記入力チャネルサイズが増加されることにより、線形的に拡張される、
請求項１３に記載の電子装置。
前記ランクは、
前記拡張層の個数が増加されることにより、線形的に拡張される、
請求項１５に記載の電子装置。
前記拡張層の個数は、
２と前記中間層の個数よりも１だけ少ない数との間のある１つの値である、
請求項１５に記載の電子装置。