JP7350923B2

JP7350923B2 - ディープラーニングフレームワークのオペレータ登録方法、装置、デバイス及び記憶媒体

Info

Publication number: JP7350923B2
Application number: JP2022040721A
Authority: JP
Inventors: チェン，ウェイハン; ヤン，ジャビン; リウ，ホンギュ; ラン，シャン
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-05-18
Filing date: 2022-03-15
Publication date: 2023-09-26
Anticipated expiration: 2042-03-15
Also published as: US20220374238A1; US11625248B2; CN113342346A; CN113342346B; JP2022177793A

Description

本開示は、コンピュータ技術の分野に関し、具体的にディープラーニングのような人工知能の分野に関し、特にディープラーニングフレームワークのオペレータ登録方法、装置、デバイス及び記憶媒体に関する。

ディープラーニングフレームワークは人工知能分野の基礎的なフレームワークとして、ますます注目されており、その重要な指標の１つはフレームワークの拡張性である。カスタムオペレータは拡張性を実現する主要なルートである。

関連技術では、ユーザによりオペレータをカスタマイズしてディープラーニングフレームワークに適用することを実現するために、一般的にユーザがディープラーニングフレームワークの内部概念を理解し、内部クラスを継承する必要があり、さらにディープラーニングフレームワーク全体をコンパイルする必要がある。

本開示は、ディープラーニングフレームワークのオペレータ登録方法、装置、デバイス及び記憶媒体を提供する。

本開示の一態様によれば、ユーザにより提供されたディープラーニングフレームワークにオペレータを登録するための登録情報を受信することであって、前記登録情報は作成方法が前記ディープラーニングフレームワークに関連しないカスタム計算関数を含むことと、前記登録情報に基づいて、前記ディープラーニングフレームワークにおけるオペレータメタ情報を作成することと、前記オペレータメタ情報に基づいて前記ディープラーニングフレームワークにおける登録対象オペレータを構築し、前記登録対象オペレータを前記ディープラーニングフレームワークにおけるグローバルオペレータテーブルに登録することと、を含むディープラーニングフレームワークのオペレータ登録方法を提供する。

本開示の別の態様によれば、ユーザにより提供されたディープラーニングフレームワークにオペレータを登録するための登録情報を受信することであって、前記登録情報は作成方法が前記ディープラーニングフレームワークに関連しないカスタム計算関数を含む受信モジュールと、前記登録情報に基づいて、前記ディープラーニングフレームワークにおけるオペレータメタ情報を作成する作成モジュールと、前記オペレータメタ情報に基づいて前記ディープラーニングフレームワークにおける登録対象オペレータを構築し、前記登録対象オペレータを前記ディープラーニングフレームワークにおけるグローバルオペレータテーブルに登録する登録モジュールと、を備えるディープラーニングフレームワークのオペレータ登録装置を提供する。

本開示の別の態様によれば、少なくとも１つのプロセッサと、前記少なくとも１つのプロセッサと通信可能に接続されたメモリとを備え、前記メモリに前記少なくとも１つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも１つのプロセッサにより実行されると、前記少なくとも１つのプロセッサに前記態様のいずれか一項に記載の方法を実行させる電子デバイスを提供する。

本開示の別の態様によれば、コンピュータに前記態様のいずれか一項に記載の方法を実行させるためのコンピュータコマンドが記憶された非一時的なコンピュータ可読記憶媒体を提供する。

本開示の別の態様によれば、プロセッサにより実行されると、前記態様のいずれか一項に記載の方法を実現するコンピュータプログラムを含むコンピュータプログラム製品を提供する。

本開示の技術案によれば、オペレータ登録プロセスを簡略化することができる。

理解すべきなのは、本セクションで説明される内容は、本開示の実施形態の重要な又は肝心な特徴を標識することでもなく、本開示の範囲を制限することでもない。本開示の他の特徴は、以下の明細書により容易に理解されるであろう。

図面は、本技術案をより良く理解するためのものであり、本願に制限されない。図面において、
本開示の第１実施形態に係る概略図である。本開示の第２実施形態に係る概略図である。本開示の第３実施形態に係る概略図である。本開示の第４実施形態に係る概略図である。本開示の第５実施形態に係る概略図である。本開示の実施形態のディープラーニングフレームワークのオペレータ登録方法のいずれかを実現するための電子デバイスの概略図である。

以下、図面に基づいて、本出願の例示的な実施例を説明する。理解を容易にするために、本出願の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。従って、当業者は、本出願の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識できるはずである。同様に、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。

オペレータ（ｏｐｅｒａｔｏｒ）はディープラーニングフレームワーク（単にフレームワークと呼ぶことができる）における基本的な計算ユニットであり、その入力はテンソル（ｔｅｎｓｏｒ）又はテンソルの組み合わせを含み、テンソル又はテンソルの組み合わせに対して計算を行うことにより、畳み込みオペレータ、プール化オペレータ、ｒｅｌｕオペレータなどの特定の機能を達成する。ディープラーニングフレームワークにおいて、ｔｅｎｓｏｒを用いてデータを表現する。Ｔｅｎｓｏｒは多次元配列として理解されて良い。ディープラーニングフレームワークを使ってモデルを構築するプロセスは、特定の計算目標を満たすように異なるオペレータを組み合わせるプロセスでもある。オペレータの豊富さはディープラーニングフレームワーク製品の機能の完備性を測る重要な指標でもある。いくつかの特定の分野では、多くのカスタマイズされたものであって、汎用的ではなく、基礎的なオペレータを組み合わせることができないオペレータ、例えば３Ｄ視覚、オプティカルフローなどの分野におけるモデルが必要である。この場合に、フレームワークのカスタムオペレータ機能を使用してフレームワークを拡張して開発することにより、フレームワークを特定の分野で使用可能にする必要がある。

ディープラーニングフレームワークのカスタムオペレータの作成方法が複雑すぎて、理解しなければならない概念が多すぎると、多くのユーザが利用可能なカスタムオペレータを書くことが困難になるため、ディープラーニングフレームワーク製品にとって、簡潔なカスタムオペレータの処理方案を提供することは極めて重要である。

カスタムオペレータをディープラーニングフレームワークに適用するために、一般的に次の手順を実行する必要がある。

（１）オペレータ計算論理実現：このステップでは、Ｃ＋＋を使用してオペレータのコア計算ロジックの作成を完成する必要がある。この部分の実現では、テンソルに依存しないフレームワークにおけるデータ構造を理解する必要があるかどうかが簡潔性の鍵である。

（２）オペレータをフレームに関連付ける：このステップは、オペレータの計算ロジックを何らかの方法でフレームワークに登録し又は関連付けることにより、フレームワークにより呼び出されることができるようにする。これは同様に、理解しにくい概念を導入することなく、比較的直感的な記述方法が必要である。

（３）オペレータをコンパイルしてモデルに用いる：このステップでは、実際のシナリオに適用されるようにオペレータのコンパイルを完了する。フレームワーク全体を連携してコンパイルする必要があるかどうかは、このステップの簡潔性を測る重要な指標の１つである。ユーザは自分で書いたオペレータを独立してコンパイルすることは、完全なフレームワークコードをダウンロードしてフレームワーク全体を連携してコンパイルする必要があることに比べて、利便性の面で明らかな差がある。

関連技術では、各ディープラーニングフレームワーク製品は何れも独自のカスタムオペレータ作成スキームを持っているが、スキームの使いやすさにはばらつきがあり、且ついくつかのフレームワークにおける概念を導入しており、ユーザの理解コストが増加した。その概要は次のとおりである。

（１）ＰｙＴｏｒｃｈスキーム：テンソルを入力とし、テンソルのリストを返す計算関数を作成し、Ｐｙｂｉｎｄ１１モジュールを使用してＰｙｔｈｏｎインタフェースとしてカプセル化し、独立にコンパイルした後、そのフレームワークにおけるＦｕｎｃｔｉｏｎを継承し、ｆｏｒｗａｒｄとｂａｃｋｗａｒｄメソッドを実装し、ｃｏｎｔｅｘｔを使用して前逆実行ロジックを関連付ける。

（２）ＴｅｎｓｏｒＦｌｏｗスキーム：内部オペレータを作成する書き方とほぼ一致しており、フレームワークの下位層にあるＯｐＫｅｒｎｅｌを継承し、フレームワークで指定されたＣｏｍｐｕｔｅスキームを実現し、フレームワークの下位層にあるＯｐＫｅｒｎｅｌＣｏｎｔｅｘｔを用いて入出力を管理し、フレームワークの下位層にある複数の登録インタフェースを用いて登録を完了し、独立コンパイルをサポートする。

（３）ＭｉｎｄＳｐｏｒｅスキーム：内部オペレータを作成する書き方と完全に一致しており、ＰｒｉｍｉｔｉｖｅＷｉｔｈＩｎｆｅｒ、ＧＰＵＫｅｒｎｅｌなどのフレームワークの基礎概念を理解して継承する必要があり、フレームワークで指定されたＩｎｉｔ、Ｌａｕｎｃｈなどのメソッドを実現し、特定の書き方で登録を完了し、完全なフレームワークのソースコードと一緒にコンパイルしなければならない。

（４）Ｊｉｔｔｏｒスキーム：フレームワークの下位層にあるＣｕｓｔｏｍＯｐを理解して継承する必要があり、フレームワークで指定されたｊｉｔ＿ｐｒｅｐａｒｅやｊｉｔ＿ｒｕｎなどのメソッドを実現し、オペレータの実装を文字列にカプセル化し、即時にコンパイルして使用する。

関連技術と本開示とをより直観的に比較するために、関連技術と本開示との比較を表１に示すことができる。

表１は、関連技術と本開示の各依存項の比較を示した。依存項が少ないほど、スキームは簡潔である。本開示は、オペレータ計算の本質に着目し、カスタムオペレータの登録処理スキームを大幅に簡略化し、又はカスタムオペレータのプログラミングパラダイムを簡略化した。

本開示の具体的な実施形態は、以下の実施形態を参照することができる。

図１は、本開示の第１実施形態に係る概略図である。本実施形態は、以下のことを含むディープラーニングフレームワークのオペレータ登録方法を提供する。

１０１において、ユーザにより提供されたディープラーニングフレームワークにオペレータを登録するための登録情報であって、作成方法が前記ディープラーニングフレームワークに関連しないカスタム計算関数を含む登録情報を受信する。

１０２において、前記登録情報に基づいて、前記ディープラーニングフレームワークにおけるオペレータメタ情報を作成する。

１０３において、前記オペレータメタ情報に基づいて、前記ディープラーニングフレームワークにおける登録対象オペレータを構築し、前記登録対象オペレータをディープラーニングフレームワークにおけるグローバルオペレータテーブルに登録する。

本実施形態で提供される処理方法の実行主体は、ディープラーニングフレームワークであって良い。図２に示すように、ディープラーニングフレームワークは、ユーザ側と内部側とに分割されていてよい。ユーザ側には、上述した登録情報をユーザが入力することができる情報入力モジュール２０１を備えてよい。具体的には、ディープラーニングフレームワークは、登録インタフェースをあらかじめ設計しておき、当該登録インタフェースを情報入力モジュールとして登録情報の入力を実現することができる。登録インタフェースは、マクロ、静的オブジェクト、又はメソッドなどを使用して実装できる。

登録情報は、カスタム計算関数を含み、さらに、カスタム入力情報及びカスタム出力情報を含むことができる。カスタム入力情報とカスタム出力情報とは、それぞれカスタムオペレータの入力変数の情報とカスタムオペレータの出力変数の情報である。情報は例えば変数名である。カスタム入力情報を例にすると、カスタム入力情報は、ユーザ自身に命名された入力変数の名前のようなものであり、より具体的には、例えば、テンソルである入力変数をｔｅｎｓｏｒ１と命名することができる。登録情報は、カスタマイズされた情報を含むため、カスタムオペレータの登録情報として理解されて良い。

オペレータは、ディープラーニングフレームワークにおける基本的な計算ユニットであり、計算関数を含む。より具体的には、１つのオペレータは、順方向計算関数（ＦｏｒｗａｒｄＦｕｎｃｔｉｏｎ）及び逆方向計算関数（ＢａｃｋｗａｒｄＦｕｎｃｔｉｏｎ）を含むことができる。

カスタムオペレータでは、ユーザが自分で作成した計算関数、すなわちカスタム計算関数である。

カスタム計算関数がディープラーニングフレームワークに関連しないとは、ユーザがディープラーニングフレームワークの内部概念を理解したり、ディープラーニングフレームワークの内部クラスを継承したりする必要がなく、簡潔、柔軟、直感的な方法で計算関数を作成できることを意味する。

計算関数の簡潔さ、柔軟性、直感性は、次のような点で実現される。

（１）関数の命名を制限せず、ユーザに指定関数の実現を要求せず、ユーザは自分の意図で自分の関数に命名すればよい。

（２）関数パラメータの数を制限せず、ユーザは実際の計算ニーズに応じて、１つ又は複数のＴｅｎｓｏｒ、ｖｅｃｔｏｒ＜Ｔｅｎｓｏｒ＞、及びｉｎｔ、ｆｌｏａｔ、ｄｏｕｂｌｅなどのタイプのパラメータを入力とすることができ、非常に柔軟である。

（３）関数の戻り値は可変長Ｔｅｎｓｏｒリストであり、ユーザは実際の計算ニーズに応じて１つ又は複数のＴｅｎｓｏｒを戻すことができる。

（４）ユーザは、基礎データタイプＴｅｎｓｏｒ、データタイプ、デバイスタイプを含むオペレータ計算ロジックに必要な基礎概念のみを理解すればよく、他のフレームワークの下位層にある概念は一切理解する必要がなく、学習及び理解コストが低い。

これらの特徴をまとめると、カスタムオペレータの計算関数は次のように記述できる。
Ｔｅｎｓｏｒリストを戻すオペレータ計算関数名（Ｔｅｎｓｏｒ１入力，Ｔｅｎｓｏｒ２入力．．．）｛
オペレータ計算ロジック．．．
計算結果を戻す
｝

カスタムオペレータについて、一般的にそのカスタムオペレータの順方向計算関数（ＦｏｒｗａｒｄＦｕｎｃｔｉｏｎ）と逆方向計算関数（ＢａｃｋｗａｒｄＦｕｎｃｔｉｏｎ）を作成する。どちらも、前述の直感的でプログラミング習慣に準拠した簡潔な実装方式を使用できる。

このようなプログラミングパラダイム設計では、ユーザは入力されたＴｅｎｓｏｒ（テンソル）と返されたＴｅｎｓｏｒ、及び関連する演算論理実装のみに注意を払う必要があり、例えば前述のスキームにおけるＯｐＫｅｒｎｅｌＣｏｎｔｅｘｔ、ＣｕｓｔｏｍＯｐ、ＯｐＫｅｒｎｅｌなどのフレームワーク内部の無関係な概念に注意を払う必要はない。これは一般的なプログラミング習慣に合致しており、書き方の理解に関するコストが低い。

ユーザが作成したディープラーニングフレームワークに関連しないカスタム計算関数を使用することで、ユーザによるカスタムオペレータの計算関数に対する簡潔、柔軟、直感的な作成を実現することができ、さらにオペレータ登録プロセスを簡略化することができる。

ユーザが入力した登録情報を受信すると、登録情報に基づいてオペレータメタ情報（ＯｐＭｅｔａＩｎｆｏ）を生成することができる。図２に示すように、ユーザ側では、登録情報に基づいてカスタムオペレータに対応するオペレータメタ情報（ＯｐＭｅｔａＩｎｆｏ）を作成するための作成モジュール２０２をさらに備えて良い。さらに、カスタムオペレータのそれぞれは１つのオペレータメタ情報に対応し、複数のカスタムオペレータは複数のオペレータメタ情報に対応し、複数のオペレータメタ情報はオペレータメタ情報テーブル（ＯｐＭｅｔａＩｎｆｏＭａｐ）を構成することができる。

具体的には、ビルダー（ｂｕｉｌｄｅｒ）を用いて登録情報に基づいてオペレータメタ情報を作成してよい。ビルダーは、例えばマクロなどの方法を使用することができる。

いくつかの実施形態では、前記登録情報に基づいて前記ディープラーニングフレームワークにおけるオペレータメタ情報を作成することは、前記カスタム入力情報を前記ディープラーニングフレームワークにおける標準入力情報に変換し、前記カスタム出力情報を前記ディープラーニングフレームワークにおける標準出力情報に変換し、前記カスタム計算関数をマクロで処理して、マクロ処理された計算関数を得、前記標準入力情報と、前記標準出力情報と、前記マクロ処理された計算関数とに基づいて、前記ディープラーニングフレームワークにおけるオペレータメタ情報を作成することを含んで良い。

入力情報又は出力情報が変数名であることを例にすると、カスタム入力変数名を標準入力変数名に変換し、カスタム出力変数名を標準出力変数名に変換して良い。入力を例にすると、ディープラーニングフレームワークでは、カスタム入力変数名と標準入力変数名との間のマッピング関係をあらかじめ設定することにより、このマッピング関係によりカスタム入力変数名を標準入力変数名に変換することができる。例えばカスタム入力変数名がｔｅｎｓｏｒ１入力であれば、あらかじめ配置されたマッピング関係の処理を経て、標準入力変数名Ｘに変換することができる。理解すべきなのは、マッピング関係は、ある特定の名と別の特定の名との１対１の対応関係に限定されるものではなく、カスタム変数名をディープラーニングフレームワークにおける標準変数名に適合するように変換するための計算関係又は処理関係であってもよい。変数名は入力変数名と出力変数名を含む。

カスタム計算関数をマクロで処理することは、カスタム計算関数をマクロでラップすることを意味して良い。例えば、カスタム計算関数がＲｅｌｕＣＰＵＦｏｒｗａｒｄで、マクロがＰＤ＿ＫＥＲＮＥＬであれば、マクロで処理された計算関数はＰＤ＿ＫＥＲＮＥＬ（ＲｅｌｕＣＰＵＦｏｒｗａｒｄ）として表現できる。

コンピュータの分野では、マクロは置換処理の一種であり、定義された置換関係により、対応する置換処理を実現することができる。例えば、上記のマクロ処理された計算関数ＰＤ＿ＫＥＲＮＥＬ（ＲｅｌｕＣＰＵＦｏｒｗａｒｄ）を、定義された置換関係により、ある設定された構造体ＫｅｒｎｅｌＦｕｎｃＩｍｐｌに含まれる計算関数ｃｏｍｐｕｔｅに置換する。

上記定義された置換関係に基づいてカスタム定義関数をコンパイルする場合に、ＫｅｒｎｅｌＦｕｎｃＩｍｐｌのＣｏｍｐｕｔｅ関数を処理するように置き換えられる。

作成されるオペレータメタ情報は、標準入力情報、標準出力情報、及びマクロ処理された計算関数の関数ポインタを含むことができる。

上記の変換及びマクロ処理により、カスタムオペレータに対応するオペレータメタ情報を効率的に作成することができる。

幾つかの実施形態では、前記登録対象オペレータは、登録対象オペレータ記述情報と登録対象オペレータカーネル関数とを含み、前記オペレータメタ情報に基づいて、ディープラーニングフレームワークにおける登録対象オペレータを構築することは、前記標準入力情報と前記標準出力情報とに基づいて、前記登録対象オペレータ記述情報を構築し、前記マクロ処理された計算関数に基づいて、前記登録対象オペレータカーネル関数を構築することを含む。

図２に示すように、内部側には、オペレータメタ情報に基づいて、対応するディープラーニングフレームワークにおける登録対象オペレータを構築してディープラーニングフレームワークにおけるグローバルオペレータテーブルに登録するユーザオペレータ構築モジュール２０３が備えられても良い。ディープラーニングフレームワーク内にそもそも存在しているオペレータと区別するために、ユーザが作成したカスタムオペレータに対応する登録対象オペレータをユーザオペレータ（ＣｕｓｔｏｍＯｐ）と呼ぶことができる。理解すべきなのは、ユーザオペレータは、ディープラーニングフレームワークに準拠した標準オペレータであり、ディープラーニングフレームワーク内で統一的にスケジューリングすることができる。

ディープラーニングフレームワークにおいて、オペレータは記述情報とカーネル関数という２つの部分を含むことができる。記述情報は例えば入力情報、出力情報などを含み、カーネル関数はオペレータの主要な計算ロジックを記述するために用いられる。

登録対象オペレータ記述情報は、標準入力情報及び標準出力情報を含むことができる。

登録対象オペレータカーネル関数は、マクロ処理された計算関数に基づいて構築することができる。

マクロ処理された計算関数に基づいて前記登録対象オペレータカーネル関数を構築することにより、カスタム計算関数と標準計算関数との関連付けを実現し、カスタムオペレータをディープラーニングフレームワーク内に適用することができる。

ディープラーニングフレームワーク内では、統一的なスケジューリングを実現するために、ディープラーニングフレームワークにおけるオペレータに対応する関数の書き方が統一されており、かつこの統一された書き方とユーザのカスタムオペレータの計算関数の書き方に大きな違いがある。

具体的には、異なるシナリオにおいて、異なるユーザの計算関数の書き方が異なる場合があり、例えばテンソルを入力とする場合、関数の書き方は以下のようになる。
Ｔｅｎｓｏｒリストを戻すオペレータ計算関数名（Ｔｅｎｓｏｒ１入力）｛．．．｝

一方、入力されるテンソルが２つある場合、関数の書き方は以下のようになる。
Ｔｅｎｓｏｒリストを戻すオペレータ計算関数名（Ｔｅｎｓｏｒ１入力，Ｔｅｎｓｏｒ２入力）｛．．．｝

入力が増えると、関数の書き方も増える。Ｃ＋＋プログラミング言語において、異なる関数の書き方は異なる関数ポインタのタイプ、即ち異なるデータタイプを意味するが、フレームワークにユーザが書く可能性のある関数ポインタタイプを格納し、且つフレームワークの下位層で呼び出す必要がある。このような書き方の柔軟性が非常に強いパラダイムは、Ｃ＋＋プログラミング言語の中では簡単で汎用的な形式で格納することができない。全体を簡潔にするためには、ユーザが作成する様々な計算関数を統一する必要がある。

例えば、あるカスタム計算関数の関数形式は次のとおりである。
Ｔｅｎｓｏｒリストを戻すオペレータ計算関数名（Ｔｅｎｓｏｒ１入力）｛．．．｝
もう１つのカスタム計算関数の関数形式は次のとおりである。
Ｔｅｎｓｏｒリストを戻すオペレータ計算関数名（Ｔｅｎｓｏｒ１入力，Ｔｅｎｓｏｒ２入力）｛．．．｝

上記２つのカスタム計算関数の関数形式は統一されておらず、本実施形態では、ディープラーニングフレームワーク内で統一されたスケジューリングを容易にするために、異なるカスタム計算関数を統一する必要がある。

統一された関数、即ち統一的な形式を持つ関数の関数形式は、次のとおりであって良い。
Ｔｅｎｓｏｒリストを戻すオペレータ計算関数名（Ｔｅｎｓｏｒリスト入力）｛．．．｝

いくつかの実施形態では、前記登録対象オペレータカーネル関数には、統一的な形式の入力情報及び統一された関数ポインタが含まれ、前記マクロ処理された計算関数に基づいて、前記登録対象オペレータカーネル関数を構築することは、異なるカスタム計算関数に対して統一的な形式を有する静的関数を含む、前記マクロ処理された計算関数を置換するための構造体を決定し、前記静的関数の入力情報を前記統一的な形式の入力情報とし、前記静的関数の関数ポインタを前記統一的な関数ポインタとすることを含む。

例えば、一般的なフレームワークにおけるオペレータはＯｐＫｅｒｎｅｌクラスを継承して独自の計算（Ｃｏｍｐｕｔｅ）関数を追加して実装する必要があるが、対応する入出力テンソルはすべてｃｏｎｔｅｘｔにあり、ｃｏｎｔｅｘｔのＩｎｐｕｔ、Ｏｕｔｐｕｔメソッドにより取得する必要がある。これは、前述の直観的なカスタム計算関数のプログラミングパラダイムとは本質的に異なるため、両者を関連付ける必要がある。

本実施形態では、登録対象オペレータカーネル関数を構築する際に、あらかじめ定義された構造体における静的関数であってもよい統一的な形式の関数に基づいて構築する。

具体的に、本実施形態では、登録対象オペレータカーネル関数を構築する際に、上記の静的関数の入力情報を作成し、上記の静的関数の関数ポインタを作成し、他の幾つかの標準的な処理を作成し、例えばｃｏｎｔｅｘｔから入力情報を取得してｉｎｐｕｔｓ変数に入れることを含むことができる。

本実施形態では、登録対象オペレータカーネル関数を構築する際に、上記の３つの作成手順を含む。

登録対象オペレータカーネル関数を構築する際に、統一的な形式の静的関数を採用することにより、ディープラーニングフレームワークの統一的なスケジューリングのために、カスタム計算関数を統一することができる。

統一的な形式を有する静的関数の入力は、入力変数リストとすることができる。さらに、入力変数リストは、入力テンソルリストと、他のデータタイプの入力変数を格納するための属性リストとを含むことができる。例えば、カスタム計算関数の入力変数のデータタイプがテンソルタイプ（ｔｅｎｓｏｒ）、整数タイプ（ｉｎｔ）、浮動小数点タイプ（ｆｌｏａｔ）であり、ｔｅｎｓｏｒ１、ｔｅｎｓｏｒ２、ｉｎｔ、ｆｌｏａｔと表現されている場合、静的関数の入力変数リストはテンソルリスト（ｔｅｎｓｏｒ１、ｔｅｎｓｏｒ２）及び属性リスト（ｉｎｔ、ｆｌｏａｔ）を含むことができる。

入力変数リストはＣ＋＋のテンプレートパラメータ導出メカニズムを用いて得ることができる。

いくつかの実施形態では、前記静的関数の入力情報は入力情報リストを構成し、前記入力情報リストは入力テンソルリストを含み、前記カスタム入力情報は少なくとも１つのデータタイプのカスタム入力情報を含み、前記構造体は少なくとも１つの特殊化の副構造体を含み、異なる特殊化の副構造体は異なるデータタイプに対応し、前記データタイプはテンソルを含み、前記マクロ処理された計算関数に基づいて前記登録対象オペレータカーネル関数を構築することは、前記少なくとも１つの特殊化の副構造体のそれぞれを用いて、前記それぞれの特殊化の副構造体に対応するデータタイプのカスタム入力情報を取得し、データタイプがテンソルのカスタム入力情報で前記入力テンソルリストを構成し、前記データタイプが非テンソルも含み、前記入力情報リストが他のデータタイプのリストも含む場合に、データタイプが非テンソルのカスタム入力情報で前記他のデータタイプのリストを構成することをさらに含む。

具体的には、カスタムオペレータのコンパイル時に、定義されたマクロの置換関係に基づいて、前記マクロ処理された計算関数を置換する構造体（ｓｔｒｕｃｔ）を決定することができる。上述の例によれば、マクロ処理された計算関数はＰＤ＿ＫＥＲＮＥＬ（ＲｅｌｕＣＰＵＦｏｒｗａｒｄ）であり、当該関数を置換する構造体はＫｅｒｎｅｌＦｕｎｃＩｍｐｌであり、当該構造体における静的関数はＣｏｍｐｕｔｅである。実際の応用において、この静的関数Ｃｏｍｐｕｔｅへのポインタが返され、さらに、この構造体ＫｅｒｎｅｌＦｕｎｃＩｍｐｌには複数の特殊化の副構造体が含まれていてもよい。副構造体は、上記の構造体ＫｅｒｎｅｌＦｕｎｃＩｍｐｌに含まれる構造体であり、特殊化の副構造体は、一つ又は複数のパラメータが具体化された構造体である。本実施形態では、異なる特殊化の副構造体は異なるデータタイプに対応しており、例えば、ある特殊化の副構造体の最初のテンプレートパラメータがテンソルタイプに具体化されていれば、その特殊化の副構造体に対応するデータタイプはテンソルであり、カスタム計算関数におけるデータタイプがテンソルの入力変数を解析することができる。特殊化の副構造体に基づいて、静的関数Ｃｏｍｐｕｔｅのポインタにより静的関数Ｃｏｍｐｕｔｅを呼び出すことができる。この静的関数Ｃｏｍｐｕｔｅの返り値は、この複数の特殊化の副構造体のそれぞれにおける静的関数の関数ポインタである。特定の副構造体における静的関数は、例えばＣｏｍｐｕｔｅＣａｌｌＨｅｌｐｅｒ１、ＣｏｍｐｕｔｅＣａｌｌＨｅｌｐｅｒ２．．．．で表す場合、静的関数Ｃｏｍｐｕｔｅを呼び出すことで、ＣｏｍｐｕｔｅＣａｌｌＨｅｌｐｅｒ１の関数ポインタ、ＣｏｍｐｕｔｅＣａｌｌＨｅｌｐｅｒ２の関数ポインタなどを返すことができる。さらに、関数ポインタに基づいて対応する特殊化の副構造体における静的関数を呼び出し、例えば、ＣｏｍｐｕｔｅＣａｌｌＨｅｌｐｅｒ１の関数ポインタに基づいてＣｏｍｐｕｔｅＣａｌｌＨｅｌｐｅｒ１を呼び出すことができる。各特殊化の副構造体における静的関数は、対応するデータタイプの入力変数を解析し、対応するデータタイプの入力変数リストを構築するために使用される。例えば、ＣｏｍｐｕｔｅＣａｌｌＨｅｌｐｅｒ１に対応するデータタイプがテンソル（ｔｅｎｓｏｒ）であり、カスタム計算関数の入力変数がｔｅｎｓｏｒ１とｔｅｎｓｏｒ２を含む場合、ＣｏｍｐｕｔｅＣａｌｌＨｅｌｐｅｒ１の実行により、入力テンソルリスト（ｔｅｎｓｏｒ１，ｔｅｎｓｏｒ２）を取得することができる。

具体的な実現において、図３に示すように、異なる特殊化の副構造体がカスタム計算関数の入力変数を１つずつマッチングする方式で、対応するデータタイプの入力変数を取得して対応する入力変数リストを構成してもよい。さらに、マッチングの終了を識別するための特殊な特殊化の副構造体を含むことができる。さらに、特殊化の副構造体を用いてカスタム計算関数の入力変数を解析する場合には、Ｃ＋＋のテンプレート導出メカニズムを用いることができる。

カスタム計算関数の入力変数の解析は、あらかじめ定義された構造体により実現することができる。

いくつかの実施形態では、現在のシナリオに基づいて、前記現在のシナリオに対応する現在のコンストラクタを決定し、前記現在のコンストラクタを用いて、前記オペレータメタ情報に基づいてディープラーニングフレームワークにおける登録対象オペレータを構築し、前記登録対象オペレータを前記ディープラーニングフレームワークにおけるグローバルオペレータテーブルに登録して良い。

図４に示すように、コンストラクタはｌｏａｄＯｐＭｅｔａＩｎｆｏＡｎｄＲｅｇｉｓｔｅｒ（）（ｌｏａｄと略記）とＲｅｇｉｓｔｅｒＯｐｅｒａｔｏｒＷｉｔｈＭｅｔａＩｎｆｏＭａｐ（）（ｒｅｇｉｓｔｅｒと略記）で示される二つの種類を含んでよい。

現在のシナリオに基づいて現在のコンストラクタを選択することができる。例えば、現在のシナリオは訓練であれば、選択された現在のコンストラクタはｌｏａｄであり、現在のシナリオは推論であれば、選択された現在のコンストラクタはｒｅｇｉｓｔｅｒである。ｌｏａｄとは、まずコンパイルして動的ライブラリファイルを生成し、動的ライブラリファイルを生成した後に終了し、その後に再起動する時にこの動的ライブラリをロードし、登録を完了することを指し、生成と登録が２つのプロセスである。ｒｅｇｉｓｔｅｒは生成と登録が一つのプロセスである。また、図４のＣｕｓｔｏｍＯｐ及びＣｕｓｔｏｍＯｐＫｅｒｎｅｌは、カスタムオペレータに対応する登録対象オペレータの２つのクラスであり、それぞれ登録対象オペレータ記述情報及び登録対象オペレータカーネル関数を格納する。ＯｐＩｎｆｏＭａｐ及びＡｌｌＯｐＫｅｒｎｅｌｓ（）はグローバルオペレータテーブルであり、それぞれグローバルなオペレータ記述情報及びオペレータカーネル関数を格納する。

具体的には、ユーザが入力した登録情報をＯｐＭｅｔａＩｎｆｏに格納することができ、複数のＯｐＭｅｔａＩｎｆｏがＯｐＭｅｔａＩｎｆｏＭａｐを構成することができる。ユーザは、カスタムオペレータをコンパイルする際に、ｌｏａｄ関数又はｒｅｇｉｓｔｅｒ関数を呼び出すことにより、カスタムオペレータに対応する登録対象オペレータを構築し、グローバルオペレータテーブルに登録することができる。その後、ディープラーニングフレームワークの統一スケジューリング方式に基づいてスケジューリングすることができる。訓練については、ユーザはｐｙｔｈｏｎインタフェースを使用して呼び出すことができ、ディープラーニングフレームワークはＰｙｔｈｏｎインタフェースを生成するときにｌｏａｄ関数の呼び出しをＰｙｔｈｏｎインタフェースにカプセル化することができるため、ユーザはＰｙｔｈｏｎインタフェースを使用するときに自動的に呼び出すことができる。推論については、推論プログラムの起動時にグローバルコールが１回行われ、ｒｅｇｉｓｔｅｒ関数を呼び出すことができる。

シナリオごとに異なるコンストラクタを使用することで、より柔軟性を高めることができる。

本開示の実施形態では、以上の処理により、ディープラーニングフレームワークのカスタムオペレータのコード化の複雑さを効果的に削減し、フレームワークの二次開発のコストを削減し、フレームワークの使いやすさが向上するため、他の専門分野がこの方法により専用オペレータを容易に拡張し、例えば量子計算、バイオコンピューティングなどの分野においてディープラーニングフレームワークを用いてＡＩ研究を行うことができる。これは、ディープラーニングフレームワークのエコ構築に長期的に良い影響を与え、競争力を高めることができる。

図５は、本開示の第５実施形態に係る概略図である。本実施形態はディープラーニングフレームワークのオペレータ登録装置を提供する。図５に示すように、オペレータ登録装置５００は、受信モジュール５０１と、作成モジュール５０２と、登録モジュール５０３とを備える。

受信モジュール５０１は、ユーザにより提供されたディープラーニングフレームワークにオペレータを登録するための登録情報であって、作成方法が前記ディープラーニングフレームワークに関連しないカスタム計算関数を含む登録情報を受信する。作成モジュール５０２は、前記登録情報に基づいて前記ディープラーニングフレームワークにおけるオペレータメタ情報を作成する。登録モジュール５０３は、前記オペレータメタ情報に基づいて前記ディープラーニングフレームワークにおける登録対象オペレータを構築し、前記登録対象オペレータを前記ディープラーニングフレームワークにおけるグローバルオペレータテーブルに登録する。

幾つかの実施形態では、前記登録情報は、カスタム入力情報及びカスタム出力情報をさらに含み、前記作成モジュール５０２は、具体的に、前記カスタム入力情報を前記ディープラーニングフレームワークにおける標準入力情報に変換し、前記カスタム出力情報を前記ディープラーニングフレームワークにおける標準出力情報に変換し、前記カスタム計算関数をマクロで処理してマクロ処理された計算関数を得、前記標準入力情報と、前記標準出力情報と、前記マクロ処理された計算関数とに基づいて、前記ディープラーニングフレームワークにおけるオペレータメタ情報を作成する。

いくつかの実施形態では、前記登録対象オペレータは、登録対象オペレータ記述情報及び登録対象オペレータカーネル関数を含み、前記登録モジュール５０３は、具体的に、前記標準入力情報及び前記標準出力情報に基づいて、前記登録対象オペレータ記述情報を構築し、前記マクロ処理された計算関数に基づいて、前記登録対象オペレータカーネル関数を構築する。

いくつかの実施形態では、前記登録対象オペレータカーネル関数に統一的な形式の入力情報と統一された関数ポインタとが含まれ、前記登録モジュール５０３は、さらに具体的に、異なるカスタム計算関数に対して統一的な形式を有する静的関数を含む、前記マクロ処理された計算関数を置換するための構造体を決定し、前記静的関数の入力情報を前記統一的な形式の入力情報とし、前記静的関数の関数ポインタを前記統一された関数ポインタとする。

いくつかの実施形態では、前記静的関数の入力情報で入力情報リストを構成し、前記入力情報リストに入力テンソルリストが含まれ、前記カスタム入力情報に少なくとも１つのデータタイプのカスタム入力情報が含まれ、前記構造体に少なくとも１つの特殊化の副構造体が含まれ、異なる特殊化の副構造体が異なるデータタイプに対応し、前記データタイプにテンソルが含まれ、前記登録モジュールは、さらに、前記少なくとも１つの特殊化の副構造体のそれぞれを使用して、前記特殊化の副構造体のそれぞれに対応するデータタイプのカスタム入力情報を取得し、データタイプがテンソルのカスタム入力情報で前記入力テンソルリストを構成し、前記データタイプが非テンソルも含み、前記入力情報リストが他のデータタイプのリストも含む場合に、データタイプが非テンソルのカスタム入力情報で前記他のデータタイプのリストを構成する。

いくつかの実施形態では、前記登録モジュール５０３は、具体的に、現在のシナリオに基づいて、前記現在のシナリオに対応する現在のコンストラクタを決定し、前記現在のコンストラクタを用いて、前記オペレータメタ情報に基づいて、ディープラーニングフレームワークにおける登録対象オペレータを構築し、前記登録対象オペレータを前記ディープラーニングフレームワークにおけるグローバルオペレータテーブルに登録する。

理解すべきなのは、本開示の実施形態では、異なる実施形態における同一又は類似の内容を互いに参照することができる。

理解すべきなのは、本開示の実施形態における「第１」、「第２」等は、単に区別するためのものであり、重要度の高低、タイミングの前後等を表すものではない。

本開示の実施形態によれば、本開示はさらに、電子デバイス、可読記憶媒体、及びコンピュータプログラム製品を提供する。

図６は、本開示の実施形態を実施するために使用され得る例示的な電子デバイス６００の模式的なブロック図である。電子デバイスは、ラップトップ、デスクトップコンピュータ、ワークベンチ、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータのような、様々な形態のデジタルコンピュータを表す。電子デバイスはさらに、ＰＤＡ、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の同様のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すことができる。本明細書に示す構成要素、それらの接続及び関係、ならびにそれらの機能は、単なる一例であり、本明細書に記載及び／又は要求された本開示の実現を制限することではない。

図６に示すように、電子デバイス６００は、読み取り専用メモリ（ＲＯＭ）６０２に記憶されたコンピュータプログラム、又は記憶手段６０６からランダムアクセスメモリ（ＲＡＭ）６０３にロードされたコンピュータプログラムに従って、様々な適切な動作及び処理を実行することができる演算手段６０１を含む。ＲＡＭ６０３には、電子デバイス６００の動作に必要な各種のプログラムやデータが記憶されてもよい。演算手段６０１、ＲＯＭ６０２及びＲＡＭ６０３は、バス６０４を介して接続されている。入出力（Ｉ／Ｏ）インタフェース６０５もバス６０４に接続されている。

例えばキーボード、マウス等の入力手段６０６と、例えば様々なタイプのディスプレイ、スピーカ等の出力手段６０７と、例えば磁気ディスク、光ディスク等の記憶手段６０８と、例えばネットワークカード、モデム、無線通信トランシーバなどの通信手段６０９を含む電子デバイス６００の複数の構成要素は、Ｉ／Ｏインタフェース６０５に接続される。通信手段６０９は、電子デバイス６００が例えばインターネットのコンピュータネットワーク及び／又は様々な電気通信ネットワークを介して他のデバイスと情報／データを交換することを可能にする。

演算手段６０１は、処理能力及び演算能力を有する様々な汎用及び／又は専用の処理コンポーネントであってよい。演算手段６０１のいくつかの例は、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、様々な専用の人工知能（ＡＩ）演算チップ、機械学習モデルアルゴリズムを実行する様々な演算ユニット、デジタル信号プロセッサ（ＤＳＰ）、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。演算手段６０１は、上述した様々な方法及び処理、例えばディープラーニングフレームワークのオペレータ登録方法を実行する。例えば、幾つかの実施形態では、ディープラーニングフレームワークのオペレータ登録方法は、例えば記憶手段６０８のような機械可読媒体に物理的に組み込まれたコンピュータソフトウェアプログラムとして実装されてもよい。幾つかの実施形態では、コンピュータプログラムの一部又は全部は、ＲＯＭ６０２及び／又は通信手段６０９を介して電子デバイス６００にロード及び／又はインストールすることができる。コンピュータプログラムがＲＡＭ６０３にロードされ、演算手段６０１により実行されると、上述したディープラーニングフレームワークのオペレータ登録方法の１つ又は複数のステップを実行することができる。代替的に、他の実施形態では、演算手段６０１は、ディープラーニングフレームワークのオペレータ登録方法を実行するように、他の任意の適切な方法で（例えば、ファームウェアを介する）構成されてもよい。

本明細書で前述したシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、専用集積回路（ＡＳＩＣ）、専用標準製品（ＡＳＳＰ）、システムオンチップシステム（ＳＯＣ）、ロードプログラマブル論理デバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はこれらの組み合わせにおいて実装されてもよい。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムで実施されることを含んで良い。当該１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラマブルシステム上で実行及び／又は解釈することができる。当該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであって、記憶システム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、当該記憶システム、当該少なくとも１つの入力装置、及び当該少なくとも１つの出力装置にデータ及び命令を転送することができる。

本開示の方法を実施するためのプログラムコードは、１つ又は複数のプログラミング言語の任意の組み合わせを用いて記述することができる。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ、又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供することにより、プログラムコードがプロセッサ又はコントローラにより実行されると、フローチャート及び／又はブロック図に指定された機能／動作を実行するようにすることができる。プログラムコードは、全てがマシン上で実行されても良く、一部がマシン上で実行されても良く、スタンドアロンパッケージとして一部的にマシン上で実行され且つ一部的にリモートマシン上で実行され、或いは全てがリモートマシン又はサーバ上で実行されても良い。

本開示の文脈では、機械可読媒体は、有形の媒体であって、命令実行システム、装置又はデバイスにより使用され、或いは命令実行システム、装置又はデバイスと合わせて使用されるプログラムを含むか記憶することができる。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体であってよい。機械可読媒体は、電子的、磁気的、光学的、電磁気的、赤外線的、又は半導体的なシステム、装置又はデバイス、あるいはこれらの任意の適切な組み合わせを含んで良いが、これらに限定されない。機械可読記憶媒体のより具体的な例は、１つ又は複数のラインに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭ又はフラッシュメモリ（登録商標））、光ファイバ、携帯型コンパクトディスク読み取り専用メモリ（ＣＤ?ＲＯＭ）、光学記憶装置、磁気記憶装置、又はこれらの任意の適切な組み合わせを含む。

ユーザとのインタラクションを提供するために、本明細書に記載されたシステム及び技術は、ユーザに情報を表示するための表示装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、ユーザにより入力をコンピュータに提供するキーボード及びポインティングデバイス（例えば、マウス又はトラックボール）と備えるコンピュータ上に実施されてよい。他の種類の装置は、ユーザとのインタラクションを提供するためにも使用され得る。例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であって良く、ユーザからの入力を任意の形式（音入力、音声入力、又は触覚入力を含む）で受信して良い。

本明細書に記載されたシステム及び技術は、バックエンド構成要素を含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェア構成要素を含むコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンド構成要素を含むコンピューティングシステム（例えば、グラフィカルユーザインタフェースもしくはウェブブラウザを有するクライアントコンピュータであり、ユーザは、当該グラフィカルユーザインタフェースもしくは当該ウェブブラウザを通じて本明細書で説明されるシステムと技術の実施形態とインタラクションすることができる）、そのようなバックエンド構成要素、ミドルウェア構成要素、もしくはフロントエンド構成要素の任意の組合せを含むコンピューティングシステムに実施されることが可能である。システムの構成要素は、任意の形態又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によって相互に接続されることが可能である。通信ネットワークの例は、ローカルエリアネットワーク（「ＬＡＮ」）、ワイド・エリア・ネットワーク（「ＷＡＮ」）、インターネットワークを含む。

コンピュータシステムは、クライアントとサーバを含み得る。クライアントとサーバは、一般的に互いから遠く離れており、通常は、通信ネットワークを通じてインタラクトする。クライアントとサーバとの関係は、相応するコンピュータ上で実行され、互いにクライアント－サーバの関係を有するコンピュータプログラムによって生じる。サーバはクラウドサーバ、クラウドコンピューティングサーバ又はクラウドホストとも呼ばれ、従来の物理ホストとＶＰＳサービス（「ＶｉｒｔｕａｌＰｒｉｖａｔｅＳｅｒｖｅｒ」、或いは「ＶＰＳ」と略称される）において管理が難しく、ビジネスの拡張性が弱いという欠点を解決するクラウドコンピューティングサービスシステムのホスト製品の１つであって良い。サーバは、分散システムのサーバであっても良く、ブロックチェーンを組み合わせたサーバであってもよい。

以上で示された様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除できることを理解されたい。例えば、本出願に説明される各ステップは、並列の順序又は順次的な順序で実施されてもよいし、又は異なる順序で実行されてもよく、本出願で開示された技術案の望ましい結果が達成できる限り、ここで制限されない。

上記の具体的な実施形態は本出願の保護範囲に対する制限を構成しない。設計要件及び他の要因に従って、様々な修正、組み合わせ、部分的組み合わせ及び置換を行うことができることを当業者は理解するべきである。本出願の精神及び原則の範囲内で行われる修正、同等の置換、改善は、何れも本出願の保護範囲内に含まれるべきである。

Claims

コンピュータによって実行される、ディープラーニングフレームワークのオペレータ登録方法であって、
ユーザにより提供されたディープラーニングフレームワークにオペレータを登録するための登録情報を受信することであって、前記登録情報は、作成方法が前記ディープラーニングフレームワークに関連しないカスタム計算関数を含む、ことと、
前記登録情報に基づいて、前記ディープラーニングフレームワークにおけるオペレータメタ情報を作成することと、
前記オペレータメタ情報に基づいて前記ディープラーニングフレームワークにおける登録対象オペレータを構築し、前記登録対象オペレータを前記ディープラーニングフレームワークにおけるグローバルオペレータテーブルに登録することと、
を含む、
ディープラーニングフレームワークのオペレータ登録方法。
前記登録情報は、カスタム入力情報及びカスタム出力情報をさらに含み、
前記登録情報に基づいて、前記ディープラーニングフレームワークにおけるオペレータメタ情報を作成することは、
前記ディープラーニングフレームワークにおける内部標準に適合するように、前記カスタム入力情報を統一化して形式が統一である標準入力情報を得ることと、
前記ディープラーニングフレームワークにおける内部標準に適合するように、前記カスタム出力情報を統一化して形式が統一である標準出力情報を得ることと、
前記カスタム計算関数に対してマクロを実行してマクロ処理された計算関数を取得することと、
前記標準入力情報と、前記標準出力情報と、前記マクロ処理された計算関数とに基づいて、前記ディープラーニングフレームワークにおけるオペレータメタ情報を作成することと、
を含む、
請求項１に記載のディープラーニングフレームワークのオペレータ登録方法。
前記登録対象オペレータは、登録対象オペレータ記述情報と、登録対象オペレータカーネル関数と、を含み、
前記オペレータメタ情報に基づいて前記ディープラーニングフレームワークにおける登録対象オペレータを構築することは、
前記標準入力情報と前記標準出力情報とに基づいて、前記登録対象オペレータ記述情報を構築することであって、前記登録対象オペレータは前記標準入力情報と前記標準出力情報で構成される、ことと、
前記マクロ処理された計算関数に基づいて前記登録対象オペレータカーネル関数を構築することと、
を含み、
前記登録対象オペレータカーネル関数に統一的な形式の入力情報及び統一された関数ポインタが含まれ、
前記マクロ処理された計算関数に基づいて前記登録対象オペレータカーネル関数を構築することは、
異なるカスタム計算関数に対して統一的な形式を有する静的関数を含む、前記マクロ処理された計算関数を置換するための構造体を決定することと、
前記静的関数の入力情報を前記統一的な形式の入力情報とすることと、
前記静的関数の関数ポインタを前記統一された関数ポインタとすることと、
を含む、
請求項２に記載のディープラーニングフレームワークのオペレータ登録方法。
前記静的関数の入力情報で入力情報リストを構成し、前記入力情報リストに入力テンソルリストが含まれ、前記カスタム入力情報に少なくとも１つのデータタイプのカスタム入力情報が含まれ、前記構造体に少なくとも１つの特殊化の副構造体が含まれ、異なる特殊化の副構造体が異なるデータタイプに対応し、前記データタイプにテンソルが含まれ、
前記マクロ処理された計算関数に基づいて前記登録対象オペレータカーネル関数を構築することは、
前記少なくとも１つの特殊化の副構造体のそれぞれを用いて、前記特殊化の副構造体のそれぞれに対応するデータタイプのカスタム入力情報を取得することと、
データタイプがテンソルであるカスタム入力情報によって前記入力テンソルリストを構成することと、
前記データタイプが非テンソルをさらに含み、且つ前記入力情報リストが他のデータタイプのリストをさらに含む場合、データタイプが非テンソルであるカスタム入力情報によって前記他のデータタイプのリストを構成することと、
をさらに含む、
請求項３に記載のディープラーニングフレームワークのオペレータ登録方法。
前記オペレータメタ情報に基づいて前記ディープラーニングフレームワークにおける登録対象オペレータを構築し、前記登録対象オペレータを前記ディープラーニングフレームワークにおけるグローバルオペレータテーブルに登録することは、
現在のシナリオに基づいて、前記現在のシナリオに対応する現在のコンストラクタを決定することであって、前記シナリオは訓練と推論を含む、ことと、
前記現在のコンストラクタを用いて、前記オペレータメタ情報に基づいてディープラーニングフレームワークにおける登録対象オペレータを構築し、前記登録対象オペレータを前記ディープラーニングフレームワークにおけるグローバルオペレータテーブルに登録することと、
を含む、
請求項１～４のいずれか一項に記載のディープラーニングフレームワークのオペレータ登録方法。
ディープラーニングフレームワークのオペレータ登録装置であって、
ユーザにより提供されたディープラーニングフレームワークにオペレータを登録するための登録情報を受信する受信モジュールであって、前記登録情報は、作成方法が前記ディープラーニングフレームワークに関連しないカスタム計算関数を含む、受信モジュールと、
前記登録情報に基づいて、前記ディープラーニングフレームワークにおけるオペレータメタ情報を作成する作成モジュールと、
前記オペレータメタ情報に基づいて前記ディープラーニングフレームワークにおける登録対象オペレータを構築し、前記登録対象オペレータを前記ディープラーニングフレームワークにおけるグローバルオペレータテーブルに登録する登録モジュールと、
を備える、
ディープラーニングフレームワークのオペレータ登録装置。
前記登録情報はカスタム入力情報とカスタム出力情報とをさらに含み、
前記作成モジュールは、
前記ディープラーニングフレームワークにおける内部標準に適合するように、前記カスタム入力情報を統一化して形式が統一である標準入力情報を得ることと、
前記ディープラーニングフレームワークにおける内部標準に適合するように、前記カスタム出力情報を統一化して形式が統一である標準出力情報を得ることと、
前記カスタム計算関数に対してマクロを実行してマクロ処理された計算関数を取得することと、
前記標準入力情報と、前記標準出力情報と、前記マクロ処理された計算関数とに基づいて、前記ディープラーニングフレームワークにおけるオペレータメタ情報を作成することと、
を実行する、
請求項６に記載のディープラーニングフレームワークのオペレータ登録装置。
前記登録対象オペレータは、登録対象オペレータ記述情報と、登録対象オペレータカーネル関数と、を含み、
前記登録モジュールは、
前記標準入力情報及び前記標準出力情報に基づいて、前記登録対象オペレータ記述情報を構築することと、
前記マクロ処理された計算関数に基づいて前記登録対象オペレータカーネル関数を構築することであって、前記登録対象オペレータは前記標準入力情報と前記標準出力情報で構成される、ことと、
を実行し、
前記登録対象オペレータカーネル関数は、統一的な形式の入力情報及び統一された関数ポインタを含み、
前記登録モジュールは、
異なるカスタム計算関数に対して統一的な形式を有する静的関数を含む、前記マクロ処理された計算関数を置換するための構造体を決定することと、
前記静的関数の入力情報を前記統一的な形式の入力情報とすることと、
前記静的関数の関数ポインタを前記統一された関数ポインタとすることと、
をさらに実行する、
請求項７に記載のディープラーニングフレームワークのオペレータ登録装置。
前記静的関数の入力情報で入力情報リストを構成し、前記入力情報リストに入力テンソルリストが含まれ、前記カスタム入力情報に少なくとも１つのデータタイプのカスタム入力情報が含まれ、前記構造体に少なくとも１つの特殊化の副構造体が含まれ、異なる特殊化の副構造体が異なるデータタイプに対応し、前記データタイプにテンソルが含まれ、
前記登録モジュールは、
前記少なくとも１つの特殊化の副構造体のそれぞれを用いて、前記特殊化の副構造体のそれぞれに対応するデータタイプのカスタム入力情報を取得することと、
データタイプがテンソルであるカスタム入力情報によって前記入力テンソルリストを構成することと、
前記データタイプが非テンソルをさらに含み、且つ前記入力情報リストが他のデータタイプのリストをさらに含む場合、データタイプが非テンソルであるカスタム入力情報によって前記他のデータタイプリストを構成することと、
をさらに実行する、
請求項８に記載のディープラーニングフレームワークのオペレータ登録装置。
前記登録モジュールは、
現在のシナリオに基づいて、前記現在のシナリオに対応する現在のコンストラクタを決定することであって、前記シナリオは訓練と推論を含む、ことと、
前記現在のコンストラクタを用いて、前記オペレータメタ情報に基づいて、ディープラーニングフレームワークにおける登録対象オペレータを構築し、前記登録対象オペレータを前記ディープラーニングフレームワークにおけるグローバルオペレータテーブルに登録することと、
を実行する、
請求項６～９のいずれか一項に記載のディープラーニングフレームワークのオペレータ登録装置。
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信可能に接続されたメモリと、
を備え、
前記メモリに前記少なくとも１つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも１つのプロセッサにより実行されると、前記少なくとも１つのプロセッサに請求項１～５のいずれか一項に記載のディープラーニングフレームワークのオペレータ登録方法を実行させる電子デバイス。
コンピュータに請求項１～５のいずれか一項に記載のディープラーニングフレームワークのオペレータ登録方法を実行させるためのコンピュータコマンドを記憶した非一時的なコンピュータ可読記憶媒体。
プロセッサにより実行されると、請求項１～５のいずれか一項に記載のディープラーニングフレームワークのオペレータ登録方法を実現するコンピュータプログラム。