JP7268924B2

JP7268924B2 - 推論システム、推論装置、推論方法及び推論プログラム

Info

Publication number: JP7268924B2
Application number: JP2022026516A
Authority: JP
Inventors: 一樹客野
Original assignee: Axell Corp
Current assignee: Axell Corp
Priority date: 2019-11-14
Filing date: 2022-02-24
Publication date: 2023-05-08
Anticipated expiration: 2039-11-14
Also published as: JP2022060486A

Description

本発明は、推論システム、推論装置、推論方法及び推論プログラムに関する。

画像認識、音声認識、文字認識などのアプリケーションにおいて、入力層、中間層、及び出力層を含むニューラルネットワークを用いた推論処理が用いられている。
ニューラルネットワークの学習処理では、中間層を多層化した構成を用いたディープラーニングを実行することにより、高い精度で推論可能な学習済みモデルを作成する。
アプリケーションの利用者は、推論装置が実行する推論フレームワークに、ネットワーク構造と重み係数で定義される学習済みモデル（例えば、特許文献１）を読み込ませることにより推論処理を実行する。
なお、推論処理における入力データの形式は、学習時の設計に応じた制限がかけられる。このような制限には、入力ニューロンの数に対応する１データの要素数、及びデータの分解能などがある。
推論装置は、入力データを上記制限に適応した形式にする前処理を実行し、前処理済みの入力データをニューラルネットワークに入力する。
また推論装置は、ニューラルネットワークの出力データを後段で実行される処理に適応した形式にする後処理を実行し、後処理済みの出力データを後段のアプリケーションに出力する。

特許文献２には、学習時にニューラルネット演算装置に与えられる学習データについて前処理を施す前処理装置と、認識時にニューラルネット演算装置に与えられる認識データに前処理を施す前処理装置が開示されている。
学習時の前処理では、例えば２値化処理でニューラルネット演算装置に入力させる学習データのデータセット数を適正に少なくして学習時間を短縮させることができる。また認識時の前処理は、例えば量子化処理で認識データの特徴を際立たせることにより認識率を向上させることができる。
また特許文献２には、前処理装置により前処理された学習データ又は認識データに基づきニューラルネット演算装置で学習演算又は認識演算された結果を受けて、後で使用する機器に合わせてデータ変換（後処理）を行う後処理装置が記載されている。

特開２０１９－１５９４９９号公報特開平８－２１２１８２号公報

ニューラルネットワークを用いた推論を行う学習済みモデルは、推論装置の利用者自身が作成するのではなく、推論システムの開発を商業的に行う販売者が作成し、利用者に提供されるケースがある。
この場合、推論装置の利用者は、販売者がネットワーク上にアップロードした学習済みモデルを購入・ダウンロードし、自身の推論装置に予め導入した推論フレームワークに組み込んで利用する。
推論フレームワーク自体はマルチプラットフォームで動作するため、利用者は自身の環境で推論フレームワークを手軽に実行できる。
しかし、上記の前処理部と後処理部はＣ言語やＰｙｔｈｏｎなどのプログラム言語を用いて、利用者が自らの環境に応じて実装する必要があるのが現状である。
利用者自身によるこれらの実装は難度が高く、プラットフォーム毎にコンパイルしなおす必要がありポータビリティも低い。
その結果、現状として、特に販売者から提供された学習済みモデルを利用することは決して容易ではない。
本発明はこのような事情を鑑みてなされたものであり、一側面として、学習済みモデルを容易に使用可能とすることを目的とする。

本発明は、上記の課題を解決するためになされたものであり、一形態として、ニューラルネットワークの推論処理を行う第１装置と、前記推論処理に用いる学習済みモデルを作成する第２装置と、を備え、前記第１装置は、前記推論処理を行うために、学習済みモデルを入れ替え可能な推論フレームワークを実行する実行部と、前記推論処理を行う対象データの入力を受け付ける受付部と、前記第２装置が作成した前記学習済みモデルを前記推論フレームワークに読み込む読込部と、を備え、前記推論フレームワークは、推論エンジンと、後処理用バーチャルマシンと、を備え、前記学習済みモデルは、ニューラルネットワークと、後処理用プログラムの前記後処理用バーチャルマシン用バイトコードと、を備え、前記推論エンジンは、前記学習済みモデルに含まれるニューラルネットワークに基づいて前記対象データに対する推論を行い、前記推論の結果となる出力データを出力し、前記後処理用バーチャルマシンは、前記学習済みモデルに含まれる前記後処理用バーチャルマシン用バイトコードに基づいて前記後処理用プログラムを実行し、前記出力データのデータ形式を、アプリケーションが期待する形式に変換する後処理を行う、ことを特徴とする。
また、一形態として、ニューラルネットワークの推論処理を行う第１装置と、前記推論処理に用いる学習済みモデルを作成する第２装置と、を備え、前記第１装置は、前記推論処理を行うために、学習済みモデルを入れ替え可能な推論フレームワークを実行する実行部と、前記推論処理を行う対象データの入力を受け付ける受付部と、前記第２装置が作成した前記学習済みモデルを前記推論フレームワークに読み込む読込部と、を備え、前記推論フレームワークは、推論エンジンと、前処理用バーチャルマシンと、を備え、前記学習済みモデルは、ニューラルネットワークと、前処理用プログラムの前記前処理用バーチャルマシン用バイトコードと、を備え、前記前処理用バーチャルマシンは、前記学習済みモデルに含まれる前記前処理用バーチャルマシン用バイトコードに基づいて前記前処理用プログラムを実行し、前記受付部が受け付けた前記対象データのデータ形式を前記推論処理に対応する形式に変換する前処理を行い、前記推論エンジンは、前記前処理用バーチャルマシンが実行する前記前処理用プログラムによる前処理済の前記対象データを入力され、当該対象データに対して、前記学習済みモデルに含まれるニューラルネットワークに基づく推論処理を行う、ことを特徴とする。

本発明によれば、一側面として、学習済みモデルを容易に使用することが出来る。

ニューラルネットワークを用いて推論を行うための方式を説明する図である。本実施形態の推論装置を適用した推論システムの概要を説明する図である。第１の例に係る推論処理を説明する図である。第１の例において、前処理及び後処理をバーチャルマシンで実行する学習済みモデルの作成方法を説明する図である。第２の例に係る推論装置を説明する図である。第２の実施形態に係る前処理及び後処理をＣＮＮレイヤーとして実装した学習済みモデルの作成方法を示す図である。第１の例に係る推論装置の機能構成を説明するブロック図である。第１の例に係る販売者装置の機能構成を説明するブロック図である。第２の例に係る推論装置の機能構成を説明するブロック図である。第２の例における販売者装置の機能構成を説明するブロック図である。推論装置が実行する学習済みモデル要求処理を説明するフローチャートである。図１１の学習済みモデル要求処理に対応して販売者装置が実行する学習済みモデル送信処理を説明するフローチャートである。推論装置が実行する推論処理を説明するフローチャートである。コンピュータ装置の一実施例を示すブロック図である。

以下に、図面を参照して本発明の実施の形態を詳細に説明する。
図１は、ニューラルネットワークを用いて推論を行うための方式を説明する図である。
ニューラルネットワークを用いた推論では、ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）の推論フレームワークに学習済みモデルを読み込む。学習済みモデルはネットワーク構造と重み係数で定義されており、推論フレームワークは、これらの情報をパラメータとして推論処理を実行する。
推論フレームワークは、推論ランタイムともいう。推論ランタイムは推論ランタイムライブラリの略であり、ニューラルネットワーク（メインプログラム）を実行するときに用いられるプログラムの部品をひとまとめにしたファイルである。
なお、推論フレームワークによる推論処理では、推論対象の画像データ等を推論フレームワークに入力する前に当該データに対して行う前処理と、推論フレームワークの出力に対して行う後処理が必要である。前処理部と後処理部は、利用者によってＣ言語などで記述される。

前処理は画像形式変換等であり、後処理は検出結果の整形等である。
例えば「Ｙｏｌｏ」などでは、前処理として、入力された８ｂｉｔの画像をｆｌｏａｔに変換し、ＲＧＢ順の並び替え、リサイズを行ったあとでＣＮＮに投入する。学習済みモデルの種類によって、ＲＧＢ値のレンジが－１２８～１２７や、０～１．０、－０．５～０．５など、期待する入力が異なるため、それを合わせ込むために行われる。
前処理として入力画像をフーリエ変換したあとに推論フレームワークに入力する場合や、フレーム間の動きベクトルを計算したあとに推論フレームワークに入力する場合もある。
さらに、上記の「Ｙｏｌｏ」の場合、ＣＮＮの出力は１４７０次元のベクトルである。後処理として、下記に示すようなコードでバウンディングボックスに変換する必要がある。

推論フレームワーク自体はマルチプラットフォームで動作する。
しかしながら、推論フレームワークへの入力データのフォーマットをあわせる前処理部と、出力ベクトルから期待する結果（バウンディングボックスなど）に整形する後処理部は、Ｃ＋＋言語やＰｙｔｈｏｎなどで記述されているため学習済みモデルに含めることができない。
前処理部、後処理部については利用者が自ら実現するためのプログラムコードを記述する必要があり、非常に難度が高い。
また異なるプラットフォーム上で学習済みモデルを使いたい場合、プラットフォーム毎にコンパイルしなおす必要がありポータビリティが低い。その結果、学習済みモデルを利用することは決して容易ではない。
この問題は、学習済みモデルの販売プラットフォームを作る時に障害になる。販売者から見ると、後処理をプログラムで提供する必要がありノウハウが流出してしまう恐れがある。また利用者から見ると、後処理をコーディングする必要があり取扱が煩雑である。

ニューラルネットワークでは、学習済みモデルを作成するとき教師データを利用して学習を実行する。学習済みモデルをアップデートするときには、新たな教師データを利用して学習を実行する。
教師データとは、ニューラルネットワークが学習しやすいように、例えば、ラベル、オフセット、バウンディングボックスが調整された例題と答えについてのデータである。従って、教師データが変わると、推論時に利用する前処理及び後処理も調整する必要が生じる。
前処理部及び後処理部は、学習時に使用した推論フレームワーク及び学習時の設定などに対応するように作成されるからである。また学習時の設定は、推論対象に応じた入力データごとに適切な設定を技術者が適宜設定するものなので、一意に決まるものではない。学習時に使用する推論フレームワークは、推論時に使用する推論フレームワークとは違うものでもよいため、設定は複数種類存在することになる。
前処理及び後処理は学習済みモデルごとに異なる処理となる。
一度作成した前処理プログラム、後処理プログラムを更新後の学習済みモデルに適用することは難しく、学習済みモデルのアップデート時にも改めて前処理、後処理をコーディングする必要がある。利用者にとってはとりわけ取扱が煩雑となる。
前処理プログラム、後処理プログラムをそのままに学習済みモデルを差し替えることを考えた場合、特に後処理がハードコーディングされていると差し替えできる範囲が狭くなることが考えられる。

本実施形態の推論装置、及び推論装置が用いる学習済みモデルはこのような諸問題を解決するものである。
学習済みモデルに前処理及び後処理の機能をあらかじめ組み込み、それを推論フレームワークで実行可能としたことで、学習済みモデルの利用者が自ら前処理、後処理用のコードを記述する必要がない。その結果、学習済みモデルの利用を非常に容易とすることができる。

図２は、本実施形態の推論装置を適用した推論システムの概要を説明する図である。
システムは、学習済みモデルの利用者が利用する推論装置１と、推論フレームワークの提供者が利用する推論フレームワーク提供者装置２と、例えばアプリケーションの販売者である、学習済みモデルの販売者が利用する販売者装置３と、を含む。これらの装置は、インターネットなどのネットワークＮＷに接続され、互いに通信可能に構成されている。

図２を用いて、本実施形態に係る処理の流れを概説する。
（１）推論フレームワークの提供者は、推論ランタイムにＶＭを組み込んだランタイムライブラリとして利用者に提供する。学習済みモデルの利用者は、提供された推論フレームワークを、自身の推論装置１に導入する。
（２）学習済みモデルの販売者は、販売者装置３を用いて、提供者が提供した推論フレームワーク向けに前処理及び後処理の機能を組み込んだ学習済みモデルを作成する。
（３）学習済みモデルの販売者は、販売者装置３を用いて、作成した学習済みモデルを利用者に販売提供する。学習済みモデルは販売者装置３から直接利用者に販売提供される。あるいは、販売者が学習済みモデルストアのサーバにアップロードした学習済みモデルを、利用者が推論装置１を用いてダウンロードすることで学習済みモデルが提供されてもよい。
（４）推論装置１の利用者は、（１）で提供された推論フレームワークに、（３）で提供された学習済みモデルを読み込ませ、推論装置１を用いて入力データ等に対する推論処理を実行する。なお、以下の説明では、画像データを用いた推論処理を一例として説明するが、入力データは、音声データ、文字データなどの他のデータでもよい。

推論装置１、販売者装置３が行う処理については後に詳述するが、本実施形態の推論処理を概説する。
推論装置１は、学習済みモデルが含む前処理用の機能を入力データに対して実行し、入力データを推論処理に対応した形式に変換する前処理を行う。
推論装置１は、前処理済みの入力データをニューラルネットワークに入力して推論処理を行う。
さらに推論装置１は、ニューラルネットワークの出力データ（推論結果出力データ）に対して学習済みモデルが含む後処理用の機能を実行し、出力データの形式を、後段の処理に対応する形式に変換する後処理を行う。推論装置１は、例えば、推論処理の出力データの形式を、後段のアプリケーションで実行される処理に適合させる。
推論装置１は、後処理済みの出力データを、後段で実行されるアプリケーションに出力する。
学習済みモデルは、前処理用の機能と後処理用の機能を含んでいる。従って、推論装置１の利用者（ユーザ）は、モデル販売者から学習済みモデルを購入して推論フレームワークに組み込むことで入出力データの前処理及び後処理を考慮することなく推論処理を実行することができる。従って、学習済みモデルを容易に使うことができる。
また学習済みモデルの中に前処理と後処理を統合することができるため、クロスプラットフォームでの一貫した動作を実現できる。

学習済みモデルの販売者は、再学習によって学習済みモデルをアップデートした場合には、新たな学習済みモデルに対応した前処理及び後処理の機能を含んだ学習済みモデルを提供することができる。例えば、販売者装置３は、新たな学習済みモデルを、モデルストアのサーバにアップロードすることができる。推論装置１は、新たに提供された学習済みモデルに含まれる前処理及び後処理の機能をフレーワークに読み込ませて推論処理を行う。

ニューラルネットワークでは、学習済みモデルを作成するとき教師データを利用して学習を実行する。学習済みモデルをアップデートするときには、新たな教師データを利用して学習を実行する。
教師データとは、ニューラルネットワークが学習しやすいように、例えば、ラベル、オフセット、バウンディングボックスが調整された例題と答えについてのデータである。
学習時の教師データが変わると、推論時に利用する前処理及び後処理も調整する必要が生じる。
上記のように従来は、推論フレームワークに対して前処理及び後処理をハードコーディングで実装していたため、学習済みモデルのアップデート後には前処理及び後処理のプログラムを新たに作成しなければならなかった。
従って、アップデート後の新たな学習済みモデルを利用するのが煩雑になっていた。
それに対して、本実施形態では、学習処理を実行した学習済みモデルの販売者が、新たな学習済みモデルに対応する前処理及び後処理の機能を学習済みモデル自体に含ませている。
利用者は、アップデート後の学習済みモデルを推論フレームワークに読み込ませるだけで、新たな学習済みモデルを用いた推論処理を推論装置１に実行させることができる。従って、学習済みモデルの利用がより容易になる。

図３は、第１の例に係る推論処理を説明する図である。
推論装置１は、推論フレーワーク１０を実行することにより推論処理を実行する。
この例では、推論フレーワーク１０にＶＭ（バーチャルマシン）を搭載し、学習済みモデルには、前処理用、後処理用の機能として、このＶＭで実行可能なバイトコードを含ませる。
推論フレーワーク１０は、学習済みモデルに含まれるバイトコードを実行することによって前処理、後処理を実行することが出来る。
推論フレーワーク１０は、推論エンジン１１と、前処理用ＶＭ１２と、後処理用ＶＭ１３と、を含む。
推論エンジン１１は、ニューラルネットワーク、例えばＣＮＮによる推論処理を行う。
前処理用ＶＭ１２は、前処理用のバイトコードを実行することで、推論エンジン１１に入力する画像等のデータに対する形式変換などの前処理を実行する。
後処理用ＶＭ１３は、前処理用のバイトコードを実行することで、推論エンジン１１による推論結果に対する後処理を実行する。

それに対し、推論フレーワーク１０が読み込む学習済みモデル５０は、ネットワーク構造や重み付けといったニューラルネットワークの本体データ５１と、ＶＭ用のコンパイル済みバイトコードと、を備えている。
ＶＭ用バイトコードは、前処理用プログラムのバイトコード５２と、後処理用プログラムのバイトコード５３と、を含む。
推論フレーワーク１０は、画像データ等を入力されると、学習済みモデル５０が含む前処理用プログラムのバイトコード５２、後処理用プログラムのバイトコード５３を、前処理用ＶＭ１２、後処理用ＶＭ１３を用いて夫々実行することによって、前処理、後処理を自動的に行う。
その結果、学習済みモデル５０の利用者は、前処理、後処理のためのプログラムコードを自ら記述して、前処理用プログラム、後処理用プログラムを別途用意する必要がない。学習済みモデルは使いやすくなると言える。

図４は、第１の例において、前処理及び後処理をバーチャルマシンで実行する学習済みモデルの作成方法を説明する図である。
学習済みモデルの販売者は、販売者装置３において、図４に説明する変換ツール１００を用いて推論フレームワークに含まれるＶＭに対応した学習済みモデル５０を作成する。
変換ツール１００は、プログラムコードをＶＭ向けにコンパイルしてＶＭ用のバイトコードを生成するコンパイラ１０１を含む。
販売者は、変換ツール１００を実行する販売者装置３において、既存の推論フレームワークで学習した学習済みモデル５０と、前処理用プログラムのコード、後処理用プログラムのコードを変換ツールに入力する。

変換ツール１００は、ＶＭ用コンパイラを用いてプログラムコードをＶＭ向けにコンパイルしてバイトコードを生成し、生成したバイトコードを学習済みモデル５０に含める。
バイトコードを学習済みモデル５０とパックして１つのファイルとしてもよいし、バイトコードと学習済みモデル５０を別ファイルとして同時に配信してもよい。
なお、前処理のプログラムコード、後処理のプログラムコードにはいずれも独自の秘匿されるべきノウハウが導入されている。従ってバイトコードがリバースエンジニアリングされてノウハウが流出することを防止するために、学習済みモデル５０に含ませるバイトコードは暗号化されて配布されてもよい。

図５は、第２の例に係る推論装置を説明する図である。
推論フレーワーク１０は、レジスタやメモリに相当する機能を備えている。図３、図４で説明したＶＭの基本命令（レジスタからのリード・ストア、メモリからのリード・ストア、条件分岐、ループ）をそれぞれＣＮＮレイヤーとして実装し、チューリング完全とする。実質的に、図３で説明したＶＭと同じアーキテクチャであると言える。
推論フレーワーク１０が読み込む学習済みモデル５０は、重み付けとネットワーク構造を含むが、ネットワーク構造内に、図３のＶＭの命令に一対一で対応したレイヤーが定義されている。このレイヤーが前処理と後処理を実行するのである。
学習済みモデル５０の中に前処理と後処理を実行する機能を含ませる点で、図３と同じ構成である。
前処理用のレイヤーと後処理のレイヤーを含む学習済みモデル５０が推論ランタイムに読み込まれると、推論エンジン１１は、画像データに対する前処理、ＣＮＮの推論処理、推論結果に対する後処理を行う。

図６は、第２の実施形態に係る前処理及び後処理をＣＮＮレイヤーとして実装した学習済みモデルの作成方法を示す図である。
学習済みモデルの販売者は、販売者装置３において、前処理及び後処理をＣＮＮレイヤーとして実装した学習済みモデル５０を、図６に説明する変換ツール１５０によって作成する。
学習済みモデルの販売者は、販売者装置３において、既存の推論フレームワークで学習した「ネットワーク構造」と「重み」を含む学習済みモデル５０と、前処理用プログラムのコード、後処理用プログラムのコードを変換ツール１５０に入力する。

変換ツール１５０は、レイヤーコンパイラ１５１を用いて、前処理用プログラムのコード、後処理用プログラムのコードをそれぞれレイヤーに落とし込み（コンパイルし）、生成したレイヤー５５、５６を学習済みモデル５０に含める。
すなわち変換ツール１５０は、前処理用プログラムのコード、後処理用プログラムのコードをレイヤー形式のバイトコードに変換し、ニューラルネットワークの前後に接続するのである。
なお、「レイヤーに落とし込む」とは、前処理と後処理のプログラムコードに含まれるループ処理などを展開することによりＣＮＮで処理可能なレイヤー形式に変換することである。
学習済みモデル５０において、レイヤーとしてコンパイルされたプログラムはネットワーク構造として格納されているので、学習済みモデル５０を読み込む推論装置１は、前処理、推論処理、及び後処理をすべてＣＮＮで実行することが出来る。
その結果、学習済みモデル５０の利用者は、前処理、後処理のためのプログラムコードを自ら記述して、前処理用プログラム、後処理用プログラムを別途用意する必要がない。学習済みモデルは使いやすくなると言える。

図７は、第１の例に係る推論装置の機能構成を説明するブロック図である。
推論装置１は、制御部３０と記憶部４０とを備える。
制御部３０は、受付部３１と、送信部３２と、受信部３３と、読込部３４と、前処理部３５と、推論部３６と、後処理部３７と、出力部３８と、を備える。
記憶部４０は、画像データ記憶部４１と、学習済みモデル記憶部４２と、前処理済み画像データ記憶部４３と、推論結果記憶部４４と、後処理済み推論結果記憶部４５と、を備える。
受付部３１は、画像データ記憶部４１からの推論フレーワーク１０に対する画像データ等の入力を受け付ける。また、受付部３１は、学習済みモデルの取得を要求する学習済みモデル取得要求を、利用者から受け付ける。
送信部３２は、受付部３１が学習済みモデル取得要求を受け付けたことに応じて、販売者装置３に対して学習済みモデル取得要求を送信する。送信部３２はまた、受付部３１が入力を受け付けた画像データ等を販売者装置３に対して送信する。

受信部３３は、販売者装置３から学習済みモデルを受信して学習済みモデル記憶部４２に格納する。
読込部３４は、学習済みモデル記憶部４２から学習済みモデルを読み出して推論フレーワーク１０に組み込む。
前処理部３５は、前処理用ＶＭ１２に相当し、読み込んだ学習済みモデル５０に含まれる前処理用バイトコード５２を実行する。それによって、前処理部３５は、画像データ等に対する前処理を行い、前処理済みの画像データ等を前処理済み画像データ記憶部４３に格納する。
上記したように、前処理は画像データを推論処理に対応した画像形式に変換する処理である。

推論部３６は、推論エンジン１１に相当する。推論部３６は、読み込んだ学習済みモデル５０に含まれる本体データを用いて、前処理済み画像データ記憶部４３に格納されている前処理済みの画像データに対する推論処理を行い、推論結果出力データを推論結果記憶部４４に格納する。
後処理部３７は、後処理用ＶＭ１３に相当し、読み込んだ学習済みモデル５０に含まれる後処理用バイトコード５３を実行する。それによって、後処理部３７は、推論結果記憶部４４に格納されている推論結果出力データに対する後処理を行い、後処理済みの推論結果出力データを後処理済み推論結果記憶部４５に格納する。
上記したように、後処理は、推論結果出力データを後段のアプリケーションで実行される処理に適合させる処理である。
出力部３８は、後処理済み推論結果記憶部４５に格納されている後処理済みの推論結果出力データを後段のアプリケーションに対して出力する。

図８は、第１の例に係る販売者装置の機能構成を説明するブロック図である。
販売者装置３は、制御部６０と記憶部７０とを備える。
制御部６０は、変換部６１と、統合部６２と、出力部６３と、受付部６４と、送信部６５と、を備える。
記憶部７０は、プログラムコード記憶部７１と、学習済みモデル記憶部７２と、統合学習済みモデル記憶部７３と、を備える。
プログラムコード記憶部７１は、予め準備された前処理用プログラム、後処用プログラムのプログラムコードが格納されている。
学習済みモデル記憶部７２には、予め学習された学習済みモデルが格納される。
統合学習済みモデル記憶部７３は、前処理及び後処理の機能が統合された統合学習済みモデルが格納される。

変換部６１は、プログラムコード記憶部７１から入力された前処理、後処理のプログラムコードをＶＭ向けのバイトコードに変換する（コンパイルする）処理を行う。変換部６１は、図４のコンパイラ１０１に相当する。
変換部６１は、このときバイトコードを暗号化してもよい。
統合部６２は、学習済みモデル記憶部７２に格納される学習済みモデル５０に、変換部６１が変換したバイトコードを組み込んで統合する。
このとき統合部６２は、バイトコードを暗号化してもよい。
出力部６３は、バイトコードを統合した学習済みモデル５０を統合学習済みモデル記憶部７３に出力する。
受付部６４は、推論装置１からの学習済みモデル取得要求を受け付ける。
送信部６５は、推論装置１に対して、統合学習済みモデル記憶部７３に記憶されているバイトコードを組み込んだ学習済みモデルを送信する。

図９は、第２の例に係る推論装置の機能構成を説明するブロック図である。図７と同様の構成には同じ符号を付して説明している。
第１の例と同様に推論装置１は、制御部３０と記憶部４０とを備える。
制御部３０は、受付部３１と、送信部３２と、受信部３３と、読込部３４と、前処理部３５と、推論部３６と、後処理部３７と、出力部３８と、を備える。
記憶部４０は、画像データ記憶部４１と、学習済みモデル記憶部４２と、前処理済み画像データ記憶部４３と、推論結果記憶部４４と、後処理済み推論結果記憶部４５と、を備える。

受付部３１は、画像データ記憶部４１からの推論フレーワーク１０に対する画像データ等の入力を受け付ける。受付部３１はまた、利用者による学習済みモデル取得要求を受け付ける。
送信部３２は、受付部３１が学習済みモデル取得要求を受け付けたことに応じて、販売者装置３に対して学習済みモデル取得要求を送信する。送信部３２はまた、受付部３１が入力を受け付けた画像データを販売者装置３に対して送信する。
受信部３３は、販売者装置３から学習済みモデルを受信して学習済みモデル記憶部４２に格納する。
読込部３４は、学習済みモデル記憶部４２から学習済みモデルを読み出して推論フレーワーク１０に組み込む。
前処理部３５は、推論エンジン１１に相当し、読み込んだ学習済みモデル５０に含まれる前処理用レイヤー５５を実行する。それによって、前処理部３５は画像データ等に対する前処理を行い、前処理済みの画像データ等を前処理済み画像データ記憶部４３に格納する。
上記したように、前処理は画像データを推論処理に対応した画像形式に変換する等の処理である。

推論部３６は、推論エンジン１１に相当する。推論部３６は、読み込んだ学習済みモデル５０に含まれる本体データ５１を用いて、前処理済み画像データ記憶部４３に格納されている前処理済みの画像データに対する推論処理を行い、推論結果出力データを推論結果記憶部４４に格納する。
後処理部３７は、後処理用ＶＭ１３に相当し、読み込んだ学習済みモデル５０に含まれる後処理用レイヤー５６を実行する。それによって、後処理部３７は、推論結果記憶部４４に格納されている推論結果出力データに対する後処理を行い、後処理済みの推論結果出力データを後処理済み推論結果記憶部４５に格納する。
上記したように、後処理は、推論結果出力データを後段のアプリケーションで実行される処理に適合させる等の処理である。
出力部３８は、後処理済み推論結果記憶部４５に格納されている後処理済みの推論結果出力データを後段のアプリケーションに対して出力する。

図１０は、第２の例における販売者装置の機能構成を説明するブロック図である。図８と同様の構成には同じ符号を付して説明している。
第１の例と同様に販売者装置３は、制御部６０と記憶部７０とを備える。
制御部６０は、変換部６１と、統合部６２と、出力部６３と、受付部６４と、送信部６５と、を備える。
記憶部７０は、プログラムコード記憶部７１と、学習済みモデル記憶部７２と、統合学習済みモデル記憶部７３と、を備える。
プログラムコード記憶部７１は、予め準備された前処理用プログラム、後処理用プログラムのプログラムコードが格納されている。
学習済みモデル記憶部７２には、予め学習された学習済みモデルが格納されている。
統合学習済みモデル記憶部７３は、前処理及び後処理の機能が統合された統合学習済みモデルが格納される。

変換部６１は、プログラムコード記憶部７１から入力された前処理、後処理のプログラムコードを展開してレイヤーに変換する（コンパイルする）処理を行う。図６のレイヤーコンパイラ１５１に相当する。
統合部６２は、学習済みモデル記憶部７２に格納される学習済みモデル５０に、変換部６１が変換したレイヤーを組み込んで統合する。
出力部６３は、バイトコードを統合した学習済みモデル５０を統合学習済みモデル記憶部７３に出力する。
受付部６４は、推論装置１からの学習済みモデル取得要求を受け付ける。
送信部６５は、推論装置１に対して、統合学習済みモデル記憶部７３に記憶されているレイヤーを組み込んだ学習済みモデルを送信する。

なお、レイヤーコンパイラは、販売者装置３の変換ツール１５０ではなく、推論装置１の推論エンジン１１が備えてもよい。
この場合、変換ツール１５０は、学習済みモデル５０に対して、単に前処理用プログラムのコード、後処理用プログラムのコードを含めるのみである。
推論装置１の推論エンジン１１が、学習済みモデル５０を読み込むと、レイヤーコンパイラは、学習済みモデル５０に含まれる前処理と後処理のプログラムコードに含まれるループ処理などを展開することにより、前処理と後処理のプログラムコードをＣＮＮで処理可能なレイヤー形式のバイトコードに変換する。

図１１は、推論装置が実行する学習済みモデル要求処理を説明するフローチャートである。
ステップＳ１０１において、受付部３１は、学習済みモデル取得要求があったか否かを判定する。この学習済みモデル取得要求は、推論装置１の利用者によって、推論装置１が備えるキーボードやマウスなどの入力装置を用いて行われ得る。
学習済みモデル取得要求があったと判定した場合（ステップＳ１０１でＹｅｓ）、受付部３１は、ステップＳ１０２において、学習済みモデル取得要求を受け付ける。そして送信部３２は、ステップＳ１０３において、学習済みモデル要求を販売者装置３に送信し、学習済みモデル要求処理は終了する。
受付部３１において、学習済みモデル取得要求がなかったと判定された場合（ステップＳ１０１でＮｏ）、受信部３３は、ステップＳ１０４において、販売者装置３から学習済みモデルを受信したか否かを判定する。学習済みモデルを受信したと判定した場合（ステップＳ１０４でＹｅｓ）、受信部３３は、ステップＳ１０５において、受信した学習済みモデルを記憶部４０に格納する、そして、読込部３４は、Ｓ１０６において、記憶部４０に格納された学習済みモデルを読み出し、推論フレームワークに学習済みモデルを組み込む。
学習済みモデルを受信したと判定しなかった場合（ステップＳ１０４でＮｏ）、受信部３３は何も行わず、学習済みモデル要求処理は終了する。

図１２は、図１１の学習済みモデル要求処理に対応して販売者装置が実行する学習済みモデル送信処理を説明するフローチャートである。
ステップＳ１１１において、受付部５４は、学習済みモデル取得要求が推論装置１からあったか否かを判定する。学習済みモデル取得要求があったと判定した場合（ステップＳ１１１でＹｅｓ）、受付部５４は、ステップＳ１１２において、学習済みモデル取得要求を受け付ける。送信部５５は、ステップＳ１１３において、要求に応じて記憶部６０から学習済みモデルを読み出して推論装置１に送信する。

図１３は、推論装置が実行する推論処理を説明するフローチャートである。
ステップＳ１２１において、受付部３１は、推論対象の画像データ等の入力が行われたか、すなわち入力データがあったかを判定する。
画像データの入力は、例えば、推論装置１が備えるキーボードやマウスなどの入力装置を用いて記憶部４０に予め格納されている画像データを利用者が選択することによって行い得る。
あるいは、推論装置１が備えるカメラなどの撮像装置によって直接撮像された画像データが入力されてもよい。
入力データがなかったと判定した場合（ステップＳ１２１にてＮｏ）、受付部３１は、Ｓ１２１の処理を繰り返し実行する。入力データがあったと判定した場合（ステップＳ１２１でＹｅｓ）、ステップＳ１２２において、受付部３１は入力データを受け付ける。

ステップＳ１２３において、前処理部３５は、入力データに対して前処理を実行し、前処理済みの入力データを記憶部４０に格納する。
前処理部３５による前処理は、推論フレーワーク１０が備えるＶＭ１２が、学習済みモデルに含まれる前処理用バイトコード５１を実行することによって実施される。
あるいは前処理部３５による前処理は、推論フレーワーク１０が備える推論エンジン１１が、学習済みモデルに含まれる前処理用レイヤー５５を実行することによって実施される。
ステップＳ１２４において、推論部３６（推論エンジン１１）は、記憶部４０に格納されている前処理済みの入力データ（変換入力データ）に対して推論処理を実行し、推論結果出力データを記憶部４０に格納する。

ステップＳ１２５において、後処理部３７は、記憶部４０に格納されている推論結果出力データに対して後処理を実行し、後処理済みの推論結果出力データを記憶部４０に格納する。
後処理部３７による後処理は、推論フレーワーク１０が備えるＶＭ１３が、学習済みモデルに含まれる後処理用バイトコード５２を実行することによって実施される。
あるいは後処理部３７による後処理は、推論フレーワーク１０が備える推論エンジン１１が、学習済みモデルに含まれる後処理用レイヤー５６を実行することによって実施される。
ステップＳ１２６において、出力部３８は、記憶部４０に格納されている後処理済みの出力データを後段のアプリケーションに対して出力する。

図１４は、コンピュータ装置の一実施例を示すブロック図である。
図１４を参照して、コンピュータ装置２００の構成について説明する。
図１４において、コンピュータ装置２００は、制御回路２０１と、記憶装置２０２と、読書装置２０３と、記録媒体２０４と、通信インターフェイス２０５と、入出力インターフェイス２０６と、入力装置２０７と、表示装置２０８とを含む。また、通信インターフェイス２０５は、ネットワーク３００と接続される。そして、各構成要素は、バス２１０により接続される。
販売者装置３、推論装置１は、コンピュータ装置２００に記載の構成要素の一部または全てを適宜選択して構成することができる。

制御回路２０１は、コンピュータ装置２００全体の制御をする。制御回路２０１は、例えば、ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ（ＣＰＵ）などのプロセッサである。制御回路２０１は、例えば、図７、図９における制御部３０、図８、図１０における制御部６０として機能する。

記憶装置２０２は、各種データを記憶する。そして、記憶装置２０２は、例えば、ＲｅａｄＯｎｌｙＭｅｍｏｒｙ（ＲＯＭ）及びＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ（ＲＡＭ）などのメモリや、ＨａｒｄＤｉｓｋ（ＨＤ）などである。記憶装置２０２は、制御回路２０１を、制御部３０、制御部６０として機能させる情報処理プログラムを記憶してもよい。記憶装置２０２は、例えば、図７、図９における記憶部４０、図８、図１０における記憶部７０として機能する。
なお、情報処理プログラムは、制御回路２０１を制御部３０として機能させる推論プログラムと、制御回路２０１を制御部６０として機能させる変換プログラムとの少なくとも一方を含む。

推論装置１、販売者装置３は、推論処理を行うとき、記憶装置２０２に記憶されたプログラムをＲＡＭに読み出す。
推論装置１は、ＲＡＭに読み出されたプログラムを制御回路２０１で実行することにより、受付処理、送信処理、受信処理、読込処理、前処理に係る処理、推論処理、後処理に係る処理、出力処理のいずれか１以上を含む処理を実行する。
販売者装置３は、ＲＡＭに読み出されたプログラムを制御回路２０１で実行することにより、変換処理、統合処理、出力処理、受付処理、送信処理のいずれか１以上を含む処理を実行する。
なお、プログラムは、制御回路２０１が通信インターフェイス２０５を介してアクセス可能であれば、ネットワーク３００上のサーバが有する記憶装置に記憶されていても良い。

読書装置２０３は、制御回路２０１に制御され、着脱可能な記録媒体２０４のデータのリード／ライトを行なう。
記録媒体２０４は、各種データを保存する。記録媒体２０４は、例えば、取引処理プログラムを記憶する。記録媒体２０４は、例えば、ＳｅｃｕｒｅＤｉｇｉｔａｌ（ＳＤ）メモリーカード、ＦｌｏｐｐｙＤｉｓｋ（ＦＤ）、ＣｏｍｐａｃｔＤｉｓｃ（ＣＤ）、ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ（ＤＶＤ）、Ｂｌｕ－ｒａｙ（登録商標）Ｄｉｓｋ（ＢＤ）、及びフラッシュメモリなどの不揮発性メモリ（非一時的記録媒体）である。

通信インターフェイス２０５は、ネットワーク３００を介してコンピュータ装置２００と他の装置とを通信可能に接続する。通信インターフェイス２０５は、例えば、図７、図９において、送信部３２、受信部３３として機能する。通信インターフェイス２０５は、また図８、図１０において、受付部６４、送信部６５として機能する。
入出力インターフェイス２０６は、例えば、各種入力装置と着脱可能に接続するインターフェイスである。入出力インターフェイス２０６と接続される入力装置には、例えば、キーボード、及びマウスなどがある。入出力インターフェイス２０６は、接続された各種入力装置とコンピュータ装置２００とを通信可能に接続する。そして、入出力インターフェイス２０６は、接続された各種入力装置から入力された信号を、バス２１０を介して制御回路２０１に出力する。また、入出力インターフェイス２０６は、制御回路２０１から出力された信号を、バス２１０を介して入出力装置に出力する。入出力インターフェイス２０６は、例えば、図７、図９において、受付部３１として機能する。また、入出力インターフェイス２０６は、例えば、図８、図１０において、受付部６４として機能する。

表示装置２０７は、各種情報を表示する。ネットワーク３００は、例えば、ＬＡＮ、無線通信、Ｐ２Ｐネットワーク、またはインターネットなどであり、コンピュータ装置２００と他の装置を通信接続する。
なお、本実施形態は、以上に述べた実施形態に限定されるものではなく、本実施形態の要旨を逸脱しない範囲内で種々の構成または実施形態を取ることができる。

１推論装置、２提供者装置、３販売者装置、１０推論フレームワーク、１１推論エンジン、１２前処理用ＶＭ、１３後処理用ＶＭ、３０制御部、３１受付部、３２送信部、３３受信部、３４読込部、３５前処理部、３６推論部、３７後処理部、３８出力部、４０記憶部、５０学習済みモデル、５１本体データ、５２前処理用バイトコード、５３後処理用バイトコード、６０制御部、６１変換部、６２統合部、６３出力部、６４受付部、６５送信部、７０記憶部、７０記憶部、１００変換ツール、１０１コンパイラ、１５０変換ツール、１５１レイヤーコンパイラ

Claims

ニューラルネットワークの推論処理を行う第１装置と、前記推論処理に用いる学習済みモデルを作成する第２装置と、を備え、
前記第１装置は、
前記推論処理を行うために、学習済みモデルを入れ替え可能な推論フレームワークを実行する実行部と、
前記推論処理を行う対象データの入力を受け付ける受付部と、
前記第２装置が作成した前記学習済みモデルを前記推論フレームワークに読み込む読込部と、
を備え、
前記推論フレームワークは、推論エンジンと、後処理用バーチャルマシンと、を備え、
前記学習済みモデルは、ニューラルネットワークと、後処理用プログラムの前記後処理用バーチャルマシン用バイトコードと、を備え、
前記推論エンジンは、前記学習済みモデルに含まれるニューラルネットワークに基づいて前記対象データに対する推論を行い、前記推論の結果となる出力データを出力し、
前記後処理用バーチャルマシンは、前記学習済みモデルに含まれる前記後処理用バーチャルマシン用バイトコードに基づいて前記後処理用プログラムを実行し、前記出力データのデータ形式を、アプリケーションが期待する形式に変換する後処理を行う、
ことを特徴とする推論システム。
請求項１に記載の推論システムにおいて、
前記第２装置は、
前記後処理用プログラムのプログラムコードを前記第１装置で実行可能な前記後処理用バーチャルマシン用バイトコードに変換する変換部と、
前記変換部が変換した前記後処理用バーチャルマシン用バイトコードを前記学習済みモデルに統合する統合部と、
を備えることを特徴とする推論システム。
請求項２に記載の推論システムにおいて、
前記後処理用バーチャルマシン用バイトコードは暗号化されていることを特徴とする推論システム。
ニューラルネットワークの推論処理を行う第１装置と、前記推論処理に用いる学習済みモデルを作成する第２装置と、を備え、
前記第１装置は、
前記推論処理を行うために、学習済みモデルを入れ替え可能な推論フレームワークを実行する実行部と、
前記推論処理を行う対象データの入力を受け付ける受付部と、
前記第２装置が作成した前記学習済みモデルを前記推論フレームワークに読み込む読込部と、
を備え、
前記推論フレームワークは、推論エンジンと、前処理用バーチャルマシンと、を備え、
前記学習済みモデルは、ニューラルネットワークと、前処理用プログラムの前記前処理用バーチャルマシン用バイトコードと、を備え、
前記前処理用バーチャルマシンは、前記学習済みモデルに含まれる前記前処理用バーチャルマシン用バイトコードに基づいて前記前処理用プログラムを実行し、前記受付部が受け付けた前記対象データのデータ形式を前記推論処理に対応する形式に変換する前処理を行い、
前記推論エンジンは、前記前処理用バーチャルマシンが実行する前記前処理用プログラムによる前処理済の前記対象データを入力され、当該対象データに対して、前記学習済みモデルに含まれるニューラルネットワークに基づく推論処理を行う、
ことを特徴とする推論システム。
請求項４に記載の推論システムにおいて、
前記第２装置は、
前記前処理用プログラムのプログラムコードを前記第１装置で実行可能な前記前処理用バーチャルマシン用バイトコードに変換する変換部と、
前記変換部が変換した前記前処理用バーチャルマシン用バイトコードを前記学習済みモデルに統合する統合部と、
を備えることを特徴とする推論システム。
請求項５に記載の推論システムにおいて、
前記前処理用バーチャルマシン用バイトコードは暗号化されていることを特徴とする推論システム。
ニューラルネットワークの推論処理を行う推論装置であって、
前記推論処理を行うための学習済みモデルを入れ替え可能な推論フレームワークを実行する実行部と、
前記推論処理を行う対象データの入力を受け付ける受付部と、
外部装置が作成した前記学習済みモデルを前記推論フレームワークに読み込む読込部と、
を備え、
前記推論フレームワークは、推論エンジンと、後処理用バーチャルマシンと、を備え、
前記学習済みモデルは、ニューラルネットワークと、後処理用プログラムの前記後処理用バーチャルマシン用バイトコードと、を備え、
前記推論エンジンは、前記学習済みモデルに含まれるニューラルネットワークに基づいて前記対象データに対する推論を行い、前記推論の結果となる出力データを出力し、
前記後処理用バーチャルマシンは、前記学習済みモデルに含まれる前記後処理用バーチャルマシン用バイトコードに基づいて前記後処理用プログラムを実行し、前記出力データのデータ形式を、アプリケーションが期待する形式に変換する後処理を行う、
ことを特徴とする推論装置。
ニューラルネットワークの推論処理を行う推論装置であって、
前記推論処理を行うための学習済みモデルを入れ替え可能な推論フレームワークを実行する実行部と、
前記推論処理を行う対象データの入力を受け付ける受付部と、
外部装置が作成した前記学習済みモデルを前記推論フレームワークに読み込む読込部と、
を備え、
前記推論フレームワークは、推論エンジンと、前処理用バーチャルマシンと、を備え、
前記学習済みモデルは、ニューラルネットワークと、前処理用プログラムの前記前処理用バーチャルマシン用バイトコードと、を備え、
前記前処理用バーチャルマシンは、前記学習済みモデルに含まれる前記前処理用バーチャルマシン用バイトコードに基づいて前記前処理用プログラムを実行し、前記受付部が受け付けた前記対象データのデータ形式を前記推論処理に対応する形式に変換する前処理を行い、
前記推論エンジンは、前記前処理用バーチャルマシンが実行する前記前処理用プログラムによる前処理済の前記対象データを入力され、当該対象データに対して、前記学習済みモデルに含まれるニューラルネットワークに基づく推論処理を行う、
ことを特徴とする推論装置。
推論装置のプロセッサによって実行される推論方法であって、
前記プロセッサは、
ニューラルネットワークの推論処理を行うための学習済みモデルを入れ替え可能な推論フレームワークを実行し、
前記推論処理を行う対象データの入力を受け付け、
外部装置が作成した前記学習済みモデルを前記推論フレームワークに読み込み、
前記推論フレームワークは、推論エンジンと、後処理用バーチャルマシンと、を備え、
前記学習済みモデルは、ニューラルネットワークと、後処理用プログラムの前記後処理用バーチャルマシン用バイトコードと、を備え、
前記推論エンジンは、前記学習済みモデルに含まれるニューラルネットワークに基づいて前記対象データに対する推論を行い、前記推論の結果となる出力データを出力し、
前記後処理用バーチャルマシンは、前記学習済みモデルに含まれる前記後処理用バーチャルマシン用バイトコードに基づいて前記後処理用プログラムを実行し、前記出力データのデータ形式を、アプリケーションが期待する形式に変換する後処理を行う、
ことを特徴とする推論方法。
推論装置のプロセッサによって実行される推論方法であって、
前記プロセッサは、
ニューラルネットワークの推論処理を行うための学習済みモデルを入れ替え可能な推論フレームワークを実行し、
前記推論処理を行う対象データの入力を受け付け、
外部装置が作成した前記学習済みモデルを前記推論フレームワークに読み込み、
前記推論フレームワークは、推論エンジンと、前処理用バーチャルマシンと、を備え、
前記学習済みモデルは、ニューラルネットワークと、前処理用プログラムの前記前処理用バーチャルマシン用バイトコードと、を備え、
前記前処理用バーチャルマシンは、前記学習済みモデルに含まれる前記前処理用バーチャルマシン用バイトコードに基づいて前記前処理用プログラムを実行し、前記対象データのデータ形式を前記推論処理に対応する形式に変換する前処理を行い、
前記推論エンジンは、前記前処理用バーチャルマシンが実行する前記前処理用プログラムによる前処理済の前記対象データを入力され、当該対象データに対して、前記学習済みモデルに含まれるニューラルネットワークに基づく推論処理を行う、
ことを特徴とする推論方法。
推論装置のプロセッサによって実行される推論プログラムであって、
ニューラルネットワークの推論処理を行うための学習済みモデルを入れ替え可能な推論フレームワークを実行し、
前記推論処理を行う対象データの入力を受け付け、
外部装置が作成した前記学習済みモデルを前記推論フレームワークに読み込み、
前記推論フレームワークは、推論エンジンと、後処理用バーチャルマシンと、を備え、
前記学習済みモデルは、ニューラルネットワークと、後処理用プログラムの前記後処理用バーチャルマシン用バイトコードと、を備え、
前記推論エンジンは、前記学習済みモデルに含まれるニューラルネットワークに基づいて前記対象データに対する推論を行い、前記推論の結果として出力データを出力し、
前記後処理用バーチャルマシンは、前記学習済みモデルに含まれる前記後処理用バーチャルマシン用バイトコードに基づいて前記後処理用プログラムを実行し、前記出力データのデータ形式を、アプリケーションが期待する形式に変換する後処理を行う、
ことを特徴とする推論プログラム。
推論装置のプロセッサによって実行される推論プログラムであって、
ニューラルネットワークの推論処理を行うための学習済みモデルを入れ替え可能な推論フレームワークを実行し、
前記推論処理を行う対象データの入力を受け付け、
外部装置が作成した前記学習済みモデルを前記推論フレームワークに読み込み、
前記推論フレームワークは、推論エンジンと、前処理用バーチャルマシンと、を備え、
前記学習済みモデルは、ニューラルネットワークと、前処理用プログラムの前記前処理用バーチャルマシン用バイトコードと、を備え、
前記前処理用バーチャルマシンは、前記学習済みモデルに含まれる前記前処理用バーチャルマシン用バイトコードに基づいて前記前処理用プログラムを実行し、前記対象データのデータ形式を前記推論処理に対応する形式に変換する前処理を行い、
前記推論エンジンは、前記前処理用バーチャルマシンが実行する前記前処理用プログラムによる前処理済の前記対象データを入力され、当該対象データに対して、前記学習済みモデルに含まれるニューラルネットワークに基づく推論処理を行う、
ことを特徴とする推論プログラム。
ニューラルネットワークの推論処理を行う第１装置と、前記推論処理に用いる学習済みモデルを作成する第２装置と、を備え、
前記第１装置は、
前記推論処理を行う対象データの入力を受け付ける受付部と、
前記第２装置が作成した前記学習済みモデルを読み込む読込部と、
前記学習済みモデルを用いて前記対象データに基づく前記推論処理を実行する推論部と、
前記受付部が受け付けた前記対象データのデータ形式を前記推論処理に対応する形式に変換する前処理を行う前処理部と、
を備え、
前記学習済みモデルは、前記前処理を前記第１装置に実行させるための第１制御情報を含み、
前記前処理部は、前記前処理を、前記学習済みモデルに含まれる前記第１制御情報に基づいて実行し、
前記第２装置は、
前記第１制御情報として、前記前処理のプログラムコードを前記第１装置で実行可能なレイヤーに変換する変換部と、
前記変換部が変換した前記レイヤーを前記学習済みモデルに統合する統合部と、
を備えることを特徴とする推論システム。