WO2020003607A1

WO2020003607A1 - 情報処理装置、モデル学習方法、データ認識方法および学習済みモデル

Info

Publication number: WO2020003607A1
Application number: PCT/JP2019/007055
Authority: WO
Inventors: 律郎西村
Original assignee: オリンパス株式会社
Priority date: 2018-06-25
Filing date: 2019-02-25
Publication date: 2020-01-02
Also published as: JP2021182169A

Abstract

第１専用モデル５２ａは、第１のデバイスにより取得された第１データに含まれる特徴を学習する。第２専用モデル５２ｂは、第２のデバイスにより取得された第２データに含まれる特徴を学習する。共通モデル５４は、第１データと第２データに含まれる特徴を学習する。モデル選択部３２は、入力データを取得したデバイスを特定するデバイス識別情報にもとづいて、学習する専用モデルを選択する。学習部２２は、入力データを用いて、選択された専用モデルと共通モデル５４とを結合した学習モデルに学習させる。

Description

情報処理装置、モデル学習方法、データ認識方法および学習済みモデル

　本発明は、教師データに含まれる特徴を学習する技術、および学習済みモデルを用いて入力データを認識する技術に関する。

　近年、人の脳神経系のニューロンを数理モデル化したニューラルネットワークが注目されている。ニューラルネットワークは、画像処理、音声認識など様々な分野に適用される。教師あり学習でニューラルネットワークは、教師データを用いてパラメータを最適化し、学習済みモデルを構築する。パラメータを高精度に最適化することで、入力データを正確に認識できる学習済みモデルが生成される。

　特許文献１は、ノイズや不要データを除去する前処理を実施した入力情報をニューラルネットワークに入力して、教師データへのマッチング精度や計算速度を向上させ、状態量の推定精度を向上する技術を開示する。

特開２００９－１１３７１７号公報

　現在、医療施設における医師の診断支援として、内視鏡で撮影した内視鏡画像や、顕微鏡を通して病理標本（組織）を撮影した病理画像などを入力し、画像に含まれる病変を抽出するニューラルネットワークなどの機械学習の開発が進められている。これらの機械学習では、撮影画像データと、病変などの認識対象の情報とをセットにした教師データが利用される。病変以外の認識対象の情報としては、泡、残渣、粘膜の臓器種別、血管などの情報がある。

　撮影デバイスごとに、レンズおよび撮像素子の特性や、画像処理エンジンの処理特性が異なるため、撮影された画像の解像力や色調、明るさなどの特徴は、撮影デバイスごとに異なる。そのため学習時に、特定の機種の撮影デバイスＡの教師データしか使用していなければ、生成された学習済みモデルは、撮影デバイスＡの撮影画像データを高精度に認識できるものの、別の機種の撮影デバイスＢの撮影画像データを高精度に認識できない。

　この状況を回避するためには、学習時に、撮影デバイスＡの教師データだけでなく、撮影デバイスＢの教師データも使用して１つの学習済みモデルを生成することで、両方の撮影デバイスによる撮影画像データの認識精度が高められる。しかしながら、この場合、撮影デバイスＡの教師データと撮影デバイスＢの教師データとを、実質的に同数用意する必要がある。たとえば撮影デバイスＡが内視鏡の旧機種、撮影デバイスＢが内視鏡の新機種である場合、撮影デバイスＢの教師データ数は、撮影デバイスＡの教師データ数よりも少ないため、撮影デバイスＢの撮影画像データの認識精度を高めるためには、多くの教師データを集める必要があり、時間がかかる。そこで撮影デバイスＢの教師データ数が少ない場合であっても、撮影デバイスＢの認識精度を高められる学習モデルの構築が望まれている。

　本発明はこうした状況に鑑みなされたものであり、その目的は、新たな学習モデルに関する技術を提供することにある。

　上記課題を解決するために、本発明のある態様の情報処理装置は、第１のデバイスにより取得された第１データに含まれる特徴を学習する第１専用モデルと、第２のデバイスにより取得された第２データに含まれる特徴を学習する第２専用モデルと、第１データと第２データに含まれる特徴を学習する共通モデルと、入力データを受け付ける受付部と、入力データを取得したデバイスを特定するデバイス識別情報にもとづいて、学習する専用モデルを選択するモデル選択部と、入力データを用いて、選択された専用モデルと共通モデルとを結合した学習モデルに学習させる学習部と、を備える。

　本発明の別の態様もまた、情報処理装置である。この装置は、入力データを受け付ける受付部と、入力データを取得したデバイスにより取得された複数のデータに含まれる特徴を学習した専用モデルと、複数のデバイスにより取得された複数のデータに含まれる特徴を学習した共通モデルとを結合した結合モデルを用いて、入力データを認識する認識部と、を備える。

　本発明のさらに別の態様は、学習モデルの学習方法である。この方法は、第１のデバイスにより取得された第１データを用いて、第１専用モデルと共通モデルとを結合した学習モデルに学習させるステップと、第２のデバイスにより取得された第２データを用いて、第２専用モデルと共通モデルとを結合した学習モデルに学習させるステップと、を有する。

　本発明のさらに別の態様は、データ認識方法である。この方法は、入力データを受け付けるステップと、入力データを取得したデバイスにより取得された複数のデータに含まれる特徴を学習した専用モデルと、複数のデバイスにより取得された複数のデータに含まれる特徴を学習した共通モデルとを結合した結合モデルを用いて、入力データを認識するステップと、を有する。

　本発明のさらに別の態様は、入力データをコンピュータに認識させるための学習済みモデルであって、第１のデバイスにより取得された第１データに含まれる特徴を学習済みの第１専用モデルと、第２のデバイスにより取得された第２データに含まれる特徴を学習済みの第２専用モデルと、第１データと第２データに含まれる特徴を学習済みの共通モデルと、を備える。当該学習済みモデルは、コンピュータに入力データが入力されると、入力データを取得したデバイスを特定するデバイス識別情報にもとづいて、学習する専用モデルを選択する機能と、選択した専用モデルと、共通モデルとを結合した結合モデルを生成する機能と、結合モデルを用いて入力データを認識する機能とをコンピュータに実現させる。

　なお、以上の構成要素の任意の組み合わせ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。

学習時の学習モデルを示す図である。入力データ認識時の学習済みモデルを示す図である。実施例の情報処理装置の構成を示す図である。学習モデルの例を示す図である。学習モデルの別の例を示す図である。

　本発明の実施例の概要を説明する。
　実施例の情報処理装置では、複数の部分モデルを結合して、学習モデルを構築する。学習モデルは、デバイスの種類ごとに用意される専用モデルと、複数のデバイスで共用される共通モデルを含む。学習時、情報処理装置は、教師データを取得したデバイス種類に応じた専用モデルと、共通モデルとを結合した学習モデルを生成して、教師データを学習する。教師データを取得したデバイスの種類に応じて、専用モデルが切り替えられる。データ認識時、情報処理装置は、入力データを取得したデバイス種類に応じた学習済みの専用モデルと、学習済みの共通モデルとを結合した結合モデルを生成して、入力データを認識する。実施例では、デバイスが撮影デバイスであって、撮影画像データを入力し、撮影画像データに含まれる病変を出力する学習モデルについて説明する。

　図１は、学習時の学習モデルを示す。デバイスＡ、デバイスＢ、・・・、デバイスＭは、異なる種類の撮影デバイスであり、撮影デバイスの機種ごとに異なる撮像特性を有している。

　実施例では、デバイスＡで撮影した画像データを含む教師データＡは、デバイスＡに専用のモデル（専用モデルＡ）と、共通モデルとを結合した学習モデルに入力されて学習される。デバイスＢで撮影した画像データを含む教師データＢは、デバイスＢに専用のモデル（専用モデルＢ）と、共通モデルとを結合した学習モデルに入力されて学習される。デバイスＭで撮影した画像データを含む教師データＭは、デバイスＭに専用のモデル（専用モデルＭ）と、共通モデルとを結合した学習モデルに入力されて学習される。

　実施例の学習モデルは、共通モデルを必ず含み、デバイスの種類に応じて専用モデルを入れ替えて、入れ替えた専用モデルと共通モデルとを結合した状態で使用される。教師データを撮影したデバイスに応じて専用モデルを切り替えることで、専用モデルは、デバイスに特化した撮影画像データの特徴を学習し、共通モデルは、複数のデバイスに汎用的な撮影画像データの特徴を学習する。

　デバイスに特化した撮影画像データの特徴は、たとえば解像力や色調、明るさなど、デバイスの撮像特性が画像データに反映される特徴である。専用モデルは、一つの種類のデバイスの教師データのみを学習するため、結果として専用モデルは、デバイス特性が撮影画像データに反映された特徴を学習する。

　複数のデバイスに汎用的な撮影画像データの特徴は、デバイス依存の特徴ではなく、撮影された病変の形状、模様、大きさなどの外観的特徴である。共通モデルは、複数種類のデバイスの教師データを学習するため、結果として共通モデルは、複数のデバイスで撮影された画像データに共通の特徴を学習する。

　実施例の学習モデルによると、専用モデルは、特定の種類のデバイスの特徴のみを学習すればよいため、学習の収束は早い。そのためデバイスＡ～Ｍに対応する専用モデルＡ～Ｍ、および共通モデルが十分に学習されている状態で、新たなデバイスＮに対応する専用モデルＮを学習するときには、専用モデルＮと共通モデルを結合した学習モデルを生成して、デバイスＮの教師データを当該学習モデルに入力すればよい。このとき共通モデルのパラメータは若干調整されるが、共通モデルのパラメータ自体は十分に学習された状態にあるため、比較的少数のデバイスＮの教師データＮにより、専用モデルＮの学習を完了させることが可能となる。

　図２は、入力データ認識時の学習済みモデルを示す。デバイスＡで撮影した画像データである入力データＡは、専用モデルＡと共通モデルとを結合した学習済みモデルに入力されて認識される。デバイスＢで撮影した画像データである入力データＢは、専用モデルＢと共通モデルとを結合した学習済みモデルに入力されて認識される。デバイスＭで撮影した画像データである入力データＭは、専用モデルＭと共通モデルとを結合した学習済みモデルに入力されて認識される。

　入力データの認識時、学習済みモデルは、デバイスの種類に応じた専用モデルと、共通モデルとを結合した状態で使用される。専用モデルと共通モデルとを組み合わせることで、１つの学習済みモデルが構築され、入力データを高精度に認識できる。学習済みモデルは、人工知能ソフトウェアの一部であるプログラムモジュールとして利用されてよい。

　図３は、実施例の情報処理装置１の構成を示す。情報処理装置１は、受付部１０、処理部２０、モデル生成部３０、ニューラルネットワークシステム（以下、「ＮＮシステム」と呼ぶ）４０および記憶装置５０を備える。受付部１０は、入力データ取得部１２およびデバイス識別情報取得部１４を有する。処理部２０は、学習部２２および認識部２４を有する。モデル生成部３０は、モデル選択部３２およびモデル結合部３４を有する。記憶装置５０は、第１専用モデル５２ａ、第２専用モデル５２ｂ、・・・、第ｎ専用モデル５２ｎ（以下、特に区別しない場合には「専用モデル５２」と呼ぶ）および共通モデル５４を記憶する。

　ＮＮシステム４０は、電子回路を含むハードウェアで構成されてもよいが、ソフトウェアによって構成されてもよい。モデル生成部３０は、記憶装置５０から専用モデル５２および共通モデル５４を読み出し、ＮＮシステム４０において結合することで、デバイス種類ごとの学習モデルを構築する。ＮＮシステム４０がハードウェアで構成される場合、モデル生成部３０は、ＮＮシステム４０の各ノードのパラメータを設定することで、専用モデル５２および共通モデル５４を構築する。

　情報処理装置１のそれぞれの構成は、ハードウェア的には、任意のプロセッサ、メモリ、その他のＬＳＩで実現でき、ソフトウェア的にはメモリにロードされたプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組み合わせによっていろいろな形で実現できることは、当業者には理解されるところである。

　図３に示す情報処理装置１は、画像認識に用いるパラメータを学習する機械学習装置、および学習済みモデルを用いて画像データを認識する画像認識装置として機能する。機械学習機能は、学習部２２およびＮＮシステム４０により実現され、画像認識機能は、認識部２４およびＮＮシステム４０により実現される。

　第１専用モデル５２ａは、第１の撮影デバイスにより取得された第１データに含まれる特徴を学習する学習モデルである。第２専用モデル５２ｂは、第２の撮影デバイスにより取得された第２データに含まれる特徴を学習する学習モデルである。第３専用モデル５２ｃは、第３の撮影デバイスにより取得された第３データに含まれる特徴を学習する学習モデルである。第ｎ専用モデル５２ｎは、第ｎの撮影デバイスにより取得された第ｎデータに含まれる特徴を学習する学習モデルである。ここで、第１の撮影デバイス、第２の撮影デバイス、第３の撮影デバイス、・・・、第ｎの撮影デバイスは、それぞれ異なる種類のカメラであって、固有の撮像特性を有する。

　共通モデル５４は、第１の撮影デバイス、第２の撮影デバイス、第３の撮影デバイス、・・・、第ｎの撮影デバイスにより取得されたデータに含まれる特徴を学習する学習モデルである。つまり共通モデル５４は、第１～第ｎの撮影デバイスで取得された画像データの特徴を学習する。以下の実施例では、説明の便宜上、第１の撮影デバイスにより取得された画像データと、第２の撮影デバイスにより取得された画像データを用いて、ＮＮシステム４０のパラメータを学習する処理を説明する。

　入力データ取得部１２は、入力データとして、教師データを受け付ける。実施例の教師データは、内視鏡で撮影された画像データと、当該画像データに含まれる病変に関する情報、たとえば画像内の病変の位置、病変名称を含んで構成される。デバイス識別情報取得部１４は、当該教師データを取得したデバイスを特定するデバイス識別情報を取得する。

　たとえば入力データ取得部１２が、撮影デバイスから入力データを受け付けたとき、デバイス識別情報取得部１４は、デバイス識別情報を、当該撮影デバイスから直接取得してもよい。また画像データに、当該画像を撮影したデバイスのデバイス識別情報がメタデータとして付加されていれば、デバイス識別情報取得部１４は、メタデータを読み出して、デバイス識別情報を取得してもよい。またデバイス識別情報取得部１４は、画像データの色調や解像力などの画像特性を解析して、当該画像を撮影したデバイスのデバイス識別情報を取得してもよい。またユーザが、教師データの画像を撮影したデバイスのデバイス識別情報を入力して、デバイス識別情報取得部１４が取得してもよい。

　モデル選択部３２は、教師データを取得したデバイスを特定するデバイス識別情報にもとづいて、学習する専用モデル５２を選択する。デバイス識別情報が、第１のデバイスを特定する情報であれば、モデル選択部３２は、第１専用モデル５２ａを選択する。デバイス識別情報が、第２のデバイスを特定する情報であれば、モデル選択部３２は、第２専用モデル５２ｂを選択する。モデル結合部３４は、選択された専用モデル５２と共通モデル５４とをＮＮシステム４０において結合し、学習モデルを生成する。

　図４は、ＮＮシステム４０に生成される学習モデルの例を示す。実施例の専用モデル５２および共通モデル５４のそれぞれは、ニューラルネットワークとして形成される。学習モデルにおいて、専用モデル５２は、共通モデル５４よりも入力側に配置される。専用モデル５２と共通モデル５４との間には、別のモデルが介在してもよいが、専用モデル５２の出力が、共通モデル５４の入力に直接結合されてよい。

　図４（ａ）は、第１専用モデル５２ａと共通モデル５４とを結合した学習モデルを示す。実施例の学習モデルは、共通モデル５４の入力層が、専用モデル５２の出力層に結合する構造をもつ。モデル選択部３２がデバイス識別情報にもとづいて第１専用モデル５２ａを選択すると、モデル結合部３４が、第１専用モデル５２ａと共通モデル５４とを結合して、ＮＮシステム４０に学習モデルを生成する。

　図４（ｂ）は、第２専用モデル５２ｂと共通モデル５４とを結合した学習モデルを示す。モデル選択部３２がデバイス識別情報にもとづいて第２専用モデル５２ｂを選択すると、モデル結合部３４が、第２専用モデル５２ｂと共通モデル５４とを結合して、ＮＮシステム４０に学習モデルを生成する。

　図４（ａ）、（ｂ）に示すように、第１専用モデル５２ａおよび第２専用モデル５２ｂは、同じネットワーク構成を有してよい。たとえばＮＮシステム４０をハードウェアで構成する場合、モデル結合部３４は、専用モデル５２のパラメータを入れ替えることで、所定の専用モデル５２をハードウェア上に実現できる。この場合、第１専用モデル５２ａは、第１の撮影デバイス用のパラメータセットであり、第２専用モデル５２ｂは、第２の撮影デバイス用のパラメータセットとなる。なおＮＮシステム４０をソフトウェアで構成する場合、各専用モデル５２は、ネットワーク構成とパラメータセットとを含んで構成される。

　図５は、第２専用モデル５２ｂと共通モデル５４とを結合した学習モデルの別の例を示す。図４（ａ）に示す第１専用モデル５２ａと比較すると、図５に示す第２専用モデル５２ｂは、第１専用モデル５２ａとは異なるネットワーク構成を有する。このように各専用モデル５２は、独自のネットワーク構成を有してよいが、専用モデル５２の出力層は、共通モデル５４の入力層と連結できる構成を有する必要がある。

　学習部２２は、教師データを用いて、選択された専用モデル５２と共通モデル５４とを結合した学習モデルに学習させる。学習部２２が、各専用モデル５２を、撮影デバイスごとに学習させることで、第１専用モデル５２ａは、第１の撮影デバイスの特性が第１データに反映された特徴を学習し、第２専用モデル５２ｂは、第２の撮影デバイスの特性が第２データに反映された特徴を学習する。また学習部２２が、共通モデル５４を、撮影デバイスの種類に関係なく、常に学習させることで、共通モデル５４は、全ての教師データに共通の特徴を学習する。

　たとえば、第１専用モデル５２ａ、第２専用モデル５２ｂ、共通モデル５４の学習が進んでいる段階で、第３の撮影デバイスを搭載した新機種の内視鏡がメーカから販売されるとする。ユーザは、第３の撮影デバイスの専用モデルとして、第３専用モデル５２ｃを作成し、記憶装置５０に記憶する。第３専用モデル５２ｃは、第３の撮影デバイスにより取得された第３データに含まれる特徴を学習する学習モデルである。

　第３の撮影デバイスにより取得された画像データを含む教師データに対して、モデル選択部３２は、第３専用モデル５２ｃを選択して、モデル結合部３４が、第３専用モデル５２ｃと共通モデル５４とを結合した学習モデルをＮＮシステム４０に形成する。このとき共通モデル５４は、第１および第２の撮影デバイスにより撮影された教師データを学習した状態にある。そのため学習部２２が、第３専用モデル５２ｃと共通モデル５４とを結合した学習モデルに学習させると、比較的少ない第３の撮影デバイスの教師データにより、第３専用モデル５２ｃの学習を完了させることが可能となる。

　次に、学習済みモデルを用いて、入力データを認識する処理を説明する。
　入力データ取得部１２は、入力データとして、撮影画像データを受け付ける。実施例の撮影画像データは、内視鏡で撮影された画像データである。デバイス識別情報取得部１４は、当該撮影画像データを取得したデバイスを特定するデバイス識別情報を取得する。

　図３を参照して、記憶装置５０は、学習済みの複数の専用モデル５２と、学習済みの共通モデル５４とを記憶している。これらの学習済みモデルは、入力データをコンピュータに認識させるための学習済みモデルであり、具体的には内視鏡画像データを入力して、当該画像に含まれる病変情報を出力させるためのモデルである。学習済みモデルは、専用モデル５２の入力層に入力された入力データを、専用モデル５２および共通モデル５４における学習済みパラメータに応じて演算し、共通モデル５４の出力層から、病変の有無、病変位置を示す情報を出力させる。第１専用モデル５２ａは、第１の撮影デバイスにより取得された第１データに含まれる特徴を学習済みの学習モデルであり、第２専用モデル５２ｂは、第２の撮影デバイスにより取得された第２データに含まれる特徴を学習済みの学習モデルである。共通モデル５４は、複数種類のデバイスにより取得されたデータに含まれる特徴を学習済みの学習モデルである。

　モデル選択部３２は、撮影画像データを取得したデバイスを特定するデバイス識別情報にもとづいて、記憶装置５０から、認識で使用する専用モデル５２を選択する。デバイス識別情報が、第１のデバイスを特定する情報であれば、モデル選択部３２は、第１専用モデル５２ａを選択する。デバイス識別情報が、第２のデバイスを特定する情報であれば、モデル選択部３２は、第２専用モデル５２ｂを選択する。モデル結合部３４は、選択された専用モデル５２と共通モデル５４とをＮＮシステム４０において結合した結合モデルを生成する。

　認識部２４は、結合モデルを用いて、入力データを認識する。ここで認識部２４は、入力データを専用モデル５２の入力層に入力し、共通モデル５４の出力層からのデータを取得する。実施例で入力データの認識は、入力データをＮＮシステム４０に入力して、ＮＮシステム４０に画像認識させて、認識結果を出力させることを意味する。具体的に認識部２４は、ＮＮシステム４０により、撮影画像データから、病変を抽出する画像認識処理を実行させる。この画像認識処理は、医師の診断支援に役立つ。

　以上、本発明を実施例をもとに説明した。これらの実施例は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

　実施例では、デバイスの種類ごとに専用モデル５２を学習させたが、複数のデバイス種類に１つの専用モデル５２を対応付けてもよい。たとえば撮影デバイスの種類が異なっていても、色調などの画像特性が似ていれば、複数種類の撮影デバイスに対して１つの専用モデル５２を設定して、学習させてもよい。

　また実施例では、専用モデル５２を、共通モデル５４よりも入力側に配置した学習モデルを示したが、共通モデル５４が、専用モデル５２よりも入力側に配置されてもよい。また専用モデル５２と共通モデル５４とは直列に連結されるのではなく、並列に連結されてもよい。

　実施例の情報処理装置１では、処理部２０が、学習部２２と認識部２４の双方を有して、画像認識に用いるパラメータを学習する機械学習装置、および学習済みモデルを用いて画像データを認識する画像認識装置として機能することを説明した。情報処理装置１は、必ずしも学習部２２と認識部２４の双方を有する必要はない。

　たとえば内視鏡画像の診断支援サービスを提供する主体が、情報処理装置１を、機械学習装置として利用してよい。この提供主体は、様々な内視鏡で撮影された画像データの教師データを収集して、情報処理装置１に学習させる。学習済みモデルは、内視鏡画像の診断支援サービスを提供される医療施設に配布される。このとき医療施設は、所有している内視鏡の種類に対応する学習済みの専用モデル５２と、共通モデル５４とを取得して、内視鏡画像の認識処理を実施してよい。なお医療施設は、クラウドサービスを利用して学習済みモデルによる認識処理を実施してもよい。

１・・・情報処理装置、１０・・・受付部、２０・・・処理部、２２・・・学習部、２４・・・認識部、３０・・・モデル生成部、３２・・・モデル選択部、３４・・・モデル結合部、４０・・・ＮＮシステム、５０・・・記憶装置、５２・・・専用モデル、５２ａ・・・第１専用モデル、５２ｂ・・・第２専用モデル、５２ｃ・・・第３専用モデル、５２ｎ・・・第ｎ専用モデル、５４・・・共通モデル。

　本発明は、学習に関する技術分野に利用できる。

Claims

　第１のデバイスにより取得された第１データに含まれる特徴を学習する第１専用モデルと、
　第２のデバイスにより取得された第２データに含まれる特徴を学習する第２専用モデルと、
　前記第１データと前記第２データに含まれる特徴を学習する共通モデルと、
　入力データを受け付ける受付部と、
　前記入力データを取得したデバイスを特定するデバイス識別情報にもとづいて、学習する専用モデルを選択するモデル選択部と、
　前記入力データを用いて、選択された専用モデルと前記共通モデルとを結合した学習モデルに学習させる学習部と、
　を備えることを特徴とする情報処理装置。
　前記第１専用モデルは、前記第１デバイスの特性が前記第１データに反映された特徴を学習し、
　前記第２専用モデルは、前記第２デバイスの特性が前記第２データに反映された特徴を学習し、
　前記共通モデルは、前記第１データと前記第２データに共通の特徴を学習する、
　ことを特徴とする請求項１に記載の情報処理装置。
　前記第１専用モデル、前記第２専用モデル、前記共通モデルのそれぞれは、ニューラルネットワークとして形成される、
　ことを特徴とする請求項１に記載の情報処理装置。
　前記学習モデルにおいて、前記第１専用モデルまたは前記第２専用モデルは、前記共通モデルよりも入力側に配置される、
　ことを特徴とする請求項３に記載の情報処理装置。
　前記第１専用モデルまたは前記第２専用モデルの出力は、前記共通モデルの入力に結合される、
　ことを特徴とする請求項４に記載の情報処理装置。
　前記第１専用モデルおよび前記第２専用モデルは、同じネットワーク構成を有する、
　ことを特徴とする請求項３に記載の情報処理装置。
　入力データを受け付ける受付部と、
　前記入力データを取得したデバイスにより取得された複数のデータに含まれる特徴を学習した専用モデルと、複数のデバイスにより取得された複数のデータに含まれる特徴を学習した共通モデルとを結合した結合モデルを用いて、前記入力データを認識する認識部と、
　を備えることを特徴とする情報処理装置。
　前記受付部は、前記入力データを取得したデバイスを特定するデバイス識別情報を受け付ける、
　ことを特徴とする請求項７に記載の情報処理装置。
　複数のデバイスのそれぞれに対応する前記専用モデルを記憶する記憶装置と、
　前記受付部が受け付けたデバイス識別情報をもとに、前記記憶装置から、使用する専用モデルを選択するモデル選択部と、
　選択された前記専用モデルと、前記共通モデルとを結合するモデル結合部と、
　をさらに備えることを特徴とする請求項８に記載の情報処理装置。
　第１のデバイスにより取得された第１データを用いて、第１専用モデルと共通モデルとを結合した学習モデルに学習させるステップと、
　第２のデバイスにより取得された第２データを用いて、第２専用モデルと前記共通モデルとを結合した学習モデルに学習させるステップと、
　を有するモデル学習方法。
　コンピュータに、
　第１のデバイスにより取得された第１データを用いて、第１専用モデルと共通モデルとを結合した学習モデルに学習させる機能と、
　第２のデバイスにより取得された第２データを用いて、第２専用モデルと前記共通モデルとを結合した学習モデルに学習させる機能と、
　を実現させるためのプログラム。
　入力データを受け付けるステップと、
　前記入力データを取得したデバイスにより取得された複数のデータに含まれる特徴を学習した専用モデルと、複数のデバイスにより取得された複数のデータに含まれる特徴を学習した共通モデルとを結合した結合モデルを用いて、前記入力データを認識するステップと、
　を有するデータ認識方法。
　コンピュータに、
　入力データを受け付ける機能と、
　前記入力データを取得したデバイスにより取得された複数のデータに含まれる特徴を学習した専用モデルと、複数のデバイスにより取得された複数のデータに含まれる特徴を学習した共通モデルとを結合した結合を用いて、前記入力データを認識する機能と、
　を実現させるためのプログラム。
　入力データをコンピュータに認識させるための学習済みモデルであって、
　第１のデバイスにより取得された第１データに含まれる特徴を学習済みの第１専用モデルと、
　第２のデバイスにより取得された第２データに含まれる特徴を学習済みの第２専用モデルと、
　前記第１データと前記第２データに含まれる特徴を学習済みの共通モデルと、を備え、
　当該コンピュータに、入力データが入力されると、
　前記入力データを取得したデバイスを特定するデバイス識別情報にもとづいて、学習する専用モデルを選択する機能と、
　選択した前記専用モデルと、前記共通モデルとを結合した結合モデルを生成する機能と、
　前記結合モデルを用いて、前記入力データを認識する機能と、
　を実現させるための学習済みモデル。