WO2022209435A1

WO2022209435A1 - コンピュータプログラム、モデル生成方法、推定方法及び推定装置

Info

Publication number: WO2022209435A1
Application number: PCT/JP2022/007299
Authority: WO
Inventors: 温史池上; 悟史中村
Original assignee: 古野電気株式会社
Priority date: 2021-03-31
Filing date: 2022-02-22
Publication date: 2022-10-06
Also published as: JPWO2022209435A1; EP4317910A1; CL2023002753A1; CN117178161A

Abstract

【課題】水中生物のサイズを推定することができるコンピュータプログラム、モデル生成方法、推定方法及び推定装置を提供する。【解決手段】コンピュータプログラムは、コンピュータに、水中生物を撮像した画像データを取得し、画像データを入力した場合に水中生物の所定部位の位置データを出力する第１学習モデルに、取得した画像データを入力して、撮像された水中生物の所定部位の位置データを取得し、画像データを入力した場合に水中生物のセグメンテーション画像を生成する生成モデルに、取得した画像データを入力して、撮像された水中生物のセグメンテーション画像を生成し、所定部位の位置データ及びセグメンテーション画像に基づいて、撮像された水中生物のサイズを推定する、処理を実行させる。

Description

コンピュータプログラム、モデル生成方法、推定方法及び推定装置

　本発明は、コンピュータプログラム、モデル生成方法、推定方法及び推定装置に関する。

　生簀内の養殖魚のサイズは、給餌量や水揚げ時期を決定する重要な情報である。従来、水中での魚体長計測自動化のため複数の解析サービスが提供されている。これらのサービスは、魚体の複数の特徴点を抽出し、特徴点間（例えば、口端と尾叉との間）の距離を計測することで測長を行っている。

　特許文献１には、魚が撮影されている撮影画像から魚の２つの特徴部位（口と尾鰭）を検出し、検出した特徴部位間の長さに基づいて魚のサイズを算出する情報処理装置が開示されている。

国際公開第２０１８／０６１９２５号

　しかし、魚の体高計測に最適な部位は、必ずしも特徴があると限らないため、計測精度や生物学的な安定性の面において、精度よく体高を計測することできず、魚などの水中生物のサイズを推定することが困難である。

　本発明は、斯かる事情に鑑みてなされたものであり、水中生物のサイズを推定することができるコンピュータプログラム、モデル生成方法、推定方法及び推定装置を提供することを目的とする。

　本発明に係るコンピュータプログラムは、コンピュータに、水中生物を撮像した画像データを取得し、画像データを入力した場合に水中生物の所定部位の位置データを出力する第１学習モデルに、取得した画像データを入力して、前記撮像された水中生物の所定部位の位置データを取得し、画像データを入力した場合に水中生物のセグメンテーション画像を生成する生成モデルに、取得した画像データを入力して、前記撮像された水中生物のセグメンテーション画像を生成し、前記所定部位の位置データ及び前記セグメンテーション画像に基づいて前記撮像された水中生物のサイズを推定する、処理を実行させる。

　本発明に係るコンピュータプログラムは、コンピュータに、画像データを入力した場合に水中生物の第１位置データ及び前記水中生物の所定部位の第２位置データを出力する第２学習モデルに、取得した画像データを入力して、前記第１位置データ及び前記第２位置データを出力し、前記第１学習モデルには、前記第２位置データを含む第２領域の画像データを入力し、前記生成モデルには、前記第１位置データを含む第１領域の画像データを入力する、処理を実行させる。

　本発明に係るコンピュータプログラムは、前記所定部位は、尾鰭及び吻端を含み、コンピュータに、前記尾鰭と前記吻端とを結ぶ直線と直交する直線に基づいて体高を算出する、処理を実行させる。

　本発明に係るコンピュータプログラムは、コンピュータに、ステレオカメラによって撮像された画像データを前記第１学習モデルに入力して、取得した所定部位の位置データに基づいて吻端及び尾叉の３次元位置を算出し、算出した３次元位置に基づいて体高補助線を生成し、生成した体高補助線を前記セグメンテーション画像上に２次元投影して体高を算出する、処理を実行させる。

　本発明に係るコンピュータプログラムは、コンピュータに、前記吻端又は前記尾叉の位置から、前記吻端と前記尾叉の距離の所定割合の位置にある前記体高補助線を用いて前記体高を算出する、処理を実行させる。

　本発明に係るコンピュータプログラムは、コンピュータに、ステレオカメラによって撮像された複数のフレームそれぞれの画像データを前記第１学習モデルに入力して、取得した所定部位の位置データに基づいてフレーム毎の尾叉の３次元位置を算出し、算出した尾叉の３次元位置に基づいてフレーム毎に尾叉の変位を特定し、特定した変位に基づいて、前記水中生物のサイズを推定するためのフレームを選択する、処理を実行させる。

　本発明に係るコンピュータプログラムは、コンピュータに、前記第１学習モデルが出力する位置データに基づいて、尾鰭又は吻端の推定位置を表示し、表示した尾鰭又は吻端の推定位置の修正を受け付け、受け付けた修正位置と、前記修正位置を受け付けた際の画像データとに基づいて、前記第１学習モデルを再学習する、処理を実行させる。

　本発明に係るコンピュータプログラムは、コンピュータに、前記生成モデルが生成したセグメンテーション画像を表示し、表示したセグメンテーション画像の修正を受け付け、修正されたセグメンテーション画像と、前記修正を受け付けた際の画像データとに基づいて、前記生成モデルを再学習する、処理を実行させる。

　本発明に係るコンピュータプログラムは、コンピュータに、生簀内で養殖されている前記水中生物の画像に尾叉長又は体高を付して表示する、処理を実行させる。

　本発明に係るコンピュータプログラムは、コンピュータに、生簀内で養殖されている複数の水中生物の推定したサイズの精度を複数のランクに区分し、区分したランク毎の水中生物の数を表示する、処理を実行させる。

　本発明に係るコンピュータプログラムは、コンピュータに、生簀内で養殖されている複数の水中生物の尾叉長及び体高の少なくとも一方を含むサイズの分布を表示する、処理を実行させる。

　本発明に係るモデル生成方法は、水中生物を撮像した画像データ、及び前記水中生物の所定部位の位置データを含む第１訓練データを取得し、前記画像データ、及び前記水中生物のセグメンテーション画像を含む第２訓練データを取得し、前記第１訓練データに基づいて、水中生物を撮像した画像データを入力した場合に、前記水中生物の所定部位の位置データを出力するように第１学習モデルを生成し、前記第２訓練データに基づいて、水中生物を撮像した画像データを入力した場合に、前記水中生物のセグメンテーション画像を生成するように生成モデルを生成する。

　本発明に係るモデル生成方法は、水中生物を撮像した画像データ、前記水中生物の第１位置データ及び前記水中生物の所定部位の第２位置データを含む第３訓練データを取得し、前記第３訓練データに基づいて、水中生物を撮像した画像データを入力した場合に、前記水中生物の第１位置データ及び前記水中生物の所定部位の第２位置データを出力するよ
うに第２学習モデルを生成する。

　本発明に係る推定方法は、水中生物を撮像した画像データを取得し、画像データを入力した場合に水中生物の所定部位の位置データを出力する第１学習モデルに、取得した画像データを入力して、前記撮像された水中生物の所定部位の位置データを取得し、画像データを入力した場合に水中生物のセグメンテーション画像を生成する生成モデルに、取得した画像データを入力して、前記撮像された水中生物のセグメンテーション画像を生成し、前記所定部位の位置データ及び前記セグメンテーション画像に基づいて前記撮像された水中生物のサイズを推定する。

　本発明に係る推定装置は、水中生物を撮像した画像データを取得する第１取得部と、画像データを入力した場合に水中生物の所定部位の位置データを出力する第１学習モデルに、前記第１取得部で取得した画像データを入力して、前記撮像された水中生物の所定部位の位置データを取得する第２取得部と、画像データを入力した場合に水中生物のセグメンテーション画像を生成する生成モデルに、前記第１取得部で取得した画像データを入力して、前記撮像された水中生物のセグメンテーション画像を生成する生成部と、前記所定部位の位置データ及び前記セグメンテーション画像に基づいて前記撮像された水中生物のサイズを推定する推定部とを備える。

　本発明によれば、水中生物のサイズを推定することができる。

本実施の形態の推定装置の構成の一例を示すブロック図である。ＡＩ部の構成の一例を示す模式図である。魚のサイズの推定の流れを示す模式図である。第２学習モデルの構成の一例を示す模式図である。第１学習モデルの構成の一例を示す模式図である。生成モデルの構成の一例を示す模式図である。各モデルの機械学習による生成方法の一例を示す模式図である。カメラ間の魚枠ペアリングの一例を示す模式図である。魚枠及び部位枠のペアリストの一例を示す図である。魚と部位のペアリングの一例を示す模式図である。魚リストの一例を示す図である。追尾部の構成の一例を示すブロック図である。テールビート除去部の構成の一例を示すブロック図である。尾叉軌道の近似直線の一例を示す模式図である。計測部の構成の一例を示すブロック図である。体高計測の一例を示す模式図である。魚のサイズの自動計測の一例を示す模式図である。推定結果ＤＢの構成の一例を示す模式図である。本実施の形態の推定装置の構成の他の例を示すブロック図である。推定結果の第１表示例を示す模式図である。誤差の要因の一例を示す模式図である。推定結果の第２表示例を示す模式図である。推定結果の第３表示例を示す模式図である。推定結果の第４表示例を示す模式図である。推定装置の処理手順の一例を示すフローチャートである。推定装置の処理手順の一例を示すフローチャートである。

　以下、本発明の実施の形態について説明する。図１は本実施の形態の推定装置１００の構成の一例を示すブロック図である。推定装置１００は、入力部１０、ＡＩ部２０、ペアリング部３０、追尾部４０、テールビート除去部５０、計測部６０、推定部としての推定部７０、及び出力部８０を備える。

　カメラ部２００は、例えば、生簀内の水中の所定位置に設置される防水型のステレオカメラである。カメラ部２００は、生簀内を泳ぐ魚などの水中生物を撮像することができる。なお、カメラ部２００は、単眼カメラであってもよい。なお、カメラに代えて、他の撮像デバイスでもよい。以下では、水中生物の例として魚を挙げて説明する。カメラ部２００は、撮像画像データ（動画）を出力する。撮像画像データは、複数のフレーム単位の画像（フレーム画像）で構成されている。

　推定装置１００は、パーソナルコンピュータ等でもよく、インターネット上のサーバ（クラウド）でもよい。推定装置１００がパーソナルコンピュータ等の場合は、推定装置１００は、カメラ部２００から直接、撮像画像データを取得してもよい。推定装置１００が、インターネット上のサーバの場合、推定装置１００は、クライアント端末装置（不図示）などを介してカメラ部２００で撮像された撮像画像データを取得することができる。

　入力部１０は、カメラ部２００で撮像された撮像画像データを取得する。入力部１０は、取得した撮像画像データをＡＩ部２０へ出力する。

　ＡＩ部２０は、機械学習によって生成されたモデルであり、撮像画像データに基づいて魚のサイズの推定に必要なデータを出力する。魚のサイズは、例えば、尾叉長及び体高である。以下、ＡＩ部２０について具体的に説明する。尾叉長は、体長であり、具体的には、魚の上アゴの先端（吻端）から尾鰭が二叉した中央部の最もへこんだ部分（尾叉）までの長さをいう。体高は、魚の背縁から腹縁までの垂直方向の距離であり、具体的には、腹鰭の付け根から背縁までの距離である。

　図２はＡＩ部２０の構成の一例を示す模式図である。ＡＩ部２０は、第２取得部としての第１学習モデル２１、生成部として生成モデル２２、第２学習モデル２３及び第１取得部としての画像切出部２４を備える。推定部７０は、第１学習モデル２１が出力する部位の位置データ、及び生成モデル２２が出力する魚のセグメンテーション画像データに基づいて魚のサイズを推定することができる。この場合、カメラ部２００は、単眼カメラでもよい。

　第２学習モデル２３は、撮像画像データを入力した場合に、単体魚の位置データ（水中生物の第１位置データ）、及び部位の位置データ（当該水中生物の所定部位の第２位置データ）を出力するように機械学習を行って生成されている。第２学習モデル２３が出力する位置データは、撮像画像上の座標（ｘ、ｙ）又は領域（ｘ、ｙ、width、height）であ
る。

　画像切出部２４は、第２学習モデル２３が出力した単体魚の位置データ（座標又は領域）に基づいて、当該座標又は領域を含む周辺領域の画像を切り出して、単体魚画像データを取得する。単体魚画像には、魚全体の画像が含まれる。画像切出部２４は、第２学習モデル２３が出力した部位の位置データ（座標又は領域）に基づいて、当該座標又は領域を含む周辺領域の画像を切り出して、部位画像データを取得する。部位画像には、魚の所定部位の画像が含まれる。画像切出部２４は、単体魚画像データを生成モデル２２へ出力し、部位画像データを第１学習モデル２１へ出力する。なお、画像切出部２４を、ＡＩ部２０の外部に設けてもよい。

　第１学習モデル２１は、画像切出部２４が出力した部位画像データを入力した場合に、部位の位置データを出力するように機械学習を行って生成されている。生成モデル２２は、画像切出部２４が出力した単体魚画像データを入力した場合に、魚のセグメンテーション画像データを出力するように機械学習を行って生成されている。

　図３は魚のサイズの推定の流れを示す模式図である。図３では、便宜上、撮像画像に魚が１匹映っているものとする。前述のとおり、第２学習モデル２３は、画像切出部２４と協働して、撮像画像データを入力した場合に、単体魚画像データ（第１位置データを含む第１領域の画像データ）、及び部位画像データ（第２位置データを含む第２領域の画像データ）を出力する。図３に示すように、単体魚画像は、単体の魚全体を囲む矩形領域の画像である。単体魚画像データは、矩形領域データと、矩形領域内のクラス（例えば、魚）とを含むデータである。部位画像は、所定部位としての吻端Ｐ１を含む吻端画像、及び所定部位としての尾鰭（尾叉でもよい）Ｐ２を含む尾鰭画像である。部位画像データは、矩形領域データと、矩形領域内のクラス（例えば、吻端及び尾鰭）とを含むデータである。

　第１学習モデル２１は、部位画像データを入力した場合に、部位の位置データを出力する。部位の位置データは、吻端Ｐ１の位置データ、及び尾鰭Ｐ２の位置データであり、画像上の座標である。画像の座標系をＸＹとすると、位置データは座標（ｘ、ｙ）又は領域（ｘ、ｙ、width、height）で表すことができる。なお、この場合、カメラの光軸方向の
座標はＺで表すことができる。

　生成モデル２２は、単体魚画像データを入力した場合に、セグメンテーション画像データを出力する。セグメンテーション画像は、単体魚画像の各画素（ピクセル）のクラスを分類したものであり、図３の例では、「鰭を除く魚体」に分類されたピクセルを「模様なし」とし、「魚体以外」に分類されたピクセルを「模様あり」で表している。セグメンテーション画像により、魚体と魚体以外の境界（魚体の輪郭線）を求めることができる。

　推定部７０は、部位の位置データ、及びセグメンテーション画像データに基づいて魚のサイズを推定することができる。図３に示すように、吻端Ｐ１と尾鰭Ｐ２とを結ぶ直線Ｌの長さを尾叉長として推定できる。また、直線Ｌに直交する直線Ｈと魚体の輪郭線との交点間の長さを体高として推定できる。ここで、直線Ｈと直線Ｌとの交点の位置は、吻端Ｐ１の位置から直線Ｌ上の所定割合の点（例えば、尾叉長の４０％など）とすることができる。

　上述のように、所定部位（吻端及び尾鰭）の位置データとセグメンテーション画像とを組み合わせ、尾叉長を表す直線と直交する体高直線Ｈとセグメンテーション画像とに基づいて体高計測を実施することができるので、体高計測に最適な特徴部位がない場合でも、安定して高精度に魚のサイズを推定することができる。

　なお、後述のペアリング部３０以降の処理を行うことにより、体高計測をさらに高精度に行うことができる。

　図４は第２学習モデル２３の構成の一例を示す模式図である。第２学習モデル２３は、例えば、Ｆａｓｔｅｒ　Ｒ－ＣＮＮ（Convolutional Neural Network）で構成することができる。第２学習モデル２３は、ＣＮＮ層２３１、領域提案ネットワーク（ＲＰＮ）２３２、ＲＯＩ（Region-of-Interest）　ＰＯＯＬ２３３、及び識別ネットワーク２３４を備える。ＣＮＮ層２３１は、入力された撮像画像データから画像特徴量（特徴マップ）を生成して、領域提案ネットワーク（ＲＰＮ）２３２、及びＲＯＩ　ＰＯＯＬ２３３へ出力する。

　領域提案ネットワーク（ＲＰＮ）２３２は、入力された画像特徴量から候補領域を計算してＲＯＩ　ＰＯＯＬ２３３へ出力する。領域提案ネットワーク（ＲＰＮ）２３２は、撮像画像のどこに物体が映っているのか、すなわち、物体が映っている領域と、その矩形の形を検出することができる。

　ＲＯＩ　ＰＯＯＬ２３３は、ＣＮＮ層２３１から出力される画像特徴量と、領域提案ネットワーク（ＲＰＮ）２３２から出力される候補領域とを繋ぎ、固定長のＲＯＩ領域特徴を識別ネットワーク２３４へ出力する。

　識別ネットワーク２３４は、入力されたＲＯＩ領域特徴から、正確な領域・クラスを再計算して、領域と、その領域のクラスを分類して出力する。ここで、クラスは、単体魚、吻端、及び尾鰭である。第２学習モデル２３は、Ｆａｓｔｅｒ　Ｒ－ＣＮＮに限定されるものではなく、例えば、Ｒ－ＣＮＮ、Ｍａｓｋ　Ｒ－ＣＮＮ、ＹＯＬＯ（You Only Look Once）、ＳＳＤ（Single Shot Multibox Detector）等であってもよい。

　図５は第１学習モデル２１の構成の一例を示す模式図である。第１学習モデル２１は、例えば、ＲｅｔｉｎａＮｅｔで構成することができる。第１学習モデル２１は、Ｆｅａｔｕｒｅ　Ｐｙｒａｍｉｄ　Ｎｅｔｗｏｒｋ２１１、クラス分類器２１２、及び領域回帰器２１３を備える。第２学習モデル２３が出力した部位画像データは、第１学習モデル２１に入力される。部位画像データは、尾鰭の画像データ及び吻端の画像データを含む。Ｆｅａｔｕｒｅ　Ｐｙｒａｍｉｄ　Ｎｅｔｗｏｒｋ２１１は、ボトムアップの方向では、様々なスケールの特徴マップを構成する特徴階層を算出し、トップダウンの方向では、空間的には粗いが意味的には強い高層からの特徴マップをアップサンプリングして高解像の特徴を生成する。各特徴は、ボトムアップの方向で算出された特徴と結び付けられている。

　このように、Ｆｅａｔｕｒｅ　Ｐｙｒａｍｉｄ　Ｎｅｔｗｏｒｋ２１１は、高次・低次の両方の特性を持つ特徴量を抽出することができ、意味と位置の両方のバランスの良い精度を実現できる。

　領域回帰器２１３は、吻端の位置、及び尾鰭の位置を出力する。吻端及び尾鰭の位置は画像上の座標値で表される。クラス分類器２１２は、領域回帰器２１３が出力する位置（座標値）のクラス（吻端、及び尾鰭）を特定する。第１学習モデル２１により、吻端の画像上での吻端の位置を精度よく求めることができ、尾鰭の画像上での尾鰭の位置を精度よく求めることができる。第１学習モデル２１は、ＲｅｔｉｎａＮｅｔに限定されるものではなく、例えば、ＳｅｇＮｅｔ、Ｍａｓｋ　Ｒ－ＣＮＮ、ＳＶＭ（Support Vector Machine）等であってもよい。

　図６は生成モデル２２の構成の一例を示す模式図である。生成モデル２２は、例えば、Ｕ－Ｎｅｔで構成することができる。生成モデル２２は、エンコーダ２２１～２２５、デコーダ２２６～２２９を備える。生成モデル２２は、入力された単体魚画像データに対して、エンコーダ２２１～２２５で畳み込み処理を繰り返す。エンコーダ２２５で畳み込まれた画像をデコーダ２２６～２２９でアップサンプリング（逆畳み込み）処理を繰り返す。畳み込まれた画像をデコードする際に、エンコーダ２２４～２２１で生成した特徴マップを逆畳み込み処理を行う画像に足し合わせる処理を行う。生成モデル２２は、入力された単体魚画像上の魚体のセグメンテーション画像を出力する。セグメンテーション画像により、魚体と魚体以外の境界（魚体の輪郭線）を求めることができる。

　これにより、畳み込み処理によって失われる位置情報を保持することができ、より精度の高いセグメンテーション（いずれのピクセルがいずれのクラスであるか）を出力するこ
とができる。生成モデル２２は、Ｕ－Ｎｅｔに限定されるものではなく、例えば、ＧＡＮ（Generative Adversarial Network）、ＳｅｇＮｅｔ等でもよい。

　図７は各モデルの機械学習による生成方法の一例を示す模式図である。図７Ａは、第２学習モデル２３の生成方法を示す。第２学習モデル２３は、学習用入力データとして撮像画像データを入力した場合、単体魚の位置データ（第１位置データ）、及び部位の位置データ（第２位置データ）を出力するように機械学習を行って生成することができる。この場合、教師データは、学習用入力データである撮像画像データに基づいてアノテーションを行って作成した単体魚の位置データ、及び部位の位置データを用いる。学習用データと教師データは、多数用意しておき、第２学習モデル２３を機械学習する。出力データが教師データに近づくように、第２学習モデル２３の内部パラメータを更新して第２学習モデル２３を生成することができる。

　図７Ｂは、第１学習モデル２１の生成方法を示す。第１学習モデル２１は、学習用入力データとして部位画像データを入力した場合、部位の位置データを出力するように機械学習を行って生成することができる。この場合、教師データは、学習用入力データである部位画像データに基づいてアノテーションを行って作成した部位の位置データを用いる。学習用データと教師データは、多数用意しておき、第１学習モデル２１を機械学習する。出力データが教師データに近づくように、第１学習モデル２１の内部パラメータを更新して第１学習モデル２１を生成することができる。

　図７Ｃは、生成モデル２２の生成方法を示す。生成モデル２２は、学習用入力データとして単体魚画像データを入力した場合、セグメンテーション画像データを出力するように機械学習を行って生成することができる。この場合、教師データは、学習用入力データである単体魚画像データに基づいてアノテーションを行って作成したセグメンテーション画像データを用いる。学習用データと教師データは、多数用意しておき、生成モデル２２を機械学習する。出力データが教師データに近づくように、生成モデル２２の内部パラメータを更新して生成モデル２２を生成することができる。

　前述の各モデルは再学習させることもできる。例えば、図３に示すような、第１学習モデル２１が出力する位置データに基づいて、尾鰭及び吻端の推定位置を画面上に表示し、表示した尾鰭及び吻端の推定位置を修正する操作を受け付ける。推定位置の修正は、例えば、マウス等を操作して画面上のポインタを推定位置に移動させ、所定の操作（タッチ、クリック、ドラッグ・アンド・ドロップ等）を行うことにより、画面上で推定位置を正しい位置に移動させることができる。受け付けた修正位置と、修正位置を受け付けた際の画像データとを訓練データとして用意し、受け付けた修正位置と、修正位置を受け付けた際の画像データとに基づいて、第１学習モデル２１を再学習することができる。これにより、第１学習モデル２１が出力する位置データの精度が向上する。

　また、図３に示すような、生成モデル２２が生成したセグメンテーション画像を画面上に表示し、表示したセグメンテーション画像を修正する操作を受け付ける。セグメンテーション画像の修正は、例えば、ペイントソフト等のアプリケーションを起動して、セグメンテーション画像を画面上に表示させ、マウス等を操作して画面上のポインタを所要位置に移動させ、所定の操作（タッチ、クリック、ドラッグ・アンド・ドロップ等）を行うことにより、魚体以外の画素を魚体の画素に変換し、あるいは魚体の画素を魚体以外の画素に変換することにより行うことができる。修正されたセグメンテーション画像と、修正を受け付けた際の画像データとを訓練データとして用意し、修正されたセグメンテーション画像と、修正を受け付けた際の画像データとに基づいて、生成モデル２２を再学習することができる。これにより、生成モデル２２が生成するセグメンテーション画像の精度が向上する。

　また、第２学習モデル２３が出力する単体魚の位置データ、吻端の位置データ、及び尾鰭の位置データを画面上に表示し、表示した位置データを修正する操作を受け付ける。なお、この場合、作業性や視認性の向上の観点から、単体魚の位置、吻端の位置、及び尾鰭の位置をそれぞれ含む切出画像（単体魚画像、吻端画像、尾鰭画像）を当該位置とともに画面上に表示してもよい。単体魚の位置データを修正する場合には、第２学習モデル２３が出力する単体魚の位置を画面上に表示し、表示した単体魚の位置を修正する操作を受け付ける。単体魚の位置の修正は、例えば、マウス等を操作して画面上の単体魚の位置を移動させて当該位置を修正すればよい。吻端の位置を修正する場合には、第２学習モデル２３が出力する吻端の位置を画面上に表示し、表示した吻端の位置を修正する操作を受け付ける。吻端の位置の修正は、例えば、マウス等を操作して画面上の吻端の位置を移動させて当該位置を修正すればよい。尾鰭の位置を修正する場合には、第２学習モデル２３が出力する尾鰭の位置を画面上に表示し、表示した尾鰭の位置を修正する操作を受け付ける。尾鰭の位置の修正は、例えば、マウス等を操作して画面上の尾鰭の位置を移動させて当該位置を修正すればよい。また、吻端と尾鰭の位置データとして、第１学習モデル２１を再学習するために修正した位置データを用いることもできる。

　修正された単体魚の位置と、修正を受け付けた際の画像データとを訓練データとして用意し、修正された単体魚の位置と、修正を受け付けた際の画像データとに基づいて、第２学習モデル２３を再学習することができる。修正された吻端の位置と、修正を受け付けた際の画像データとを訓練データとして用意し、修正された吻端の位置と、修正を受け付けた際の画像データとに基づいて、第２学習モデル２３を再学習することができる。同様に、修正された尾鰭の位置と、修正を受け付けた際の画像データとを訓練データとして用意し、修正された尾鰭の位置と、修正を受け付けた際の画像データとに基づいて、第２学習モデル２３を再学習することができる。これにより、第２学習モデル２３が出力する単体魚の位置データ及び部位の位置データの精度が向上する。

　次に、体高計測の精度をさらに高める方法について説明する。以下、ペアリング処理、追尾処理、テールビート除去処理、及び体高計測処理について順番に説明する。なお、カメラ部２００は、ステレオカメラであるとする。

　ペアリング部３０は、カメラ間のペアリング処理、及び魚と部位との間のペアリング処理を行う。まず、カメラ間のペアリング処理について説明する。カメラ間のペアリング処理は、魚枠ペアリング、及び部位枠ペアリングを含む。

　図８はカメラ間の魚枠ペアリングの一例を示す模式図である。図８において、左側識別画像は、ステレオカメラの左側のカメラで撮像した撮像画像に基づいて推定された単体魚画像が映っている画像であり、右側識別画像は、ステレオカメラの右側のカメラで撮像した撮像画像に基づいて推定された単体魚画像（魚枠とも称する）が映っている画像である。図８の例では、それぞれ３つの魚枠を図示しているが、実際の画像では、魚枠の数は３つに限定されない。左右方向（水平方向）にステレオカメラを配置する構成に代えて、上下方向に配置してもよく、あるいは、斜め方向（例えば、水平方向に対して０度より大きく９０度未満の角度）に配置してもよい。

　ペアリング部３０は、左右の識別画像内の全ての魚枠について、総当たりでペアリングを実施する。図８の例では、左側識別画像の魚枠Ｇ１と、右側識別画像内の全ての魚枠Ｇ４、Ｇ５、Ｇ６との間でペアリングを行う。ペアリングの際には、許容誤差範囲内で最も近いペアを選択する。図８の例では、魚枠Ｇ１に対して、魚枠Ｇ６が最も近いペアとして選択される。同様に、左側識別画像の魚枠Ｇ２、Ｇ３についても、対応するペアを右側識別画像内の魚枠から選択する。

　なお、図示していないが、部位枠ペアリングも魚枠ペアリングと同様に行うことができる。ペアリング部３０は、左右の識別画像内の全ての部位枠について、総当たりでペアリングを実施する。左側識別画像の部位枠と、右側識別画像内の全ての部位枠との間でペアリングを行う。ペアリングの際には、許容誤差範囲内で最も近いペアを選択する。

　図９は魚枠及び部位枠のペアリストの一例を示す図である。図９Ａは魚枠ペアリストを示し、図９Ｂは部位枠ペアリストを示す。図９Ａに示すように、左側識別画像の魚枠Ｇ１と右側識別画像の魚枠Ｇ６とがペアとなっている。同様に、左側識別画像の魚枠Ｇ２と右側識別画像の魚枠Ｇ４とがペアとなり、左側識別画像の魚枠Ｇ３と右側識別画像の魚枠Ｇ５とがペアとなっている。

　図９Ｂに示すように、左側識別画像の部位枠ｇ１と右側識別画像の部位枠ｇ１２とがペアとなり、左側識別画像の部位枠ｇ２と右側識別画像の部位枠ｇ１０とがペアとなり、左側識別画像の部位枠ｇ３と右側識別画像の部位枠ｇ８とがペアとなっている。他の部位も同様である。

　図１０は魚と部位のペアリングの一例を示す模式図である。前述のカメラ間のペアリングによって、魚枠Ｇ１～Ｇ３、部位枠ｇ１～ｇ６がペアリングされたとする。なお、魚枠Ｇ１～Ｇ３、部位枠ｇ１～ｇ６は、それぞれペアとなる魚枠、部位枠が存在する。図１０は、ペアリングされた魚枠及び部位枠の一方側（例えば、左側識別画像）を図示したものである。

　ペアリング部３０は、識別画像内の全ての魚枠と部位枠について、総当たりでペアリングを実施する。この場合、ペアリングは、左側識別画像のみ、右側識別画像のみ、あるいは左右の両識別画像を用いて行うことができる。図１０の例では、魚枠Ｇ１と、識別画像内の全ての部位枠ｇ１～ｇ６との間でペアリングを行う。ペアリングの際には、許容誤差範囲内で最も近いペアを選択する。他の魚枠Ｇ２、Ｇ３についても同様の処理を行う。

　図１１は魚リストの一例を示す図である。図１１に示すように、魚枠Ｇ１と部位枠ｇ３、ｇ４とがペアとなっている。同様に、魚枠Ｇ２と部位枠ｇ１、ｇ２とがペアとなり、魚枠Ｇ３と部位枠ｇ５、ｇ６とがペアとなる。すなわち、ＩＤが１の魚は、魚枠Ｇ１と部位枠ｇ３、ｇ４とがペアとなり、ＩＤが２の魚は、魚枠Ｇ２と部位枠ｇ１、ｇ２とがペアとなり、ＩＤが３の魚は、魚枠Ｇ３と部位枠ｇ５、ｇ６とがペアとなっている。

　上述の構成により、例えば、生簀内を撮像して得られた複数の魚それぞれの魚枠と部位枠とが対応付けることができる。

　図１２は追尾部４０の構成の一例を示すブロック図である。追尾部４０は、生簀内を泳ぐ魚を、フレーム間で追尾（トラッキング）を行う。追尾を行うことにより、魚のダブルカウントを防止できる。追尾部４０は、２Ｄ追尾部４１、３Ｄ変換部４２、及び３Ｄ追尾部４３を備える。

　２Ｄ追尾部４１は、ペアリング部３０で生成された魚枠ペアリスト、部位枠ペアリスト、及び魚リストを用いて各魚の追尾を行う。２Ｄ追尾部４１は、魚の２Ｄ画像に基づいて追尾を行う。

　３Ｄ変換部４２は、ペアリング部３０で生成された魚枠ペアリスト、部位枠ペアリスト、及び魚リストに基づいて、左側のカメラで撮像して得られた単体魚画像、右側のカメラで撮像して得られた単体魚画像及びステレオカメラの測距原理を用いて魚の２Ｄ画像を３
Ｄ画像に変換する。または、吻端及び尾叉の３Ｄ位置を３点測量の原理に基づき計測してもよい。魚の２Ｄ画像の各画素までの距離Ｚは、Ｚ＝（Ｂ×Ｆ）／Ｄで算出することができる。ここで、Ｂはカメラ間距離であり、Ｆは焦点距離であり、Ｄは視差である。

　３Ｄ追尾部４３は、ペアリング部３０で生成された魚枠ペアリスト、部位枠ペアリスト、及び魚リストを用いて各魚の追尾を行う。３Ｄ追尾部４３は、魚の３Ｄ画像上の吻端の位置に基づいて追尾を行うことができる。これにより、魚が水中を泳ぐ際の魚のテールビートの影響を低減できる。

　図１３はテールビート除去部５０の構成の一例を示すブロック図である。テールビート除去部５０は、尾叉３Ｄ計測部５１、平面投影部５２、近似直線算出部５３、及びフレーム除去部５４を備える。

　尾叉３Ｄ計測部５１は、ペアリング部３０でペアリング済みの尾叉（尾鰭）の画像上の（Ｘ、Ｙ）座標から３Ｄ位置（Ｘ、Ｙ、Ｚ）を計測する。ここで、画像の横方向をＸ軸、縦方向をＹ軸、カメラの光軸方向をＺ軸とすることができる。

　平面投影部５２は、尾叉の３Ｄ位置をＸＺ平面に投影する。これにより、尾叉の位置を魚の背中側から見た位置にすることができる。平面投影部５２は、魚の背中側から見た尾叉の位置をフレーム毎に記録する。これにより、尾叉の位置をＸＺ平面上でプロットすることができる。

　近似直線算出部５３は、ＸＺ平面上でプロットされた尾叉の位置（尾叉軌道）の近似直線を算出する。

　フレーム除去部５４は、近似直線からの尾叉のずれが許容範囲を超える場合、当該尾叉に対応するフレームを除去する。尾叉の３Ｄ位置を平面に投影してから近似直線を算出する構成に代えて、尾叉の３Ｄ位置から３Ｄ空間上の近似線を算出してもよい。この場合、算出した３Ｄ的な近似線からの尾叉の３Ｄ位置のずれが許容範囲を超える場合、当該尾叉に対応するフレームを除去すればよい。

　図１４は尾叉軌道の近似直線の一例を示す模式図である。図１４において、横軸は尾叉の位置Ｘを示し、縦軸は尾叉の位置Ｚを示す。図１４中、Ｏは計測された尾叉の位置であり、符号ｔ１～ｔ１３は、フレームの時点を示し、破線の直線は、尾叉軌道の近似直線を示す。時刻ｔ１からｔ１３に亘って、尾叉の位置が推移する。図１４中、時刻ｔ３、ｔ７～ｔ９における尾叉の位置が近似直線からずれている。そこで、時刻ｔ３、ｔ７～９それぞれのフレームを除去し、残りの時刻ｔ１～ｔ２、ｔ４～ｔ６、ｔ１０～ｔ１３の各フレームを用いて、後述の体高計測を行う。尾叉の位置が近似直線からずれるのは、例えば、魚が進路を変えるため、尾叉が大きく変動するためであり、魚のサイズを推定する際の誤差の要因となるので、近似直線からの尾叉のずれが許容範囲を超える場合、当該尾叉に対応するフレームを除去する。なお、フレーム除去は、近似直線を用いた方法に限定されるものではなく、ＳＶＭ、ニューラルネットワーク、クラスタリング等の他の機械学習を用いてもよい。また、尾叉の位置の時間的な変化量が所定閾値を超えた場合、当該フレームを除去してもよい。

　テールビート除去部５０は、撮像フレームの中からテールビート除去したフレーム以外のフレームをテールビート除去済フレーム（計測対象フレーム）として計測部６０へ出力する。

　すなわち、推定装置１００は、ステレオカメラによって撮像された複数のフレームそれ
ぞれの画像データを第１学習モデル２１に入力して、取得した所定部位の位置データに基づいてフレーム毎の尾叉の３次元位置を算出し、算出した３次元位置を所定の２次元平面に投影してフレーム毎に尾叉の変位を特定し、特定した変位に基づいて、魚のサイズを推定するためのフレームを選択する。

　図１５は計測部６０の構成の一例を示すブロック図である。計測部６０は、最適フレーム選定部６１、吻端・尾叉３Ｄ計測部６２、体高補助線生成部６３、体高補助線投影部６４、及び体高計測部６５を備える。

　最適フレーム選定部６１は、尾叉軌道の近似直線に最も近い位置の尾叉に対応する時点のフレームを選定する。なお、最適なフレームを選定する構成に代えて、フレーム除去された残りのフレームの中からランダムに選定してもよく、あるいは、除去したフレームから数フレームだけ前又は後のフレームを選定してもよい。

　吻端・尾叉３Ｄ計測部６２は、選定されたフレームにおいて、吻端の３Ｄ位置、及び尾叉の３Ｄ位置を計測する。なお、３Ｄ計測は、３Ｄ追尾部４３で追尾した吻端の３Ｄ位置、及び尾叉３Ｄ計測部５１で計測した尾叉の３Ｄ位置を用いてもよい。

　体高補助線生成部６３は、３Ｄ計測された吻端の３Ｄ位置と尾叉の３Ｄ位置とを結ぶ３Ｄ直線を、例えば、１０分割するように、当該３Ｄ直線と直交する９本の体高補助線を生成する。

　体高補助線投影部６４は、体高補助線生成部６３で生成した体高補助線を２Ｄ平面（例えば、ＸＹ平面）に投影する。

　体高計測部６５は、２Ｄ平面に投影した体高補助線と魚体の輪郭（例えば、セグメンテーション画像上の輪郭）との交点位置に基づいて体高を計測する。なお、魚体の輪郭等に欠損があるために、体高を計測することができない場合、最適フレーム選定部６１は、尾叉軌道の近似直線に対して次に近い位置の尾叉に対応する時点のフレームを選定し、吻端・尾叉３Ｄ計測部６２、体高補助線生成部６３、体高補助線投影部６４、及び体高計測部６５の各処理を繰り返すことができる。魚体の輪郭等の欠損は、例えば、体高補助線と魚体の輪郭との交点間の距離と所定閾値とを比較して判定することができる。あるいは、隣接する体高補助線それぞれと魚体の輪郭との交点間の距離の変化量と所定閾値とを比較して判定することができる。欠損部分は補間処理してもよい。

　図１６は体高計測の一例を示す模式図である。図１６Ａに示すように、３Ｄ計測された吻端の３Ｄ位置と尾叉の３Ｄ位置とを結ぶ３Ｄ直線Ｌを、例えば、１０分割するように、３Ｄ直線Ｌと直交する９本の体高補助線Ａ１～Ａ９を生成する。

　図１６Ｂに示すように、９本の体高補助線Ａ１～Ａ９を２Ｄ平面（例えば、ＸＹ平面）に投影し、２Ｄ平面に投影した体高補助線Ａ１～Ａ９と魚体の輪郭（例えば、セグメンテーション画像上の輪郭）との交点位置に基づいて体高を計測する。具体的には、吻端から、尾叉長Ｌの４０％に相当する距離の体高補助線Ａ４が魚体の輪郭と交差する２つの位置の間の距離Ｈを体高として計測することができる。なお、体高補助線の数は一例であって、９本に限定されない。また、比率４０％は一例であって、４０％に限定されない。

　図１７は魚のサイズの自動計測の一例を示す模式図である。図１７には、各フレーム番号の画像それぞれに映っている魚のＩＤを図示している。例えば、フレーム１～１０に、魚ＩＤが０００１の魚が映っており、Ｏで示すフレーム７において、魚０００１のサイズが自動計測されている。自動計測により計測されたフレーム７は、フレーム１～１０の中
で、例えば、最もテールビートが小さいフレームである。

　同様に、フレーム３～１２に、魚ＩＤが０００２の魚が映っており、Ｏで示すフレーム９において、魚０００２のサイズが自動計測され、フレーム５～９に、魚ＩＤが０００３の魚が映っているが、魚０００３のサイズは自動計測されていない。また、フレーム７～１４に、魚ＩＤが０００４の魚が映っており、Ｏで示すフレーム１３において、魚０００４のサイズが自動計測され、フレーム８～１６に、魚ＩＤが０００５の魚が映っており、Ｏで示すフレーム１５において、魚０００５のサイズが自動計測されている。フレーム間の同一個体の認識は追尾部４０が行う。

　計測部６０は、計測結果を推定部７０に出力する。推定部７０は、自動計測された生簀内の魚の尾叉長及び体高を収集し、生簀内の魚のサイズを推定することができる。

　出力部８０は、推定部７０が推定した結果を表示可能なデータに変換して外部の端末装置や表示装置等に出力することができる。

　図１８は推定結果ＤＢ９０の構成の一例を示す模式図である。推定結果ＤＢ９０は、推定装置１００の内部に設けてもよく、推定装置１００からアクセス可能であれば、外部のデータサーバ等に設けてもよい。推定結果ＤＢ９０は、推定装置１００による推定結果を記憶しておくことができる。推定結果ＤＢ９０は、例えば、魚ＩＤ、尾叉長、体高、ランク、及び画像を、魚ＩＤに対応付けて記録している。なお、図示していないが、魚ＩＤに対応付けて吻端の位置情報（座標値）及び尾鰭（尾叉）の位置情報（座標値）を記録してもよい。魚ＩＤは、例えば、生簀内の魚を識別する識別子である。ランクは、魚のサイズの計測精度を特定するものである。ランクの詳細は後述する。画像は、魚の画像であり、魚の画像に重畳させて、当該魚の尾叉長を示す直線、及び体高を示す直線を表示してもよい。また、当該魚の画像上に、フレーム番号、尾叉長の値、体高の値、属するランクを表示してもよい。

　図１９は本実施の形態の推定装置１００の構成の他の例を示すブロック図である。図１９に示すように、推定装置１００は、例えば、パーソナルコンピュータ等を用いることができる。推定装置１００は、ＣＰＵ１０１、ＲＯＭ１０２、ＲＡＭ１０３、ＧＰＵ１０４、ビデオメモリ１０５、及び記録媒体読取部１０６などで構成することができる。記録媒体１（例えば、ＣＤ－ＲＯＭ等の光学可読ディスク記憶媒体）に記録されたコンピュータプログラム（コンピュータプログラム製品）を記録媒体読取部１０６（例えば、光学ディスクドライブ）で読み取ってＲＡＭ１０３に格納することができる。ここで、コンピュータプログラム（コンピュータプログラム製品）は、後述の図２５及び図２６に記載された処理手順を含む。ハードディスク（図示しない）に格納しコンピュータプログラム実行時にＲＡＭ１０３に格納してもよい。

　ＲＡＭ１０３に格納されたコンピュータプログラム（コンピュータプログラム製品）をＣＰＵ１０１で実行させることにより、入力部１０、ＡＩ部２０、ペアリング部３０、追尾部４０、テールビート除去部５０、計測部６０、推定部７０、及び出力部８０における各処理を実行することができる。ビデオメモリ１０５は、各種画像処理のためのデータや処理結果などを一時的に格納することができる。また、コンピュータプログラム（コンピュータプログラム製品）は、記録媒体読取部１０６で読み取る構成に代えて、インターネットなどのネットワークを介して他のコンピュータまたはネットワークデバイス等からダウンロードすることもできる。

　次に、通信ネットワークを介して推定装置１００と接続される端末装置の表示画面に表示される推定結果について説明する。以下の表示処理は、端末装置からの要求に応じて、
推定装置１００が推定結果ＤＢ９０にアクセスし、必要な場合には、表示するための数値を演算し、端末装置へ出力することにより行うことができる。また、端末装置が、推定結果ＤＢのデータを既にダウンロードしている場合には、端末装置のＣＰＵがダウンロードしたデータを用いて表示部に表示することにより行うことができる。

　図２０は推定結果の第１表示例を示す模式図である。推定結果画面３００には、ランク、計測数、平均魚体重、平均尾叉長、平均体高、平均肥満度、平均撮影距離、平均角度などの各欄が表示される。また、ランク毎に詳細データのダウンロードの選択を受け付けるボックス３０１が表示され、「保存」アイコン３０２を操作することにより、詳細データを推定装置１００からダウンロードすることができる。ダウンロードするデータには、カメラ部２００で撮像された動画も含む。

　ランクは、魚のサイズの計測精度を特定するものであり、例えば、ランクＡは誤差が５％未満であるとし、ランクＢは誤差が５％以上１０％未満であるとし、ランクＣは誤差が１０％以上２０％未満であるとし、ランクＦは誤差が２０％以上であるとすることができる。なお、ランクの区分数やランクの定義は、これらに限定されない。

　図２１は誤差の要因の一例を示す模式図である。図２１Ａは部位の位置の誤差の分布を示す。吻端の位置の誤差、尾叉（尾鰭）の位置の誤差が増えるほど、尾叉長及び体高の誤差が増加する。吻端及び尾叉の位置の誤差は、第１学習モデル２１が出力する吻端及び尾鰭（尾叉）の位置データを用いて三次元計測を行った際の再投影誤差に基づいて算出される。図２１Ｂは魚体の傾き（角度）の誤差を示す。魚体の傾きが大きいほど、体高の誤差が増加する。傾きの誤差は、角度ズレを単純な計測位置ズレとして体高誤差に反映することができる。ランク付けは、部位の位置の誤差又は傾きの誤差のうち悪い方の誤差を採用することができる。

　計測数は、それぞれのランクに含まれる魚の数を示す。平均尾叉長、平均体高は、各ランク内の平均値を表す。平均魚体重、及び平均肥満度は、所定の計算式によって平均尾叉長及び平均体高から算出することができる。養殖業においては、育成魚の重量の把握も重要である。実際に重量計を用いて育成魚の重量を計測することは、多くの労力を要する。しかし、本実施の形態によれば、推定装置１００が推定した尾叉長及び体高などから、実際の重量計を用いることなく、育成魚の重量を換算することができる。この場合、体高計測に最適な特徴部位がない場合でも、安定して高精度に体高を推定できるので、育成魚の体重も精度よく推定できる。

　上述のように、推定装置１００は、生簀内で養殖されている複数の魚（水中生物）の推定したサイズの精度を複数のランクに区分し、区分したランク毎の魚を表示する。これにより、生簀内の魚のサイズがどの程度であって、さらにデータの信頼度も分かるので、給餌量や水揚げ時期を決定するための情報を提供できる。

　図２２は推定結果の第２表示例を示す模式図である。推定結果画面３１０には、分布選択リスト３１１、分布表示領域３１２が表示される。図２２の例では、尾叉長、体高、魚体重などの項目の中から尾叉長の分布が選択され、分布表示領域３１２には、生簀内の魚の尾叉長分布が表示されている。また、尾叉長の分布の内訳として、ランクを表示してもよい。尾叉長と同様に、体高や魚体重などの分布を表示させることができる。

　上述のように、推定装置１００は、生簀内で養殖されている複数の魚の尾叉長及び体高の少なくとも一方の分布を表示することができる。これにより、生簀内の魚のサイズがどのように分布しているかが分かるので、給餌量や水揚げ時期を決定するための情報を提供できる。

　図２３は推定結果の第３表示例を示す模式図である。推定結果画面３２０には、ランク選択リスト３２１、魚計測データ表示領域３２２が表示される。図２３の例では、ランクＡ、Ｂ、Ｃ、Ｆの各ランクからランクＡが選択されている。魚計測データ表示領域３２２には、ランクＡに属する各魚の計測データが表示される。図２３の例では、計測データには、魚体重、尾叉長、体高、及び画像が含まれるが、これらに限定されない。画像の欄のボックス３２３を操作することにより、後述の図２４に示すように、選択した魚の画像を表示することができる。

　これにより、ランク毎に、ランクに属する個々の魚（固体）の計測データを確認することができる。

　図２４は推定結果の第４表示例を示す模式図である。推定結果画面３３０には、選択された魚の画像が表示される。また、魚の画像に重畳させて、当該魚の尾叉長を示す直線、及び体高を示す直線を表示してもよい。また、当該魚の画像上に、フレーム番号、尾叉長の値、体高の値、魚体重の値、属するランクを表示してもよい。

　上述のように、推定装置１００は、魚の画像に尾叉長及び体高を付して表示することができる。これにより、ランクに属する個々の魚（固体）の計測データを確認することができる。

　図２５及び図２６は推定装置１００の処理手順の一例を示すフローチャートである。推定装置１００は、撮像画像データを取得し（Ｓ１１）、取得した撮像画像データを第２学習モデル２３に入力して、画像切出部２４から単体魚画像データ及び部位画像データを取得する（Ｓ１２）。ここで、部位画像データは、吻端画像データ及び尾鰭画像データを含む。推定装置１００は、取得した部位画像データを第１学習モデル２１に入力して部位の位置データを取得する（Ｓ１３）。ここでは、吻端画像データを第１学習モデル２１に入力し、第１学習モデル２１が出力する吻端の位置情報（座標又は領域の値）を取得し、尾鰭画像データを第１学習モデル２１に入力し、第１学習モデル２１が出力する尾鰭の位置情報（座標又は領域の値）を取得する。

　推定装置１００は、取得した単体魚画像データを生成モデル２２に入力してセグメンテーション画像データを取得し（Ｓ１４）、取得した部位の位置データ及びセグメンテーション画像データに基づいて尾叉長の計測ポイントを推定（生成）する（Ｓ１５）。ここでは、尾叉長の計測ポイント（吻端及び尾鰭それぞれの位置情報（座標又は領域の値））推定結果ＤＢ９０に記憶する。なお、後述のステップＳ１６及びＳ１７の処理を用いて魚又は魚の所定部位のカメラからの距離Ｚを求めて、魚のサイズ（尾叉長及び体高）を推定してもよい。

　推定装置１００は、カメラ間のペアリングを行い（Ｓ１６）、魚と部位のペアリングを行って魚リストを生成する（Ｓ１７）。推定装置１００は、魚の追尾処理を行い（Ｓ１８）、テールビート除去処理を行う（Ｓ１９）。推定装置１００は、体高算出に最適なフレームを選定する（Ｓ２０）。

　推定装置１００は、体高算出が可能であるか否かを判定し（Ｓ２１）、体高算出が不可の場合（Ｓ２１でＮＯ）、ステップＳ２０の処理を行う。体高算出が可能の場合（Ｓ２１でＹＥＳ）、推定装置１００は、体高を算出する（Ｓ２２）。体高の算出は、図１６Ｂに示した方法で行う。体高の「算出」は、「計測」と同義であるが、間接的に計測するという意味もある。推定装置１００は、他の魚（計測を実施していない魚）の有無を判定する（Ｓ２３）。

　他の魚がある場合（Ｓ２３でＹＥＳ）、推定装置１００は、ステップＳ１１以降の処理を繰り返す。他の魚がない場合（Ｓ２３でＮＯ）、推定装置１００は、魚の算出データを収集し（Ｓ２４）、誤差に応じて、算出データをランクに区分する（Ｓ２５）。推定装置１００は、ランク毎の算出データの統計値（例えば、平均値）を算出し（Ｓ２６）、推定項目（例えば、尾叉長、体高など）ごとの分布を作成し（Ｓ２７）、推定結果を出力し（Ｓ２８）、処理を終了する。

　推定装置１００は、ＣＰＵ、ＧＰＵ、ＲＯＭ、ＲＡＭ、記録媒体読取部などで構成することができる。記録媒体に記録されたコンピュータプログラムを記録媒体読取部で読み取ってＲＡＭに格納することができる。ＲＡＭに格納されたコンピュータプログラムをＣＰＵ、ＧＰＵで実行させることにより、推定装置１００で行う処理を実行することができる。また、コンピュータプログラムは、記録媒体読取部で読み取る構成に代えて、インターネットなどのネットワークを介してダウンロードすることもできる。

　本実施の形態によれば、体高計測をセグメンテーション画像と体高直線との組み合わせにより行うので、体高計測のための最適部位が無い場合でも、安定して高精度に魚のサイズを推定することができる。

　また、魚の鰭は、遊泳時に展開したり収納したりするため、測定精度の低下原因となる。しかし、本実施の形態によれば、鰭を除く魚体に対してセグメンテーションを行うので、鰭に影響されることなく、高精度に体高を計測することができる。

　また、高解像度の画像から特徴点を高精度に抽出するには、画像処理のための演算負荷が増大する。しかし、本実施の形態によれば、第１学習モデルと生成モデルとを組み合わせるので、セグメンテーション画像と体高直線とを組み合わせて高精度に魚のサイズを推定することができるとともに、負荷軽減を図ることができる。

　１００　推定装置
　１０　入力部
　２０　ＡＩ部
　２１　第１学習モデル
　２１１　Ｆｅａｔｕｒｅ　Ｐｙｒａｍｉｄ　Ｎｅｔｗｏｒｋ
　２１２　クラス分類器
　２１３　領域回帰器
　２２　生成モデル
　２２１、２２２、２２３、２２４、２２５　エンコーダ
　２２６、２２７、２２８、２２９　デコーダ
　２３　第２学習モデル
　２４　画像切出部
　２３１　ＣＮＮ層
　２３２　領域提案ネットワーク
　２３３　ＲＯＩ　ＰＯＯＬ
　２３４　識別ネットワーク
　３０　ペアリング部
　４０　追尾部
　４１　２Ｄ追尾部
　４２　３Ｄ変換部
　４３　３Ｄ追尾部
　５０　テールビート除去部
　５１　尾叉３Ｄ計測部
　５２　平面投影部
　５３　近似直線算出部
　５４　フレーム除去部
　６０　計測部
　６１　最適フレーム選定部
　６２　吻端・尾叉３Ｄ計測部
　６３　体高補助線生成部
　６４　体高補助線投影部
　６５　体高計測部
　７０　推定部
　８０　出力部
　９０　推定結果ＤＢ
　１０１　ＣＰＵ
　１０２　ＲＯＭ
　１０３　ＲＡＭ
　１０４　ＧＰＵ
　１０５　ビデオメモリ
　１０６　記録媒体読取部
　２００　カメラ部

Claims

　コンピュータに、
　水中生物を撮像した画像データを取得し、
　画像データを入力した場合に水中生物の所定部位の位置データを出力する第１学習モデルに、取得した画像データを入力して、前記撮像された水中生物の所定部位の位置データを取得し、
　画像データを入力した場合に水中生物のセグメンテーション画像を生成する生成モデルに、取得した画像データを入力して、前記撮像された水中生物のセグメンテーション画像を生成し、
　前記所定部位の位置データ及び前記セグメンテーション画像に基づいて前記撮像された水中生物のサイズを推定する、
　処理を実行させるコンピュータプログラム。
　コンピュータに、
　画像データを入力した場合に水中生物の第１位置データ及び前記水中生物の所定部位の第２位置データを出力する第２学習モデルに、取得した画像データを入力して、前記第１位置データ及び前記第２位置データを出力し、
　前記第１学習モデルには、前記第２位置データを含む第２領域の画像データを入力し、
　前記生成モデルには、前記第１位置データを含む第１領域の画像データを入力する、
　処理を実行させる請求項１に記載のコンピュータプログラム。
　前記所定部位は、尾鰭及び吻端を含み、
　コンピュータに、
　前記尾鰭と前記吻端とを結ぶ直線と直交する直線に基づいて体高を算出する、
　処理を実行させる請求項１又は請求項２に記載のコンピュータプログラム。
　コンピュータに、
　ステレオカメラによって撮像された画像データを前記第１学習モデルに入力して、取得した所定部位の位置データに基づいて吻端及び尾叉の３次元位置を算出し、
　算出した３次元位置に基づいて体高補助線を生成し、
　生成した体高補助線を前記セグメンテーション画像上に２次元投影して体高を算出する、
　処理を実行させる請求項１から請求項３のいずれか一項に記載のコンピュータプログラム。
　コンピュータに、
　前記吻端又は前記尾叉の位置から、前記吻端と前記尾叉の距離の所定割合の位置にある前記体高補助線を用いて前記体高を算出する、
　処理を実行させる請求項４に記載のコンピュータプログラム。
　コンピュータに、
　ステレオカメラによって撮像された複数のフレームそれぞれの画像データを前記第１学習モデルに入力して、取得した所定部位の位置データに基づいてフレーム毎の尾叉の３次元位置を算出し、
　算出した尾叉の３次元位置に基づいてフレーム毎に尾叉の変位を特定し、
　特定した変位に基づいて、前記水中生物のサイズを推定するためのフレームを選択する、
　処理を実行させる請求項１から請求項５のいずれか一項に記載のコンピュータプログラム。
　コンピュータに、
　前記第１学習モデルが出力する位置データに基づいて、尾鰭又は吻端の推定位置を表示し、
　表示した尾鰭又は吻端の推定位置の修正を受け付け、
　受け付けた修正位置と、前記修正位置を受け付けた際の画像データとに基づいて、前記第１学習モデルを再学習する、
　処理を実行させる請求項１から請求項６のいずれか一項に記載のコンピュータプログラム。
　コンピュータに、
　前記生成モデルが生成したセグメンテーション画像を表示し、
　表示したセグメンテーション画像の修正を受け付け、
　修正されたセグメンテーション画像と、前記修正を受け付けた際の画像データとに基づいて、前記生成モデルを再学習する、
　処理を実行させる請求項１から請求項７のいずれか一項に記載のコンピュータプログラム。
　コンピュータに、
　生簀内で養殖されている前記水中生物の画像に尾叉長又は体高を付して表示する、
　処理を実行させる請求項１から請求項８のいずれか一項に記載のコンピュータプログラム。
　コンピュータに、
　生簀内で養殖されている複数の水中生物の推定したサイズの精度を複数のランクに区分し、区分したランク毎の水中生物の数を表示する、
　処理を実行させる請求項１から請求項９のいずれか一項に記載のコンピュータプログラム。
　コンピュータに、
　生簀内で養殖されている複数の水中生物の尾叉長及び体高の少なくとも一方を含むサイズの分布を表示する、
　処理を実行させる請求項１から請求項１０のいずれか一項に記載のコンピュータプログラム。
　水中生物を撮像した画像データ、及び前記水中生物の所定部位の位置データを含む第１訓練データを取得し、
　前記画像データ、及び前記水中生物のセグメンテーション画像を含む第２訓練データを取得し、
　前記第１訓練データに基づいて、水中生物を撮像した画像データを入力した場合に、前記水中生物の所定部位の位置データを出力するように第１学習モデルを生成し、
　前記第２訓練データに基づいて、水中生物を撮像した画像データを入力した場合に、前記水中生物のセグメンテーション画像を生成するように生成モデルを生成する、
　モデル生成方法。
　水中生物を撮像した画像データ、前記水中生物の第１位置データ及び前記水中生物の所定部位の第２位置データを含む第３訓練データを取得し、
　前記第３訓練データに基づいて、水中生物を撮像した画像データを入力した場合に、前記水中生物の第１位置データ及び前記水中生物の所定部位の第２位置データを出力するように第２学習モデルを生成する、
　請求項１２に記載のモデル生成方法。
　水中生物を撮像した画像データを取得し、
　画像データを入力した場合に水中生物の所定部位の位置データを出力する第１学習モデルに、取得した画像データを入力して、前記撮像された水中生物の所定部位の位置データを取得し、
　画像データを入力した場合に水中生物のセグメンテーション画像を生成する生成モデルに、取得した画像データを入力して、前記撮像された水中生物のセグメンテーション画像を生成し、
　前記所定部位の位置データ及び前記セグメンテーション画像に基づいて前記撮像された水中生物のサイズを推定する、
　推定方法。
　水中生物を撮像した画像データを取得する第１取得部と、
　画像データを入力した場合に水中生物の所定部位の位置データを出力する第１学習モデルに、前記第１取得部で取得した画像データを入力して、前記撮像された水中生物の所定部位の位置データを取得する第２取得部と、
　画像データを入力した場合に水中生物のセグメンテーション画像を生成する生成モデルに、前記第１取得部で取得した画像データを入力して、前記撮像された水中生物のセグメンテーション画像を生成する生成部と、
　前記所定部位の位置データ及び前記セグメンテーション画像に基づいて前記撮像された水中生物のサイズを推定する推定部と
　を備える推定装置。