WO2024095584A1

WO2024095584A1 - 情報処理プログラム、情報処理装置及び情報処理方法

Info

Publication number: WO2024095584A1
Application number: PCT/JP2023/031274
Authority: WO
Inventors: 裕子石若
Original assignee: ソフトバンク株式会社
Priority date: 2022-11-01
Filing date: 2023-08-29
Publication date: 2024-05-10
Also published as: JP2024066259A

Abstract

情報処理プログラムは、複数の魚が所在する生簀を複数の異なる方向それぞれから撮像する複数の撮像装置から、複数の異なる方向それぞれから撮像された複数の撮像画像を取得する取得手順と、取得手順によって取得された各撮像画像に対応する撮像装置から各撮像画像に撮像された各魚までの距離に基づいて、各撮像画像に撮像された各魚の生簀における位置を示す第１魚位置情報を撮像画像ごとに推定し、生簀における所定の位置から所定の範囲内の位置に対応する複数の第１魚位置情報を一の魚の位置を示す第２魚位置情報に集約し、第２魚位置情報に基づいて、複数の魚に関する情報を推定する推定手順と、をコンピュータに実行させる。

Description

情報処理プログラム、情報処理装置及び情報処理方法

　本発明は、情報処理プログラム、情報処理装置及び情報処理方法に関する。

　従来、魚の養殖技術を向上させるための様々な技術が知られている。例えば、生簀内の魚が撮影された撮影画像から、魚の数（尾数ともいう）に応じて変化する予め定められた特徴量を抽出する。そして、機械学習による特徴量と尾数との関係データである学習モデルに、抽出された特徴量を照合することにより、学習モデルから尾数を検知する技術が知られている。

特許第６７８７４７１号公報

　しかしながら、上記の従来技術では、生簀内の尾数を検知するにすぎないため、画像から生簀に所在する複数の魚に関する情報を精度よく推定することができるとは限らない。

　実施形態に係る情報処理プログラムは、複数の魚が所在する生簀を複数の異なる方向それぞれから撮像する複数の撮像装置から、前記複数の異なる方向それぞれから撮像された複数の撮像画像を取得する取得手順と、前記取得手順によって取得された各撮像画像に対応する前記撮像装置から各撮像画像に撮像された各魚までの距離に基づいて、各撮像画像に撮像された各魚の前記生簀における位置を示す第１魚位置情報を前記撮像画像ごとに推定し、前記生簀における所定の位置から所定の範囲内の位置に対応する複数の第１魚位置情報を一の魚の位置を示す第２魚位置情報に集約し、前記第２魚位置情報に基づいて、前記複数の魚に関する情報を推定する推定手順と、をコンピュータに実行させる。

　実施形態の一態様によれば、画像から生簀に所在する複数の魚に関する情報を精度よく推定することができるといった効果を奏する。

図１は、物体検出により検出される魚のサイズと養殖業者にとって必要な尾斜長とが異なることを説明するための図である。図２は、実施形態に係る情報処理装置の構成例を示す図である。図３は、生簀を複数の異なる方向それぞれから撮像する複数の撮像装置の配置例を示す図である。図４は、複数の魚が所在する生簀を複数の異なる方向それぞれから撮像した撮像画像と各撮像画像に対応する仮想オブジェクトの配置例を示す図である。図５は、各方向から見た魚の仮想オブジェクトを同一の仮想空間上に重ねて配置した様子を示す図である。図６は、各方向から見た魚の仮想オブジェクトの位置情報を集約した後の様子を示す図である。図７は、第１の変形例に係る各方向から見た魚の仮想オブジェクトが物体検出により検出された様子を示す図である。図８は、魚の仮想オブジェクトの骨格モデルと魚の尾斜長の関係を示す図である。図９は、第２の変形例に係る魚の仮想オブジェクトの配置方法の一例を示す図である。図１０は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

　以下に、本願に係る情報処理プログラム、情報処理装置及び情報処理方法を実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理プログラム、情報処理装置及び情報処理方法が限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

（実施形態）
〔１．はじめに〕
　従来、静止画像や動画像（以下、画像ともいう）に撮像された対象物の位置推定およびクラス分類を実行する物体検出の技術が知られている。物体検出では、対象物の位置を矩形の枠（バウンディングボックスともいう）として検出する。

　物体検出は、画像から画像に撮像された対象物の位置およびクラスを推定するようあらかじめ学習された機械学習モデル（以下、学習済みモデルともいう）を用いて行われる。例えば、生簀を泳いでいる魚の群れを撮像した撮像画像を学習済みモデルの入力情報として入力し、撮像画像に撮像された魚の群れに属する各魚の位置および尾数に関する情報を学習済みモデルの出力情報として得る。

　図１は、物体検出により検出される魚のサイズと養殖業者にとって必要な尾斜長とが異なることを説明するための図である。図１の左側は、生簀を泳いでいる魚の群れを撮像した撮像画像１を示す。また、撮像画像１には、物体検出により検出された魚４ならびに魚４を囲むバウンディングボックス２、および、魚３ならびに魚３を囲むバウンディングボックス５が含まれている。図１の右側は、魚の全長、尾斜長、および体高の関係を示す。実際の養殖業者にとって必要な情報は、出荷サイズの魚が何尾いるかである。出荷サイズは、尾斜長で決まる。養殖業者は、尾斜長に基づいて魚の重量を推定する。

　ここで、物体検出により検出される対象物の大きさは、バウンディングボックスの大きさである。図１に示す例では、撮像画像１から検出された魚４は、真横から見た形状に近いが、頭が画像の奥に向かっている。したがって、バウンディングボックス２の一辺の長さは、魚４を真横からみた大きさ（例えば、魚の全長）とは異なる。また、撮像画像１から検出された魚３は、頭が正面を向いている。したがって、バウンディングボックス５の一辺の長さは、魚３を真横からみた大きさ（例えば、魚の全長）とは異なる。

　上述したように、従来の物体検出の技術を用いて検出されるのは、バウンディングボックスの大きさであり、バウンディングボックスの大きさは、養殖業者にとって必要な尾斜長とは異なる。

　これに対し、本実施形態に係る情報処理装置は、複数の撮像装置を用いて、複数の異なる方向それぞれから生簀の水中にいる複数の魚を撮影した複数の撮影画像を取得する。続いて、情報処理装置は、撮影画像に写っている各魚と撮像装置との距離（以下、カメラ魚間距離ともいう）を推定する。続いて、情報処理装置は、各魚に対応する仮想オブジェクトを生簀に対応する仮想空間（以下、生簀空間ともいう）のカメラ魚間距離に対応する各位置に配置する。続いて、情報処理装置は、生簀空間における同じ位置に複数の仮想オブジェクトが重なっている場合は、複数の仮想オブジェクトの中から一つの仮想オブジェクトを選択し、選択された仮想オブジェクト以外の仮想オブジェクトを削除することで、仮想オブジェクトの位置情報を集約する。続いて、情報処理装置は、複数の撮影画像それぞれに対応する生簀空間の仮想画像と、仮想画像に対応する撮影画像との誤差が小さくなるよう、複数の仮想オブジェクトそれぞれの位置、大きさ、向き、および尾数のパラメータを調整する。これにより、情報処理装置は、複数の魚が所在する生簀を撮像した撮像画像から、生簀に所在する複数の魚それぞれの位置、大きさ、向き、および尾数を精度よく推定することができる。したがって、情報処理装置は、画像から生簀に所在する複数の魚に関する情報を精度よく推定することができる。

　なお、魚の大きさを表す寸法には、魚の全長、標準体長（体長）、尾叉長、体高、体幅などの種類が存在する。本願明細書において「魚の大きさ」と記載する場合には、魚の全長、標準体長（体長）、尾叉長、体高、体幅などいずれの寸法によって測定される魚の大きさをも含む概念とする。

　また、以下では、画像が動画像である場合について説明する。

〔２．情報処理装置の構成〕
　図２は、実施形態に係る情報処理装置１００の構成例を示す図である。情報処理装置１００は、通信部１１０と、記憶部１２０と、入力部１３０と、出力部１４０と、制御部１５０とを有する。

（通信部１１０）
　通信部１１０は、例えば、ＮＩＣ（Network　Interface　Card）等によって実現される。そして、通信部１１０は、ネットワークと有線または無線で接続され、例えば、撮像装置との間で情報の送受信を行う。

（記憶部１２０）
　記憶部１２０は、例えば、ＲＡＭ（Random　Access　Memory)、フラッシュメモリ（Flash　Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。具体的には、記憶部１２０は、各種プログラム（情報処理プログラムの一例）を記憶する。また、記憶部１２０は、各撮像装置を識別するカメラ識別情報と、各撮像装置に関するカメラ情報とを対応付けて記憶する。例えば、記憶部１２０は、カメラ情報として、各撮像装置の撮像可能範囲に含まれる生簀の空間の３次元位置座標に関する情報、および、ステレオカメラである各撮像装置のカメラ間距離、焦点距離ならびに視差を示す情報を記憶する。

（入力部１３０）
　入力部１３０は、利用者から各種操作が入力される。例えば、入力部１３０は、タッチパネル機能により表示面（例えば出力部１４０）を介して利用者からの各種操作を受け付けてもよい。また、入力部１３０は、情報処理装置１００に設けられたボタンや、情報処理装置１００に接続されたキーボードやマウスからの各種操作を受け付けてもよい。

（出力部１４０）
　出力部１４０は、例えば、液晶ディスプレイや有機ＥＬ（Electro-Luminescence）ディスプレイ等によって実現される表示画面であり、各種情報を表示するための表示装置である。出力部１４０は、制御部１５０の制御に従って、各種情報を表示する。なお、情報処理装置１００にタッチパネルが採用される場合には、入力部１３０と出力部１４０とは一体化される。また、以下の説明では、出力部１４０を画面と記載する場合がある。

（制御部１５０）
　制御部１５０は、コントローラ（controller）であり、例えば、ＣＰＵ（Central　Processing　Unit）やＭＰＵ（Micro　Processing　Unit）等によって、情報処理装置１００内部の記憶装置に記憶されている各種プログラム（情報処理プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１５０は、コントローラであり、例えば、ＡＳＩＣ（Application　Specific　Integrated　Circuit）やＦＰＧＡ（Field　Programmable　Gate　Array）等の集積回路により実現される。

　制御部１５０は、取得部１５１と、推定部１５２と、出力制御部１５３を機能部として有し、以下に説明する情報処理の作用を実現または実行してよい。なお、制御部１５０の内部構成は、図２に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、各機能部は、制御部１５０の機能を示したものであり、必ずしも物理的に区別されるものでなくともよい。

（取得部１５１）
　取得部１５１は、複数の魚が所在する生簀を複数の異なる方向それぞれから撮像する複数の撮像装置から、複数の異なる方向それぞれから撮像された複数の撮像画像を取得する。例えば、取得部１５１は、通信部１１０を介して、複数の撮像装置それぞれから複数の撮像画像それぞれを取得する。

　図３は、生簀を複数の異なる方向それぞれから撮像する複数の撮像装置の配置例を示す図である。図３では、生簀１０は、立方体の上面を除いた箱のような形状をしており、例えば、海水中に配置される。図３では、生簀の一辺の長さは３ｍである。また、生簀１０の各側面には、水面からの深さに応じて撮像装置が配置される。例えば、水面から１ｍの深さには、撮像装置１１、２１、３１、４１がそれぞれ各側面に配置される。また、水面から２ｍの深さには、撮像装置１２、２２、３２、４２がそれぞれ各側面に配置される。また、水面から３ｍの深さには、撮像装置１３、２３、３３、４３がそれぞれ各側面に配置される。図３では、撮像装置１１～１３、２１～２３、３１～３３、および４１～４３それぞれは、２つのカメラで構成されるステレオカメラである。

　図３に示すように、生簀１０に対する各撮像装置の位置はあらかじめわかっている。また、各撮像装置の画角もあらかじめわかっている。また、各撮像装置の位置および画角に基づいて、各撮像装置の撮像可能範囲はあらかじめわかっている。取得部１５１は、各撮像装置の撮像可能範囲に関する情報に基づいて、各撮像装置の撮像可能範囲に含まれる生簀の空間の３次元位置座標に関する情報を特定する。記憶部１２０は、各撮像装置の撮像可能範囲に含まれる生簀の空間の３次元位置座標に関する情報をカメラ識別情報と対応付けて記憶する。

（推定部１５２）
　推定部１５２は、取得部１５１によって取得された各撮像画像に対応する撮像装置から各撮像画像に撮像された各魚までの距離（以下、カメラ魚間距離と記載する場合がある）を推定する。具体的には、推定部１５２は、記憶部１２０を参照して、取得部１５１が取得したカメラ識別情報と対応付けられたカメラ情報のうち、ステレオカメラである撮像装置のカメラ間距離、焦点距離ならびに視差を示す情報を取得する。続いて、推定部１５２は、取得したカメラ間距離、焦点距離ならびに視差を示す情報および各撮像画像に基づいて、カメラ魚間距離を推定する。

　続いて、推定部１５２は、記憶部１２０を参照して、取得部１５１が取得したカメラ識別情報と対応付けられたカメラ情報のうち、各撮像装置の撮像可能範囲に含まれる生簀の空間の３次元位置座標に関する情報を取得する。続いて、推定部１５２は、推定したカメラ魚間距離と各撮像装置の撮像可能範囲に含まれる生簀の空間の３次元位置座標に関する情報とに基づいて、各撮像画像に撮像された各魚の生簀における位置を示す第１魚位置情報を撮像画像ごとに推定する。続いて、推定部１５２は、各魚に対応する仮想オブジェクトを生簀に対応する仮想空間（以下、生簀空間ともいう）の第１魚位置情報に対応する各位置に配置する。推定部１５２は、各撮像画像について推定された第１魚位置情報に対応する生簀空間の各位置に仮想オブジェクトを配置する。

　また、推定部１５２は、各撮像画像に対する物体検出を行った後に、検出された各魚をトラッキングすることにより、各魚の方向（各魚の頭の向き）を決定する。

　図４は、複数の魚が所在する生簀を複数の異なる方向それぞれから撮像した撮像画像と各撮像画像に対応する仮想オブジェクトの配置例を示す図である。図４の上段は、撮像装置１２、２２、３２および４２によってそれぞれ撮像された撮像画像１２Ａ、２２Ａ、３２Ａおよび４２Ａを示す。図４の下段は、推定部１５２が、撮像画像１２Ａ、２２Ａ、３２Ａおよび４２Ａにそれぞれについて推定された第１魚位置情報に対応する生簀空間の各位置に仮想オブジェクトを配置した状態を示す仮想画像１２Ｂ、２２Ｂ、３２Ｂおよび４２Ｂである。すなわち、図４の下段は、撮像装置１２、２２、３２および４２に対応する方向から見た生簀空間の各位置に仮想オブジェクトを配置し、撮像装置１２、２２、３２および４２に対応する仮想カメラ１２´、２２´、３２´および４２´によって生簀空間を撮像して得られた仮想画像１２Ｂ、２２Ｂ、３２Ｂおよび４２Ｂを示す。

　図５は、各方向から見た魚の仮想オブジェクトを同一の仮想空間上に重ねて配置した様子を示す図である。図５では、図４の下段で示した仮想画像１２Ｂ、２２Ｂ、３２Ｂおよび４２Ｂに対応する仮想オブジェクトを同一の仮想空間上に重ねて配置した様子をある方向から見た仮想画像５０を示す。図５では、各方向から見た各仮想オブジェクトが同一の仮想空間上に重ねて配置される様子を示す。

　また、推定部１５２は、生簀における所定の位置から所定の範囲内の位置に対応する複数の第１魚位置情報を一の魚の位置を示す第２魚位置情報に集約する。具体的には、推定部１５２は、仮想空間に配置された所定の仮想オブジェクトの位置と重なっている他の仮想オブジェクトが存在する場合、所定の仮想オブジェクトの第１魚位置情報と他の仮想オブジェクトの第１魚位置情報を一の魚の位置を示す第２魚位置情報に集約する。より具体的には、推定部１５２は、仮想空間における同じ位置に複数の仮想オブジェクトが重なっている場合は、複数の仮想オブジェクトの中から一つの仮想オブジェクトを選択し、選択された仮想オブジェクト以外の仮想オブジェクトを削除することで、仮想オブジェクトの位置情報を集約する。例えば、推定部１５２は、各撮像画像のうち各魚が撮像された領域である魚領域の面積を比較する。続いて、推定部１５２は、複数の第１魚位置情報の中から魚領域の面積が最も大きい撮像画像に対応する第１魚位置情報を第２魚位置情報として選択することにより、複数の第１魚位置情報を第２魚位置情報に集約する。

　図６は、各方向から見た魚の仮想オブジェクトの位置情報を集約した後の様子を示す図である。図６では、図５と比べて、集約された分だけ仮想オブジェクトの数が減り、実際の生簀に所在する魚の群れを撮像した撮像画像と類似する仮想画像となった様子を示す。

　なお、上述した実施形態では、推定部１５２が、仮想空間における同じ位置に複数の仮想オブジェクトが重なっている場合は、複数の仮想オブジェクトの中から一つの仮想オブジェクトを選択し、選択された仮想オブジェクト以外の仮想オブジェクトを削除することで、仮想オブジェクトの位置情報を集約する場合について説明したが、集約の方法はこれに限られない。例えば、推定部１５２は、仮想空間における同じ位置に複数の仮想オブジェクトが重なっている場合は、重なっている複数の仮想オブジェクトの第１魚位置情報の代表値を算出する。例えば、推定部１５２は、代表値の一例として、重なっている複数の仮想オブジェクトの第１魚位置情報の平均値、中央値、または、最頻値を算出する。続いて、推定部１５２は、算出した第１魚位置情報の代表値を第２魚位置情報として採用することにより、複数の第１魚位置情報を第２魚位置情報に集約してもよい。

　また、推定部１５２は、生簀に対応する仮想空間における第２魚位置情報に対応する位置に各魚に対応する仮想オブジェクトが配置された仮想空間を複数の撮像装置それぞれに対応する複数の仮想カメラそれぞれによって撮像した複数の仮想画像を生成する。例えば、推定部１５２は、図６に示した集約後の仮想オブジェクトが配置された生簀空間を複数の撮像装置それぞれに対応する複数の仮想カメラそれぞれによって撮像した複数の仮想画像を生成する。すなわち、推定部１５２は、各撮像装置に対応する仮想画像を生成する。

　続いて、推定部１５２は、各仮想画像と各仮想画像に対応する各撮像画像との誤差が小さくなるように、各仮想オブジェクトに関するパラメータの値を変化させる。具体的には、推定部１５２は、各仮想画像と各仮想画像に対応する各撮像画像とを比較して、各仮想画像と各撮像画像との誤差が小さくなるように、各仮想オブジェクトの大きさや向きを変化させる。より具体的には、推定部１５２は、遺伝的アルゴリズムを用いて、各仮想画像と各仮想画像に対応する各撮像画像との誤差が最小となるような各仮想オブジェクトに関するパラメータの値を決定してよい。例えば、各仮想オブジェクトに関するパラメータの値は、各仮想オブジェクトの位置を示す値、各仮想オブジェクトの向きを示す値、または、各仮想オブジェクトの大きさを示す値である。

　なお、推定部１５２は、遺伝的アルゴリズムを用いる代わりに、機械学習モデルを用いてパラメータの値を決定してもよい。例えば、推定部１５２は、各仮想画像と各仮想画像に対応する各撮像画像が入力情報として入力された場合に、各仮想画像と各仮想画像に対応する各撮像画像との誤差が最小となるようなパラメータの値を出力情報として出力するよう学習された機械学習モデルを用いて、各仮想オブジェクトに関するパラメータの値を決定してもよい。

　続いて、推定部１５２は、変化させた後の各仮想オブジェクトに関するパラメータの値に基づいて、複数の魚に関する情報を推定する。例えば、複数の魚に関する情報は、生簀における各魚の位置を示す魚位置情報、各魚の向きを示す魚向き情報、各魚の大きさを示す魚サイズ情報、または、複数の魚の数を示す尾数情報である。このようにして、推定部１５２は、第２魚位置情報に基づいて、複数の魚に関する情報を推定する。

（出力制御部１５３）
　出力制御部１５３は、推定部１５２によって推定された複数の魚に関する情報を出力部１４０に出力する。例えば、出力制御部１５３は、推定部１５２によって推定された生簀における各魚の魚サイズ情報および尾数情報を出力部１４０に表示させる。

〔３．変形例〕
　上述した情報処理装置１００は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、実施形態の変形例について説明する。

〔３－１．第１の変形例〕
　上述した実施形態では、推定部１５２が仮想オブジェクトの位置情報に基づいて複数の魚に関する情報を推定する場合について説明した。第１の変形例では、推定部１５２が仮想オブジェクトの姿勢に関する姿勢情報を推定し、姿勢情報に基づいて、複数の魚に関する情報を推定する。これにより、情報処理装置１００は、例えば、各魚の大きさをより精度よく推定することができる。したがって、情報処理装置１００は、複数の魚に関する情報の推定精度を向上させることができる。

　具体的には、推定部１５２は、各撮像画像に対応する集約後の仮想画像に対する物体検出を行う。続いて、推定部１５２は、各仮想画像における各仮想オブジェクトを検出し、検出された各仮想オブジェクトを囲むバウンディングボックスの大きさに基づいて、検出された各仮想オブジェクトの姿勢に関する姿勢情報を推定する。続いて、推定部１５２は、姿勢情報に基づいて、複数の魚に関する情報を推定する。

　図７は、第１の変形例に係る各方向から見た魚の仮想オブジェクトが物体検出により検出された様子を示す図である。図７では、撮像装置１２、２２、３２および４２に対応する仮想カメラ１２´、２２´、３２´および４２´によって集約後の生簀空間を撮像して得られた仮想画像１２Ｃ、２２Ｃ、３２Ｃおよび４２Ｃを示す。また、図７では、仮想画像１２Ｃ、２２Ｃ、３２Ｃおよび４２Ｃには、それぞれ、物体検出により検出された同一の魚６２、６３、６４ならびに６５、および、魚６２、６３、６４ならびに６５を囲むバウンディングボックス５２、５３、５４ならびに５５が含まれている。

　また、推定部１５２は、各バウンディングボックスに入る仮想オブジェクトの姿勢を推定する。具体的には、推定部１５２は、各バウンディングボックスに入る仮想オブジェクトの骨格モデルの曲がり方を推定する。より具体的には、推定部１５２は、骨格モデルを構成するジョイント（関節）とボーン（骨）の組同士の角度を推定する。また、球形のジョイント（関節）と円錐形のボーン（骨）の組をリグと呼ぶ。すなわち、推定部１５２は、各バウンディングボックスに入るには、各リグがどのような角度を保てばよいかを推定する。このようにして、推定部１５２は、各仮想画像で検出された同一の仮想オブジェクトについて、各バウンディングボックスに入る仮想オブジェクトの姿勢を推定する。例えば、推定部１５２は、遺伝的アルゴリズムを用いて、各バウンディングボックスに入ると推定された姿勢情報同士の誤差が最小となるような仮想オブジェクトの姿勢を推定結果としてよい。

　なお、推定部１５２は、遺伝的アルゴリズムを用いる代わりに、機械学習モデルを用いて仮想オブジェクトの姿勢を推定してもよい。例えば、推定部１５２は、各仮想画像で検出された同一の仮想オブジェクトに関する各バウンディングボックスと各バウンディングボックスに含まれる仮想オブジェクトの画像とが入力情報として入力された場合に、各バウンディングボックスに入ると推定される姿勢情報同士の誤差が最小となるような仮想オブジェクトの姿勢情報を出力情報として出力するよう学習された機械学習モデルを用いて、仮想オブジェクトの姿勢を推定してもよい。

　図８は、魚の仮想オブジェクトの骨格モデルと魚の尾斜長の関係を示す図である。図８は、魚の仮想オブジェクト７０と仮想オブジェクト７０の骨格モデル７１と、骨格モデル７１を構成する球形のジョイント（関節）と円錐形のボーン（骨）を示す。図８の上段は、図７に示すようなバウンディングボックスに入っている仮想オブジェクトがＣの字型に体を曲げている様子を示す。推定部１５２は、仮想オブジェクトの姿勢を推定した場合、曲がっている骨格モデルのリグを真っ直ぐに伸ばすことで、仮想オブジェクトの尾斜長を精度よく推定することができる。

　上記では、推定部１５２が、各撮像画像に対応する集約後の仮想画像を用いて、仮想オブジェクトの姿勢を推定する場合について説明したが、推定部１５２は、各撮像画像のうち少なくとも一の撮像画像に対応する集約後の仮想画像を用いて、仮想オブジェクトの姿勢を推定してよい。具体的には、推定部１５２は、人物の姿勢を推定する第１推定モデルに対する転移学習を行うことにより、魚の仮想オブジェクトの姿勢を推定する第２推定モデルを生成する。続いて、推定部１５２は、少なくとも一の撮像画像に対応する集約後の仮想画像を第２推定モデルの入力情報として入力することにより、少なくとも一の撮像画像に対応する集約後の仮想画像に含まれる仮想オブジェクトの姿勢を推定する。

〔３－２．第２の変形例〕
　上述した実施形態では、情報処理装置１００がカメラ魚間距離を推定できる場合について説明した。第２の変形例では、情報処理装置１００がカメラ魚間距離できない場合について説明する。ここで、情報処理装置１００がカメラ魚間距離できない場合とは、例えば、生簀を撮像する各撮像装置がステレオカメラではなく、単眼カメラであるような場合に対応する。

　図９は、第２の変形例に係る魚の仮想オブジェクトの配置方法の一例を示す図である。図９の左側は、生簀空間を上面から眺めた図である。図７では、４方向の仮想カメラそれぞれから同じ位置に複数の仮想オブジェクトが一列に配置されている。また、図７では、各仮想オブジェクトの大きさは同じである。図７では、推定部１５２が、生簀空間における各仮想オブジェクトの位置を仮想カメラの位置から徐々に離していき、仮想カメラに対応する撮像装置によって撮像された撮像画像に撮像された各魚の大きさと同程度の大きさに見える位置まで各仮想オブジェクトを移動させる。推定部１５２は、４方向から同様のことを行い、４方向から見て最もマッチした位置に各仮想オブジェクトを配置する。推定部１５２は、４方向から見たマッチング度合を示す数値が所定の閾値以下である場合には、各方向から見た位置に各仮想オブジェクトを配置する。

〔４．効果〕
　上述したように、実施形態に係る情報処理装置１００は、取得部１５１と推定部１５２を備える。取得部１５１は、複数の魚が所在する生簀を複数の異なる方向それぞれから撮像する複数の撮像装置から、複数の異なる方向それぞれから撮像された複数の撮像画像を取得する。推定部１５２は、取得部１５１によって取得された各撮像画像に対応する撮像装置から各撮像画像に撮像された各魚までの距離に基づいて、各撮像画像に撮像された各魚の生簀における位置を示す第１魚位置情報を撮像画像ごとに推定し、生簀における所定の位置から所定の範囲内の位置に対応する複数の第１魚位置情報を一の魚の位置を示す第２魚位置情報に集約し、第２魚位置情報に基づいて、複数の魚に関する情報を推定する。

　これにより、情報処理装置１００は、複数の魚が所在する生簀を撮像した撮像画像から、生簀に所在する複数の魚それぞれの位置、大きさ、向き、および尾数を精度よく推定することができる。したがって、情報処理装置１００は、画像から生簀に所在する複数の魚に関する情報を精度よく推定することができる。

　また、推定部１５２は、各撮像画像のうち各魚が撮像された領域である魚領域の面積に基づいて、複数の第１魚位置情報の中から魚領域の面積が最も大きい撮像画像に対応する第１魚位置情報を第２魚位置情報として選択することにより、複数の第１魚位置情報を第２魚位置情報に集約する。

　ここで、魚領域の面積が小さい撮像画像に対応する第１魚位置情報よりも、魚領域の面積が大きい撮像画像に対応する第１魚位置情報の方が、第１魚位置情報の精度が高いと考えられる。これにより、情報処理装置１００は、複数の第１魚位置情報の中からより精度の高い第１魚位置情報を第２魚位置情報として選択することができる。

　また、推定部１５２は、生簀に対応する仮想空間における第２魚位置情報に対応する位置に各魚に対応する仮想オブジェクトが配置された仮想空間を複数の撮像装置それぞれに対応する複数の仮想カメラそれぞれによって撮像した複数の仮想画像を生成し、各仮想画像と各仮想画像に対応する各撮像画像との誤差が小さくなるように、各仮想オブジェクトに関するパラメータの値を変化させ、変化させた後の各仮想オブジェクトに関するパラメータの値に基づいて、複数の魚に関する情報を推定する。

　これにより、情報処理装置１００は、各仮想画像と各仮想画像に対応する各撮像画像との比較に基づいて、複数の魚が所在する生簀を撮像した撮像画像から、生簀に所在する複数の魚それぞれの位置、大きさ、向き、および尾数を精度よく推定することができる。

　また、各仮想オブジェクトに関するパラメータの値は、各仮想オブジェクトの位置を示す値、各仮想オブジェクトの向きを示す値、または、各仮想オブジェクトの大きさを示す値である。

　これにより、情報処理装置１００は、複数の魚が所在する生簀を撮像した撮像画像から、生簀に所在する複数の魚それぞれの位置、大きさ、向き、および尾数を精度よく推定することができる。

　また、推定部１５２は、各撮像画像のうち少なくとも一の撮像画像に対応する仮想画像に対する物体検出を行い、仮想画像における各仮想オブジェクトを検出し、検出された各仮想オブジェクトを囲むバウンディングボックスの大きさに基づいて、検出された各仮想オブジェクトの姿勢に関する姿勢情報を推定し、姿勢情報に基づいて、複数の魚に関する情報を推定する。

　これにより、情報処理装置１００は、例えば、各魚の大きさをより精度よく推定することができる。したがって、情報処理装置１００は、複数の魚に関する情報の推定精度を向上させることができる。

　また、複数の魚に関する情報は、生簀における各魚の位置を示す魚位置情報、各魚の向きを示す魚向き情報、各魚の大きさを示す魚サイズ情報、または、複数の魚の数を示す尾数情報である。

　これにより、情報処理装置１００は、養殖業者に対して、出荷サイズの魚が何尾いるかという情報を提供可能とすることができる。

〔５．ハードウェア構成〕
　また、上述してきた実施形態に係る情報処理装置１００は、例えば図１０に示すような構成のコンピュータ１０００によって実現される。図１０は、情報処理装置１００の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ１３００、ＨＤＤ１４００、通信インターフェイス（Ｉ／Ｆ）１５００、入出力インターフェイス（Ｉ／Ｆ）１６００、及びメディアインターフェイス（Ｉ／Ｆ）１７００を備える。

　ＣＰＵ１１００は、ＲＯＭ１３００またはＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

　ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス１５００は、所定の通信網を介して他の機器からデータを受信してＣＰＵ１１００へ送り、ＣＰＵ１１００が生成したデータを所定の通信網を介して他の機器へ送信する。

　ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。ＣＰＵ１１００は、入出力インターフェイス１６００を介して、入力装置からデータを取得する。また、ＣＰＵ１１００は、生成したデータを入出力インターフェイス１６００を介して出力装置へ出力する。

　メディアインターフェイス１７００は、記録媒体１８００に格納されたプログラムまたはデータを読み取り、ＲＡＭ１２００を介してＣＰＵ１１００に提供する。ＣＰＵ１１００は、かかるプログラムを、メディアインターフェイス１７００を介して記録媒体１８００からＲＡＭ１２００上にロードし、ロードしたプログラムを実行する。記録媒体１８００は、例えばＤＶＤ（Digital　Versatile　Disc）、ＰＤ（Phase　change　rewritable　Disk）等の光学記録媒体、ＭＯ（Magneto-Optical　disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

　例えば、コンピュータ１０００が実施形態に係る情報処理装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、制御部１５０の機能を実現する。コンピュータ１０００のＣＰＵ１１００は、これらのプログラムを記録媒体１８００から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。

　以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

〔６．その他〕
　また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

　また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

　また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

　１００　情報処理装置
　１１０　通信部
　１２０　記憶部
　１３０　入力部
　１４０　出力部
　１５０　制御部
　１５１　取得部
　１５２　推定部
　１５３　出力制御部

Claims

　複数の魚が所在する生簀を複数の異なる方向それぞれから撮像する複数の撮像装置から、前記複数の異なる方向それぞれから撮像された複数の撮像画像を取得する取得手順と、
　前記取得手順によって取得された各撮像画像に対応する前記撮像装置から各撮像画像に撮像された各魚までの距離に基づいて、各撮像画像に撮像された各魚の前記生簀における位置を示す第１魚位置情報を前記撮像画像ごとに推定し、前記生簀における所定の位置から所定の範囲内の位置に対応する複数の第１魚位置情報を一の魚の位置を示す第２魚位置情報に集約し、前記第２魚位置情報に基づいて、前記複数の魚に関する情報を推定する推定手順と、
　をコンピュータに実行させる情報処理プログラム。
　前記推定手順は、
　各撮像画像のうち各魚が撮像された領域である魚領域の面積に基づいて、前記複数の第１魚位置情報の中から前記魚領域の面積が最も大きい前記撮像画像に対応する前記第１魚位置情報を前記第２魚位置情報として選択することにより、前記複数の第１魚位置情報を前記第２魚位置情報に集約する、
　請求項１に記載の情報処理プログラム。
　前記推定手順は、
　前記生簀に対応する仮想空間における前記第２魚位置情報に対応する位置に各魚に対応する仮想オブジェクトが配置された前記仮想空間を前記複数の撮像装置それぞれに対応する複数の仮想カメラそれぞれによって撮像した複数の仮想画像を生成し、各仮想画像と各仮想画像に対応する各撮像画像との誤差が小さくなるように、各仮想オブジェクトに関するパラメータの値を変化させ、変化させた後の各仮想オブジェクトに関するパラメータの値に基づいて、前記複数の魚に関する情報を推定する、
　請求項１に記載の情報処理プログラム。
　各仮想オブジェクトに関するパラメータの値は、各仮想オブジェクトの位置を示す値、各仮想オブジェクトの向きを示す値、または、各仮想オブジェクトの大きさを示す値である、
　請求項３に記載の情報処理プログラム。
　前記推定手順は、
　各撮像画像のうち少なくとも一の撮像画像に対応する前記仮想画像に対する物体検出を行い、前記仮想画像における各仮想オブジェクトを検出し、検出された各仮想オブジェクトを囲むバウンディングボックスの大きさに基づいて、検出された各仮想オブジェクトの姿勢に関する姿勢情報を推定し、前記姿勢情報に基づいて、前記複数の魚に関する情報を推定する、
　請求項３に記載の情報処理プログラム。
　前記複数の魚に関する情報は、前記生簀における各魚の位置を示す魚位置情報、各魚の向きを示す魚向き情報、各魚の大きさを示す魚サイズ情報、または、前記複数の魚の数を示す尾数情報である、
　請求項１に記載の情報処理プログラム。
　複数の魚が所在する生簀を複数の異なる方向それぞれから撮像する複数の撮像装置から、前記複数の異なる方向それぞれから撮像された複数の撮像画像を取得する取得部と、
　前記取得部によって取得された各撮像画像に対応する前記撮像装置から各撮像画像に撮像された各魚までの距離に基づいて、各撮像画像に撮像された各魚の前記生簀における位置を示す第１魚位置情報を前記撮像画像ごとに推定し、前記生簀における所定の位置から所定の範囲内の位置に対応する複数の第１魚位置情報を一の魚の位置を示す第２魚位置情報に集約し、前記第２魚位置情報に基づいて、前記複数の魚に関する情報を推定する推定部と、
　を備える情報処理装置。
　情報処理装置が実行するプログラムにより実現される情報処理方法であって、
　複数の魚が所在する生簀を複数の異なる方向それぞれから撮像する複数の撮像装置から、前記複数の異なる方向それぞれから撮像された複数の撮像画像を取得する取得工程と、
　前記取得工程によって取得された各撮像画像に対応する前記撮像装置から各撮像画像に撮像された各魚までの距離に基づいて、各撮像画像に撮像された各魚の前記生簀における位置を示す第１魚位置情報を前記撮像画像ごとに推定し、前記生簀における所定の位置から所定の範囲内の位置に対応する複数の第１魚位置情報を一の魚の位置を示す第２魚位置情報に集約し、前記第２魚位置情報に基づいて、前記複数の魚に関する情報を推定する推定工程と、
　を含む情報処理方法。