WO2023228314A1

WO2023228314A1 - 仕様対応データ推定装置、機械学習方法、仕様対応データ推定方法、及びプログラム

Info

Publication number: WO2023228314A1
Application number: PCT/JP2022/021381
Authority: WO
Inventors: 正彬西野; 健吾中村; 宜仁安田
Original assignee: 日本電信電話株式会社
Priority date: 2022-05-25
Filing date: 2022-05-25
Publication date: 2023-11-30

Abstract

本開示は、様々な仕様に応じて、適切な機械学習を行うことを目的とする。　そのため、本開示は、学習フェーズにおいて、機械学習モデルを所定の仕様に対応して機械学習させる仕様対応データ推定装置３であって、入力データ及び出力データのペアである複数の訓練例のデータ及び当該複数の訓練例のそれぞれが前記所定の仕様を満たすか否かを出力する仕様関数を取得する取得部３１と、前記仕様関数を用いて、前記複数の訓練例のデータのうち前記所定の仕様を満たす所定の訓練例のデータを検証する仕様検証部３２と、前記所定の訓練例のデータにより、前記機械学習モデルを機械学習させる機械学習部３５と、を有する仕様対応データ推定装置である。

Description

仕様対応データ推定装置、機械学習方法、仕様対応データ推定方法、及びプログラム

　本開示は、任意の機械学習モデルに対する入出力データのペアが満たすべき所定の仕様が存在する場合に、入出力データが所為の仕様を満たしつつ予測誤差を小さくすることを可能とする技術に関する。

　Xを入力ドメイン、Yを出力ドメインとする。機械学習とは、Xの要素x_iとYの要素y_iのペアの系列である、訓練例の列S= [(x₁,y₁),(x₂,y₂),…,(x_n,y_n)] が与えられたときに、入力ドメインXから出力ドメインYへの写像である仮説h:X→Yのうち、できるだけ正しくx_iに対応するy_iが予測可能な仮説の集合Hから選択するアルゴリズムである。即ち、機械学習とは、h(x_i)=y_iを満たすような訓練例(x_i,y_i)∈Sが多数存在するような所定の仮説を、与えられた仮説の集合Hから選択する。

　例えば、入力ドメインXとしては、N次元の実数ベクトルの集合、画像の集合、ニュース記事の集合などが考えられる。また、各入力ドメインXに対する各出力ドメインYとしては、実数の集合、画像に映っている物体の名前の集合、ニュースのカテゴリの集合などが考えられる。特に、出力ドメインYが離散的な自然数の有限集合Y={1,2,…,K}であった場合、仮説h∈Hは多クラス分類器とよばれる。また、与えられた入力ドメインx∈Xに対して、仮説を用いて対応する出力ドメインy∈Yを推定する問題のことを多クラス分類問題とよぶ。

　このような機械学習技術を用いて多クラス分類問題を解く方法は広く利用されている。例えば、文書分類問題とは入力として与えられたニュース文書のジャンルを推定する問題であるが、この問題を多クラス分類問題とみなして機械学習技術を用いて解くことができる。

　機械学習技術は幅広い応用分野で利用されるが、機械学習技術が利用される場面によっては、与えられた入力ドメインxに対して、仮説の出力ドメインy=h(x)が満たすべき値が仕様により予め定まっている場合がある。例えば、オンラインショッピングサービスの利用者に対して、利用者が興味を持つと期待される商品を推薦する仕組みは、利用者の集合をX, 推薦の対象となる商品の集合をYとするような多クラス分類問題として定式化できる。機械学習技術を用いてこのような問題を解くと、訓練(学習)例から推定された仮説h:X→Yは、任意の利用者に対して任意の商品を推薦する可能性がある。

　ところが、サービスの規約等によって、未成年者に対して特定の商品群を推薦することが禁止されている場合には、未成年である利用者xに対して、仮説が出力した商品y=h(x)を推薦することは規約違反となる恐れがある。

　通常、仮説の集合Hから推定された仮説h∈Hが仕様（規約）を満たすことを保証することは困難である。そのため、従来は、このような仕様が存在する場合、仕様を加味することが可能な機械学習モデル（仮説の集合）として、例えば、Markov Logic Networksのような特定のモデルを利用する必要があった（非特許文献１参照）。

Matthew Rechardson and Pedro Domingos, "Markov Logic Networks," Machine Learning Vol.62, pp.107-136, 2006.

　しかし、上記未成年者の例に限らず様々な仕様が存在し、様々な仕様に応じてよい性能を発揮する機械学習モデルは異なる。そのため、仕様を満たすことを保証しようとすると、仕様内容に応じた特定の機械学習モデルを選択しなければならないが、様々な機械学習モデルの中から適切な特定のモデルを選択することは現実には困難である。

　本発明は、上記の点に鑑みてなされたものであって、様々な仕様に応じて、適切な機械学習を行うことを目的とする。

　上記課題を解決するため、請求項１に係る発明は、学習フェーズにおいて、機械学習モデルを所定の仕様に対応して機械学習させる仕様対応データ推定装置であって、入力データ及び出力データのペアである複数の訓練例のデータ及び当該複数の訓練例のそれぞれが前記所定の仕様を満たすか否かを出力する仕様関数を取得する取得部と、前記仕様関数を用いて、前記複数の訓練例のデータのうち前記所定の仕様を満たす所定の訓練例のデータを検証する仕様検証部と、前記所定の訓練例のデータにより、前記機械学習モデルを機械学習させる機械学習部と、を有する仕様対応データ推定装置である。

　以上説明したように本発明によれば、様々な仕様に応じて、適切な機械学習を行うことができるという効果を奏する。

本実施形態に係る通信システムの全体構成図である。本実施形態に係る仕様対応データ推定装置の電気的なハードウェア構成図である。本実施形態に係る通信端末の電気的なハードウェア構成図である。学習フェーズにおける仕様対応データ推定装置の機能構成図である。推定フェーズにおける仕様対応データ推定装置の機能構成図である。学習フェ－ズにおいて仕様対応データ推定装置が実行する処理又は動作を示すフローチャートである。推定フェ－ズにおいて仕様対応データ推定装置が実行する処理又は動作を示すフローチャートである。

　以下、図面に基づいて本発明の実施形態を説明する。

　〔実施形態のシステム構成〕
　まず、図１を用いて、本実施形態の通信システムの全体構成略について説明する。図１は、本実施形態に係る通信システムの全体構成図である。

　図１に示されているように、本実施形態の通信システム１は、仕様対応データ推定装置３、及び通信端末５によって構築されている。通信端末５は、ユーザによって管理及び使用される。ユーザは、仕様対応データ推定装置の出力結果を参照して、その後の対応を判断する者である。

　また、仕様対応データ推定装置３と通信端末５は、インターネット等の通信ネットワーク１００を介して通信することができる。通信ネットワーク１００の接続形態は、無線又は有線のいずれでも良い。

　仕様対応データ推定装置３は、単数又は複数のコンピュータによって構成されている。仕様対応データ推定装置３が複数のコンピュータによって構成されている場合には、「仕様対応データ推定装置」と示しても良いし、「仕様対応データ推定システム」と示しても良い。

　仕様対応データ推定装置３は、未成年者に対して特定の商品群を推薦することが禁止されている等の様々な仕様(規約)に応じて、適切な機械学習及び推定を行う。

　通信端末５は、コンピュータであり、図１では、一例としてノート型パソコンが示されている。図１では、ユーザが、通信端末５を操作する。なお、通信端末５を用いずに、仕様対応データ推定装置３単独で処理をしてもよい。

　〔ハードウェア構成〕
　＜仕様対応データ推定装置のハードウェア構成＞
　次に、図２を用いて、仕様対応データ推定装置３の電気的なハードウェア構成を説明する。図２は、仕様対応データ推定装置の電気的なハードウェア構成図である。

　仕様対応データ推定装置３は、コンピュータとして、図２に示されているように、ＣＰＵ(Central Processing Unit)３０１、ＲＯＭ(Read Only Memory)３０２、ＲＡＭ(Random Access Memory)３０３、ＳＳＤ(Solid State Drive)３０４、外部機器接続Ｉ／Ｆ(Interface)３０５、ネットワークＩ／Ｆ３０６、メディアＩ／Ｆ３０９、及びバスライン３１０を備えている。

　これらのうち、ＣＰＵ３０１は、仕様対応データ推定装置３全体の動作を制御する。ＲＯＭ３０２は、ＩＰＬ(Initial Program Loader)等のＣＰＵ３０１の駆動に用いられるプログラムを記憶する。ＲＡＭ３０３は、ＣＰＵ３０１のワークエリアとして使用される。

　ＳＳＤ３０４は、ＣＰＵ３０１の制御に従って各種データの読み出し又は書き込みを行う。なお、ＳＤＤ３０４の代わりに、ＨＤＤ(Hard Disk Drive)を用いても良い。

　外部機器接続Ｉ／Ｆ３０５は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、ディスプレイ、スピーカ、キーボード、マウス、ＵＳＢ(Universal Serial Bus)メモリ、及びプリンタ等である。

　ネットワークＩ／Ｆ３０６は、通信ネットワーク１００を介してデータ通信をするためのインターフェースである。

　メディアＩ／Ｆ３０９は、フラッシュメモリ等の記録メディア３０９ｍに対するデータの読み出し又は書き込み（記憶）を制御する。記録メディア３０９ｍには、ＤＶＤ(Digital Versatile Disc)やＢｌｕ-ｒａｙＤｉｓｃ（登録商標）等も含まれる。

　バスライン３１０は、図２に示されているＣＰＵ３０１等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。

　＜通信端末のハードウェア構成＞
　次に、図３を用いて、通信端末５の電気的なハードウェア構成を説明する。図３は、通信端末の電気的なハードウェア構成図である。

　通信端末５は、コンピュータとして、図３に示されているように、ＣＰＵ５０１、ＲＯＭ５０２、ＲＡＭ５０３、ＳＳＤ５０４、外部機器接続Ｉ／Ｆ(Interface)５０５、ネットワークＩ／Ｆ５０６、ディスプレイ５０７、ポインティングデバイス５０８、メディアＩ／Ｆ５０９、及びバスライン５１０を備えている。

　これらのうち、ＣＰＵ５０１は、通信端末５全体の動作を制御する。ＲＯＭ５０２は、ＩＰＬ等のＣＰＵ５０１の駆動に用いられるプログラムを記憶する。ＲＡＭ５０３は、ＣＰＵ５０１のワークエリアとして使用される。

　ＳＳＤ５０４は、ＣＰＵ５０１の制御に従って各種データの読み出し又は書き込みを行う。なお、ＳＳＤ５０４の代わりに、ＨＤＤ(Hard Disk Drive)を用いてもよい。

　外部機器接続Ｉ／Ｆ５０５は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、ディスプレイ、スピーカ、キーボード、マウス、ＵＳＢメモリ、及びプリンタ等である。

　ネットワークＩ／Ｆ５０６は、通信ネットワーク１００を介してデータ通信をするためのインターフェースである。

　ディスプレイ５０７は、各種画像を表示する液晶や有機ＥＬ(Electro Luminescence)などの表示手段の一種である。

　ポインティングデバイス５０８は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。なお、ユーザがキーボードを使う場合は、ポインティングデバイス５０８の機能をＯＦＦにしてもよい。

　メディアＩ／Ｆ５０９は、フラッシュメモリ等の記録メディア５０９ｍに対するデータの読み出し又は書き込み（記憶）を制御する。記録メディア５０９ｍには、ＤＶＤやＢｌｕ-ｒａｙＤｉｓｃ（登録商標）等も含まれる。

　バスライン５１０は、図４に示されているＣＰＵ５０１等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。

　〔仕様対応データ推定装置の機能構成〕
　続いて、本実施形態に係る仕様対応データ推定装置３の学習フェーズ及び推定（予測）フェーズにおける機能構成について説明する。

　ここで、入力ドメインをX、出力ラベルをYとする。以下では、Yは離散的な値の集合Y={1,2,…,K}とする。仮説の関数hは、Xの要素を受け取りYの要素を出力する関数であり、hと表現する。

　＜学習フェーズの機能構成＞
　学習フェーズの仕様対応データ推定装置３は、訓練例の集合S'=[(x₁,y₁),(x₂,y₂),…,(x_n,y_n)]と、仮説hの有限又は無限の集合Hに基づいて、訓練損失

を最小とするような仮説

を選択する。ここで仮説の集合Hとしては、例えばパラメータ

によって特徴づけられるすべてのニューラルネットワークの集合などが該当する。

はパラメータに特定の値を設定したときのニューラルネットワークなどを表す。

は損失関数であり、２つの引数y,y'∈Yを受け取り、非負実数を出力する。

　損失関数は２つの入力の相違度合いに応じて大きな値を出力する関数であり、例えば0-1損失

は、y＝y'であるならば

を出力し、y≠y'ならば

を出力する関数である。

　続いて、学習フェーズにおける仕様対応データ推定装置３の各機能について詳細に説明する。図４は、学習フェーズにおける仕様対応データ推定装置の機能構成図である。

　図４に示すように、仕様対応データ推定装置３は、取得部３１、仕様検証部３２、及び機械学習部３５を有する。これら各部は、プログラムに基づき図２のＣＰＵ３０１による命令によって実現される機能である。また、ＲＡＭ３０３又はＳＳＤ３０４には、機械学習モデル３０ａが記憶されている。

　取得部３１は、通信端末７から、訓練例データS(入力データx,出力データy)と仕様関数cを取得する。取得部３１は、機械学習用の学習データを入力するための入力部としての役割も果たす。具体的には、取得部３１は、通信端末５等のような外部から、複数の訓練例のデータS=[(x₁,y₁),…,(x_n,y_n)]と、複数の訓練例のそれぞれが所定の仕様Aを満たすか否かを出力する仕様関数ｃとを取得する。ここで、仕様関数ｃは入出力データのペア(x,y)∈X×Yを受け取り、それが所定の仕様を満たすか否かを示す結果情報を出力する関数c(x,y)である。仕様関数c(x,y)は入出力データのペア(x,y)が仕様を満たす場合にはc(x,y)=1を出力し、満たさない場合にはc(x,y)=0を出力する。また、所定の仕様Aは、例えば、未成年者に特定の商品群又はサービス群を推薦することが禁止されている場合のように、提供される者に対する年齢制限が挙げられる。

　仕様検証部３２は、取得部３１によって取得された仕様関数ｃを用いて、複数の訓練例のデータSのうち、所定の仕様Aを満たす所定の訓練例のデータS'を検証する。この場合、仕様検証部３２は、推定フェーズで利用するために、仕様関数cを管理（保持）しておく。具体的には、仕様検証部３２は、取得部３１から取得された仕様関数cを用いて、訓練例S中のペア(x_i,y_i)が上記所定の仕様Aを満たすか否かを検証する。

　機械学習部３５は、訓練例の集合S'に対する訓練損失が最小となるような仮説h(入力データx,出力データy)に基づいて、機械学習モデル３０ｇを機械学習させる。具体的には、機械学習部３５は、仕様検証部３２から、所定の仕様Aを満たす所定の訓練例S'のみを受け取って訓練損失を最小とするような仮説

を求める処理を実行する。

　＜推定フェーズの機能構成＞
　推論フェーズの仕様対応データ推定装置３は、学習フェーズによって推定された仮説

と、入力データx∈Xに基づいて、

を出力する。なお、以下では仮説h:X→Yは、(x,y)∈X×Yを引数として受け取り実数を出力する関数h(x,y)によって、

として定義されるとする。ニューラルネットワークなど、条件付き確率分布

を表す仮説はこの定義に該当する。

　続いて、推定フェーズにおける仕様対応データ推定装置３の各機能について詳細に説明する。図５は、推定フェーズにおける仕様対応データ推定装置の機能構成図である。

　図５に示すように、仕様対応データ推定装置３は、取得部３１、仕様検証部３２、推定部３７、及び出力部３９を有する。これら各部は、プログラムに基づき図２のＣＰＵ３０１による命令によって実現される機能である。また、ＲＡＭ３０３又はＳＳＤ３０４には、学習済み機械学習モデル３０ｂが記憶されている。なお、学習フェーズにおける機能構成と同様の機能構成については、同一の符号を付して説明を省略する。

　推定部３７は、学習済みの機械学習モデル３０ｂを用いると共に、仕様検証部３２で管理されている仕様関数cにより所定の仕様を満たす出力データyを推定して出力する。具体的には、推定部３７は、学習フェーズで得られた仮説

と、仕様関数cとを用いて、c(x,y)=1を満たす適切なy∈Yを求める。

　なお、yは

として求められる。

　出力部３９は、推定部３７によって推定された所定の仕様を満たす出力データyを示す推定結果の情報を、仕様対応データ推定装置３から出力する。出力する例としては、図２の外部機器接続Ｉ／Ｆ３０５に接続されたディスプレイに表示させる場合、ネットワークＩ／Ｆ３０６を介して外部装置に送信する場合等が挙げられる。

　〔仕様対応データ推定装置の処理又は動作〕
　続いて、図６及び図７を用いて、仕様対応データ推定装置３の学習フェーズ及び推定フェーズにおける処理又は動作について説明する。

　＜学習フェーズにおける処理又は動作＞
　図６は、学習フェーズにおいて仕様対応データ推定装置が実行する処理又は動作を示すフローチャートである。

　Ｓ１１：取得部３１は、通信端末７から又は自装置（仕様対応データ推定装置）に対する直接の入力に基づき、訓練例S(入力データx,出力データy)と仕様関数cを取得する。

　Ｓ１２：仕様検証部３２は、取得部３１によって取得された訓練例Sから、取得部３１によって取得された仕様関数cを満たす所定の訓練例の集合S'を出力する。この場合、仕様検証部３２は、推定フェーズで利用するために、仕様関数cを保持しておく。

　例えば、仕様検証部３２は、取得部３１から入力された訓練例データSから、仕様関数c(x_i,y_i)=1を満たす全てのサンプルを選択して得られる集合データ

を作成する。

　Ｓ１３：機械学習部３５は、訓練例の集合データS'に対する訓練損失が最小となるような仮説h(入力データx,出力データy)に基づいて、機械学習モデル３０ａを機械学習させる。機械学習モデル３０ａは、既存のアルゴリズムを用いる。

　これによって、仕様対応データ推定装置３は、外部の仕様を加味しつつ、推定誤りの少ない仮説を選択できることを理論的に示すことができる。

　以上により、学習フェーズの処理又は動作の説明が終了する。

　＜推定フェーズにおける処理又は動作＞
　図７は、推定フェーズにおいて仕様対応データ推定装置が実行する処理又は動作を示すフローチャートである。

　Ｓ２１：取得部３１は、通信端末７から又は自装置（仕様対応データ推定装置３）に対する直接の入力に基づき、取得部３１は、入力データx∈Xを取得する。

　Ｓ２２：推定部３７は、学習済みの機械学習モデル３０ｂを用いると共に、仕様検証部３２で管理（保持）されている仕様関数cにより所定の仕様Aを満たす出力データyを出力する。

　Ｓ２３：出力部３９は、推定結果の情報を出力する。

　以上により、推定フェーズの処理又は動作の説明が終了する。

　〔実施形態の効果〕
　以上説明したように本実施形態によれば、様々な仕様(規約)に応じて、適切な機械学習を行うことができるという効果を奏する。

　〔補足〕
　本発明は上述の実施形態に限定されるものではなく、以下に示すような構成又は処理（動作）であってもよい。
（１）仕様対応データ推定装置３はコンピュータとプログラムによっても実現できるが、このプログラムを（非一時的な）記録媒体に記録することも、通信ネットワーク１００を介して提供することも可能である。
（２）仕様対応データ推定装置３と通信端末５との間の通信において、他の装置（サーバ、ルータ等）がデータを中継してもよい。例えば、本明細書では、簡略化のために、仕様対応データ推定装置３の入力部３１が通信端末５に対してデータを送信する旨が記載しているが、この送信処理には、他の装置がデータを中継する場合も含まれる趣旨である。
（３）上記実施形態では、通信端末５の一例としてノート型パソコンが示されているが、これに限るものではなく、例えば、デスクトップパソコン、タブレット端末、スマートフォン、スマートウォッチ、カーナビゲーション装置、冷蔵庫、電子レンジ等であってもよい。
（４）各ＣＰＵ３０１，５０１は、単一だけでなく、複数であってもよい。

１　通信システム
３　仕様対応データ推定装置
５　通信端末
３０ａ　機械学習モデル
３０ｂ　学習済み機械学習モデル
３１　取得部（入力部）
３２　仕様検証部
３５　機械学習部
３７　推定部
３９　出力部

Claims

　学習フェーズにおいて、機械学習モデルを所定の仕様に対応して機械学習させる仕様対応データ推定装置であって、
　入力データ及び出力データのペアである複数の訓練例のデータ及び当該複数の訓練例のそれぞれが前記所定の仕様を満たすか否かを出力する仕様関数を取得する取得部と、
　前記仕様関数を用いて、前記複数の訓練例のデータのうち前記所定の仕様を満たす所定の訓練例のデータを検証する仕様検証部と、
　前記所定の訓練例のデータにより、前記機械学習モデルを機械学習させる機械学習部と、
　を有する仕様対応データ推定装置。
　前記所定の仕様は、提供される者に対する年齢制限を示す、請求項１に記載の仕様対応データ推定装置。
　学習フェーズにおいて、機械学習モデルを所定の仕様に対応して機械学習させる仕様対応データ推定装置が実行する機械学習方法であって、
　前記仕様対応データ推定装置は、
　入力データ及び出力データのペアである複数の訓練例のデータ及び当該複数の訓練例のそれぞれが前記所定の仕様を満たすか否かを出力する仕様関数を取得する取得処理と、
　前記仕様関数を用いて、前記複数の訓練例のデータのうち前記所定の仕様を満たす所定の訓練例のデータを検証する仕様検証処理と、
　前記所定の訓練例のデータにより、前記機械学習モデルを機械学習させる機械学習処理と、
　を実行する機械学習方法。
　コンピュータに、請求項３に記載の方法を実行させるプログラム。
　推定フェーズにおいて、学習済み機械学習モデルを用いて所定の仕様に対応した推定を行う仕様対応データ推定装置であって、
　所定の入力データを取得する取得部と、
　学習済み機械学習モデルを用いると共に、入力データ及び出力データのペアである複数の訓練例のそれぞれが前記所定の仕様を満たすか否かを出力する仕様関数により前記所定の仕様を満たす出力データを推定する推定部と、
　推定された前記出力データを示す推定結果の情報を出力する出力部と、
　を有する仕様対応データ推定装置。
　前記所定の仕様は、提供される者に対する年齢制限を示す、請求項５に記載の仕様対応データ推定装置。
　推定フェーズにおいて、学習済み機械学習モデルを用いて所定の仕様に対応した推定を行う仕様対応データ推定装置が実行する仕様対応データ推定方法であって、
　前記仕様対応データ推定装置は、
　所定の入力データを取得する取得処理と、
　学習済み機械学習モデルを用いると共に、入力データ及び出力データのペアである複数の訓練例のそれぞれが前記所定の仕様を満たすか否かを出力する仕様関数により前記所定の仕様を満たす出力データを推定する推定処理と、
　推定された前記出力データを示す推定結果の情報を出力する出力処理と、
　を実行する仕様対応データ推定方法。
　コンピュータに、請求項７に記載の方法を実行させるプログラム。