JP7354721B2 - 情報処理プログラム、情報処理方法および情報処理装置 - Google Patents

情報処理プログラム、情報処理方法および情報処理装置 Download PDF

Info

Publication number
JP7354721B2
JP7354721B2 JP2019174350A JP2019174350A JP7354721B2 JP 7354721 B2 JP7354721 B2 JP 7354721B2 JP 2019174350 A JP2019174350 A JP 2019174350A JP 2019174350 A JP2019174350 A JP 2019174350A JP 7354721 B2 JP7354721 B2 JP 7354721B2
Authority
JP
Japan
Prior art keywords
rule
learning model
input data
information
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019174350A
Other languages
English (en)
Other versions
JP2021051576A (ja
Inventor
憲二 大木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019174350A priority Critical patent/JP7354721B2/ja
Publication of JP2021051576A publication Critical patent/JP2021051576A/ja
Application granted granted Critical
Publication of JP7354721B2 publication Critical patent/JP7354721B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明の実施形態は、情報処理プログラム、情報処理方法および情報処理装置に関する。
近年、機械学習による学習モデルを用いて業務判断を自動化する事例が増加している。自動化する業務判断には、経理担当者が購入依頼品に対して所定の経費コードを付与する、購買受付担当者が購入案件に該当する担当者を設定する等がある。学習モデルを用いた業務判断では、購入依頼品、購入案件を入力データとし、教師あり学習で学習した学習モデルを用いて経費コードや担当者などのラベル付け(クラス分類)を行う。
このような学習モデルを用いた業務判断の自動化では、業務判断の基準が変わる等のコンセプトドリフトにより判断精度が劣化することがあり、コンセプトドリフトに対する適切な対処は業界上の課題である。
このコンセプトドリフトに対処する従来技術としては、コンセプトドリフトの発生タイミングを検知して、コンセプトドリフト発生以降のデータを用いて機械学習をすることで学習モデルを更新するものが知られている。
J. Gama, P. Medas, G. Castillo, and P. Rodrigues. Learning with drift detection. In Proc. of the 17th Brazilian Symposium on Artificial Intelligence , pages 286-295, 2004.
しかしながら、上記の従来技術では、コンセプトドリフト発生以降に正解データを一定期間採取してモデルの更新を行ってからでないと判断精度の向上が見込めないという問題がある。このため、コンセプトドリフトに対して速やかに適切な対処を行うことが困難であった。
1つの側面では、コンセプトドリフトに適切に対処できる情報処理プログラム、情報処理方法および情報処理装置を提供することを目的とする。
1つの案では、情報処理プログラムは、特定する処理と、記憶する処理と、更新する処理と、抽出する処理と、削除する処理とをコンピュータに実行させる。特定する処理は、入力データに対して、当該入力データに合致するルールが予め設定されたルール定義情報に含まれる場合には当該ルール定義情報のルールに基づいて入力データに対応するラベルを特定し、ルール定義情報に含まれない場合には学習モデルを用いて入力データに対応するラベルを特定する。記憶する処理は、入力データと、特定したラベルとを予測済み情報として記憶する。更新する処理は、記憶した予測済み情報を教師データとして学習モデルを更新する。抽出する処理は、ルール定義情報に含まれるルールの中で学習モデルに包含されているルールを抽出する。削除する処理は、抽出した学習モデルに包含されているルールをルール定義情報から削除する。
1つの実施態様によれば、コンセプトドリフトに適切に対処できる。
図1は、実施形態にかかる情報処理装置の概要を説明する説明図である。 図2は、ルール定義の一例を示す説明図である。 図3は、学習モデルの概要を説明する説明図である。 図4は、学習モデルの更新を説明する説明図である。 図5は、ルール実行処理の一例を示すフローチャートである。 図6は、ルール整理処理の一例を示すフローチャートである。 図7は、プログラムを実行するコンピュータの一例を示すブロック図である。
以下、図面を参照して、実施形態にかかる情報処理プログラム、情報処理方法および情報処理装置を説明する。実施形態において同一の機能を有する構成には同一の符号を付し、重複する説明は省略する。なお、以下の実施形態で説明する情報処理プログラム、情報処理方法および情報処理装置は、一例を示すに過ぎず、実施形態を限定するものではない。また、以下の各実施形態は、矛盾しない範囲内で適宜組みあわせてもよい。
図1は、実施形態にかかる情報処理装置の概要を説明する説明図である。図1に示す情報処理装置1は、業務等で入力された入力データ11対するラベル付け(クラス分類)を判断結果として出力することで、業務判断の自動化を支援する装置である。情報処理装置1としては、例えばパーソナルコンピュータ等を適用できる。
自動化する業務判断は、例えば、経理担当者が購入依頼品に対して所定の経費コードを付与する、購買受付担当者が購入案件に該当する担当者を設定する等、様々である。本実施形態において、情報処理装置1は、経理担当者が購入依頼品の名称を入力データ11として入力し、購入依頼品に対応する経費コードをラベルとして出力するものとする。
具体的には、図1に示すように、情報処理装置1は、入力部10と、ルール実行部20と、記憶部30と、モデル更新部40と、ルール整理部50と、出力部60とを有する。
入力部10は、入力データ11の入力を受け付ける処理部である。入力部10は、受け付けた入力データ11をルール実行部20へ出力する。
ルール実行部20は、入力データ11に対して、対応するラベルを特定するルール実行処理(S1~S3)を行う処理部である。具体的には、ルール実行部20は、入力データ11についてルール定義31に含まれる各ルールと照合し、ルール定義31に含まれるルールに合致するか否かを判定する(S1)。
判定の結果、入力データ11がルール定義31に含まれるルールに合致する場合(S1:Yes)、ルール実行部20は、ルール定義31のルールに基づいて入力データ11に対するラベルを特定し、特定したラベルを出力する(S2)。具体的には、ルール実行部20は、ルール定義31のルールにおいて定義済みのラベルを出力する。
また、判定の結果、入力データ11がルール定義31に含まれるルールに合致しない場合(S1:No)、ルール実行部20は、学習モデル32を用いて入力データ11に対する予測値を得てラベルを特定し、特定したラベルを出力する(S3)。
図2は、ルール定義31の一例を示す説明図である。図2に示すように、ルール定義31は、ラベルを特定するためのルール(条件)と、条件に一致する場合に付与するラベル(動作)とがルールを識別する識別情報(ルールID)に対応付けて予め定義された定義情報である。すなわち、ルール定義31は、ルール定義情報の一例である。
例えば、ルール定義31において、ルールIDが「1」のルールは、“品名”が“DEF”を含む場合に、“codeA”をラベルとして付与する。また、ルールIDが「2」のルールは、“品名”が“EFGサーバ”に一致する場合に、“codeB”をラベルとして付与する。
ルール定義31については、例えば、BRMS(Business Rule Management System)などのルール解釈に関するエンジンに対応する記述となっており。業務判断の変更を伴う業務システムの更新時などにユーザが予め登録する。
ルール実行部20は、入力データ11に対して、BRMSを呼び出してルール定義31に合致する動作を得る。例えば、ルール実行部20は、“DEFサーバ”という品名を含む入力データ11が与えられた場合、BRMSを呼び出すことで、ルールIDが「1」の条件に合致することから“codeA”のラベルを得る。よって、ルール実行部20は、“codeA”を入力データ11に対するラベルとして出力する。
また、ルール実行部20は、“EFHサーバ”という品名を含む入力データ11が与えられた場合、BRMSを呼び出すことで、ルール定義31に該当するルールがないことから、合致なし(動作無し)との結果を得る。よって、ルール実行部20は、学習モデル32を用いて“EFHサーバ”という品名を含む入力データ11に対する予測値(ラベル)を得て、そのラベル出力する。
図3は、学習モデル32の概要を説明する説明図である。図3に示すように、学習モデル32は、サンプルとする品名(x)と、品名(x)に対する正解のラベルであるコード(y)とを複数有する教師データ12をもとに、教師ありの機械学習を行うことで構築される。ルール実行部20は、このように構築された学習モデル32を用いることで、新規の入力データ11に対するコードを推測できる。
例えば、ルール実行部20は、“EFHサーバ”という品名を含む入力データ11に対し、図3の教師データ12をもとに構築した学習モデル32を用いることで“codeB”を得る。
ルール実行部20は、入力データ11に対し、S2、S3において出力(予測)したラベルを予測済みデータ33として出力する。具体的には、ルール実行部20は、入力データ11と、特定したラベルとを予測済みデータ33として記憶部30に格納する。すなわち、予測済みデータ33は、予測済み情報の一例である。なお、ルール実行部20は、ルール定義31のルールに基づいてラベルを特定した場合(S2)には、どのルールに合致して予測を行っているかを示すルールIDを適用ルールIDとして予測済みデータ33に含める。
記憶部30は、ルール定義31、学習モデル32および予測済みデータ33を記憶する処理部である。具体的には、記憶部30は、メモリなどの記憶装置に確保した記憶領域にルール定義31、学習モデル32および予測済みデータ33を記憶する。
モデル更新部40は、教師データ12を用いて学習モデル32の更新を行う処理部である。具体的には、モデル更新部40は、記憶部30が記憶した予測済みデータ33を教師データとして学習モデル32の更新を行う。なお、モデル更新部40が学習モデル32の更新を行うタイミングとしては、例えば、前回の学習モデル32の更新から一定期間経過した場合や、予測済みデータ33が一定量貯まった場合などがある。
図4は、学習モデル32の更新を説明する説明図である。図4に示すように、予測済みデータ33は、例えば、入力データ11として与えられた品名(x)と、ルール実行部20が予測した予測コード(y)と、正解コード(y’)と、適用ルールIDとを有する。
正解コード(y’)は、ユーザなどによって与えられた正解値のラベルであり、予測コード(y)に対して特にユーザからの修正がない場合は予測コード(y)の値がそのまま正解コード(y’)となる。なお、予測コード(y)に対してユーザからの修正があった場合は、修正値が正解コード(y’)となる。適用ルールIDは、ルール定義31のルールに基づいてラベルを特定した場合(S2)の、どのルールに合致して予測を行っているかを示すルールIDである。
モデル更新部40は、予測済みデータ33における品名(x)と、品名(x)に対する正解のラベル正解コード(y’)とをもとに、教師ありの機械学習を行うことで学習モデル32を更新する。このように、モデル更新部40は、予測済みデータ33を教師データとする教師ありの機械学習により学習モデル32を更新することで、ルール定義31のルールに基づいてラベルを特定したケースについても、順次学習を行うことができる。
ルール整理部50は、ルール定義31に含まれるルールの中で、学習モデル32を用いてラベルを特定できるようになったルール、すなわち学習モデル32に包含されているルールを不要なルールとして整理する処理部である。具体的には、ルール整理部50は、ルール定義31に含まれるルールの中で学習モデル32に包含されているルールを抽出し、抽出した学習モデル32に包含されているルールをルール定義31から削除する。
より具体的には、ルール整理部50は、学習モデル32の更新を検知すると(S4)、ルール定義31のルールを整理するためのルール整理処理(S5、S6)を実行する。なお、学習モデル32に関する更新の検知は、例えば、モデル更新部40からの更新の通知、学習モデル32の更新日時のチェックなどにより行う。
ルール整理処理を開始すると、ルール整理部50は、ルール定義31に含まれる各ルールが学習モデル32に包含されているか否かを判定し(S5)、包含されていると判定したルールを抽出する。次いで、ルール整理部50は、抽出した学習モデル32に包含されているルールをルール定義31から削除する(S6)。
なお、学習モデル32に包含されているルールの判別について、ルール整理部50は、ルール定義31に含まれるルールに合致する入力データ11に対して、学習モデル32を用いて特定したラベルと、ルール定義31のルールに基づいて特定したラベルとが合致するか否かに基づいて判別する。合致する場合は、学習モデル32を用いてルール定義31と同じようにラベルを特定できることから、ルール整理部50は、学習モデル32に包含されているものと判別する。
このように、ルール整理部50は、ルール定義31に含まれるルールの中で学習モデル32に包含されているルールを削除することで、ルール定義31におけるルールの肥大化を防ぐことができる。
出力部60は、入力データ11に対する予測結果を出力する処理部である。具体的には、出力部60は、入力データ11に対する予測結果(予測コード(y))を予測済みデータ33より読み出し、ディスプレイやファイルなどに出力する。これにより、ユーザは、入力データ11に対する業務判断(入力データ11対するラベル付け(クラス分類))を容易に得ることができる。
このとき、出力部60は、ユーザインタフェースを介したユーザからの指示により、予測結果に対する修正を受け付けた場合、修正値を正解コード(y’)として予測済みデータ33に格納する。なお、修正がない場合、出力部60は、予測結果(予測コード(y))をそのまま正解コード(y’)として予測済みデータ33に格納してもよい。
ここで、ルール実行処理の詳細を説明する。図5は、ルール実行処理の一例を示すフローチャートである。
図5に示すように、処理が開始されると、ルール実行部20は、ルール定義31から入力データ11の条件に合致するルールを取得する(S10)。次いで、ルール実行部20は、ルール定義31の各ルールの中に入力データ11の条件に合致したルールがあるか否かを判定する(S11)。
合致したルールがある場合(S11:Yes)、ルール実行部20は、ルール定義31において合致したルールの動作に記載されている値(ラベル)を予測結果とする(S12)。次いで、ルール実行部20は、予測済みデータ33に入力データ11における品名(x)と、予測結果(予測コード(y))、合致したルールID(適用ルールID)を格納する(S13)。
合致したルールがない場合(S11:No)、ルール実行部20は、入力データ11に対して学習モデル32を実行した結果を予測結果(ラベル)とする(S14)。次いで、ルール実行部20は、予測済みデータ33に入力データ11における品名(x)と、予測結果(予測コード(y))を格納する(S15)。
S13、S15に次いで、出力部60は、入力データ11に対する予測結果(予測コード(y))を予測済みデータ33より読み出して出力する(S16)。
次に、ルール整理処理の詳細を説明する。図6は、ルール整理処理の一例を示すフローチャートである。図6に示すように、処理が開始されると、ルール整理部50は、予測済みデータ33を逐次取り出してS20~S25のループ処理を行う。
具体的には、ルール整理部50は、予測済みデータ33を取り出し(S20)、適用ルールIDを取得し(S21)、ルールIDが空であるか否かを判定する(S22)。
適用ルールIDにルールIDが記載されている場合(S22:No)、予測済みデータ33は、ルール定義31に含まれるルールに合致する入力データ11に対し、ルール定義31のルールで予測結果(ラベル)を得たデータである。
したがって、適用ルールIDにルールIDが記載されている場合(S22:No)、ルール整理部50は、更新された学習モデル32で予測済みデータ33に含まれる入力データ(品名(x))に対する予測値を求める(S23)。次いで、ルール整理部50は、S23で求めた予測値と、予測済みデータ33に含まれる正解コード(y’)の一致性を記録する(S24)。
また、適用ルールIDにルールIDが記載されていない場合(S22:Yes)、予測済みデータ33は、ルール定義31に含まれるルールに合致しない入力データ11に対し、学習モデル32を用いて予測結果(ラベル)を得たデータである。したがって、適用ルールIDにルールIDが記載されていない場合(S22:Yes)、予測済みデータ33は、S23、S24の処理をスキップする。このように、ルール整理部50は、予測済みデータ33の中でルール定義31のルールに基づいてラベルを特定したデータを用いてルール整理処理を行う(S25)。
次いで、ルール整理部50は、S24で記録した一致性をもとに、ルールIDごとに正解率を求める(S26)。具体的には、ルール整理部50は、ルールIDごとに、総件数に対する一致する件数の割合から正解率を求める。
次いで、ルール整理部50は、ルールIDごとに求めた正解率をもとに、正解率が所定の閾値以上のルールIDを抽出する(S27)。次いで、ルール整理部50は、抽出したルールIDを持つルールをルール定義31から除去し(S28)、処理を終了する。
例えば、正解率が所定の閾値以上であれば、学習モデル32を用いてルール定義31と同じようにラベルを特定できていると言える。したがって、ルール整理部50は、正解率が所定の閾値以上であるルールを学習モデル32に包含されているものとみなし、ルール定義31より除去する。
以上のように、情報処理装置1は、ルール実行部20と、記憶部30と、モデル更新部40と、ルール整理部50とを有する。ルール実行部20は、入力データ11に対して、入力データ11に合致するルールが予め設定されたルール定義31に含まれる場合にはルール定義31のルールに基づいて入力データ11に対応するラベルを特定する。また、ルール実行部20は、入力データ11に対して、入力データ11に合致するルールがルール定義31に含まれない場合には学習モデル32を用いて入力データ11に対応するラベルを特定する。記憶部30は、入力データ11と、ルール実行部20が特定したラベルとを予測済みデータ33として記憶する。モデル更新部40は、記憶部30が記憶した予測済みデータ33を教師データとして学習モデル32を更新する。ルール整理部50は、ルール定義31に含まれるルールの中で学習モデル32に包含されているルールを抽出する。ルール整理部50は、抽出した学習モデル32に包含されているルールをルール定義31から削除する。
これにより、情報処理装置1では、コンセプトドリフトに関するルールをルール定義31として予め登録しておくことで、学習モデル32がコンセプトドリフトに未対応の間はルール定義31のルールに基づいてラベルの予測を行うので、コンセプトドリフトに適切に対処することができる。
また、ルール整理部50は、ルール定義31に含まれるルールに合致する入力データに対して、学習モデル32を用いて特定したラベルと、当該ルールに基づいて特定したラベルとが合致するか否かに基づき、ルール定義31に含まれるルールが学習モデル32に包含されているルールであるか否かを判別する。これにより、情報処理装置1は、ルール定義31に含まれるルールに合致する入力データ(例えば予測済みデータ33)を用いて、ルール定義31に含まれるルールが学習モデル32に包含されているか否かを判別できる。
また、ルール整理部50は、学習モデル32の更新を検知した場合に、学習モデル32に包含されているルールをルール定義31より抽出し、抽出したルールをルール定義31から削除する。これにより、情報処理装置1は、学習モデル32の更新によって学習モデル32がルール定義31に含まれるルールを包含するようになった場合、そのルールを速やかにルール定義31より削除できる。
なお、図示した各装置の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
情報処理装置1で行われる各種処理機能は、CPU(またはMPU、MCU(Micro Controller Unit)等のマイクロ・コンピュータ)上で、その全部または任意の一部を実行するようにしてもよい。また、各種処理機能は、CPU(またはMPU、MCU等のマイクロ・コンピュータ)で解析実行されるプログラム上、またはワイヤードロジックによるハードウエア上で、その全部または任意の一部を実行するようにしてもよいことは言うまでもない。また、情報処理装置1で行われる各種処理機能は、クラウドコンピューティングにより、複数のコンピュータが協働して実行してもよい。
ところで、上記の実施形態で説明した各種の処理は、予め用意されたプログラムをコンピュータで実行することで実現できる。そこで、以下では、上記の実施例と同様の機能を有するプログラムを実行するコンピュータ(ハードウエア)の一例を説明する。図7は、プログラムを実行するコンピュータの一例を示すブロック図である。
図7に示すように、コンピュータ100は、各種演算処理を実行するCPU101と、データ入力を受け付ける入力装置102と、モニタ103と、スピーカ104とを有する。また、コンピュータ100は、記憶媒体からプログラム等を読み取る媒体読取装置105と、各種装置と接続するためのインタフェース装置106と、有線または無線により外部機器と通信接続するための通信装置107とを有する。また、コンピュータ100は、各種情報を一時記憶するRAM108と、ハードディスク装置109とを有する。また、コンピュータ100内の各部(101~109)は、バス110に接続される。
ハードディスク装置109には、上記の実施形態で説明した各種の処理を実行するためのプログラム111が記憶される。また、ハードディスク装置109には、プログラム111が参照する各種データ112が記憶される。各種データ112は、例えば、ルール定義31、学習モデル32および予測済みデータ33などが相当する。入力装置102は、例えば、情報処理装置1の操作者から操作情報の入力を受け付ける。モニタ103は、例えば、操作者が操作する各種画面を表示する。インタフェース装置106は、例えば印刷装置等が接続される。通信装置107は、通信ケーブル等を介して接続した外部機器との間で各種情報をやりとりする。
CPU101は、ハードディスク装置109に記憶されたプログラム111を読み出して、RAM108に展開して実行することで、各種の処理を行う。例えば、情報処理装置1の場合、CPU101は、プログラム111を実行することで、入力部10、ルール実行部20、記憶部30、モデル更新部40、ルール整理部50および出力部60に関する処理を行う。
なお、プログラム111は、ハードディスク装置109に記憶されていなくてもよい。例えば、コンピュータ100が読み取り可能な記憶媒体に記憶されたプログラム111を、コンピュータ100が読み出して実行するようにしてもよい。コンピュータ100が読み取り可能な記憶媒体は、例えば、CD-ROMやDVDディスク、USB(Universal Serial Bus)メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、LAN等に接続された装置にプログラム111を記憶させておき、コンピュータ100がこれらからプログラム111を読み出して実行するようにしてもよい。
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)入力データに対して、当該入力データに合致するルールが予め設定されたルール定義情報に含まれる場合には当該ルール定義情報のルールに基づいて前記入力データに対応するラベルを特定し、前記ルール定義情報に含まれない場合には学習モデルを用いて前記入力データに対応するラベルを特定し、
前記入力データと、特定した前記ラベルとを予測済み情報として記憶し、
記憶した前記予測済み情報を教師データとして前記学習モデルを更新し、
前記ルール定義情報に含まれるルールの中で前記学習モデルに包含されているルールを抽出し、
抽出した前記学習モデルに包含されているルールを前記ルール定義情報から削除する、
処理をコンピュータに実行させることを特徴とする情報処理プログラム。
(付記2)前記抽出する処理は、前記ルール定義情報に含まれるルールに合致する入力データに対して、前記学習モデルを用いて特定したラベルと、当該ルールに基づいて特定したラベルとが合致するか否かに基づき、前記ルール定義情報に含まれるルールが前記学習モデルに包含されているルールであるか否かを判別する、
ことを特徴とする付記1に記載の情報処理プログラム。
(付記3)前記抽出する処理および前記削除する処理は、前記学習モデルの更新を検知した場合に行う、
ことを特徴とする付記1または2に記載の情報処理プログラム。
(付記4)入力データに対して、当該入力データに合致するルールが予め設定されたルール定義情報に含まれる場合には当該ルール定義情報のルールに基づいて前記入力データに対応するラベルを特定し、前記ルール定義情報に含まれない場合には学習モデルを用いて前記入力データに対応するラベルを特定し、
前記入力データと、特定した前記ラベルとを予測済み情報として記憶し、
記憶した前記予測済み情報を教師データとして前記学習モデルを更新し、
前記ルール定義情報に含まれるルールの中で前記学習モデルに包含されているルールを抽出し、
抽出した前記学習モデルに包含されているルールを前記ルール定義情報から削除する、
処理をコンピュータが実行することを特徴とする情報処理方法。
(付記5)前記抽出する処理は、前記ルール定義情報に含まれるルールに合致する入力データに対して、前記学習モデルを用いて特定したラベルと、当該ルールに基づいて特定したラベルとが合致するか否かに基づき、前記ルール定義情報に含まれるルールが前記学習モデルに包含されているルールであるか否かを判別する、
ことを特徴とする付記4に記載の情報処理方法。
(付記6)前記抽出する処理および前記削除する処理は、前記学習モデルの更新を検知した場合に行う、
ことを特徴とする付記4または5に記載の情報処理方法。
(付記7)入力データに対して、当該入力データに合致するルールが予め設定されたルール定義情報に含まれる場合には当該ルール定義情報のルールに基づいて前記入力データに対応するラベルを特定し、前記ルール定義情報に含まれない場合には学習モデルを用いて前記入力データに対応するラベルを特定するラベル予測部と、
前記入力データと、特定した前記ラベルとを予測済み情報として記憶する記憶部と、
記憶した前記予測済み情報を教師データとして前記学習モデルを更新するモデル更新部と、
前記ルール定義情報に含まれるルールの中で前記学習モデルに包含されているルールを抽出し、抽出した前記学習モデルに包含されているルールを前記ルール定義情報から削除するルール整理部と、
を有することを特徴とする情報処理装置。
(付記8)前記ルール整理部は、前記ルール定義情報に含まれるルールに合致する入力データに対して、前記学習モデルを用いて特定したラベルと、当該ルールに基づいて特定したラベルとが合致するか否かに基づき、前記ルール定義情報に含まれるルールが前記学習モデルに包含されているルールであるか否かを判別する、
ことを特徴とする付記7に記載の情報処理装置。
(付記9)前記ルール整理部は、前記学習モデルの更新を検知した場合に、前記学習モデルに包含されているルールを抽出し、抽出した前記ルールを前記ルール定義情報から削除する、
ことを特徴とする付記7または8に記載の情報処理装置。
1…情報処理装置
10…入力部
11…入力データ
12…教師データ
20…ルール実行部
30…記憶部
31…ルール定義
32…学習モデル
33…予測済みデータ
40…モデル更新部
50…ルール整理部
60…出力部
100…コンピュータ
101…CPU
102…入力装置
103…モニタ
104…スピーカ
105…媒体読取装置
106…インタフェース装置
107…通信装置
108…RAM
109…ハードディスク装置
110…バス
111…プログラム
112…各種データ

Claims (5)

  1. 入力データに対して、当該入力データに合致するルールが予め設定されたルール定義情報に含まれる場合には当該ルール定義情報のルールに基づいて前記入力データに対応するラベルを特定し、前記ルール定義情報に含まれない場合には学習モデルを用いて前記入力データに対応するラベルを特定し、
    前記入力データと、特定した前記ラベルとを予測済み情報として記憶し、
    記憶した前記予測済み情報を教師データとして前記学習モデルを更新し、
    前記ルール定義情報に含まれるルールの中で前記学習モデルに包含されているルールを抽出し、
    抽出した前記学習モデルに包含されているルールを前記ルール定義情報から削除する、
    処理をコンピュータに実行させることを特徴とする情報処理プログラム。
  2. 前記抽出する処理は、前記ルール定義情報に含まれるルールに合致する入力データに対して、前記学習モデルを用いて特定したラベルと、当該ルールに基づいて特定したラベルとが合致するか否かに基づき、前記ルール定義情報に含まれるルールが前記学習モデルに包含されているルールであるか否かを判別する、
    ことを特徴とする請求項1に記載の情報処理プログラム。
  3. 前記抽出する処理および前記削除する処理は、前記学習モデルの更新を検知した場合に行う、
    ことを特徴とする請求項1または2に記載の情報処理プログラム。
  4. 入力データに対して、当該入力データに合致するルールが予め設定されたルール定義情報に含まれる場合には当該ルール定義情報のルールに基づいて前記入力データに対応するラベルを特定し、前記ルール定義情報に含まれない場合には学習モデルを用いて前記入力データに対応するラベルを特定し、
    前記入力データと、特定した前記ラベルとを予測済み情報として記憶し、
    記憶した前記予測済み情報を教師データとして前記学習モデルを更新し、
    前記ルール定義情報に含まれるルールの中で前記学習モデルに包含されているルールを抽出し、
    抽出した前記学習モデルに包含されているルールを前記ルール定義情報から削除する、
    処理をコンピュータが実行することを特徴とする情報処理方法。
  5. 入力データに対して、当該入力データに合致するルールが予め設定されたルール定義情報に含まれる場合には当該ルール定義情報のルールに基づいて前記入力データに対応するラベルを特定し、前記ルール定義情報に含まれない場合には学習モデルを用いて前記入力データに対応するラベルを特定するラベル予測部と、
    前記入力データと、特定した前記ラベルとを予測済み情報として記憶する記憶部と、
    記憶した前記予測済み情報を教師データとして前記学習モデルを更新するモデル更新部と、
    前記ルール定義情報に含まれるルールの中で前記学習モデルに包含されているルールを抽出し、抽出した前記学習モデルに包含されているルールを前記ルール定義情報から削除するルール整理部と、
    を有することを特徴とする情報処理装置。
JP2019174350A 2019-09-25 2019-09-25 情報処理プログラム、情報処理方法および情報処理装置 Active JP7354721B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019174350A JP7354721B2 (ja) 2019-09-25 2019-09-25 情報処理プログラム、情報処理方法および情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019174350A JP7354721B2 (ja) 2019-09-25 2019-09-25 情報処理プログラム、情報処理方法および情報処理装置

Publications (2)

Publication Number Publication Date
JP2021051576A JP2021051576A (ja) 2021-04-01
JP7354721B2 true JP7354721B2 (ja) 2023-10-03

Family

ID=75157311

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019174350A Active JP7354721B2 (ja) 2019-09-25 2019-09-25 情報処理プログラム、情報処理方法および情報処理装置

Country Status (1)

Country Link
JP (1) JP7354721B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070260568A1 (en) 2006-04-21 2007-11-08 International Business Machines Corporation System and method of mining time-changing data streams using a dynamic rule classifier having low granularity
US20170308557A1 (en) 2016-04-21 2017-10-26 LeanTaas Method and system for cleansing and de-duplicating data
US20190171428A1 (en) 2017-12-04 2019-06-06 Banjo, Inc. Automated model management methods

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070260568A1 (en) 2006-04-21 2007-11-08 International Business Machines Corporation System and method of mining time-changing data streams using a dynamic rule classifier having low granularity
US20170308557A1 (en) 2016-04-21 2017-10-26 LeanTaas Method and system for cleansing and de-duplicating data
US20190171428A1 (en) 2017-12-04 2019-06-06 Banjo, Inc. Automated model management methods

Also Published As

Publication number Publication date
JP2021051576A (ja) 2021-04-01

Similar Documents

Publication Publication Date Title
AU2019261735B2 (en) System and method for recommending automation solutions for technology infrastructure issues
JP6629678B2 (ja) 機械学習装置
CN109583468B (zh) 训练样本获取方法,样本预测方法及对应装置
JP6299759B2 (ja) 予測関数作成装置、予測関数作成方法、及びプログラム
US7797260B2 (en) Automated document classifier tuning including training set adaptive to user browsing behavior
US11907977B2 (en) Collaborative text detection and text recognition
JP2016058027A (ja) データ処理装置、データ処理方法、およびプログラム
CN114663198A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
CN111931809A (zh) 数据的处理方法、装置、存储介质及电子设备
CN113592605A (zh) 基于相似产品的产品推荐方法、装置、设备及存储介质
CN104321753B (zh) 用于呈现监测资源的使用量的方法、计算装置以及其上记录有用于执行的程序的记录介质
WO2022063561A2 (en) Method and system for evaluating consistency of an engineered system
JP7287699B2 (ja) 機械学習を通じての学習モデルを使った情報提供方法および装置
CN113869789A (zh) 一种风险监控的方法、装置、计算机设备及存储介质
KR20200073822A (ko) 악성코드 분류 방법 및 그 장치
JP2019219848A (ja) ソースコード解析方法およびソースコード解析装置
JP7354721B2 (ja) 情報処理プログラム、情報処理方法および情報処理装置
JP7450190B2 (ja) 特許情報処理装置、特許情報処理方法、およびプログラム
JP6894461B2 (ja) 情報処理装置、プログラム、及び情報処理方法
EP3690772A1 (en) Method and system for skill matching for determining skill similarity
JP6763967B2 (ja) データ変換装置とデータ変換方法
CN111914868A (zh) 模型训练方法、异常数据检测方法、装置和电子设备
CN110019771A (zh) 文本处理的方法及装置
JP7052395B2 (ja) 学習プログラム、学習方法および学習装置
CN116662764B (zh) 误识别纠正的数据识别方法、模型训练方法、装置和设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230822

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230904

R150 Certificate of patent or registration of utility model

Ref document number: 7354721

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150