JP2023168157A

JP2023168157A - 機械学習プログラム，機械学習方法，および情報処理装置

Info

Publication number: JP2023168157A
Application number: JP2022079842A
Authority: JP
Inventors: 明則岩川; Akinori Iwakawa
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2022-05-13
Filing date: 2022-05-13
Publication date: 2023-11-24
Also published as: US20230368072A1

Abstract

【課題】訓練データの陳腐化に起因するデータ分類精度の低下を抑制する。
【解決手段】複数の第１の訓練データを含む第１訓練データ群を用いて機械学習された分類器に第２の訓練データを入力することによって推論される判定ラベルと、前記第２の訓練データの正解ラベルとが異なる場合に、当該第２の訓練データに対して類似範囲を決定し、前記複数の第１の訓練データのなかから、少なくとも前記類似範囲内に含まれる第１の訓練データを除去して第２訓練データ群を作成し、前記第２訓練データ群を用いて新たに前記分類器を機械学習する処理をコンピュータが実行する。
【選択図】図８

Description

本発明は、機械学習プログラム，機械学習方法，および情報処理装置に関する。

近年、機械学習によるデータの分類技術が開発されている。一例において、文書分類システムが知られている。文書分類システムは、機械学習による自然言語処理を応用することによって文書を内容に応じて複数の分野（クラス）に分類する。

教師あり学習における分類器（モデル）の訓練時においては、対象データと対象データの属するクラスを示す正解ラベルとが対になった教師データが作成される。教師データを訓練データとして用いて分類器の訓練が行なわれる。推論時においては、分類器は、判断対象のデータが入力されると、データが各クラスに属する確率を算出する。分類器は、データが属する確率が最も高いクラスを判定ラベルとして出力してよい。

時事情勢の変化等によって対象データに対する正解ラベルが変化することに起因して、訓練データが陳腐化する場合がある。一例において、「ウイルス変異」に関する文章を分類する場合に、既存の訓練データ作成時においては正解ラベルが「科学」であるが、その後の新規の訓練データ作成時においては正解ラベルが「社会」である場合がある。

しかし、時事情勢の変化等に合わせて、すべての既存訓練データを新規訓練データに作り直すのは作業者の負担が大きくなる。したがって、従来は、既存訓練データに新規訓練データを逐次的に追加して再訓練することが行なわれている。

特開２０２０－１６０５４３号公報

しかし、既存教師データに新規の教師データを追加して再訓練する手法によれば、陳腐化した既存教師データが一時的に残存する可能性がある。新規教師データと類似した既存教師データがあり、両者で異なる正解ラベルを有することは分類精度の低下の原因になる。したがって、陳腐化した訓練データが残存すると、分類精度の低下を抑制することが難しい場合がある。

１つの側面では、本発明は、訓練データの陳腐化に起因するデータ分類精度の低下を抑制することを目的の１つとする。

このため、この機械学習プログラムは、複数の第１の訓練データを含む第１訓練データ群を用いて機械学習された分類器に第２の訓練データを入力することによって推論される判定ラベルと、前記第２の訓練データの正解ラベルとが異なる場合に、当該第２の訓練データに対して類似範囲を決定し、前記複数の第１の訓練データのなかから、少なくとも前記類似範囲内に含まれる第１の訓練データを除去して第２訓練データ群を作成し、前記第２訓練データ群を用いて新たに前記分類器を機械学習する。

一実施形態によれば、訓練データの陳腐化に起因するデータ分類精度の低下を抑制することができる。

第１実施形態における情報処理装置のハードウェア構成の一例を示す図である。第１実施形態における情報処理装置の機能構成を示す図である。分類器の一例を示す図である。第１実施形態における訓練時のソフトウェア構成例を模式的に示すブロック図である。第１訓練データ群の一例を示す図である。第１実施形態における推論時のソフトウェア構成例を模式的に示すブロック図である。比較例における既存訓練データ群の更新処理の一例を示す図である。第１実施形態における既存訓練データ群の更新処理の一例を示す図である。第１実施形態における第２訓練データの選別処理の一例を示す図である。比較例における分類処理の一例を示す図である。第１実施形態における分類処理の一例を示す図である。相違データと同値データとの間のコサイン類似度を示す第１テーブルの一例を示す図である。相違データと第１訓練データ群との間のコサイン類似度を示す第２テーブルの一例を示す図である。第１実施形態における訓練データ更新後の訓練時のソフトウェア構成例を模式的に示すブロック図である。第１実施形態における情報処理装置による訓練時の処理を示すフローチャートである。第１実施形態における情報処理装置の訓練データ生成処理を示すフローチャートである。第１実施形態における情報処理装置による第２訓練データの選別処理を示すフローチャートである。第１実施形態における情報処理装置による既存訓練データの更新処理を示すフローチャートである。第１実施形態における情報処理装置による再訓練時の処理を示すフローチャートである。第２実施形態における推論時のソフトウェア構成例を模式的に示すブロック図である。第２実施形態における情報処理装置による既存訓練データの更新処理を示すフローチャートである。第３実施形態における推論時のソフトウェア構成例を模式的に示すブロック図である。指標データの一例を示す図である。指標データに基づくデータ選択処理の一例を示す図である。指標データに基づくデータ選択処理の他の例を示す図である。第３実施形態における新たな第２訓練データの作成時のソフトウェア構成例を模式的に示すブロック図である。ラベル無し新規訓練データ候補の一例を示す図である。指標データとラベル無し新規訓練データ候補との間のコサイン類似度を示す第３テーブルの一例を示す図である。正解ラベル付けしたデータの一例を示す図である。第３実施形態におけるラベリング待ちデータの選択処理の一例を示す図である。第３実施形態における情報処理装置による第２訓練データの選別処理を示すフローチャートである。第３実施形態における情報処理装置による既存訓練データの更新処理の一例を示すフローチャートである。第３実施形態における情報処理装置による既存訓練データの更新処理の他の例を示すフローチャートである。

以下、図面を参照して本機械学習プログラム，機械学習方法，および情報処理装置にかかる実施形態を説明する。但し、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。また、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。

〔第１実施形態〕
〔Ａ－１〕構成
図１は実施形態の一例としての情報処理装置１のハードウェア構成を例示する図である。

情報処理装置１は、例えば、図１に示すように、プロセッサ１１，メモリ１２，記憶装置１３，グラフィック処理装置１４，入力インタフェース１５，光学ドライブ装置１６，機器接続インタフェース１７およびネットワークインタフェース１８を構成要素として有する。これらの構成要素１１～１８は、バス１９を介して相互に通信可能に構成される。情報処理装置１は、コンピュータの一例である。

プロセッサ１１は、情報処理装置１全体を制御する。プロセッサ１１は、制御部の一例である。プロセッサ１１は、マルチプロセッサであってもよい。プロセッサ１１は、例えばＣＰＵ，ＭＰＵ（Micro Processing Unit），ＤＳＰ（Digital Signal Processor），ＡＳＩＣ（Application Specific Integrated Circuit），ＰＬＤ（Programmable Logic Device），ＦＰＧＡ（Field Programmable Gate Array），ＧＰＵ（Graphics Processing Unit）のいずれか一つであってもよい。また、プロセッサ１１は、ＣＰＵ，ＭＰＵ，ＤＳＰ，ＡＳＩＣ，ＰＬＤ，ＦＰＧＡ，ＧＰＵのうちの２種類以上の要素の組み合わせであってもよい。

プロセッサ１１が、制御プログラム（機械学習プログラム１３ａまたは訓練データ生成プログラム１３ｂ）を実行することにより、図２に例示する、訓練処理部１００としての機能が実現される。訓練データ生成プログラム１３ｂは、機械学習プログラム１３ａの一部として設けられていてもよい。

情報処理装置１は、例えばコンピュータ読み取り可能な非一時的な記録媒体に記録されたプログラムである機械学習プログラム１３ａ、訓練データ生成プログラム１３ｂ、およびＯＳ（Operating System）プログラムを実行することにより、訓練処理部１００としての機能を実現する。

情報処理装置１に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、情報処理装置１に実行させる機械学習プログラム１３ａまたは訓練データ生成プログラム１３ｂを記憶装置１３に格納しておくことができる。プロセッサ１１は、記憶装置１３内の機械学習プログラム１３ａまたは訓練データ生成プログラム１３ｂの少なくとも一部をメモリ１２にロードし、ロードしたプログラムを実行する。

また、情報処理装置１（プロセッサ１１）に実行させる機械学習プログラム１３ａまたは訓練データ生成プログラム１３ｂを、光ディスク１６ａ，メモリ装置１７ａ，メモリカード１７ｃ等の非一時的な可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ１１からの制御により、記憶装置１３にインストールされた後、実行可能になる。また、プロセッサ１１が、可搬型記録媒体から直接機械学習プログラム１３ａまたは訓練データ生成プログラム１３ｂを読み出して実行することもできる。

メモリ１２は、ＲＯＭ（Read Only Memory）およびＲＡＭ（Random Access Memory）を含む記憶メモリである。メモリ１２のＲＡＭは情報処理装置１の主記憶装置として使用される。ＲＡＭには、プロセッサ１１に実行させるＯＳプログラムや制御プログラムの少なくとも一部が一時的に格納される。また、メモリ１２には、プロセッサ１１による処理に必要な各種データが格納される。

記憶装置１３は、ハードディスクドライブ（Hard Disk Drive：ＨＤＤ）、ＳＳＤ（Solid State Drive）、ストレージクラスメモリ（Storage Class Memory：ＳＣＭ）等の記憶装置であって、種々のデータを格納するものである。記憶装置１３は、本情報処理装置１の補助記憶装置として使用される。記憶装置１３には、ＯＳプログラム，制御プログラムおよび各種データが格納される。制御プログラムには機械学習プログラム１３ａまたは訓練データ生成プログラム１３ｂが含まれる。

補助記憶装置としては、ＳＣＭやフラッシュメモリ等の半導体記憶装置を使用することもできる。また、複数の記憶装置１３を用いてＲＡＩＤ（Redundant Arrays of Inexpensive Disks）が構成されてもよい。

また、記憶装置１３には、後述する各種の訓練データ（教師データ）と、各処理を実行する場合に生成される各種データとを格納してもよい、

グラフィック処理装置１４には、モニタ１４ａが接続されている。グラフィック処理装置１４は、プロセッサ１１からの命令に従って、画像をモニタ１４ａの画面に表示させる。モニタ１４ａとしては、ＣＲＴ（Cathode Ray Tube）を用いた表示装置や液晶表示装置等が挙げられる。

入力インタフェース１５には、キーボード１５ａおよびマウス１５ｂが接続されている。入力インタフェース１５は、キーボード１５ａやマウス１５ｂから送られてくる信号をプロセッサ１１に送信する。なお、マウス１５ｂは、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル，タブレット，タッチパッド，トラックボール等が挙げられる。

光学ドライブ装置１６は、レーザ光等を利用して、光ディスク１６ａに記録されたデータの読み取りを行なう。光ディスク１６ａは、光の反射によって読み取り可能にデータを記録された可搬型の非一時的な記録媒体である。光ディスク１６ａには、ＤＶＤ（Digital Versatile Disc），ＤＶＤ－ＲＡＭ，ＣＤ－ＲＯＭ（Compact Disc Read Only Memory），ＣＤ－Ｒ（Recordable）／ＲＷ（ReWritable）等が挙げられる。

機器接続インタフェース１７は情報処理装置１に周辺機器を接続するための通信インタフェースである。例えば、機器接続インタフェース１７には、メモリ装置１７ａやメモリリーダライタ１７ｂを接続することができる。メモリ装置１７ａは、機器接続インタフェース１７との通信機能を搭載した非一時的な記録媒体、例えばＵＳＢ（Universal Serial Bus）メモリである。メモリリーダライタ１７ｂは、メモリカード１７ｃへのデータの書き込み、またはメモリカード１７ｃからのデータの読み出しを行なう。メモリカード１７ｃは、カード型の非一時的な記録媒体である。

ネットワークインタフェース１８は、図示しないネットワークに接続される。ネットワークインタフェース１８は、ネットワークを介して、他の情報処理装置や通信機器等が接続されてもよい。例えば、ネットワークを介して入力文等のデータが入力されてもよい。

図２は、第１実施形態における情報処理装置１の機能構成を例示する図である。情報処理装置１は、図２に示すように、訓練処理部１００としての機能を備える。情報処理装置１においては、プロセッサ１１が制御プログラム（機械学習プログラム１３ａまたは訓練データ生成プログラム１３ｂ）を実行することにより、訓練処理部１００としての機能が実現される。

訓練処理部１００は、訓練データを用いて、機械学習における学習処理（訓練）を実現する。すなわち、情報処理装置１は、訓練処理部１００により、分類器１１０の機械学習モデルの訓練を行なう訓練装置として機能する。

訓練処理部１００は、訓練データ更新部１２０を備える。

正解ラベル付き文章収集部２０が、分類器１１０の訓練に用いる訓練データを取得する装置である。訓練データは、対象データと対象データの属する分類（クラス）を示す正解ラベルとが対になった教師データであってよい。

本例では、訓練データは、既存訓練データ群２１を含む。分類器１１０は、既存訓練データ群２１を用いて機械学習される。時事情勢の変化等による既存訓練データ群２１の陳腐化を抑制するために、既存訓練データ群２１に対して第２訓練データ２２が追加される。第２訓練データ２２は、既存訓練データ群２１に追加される新規訓練データである。

訓練データ更新部１２０は、既存訓練データ群２１の一部のデータを削除することによって既存訓練データ群２１を更新する。訓練データ更新部１２０は、既存訓練データ群２１に対して第２訓練データ２２を追加する。

第２訓練データ２２の追加前であって、かつ更新前の既存訓練データ群２１は「第１訓練データ群２１１」と称される。第２訓練データ２２の追加後であり、かつ更新後の既存訓練データ群２１が「第２訓練データ群２１２」と称される。第２訓練データ群２１２は、追加された第２訓練データ２２を含む。

分類器１１０は、推論時においては、入力されたデータを内容に応じて複数のクラスに分類する。訓練処理部１００は、訓練時においては、分類器１１０の訓練（機械学習）を実現する。

分類器１１０は、入力された文章データを内容に応じて複数の分野に分類する文書分類器であってよい。

図３は、分類器１１０の一例を示す図である。分類器１１０は、入力されたデータを複数のクラスに分類するための機械学習モデルである。機械学習モデルは、例えば、ディープラーニングのモデル（ディープニューラルネットワーク）であってもよい。ニューラルネットワークは、ハードウェア回路であってもよいし、プロセッサ１１等によりコンピュータプログラム上で仮想的に構築される階層間を接続するソフトウェアによる仮想的なネットワークであってもよい。

図３においては、分類器１１０には、入力データが入力される。入力データが入力文１１１である場合を例にとって説明する。入力文１１１は、複数の単語（図３においては、「明日」，「は」，「晴れ」の単語）で構成されている。単語のそれぞれは、固定長の意味ベクトルで表現されてよい。単語を意味ベクトルで表現することは「単語の分散表現」と称される。単語の分散表現を獲得する手法は従来と同様である。入力データの内容は図３に示されたものに限られない。

図３の分類器１１０は、入力層１１２，トランスフォーマー１１３，隠れ層１１４，および出力層１１５を含む。

入力層１１２は、隠れ層１１４の次元（隠れ次元）の数ｎと、単語列（単語列方向）の数ｍに応じたｎ×ｍの行列で与えられる。トランスフォーマー１１３は、設定した正解ラベル１１７に分類されるように重み係数を機械学習する。隠れ層１１４は、入力されたデータの意味ベクトルを出力する。意味ベクトルは、特徴量ベクトルの一例である。

出力層１１５は、入力されたデータが各分類（クラス）に属する確率を算出する。図３の例では、入力文１１１が、社会、経済、および科学の各分野に属する分類確率は、０．７，０．１，および０．２となる。出力層１１５は、最大の確率を示す分野を判定ラベル１１６として出力してよい。

但し、分類器１１０は、図３の構成に限定されない。入力データの内容に応じて複数のクラスに分類するものであれば種々の分類器１１０が用いられてよい。分類器１１０が文書分類器である場合、ＲＮＮ（Recurrent Neural Network），ＬＳＴＭ(Long Short Term Memory)，Seq2Seqモデル，Attention付きSeq2Seqモデル，およびTransformer等の種々の自然言語処理手法が用いられてよい。

〔Ａ－１－１〕訓練時
図４は、第１実施形態における訓練時のソフトウェア構成例を模式的に示すブロック図である。訓練時においては、正解ラベル付き文章収集部２０は、入力文１１１と入力文１１１に対する正解ラベル１１７とを含む既存訓練データ群２１（第１訓練データ群２１１）を収集する。第１訓練データ群２１１を用いて分類器１１０が訓練される。第１訓練データ群２１１は、複数の第１訓練データを含む。第１訓練データは、第１の訓練データの一例である。

図５は、第１訓練データ群２１１の一例を示す図である。第１訓練データ群２１１は、入力文１１１を識別する識別情報ＩＤ，タイムスタンプ，入力文１１１の意味ベクトルの成分，および正解ラベル１１７を含んでよい。

分類器１１０は、分類器１１０による判定ラベル１１６と、第１訓練データ群２１１に付加されている正解ラベル１１７との誤差が小さくなるように、トランスフォーマー１１３および隠れ層１１４等の重み係数を調整することで機械学習する。

〔Ａ－１－２〕推論時（第２訓練データ群２１２の生成時）
図６は、第１実施形態における推論時（第２訓練データ群２１２の生成時）のソフトウェア構成例を模式的に示すブロック図である。分類器１１０は、図４に示したように、すでに第１訓練データ群２１１等の既存訓練データを用いて機械学習されている。

訓練データ更新部１２０は、新規データ追加部１２１，比較部１２２，および既存データ更新部１２３を備えてよい。

新規データ追加部１２１は、第１訓練データ群２１１等の既存訓練データ群２１に新規訓練データである第２訓練データ２２を追加する。この結果、既存訓練データ群２１が第１訓練データ群２１１から第２訓練データ群２１２へと更新される。追加される第２訓練データ２２の数は、Ｎ個であり、予め定められていてよい。新規データ追加部１２１は、第２訓練データ２２を追加することによって、既存訓練データ群２１が時事情勢の変化等に起因して陳腐化することを防止する。

図７は、比較例における既存訓練データ群２１の更新処理の一例を示す図である。図８は、第１実施形態における既存訓練データ群２１の更新処理の一例を示す図である。図７および図８においては、第２訓練データ２２に比べて早い時期に登録された既存訓練データ群２１である第１訓練データ群２１１は、複数の第１訓練データ＃１～＃９を含む。新規データ追加部１２１は、新たに＃１０，＃１１，および＃１２の合計Ｎ個（図７，図８ではＮ＝３）である第２訓練データ２２を追加する。図７および図８においては、左方にいくほどデータの登録時期が早い、すなわち、古い。

図９は、第１実施形態における第２訓練データ２２の選別処理の一例を示す図である。

追加される第２訓練データ２２（図８における＃１０，＃１１，および＃１２）が、第１訓練データ群２１１を用いて機械学習された分類器１１０に入力される。分類器１１０は、第２訓練データ２２に対する判定ラベル１１６を推論する。図９に示されるように、第２訓練データ２２は、ＩＤ、入力文１１１および正解ラベル１１７を含んでよい。図９においては、Ｎ１は、「新種のウイルスが発見されました」という入力文１１１であり、Ｎ１の正解ラベル１１７は「社会」である。Ｎ３は、「重力波が検出されました」という入力文１１１であり、Ｎ３の正解ラベル１１７は「科学」である。

第２訓練データ２２が、第１訓練データ群２１１を用いて訓練された分類器１１０に入力されることによって、意味ベクトル２３および判定結果が得られる。意味ベクトル２３は、単語単位の意味ベクトルではなく、文章の意味ベクトルである。意味ベクトル２３は、複数の成分１～４の値によって表現されてよい。成分の数は、適宜に定められてよい。一例において、成分の数は数百である。判定結果は、判定ラベル１１６を含む。

図６に戻り、比較部１２２は、第２訓練データ２２（図８の＃１０～＃１２）をそれぞれ入力することによって推論される判定ラベル１１６と、第２訓練データ２２の正解ラベル１１７とを比較する。

図７および図８に示すデータ＃１１においては、判定ラベル１１６が科学であり、正解ラベル１１７が社会であり、判定ラベル１１６と正解ラベル１１７とが異なる。判定ラベル１１６と正解ラベル１１７とが異なる第２訓練データ２２（図８の＃１１等）を相違データ２２１（食い違い群データ）と称する。判定ラベル１１６と正解ラベル１１７とが同じである第２訓練データ２２（図８の＃１０および＃１２等）を同値データ２２２と称する。図９には、相違データ２２１および同値データ２２２の例が示される。

図７および図８において、＃７および＃１１がウイルス変異に関する文章である場合を例にとって説明する。既存の第１訓練データ群２１１に含まれる＃７が登録される時点においては、「ウイルス変異」に関する文章に対する正解ラベル１１７は「科学」である。一方、時事情勢の変化によって、第２訓練データ２２（図８の＃１１）の時点では、正解ラベル１１７が「科学」から「社会」に変化する。この場合、第１訓練データ群２１１を用いて訓練された分類器１１０に、＃１１の文章を入力すると、判定ラベル１１６が「科学」と推論され、正解ラベル１１７「社会」と異なる。比較部１２２は、このような正解ラベル１１７と判定ラベル１１６とが異なる第２訓練データ２２を選別する。

図６に示される既存データ更新部１２３は、既存訓練データ群２１を更新する。既存データ更新部１２３は、第１訓練データ群２１１を更新して第２訓練データ群２１２を生成する。既存データ更新部１２３は、類似範囲決定部１２４および除去部１２５を備える。

類似範囲決定部１２４は、相違データ２２１に対して類似範囲を決定する。類似範囲決定部１２４は、図８においては、相違データ２２１（図８の＃１１等）に対して類似範囲を決定する。類似範囲決定部１２４は、相違データ２２１が複数ある場合には、それぞれの相違データ２２１について類似範囲を決定する。

類似範囲は、相違データ２２１をベクトル化して得られる特徴量ベクトル（例えば、意味ベクトル２３）との間で予め定められた関係を満たすベクトル空間上での範囲であってよい。図１０および図１１を参照して、類似範囲が説明される。

図１０は、比較例における分類処理の一例を示す図である。図１１は、第１実施形態における分類処理の一例を示す図である。図１０および図１１は、入力データの特徴量ベクトル空間を示している。入力データが入力文１１１である場合、特徴量ベクトル空間は、入力文１１１をベクトル化した意味ベクトル２３の空間である。

図１０および図１１においては、丸印が第１訓練データ群２１１を示し、星印が、新たに追加される訓練データである第２訓練データ２２を示す。第１訓練データ群２１１および第２訓練データ２２において、正解ラベル１１７が第１のラベル「社会」である訓練データを白色で示し、正解ラベル１１７が第２のラベル「科学」である訓練データを黒色で示す。

旧分類平面は、第１訓練データ群２１１によって訓練された分類器１１０によって、ラベル「社会」とラベル「科学」とを区別する境界平面を意味する。新分類平面は、第２訓練データ群２１２によって訓練された分類器１１０によって、ラベル「社会」とラベル「科学」とを区別する境界平面を意味する。

図１１において、第２訓練データ（Ｎ１）は、正解ラベル１１７が「社会」であり、旧分類平面による判定ラベル１１６が「科学」である。第２訓練データ（Ｎ２）は、正解ラベル１１７が「科学」であり、旧分類平面による判定ラベル１１６が「社会」である。したがって、第２訓練データ（Ｎ１、Ｎ２）は、それぞれ相違データ２２１である。残りの第２訓練データ（Ｎ３，Ｎ４）は、同値データ２２２である。

相違データ２２１であるＮ１に最も類似する同値データ２２２はＮ３である。相違データ２２１であるＮ１における類似範囲１３０ａは、相違データ２２１であるＮ１と複数の同値データ２２２（Ｎ３，Ｎ４）のうちのいずれかのデータとの間の類似度が高いほど狭く決定してよい。ベクトル空間における距離が近いほど類似度が高くなる。

類似範囲１３０ａは、相違データ２２１（Ｎ１）と複数の同値データ２２２（Ｎ３，Ｎ４）のそれぞれとの間の類似度のうちの最大値であるαに基づいて定められてよい。類似範囲１３０ｂも、相違データ２２１（Ｎ２）と複数の同値データ２２２（Ｎ３，Ｎ４）のそれぞれとの間の類似度のうちの最大値であるαに基づいて定められてよい。

一例において、類似範囲は、１－（（１－α）／２）、つまり（１＋α）／２に応じて相違データ２２１ごとに定められてよい。また、相違データ２２１（Ｎ１，Ｎ２）ごとに類似範囲１３０ａ，１３０ｂの大きさが異なってよい。例えば、相違データ２２１（Ｎ１）について類似範囲１３０ａは、類似度が０．８５以上の範囲である。相違データ２２１（Ｎ２）について類似範囲１３０ａは、類似度が０．８０以上の範囲である。

一例において、類似度は、コサイン類似度である。コサイン類似度は、２つのベクトルがなす角度のコサイン値であり、次の数式で与えられる。

コサイン類似度は、－１以上１以下の値をとる。コサイン類似度が１に近い場合には、２つのベクトルは同じ向きに近い。コサイン類似度が－１に近い場合には、２つのベクトルは逆向きに近い。コサイン類似度が０に近い場合には、２つのベクトルは似ていない。但し、類似度は、コサイン類似度に限られない。

図１２は、相違データ２２１（Ｎ１，Ｎ２）と同値データ２２２（Ｎ３，Ｎ４）との間のコサイン類似度を示す第１テーブル２４の一例を示す図である。相違データ２２１（Ｎ１）と同値データ２２２（Ｎ３，Ｎ４）との間のコサイン類似度における最大値αは、０．７である。したがって、相違データ２２１（Ｎ１）についての類似範囲１３０ａは、（１＋０．７）／２＝０．８５となる。相違データ２２１（Ｎ２）と、同値データ２２２（Ｎ３，Ｎ４）との間のコサイン類似度において最大値αは０．６である。したがって、相違データ２２１（Ｎ２）についての類似範囲１３０ｂは、（１＋０．６）／２＝０．８となる。

図６に戻り、除去部１２５は、第１訓練データ群２１１中の第１訓練データのなかから、少なくとも類似範囲１３０ａ，１３０ｂ内に含まれる第１訓練データを除去する。

なお、図７に示す比較例においては、第２訓練データ２２が新たに追加された数をＮとすると、登録時期が古いものから順番にＮ個の第１訓練データが第１訓練データ群２１１から除去されて、第１訓練データ群２１１が第２訓練データ群２１２に更新される。しかし、相違データ２２１である＃１１の類似範囲内に含まれる＃７が残存する。したがって、＃１１と＃７は、類似したデータ内容であるのにもかかわらず、＃１１と＃７との間で正解ラベル１１７が異なる状況が解消されない。正解ラベル１１７が古くなった訓練データ（＃７）の影響を受けるため、分類精度の低下を抑制することが困難になる場合がある。

図８に示す第１実施形態においては、除去部１２５は、相違データ２２１である＃１１の類似範囲内に含まれる＃７を除去する。したがって、意味ベクトル２３が類似した内容のデータであるのにもかかわらず正解ラベル１１７が異なる＃１１と＃７が併存する状況が解消される。したがって、古くなった訓練データ（＃７）の影響を軽減することができるため、分類精度の低下を抑制することが可能となる。

図８に示されるように、除去部１２５は、追加された時期が古いものから順番に第１訓練データ群２１１のうち（Ｎ－Ｓ）個をさらに除去してよい。本例では、Ｎ＝３、Ｓ＝１であるので、古いデータから２個（Ｎ－Ｓ）、具体的には＃１，＃２が除去される。したがって、訓練データの数が必要以上に増減することを防止することができる。

図１３は、相違データ２２１（Ｎ１およびＮ２）と、第１訓練データ群２１１との間のコサイン類似度を示す第２テーブル２５の一例を示す図である。除去部１２５は、相違データ２２１（Ｎ１）と全ての第１訓練データ群２１１との間のコサイン類似度を算出してよい。そして、除去部１２５は、コサイン類似度が、相違データ２２１（Ｎ１）についての類似範囲１３０ａ内（例えば、０．８５以上）である第１訓練データ（Ｘ１，Ｘ２）を除去する。同様に、除去部１２５は、相違データ２２１（Ｎ２）と全ての第１訓練データ群２１１との間のコサイン類似度を算出してよい。そして、除去部１２５は、コサイン類似度が相違データ２２１（Ｎ２）についての類似範囲１３０ｂ内（例えば、０．８以上）である第１訓練データ（Ｘ１２）を除去する。

図１０に示す比較例においては、相違データ２２１（Ｎ１）の類似範囲内に、既存訓練データである第１訓練データ群２１１のＸ１，Ｘ２が残存する。また、相違データ２２１（Ｎ２）の類似範囲に、既存訓練データである第１訓練データ群２１１のＸ１２が残存する。したがって、新たな第２訓練データ２２を追加して訓練データの更新を図ったにもかかわらず、分類器１１０の機械学習モデルが、これら陳腐化した第１訓練データ（Ｘ１，Ｘ２，Ｘ１２）の影響をうける。

したがって、比較例によれば、更新された分類器１１０における新分類平面によっても、本来、正解ラベル１１７が「社会」である判断対象データＣ１が誤って「科学」と判定されたり、正解ラベル１１７が「科学」である判断対象データＣ２が誤って「社会」と判定されたりする可能性がある。

図１１に示す第１実施形態においては、相違データ２２１（Ｎ１）の類似範囲１３０ａ内にあった、第１訓練データ群２１１のＸ１，Ｘ２が除去部１２５によって除去される。相違データ２２１（Ｎ２）の類似範囲１３０ｂ内においても、第１訓練データ群２１１のＸ１２が除去部１２５によって除去される。

したがって、第１実施形態の情報処理装置１によれば、更新された分類器１１０における新分類平面によって、本来、正解ラベル１１７が「社会」である判断対象データＣ１が誤って「科学」と判定されること、および正解ラベル１１７が「科学」である判断対象データＣ２が誤って「社会」と判定されることが抑制される。

〔Ａ－１－３〕再訓練時
図１４は、第１実施形態における既存訓練データ群２１の更新後の訓練時のソフトウェア構成例を模式的に示すブロック図である。再訓練時においては、訓練処理部１００によって生成された第２訓練データ群２１２を用いて分類器１１０が訓練される。さらに、新たな第２訓練データ２２が追加されて、既存訓練データ群２１である第２訓練データ群２１２がさらに更新されてもよい。第２訓練データ群２１２の更新は、図６等において、第２訓練データ群２１２を更新前の既存訓練データ群２１（第１訓練データ群２１１）とした場合に対応する。したがって、繰り返しの説明は省略される。

〔Ｂ－１〕動作
上述の如く構成された実施形態の一例としての情報処理装置１における機械学習モデルの訓練手法が、図１５～図１９に示すフローチャートに従って説明される。

〔Ｂ－１－１〕訓練時
図１５は、第１実施形態における情報処理装置１による訓練時の処理を示すフローチャートである。

訓練時においては、訓練処理部１００は、既存訓練データ群２１を用いて分類器１１０を訓練する（ステップＳ１）。既存訓練データ群２１は、例えば、第１訓練データ群２１１である。

〔Ｂ－１－２〕推論時（第２訓練データ群２１２の生成時）
図１６は、第１実施形態における情報処理装置の訓練データ生成処理を示すフローチャートである。

訓練処理部１００は、機械学習された分類器１１０に第２訓練データ２２（新規教師データ）を入力して推論した判定ラベル１１６と、第２訓練データ２２の正解ラベル１１７とが異なる相違データ２２１を選別する（ステップＳ２）。

訓練処理部１００は、既存訓練データ群２１を更新する（ステップＳ３）。訓練処理部１００は、第１訓練データ群２１１から一部のデータを削除して、第２訓練データ群２１２を作成してよい。

図１７は、第１実施形態における情報処理装置１による第２訓練データ２２の選別処理を示すフローチャートである。図１７は、図１６におけるステップＳ２の一例を示す。

一定期間経過するのを待って（ステップＳ１０のＹＥＳルート参照）、処理がステップＳ１１に進む。したがって、一定期間ごとに、ステップＳ１１～ステップＳ１７の処理が実行されてよい。

ステップＳ１１において、訓練処理部１００は、第２訓練データ２２（新規教師データ）を受信する。第２訓練データ２２は、正解ラベル付き文章収集部２０を介して取得されてよい。

ステップＳ１２において、訓練処理部１００は、訓練データごと毎にタイムスタンプを設定してよい。タイムスタンプは、訓練データが登録された日時を示す情報である。

ステップＳ１３において、訓練処理部１００は、第２訓練データ２２を分類器１１０に入力し、図９に示されるような意味ベクトル２３およびラベル判定結果を算出する。ラベル判定結果は、推論された判定ラベル１１６についての情報を含む。

ステップＳ１４において、比較部１２２は、判定ラベル１１６と正解ラベル１１７とを比較する。判定ラベル１１６と正解ラベル１１７とが同じ場合には（ステップＳ１５のＹＥＳルート参照）、比較部１２２は、第２訓練データ２２を同値データ２２２のグループに登録する（ステップＳ１６）。判定ラベル１１６と正解ラベル１１７とが異なる場合には（ステップＳ１５のＮＯルート参照）、比較部１２２は、第２訓練データ２２を相違データ２２１のグループに登録する（ステップＳ１７）。

図１８は、第１実施形態における情報処理装置１による既存訓練データの更新処理を示すフローチャートである。図１８は、図１６におけるステップＳ３の一例を示す。

新規データ追加部１２１は、第２訓練データ２２の数が規定数を超えるのを待って（ステップＳ２０のＹＥＳルート参照）、第２訓練データ２２を既存訓練データ群２１に追加登録する（ステップＳ２１）。新規データ追加部１２１は、第２訓練データ２２を第１訓練データ群２１１に追加する処理を行なう。

ステップＳ２２において、類似範囲決定部１２４は、相違データ２２１（例えば、図１１のＮ１，Ｎ２）のそれぞれと、全ての同値データ２２２（例えば、図１１のＮ３，Ｎ４）とのコサイン類似度を計算してよい。計算結果は、一例において、図１２に示される。

ステップＳ２３において、類似範囲決定部１２４は、第２訓練データ２２のうち相違データ２２１（例えば、図１１のＮ１，Ｎ２）のそれぞれについて、計算式を用いて類似範囲１３０を決定する。

類似範囲決定部１２４は、一例において、相違データ２２１ごとに全ての同値データ２２２との間のコサイン類似度における最大値αを算出する。類似範囲決定部１２４は、相違データ２２１ごとに、類似範囲１３０を、（１＋α）／２によって決定してよい。類似範囲決定部１２４は、相違データ２２１のそれぞれに応じて、類似範囲１３０を異なるように決定してよい。類似範囲決定部１２４は、相違データ２２１（例えば、図１１のＮ１，Ｎ２）と複数の同値データ２２２（例えば、図１１のＮ３，Ｎ４）のうちのいずれかのデータとの間の類似度が高いほど狭くするように相違データ２２１ごとに類似範囲を決定してよい。最大値αが大きくなる（１に近づく）ほど、（１＋α）／２が大きくなる（１に近づく）。したがって、最大値αが大きくなるほど、ベクトル空間における類似範囲１３０が狭くなる。

ステップＳ２４において、除去部１２５は、相違データ２２１と既存訓練データ群２１との類似度を取得する。除去部１２５は、相違データ２２１と既存訓練データ群２１との類似度を取得する。特に、除去部１２５は、相違データ２２１と第１訓練データ群２１１に含まれる各第１訓練データとの間のコサイン類似度を計算する。

ステップＳ２５において、除去部１２５は、既存訓練データ群２１の訓練データのうち、類似範囲１３０内に含まれるデータが存在する否かを判断する。具体的には、除去部１２５は、第１訓練データ群２１１に含まれる複数の第１訓練データのうち、類似範囲１３０内に含まれるデータが存在するか否かを判断する。既存訓練データ群２１の訓練データのうち、類似範囲１３０内に含まれるデータが存在する場合には（ステップＳ２５のＹＥＳルート参照）、除去部１２５は、既存訓練データ群２１から該当データを削除する（ステップＳ２６）。既存訓練データ群２１の訓練データのうち、類似範囲１３０内に含まれるデータが存在しない場合には（ステップＳ２５のＮＯルート参照）、処理は、ステップＳ２７に進む。

ステップＳ２７において、除去部１２５は追加された時期が古いものから順番に複数の第１訓練データのうち（Ｎ－Ｓ）個をさらに除去してよい。Ｎは、新たに追加された第２訓練データ２２の数であり、Ｓは、類似範囲１３０内に含まれるために除去される第１訓練データの数である。

〔Ｂ－１－３〕再訓練時
図１９は、第１実施形態における情報処理装置１による再訓練時の処理を示すフローチャートである。

再訓練時においては、訓練処理部１００は、更新後の既存訓練データ群２１を用いて分類器１１０を再訓練する（ステップＳ４）。更新後の既存訓練データ群２１は、例えば、第１訓練データ群２１１を更新した第２訓練データ群２１２である。

更新された第２訓練データ群２１２に、新たな第２訓練データ２２が追加されることによって、第２訓練データ群２１２がさらに再更新されてもよい。この場合、再更新の前の第２訓練データ群２１２が第１訓練データ群２１１とされるとともに再更新後の訓練データ群が第２訓練データ群２１２とされる。そして、図１６～図１８に示される手法を適用することによって、順次に既存訓練データ群２１が更新されてよい。

〔第２実施形態〕
〔Ａ－２〕構成
第２実施形態の情報処理装置１について説明される。第２実施形態の情報処理装置１のハードウェア構成は、図１に示される第１実施形態におけるハードウェア構成と同様である。したがって、繰り返しの説明が省略される。

図２０は、第２実施形態における推論時のソフトウェア構成例を模式的に示すブロック図である。第２実施形態では、類似範囲の決定手法が第１実施形態と異なる。第２実施形態の処理は、類似範囲を決定するために同値データ２２２を必ずしも必要としない。第２実施形態における他のソフトウェア構成は、第１実施形態におけるソフトウェア構成と同様である。したがって、繰り返しの説明が省略されて、第１実施形態における同様の構成については、同じ符号を付して示す。

第１実施形態においては、第２訓練データ２２のうち相違データ２２１のそれぞれに対して、計算式によって類似範囲１３０を決定する処理が示される。特に、類似範囲決定部１２４は、相違データ２２１に応じて、類似範囲１３０の大きさを変える。しかし、第２実施形態においては、相違データ２２１のそれぞれに対して類似範囲１３０の大きさが一定とされてよい。類似範囲１３０の大きさは、特徴量ベクトル（意味ベクトル２３）空間において、各相違データ２２１からの距離Ｒ（但し、Ｒは定数）で表される。Ｒの値は、予め定められてよい。

〔Ｂ－２〕動作
第２実施形態の情報処理装置１による訓練時および再訓練時の動作は、図１５および図１９に示される第１実施形態の情報処理装置１の場合の動作と同様である。したがって、詳しい説明は省略される。

第２実施形態の情報処理装置１の推論時の動作は、図１６に示される第１実施形態の情報処理装置１の動作と共通する。但し、第２実施形態の情報処理装置１は、類似範囲１３０を決定する処理において、同値データ２２２を使用しないため、図１７におけるステップＳ１６の処理が省略されてよい。

図２１は、第２実施形態における情報処理装置１による既存訓練データの更新処理を示すフローチャートである。図２１に示される処理において、ステップＳ３０，Ｓ３１，Ｓ３３～Ｓ３６の処理は、図１８に示されるステップＳ２０，Ｓ２１，Ｓ２４～Ｓ２７の処理と同様である。したがって、詳しい説明を省略する。

ステップＳ３２において、類似範囲決定部１２４は、第２訓練データ２２のうち相違データ２２１のそれぞれについて一定の範囲である類似範囲１３０を決定する。

第２実施形態の情報処理装置１によれば、類似範囲１３０の決定について、同値データ２２２を用いた演算が不要である。よって簡略化した構成によって、陳腐化したデータを削除することができる。

〔第３実施形態〕
〔Ａ－３〕構成
第３実施形態の情報処理装置１について説明される。第３実施形態の情報処理装置１のハードウェア構成は、図１に示される第１実施形態におけるハードウェア構成と同様である。したがって、繰り返しの説明が省略される。

図２２は、第３実施形態における推論時のソフトウェア構成例を模式的に示すブロック図である。第３実施形態の情報処理装置１は、図６に示される第１実施形態のソフトウェア構成または図２０に示される第２実施形態のソフトウェア構成に対して、補完部１２６が追加されている。図２２においては、第１実施形態の情報処理装置１のソフトウェア構成に対して、補完部１２６が追加された構成を示す。しかし、第２実施形態の情報処理装置１のソフトウェア構成に対して、補完部１２６が追加されてもよい。

除去部１２５は、補完部１２６に対して指標データを通知する。

第２訓練データ２２ａは、図６および図２０のように正解ラベル付き文章収集部２０から取得されず、訓練処理部１００による処理を通じて生成されてよい。

図２３は、指標データ２６の一例を示す。指標データ２６は、新たな第２訓練データ２２ａを収集するために指標となるデータである。指標データ２６は、既存訓練データ群２１（第１訓練データ群２１１）に含まれる第１訓練データが除去された類似範囲１３０または除去された第１訓練データに基づいて生成される。より具体的には、指標データ２６は、既存訓練データ群２１（第１訓練データ群２１１）に含まれる第１訓練データが除去された類似範囲１３０のベクトル空間上の位置または除去された第１訓練データのベクトル空間上の位置に基づいて生成される。

指標データ２６は、一例において、第１訓練データ（図１１のＸ１，Ｘ２）が除去された類似範囲１３０ａに対応する第２訓練データ２２（図１１のＮ１）の成分を含む。指標データ２６は、第２訓練データ２２（図１１のＮ１）に対応する指標範囲（類似範囲１３０ａに対応）についての情報（図１１においては、０．８５）を含んでよい。さらに指標データ２６は、類似範囲１３０ａに含まれるとして除去された第１訓練データの数（類似範囲１３０ａ内に含まれるとして削除された第１訓練データの数は、２個）についての情報を含んでよい。

指標データ２６は、類似範囲１３０内に含まれるとして第１訓練データが除去された場合において、複数の類似範囲１３０（図１１の場合、類似範囲１３０ａ，１３０ｂ）のそれぞれについて生成される。第２訓練データ２２（図１１のＮ２）に対応する類似範囲１３０ｂについての指標データ２６は、第２訓練データ２２（図１１のＮ２）の成分、類似範囲１３０ｂの情報（０．８）、および除去された第１訓練データ（図１１のＸ１２）の数（１個）について含む。

図２４は、指標データ２６に基づくデータ選択処理の一例を示す図である。指標データ２６は、第１訓練データを除去した領域に対応する。第１領域データを除去した領域は、ベクトル空間において、訓練データが希薄な領域となる。したがって、指標データ２６に基づいて新たな訓練データを優先して収集することで、希薄な領域に対して優先して訓練データを補充することができる。指標データ２６は、図２３および図２４に示される場合に限られない。

図２５は、指標データ２６ａ，２６ｂに基づくデータ選択処理の他の例を示す図である。図２５のように、指標データ２６ａ，２６ｂは、類似範囲１３０ａに含まれるとして除去された第１訓練データであるＸ１，Ｘ２のそれぞれに基づいて生成されてもよい。指標データ２６ａ，２６ｃは、第１訓練データであるＸ１，Ｘ２のそれぞれの成分と、除去された第１訓練データ（Ｘ１，Ｘ２）のそれぞれにおける指標範囲１３２－１，１３２－２とを含んでよい。

図２６は、第３実施形態における新たな第２訓練データ２２の作成時のソフトウェア構成例を模式的に示すブロック図である。図２６は、指標データ２６に基づいて、新たな第２訓練データ２２ａを収集する処理を示す。

第１実施形態および第２実施形態の場合と異なり、文章収集部２７が、正解ラベル１１７が付加されていないラベル無し新規訓練データ候補２５１を取得してよい。ラベル無し新規訓練データ候補２５１は、教師データにおいて正解ラベル１１７が付加される前の対象データの候補であってよい。

図２７は、ラベル無し新規訓練データ候補２５１の一例を示す図である。ラベル無し新規訓練データ候補２５１は、識別情報と文章（対象データ部分）を含んでよい。

ラベル無し新規訓練データ候補２５１は、分類器１１０に入力される。分類器１１０は、ラベル無し新規訓練データ候補２５１に対応する特徴量ベクトル（意味ベクトル２３）を推論して出力する。

補完部１２６は、分類器１１０によって推論された特徴量ベクトル（意味ベクトル２３）と、指標データ２６とに基づいて、ラベル無し新規訓練データ候補２５１のうちからラベリング待ちデータ２５２を選択する。ラベリング待ちデータ２５２は、正解ラベル１１７が付される対象データである。

図２８は、指標データ２６（一例において、図１１のＮ１，Ｎ２に対応）とラベル無し新規訓練データ候補２５１との間のコサイン類似度を含む第３テーブル２８を示す。補完部１２６は、指標データ２６ごとに、ラベル無し新規訓練データ候補２５１のそれぞれとの間のコサイン類似度を算出する。具体的には、補完部１２６は、指標データ２６（Ｎ１）とラベル無し新規訓練データ候補２５１（Ｎ５～Ｎ８）のそれぞれとの間のコサイン類似度を算出する。同様に、補完部１２６は、指標データ２６（Ｎ２）とラベル無し新規訓練データ候補２５１（Ｎ５～Ｎ８）のそれぞれとの間のコサイン類似度を算出する。

補完部１２６は、指標データ２６に含まれる指標範囲１３２（一例において、類似範囲１３０に対応）を参照する。指標範囲１３２は、例えば、コサイン類似度に対する閾値で規定してもよい。例えば、指標データ２６（Ｎ１）については、指標範囲１３２は、０．８５以上であり、指標データ２６（Ｎ２）については、指標範囲は、０．８以上である。

補完部１２６は、図２８に示される第３テーブル２８中から、指標範囲１３２に含まれるラベリング待ちデータ２５２を選択する。図２８に示される場合では、補完部１２６は、指標データ２６（Ｎ１）の指標範囲１３２に含まれるラベリング待ちデータ２５２として、Ｎ５，Ｎ６を選択する。同様に、補完部１２６は、指標データ２６（Ｎ２）の指標範囲１３２に含まれるラベリング待ちデータ２５２として、Ｎ８を選択する。ラベリング待ちデータ２５２は登録される。

図２４に示されるように、補完部１２６は、指標データ２６の指標範囲（類似範囲１３０に対応）内に存在するラベリング待ちデータ２５２を選択してよい。あるいは、図２５に示されるように、補完部１２６は、指標データ２６ａ，２６ｂに含まれる指標範囲１３２－１，１３２－２内に存在するラベリング待ちデータ２５２を選択してよい。

ラベリング待ちデータ２５２に対して正解ラベル１１７が付加されて第２訓練データ２２ａが生成される。ラベリング待ちデータ２５２として登録されたデータに正解ラベル１１７が付加される。正解ラベル１１７の付加は、一例において、作業者によって行なわれてよい。

図２９は、正解ラベル付けしたデータ２９の一例を示す図である。図２９においては、指標データ２６（Ｎ１）の指標範囲に含まれることにより、ラベリング待ちデータ２５２として選択されたＮ５，Ｎ６に対して、それぞれ正解ラベル１１７が付加される。同様に、指標データ２６（Ｎ２）の指標範囲に含まれるラベリング待ちデータ２５２として選択されたＮ８に対して、正解ラベル１１７が付加される。正解ラベル付けしたデータ２９は、図２６における第２訓練データ２２ａとして用いられる。

〔Ｂ－３〕動作
第３実施形態の情報処理装置１による訓練時および再訓練時の動作は、図１５および図１９に示される第１実施形態の情報処理装置１の場合の動作と同様である。したがって、詳しい説明は省略される。

図３０は、第３実施形態におけるラベリング待ちデータ２５２の選択処理の一例を示す図である。

一定期間が経過するのを待って（ステップＳ４０のＹＥＳルート参照）、処理がステップＳ４１に進む。したがって、一定期間ごとに、ステップＳ４１～ステップＳ４９の処理が実行されてよい。

ステップＳ４１において、訓練処理部１００は、ラベル無し新規訓練データ候補２５１（分類対象データ）を受信する。ラベル無し新規訓練データ候補２５１は、文章収集部２７から取得してよい。

ステップＳ４２において、補完部１２６は、指標データ２６があるか否かを判断する。指標データ２６がない場合には（ステップＳ４２のＮＯルート参照）、処理はステップＳ４３に進む。指標データ２６がある場合には（ステップＳ４２のＹＥＳルート参照）、処理はステップＳ４４に進む。

ステップＳ４３においては、補完部１２６は、ラベル無し新規訓練データ候補２５１から必要な第２訓練データ数分のデータをランダムに選択する。補完部１２６は、選択されたラベル無し新規訓練データ候補２５１をラベリング待ちデータ２５２として登録する。

ステップＳ４４においては、補完部１２６は、指標データ２６の情報を取得する。指標データ２６は、図２３に示されるように、対応する第２訓練データ２２の成分、指標範囲、削除された第１訓練データの数などの情報を含んでよい。

ステップＳ４５においては、訓練処理部１００は、ラベル無し新規訓練データ候補２５１を分類器１１０に入力し、特徴量ベクトル（意味ベクトル２３）を取得する。

ステップＳ４６においては、補完部１２６は、指標データ２６のそれぞれとラベル無し新規訓練データ候補２５１との類似度を計算する。

ステップＳ４７においては、補完部１２６は、類似範囲１３０等に対応する指標範囲内にあるラベル無し新規訓練データ候補２５１をラベリング待ちデータ２５２として選択し登録する。

登録されたラベリング待ちデータ２５２が規定された数以上となった場合には（ステップＳ４８のＹＥＳルート参照）、処理が完了する。登録されたラベリング待ちデータ２５２が規定された数以上とならない場合には（ステップＳ４８のＮＯルート参照）、処理は、ステップＳ４９に進む。

ステップＳ４９においては、補完部１２６は、残ったラベル無し新規訓練データ候補２５１からランダムに必要数のラベリング待ちデータを選択して登録する。

図３１は、第３実施形態における情報処理装置１による第２訓練データ２２ａに対する選別処理を示すフローチャートである。図３１は、図１６におけるステップＳ２の一例を示す。

ラベリング待ちデータ２５２に正解ラベル１１７が付加されて新たな第２訓練データ２２ａが生成される。正解ラベル１１７は、作業者によって文章の内容に応じて付加されてよい。

規定数以上のラベリング待ちデータにラベルが付与された場合には（ステップＳ５０のＹＥＳルート参照）、ステップＳ５１以下の処理に進む。

ステップＳ５１において、訓練処理部１００は、訓練データごとにタイムスタンプを設定してよい。タイムスタンプは、訓練データが登録された日時を示す情報である。

ステップＳ５２において、訓練処理部１００は、第２訓練データ２２ａを分類器１１０に入力し、図９に示されるようなラベル判定結果を算出する。ラベル判定結果は、推論された判定ラベル１１６についての情報を含んでいる。

ステップＳ５３～Ｓ５６の処理は、図１７におけるステップＳ１４～Ｓ１７の処理と同様である。したがって、繰り返しの説明が省略される。

図３２は、第３実施形態における情報処理装置１による既存訓練データの更新処理の一例を示すフローチャートである。

図３２の処理は、ステップＳ６７が付加されていることを除いて、図１８の処理と同様である。すなわち、図３２のステップＳ６０～Ｓ６６，およびＳ６８の処理は、図１８のステップＳ２０～Ｓ２７の処理と共通する。したがって、繰り返しの説明が省略される。

ステップＳ６７において、除去部１２５は、既存訓練データ群２１（第１訓練データ群２１１）に含まれる第１訓練データが除去された類似範囲１３０または除去された第１訓練データに基づいて、指標データ２６を生成する。

第１領域データを除去した領域は、ベクトル空間において、訓練データが希薄な領域となる。したがって、指標データ２６に基づいて新たな訓練データを優先して収集することで、希薄な領域に対して優先して訓練データを補充することができる。

図３３は、第３実施形態における情報処理装置１による既存訓練データの更新処理の他の例を示すフローチャートである。

図３３の処理は、ステップＳ７６が付加されていることを除いて、図２１の処理と同様である。すなわち、図３３のステップＳ７０～Ｓ７５，およびＳ７７の処理は、図２１のステップＳ３０～Ｓ３６の処理と共通する。したがって、繰り返しの説明が省略される。

ステップＳ７６において、除去部１２５は、既存訓練データ群２１（第１訓練データ群２１１）に含まれる第１訓練データが除去された類似範囲１３０または除去された第１訓練データに基づいて、指標データ２６を生成する。

（Ｃ）実施形態の効果
このように、第１～第３実施形態にかかる手法では、コンピュータは、複数の第１訓練データを含む第１訓練データ群２１１を用いて機械学習された分類器１１０に第２訓練データ２２を入力することによって推論される判定ラベル１１６を用いる。コンピュータは、判定ラベル１１６と、第２訓練データ２２の正解ラベル１１７とが異なる場合に、当該第２訓練データ２２に対して類似範囲１３０を決定する処理を実行する。そして、コンピュータは、複数の第１訓練データのなかから、少なくとも類似範囲１３０内に含まれる第１訓練データを除去して第２訓練データ群２１２を作成する処理を実行する。そして、コンピュータは、第２訓練データ群２１２を用いて新たに分類器１１０を機械学習する処理を実行する。

以上の手法によれば、訓練データの陳腐化に起因するデータ分類精度の低下を抑制することができる。意味ベクトル２３等の特徴量ベクトルが類似した内容のデータであるのにもかかわらず正解ラベル１１７が異なる状況が解消される。したがって、正解ラベル１１７が古くなった第１訓練データの影響を軽減することができるため、分類精度の低下を抑制することができる。

第２訓練データ群２１２は、さらに第２訓練データ２２を含む。したがって、第２訓練データ２２が追加される場合においても、既存の第１訓練データ群２１１と第２訓練データ２２との間において類似するデータであるにも関わらず正解ラベル１１７が異なるデータが併存する状況が解消される。したがって、正解ラベル１１７が古くなった第１訓練データの影響を軽減することができるため、分類精度の低下を抑制することができる。

類似範囲１３０を決定する処理は、第２訓練データ２２をベクトル化して得られる特徴量ベクトルとの間で予め定められた値以上の類似度を示す範囲を、第２訓練データ２２に対する類似範囲１３０として決定する。したがって、意味ベクトル２３等の特徴量ベクトルが類似した内容のデータであるのにもかかわらず正解ラベル１１７が異なるデータが併存する状況を解消することができる。

第２訓練データ２２は、判定ラベル１１６と正解ラベル１１７とが異なる複数の相違データ２２１、および判定ラベル１１６と正解ラベル１１７とが同じ複数の同値データ２２２を含む。複数の同値データ２２２のうちのいずれかのデータと相違データ２２１との間の類似度が高いほど狭くするように類似範囲１３０が決定される。相違データ２２１ごとに類似範囲１３０が決定される。

したがって、相違データ２２１ごとに最適な範囲において、第１訓練データを除去することができる。

相違データ２２１において、複数の同値データ２２２のそれぞれとの間の類似度のうちの最大値をαとすると、類似範囲１３０は（１＋α）／２に応じて相違データ２２１ごとに定められる。

したがって、定量的に、相違データ２２１ごとに最適な範囲において、第１訓練データを除去することができる。

第２訓練データ２２の数をＮとし、類似範囲１３０内に含まれるために除去される第１訓練データの数をＳとする場合に、追加された時期が古いものから順番に複数の第１訓練データのうち（Ｎ－Ｓ）個をさらに除去する。

したがって、訓練データの陳腐化を抑制することができる。

第１訓練データが除去された類似範囲１３０に対応しており判定ラベル１１６と正解ラベル１１７とが異なる第２訓練データ２２である相違データ２２１または除去された第１訓練データに基づいて、新たな第２の訓練データを収集するために指標となる指標データ２６が生成される。そして、指標データ２６との間の類似度に基づいて、新たな第２訓練データ２２が収集される。

したがって、第１領域データが除去されることに起因して訓練データが希薄となった領域に対して優先して訓練データを補充することができる。これにより、訓練データが希薄になることに起因する分類精度の低下を未然に防止することができる。

（Ｄ）その他
開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。例えば、本実施形態の各構成および各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。

（Ｅ）付記
以上の実施形態に関し、さらに以下の付記を開示する。

（付記１）
複数の第１の訓練データを含む第１訓練データ群を用いて機械学習された分類器に第２の訓練データを入力することによって推論される判定ラベルと、前記第２の訓練データの正解ラベルとが異なる場合に、当該第２の訓練データに対して類似範囲を決定し、
前記複数の第１の訓練データのなかから、少なくとも前記類似範囲内に含まれる第１の訓練データを除去して第２訓練データ群を作成し、
前記第２訓練データ群を用いて新たに前記分類器を機械学習する
処理をコンピュータに実行させる、機械学習プログラム。

（付記２）
前記第２訓練データ群は、第２の訓練データを含む、付記１に記載の機械学習プログラム。

（付記３）
前記類似範囲を決定する処理は、前記第２の訓練データをベクトル化して得られる特徴量ベクトルとの間で予め定められた値以上の類似度を示す範囲を、前記第２の訓練データに対する前記類似範囲として決定する処理を含む、付記１または２に記載の機械学習プログラム。

（付記４）
前記第２の訓練データは、前記判定ラベルと前記正解ラベルとが異なる複数の相違データ、および前記判定ラベルと前記正解ラベルとが同じ複数の同値データを含み、
前記類似範囲を決定する処理は、前記複数の同値データのうちのいずれかのデータと前記複数の相違データとの間の類似度が高いほど狭くするように前記複数の相違データのそれぞれに前記類似範囲を決定する処理を含む、付記１または２に記載の機械学習プログラム。

（付記５）
前記類似範囲は、前記相違データと前記複数の同値データのそれぞれとの間の類似度のうちの最大値に基づいて定められる、付記４に記載の機械学習プログラム。

（付記６）
前記少なくとも前記類似範囲内に含まれる前記第１の訓練データを除去する処理は、前記第２の訓練データの数をＮとし、前記類似範囲内に含まれるために除去される前記第１の訓練データの数をＳとする場合に、追加された時期が古いものから順番に前記複数の第１の訓練データのうち（Ｎ－Ｓ）個をさらに除去する処理を含む、付記２に記載の機械学習プログラム。

（付記７）
前記第１の訓練データが除去された前記類似範囲に対応しており前記判定ラベルと前記正解ラベルとが異なる前記第２の訓練データまたは除去された第１の訓練データに基づいて、新たな第２の訓練データを収集するために指標となる指標データを生成し、
前記指標データとの間の類似度に基づいて、前記新たな第２の訓練データを収集する、処理を前記コンピュータに実行させる、付記１または２に記載の機械学習プログラム。

(付記８)
複数の第１の訓練データを含む第１訓練データ群を用いて機械学習された分類器に第２の訓練データを入力することによって推論される判定ラベルと、前記第２の訓練データの正解ラベルとが異なる場合に、当該第２の訓練データに対して類似範囲を決定し、
前記複数の第１の訓練データのなかから、少なくとも前記類似範囲内に含まれる第１の訓練データを除去して第２訓練データ群を作成し、
前記第２訓練データ群を用いて新たに前記分類器を機械学習する
処理をコンピュータが実行する、機械学習方法。

（付記９）
前記第２訓練データ群は、第２の訓練データを含む、付記８に記載の機械学習方法。

（付記１０）
前記類似範囲を決定する処理は、前記第２の訓練データをベクトル化して得られる特徴量ベクトルとの間で予め定められた値以上の類似度を示す範囲を、前記第２の訓練データに対する前記類似範囲として決定する処理を含む、付記８または９に記載の機械学習方法。

（付記１１）
前記第２の訓練データは、前記判定ラベルと前記正解ラベルとが異なる複数の相違データ、および前記判定ラベルと前記正解ラベルとが同じ複数の同値データを含み、
前記類似範囲を決定する処理は、前記複数の同値データのうちのいずれかのデータと前記相違データとの間の類似度が高いほど狭くするように前記複数の相違データのそれぞれに前記類似範囲を決定する処理を含む、付記８または９に記載の機械学習方法。

（付記１２）
前記類似範囲は、前記相違データと前記複数の同値データのそれぞれとの間の類似度のうちの最大値に基づいて定められる、付記１１に記載の機械学習方法。

（付記１３）
前記少なくとも前記類似範囲内に含まれる前記第１の訓練データを除去する処理は、前記第２の訓練データの数をＮとし、前記類似範囲内に含まれるために除去される前記第１の訓練データの数をＳとする場合に、追加された時期が古いものから順番に前記複数の第１の訓練データのうち（Ｎ－Ｓ）個をさらに除去する処理を含む、付記９に記載の機械学習方法。

（付記１４）
前記第１の訓練データが除去された前記類似範囲に対応しており前記判定ラベルと前記正解ラベルとが異なる前記第２の訓練データまたは除去された第１の訓練データに基づいて、新たな第２の訓練データを収集するために指標となる指標データを生成し、
前記指標データとの間の類似度に基づいて、前記新たな第２の訓練データを収集する、処理を前記コンピュータが実行する、付記８または９に記載の機械学習方法。

（付記１５）
複数の第１の訓練データを含む第１訓練データ群を用いて機械学習された分類器に第２の訓練データを入力することによって推論される判定ラベルと、前記第２の訓練データの正解ラベルとが異なる場合に、当該第２の訓練データに対して類似範囲を決定し、
前記複数の第１の訓練データのなかから、少なくとも前記類似範囲内に含まれる第１の訓練データを除去して第２訓練データ群を作成し、
前記第２訓練データ群を用いて新たに前記分類器を機械学習する
処理を実行する制御部を備えることを特徴とする、情報処理装置。

（付記１６）
前記第２訓練データ群は、第２の訓練データを含む、付記１５に記載の情報処理装置。

（付記１７）
前記類似範囲を決定する処理は、前記第２の訓練データをベクトル化して得られる特徴量ベクトルとの間で予め定められた値以上の類似度を示す範囲を、前記第２の訓練データに対する前記類似範囲として決定する処理を含む、付記１５または１６に記載の情報処理装置。

（付記１８）
前記第２の訓練データは、前記判定ラベルと前記正解ラベルとが異なる複数の相違データ、および前記判定ラベルと前記正解ラベルとが同じ複数の同値データを含み、
前記類似範囲を決定する処理は、前記複数の同値データのうちのいずれかのデータと前記相違データとの間の類似度が高いほど狭くするように前記複数の相違データのそれぞれに前記類似範囲を決定する処理を含む、付記１５または１６に記載の情報処理装置。

（付記１９）
前記類似範囲は、前記相違データと前記複数の同値データのそれぞれとの間の類似度のうちの最大値に基づいて定められる、付記１８に記載の情報処理装置。

（付記２０）
前記少なくとも前記類似範囲内に含まれる前記第１の訓練データを除去する処理は、前記第２の訓練データの数をＮとし、前記類似範囲内に含まれるために除去される前記第１の訓練データの数をＳとする場合に、追加された時期が古いものから順番に前記複数の第１の訓練データのうち（Ｎ－Ｓ）個をさらに除去する処理を含む、付記１６に記載の情報処理装置。

（付記２１）
前記制御部は、前記第１の訓練データが除去された前記類似範囲に対応しており前記判定ラベルと前記正解ラベルとが異なる前記第２の訓練データまたは除去された第１の訓練データに基づいて、新たな第２の訓練データを収集するために指標となる指標データを生成し、
前記指標データとの間の類似度に基づいて、前記新たな第２の訓練データを収集する、付記１５または１６に記載の情報処理装置。

１情報処理装置
１１プロセッサ
１２メモリ
１３記憶装置
１３ａ機械学習プログラム
１３ｂ訓練データ生成プログラム
１４グラフィック処理装置
１４ａモニタ
１５入力インタフェース
１５ａキーボード
１５ｂマウス
１６光学ドライブ装置
１６ａ光ディスク
１７機器接続インタフェース
１７ａメモリ装置
１７ｂメモリリーダライタ
１７ｃメモリカード
１８ネットワークインタフェース
１８ａネットワーク
１９バス
２０正解ラベル付き文章収集部
２１既存訓練データ群
２２第２訓練データ
２３意味ベクトル
２４第１テーブル
２５第２テーブル
２６指標データ
２７文章収集部
２８第３テーブル
２９正解ラベル付けしたデータ
１００訓練処理部
１１０分類器
１１１入力文
１１２入力層
１１３トランスフォーマー
１１４隠れ層
１１５出力層
１１６判定ラベル
１１７正解ラベル
１２０訓練データ更新部
１２１新規データ追加部
１２２比較部
１２３既存データ更新部
１２４類似範囲決定部
１２５除去部
１２６補完部
１３０類似範囲
１３０ａ類似範囲
１３０ｂ類似範囲
１２６補完部
２１１第１訓練データ群
２１２第２訓練データ群
２２１相違データ
２２２同値データ
２５１ラベル無し新規訓練データ候補
２５２ラベリング待ちデータ

Claims

複数の第１の訓練データを含む第１訓練データ群を用いて機械学習された分類器に第２の訓練データを入力することによって推論される判定ラベルと、前記第２の訓練データの正解ラベルとが異なる場合に、当該第２の訓練データに対して類似範囲を決定し、
前記複数の第１の訓練データのなかから、少なくとも前記類似範囲内に含まれる第１の訓練データを除去して第２訓練データ群を作成し、
前記第２訓練データ群を用いて新たに前記分類器を機械学習する
処理をコンピュータに実行させる、機械学習プログラム。
前記第２訓練データ群は、前記第２の訓練データを含む、請求項１に記載の機械学習プログラム。
前記類似範囲を決定する処理は、前記第２の訓練データをベクトル化して得られる特徴量ベクトルとの間で予め定められた値以上の類似度を示す範囲を、前記第２の訓練データに対する前記類似範囲として決定する処理を含む、請求項１または２に記載の機械学習プログラム。
前記第２の訓練データは、前記判定ラベルと前記正解ラベルとが異なる複数の相違データ、および前記判定ラベルと前記正解ラベルとが同じ複数の同値データを含み、
前記類似範囲を決定する処理は、前記複数の同値データのうちのいずれかのデータと前記相違データとの間の類似度が高いほど狭くするように前記複数の相違データのそれぞれに前記類似範囲を決定する処理を含む、請求項１または２に記載の機械学習プログラム。
前記類似範囲は、前記相違データと前記複数の同値データのそれぞれとの間の類似度のうちの最大値に基づいて定められる、請求項４に記載の機械学習プログラム。
前記少なくとも前記類似範囲内に含まれる前記第１の訓練データを除去する処理は、前記第２の訓練データの数をＮとし、前記類似範囲内に含まれるために除去される前記第１の訓練データの数をＳとする場合に、追加された時期が古いものから順番に前記複数の第１の訓練データのうち（Ｎ－Ｓ）個をさらに除去する処理を含む、請求項２に記載の機械学習プログラム。
前記第１の訓練データが除去された前記類似範囲に対応しており前記判定ラベルと前記正解ラベルとが異なる前記第２の訓練データまたは除去された第１の訓練データに基づいて、新たな第２の訓練データを収集するために指標となる指標データを生成し、
前記指標データとの間の類似度に基づいて、前記新たな第２の訓練データを収集する、処理を前記コンピュータに実行させる、請求項１または２に記載の機械学習プログラム。
複数の第１の訓練データを含む第１訓練データ群を用いて機械学習された分類器に第２の訓練データを入力することによって推論される判定ラベルと、前記第２の訓練データの正解ラベルとが異なる場合に、当該第２の訓練データに対して類似範囲を決定し、
前記複数の第１の訓練データのなかから、少なくとも前記類似範囲内に含まれる第１の訓練データを除去して第２訓練データ群を作成し、
前記第２訓練データ群を用いて新たに前記分類器を機械学習する
処理をコンピュータが実行する、機械学習方法。
複数の第１の訓練データを含む第１訓練データ群を用いて機械学習された分類器に第２の訓練データを入力することによって推論される判定ラベルと、前記第２の訓練データの正解ラベルとが異なる場合に、当該第２の訓練データに対して類似範囲を決定し、
前記複数の第１の訓練データのなかから、少なくとも前記類似範囲内に含まれる第１の訓練データを除去して第２訓練データ群を作成し、
前記第２訓練データ群を用いて新たに前記分類器を機械学習する
処理を実行する制御部を備えることを特徴とする、情報処理装置。