WO2023162129A1

WO2023162129A1 - 学習用データ生成装置、リスク検知装置、学習用データ生成方法、リスク検知方法、学習用データ生成プログラム及びリスク検知プログラム

Info

Publication number: WO2023162129A1
Application number: PCT/JP2022/007860
Authority: WO
Inventors: 直生吉永; 淳吉田
Original assignee: 日本電気株式会社
Priority date: 2022-02-25
Filing date: 2022-02-25
Publication date: 2023-08-31

Abstract

ルール作成等の煩雑な作業を要することなく、プロジェクト等のリスクをより精度よく検知するための学習用データを生成するために、学習用データ生成装置（１）は、テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析部（１１）と、上記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、上記構造データにおいて上記表現に対応する要素にタグ付けするタグ付け部（１２）と、上記テキストデータと上記タグ付け部（１２）によりタグ付けされた構造データとを含む学習用データを出力する出力部（１３）と、を備える。

Description

学習用データ生成装置、リスク検知装置、学習用データ生成方法、リスク検知方法、学習用データ生成プログラム及びリスク検知プログラム

　本発明は、プロジェクト等のリスクを検知するための技術に関する。

　企業等においては業務文書等の大量の文書が存在する。そのような大量の文書の全てを確認して俯瞰的な判断を下すことは困難であり、保管されている大量の文書を有効に活用できていない場合がある。また、近年、大量の文書から有用な情報を抽出したり、特定の状況を検知したりしたいといったニーズがある。特に、プロジェクト等のリスクを検知したいというニーズが大きい。

　文書からリスクを検知する手法として、従来では、リスクを表す単語（「遅れ」、「不満」、等）を抽出したり、抽出された単語を組み合わせたルールベースでリスクを検知したりすることが行われている。例えば特許文献１には、ひとつの文書を独立した複数のルールに関して評価し、各ルールの評価値と重みの積を合計することが記載されている。また、特許文献２には、ＷＥＢページのテキストデータから形態素解析によって単語を抽出し、抽出した単語をニューラルネットワークに入力してリスクに関するスコアを算出することが記載されている。

特開平２－２８９０６０号公報特開２０２０－１６６５０６号公報

　しかしながら、特許文献１等のルールベースでリスクを検知する技術では、人手による単語辞書やルール作成に非常に手間がかかるという課題があった。上記課題解決のため、特許文献２等に記載されたような、一般的な自然言語処理技術を利用して単語抽出を行う方法が考えられるが、誤検知が多くなってしまうという課題があった。

　本発明の一態様は、上記の問題に鑑みてなされたものであり、その目的の一例は、ルール作成等の煩雑な作業を要することなく、プロジェクト等のリスクをより精度よく検知するための学習用データを生成する技術を提供することである。

　本発明の一側面に係る学習用データ生成装置は、テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析手段と、前記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、前記構造データにおいて前記表現に対応する要素にタグ付けするタグ付け手段と、前記テキストデータと前記タグ付け手段によりタグ付けされた構造データとを含む学習用データを出力する出力手段と、を備える。

　本発明の一側面に係るリスク検知装置は、テキストデータを取得する取得手段と、前記取得手段が取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析手段と、テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、前記取得手段が取得したテキストデータからリスクに相当する表現を抽出する抽出手段と、を備える。

　本発明の一側面に係る学習用データ生成方法は、少なくとも１つのプロセッサが、テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成し、前記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、前記構造データにおいて前記表現に対応する要素にタグ付けし、前記テキストデータと前記タグ付けされた構造データとを含む学習用データを出力する。

　本発明の一側面に係るリスク検知方法は、少なくとも１つのプロセッサが、テキストデータを取得し、前記取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成し、テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、前記取得したテキストデータからリスクに相当する表現を抽出する。

　本発明の一側面に係る学習用データ生成プログラムは、コンピュータに、テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析処理と、前記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、前記構造データにおいて前記表現に対応する要素にタグ付けするタグ付け処理と、前記テキストデータと前記タグ付け処理においてタグ付けされた構造データとを含む学習用データを出力する出力処理と、を実行させる。

　本発明の一側面に係るリスク検知プログラムは、コンピュータに、テキストデータを取得する取得処理と、前記取得処理において取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析処理と、テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、前記取得処理において取得したテキストデータからリスクに相当する表現を抽出する抽出処理と、を実行させる。

　本発明の一態様によれば、ルール作成等の煩雑な作業を要することなく、プロジェクト等のリスクをより精度よく検知するための学習用データを生成することができる。

例示的実施形態１に係る学習用データ生成装置の構成を示すブロック図である。例示的実施形態１に係る学習用データ生成方法の流れを示すフロー図である。例示的実施形態１に係るリスク検知装置の構成を示すブロック図である。例示的実施形態１に係るリスク検知方法の流れを示すフロー図である。例示的実施形態２に係る情報処理装置の構成を示すブロック図である。例示的実施形態２に係る学習フェーズ実行方法の流れを示すフロー図である。例示的実施形態２に係る画面表示例を示す図である。例示的実施形態２に係る画面表示例を示す図である。例示的実施形態２に係る推定フェーズ実行方法の流れを示すフロー図である。各例示的実施形態に係る情報処理装置として機能するコンピュータの構成を示すブロック図である。

　〔例示的実施形態１〕
　本発明の第１の例示的実施形態について、図面を参照して詳細に説明する。本例示的実施形態は、後述する例示的実施形態の基本となる形態である。

　＜学習用データ生成装置１の構成＞
　本例示的実施形態に係る学習用データ生成装置１の構成について、図１を参照して説明する。図１は、学習用データ生成装置１の構成を示すブロック図である。学習用データ生成装置１は、解析部１１、タグ付け部１２及び出力部１３を備える。

　（解析部１１）
　解析部１１は、テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する。ここで、テキストデータは、文を表すデータであり、一例として、企業で保管されている業務文書（業務日報、操業日誌、等）を表すデータである。テキストデータが保存されるデータ形式はテキストファイルに限られず、例えばＰＤＦ（Portable Document Format）形式のファイル、ＨＴＭＬ（HyperText Markup Language）形式のファイル、又は他の所定の文書作成ソフトウェアにより作成されたファイルであってもよい。

　解析部１１は、一例として、形態素解析及び構文解析を行うことにより文の構造を解析する。形態素解析は、文を形態素に分割し、それぞれの形態素の品詞等を判別する処理である。構文解析は、形態素の関係を図式化する等して明確にする処理である。ただし、解析部１１が文の構造を解析する手法は上述した例に限られない。解析部１１は他の手法により文の構造を解析してもよい。

　構造データは、文の構造を表すデータであり、一例として、構文木を表すデータである。

　（タグ付け部１２）
　タグ付け部１２は、上記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、上記構造データにおいて上記表現に対応する要素にタグ付けする。ここで、リスクに相当する表現は、例えば、「費用負担が必要になる」といったフレーズである。以下では、リスクに相当する表現を「リスク表現」ともいう。どのフレーズがリスク表現であるかは、ユーザの属性、ユーザ又はプロジェクトの状況等により様々である。リスク表現は一例として、複数の形態素の組み合わせを含む。

　ユーザ操作は、ユーザがリスク表現を指定する動作であり、一例として、マウス、キーボード、タッチパネル、音声入力装置、視線入力装置等の入力装置に対する操作を含む。タグ付け部１２は、一例として、入出力インタフェースに接続されたディスプレイにリスク表現の指定をユーザに促す画面を表示する。ユーザが入力装置を用いてリスク表現を指定する操作を行うと、タグ付け部１２は、ユーザ操作に基づき、構造データに含まれる要素に対するタグ付けを行う。構造データにおいてリスク表現に対応する要素は、一例として、文に含まれる形態素である。

　（出力部１３）
　出力部１３は、上記テキストデータとタグ付け部１２によりタグ付けされた構造データとを含む学習用データを出力する。学習用データは、一例として、テキストデータからリスク表現を抽出するモデルの学習に用いられる。モデルの機械学習の手法は限定されないが、一例として、決定木ベース、線形回帰、又はニューラルネットワークの手法が用いられてもよく、また、これらのうちの２以上の手法が用いられてもよい。

　出力部１３は、一例として、学習用データを記憶装置に書き込むことにより出力してもよく、また、通信インタフェースを介して他の装置に学習用データを送信することにより学習用データを出力してもよい。また、出力部１３は、入出力インタフェースに接続された出力装置に学習用データを出力してもよい。出力装置は、一例として、ディスプレイ、プリンタ、プロジェクタ又はスピーカである。

　＜学習用データ生成装置１の効果＞
　以上のように、本例示的実施形態に係る学習用データ生成装置１においては、テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析部１１と、上記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、上記構造データにおいて上記表現に対応する要素にタグ付けするタグ付け部１２と、上記テキストデータとタグ付け部１２によりタグ付けされた構造データとを含む学習用データを出力する出力部１３と、を備える構成が採用されている。このように、学習用データ生成装置１は、文の構造を表す構造データをそのまま学習用データとするのではなく、ユーザ操作に基づきタグ付けした構造データを学習用データに含める。このため、本例示的実施形態に係る学習用データ生成装置１によれば、ルール作成等の煩雑な作業を要することなく、プロジェクト等のリスクをより精度よく検知するための学習用データを生成できるという効果が得られる。

　＜学習用データ生成プログラム＞
　上述の学習用データ生成装置１の機能は、プログラムによって実現することもできる。本例示的実施形態に係る学習用データ生成プログラムは、コンピュータに、テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析処理と、上記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、上記構造データにおいて上記表現に対応する要素にタグ付けするタグ付け処理と、上記テキストデータと上記タグ付け処理においてタグ付けされた構造データとを含む学習用データを出力する出力処理と、を実行させる。

　＜学習用データ生成方法Ｓ１の流れ＞
　本例示的実施形態に係る学習用データ生成方法Ｓ１の流れについて、図２を参照して説明する。図２は、学習用データ生成方法Ｓ１の流れを示すフロー図である。学習用データ生成方法Ｓ１における各ステップの実行主体は、学習用データ生成装置１が備えるプロセッサであってもよいし、他の装置が備えるプロセッサであってもよく、各ステップの実行主体がそれぞれ異なる装置に設けられたプロセッサであってもよい。

　ステップＳ１１では、少なくとも１つのプロセッサが、テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する。ステップＳ１２では、少なくとも１つのプロセッサが、上記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、上記構造データにおいて上記表現に対応する要素にタグ付けする。ステップＳ１３では、少なくとも１つのプロセッサが、上記テキストデータと上記タグ付けされた構造データとを含む学習用データを出力する。

　＜学習用データ生成方法Ｓ１の効果＞
　以上のように、本例示的実施形態に係る学習用データ生成方法Ｓ１においては、少なくとも１つのプロセッサが、テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成し、上記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、上記構造データにおいて上記表現に対応する要素にタグ付けし、上記テキストデータと上記タグ付けされた構造データとを含む学習用データを出力する構成が採用されている。このため、本例示的実施形態に係る学習用データ生成方法Ｓ１によれば、ルール作成等の煩雑な作業を要することなく、プロジェクト等のリスクをより精度よく検知するための学習用データを生成できるという効果が得られる。

　＜リスク検知装置２の構成＞
　次いで、本例示的実施形態に係るリスク検知装置２の構成について、図３を参照して説明する。図３は、リスク検知装置２の構成を示すブロック図である。リスク検知装置２は、取得部２１、解析部２２及び抽出部２３を備える。

　（取得部２１）
　取得部２１は、テキストデータを取得する。取得部２１は、一例として、記憶装置からテキストデータを読み出すことによりテキストデータを取得してもよく、また、通信インタフェースを介して接続された他の装置からテキストデータを受信することによりテキストデータを取得してもよい。また、取得部２１は、入出力インタフェースに接続された入力装置に入力されたテキストデータを取得してもよい。

　（解析部２２）
　解析部２２は、取得部２１が取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する。解析部２２は、一例として、形態素解析及び構文解析を行うことにより文の構造を解析する。ただし、解析部２２が文の構造を解析する手法は上述した例に限られない。解析部２２は他の手法により文の構造を解析してもよい。

　（抽出部２３）
　抽出部２３は、テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、取得部２１が取得したテキストデータからリスクに相当する表現を抽出する。

　（モデル）
　モデルは、テキストデータからリスク表現を抽出するモデルである。モデルの入力は一例として、テキストデータと構造データとを含む。また、モデルの出力は一例として、リスク表現を示すデータを含む。リスク表現を示すデータは一例として、リスク表現に相当する要素を示すデータ、又は、構造データに含まれる要素がリスク表現である確信度（スコア）を含む。

　モデルは、学習用データを用いた教師あり機械学習により生成される。モデルの学習に用いられる学習用データは、テキストデータと、リスク表現に対応する要素にタグ付けされた構造データとを含む。学習用データは、一例として、学習用データ生成装置１が生成した学習用データである。モデルの機械学習の手法は限定されないが、一例として、決定木ベース、線形回帰、又はニューラルネットワークの手法が用いられてもよく、また、これらのうちの２以上の手法が用いられてもよい。

　＜リスク検知装置２の効果＞
　以上のように、本例示的実施形態に係るリスク検知装置２においては、テキストデータを取得する取得部２１と、取得部２１が取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析部２２と、テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、取得部２１が取得したテキストデータからリスクに相当する表現を抽出する抽出部２３と、を備える構成が採用されている。このため、本例示的実施形態に係るリスク検知装置２によれば、ルール作成等の煩雑な作業を要することなく、プロジェクト等のリスクをより精度よく検知できるという効果が得られる。

　＜リスク検知プログラム＞
　上述のリスク検知装置２の機能は、プログラムによって実現することもできる。本例示的実施形態に係るリスク検知プログラムは、コンピュータに、テキストデータを取得する取得処理と、上記取得処理において取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析処理と、テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、上記取得処理において取得したテキストデータからリスクに相当する表現を抽出する抽出処理と、を実行させる。

　＜リスク検知方法Ｓ２の流れ＞
　本例示的実施形態に係るリスク検知方法Ｓ２の流れについて、図４を参照して説明する。図４は、リスク検知方法Ｓ２の流れを示すフロー図である。リスク検知方法Ｓ２における各ステップの実行主体は、リスク検知装置２が備えるプロセッサであってもよいし、他の装置が備えるプロセッサであってもよく、各ステップの実行主体がそれぞれ異なる装置に設けられたプロセッサであってもよい。

　ステップＳ２１では、少なくとも１つのプロセッサが、テキストデータを取得する。ステップＳ２２では、少なくとも１つのプロセッサが、上記取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する。ステップＳ２３では、少なくとも１つのプロセッサが、テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、上記取得したテキストデータからリスクに相当する表現を抽出する。

　＜リスク検知方法Ｓ２の効果＞
　以上のように、本例示的実施形態に係るリスク検知方法Ｓ２においては、少なくとも１つのプロセッサが、テキストデータを取得し、上記取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成し、テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、上記取得したテキストデータからリスクに相当する表現を抽出する構成が採用されている。このため、本例示的実施形態に係るリスク検知方法Ｓ２によれば、ルール作成等の煩雑な作業を要することなく、プロジェクト等のリスクをより精度よく検知できるという効果が得られる。

　〔例示的実施形態２〕
　本発明の第２の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態１にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付し、その説明を適宜省略する。

　＜リスク検知装置１Ａの構成＞
　図５は、本例示的実施形態に係るリスク検知装置１Ａの構成を示すブロック図である。リスク検知装置１Ａは、保存された文書からプロジェクト等のリスクを検知する機能を備える。リスク検知装置１Ａは本明細書に係る学習用データ生成装置及びリスク検知装置の一例である。リスク検知装置１Ａは、図５に示すように、制御部１０Ａ、記憶部２０Ａ、通信部３０Ａ及び入出力部４０Ａを備える。

　（通信部３０Ａ）
　通信部３０Ａは、リスク検知装置１Ａの外部の装置と通信回線を介して通信する。通信回線の具体的構成は本例示的実施形態を限定するものではないが、通信回線は一例として、無線ＬＡＮ（Local Area Network）、有線ＬＡＮ、ＷＡＮ（Wide Area Network）、公衆回線網、モバイルデータ通信網、又は、これらの組み合わせである。通信部３０Ａは、制御部１０Ａから供給されたデータを他の装置に送信したり、他の装置から受信したデータを制御部１０Ａに供給したりする。

　（入出力部４０Ａ）
　入出力部４０Ａには、キーボード、マウス、ディスプレイ、プリンタ、タッチパネル等の入出力機器が接続される。入出力部４０Ａは、接続された入力機器からリスク検知装置１Ａに対する各種の情報の入力を受け付ける。また、入出力部４０Ａは、制御部１０Ａの制御の下、接続された出力機器に各種の情報を出力する。入出力部４０Ａとしては、例えばＵＳＢ（Universal Serial Bus）などのインタフェースが挙げられる。

　（制御部１０Ａ）
　制御部１０Ａは、図５に示すように、学習フェーズ実行部１１０Ａ及び推定フェーズ実行部１２０Ａを備える。学習フェーズ実行部１１０Ａは解析部１１、タグ付け部１２、出力部１３及び学習部１４Ａを備える。推定フェーズ実行部１２０Ａは、取得部２１、解析部２２及び抽出部２３を備える。

　（解析部１１）
　解析部１１は、テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する。本例示的実施形態において、解析部１１は、テキストデータの形態素解析及び構文解析を行い、構文木を表すデータを生成する。

　（タグ付け部１２）
　タグ付け部１２は、上記文に含まれるリスク表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、上記構造データにおいてリスク表現に対応する要素にタグ付けする。タグ付け部１２は、一例として、上記ユーザ操作に基づき、上記リスクに相当する表現を示すタグとして「意図」を示すタグ及び「トピック」を示すタグを上記構造データの要素に付与する。ただし、タグ付け部１２が付与するタグは「意図」のタグと「トピック」のタグとの２種類のタグに限られず、他の種類のタグを含んでもよい。また、タグ付け部１２が付与するタグの種類は２に限らず、これより多くても少なくてもよい。

　（出力部１３）
　出力部１３は、テキストデータと、タグ付け部１２がタグ付けした構造データとを含む学習用データＴＤを出力する。本例示的実施形態において、出力部１３は、学習用データＴＤを記憶部２０Ａに書き込むことにより出力する。

　（学習部１４Ａ）
　学習部１４Ａは、学習用データを用いて、テキストデータと当該テキストデータの文の構造を表す構造データとを入力として当該テキストデータからリスクに相当する表現を抽出するモデルＭＡを学習させる。

　（取得部２１）
　取得部２１は、リスク検知の対象であるテキストデータを取得する。テキストデータは一例として、業務文書データベースＤＢに記憶されたテキストデータである。また、テキストデータは、通信部３０Ａを介して接続された他の装置から受信されるデータであってもよく、また、入出力部４０Ａに接続された入力装置に入力されたデータであってもよい。

　（解析部２２）
　解析部２２は、取得部２１が取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する。解析部２２が行う解析処理は解析部１１が行う解析処理と同様である。解析部２２は一例として、解析部１１と共通のライブラリを用いて形態素解析及び構文解析を行ってもよい。

　（抽出部２３）
　抽出部２３は、学習部１４Ａが生成したモデルＭＡを用いて、取得部２１が取得したテキストデータからリスクに相当する表現を抽出する。

　（記憶部２０Ａ）
　記憶部２０Ａには、業務文書データベースＤＢが記憶されるとともに、学習用データＴＤ及びモデルＭＡが記憶される。なお、モデルＭＡが記憶されるとは、モデルＭＡを規定するパラメータが記憶部２０Ａに記憶されることをいう。

　（業務文書データベースＤＢ）
　業務文書データベースＤＢは、業務文書が蓄積されたデータベースである。業務文書は、テキストファイル、ＰＤＦファイル、ＨＴＭＬファイル等の種々のファイル形式で保存される。本例示的実施形態において、業務文書データベースＤＢに記憶されたファイルの少なくとも一部は、モデルＭＡの学習のために用いられる。

　（モデルＭＡ）
　モデルＭＡは、テキストデータからリスク表現を抽出するためのモデルであり、教師あり機械学習により生成される。モデルＭＡの入力は、テキストデータ及びタグ付けされた構造データを含む。モデルＭＡの出力は、リスク表現を示すデータを含む。リスク表現を示すデータは、一例として、リスク表現に相当する要素の組み合わせを示すデータ、又は、構造データに含まれる各要素がリスク表現である確信度を含む。本例示的実施形態において、モデルＭＡは、ディープラーニングにより生成されたモデルである。

　＜学習フェーズ実行方法Ｓ１００Ａの流れ＞
　図６は、リスク検知装置１Ａが実行する学習フェーズ実行方法Ｓ１００Ａの流れを示すフロー図である。なお、学習フェーズ実行方法Ｓ１００Ａに含まれるステップのうち、一部のステップは並行して又は順序を換えて実行されてもよい。また、既に説明した内容についてはその説明を繰り返さない。

　（ステップＳ１０１）
　ステップＳ１０１において、解析部１１は、業務文書データベースＤＢからテキストデータを取得し、取得したテキストデータが表す文の構造を解析し、文の構造を表す構造データを生成する。

　（ステップＳ１０２）
　ステップＳ１０２において、タグ付け部１２は、上記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、上記構造データにおいて上記表現に対応する要素にタグ付けする。具体的には、タグ付け部１２は一例として、入出力部４０Ａに接続されたタッチパネル（図示略）にリスク表現の指定をユーザに促す画面を表示するとともに、タッチパネルに対するユーザ操作に基づきタグ付けを行う。

　図７は、タグ付け部１２が出力する画面表示の具体例を示す図である。図７の例で、画面には、テキストデータ２０１と、テキストデータ２０１の構文解析結果である構文木２０２とが表示される。図７の例では、「先方が拒否した場合には、当社での費用負担が必要になることを報告した。」という文についての構文解析の結果である構文木２０２が表示されている。また、画面には、ユーザが要素を選択するためのポインタ２０４、次のテキストデータを表示するためのボタン２０６、及び、前のテキストデータを表示するためのボタン２０５が表示される。ポインタ２０４は、ユーザ操作に基づき画面内を移動する。また、タグ付け部１２は、「「意図」、「トピック」の順に選択してください。」といったユーザ操作を促すメッセージを表示してもよい。

　図８は、図７の画面においてユーザがタグ付けする要素を選択した後の画面表示の具体例を示す図である。図７の構文木２０２においてユーザが「必要」と「費用負担」とを順に選択する操作を行うと、タグ付け部１２は、「必要」に「意図」のタグを付与するとともに、「費用負担」に「トピック」のタグを付与する。なお、ユーザがリスク表現を指定するためのＵＩ画面は図７及び図８の例に限られず、他の画面であってもよい。

　上述したように、タグ付け部１２は、構造データにおいてリスク表現に対応する複数の要素にそれぞれ異なるタグを付与する。タグ付けされた構造データは、リスク表現に対応する複数の要素間の関係（係り受け関係、等）を表すデータであるとも言える。換言すると、タグ付け部１２は、リスク表現に対応する複数の要素間の関係（係り受け関係、等）を示すデータを生成する。このように、本例示的実施形態では、ユーザは、テキストデータにおいてリスク表現に相当する複数の要素を指定し、タグ付け部１２は、ユーザが指定した複数の要素及び当該複数の要素間の関係を示すデータを生成する。

　テキストデータがリスク表現を含まない場合、ユーザはタグ付けのためのユーザ操作を行うことなく、ボタン２０６又はボタン２０５を選択する。この場合、タグ付け部１２は、そのテキストデータに対応する構造データに対しタグ付け処理を行わない。

　（ステップＳ１０３）
　ステップＳ１０３において、出力部１３は、テキストデータと、タグ付けされた構造データとを含む学習用データＴＤを出力する。本例示的実施形態において、出力部１３は学習用データＴＤを記憶部２０Ａに記憶する。

　リスク検知装置１Ａは、ひとつのテキストデータについてステップＳ１０１～Ｓ１０３の処理を実行する。これにより、テキストデータとそのテキストデータの文の構造を表す構造データであってリスク表現の要素にタグ付けされた構造データとを含む学習用データＴＤが生成される。

　（ステップＳ１０４）
　ステップＳ１０４において、学習部１４Ａは、学習用データＴＤを用いた教師あり機械学習によりモデルＭＡを生成する。本例示的実施形態において、学習部１４Ａは、モデルＭＡをディープラーニングにより生成する。

　＜推定フェーズ実行方法Ｓ２００Ａの流れ＞
　図９は、リスク検知装置１Ａが実行する推定フェーズ実行方法Ｓ２００Ａの流れを示すフロー図である。なお、推定フェーズ実行方法Ｓ２００Ａに含まれるステップのうち、一部のステップは並行して又は順序を換えて実行されてもよい。また、既に説明した内容についてはその説明を繰り返さない。

　（ステップＳ２０１）
　ステップＳ２０１において、取得部２１は、リスク検知の対象であるテキストデータを取得する。取得部２１が取得するテキストデータは一例として、業務文書データベースＤＢに記憶されたテキストデータであって、モデルＭＡの学習に用いられていないテキストデータを含む。また、取得部２１は、通信部３０Ａを介して接続された他の装置からテキストデータを受信してもよい。

　（ステップＳ２０２）
　ステップＳ２０２において、解析部２２は、取得部２１が取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する。

　（ステップＳ２０３）
　ステップＳ２０３において、抽出部２３は、モデルＭＡを用いて、取得部２１が取得したテキストデータからリスク表現を抽出する。抽出部２３は、一例として、取得部２１が取得いたテキストデータと、解析部２２が生成した構造データとをモデルＭＡに入力して得られるモデルＭＡの出力に基づき、テキストデータからリスク表現を抽出する。

　抽出部２３は、抽出したリスク表現を出力する。抽出部２３は一例として、リスク表現を示すデータを記憶部２０Ａに書き込むことにより出力する。ただし、抽出部２３がリスク表現を出力する手法は上述した例に限定されず、抽出部２３は他の手法によりリスク表現を出力してもよい。抽出部２３は一例として、通信部３０Ａを介して接続された他の装置にリスク表現を示すデータを送信してもよく、また、入出力部４０Ａに接続された出力装置にリスク表現を示すデータを出力してもよい。

　＜リスク検知装置１Ａの効果＞
　ところで、上述の特許文献２に記載されたような、一般的な自然言語処理技術を利用した手法では、上述したように誤検知が多くなってしまうという問題があった。例えば「先方が拒否した場合には、当社での費用負担が必要になることを報告した」という文において「費用負担」と「必要」とをリスク表現として検知することは問題ない。一方、「必要に応じ、当社と顧客で費用負担を折半することとなった」という文、及び「必要な人員について整理し、費用負担を確認した」という文において「必要」と「費用負担」とはリスク表現ではないものの、これらがリスク表現として誤検知されてしまうという問題があった。

　それに対し本例示的実施形態では、文の構造を表す構造データをそのまま学習用データとするのではなく、ユーザ操作に基づきタグ付けした構造データを学習用データに含める。ユーザが指定した複数の要素及び複数の要素間の関係を示す構造データを学習用データに含めることにより、プロジェクト等のリスクをより精度よく検知するための学習用データを生成できるという効果が得られる。

　また、構造データにおいてタグが付される要素はユーザにより選択される要素であるため、タグ付きの構造データは、ユーザがどういったフレーズをリスクとみなすかといったユーザの意図を反映したデータとなる。どのようなフレーズがリスクであるかはユーザの状況又はプロジェクトの状況によって様々であるが、本例示的実施形態に係る学習用データ生成装置１によれば、ルール作成等の煩雑な作業を要することなく、ユーザの意向をより反映したリスク検知を行うための学習用データを生成できるという効果が得られる。

　以上のように、本例示的実施形態に係るリスク検知装置１Ａにおいては、学習用データＴＤを用いてモデルＭＡを学習させる学習部１４Ａを備える構成が採用されている。このため、本例示的実施形態に係るリスク検知装置１Ａによれば、例示的実施形態１に係る学習用データ生成装置１の奏する効果に加えて、ルール作成等の煩雑な作業を要することなく、プロジェクト等のリスクをより精度よく検知するためのモデルＭＡを生成できるという効果が得られる。

　また、本例示的実施形態に係るリスク検知装置１Ａにおいては、タグ付け部１２は、上記ユーザ操作に基づき、リスク表現を示すタグとして意図を示すタグ及びトピックを示すタグを上記構造データの要素に付与する構成が採用されている。タグが付される要素はユーザにより選択される要素であるため、これらのタグ付きの構造データは、ユーザがどのようなフレーズをリスクとみなすかというユーザの意図を反映したデータとなる。どのようなフレーズがリスクであるかはユーザの状況又はプロジェクトの状況等によって様々であるが、このようなタグ付き構造データを学習用データに含めることにより、本例示的実施形態に係るリスク検知装置１Ａによれば、例示的実施形態１に係る学習用データ生成装置１の奏する効果に加えて、モデルＭＡを用いたリスク検知にユーザの意図をより反映させることができるという効果が得られる。

　また、本例示的実施形態に係るリスク検知装置１Ａにおいては、学習部１４Ａは、モデルＭＡをディープラーニングにより生成する。このため、本例示的実施形態に係るリスク検知装置１Ａによれば、ルール作成等の煩雑な作業を要することなく、プロジェクト等のリスクをより精度よく検知するためのモデルＭＡを生成できるという効果が得られる。

　また、本例示的実施形態に係るリスク検知装置１Ａにおいては、解析部１１は、テキストデータの形態素解析および構文解析を行う。このため、本例示的実施形態に係るリスク検知装置１Ａによれば、ルール作成等の煩雑な作業を要することなく、プロジェクト等のリスクをより精度よく検知するための学習用データを生成できるという効果が得られる。

　また、本例示的実施形態において、タグ付けされた構造データは、一例として、リスク表現に対応する複数の要素間の関係（係り受けの関係、等）を示している。構造データをそのまま学習データとして用いるのではなく、ユーザ操作に基づきタグ付け部１２が複数の要素にタグ付けした構造データを学習データとして用いることにより、本例示的実施形態によれば、リスク表現を検知するモデルＭＡとしてより検知精度の高いモデルＭＡを生成することができる。

　また、本例示的実施形態に係るリスク検知装置１Ａにおいては、モデルＭＡは、ディープラーニングにより生成されたモデルである。このため、本例示的実施形態に係るリスク検知装置１Ａによれば、ルール作成等の煩雑な作業を要することなく、プロジェクト等のリスクをより精度よく検知できるという効果が得られる。

　また、本例示的実施形態に係るリスク検知装置１Ａにおいては、解析部２２は、上記テキストデータの形態素解析および構文解析を行う。このため、本例示的実施形態に係るリスク検知装置１Ａによれば、ルール作成等の煩雑な作業を要することなく、プロジェクト等のリスクをより精度よく検知できるという効果が得られる。

＜変形例＞
　上述の例示的実施形態２において、リスクの危険度をユーザが選択できるようにしてもよい。この場合、タグ付け部１２は一例として、リスクの危険度をユーザが選択するためのＵＩ画面をタッチパネルに出力する。ユーザはタッチパネルを操作してタグを付与する要素とリスクの危険度とを選択し、タグ付け部１２はユーザ操作に応じて、リスクの危険度を含むタグを選択された要素に付与する。リスクの危険度を含むタグが付与された構造データを学習用データに含まることにより、モデルＭＡの検知精度をより向上させることができる。

　〔ソフトウェアによる実現例〕
　学習用データ生成装置１、リスク検知装置２及びリスク検知装置１Ａ（以下「学習用データ生成装置１等」という）の一部又は全部の機能は、集積回路（ＩＣチップ）等のハードウェアによって実現してもよいし、ソフトウェアによって実現してもよい。

　後者の場合、学習用データ生成装置１等は、例えば、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータによって実現される。このようなコンピュータの一例（以下、コンピュータＣと記載する）を図１０に示す。コンピュータＣは、少なくとも１つのプロセッサＣ１と、少なくとも１つのメモリＣ２と、を備えている。メモリＣ２には、コンピュータＣを学習用データ生成装置１等として動作させるためのプログラムＰが記録されている。コンピュータＣにおいて、プロセッサＣ１は、プログラムＰをメモリＣ２から読み取って実行することにより、学習用データ生成装置１等の各機能が実現される。

　プロセッサＣ１としては、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphic Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＭＰＵ（Micro Processing Unit）、ＦＰＵ（Floating point number Processing Unit）、ＰＰＵ（Physics Processing Unit）、マイクロコントローラ、又は、これらの組み合わせなどを用いることができる。メモリＣ２としては、例えば、フラッシュメモリ、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、又は、これらの組み合わせなどを用いることができる。

　なお、コンピュータＣは、プログラムＰを実行時に展開したり、各種データを一時的に記憶したりするためのＲＡＭ（Random Access Memory）を更に備えていてもよい。また、コンピュータＣは、他の装置との間でデータを送受信するための通信インタフェースを更に備えていてもよい。また、コンピュータＣは、キーボードやマウス、ディスプレイやプリンタなどの入出力機器を接続するための入出力インタフェースを更に備えていてもよい。

　また、プログラムＰは、コンピュータＣが読み取り可能な、一時的でない有形の記録媒体Ｍに記録することができる。このような記録媒体Ｍとしては、例えば、テープ、ディスク、カード、半導体メモリ、又はプログラマブルな論理回路などを用いることができる。コンピュータＣは、このような記録媒体Ｍを介してプログラムＰを取得することができる。また、プログラムＰは、伝送媒体を介して伝送することができる。このような伝送媒体としては、例えば、通信ネットワーク、又は放送波などを用いることができる。コンピュータＣは、このような伝送媒体を介してプログラムＰを取得することもできる。

　〔付記事項１〕
　本発明は、上述した実施形態に限定されるものでなく、請求項に示した範囲で種々の変更が可能である。例えば、上述した実施形態に開示された技術的手段を適宜組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。

　〔付記事項２〕
　上述した実施形態の一部又は全部は、以下のようにも記載され得る。ただし、本発明は、以下の記載する態様に限定されるものではない。

　（付記１）
　テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析手段と、
　前記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、前記構造データにおいて前記表現に対応する要素にタグ付けするタグ付け手段と、
　前記テキストデータと前記タグ付け手段によりタグ付けされた構造データとを含む学習用データを出力する出力手段と、
　を備える学習用データ生成装置。

　（付記２）
　前記学習用データを用いて、テキストデータと当該テキストデータの文の構造を表す構造データとを入力として当該テキストデータからリスクに相当する表現を抽出するモデルを学習させる学習手段、
を更に備える付記１に記載の学習用データ生成装置。

　（付記３）
　前記タグ付け手段は、前記ユーザ操作に基づき、前記リスクに相当する表現を示すタグとして意図を示すタグ及びトピックを示すタグを前記構造データの要素に付与する、
付記１又は２に記載の学習用データ生成装置。

　（付記４）
　前記学習手段は、前記モデルをディープラーニングにより生成する、
付記２に記載の学習用データ生成装置。

　（付記５）
　前記解析手段は、前記テキストデータの形態素解析および構文解析を行う、
　付記１から４の何れか１つに記載の学習用データ生成装置。

　（付記６）
　テキストデータを取得する取得手段と、
　前記取得手段が取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析手段と、
　テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、前記取得手段が取得したテキストデータからリスクに相当する表現を抽出する抽出手段と、
を備えるリスク検知装置。

　（付記７）
　前記モデルは、ディープラーニングにより生成されたモデルである、
付記６に記載のリスク検知装置。

　（付記８）
　前記解析手段は、前記テキストデータの形態素解析および構文解析を行う、
　付記６又は７に記載のリスク検知装置。

　（付記９）
　少なくとも１つのプロセッサが、
　テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成し、
　前記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、前記構造データにおいて前記表現に対応する要素にタグ付けし、
　前記テキストデータと前記タグ付けされた構造データとを含む学習用データを出力する、
学習用データ生成方法。

　（付記１０）
　少なくとも１つのプロセッサが、
　テキストデータを取得し、
　前記取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成し、
　テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、前記取得したテキストデータからリスクに相当する表現を抽出する、
リスク検知方法。

　（付記１１）
　コンピュータに、
　テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析処理と、
　前記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、前記構造データにおいて前記表現に対応する要素にタグ付けするタグ付け処理と、
　前記テキストデータと前記タグ付け処理においてタグ付けされた構造データとを含む学習用データを出力する出力処理と、
を実行させる学習用データ生成プログラム。

　（付記１２）
　コンピュータに、
　テキストデータを取得する取得処理と、
　前記取得処理において取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析処理と、
　テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、前記取得処理において取得したテキストデータからリスクに相当する表現を抽出する抽出処理と、
を実行させるリスク検知プログラム。

　（付記１３）
　テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析手段と、
　前記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、前記構造データにおいて前記表現に対応する要素にタグ付けするタグ付け手段と、
　前記テキストデータと前記タグ付け手段によりタグ付けされた構造データとを含む学習用データを出力する出力手段と、
　を含む学習用データ生成システム。

　（付記１４）
　テキストデータを取得する取得手段と、
　前記取得手段が取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析手段と、
　テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、前記取得手段が取得したテキストデータからリスクに相当する表現を抽出する抽出手段と、
　を含むリスク検知システム。

　〔付記事項３〕
　上述した実施形態の一部又は全部は、更に、以下のように表現することもできる。
　少なくとも１つのプロセッサを備え、前記プロセッサは、テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析処理と、前記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、前記構造データにおいて前記表現に対応する要素にタグ付けするタグ付け処理と、前記テキストデータと前記タグ付け処理においてタグ付けされた構造データとを含む学習用データを出力する出力処理と、を実行する学習用データ生成装置。

　なお、この学習用データ生成装置は、更にメモリを備えていてもよく、このメモリには、前記解析処理と、前記タグ付け処理と、前記出力処理とを前記プロセッサに実行させるためのプログラムが記憶されていてもよい。また、このプログラムは、コンピュータ読み取り可能な一時的でない有形の記録媒体に記録されていてもよい。

　少なくとも１つのプロセッサを備え、前記プロセッサは、テキストデータを取得する取得処理と、前記取得処理において取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析処理と、テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、前記取得処理において取得したテキストデータからリスクに相当する表現を抽出する抽出処理と、を実行するリスク検知装置。
　なお、このリスク検知装置は、更にメモリを備えていてもよく、このメモリには、前記取得処理と、前記解析処理と、前記抽出処理とを前記プロセッサに実行させるためのプログラムが記憶されていてもよい。また、このプログラムは、コンピュータ読み取り可能な一時的でない有形の記録媒体に記録されていてもよい。

　以上、上記例示的実施形態等を参照して本願発明を説明したが、本願発明は、上述した例示的実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。また、上述した学習用データ生成装置１、及びリスク検知装置１Ａ、２の機能のうちの少なくとも一以上の機能は、ネットワーク上のいかなる場所に設置され接続された複数の異なる情報処理装置で実行されてもよく、つまり、いわゆるクラウドコンピューティングで実行されてもよい。

１　学習用データ生成装置
１Ａ、２　リスク検知装置
１１、２２　解析部
１３　出力部
１４Ａ　学習部
２１　取得部
２３　抽出部
Ｓ１　学習用データ生成方法
Ｓ２　リスク検知方法

Claims

　テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析手段と、
　前記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、前記構造データにおいて前記表現に対応する要素にタグ付けするタグ付け手段と、
　前記テキストデータと前記タグ付け手段によりタグ付けされた構造データとを含む学習用データを出力する出力手段と、
　を備える学習用データ生成装置。
　前記学習用データを用いて、テキストデータと当該テキストデータの文の構造を表す構造データとを入力として当該テキストデータからリスクに相当する表現を抽出するモデルを学習させる学習手段、
を更に備える請求項１に記載の学習用データ生成装置。
　前記タグ付け手段は、前記ユーザ操作に基づき、前記リスクに相当する表現を示すタグとして意図を示すタグ及びトピックを示すタグを前記構造データの要素に付与する、請求項１又は２に記載の学習用データ生成装置。
　前記学習手段は、前記モデルをディープラーニングにより生成する、
請求項２に記載の学習用データ生成装置。
　前記解析手段は、前記テキストデータの形態素解析および構文解析を行う、
　請求項１から４の何れか１項に記載の学習用データ生成装置。
　テキストデータを取得する取得手段と、
　前記取得手段が取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析手段と、
　テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、前記取得手段が取得したテキストデータからリスクに相当する表現を抽出する抽出手段と、
を備えるリスク検知装置。
　前記モデルは、ディープラーニングにより生成されたモデルである、
請求項６に記載のリスク検知装置。
　前記解析手段は、前記テキストデータの形態素解析および構文解析を行う、
　請求項６又は７に記載のリスク検知装置。
　少なくとも１つのプロセッサが、
　テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成し、
　前記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、前記構造データにおいて前記表現に対応する要素にタグ付けし、
　前記テキストデータと前記タグ付けされた構造データとを含む学習用データを出力する、
学習用データ生成方法。
　少なくとも１つのプロセッサが、
　テキストデータを取得し、
　前記取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成し、
　テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、前記取得したテキストデータからリスクに相当する表現を抽出する、
リスク検知方法。
　コンピュータに、
　テキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析処理と、
　前記文に含まれるリスクに相当する表現を指定するユーザ操作を受け付け、受け付けたユーザ操作に基づき、前記構造データにおいて前記表現に対応する要素にタグ付けするタグ付け処理と、
　前記テキストデータと前記タグ付け処理においてタグ付けされた構造データとを含む学習用データを出力する出力処理と、
を実行させる学習用データ生成プログラム。
　コンピュータに、
　テキストデータを取得する取得処理と、
　前記取得処理において取得したテキストデータが表す文の構造を解析し、当該文の構造を表す構造データを生成する解析処理と、
　テキストデータと当該テキストデータの文の構造を表す構造データであってリスクに相当する表現に対応する要素にタグ付けされた構造データとを含む学習用データを参照して学習されたモデルを用いて、前記取得処理において取得したテキストデータからリスクに相当する表現を抽出する抽出処理と、
を実行させるリスク検知プログラム。