JP7282715B2 - 評価装置、評価方法及び評価プログラム - Google Patents
評価装置、評価方法及び評価プログラム Download PDFInfo
- Publication number
- JP7282715B2 JP7282715B2 JP2020096167A JP2020096167A JP7282715B2 JP 7282715 B2 JP7282715 B2 JP 7282715B2 JP 2020096167 A JP2020096167 A JP 2020096167A JP 2020096167 A JP2020096167 A JP 2020096167A JP 7282715 B2 JP7282715 B2 JP 7282715B2
- Authority
- JP
- Japan
- Prior art keywords
- text data
- value
- data
- distribution
- output unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、例えば、非特許文献3及び4では、各特徴量の機械学習モデルの予測結果に対する影響度合いを説明する値を算出する手法が提案されている。
図1は、本実施形態における評価装置1の機能構成を示す図である。
評価装置1は、サーバ装置又はパーソナルコンピュータ等の情報処理装置(コンピュータ)であり、制御部10及び記憶部20の他、各種データの入出力デバイス及び通信デバイス等を備える。
テキストデータを構成する単語が特徴量(Features)として機械学習モデルへ入力される要素となる。
本実施形態において、説明値は、正の値の場合にポジティブな予測結果に貢献し、負の値の場合にネガティブな予測結果に貢献する。また、説明値の絶対値が大きいほど単語の重要度が高く、予測結果への影響度合いが大きい。
なお、説明値の算出手法は限定されないが、例えば、非特許文献3又は4で提案されている既存の説明手法が適用可能である。
具体的には、分布出力部14は、説明値をプロットしたグラフをディスプレイに表示させる。
このとき、一覧出力部15は、一覧における予測値の正誤に関する統計値を出力してもよい。統計値は、例えば、予測結果が正解の数及び割合、誤検知(False Positive)の数及び割合、検知漏れ(False Negative)の数及び割合等である。
すなわち、予測結果に関わらず、ポジティブ又はネガティブのいずれかへ分類する影響度の大きい単語が協調される。
さらに、フィルタ部17は、テキストデータの長さに基づいて、処理対象のテキストデータをさらに選別してもよい。
この画面では、検索機能が提供され、指定された単語(キーワード)による検索と、キーワードリストの取り込みによる一括検索とが可能となっている。
また、「Word Length」欄において、テキストデータの長さとして、700ワード以下、701~1000ワード、1001~1400ワード、1401ワード以上のうち、少なくともいずれかの選択が求められている。なお、テキストデータの長さの指定方法は、例えば、数値範囲が直接入力される態様であってもよい。
また、領域24には、機械学習モデルによる分類精度、及びテキストデータ(Datapoints)の総数が表示されている。
CSVファイル等によりキーワードリストが取り込まれると、複数のキーワードそれぞれが出現するテキストデータが検索され、検索されたテキストデータの数の順に領域31に一覧表示される。なお、キーワードがフィルタ後のデータセットに含まれない場合は、該当のキーワードが出現するテキストデータの数は0となる。
なお、検索された数は、キーワードの出現回数であってもよい。
この例では、一覧の各行において、テキストデータの少なくとも一部が、選択されたキーワードが中央に、かつ、前後の単語群と共に配置されるように、コンコーダンスリストとして検索結果が表示されている。
これにより、ユーザは、指定したキーワードがデータセットの中でどのように使用されているかを容易に把握できる。
なお、1つのテキストデータにキーワードが複数現れる場合、キーワードが現れる度に別の行に出力される。
選択されたテキストデータの全文が領域41に表示される。このとき、テキストデータに含まれる単語のうち、指定されたキーワードと共に、説明値の絶対値が上位であり影響度の高い重要な単語が10個、強調表示されている。
具体的には、キーワードである「good」の色が変更され、ポジティブに影響する重要な単語とネガティブに影響する重要な単語とが、それぞれ異なる背景色で表示されている。
グラフオプションが選択された場合、分布出力部14は、検索されたキーワードの説明値の分布を、領域51にグラフ表示する。
この場合、中立(説明値≒0)な評価が多いが、ポジティブ(説明値>0)に評価される場合がネガティブ(説明値<0)に評価される場合よりも多いことが視覚的に把握できる。
説明値の分布グラフ、及び統計情報は、複数のキーワードを比較して出力することも可能である。
この例では、「better」及び「worst」の2つの単語を比較して、それぞれの統計値を並べて表示している。
なお、ポジティブ、中立、ネガティブを分ける説明値の閾値は、予め設定されてよい。
・「better」は、「worst」に比べて出現頻度が高い。
・「better」の平均値及び中央値は0付近で中立であるが、「worst」はネガティブ側に寄っている。
・「better」も「worst」も、最小値及び最大値の大きさが同等であり、正負両側に広がっているが、「worst」の方が大きな値が存在するため、より予測結果への影響度が高い。
・「better」は、ポジティブな評価とネガティブな評価とが同等数あるが、「worst」は、ほぼネガティブな評価となっている。
この例では、「good」と「bad」とで説明値の分布を比較している。
「good」の説明値は、ポジティブ側に偏り、「bad」の説明値は、逆にネガティブ側に偏っていることが分かる。
これにより、評価装置1は、データセットの中で特定の単語(特徴量)が機械学習モデルの予測結果にどのような影響を与えているかの傾向を可視化して提示できる。
評価装置1は、分布データの統計値を出力するので、ユーザは、客観的な数値データに基づいて、説明値の分布の確からしさを確認できる。
これにより、ユーザは、指定した単語がデータセットの中でどのように使われているかを確認しつつ、各出現箇所において、機械学習モデルの予測値にどの程度影響しているかを詳細に調査できる。
これにより、ユーザは、指定した単語を含むテキストデータ全体を確認しつつ、この中で影響度合いの高い他の単語群を容易に把握し、機械学習モデルの信頼性を総合的に評価できる。
また、評価装置1は、データセットに含まれる単語のうち、説明値の大きさが上位所定数の単語を出力することで、特徴量を適切にユーザに提示できる。
これにより、ユーザは、テキストデータの種類を絞り込み、この範囲での特定の単語の影響度を詳細に評価できる。
この場合、検索のためのキーワードには、1又は複数の連続した単語が入力され、また、一覧出力部15及び単語出力部16等による重要単語の提示は、所定数の語句の提示となる。なお、テキストデータ中の語句を判別するために、予め語句を定義した辞書が設けられてもよいし、既存の構文解析の技術により自動で語句の区切りが判別されてもよい。
10 制御部
11 データセット入力部
12 予測値入力部
13 説明値入力部
14 分布出力部
15 一覧出力部
16 単語出力部(語句出力部)
17 フィルタ部
20 記憶部
Claims (12)
- 複数のテキストデータ、及び当該テキストデータそれぞれの正しい分類を含むデータセットを受け付けるデータセット入力部と、
前記テキストデータを入力とした機械学習モデルによる前記分類の予測値を受け付ける予測値入力部と、
前記テキストデータを構成する語句毎の前記予測値に対する影響度合いを説明する説明値を受け付ける説明値入力部と、
指定された語句に対して、前記データセットに現れる箇所毎の前記説明値の分布データを出力する分布出力部と、を備える評価装置。 - 前記分布出力部は、複数の語句が指定されたことに応じて、当該複数の語句に対する前記説明値の分布データを比較して出力する請求項1に記載の評価装置。
- 前記分布出力部は、前記説明値をプロットしたグラフを出力する請求項1又は請求項2に記載の評価装置。
- 前記分布出力部は、前記分布データの統計値を出力する請求項1から請求項3のいずれかに記載の評価装置。
- 前記指定された語句が含まれる前記テキストデータの一覧と共に、前記説明値、前記予測値及び前記正しい分類を出力する一覧出力部を備える請求項1から請求項4のいずれかに記載の評価装置。
- 前記一覧出力部は、前記一覧における前記予測値の正誤に関する統計値を出力する請求項5に記載の評価装置。
- 前記一覧出力部は、前記一覧から選択されたテキストデータの全文を、前記指定された語句、及び当該テキストデータの中で前記説明値の大きさが上位所定数の語句を強調して出力する請求項5又は請求項6に記載の評価装置。
- 前記データセットに含まれる語句のうち、前記説明値の大きさが上位所定数の語句を出力する語句出力部を備える請求項1から請求項7のいずれかに記載の評価装置。
- 前記データセットのうち、処理対象のテキストデータを、前記予測値の正誤の区分に基づいて選別するフィルタ部を備える請求項1から請求項8のいずれかに記載の評価装置。
- 前記フィルタ部は、テキストデータの長さに基づいて、前記処理対象のテキストデータをさらに選別する請求項9に記載の評価装置。
- 複数のテキストデータ、及び当該テキストデータそれぞれの正しい分類を含むデータセットを受け付けるデータセット入力ステップと、
前記テキストデータを入力とした機械学習モデルによる前記分類の予測値を受け付ける予測値入力ステップと、
前記テキストデータを構成する語句毎の前記予測値に対する影響度合いを説明する説明値を受け付ける説明値入力ステップと、
指定された語句に対して、前記データセットに現れる箇所毎の前記説明値の分布データを出力する分布出力ステップと、をコンピュータが実行する評価方法。 - 請求項1から請求項10のいずれかに記載の評価装置としてコンピュータを機能させるための評価プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020096167A JP7282715B2 (ja) | 2020-06-02 | 2020-06-02 | 評価装置、評価方法及び評価プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020096167A JP7282715B2 (ja) | 2020-06-02 | 2020-06-02 | 評価装置、評価方法及び評価プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021189889A JP2021189889A (ja) | 2021-12-13 |
JP7282715B2 true JP7282715B2 (ja) | 2023-05-29 |
Family
ID=78849883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020096167A Active JP7282715B2 (ja) | 2020-06-02 | 2020-06-02 | 評価装置、評価方法及び評価プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7282715B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011170786A (ja) | 2010-02-22 | 2011-09-01 | Nomura Research Institute Ltd | 文書分類システムおよび文書分類プログラムならびに文書分類方法 |
JP2018513507A (ja) | 2015-03-20 | 2018-05-24 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 人工ニューラルネットワークの関連性スコア割当て |
-
2020
- 2020-06-02 JP JP2020096167A patent/JP7282715B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011170786A (ja) | 2010-02-22 | 2011-09-01 | Nomura Research Institute Ltd | 文書分類システムおよび文書分類プログラムならびに文書分類方法 |
JP2018513507A (ja) | 2015-03-20 | 2018-05-24 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 人工ニューラルネットワークの関連性スコア割当て |
Non-Patent Citations (1)
Title |
---|
金 明哲,「テキストデータの統計科学入門」,株式会社岩波書店,2009年04月28日,pp.177-194,ISBN:978-4-00-005702-8 |
Also Published As
Publication number | Publication date |
---|---|
JP2021189889A (ja) | 2021-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11625406B2 (en) | Website scoring system | |
US11775596B1 (en) | Models for classifying documents | |
CN109697162B (zh) | 一种基于开源代码库的软件缺陷自动检测方法 | |
US9646077B2 (en) | Time-series analysis based on world event derived from unstructured content | |
US20120303661A1 (en) | Systems and methods for information extraction using contextual pattern discovery | |
Shah et al. | Using app reviews for competitive analysis: tool support | |
US20230010680A1 (en) | Business Lines | |
US20230081737A1 (en) | Determining data categorizations based on an ontology and a machine-learning model | |
US10229194B2 (en) | Providing known distribution patterns associated with specific measures and metrics | |
Yuan et al. | Isea: An interactive pipeline for semantic error analysis of nlp models | |
JP7282715B2 (ja) | 評価装置、評価方法及び評価プログラム | |
KR20210100389A (ko) | 유사 특허 검색 방법 | |
EP4270239A1 (en) | Supervised machine learning method for matching unsupervised data | |
CA3230643A1 (en) | Data management suggestions from knowledge graph actions | |
Dobrzyński et al. | Text mining studies of software repository contents | |
JP4525224B2 (ja) | ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置 | |
CN115563288B (zh) | 一种文本检测的方法、装置、电子设备及存储介质 | |
JP6094937B1 (ja) | 特許文献集合のスクリーニング方法 | |
EA039466B1 (ru) | Способ и система классификации данных для выявления конфиденциальной информации в тексте | |
Kumari et al. | Use of lime for human interpretability in sinhala document classification | |
CN117648635B (zh) | 敏感信息分类分级方法及系统、电子设备 | |
Gao et al. | Exploring filter-based feature selection techniques for software quality classification | |
Gromova | Analysis of the characteristics and causes of underestimated bug reports | |
KR20220116781A (ko) | 컴포넌트 네트워크 기반의 분석 시스템을 이용한 비정형 데이터 분석 방법 | |
CN117648635A (zh) | 敏感信息分类分级方法及系统、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220607 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230329 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230517 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7282715 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |