JP7199028B2 - 分類装置、分類方法、及び、コンピュータプログラム - Google Patents
分類装置、分類方法、及び、コンピュータプログラム Download PDFInfo
- Publication number
- JP7199028B2 JP7199028B2 JP2020219310A JP2020219310A JP7199028B2 JP 7199028 B2 JP7199028 B2 JP 7199028B2 JP 2020219310 A JP2020219310 A JP 2020219310A JP 2020219310 A JP2020219310 A JP 2020219310A JP 7199028 B2 JP7199028 B2 JP 7199028B2
- Authority
- JP
- Japan
- Prior art keywords
- classification
- document
- score
- user
- control unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
<分類システムの概要>
図1を参照して、実施の形態1に係る分類システム10の概要について説明する。図1は、実施の形態1に係る分類システム10の構成の一例を示す模式図である。
図2~図4を参照して、実施の形態1に係る分類装置100の構成について説明する。図2は、実施の形態1に係る分類装置100の構成の一例を示すブロック図である。図3は、実施の形態1に係る公報DB101のデータ構造の一例を示す図である。図4は、実施の形態1に係る教師データDB103のデータ構造の一例を示す図である。図5は、実施の形態1に係る分類結果DB108のデータ構造の一例を示す図である。
図6及び図7を参照して、UI画面200の一例について説明する。図6は、各分類のスコアのうち第1位のスコアが第1の閾値以上である場合のUI画面200の表示の一例を示す図である。図7は、各分類のスコアのうち第1位のスコアが第2の閾値未満である場合のUI画面200の表示例を示す図である。
図8を参照して、分類装置100が実行する分類処理の第1例について説明する。図8は、実施の形態1に係る分類処理の第1例を示すフローチャートである。
図9を参照して、分類装置100が実行する分類処理の第2例について説明する。図9は、実施の形態1に係る分類処理の第2例を示すフローチャートである。分類装置100は、図8に示す分類処理の第1例と当該図9に示す分類処理の第2例とのいずれか一方を実行してもよい。あるいは、分類装置100は、ユーザ2からの指示に応じて、図8に示す分類処理の第1例、又は、当該図9に示す分類処理の第2例のいずれかを実行してもよい。
図10を参照して、分類装置100が実行するモデル再学習処理について説明する。図10は、実施の形態1に係るモデル再学習処理の一例を示すフローチャートである。当該モデル再学習処理は、図8又は図9に示した分類処理の実行後に、ユーザ2の指示よって開始されてよい。
図11を参照して、分類装置100が実行するモデル評価処理について説明する。図11は、実施の形態1に係るモデル評価処理の一例を示すフローチャートである。当該モデル評価処理は、ユーザの指示によって開始されてよい。
なお、分類実行部107は、必ずしも学習モデル120を用いて公報に付与する分類を決定する必要はない。例えば、分類実行部107は、公知のルールベース又は機械学習に基づいて、公報に付与する分類(以下、システム分類という)を決定してもよい。この場合、図5に示す分類結果DB108の「AI分類」、及び、上述したUI制御部109が行う処理における「AI分類」は、「システム分類」に読み替えられてもよい。
(A1)最近よく使用される検索式、急上昇ワード、又は、他のユーザの分類パターン等を具体的に提案する。
(A2)例えば、分類1、分類2、分類3という分類があって、本当は分類4となるべきものが推論対象となった場合、「分類なし」としつつ、分類4を提案する。
(B1)モデル学習部104は、分類4、分類5、分類6を1つの他分類として、第1の学習モデルの学習を行う。そして、モデル学習部104は、他分類の教師データを用いて、分類4、分類5、分類6について第2の学習モデルの学習を行う。分類実行部107は、まず、第1の学習モデルを用いて公報を分類1、分類2、分類3、他分類のいずれかに振り分け、次に、第2の学習モデルを用いて他分類に振り分けられた公報を分類4、分類5、分類6のいずれかに振り分ける。
(B2)モデル学習部104は、分類1、分類2、分類3について学習モデルの学習を行う。分類実行部107は、当該学習モデルが出力した推論結果として第1位のスコアが所定の閾値未満の場合、分類4、分類5、分類6のいずかであると判定する。
図12は、本開示に係る分類装置100及び端末20のハードウェアの構成の一例を示すブロック図である。
10 分類システム
20 端末
30 通信ネットワーク
100 分類装置
101 公報DB
102 教師データ生成部
103 教師データDB
104 モデル学習部
105 モデル格納部
106 分類対象入力部
107 分類実行部
108 分類結果DB
109 UI制御部
110 モデル評価部
120 学習モデル
200 UI画面
201 ステータス欄
202 分類欄
203 分類候補欄
204 確認チェックボックス
205 公報項目欄
206 要確認マーク
Claims (11)
- 文書と、前記文書に付与された番号と、学習モデルを用いて当該文書に付与された分類と、当該文書と前記分類の適合する度合を示すスコアとが関連付けられている情報が格納される格納部と、
前記番号と、前記分類と、前記スコアが最も高い分類を当該文書の前記分類として表示させる制御部と、を備え、
前記制御部は、前記スコアが最も高い分類の当該スコアが所定の閾値未満である場合、分類なしを示す情報を前記分類として表示させる、
分類装置。 - 文書と、前記文書に付与された番号と、学習モデルを用いて当該文書に付与された分類と、当該文書と前記分類の適合する度合を示すスコアとが関連付けられている情報が格納される格納部と、
前記番号と、前記分類と、前記スコアが高いものから順に所定数を当該文書の前記分類の候補として表示させる制御部と、を備え、
前記制御部は、前記スコアが最も高い分類の当該スコアが所定の閾値未満である場合、分類なしを示す情報を前記分類として表示させる、
分類装置。 - 文書と、前記文書に付与された番号と、学習モデルを用いて当該文書に付与された分類と、当該文書と前記分類の適合する度合を示すスコアとが関連付けられている情報が格納される格納部と、
前記番号と、前記分類と、前記スコアが最も高い分類を当該文書の前記分類として表示させる制御部と、を備え、
前記制御部は、前記スコアが最も高い分類の当該スコアが所定の閾値未満である場合、ユーザに前記分類の確認を促す情報を表示させる、
分類装置。 - 文書と、前記文書に付与された番号と、学習モデルを用いて当該文書に付与された分類と、当該文書と前記分類の適合する度合を示すスコアとが関連付けられている情報が格納される格納部と、
前記番号と、前記分類と、前記スコアが高いものから順に所定数を当該文書の前記分類の候補として表示させる制御部と、を備え、
前記スコアが最も高い分類の当該スコアが所定の閾値未満である場合、ユーザに前記分類の確認を促す情報を表示させる、
分類装置。 - 文書と、前記文書に付与された番号と、学習モデルを用いて当該文書に付与された分類とが関連付けられている情報を格納する格納部と、
前記文書の番号と、システム分類と、当該システム分類のスコアとを表示させる制御部と、を備え、
前記制御部は、当該文書に付与する分類として、ユーザから前記システム分類とは異なる分類が指示された場合、その指示された当該分類をユーザ分類として前記文書に関連付け、当該文書に付与する分類として、前記ユーザから前記システム分類が指示された場合、前記システム分類を前記ユーザ分類として前記文書に関連付け、前記文書の前記システム分類と前記ユーザ分類との比較に基づいて、前記学習モデルの分類精度を評価する、
分類装置。 - 前記制御部は、ユーザが前記分類を確認済みであるか否かを示す確認情報が未確認であることを示す場合、前記分類は前記ユーザによって未確認であることを示す第1の情報を表示させる、
請求項1から5のいずれか1項に記載の分類装置。 - 前記制御部は、前記確認情報が、確認済みであることを示す場合、前記分類は前記ユーザによって確認済みであることを示す第2の情報を表示させる、
請求項6に記載の分類装置。 - 前記制御部は、前記文書の前記分類を確認した旨の指示がされた場合、前記文書に関連付けられる前記確認情報を、前記ユーザが前記分類を確認済みであることを示す確認済み情報に変更する、
請求項6又は7に記載の分類装置。 - 前記制御部は、前記分類の前記スコアが所定の閾値以上である場合、前記文書に関連付けられている前記確認情報を前記確認済み情報に変更する、
請求項6又は7に記載の分類装置。 - 装置によって文書を分類する分類方法であって、
文書と、前記文書に付与された番号と、学習モデルを用いて当該文書に付与された分類と、当該文書と前記分類の適合する度合を示すスコアとが関連付けられている情報を格納部に格納し、
前記文書の番号と、前記分類と、当該分類の前記スコアとを表示させ、
前記スコアが最も高い分類の当該スコアが所定の閾値未満である場合、分類なしを示す情報を前記分類として表示させる、
分類方法。 - 文書を分類するコンピュータプログラムであって、
文書と、前記文書に付与された番号と、学習モデルを用いて当該文書に付与された分類と、当該文書と前記分類の適合する度合を示すスコアとが関連付けられている情報を格納部に格納し、
前記文書の番号と、前記分類と、当該分類の前記スコアとを表示させ、
前記スコアが最も高い分類の当該スコアが所定の閾値未満である場合、分類なしを示す情報を前記分類として表示させることをコンピュータに実行させる、
コンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020219310A JP7199028B2 (ja) | 2020-12-28 | 2020-12-28 | 分類装置、分類方法、及び、コンピュータプログラム |
JP2022196507A JP2023029991A (ja) | 2020-12-28 | 2022-12-08 | 分類装置、分類方法、及び、コンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020219310A JP7199028B2 (ja) | 2020-12-28 | 2020-12-28 | 分類装置、分類方法、及び、コンピュータプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022196507A Division JP2023029991A (ja) | 2020-12-28 | 2022-12-08 | 分類装置、分類方法、及び、コンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022104232A JP2022104232A (ja) | 2022-07-08 |
JP7199028B2 true JP7199028B2 (ja) | 2023-01-05 |
Family
ID=82280233
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020219310A Active JP7199028B2 (ja) | 2020-12-28 | 2020-12-28 | 分類装置、分類方法、及び、コンピュータプログラム |
JP2022196507A Pending JP2023029991A (ja) | 2020-12-28 | 2022-12-08 | 分類装置、分類方法、及び、コンピュータプログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022196507A Pending JP2023029991A (ja) | 2020-12-28 | 2022-12-08 | 分類装置、分類方法、及び、コンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7199028B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018194881A (ja) | 2017-05-12 | 2018-12-06 | 株式会社日立製作所 | 文書分類システムおよび文書分類方法 |
JP2019087258A (ja) | 2017-11-07 | 2019-06-06 | 株式会社日立製作所 | 情報処理装置、文書分類方法 |
-
2020
- 2020-12-28 JP JP2020219310A patent/JP7199028B2/ja active Active
-
2022
- 2022-12-08 JP JP2022196507A patent/JP2023029991A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018194881A (ja) | 2017-05-12 | 2018-12-06 | 株式会社日立製作所 | 文書分類システムおよび文書分類方法 |
JP2019087258A (ja) | 2017-11-07 | 2019-06-06 | 株式会社日立製作所 | 情報処理装置、文書分類方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2022104232A (ja) | 2022-07-08 |
JP2023029991A (ja) | 2023-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fawagreh et al. | Random forests: from early developments to recent advancements | |
CN110163647B (zh) | 一种数据处理方法及装置 | |
EP3523710B1 (en) | Apparatus and method for providing a sentence based on user input | |
US11475218B2 (en) | Apparatus and method for providing sentence based on user input | |
JP6986978B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP2022512065A (ja) | 画像分類モデルの訓練方法、画像処理方法及び装置 | |
JP2018010451A (ja) | データ分類装置、データ分類方法、およびプログラム | |
US20200311306A1 (en) | Electronic device for obfuscating and decoding data and method for controlling same | |
JP6719399B2 (ja) | 解析装置、解析方法、およびプログラム | |
WO2019042450A1 (zh) | 一种自然语言处理方法和装置 | |
JP6199461B1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
WO2020241467A1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
CN110023984A (zh) | 用于汇总内容的电子设备和方法 | |
CN112232048B (zh) | 一种基于神经网络的表格处理方法以及相关装置 | |
JP7199028B2 (ja) | 分類装置、分類方法、及び、コンピュータプログラム | |
JP6890764B2 (ja) | 教師データ生成システム、教師データ生成方法、及びプログラム | |
CN108875060B (zh) | 一种网站识别方法及识别系统 | |
CN113255368B (zh) | 针对文本数据进行情感分析的方法、装置及相关设备 | |
JP5657338B2 (ja) | 入力情報分析装置 | |
JP2018036756A (ja) | メッセージ分類システム、メッセージ分類方法及びプログラム | |
JP2023014159A (ja) | 分類システム、及び、分類方法 | |
JP6983672B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
CN117236347B (zh) | 交互文本翻译的方法、交互文本的显示方法和相关装置 | |
JP7383090B2 (ja) | 情報処理装置、方法、およびプログラム | |
JP7465025B1 (ja) | 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211221 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20211221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220415 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220905 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221208 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7199028 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |