JP7425662B2 - ラベル設計支援装置、及びラベル設計支援方法 - Google Patents
ラベル設計支援装置、及びラベル設計支援方法 Download PDFInfo
- Publication number
- JP7425662B2 JP7425662B2 JP2020073448A JP2020073448A JP7425662B2 JP 7425662 B2 JP7425662 B2 JP 7425662B2 JP 2020073448 A JP2020073448 A JP 2020073448A JP 2020073448 A JP2020073448 A JP 2020073448A JP 7425662 B2 JP7425662 B2 JP 7425662B2
- Authority
- JP
- Japan
- Prior art keywords
- label design
- label
- correction
- word
- design
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013461 design Methods 0.000 title claims description 272
- 238000000034 method Methods 0.000 title claims description 43
- 238000012937 correction Methods 0.000 claims description 84
- 238000011156 evaluation Methods 0.000 claims description 31
- 230000010365 information processing Effects 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 18
- 230000005484 gravity Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 12
- 238000002372 labelling Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000012854 evaluation process Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
れるが、この場合、次のような課題がある。即ち、例えば、SMEが主体となってラベルの設計が行われた場合、ドメイン寄りの観点でラベルが設計され、文書に含まれている各単語のラベルへの帰属の判定において複数のラベルの判定に共通の特徴量が用いられて正しいラベルが付与されないことがある。尚、この場合は、例えば、より上位概念のラベルを設定する必要がある。また例えば、ドメインの知識を有していないIT技術者が主体となってラベルの設計が行われた場合、本来、異なるラベルを付与すべき複数の単語に同じラベルが付与されてしまうことがある。
の結果と、前記ラベル設計における前記ラベルと前記単語の関係とを比較することにより前記ラベル設計の補正要否を判定するラベル設計評価部と、を備える。
案(ラベルと単語を対応付けた情報。以下、「ラベル設計原案」と称する。)に含まれている各単語をクラスタリングし、クラスタリングの結果(各単語のクラスタへの帰属の様子)とラベル設計原案におけるラベルと単語の関係(各単語のラベルへの帰属の様子)を比較することによりラベル設計原案を評価し、ラベル設計原案の補正要否を判定する。そしてラベル設計支援装置100は、補正要と判定した場合、ラベル設計原案を補正し、補正後のラベル設計原案(以下、「ラベル設計結果」と称する。)を出力する。
現(TF-IDF等)によるもの、分散表現によるもの(word2vec(Skip-gram、CBOW)等)等が
ある。
がある。
クラスタリングされた各クラスタにラベルを対応づけた(クラスタ通りにラベルを付与した)、図7Aに示す補正案を生成してユーザに提示する。
Gate Array)、ASIC(Application Specific Integrated Circuit)、AI(Artificial Intelligence)チップ等を用いて構成されている。
Only Memory)、RAM(Random Access Memory)、不揮発性メモリ(NVRAM(Non Volatile RAM))等である。
)、光学式記憶装置(CD(Compact Disc)、DVD(Digital Versatile Disc)等)、
ストレージシステム、ICカード、SDカードや光学式記録媒体等の記録媒体の読取/書込装置、クラウドサーバの記憶領域等である。補助記憶装置13には、記録媒体の読取装置や通信装置16を介してプログラムやデータを読み込むことができる。補助記憶装置13に格納(記憶)されているプログラムやデータは主記憶装置12に随時読み込まれる。
離が第1閾値以上になるように設定し直したラベル設計をユーザに提示する(S1113)。その後、ラベル設計提案処理S916は終了する。
ベルを設定し直した内容のラベル設計の補正案を生成する。そのため、例えば、ドメインの知識を有していないIT技術者が主体となってラベルの設計が行われた場合、本来、異なるラベルを付与すべき複数の単語に同じラベルが付与されてしまうのを防ぐことができる。
続いて、ラベル設計支援装置100が生成したラベル設計結果115の適用事例について説明する。
る。尚、ラベル設計結果115に特徴量調整情報116が付帯する場合、上記各特徴量として当該特徴量調整情報116に含まれている特徴量も採用される。
カード、SDカード、DVD等の記録媒体に置くことができる。
110 記憶部
111 ラベル設計原案
112 蓄積特徴量
113 第1閾値
114 第2閾値
115 ラベル設計結果
116 特徴量調整情報
120 ラベル設計原案受付部
130 ベクトル化部
140 クラスタリング部
150 ラベル設計評価部
160 ラベル設計補正部
161 新ラベル設計提案部
162 特徴量調整部
163 補正処理部
170 結果出力部
180 閾値設定部
S900 ラベル設計支援処理
S913 評価処理
S916 ラベル設計提案処理
S918 特徴量調整処理
1300 文書検索システム
Claims (15)
- 情報処理装置を用いて構成され、
ラベルと当該ラベルの付与対象となる複数の単語とを対応づけた情報であるラベル設計を記憶する記憶部と、
前記ラベル設計において前記ラベルに対応づけられている前記単語を特徴量に基づきベクトル化した単語ベクトルを生成するベクトル化部と、
前記単語ベクトルをクラスタリングするクラスタリング部と、
前記クラスタリングの結果と、前記ラベル設計における前記ラベルと前記単語の関係とを比較することにより前記ラベル設計の補正要否を判定するラベル設計評価部と、
を備える、ラベル設計支援装置。 - 請求項1に記載のラベル設計支援装置であって、
前記ラベル設計評価部は、単語数が最大のクラスタである代表クラスタの単語が複数のラベルに対応付けられているか否かを判定することにより、前記ラベル設計の補正要否を判定する、
ラベル設計支援装置。 - 請求項2に記載のラベル設計支援装置であって、
前記ラベル設計評価部が前記ラベル設計について補正要と判定した場合に、前記ラベル設計の補正案を生成するラベル設計補正部を更に備え、
前記ラベル設計評価部が、前記代表クラスタの単語が複数のラベルに対応付けられていると判定した場合に、前記ラベル設計補正部が、前記クラスタリング部によりクラスタリングされた各クラスタに前記ラベルの夫々を対応づけた内容の前記ラベル設計の補正案を生成する、
ラベル設計支援装置。 - 請求項1に記載のラベル設計支援装置であって、
前記ラベル設計評価部は、前記ラベルごとに、単語数が最大のクラスタである代表クラスタの重心からの各単語の平均距離が所定範囲内である否かを判定することにより、前記ラベル設計の補正要否を判定する、
ラベル設計支援装置。 - 請求項4に記載のラベル設計支援装置であって、
前記ラベル設計評価部が前記ラベル設計について補正要と判定した場合に、前記ラベル設計の補正案を生成するラベル設計補正部を更に備え、
前記ラベル設計評価部が、単語数が最大のクラスタである代表クラスタの重心からの各単語の平均距離が所定範囲内でないと判定したラベルについて、前記ラベル設計補正部が、前記平均距離が前記所定範囲内になるように前記ラベルを設定し直した内容の前記ラベル設計の補正案を生成する、
ラベル設計支援装置。 - 請求項4に記載のラベル設計支援装置であって、
前記所定範囲の設定を受け付けるユーザインタフェースを更に備える、
ラベル設計支援装置。 - 請求項1に記載のラベル設計支援装置であって、
前記ラベル設計評価部が前記ラベル設計について補正要と判定した場合に、前記ラベル設計の補正案を生成するラベル設計補正部を更に備え、
前記ラベル設計補正部は、ユーザインタフェースを介して前記補正案をユーザに提示す
ることによりユーザが前記補正案に同意するか否かを受け付け、
ユーザが同意した場合に前記補正案をラベル設計の結果として出力する結果出力部を更に備える、
ラベル設計支援装置。 - 請求項1に記載のラベル設計支援装置であって、
前記ラベル設計評価部が、前記ラベル設計について補正要と判定した場合に、特徴量を調整して前記ベクトル化を行うことにより前記単語ベクトルを生成し、生成した前記単語ベクトルをクラスタリングし、
前記ラベル設計評価部が、前記クラスタリングの結果と前記ラベル設計における前記ラベルと前記単語の関係を評価することにより、前記ラベル設計の補正要否を再度判定する、
ラベル設計支援装置。 - 請求項8に記載のラベル設計支援装置であって、
前記ラベル設計評価部が前記ラベル設計について補正要と判定した場合に、前記ラベル設計の補正案を生成するラベル設計補正部を更に備え、
前記ラベル設計補正部は、ユーザインタフェースを介して前記補正案をユーザに提示することによりユーザが前記補正案に同意するか否かを受け付け、
ユーザが同意した場合に前記ラベル設計の結果と特徴量の前記調整の内容とを出力する結果出力部を更に備える、
ラベル設計支援装置。 - 請求項8に記載のラベル設計支援装置であって、
特徴量の前記調整は、新たな特徴量の追加である、
ラベル設計支援装置。 - 情報処理装置が、
ラベルと当該ラベルの付与対象となる複数の単語とを対応づけた情報であるラベル設計を記憶するステップと、
前記ラベル設計において前記ラベルに対応づけられている前記単語を特徴量に基づきベクトル化した単語ベクトルを生成するステップと、
前記単語ベクトルをクラスタリングするステップと、
前記クラスタリングの結果と、前記ラベル設計における前記ラベルと前記単語の関係とを比較することにより前記ラベル設計の補正要否を判定するステップと、
を実行する、ラベル設計支援方法。 - 請求項11に記載のラベル設計支援方法であって、
前記情報処理装置が、単語数が最大のクラスタである代表クラスタの単語が複数のラベルに対応付けられているか否かを判定することにより、前記ラベル設計の補正要否を判定するステップ、
を更に実行する、ラベル設計支援方法。 - 請求項12に記載のラベル設計支援方法であって、
前記情報処理装置が、
前記ラベル設計について補正要と判定した場合に、前記ラベル設計の補正案を生成するステップを更に実行し、
前記代表クラスタの単語が複数のラベルに対応付けられていると判定した場合に、前記ラベル設計の補正案を生成するステップにおいて、クラスタリングした各クラスタに前記ラベルの夫々を対応づけた内容の前記ラベル設計の補正案を生成する、
ラベル設計支援方法。 - 請求項11に記載のラベル設計支援方法であって、
前記情報処理装置が、前記ラベルごとに、単語数が最大のクラスタである代表クラスタの重心からの各単語の平均距離が所定範囲内である否かを判定することにより、前記ラベル設計の補正要否を判定するステップ、
を更に実行する、ラベル設計支援方法。 - 請求項14に記載のラベル設計支援方法であって、
前記情報処理装置が、
前記ラベル設計について補正要と判定した場合に、前記ラベル設計の補正案を生成するステップを更に実行し、
単語数が最大のクラスタである代表クラスタの重心からの各単語の平均距離が所定範囲内でないと判定したラベルについて、前記ラベル設計の補正案を生成するステップにおいて、前記平均距離が前記所定範囲内になるように前記ラベルを設定し直した内容の前記ラベル設計の補正案を生成する、
ラベル設計支援方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020073448A JP7425662B2 (ja) | 2020-04-16 | 2020-04-16 | ラベル設計支援装置、及びラベル設計支援方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020073448A JP7425662B2 (ja) | 2020-04-16 | 2020-04-16 | ラベル設計支援装置、及びラベル設計支援方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021170255A JP2021170255A (ja) | 2021-10-28 |
JP7425662B2 true JP7425662B2 (ja) | 2024-01-31 |
Family
ID=78150077
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020073448A Active JP7425662B2 (ja) | 2020-04-16 | 2020-04-16 | ラベル設計支援装置、及びラベル設計支援方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7425662B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011118723A1 (ja) | 2010-03-26 | 2011-09-29 | 日本電気株式会社 | 意味抽出装置、意味抽出方法、および、記録媒体 |
JP2019012457A (ja) | 2017-06-30 | 2019-01-24 | 新日鉄住金ソリューションズ株式会社 | 情報処理装置、情報処理方法及びプログラム |
-
2020
- 2020-04-16 JP JP2020073448A patent/JP7425662B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011118723A1 (ja) | 2010-03-26 | 2011-09-29 | 日本電気株式会社 | 意味抽出装置、意味抽出方法、および、記録媒体 |
JP2019012457A (ja) | 2017-06-30 | 2019-01-24 | 新日鉄住金ソリューションズ株式会社 | 情報処理装置、情報処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021170255A (ja) | 2021-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102703923B1 (ko) | 문서의 내러티브 학습 장치 및 방법, 문서의 내러티브 생성 장치 및 방법 | |
JP5512489B2 (ja) | ファイル管理装置及びファイル管理方法 | |
US8732173B2 (en) | Classification hierarchy regeneration system, classification hierarchy regeneration method, and classification hierarchy regeneration program | |
JP5834883B2 (ja) | 因果関係要約方法、因果関係要約装置及び因果関係要約プログラム | |
JP2013080375A (ja) | 個人情報匿名化装置及び方法 | |
KR102046692B1 (ko) | 다언어 특질 투영된 개체 공간 기반 개체 요약본 생성 방법 및 시스템 | |
US9552415B2 (en) | Category classification processing device and method | |
JP2014067154A (ja) | 文書分類支援装置、方法及びプログラム | |
US11244109B2 (en) | Information processing device and information processing method | |
JP5836893B2 (ja) | ファイル管理装置、ファイル管理方法、及びプログラム | |
JP5215046B2 (ja) | 文書分類装置 | |
JP4795856B2 (ja) | クラスタリング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP7425662B2 (ja) | ラベル設計支援装置、及びラベル設計支援方法 | |
JP2016027493A (ja) | 文書分類支援装置、方法及びプログラム | |
JP7364512B2 (ja) | ラベル付与モデル生成装置、及びラベル付与モデル生成方法 | |
JP2022052481A (ja) | 説明文出力装置、説明文出力プログラム及び説明文出力方法 | |
JP5942981B2 (ja) | 要約作成装置、要約作成方法、およびプログラム | |
JP5199968B2 (ja) | キーワードタイプ判定装置、キーワードタイプ判定方法およびキーワードタイプ判定プログラム | |
JP7442430B2 (ja) | 審査支援システム、及び審査支援方法 | |
Safaei et al. | Multidimensional indexing technique for medical images retrieval | |
WO2024127832A1 (ja) | 計算機システム及び文書分析方法 | |
JP2015022723A (ja) | 文書を検索する装置及び方法 | |
US11328501B2 (en) | Computer-readable recording medium recording specifying program, information processing apparatus, and specifying method | |
JP7478585B2 (ja) | プログラム部品評価システム、及びプログラム部品評価方法 | |
JP2023134907A (ja) | 業務分析支援システム、及び業務分析支援方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230913 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7425662 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |