JP7418235B2 - 事例カタログ管理装置及び事例カタログ構築方法 - Google Patents
事例カタログ管理装置及び事例カタログ構築方法 Download PDFInfo
- Publication number
- JP7418235B2 JP7418235B2 JP2020024807A JP2020024807A JP7418235B2 JP 7418235 B2 JP7418235 B2 JP 7418235B2 JP 2020024807 A JP2020024807 A JP 2020024807A JP 2020024807 A JP2020024807 A JP 2020024807A JP 7418235 B2 JP7418235 B2 JP 7418235B2
- Authority
- JP
- Japan
- Prior art keywords
- case
- item
- items
- combination
- inter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims description 5
- 238000000605 extraction Methods 0.000 claims description 112
- 238000007726 management method Methods 0.000 claims description 51
- 238000000034 method Methods 0.000 claims description 28
- 239000013598 vector Substances 0.000 claims description 19
- 239000000284 extract Substances 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 description 36
- 238000005516 engineering process Methods 0.000 description 36
- 230000000694 effects Effects 0.000 description 33
- 238000012545 processing Methods 0.000 description 29
- 238000013480 data collection Methods 0.000 description 26
- 230000008569 process Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 13
- 238000012790 confirmation Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 238000012937 correction Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Description
以下、本発明に係る実施形態1を、図1から図10を用いて説明する。
先ず、図1及び図2を用いて事例カタログ管理システムの構成について説明する。
本実施形態1の事例カタログ管理システムは、事例カタログ管理装置1、事例利用者端末4、事例提供者端末5、事例収集先情報源6(図では、事例収集先情報源♯i:6-i(i=1,…,N)と表記)、管理者端末7、外部サービスシステム8、外部サービスユーザー端末9から構成される。
事例カタログ管理装置1のハードウェア構成としては、例えば、図2に示されるパーソナルコンピュータのような一般的な情報処理装置で実現される。
事例カタログ100は、図3に示されるようなテーブル構造により表現される。事例カタログ100のテーブルは、例えば、事例ID100a、事例タイトル100b、作成日時100c、更新日時100c、登録ユーザー名100d、顧客名100f、課題内容100g、施策内容100h、技術名100i、効果内容100j、元データへのリンク100kの項目から構成される。そして、RDBのテーブルで表現されるときには、一つの文書により一つのレコードが格納される。なお、図3に示されるような事例カタログ100の各項目を以下では、「事例項目」という。
事例カタログデータ収集部14は、事例データ収集部141、項目抽出部143、形式加工部145、事例カタログデータベース登録部147、モデル作成部144から構成される。
項目抽出部143は、値候補抽出部1432と最適組み合わせ選択部1433から構成される。
先ず、情報ソースリポジトリ142から文書の収集先のURLを取得する(S401)。
次に、取得したURLから文書ファイルをダウンロードする(S402)。次に、ダウンロードした文書ファイルから、文書ファイルの種別を特定する(S403)。次に、取得した文書ファイルの種別に合わせて、文書ファイルの内容を分析し、文書ファイルに含まれるテキストを取得する(S404)。最後に、取得したテキストを項目抽出部143に出力する(S405)。
先ず、文書に含まれるテキストを取得する(S601)。
次に、抽出したい事例項目ごとに処理を実行する(S602)。
顧客名や技術名を抽出する場合には、S603、S604、S605を実行する。
以上の処理により、各事例項目の候補で最適なものを出力することができる。
項目間関連性算出テーブル20は、最適組合せ選択部で作成され使用されるテーブルであり、項目間関連性を示す値を保持するテーブルである。
これは、図7のS610に該当する処理である。
次に、各事例項目の候補のスコアを正規化する(S702)。
スコアの正規化は、以下の(式1)によって行われる。ここで、Siは、各事例項目の候補のスコア、Sj′は、正規化されたスコアであり、分子のΣは、全ての事例項目についての和をとることを意味する。
次に、各事例項目の組合せに対して、項目間の関連性を予め定めた項目間関連性算出モデル151に基づいて、項目間関連値rel(i,j)を算出し(S704)、項目間関連性算出テーブル20に格納する。
以上の処理により、各事例項目間の関連性を考慮して、各項目の候補を出力することができる。
これは、具体的には、事例項目間の項目間関連値を算出する方法となる。ここでは、事例が日本語で記述されていることを想定し、さらに施策内容と効果内容の関連性について算出する場合について述べる。
項目間関連性重みづけテーブル30の値は、評価した結果に基づいて決める。例えば、事例の文書に対して、いくつかの項目間関連性重みづけテーブル30の値を用意して、各項目間関連性重みづけテーブル30の場合での、出力結果(各項目の候補の単語や文)を出す。そして、出力結果を評価者が順位をつけ、最も順位の高くなったテーブルの値に決定する。なお、この評価は単一の事例に対して実施するのではなく、多数の事例に対して評価を実施し、多くの事例で順位が高いテーブルの値を選択する。また、評価者によって、順位づけが異なるような場合では、評価者を複数用意し、多くの事例で、かつ、より多くの評価者で順位が高いテーブルの値を選択してもよい。
以下、本発明に係る実施形態2を、図11を用いて説明する。
本実施形態では、実施形態1と相違する点を中心に説明する。
実施形態1では、最も総合スコアの高い項目の候補を事例カタログデータベース10に登録していた。しかしながら、項目間の関連性を考慮したとしても、元の文章の記載がわかりづらいものであったり、その前段の値候補抽出部1432での出力の候補が良好でない場合などは、項目抽出部143が出力する候補が必ずしも適切でない場合が考えられる。そのような場合では、事例カタログデータベースに格納される値も不適切なものとなり、事例データカタログベースの質が低下してしまい、また、その事例に対する事例カタログを閲覧しても、事例の概要を把握できなくなることが懸念される。不適切な出力を防ぐために、事例カタログデータベース管理者等、人手でチェックや修正を全件に対して実施していたのでは、本来の事例カタログデータの収集を簡易化する目的を達成できない。
上記で述べた実施形態2では、管理者による確認の有無を総合スコアのみで判定していたが、各項目のスコアを考慮できていない。そのため、総合スコアは良好だが、特定の項目のみきわめて低い場合については、人手でチェックされずに出力される可能性がある。自動生成する事例カタログデータベースの品質の考え方、ポリシーに依存するが、一部の項目がうまく抽出できなくても全体的によければ問題ないと考えるのであれば、実施形態2で述べたように総合スコアのみで判定すればよい。
以下、本発明に係る実施形態3を、図12を用いて説明する。
本実施形態でも、実施形態1と相違する点を中心に説明する。
実施形態1では、項目抽出部143で事例の項目の値を抽出する際に、事例収集先情報源6によらず共通の項目抽出モデル150に基づいて実行していた。しかしながら、事例収集先の情報源によって、事例に関する説明の記述の仕方は異なっているため、共通のモデルでは情報を抽出できない、又は、十分な精度で情報を抽出することができないことが懸念される。また、事例の項目を抽出可能な事例収集先情報源に制限が生じてしまい、より多くの事例収集先情報源6から収集することが困難となる。
以下、本発明に係る実施形態4を、図13及び図14を用いて説明する。
実施形態1の項目抽出部143では、顧客名の事例項目の候補や課題文の事例項目の候補、施策文の事例項目の候補、技術名の事例項目の候補、効果文の事例項目の候補を出力していた。しかしながら、事例カタログデータベースでの利便性を向上させるためには、より多くの事例項目を用意することが望ましい。値候補抽出部1432において、抽出のために利用するモデルを追加することによっても実現することができるが、別の方法として、最適組み合わせ選択部1433で出力された各項目の候補の値を用いて、新たな項目の値を抽出することも可能である。
実施形態4では、前述したように新たに、分野カテゴリ、課題カテゴリ、技術カテゴリも推測することができ、これらの情報を格納するように、事例カタログの項目として、分野カテゴリ100l、課題カテゴリ100m、技術カテゴリ100nが追加されている。
2,3…ネットワーク
4…事例利用者端末
5…事例提供者端末
6…事例収集先情報源
7…管理者端末
8…外部サービスシステム
9…外部サービスユーザー端末
10…事例カタログデータベース
12…データベース検索及び閲覧部
13…データベース登録及び更新部
14…事例カタログデータ収集部
15…APIゲートウェイ
16…データベース管理部
20…項目間関連性算出テーブル
30…項目間関連性重みづけテーブル
141…事例データ収集部
142…情報ソースリポジトリ
143…項目抽出部
145…形式加工部
146…語彙辞書
147…事例カタログデータベース登録部
149…項目抽出機能IF部
150…項目抽出モデル
151…項目間関連性算出モデル
1432…値候補抽出部
1433…最適組み合わせ選択部
1434…分野カテゴリ推測部
1435…課題カテゴリ推測部
1436…技術カテゴリ推測部
Claims (7)
- 文書から事例項目により構成される事例カタログを抽出する事例カタログ管理装置であって、
前記文書のテキストを入力し、事例項目とその値を候補として、候補の組合せを出力する項目抽出部を有し、
事例項目の組合せごとに項目関連値を格納する項目間関連性テーブルと、事例項目の組合せごとに重みづけ係数を格納する項目間関連性重みづけテーブルとを保持し、
前記項目抽出部は、事例項目ごとに入力されたテキストに対してスコアを出力する項目抽出モデルに基づいて、前記テキストから各事例項目の候補を抽出する値候補抽出部と、事例項目の候補の組合せから最適なものを選択する最適組合せ選択部とを備え、
前記最適組合せ選択部は、
前記項目間関連性テーブルを参照して、事例項目の組合せごとに、事例項目間の関連度を示す項目間関連値を求め、
項目間関連性重みづけテーブルを参照して、事例項目の組合せごとに、事例項目間の重みづけ係数を求め、
事例項目の全てにわたって、各事例項目の組合せごとの項目間関連値と各事例項目の組合せごとの重みづけ係数を掛けた項の総和によって求められる総合スコアを算出し、前記総合スコアに基づいて、事例項目の候補の組合せから最適なものを選択して、選択された事例項目の組合せと各事例項目の値により事例カタログを出力することを特徴とする事例カタログ管理装置。 - 各事例項目ごとのスコアは、事例項目の値となるテキストからベクトルを生成し、生成されたベクトルに基づいて算出されることを特徴とする請求項1記載の事例カタログ管理装置。
- 前記項目間関連値は、生成されたベクトル間の類似度に基づいて算出されることを特徴とする請求項1記載の事例カタログ管理装置。
- 前記総合スコアの値の大小によって、前記事例項目の候補を含んだ情報を出力するか否かを判定することを特徴とする請求項1記載の事例カタログ管理装置。
- 前記文書の情報源の種別又は文書の種別に対応して、前記項目抽出モデルを切替えることを特徴とする請求項1記載の事例カタログ管理装置。
- 前記最適組合せ選択部により選択された事例項目とその値を入力して、新たな事例項目の値を推測して出力することを特徴とする請求項1記載の事例カタログ管理装置。
- 事例カタログ管理装置により、文書から事例項目により構成される事例カタログを抽出する事例カタログ構築方法であって、
前記事例カタログ管理装置は、事例項目の組合せごとに項目関連値を格納する項目間関連性テーブルと、事例項目の組合せごとに重みづけ係数を格納する項目間関連性重みづけテーブルとを保持し、
前記事例カタログ管理装置が、前記文書のテキストを入力し、事例項目とその値を候補として、候補の組合せを出力する項目抽出ステップを有し、
前記項目抽出ステップは、前記事例カタログ管理装置が、項目抽出モデルに基づいて、前記テキストから各事例項目の候補を抽出する値候補抽出ステップと、前記事例カタログ管理装置が、事例項目の候補の組合せから最適なものを選択する最適組合せ選択ステップとを備え、
前記最適組合せ選択ステップは、
前記項目間関連性テーブルを参照して、事例項目の組合せごとに、事例項目間の関連度を示す項目間関連値を求め、
項目間関連性重みづけテーブルを参照して、事例項目の組合せごとに、事例項目間の重みづけ係数を求め、
事例項目の全てにわたって、各事例項目の組合せごとの項目間関連値と各事例項目の組合せごとの重みづけ係数を掛けた項の総和によって求められる総合スコアを算出し、前記総合スコアに基づいて、事例項目の候補の組合せから最適なものを選択して、選択された事例項目の組合せと各事例項目の値により事例カタログ出力することを特徴とする事例カタログ管理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020024807A JP7418235B2 (ja) | 2020-02-18 | 2020-02-18 | 事例カタログ管理装置及び事例カタログ構築方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020024807A JP7418235B2 (ja) | 2020-02-18 | 2020-02-18 | 事例カタログ管理装置及び事例カタログ構築方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021131576A JP2021131576A (ja) | 2021-09-09 |
JP7418235B2 true JP7418235B2 (ja) | 2024-01-19 |
Family
ID=77550938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020024807A Active JP7418235B2 (ja) | 2020-02-18 | 2020-02-18 | 事例カタログ管理装置及び事例カタログ構築方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7418235B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002236692A (ja) | 2001-02-09 | 2002-08-23 | Fujitsu Ltd | 障害情報管理装置 |
JP2014153862A (ja) | 2013-02-07 | 2014-08-25 | Nippon Telegr & Teleph Corp <Ntt> | 情報抽出装置、情報抽出方法及び情報抽出プログラム |
-
2020
- 2020-02-18 JP JP2020024807A patent/JP7418235B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002236692A (ja) | 2001-02-09 | 2002-08-23 | Fujitsu Ltd | 障害情報管理装置 |
JP2014153862A (ja) | 2013-02-07 | 2014-08-25 | Nippon Telegr & Teleph Corp <Ntt> | 情報抽出装置、情報抽出方法及び情報抽出プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021131576A (ja) | 2021-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11392778B2 (en) | Use of statistical flow data for machine translations between different languages | |
US10509861B2 (en) | Systems, methods, and software for manuscript recommendations and submissions | |
US9990422B2 (en) | Contextual analysis engine | |
US10430806B2 (en) | Input/output interface for contextual analysis engine | |
US10235681B2 (en) | Text extraction module for contextual analysis engine | |
US10755179B2 (en) | Methods and apparatus for identifying concepts corresponding to input information | |
US10810215B2 (en) | Supporting evidence retrieval for complex answers | |
Rodríguez-García et al. | Creating a semantically-enhanced cloud services environment through ontology evolution | |
US11468342B2 (en) | Systems and methods for generating and using knowledge graphs | |
Sunilkumar et al. | A survey on semantic similarity | |
US20050149538A1 (en) | Systems and methods for creating and publishing relational data bases | |
KR20180042710A (ko) | 유사도 분석 기반 이음 동의 항목 관리 방법 및 장치 | |
Verma et al. | A novel approach for text summarization using optimal combination of sentence scoring methods | |
WO2022269510A1 (en) | Method and system for interactive searching based on semantic similarity of semantic representations of text objects | |
CN109726292A (zh) | 面向大规模多语种数据的文本分析方法和装置 | |
CN111126073B (zh) | 语义检索方法和装置 | |
CN117149804A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
US11328005B2 (en) | Machine learning (ML) based expansion of a data set | |
JP2021144348A (ja) | 情報処理装置及び情報処理方法 | |
JP7418235B2 (ja) | 事例カタログ管理装置及び事例カタログ構築方法 | |
JP2020067864A (ja) | 知識検索装置、知識検索方法、および、知識検索プログラム | |
WO2020079752A1 (ja) | 文献検索方法および文献検索システム | |
WO2018126019A1 (en) | Systems, methods, and software for manuscript recommendations and submissions | |
Musabeyezu | Comparative study of annotation tools and techniques | |
Eldin et al. | Cross-language semantic web service discovery to improve the selection mechanism by using data mining techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220609 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230529 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230627 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7418235 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |