JP6703698B1 - 情報提供システム - Google Patents
情報提供システム Download PDFInfo
- Publication number
- JP6703698B1 JP6703698B1 JP2019199259A JP2019199259A JP6703698B1 JP 6703698 B1 JP6703698 B1 JP 6703698B1 JP 2019199259 A JP2019199259 A JP 2019199259A JP 2019199259 A JP2019199259 A JP 2019199259A JP 6703698 B1 JP6703698 B1 JP 6703698B1
- Authority
- JP
- Japan
- Prior art keywords
- information
- basic information
- target
- basic
- target information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
図1は、本実施形態における情報提供システム100の全体の構成を示すブロック図である。
図3は、本実施形態における情報提供システムの関連性データベースの一例を示す模式図である。関連性データベースは、基礎情報と対象情報とが1対1で対応して、複数記憶される。関連性データベースは、基礎コンテンツがチャンク構造に分割された複数の基礎情報と、基礎コンテンツと関連して基礎コンテンツとは異なる属性の対象コンテンツがチャンク構造に分割された複数の対象情報を、それぞれ対応させて記憶される。基礎コンテンツと対象コンテンツとは、文章情報を含み、更に図表に関する図表情報を含んでいてもよい。対象コンテンツは、基礎コンテンツに基づいて編集すべき対象となるコンテンツである。
基礎情報類似度算出用データベースは、基礎情報を用いて機械学習により構築される。機械学習の方法として、例えば基礎情報を教師データとして学習用プログラムを使いベクトル化して学習させる。基礎情報は、基礎情報における基礎情報ラベルに対応させて、ベクトル化された状態でパラメータとして基礎情報類似度算出用データベースに記憶される。基礎情報は、基礎情報に対応させて、ベクトル化された状態でパラメータとして基礎情報類似度算出用データベースに記憶されてもよい。
対象情報類似度推定処理用データベースは、対象情報を用いて機械学習により構築される。機械学習の方法として、例えば対象情報を教師データとして学習用プログラムを使いベクトル化して学習させる。対象情報は、対象情報における対象情報ラベルに対応させて、ベクトル化された状態でパラメータとして対象情報類似度推定処理用データベースに記憶される。対象情報は、対象情報に対応させて、ベクトル化された状態でパラメータとして対象情報類似度推定処理用データベースに記憶されてもよい。
図6は、本実施形態における情報提供システムの情報提供装置1の構成の一例を示す模式図である。情報提供装置1として、パーソナルコンピュータ(PC)のほか、スマートフォンやタブレット端末等の電子機器が用いられてもよい。情報提供装置1は、筐体10と、CPU101と、ROM102と、RAM103と、保存部104と、I/F105〜107とを備える。各構成101〜107は、内部バス110により接続される。
基礎情報取得部31は、基礎情報、特定の基礎情報等の各種情報を取得する。特定の基礎情報は、これから基礎情報類似度を算出すべき対象となる基礎情報である。
基礎情報比較部32は、関連性データベースに記憶された基礎情報と、基礎情報取得部31により取得した特定の基礎情報と、を比較する。基礎情報比較部32は、基礎情報と、特定の基礎情報と、が一致するか、一致しないか、を判定する。
基礎情報類似度算出部33は、基礎情報比較部32により基礎情報と特定の基礎情報とが一致しない場合、基礎情報類似度算出用データベースを参照し、基礎情報類似度算出用データベースに記憶された基礎情報と、基礎情報取得部31により取得された特定の基礎情報と、の類似度を示す基礎情報類似度を算出する。基礎情報類似度算出部33は、基礎情報の特徴量を用いて、基礎情報類似度算出する。基礎情報の特徴量として、例えば基礎情報がベクトル化されて表現されてもよい。基礎情報類似度算出部33は、特定の基礎情報をベクトル化した上で、基礎情報類似度算出用データベース内でベクトル化された基礎情報とのベクトル演算により、特定の基礎情報と基礎情報との基礎情報類似度を算出する。
対象情報抽出部34は、算出された基礎情報類似度に基づいて、複数の基礎情報から第1基礎情報を選択し、関連性データベースを参照し、選択した第1基礎情報に対応する対象情報を第1対象情報として抽出する。対象情報抽出部34は、複数の基礎情報から1つの第1基礎情報を選択したとき、選択した1つの第1基礎情報に対応する1つの対象情報を第1対象情報として抽出する。また、対象情報抽出部34は、複数の第1基礎情報を選択したとき、選択したそれぞれの第1基礎情報に対応する対象情報をそれぞれ第1対象情報として抽出してもよい。
対象情報類似度算出部35は、対象情報類似度推定処理用データベースを参照し、対象情報と、対象情報抽出部34により抽出された第1対象情報と、の類似度を示す対象情報類似度を算出する。対象情報類似度算出部35は、対象情報の特徴量を用いて、対象情報類似度を算出する。対象情報の特徴量として、例えば対象情報がベクトル化されて表現されてもよい。対象情報類似度算出部35は、特定の対象情報をベクトル化した上で、対象情報類似度推定処理用データベース内でベクトル化された対象情報とのベクトル演算により、特定の対象情報と対象情報との対象情報類似度を算出する。
入力部15は、情報提供装置1に各種情報を入力する。入力部15は、I/F105を介して学習データ、基礎情報、基礎コンテンツ等の各種情報を入力するほか、例えばI/F106を介して入力部分108から各種情報を入力する。
出力部16は、対象情報等の各種情報を出力部分109等に出力する。出力部16は、例えば公衆通信網7を介して、ユーザ端末5等に対象情報等の各種情報を送信する。
記憶部17は、基礎情報や対象情報等の各種情報を保存部104に記憶し、必要に応じて保存部104に記憶された各種情報を取出す。また、記憶部17は、基礎情報類似度算出用データベース、対象情報類似度算出用データベース等の各種データベースを、保存部104に記憶し、必要に応じて保存部104に記憶された各種データベースを取出す。
制御部18は、複数の基礎情報を用いて基礎情報類似度算出用データベースを構築するための機械学習を実行する。また、制御部18は、複数の対象情報を用いて対象情報類似度算出用データベースを構築するための機械学習を実行する。制御部18は、線形回帰、ロジスティック回帰、サポートベクターマシーン、決定木、回帰木、ランダムフォレスト、勾配ブースティング木、ニューラルネットワーク、ベイズ、時系列、クラスタリング、アンサンブル学習等により機械学習を実行する。
ユーザ端末5は、ユーザが保有する端末を示す。ユーザ端末5は、携帯電話(携帯端末)、スマートフォン、タブレット型端末、ウェアラブル端末、パーソナルコンピュータ、IoT(Internet of Things)デバイス等の電子機器のほか、あらゆる電子機器で具現化されたものが用いられてもよい。ユーザ端末5は、HMD(ヘッドマウントディスプレイ)の1種類であるホロレンズ(登録商標)が用いられてもよい。ユーザ端末5は、例えば公衆通信網7を介して情報提供装置1と接続されるほか、例えば情報提供装置1と直接接続されてもよい。ユーザは、ユーザ端末5を用いて、情報提供装置1から第1対象情報を取得するほか、ユーザ端末5の表示部に取得した各種情報を表示させることができる。また、ユーザは、ユーザ端末5を用いて、情報提供装置1の各種制御を行ってもよい。
サーバ6には、上述した各種情報が記憶される。サーバ6には、例えば公衆通信網7を介して送られてきた各種情報が蓄積される。サーバ6には、例えば保存部104と同様の情報が記憶され、公衆通信網7を介して情報提供装置1と各種情報の送受信が行われてもよい。すなわち、情報提供装置1は、保存部104の代わりにサーバ6を用いてもよい。
公衆通信網7は、情報提供装置1等が通信回路を介して接続されるインターネット網等である。公衆通信網7は、いわゆる光ファイバ通信網で構成されてもよい。また、公衆通信網7は、有線通信網には限定されず、無線通信網等の公知の通信網で実現してもよい。
次に、本実施形態における情報提供システム100の動作の一例について説明する。図8は、本実施形態における情報提供システム100の動作の一例を示すフローチャートである。
基礎情報取得部31は、例えば仕様書等の基礎コンテンツがチャンク構造に分割された基礎情報を特定の基礎情報として1又は複数取得する(基礎情報取得ステップS31)。基礎情報取得部31は、特定の基礎情報を含む特定の基礎コンテンツを取得してもよい。
次に、基礎情報比較部32は、関連性データベースに記憶された基礎情報と、基礎情報取得部31により取得した特定の基礎情報と、を比較する(基礎情報比較ステップS32)。基礎情報比較部32は、基礎情報と、特定の基礎情報と、が一致するか、一致しないか、を判定する。
次に、基礎情報類似度算出部33は、基礎情報比較部32により比較した結果、基礎情報と特定の基礎情報とが一致しない場合、基礎情報類似度算出用データベースを参照し、基礎情報類似度算出用データベースに記憶された基礎情報と、基礎情報取得部31により取得された特定の基礎情報と、の類似度を示す基礎情報類似度を算出する(基礎情報類似度算出ステップS33)。
対象情報抽出部34は、算出された基礎情報類似度に基づいて、複数の基礎情報から第1基礎情報を選択し、関連性データベースを参照し、選択した第1基礎情報に対応する対象情報を第1対象情報として抽出する(第1対象情報抽出ステップS34)。
次に、対象情報類似度算出部35は、対象情報類似度推定処理用データベースを参照し、対象情報類似度推定処理用データベースに記憶された対象情報と、対象情報抽出部34により抽出された第1対象情報と、の類似度を示す対象情報類似度を算出する(対象情報類似度算出ステップS35)。
次に、対象情報抽出部34は、対象情報類似度に基づいて、第1対象情報とは異なる第2対象情報を更に1又は複数抽出する(第2対象情報抽出ステップS36)。
図9は、本実施形態における情報提供システム100における第2例を示す模式図である。情報提供システム100の第2例では、基礎コンテンツがチャンク構造に分割された複数の基礎情報と、属性ごとに分類された対象コンテンツがチャンク単位に分割された複数の対象情報と、が記憶される関連性データベースを複数備える。
先ず、基礎情報取得部31は、特定の基礎コンテンツXに含まれる、特定の基礎情報x1〜x5、特定の基礎情報e1、特定の基礎情報f2、特定の基礎情報g3、特定の基礎情報h2、を取得する(基礎情報取得ステップS31)。
基礎情報比較部32は、関連性データベースに記憶された基礎情報と、基礎情報取得部31により取得した特定の基礎情報と、を比較する。基礎情報比較部32は、基礎情報と、特定の基礎情報と、が一致するか、一致しないか、を判定する。
基礎情報類似度算出部33は、基礎情報比較部32により基礎情報と特定の基礎情報とが一致しない場合、基礎情報類似度算出用データベースを参照し、基礎情報類似度算出用データベースに記憶された基礎情報と、基礎情報取得部31により取得された特定の基礎情報と、の類似度を示す基礎情報類似度を算出する。
対象情報抽出部34は、算出された基礎情報類似度に基づいて、複数の基礎情報から第1基礎情報を選択し、それぞれの関連性データベースを参照し、選択した第1基礎情報に対応する対象情報を第1対象情報として抽出する。対象情報抽出部34は、複数の基礎情報から1つの第1基礎情報を選択したとき、選択した1つの第1基礎情報に対応する1つの対象情報を第1対象情報として抽出する。また、対象情報抽出部34は、複数の第1基礎情報を選択したとき、選択したそれぞれの第1基礎情報に対応する対象情報をそれぞれ第1対象情報として抽出してもよい。
情報提供装置1の第3例では、更にアクセス制御部を備える点で、第1例と相違する。アクセス制御部は、例えば、CPU101が、RAM103を作業領域として、保存部104等に記憶されたプログラムを実行することにより実現される。
5 :ユーザ端末
6 :サーバ
7 :公衆通信網
10 :筐体
15 :入力部
16 :出力部
17 :記憶部
18 :制御部
31 :基礎情報取得部
32 :基礎情報比較部
33 :基礎情報類似度算出部
34 :対象情報抽出部
35 :対象情報類似度算出部
100 :情報提供システム
101 :CPU
102 :ROM
103 :RAM
104 :保存部
105 :I/F
106 :I/F
107 :I/F
108 :入力部分
109 :出力部分
110 :内部バス
S31 :基礎情報取得部ステップ
S32 :基礎情報比較ステップ
S33 :基礎情報類似度算出ステップ
S34 :第1対象情報抽出ステップ
S35 :対象情報類似度算出ステップ
S36 :第2対象情報抽出ステップ
Claims (3)
- 基礎コンテンツがチャンク構造に分割された複数の基礎情報と、前記基礎コンテンツとは異なる属性の対象コンテンツがチャンク構造に分割された複数の対象情報と、を対応させて記憶される関連性データベースと、
複数の前記基礎情報を用いて機械学習により構築される基礎情報類似度算出用データベースと、
特定の基礎情報を取得する基礎情報取得手段と、
前記基礎情報と、前記特定の基礎情報とを比較する基礎情報比較手段と、
前記基礎情報比較手段により前記基礎情報と前記特定の基礎情報とが一致しない場合、前記基礎情報類似度算出用データベースを参照し、前記基礎情報と、前記特定の基礎情報と、の類似度を示す基礎情報類似度を算出する基礎情報類似度算出手段と、
前記基礎情報類似度に基づいて、複数の前記基礎情報から第1基礎情報を選択し、前記関連性データベースを参照し、前記第1基礎情報に対応する前記対象情報を第1対象情報として抽出する対象情報抽出手段と、を備えること
を特徴とする情報提供システム。 - 複数の前記対象情報を用いて機械学習により構築された対象情報類似度推定処理用データベースと、
前記対象情報類似度推定処理用データベースを参照し、前記対象情報と、前記対象情報抽出手段により抽出された前記第1対象情報と、の類似度を示す対象情報類似度を算出する対象情報類似度算出手段と、を備え、
前記対象情報抽出手段は、前記対象情報類似度に基づいて、前記第1対象情報とは異なる第2対象情報を更に抽出すること
を特徴とする請求項1記載の情報提供システム。 - 複数の前記基礎情報と、属性ごとに分類された前記対象コンテンツがチャンク構造に分割された複数の前記対象情報と、を対応させて記憶される前記関連性データベースを複数備えること
を特徴とする請求項2記載の情報提供システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019199259A JP6703698B1 (ja) | 2019-10-31 | 2019-10-31 | 情報提供システム |
PCT/JP2020/026693 WO2021084807A1 (ja) | 2019-10-31 | 2020-07-08 | 情報提供システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019199259A JP6703698B1 (ja) | 2019-10-31 | 2019-10-31 | 情報提供システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6703698B1 true JP6703698B1 (ja) | 2020-06-03 |
JP2021071992A JP2021071992A (ja) | 2021-05-06 |
Family
ID=70858073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019199259A Active JP6703698B1 (ja) | 2019-10-31 | 2019-10-31 | 情報提供システム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6703698B1 (ja) |
WO (1) | WO2021084807A1 (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3851712B2 (ja) * | 1997-07-28 | 2006-11-29 | 株式会社ジャストシステム | 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2010191519A (ja) * | 2009-02-16 | 2010-09-02 | Nec Corp | 文書管理装置、方法、及び、プログラム |
JP2012185667A (ja) * | 2011-03-04 | 2012-09-27 | Takara Printing Co Ltd | 財務文書対訳表示システム |
GB2503486A (en) * | 2012-06-28 | 2014-01-01 | Ibm | Managing changes to files |
WO2014064803A1 (ja) * | 2012-10-25 | 2014-05-01 | 株式会社日立製作所 | 文書処理プログラム、文書処理装置、文書処理システム、文書処理方法 |
JP6651189B1 (ja) * | 2019-03-29 | 2020-02-19 | 株式会社 情報システムエンジニアリング | 機械学習用のデータ構造、学習方法及び情報提供システム |
-
2019
- 2019-10-31 JP JP2019199259A patent/JP6703698B1/ja active Active
-
2020
- 2020-07-08 WO PCT/JP2020/026693 patent/WO2021084807A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2021084807A1 (ja) | 2021-05-06 |
JP2021071992A (ja) | 2021-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11222167B2 (en) | Generating structured text summaries of digital documents using interactive collaboration | |
US20240028651A1 (en) | System and method for processing documents | |
US10474708B2 (en) | Entity-centric knowledge discovery | |
US9542477B2 (en) | Method of automated discovery of topics relatedness | |
US20200117446A1 (en) | Code search and code navigation | |
US10678820B2 (en) | System and method for computerized semantic indexing and searching | |
US11887011B2 (en) | Schema augmentation system for exploratory research | |
US20180293215A1 (en) | Method and Computer Program for Sharing Memo between Electronic Documents | |
JP2017041171A (ja) | テストシナリオ生成支援装置およびテストシナリオ生成支援方法 | |
US20080184107A1 (en) | Method and apparatus for creating a tool for generating an index for a document | |
JP2021144348A (ja) | 情報処理装置及び情報処理方法 | |
JP6621514B1 (ja) | 要約作成装置、要約作成方法、及びプログラム | |
CN117420998A (zh) | 一种客户端ui交互组件生成方法、装置、终端及介质 | |
JP2019016074A (ja) | オントロジー生成装置、オントロジー生成プログラム及びオントロジー生成方法 | |
JP6703698B1 (ja) | 情報提供システム | |
CN113449063B (zh) | 一种构建文档结构信息检索库的方法及装置 | |
KR101835994B1 (ko) | 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치 | |
CN114676155A (zh) | 代码提示信息的确定方法、数据集的确定方法及电子设备 | |
JP2018156552A (ja) | 計算機システム及び文章データの検索方法 | |
JP2021101375A (ja) | 辞書構築装置、辞書の生産方法、およびプログラム | |
CN112699642A (zh) | 复杂医疗文书的索引提取方法及装置、介质及电子设备 | |
JP2021128620A (ja) | 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム | |
CN113505889B (zh) | 图谱化知识库的处理方法、装置、计算机设备和存储介质 | |
JP6949341B1 (ja) | プログラムコード自動生成装置及びプログラム | |
JP6476638B2 (ja) | 固有用語候補抽出装置、固有用語候補抽出方法、及び固有用語候補抽出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191101 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20191101 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20191203 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200327 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6703698 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |