JP6578693B2 - 情報抽出装置、情報抽出方法、及び、表示制御システム - Google Patents
情報抽出装置、情報抽出方法、及び、表示制御システム Download PDFInfo
- Publication number
- JP6578693B2 JP6578693B2 JP2015060288A JP2015060288A JP6578693B2 JP 6578693 B2 JP6578693 B2 JP 6578693B2 JP 2015060288 A JP2015060288 A JP 2015060288A JP 2015060288 A JP2015060288 A JP 2015060288A JP 6578693 B2 JP6578693 B2 JP 6578693B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- structured
- unit
- data
- location
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
- G06F16/986—Document structures and storage, e.g. HTML extensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9566—URL specific, e.g. using aliases, detecting broken or misspelled links
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
- G06F16/972—Access to data in other repository systems, e.g. legacy data or dynamic Web page generation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Description
<第二の実施形態>
次に、本発明を実施するための第二の形態について図面を参照して詳細に説明する。
<第三の実施形態>
次に、本発明を実施するための第三の形態について図面を参照して詳細に説明する。
<第四の実施形態>
次に、本発明を実施するための第四の形態について図面を参照して詳細に説明する。
<第五の実施形態>
次に、本発明を実施するための第五の形態について図面を参照して詳細に説明する。
<第六の実施形態>
次に、本発明を実施するための第六の形態について図面を参照して詳細に説明する。
11 URLリスト保持部
12 Webデータ取得部
13 構造化モデル保持部
14 構造化実行部
15 蓄積部
16 構造化情報蓄積部
17 教師データ作成部
18 構造化学習部
20 情報抽出装置
21 URLリスト保持部
22 Webデータ取得部
23 構造化モデル保持部
24 構造化実行部
25 蓄積部
26 構造化情報蓄積部
27 教師データ作成部
28 構造化学習部
29 蓄積データ閲覧部
30 情報抽出装置
31 URLリスト保持部
32 Webデータ取得部
33 構造化モデル保持部
34 構造化実行部
35 蓄積部
36 構造化情報蓄積部
37 教師データ作成部
38 構造化学習部
39 Web検索部
40 情報抽出装置
41 URLリスト保持部
42 Webデータ取得部
43 構造化モデル保持部
44 構造化実行部
45 蓄積部
46 構造化情報蓄積部
47 教師データ作成部
48 構造化学習部
49 有効性判断部
50 表示制御システム
51 構造化実行部
52 表示制御部
53 端末
60 情報抽出装置
61 記憶部
62 構造化実行部
Claims (10)
- 関係性を有する情報である構造化情報の種類と前記構造化情報のデータ内容およびデータの位置との関係を学習した結果である構造化モデル情報を記憶する記憶手段と、
前記構造化モデル情報に基づいて、抽出対象の文書データから前記構造化情報を抽出する構造化実行手段と、
前記抽出対象の文書データの存在場所を表す存在場所情報を記憶する存在場所保持手段と、
前記構造化実行手段による前記構造化情報の抽出結果に基づいて、前記存在場所情報を更新する存在場所更新手段と、
を包含する、情報抽出装置。 - 前記存在場所更新手段は、
前記抽出結果において新たな前記データ内容が含まれる場合、前記新たなデータ内容が含まれる前記文書データの存在場所をリストアップすることによって、前記存在場所情報を追加し、
前記存在場所情報が示す前記存在場所のうちの特定の存在場所から取得された前記抽出対象の文書データに関する前記抽出結果において、有効な前記構造化情報が得られない場合、前記特定の存在場所を表す前記存在場所情報を削除する、
請求項1に記載の情報抽出装置。 - 前記構造化情報をユーザに提示することにより、前記構造化情報を提示されたユーザによって前記構造化モデル情報を更新する指示を表す情報を入力された場合、前記指示を表す情報に基づいて、前記構造化モデル情報を更新する構造化モデル更新手段をさらに備える、
請求項1または2に記載の情報抽出装置。 - 前記構造化情報の種類と前記構造化情報のデータ内容およびデータの位置との関係が、前記文書データを記述する文字列に基づいている、請求項1乃至3のいずれか一項に記載の情報抽出装置。
- 前記文書データを記述する文字列がHTML(Hyper Text MarkupLanguage)を用いて記載されている、請求項4に記載の情報抽出装置。
- 前記構造化実行手段が、前記構造化情報を抽出した結果の確からしさを示す確度を出力
する、請求項1乃至5のいずれか1項に記載の情報抽出装置。 - 情報抽出装置によって、
関係性を有する情報である構造化情報の種類と前記構造化情報のデータ内容およびデータの位置との関係を学習した結果である構造化モデル情報を記憶手段に記憶し、
前記構造化モデル情報に基づいて、抽出対象の文書データから前記構造化情報を抽出し、
前記抽出対象の文書データの存在場所を表す存在場所情報を存在場所保持手段に記憶し、
前記抽出対象の文書データから前記構造化情報を抽出した結果に基づいて、前記存在場所情報を更新する、
情報抽出方法。 - 請求項1乃至6のいずれか一項に記載の情報抽出装置と、
前記抽出結果を、前記構造化情報を抽出した結果の確からしさに応じた順序で端末に表示させる表示制御手段と、を含む、表示制御システム。 - 請求項1乃至6のいずれか一項に記載の情報抽出装置と、
前記抽出結果を、前記文書データと関連付けて端末に表示させる表示制御手段と、を含む、表示制御システム。 - 前記表示制御手段からの表示制御に応じて情報を表示する端末をさらに含む、請求項8または9に記載の表示制御システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015060288A JP6578693B2 (ja) | 2015-03-24 | 2015-03-24 | 情報抽出装置、情報抽出方法、及び、表示制御システム |
US15/058,333 US20160283605A1 (en) | 2015-03-24 | 2016-03-02 | Information extraction device, information extraction method, and display control system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015060288A JP6578693B2 (ja) | 2015-03-24 | 2015-03-24 | 情報抽出装置、情報抽出方法、及び、表示制御システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016181069A JP2016181069A (ja) | 2016-10-13 |
JP6578693B2 true JP6578693B2 (ja) | 2019-09-25 |
Family
ID=56975112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015060288A Active JP6578693B2 (ja) | 2015-03-24 | 2015-03-24 | 情報抽出装置、情報抽出方法、及び、表示制御システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20160283605A1 (ja) |
JP (1) | JP6578693B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7068742B2 (ja) * | 2016-12-21 | 2022-05-17 | 株式会社オプティム | 資産管理システム、資産管理方法、およびプログラム |
JP2023096472A (ja) * | 2021-12-27 | 2023-07-07 | ストックマーク株式会社 | 情報処理システム、情報処理方法および情報処理プログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1478237A (zh) * | 2000-09-29 | 2004-02-25 | лԽ�� | 通过互联计算机网络的多语种电子数据源的在线智能信息比较代理器 |
US20030028498A1 (en) * | 2001-06-07 | 2003-02-06 | Barbara Hayes-Roth | Customizable expert agent |
US7536323B2 (en) * | 2003-03-26 | 2009-05-19 | Victor Hsieh | Online intelligent multilingual comparison-shop agents for wireless networks |
US8253731B2 (en) * | 2006-11-27 | 2012-08-28 | Designin Corporation | Systems, methods, and computer program products for home and landscape design |
WO2012147840A1 (ja) * | 2011-04-28 | 2012-11-01 | 有限会社アイ・アール・ディー | データベース構築装置、商標侵害検知装置、データベース構築方法、および商標侵害検知方法 |
JP5866728B2 (ja) * | 2011-10-14 | 2016-02-17 | サイバーアイ・エンタテインメント株式会社 | 画像認識システムを備えた知識情報処理サーバシステム |
JP6459968B2 (ja) * | 2013-09-20 | 2019-01-30 | 日本電気株式会社 | 商品推薦装置、商品推薦方法、及び、プログラム |
-
2015
- 2015-03-24 JP JP2015060288A patent/JP6578693B2/ja active Active
-
2016
- 2016-03-02 US US15/058,333 patent/US20160283605A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2016181069A (ja) | 2016-10-13 |
US20160283605A1 (en) | 2016-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11372935B2 (en) | Automatically generating a website specific to an industry | |
CN100462972C (zh) | 基于文档的信息和统一资源定位符管理方法和设备 | |
CN101918945B (zh) | 用于执行自动扩展的语言搜索的方法和系统 | |
CN101192231B (zh) | 基于上下文的书签 | |
JP4637969B1 (ja) | ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法 | |
US20070198727A1 (en) | Method, apparatus and system for extracting field-specific structured data from the web using sample | |
US20090240638A1 (en) | Syntactic and/or semantic analysis of uniform resource identifiers | |
US10621255B2 (en) | Identifying equivalent links on a page | |
US20100205199A1 (en) | Intent driven search result rich abstracts | |
CN113544689A (zh) | 为文档的来源观点生成并提供附加内容 | |
US8458187B2 (en) | Methods and systems for visualizing topic location in a document redundancy graph | |
US20140149259A1 (en) | Consumer centric online product research | |
Khatter et al. | Web scraping based product comparison model for E-commerce websites | |
JP6578693B2 (ja) | 情報抽出装置、情報抽出方法、及び、表示制御システム | |
JP2009277026A (ja) | フォーム入力支援システム、フォーム入力支援方法、及びフォーム入力支援用プログラム | |
CN103793453A (zh) | 用于web导航跟踪的方法和系统 | |
JP2006023968A (ja) | 固有表現抽出方法および装置並びにそれらに用いるプログラム | |
JP5659500B2 (ja) | Webサービス記憶プログラム、および、Webサービス記憶装置 | |
JP5380874B2 (ja) | 情報検索方法、プログラム及び装置 | |
JP2006155275A (ja) | 情報抽出方法及び情報抽出装置 | |
US9530094B2 (en) | Jabba-type contextual tagger | |
JP5187064B2 (ja) | Web資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法 | |
KR101421819B1 (ko) | 온라인 환경에서의 벌룬을 이용한 키워드 검색 결과 제공 방법 | |
JP5861545B2 (ja) | 情報処理装置、履歴制御方法および履歴制御プログラム | |
JP2011039743A (ja) | WWW情報閲覧システムと方法およびWebブラウザとプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190129 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190131 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190320 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190730 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190812 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6578693 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |