JP2006195535A - 情報抽出装置及び情報抽出方法並びに情報抽出プログラム - Google Patents
情報抽出装置及び情報抽出方法並びに情報抽出プログラム Download PDFInfo
- Publication number
- JP2006195535A JP2006195535A JP2005003866A JP2005003866A JP2006195535A JP 2006195535 A JP2006195535 A JP 2006195535A JP 2005003866 A JP2005003866 A JP 2005003866A JP 2005003866 A JP2005003866 A JP 2005003866A JP 2006195535 A JP2006195535 A JP 2006195535A
- Authority
- JP
- Japan
- Prior art keywords
- information
- search
- extracted
- text
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】テキスト情報を入力する情報入力部11と、企業、人、製品等の所定のオブジェクト間の関係情報を抽出する関係情報抽出部12と、抽出された関係情報に含まれる複数の構成要素を検索語として、インターネット検索を行うインターネット検索部13と、検索結果から抽出されたテキスト情報の中から、関係情報抽出部12が抽出した関係情報を特定する特定情報を抽出し、抽出した特定情報と関係情報に含まれる構成要素を検索語として、所定の既存データベース18を検索し、関係情報に対応する既存データベース内のオブジェクトを特定する関係情報特定部17と、DB18内のオブジェクトに対して関係情報を反映する関係情報追加部19とを備えている。
【選択図】 図1
Description
関根聡,「テキストからの情報抽出」,情報処理,情報処理学会,1999年4月,第40巻,第4号,p.370−373
2 インターネット
11 情報入力部
12 関係情報抽出部
13 インターネット検索部
14 テキスト情報取得部
15 識別用記述抽出部
16 各記述の重要度算出部
17 関係情報特定部
18 DB
19 関係情報追加部
20 検索用サーバ
Claims (8)
- テキスト情報を入力する情報入力手段と、
前記情報入力手段で入力されたテキスト情報を解析し、企業、人、製品等の所定のオブジェクト間の関係情報を抽出する関係情報抽出手段と、
前記関係情報抽出手段によって抽出された関係情報に含まれる複数の構成要素を検索語として用い、所定の通信網内の複数の情報に対して検索を行う検索手段と、
前記検索手段による検索結果から、テキスト情報を抽出するテキスト情報抽出手段と、
前記テキスト情報の中から前記関係情報を特定する特定情報を抽出し、抽出した特定情報と前記関係情報に含まれる構成要素を検索語として、所定の既存データベースを検索し、前記関係情報に対応する既存データベース内のオブジェクトを特定する特定手段と、
前記特定手段によって特定された前記既存データベース内のオブジェクトに対して関係情報を反映する関係情報反映手段と
を備えることを特徴とする情報抽出装置。 - 前記検索手段が、インターネット内の検索サーバにアクセスして、インターネット検索を行うものであることを特徴とする請求項1記載の情報抽出装置。
- 前記関係情報が、1個のオブジェクトを示す構成要素と、その相手方のオブジェクトを示す構成要素と、それらオブジェクト間の関係を示す構成要素とを含み、
前記検索手段が、1個のオブジェクトを示す構成要素と、相手方のオブジェクトを示す構成要素と、それらオブジェクト間の関係を示す構成要素とを検索語として、アンド検索を行うことを特徴とする請求項1又は2に記載の情報抽出装置。 - 前記特定手段が、前記テキスト情報抽出手段によって抽出されたテキスト情報のうち重要度の高いテキスト情報を選択的に用いて前記既存データベース内のオブジェクトを特定することを特徴とする請求項1〜3のいずれか1項に記載の情報抽出装置。
- 前記特定手段は、前記テキスト情報抽出手段により抽出されたテキスト情報の中から前記関係情報を特定する複数の種類の異なる特定情報を抽出し、検索語として用いることを特徴とする請求項1〜4のいずれか1項に記載の情報抽出装置。
- 前記検索手段が、複数のWebページを検索結果として出力するものであり、
前記テキスト情報抽出手段が、複数のWebページのうちの所定数のWebページを対象としてテキスト情報を抽出する
ことを特徴とする請求項1〜5のいずれか1項に記載の情報抽出装置。 - テキスト情報を入力する情報入力過程と、
前記情報入力過程で入力されたテキスト情報を解析し、企業、人、製品等の所定のオブジェクト間の関係情報を抽出する関係情報抽出過程と、
前記関係情報抽出過程で抽出された関係情報に含まれる複数の構成要素を検索語として用い、所定の通信網内の複数の情報に対して検索を行う検索過程と、
前記検索過程による検索結果からテキスト情報を抽出するテキスト情報抽出過程と、
前記テキスト情報抽出過程で抽出されたテキスト情報の中から前記関係情報を特定する特定情報を抽出し、抽出した特定情報と前記関係情報に含まれる構成要素を検索語として、所定の既存データベースを検索し、前記関係情報に対応する既存データベース内のオブジェクトを特定する特定過程と、
前記特定過程で特定された前記既存データベース内のオブジェクトに対して関係情報を反映する関係情報反映過程と
を含んでいることを特徴とする情報抽出方法。 - テキスト情報を入力する情報入力過程と、
前記情報入力過程で入力されたテキスト情報を解析し、企業、人、製品等の所定のオブジェクト間の関係情報を抽出する関係情報抽出過程と、
前記関係情報抽出過程で抽出された関係情報に含まれる複数の構成要素を検索語として用い、所定の通信網内の複数の情報に対して検索を行う検索過程と、
前記検索過程による検索結果からテキスト情報を抽出するテキスト情報抽出過程と、
前記テキスト情報抽出過程で抽出されたテキスト情報の中から前記関係情報を特定する特定情報を抽出し、抽出した特定情報と前記関係情報に含まれる構成要素を検索語として、所定の既存データベースを検索し、前記関係情報に対応する既存データベース内のオブジェクトを特定する特定過程と、
前記特定過程で特定された前記既存データベース内のオブジェクトに対して関係情報を反映する関係情報反映過程と
をコンピュータに実行させるため情報抽出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005003866A JP2006195535A (ja) | 2005-01-11 | 2005-01-11 | 情報抽出装置及び情報抽出方法並びに情報抽出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005003866A JP2006195535A (ja) | 2005-01-11 | 2005-01-11 | 情報抽出装置及び情報抽出方法並びに情報抽出プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006195535A true JP2006195535A (ja) | 2006-07-27 |
Family
ID=36801598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005003866A Pending JP2006195535A (ja) | 2005-01-11 | 2005-01-11 | 情報抽出装置及び情報抽出方法並びに情報抽出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006195535A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009217426A (ja) * | 2008-03-10 | 2009-09-24 | Fujitsu Ltd | 情報処理装置、リソース同定プログラム、リソース同定方法 |
JP2010117832A (ja) * | 2008-11-12 | 2010-05-27 | Nippon Telegr & Teleph Corp <Ntt> | 関係情報抽出装置、その方法、プログラム及び記録媒体 |
JP2017129962A (ja) * | 2016-01-19 | 2017-07-27 | 株式会社インターワークス | 情報提供装置、方法、及びコンピュータプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000029943A (ja) * | 1998-07-10 | 2000-01-28 | Fujitsu Ltd | 顧客勧誘支援方法 |
JP2000288478A (ja) * | 1999-04-06 | 2000-10-17 | Toshiba Corp | 宛先特定装置 |
JP2002288166A (ja) * | 2001-03-26 | 2002-10-04 | Ricoh Co Ltd | 関係情報抽出方法及び意味情報抽出方法 |
-
2005
- 2005-01-11 JP JP2005003866A patent/JP2006195535A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000029943A (ja) * | 1998-07-10 | 2000-01-28 | Fujitsu Ltd | 顧客勧誘支援方法 |
JP2000288478A (ja) * | 1999-04-06 | 2000-10-17 | Toshiba Corp | 宛先特定装置 |
JP2002288166A (ja) * | 2001-03-26 | 2002-10-04 | Ricoh Co Ltd | 関係情報抽出方法及び意味情報抽出方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009217426A (ja) * | 2008-03-10 | 2009-09-24 | Fujitsu Ltd | 情報処理装置、リソース同定プログラム、リソース同定方法 |
US8392524B2 (en) | 2008-03-10 | 2013-03-05 | Fujitsu Limited | Information processing apparatus, resource identifying program, and resource identifying method |
JP2010117832A (ja) * | 2008-11-12 | 2010-05-27 | Nippon Telegr & Teleph Corp <Ntt> | 関係情報抽出装置、その方法、プログラム及び記録媒体 |
JP2017129962A (ja) * | 2016-01-19 | 2017-07-27 | 株式会社インターワークス | 情報提供装置、方法、及びコンピュータプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8166013B2 (en) | Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis | |
US7783658B1 (en) | Multi-entity ontology weighting systems and methods | |
KR100754768B1 (ko) | 사용자별 맞춤 추천어를 제공하는 시스템, 방법 및 상기방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독가능한 기록 매체 | |
CN103678576B (zh) | 基于动态语义分析的全文检索系统 | |
US9208245B2 (en) | System and method for compending blogs | |
US20070027672A1 (en) | Computer method and apparatus for extracting data from web pages | |
US8515986B2 (en) | Query pattern generation for answers coverage expansion | |
Van Hooland et al. | Evaluating the success of vocabulary reconciliation for cultural heritage collections | |
US20090037396A1 (en) | Search apparatus and search method | |
Muller | Comparing tagging vocabularies among four enterprise tag-based services | |
JP5221664B2 (ja) | 情報マップ管理システムおよび情報マップ管理方法 | |
Naudé | Electronic journal of information systems in developing countries (2000–2013): A bibliometric study | |
TWI575391B (zh) | 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體 | |
JP2006195535A (ja) | 情報抽出装置及び情報抽出方法並びに情報抽出プログラム | |
JP2014081916A (ja) | 検索キーに名称を用いる検索システムおよび検索方法 | |
JP2006023968A (ja) | 固有表現抽出方法および装置並びにそれらに用いるプログラム | |
Hagood | A brief introduction to data mining projects in the humanities | |
JP4057962B2 (ja) | 質問応答装置、質問応答方法及びプログラム | |
KR101589626B1 (ko) | 어휘의미패턴 분석방법에 기반하여 빅데이터로부터 점포창업용 데이터 또는 운영지원용 데이터를 생성하는 방법 | |
Castellano et al. | A web text mining flexible architecture | |
KR100862565B1 (ko) | 사용자 맞춤형 특허정보 데이터베이스 구축시스템 | |
JP2004030428A (ja) | 情報サービス検索支援装置、情報サービス検索装置、情報サービス検索方法及び情報サービス検索プログラム | |
Frączkowski et al. | Stakeholder impact on the success and risk of failure of ICT projects in Poland | |
KR20180006518A (ko) | 기술소개서 자동 작성 서비스 시스템 | |
US20120131000A1 (en) | Method and apparatus for identifying talent by matching with the given technical needs and building talent profile from multiple data sources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080104 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100813 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100824 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101022 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110222 |