JP2006106872A - 知識情報収集システム、知識検索システム及び知識情報収集方法 - Google Patents
知識情報収集システム、知識検索システム及び知識情報収集方法 Download PDFInfo
- Publication number
- JP2006106872A JP2006106872A JP2004289070A JP2004289070A JP2006106872A JP 2006106872 A JP2006106872 A JP 2006106872A JP 2004289070 A JP2004289070 A JP 2004289070A JP 2004289070 A JP2004289070 A JP 2004289070A JP 2006106872 A JP2006106872 A JP 2006106872A
- Authority
- JP
- Japan
- Prior art keywords
- knowledge
- information
- natural language
- expression
- table information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】表情報解析モジュール112aは、収集制御モジュール111によって収集された知識情報に表情報が含まれている場合、当該表情報を解析する。自然言語付加モジュール112bは、表情報解析モジュール112aの表情報解析結果を自然言語に変換する。テキスト抽出モジュール114は、自然言語付加モジュール112bによって変換された自然言語を、対応する表情報を含む知識情報から抽出されたテキストデータに付して、知識DB121への知識情報登録を行う登録モジュール13へ送出する。
【選択図】 図1
Description
図1は本発明の一実施形態に係るナレッジマネジメントシステムの構成を示すブロック図である。このナレッジマネジメントシステムは、知識情報の収集、分析及び検索等のサービスを提供する。ナレッジマネジメントシステムは、Web情報収集システム11、知識検索システム12、登録モジュール13及び設定ファイル14を含む。Web情報収集システム11、登録モジュール13及び設定ファイル14は、ナレッジマネジメントシステムが提供するサービスの1つである知識情報の収集を行うための知識情報収集システムを構築する。
まず表情報自然言語変換機構112の表情報解析モジュール112aは、収集制御モジュール111によって収集された知識情報、例えばHTML文書情報を解析して、当該文書情報に表情報に含まれているかを判定する(ステップS1)。本実施形態では、表を示すタグ(例えばHTMLの<TABLE>)があるか否かにより、表情報であるか否かが判定される。
表情報解析モジュール112aはステップS5において、対象となる項目が存在する第i行(ここではi=2)の第1列のセルから単語を取り出す。表情報解析モジュール112aは、取り出された単語をキーに解析用辞書112cを参照することにより、当該単語が「要素種別の表現」であるかを判別し、「要素種別の表現」であれば、当該単語を「要素種別の表現」として取り出す。図2の表の例では、i=2の場合、「車両価格」が「要素種別の表現」として取り出される。
まず、解析用辞書112cに含まれる「要素種別の表現」に合致するものが表内に見つからないケース1の動作について、図5のフローチャートを参照して説明する。
次に、解析用辞書112cに含まれる「要素値の表現」に合致するものが表内に見つからないケース2の動作について、図6のフローチャートを参照して説明する。
次に、解析用辞書112cに含まれる「要素種別の表現」及び「要素値の表現」が共に表内に見つからないケース3の動作について、図7のフローチャートを参照して説明する。
Claims (4)
- 知識条件設定手段により設定された知識情報収集条件をもとに、知識データベースに登録すべき知識情報を外部データソースから収集する知識情報収集システムにおいて、
収集された知識情報に表情報が含まれている場合、当該表情報を解析する表情報解析手段と、
前記表情報解析手段の表情報解析結果を自然言語に変換する自然言語変換手段と、
収集された知識情報からテキストデータを抽出するテキスト抽出手段であって、前記自然言語変換手段によって変換された自然言語を、対応する表情報を含む知識情報から抽出されたテキストデータに付して、前記知識データベースへの知識情報登録を行う登録手段へ送出するテキスト抽出手段と
を具備することを特徴とする知識情報収集システム。 - 表を構成する、少なくとも、要素値、当該要素値に対応する項目の種類を表す要素種別、及び表名に相当する対象の各カテゴリ毎に、そのカテゴリに適用し得る表現を保持する解析辞書を更に具備し、
前記表情報解析手段は、表情報から、前記解析辞書に保持されている表現に合致する、対象の表現、要素種別の表現及び要素値の表現を抽出し、
前記自然言語変換手段は前記表情報解析手段によって抽出された対象の表現、要素種別の表現及び要素値の表現を含む自然言語を作成する
ことを特徴とする請求項1記載の知識情報収集システム。 - 請求項1記載の知識情報収集システムによって収集された知識情報が登録される知識データベースと、
ユーザにより指定された自然言語検索条件に従って自然言語検索処理を行って前記知識データベースから当該検索条件に合致した検索結果を取得する検索手段であって、検索結果に表情報を含む知識情報がある場合、当該知識情報に付されている前記表情報から変換された自然言語を、当該知識情報の要約としてユーザに提示する検索手段と
を具備することを特徴とする知識検索システム。 - 知識条件設定手段により設定された知識情報収集条件をもとに、知識データベースに登録すべき知識情報を外部データソースから収集する知識情報収集方法において、
収集された知識情報に表情報が含まれているかを判定するステップと、
収集された知識情報に表情報が含まれている場合、当該表情報を解析するステップと、
前記表情報の解析結果を自然言語に変換するステップと、
前記変換された自然言語を、対応する表情報を含む知識情報から抽出されたテキストデータに付して、前記知識データベースに登録させるステップと
を具備することを特徴とする知識情報収集方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004289070A JP4119413B2 (ja) | 2004-09-30 | 2004-09-30 | 知識情報収集システム、知識検索システム及び知識情報収集方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004289070A JP4119413B2 (ja) | 2004-09-30 | 2004-09-30 | 知識情報収集システム、知識検索システム及び知識情報収集方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006106872A true JP2006106872A (ja) | 2006-04-20 |
JP4119413B2 JP4119413B2 (ja) | 2008-07-16 |
Family
ID=36376578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004289070A Expired - Fee Related JP4119413B2 (ja) | 2004-09-30 | 2004-09-30 | 知識情報収集システム、知識検索システム及び知識情報収集方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4119413B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008305105A (ja) * | 2007-06-06 | 2008-12-18 | Toshiba Corp | 文書データ処理装置 |
CN101542743B (zh) * | 2007-07-27 | 2012-09-05 | 松下电器产业株式会社 | 半导体装置的制造方法 |
CN111078216A (zh) * | 2019-11-08 | 2020-04-28 | 泰康保险集团股份有限公司 | 信息展示方法、装置、电子设备及计算机可读介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000099515A (ja) * | 1998-09-21 | 2000-04-07 | Nippon Telegr & Teleph Corp <Ntt> | 意味属性辞書作成方法及び装置並びに意味属性辞書作成プログラムを記録した記録媒体 |
JP2002099294A (ja) * | 2000-06-29 | 2002-04-05 | Fujitsu Ltd | 情報処理装置 |
JP2002140620A (ja) * | 2000-11-06 | 2002-05-17 | Matsushita Electric Ind Co Ltd | 比較情報提供システム |
JP2003150624A (ja) * | 2001-11-12 | 2003-05-23 | Mitsubishi Electric Corp | 情報抽出装置および情報抽出方法 |
JP2004102369A (ja) * | 2002-09-05 | 2004-04-02 | Sangaku Renkei Kiko Kyushu:Kk | 同系統情報を取得する情報検索方法、同系統情報を取得する広域ネットワーク上の情報検索方法、情報検索装置、検索エンジンサーバ装置、同系統検索エンジンサーバ装置、検索用インデックス作成装置、及び情報検索システム |
-
2004
- 2004-09-30 JP JP2004289070A patent/JP4119413B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000099515A (ja) * | 1998-09-21 | 2000-04-07 | Nippon Telegr & Teleph Corp <Ntt> | 意味属性辞書作成方法及び装置並びに意味属性辞書作成プログラムを記録した記録媒体 |
JP2002099294A (ja) * | 2000-06-29 | 2002-04-05 | Fujitsu Ltd | 情報処理装置 |
JP2002140620A (ja) * | 2000-11-06 | 2002-05-17 | Matsushita Electric Ind Co Ltd | 比較情報提供システム |
JP2003150624A (ja) * | 2001-11-12 | 2003-05-23 | Mitsubishi Electric Corp | 情報抽出装置および情報抽出方法 |
JP2004102369A (ja) * | 2002-09-05 | 2004-04-02 | Sangaku Renkei Kiko Kyushu:Kk | 同系統情報を取得する情報検索方法、同系統情報を取得する広域ネットワーク上の情報検索方法、情報検索装置、検索エンジンサーバ装置、同系統検索エンジンサーバ装置、検索用インデックス作成装置、及び情報検索システム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008305105A (ja) * | 2007-06-06 | 2008-12-18 | Toshiba Corp | 文書データ処理装置 |
CN101542743B (zh) * | 2007-07-27 | 2012-09-05 | 松下电器产业株式会社 | 半导体装置的制造方法 |
CN111078216A (zh) * | 2019-11-08 | 2020-04-28 | 泰康保险集团股份有限公司 | 信息展示方法、装置、电子设备及计算机可读介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4119413B2 (ja) | 2008-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9208185B2 (en) | Indexing and search query processing | |
US8504553B2 (en) | Unstructured and semistructured document processing and searching | |
US20080306941A1 (en) | System for automatically extracting by-line information | |
Han et al. | Wrapping web data into XML | |
US20150067476A1 (en) | Title and body extraction from web page | |
US20080115057A1 (en) | High precision data extraction | |
CN108090104B (zh) | 用于获取网页信息的方法和装置 | |
JP2007122513A (ja) | コンテンツ検索方法、及び、コンテンツ検索サーバ | |
JP2011108085A (ja) | 知識構築装置およびプログラム | |
JP2003173280A (ja) | データベース生成装置、データベース生成方法及びデータベース生成プログラム | |
JP2005346495A (ja) | 情報処理システム、情報処理方法、および情報処理プログラム | |
JP6653169B2 (ja) | キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム | |
JP2008269069A (ja) | 情報処理システム及び情報処理方法 | |
JP2007108889A (ja) | 知的財産管理システム、知的財産管理方法およびプログラム | |
Rasmussen et al. | The data documentation initiative: a preservation standard for research | |
JP4119413B2 (ja) | 知識情報収集システム、知識検索システム及び知識情報収集方法 | |
JP5423470B2 (ja) | 名寄せチェック支援装置、名寄せチェック支援プログラム及び名寄せチェック支援方法 | |
JP4505389B2 (ja) | 広告コンテンツ送信システム、広告コンテンツ送信方法 | |
US20120150899A1 (en) | System and method for selectively generating tabular data from semi-structured content | |
JP2006023968A (ja) | 固有表現抽出方法および装置並びにそれらに用いるプログラム | |
JP5008152B2 (ja) | 調達情報検索システム | |
JP2010003159A (ja) | Web利用者支援システム、Web利用者支援方法、およびWeb利用者支援プログラム | |
US20030237042A1 (en) | Document processing device and document processing method | |
JP5769648B2 (ja) | 関連語取得装置及び関連語取得方法 | |
JP2007199987A (ja) | 特許情報検索システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070731 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080129 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080321 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080422 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080424 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4119413 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110502 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110502 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120502 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120502 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130502 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130502 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140502 Year of fee payment: 6 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |