JP4791169B2 - 関連語抽出装置、関連語抽出方法 - Google Patents
関連語抽出装置、関連語抽出方法 Download PDFInfo
- Publication number
- JP4791169B2 JP4791169B2 JP2005358328A JP2005358328A JP4791169B2 JP 4791169 B2 JP4791169 B2 JP 4791169B2 JP 2005358328 A JP2005358328 A JP 2005358328A JP 2005358328 A JP2005358328 A JP 2005358328A JP 4791169 B2 JP4791169 B2 JP 4791169B2
- Authority
- JP
- Japan
- Prior art keywords
- domain
- web document
- data
- vocabulary data
- vocabulary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims description 62
- 238000000034 method Methods 0.000 claims description 11
- 238000013075 data extraction Methods 0.000 claims 4
- 239000000284 extract Substances 0.000 description 17
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 102100035971 Molybdopterin molybdenumtransferase Human genes 0.000 description 4
- 101710119577 Molybdopterin molybdenumtransferase Proteins 0.000 description 4
- 238000010411 cooking Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000004590 computer program Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
通信回線を介して接続された記憶装置に記憶されたWebドキュメントを受信する受信部(例えば、後述の通信部510)と、
前記受信部が受信したWebドキュメントを記憶するWebドキュメント記憶部(例えば、後述のWebドキュメント記憶部530)と、
抽出する広告語彙データに関連する第1広告語彙データの入力を受け付ける入力部(例えば、後述の入力部550)と、
前記入力部を介して入力された第1広告語彙データが含まれているWebドキュメントを、前記Webドキュメント記憶部から抽出するWebドキュメント抽出部(例えば、後述の抽出部525)と、
前記Webドキュメント抽出部により抽出されたWebドキュメント中に共通して含まれる第2広告語彙データを抽出する抽出部(例えば、後述の抽出部525)と、
前記抽出部により抽出された前記第2広告語彙データを、前記第1広告語彙データと関連づけたドメインを生成するドメイン生成部(例えば、ドメイン生成部527)と、
前記ドメイン生成部により生成された前記ドメインを記憶するドメイン記憶部(例えば、ドメイン記憶部540)と、
を備える関連語抽出装置。
よって、ユーザが入力した第1広告語彙データが含まれるWebドキュメントから、第2広告語彙データを抽出して、第1広告語彙データと第2広告語彙データとを関連づけたデータであるドメインを生成することが可能である。
したがって、関連語抽出装置によれば、入力された任意の第1広告語彙データに基づいて、通信回線を介して接続された記憶装置に記憶された広告、宣伝に関する情報(Webドキュメント)の関連語を第2広告語彙データとして抽出し、第1広告語彙データと第2広告語彙データとを関連づけたデータを生成することが可能である。
よって、第1広告語彙データから第2広告語彙データを抽出し、これにより生成されたドメインと新しく生成されたドメインとを関連づけることで、ドメイン間での関連性を示すデータを生成することが可能である。
よって、Webドキュメントに含まれる語彙のうち、頻出度に基づいて第2広告語彙データを抽出するため、関連語の関連度として適切な第2広告語彙データを抽出することが可能である。
通信回線を介して接続された記憶装置に記憶されたWebドキュメントを受信するステップと、
前記受信するステップにて受信したWebドキュメントを記憶するステップと、
抽出する広告語彙データに関連する第1広告語彙データの入力を受け付ける入力ステップと、
前記入力ステップにて入力された第1広告語彙データが含まれているWebドキュメントを、抽出する抽出ステップと、
前記Webドキュメント抽出部により抽出されたWebドキュメント中に共通して含まれる第2広告語彙データを抽出する第2広告語彙データ抽出ステップと、
前記第2広告語彙データ抽出ステップにより抽出された前記第2広告語彙データを、前記第1広告語彙データと関連づけたドメインを生成するドメイン生成ステップと、
前記ドメイン生成ステップにより生成された前記ドメインを記憶するドメイン記憶ステップと、
を備える関連語抽出方法。
図1は、本発明の好適な実施形態である関連語抽出システム1の構成図である。関連語抽出システム1は、関連語抽出装置500と、Webサーバ100a〜cとから構成される。関連語抽出装置500と、Webサーバ100a〜cとは、通信回線ネットワーク30を介して通信可能に接続される。
30 通信回線ネットワーク
100 制御部
100a、100b、100c Webサーバ
200 ユーザ端末
210 通信部
220 制御部
250 入力部
260 出力部
305 入力窓
311 リンクデータ
321 リンクデータ
410 ドメイン
420 ドメイン
500 関連語抽出装置
510 通信部
520 制御部
525 抽出部
527 ドメイン生成部
530 ドキュメント記憶部
540 ドメイン記憶部
550 入力部
560 出力部
600 ドキュメント
605 ドキュメント
620 制御部
Claims (5)
- 複数の語彙データから互いに関連した語彙データを関連づける関連語抽出装置であって、
通信回線を介して接続された記憶装置に記憶されたWebドキュメントを受信する受信部と、
前記受信部が受信したWebドキュメントを特徴付けるキーワードを含んだ当該Webドキュメントの一部を記憶するWebドキュメント記憶部と、
特定の業種・業界においてよく使われる語彙データの解析の基になる第1語彙データの入力を受け付ける入力部と、
前記Webドキュメント記憶部が記憶した前記Webドキュメントの一部のうち、前記入力部を介して入力された前記第1語彙データが含まれているものを抽出するWebドキュメント抽出部と、
前記Webドキュメント抽出部により抽出された前記Webドキュメントの一部の中に共通して含まれる第2語彙データを抽出する第2語彙データ抽出部と、
前記第2語彙データ抽出部により抽出された前記第2語彙データに、前記第1語彙データを関連づけたデータである、ドメインを生成するドメイン生成部と、
前記ドメイン生成部により生成された前記ドメインを記憶するドメイン記憶部と、
を備える関連語抽出装置。 - 前記ドメイン生成部は、前記第2語彙データ抽出部が抽出した複数の前記第2語彙データについて、前記第2語彙データを共通して含む前記Webドキュメントの一部の組み合わせが異なるものを、それぞれ異なるグループとして前記第1語彙データと関連付けたドメインを生成する請求項1に記載の関連語抽出装置。
- 前記ドメイン生成部は、前記ドメイン記憶部に既に記憶されている前記ドメインに含まれる第2語彙データと同一の語彙データを第1語彙データとして含む新たなドメインがドメイン記憶部に記憶された場合に、これらのドメインをさらに関連づける、請求項1または請求項2に記載の関連語抽出装置。
- 関連語抽出装置が、複数の語彙データから互いに関連した語彙データを関連づける関連語抽出方法であって、
通信回線を介して接続された記憶装置に記憶されたWebドキュメントを受信するステップと、
前記受信するステップにおいて受信したWebドキュメントを特徴付けるキーワードを含んだ当該Webドキュメントの一部を記憶するWebドキュメント記憶ステップと、
特定の業種・業界においてよく使われる語彙データの解析の基になる第1語彙データの入力を受け付ける入力ステップと、
前記Webドキュメント記憶ステップにおいて記憶した前記Webドキュメントの一部のうち、前記入力ステップにおいて入力された前記第1語彙データが含まれているものを抽出するWebドキュメント抽出ステップと、
前記Webドキュメント抽出ステップにおいて抽出された前記Webドキュメントの一部の中に共通して含まれる第2語彙データを抽出する第2語彙データ抽出ステップと、
前記第2語彙データ抽出ステップにおいて抽出された前記第2語彙データに、前記第1語彙データを関連づけたデータである、ドメインを生成するドメイン生成ステップと、
前記ドメイン生成ステップにおいて生成された前記ドメインを記憶するドメイン記憶ステップと、
を備える関連語抽出方法。 - 関連語抽出装置に、複数の語彙データから互いに関連した語彙データを関連づける関連語抽出方法を実行させるプログラムであって、前記関連語抽出装置に、
通信回線を介して接続された記憶装置に記憶されたWebドキュメントを受信するステップと、
前記受信するステップにおいて受信したWebドキュメントを特徴付けるキーワードを含んだ当該Webドキュメントの一部を記憶するWebドキュメント記憶ステップと、
特定の業種・業界においてよく使われる語彙データの解析の基になる第1語彙データの入力を受け付ける入力ステップと、
前記Webドキュメント記憶ステップにおいて記憶した前記Webドキュメントの一部のうち、前記入力ステップにおいて入力された前記第1語彙データが含まれているものを抽出するWebドキュメント抽出ステップと、
前記Webドキュメント抽出ステップにおいて抽出された前記Webドキュメントの一部の中に共通して含まれる第2語彙データを抽出する第2語彙データ抽出ステップと、
前記第2語彙データ抽出ステップにおいて抽出された前記第2語彙データに、前記第1語彙データを関連づけたデータである、ドメインを生成するドメイン生成ステップと、
前記ドメイン生成ステップにおいて生成された前記ドメインを記憶するドメイン記憶ステップと、
を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005358328A JP4791169B2 (ja) | 2005-12-12 | 2005-12-12 | 関連語抽出装置、関連語抽出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005358328A JP4791169B2 (ja) | 2005-12-12 | 2005-12-12 | 関連語抽出装置、関連語抽出方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2007164378A JP2007164378A (ja) | 2007-06-28 |
JP2007164378A5 JP2007164378A5 (ja) | 2008-07-17 |
JP4791169B2 true JP4791169B2 (ja) | 2011-10-12 |
Family
ID=38247213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005358328A Active JP4791169B2 (ja) | 2005-12-12 | 2005-12-12 | 関連語抽出装置、関連語抽出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4791169B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107357851A (zh) * | 2017-06-28 | 2017-11-17 | 国信优易数据有限公司 | 一种信息处理方法和系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004062446A (ja) * | 2002-07-26 | 2004-02-26 | Ibm Japan Ltd | 情報収集システム、アプリケーションサーバ、情報収集方法、およびプログラム |
JP2004234078A (ja) * | 2003-01-28 | 2004-08-19 | Oki Electric Ind Co Ltd | 情報検索装置 |
JP2004280488A (ja) * | 2003-03-17 | 2004-10-07 | Hitachi Ltd | 文書管理方法及び文書管理装置 |
-
2005
- 2005-12-12 JP JP2005358328A patent/JP4791169B2/ja active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107357851A (zh) * | 2017-06-28 | 2017-11-17 | 国信优易数据有限公司 | 一种信息处理方法和系统 |
CN107357851B (zh) * | 2017-06-28 | 2020-01-31 | 国信优易数据有限公司 | 一种信息处理方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
JP2007164378A (ja) | 2007-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20040049374A1 (en) | Translation aid for multilingual Web sites | |
JP3820242B2 (ja) | 質問応答型文書検索システム及び質問応答型文書検索プログラム | |
US8099406B2 (en) | Method for human editing of information in search results | |
US9720904B2 (en) | Generating training data for disambiguation | |
Jones et al. | Improving web search on small screen devices | |
US20140032522A1 (en) | Systems and methods for contextual searching of semantic entities | |
US20080033938A1 (en) | Keyword outputting apparatus, keyword outputting method, and keyword outputting computer program product | |
US7958449B2 (en) | Method and apparatus for displaying and processing input fields from a document | |
US20030025731A1 (en) | Method and system for automated research using electronic book highlights and notations | |
JP5229226B2 (ja) | 情報共有システム、情報共有方法、および情報共有プログラム | |
JP2010510601A (ja) | 商品情報を推薦する方法およびその方法を実行するシステム | |
JP5399450B2 (ja) | 医療用語の曖昧性を判定するシステム、方法およびソフトウェア | |
US8572118B2 (en) | Computer method and apparatus of information management and navigation | |
US11416907B2 (en) | Unbiased search and user feedback analytics | |
JP4081065B2 (ja) | Faqデータ作成装置、方法、及びプログラム | |
US10242033B2 (en) | Extrapolative search techniques | |
JP2015525929A (ja) | 検索品質を改善するための重みベースのステミング | |
US20170228378A1 (en) | Extracting topics from customer review search queries | |
CN114357335A (zh) | 信息获取方法、介质、装置和计算设备 | |
JP2009223372A (ja) | リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法 | |
US7207003B1 (en) | Method and apparatus in a data processing system for word based render browser for skimming or speed reading web pages | |
JP4791169B2 (ja) | 関連語抽出装置、関連語抽出方法 | |
Shamim et al. | Critical product features’ identification using an opinion analyzer | |
WO2014069582A1 (ja) | 関連情報提示装置及び関連情報提示方法 | |
JP2009163388A (ja) | 広告データを表示する方法及び、広告データを表示するシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080602 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080602 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100914 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110705 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110721 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140729 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4791169 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |