JP2007188330A - 構造化文書抽出装置、構造化文書抽出方法および構造化文書抽出プログラム - Google Patents
構造化文書抽出装置、構造化文書抽出方法および構造化文書抽出プログラム Download PDFInfo
- Publication number
- JP2007188330A JP2007188330A JP2006006443A JP2006006443A JP2007188330A JP 2007188330 A JP2007188330 A JP 2007188330A JP 2006006443 A JP2006006443 A JP 2006006443A JP 2006006443 A JP2006006443 A JP 2006006443A JP 2007188330 A JP2007188330 A JP 2007188330A
- Authority
- JP
- Japan
- Prior art keywords
- document
- author
- metadata
- structured
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99936—Pattern matching access
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】ネットワークを介してアクセス可能な構造化文書に本文として含まれる本文情報を特定する本文情報特定手段110と、構造化文書に付与されたデータであって、当該構造化文書の本文情報に関するデータおよび当該構造化文書と他の構造化文書との間のリンク関係を示すデータを含むメタデータを抽出するメタデータ抽出手段106と、
ネットワークを介してアクセス可能な、複数の構造化文書から検索対象となる複数の対象文書を特定する対象文書特定手段104と、本文情報とメタデータとに基づいて、複数の前記対象文書それぞれの重要度を算出する重要度算出手段120とを備えた。
【選択図】 図2
Description
51 CPU
52 ROM
53 RAM
57 通信I/F
62 バス
100 検索条件取得部
102 構造化文書抽出部
104 対象文書抽出部
106 メタデータ抽出部
108 メタデータ解析部
110 本文情報抽出部
112 本文情報解析部
120 重要度算出部
122 抽出結果作成部
130 オントロジーDB
132 履歴DB
Claims (22)
- ネットワークを介してアクセス可能な構造化文書に本文として含まれる本文情報を特定する本文情報特定手段と、
前記構造化文書に付与されたデータであって、当該構造化文書の前記本文情報に関するデータおよび当該構造化文書と他の構造化文書との間のリンク関係を示すデータを含むメタデータを抽出するメタデータ抽出手段と、
前記ネットワークを介してアクセス可能な、複数の前記構造化文書から検索対象となる複数の対象文書を特定する対象文書特定手段と、
前記本文情報特定手段が特定した前記本文情報と、前記メタデータ抽出手段が抽出した前記メタデータとに基づいて、前記対象文書特定手段により特定された複数の前記対象文書それぞれの重要度を算出する重要度算出手段と
を備えたことを特徴とする構造化文書抽出装置。 - 前記メタデータは、前記リンク関係を示すデータとして、トラックバックを含むことを特徴とする請求項1に記載の構造化文書抽出装置。
- 前記メタデータは、前記本文情報に関する情報として、サイトまたは記事の内容を説明する付加情報を含むことを特徴とする請求項1に記載の構造化文書抽出装置。
- 前記対象文書に付与された前記メタデータから、前記対象文書に関連付けられている関連文書に付与されたメタデータに当該関連文書の著者情報が含まれるか否かを特定するメタデータ解析手段をさらに備え、
前記文書重要度算出手段は、前記関連文書の前記メタデータに前記著者情報が含まれている前記対象文書に対し、前記著者情報が含まれていない前記対象文書に比べて高い重要度を算出することを特徴とする請求項1に記載の構造化文書抽出装置。 - 前記対象文書に付与された前記メタデータから、当該対象文書の作成日を特定し、さらに前記対象文書に関連付けられている関連文書に付与された前記メタデータから、当該関連文書の作成日を特定するメタデータ解析手段をさらに備え、
前記文書重要度算出手段は、前記対象文書の作成日と前記関連文書の作成日の間の長さに基づいて、前記対象文書の重要度を算出することを特徴とする請求項1に記載の構造化文書抽出装置。 - 前記メタデータ解析手段は、前記対象文書の前記メタデータにおいて前記対象文書に複数の前記関連文書が関連付けられている場合に、複数の前記関連文書それぞれの作成日を特定し、
前記文書重要度算出手段は、前記対象文書の作成日から所定期間内の作成日に作成された前記関連文書の数が予め定められた規定数以上である前記対象文書に対し、前記規定数未満である前記対象文書に比べて高い重要度を算出することを特徴とする請求項5に記載の構造化文書抽出装置。 - 前記対象文書に付与された前記メタデータに基づいて、当該対象文書の前記本文情報に対する意見であって、著者の異なる意見の数をカウントするメタデータ解析手段をさらに備え、
前記文書重要度算出手段は、前記本文情報に含まれる異なる著者による意見の数に基づいて、前記対象文書の重要度を算出することを特徴とする請求項1に記載の構造化文書抽出装置。 - 前記メタデータから、前記対象文書の作成日を特定し、さらに前記対象文書の前記本文情報に対する意見の記入日を特定するメタデータ解析手段をさらに備え、
前記文書重要度算出手段は、前記メタデータ解析手段により特定された記入日に基づいて、前記対象文書の重要度を算出することを特徴とする請求項1に記載の構造化文書抽出装置。 - 前記メタデータ解析手段は、さらに前記対象文書に対する意見の数を、当該意見のうち最も古い意見の記入日から最も新しい意見の記入日までの期間で割った値を算出し、
前記文書重要度算出手段は、前記文書解析手段により得られた値が大きいほど、前記対象文書に対し、高い重要度を算出することを特徴とする請求項8に記載の構造化文書抽出装置。 - 前記文書重要度算出手段は、前記メタデータに他の構造化文書とのリンク関係を示す情報が含まれていない前記対象文書に対し、前記メタデータに他の構造化文書とのリンク関係を示す情報が含まれている前記対象文書に比べて低い重要度を算出することを特徴とする請求項1に記載の構造化文書抽出装置。
- 前記文書重要度算出手段は、第1対象文書の前記メタデータにおいて第2対象文書を含む複数の構造化文書が前記第1対象文書に関連付けられており、前記第2対象文書の前記メタデータにおいて複数の構造化文書が前記第2対象文書に関連付けられており、かつ前記第2対象文書に関連付けられている前記構造化文書の数が前記第1対象文書に関連付けられている前記構造化文書の数に比べて多い場合には、前記第2対象文書に対し前記第1対象文書に比べて高い重要度を算出することを特徴とする請求項1に記載の構造化文書抽出装置。
- 前記構造化文書に付与された前記メタデータから、当該構造化文書の著者を示す著者情報を特定するメタデータ解析手段をさらに備え、
前記文書重要度算出手段は、第1の著者の第1対象文書の前記メタデータにおいて前記第1対象文書が第2著者の複数の第2対象文書に関連付けられており、かつ前記第2構造化文書の前記メタデータにおいて前記第2対象文書が複数の前記第1対象文書に関連付けられている場合に、前記第1の著者および前記第2の著者の著者情報を保持する著者情報保持手段と
をさらに備え、
前記文書重要度算出手段は、前記著者情報保持手段によって保持される前記著者情報に示される著者の前記対象文書に対し、前記著者情報に示される著者以外の著者の前記対象文書に比べて高い重要度を算出することを特徴とする請求項1に記載の構造化文書抽出装置。 - 前記メタデータに基づいて、前記メタデータにおいて関連付けられている関連文書の数が予め設定された規定値以上となる構造化文書であって、著者が同一の構造化文書の数を特定するメタデータ解析手段と、
前記メタデータ解析手段により特定された前記構造化文書の数が予め定めた規定数以上である場合に、当該構造化文書の前記著者情報を保持する著者情報保持手段と
をさらに備え、
前記文書重要度算出手段は、前記著者情報保持手段によって保持される前記著者情報に示される著者の前記対象文書に対し、前記著者情報に示される著者以外の著者の前記対象文書に比べて高い重要度を算出することを特徴とする請求項1に記載の構造化文書抽出装置。 - 互いに関連する複数の内容を各属性に対応付けて保持する関連内容保持手段と、
前記本文情報に記載された内容を特定する本文情報解析手段と、
前記メタデータに基づいて、著者が同一の構造化文書を検索するメタデータ解析手段と、
前記構造化文書の前記本文情報に記載された内容が前記関連内容保持手段において同一の属性に対応付けられている構造化文書であって、かつ著者が同一の構造化文書の数が予め定められた規定数以上である場合に、当該構造化文書の前記著者情報を前記属性に対応付けて保持する著者情報保持手段と
をさらに備え、
前記文書重要度算出手段は、前記著者情報保持手段おいて検索対象の属性に対応付けられている前記著者情報に示される著者の前記対象文書に対し、前記著者情報に示される著者以外の著者の前記対象文書に比べて高い重要度を算出することを特徴とする請求項1に記載の構造化文書抽出装置。 - 前記構造化文書に付与された前記メタデータに基づいて、前記メタデータに他の構造化文書とのリンク関係を示すデータが含まれず、かつ著者が同一の構造化文書を特定するメタデータ解析手段と、
前記メタデータ解析手段により特定された前記構造化文書の数が予め定めた規定数以上である場合に、当該構造化文書の著者情報を保持する著者情報保持手段と
をさらに備え、
前記文書重要度算出手段は、前記著者情報保持手段によって保持される前記著者情報に示される著者の前記対象文書に対し、前記著者情報に示される著者以外の著者の前記対象文書に比べて低い重要度を算出することを特徴とする請求項1に記載の構造化文書抽出装置。 - 前記対象文書に関連付けられている関連文書の前記本文情報に当該対象文書を支持する記載が含まれるか否かを特定する本文情報解析手段をさらに備え、
前記文書重要度算出手段は、前記対象文書を支持する記載を含む前記関連文書に対応する前記対象文書に対し、支持する記載を含まない前記関連文書に対応する前記対象文書に比べて高い重要度を算出することを特徴とする請求項1に記載の構造化文書抽出装置。 - 前記本文情報解析手段は、前記メタデータにおいて前記対象文書に複数の前記関連文書が関連付けられている場合に、複数の前記関連文書それぞれの前記本文情報に当該対象文書を支持する記載が含まれるか否かを特定し、
前記文書重要度算出手段は、前記対象文書を支持する記載が含まれる前記関連文書の数が予め定められた規定数以上である前記対象文書に対し、規定数未満である前記対象文書に比べて高い重要度を算出することを特徴とする請求項16に記載の構造化文書抽出装置。 - 前記メタデータから、前記構造化文書の前記本文情報に対する複数の意見を特定し、特定した意見の中から同一の内容の意見と、前記同一の内容と逆の内容の意見とを特定するメタデータ解析手段と、
前記対象文書の前記本文情報に対する複数の意見のうち所定の割合以上が所定の内容を含む場合に、当該所定の内容と逆の意見に対し、前記所定の内容に比べて高い重要度を算出する意見重要度算出手段と
をさらに備えたことを特徴とする請求項1に記載の構造化文書抽出装置。 - 前記メタデータから、前記構造化文書の著者を示す著者情報を特定するメタデータ解析手段と、
第1の著者の第1対象文書の前記メタデータおいて前記第1対象文書が第2著者の複数の第2対象文書に関連付けられており、かつ前記第2構造化文書の前記メタデータにおいて前記第2の対象文書が複数の前記第1対象文書に関連付けられている場合に、前記第1の著者および前記第2の著者の前記著者情報を保持する著者情報保持手段と、
前記メタデータから、前記対象文書の前記本文情報に対する複数の意見を特定し、特定した各意見の著者を特定するメタデータ解析手段と
をさらに備え、
前記意見重要度算出手段は、前記対象文書の前記本文情報に含まれる複数の意見のうち前記著者情報保持手段により保持される前記著者情報に対応する著者の意見に対し、前記著者情報に対応する著者以外の著者の意見に比べて高い重要度を算出することを特徴とする請求項1に記載の構造化文書抽出装置。 - 前記メタデータから、前記構造化文書の著者を示す著者情報を特定するメタデータ解析手段と、
前記メタデータに他の構造化文書とのリンク関係を示すデータが含まれず、かつ前記著者情報が同一の構造化文書の数が予め定めた規定数以上である場合に、当該著者情報を保持する著者情報保持手段と
をさらに備え、
前記メタデータ解析手段は、さらに前記対象文書の前記メタデータから前記本文情報に対する複数の意見それぞれを記入した著者を示す著者情報を特定し、
前記意見重要度算出手段は、前記本文情報に対する複数の意見のうち前記著者情報保持手段により保持されている前記著者情報に示される著者の意見に対し、前記著者情報に示される著者以外の著者の意見に比べて低い重要度を算出することを特徴とする請求項1に記載の構造化文書抽出装置。 - ネットワークを介してアクセス可能な構造化文書に本文として含まれる本文情報を特定する本文情報特定ステップと、
前記構造化文書に付与されたデータであって、当該構造化文書の前記本文情報に関するデータおよび当該構造化文書と他の構造化文書との間のリンク関係を示すデータを含むメタデータを抽出するメタデータ抽出ステップと、
前記ネットワークを介してアクセス可能な、複数の前記構造化文書から検索対象となる複数の対象文書を特定する対象文書特定ステップと、
前記本文情報特定ステップにおいて特定した前記本文情報と、前記メタデータ抽出ステップにおいて抽出した前記メタデータとに基づいて、前記対象文書特定ステップにおいて特定された複数の前記対象文書それぞれの重要度を算出する重要度算出ステップと
を有することを特徴とする構造化文書抽出方法。 - 構造化文書抽出処理をコンピュータに実行させる構造化文書抽出プログラムであって、
ネットワークを介してアクセス可能な構造化文書に本文として含まれる本文情報を特定する本文情報特定ステップと、
前記構造化文書に付与されたデータであって、当該構造化文書の前記本文情報に関するデータおよび当該構造化文書と他の構造化文書との間のリンク関係を示すデータを含むメタデータを抽出するメタデータ抽出ステップと、
前記ネットワークを介してアクセス可能な、複数の前記構造化文書から検索対象となる複数の対象文書を特定する対象文書特定ステップと、
前記本文情報特定ステップにおいて特定した前記本文情報と、前記メタデータ抽出ステップにおいて抽出した前記メタデータとに基づいて、前記対象文書特定ステップにおいて特定された複数の前記対象文書それぞれの重要度を算出する重要度算出ステップと
を有することを特徴とする構造化文書抽出プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006006443A JP4542993B2 (ja) | 2006-01-13 | 2006-01-13 | 構造化文書抽出装置、構造化文書抽出方法および構造化文書抽出プログラム |
US11/622,216 US8037403B2 (en) | 2006-01-13 | 2007-01-11 | Apparatus, method, and computer program product for extracting structured document |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006006443A JP4542993B2 (ja) | 2006-01-13 | 2006-01-13 | 構造化文書抽出装置、構造化文書抽出方法および構造化文書抽出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007188330A true JP2007188330A (ja) | 2007-07-26 |
JP4542993B2 JP4542993B2 (ja) | 2010-09-15 |
Family
ID=38323312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006006443A Active JP4542993B2 (ja) | 2006-01-13 | 2006-01-13 | 構造化文書抽出装置、構造化文書抽出方法および構造化文書抽出プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8037403B2 (ja) |
JP (1) | JP4542993B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9141729B2 (en) | 2008-02-21 | 2015-09-22 | Kabushiki Kaisha Toshiba | Display-data generating apparatus and display-data generating method |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008084193A (ja) * | 2006-09-28 | 2008-04-10 | Toshiba Corp | インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム |
JP2009080624A (ja) * | 2007-09-26 | 2009-04-16 | Toshiba Corp | 情報表示装置、方法及びプログラム |
US8510312B1 (en) * | 2007-09-28 | 2013-08-13 | Google Inc. | Automatic metadata identification |
US20100293182A1 (en) * | 2009-05-18 | 2010-11-18 | Nokia Corporation | Method and apparatus for viewing documents in a database |
US20110302103A1 (en) * | 2010-06-08 | 2011-12-08 | International Business Machines Corporation | Popularity prediction of user-generated content |
JP5610524B2 (ja) * | 2010-09-22 | 2014-10-22 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 文書の優先度を決定する方法、プログラム及び装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08288960A (ja) * | 1995-04-14 | 1996-11-01 | Toshiba Corp | ネットワーク情報処理装置 |
WO2003046764A1 (fr) * | 2001-11-26 | 2003-06-05 | Fujitsu Limited | Procede et appareil d'analyse d'informations |
JP2005309964A (ja) * | 2004-04-23 | 2005-11-04 | Sony Corp | 情報処理装置及び情報処理装置に用いるプログラム |
JP2005352861A (ja) * | 2004-06-11 | 2005-12-22 | Nippon Telegr & Teleph Corp <Ntt> | 電子データ処理方法、電子データ処理装置、および、電子データ処理プログラム |
JP2008508575A (ja) * | 2004-06-30 | 2008-03-21 | テクノラティ,インコーポレーテッド | エコシステムを使用した集約および検索の方法、並びに、それらの関連技術 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5907836A (en) * | 1995-07-31 | 1999-05-25 | Kabushiki Kaisha Toshiba | Information filtering apparatus for selecting predetermined article from plural articles to present selected article to user, and method therefore |
US6314420B1 (en) * | 1996-04-04 | 2001-11-06 | Lycos, Inc. | Collaborative/adaptive search engine |
JP3849318B2 (ja) * | 1998-09-10 | 2006-11-22 | 富士ゼロックス株式会社 | 情報検索装置、情報検索方法及び情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP4489994B2 (ja) * | 2001-05-11 | 2010-06-23 | 富士通株式会社 | 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体 |
JP4283466B2 (ja) * | 2001-10-12 | 2009-06-24 | 富士通株式会社 | リンク関係に基づく文書整理方法 |
JP3773447B2 (ja) * | 2001-12-21 | 2006-05-10 | 株式会社日立製作所 | サブスタンス間の二項関係表示方法 |
US7836010B2 (en) * | 2003-07-30 | 2010-11-16 | Northwestern University | Method and system for assessing relevant properties of work contexts for use by information services |
US20050138067A1 (en) | 2003-12-19 | 2005-06-23 | Fuji Xerox Co., Ltd. | Indexing for contexual revisitation and digest generation |
US7293019B2 (en) * | 2004-03-02 | 2007-11-06 | Microsoft Corporation | Principles and methods for personalizing newsfeeds via an analysis of information novelty and dynamics |
US8200700B2 (en) * | 2005-02-01 | 2012-06-12 | Newsilike Media Group, Inc | Systems and methods for use of structured and unstructured distributed data |
US7529735B2 (en) * | 2005-02-11 | 2009-05-05 | Microsoft Corporation | Method and system for mining information based on relationships |
JP4721740B2 (ja) * | 2005-03-23 | 2011-07-13 | 富士通株式会社 | 記事又は話題を管理するためのプログラム |
-
2006
- 2006-01-13 JP JP2006006443A patent/JP4542993B2/ja active Active
-
2007
- 2007-01-11 US US11/622,216 patent/US8037403B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08288960A (ja) * | 1995-04-14 | 1996-11-01 | Toshiba Corp | ネットワーク情報処理装置 |
WO2003046764A1 (fr) * | 2001-11-26 | 2003-06-05 | Fujitsu Limited | Procede et appareil d'analyse d'informations |
JP2005309964A (ja) * | 2004-04-23 | 2005-11-04 | Sony Corp | 情報処理装置及び情報処理装置に用いるプログラム |
JP2005352861A (ja) * | 2004-06-11 | 2005-12-22 | Nippon Telegr & Teleph Corp <Ntt> | 電子データ処理方法、電子データ処理装置、および、電子データ処理プログラム |
JP2008508575A (ja) * | 2004-06-30 | 2008-03-21 | テクノラティ,インコーポレーテッド | エコシステムを使用した集約および検索の方法、並びに、それらの関連技術 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9141729B2 (en) | 2008-02-21 | 2015-09-22 | Kabushiki Kaisha Toshiba | Display-data generating apparatus and display-data generating method |
Also Published As
Publication number | Publication date |
---|---|
US20070179937A1 (en) | 2007-08-02 |
JP4542993B2 (ja) | 2010-09-15 |
US8037403B2 (en) | 2011-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Resnik et al. | The web as a parallel corpus | |
US11275774B2 (en) | Systems and methods for generating and using aggregated search indices and non-aggregated value storage | |
EP2478431B1 (en) | Automatically finding contextually related items of a task | |
US9817908B2 (en) | Systems and methods for news event organization | |
Trampuš et al. | Internals of an aggregated web news feed | |
US10585927B1 (en) | Determining a set of steps responsive to a how-to query | |
US20140114942A1 (en) | Dynamic Pruning of a Search Index Based on Search Results | |
Macdonald et al. | Blog track research at TREC | |
WO2009096523A1 (ja) | 情報分析装置、検索システム、情報分析方法及び情報分析用プログラム | |
JP6394388B2 (ja) | 同義関係判定装置、同義関係判定方法、及びそのプログラム | |
JP4542993B2 (ja) | 構造化文書抽出装置、構造化文書抽出方法および構造化文書抽出プログラム | |
Chang et al. | Improving recency ranking using twitter data | |
JP2008210024A (ja) | 文書集合分析装置,文書集合分析方法,その方法を実装したプログラム及びそのプログラムを格納した記録媒体 | |
Kumar | Apache Solr search patterns | |
JP2007140603A (ja) | アーリーアダプタ抽出方法及び装置及びプログラム及び話題語予測方法及び装置及びプログラム | |
Aliakbary et al. | Web page classification using social tags | |
Zou et al. | Assessing software quality through web comment search and analysis | |
Fletcher | Implementing a BNC-compare-able web corpus | |
Duan et al. | Research on Enterprise Track of TREC 2007 at SJTU APEX Lab. | |
US20080033953A1 (en) | Method to search transactional web pages | |
JP2011086152A (ja) | 時間表現抽出装置、時間表現抽出方法および時間表現抽出プログラム | |
JP2018206189A (ja) | 情報収集装置、および、情報収集方法 | |
JP2011150538A (ja) | 重要キーワード抽出装置及び方法及びプログラム | |
Mohamad et al. | Automatic event detection on Reuters news | |
Lee et al. | Learning to predict the need of summarization on news articles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090925 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091006 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091207 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100416 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20100517 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100601 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100628 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4542993 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130702 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |