JP5421737B2 - コンピュータ実施方法 - Google Patents
コンピュータ実施方法 Download PDFInfo
- Publication number
- JP5421737B2 JP5421737B2 JP2009260896A JP2009260896A JP5421737B2 JP 5421737 B2 JP5421737 B2 JP 5421737B2 JP 2009260896 A JP2009260896 A JP 2009260896A JP 2009260896 A JP2009260896 A JP 2009260896A JP 5421737 B2 JP5421737 B2 JP 5421737B2
- Authority
- JP
- Japan
- Prior art keywords
- topic
- articles
- grained
- characteristic
- article
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
42: インデックスエントリi P1, P2, P3
43: 種語選択
44: 種語
45: 細粒度トピックモデル生成
46: 候補細粒度トピックモデル
47: 細粒度トピックモデル評価
48: エバーグリーンインデックス
49: トピックk
50: 細粒度トピックモデルk
Claims (4)
- 電気的に記憶されたソーシャルインデックスの相互構築においてトピックを狭めることを提供するコンピュータにより実施されるシステムであって、
各々オンラインのテキストの資料及びトピックの階層構造ツリーを備えるアーティクルのコーパスを備える記憶装置と、
ソーシャルインデックスシステムと、
を備え、
前記ソーシャルインデックスシステムは、
(1)オントピックポジティブ訓練例としての前記コーパスにおける前記アーティクルのセットを、トピックの各々のために、指定し、前記オントピックポジティブ訓練例と一致する有限状態パターンを備える細粒度トピックモデルを見つけると共に、前記有限状態パターンは、対応するトピックのための前記オントピックポジティブ訓練例のサブセットと一致するアーティクルを識別する、有限状態モデラーと、
(2)トピックの中心に対応する各トピックのための粗粒度トピックモデルを生成する特徴的単語モデラーであって、
前記コーパス内のアーティクルのセットを任意に選択し、任意に選択されたアーティクルの各々内で特徴的単語のセットを識別し、任意に選択されたアーティクルのセット内で識別された前記特徴的単語の各々の出現頻度を決定する任意にサンプリングするモジュールと、
前記オントピックポジティブ訓練例内の各アーティクル内の前記特徴的単語のセットを識別し、前記オントピックポジティブ訓練例における前記アーティクル内に識別された前記特徴的単語の各々の出現頻度を決定する選択的にサンプリングするモジュールと、
前記オントピックポジティブ訓練例及び任意に選択されたアーティクルのセット内の各アーティクル内での前記特徴的単語の出現頻度の比として、各特徴的単語に点を割り当てるスコアリングモジュールと、
を備えた前記特徴的単語モデラーと、
(3)前記コーパス内に受け取られた受信された新しいアーティクルをフィルタリングするフィルタモジュールであって、
複数の有限状態パターンを各新しいアーティクルにマッチングするマッチングモジュールと、
各新しいアーティクル内の特徴的単語のセットを識別し、前記各新しいアーティクル内において識別された特徴的単語の各々の出現頻度を決定する特徴的単語評価器と、
前記新しいアーティクル及び任意に選択されたアーティクルのセット内における前記特徴的単語の各出現頻度の比として、類似点を各特徴的単語に割り当てる類似点スコアリングモジュールと、
を備えた前記フィルタモジュールと、
(4)前記トピックの各々のための新しいアーティクルを配列する表示モジュールであって、
前記新しいアーティクルを前記トピックのための細粒度トピックモデルの有限状態パターンにマッチングする新しいアーティクルのマッチングモジュールと、
前記トピックのための細粒度トピックモデルと一致する各新しいアーティクルのために、前記新しいアーティクル内において識別された前記特徴的単語の各々のための類似点を前記トピックのための前記粗粒度トピックモデルにおける対応する特徴的単語の得点と比較する新しいアーティクルの比較モジュールと、
前記トピックの細粒度トピックモデルに一致するとともにネガティブ訓練例のための候補のアーティクルとして前記トピックの粗粒度のトピックモデルの特徴的単語の得点に近い類似点を有する前記新しいアーティクルの各々を表示するディスプレイと、
を備えた前記表示モジュールと、
を含む、前記システム。 - 前記オントピックポジティブ訓練例としての前記コーパスにおける前記アーティクルのセットを指定することに代えて、トピックモデルとして前記有限状態パターンに一致する前記コーパス内の前記アーティクルのセットは、任意に選択され、
前記トピックモデル内の各アーティクルにおける特徴的単語のための用語ベクトルは、前記トピックモデル内での出現頻度を備えて、形成され、
前記用語ベクトルは、平均化される
請求項1記載の前記システム。 - 電気的に記憶されたソーシャルインデックスの相互構築においてトピックを広げることを提供するコンピュータにより実施されるシステムであって、
各々オンラインのテキストの資料及びトピックの階層構造ツリーを備えるアーティクルのコーパスを備える記憶装置と、
ソーシャルインデックスシステムと、
を備え、
前記ソーシャルインデックスシステムは、
(1)オントピックポジティブ訓練例としての前記コーパスにおける前記アーティクルのセットを、トピックの各々のために、指定し、前記オントピックポジティブ訓練例と一致する有限状態パターンを備える細粒度トピックモデルを見つけると共に、前記有限状態パターンは、対応するトピックのための前記オントピックポジティブ訓練例のサブセットと一致するアーティクルを識別する、有限状態モデラーと、
(2)トピックの中心に対応する各トピックのための粗粒度トピックモデルを生成する特徴的単語モデラーであって、
前記コーパス内のアーティクルのセットを任意に選択し、任意に選択されたアーティクルの各々内で特徴的単語のセットを識別し、任意に選択されたアーティクルのセット内で識別された前記特徴的単語の各々の出現頻度を決定する任意にサンプリングするモジュールと、
前記オントピックポジティブ訓練例内の各アーティクル内の前記特徴的単語のセットを識別し、前記オントピックポジティブ訓練例における前記アーティクル内に識別された前記特徴的単語の各々の出現頻度を決定する選択的にサンプリングするモジュールと、
前記オントピックポジティブ訓練例及び任意に選択されたアーティクルのセット内の各アーティクル内での前記特徴的単語の出現頻度の比として、各特徴的単語に点を割り当てるスコアリングモジュールと、
を備えた前記特徴的単語モデラーと、
(3)前記コーパス内に受け取られた受信された新しいアーティクルをフィルタリングするフィルタモジュールであって、
複数の有限状態パターンを各新しいアーティクルにマッチングするマッチングモジュールと、
各新しいアーティクル内の特徴的単語のセットを識別し、前記各新しいアーティクル内において識別された特徴的単語の各々の出現頻度を決定する特徴的単語評価器と、
前記新しいアーティクル及び任意に選択されたアーティクルのセット内における前記特徴的単語の各出現頻度の比として、類似点を各特徴的単語に割り当てる類似点スコアリングモジュールと、
を備えた前記フィルタモジュールと、
(4)前記トピックの各々のための新しいアーティクルを配列する表示モジュールであって、
前記新しいアーティクルを前記トピックのための細粒度トピックモデルの有限状態パターンにマッチングする新しいアーティクルのマッチングモジュールと、
前記トピックのための細粒度トピックモデルと一致する各新しいアーティクルのために、前記新しいアーティクル内において識別された前記特徴的単語の各々のための類似点を前記トピックのための前記粗粒度トピックモデルにおける対応する特徴的単語の得点と比較する新しいアーティクルの比較モジュールと、
前記トピックの細粒度トピックモデルに一致するとともにネガティブ訓練例のための候補のアーティクルとして前記トピックの粗粒度のトピックモデルの特徴的単語の得点に近い類似点を有する前記新しいアーティクルの各々を表示するディスプレイと、
を備えた前記表示モジュールと、
を含む、前記システム。 - 電気的に記憶されたソーシャルインデックスの相互構築の際のノイズに対するロバスト性を提供するコンピュータにより実施されるシステムであって、
各々オンラインのテキストの資料及びトピックの階層構造ツリーを備えるアーティクルのコーパスを備える記憶装置と、
ソーシャルインデックスシステムと、
を備え、
前記ソーシャルインデックスシステムは、
(1)オントピックポジティブ訓練例としての前記コーパスにおける前記アーティクルのセットを、トピックの各々のために、指定し、前記オントピックポジティブ訓練例と一致する有限状態パターンを備える細粒度トピックモデルを見つけると共に、前記有限状態パターンは、対応するトピックのための前記オントピックポジティブ訓練例のサブセットと一致するアーティクルを識別する、有限状態モデラーと、
(2)トピックの中心に対応する各トピックのための粗粒度トピックモデルを生成する特徴的単語モデラーであって、
前記コーパス内のアーティクルのセットを任意に選択し、任意に選択されたアーティクルの各々内で特徴的単語のセットを識別し、任意に選択されたアーティクルのセット内で識別された前記特徴的単語の各々の出現頻度を決定する任意にサンプリングするモジュールと、
前記オントピックポジティブ訓練例内の各アーティクル内の前記特徴的単語のセットを識別し、前記オントピックポジティブ訓練例における前記アーティクル内に識別された前記特徴的単語の各々の出現頻度を決定する選択的にサンプリングするモジュールと、
前記オントピックポジティブ訓練例及び任意に選択されたアーティクルのセット内の各アーティクル内での前記特徴的単語の出現頻度の比として、各特徴的単語に点を割り当てるスコアリングモジュールと、
を備えた前記特徴的単語モデラーと、
(3)前記コーパス内に受け取られた受信された新しいアーティクルをフィルタリングするフィルタモジュールであって、
複数の有限状態パターンを各新しいアーティクルにマッチングするマッチングモジュールと、
各新しいアーティクル内の特徴的単語のセットを識別し、前記各新しいアーティクル内において識別された特徴的単語の各々の出現頻度を決定する特徴的単語評価器と、
前記新しいアーティクル及び任意に選択されたアーティクルのセット内における前記特徴的単語の各出現頻度の比として、類似点を各特徴的単語に割り当てる類似点スコアリングモジュールと、
を備えた前記フィルタモジュールと、
(4)前記トピックの各々のための新しいアーティクルを配列する表示モジュールであって、
前記新しいアーティクルを前記トピックのための細粒度トピックモデルの有限状態パターンにマッチングする新しいアーティクルのマッチングモジュールと、
前記トピックのための細粒度トピックモデルと一致する各新しいアーティクルのために、前記新しいアーティクル内において識別された前記特徴的単語の各々のための類似点を前記トピックのための前記粗粒度トピックモデルにおける対応する特徴的単語の得点と比較する新しいアーティクルの比較モジュールと、
前記トピックの細粒度トピックモデルに一致するとともにネガティブ訓練例のための候補のアーティクルとして前記トピックの粗粒度のトピックモデルの特徴的単語の得点に近い類似点を有する前記新しいアーティクルの各々を表示するディスプレイと、
を備えた前記表示モジュールと、
を含む、前記システム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11502408P | 2008-11-14 | 2008-11-14 | |
US61/115,024 | 2008-11-14 | ||
US12/608,929 | 2009-10-29 | ||
US12/608,929 US8549016B2 (en) | 2008-11-14 | 2009-10-29 | System and method for providing robust topic identification in social indexes |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2010118064A JP2010118064A (ja) | 2010-05-27 |
JP2010118064A5 JP2010118064A5 (ja) | 2010-08-26 |
JP5421737B2 true JP5421737B2 (ja) | 2014-02-19 |
Family
ID=41818847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009260896A Expired - Fee Related JP5421737B2 (ja) | 2008-11-14 | 2009-11-16 | コンピュータ実施方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8549016B2 (ja) |
EP (1) | EP2192500B1 (ja) |
JP (1) | JP5421737B2 (ja) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2538438A1 (en) | 2006-03-01 | 2007-09-01 | Legalview Assets, Limited | Systems and methods for media programming |
US8010545B2 (en) * | 2008-08-28 | 2011-08-30 | Palo Alto Research Center Incorporated | System and method for providing a topic-directed search |
US8549016B2 (en) * | 2008-11-14 | 2013-10-01 | Palo Alto Research Center Incorporated | System and method for providing robust topic identification in social indexes |
US8239397B2 (en) * | 2009-01-27 | 2012-08-07 | Palo Alto Research Center Incorporated | System and method for managing user attention by detecting hot and cold topics in social indexes |
US8452781B2 (en) * | 2009-01-27 | 2013-05-28 | Palo Alto Research Center Incorporated | System and method for using banded topic relevance and time for article prioritization |
US8356044B2 (en) * | 2009-01-27 | 2013-01-15 | Palo Alto Research Center Incorporated | System and method for providing default hierarchical training for social indexing |
US9047283B1 (en) * | 2010-01-29 | 2015-06-02 | Guangsheng Zhang | Automated topic discovery in documents and content categorization |
US9031944B2 (en) * | 2010-04-30 | 2015-05-12 | Palo Alto Research Center Incorporated | System and method for providing multi-core and multi-level topical organization in social indexes |
JP5542732B2 (ja) * | 2010-10-29 | 2014-07-09 | 日本電信電話株式会社 | データ抽出装置、データ抽出方法、及びそのプログラム |
US8775955B2 (en) * | 2010-12-02 | 2014-07-08 | Sap Ag | Attraction-based data visualization |
US9805022B2 (en) * | 2010-12-09 | 2017-10-31 | Apple Inc. | Generation of topic-based language models for an app search engine |
US10055766B1 (en) * | 2011-02-14 | 2018-08-21 | PayAsOne Intellectual Property Utilization LLC | Viral marketing object oriented system and method |
US20140089239A1 (en) * | 2011-05-10 | 2014-03-27 | Nokia Corporation | Methods, Apparatuses and Computer Program Products for Providing Topic Model with Wording Preferences |
US20120317104A1 (en) * | 2011-06-13 | 2012-12-13 | Microsoft Corporation | Using Aggregate Location Metadata to Provide a Personalized Service |
US20130159254A1 (en) * | 2011-12-14 | 2013-06-20 | Yahoo! Inc. | System and methods for providing content via the internet |
JP5775466B2 (ja) * | 2012-01-13 | 2015-09-09 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 会話から雑談部分を抽出するための雑談抽出システム、方法、およびプログラム |
US8826125B2 (en) * | 2012-03-12 | 2014-09-02 | Hyperion Media LLC | System and method for providing news articles |
US10108526B2 (en) * | 2012-11-27 | 2018-10-23 | Purdue Research Foundation | Bug localization using version history |
CN103246728A (zh) * | 2013-05-10 | 2013-08-14 | 北京大学 | 一种基于文档词汇特征变化的突发事件检测方法 |
US10002187B2 (en) | 2013-11-26 | 2018-06-19 | Oracle International Corporation | Method and system for performing topic creation for social data |
US9996529B2 (en) | 2013-11-26 | 2018-06-12 | Oracle International Corporation | Method and system for generating dynamic themes for social data |
JP6257076B2 (ja) * | 2013-12-27 | 2018-01-10 | エヌ・ティ・ティ・コムウェア株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
CN103886044A (zh) * | 2014-03-11 | 2014-06-25 | 百度在线网络技术(北京)有限公司 | 搜索结果的提供方法和装置 |
US9720977B2 (en) * | 2014-06-10 | 2017-08-01 | International Business Machines Corporation | Weighting search criteria based on similarities to an ingested corpus in a question and answer (QA) system |
US11263401B2 (en) | 2014-07-31 | 2022-03-01 | Oracle International Corporation | Method and system for securely storing private data in a semantic analysis system |
US11989662B2 (en) * | 2014-10-10 | 2024-05-21 | San Diego State University Research Foundation | Methods and systems for base map and inference mapping |
US20160117386A1 (en) | 2014-10-22 | 2016-04-28 | International Business Machines Corporation | Discovering terms using statistical corpus analysis |
US10884891B2 (en) | 2014-12-11 | 2021-01-05 | Micro Focus Llc | Interactive detection of system anomalies |
US20160239494A1 (en) * | 2015-02-12 | 2016-08-18 | Acquire Media Ventures Inc. | Determining and maintaining a list of news stories from news feeds most relevant to a topic |
IN2015CH01424A (ja) | 2015-03-20 | 2015-04-10 | Wipro Ltd | |
WO2017027003A1 (en) | 2015-08-10 | 2017-02-16 | Hewlett Packard Enterprise Development Lp | Evaluating system behaviour |
US20170140117A1 (en) * | 2015-11-18 | 2017-05-18 | Ucb Biopharma Sprl | Method and system for generating and displaying topics in raw uncategorized data and for categorizing such data |
US9992209B1 (en) * | 2016-04-22 | 2018-06-05 | Awake Security, Inc. | System and method for characterizing security entities in a computing environment |
CN108228648B (zh) | 2016-12-21 | 2022-03-15 | 伊姆西Ip控股有限责任公司 | 创建索引的方法和设备 |
CN106919649B (zh) * | 2017-01-19 | 2020-06-26 | 北京奇艺世纪科技有限公司 | 一种词条权重计算的方法及装置 |
US10419269B2 (en) | 2017-02-21 | 2019-09-17 | Entit Software Llc | Anomaly detection |
CN107169632A (zh) * | 2017-04-19 | 2017-09-15 | 广东数相智能科技有限公司 | 全球媒体形象分析方法、装置和系统 |
CN107247728B (zh) * | 2017-05-02 | 2021-04-27 | 北京星选科技有限公司 | 文本处理方法、装置及计算机存储介质 |
US20200104429A1 (en) * | 2018-09-28 | 2020-04-02 | Salesforce.Com, Inc. | Automated search result sorting |
US10331713B1 (en) | 2018-10-03 | 2019-06-25 | Gurbaksh Singh Chahal | User activity analysis using word clouds |
US11151167B2 (en) | 2019-05-10 | 2021-10-19 | Georgetown University | Cache optimization via topics in web search engines |
US10503792B1 (en) | 2019-05-10 | 2019-12-10 | Georgetown University | Cache optimization via topics in web search engines |
JP6802334B1 (ja) * | 2019-08-01 | 2020-12-16 | 株式会社大和総研 | マッチングシステムおよびプログラム |
CN111506785B (zh) * | 2020-03-06 | 2023-07-07 | 之江实验室 | 基于社交文本的网络舆情话题识别方法和系统 |
JP7364512B2 (ja) * | 2020-03-25 | 2023-10-18 | 株式会社日立製作所 | ラベル付与モデル生成装置、及びラベル付与モデル生成方法 |
JP7192039B1 (ja) | 2021-06-14 | 2022-12-19 | 株式会社大和総研 | マッチングシステムおよびプログラム |
Family Cites Families (95)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3803363A (en) * | 1972-01-17 | 1974-04-09 | F Lee | Apparatus for the modification of the time duration of waveforms |
US4109938A (en) * | 1975-09-25 | 1978-08-29 | Mitchell Beazley Encyclopedias, Ltd. | System for arranging and retrieving information |
US4369886A (en) * | 1979-10-09 | 1983-01-25 | Ag-Electron, Inc. | Reflectance ratio sorting apparatus |
US4404676A (en) * | 1981-03-30 | 1983-09-13 | Pioneer Electric Corporation | Partitioning method and apparatus using data-dependent boundary-marking code words |
US5369763A (en) | 1989-02-01 | 1994-11-29 | Kansas State University Research Foundation | Data storage and retrieval system with improved data base structure |
US6978277B2 (en) * | 1989-10-26 | 2005-12-20 | Encyclopaedia Britannica, Inc. | Multimedia search system |
US5241671C1 (en) * | 1989-10-26 | 2002-07-02 | Encyclopaedia Britannica Educa | Multimedia search system using a plurality of entry path means which indicate interrelatedness of information |
FR2666946B1 (fr) * | 1990-09-17 | 1992-12-04 | Inst Francais Du Petrole | Methode et dispositif pour synchroniser sur un evenement exterieur, l'echantillonnage de signaux de mesure par un ensemble de numerisation du type a sur-echantillonnage. |
US5257939A (en) | 1992-10-13 | 1993-11-02 | Robinson Don T | Cultural knowledge board game |
US5724567A (en) | 1994-04-25 | 1998-03-03 | Apple Computer, Inc. | System for directing relevance-ranked data objects to computer users |
JP2809341B2 (ja) | 1994-11-18 | 1998-10-08 | 松下電器産業株式会社 | 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。 |
US5671342A (en) | 1994-11-30 | 1997-09-23 | Intel Corporation | Method and apparatus for displaying information relating to a story and a story indicator in a computer system |
US5530852A (en) | 1994-12-20 | 1996-06-25 | Sun Microsystems, Inc. | Method for extracting profiles and topics from a first file written in a first markup language and generating files in different markup languages containing the profiles and topics for use in accessing data described by the profiles and topics |
US6263290B1 (en) * | 1995-02-22 | 2001-07-17 | Michael K. Williams | Process and machine for signal waveform analysis |
US5680511A (en) | 1995-06-07 | 1997-10-21 | Dragon Systems, Inc. | Systems and methods for word recognition |
US5907836A (en) | 1995-07-31 | 1999-05-25 | Kabushiki Kaisha Toshiba | Information filtering apparatus for selecting predetermined article from plural articles to present selected article to user, and method therefore |
US6044083A (en) * | 1995-10-20 | 2000-03-28 | Zenith Electronics Corporation | Synchronous code division multiple access communication system |
US6021403A (en) * | 1996-07-19 | 2000-02-01 | Microsoft Corporation | Intelligent user assistance facility |
US5907677A (en) | 1996-08-23 | 1999-05-25 | Ecall Inc. | Method for establishing anonymous communication links |
EP0848347A1 (en) | 1996-12-11 | 1998-06-17 | Sony Corporation | Method of extracting features characterising objects |
US6285987B1 (en) | 1997-01-22 | 2001-09-04 | Engage, Inc. | Internet advertising system |
US5937422A (en) * | 1997-04-15 | 1999-08-10 | The United States Of America As Represented By The National Security Agency | Automatically generating a topic description for text and searching and sorting text by topic using the same |
US6233575B1 (en) | 1997-06-24 | 2001-05-15 | International Business Machines Corporation | Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values |
US6292830B1 (en) * | 1997-08-08 | 2001-09-18 | Iterations Llc | System for optimizing interaction among agents acting on multiple levels |
US6052657A (en) * | 1997-09-09 | 2000-04-18 | Dragon Systems, Inc. | Text segmentation and identification of topic using language models |
US6289342B1 (en) * | 1998-01-05 | 2001-09-11 | Nec Research Institute, Inc. | Autonomous citation indexing and literature browsing using citation context |
US6598045B2 (en) | 1998-04-07 | 2003-07-22 | Intel Corporation | System and method for piecemeal relevance evaluation |
US6310645B1 (en) * | 1998-05-27 | 2001-10-30 | Antec Corporation | Method and apparatus for measuring characteristics of a communication signal modulated with a composite video signal without synchronizing to the signal |
US7275061B1 (en) | 2000-04-13 | 2007-09-25 | Indraweb.Com, Inc. | Systems and methods for employing an orthogonal corpus for document indexing |
US6269361B1 (en) | 1999-05-28 | 2001-07-31 | Goto.Com | System and method for influencing a position on a search result list generated by a computer network search engine |
US6981040B1 (en) | 1999-12-28 | 2005-12-27 | Utopy, Inc. | Automatic, personalized online information and product services |
US6397211B1 (en) | 2000-01-03 | 2002-05-28 | International Business Machines Corporation | System and method for identifying useless documents |
JP3562572B2 (ja) | 2000-05-02 | 2004-09-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データベースのドキュメントにおける新規な事項・新規クラスの検出及び追跡 |
US7130848B2 (en) * | 2000-08-09 | 2006-10-31 | Gary Martin Oosta | Methods for document indexing and analysis |
US7062485B1 (en) | 2000-09-01 | 2006-06-13 | Huaichuan Hubert Jin | Method and apparatus for score normalization for information retrieval applications |
US7185065B1 (en) | 2000-10-11 | 2007-02-27 | Buzzmetrics Ltd | System and method for scoring electronic messages |
US7200606B2 (en) | 2000-11-07 | 2007-04-03 | The Regents Of The University Of California | Method and system for selecting documents by measuring document quality |
US6772120B1 (en) | 2000-11-21 | 2004-08-03 | Hewlett-Packard Development Company, L.P. | Computer method and apparatus for segmenting text streams |
US7685224B2 (en) | 2001-01-11 | 2010-03-23 | Truelocal Inc. | Method for providing an attribute bounded network of computers |
US20020161838A1 (en) | 2001-04-27 | 2002-10-31 | Pickover Cilfford A. | Method and apparatus for targeting information |
JP2003030221A (ja) * | 2001-07-12 | 2003-01-31 | Ricoh Co Ltd | 文書分類装置、分類法則更新方法、コンピュータプログラム及び記録媒体 |
US7092888B1 (en) | 2001-10-26 | 2006-08-15 | Verizon Corporate Services Group Inc. | Unsupervised training in natural language call routing |
US7716161B2 (en) | 2002-09-24 | 2010-05-11 | Google, Inc, | Methods and apparatus for serving relevant advertisements |
US7752072B2 (en) | 2002-07-16 | 2010-07-06 | Google Inc. | Method and system for providing advertising through content specific nodes over the internet |
US20050226511A1 (en) | 2002-08-26 | 2005-10-13 | Short Gordon K | Apparatus and method for organizing and presenting content |
US7320000B2 (en) | 2002-12-04 | 2008-01-15 | International Business Machines Corporation | Method and apparatus for populating a predefined concept hierarchy or other hierarchical set of classified data items by minimizing system entrophy |
US7467202B2 (en) | 2003-09-10 | 2008-12-16 | Fidelis Security Systems | High-performance network content analysis platform |
GB0322600D0 (en) | 2003-09-26 | 2003-10-29 | Univ Ulster | Thematic retrieval in heterogeneous data repositories |
JP2005158010A (ja) | 2003-10-31 | 2005-06-16 | Hewlett-Packard Development Co Lp | 分類評価装置・方法及びプログラム |
EP1687807B1 (en) | 2003-11-21 | 2016-03-16 | Nuance Communications, Inc. | Topic specific models for text formatting and speech recognition |
JP2007512609A (ja) | 2003-11-21 | 2007-05-17 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 文書構造化のためのテキストセグメンテーション及びトピック注釈付け |
JP4808160B2 (ja) | 2003-11-21 | 2011-11-02 | ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー | トピック特異的言語モデルおよびトピック特異的ラベル統計によるユーザー対話を用いたテキストセグメント分割およびラベル付与 |
US20070244690A1 (en) | 2003-11-21 | 2007-10-18 | Koninklijke Philips Electronic, N.V. | Clustering of Text for Structuring of Text Documents and Training of Language Models |
US7502815B1 (en) * | 2004-02-20 | 2009-03-10 | Xilinx, Inc. | True random number generator and method of generating true random numbers |
US7293019B2 (en) | 2004-03-02 | 2007-11-06 | Microsoft Corporation | Principles and methods for personalizing newsfeeds via an analysis of information novelty and dynamics |
US7426557B2 (en) | 2004-05-14 | 2008-09-16 | International Business Machines Corporation | System, method, and service for inducing a pattern of communication among various parties |
US7281022B2 (en) | 2004-05-15 | 2007-10-09 | International Business Machines Corporation | System, method, and service for segmenting a topic into chatter and subtopics |
JP2005352878A (ja) * | 2004-06-11 | 2005-12-22 | Hitachi Ltd | 文書検索システム、検索サーバ、及び検索クライアント |
US7567959B2 (en) | 2004-07-26 | 2009-07-28 | Google Inc. | Multiple index based information retrieval system |
US7496567B1 (en) | 2004-10-01 | 2009-02-24 | Terril John Steichen | System and method for document categorization |
US20060167930A1 (en) | 2004-10-08 | 2006-07-27 | George Witwer | Self-organized concept search and data storage method |
US7693683B2 (en) * | 2004-11-25 | 2010-04-06 | Sharp Kabushiki Kaisha | Information classifying device, information classifying method, information classifying program, information classifying system |
US7640488B2 (en) * | 2004-12-04 | 2009-12-29 | International Business Machines Corporation | System, method, and service for using a focused random walk to produce samples on a topic from a collection of hyper-linked pages |
US7548917B2 (en) | 2005-05-06 | 2009-06-16 | Nelson Information Systems, Inc. | Database and index organization for enhanced document retrieval |
US20070050356A1 (en) | 2005-08-23 | 2007-03-01 | Amadio William J | Query construction for semantic topic indexes derived by non-negative matrix factorization |
WO2007035912A2 (en) | 2005-09-21 | 2007-03-29 | Praxeon, Inc. | Document processing |
US9069847B2 (en) | 2005-10-21 | 2015-06-30 | Battelle Memorial Institute | Data visualization methods, data visualization devices, data visualization apparatuses, and articles of manufacture |
US20070156622A1 (en) | 2006-01-05 | 2007-07-05 | Akkiraju Rama K | Method and system to compose software applications by combining planning with semantic reasoning |
EP1989639A4 (en) | 2006-02-28 | 2012-05-02 | Buzzlogic Inc | SOCIAL ANALYSIS SYSTEM AND METHOD FOR ANALYZING CONVERSATIONS ON SOCIAL MULTIMEDIA CONTENT |
US8326686B2 (en) | 2006-03-30 | 2012-12-04 | Google Inc. | Automatically generating ads and ad-serving index |
US7890485B2 (en) | 2006-04-13 | 2011-02-15 | Tony Malandain | Knowledge management tool |
US7809723B2 (en) | 2006-06-26 | 2010-10-05 | Microsoft Corporation | Distributed hierarchical text classification framework |
US20080040221A1 (en) | 2006-08-08 | 2008-02-14 | Google Inc. | Interest Targeting |
US20080126319A1 (en) | 2006-08-25 | 2008-05-29 | Ohad Lisral Bukai | Automated short free-text scoring method and system |
US20080065600A1 (en) | 2006-09-12 | 2008-03-13 | Harold Batteram | Method and apparatus for providing search results from content on a computer network |
US20080091510A1 (en) * | 2006-10-12 | 2008-04-17 | Joshua Scott Crandall | Computer systems and methods for surveying a population |
US7921092B2 (en) | 2006-12-04 | 2011-04-05 | Yahoo! Inc. | Topic-focused search result summaries |
US8583419B2 (en) | 2007-04-02 | 2013-11-12 | Syed Yasin | Latent metonymical analysis and indexing (LMAI) |
US8165985B2 (en) * | 2007-10-12 | 2012-04-24 | Palo Alto Research Center Incorporated | System and method for performing discovery of digital information in a subject area |
US8073682B2 (en) * | 2007-10-12 | 2011-12-06 | Palo Alto Research Center Incorporated | System and method for prospecting digital information |
US8234310B2 (en) * | 2007-12-20 | 2012-07-31 | Pottenger William M | Social networking on a website with topic-based data sharing |
US8422787B2 (en) | 2007-12-27 | 2013-04-16 | Nec Corporation | Apparatus, method and program for text segmentation |
US9411886B2 (en) * | 2008-03-31 | 2016-08-09 | Yahoo! Inc. | Ranking advertisements with pseudo-relevance feedback and translation models |
US20100042589A1 (en) | 2008-08-15 | 2010-02-18 | Smyros Athena A | Systems and methods for topical searching |
US20100057536A1 (en) * | 2008-08-28 | 2010-03-04 | Palo Alto Research Center Incorporated | System And Method For Providing Community-Based Advertising Term Disambiguation |
US8010545B2 (en) * | 2008-08-28 | 2011-08-30 | Palo Alto Research Center Incorporated | System and method for providing a topic-directed search |
US20100057577A1 (en) * | 2008-08-28 | 2010-03-04 | Palo Alto Research Center Incorporated | System And Method For Providing Topic-Guided Broadening Of Advertising Targets In Social Indexing |
US8209616B2 (en) * | 2008-08-28 | 2012-06-26 | Palo Alto Research Center Incorporated | System and method for interfacing a web browser widget with social indexing |
US9317599B2 (en) | 2008-09-19 | 2016-04-19 | Nokia Technologies Oy | Method, apparatus and computer program product for providing relevance indication |
US8549016B2 (en) * | 2008-11-14 | 2013-10-01 | Palo Alto Research Center Incorporated | System and method for providing robust topic identification in social indexes |
US8356044B2 (en) * | 2009-01-27 | 2013-01-15 | Palo Alto Research Center Incorporated | System and method for providing default hierarchical training for social indexing |
US8452781B2 (en) * | 2009-01-27 | 2013-05-28 | Palo Alto Research Center Incorporated | System and method for using banded topic relevance and time for article prioritization |
US8239397B2 (en) * | 2009-01-27 | 2012-08-07 | Palo Alto Research Center Incorporated | System and method for managing user attention by detecting hot and cold topics in social indexes |
US20110112995A1 (en) * | 2009-10-28 | 2011-05-12 | Industrial Technology Research Institute | Systems and methods for organizing collective social intelligence information using an organic object data model |
US8554854B2 (en) * | 2009-12-11 | 2013-10-08 | Citizennet Inc. | Systems and methods for identifying terms relevant to web pages using social network messages |
-
2009
- 2009-10-29 US US12/608,929 patent/US8549016B2/en not_active Expired - Fee Related
- 2009-11-13 EP EP09175873.0A patent/EP2192500B1/en not_active Not-in-force
- 2009-11-16 JP JP2009260896A patent/JP5421737B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20100125540A1 (en) | 2010-05-20 |
EP2192500A2 (en) | 2010-06-02 |
JP2010118064A (ja) | 2010-05-27 |
EP2192500A3 (en) | 2010-09-29 |
US8549016B2 (en) | 2013-10-01 |
EP2192500B1 (en) | 2016-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5421737B2 (ja) | コンピュータ実施方法 | |
Savov et al. | Identifying breakthrough scientific papers | |
CN103870973B (zh) | 基于电子信息的关键词提取的信息推送、搜索方法及装置 | |
US9514216B2 (en) | Automatic classification of segmented portions of web pages | |
Liu et al. | Analyzing changes in hotel customers’ expectations by trip mode | |
KR101203345B1 (ko) | 요약을 이용하여 디스플레이 페이지를 분류하는 방법 및시스템 | |
US8843490B2 (en) | Method and system for automatically extracting data from web sites | |
Ma et al. | Exploring performance of clustering methods on document sentiment analysis | |
JP5350472B2 (ja) | トピックに関する複数の製品にランクを付ける製品ランク付け方法及び製品ランク付けシステム | |
US10354308B2 (en) | Distinguishing accessories from products for ranking search results | |
US8713028B2 (en) | Related news articles | |
US20110225152A1 (en) | Constructing a search-result caption | |
KR101105173B1 (ko) | 카테고리화를 통해 호스트 투 게스트 콘텐츠를 자동으로 매칭하기 위한 메커니즘 | |
JP2010055618A (ja) | トピックを基にした検索を提供する方法及びシステム | |
US20130282704A1 (en) | Search system with query refinement | |
US20090210407A1 (en) | Method and system for adaptive discovery of content on a network | |
WO2010081238A1 (en) | Method and system for document classification | |
McCain | Eponymy and obliteration by incorporation: The case of the “Nash Equilibrium” | |
WO2016114790A1 (en) | Reading difficulty level based resource recommendation | |
Fan et al. | Assessing topic model relevance: Evaluation and informative priors | |
Qian et al. | Detecting new Chinese words from massive domain texts with word embedding | |
CN112307336A (zh) | 热点资讯挖掘与预览方法、装置、计算机设备及存储介质 | |
Hlava | The Taxobook: Applications, implementation, and integration in search: Part 3 of a 3-part series | |
Feldman | The answer machine | |
EP1910918A2 (en) | Method and system for automatically extracting data from web sites |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100712 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121114 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130426 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130521 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130815 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131122 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |