JP5563836B2 - ソーシャルインデクシングのためにデフォルト階層訓練を提供するためのシステム及び方法 - Google Patents
ソーシャルインデクシングのためにデフォルト階層訓練を提供するためのシステム及び方法 Download PDFInfo
- Publication number
- JP5563836B2 JP5563836B2 JP2010010997A JP2010010997A JP5563836B2 JP 5563836 B2 JP5563836 B2 JP 5563836B2 JP 2010010997 A JP2010010997 A JP 2010010997A JP 2010010997 A JP2010010997 A JP 2010010997A JP 5563836 B2 JP5563836 B2 JP 5563836B2
- Authority
- JP
- Japan
- Prior art keywords
- topic
- label
- tree
- pattern
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Description
以下の用語は、明細書全体にわたって使用され、特に注釈がなければ、以下に記載の意味を含む。
●トピックラベルが複製された時、先祖ノードからの単語及び制約を考慮に入れる必要がある場合、
●複製ラベルを有する共通の先祖ノードからの単語が互いに識別されない場合、
●ツリー内の先祖ノードの全てからの全単語を使用することによって過剰に制限された論理積が生じた場合、
●パターンに含むように更なる単語を選択する時、単語の出現頻度に関する情報を考慮に入れる必要がある場合、
この手法は、失敗につながる。
● 単一単語パターン、
● 完成したトピックラベルから作成されたn−グラム法、又は
● 単一単語、n−グラム法、又は論理和から作成された三項から成る論理積
を含むことができる。
論理積に加えて又は論理積に代わって、論理和又はシーケンス(列)などの他のパターンが含まれてもよい。単語を、一回より多く使用するようなデフォルト候補パターンは削除される。更に、デフォルト候補パターンを生成する場合、トピックのラベル、トピックの親ラベル、又はトピックの任意の他の先祖のラベルに出現する単語が使用される。インデックスの他のラベルにおいて出現する単語はデフォルト候補パターン評価期間に判断される。
● 最初に、デフォルト候補パターンが、0〜80点の範囲の記事得点に基づいて、得点が割り当てられる。
● 記事得点の半分の最小値と複雑度得点が加算される。
● デフォルト候補パターンがトピックの好ましいパターンに一致した場合、記事得点の半分の最小値と10点が得点に加算される。
● デフォルト候補パターンがハードな規則を破った場合、パターンは100点のペナルティを課す。
● 候補がソフトな規則を破った場合、パターンは、一反則当たり20点のペナルティを課す。
各デフォルト候補パターンに割り当てられる点数の変化は、得点処理に対してさほど影響しない。
○ 70%: 図8を参照して以下に更に記載されているように、記事整合(ステップ81)。理想的な比率に最も近似している記事のパーセンテージに比例して整合するトピックモデルが有利であると認められる。
○ 10%: 図9を参照して以下に更に記載されているように、構造的簡単度(ステップ82)。特定の種類の構造的複雑度によってトピックモデルの識別能力が高められ、有利であると認められる。
○ 20%: 図10を参照して以下に更に記載されているように、ラベルボーナス(ステップ83)。ボーナスラベルを含むトピックモデルは同等の得点の他のトピックモデルと同点決勝を行う。
更に、単一単語パターンは複数の単語パターンより多い記事を整合させる傾向がある。結果的に、デフォルト候補パターン得点は、単一単語パターンに起因する高い記事カウントの利点を削減するように調整される。これによって、トピックが二つ以上の単語を有する単語ラベルを有し、提示されたデフォルト候補パターンに含まれる単語数が、単語ラベルに含まれる単語よりも少ない場合(ステップ84)、記事得点が半減されるペナルティが課される(ステップ85)。
● 記事の20%未満が整合する候補(ステップ91)には、記事の理想数を少数表示した得点が割り当てられる(ステップ92)。
● 記事の20〜40%より多くが整合する候補(ステップ93)には、整合した記事の数が40%に近似するにつれてゼロまで減少する得点が割当てられる(ステップ94)。
● 記事整合>記事の40%が整合する候補(ステップ95)は多過ぎると判断され、得点ゼロが割当てられる(ステップ96)。
記事整合評価(ステップ91〜96)に続いて、得られた得点を戻す(ステップ97)。
○ n−グラム法の数(ステップ101)。一般に、n−グラム法は、高い識別パターン要素であり、デフォルト候補パターンは、パターンに含まれるn−グラム法の数との関連において、報酬を受ける(ステップ102)。
○ 非複製単語の数(ステップ103)。非複製単語は、複製単語より識別性が高い。いくつかの非複製単語を有するパターンは、より少ない又は非複製単語を全く含まないパターンよりも識別性が高い傾向がある。非複製単語の数が計算される(ステップ104)。
○ グループ数(ステップ105)。単語のグループは、用語の論理積と論理和である(ステップ106)。
score=(6×numNgrams)−(numGroups+2)×numNonDupWords−numDupWords (1)
式中、numNgramsはn−グラム法の数であり、numGroupsは単語群の数であり、numNonDupWordsは非複製単語の数であり、numDupWordsは複製単語の数である。しかしながら、得点の全体的な影響力を制限するために、以下の規則が得点調整に適用される。即ち、
○ 得点は10より大きくならないし、或いは、−10未満に満たない。
○ 候補の為の総得点において簡単度得点は記事得点の50%以上にならない。
採点法の他の公式化も可能である。構造的複雑度の整合評価(ステップ101〜107)の後、得られた得点を戻す(ステップ108)。
○ 略同じ得点を有する多数のパターンがある。完成したパターンのうち、パターンの一つは「ボーナス」ラベルを有している。
○ 候補者は、いずれの記事にも整合しない。
従って、これらの両ケースにおいて合理的な推測をするために、ボーナスラベルを有するパターンにボーナス得点が報酬として与えられ、これが、総得点の20%までに寄与する。但し、ボーナスラベルに対する信用度(クレジット)を、採点法の好適な少数派の役割に、割り当てる他の手法が使用されてもよい。図10は、図7のルーチン80に使用されるラベルを評価するためのルーチン110を示すフローチャートである。各デフォルト候補パターンは繰り返し処理され(ステップ111〜114)、各繰り返しの間、ボーナスラベルに対してパターンが評価されるが、このパターンは、トピックラベル内の単語の全てを含むパターンである(ステップ112)。
○ 単一単語パターンに整合する:15点
○ 全てのボーナス単語との論理積:15点
○ 順番に出現する全てのボーナス単語にn−グラム法を適用:20点
この採点法は、単一単語のみを有するラベルもあるが、複数の単語を有するラベルもあることを認識している。更に、n−グラム法は、複数単語のラベルとして同一の単語を含むパターンの中の論理積より特定化されており、採点法は、大部分の特定のラベル単語パターンのバイアスを紹介する。例えば、トピックラベル「“Mountain View”」に対して、この採点法は、論理積「“[mountain view]”」よりもn−グラム法の「“{mountain view}”」が好ましいとされる。n−グラム法は、山と景色を意味する記事とは整合しない。更なる例として、論理積「“[Portola valley]”」よりもn−グラム法の「“{Portola valley}”」が好ましいとされる。後者の論理積は、{“Portola school,”}などの単語の一部又は適切な名詞としてPortolaを用いるSanFrancisco Bay Areaの他の町について記事に整合し、さらに単語valleyも示唆している。
● 複製された単一単語のパターンが特定のトピックに当てはまる記事を選択するための識別力を有していないので、トピックラベルが複製されている場合、パターンは単一用語(項)であってはならない(ステップ121)。
● パターンは局所的トピック用語を含む必要がある(ステップ123)。トピックのラベル内の単語は識別しやすい。
● トピックラベルが複製される場合(ステップ125)、パターンは親単語を含む必要がある(ステップ126)。複数のトピックが同一ラベルを有している場合、トピック同士を識別するためにラベル自体を使用することができない。
デフォルト候補パターンがハードな制約規則を破った場合、このパターンをハードな制約規則を守っているパターンと区別するために、このパターンは100点のペナルティなどの得点ペナルティが課せられる(ステップ122、124、127のそれぞれ)。ハードな制約評価(ステップ121〜127)の後、得られた得点を戻す(ステップ128)。
● 候補は、少なくとも一つの非複製の局所的トピック単語を含むべきである(ステップ131)。非複製単語は、複製単語より識別能力が高い。
● 複製トピックラベルに対する候補(ステップ133)は、非複製の親単語を含むべきである(ステップ134)。親からの非複製単語は、複製単語より識別能力が高い。
● 複製されたトピックラベル(ステップ133)に対する候補は、共通の先祖からの単語を含むべきではない(ステップ136)。同一ラベルを有するトピックの共通の先祖からの単語は、トピック同士を識別することができない。
デフォルト候補パターンがソフトな候補規則のいずれかを破った場合、パターンは、破られたソフトな制約全てに対して20点のペナルティなどのペナルティが課せられる(ステップ132、135、137)。ソフトな制約評価の後(ステップ131〜137)、得られた得点を戻す(ステップ138)。
● トピック別階層。親と先祖のノードについて考慮すること。
● 複製されたトピックラベル。パターンを評価する際に、複製されたラベルを含むケースを特に考慮すること。
● 複製単語。パターンに含むために単語を選択するときに、一つより多いラベルに出現する単語について特別に配慮すること。他の配慮も適用可能である。
11: ソーシャルインデクシングシステム
13a、13b、13c: ユーザ ユーザ ユーザ
14a: ウェブサーバ
15a: ウェブコンテンツ
14b: ニュース収集サーバ
15b: ニュースコンテンツ
14c: 投票によるニュースサーバ
15c: 「吟味された」コンテンツ
16: ネットワーク
Claims (2)
- ソーシャルインデクシングのためのデフォルト階層訓練を提供するためのコンピュータ実施方法であって、
ソーシャルインデクシングのためのディジタル情報の記事を保持し、
各々が一つ以上の単語を有するラベルを含む、トピックの階層的構造化されたツリーであるトピックツリーを指定し、
前記トピックツリーの文字構造に本来備わっている制約を識別する共に、不変規則を含むように前記制約を定義し、
前記不変規則が、
前記トピックツリー内で複製されたラベルから構成された単一用語を含む一つのトピックモデルを形成すること、
前記トピックモデルが属するトピックに対するラベルからの用語を全く含まない一つのトピックモデルを形成すること、及び、
前記ラベルが前記トピックツリー内で複製される時、前記トピックモデルが属する前記トピックに対する親トピックのラベルからの用語を全く含まないトピックモデルを形成すること
の一つ以上を含み、
前記トピックツリーのトピック毎に、前記ラベルの少なくとも一つ内の前記単語を含む少なくとも一つの用語を含むと共に有限状態パターンであるトピックモデルを作成し、
前記制約に照らして、前記トピックツリーに対する前記トピックモデルを評価する共に、前記不変規則の一つ以上を破るトピックモデルを不利とし、
前記トピックモデルの中から、前記制約を最高に満たすトピックモデルを識別する、
コンピュータ実施方法。 - 許可規則を含むように前記制約を定義し、前記許可規則の一つ以上を破るトピックモデルはカウントしないことを更に含み、
前記許可規則は、
前記トピックツリー内の他のラベルに複製されない前記トピックモデルが属する前記トピックのための、前記ラベルからの用語を含まない1つのトピックモデルを形成すること、
前記ラベルが前記トピックツリー内の他のラベルに複製されるとき、前記トピックモデルが属する前記トピックのための親トピックの前記ラベルからの非複製用語を含まない1つのトピックモデルを形成すること、及び
前記ラベルが前記トピックツリー内の他のラベルに複製されるとき、前記トピックモデルが属する前記トピックのための共通の先祖トピックのラベルからの用語を含む1つのトピックモデルを形成すること
の一つ以上を含む、請求項1に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/360,825 US8356044B2 (en) | 2009-01-27 | 2009-01-27 | System and method for providing default hierarchical training for social indexing |
US12/360,825 | 2009-01-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010176665A JP2010176665A (ja) | 2010-08-12 |
JP5563836B2 true JP5563836B2 (ja) | 2014-07-30 |
Family
ID=42242208
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010010997A Expired - Fee Related JP5563836B2 (ja) | 2009-01-27 | 2010-01-21 | ソーシャルインデクシングのためにデフォルト階層訓練を提供するためのシステム及び方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8356044B2 (ja) |
EP (1) | EP2211280B1 (ja) |
JP (1) | JP5563836B2 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5689361B2 (ja) | 2011-05-20 | 2015-03-25 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | グラフデータの一部を準同型写像の像であるデータ構造に変換する方法、プログラム、および、システム |
US8549016B2 (en) * | 2008-11-14 | 2013-10-01 | Palo Alto Research Center Incorporated | System and method for providing robust topic identification in social indexes |
US8239397B2 (en) * | 2009-01-27 | 2012-08-07 | Palo Alto Research Center Incorporated | System and method for managing user attention by detecting hot and cold topics in social indexes |
US8356044B2 (en) * | 2009-01-27 | 2013-01-15 | Palo Alto Research Center Incorporated | System and method for providing default hierarchical training for social indexing |
US8452781B2 (en) * | 2009-01-27 | 2013-05-28 | Palo Alto Research Center Incorporated | System and method for using banded topic relevance and time for article prioritization |
JP5032645B2 (ja) * | 2010-11-04 | 2012-09-26 | 株式会社東芝 | ニュース情報分析装置 |
EP2645272A1 (en) * | 2012-03-28 | 2013-10-02 | Lockeed Martin Corporation | Identifying cultural background from text |
US9436382B2 (en) | 2012-09-18 | 2016-09-06 | Adobe Systems Incorporated | Natural language image editing |
US9588964B2 (en) * | 2012-09-18 | 2017-03-07 | Adobe Systems Incorporated | Natural language vocabulary generation and usage |
US9141335B2 (en) | 2012-09-18 | 2015-09-22 | Adobe Systems Incorporated | Natural language image tags |
US10656808B2 (en) | 2012-09-18 | 2020-05-19 | Adobe Inc. | Natural language and user interface controls |
US9412366B2 (en) | 2012-09-18 | 2016-08-09 | Adobe Systems Incorporated | Natural language image spatial and tonal localization |
US10204026B2 (en) | 2013-03-15 | 2019-02-12 | Uda, Llc | Realtime data stream cluster summarization and labeling system |
US10430111B2 (en) | 2013-03-15 | 2019-10-01 | Uda, Llc | Optimization for real-time, parallel execution of models for extracting high-value information from data streams |
US9600550B2 (en) | 2013-03-15 | 2017-03-21 | Uda, Llc | Optimization for real-time, parallel execution of models for extracting high-value information from data streams |
US10599697B2 (en) | 2013-03-15 | 2020-03-24 | Uda, Llc | Automatic topic discovery in streams of unstructured data |
US10698935B2 (en) | 2013-03-15 | 2020-06-30 | Uda, Llc | Optimization for real-time, parallel execution of models for extracting high-value information from data streams |
US10191927B2 (en) * | 2014-04-02 | 2019-01-29 | Facebook, Inc. | Selecting previously-presented content items for presentation to users of a social networking system |
WO2015161129A1 (en) * | 2014-04-16 | 2015-10-22 | Akuda Labs Llc | Automatic topic discovery in streams of unstructured data |
CN105159882A (zh) * | 2015-09-16 | 2015-12-16 | 中国地质大学(北京) | 一种确定微博热门话题的方法及装置 |
US11477302B2 (en) * | 2016-07-06 | 2022-10-18 | Palo Alto Research Center Incorporated | Computer-implemented system and method for distributed activity detection |
US10963501B1 (en) * | 2017-04-29 | 2021-03-30 | Veritas Technologies Llc | Systems and methods for generating a topic tree for digital information |
EP3788512A4 (en) | 2017-12-30 | 2022-03-09 | Target Brands, Inc. | HIERARCHICAL, PARALLEL MODELS FOR REAL-TIME EXTRACTING HIGH VALUE INFORMATION FROM DATA STREAMS AND THE ASSOCIATED CREATION SYSTEM AND METHOD |
WO2022238873A1 (en) * | 2021-05-10 | 2022-11-17 | Skupin Andre | Knowledge space analytics |
Family Cites Families (77)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5369763A (en) * | 1989-02-01 | 1994-11-29 | Kansas State University Research Foundation | Data storage and retrieval system with improved data base structure |
US5257939A (en) * | 1992-10-13 | 1993-11-02 | Robinson Don T | Cultural knowledge board game |
US5724567A (en) * | 1994-04-25 | 1998-03-03 | Apple Computer, Inc. | System for directing relevance-ranked data objects to computer users |
US5659766A (en) * | 1994-09-16 | 1997-08-19 | Xerox Corporation | Method and apparatus for inferring the topical content of a document based upon its lexical content without supervision |
JP2809341B2 (ja) * | 1994-11-18 | 1998-10-08 | 松下電器産業株式会社 | 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。 |
US5671342A (en) * | 1994-11-30 | 1997-09-23 | Intel Corporation | Method and apparatus for displaying information relating to a story and a story indicator in a computer system |
US5530852A (en) * | 1994-12-20 | 1996-06-25 | Sun Microsystems, Inc. | Method for extracting profiles and topics from a first file written in a first markup language and generating files in different markup languages containing the profiles and topics for use in accessing data described by the profiles and topics |
US5680511A (en) * | 1995-06-07 | 1997-10-21 | Dragon Systems, Inc. | Systems and methods for word recognition |
US5907836A (en) * | 1995-07-31 | 1999-05-25 | Kabushiki Kaisha Toshiba | Information filtering apparatus for selecting predetermined article from plural articles to present selected article to user, and method therefore |
US6021403A (en) * | 1996-07-19 | 2000-02-01 | Microsoft Corporation | Intelligent user assistance facility |
US5907677A (en) * | 1996-08-23 | 1999-05-25 | Ecall Inc. | Method for establishing anonymous communication links |
EP0848347A1 (en) * | 1996-12-11 | 1998-06-17 | Sony Corporation | Method of extracting features characterising objects |
US6285987B1 (en) * | 1997-01-22 | 2001-09-04 | Engage, Inc. | Internet advertising system |
JP4208288B2 (ja) * | 1997-06-06 | 2009-01-14 | パナソニック株式会社 | 検索メニュー作成装置、検索メニュー作成方法及び検索メニュー作成プログラムを記録した記録媒体 |
US6233575B1 (en) * | 1997-06-24 | 2001-05-15 | International Business Machines Corporation | Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values |
US6292830B1 (en) * | 1997-08-08 | 2001-09-18 | Iterations Llc | System for optimizing interaction among agents acting on multiple levels |
US6052657A (en) * | 1997-09-09 | 2000-04-18 | Dragon Systems, Inc. | Text segmentation and identification of topic using language models |
US6598045B2 (en) * | 1998-04-07 | 2003-07-22 | Intel Corporation | System and method for piecemeal relevance evaluation |
US7275061B1 (en) * | 2000-04-13 | 2007-09-25 | Indraweb.Com, Inc. | Systems and methods for employing an orthogonal corpus for document indexing |
US6269361B1 (en) * | 1999-05-28 | 2001-07-31 | Goto.Com | System and method for influencing a position on a search result list generated by a computer network search engine |
US6981040B1 (en) * | 1999-12-28 | 2005-12-27 | Utopy, Inc. | Automatic, personalized online information and product services |
US6397211B1 (en) * | 2000-01-03 | 2002-05-28 | International Business Machines Corporation | System and method for identifying useless documents |
JP3562572B2 (ja) * | 2000-05-02 | 2004-09-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データベースのドキュメントにおける新規な事項・新規クラスの検出及び追跡 |
US7062485B1 (en) * | 2000-09-01 | 2006-06-13 | Huaichuan Hubert Jin | Method and apparatus for score normalization for information retrieval applications |
US7185065B1 (en) * | 2000-10-11 | 2007-02-27 | Buzzmetrics Ltd | System and method for scoring electronic messages |
US7200606B2 (en) * | 2000-11-07 | 2007-04-03 | The Regents Of The University Of California | Method and system for selecting documents by measuring document quality |
JP2002157262A (ja) * | 2000-11-20 | 2002-05-31 | Hitachi Ltd | 分類ルール定義支援方法 |
US6772120B1 (en) * | 2000-11-21 | 2004-08-03 | Hewlett-Packard Development Company, L.P. | Computer method and apparatus for segmenting text streams |
US7685224B2 (en) * | 2001-01-11 | 2010-03-23 | Truelocal Inc. | Method for providing an attribute bounded network of computers |
US20020161838A1 (en) * | 2001-04-27 | 2002-10-31 | Pickover Cilfford A. | Method and apparatus for targeting information |
US7092888B1 (en) * | 2001-10-26 | 2006-08-15 | Verizon Corporate Services Group Inc. | Unsupervised training in natural language call routing |
US7716161B2 (en) * | 2002-09-24 | 2010-05-11 | Google, Inc, | Methods and apparatus for serving relevant advertisements |
US7752072B2 (en) * | 2002-07-16 | 2010-07-06 | Google Inc. | Method and system for providing advertising through content specific nodes over the internet |
US20050226511A1 (en) | 2002-08-26 | 2005-10-13 | Short Gordon K | Apparatus and method for organizing and presenting content |
US7320000B2 (en) * | 2002-12-04 | 2008-01-15 | International Business Machines Corporation | Method and apparatus for populating a predefined concept hierarchy or other hierarchical set of classified data items by minimizing system entrophy |
CA2419883A1 (en) * | 2003-02-26 | 2004-08-26 | Ibm Canada Limited - Ibm Canada Limitee | Discriminatory replay of log files during table space recovery in a database management system |
US7467202B2 (en) * | 2003-09-10 | 2008-12-16 | Fidelis Security Systems | High-performance network content analysis platform |
GB0322600D0 (en) * | 2003-09-26 | 2003-10-29 | Univ Ulster | Thematic retrieval in heterogeneous data repositories |
JP2005158010A (ja) * | 2003-10-31 | 2005-06-16 | Hewlett-Packard Development Co Lp | 分類評価装置・方法及びプログラム |
EP1687737A2 (en) * | 2003-11-21 | 2006-08-09 | Philips Intellectual Property & Standards GmbH | Text segmentation and topic annotation for document structuring |
US20070244690A1 (en) * | 2003-11-21 | 2007-10-18 | Koninklijke Philips Electronic, N.V. | Clustering of Text for Structuring of Text Documents and Training of Language Models |
WO2005050474A2 (en) * | 2003-11-21 | 2005-06-02 | Philips Intellectual Property & Standards Gmbh | Text segmentation and label assignment with user interaction by means of topic specific language models and topic-specific label statistics |
WO2005050621A2 (en) * | 2003-11-21 | 2005-06-02 | Philips Intellectual Property & Standards Gmbh | Topic specific models for text formatting and speech recognition |
US7293019B2 (en) * | 2004-03-02 | 2007-11-06 | Microsoft Corporation | Principles and methods for personalizing newsfeeds via an analysis of information novelty and dynamics |
US7426557B2 (en) * | 2004-05-14 | 2008-09-16 | International Business Machines Corporation | System, method, and service for inducing a pattern of communication among various parties |
US7281022B2 (en) * | 2004-05-15 | 2007-10-09 | International Business Machines Corporation | System, method, and service for segmenting a topic into chatter and subtopics |
JP2005352878A (ja) * | 2004-06-11 | 2005-12-22 | Hitachi Ltd | 文書検索システム、検索サーバ、及び検索クライアント |
US7567959B2 (en) * | 2004-07-26 | 2009-07-28 | Google Inc. | Multiple index based information retrieval system |
US7496567B1 (en) * | 2004-10-01 | 2009-02-24 | Terril John Steichen | System and method for document categorization |
US20060167930A1 (en) * | 2004-10-08 | 2006-07-27 | George Witwer | Self-organized concept search and data storage method |
US7548917B2 (en) * | 2005-05-06 | 2009-06-16 | Nelson Information Systems, Inc. | Database and index organization for enhanced document retrieval |
US20070050356A1 (en) * | 2005-08-23 | 2007-03-01 | Amadio William J | Query construction for semantic topic indexes derived by non-negative matrix factorization |
US7707206B2 (en) * | 2005-09-21 | 2010-04-27 | Praxeon, Inc. | Document processing |
US9069847B2 (en) | 2005-10-21 | 2015-06-30 | Battelle Memorial Institute | Data visualization methods, data visualization devices, data visualization apparatuses, and articles of manufacture |
US7890502B2 (en) * | 2005-11-14 | 2011-02-15 | Microsoft Corporation | Hierarchy-based propagation of contribution of documents |
US20070156622A1 (en) * | 2006-01-05 | 2007-07-05 | Akkiraju Rama K | Method and system to compose software applications by combining planning with semantic reasoning |
JP2009528639A (ja) * | 2006-02-28 | 2009-08-06 | バズロジック, インコーポレイテッド | ソーシャルメディアにおける会話を分析するためのソーシャル分析システムおよび方法 |
US8326686B2 (en) * | 2006-03-30 | 2012-12-04 | Google Inc. | Automatically generating ads and ad-serving index |
US7890485B2 (en) * | 2006-04-13 | 2011-02-15 | Tony Malandain | Knowledge management tool |
US7809723B2 (en) * | 2006-06-26 | 2010-10-05 | Microsoft Corporation | Distributed hierarchical text classification framework |
WO2008021906A2 (en) * | 2006-08-08 | 2008-02-21 | Google Inc. | Interest targeting |
US20080126319A1 (en) * | 2006-08-25 | 2008-05-29 | Ohad Lisral Bukai | Automated short free-text scoring method and system |
US20080065600A1 (en) * | 2006-09-12 | 2008-03-13 | Harold Batteram | Method and apparatus for providing search results from content on a computer network |
US7921092B2 (en) * | 2006-12-04 | 2011-04-05 | Yahoo! Inc. | Topic-focused search result summaries |
WO2008120030A1 (en) * | 2007-04-02 | 2008-10-09 | Sobha Renaissance Information | Latent metonymical analysis and indexing [lmai] |
US8165985B2 (en) * | 2007-10-12 | 2012-04-24 | Palo Alto Research Center Incorporated | System and method for performing discovery of digital information in a subject area |
US8073682B2 (en) * | 2007-10-12 | 2011-12-06 | Palo Alto Research Center Incorporated | System and method for prospecting digital information |
JP5343861B2 (ja) * | 2007-12-27 | 2013-11-13 | 日本電気株式会社 | テキスト分割装置とテキスト分割方法およびプログラム |
US20100042589A1 (en) * | 2008-08-15 | 2010-02-18 | Smyros Athena A | Systems and methods for topical searching |
US8209616B2 (en) * | 2008-08-28 | 2012-06-26 | Palo Alto Research Center Incorporated | System and method for interfacing a web browser widget with social indexing |
US20100057577A1 (en) * | 2008-08-28 | 2010-03-04 | Palo Alto Research Center Incorporated | System And Method For Providing Topic-Guided Broadening Of Advertising Targets In Social Indexing |
US9317599B2 (en) * | 2008-09-19 | 2016-04-19 | Nokia Technologies Oy | Method, apparatus and computer program product for providing relevance indication |
US8549016B2 (en) * | 2008-11-14 | 2013-10-01 | Palo Alto Research Center Incorporated | System and method for providing robust topic identification in social indexes |
US8452781B2 (en) * | 2009-01-27 | 2013-05-28 | Palo Alto Research Center Incorporated | System and method for using banded topic relevance and time for article prioritization |
US8356044B2 (en) * | 2009-01-27 | 2013-01-15 | Palo Alto Research Center Incorporated | System and method for providing default hierarchical training for social indexing |
US8239397B2 (en) * | 2009-01-27 | 2012-08-07 | Palo Alto Research Center Incorporated | System and method for managing user attention by detecting hot and cold topics in social indexes |
US11502408B2 (en) | 2019-04-25 | 2022-11-15 | Sharp Kabushiki Kaisha | Scanned antenna and liquid crystal device |
-
2009
- 2009-01-27 US US12/360,825 patent/US8356044B2/en active Active
-
2010
- 2010-01-14 EP EP10150704.4A patent/EP2211280B1/en not_active Not-in-force
- 2010-01-21 JP JP2010010997A patent/JP5563836B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20100191773A1 (en) | 2010-07-29 |
JP2010176665A (ja) | 2010-08-12 |
US8356044B2 (en) | 2013-01-15 |
EP2211280B1 (en) | 2016-11-16 |
EP2211280A2 (en) | 2010-07-28 |
EP2211280A3 (en) | 2011-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5563836B2 (ja) | ソーシャルインデクシングのためにデフォルト階層訓練を提供するためのシステム及び方法 | |
US9483532B1 (en) | Text processing system and methods for automated topic discovery, content tagging, categorization, and search | |
EP2159715B1 (en) | System and method for providing a topic-directed search | |
Hotho et al. | Information retrieval in folksonomies: Search and ranking | |
US9460195B1 (en) | System and methods for determining term importance, search relevance, and content summarization | |
Balog et al. | Overview of the TREC 2010 Entity Track. | |
Bar-Ilan | Informetrics at the beginning of the 21st century—A review | |
Krestel et al. | Latent dirichlet allocation for tag recommendation | |
JP5391633B2 (ja) | オントロジー空間を規定するタームの推奨 | |
JP2010176666A (ja) | ソーシャルインデックスにおける熱いトピック及び冷めたトピックを検出することによりユーザの関心を管理するためのシステム及び方法 | |
US20110270830A1 (en) | System And Method For Providing Multi-Core And Multi-Level Topical Organization In Social Indexes | |
Demartini et al. | Why finding entities in Wikipedia is difficult, sometimes | |
US8498983B1 (en) | Assisting search with semantic context and automated search options | |
Bellot et al. | INEX Tweet Contextualization task: Evaluation, results and lesson learned | |
Shani et al. | Mining recommendations from the web | |
Li et al. | Labeling clusters from both linguistic and statistical perspectives: A hybrid approach | |
Azarafza et al. | Textrank-based microblogs keyword extraction method for Persian language | |
Gamon et al. | Understanding document aboutness-step one: Identifying salient entities | |
Mohammed et al. | Contextual information search based on ontological user profile | |
Jabeen et al. | Quality-protected folksonomy maintenance approaches: a brief survey | |
Jiang et al. | Context comparison of bursty events in web search and online media | |
Siemiński | Fast algorithm for assessing semantic similarity of texts | |
Lahiri | Keywords at work: investigating keyword extraction in social media applications | |
Ghada et al. | An automatic filtering method for field association words by deleting unnecessary words | |
Makawana et al. | A novel network-based paragraph filtering technique for legal document similarity analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130517 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130528 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130823 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131112 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140312 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140520 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140613 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5563836 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |