JP2009099145A - 対象領域におけるディジタル情報開示方法 - Google Patents
対象領域におけるディジタル情報開示方法 Download PDFInfo
- Publication number
- JP2009099145A JP2009099145A JP2008263362A JP2008263362A JP2009099145A JP 2009099145 A JP2009099145 A JP 2009099145A JP 2008263362 A JP2008263362 A JP 2008263362A JP 2008263362 A JP2008263362 A JP 2008263362A JP 2009099145 A JP2009099145 A JP 2009099145A
- Authority
- JP
- Japan
- Prior art keywords
- topic
- index
- topics
- information
- digital information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
- G06F16/3326—Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/912—Applications of a database
- Y10S707/917—Text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】対象領域中のトピックのそれぞれと、前記トピックに対する訓練マテリアルと、ディジタル情報を含むコーパスとを指定し、トピックのそれぞれについてのトピックモデルを構築し、トピックモデルを訓練マテリアルに対して評価し、トピックモデルを使用してコーパスからのディジタル情報をトピックによってエバーグリーンインデックスに編成する。
【選択図】図3
Description
コーパス:記事、文書、ウェブページ、電子書籍、または、印刷物として利用可能な他のディジタル情報の、集まりまたはセット。
文書:コーパス内の個別の記事。文書はまた、本の章または節、あるいは、より大きな著作物の他の下位区分を含むこともできる。1つの文書が、種々のトピックに関するいくつかの引用ページを含む場合がある。
引用ページ:ページ番号などインデックスに引用されている文書内の位置。引用ページは、単一のページとすることもでき、あるいは1組のページとすることもできるが、これは例えば、サブトピックがトピックモデルにより拡張され、1組のページが、トピックモデルに合致するすべてのページを含む場合である。引用ページはまた、トピックモデルが合致することのできる、ページ全体よりも小さいもの(段落など)とすることもできる。
対象領域:エバーグリーンインデックスを含めたソーシャルインデックス中のトピックまたはサブトピックのセット。
トピック:ソーシャルインデックス内の単一のエントリ。エバーグリーンインデックス中では、トピックには、パターンなど、コーパス内の文書との照合に使用されるトピックモデルが付随する。
サブトピック:ソーシャルインデックス内のトピックの下に階層的にリストされる単一のエントリ。エバーグリーンインデックス中では、サブトピックにもトピックモデルが付随する。
コミュニティ:特定の対象領域中の主要な関心トピックをオンラインで共有し、相互間の対話が少なくとも部分的にコンピュータネットワークで媒介される人々のグループ。対象領域は、ヨットレースや有機園芸のような趣味、歯科学や内科学のような専門的関心、または遅発性糖尿病の管理のような医学的関心など、大まかに定義される。
増強コミュニティ:対象領域に関するソーシャルインデックスを有するコミュニティ。増強コミュニティは、ソーシャルインデックスによって引用された対象領域内の文書の閲覧および投票に参加する。
エバーグリーンインデックス:エバーグリーンインデックスは、コーパスと共に最新の状態を継続的に維持するソーシャルインデックスである。
ソーシャルインデクシングシステム:増強コミュニティ間の情報交換を容易にし、ステータスインジケータを提供し、対象文書をある増強コミュニティから別の増強コミュニティに渡すのを可能にする、オンライン情報交換インフラストラクチャ。相互接続された1組の増強コミュニティが、コミュニティの社会的ネットワークを形成する。
情報ダイエット:情報ダイエットは、ユーザが「消費」する情報、すなわち関心のある対象にわたって読む情報を、特徴付ける。例えば、ユーザは、自分の情報消費活動において、自分の時間の25%を選挙ニュースに費やし、15%を地域社会ニュースに費やし、10%を娯楽トピックに費やし、10%を親類に関係のある健康トピックに関する新しい情報に費やし、20%を自分の特定の専門的関心事における新しい進展に費やし、10%を経済進展に費やし、10%をエコロジーおよび新エネルギー源における進展に費やす場合がある。ソーシャルインデクシングのためのシステムが与えられれば、ユーザは、自分の情報ダイエット中の自分の主要な関心のそれぞれにつき、別々の増強コミュニティに加入することまたはそれをモニタすることができる。
1)1つ以上の記事を、エバーグリーンインデックス中のトピックに対する正の例として指定する。
2)エバーグリーンインデックスを訓練して、パターンすなわちトピックモデルを得る。
3)トピックモデルをコーパスと照合して、合致する記事のセットを得る。
4)合致する記事のいくつかがトピックに関するものでない場合は、1つ以上のこれらの合致する記事を負の例として追加し、ステップ2)に移る。
5)トピックに関するいくつかの記事が合致する記事としてリストされていない場合は、これらの記事を正の例として追加し、ステップ2)に移る。
1)単一単語の候補を生成する(ステップ112)。
2)n−gram(介在する単語のないシーケンス)を生成する(ステップ115)。
3)論理和パターン(論理OR)を生成する(ステップ118)。
4)論理積パターン(論理AND)を生成する(ステップ121)。
5)シーケンスパターンを生成する(ステップ124)。
6)第2レベルの論理和パターンを生成する(ステップ127)。
他の段階、および他の形の候補トピックモデル86、述語、ならびに認識制約表現も可能である。例として、表1に、K.アリベック、「Biohazard」、(Random House)(1999)から生成された、パターンの形のトピックモデルを提供する。各述語において、論理積を左右の角括弧で示す。論理和を左右の丸括弧で示す。n−gramを左右の中括弧で示す。曖昧さが排除されたライブラリパターンの名前の前に、ドル記号を付す。
Claims (10)
- 対象領域におけるディジタル情報の開示を実施する方法であって、
対象領域中のトピックのそれぞれと、前記トピックに対する訓練マテリアルと、ディジタル情報を含むコーパスとを指定し、
前記トピックのそれぞれについてのトピックモデルを構築し、
前記トピックモデルを前記訓練マテリアルに対して評価し、
前記トピックモデルを使用して前記コーパスからの前記ディジタル情報を前記トピックによってエバーグリーンインデックスに編成する、
ことを含むことを特徴とする方法。 - 請求項1に記載の方法であって、
性能、単純さ、および偏向のうちの少なくとも1つに関して前記トピックモデルを評価することをさらに含むことを特徴とする方法。 - 請求項1に記載の方法であって、
各トピックモデルを有限状態言語の述語として形成し、
各述語を、前記述語が合致する前記コーパス中の位置を返すクエリとして前記コーパスに適用する、
ことをさらに含むことを特徴とする方法。 - 請求項1に記載の方法であって、
前記コーパス中の記事を前記エバーグリーンインデックス中の前記トピックモデルに対して分類し、
前記分類した記事を前記エバーグリーンインデックス中で提示する、
ことをさらに含むことを特徴とする方法。 - 請求項1に記載の方法であって、
前記トピックの少なくとも1つの下に1つ以上のサブトピックを階層的に構築することをさらに含むことを特徴とする方法。 - 請求項1に記載の方法であって、
各トピックモデルについての正しい引用に対応する前記コーパス中の記事を含む正の訓練例のセットを定義することをさらに含むことを特徴とする方法。 - 請求項6に記載の方法であって、
各トピックモデルについての正しくない引用に対応する前記コーパス中の記事を含む負の訓練例のセットを定義することをさらに含むことを特徴とする方法。 - 請求項6に記載の方法であって、
各トピックの特性を表し、前記正の訓練例セット中の前記記事に基づく、基底単語を識別し、
前記基底単語の1つ以上を、シードワードとして前記トピックについての前記トピックモデルのそれぞれに組み入れる、
ことをさらに含むことを特徴とする方法。 - 請求項8に記載の方法であって、
前記トピック中の単語と、前記トピックの引用によって参照される前記コーパス中のラベルに近接する単語とのうちの少なくとも一方を含む追加の単語を、前記シードワードと共に含めることをさらに含むことを特徴とする方法。 - 請求項1に記載の方法であって、
前記ディジタル情報は、印刷された文書と、ウェブページと、ディジタル媒体中に書かれたマテリアルとのうちの1つ以上を含むことを特徴とする方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US99863607P | 2007-10-12 | 2007-10-12 | |
US60/998,636 | 2007-10-12 | ||
US12/190,552 US8165985B2 (en) | 2007-10-12 | 2008-08-12 | System and method for performing discovery of digital information in a subject area |
US12/190,552 | 2008-08-12 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2009099145A true JP2009099145A (ja) | 2009-05-07 |
JP2009099145A5 JP2009099145A5 (ja) | 2011-11-24 |
JP5329900B2 JP5329900B2 (ja) | 2013-10-30 |
Family
ID=40349994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008263362A Expired - Fee Related JP5329900B2 (ja) | 2007-10-12 | 2008-10-10 | 対象領域におけるディジタル情報開示方法 |
Country Status (3)
Country | Link |
---|---|
US (2) | US8165985B2 (ja) |
EP (1) | EP2048605B1 (ja) |
JP (1) | JP5329900B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012014544A (ja) * | 2010-07-02 | 2012-01-19 | Nippon Telegr & Teleph Corp <Ntt> | コーディネート推薦装置、コーディネート推薦方法及びそのプログラム |
JP2012108867A (ja) * | 2010-10-29 | 2012-06-07 | Nippon Telegr & Teleph Corp <Ntt> | データ抽出装置、データ抽出方法、及びそのプログラム |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8583639B2 (en) * | 2008-02-19 | 2013-11-12 | International Business Machines Corporation | Method and system using machine learning to automatically discover home pages on the internet |
US20220327484A1 (en) * | 2008-03-21 | 2022-10-13 | Brian Gale | System and method for clinical practice and health risk reduction monitoring |
US8095540B2 (en) * | 2008-04-16 | 2012-01-10 | Yahoo! Inc. | Identifying superphrases of text strings |
US8549016B2 (en) * | 2008-11-14 | 2013-10-01 | Palo Alto Research Center Incorporated | System and method for providing robust topic identification in social indexes |
US8239397B2 (en) * | 2009-01-27 | 2012-08-07 | Palo Alto Research Center Incorporated | System and method for managing user attention by detecting hot and cold topics in social indexes |
US8356044B2 (en) * | 2009-01-27 | 2013-01-15 | Palo Alto Research Center Incorporated | System and method for providing default hierarchical training for social indexing |
US8452781B2 (en) * | 2009-01-27 | 2013-05-28 | Palo Alto Research Center Incorporated | System and method for using banded topic relevance and time for article prioritization |
EP2312515A1 (en) * | 2009-10-16 | 2011-04-20 | Alcatel Lucent | Device for determining potential future interests to be introduced into profile(s) of user(s) of communication equipment(s) |
US8311792B1 (en) * | 2009-12-23 | 2012-11-13 | Intuit Inc. | System and method for ranking a posting |
US8332395B2 (en) * | 2010-02-25 | 2012-12-11 | International Business Machines Corporation | Graphically searching and displaying data |
US9031944B2 (en) * | 2010-04-30 | 2015-05-12 | Palo Alto Research Center Incorporated | System and method for providing multi-core and multi-level topical organization in social indexes |
US8645298B2 (en) * | 2010-10-26 | 2014-02-04 | Microsoft Corporation | Topic models |
US9542479B2 (en) * | 2011-02-15 | 2017-01-10 | Telenav, Inc. | Navigation system with rule based point of interest classification mechanism and method of operation thereof |
WO2012151743A1 (en) * | 2011-05-10 | 2012-11-15 | Nokia Corporation | Methods, apparatuses and computer program products for providing topic model with wording preferences |
US9613003B1 (en) * | 2011-09-23 | 2017-04-04 | Amazon Technologies, Inc. | Identifying topics in a digital work |
US9639518B1 (en) | 2011-09-23 | 2017-05-02 | Amazon Technologies, Inc. | Identifying entities in a digital work |
US9449526B1 (en) | 2011-09-23 | 2016-09-20 | Amazon Technologies, Inc. | Generating a game related to a digital work |
US9471547B1 (en) | 2011-09-23 | 2016-10-18 | Amazon Technologies, Inc. | Navigating supplemental information for a digital work |
US10339452B2 (en) | 2013-02-06 | 2019-07-02 | Verint Systems Ltd. | Automated ontology development |
US9189540B2 (en) | 2013-04-05 | 2015-11-17 | Hewlett-Packard Development Company, L.P. | Mobile web-based platform for providing a contextual alignment view of a corpus of documents |
US9575958B1 (en) * | 2013-05-02 | 2017-02-21 | Athena Ann Smyros | Differentiation testing |
US20150066506A1 (en) | 2013-08-30 | 2015-03-05 | Verint Systems Ltd. | System and Method of Text Zoning |
US10521807B2 (en) | 2013-09-05 | 2019-12-31 | TSG Technologies, LLC | Methods and systems for determining a risk of an emotional response of an audience |
US9977830B2 (en) | 2014-01-31 | 2018-05-22 | Verint Systems Ltd. | Call summary |
US10255346B2 (en) | 2014-01-31 | 2019-04-09 | Verint Systems Ltd. | Tagging relations with N-best |
CN105335347A (zh) * | 2014-05-30 | 2016-02-17 | 富士通株式会社 | 确定针对特定话题的情绪及其原因的方法和设备 |
CN104050302B (zh) * | 2014-07-10 | 2017-05-24 | 华东师范大学 | 一种基于图谱模型的话题探测系统 |
US10592841B2 (en) | 2014-10-10 | 2020-03-17 | Salesforce.Com, Inc. | Automatic clustering by topic and prioritizing online feed items |
US9984166B2 (en) | 2014-10-10 | 2018-05-29 | Salesforce.Com, Inc. | Systems and methods of de-duplicating similar news feed items |
US20160217127A1 (en) * | 2015-01-27 | 2016-07-28 | Verint Systems Ltd. | Identification of significant phrases using multiple language models |
US10558759B1 (en) * | 2018-01-04 | 2020-02-11 | Facebook, Inc. | Consumer insights analysis using word embeddings |
US10509863B1 (en) * | 2018-01-04 | 2019-12-17 | Facebook, Inc. | Consumer insights analysis using word embeddings |
US20190279073A1 (en) * | 2018-03-07 | 2019-09-12 | Sap Se | Computer Generated Determination of Patentability |
US11176549B2 (en) * | 2018-04-11 | 2021-11-16 | Sap Se | Systems and methods for matching transactional data |
WO2020086580A1 (en) | 2018-10-22 | 2020-04-30 | Carlson William D | Therapeutic combinations of tdfrps and additional agents and methods of use |
US11769012B2 (en) | 2019-03-27 | 2023-09-26 | Verint Americas Inc. | Automated system and method to prioritize language model and ontology expansion and pruning |
US11275796B2 (en) | 2019-04-30 | 2022-03-15 | International Business Machines Corporation | Dynamic faceted search on a document corpus |
US11003701B2 (en) * | 2019-04-30 | 2021-05-11 | International Business Machines Corporation | Dynamic faceted search on a document corpus |
US11521601B2 (en) * | 2019-10-18 | 2022-12-06 | Invoca, Inc. | Detecting extraneous topic information using artificial intelligence models |
US11410644B2 (en) | 2019-10-18 | 2022-08-09 | Invoca, Inc. | Generating training datasets for a supervised learning topic model from outputs of a discovery topic model |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05324726A (ja) * | 1992-05-25 | 1993-12-07 | Fujitsu Ltd | 文書データ分類装置及び文書分類機能構築装置 |
JPH0778186A (ja) * | 1993-05-17 | 1995-03-20 | Ricoh Co Ltd | 文書処理装置 |
JPH08305726A (ja) * | 1995-04-28 | 1996-11-22 | Fuji Xerox Co Ltd | 情報検索装置 |
JP2005190255A (ja) * | 2003-12-26 | 2005-07-14 | Fuji Xerox Co Ltd | データ分類処理装置、およびデータ分類処理方法、並びにコンピュータ・プログラム |
Family Cites Families (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5369763A (en) * | 1989-02-01 | 1994-11-29 | Kansas State University Research Foundation | Data storage and retrieval system with improved data base structure |
US5257939A (en) * | 1992-10-13 | 1993-11-02 | Robinson Don T | Cultural knowledge board game |
US5724567A (en) * | 1994-04-25 | 1998-03-03 | Apple Computer, Inc. | System for directing relevance-ranked data objects to computer users |
JP2809341B2 (ja) * | 1994-11-18 | 1998-10-08 | 松下電器産業株式会社 | 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。 |
US5671342A (en) * | 1994-11-30 | 1997-09-23 | Intel Corporation | Method and apparatus for displaying information relating to a story and a story indicator in a computer system |
US5530852A (en) * | 1994-12-20 | 1996-06-25 | Sun Microsystems, Inc. | Method for extracting profiles and topics from a first file written in a first markup language and generating files in different markup languages containing the profiles and topics for use in accessing data described by the profiles and topics |
US5680511A (en) * | 1995-06-07 | 1997-10-21 | Dragon Systems, Inc. | Systems and methods for word recognition |
US5907836A (en) * | 1995-07-31 | 1999-05-25 | Kabushiki Kaisha Toshiba | Information filtering apparatus for selecting predetermined article from plural articles to present selected article to user, and method therefore |
US6021403A (en) * | 1996-07-19 | 2000-02-01 | Microsoft Corporation | Intelligent user assistance facility |
US5907677A (en) * | 1996-08-23 | 1999-05-25 | Ecall Inc. | Method for establishing anonymous communication links |
EP0848347A1 (en) * | 1996-12-11 | 1998-06-17 | Sony Corporation | Method of extracting features characterising objects |
US6285987B1 (en) * | 1997-01-22 | 2001-09-04 | Engage, Inc. | Internet advertising system |
US6233575B1 (en) * | 1997-06-24 | 2001-05-15 | International Business Machines Corporation | Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values |
US6292830B1 (en) * | 1997-08-08 | 2001-09-18 | Iterations Llc | System for optimizing interaction among agents acting on multiple levels |
US6052657A (en) * | 1997-09-09 | 2000-04-18 | Dragon Systems, Inc. | Text segmentation and identification of topic using language models |
US6598045B2 (en) * | 1998-04-07 | 2003-07-22 | Intel Corporation | System and method for piecemeal relevance evaluation |
US7275061B1 (en) * | 2000-04-13 | 2007-09-25 | Indraweb.Com, Inc. | Systems and methods for employing an orthogonal corpus for document indexing |
US6269361B1 (en) * | 1999-05-28 | 2001-07-31 | Goto.Com | System and method for influencing a position on a search result list generated by a computer network search engine |
US6981040B1 (en) * | 1999-12-28 | 2005-12-27 | Utopy, Inc. | Automatic, personalized online information and product services |
US6397211B1 (en) * | 2000-01-03 | 2002-05-28 | International Business Machines Corporation | System and method for identifying useless documents |
JP3562572B2 (ja) * | 2000-05-02 | 2004-09-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データベースのドキュメントにおける新規な事項・新規クラスの検出及び追跡 |
US7062485B1 (en) * | 2000-09-01 | 2006-06-13 | Huaichuan Hubert Jin | Method and apparatus for score normalization for information retrieval applications |
US7185065B1 (en) * | 2000-10-11 | 2007-02-27 | Buzzmetrics Ltd | System and method for scoring electronic messages |
US7200606B2 (en) * | 2000-11-07 | 2007-04-03 | The Regents Of The University Of California | Method and system for selecting documents by measuring document quality |
US6772120B1 (en) * | 2000-11-21 | 2004-08-03 | Hewlett-Packard Development Company, L.P. | Computer method and apparatus for segmenting text streams |
US7685224B2 (en) * | 2001-01-11 | 2010-03-23 | Truelocal Inc. | Method for providing an attribute bounded network of computers |
US20020161838A1 (en) * | 2001-04-27 | 2002-10-31 | Pickover Cilfford A. | Method and apparatus for targeting information |
US7092888B1 (en) * | 2001-10-26 | 2006-08-15 | Verizon Corporate Services Group Inc. | Unsupervised training in natural language call routing |
US7716161B2 (en) * | 2002-09-24 | 2010-05-11 | Google, Inc, | Methods and apparatus for serving relevant advertisements |
US7752072B2 (en) * | 2002-07-16 | 2010-07-06 | Google Inc. | Method and system for providing advertising through content specific nodes over the internet |
US20050226511A1 (en) | 2002-08-26 | 2005-10-13 | Short Gordon K | Apparatus and method for organizing and presenting content |
US7320000B2 (en) * | 2002-12-04 | 2008-01-15 | International Business Machines Corporation | Method and apparatus for populating a predefined concept hierarchy or other hierarchical set of classified data items by minimizing system entrophy |
US7467202B2 (en) * | 2003-09-10 | 2008-12-16 | Fidelis Security Systems | High-performance network content analysis platform |
GB0322600D0 (en) * | 2003-09-26 | 2003-10-29 | Univ Ulster | Thematic retrieval in heterogeneous data repositories |
JP2005158010A (ja) * | 2003-10-31 | 2005-06-16 | Hewlett-Packard Development Co Lp | 分類評価装置・方法及びプログラム |
WO2005050472A2 (en) * | 2003-11-21 | 2005-06-02 | Philips Intellectual Property & Standards Gmbh | Text segmentation and topic annotation for document structuring |
US20070244690A1 (en) * | 2003-11-21 | 2007-10-18 | Koninklijke Philips Electronic, N.V. | Clustering of Text for Structuring of Text Documents and Training of Language Models |
WO2005050621A2 (en) * | 2003-11-21 | 2005-06-02 | Philips Intellectual Property & Standards Gmbh | Topic specific models for text formatting and speech recognition |
JP4808160B2 (ja) * | 2003-11-21 | 2011-11-02 | ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー | トピック特異的言語モデルおよびトピック特異的ラベル統計によるユーザー対話を用いたテキストセグメント分割およびラベル付与 |
US7293019B2 (en) * | 2004-03-02 | 2007-11-06 | Microsoft Corporation | Principles and methods for personalizing newsfeeds via an analysis of information novelty and dynamics |
US7426557B2 (en) * | 2004-05-14 | 2008-09-16 | International Business Machines Corporation | System, method, and service for inducing a pattern of communication among various parties |
US7281022B2 (en) * | 2004-05-15 | 2007-10-09 | International Business Machines Corporation | System, method, and service for segmenting a topic into chatter and subtopics |
JP2005352878A (ja) * | 2004-06-11 | 2005-12-22 | Hitachi Ltd | 文書検索システム、検索サーバ、及び検索クライアント |
US7567959B2 (en) * | 2004-07-26 | 2009-07-28 | Google Inc. | Multiple index based information retrieval system |
US20060053171A1 (en) * | 2004-09-03 | 2006-03-09 | Biowisdom Limited | System and method for curating one or more multi-relational ontologies |
US7496567B1 (en) * | 2004-10-01 | 2009-02-24 | Terril John Steichen | System and method for document categorization |
US20060167930A1 (en) * | 2004-10-08 | 2006-07-27 | George Witwer | Self-organized concept search and data storage method |
US7548917B2 (en) * | 2005-05-06 | 2009-06-16 | Nelson Information Systems, Inc. | Database and index organization for enhanced document retrieval |
US20070050356A1 (en) * | 2005-08-23 | 2007-03-01 | Amadio William J | Query construction for semantic topic indexes derived by non-negative matrix factorization |
US7707206B2 (en) * | 2005-09-21 | 2010-04-27 | Praxeon, Inc. | Document processing |
US9069847B2 (en) | 2005-10-21 | 2015-06-30 | Battelle Memorial Institute | Data visualization methods, data visualization devices, data visualization apparatuses, and articles of manufacture |
US20070156622A1 (en) * | 2006-01-05 | 2007-07-05 | Akkiraju Rama K | Method and system to compose software applications by combining planning with semantic reasoning |
AU2007219997A1 (en) * | 2006-02-28 | 2007-09-07 | Buzzlogic, Inc. | Social analytics system and method for analyzing conversations in social media |
US8326686B2 (en) * | 2006-03-30 | 2012-12-04 | Google Inc. | Automatically generating ads and ad-serving index |
US7890485B2 (en) * | 2006-04-13 | 2011-02-15 | Tony Malandain | Knowledge management tool |
US7809723B2 (en) * | 2006-06-26 | 2010-10-05 | Microsoft Corporation | Distributed hierarchical text classification framework |
US20080040221A1 (en) * | 2006-08-08 | 2008-02-14 | Google Inc. | Interest Targeting |
US20080126319A1 (en) * | 2006-08-25 | 2008-05-29 | Ohad Lisral Bukai | Automated short free-text scoring method and system |
US20080065600A1 (en) * | 2006-09-12 | 2008-03-13 | Harold Batteram | Method and apparatus for providing search results from content on a computer network |
US7921092B2 (en) * | 2006-12-04 | 2011-04-05 | Yahoo! Inc. | Topic-focused search result summaries |
WO2008120030A1 (en) * | 2007-04-02 | 2008-10-09 | Sobha Renaissance Information | Latent metonymical analysis and indexing [lmai] |
-
2008
- 2008-08-12 US US12/190,552 patent/US8165985B2/en not_active Expired - Fee Related
- 2008-10-10 JP JP2008263362A patent/JP5329900B2/ja not_active Expired - Fee Related
- 2008-10-10 EP EP08166314.8A patent/EP2048605B1/en not_active Ceased
-
2012
- 2012-04-23 US US13/453,984 patent/US8706678B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05324726A (ja) * | 1992-05-25 | 1993-12-07 | Fujitsu Ltd | 文書データ分類装置及び文書分類機能構築装置 |
JPH0778186A (ja) * | 1993-05-17 | 1995-03-20 | Ricoh Co Ltd | 文書処理装置 |
JPH08305726A (ja) * | 1995-04-28 | 1996-11-22 | Fuji Xerox Co Ltd | 情報検索装置 |
JP2005190255A (ja) * | 2003-12-26 | 2005-07-14 | Fuji Xerox Co Ltd | データ分類処理装置、およびデータ分類処理方法、並びにコンピュータ・プログラム |
Non-Patent Citations (2)
Title |
---|
CSNG199800298005; 河合 敦夫: '意味属性の学習結果にもとづく文書自動分類方式' 情報処理学会論文誌 Vol.33,No.9, 19920915, PP.1114-1122., 情報処理学会 * |
JPN6012052325; 河合 敦夫: '意味属性の学習結果にもとづく文書自動分類方式' 情報処理学会論文誌 Vol.33,No.9, 19920915, PP.1114-1122., 情報処理学会 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012014544A (ja) * | 2010-07-02 | 2012-01-19 | Nippon Telegr & Teleph Corp <Ntt> | コーディネート推薦装置、コーディネート推薦方法及びそのプログラム |
JP2012108867A (ja) * | 2010-10-29 | 2012-06-07 | Nippon Telegr & Teleph Corp <Ntt> | データ抽出装置、データ抽出方法、及びそのプログラム |
Also Published As
Publication number | Publication date |
---|---|
US8165985B2 (en) | 2012-04-24 |
EP2048605A3 (en) | 2012-11-28 |
US8706678B2 (en) | 2014-04-22 |
EP2048605A2 (en) | 2009-04-15 |
JP5329900B2 (ja) | 2013-10-30 |
US20120209797A1 (en) | 2012-08-16 |
EP2048605B1 (en) | 2016-08-24 |
US20090099996A1 (en) | 2009-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5329900B2 (ja) | 対象領域におけるディジタル情報開示方法 | |
US8930388B2 (en) | System and method for providing orientation into subject areas of digital information for augmented communities | |
US8073682B2 (en) | System and method for prospecting digital information | |
Beale | Supporting serendipity: Using ambient intelligence to augment user exploration for data mining and web browsing | |
CA2767838C (en) | Progressive filtering of search results | |
US20100125540A1 (en) | System And Method For Providing Robust Topic Identification In Social Indexes | |
US20100274753A1 (en) | Methods for filtering data and filling in missing data using nonlinear inference | |
WO2010000064A1 (en) | Information processing with integrated semantic contexts | |
WO2010000065A1 (en) | Facilitating collaborative searching using semantic contexts associated with information | |
Taghavi et al. | New insights towards developing recommender systems | |
Jiang et al. | Towards intelligent geospatial data discovery: a machine learning framework for search ranking | |
WO2008032037A1 (en) | Method and system for filtering and searching data using word frequencies | |
Sheil | Discovering user intent in e-commerce clickstreams | |
Portugal et al. | Requirements engineering for general recommender systems | |
Giuliani | Studying, developing, and experimenting contextual advertising systems | |
Chung et al. | Browsing the underdeveloped web: An experiment on the arabic medical web directory | |
Vrandecic | Incentives for the Semantic Web (INSEMTIVE 2008) | |
Mao | Epistemology-based social search for exploratory information seeking | |
Yazagan | The Potential of Bookmark Based User Profiles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111005 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111005 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121009 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130725 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5329900 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |