JP2011048821A - 相対頻度に基づくフレーズマイニングのためのシステム、方法、及び装置 - Google Patents
相対頻度に基づくフレーズマイニングのためのシステム、方法、及び装置 Download PDFInfo
- Publication number
- JP2011048821A JP2011048821A JP2010178449A JP2010178449A JP2011048821A JP 2011048821 A JP2011048821 A JP 2011048821A JP 2010178449 A JP2010178449 A JP 2010178449A JP 2010178449 A JP2010178449 A JP 2010178449A JP 2011048821 A JP2011048821 A JP 2011048821A
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- phrases
- word
- relative frequency
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000005065 mining Methods 0.000 title claims description 19
- 238000004458 analytical method Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 16
- 238000003860 storage Methods 0.000 claims description 15
- 238000012552 review Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 14
- 238000013500 data storage Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 241000282326 Felis catus Species 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 7
- 238000013515 script Methods 0.000 description 6
- 239000000047 product Substances 0.000 description 5
- 239000004065 semiconductor Substances 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241000239290 Araneae Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】例示的なシステム、方法、プロセス、及び装置が、電子文書内のフレーズを特定する。一以上のフレーズ辞書が、一以上の電子文書のコンテンツから生成される。相対頻度値が、一以上のフレーズ辞書の各々における各フレーズに対して生成される。あるフレーズに対する相対頻度値は、少なくとも部分的に、電子文書におけるフレーズの頻度とフレーズ内の個別のワードそれぞれの頻度との間の比較に基づく。一以上のフレーズが、閾値と各フレーズに対して生成された相対頻度値とに少なくとも部分的に基づいて選択される。選択された一以上のフレーズ、及び選択された一以上のフレーズの各々に関連した相対頻度値が、ユーザに対するグラフィック表示のために出力される。
【選択図】図1
Description
Claims (23)
- 電子文書内のフレーズを特定するコンピュータ実装された方法であって、
少なくとも一つの話題に関する複数のワード及びフレーズを含む電子文書を受領するステップと、
前記電子文書のコンテンツから一以上のフレーズ辞書を生成するステップと、
前記一以上のフレーズ辞書の各々の各フレーズに対して、相対頻度値を生成するステップであって、前記フレーズに対する前記相対頻度値が、少なくとも部分的に、前記電子文書における前記フレーズの頻度と前記フレーズ内の個別のワードそれぞれの頻度との間の比較に基づく、ステップと、
閾値と各フレーズに対して生成された前記相対頻度値とに少なくとも部分的に基づいて、一以上のフレーズを選択するステップと、
前記選択された一以上のフレーズ、及び前記選択された一以上のフレーズの各々に関連した前記相対頻度値を、ユーザに対するグラフィック表示のために出力するステップと、
を包含する、方法。 - 獲得ステップがさらに、複数の電子文書を獲得するステップと、フレーズマイニングのために前記複数の電子文書のサブセットをサンプリングするステップと、をさらに備える、請求項1に記載のコンピュータ実装された方法。
- 前記相対頻度の生成ステップがさらに、各フレーズに対する前記相対頻度値を、少なくとも部分的に、
- 前記一以上のフレーズと前記相対頻度値との出力ステップがさらに、前記電子文書の自動分析を駆動する、請求項1に記載のコンピュータ実装された方法。
- 前記電子文書のコンテンツをスピーチ部分に分割するステップと、前記スピーチ部分から前記一以上のフレーズ辞書を生成するステップと、をさらに包含する、請求項1に記載のコンピュータ実装された方法。
- 前記一以上のフレーズならびに前記対応する前記相対頻度値をレビューして、相対頻度値を有する他のより大きなフレーズ内に組み込まれたフレーズを除去するステップをさらに包含する、請求項1に記載のコンピュータ実装された方法。
- 残る一以上のフレーズ及び相対頻度値を結合して単一のリストにするステップと、前記リストを相対頻度値に基づいてソートするステップと、をさらに包含する、請求項6に記載のコンピュータ実装された方法。
- 電子文書フレーズマイニング装置であって、
電子文書のコンテンツを複数のスピーチ部分に分離する構文解析器であって、前記スピーチ部分が一以上のフレーズを含み、前記構文解析器が、前記電子文書におけるフレーズの各長さを組織化するためにフレーズ辞書を生成する、構文解析器と、
各フレーズ辞書における相対頻度値を生成するフレーズ値計算器であって、フレーズに対する前記相対頻度値が、少なくとも部分的に、前記電子文書における前記フレーズの頻度と前記フレーズ内の個別のワードそれぞれの頻度との間の比較に基づく、フレーズ値計算器と、
閾値と各フレーズに対して生成された前記相対頻度値とに少なくとも部分的に基づいて、一以上のフレーズを選択するソーターと、
前記選択された一以上のフレーズ、及び前記選択された一以上のフレーズの各々に関連した前記相対頻度値を、ユーザに対するグラフィック表示のために出力する出力部と、
を包含する、装置。 - 前記構文解析器が、1ワードフレーズ辞書とnワードフレーズ辞書とを含む複数のフレーズ辞書を生成し、nは特定の辞書におけるワード数に対応し、最大のnは、前記電子文書における前記構文解析器によって特定された最長のフレーズにおけるワード数に対応する、請求項8に記載の装置。
- 前記複数のフレーズ辞書が、1ワードフレーズ辞書と2ワードフレーズ辞書と3ワードフレーズ辞書と4ワードフレーズ辞書と5ワードフレーズ辞書とを含む、請求項9に記載の装置。
- 複数の電子文書を獲得し、フレーズマイニングのために前記複数の電子文書のサブセットをサンプリングする文書サンプラーをさらに備える、請求項8に記載の装置。
- 前記フレーズ値計算器が、各フレーズに対する前記相対頻度値を、少なくとも部分的に
- 前記出力部が、前記選択された一以上のフレーズと前記相対頻度値とを出力して、前記電子文書の自動分析を駆動する、請求項8に記載の装置。
- 前記一以上のフレーズならびに前記対応する前記相対頻度値をレビューして、相対頻度値を有する他のより大きなフレーズ内に組み込まれたフレーズを除去するソーターをさらに備える、請求項8に記載の装置。
- 前記ソーターからの残る一以上のフレーズ及び相対頻度値を結合して単一のリストにし、前記リストを相対頻度値に基づいてソートする結合器をさらに備える、請求項14に記載の装置。
- 処理機械によって実行された場合に、
電子文書のコンテンツを複数のスピーチ部分に分離する構文解析器であって、前記スピーチ部分が一以上のフレーズを含み、前記構文解析器が、前記電子文書におけるフレーズの各長さを組織化するためにフレーズ辞書を生成する、構文解析器と、
各フレーズ辞書における相対頻度値を生成するフレーズ値計算器であって、フレーズに対する前記相対頻度値が、少なくとも部分的に、前記電子文書における前記フレーズの頻度と前記フレーズ内の個別のワードそれぞれの頻度との間の比較に基づく、フレーズ値計算器と、
閾値と各フレーズに対して生成された前記相対頻度値とに少なくとも部分的に基づいて、一以上のフレーズを選択するソーターと、
前記選択された一以上のフレーズ、及び前記選択された一以上のフレーズの各々に関連した前記相対頻度値を、ユーザに対するグラフィック表示のために出力する出力部と、
を備える電子メッセージフレームマイニングシステムを実装する命令を含む、コンピュータ読み取り可能記憶媒体。 - 前記構文解析器が、1ワードフレーズ辞書とnワードフレーズ辞書とを含む複数のフレーズ辞書を生成し、nは特定の辞書におけるワード数に対応し、最大のnは、前記電子文書における前記構文解析器によって特定された最長のフレーズにおけるワード数に対応する、請求項16に記載のコンピュータ読み取り可能記憶媒体。
- 前記複数のフレーズ辞書が、1ワードフレーズ辞書と2ワードフレーズ辞書と3ワードフレーズ辞書と4ワードフレーズ辞書と5ワードフレーズ辞書とを含む、請求項16に記載のコンピュータ読み取り可能記憶媒体。
- 複数の電子文書を獲得し、フレーズマイニングのために前記複数の電子文書のサブセットをサンプリングする文書サンプラーをさらに備える、請求項16に記載のコンピュータ読み取り可能記憶媒体。
- 前記フレーズ値計算器が、各フレーズに対する前記相対頻度値を、少なくとも部分的に、
- 前記出力部が、前記選択された一以上のフレーズと前記相対頻度値とを出力して、前記電子文書の自動分析を駆動する、請求項16に記載のコンピュータ読み取り可能記憶媒体。
- 前記一以上のフレーズならびに前記対応する前記相対頻度値をレビューして、相対頻度値を有する他のより大きなフレーズ内に組み込まれたフレーズを除去するソーターをさらに備える、請求項16に記載のコンピュータ読み取り可能記憶媒体。
- 前記ソーターからの残る一以上のフレーズ及び相対頻度値を結合して単一のリストにし、前記リストを相対頻度値に基づいてソートする結合器をさらに備える、請求項22に記載のコンピュータ読み取り可能記憶媒体。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US23210209P | 2009-08-07 | 2009-08-07 | |
US61/232,102 | 2009-08-07 | ||
US12/540,198 US20110035211A1 (en) | 2009-08-07 | 2009-08-12 | Systems, methods and apparatus for relative frequency based phrase mining |
US12/540,198 | 2009-08-12 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011048821A true JP2011048821A (ja) | 2011-03-10 |
JP5160601B2 JP5160601B2 (ja) | 2013-03-13 |
Family
ID=42941361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010178449A Expired - Fee Related JP5160601B2 (ja) | 2009-08-07 | 2010-08-09 | 相対頻度に基づくフレーズマイニングのためのシステム、方法、及び装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20110035211A1 (ja) |
EP (1) | EP2282271A1 (ja) |
JP (1) | JP5160601B2 (ja) |
AU (1) | AU2010210014B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021026686A (ja) * | 2019-08-08 | 2021-02-22 | 株式会社スタジアム | 文字表示装置、文字表示方法、及びプログラム |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120254071A1 (en) * | 2009-12-17 | 2012-10-04 | Nec Corporation | Text mining system, text mining method and recording medium |
US8429170B2 (en) * | 2010-02-05 | 2013-04-23 | Yahoo! Inc. | System and method for discovering story trends in real time from user generated content |
US20110313756A1 (en) * | 2010-06-21 | 2011-12-22 | Connor Robert A | Text sizer (TM) |
US20120166278A1 (en) * | 2010-12-10 | 2012-06-28 | Macgregor Malcolm | Methods and systems for creating self-learning, contextually relevant, targeted, marketing campaigns, in real time and predictive modes |
US9215506B2 (en) * | 2011-03-31 | 2015-12-15 | Tivo Inc. | Phrase-based communication system |
US8949330B2 (en) * | 2011-08-24 | 2015-02-03 | Venkata Ramana Chennamadhavuni | Systems and methods for automated recommendations for social media |
KR101855147B1 (ko) * | 2011-10-06 | 2018-05-09 | 삼성전자 주식회사 | 사용자 선호도 분석 방법 및 그를 위한 디바이스 |
US9519706B2 (en) * | 2011-11-29 | 2016-12-13 | International Business Machines Corporation | Multiple rule development support for text analytics |
US8818788B1 (en) * | 2012-02-01 | 2014-08-26 | Bazaarvoice, Inc. | System, method and computer program product for identifying words within collection of text applicable to specific sentiment |
US9208145B2 (en) * | 2012-05-07 | 2015-12-08 | Educational Testing Service | Computer-implemented systems and methods for non-monotonic recognition of phrasal terms |
US20140125676A1 (en) * | 2012-10-22 | 2014-05-08 | University Of Massachusetts | Feature Type Spectrum Technique |
US9501469B2 (en) | 2012-11-21 | 2016-11-22 | University Of Massachusetts | Analogy finder |
US20140214479A1 (en) * | 2013-01-25 | 2014-07-31 | Accenture Global Services Lmited | Behavior management and expense insight system |
IL224482B (en) * | 2013-01-29 | 2018-08-30 | Verint Systems Ltd | System and method for keyword spotting using representative dictionary |
US9767157B2 (en) * | 2013-03-15 | 2017-09-19 | Google Inc. | Predicting site quality |
US9230547B2 (en) | 2013-07-10 | 2016-01-05 | Datascription Llc | Metadata extraction of non-transcribed video and audio streams |
US20150019206A1 (en) * | 2013-07-10 | 2015-01-15 | Datascription Llc | Metadata extraction of non-transcribed video and audio streams |
US10521807B2 (en) | 2013-09-05 | 2019-12-31 | TSG Technologies, LLC | Methods and systems for determining a risk of an emotional response of an audience |
US9450771B2 (en) | 2013-11-20 | 2016-09-20 | Blab, Inc. | Determining information inter-relationships from distributed group discussions |
US10652127B2 (en) | 2014-10-03 | 2020-05-12 | The Nielsen Company (Us), Llc | Fusing online media monitoring data with secondary online data feeds to generate ratings data for online media exposure |
US10552462B1 (en) * | 2014-10-28 | 2020-02-04 | Veritas Technologies Llc | Systems and methods for tokenizing user-annotated names |
RU2580424C1 (ru) | 2014-11-28 | 2016-04-10 | Общество С Ограниченной Ответственностью "Яндекс" | Способ выявления незначащих лексических единиц в текстовом сообщении и компьютер |
IL242218B (en) | 2015-10-22 | 2020-11-30 | Verint Systems Ltd | A system and method for maintaining a dynamic dictionary |
IL242219B (en) | 2015-10-22 | 2020-11-30 | Verint Systems Ltd | System and method for keyword searching using both static and dynamic dictionaries |
CN106021572B (zh) * | 2016-05-31 | 2019-05-31 | 北京百度网讯科技有限公司 | 二元特征词典的构建方法和装置 |
US10997225B2 (en) | 2018-03-20 | 2021-05-04 | The Boeing Company | Predictive query processing for complex system lifecycle management |
WO2019182593A1 (en) * | 2018-03-22 | 2019-09-26 | Equifax, Inc. | Text classification using automatically generated seed data |
US11966686B2 (en) * | 2019-06-17 | 2024-04-23 | The Boeing Company | Synthetic intelligent extraction of relevant solutions for lifecycle management of complex systems |
JP7396171B2 (ja) | 2020-03-31 | 2023-12-12 | 住友金属鉱山株式会社 | 鉱石スラリーを調製する処理方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06301722A (ja) * | 1993-04-13 | 1994-10-28 | Matsushita Electric Ind Co Ltd | 形態素解析装置及びキーワード抽出装置 |
JPH0877178A (ja) * | 1994-09-01 | 1996-03-22 | Ibm Japan Ltd | 情報検索システム及び方法 |
JP2003505778A (ja) * | 1999-05-28 | 2003-02-12 | セーダ インコーポレイテッド | 音声制御ユーザインタフェース用の認識文法作成の特定用途を有する句ベースの対話モデル化 |
JP2009048482A (ja) * | 2007-08-21 | 2009-03-05 | Nippon Hoso Kyokai <Nhk> | 情報抽出装置、情報抽出方法、及び情報抽出プログラム |
US7503000B1 (en) * | 2000-07-31 | 2009-03-10 | International Business Machines Corporation | Method for generation of an N-word phrase dictionary from a text corpus |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6597809B1 (en) * | 1999-03-19 | 2003-07-22 | Raf Technology, Inc. | Rollup functions for efficient storage presentation and analysis of data |
US7043422B2 (en) * | 2000-10-13 | 2006-05-09 | Microsoft Corporation | Method and apparatus for distribution-based language model adaptation |
US7711547B2 (en) * | 2001-03-16 | 2010-05-04 | Meaningful Machines, L.L.C. | Word association method and apparatus |
US7716161B2 (en) * | 2002-09-24 | 2010-05-11 | Google, Inc, | Methods and apparatus for serving relevant advertisements |
US7051023B2 (en) * | 2003-04-04 | 2006-05-23 | Yahoo! Inc. | Systems and methods for generating concept units from search queries |
WO2005101236A2 (en) * | 2004-04-06 | 2005-10-27 | Educational Testing Service | Lexical association metric for knowledge-free extraction of phrasal terms |
US7613664B2 (en) * | 2005-03-31 | 2009-11-03 | Palo Alto Research Center Incorporated | Systems and methods for determining user interests |
DK1900103T3 (da) * | 2005-06-16 | 2011-08-15 | Firooz Ghassabian | Datainputsystem |
GB0513225D0 (en) * | 2005-06-29 | 2005-08-03 | Ibm | Method and system for building and contracting a linguistic dictionary |
US7512596B2 (en) * | 2005-08-01 | 2009-03-31 | Business Objects Americas | Processor for fast phrase searching |
US8332207B2 (en) * | 2007-03-26 | 2012-12-11 | Google Inc. | Large language models in machine translation |
US8180630B2 (en) * | 2008-06-06 | 2012-05-15 | Zi Corporation Of Canada, Inc. | Systems and methods for an automated personalized dictionary generator for portable devices |
US8180627B2 (en) * | 2008-07-02 | 2012-05-15 | Siemens Aktiengesellschaft | Method and an apparatus for clustering process models |
-
2009
- 2009-08-12 US US12/540,198 patent/US20110035211A1/en not_active Abandoned
-
2010
- 2010-08-09 AU AU2010210014A patent/AU2010210014B2/en not_active Ceased
- 2010-08-09 JP JP2010178449A patent/JP5160601B2/ja not_active Expired - Fee Related
- 2010-08-09 EP EP10008294A patent/EP2282271A1/en not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06301722A (ja) * | 1993-04-13 | 1994-10-28 | Matsushita Electric Ind Co Ltd | 形態素解析装置及びキーワード抽出装置 |
JPH0877178A (ja) * | 1994-09-01 | 1996-03-22 | Ibm Japan Ltd | 情報検索システム及び方法 |
JP2003505778A (ja) * | 1999-05-28 | 2003-02-12 | セーダ インコーポレイテッド | 音声制御ユーザインタフェース用の認識文法作成の特定用途を有する句ベースの対話モデル化 |
US7503000B1 (en) * | 2000-07-31 | 2009-03-10 | International Business Machines Corporation | Method for generation of an N-word phrase dictionary from a text corpus |
JP2009048482A (ja) * | 2007-08-21 | 2009-03-05 | Nippon Hoso Kyokai <Nhk> | 情報抽出装置、情報抽出方法、及び情報抽出プログラム |
Non-Patent Citations (6)
Title |
---|
CSNG200100888004; 長野 徹 外2名: '"テキストマイニングのための情報抽出"' 情報処理学会研究報告 第2000巻,第91号, 20000927, p.31-38, 社団法人情報処理学会 * |
CSNG200200099009; 安部 潤一郎 外3名: '"テキストデータからの高速データマイニング-探索的文書ブラウジングとウェブデータへの応用-"' 人工知能学会誌 第15巻,第4号, 20000701, p.618-628, 社団法人人工知能学会 * |
CSNG200801043018; 山田 篤: '"社会安全のためのトレーサビリティ-I テキストマイニングと社会活動のトレース"' 画像電子学会誌 第37巻,第6号, 20081125, p.1055-1058, 画像電子学会 * |
JPN6012026787; 安部 潤一郎 外3名: '"テキストデータからの高速データマイニング-探索的文書ブラウジングとウェブデータへの応用-"' 人工知能学会誌 第15巻,第4号, 20000701, p.618-628, 社団法人人工知能学会 * |
JPN6012026788; 山田 篤: '"社会安全のためのトレーサビリティ-I テキストマイニングと社会活動のトレース"' 画像電子学会誌 第37巻,第6号, 20081125, p.1055-1058, 画像電子学会 * |
JPN6012026791; 長野 徹 外2名: '"テキストマイニングのための情報抽出"' 情報処理学会研究報告 第2000巻,第91号, 20000927, p.31-38, 社団法人情報処理学会 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021026686A (ja) * | 2019-08-08 | 2021-02-22 | 株式会社スタジアム | 文字表示装置、文字表示方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
AU2010210014B2 (en) | 2012-06-14 |
US20110035211A1 (en) | 2011-02-10 |
JP5160601B2 (ja) | 2013-03-13 |
AU2010210014A1 (en) | 2011-02-24 |
EP2282271A1 (en) | 2011-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5160601B2 (ja) | 相対頻度に基づくフレーズマイニングのためのシステム、方法、及び装置 | |
US20180260860A1 (en) | A computer-implemented method and system for analyzing and evaluating user reviews | |
US8356025B2 (en) | Systems and methods for detecting sentiment-based topics | |
US11783132B2 (en) | Technologies for dynamically creating representations for regulations | |
US20040098385A1 (en) | Method for indentifying term importance to sample text using reference text | |
US10810245B2 (en) | Hybrid method of building topic ontologies for publisher and marketer content and ad recommendations | |
JPWO2009096523A1 (ja) | 情報分析装置、検索システム、情報分析方法及び情報分析用プログラム | |
CN108228612B (zh) | 一种提取网络事件关键词以及情绪倾向的方法及装置 | |
Quasthoff et al. | Building large resources for text mining: The Leipzig Corpora Collection | |
JP5952756B2 (ja) | 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法 | |
Pandya et al. | Mated: metadata-assisted twitter event detection system | |
CN109933775B (zh) | Ugc内容处理方法及装置 | |
Kanakaraj et al. | NLP based intelligent news search engine using information extraction from e-newspapers | |
JP2012104051A (ja) | 文書インデックス作成装置 | |
JP4428703B2 (ja) | 情報検索方法及びそのシステム並びにコンピュータプログラム | |
Kosa et al. | Cross-evaluation of automated term extraction tools | |
Krilavičius et al. | News media analysis using focused crawl and natural language processing: case of Lithuanian news websites | |
Kuzár | Clustering on social web | |
JP5187187B2 (ja) | 体験情報検索システム | |
US20140236940A1 (en) | System and method for organizing search results | |
US20100287136A1 (en) | Method and system for the recognition and tracking of entities as they become famous | |
CN111382331A (zh) | 一种基于大数据的处理舆情话题的方法、装置和系统 | |
US9779074B2 (en) | Relevancy of communications about unstructured information | |
Vanetik et al. | Real-World Events Discovering with TWIST | |
JP2018147411A (ja) | データ処理装置、データ処理方法、データ処理システム及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120518 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120529 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120822 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120827 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120925 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121005 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5160601 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151221 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |