JP2006065366A - キーワード分類装置およびその方法、端末装置ならびにプログラム - Google Patents
キーワード分類装置およびその方法、端末装置ならびにプログラム Download PDFInfo
- Publication number
- JP2006065366A JP2006065366A JP2004243460A JP2004243460A JP2006065366A JP 2006065366 A JP2006065366 A JP 2006065366A JP 2004243460 A JP2004243460 A JP 2004243460A JP 2004243460 A JP2004243460 A JP 2004243460A JP 2006065366 A JP2006065366 A JP 2006065366A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- storage unit
- noun
- unit
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 キーワード抽出部40は、文書保持部10に保持された複数の問い合わせデータからキーワードとなる名詞句を抽出し、キーワード記憶部50に記憶する。共起表現抽出部60は、前記複数の問い合わせデータから前記抽出されたキーワードの名詞句に共起する述語句を抽出し、共起表現記憶部70に記憶する。分類部80は、前記複数の問い合わせデータをキーワード記憶部50に記憶された名詞句によるキーワードで第1カテゴリに分類し、かつ第1カテゴリに所属する文書を共起表現記憶部70に記憶された前記名詞句によるキーワードに対応する述語句で第2カテゴリに分類し、表示装置3に表示する。
【選択図】 図1
Description
図1を参照すると、本発明の第1の実施の形態は、文書を記憶する磁気ディスク等の文書記憶部1と、プログラム制御により動作するデータ処理装置2と、ディスプレイ装置等の表示装置3と、キーボードやマウス等の入力装置4とを備える。
図14を参照すると、本発明の第3の実施の形態は、文書を記憶する文書記憶部1と、プログラム制御により動作するデータ処理装置2と、ディスプレイ装置等の表示装置3と、キーワードやマウス等の入力装置4とを備える。
図17を参照すると、本発明の第3の実施の形態にかかる端末装置1000は、キーワード分類装置1001と、問い合わせデータ記憶部1002と、表示装置1003と、入力装置1004とで構成される。キーワード分類装置1001は、図1のデータ処理装置2または図11のデータ処理装置2に相当する。問い合わせデータ記憶部1002は、磁気ディスク等で構成され、企業のコンタクトセンターや自治体の問い合わせ窓口に寄せられた過去の大量の問い合わせデータ(その回答データも含む)を記憶している。表示装置1003はLCD等のディスプレイ、入力装置1004はキーワードやマウス等で構成される。
図18を参照すると、本発明の第4の実施の形態にかかる端末装置2000は、キーワード分類装置2001と、問い合わせデータ記憶部2002と、表示装置2003と、入力装置2004と、図形作成装置2005とで構成される。キーワード分類装置2001は、図1のデータ処理装置2に相当する。問い合わせデータ記憶部2002は、磁気ディスク等で構成され、企業のコンタクトセンターや自治体の問い合わせ窓口に寄せられた過去の大量の問い合わせデータを記憶している。図形作成装置2005は、キーワード分類装置2001の分類結果からパレート図を作成して表示装置2003に出力する装置である。表示装置2003はLCD等のディスプレイ、入力装置2004はキーワードやマウス等で構成される。
2…データ処理装置
3…表示装置
4…入力装置
10…文書保持部
20…形態素解析部
30…係り受け解析部
40…キーワード抽出部
50…キーワード記憶部
60…共起表現抽出部
70…共起表現記憶部
80…分類部
90…分類結果記憶部
110…類似キーワード検索部
120…類似キーワード記憶部
401…キーワード選択部
402…キーワード優先度判定部
601…共起表現選択部
602…共起表現優先度判定部
1000、2000…端末装置
1001、2001…キーワード分類装置
1002、2002…問い合わせデータ記憶部
1003、2003…表示装置
1004、2004…入力装置
1005…ユーザ
2005…図形作成装置
2006…マーケティング担当者
Claims (13)
- 分類対象とする複数の文書を保持する文書保持部と、
前記複数の文書からキーワードとなる名詞句を抽出するキーワード抽出部と、
前記抽出されたキーワードを記憶するキーワード記憶部と、
前記複数の文書から前記抽出されたキーワードの名詞句に共起する述語句を抽出する共起表現抽出部と、
前記抽出されたキーワードの名詞句とそれに対応する前記述語句とを記憶する共起表現記憶部と、
前記複数の文書を前記キーワード記憶部に記憶された名詞句によるキーワードで第1カテゴリに分類し、かつ第1カテゴリに所属する文書を前記共起表現記憶部に記憶された前記名詞句によるキーワードに対応する述語句で第2カテゴリに分類する分類部とを備えることを特徴とするキーワード分類装置。 - 前記分類部は、第1カテゴリに文書集合を分類する場合において、ある文書内に名詞句による複数のキーワードが存在する場合に、名詞句の優先度が最も高い名詞句で文書を分類することを特徴とする請求項1記載のキーワード分類装置。
- 前記分類部は、第1カテゴリに文書集合を分類する場合において、ある文書内に名詞句による複数のキーワードが存在する場合に、文書集合全体での名詞句の総出現頻度が最も高い名詞句で文書を分類することを特徴とする請求項1記載のキーワード分類装置。
- 前記分類部は、第1カテゴリに文書集合を分類する場合において、ある文書内に名詞句による複数のキーワードが存在する場合に、文書集合全体での名詞句の後ろ近傍に出現する助詞によって決まる重みの総和が最も高い名詞句で文書を分類することを特徴とする請求項1記載のキーワード分類装置。
- 前記分類部は、前記分類結果を表示装置に出力する場合において、カテゴリに所属する文書集合のうち出現頻度が高い名詞句でありかつ第1カテゴリの名詞句以外の名詞句をカテゴリをあらわす代表語として最初に表示しておき、いずれかの代表語を選択する指示が入力装置から入力されたとき、そのカテゴリに所属する代表語を含む文書集合を別の場所に表示することを特徴とする請求項1記載のキーワード分類装置。
- 分類対象とする複数の文書を保持する文書保持部と、
前記複数の文書からキーワードとなる名詞句を抽出するキーワード抽出部と、
前記抽出されたキーワードを記憶するキーワード記憶部と、
前記キーワード記憶部に記憶されたキーワード毎にそれに類似するキーワードを抽出する類似キーワード検索部と、
前記抽出された類似キーワードを記憶する類似キーワード記憶部と、
前記複数の文書を前記キーワード記憶部に記憶された名詞句によるキーワードでカテゴリに分類し、その結果を出力する際に、カテゴリの名詞句と類似キーワード記憶部に記憶されたその名詞句に類似する名詞句による類似キーワードとをあわせて表示装置に出力する分類部とを備えたことを特徴とするキーワード分類装置。 - 前記複数の文書から前記抽出されたキーワードの名詞句に共起する述語句を抽出する共起表現抽出部と、
前記抽出されたキーワードの名詞句とそれに対応する前記述語句とを記憶する共起表現記憶部とを備え、
前記類似キーワード検索部は、前記キーワード記憶部に記憶されたキーワード毎に、そのキーワードの名詞句に共起する述語句と同じ述語句が前記共起表現記憶部に記憶されている他の名詞句のキーワードを類似キーワードとして抽出するものであることを特徴とする請求項6記載のキーワード分類装置。 - 請求項1ないし7の何れか1項に記載されたキーワード分類装置と該キーワード分類装置で分類された結果を表示する表示装置とを備え、前記文書保持部に企業のコンタクトセンターあるいは自治体の問い合わせ窓口に寄せられた過去の問い合わせデータが記録されている端末装置。
- 請求項1ないし5の何れか1項に記載されたキーワード分類装置と該キーワード分類装置の分類結果からパレート図を作成する図形作成装置とを備え、前記文書保持部に企業のコンタクトセンターあるいは自治体の問い合わせ窓口に寄せられた過去の問い合わせデータが記録されている端末装置。
- a)キーワード抽出部が、文書保持部に保持された分類対象とする複数の文書からキーワードとなる名詞句を抽出し、キーワード記憶部に記憶するステップ、
b)共起表現抽出部が、前記複数の文書から前記抽出されたキーワードの名詞句に共起する述語句を抽出し、前記抽出されたキーワードの名詞句とそれに対応する前記述語句とを共起表現記憶部に記憶するステップ、
c)分類部が、前記複数の文書を前記キーワード記憶部に記憶された名詞句によるキーワードで第1カテゴリに分類し、かつ第1カテゴリに所属する文書を前記共起表現記憶部に記憶された前記名詞句によるキーワードに対応する述語句で第2カテゴリに分類するステップ、
を含むことを特徴とするキーワード分類方法。 - a)キーワード抽出部が、文書保持部に保持された分類対象とする複数の文書からキーワードとなる名詞句を抽出し、キーワード記憶部に記憶するステップ、
b)類似キーワード検索部が、前記キーワード記憶部に記憶されたキーワード毎にそれに類似するキーワードを抽出し、類似キーワード記憶部に記憶するステップ、
c)分類部が、前記複数の文書を前記キーワード記憶部に記憶された名詞句によるキーワードでカテゴリに分類し、その結果を出力する際に、カテゴリの名詞句と前記類似キーワード記憶部に記憶されたその名詞句に類似する名詞句による類似キーワードとをあわせて表示装置に出力するステップ、
を含むことを特徴とするキーワード分類方法。 - 分類対象とする複数の文書を保持する文書保持部、抽出されたキーワードを記憶するキーワード記憶部および抽出された述語句を記憶する共起表現記憶部を有するキーワード分類装置を構成するコンピュータを、
前記文書保持部に保持された分類対象とする複数の文書からキーワードとなる名詞句を抽出し、前記キーワード記憶部に記憶するキーワード抽出手段、
前記複数の文書から前記抽出されたキーワードの名詞句に共起する述語句を抽出し、前記抽出されたキーワードの名詞句とそれに対応する前記述語句とを前記共起表現記憶部に記憶する共起表現抽出手段、
前記複数の文書を前記キーワード記憶部に記憶された名詞句によるキーワードで第1カテゴリに分類し、かつ第1カテゴリに所属する文書を前記共起表現記憶部に記憶された前記名詞句によるキーワードに対応する述語句で第2カテゴリに分類する分類手段、
として機能させるプログラム。 - 分類対象とする複数の文書を保持する文書保持部、抽出されたキーワードを記憶するキーワード記憶部および抽出された類似キーワードを記憶する類似キーワード記憶部を有するキーワード分類装置を構成するコンピュータを、
前記文書保持部に保持された分類対象とする複数の文書からキーワードとなる名詞句を抽出し、前記キーワード記憶部に記憶するキーワード抽出手段、
前記キーワード記憶部に記憶されたキーワード毎にそれに類似するキーワードを抽出し、前記類似キーワード記憶部に記憶する類似キーワード検索手段、
前記複数の文書を前記キーワード記憶部に記憶された名詞句によるキーワードでカテゴリに分類し、その結果を出力する際に、カテゴリの名詞句と前記類似キーワード記憶部に記憶されたその名詞句に類似する名詞句による類似キーワードとをあわせて表示装置に出力する分類手段、
として機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004243460A JP2006065366A (ja) | 2004-08-24 | 2004-08-24 | キーワード分類装置およびその方法、端末装置ならびにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004243460A JP2006065366A (ja) | 2004-08-24 | 2004-08-24 | キーワード分類装置およびその方法、端末装置ならびにプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006065366A true JP2006065366A (ja) | 2006-03-09 |
Family
ID=36111849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004243460A Pending JP2006065366A (ja) | 2004-08-24 | 2004-08-24 | キーワード分類装置およびその方法、端末装置ならびにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006065366A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008027057A (ja) * | 2006-07-19 | 2008-02-07 | Fuji Xerox Co Ltd | 分類情報管理装置、分類情報管理システムおよび分類情報管理プログラム |
JP2008033835A (ja) * | 2006-07-31 | 2008-02-14 | Fujitsu Ltd | オペレータ支援プログラム、オペレータ支援装置およびオペレータ支援方法 |
JP2008225582A (ja) * | 2007-03-08 | 2008-09-25 | Mazda Motor Corp | テキスト分類装置及びプログラム |
JP2009015495A (ja) * | 2007-07-03 | 2009-01-22 | Dainippon Printing Co Ltd | キーワード分類装置 |
JP2009152927A (ja) * | 2007-12-21 | 2009-07-09 | Sony Corp | コンテンツの再生方法および再生システム |
JP2010198141A (ja) * | 2009-02-23 | 2010-09-09 | Rakuten Inc | 文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム |
JP2012160206A (ja) * | 2012-04-27 | 2012-08-23 | Dainippon Printing Co Ltd | ブログ収集サーバ |
JP2012234282A (ja) * | 2011-04-28 | 2012-11-29 | Nec Corp | 要求文書分析システム、方法およびプログラム |
WO2012169380A1 (ja) * | 2011-06-09 | 2012-12-13 | Shindo Tatsuya | 文書共有システム |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08153121A (ja) * | 1994-09-30 | 1996-06-11 | Hitachi Ltd | 文書情報分類方法および文書情報分類装置 |
JPH0991314A (ja) * | 1995-07-14 | 1997-04-04 | Fuji Xerox Co Ltd | 情報探索装置 |
JP2000067068A (ja) * | 1998-08-21 | 2000-03-03 | Nec Corp | ドキュメント自動分類システム及び方法 |
JP2000259670A (ja) * | 1999-03-12 | 2000-09-22 | Dainippon Printing Co Ltd | 文書解析システム及び記録媒体 |
JP2001184358A (ja) * | 1999-12-24 | 2001-07-06 | Fujitsu Ltd | カテゴリ因子による情報検索装置,情報検索方法およびそのプログラム記録媒体 |
JP2003044486A (ja) * | 2001-07-30 | 2003-02-14 | Toshiba Corp | 知識分析システム、クラスタ管理方法およびクラスタ管理プログラム |
JP2003323436A (ja) * | 2002-05-01 | 2003-11-14 | Nippon Telegr & Teleph Corp <Ntt> | 文書分類装置、文書分類方法、プログラム、およびこのプログラムを記録した記録媒体 |
-
2004
- 2004-08-24 JP JP2004243460A patent/JP2006065366A/ja active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08153121A (ja) * | 1994-09-30 | 1996-06-11 | Hitachi Ltd | 文書情報分類方法および文書情報分類装置 |
JPH0991314A (ja) * | 1995-07-14 | 1997-04-04 | Fuji Xerox Co Ltd | 情報探索装置 |
JP2000067068A (ja) * | 1998-08-21 | 2000-03-03 | Nec Corp | ドキュメント自動分類システム及び方法 |
JP2000259670A (ja) * | 1999-03-12 | 2000-09-22 | Dainippon Printing Co Ltd | 文書解析システム及び記録媒体 |
JP2001184358A (ja) * | 1999-12-24 | 2001-07-06 | Fujitsu Ltd | カテゴリ因子による情報検索装置,情報検索方法およびそのプログラム記録媒体 |
JP2003044486A (ja) * | 2001-07-30 | 2003-02-14 | Toshiba Corp | 知識分析システム、クラスタ管理方法およびクラスタ管理プログラム |
JP2003323436A (ja) * | 2002-05-01 | 2003-11-14 | Nippon Telegr & Teleph Corp <Ntt> | 文書分類装置、文書分類方法、プログラム、およびこのプログラムを記録した記録媒体 |
Non-Patent Citations (3)
Title |
---|
幡鎌博: "ナレッジマネジメントへむけて−知識検索・整理および基盤技術−", 人工知能学会誌, vol. 第13巻,第6号, JPN6009012448, 1 November 1998 (1998-11-01), JP, pages 912 - 919, ISSN: 0001276923 * |
清田陽司: "構文情報を利用した電子ニュース記事のクラスタリングシステムの作成と評価", 電子情報通信学会技術研究報告, vol. 第98巻,第210号, JPN6009012445, 24 July 1998 (1998-07-24), JP, pages 15 - 22, ISSN: 0001276925 * |
砂山渡: "未来の流行を予測するWebからの注目キーワードの発見", 知能と情報, vol. 第15巻,第3号, JPN6009012447, 15 June 2003 (2003-06-15), JP, pages 309 - 317, ISSN: 0001276924 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008027057A (ja) * | 2006-07-19 | 2008-02-07 | Fuji Xerox Co Ltd | 分類情報管理装置、分類情報管理システムおよび分類情報管理プログラム |
JP2008033835A (ja) * | 2006-07-31 | 2008-02-14 | Fujitsu Ltd | オペレータ支援プログラム、オペレータ支援装置およびオペレータ支援方法 |
JP4734191B2 (ja) * | 2006-07-31 | 2011-07-27 | 富士通株式会社 | オペレータ支援プログラム、オペレータ支援装置およびオペレータ支援方法 |
JP2008225582A (ja) * | 2007-03-08 | 2008-09-25 | Mazda Motor Corp | テキスト分類装置及びプログラム |
JP2009015495A (ja) * | 2007-07-03 | 2009-01-22 | Dainippon Printing Co Ltd | キーワード分類装置 |
JP2009152927A (ja) * | 2007-12-21 | 2009-07-09 | Sony Corp | コンテンツの再生方法および再生システム |
JP2010198141A (ja) * | 2009-02-23 | 2010-09-09 | Rakuten Inc | 文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム |
JP2012234282A (ja) * | 2011-04-28 | 2012-11-29 | Nec Corp | 要求文書分析システム、方法およびプログラム |
WO2012169380A1 (ja) * | 2011-06-09 | 2012-12-13 | Shindo Tatsuya | 文書共有システム |
JPWO2012169380A1 (ja) * | 2011-06-09 | 2015-02-23 | 達也 進藤 | 文書共有システム |
JP2012160206A (ja) * | 2012-04-27 | 2012-08-23 | Dainippon Printing Co Ltd | ブログ収集サーバ |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bethard et al. | Who should I cite: learning literature search models from citation behavior | |
US8010539B2 (en) | Phrase based snippet generation | |
JP4241934B2 (ja) | テキスト処理及び検索システム及び方法 | |
JP2010055618A (ja) | トピックを基にした検索を提供する方法及びシステム | |
US10747795B2 (en) | Cognitive retrieve and rank search improvements using natural language for product attributes | |
JP2010066870A (ja) | 情報推薦装置および情報推薦方法 | |
JP2011529600A (ja) | 意味ベクトルおよびキーワード解析を使用することによるデータセットを関係付けるための方法および装置 | |
Hu et al. | Enhancing accessibility of microblogging messages using semantic knowledge | |
Duan et al. | VISA: a visual sentiment analysis system | |
Fišer et al. | Distributional modelling for semantic shift detection | |
Caputo et al. | SABRE: A sentiment aspect-based retrieval engine | |
JP2006065366A (ja) | キーワード分類装置およびその方法、端末装置ならびにプログラム | |
Venkatachalam et al. | An ontology-based information extraction and summarization of multiple news articles | |
Grobelnik et al. | Text mining as integration of several related research areas: report on KDD's workshop on text mining 2000 | |
Kerremans et al. | Using data-mining to identify and study patterns in lexical innovation on the web: The NeoCrawler | |
Nazemi et al. | Comparison of full-text articles and abstracts for visual trend analytics through natural language processing | |
Ly et al. | Product review summarization based on facet identification and sentence clustering | |
Wang et al. | An automatic online news topic keyphrase extraction system | |
JP4428703B2 (ja) | 情報検索方法及びそのシステム並びにコンピュータプログラム | |
JP2002288189A (ja) | 文書分類方法及び文書分類装置並びに文書分類処理プログラムを記録した記録媒体 | |
JP2002183175A (ja) | テキストマイニング方法 | |
JP2000105769A (ja) | 文書表示方法 | |
Chakraborti et al. | Multi-document text summarization for competitor intelligence: a methodology | |
JP2005234772A (ja) | 文書管理装置および方法 | |
JP4248828B2 (ja) | 文書処理装置、文書処理方法及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090317 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090525 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20090525 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090811 |