JP2000112949A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2000112949A5 JP2000112949A5 JP1998276313A JP27631398A JP2000112949A5 JP 2000112949 A5 JP2000112949 A5 JP 2000112949A5 JP 1998276313 A JP1998276313 A JP 1998276313A JP 27631398 A JP27631398 A JP 27631398A JP 2000112949 A5 JP2000112949 A5 JP 2000112949A5
- Authority
- JP
- Japan
- Prior art keywords
- information
- evaluation
- keyword
- evaluation unit
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 claims description 47
- 239000000284 extract Substances 0.000 claims description 4
- 230000000877 morphologic Effects 0.000 claims 2
- 239000002131 composite material Substances 0.000 claims 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
Description
【発明の名称】情報判別支援装置、情報判別支援プログラムを記録した記録媒体及び情報判別支援方法
【0001】
【発明の属する技術分野】
本発明は収集した情報を分類するための情報判別支援装置、情報判別支援プログラムを記録した記録媒体及び情報判別支援方法に関し、特に収集した情報を取捨選択する行為を支援するための情報判別支援装置、情報判別支援プログラムを記録した記録媒体及び情報判別支援方法に関する。
【発明の属する技術分野】
本発明は収集した情報を分類するための情報判別支援装置、情報判別支援プログラムを記録した記録媒体及び情報判別支援方法に関し、特に収集した情報を取捨選択する行為を支援するための情報判別支援装置、情報判別支援プログラムを記録した記録媒体及び情報判別支援方法に関する。
【0012】
本発明はこのような点に鑑みなされたものであり、情報群の取捨選択の指針となる情報を提示できる情報判別支援装置及び情報判別支援方法を提供することを目的とする。
本発明はこのような点に鑑みなされたものであり、情報群の取捨選択の指針となる情報を提示できる情報判別支援装置及び情報判別支援方法を提供することを目的とする。
【0035】
キーワード抽出部51は、テキストを形態素解析し特定品詞の語彙のみをキーワードとして抽出する。結合キーワード生成部52は、抽出されたキーワードから特定品詞が連続している部分を抽出し、キーワードを結合して新たな結合キーワードとする。結合キーワード重み付け部53は、キーワードの結合数に応じて結合キーワードに重みを付ける。キーワードペア生成部54は、あるキーワードと同じ文章中に離れて存在する別の特定品詞のキーワードとを組み合わせて1つのキーワードペアとする。キーワードペア重み付け部55は、生成したキーワードペアにキーワード間の距離を考慮した重みを付ける。評価ベクトル空間生成部56は、生成した結合キーワード及びキーワードペアを用い、情報間で重複する割合の高いもしくは重複のない結合キーワード及びキーワードペアを削除した上で、類似度評価のための評価ベクトル空間を生成する。評価ベクトル生成部57は、各評価単位毎に情報中に存在する結合キーワード及びキーワードペアを検出し評価ベクトルを生成する。
キーワード抽出部51は、テキストを形態素解析し特定品詞の語彙のみをキーワードとして抽出する。結合キーワード生成部52は、抽出されたキーワードから特定品詞が連続している部分を抽出し、キーワードを結合して新たな結合キーワードとする。結合キーワード重み付け部53は、キーワードの結合数に応じて結合キーワードに重みを付ける。キーワードペア生成部54は、あるキーワードと同じ文章中に離れて存在する別の特定品詞のキーワードとを組み合わせて1つのキーワードペアとする。キーワードペア重み付け部55は、生成したキーワードペアにキーワード間の距離を考慮した重みを付ける。評価ベクトル空間生成部56は、生成した結合キーワード及びキーワードペアを用い、情報間で重複する割合の高いもしくは重複のない結合キーワード及びキーワードペアを削除した上で、類似度評価のための評価ベクトル空間を生成する。評価ベクトル生成部57は、各評価単位毎に情報中に存在する結合キーワード及びキーワードペアを検出し評価ベクトルを生成する。
Claims (13)
- 情報の内容によって複数の情報群を分類することを支援する情報判別支援装置において、
前記情報群内の各情報を評価単位に分割する情報分割手段と、
各評価単位に含まれる語彙に基づいてキーワード群を生成し、評価単位毎のキーワード群を解析することで各評価単位の記述内容の特徴を数値化する評価基準数値化手段と、
評価単位同士の特徴を比較することで評価単位間の類似度を求め、各情報中及び情報間の各評価単位の類似度に基づいて複数の情報間の類似度を算出し、互いに類似する情報同士の集合に分類する類似情報分類手段と、
を有することを特徴とする情報判別支援装置。 - 前記類似情報分類手段の分類した内容を表示する情報表示手段をさらに有することを特徴とする請求項1記載の情報判別支援装置。
- 前記情報表示手段は、類似する評価単位同士を視覚的に判別できるように表示することを特徴とする請求項2記載の情報判別支援装置。
- 前記類似情報分類手段は、同一の集合に含まれる情報の中で、各情報中及び異なる情報間の評価単位を類似度に応じた順番に並べることを特徴とする請求項1記載の情報判別支援装置。
- 前記評価基準数値化手段は、評価単位に対して形態素解析を行うことで語彙を抽出し、特定の品詞の連続する語彙を結合することにより得られる結合キーワードを前記キーワード群に含めることを特徴とする請求項1記載の情報判別支援装置。
- 前記評価基準数値化手段は、評価単位に対して形態素解析を行うことで連続した固有名詞、普通名詞を検出し、これらを結合することで前記結合キーワードを生成することを特徴とする請求項5記載の情報判別支援装置。
- 前記評価基準数値化手段は、生成した結合キーワードに対して重み付けを行い、重みを反映させて、各評価単位の記述内容の特徴を数値化することを特徴とする請求項5記載の情報判別支援装置。
- 前記評価基準数値化手段は、評価単位に対して形態素解析を行うことで語彙を抽出し、離れて存在する特定品詞の語彙のペアからなるキーワードペアを前記キーワード群に含めることを特徴とする請求項1記載の情報判別支援装置。
- 前記評価基準数値化手段は、1文章中の普通名詞、固有名詞と、その文章中の動詞の直前に存在する普通名詞もしくはサ変名詞を組み合わせて前記キーワードペアを生成することを特徴とする請求項8記載の情報判別支援装置。
- 前記評価基準数値化手段は、生成したキーワードペアに対して重み付けを行い、重みを反映させて、各評価単位の記述内容の特徴を数値化することを特徴とする請求項8記載の情報判別支援装置。
- 前記評価基準数値化手段は、すべての評価単位から生成された前記キーワード群を合成した合成キーワード群を用いて評価ベクトル空間を生成し、評価単位毎の前記キーワード群と前記評価ベクトル空間とを比較することにより、各評価単位の記述内容の特徴を数値化することを特徴とする請求項1記載の情報判別支援装置。
- 情報の内容によって情報群を分類することを支援する情報判別支援プログラムを記録したコンピュータ読み取り可能な記録媒体において、
前記情報群内の各情報を評価単位に分割する情報分割手段、
各評価単位に含まれる語彙に基づいてキーワード群を生成し、評価単位毎のキーワード群を解析することで各評価単位の記述内容の特徴を数値化する評価基準数値化手段、
評価単位同士の特徴を比較することで評価単位間の類似度を求め、各情報中及び情報間の各評価単位の類似度に基づいて複数の情報間の類似度を算出し、互いに類似する情報同士の集合に分類する類似情報分類手段、
としてコンピュータを機能させることを特徴とする情報判別支援プログラムを記録したコンピュータ読み取り可能な記録媒体。 - 情報の内容によって複数の情報群を分類することを支援する情報判 別支援方法において、
情報分割手段によって、前記情報群内の各情報を評価単位に分割し、
評価基準数値化手段によって、各評価単位に含まれる語彙に基づいてキーワード群を生成し、評価単位毎のキーワード群を解析することで各評価単位の記述内容の特徴を数値化し、
類似情報分類手段によって、評価単位同士の特徴を比較することで評価単位間の類似度を求め、各情報中及び情報間の各評価単位の類似度に基づいて複数の情報間の類似度を算出し、互いに類似する情報同士の集合に分類する、
ことを特徴とする情報判別支援方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27631398A JP3921837B2 (ja) | 1998-09-30 | 1998-09-30 | 情報判別支援装置、情報判別支援プログラムを記録した記録媒体及び情報判別支援方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27631398A JP3921837B2 (ja) | 1998-09-30 | 1998-09-30 | 情報判別支援装置、情報判別支援プログラムを記録した記録媒体及び情報判別支援方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2000112949A JP2000112949A (ja) | 2000-04-21 |
JP2000112949A5 true JP2000112949A5 (ja) | 2004-10-21 |
JP3921837B2 JP3921837B2 (ja) | 2007-05-30 |
Family
ID=17567722
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27631398A Expired - Fee Related JP3921837B2 (ja) | 1998-09-30 | 1998-09-30 | 情報判別支援装置、情報判別支援プログラムを記録した記録媒体及び情報判別支援方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3921837B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100356105B1 (ko) * | 2000-05-30 | 2002-10-19 | 주식회사 엔아이비소프트 | 문서 자동 요약을 이용한 문서 분류 검색 방법 및 문서분류 검색 시스템 |
JP2003030237A (ja) * | 2001-07-11 | 2003-01-31 | Just Syst Corp | ファイル検索方法とこの方法を利用可能なファイル検索装置、検索サーバ |
JP4025180B2 (ja) * | 2002-11-19 | 2007-12-19 | 株式会社山武 | 文書管理装置 |
JP4525433B2 (ja) * | 2005-04-08 | 2010-08-18 | 日本電信電話株式会社 | 文書集約装置及びプログラム |
JP4595692B2 (ja) * | 2005-06-15 | 2010-12-08 | 日本電信電話株式会社 | 時系列文書集約方法及び装置及びプログラム及びプログラムを格納した記憶媒体 |
JP2010122823A (ja) * | 2008-11-18 | 2010-06-03 | Nec Corp | テキスト処理システム、情報処理装置、テキストおよび情報の処理方法ならびに処理プログラム |
JP5537649B2 (ja) * | 2009-04-16 | 2014-07-02 | 株式会社東芝 | データ検索およびインデクシングの方法および装置 |
US9262735B2 (en) | 2013-08-12 | 2016-02-16 | International Business Machines Corporation | Identifying and amalgamating conditional actions in business processes |
JP7024364B2 (ja) * | 2017-12-07 | 2022-02-24 | 富士通株式会社 | 特定プログラム、特定方法および情報処理装置 |
JP7348746B2 (ja) * | 2019-04-26 | 2023-09-21 | 一般財団法人日本特許情報機構 | 調査支援方法、調査支援用コンピュータプログラムおよび調査支援システム |
JPWO2022130579A1 (ja) * | 2020-12-17 | 2022-06-23 | ||
JPWO2022130578A1 (ja) * | 2020-12-17 | 2022-06-23 |
-
1998
- 1998-09-30 JP JP27631398A patent/JP3921837B2/ja not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fabbri et al. | Multi-news: A large-scale multi-document summarization dataset and abstractive hierarchical model | |
JP3099756B2 (ja) | 文書処理装置、単語抽出装置及び単語抽出方法 | |
US6507838B1 (en) | Method for combining multi-modal queries for search of multimedia data using time overlap or co-occurrence and relevance scores | |
CN105824959B (zh) | 舆情监控方法及系统 | |
US9015168B2 (en) | Device and method for generating opinion pairs having sentiment orientation based impact relations | |
JP4595692B2 (ja) | 時系列文書集約方法及び装置及びプログラム及びプログラムを格納した記憶媒体 | |
US7213205B1 (en) | Document categorizing method, document categorizing apparatus, and storage medium on which a document categorization program is stored | |
JP2008287698A (ja) | 索引付けシステム及び索引付けプログラム | |
JP2005122295A (ja) | 関係図作成プログラム、関係図作成方法、および関係図作成装置 | |
Lloret | Text summarization: an overview | |
JP2000112949A5 (ja) | ||
Sardinha | An assessment of metaphor retrieval methods | |
Sharoff | Classifying Web corpora into domain and genre using automatic feature identification | |
KR20210044017A (ko) | 상품 리뷰 다차원 분석 방법 및 그 장치 | |
JP3584848B2 (ja) | 文書処理装置、項目検索装置及び項目検索方法 | |
JP3820878B2 (ja) | 情報検索装置,スコア決定装置,情報検索方法,スコア決定方法及びプログラム記録媒体 | |
JP3921837B2 (ja) | 情報判別支援装置、情報判別支援プログラムを記録した記録媒体及び情報判別支援方法 | |
Gupta | A survey of text summarizers for Indian Languages and comparison of their performance | |
JP2000163437A (ja) | 文書分類方法および文書分類装置ならびに文書分類処理プログラムを記録した記録媒体 | |
JP4525433B2 (ja) | 文書集約装置及びプログラム | |
JP2003157271A (ja) | テキストマイニング装置および方法 | |
Rundell | The corpus revolution revisited | |
JP2007293377A (ja) | 主観的ページと非主観的ページを分離する入出力装置 | |
JP2006119697A (ja) | 質問応答システム、質疑応答方法および質疑応答プログラム | |
Rautiainen et al. | TRECVID 2004 Experiments at MediaTeam Oulu. |