JP4394517B2 - 特徴情報抽出方法、特徴情報抽出プログラム、および特徴情報抽出装置 - Google Patents
特徴情報抽出方法、特徴情報抽出プログラム、および特徴情報抽出装置 Download PDFInfo
- Publication number
- JP4394517B2 JP4394517B2 JP2004141985A JP2004141985A JP4394517B2 JP 4394517 B2 JP4394517 B2 JP 4394517B2 JP 2004141985 A JP2004141985 A JP 2004141985A JP 2004141985 A JP2004141985 A JP 2004141985A JP 4394517 B2 JP4394517 B2 JP 4394517B2
- Authority
- JP
- Japan
- Prior art keywords
- feature information
- viewpoint
- extraction
- extracted
- viewpoints
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
・「発明の属する技術分野」中の「関する」の係り元として:1回
・「発明の属する技術分野」中の「係わる」の係り元として:1回
・「発明が解決しようとする課題」中の「向上」の係り元として:6回
前記特徴情報抽出工程で抽出された特徴情報のうち複数の観点で抽出されたものについて各観点におけるそのスコアを算出するスコア算出工程と、
前記スコア算出工程で算出されたスコアに基づいて前記複数の観点で抽出された特徴情報の観点を特定する観点特定工程と、
を含むことを特徴とする特徴情報抽出方法。
前記特徴情報抽出工程で抽出された特徴情報のうち複数の観点で抽出されたものについて各観点におけるそのスコアを算出するスコア算出工程と、
前記スコア算出工程で算出されたスコアに基づいて前記複数の観点で抽出された特徴情報の観点を特定する観点特定工程と、
をコンピュータに実行させることを特徴とする特徴情報抽出プログラム。
前記特徴情報抽出手段により抽出された特徴情報のうち複数の観点で抽出されたものについて各観点におけるそのスコアを算出するスコア算出手段と、
前記スコア算出手段により算出されたスコアに基づいて前記複数の観点で抽出された特徴情報の観点を特定する観点特定手段と、
を備えることを特徴とする特徴情報抽出装置。
201 形態素解析部
202 係り受け解析部
203 抽出ルール記憶部
204 特徴情報抽出部
205 観点特定部
206 抽出結果修正部
Claims (10)
- 特徴情報抽出手段と、スコア算出手段と、観点特定手段と、を備え、観点ごとに特徴情報の係り受けに関する抽出ルールを記憶する記憶装置にアクセス可能なコンピュータが、
前記特徴情報抽出手段により、複数の電子文書から構成される文書群中の個々の電子文書についてその特徴情報を、前記抽出ルールに基づいて前記観点ごとに抽出する特徴情報抽出工程と、
前記スコア算出手段により、前記特徴情報抽出工程で一の観点において抽出された特徴情報と残余の観点において抽出された特徴情報とを照合して、前記特徴情報が一致する観点がある場合、前記特徴情報が一致する観点ごとに当該観点におけるスコアを算出するスコア算出工程と、
前記観点特定手段により、前記スコア算出工程で算出された前記特徴情報が一致する複数の観点におけるスコアに基づいて、前記特徴情報が一致する複数の観点の中から、前記特徴情報の観点を特定する観点特定工程と、
を実行することを特徴とする特徴情報抽出方法。 - 前記スコア算出工程では、前記特徴情報の各観点におけるスコアを前記文書群中で当該特徴情報が当該観点の特徴情報として抽出された頻度に基づいて算出することを特徴とする前記請求項1に記載の特徴情報抽出方法。
- さらに、抽出結果修正手段を備える前記コンピュータが、
前記抽出結果修正手段により、前記複数の観点で抽出された特徴情報のうち前記観点特定工程で特定された観点以外で抽出された特徴情報を削除する抽出結果修正工程を実行することを特徴とする前記請求項1または請求項2に記載の特徴情報抽出方法。 - さらに、抽出結果修正手段を備える前記コンピュータが、
前記抽出結果修正手段により、前記複数の観点で抽出された特徴情報のうち前記観点特定工程で特定された観点以外で抽出された特徴情報の観点を、前記観点特定工程で特定された特徴情報の観点に変更する抽出結果修正工程を実行することを特徴とする前記請求項1または請求項2に記載の特徴情報抽出方法。 - 観点ごとに特徴情報の係り受けに関する抽出ルールを記憶する記憶装置にアクセス可能なコンピュータを、
複数の電子文書から構成される文書群中の個々の電子文書についてその特徴情報を、前記抽出ルールに基づいて前記観点ごとに抽出する特徴情報抽出工程と、
前記特徴情報抽出工程で一の観点において抽出された特徴情報と残余の観点において抽出された特徴情報とを照合して、前記特徴情報が一致する観点がある場合、前記特徴情報が一致する観点ごとに当該観点におけるスコアを算出するスコア算出工程と、
前記スコア算出工程で算出された前記特徴情報が一致する複数の観点におけるスコアに基づいて、前記特徴情報が一致する複数の観点の中から、前記特徴情報の観点を特定する観点特定工程と、
として機能させることを特徴とする特徴情報抽出プログラム。 - 前記スコア算出工程では、前記特徴情報の各観点におけるスコアを前記文書群中で当該特徴情報が当該観点の特徴情報として抽出された頻度に基づいて算出することを特徴とする前記請求項5に記載の特徴情報抽出プログラム。
- さらに、前記コンピュータを、
前記複数の観点で抽出された特徴情報のうち前記観点特定工程で特定された観点以外で抽出された特徴情報の観点を、前記観点特定工程で特定された特徴情報の観点に変更する抽出結果修正工程として機能させることを特徴とする前記請求項5に記載の特徴情報抽出プログラム。 - 観点ごとに特徴情報の係り受けに関する抽出ルールを記憶する記憶装置にアクセス可能な特徴情報抽出装置であって、
複数の電子文書から構成される文書群中の個々の電子文書についてその特徴情報を、前記抽出ルールに基づいて前記観点ごとに抽出する特徴情報抽出手段と、
前記特徴情報抽出手段により一の観点で抽出された特徴情報と残余の観点で抽出された特徴情報とを照合して、前記特徴情報が一致する観点がある場合、前記特徴情報が一致する観点ごとに当該観点におけるスコアを算出するスコア算出手段と、
前記スコア算出手段により算出された前記特徴情報が一致する複数の観点におけるスコアに基づいて、前記特徴情報が一致する複数の観点の中から、前記特徴情報の観点を特定する観点特定手段と、
を備えることを特徴とする特徴情報抽出装置。 - さらに、前記複数の観点で抽出された特徴情報のうち前記観点特定手段により特定された観点以外で抽出された特徴情報を削除する抽出結果修正手段を備えることを特徴とする前記請求項8に記載の特徴情報抽出装置。
- さらに、前記複数の観点で抽出された特徴情報のうち前記観点特定手段により特定された観点以外で抽出された特徴情報の観点を、前記観点特定手段により特定された特徴情報の観点に変更する抽出結果修正手段を備えることを特徴とする前記請求項8に記載の特徴情報抽出装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004141985A JP4394517B2 (ja) | 2004-05-12 | 2004-05-12 | 特徴情報抽出方法、特徴情報抽出プログラム、および特徴情報抽出装置 |
US10/974,643 US7715631B2 (en) | 2004-05-12 | 2004-10-27 | Method and apparatus for extracting feature information, and computer product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004141985A JP4394517B2 (ja) | 2004-05-12 | 2004-05-12 | 特徴情報抽出方法、特徴情報抽出プログラム、および特徴情報抽出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005326922A JP2005326922A (ja) | 2005-11-24 |
JP4394517B2 true JP4394517B2 (ja) | 2010-01-06 |
Family
ID=35473254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004141985A Expired - Fee Related JP4394517B2 (ja) | 2004-05-12 | 2004-05-12 | 特徴情報抽出方法、特徴情報抽出プログラム、および特徴情報抽出装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7715631B2 (ja) |
JP (1) | JP4394517B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4992243B2 (ja) * | 2006-01-31 | 2012-08-08 | 富士通株式会社 | 情報要素処理プログラム、情報要素処理方法及び情報要素処理装置 |
JP5278177B2 (ja) * | 2009-06-08 | 2013-09-04 | 富士通株式会社 | 特許情報構築装置、特許情報構築プログラム、および特許情報構築方法 |
WO2011078194A1 (ja) * | 2009-12-25 | 2011-06-30 | 日本電気株式会社 | テキストマイニングシステム、テキストマイニング方法および記録媒体 |
JP5284990B2 (ja) | 2010-01-08 | 2013-09-11 | インターナショナル・ビジネス・マシーンズ・コーポレーション | キーワードの時系列解析のための処理方法、並びにその処理システム及びコンピュータ・プログラム |
JP4940325B2 (ja) * | 2010-03-29 | 2012-05-30 | 株式会社東芝 | 文書校正支援装置、方法およびプログラム |
US20130073480A1 (en) | 2011-03-22 | 2013-03-21 | Lionel Alberti | Real time cross correlation of intensity and sentiment from social media messages |
CN109240254A (zh) * | 2017-07-10 | 2019-01-18 | 卢照敢 | 基于车况数据流的汽车状态评估及故障预警方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69426541T2 (de) * | 1993-03-12 | 2001-06-13 | Toshiba Kawasaki Kk | Dokumentdetektionssystem mit Darstellung des Detektionsresultats zur Erleichterung des Verständnis des Benutzers |
JP2583386B2 (ja) * | 1993-03-29 | 1997-02-19 | 日本電気株式会社 | キーワード自動抽出装置 |
JP3577819B2 (ja) * | 1995-07-14 | 2004-10-20 | 富士ゼロックス株式会社 | 情報探索装置及び情報探索方法 |
JPH1040253A (ja) * | 1996-07-19 | 1998-02-13 | Nippon Telegr & Teleph Corp <Ntt> | 文章中の単語の観点生成方法及び装置 |
JP3001460B2 (ja) * | 1997-05-21 | 2000-01-24 | 株式会社エヌイーシー情報システムズ | 文書分類装置 |
JPH11250097A (ja) | 1998-03-05 | 1999-09-17 | Nippon Telegr & Teleph Corp <Ntt> | キーワード抽出方法及び装置及びキーワード抽出プログラムを格納した記憶媒体 |
US7275061B1 (en) * | 2000-04-13 | 2007-09-25 | Indraweb.Com, Inc. | Systems and methods for employing an orthogonal corpus for document indexing |
EP1236175A4 (en) * | 1999-08-06 | 2006-07-12 | Lexis Nexis | SYSTEM AND METHOD FOR CLASSIFYING LEGAL CONCEPTS USING A LEGAL TOPIC SCHEME |
JP3925003B2 (ja) | 1999-09-29 | 2007-06-06 | 富士ゼロックス株式会社 | 文書処理装置および文書処理方法 |
JP2002189736A (ja) * | 2000-12-21 | 2002-07-05 | Inpatekku Kk | 技術動向分析用の特許情報記録媒体 |
JP2002189738A (ja) * | 2000-12-21 | 2002-07-05 | Inpatekku Kk | 特許情報等のキーワード分析方法及びキーワード分析装置 |
JP3486406B2 (ja) * | 2001-11-27 | 2004-01-13 | 三菱スペース・ソフトウエア株式会社 | 特許情報検索装置 |
JP2003242176A (ja) * | 2001-12-13 | 2003-08-29 | Sony Corp | 情報処理装置および方法、記録媒体、並びにプログラム |
US7028026B1 (en) * | 2002-05-28 | 2006-04-11 | Ask Jeeves, Inc. | Relevancy-based database retrieval and display techniques |
-
2004
- 2004-05-12 JP JP2004141985A patent/JP4394517B2/ja not_active Expired - Fee Related
- 2004-10-27 US US10/974,643 patent/US7715631B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20060039607A1 (en) | 2006-02-23 |
US7715631B2 (en) | 2010-05-11 |
JP2005326922A (ja) | 2005-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101201037B1 (ko) | 키워드와 웹 사이트 콘텐츠 사이의 관련성 검증 | |
JP5492187B2 (ja) | 編集距離および文書情報を使用する検索結果順位付け | |
JP4726528B2 (ja) | マルチセンスクエリについての関連語提案 | |
JP3270783B2 (ja) | 複数の文書検索方法 | |
US9092524B2 (en) | Topics in relevance ranking model for web search | |
Choudhury et al. | Figure metadata extraction from digital documents | |
US20050021545A1 (en) | Very-large-scale automatic categorizer for Web content | |
US9501557B2 (en) | Information generating computer product, apparatus, and method; and information search computer product, apparatus, and method | |
JP2004062893A (ja) | 重み付き編集距離に基づく例文の自動検索用システムおよび方法 | |
JP5141560B2 (ja) | 情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法 | |
JP5079471B2 (ja) | 同義語抽出装置 | |
US7540430B2 (en) | System and method for string distance measurement for alphanumeric indicia | |
JP4394517B2 (ja) | 特徴情報抽出方法、特徴情報抽出プログラム、および特徴情報抽出装置 | |
JP4640593B2 (ja) | 多言語文書検索装置および多言語文書検索方法、並びに、多言語文書を検索するプログラム | |
JP4754849B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP4102153B2 (ja) | インターネットを利用した文字認識の後処理装置 | |
JP4594992B2 (ja) | 文書データ分類装置、文書データ分類方法、そのプログラム及び記録媒体 | |
JP4895988B2 (ja) | 文書分類装置の余分構造減退方法 | |
JP4682627B2 (ja) | 文書検索装置および方法 | |
JP4985096B2 (ja) | 文書解析システム、および文書解析方法、並びにコンピュータ・プログラム | |
WO2020157887A1 (ja) | 文構造ベクトル化装置、文構造ベクトル化方法、及び文構造ベクトル化プログラム | |
JP2009140411A (ja) | 文章要約装置および文章要約方法 | |
JP2007264858A (ja) | 人名性別判定プログラム、機械翻訳プログラム、人名性別判定装置、機械翻訳装置、人名性別判定処理方法および機械翻訳処理方法 | |
JP3955410B2 (ja) | 類似情報照合装置、類似情報照合方法、及び、類似情報照合プログラムを記録した記録媒体 | |
JP4373478B2 (ja) | 文書検索装置及び文書検索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090907 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091013 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091015 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4394517 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121023 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121023 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131023 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |