JP5424393B2 - 単語テーマ関連度算出装置、単語テーマ関連度算出用プログラムおよび情報検索装置 - Google Patents
単語テーマ関連度算出装置、単語テーマ関連度算出用プログラムおよび情報検索装置 Download PDFInfo
- Publication number
- JP5424393B2 JP5424393B2 JP2009237227A JP2009237227A JP5424393B2 JP 5424393 B2 JP5424393 B2 JP 5424393B2 JP 2009237227 A JP2009237227 A JP 2009237227A JP 2009237227 A JP2009237227 A JP 2009237227A JP 5424393 B2 JP5424393 B2 JP 5424393B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- theme
- words
- relevance
- positive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
ユーザは、提示された検索結果のWebページ(文書)を適宜閲覧し、検索結果のWebページが、対象テーマに関連するWebページ(ポジティブ評価Webページ)であるか対象テーマ関連しないWebページ(ネガティブ評価Webページ)であるかの評価を行い、その評価結果をクライアント端末20から入力する。ここで、ユーザが実際に閲覧して評価するWebページの件数は、数件(例えば3〜5件程度)でよい。
Claims (12)
- 文書に含まれる各単語の、対象テーマに対する関連度を算出する単語テーマ関連度算出装置において、
複数の単語を含む複数の評価対象の文書それぞれについて、それが対象テーマに関連するポジティブ評価文書であるか対象テーマに関連しないネガティブ評価文書であるかのユーザからの評価を受け付け、各評価対象の文書から単語を抽出すると共に、ポジティブ評価文書中のみに出現するポジティブ単語、ネガティブ評価文書中のみに出現するネガティブ単語、ポジティブ評価文書とネガティブ評価文書の双方に出現する共通単語に分類する単語抽出・分類部と、
前記単語抽出・分類部により抽出・分類されたポジティブ単語の出現頻度と他の単語との隣接関係に基づき、該ポジティブ単語の対象テーマに対するテーマ関連度を算出するポジティブ単語用テーマ関連度算出部と、
前記単語抽出・分類部により抽出・分類された共通単語の出現頻度と他の単語との隣接関係に基づき、該共通単語の対象テーマに対するテーマ関連度を算出する共通単語用テーマ関連度算出部と、
前記単語抽出・分類部により抽出・分類されたネガティブ単語の出現頻度と制約条件下における他の単語との隣接関係に基づき、該ネガティブ単語の対象テーマに対するテーマ関連度を算出するネガティブ単語用テーマ関連度算出部とを備えたことを特徴とする単語テーマ関連度算出装置。 - さらに、前記単語抽出・分類部により抽出・分類された単語と、前記ポジティブ単語用テーマ関連度算出部、前記共通単語用テーマ関連度算出部および前記ネガティブ単語用テーマ関連度算出部により算出されたテーマ関連度を保存・管理するテーマ関連単語データベースを備えたことを特徴とする請求項1に記載の単語テーマ関連度算出装置。
- 前記ポジティブ単語用テーマ関連度算出部は、ポジティブ単語の出現頻度に基づく特徴値と、単語の概念上での上下関係および並列関係を含む単語間の関連を示すシソーラス辞書における単語間の隣接関係に基づく特徴値をそれぞれ求め、それらの特徴値を組み合わせてテーマ関連度を算出することを特徴とする請求項1または2に記載の単語テーマ関連度算出装置。
- 前記共通単語用テーマ関連度算出部は、ポジティブ単語とネガティブ単語の両者の出現頻度に基づく特徴値と、単語の概念上での上下関係および並列関係を含む単語間の関連を示すシソーラス辞書における単語間の隣接関係に基づく特徴値をそれぞれ求め、それらの特徴値を組み合わせてテーマ関連度を算出することを特徴とする請求項1ないし3のいずれかに記載の単語テーマ関連度算出装置。
- 前記ネガティブ単語用テーマ関連度算出部は、ネガティブ単語の出現頻度に基づく特徴値と、単語の概念上での上下関係および並列関係を含む単語間の関連を示すシソーラス辞書における単語間の条件付き隣接関係に基づく特徴値をそれぞれ求め、それらの特徴値を組み合わせてテーマ関連度を算出することを特徴とする請求項1ないし4のいずれかに記載の単語テーマ関連度算出装置。
- 文書に含まれる各単語の、対象テーマに対する関連度の算出に用いられる単語テーマ関連度算出用プログラムであって、
コンピュータを、
複数の単語を含む複数の評価対象の文書それぞれについて、それが対象テーマに関連するポジティブ評価文書であるか対象テーマに関連しないネガティブ評価文書であるかのユーザからの評価を受け付け、各評価対象の文書から単語を抽出すると共に、ポジティブ評価文書中のみに出現するポジティブ単語、ネガティブ評価文書中のみに出現するネガティブ単語、ポジティブ評価文書とネガティブ評価文書の双方に出現する共通単語に分類する単語抽出・分類手段、
前記単語抽出・分類部により抽出・分類されたポジティブ単語の出現頻度と他の単語との隣接関係に基づき、該ポジティブ単語の対象テーマに対するテーマ関連度を算出するポジティブ単語用テーマ関連度算出手段、
前記単語抽出・分類部により抽出・分類された共通単語の出現頻度と他の単語との隣接関係に基づき、該共通単語の対象テーマに対するテーマ関連度を算出する共通単語用テーマ関連度算出手段、および
前記単語抽出・分類部により抽出・分類されたネガティブ単語の出現頻度と制約条件下における他の単語との隣接関係に基づき、該ネガティブ単語の対象テーマに対するテーマ関連度を算出するネガティブ単語用テーマ関連度算出手段、
として機能させるプログラム単語テーマ関連度算出用プログラム。 - 前記ポジティブ単語用テーマ関連度算出部は、ポジティブ単語の出現頻度に基づく特徴値と、単語の概念上での上下関係および並列関係を含む単語間の関連を示すシソーラス辞書における単語間の隣接関係に基づく特徴値をそれぞれ求め、それらの特徴値を組み合わせてテーマ関連度を算出する請求項6に記載のプログラム単語テーマ関連度算出用プログラム。
- 前記共通単語用テーマ関連度算出部は、ポジティブ単語とネガティブ単語の両者の出現頻度に基づく特徴値と、単語の概念上での上下関係および並列関係を含む単語間の関連を示すシソーラス辞書における単語間の隣接関係に基づく特徴値をそれぞれ求め、それらの特徴値を組み合わせてテーマ関連度を算出する請求項6または7に記載のプログラム単語テーマ関連度算出用プログラム。
- 前記ネガティブ単語用テーマ関連度算出部は、ネガティブ単語の出現頻度に基づく特徴値と、単語の概念上での上下関係および並列関係を含む単語間の関連を示すシソーラス辞書における単語間の条件付き隣接関係に基づく特徴値をそれぞれ求め、それらの特徴値を組み合わせてテーマ関連度を算出する請求項6ないし8のいずれかに記載のプログラム単語テーマ関連度算出用プログラム。
- 請求項1ないし5のいずれかに記載の単語テーマ関連度算出装置および検索手段を備え、
前記検索手段は、前記単語テーマ関連度算出装置により算出されたテーマ関連度を用いて検索クエリを生成し、該検索クエリにより情報を検索し、検索された情報を、前記テーマ関連度に基づいて順位付けして提示することを特徴とする情報検索装置。 - 前記単語テーマ関連度算出装置は、検索された情報に対するユーザからの評価を繰り返し受け付けて前記テーマ関連度を算出して更新し、
検索手段は、更新されたテーマ関連度に基づいて検索クエリの生成、該検索クエリによる検索および順位付けを繰り返すことを特徴とする請求項10に記載の情報検索装置。 - 前記単語テーマ関連度算出装置は、前記テーマ関連度を算出して更新するに際し、今回検索された文書が先に評価された文書と同じである場合には、先に評価された文書から抽出・分類された単語および該単語の単語テーマ関連度の算出の基になった単語データを利用することを特徴とする請求項11に記載の情報検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009237227A JP5424393B2 (ja) | 2009-10-14 | 2009-10-14 | 単語テーマ関連度算出装置、単語テーマ関連度算出用プログラムおよび情報検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009237227A JP5424393B2 (ja) | 2009-10-14 | 2009-10-14 | 単語テーマ関連度算出装置、単語テーマ関連度算出用プログラムおよび情報検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011086043A JP2011086043A (ja) | 2011-04-28 |
JP5424393B2 true JP5424393B2 (ja) | 2014-02-26 |
Family
ID=44078951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009237227A Active JP5424393B2 (ja) | 2009-10-14 | 2009-10-14 | 単語テーマ関連度算出装置、単語テーマ関連度算出用プログラムおよび情報検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5424393B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5856905B2 (ja) * | 2012-05-22 | 2016-02-10 | 日本放送協会 | 主題抽出装置およびそのプログラム |
JP6176107B2 (ja) * | 2013-12-27 | 2017-08-09 | 富士通株式会社 | 情報収集プログラム、情報収集方法及び情報収集装置 |
JP6871799B2 (ja) * | 2017-04-28 | 2021-05-12 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理システム、その制御方法及びプログラム |
CN108681919A (zh) * | 2018-05-10 | 2018-10-19 | 苏州跃盟信息科技有限公司 | 一种内容推送方法及装置 |
JP7279311B2 (ja) * | 2018-07-19 | 2023-05-23 | カシオ計算機株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7231354B2 (ja) * | 2018-08-07 | 2023-03-01 | ヤフー株式会社 | 情報処理プログラム、情報処理装置、および情報処理方法 |
JP7045515B1 (ja) | 2021-07-19 | 2022-03-31 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003108597A (ja) * | 2001-09-27 | 2003-04-11 | Toshiba Corp | 情報検索システム、情報検索方法及び情報検索プログラム |
JP4179858B2 (ja) * | 2002-11-28 | 2008-11-12 | 株式会社リコー | 文書検索装置、文書検索方法、プログラムおよび記録媒体 |
JP2004310404A (ja) * | 2003-04-07 | 2004-11-04 | Nippon Telegr & Teleph Corp <Ntt> | 関連語の抽出装置、関連語の抽出方法、プログラムおよび記憶媒体 |
JP2005346598A (ja) * | 2004-06-07 | 2005-12-15 | Sangaku Renkei Kiko Kyushu:Kk | ウェブ情報収集装置とウェブクローラープログラム、及びウェブ情報収集方法 |
JP4640591B2 (ja) * | 2005-06-09 | 2011-03-02 | 富士ゼロックス株式会社 | 文書検索装置 |
JP2009245179A (ja) * | 2008-03-31 | 2009-10-22 | Nomura Research Institute Ltd | 文書検索支援装置 |
-
2009
- 2009-10-14 JP JP2009237227A patent/JP5424393B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011086043A (ja) | 2011-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200334496A1 (en) | Systems and methods for identifying semantically and visually related content | |
Kim et al. | A scientometric review of emerging trends and new developments in recommendation systems | |
CN109690528B (zh) | 用于提供可视化结果列表的系统以及方法 | |
JP5424393B2 (ja) | 単語テーマ関連度算出装置、単語テーマ関連度算出用プログラムおよび情報検索装置 | |
CN104123332B (zh) | 搜索结果的显示方法及装置 | |
US8612435B2 (en) | Activity based users' interests modeling for determining content relevance | |
CN102760138B (zh) | 用户网络行为的分类方法和装置及对应的搜索方法和装置 | |
US7783620B1 (en) | Relevancy scoring using query structure and data structure for federated search | |
US7783630B1 (en) | Tuning of relevancy ranking for federated search | |
US8234311B2 (en) | Information processing device, importance calculation method, and program | |
US7895235B2 (en) | Extracting semantic relations from query logs | |
US10909427B2 (en) | Method and device for classifying webpages | |
CN102799591B (zh) | 一种提供推荐词的方法及装置 | |
US20190318407A1 (en) | Method for product search using the user-weighted, attribute-based, sort-ordering and system thereof | |
US10558666B2 (en) | Systems and methods for the creation, update and use of models in finding and analyzing content | |
US20150032727A1 (en) | Information processing apparatus, information processing method, and information processing program | |
KR100859918B1 (ko) | 사용자 피드백을 이용하여 검색된 컨텐츠를 평가하고 평가결과를 이용하여 검색 결과를 제공하는 방법 및 장치 | |
CN104933100A (zh) | 关键词推荐方法和装置 | |
CN111506727B (zh) | 文本内容类别获取方法、装置、计算机设备和存储介质 | |
CN107193883B (zh) | 一种数据处理方法和系统 | |
JP2007219929A (ja) | 感性評価システム及び方法 | |
CN116610853A (zh) | 搜索推荐方法、搜索推荐系统、计算机设备及存储介质 | |
KR101621735B1 (ko) | 추천 검색어 제공 방법 및 시스템 | |
Valcarce et al. | Efficient pseudo-relevance feedback methods for collaborative filtering recommendation | |
Manek et al. | Hybrid crawling for time-based personalized web search ranking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120831 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130814 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130821 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131015 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131122 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5424393 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |