JP2013109563A - 検索条件抽出装置、検索条件抽出方法および検索条件抽出プログラム - Google Patents
検索条件抽出装置、検索条件抽出方法および検索条件抽出プログラム Download PDFInfo
- Publication number
- JP2013109563A JP2013109563A JP2011253739A JP2011253739A JP2013109563A JP 2013109563 A JP2013109563 A JP 2013109563A JP 2011253739 A JP2011253739 A JP 2011253739A JP 2011253739 A JP2011253739 A JP 2011253739A JP 2013109563 A JP2013109563 A JP 2013109563A
- Authority
- JP
- Japan
- Prior art keywords
- template
- words
- word
- products
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】商品情報入力バッファ121内の複数の商品に関する情報から複数の商品に含まれる同一文をテンプレートとして抽出し、その文における出現商品数を求めてテンプレート入力バッファ131に書き込むテンプレート抽出部120と、前記テンプレート入力バッファ131に書き込まれたテンプレートの文を形態素解析し、解析した語と、その語における出現商品数をテンプレート語群入力バッファ141に書き込む形態素解析部130と、前記テンプレート語群入力バッファ141に書き込まれた語と出現商品数に基づいて、テンプレートに語が出現する頻度を求め、該出現頻度がしきい値以上の語を、除去するべきフィルタ対象として出力するリスト生成部140と、を備える。
【選択図】図1
Description
110…商品情報入力装置
120…テンプレート抽出部
121…商品情報入力バッファ
122…文保存バッファ
130…形態素解析部
131…テンプレート入力バッファ
140…リスト生成部
141…テンプレート語群入力バッファ
142…語保存バッファ
150…フィルタ対象出力装置
Claims (3)
- ECサイト閲覧者が閲覧した商品の、閲覧した条件以外を表す語を除去するべきフィルタ対象として抽出する検索条件抽出装置であって、
複数の商品に関する情報から複数の商品に含まれる同一文をテンプレートとして抽出し、その文における出現商品数を求めるテンプレート抽出手段と、
前記テンプレート抽出手段によって抽出されたテンプレートの文を形態素解析し、解析した語と、その語における出現商品数を出力する形態素解析手段と、
前記形態素解析手段によって出力された語と出現商品数に基づいて、テンプレートに語が出現する頻度を求め、該出現頻度がしきい値以上の語を、除去するべきフィルタ対象として出力するリスト生成手段と、
を備えたことを特徴とする検索条件抽出装置。 - ECサイト閲覧者が閲覧した商品の、閲覧した条件以外を表す語を除去するべきフィルタ対象として抽出する検索条件抽出方法であって、
テンプレート抽出手段が、複数の商品に関する情報から複数の商品に含まれる同一文をテンプレートとして抽出し、その文における出現商品数を求めるテンプレート抽出ステップと、
形態素解析手段が、前記テンプレート抽出手段によって抽出されたテンプレートの文を形態素解析し、解析した語と、その語における出現商品数を出力する形態素解析ステップと、
リスト生成手段が、前記形態素解析手段によって出力された語と出現商品数に基づいて、テンプレートに語が出現する頻度を求め、該出現頻度がしきい値以上の語を、除去するべきフィルタ対象として出力するリスト生成ステップと、
を備えたことを特徴とする検索条件抽出方法。 - コンピュータを請求項1に記載の各手段として機能させる検索条件抽出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011253739A JP5613647B2 (ja) | 2011-11-21 | 2011-11-21 | 検索条件抽出装置、検索条件抽出方法および検索条件抽出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011253739A JP5613647B2 (ja) | 2011-11-21 | 2011-11-21 | 検索条件抽出装置、検索条件抽出方法および検索条件抽出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013109563A true JP2013109563A (ja) | 2013-06-06 |
JP5613647B2 JP5613647B2 (ja) | 2014-10-29 |
Family
ID=48706252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011253739A Expired - Fee Related JP5613647B2 (ja) | 2011-11-21 | 2011-11-21 | 検索条件抽出装置、検索条件抽出方法および検索条件抽出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5613647B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11259515A (ja) * | 1998-03-12 | 1999-09-24 | Toshiba Corp | 類似文書検索装置、類似文書検索方法、および類似文書検索のためのプログラムが記録された記録媒体 |
US20040083224A1 (en) * | 2002-10-16 | 2004-04-29 | International Business Machines Corporation | Document automatic classification system, unnecessary word determination method and document automatic classification method |
US20060069673A1 (en) * | 2004-09-29 | 2006-03-30 | Hitachi Software Engineering Co., Ltd. | Text mining server and program |
JP2009129087A (ja) * | 2007-11-21 | 2009-06-11 | Yahoo Japan Corp | 商品情報分類装置、プログラム、商品情報分類方法 |
JP2009271796A (ja) * | 2008-05-08 | 2009-11-19 | Nomura Research Institute Ltd | 文書データのノイズ除去システム |
-
2011
- 2011-11-21 JP JP2011253739A patent/JP5613647B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11259515A (ja) * | 1998-03-12 | 1999-09-24 | Toshiba Corp | 類似文書検索装置、類似文書検索方法、および類似文書検索のためのプログラムが記録された記録媒体 |
US20040083224A1 (en) * | 2002-10-16 | 2004-04-29 | International Business Machines Corporation | Document automatic classification system, unnecessary word determination method and document automatic classification method |
JP2004139222A (ja) * | 2002-10-16 | 2004-05-13 | Internatl Business Mach Corp <Ibm> | 文書自動分類システム、不要語判定方法、文書自動分類方法、およびプログラム |
US20060069673A1 (en) * | 2004-09-29 | 2006-03-30 | Hitachi Software Engineering Co., Ltd. | Text mining server and program |
JP2006099423A (ja) * | 2004-09-29 | 2006-04-13 | Hitachi Software Eng Co Ltd | テキストマイニングサーバ及びプログラム |
JP2009129087A (ja) * | 2007-11-21 | 2009-06-11 | Yahoo Japan Corp | 商品情報分類装置、プログラム、商品情報分類方法 |
JP2009271796A (ja) * | 2008-05-08 | 2009-11-19 | Nomura Research Institute Ltd | 文書データのノイズ除去システム |
Non-Patent Citations (2)
Title |
---|
CSNJ200510018055; 吉田 一星: '相対頻度を利用した不要語除去によるテキスト自動分類' 第65回(平成15年)全国大会講演論文集 Vol.2,No.2J-6, 20030325, pp.2-109〜2-110., 社団法人情報処理学会 * |
JPN6014037003; 吉田 一星: '相対頻度を利用した不要語除去によるテキスト自動分類' 第65回(平成15年)全国大会講演論文集 Vol.2,No.2J-6, 20030325, pp.2-109〜2-110., 社団法人情報処理学会 * |
Also Published As
Publication number | Publication date |
---|---|
JP5613647B2 (ja) | 2014-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9465864B2 (en) | Training a search query intent classifier using wiki article titles and a search click log | |
WO2018000557A1 (zh) | 搜索结果展示方法和装置 | |
JP2015191655A (ja) | 推奨ページを生成するための方法及び装置 | |
US9256593B2 (en) | Identifying product references in user-generated content | |
WO2014000576A1 (zh) | 一种网络搜索方法及网络搜索系统 | |
WO2014173349A1 (zh) | 网页分类标准获取方法、装置及网页分类方法、装置 | |
JP6237168B2 (ja) | 情報処理装置及び情報処理プログラム | |
TWI705411B (zh) | 社交業務特徵用戶的識別方法和裝置 | |
US8290925B1 (en) | Locating product references in content pages | |
JP6230725B2 (ja) | 因果関係分析装置、及び因果関係分析方法 | |
CN110674404A (zh) | 链接信息生成方法、装置、系统、存储介质及电子设备 | |
Rani et al. | Study and comparision of vectorization techniques used in text classification | |
JP6042790B2 (ja) | トレンド分析装置、トレンド分析方法およびトレンド分析プログラム | |
CN102236652B (zh) | 一种信息的分类方法和装置 | |
JP6499763B2 (ja) | ビデオ情報に対して検証を行うための方法及び装置 | |
JP5613647B2 (ja) | 検索条件抽出装置、検索条件抽出方法および検索条件抽出プログラム | |
JP6509590B2 (ja) | 商品に対するユーザの感情分析装置及びプログラム | |
JP2010117941A (ja) | Web文書主要コンテンツ抽出装置及びプログラム | |
JP2016045552A (ja) | 特徴抽出プログラム、特徴抽出方法、および特徴抽出装置 | |
JP5551665B2 (ja) | 情報抽出装置、情報抽出方法、情報抽出プログラム | |
JP5502024B2 (ja) | 検索条件抽出装置、検索条件抽出方法および検索条件抽出プログラム | |
Kaddu et al. | To extract informative content from online web pages by using hybrid approach | |
KR102295030B1 (ko) | 라이프 태그 생성 장치 및 방법 | |
JP2010128981A (ja) | 操作シーケンス抽出方法及び装置及びプログラム | |
JP2010198246A (ja) | 意味解析装置、方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140723 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140902 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140908 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5613647 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |