JP2015500525A - 情報検索のための方法および装置 - Google Patents
情報検索のための方法および装置 Download PDFInfo
- Publication number
- JP2015500525A JP2015500525A JP2014544948A JP2014544948A JP2015500525A JP 2015500525 A JP2015500525 A JP 2015500525A JP 2014544948 A JP2014544948 A JP 2014544948A JP 2014544948 A JP2014544948 A JP 2014544948A JP 2015500525 A JP2015500525 A JP 2015500525A
- Authority
- JP
- Japan
- Prior art keywords
- synonym
- word
- strings
- pair
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000005065 mining Methods 0.000 claims abstract description 7
- 238000001228 spectrum Methods 0.000 claims description 126
- 230000004044 response Effects 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 2
- 238000000638 solvent extraction Methods 0.000 claims 1
- 238000007418 data mining Methods 0.000 abstract description 5
- 238000010276 construction Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本出願は、2011年11月30日に出願された中国特許出願第201110391864.7号、表題「Method and Apparatus for Information Searching」の優先権を主張するものであり、これは、参照によりその全体が本明細書に組み込まれる。
Claims (20)
- 1つ以上のプロセッサによって実行されるときに、前記1つ以上のプロセッサに動作を実行するように命令するコンピュータ実行可能命令を記憶する1つ以上のコンピュータ読み取り可能媒体であって、前記動作が、
単語に関連付けられたクエリを受信することと、
品目のカテゴリ下の複数の品目記述をマイニングして、前記単語を含む複数の同義語対を生成することと、
前記複数の同義語対の個々の同義語対の包括的関連度を計算することと、
所定の値よりも大きい包括的関連度を有する前記複数の同義語対のうちの1つの同義語対に基づいて検索を実行することと、
を含む、1つ以上のコンピュータ読み取り可能媒体。 - 前記包括的関連度が、前記単語と前記同義語対との間の関連度に基づいて計算される、請求項1に記載の1つ以上のコンピュータ読み取り可能媒体。
- 前記包括的関連度が、前記単語および前記同義語対内の前記単語の同義語に関連付けられた属性に基づいて計算される、請求項1に記載の1つ以上のコンピュータ読み取り可能媒体。
- 前記属性が、所定の規則に基づいて重みを割り当てられ、前記包括的関連度が、前記重みに基づいて更に計算される、請求項3に記載の1つ以上のコンピュータ読み取り可能媒体。
- 前記包括的関連度が、前記単語および前記同義語対内の前記単語の同義語に関連付けられたカテゴリスペクトルに基づいて計算され、前記カテゴリスペクトルが、前記単語および前記同義語対内の前記単語の同義語に関連付けられたカテゴリと、前記カテゴリに関連付けられたユーザクリック率と、に基づいて決定される、請求項1に記載の1つ以上のコンピュータ読み取り可能媒体。
- 前記個々の同義語対が、前記単語および前記単語の同義語を含む、請求項1に記載の1つ以上のコンピュータ読み取り可能媒体。
- 前記複数の品目記述が、ベンダーによって提供される品目広告情報を含む、請求項1に記載の1つ以上のコンピュータ読み取り可能媒体。
- 前記動作が、
前記個々の同義語対の文脈パラメータであって、前記カテゴリ下の前記単語と前記個々の同義語との間の関連度を示す文脈パラメータを決定することと、
所定の規則に基づいて、前記個々の同義語対の属性パラメータを決定することと、
を更に含む、請求項1に記載の1つ以上のコンピュータ読み取り可能媒体。 - 包括的関連度の前記計算が、前記文脈パラメータおよび前記属性パラメータに基づいて前記包括的関連度を計算することを含む、請求項8に記載の1つ以上のコンピュータ読み取り可能媒体。
- 前記動作が、
前記個々の同義語対のうちの一方の単語を決定することと、
前記単語を含む同義語対の数を計算することと、
前記複数の同義語対の追加の数を計算することと、
を更に含み、前記文脈パラメータが、前記数および前記追加の数を用いて決定される、請求項8に記載の1つ以上のコンピュータ読み取り可能媒体。 - 前記動作が、
複数の品目記述の特徴に基づいて前記複数の品目記述の区分化を行って、複数のストリングを生成することと、
前記複数のストリングの少なくとも2つの単語であって、前記複数のストリングの少なくとも2つのストリングで一緒に見つけられる少なくとも2つの単語を特定することと、
前記少なくとも2つの単語が前記複数のストリングで一緒に見つけられる頻度を計算することと、
前記頻度が所定の値よりも大きい場合に、前記少なくとも2つの単語が1つの同義語対に属すると決定することと、
を更に含む、請求項1に記載の1つ以上のコンピュータ読み取り可能媒体。 - 前記動作が、
前記品目の前記カテゴリ下の履歴検索情報に基づいて前記複数の品目記述の更なる区分化を行って、更なる複数のストリングを生成することと、
前記少なくとも2つの単語が、前記更なる複数のストリングのうちの少なくとも2つの更なるストリングで一緒に見つけられると決定し、かつ前記少なくとも2つの単語が前記更なる複数のストリングで一緒に見つけられる更なる頻度を決定することと、
前記頻度が所定の値よりも大きく、かつ前記更なる頻度が更なる所定の値よりも小さい場合に、前記少なくとも2つの単語が同義語であると決定することと、
を更に含む、請求項11に記載の1つ以上のコンピュータ読み取り可能媒体。 - 取引品目のカテゴリ下の複数の品目記述をマイニングして、単語および前記単語の同義語を含む同義語対を生成することと、
前記同義語対の文脈パラメータであって、前記同義語対のうちの前記単語と前記同義語との間の関連度を示す文脈パラメータを計算することと、
所定の規則に基づいて、前記同義語対の属性パラメータを計算することと、
前記文脈パラメータおよび前記属性パラメータに基づいて、前記同義語対の包括的関連度を計算することと、
を含む、コンピュータ実装方法。 - 前記品目記述を分析して複数のストリングを生成することを更に含み、前記同義語対の2つの単語が、
前記複数のストリングのうちの少なくとも2つのストリングで一緒に見つけられ、
前記2つの単語が前記複数のストリングで一緒に見つけられ、かつ所定の値よりも大きい頻度を有する、請求項13に記載のコンピュータ実装方法。 - 単語に関連付けられたクエリを受信することと、
前記包括的関連度が所定の値よりも大きいと決定することと、
前記決定に応答して、前記同義語に基づいて検索を実行することと、
を更に含む、請求項13に記載のコンピュータ実装方法。 - 複数の品目記述の特徴に基づいて前記複数の品目記述を分析して、複数のストリングを生成することと、
前記複数のストリングのうちの少なくとも2つのストリングで一緒に見つけられる前記複数のストリングのうちの少なくとも2つの単語を特定することと、
前記少なくとも2つの単語が前記複数のストリングで一緒に見つけられる頻度を計算することと、
前記頻度が所定の値よりも大きい場合に、前記少なくとも2つの単語が1つの同義語対に属すると判定することと、
を更に含む、請求項13に記載のコンピュータ実装方法。 - 1つ以上のプロセッサと、
前記1つ以上のプロセッサによって実行可能な複数のコンポーネントを保持するメモリと、を備え、前記複数のコンポーネントが、
取引品目のカテゴリ下の複数の品目記述をマイニングして、単語および前記単語の同義語を含む同義語対を生成する、同義語取得ユニットと、
前記同義語対の文脈パラメータであって、前記カテゴリ下の前記単語と前記同義語との間の関連度を示す文脈パラメータを決定する、文脈スペクトル取得ユニットと、
所定の規則に基づいて、前記同義語対の属性パラメータを決定する、属性スペクトル取得ユニットと、
前記文脈パラメータおよび前記属性パラメータに基づいて、前記同義語対の包括的関連度を計算する、索引構築ユニットと、
単語を含むクエリに応答して、前記同義語対に基づいて検索を実行する検索ユニットと、
を備える、コンピューティングデバイス。 - 前記同義語取得ユニットが、前記品目記述を更に分析して複数のストリングを生成し、前記同義語対の2つの単語が、
前記複数のストリングのうちの少なくとも2つのストリングで一緒に見つけられ、
前記2つの単語が前記複数のストリングで一緒に見つけられ、かつ所定の値よりも大きい頻度を有する、請求項17に記載のコンピューティングデバイス。 - 前記包括的関連度が、前記単語および前記同義語対内の前記単語の同義語に関連付けられたカテゴリスペクトルに基づいて更に計算され、前記カテゴリスペクトルが、前記単語および前記同義語に関連付けられたカテゴリと、前記カテゴリに関連付けられたユーザクリック率と、に基づいて決定される、請求項17に記載のコンピューティングデバイス。
- 前記同義語取得ユニットが更に、
複数の品目記述の特徴に基づいて前記複数の品目記述を分析して、複数のストリングを生成し、
前記複数のストリングのうちの少なくとも2つのストリングで一緒に見つけられる前記複数のストリングの少なくとも2つの単語を特定し、
前記少なくとも2つの単語が前記複数のストリングで一緒に見つけられる頻度を計算し、
前記頻度が所定の値よりも大きい場合に、前記少なくとも2つの単語が1つの同義語対に属すると判定する、請求項17に記載のコンピューティングデバイス。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110391864.7A CN103136262B (zh) | 2011-11-30 | 2011-11-30 | 信息检索方法及装置 |
CN201110391864.7 | 2011-11-30 | ||
PCT/US2012/067411 WO2013082506A1 (en) | 2011-11-30 | 2012-11-30 | Method and apparatus for information searching |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015500525A true JP2015500525A (ja) | 2015-01-05 |
JP2015500525A5 JP2015500525A5 (ja) | 2015-12-24 |
JP6124917B2 JP6124917B2 (ja) | 2017-05-10 |
Family
ID=47470148
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014544948A Active JP6124917B2 (ja) | 2011-11-30 | 2012-11-30 | 情報検索のための方法および装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20130138429A1 (ja) |
EP (1) | EP2786275A1 (ja) |
JP (1) | JP6124917B2 (ja) |
CN (1) | CN103136262B (ja) |
TW (1) | TWI547815B (ja) |
WO (1) | WO2013082506A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108881945A (zh) * | 2018-07-11 | 2018-11-23 | 深圳创维数字技术有限公司 | 消除关键词歧义的方法、电视及可读存储介质 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NZ589787A (en) * | 2010-12-08 | 2012-03-30 | S L I Systems Inc | A method for determining relevant search results |
US20150019382A1 (en) * | 2012-10-19 | 2015-01-15 | Rakuten, Inc. | Corpus creation device, corpus creation method and corpus creation program |
US10339216B2 (en) | 2013-07-26 | 2019-07-02 | Nuance Communications, Inc. | Method and apparatus for selecting among competing models in a tool for building natural language understanding models |
CN104598613B (zh) * | 2015-01-30 | 2017-11-03 | 百度在线网络技术(北京)有限公司 | 一种用于垂直领域的概念关系构建方法和装置 |
CN105069086B (zh) * | 2015-07-31 | 2017-07-11 | 焦点科技股份有限公司 | 一种优化电子商务商品搜索的方法及系统 |
CN106815265B (zh) * | 2015-12-01 | 2020-07-03 | 北京国双科技有限公司 | 裁判文书的搜索方法及装置 |
CN106844571B (zh) * | 2017-01-03 | 2020-04-07 | 北京齐尔布莱特科技有限公司 | 识别同义词的方法、装置和计算设备 |
CN109002432B (zh) * | 2017-06-07 | 2022-01-04 | 北京京东尚科信息技术有限公司 | 同义词的挖掘方法及装置、计算机可读介质、电子设备 |
CN109522547B (zh) * | 2018-10-23 | 2020-09-18 | 浙江大学 | 基于模式学习的中文同义词迭代抽取方法 |
CN110688837B (zh) * | 2019-09-27 | 2023-10-31 | 北京百度网讯科技有限公司 | 数据处理的方法及装置 |
WO2021166231A1 (ja) * | 2020-02-21 | 2021-08-26 | 日本電気株式会社 | シナリオ生成装置、シナリオ生成方法、及びコンピュータ読み取り可能な記録媒体 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08147324A (ja) * | 1994-11-24 | 1996-06-07 | Nippon Telegr & Teleph Corp <Ntt> | 単語間意味類似性判別方法 |
US20030055819A1 (en) * | 2001-09-17 | 2003-03-20 | Tsukasa Saito | Information retrieving method |
US20070203929A1 (en) * | 2006-02-28 | 2007-08-30 | Ebay Inc. | Expansion of database search queries |
US20100094835A1 (en) * | 2008-10-15 | 2010-04-15 | Yumao Lu | Automatic query concepts identification and drifting for web search |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6961721B2 (en) * | 2002-06-28 | 2005-11-01 | Microsoft Corporation | Detecting duplicate records in database |
EP1665093A4 (en) * | 2003-08-21 | 2006-12-06 | Idilia Inc | SYSTEM AND METHOD FOR ASSOCIATING DOCUMENTS WITH CONTEXTUAL ADVERTISEMENTS |
NO325864B1 (no) * | 2006-11-07 | 2008-08-04 | Fast Search & Transfer Asa | Fremgangsmåte ved beregning av sammendragsinformasjon og en søkemotor for å støtte og implementere fremgangsmåten |
US7890521B1 (en) * | 2007-02-07 | 2011-02-15 | Google Inc. | Document-based synonym generation |
-
2011
- 2011-11-30 CN CN201110391864.7A patent/CN103136262B/zh active Active
-
2012
- 2012-02-06 TW TW101103773A patent/TWI547815B/zh active
- 2012-11-30 EP EP12808973.7A patent/EP2786275A1/en not_active Withdrawn
- 2012-11-30 JP JP2014544948A patent/JP6124917B2/ja active Active
- 2012-11-30 US US13/691,268 patent/US20130138429A1/en not_active Abandoned
- 2012-11-30 WO PCT/US2012/067411 patent/WO2013082506A1/en active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08147324A (ja) * | 1994-11-24 | 1996-06-07 | Nippon Telegr & Teleph Corp <Ntt> | 単語間意味類似性判別方法 |
US20030055819A1 (en) * | 2001-09-17 | 2003-03-20 | Tsukasa Saito | Information retrieving method |
JP2003091552A (ja) * | 2001-09-17 | 2003-03-28 | Hitachi Ltd | 検索要求情報抽出方法及びその実施システム並びにその処理プログラム |
US20070203929A1 (en) * | 2006-02-28 | 2007-08-30 | Ebay Inc. | Expansion of database search queries |
US20100094835A1 (en) * | 2008-10-15 | 2010-04-15 | Yumao Lu | Automatic query concepts identification and drifting for web search |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108881945A (zh) * | 2018-07-11 | 2018-11-23 | 深圳创维数字技术有限公司 | 消除关键词歧义的方法、电视及可读存储介质 |
CN108881945B (zh) * | 2018-07-11 | 2020-09-22 | 深圳创维数字技术有限公司 | 消除关键词歧义的方法、电视及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20130138429A1 (en) | 2013-05-30 |
TW201322020A (zh) | 2013-06-01 |
EP2786275A1 (en) | 2014-10-08 |
JP6124917B2 (ja) | 2017-05-10 |
WO2013082506A1 (en) | 2013-06-06 |
CN103136262B (zh) | 2016-08-24 |
CN103136262A (zh) | 2013-06-05 |
TWI547815B (zh) | 2016-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6124917B2 (ja) | 情報検索のための方法および装置 | |
US10180967B2 (en) | Performing application searches | |
JP6799152B1 (ja) | クリックグラフ上のベクトル伝播モデルに基づくインテリジェントなカスタマーサービス | |
US7519588B2 (en) | Keyword characterization and application | |
US9251292B2 (en) | Search result ranking using query clustering | |
US20150269163A1 (en) | Providing search recommendation | |
KR102355212B1 (ko) | 마이닝된 하이퍼링크 텍스트 스니펫을 통한 이미지 브라우징 | |
US20160004766A1 (en) | Search technology using synonims and paraphrasing | |
US10068022B2 (en) | Identifying topical entities | |
US20160026727A1 (en) | Generating additional content | |
US10152478B2 (en) | Apparatus, system and method for string disambiguation and entity ranking | |
US9720979B2 (en) | Method and system of identifying relevant content snippets that include additional information | |
US20170293696A1 (en) | Related entity discovery | |
US9183312B2 (en) | Image display within web search results | |
JP7451747B2 (ja) | コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体 | |
US9009192B1 (en) | Identifying central entities | |
WO2018058118A1 (en) | Method, apparatus and client of processing information recommendation | |
US11055335B2 (en) | Contextual based image search results | |
Moya et al. | Integrating web feed opinions into a corporate data warehouse | |
US20090327877A1 (en) | System and method for disambiguating text labeling content objects | |
US20200327120A1 (en) | Method and system for interactive keyword optimization for opaque search engines | |
US9183251B1 (en) | Showing prominent users for information retrieval requests | |
US9037591B1 (en) | Storing term substitution information in an index | |
US9600529B2 (en) | Attribute-based document searching | |
CN115934802A (zh) | 数据检索方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151105 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170307 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170404 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6124917 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |