JP2015500525A5 - - Google Patents

Download PDF

Info

Publication number
JP2015500525A5
JP2015500525A5 JP2014544948A JP2014544948A JP2015500525A5 JP 2015500525 A5 JP2015500525 A5 JP 2015500525A5 JP 2014544948 A JP2014544948 A JP 2014544948A JP 2014544948 A JP2014544948 A JP 2014544948A JP 2015500525 A5 JP2015500525 A5 JP 2015500525A5
Authority
JP
Japan
Prior art keywords
synonym
strings
word
computer
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014544948A
Other languages
English (en)
Other versions
JP6124917B2 (ja
JP2015500525A (ja
Filing date
Publication date
Priority claimed from CN201110391864.7A external-priority patent/CN103136262B/zh
Application filed filed Critical
Publication of JP2015500525A publication Critical patent/JP2015500525A/ja
Publication of JP2015500525A5 publication Critical patent/JP2015500525A5/ja
Application granted granted Critical
Publication of JP6124917B2 publication Critical patent/JP6124917B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (20)

  1. 1つ以上のプロセッサによって実行されるときに、前記1つ以上のプロセッサに動作を実行するように命令するコンピュータ実行可能命令を記憶する1つ以上のコンピュータ読み取り可能記憶媒体であって、前記動作が、
    単語に関連付けられたクエリを受信することと、
    品目のカテゴリ下の複数の品目記述をマイニングして、前記単語を含む複数の同義語対を生成することと、
    前記複数の同義語対の個々の同義語対の包括的関連度を計算することと、
    所定の値よりも大きい包括的関連度を有する前記複数の同義語対のうちの1つの同義語対に基づいて検索を実行することと、
    備えたことを特徴とする1つ又は複数のコンピュータ読み取り可能記憶媒体。
  2. 前記包括的関連度が、前記単語と前記同義語対との間の関連度に基づいて計算されることを特徴とする請求項1に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
  3. 前記包括的関連度が、前記単語および前記同義語対内の前記単語の同義語に関連付けられた属性に基づいて計算されることを特徴とする請求項1に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
  4. 前記属性が、所定の規則に基づいて重みを割り当てられ、前記包括的関連度が、前記重みに基づいて更に計算されることを特徴とする請求項3に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
  5. 前記包括的関連度が、前記単語および前記同義語対内の前記単語の同義語に関連付けられたカテゴリスペクトルに基づいて計算され、前記カテゴリスペクトルが、前記単語および前記同義語対内の前記単語の同義語に関連付けられたカテゴリと、前記カテゴリに関連付けられたユーザクリック率と、に基づいて決定されることを特徴とする請求項1に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
  6. 前記個々の同義語対が、前記単語および前記単語の同義語を含むことを特徴とする請求項1に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
  7. 前記複数の品目記述が、ベンダーによって提供される品目広告情報を含むことを特徴とする請求項1に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
  8. 前記動作が、
    前記個々の同義語対の文脈パラメータであって、前記カテゴリ下の前記単語と前記個々の同義語との間の関連度を示す文脈パラメータを決定することと、
    所定の規則に基づいて、前記個々の同義語対の属性パラメータを決定することと、
    を更に備えたことを特徴とする請求項1に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
  9. 包括的関連度の前記計算が、前記文脈パラメータおよび前記属性パラメータに基づいて前記包括的関連度を計算することを含むことを特徴とする請求項8に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
  10. 前記動作が、
    前記個々の同義語対のうちの一方の単語を決定することと、
    前記単語を含む同義語対の数を計算することと、
    前記複数の同義語対の追加の数を計算することと、
    を更に備え、前記文脈パラメータが、前記数および前記追加の数を用いて決定されることを特徴とする請求項8に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
  11. 前記動作が、
    複数の品目記述の特徴に基づいて前記複数の品目記述の区分化を行って、複数のストリングを生成することと、
    前記複数のストリングの少なくとも2つの単語であって、前記複数のストリングの少なくとも2つのストリングで一緒に見つけられる少なくとも2つの単語を特定することと、
    前記少なくとも2つの単語が前記複数のストリングで一緒に見つけられる頻度を計算することと、
    前記頻度が所定の値よりも大きい場合に、前記少なくとも2つの単語が1つの同義語対に属すると決定することと、
    を更に備えたことを特徴とする請求項1に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
  12. 前記動作が、
    前記品目の前記カテゴリ下の履歴検索情報に基づいて前記複数の品目記述の更なる区分化を行って、更なる複数のストリングを生成することと、
    前記少なくとも2つの単語が、前記更なる複数のストリングのうちの少なくとも2つの更なるストリングで一緒に見つけられると決定し、かつ前記少なくとも2つの単語が前記更なる複数のストリングで一緒に見つけられる更なる頻度を決定することと、
    前記頻度が所定の値よりも大きく、かつ前記更なる頻度が更なる所定の値よりも小さい場合に、前記少なくとも2つの単語が同義語であると決定することと、
    を更に備えたことを特徴とする請求項11に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
  13. 取引品目のカテゴリ下の複数の品目記述をマイニングして、単語および前記単語の同義語を含む同義語対を生成することと、
    前記同義語対の文脈パラメータであって、前記同義語対のうちの前記単語と前記同義語との間の関連度を示す文脈パラメータを計算することと、
    所定の規則に基づいて、前記同義語対の属性パラメータを計算することと、
    前記文脈パラメータおよび前記属性パラメータに基づいて、前記同義語対の包括的関連度を計算することと、
    備えたことを特徴とするコンピュータ実装方法。
  14. 前記品目記述を分析して複数のストリングを生成することを更に備え、前記同義語対の2つの単語が、
    前記複数のストリングのうちの少なくとも2つのストリングで一緒に見つけられ、
    前記2つの単語が前記複数のストリングで一緒に見つけられ、かつ所定の値よりも大きい頻度を有することを特徴とする請求項13に記載のコンピュータ実装方法。
  15. 単語に関連付けられたクエリを受信することと、
    前記包括的関連度が所定の値よりも大きいと決定することと、
    前記決定に応答して、前記同義語に基づいて検索を実行することと、
    を更に備えたことを特徴とする請求項13に記載のコンピュータ実装方法。
  16. 複数の品目記述の特徴に基づいて前記複数の品目記述を分析して、複数のストリングを生成することと、
    前記複数のストリングのうちの少なくとも2つのストリングで一緒に見つけられる前記複数のストリングのうちの少なくとも2つの単語を特定することと、
    前記少なくとも2つの単語が前記複数のストリングで一緒に見つけられる頻度を計算することと、
    前記頻度が所定の値よりも大きい場合に、前記少なくとも2つの単語が1つの同義語対に属すると判定することと、
    を更に備えたことを特徴とする請求項13に記載のコンピュータ実装方法。
  17. 1つ以上のプロセッサと、
    前記1つ以上のプロセッサによって実行可能な複数のコンポーネントを保持するメモリと、を備え、前記複数のコンポーネントが、
    取引品目のカテゴリ下の複数の品目記述をマイニングして、単語および前記単語の同義語を含む同義語対を生成する、同義語取得ユニットと、
    前記同義語対の文脈パラメータであって、前記カテゴリ下の前記単語と前記同義語との間の関連度を示す文脈パラメータを決定する、文脈スペクトル取得ユニットと、
    所定の規則に基づいて、前記同義語対の属性パラメータを決定する、属性スペクトル取得ユニットと、
    前記文脈パラメータおよび前記属性パラメータに基づいて、前記同義語対の包括的関連度を計算する、索引構築ユニットと、
    単語を含むクエリに応答して、前記同義語対に基づいて検索を実行する検索ユニットと、
    を備えたことを特徴とするコンピューティングデバイス。
  18. 前記同義語取得ユニットが、前記品目記述を更に分析して複数のストリングを生成し、前記同義語対の2つの単語が、
    前記複数のストリングのうちの少なくとも2つのストリングで一緒に見つけられ、
    前記2つの単語が前記複数のストリングで一緒に見つけられ、かつ所定の値よりも大きい頻度を有することを特徴とする請求項17に記載のコンピューティングデバイス。
  19. 前記包括的関連度が、前記単語および前記同義語対内の前記単語の同義語に関連付けられたカテゴリスペクトルに基づいて更に計算され、前記カテゴリスペクトルが、前記単語および前記同義語に関連付けられたカテゴリと、前記カテゴリに関連付けられたユーザクリック率と、に基づいて決定されることを特徴とする請求項17に記載のコンピューティングデバイス。
  20. 前記同義語取得ユニットが更に、
    複数の品目記述の特徴に基づいて前記複数の品目記述を分析して、複数のストリングを生成し、
    前記複数のストリングのうちの少なくとも2つのストリングで一緒に見つけられる前記複数のストリングの少なくとも2つの単語を特定し、
    前記少なくとも2つの単語が前記複数のストリングで一緒に見つけられる頻度を計算し、
    前記頻度が所定の値よりも大きい場合に、前記少なくとも2つの単語が1つの同義語対に属すると判定することを特徴とする請求項17に記載のコンピューティングデバイス。
JP2014544948A 2011-11-30 2012-11-30 情報検索のための方法および装置 Active JP6124917B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201110391864.7 2011-11-30
CN201110391864.7A CN103136262B (zh) 2011-11-30 2011-11-30 信息检索方法及装置
PCT/US2012/067411 WO2013082506A1 (en) 2011-11-30 2012-11-30 Method and apparatus for information searching

Publications (3)

Publication Number Publication Date
JP2015500525A JP2015500525A (ja) 2015-01-05
JP2015500525A5 true JP2015500525A5 (ja) 2015-12-24
JP6124917B2 JP6124917B2 (ja) 2017-05-10

Family

ID=47470148

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014544948A Active JP6124917B2 (ja) 2011-11-30 2012-11-30 情報検索のための方法および装置

Country Status (6)

Country Link
US (1) US20130138429A1 (ja)
EP (1) EP2786275A1 (ja)
JP (1) JP6124917B2 (ja)
CN (1) CN103136262B (ja)
TW (1) TWI547815B (ja)
WO (1) WO2013082506A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ589787A (en) 2010-12-08 2012-03-30 S L I Systems Inc A method for determining relevant search results
WO2014061285A1 (ja) * 2012-10-19 2014-04-24 楽天株式会社 コーパス生成装置、コーパス生成方法及びコーパス生成プログラム
US10339216B2 (en) 2013-07-26 2019-07-02 Nuance Communications, Inc. Method and apparatus for selecting among competing models in a tool for building natural language understanding models
CN104598613B (zh) * 2015-01-30 2017-11-03 百度在线网络技术(北京)有限公司 一种用于垂直领域的概念关系构建方法和装置
CN105069086B (zh) * 2015-07-31 2017-07-11 焦点科技股份有限公司 一种优化电子商务商品搜索的方法及系统
CN106815265B (zh) * 2015-12-01 2020-07-03 北京国双科技有限公司 裁判文书的搜索方法及装置
CN106844571B (zh) * 2017-01-03 2020-04-07 北京齐尔布莱特科技有限公司 识别同义词的方法、装置和计算设备
CN109002432B (zh) * 2017-06-07 2022-01-04 北京京东尚科信息技术有限公司 同义词的挖掘方法及装置、计算机可读介质、电子设备
CN108881945B (zh) * 2018-07-11 2020-09-22 深圳创维数字技术有限公司 消除关键词歧义的方法、电视及可读存储介质
CN109522547B (zh) * 2018-10-23 2020-09-18 浙江大学 基于模式学习的中文同义词迭代抽取方法
CN110688837B (zh) * 2019-09-27 2023-10-31 北京百度网讯科技有限公司 数据处理的方法及装置
US20230053344A1 (en) * 2020-02-21 2023-02-23 Nec Corporation Scenario generation apparatus, scenario generation method, and computer-readablerecording medium

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3379608B2 (ja) * 1994-11-24 2003-02-24 日本電信電話株式会社 単語間意味類似性判別方法
JP2003091552A (ja) * 2001-09-17 2003-03-28 Hitachi Ltd 検索要求情報抽出方法及びその実施システム並びにその処理プログラム
US6961721B2 (en) * 2002-06-28 2005-11-01 Microsoft Corporation Detecting duplicate records in database
WO2005020094A1 (en) * 2003-08-21 2005-03-03 Idilia Inc. System and method for associating documents with contextual advertisements
US8195683B2 (en) * 2006-02-28 2012-06-05 Ebay Inc. Expansion of database search queries
NO325864B1 (no) * 2006-11-07 2008-08-04 Fast Search & Transfer Asa Fremgangsmåte ved beregning av sammendragsinformasjon og en søkemotor for å støtte og implementere fremgangsmåten
US7890521B1 (en) * 2007-02-07 2011-02-15 Google Inc. Document-based synonym generation
US20100094835A1 (en) * 2008-10-15 2010-04-15 Yumao Lu Automatic query concepts identification and drifting for web search

Similar Documents

Publication Publication Date Title
JP2015500525A5 (ja)
Zheng et al. Interactive top-k spatial keyword queries
JP2014533407A5 (ja)
JP2015099593A5 (ja)
JP2013109725A5 (ja)
JP2017519285A5 (ja)
JP6124917B2 (ja) 情報検索のための方法および装置
CA2772638A1 (en) Framework for selecting and presenting answer boxes relevant to user input as query suggestions
JP2014501013A5 (ja)
JP2016509711A5 (ja)
JP2015505398A5 (ja)
JP2016519347A5 (ja)
JP2014507704A5 (ja)
JP2015535994A5 (ja)
JP2013531282A5 (ja)
JP2010118064A5 (ja)
US20130110620A1 (en) Selecting images based on textual description
WO2014183956A3 (en) Social media content analysis and output
JP2014505945A5 (ja)
JP2015069646A5 (ja)
JP2013191046A5 (ja)
RU2015135357A (ru) Система, способ и компьютерный программный продукт для прогнозирования производительности скважины
CN110096652A (zh) 舆情风向标指数计算方法及装置、可读存储介质
Smith et al. Concurrent visualization of relationships between words and topics in topic models
CN103077157A (zh) 一种文本集合相似性的可视化方法和装置