JP2015500525A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2015500525A5 JP2015500525A5 JP2014544948A JP2014544948A JP2015500525A5 JP 2015500525 A5 JP2015500525 A5 JP 2015500525A5 JP 2014544948 A JP2014544948 A JP 2014544948A JP 2014544948 A JP2014544948 A JP 2014544948A JP 2015500525 A5 JP2015500525 A5 JP 2015500525A5
- Authority
- JP
- Japan
- Prior art keywords
- synonym
- strings
- word
- computer
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001228 spectrum Methods 0.000 claims 6
- 238000005065 mining Methods 0.000 claims 2
- 230000011218 segmentation Effects 0.000 claims 1
- 238000000638 solvent extraction Methods 0.000 claims 1
Claims (20)
- 1つ以上のプロセッサによって実行されるときに、前記1つ以上のプロセッサに動作を実行するように命令するコンピュータ実行可能命令を記憶する1つ以上のコンピュータ読み取り可能記憶媒体であって、前記動作が、
単語に関連付けられたクエリを受信することと、
品目のカテゴリ下の複数の品目記述をマイニングして、前記単語を含む複数の同義語対を生成することと、
前記複数の同義語対の個々の同義語対の包括的関連度を計算することと、
所定の値よりも大きい包括的関連度を有する前記複数の同義語対のうちの1つの同義語対に基づいて検索を実行することと、
を備えたことを特徴とする1つ又は複数のコンピュータ読み取り可能記憶媒体。 - 前記包括的関連度が、前記単語と前記同義語対との間の関連度に基づいて計算されることを特徴とする請求項1に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
- 前記包括的関連度が、前記単語および前記同義語対内の前記単語の同義語に関連付けられた属性に基づいて計算されることを特徴とする請求項1に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
- 前記属性が、所定の規則に基づいて重みを割り当てられ、前記包括的関連度が、前記重みに基づいて更に計算されることを特徴とする請求項3に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
- 前記包括的関連度が、前記単語および前記同義語対内の前記単語の同義語に関連付けられたカテゴリスペクトルに基づいて計算され、前記カテゴリスペクトルが、前記単語および前記同義語対内の前記単語の同義語に関連付けられたカテゴリと、前記カテゴリに関連付けられたユーザクリック率と、に基づいて決定されることを特徴とする請求項1に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
- 前記個々の同義語対が、前記単語および前記単語の同義語を含むことを特徴とする請求項1に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
- 前記複数の品目記述が、ベンダーによって提供される品目広告情報を含むことを特徴とする請求項1に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
- 前記動作が、
前記個々の同義語対の文脈パラメータであって、前記カテゴリ下の前記単語と前記個々の同義語との間の関連度を示す文脈パラメータを決定することと、
所定の規則に基づいて、前記個々の同義語対の属性パラメータを決定することと、
を更に備えたことを特徴とする請求項1に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。 - 包括的関連度の前記計算が、前記文脈パラメータおよび前記属性パラメータに基づいて前記包括的関連度を計算することを含むことを特徴とする請求項8に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。
- 前記動作が、
前記個々の同義語対のうちの一方の単語を決定することと、
前記単語を含む同義語対の数を計算することと、
前記複数の同義語対の追加の数を計算することと、
を更に備え、前記文脈パラメータが、前記数および前記追加の数を用いて決定されることを特徴とする請求項8に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。 - 前記動作が、
複数の品目記述の特徴に基づいて前記複数の品目記述の区分化を行って、複数のストリングを生成することと、
前記複数のストリングの少なくとも2つの単語であって、前記複数のストリングの少なくとも2つのストリングで一緒に見つけられる少なくとも2つの単語を特定することと、
前記少なくとも2つの単語が前記複数のストリングで一緒に見つけられる頻度を計算することと、
前記頻度が所定の値よりも大きい場合に、前記少なくとも2つの単語が1つの同義語対に属すると決定することと、
を更に備えたことを特徴とする請求項1に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。 - 前記動作が、
前記品目の前記カテゴリ下の履歴検索情報に基づいて前記複数の品目記述の更なる区分化を行って、更なる複数のストリングを生成することと、
前記少なくとも2つの単語が、前記更なる複数のストリングのうちの少なくとも2つの更なるストリングで一緒に見つけられると決定し、かつ前記少なくとも2つの単語が前記更なる複数のストリングで一緒に見つけられる更なる頻度を決定することと、
前記頻度が所定の値よりも大きく、かつ前記更なる頻度が更なる所定の値よりも小さい場合に、前記少なくとも2つの単語が同義語であると決定することと、
を更に備えたことを特徴とする請求項11に記載の1つ又は複数のコンピュータ読み取り可能記憶媒体。 - 取引品目のカテゴリ下の複数の品目記述をマイニングして、単語および前記単語の同義語を含む同義語対を生成することと、
前記同義語対の文脈パラメータであって、前記同義語対のうちの前記単語と前記同義語との間の関連度を示す文脈パラメータを計算することと、
所定の規則に基づいて、前記同義語対の属性パラメータを計算することと、
前記文脈パラメータおよび前記属性パラメータに基づいて、前記同義語対の包括的関連度を計算することと、
を備えたことを特徴とするコンピュータ実装方法。 - 前記品目記述を分析して複数のストリングを生成することを更に備え、前記同義語対の2つの単語が、
前記複数のストリングのうちの少なくとも2つのストリングで一緒に見つけられ、
前記2つの単語が前記複数のストリングで一緒に見つけられ、かつ所定の値よりも大きい頻度を有することを特徴とする請求項13に記載のコンピュータ実装方法。 - 単語に関連付けられたクエリを受信することと、
前記包括的関連度が所定の値よりも大きいと決定することと、
前記決定に応答して、前記同義語に基づいて検索を実行することと、
を更に備えたことを特徴とする請求項13に記載のコンピュータ実装方法。 - 複数の品目記述の特徴に基づいて前記複数の品目記述を分析して、複数のストリングを生成することと、
前記複数のストリングのうちの少なくとも2つのストリングで一緒に見つけられる前記複数のストリングのうちの少なくとも2つの単語を特定することと、
前記少なくとも2つの単語が前記複数のストリングで一緒に見つけられる頻度を計算することと、
前記頻度が所定の値よりも大きい場合に、前記少なくとも2つの単語が1つの同義語対に属すると判定することと、
を更に備えたことを特徴とする請求項13に記載のコンピュータ実装方法。 - 1つ以上のプロセッサと、
前記1つ以上のプロセッサによって実行可能な複数のコンポーネントを保持するメモリと、を備え、前記複数のコンポーネントが、
取引品目のカテゴリ下の複数の品目記述をマイニングして、単語および前記単語の同義語を含む同義語対を生成する、同義語取得ユニットと、
前記同義語対の文脈パラメータであって、前記カテゴリ下の前記単語と前記同義語との間の関連度を示す文脈パラメータを決定する、文脈スペクトル取得ユニットと、
所定の規則に基づいて、前記同義語対の属性パラメータを決定する、属性スペクトル取得ユニットと、
前記文脈パラメータおよび前記属性パラメータに基づいて、前記同義語対の包括的関連度を計算する、索引構築ユニットと、
単語を含むクエリに応答して、前記同義語対に基づいて検索を実行する検索ユニットと、
を備えたことを特徴とするコンピューティングデバイス。 - 前記同義語取得ユニットが、前記品目記述を更に分析して複数のストリングを生成し、前記同義語対の2つの単語が、
前記複数のストリングのうちの少なくとも2つのストリングで一緒に見つけられ、
前記2つの単語が前記複数のストリングで一緒に見つけられ、かつ所定の値よりも大きい頻度を有することを特徴とする請求項17に記載のコンピューティングデバイス。 - 前記包括的関連度が、前記単語および前記同義語対内の前記単語の同義語に関連付けられたカテゴリスペクトルに基づいて更に計算され、前記カテゴリスペクトルが、前記単語および前記同義語に関連付けられたカテゴリと、前記カテゴリに関連付けられたユーザクリック率と、に基づいて決定されることを特徴とする請求項17に記載のコンピューティングデバイス。
- 前記同義語取得ユニットが更に、
複数の品目記述の特徴に基づいて前記複数の品目記述を分析して、複数のストリングを生成し、
前記複数のストリングのうちの少なくとも2つのストリングで一緒に見つけられる前記複数のストリングの少なくとも2つの単語を特定し、
前記少なくとも2つの単語が前記複数のストリングで一緒に見つけられる頻度を計算し、
前記頻度が所定の値よりも大きい場合に、前記少なくとも2つの単語が1つの同義語対に属すると判定することを特徴とする請求項17に記載のコンピューティングデバイス。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110391864.7 | 2011-11-30 | ||
CN201110391864.7A CN103136262B (zh) | 2011-11-30 | 2011-11-30 | 信息检索方法及装置 |
PCT/US2012/067411 WO2013082506A1 (en) | 2011-11-30 | 2012-11-30 | Method and apparatus for information searching |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015500525A JP2015500525A (ja) | 2015-01-05 |
JP2015500525A5 true JP2015500525A5 (ja) | 2015-12-24 |
JP6124917B2 JP6124917B2 (ja) | 2017-05-10 |
Family
ID=47470148
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014544948A Active JP6124917B2 (ja) | 2011-11-30 | 2012-11-30 | 情報検索のための方法および装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20130138429A1 (ja) |
EP (1) | EP2786275A1 (ja) |
JP (1) | JP6124917B2 (ja) |
CN (1) | CN103136262B (ja) |
TW (1) | TWI547815B (ja) |
WO (1) | WO2013082506A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NZ589787A (en) | 2010-12-08 | 2012-03-30 | S L I Systems Inc | A method for determining relevant search results |
WO2014061285A1 (ja) * | 2012-10-19 | 2014-04-24 | 楽天株式会社 | コーパス生成装置、コーパス生成方法及びコーパス生成プログラム |
US10339216B2 (en) | 2013-07-26 | 2019-07-02 | Nuance Communications, Inc. | Method and apparatus for selecting among competing models in a tool for building natural language understanding models |
CN104598613B (zh) * | 2015-01-30 | 2017-11-03 | 百度在线网络技术(北京)有限公司 | 一种用于垂直领域的概念关系构建方法和装置 |
CN105069086B (zh) * | 2015-07-31 | 2017-07-11 | 焦点科技股份有限公司 | 一种优化电子商务商品搜索的方法及系统 |
CN106815265B (zh) * | 2015-12-01 | 2020-07-03 | 北京国双科技有限公司 | 裁判文书的搜索方法及装置 |
CN106844571B (zh) * | 2017-01-03 | 2020-04-07 | 北京齐尔布莱特科技有限公司 | 识别同义词的方法、装置和计算设备 |
CN109002432B (zh) * | 2017-06-07 | 2022-01-04 | 北京京东尚科信息技术有限公司 | 同义词的挖掘方法及装置、计算机可读介质、电子设备 |
CN108881945B (zh) * | 2018-07-11 | 2020-09-22 | 深圳创维数字技术有限公司 | 消除关键词歧义的方法、电视及可读存储介质 |
CN109522547B (zh) * | 2018-10-23 | 2020-09-18 | 浙江大学 | 基于模式学习的中文同义词迭代抽取方法 |
CN110688837B (zh) * | 2019-09-27 | 2023-10-31 | 北京百度网讯科技有限公司 | 数据处理的方法及装置 |
US20230053344A1 (en) * | 2020-02-21 | 2023-02-23 | Nec Corporation | Scenario generation apparatus, scenario generation method, and computer-readablerecording medium |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3379608B2 (ja) * | 1994-11-24 | 2003-02-24 | 日本電信電話株式会社 | 単語間意味類似性判別方法 |
JP2003091552A (ja) * | 2001-09-17 | 2003-03-28 | Hitachi Ltd | 検索要求情報抽出方法及びその実施システム並びにその処理プログラム |
US6961721B2 (en) * | 2002-06-28 | 2005-11-01 | Microsoft Corporation | Detecting duplicate records in database |
WO2005020094A1 (en) * | 2003-08-21 | 2005-03-03 | Idilia Inc. | System and method for associating documents with contextual advertisements |
US8195683B2 (en) * | 2006-02-28 | 2012-06-05 | Ebay Inc. | Expansion of database search queries |
NO325864B1 (no) * | 2006-11-07 | 2008-08-04 | Fast Search & Transfer Asa | Fremgangsmåte ved beregning av sammendragsinformasjon og en søkemotor for å støtte og implementere fremgangsmåten |
US7890521B1 (en) * | 2007-02-07 | 2011-02-15 | Google Inc. | Document-based synonym generation |
US20100094835A1 (en) * | 2008-10-15 | 2010-04-15 | Yumao Lu | Automatic query concepts identification and drifting for web search |
-
2011
- 2011-11-30 CN CN201110391864.7A patent/CN103136262B/zh active Active
-
2012
- 2012-02-06 TW TW101103773A patent/TWI547815B/zh active
- 2012-11-30 WO PCT/US2012/067411 patent/WO2013082506A1/en active Application Filing
- 2012-11-30 US US13/691,268 patent/US20130138429A1/en not_active Abandoned
- 2012-11-30 EP EP12808973.7A patent/EP2786275A1/en not_active Withdrawn
- 2012-11-30 JP JP2014544948A patent/JP6124917B2/ja active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2015500525A5 (ja) | ||
Zheng et al. | Interactive top-k spatial keyword queries | |
JP2014533407A5 (ja) | ||
JP2015099593A5 (ja) | ||
JP2013109725A5 (ja) | ||
JP2017519285A5 (ja) | ||
JP6124917B2 (ja) | 情報検索のための方法および装置 | |
CA2772638A1 (en) | Framework for selecting and presenting answer boxes relevant to user input as query suggestions | |
JP2014501013A5 (ja) | ||
JP2016509711A5 (ja) | ||
JP2015505398A5 (ja) | ||
JP2016519347A5 (ja) | ||
JP2014507704A5 (ja) | ||
JP2015535994A5 (ja) | ||
JP2013531282A5 (ja) | ||
JP2010118064A5 (ja) | ||
US20130110620A1 (en) | Selecting images based on textual description | |
WO2014183956A3 (en) | Social media content analysis and output | |
JP2014505945A5 (ja) | ||
JP2015069646A5 (ja) | ||
JP2013191046A5 (ja) | ||
RU2015135357A (ru) | Система, способ и компьютерный программный продукт для прогнозирования производительности скважины | |
CN110096652A (zh) | 舆情风向标指数计算方法及装置、可读存储介质 | |
Smith et al. | Concurrent visualization of relationships between words and topics in topic models | |
CN103077157A (zh) | 一种文本集合相似性的可视化方法和装置 |