JP2012533818A - 単語の重みに基づいた検索結果の順位付け - Google Patents
単語の重みに基づいた検索結果の順位付け Download PDFInfo
- Publication number
- JP2012533818A JP2012533818A JP2012521611A JP2012521611A JP2012533818A JP 2012533818 A JP2012533818 A JP 2012533818A JP 2012521611 A JP2012521611 A JP 2012521611A JP 2012521611 A JP2012521611 A JP 2012521611A JP 2012533818 A JP2012533818 A JP 2012533818A
- Authority
- JP
- Japan
- Prior art keywords
- word
- string
- target
- divided
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
【選択図】なし
Description
本願は、すべての目的のために参照により本明細書に組み込まれる、2009年7月20日出願の発明の名称を「METHOD AND DEVICE FOR RANKING SEARCH RESULTS(検索結果を順位付けるための方法および装置)」とする中国特許出願第200910151647.3号に基づく優先権を主張する。
P(第1の単語|第2の単語)=C(第1の単語、第2の単語)/ΣC(Yi、第2の単語)
P(cell phone|Nokia)=C(cell phone)/ΣC(Yi、Nokia)
W(T2、Q1)=W2 W(T2、Q2)=W2’
W(T3、Q1)=W3 W(T3、Q2)=W3’
W(T4、Q1)=W4 W(T4、Q2)=W4’
W(T5、Q1)=W5 W(T5、Q2)=W5’とする。
Wsw=ΣWi=W1+W2+W3+W4+W5’
WTotal=WI+WD
ここで、WTotalは総編集距離の最小重みを表し、WIはクエリ文字列内のそれぞれの分割単語に対する挿入単語の最小重みを表し、WDはターゲット文字列内のそれぞれの分割単語に対する削除単語の最小重みを表す。
WTotal=WI+WD+WS
ここで、WTotalは総編集距離を示し、WIはクエリ文字列内のそれぞれの分割単語に対する挿入単語の最小重みを表し、WDはターゲット文字列内のそれぞれの分割単語に対する削除単語の最小重みを表し、WSはクエリ文字列および/またはターゲット文字列内のそれぞれの分割単語に対する置換単語の最小重みを表す。
Claims (20)
- 検索結果を順位付けるための方法であって、
クエリ文字列を受信し、
クエリ文字列に関連する対応する複数のターゲット文字列を含む複数の検索結果を取得し、
前記クエリ文字列と、前記複数のターゲット文字列のそれぞれを分割し、
複数の組み合わせを形成するために、前記クエリ文字列内の分割部分と、各前記ターゲット文字列内の分割部分とを対にし、
単語の組み合わせと各単語の組み合わせに対する重みとのマッピングに基づいて、前記複数の組み合わせに対応する複数の重みを取得し、重みは単語の組み合わせに含まれる単語間の意味的相関の指標となり、
前記複数のターゲット文字列それぞれに対応する前記重みに基づいて重み付けされた単語長を決定し、
前記複数のターゲット文字列を前記複数のターゲット文字列のそれぞれについて重み付けされた単語長に基づいて順位付けること、
を備える、方法。 - 請求項1に記載の方法において、単語の組み合わせと各単語の組み合わせに対する重みとの前記マッピングは、予め決定されている、方法。
- 請求項2に記載の方法において、単語の組み合わせと各単語の組み合わせに対する重みとの前記マッピングは、
1組の統計サンプルを取得し、
前記1組の統計サンプルから第1の単語および第2の単語を選択し、前記第1および第2の単語の両方が前記統計サンプル内で出現する回数をC(前記第1の単語、前記第2の単語)としてカウントし、
前記第2の単語が前記統計サンプル内で出現する回数をΣC(Yi、前記第2の単語)としてカウントし、Yiは前記第2の単語と一緒に出現するそれぞれの前記単語を表し、
前記第1および第2の単語の両方が前記統計サンプル内で出現する回数と、前記第2の単語が前記統計サンプル内で出現する回数とに基づいて、前記第2の単語が出現する条件のもとでの前記第1の単語の出現確率Pを計算し、
前記第2の単語の検索の際に、前記第1および第2の単語の間の意味的相関の指標となる重みをW=1−Pによって決定し、Wは前記重みであり、Pは前記第2の単語が出現する前記条件のもとでの前記第1の単語の前記確率であり、
前記統計サンプル内の単語の組み合わせの間の意味的相関の指標となる前記重みを決定するために、前記選択、カウント、計算、および、決定を繰り返し、
前記単語の組み合わせと各単語の組み合わせに対する重みとの前記マッピングを格納すること、によって決定される、方法。 - 請求項3に記載の方法であって、前記統計サンプルは、ウェブページ、ユーザ検索ログ、または、ユーザ選択ログから取得される、方法。
- 請求項1に記載の方法であって、
前記重み付けされた単語長は、最短スライディングウィンドウの前記重み付けされた単語長であり、
前記重みから前記重み付けされた単語長を決定して、それぞれの前記ターゲット文字列を順位付けすることは、
前記クエリ文字列の分割単語に対する前記ターゲット文字列の分割単語の最小重み、または、前記ターゲット文字列の分割単語に対する前記クエリ文字列の分割単語の最小重みを決定し、
前記最小重みに基づいて、ターゲット文字列について前記最短スライディングウィンドウの前記重み付けされた長さを計算し、
前記ターゲット文字列の前記最短スライディングウィンドウの前記重み付けされた長さを比較すること、を含み、
重み付けされた長さが短いターゲット文字列が、重み付けされた長さが長いターゲット文字列よりも高く順位付けされる、方法。 - 検索結果を順位付けするための方法であって、
クエリ文字列を受信し、
クエリ文字列に関連する対応する複数のターゲット文字列を含む複数の検索結果を取得し、
前記クエリ文字列と、前記複数のターゲット文字列のそれぞれを分割し、
単語の組み合わせと単語の組み合わせに対する重みとのマッピングに基づいて、前記クエリ文字列の分割単語に対する各挿入単語の最小重みを決定し、
単語の組み合わせと単語の組み合わせに対する重みとのマッピングに基づいて、前記ターゲット文字列の分割単語に対する各削除単語の最小重みを決定し、
各挿入単語の前記最小重みおよび各削除単語の前記最小重みに少なくとも部分的に基づいて総編集距離を決定し、
前記総編集距離に基づいて前記ターゲット文字列を順位付けること、
を備える、方法。 - 請求項7に記載の方法であって、前記総編集距離を決定することは、
前記複数のターゲット文字列の複数の総編集距離をWTotal=WI+WDとして計算することを含み、
WTotalは前記総編集距離を表し、WIは前記クエリ文字列の分割単語に対する前記挿入単語の前記最小重みを表し、WDは前記複数のターゲット文字列の内の一ターゲット文字列の分割単語に対する前記削除単語の前記最小重みを表す、方法。 - 請求項7に記載の方法であって、さらに、
各置換単語の最小重みを決定することを備え、
前記総編集距離を決定することは、さらに、各置換単語の前記最小重みに基づき、
前記総編集距離は、WTotal=WI+WD+WCとして計算され、
WTotalは前記総編集距離を表し、WIは前記クエリ文字列の分割単語に対する前記挿入単語の前記最小重みを表し、WDは前記複数のターゲット文字の内の一ターゲット文字列の分割単語に対する前記削除単語の前記最小重みを表し、WCは前記クエリ文字または前記ターゲット文字列の分割単語に対する前記置換単語の前記最小重みを表す、方法。 - 請求項11に記載の方法であって、前記各置換単語の前記最小重みを決定することは、事前設定された固定値に前記置換単語の前記編集距離の前記最小重みを設定することを含む、方法。
- 請求項11に記載の方法であって、前記各置換単語の前記最小重みを決定することは、前記置換単語の前記編集距離を、前記クエリ文字列の分割単語に対する前記挿入単語の前記最小重みと前記ターゲット文字列の前記分割単語に対する前記削除単語の前記最小重みとの合計値、平均値、または、最大値に設定することを含む、方法。
- 検索結果を順位付けるためのシステムであって、
1または複数のプロセッサであって、
クエリ文字列を受信し、
クエリ文字列に関連する対応する複数のターゲット文字列を含む複数の検索結果を取得し、
前記クエリ文字列と、各前記複数のターゲット文字列を分割し、
複数の組み合わせを形成するために、前記クエリ文字列の分割部分を前記ターゲット文字列のそれぞれの分割部分と対にし、
単語の組み合わせと単語の組み合わせに対する重みとのマッピングに基づいて、前記複数の組み合わせに対応する複数の重みを取得し、重みは単語の組み合わせに含まれる単語間の意味的相関の指標となり、
前記複数のターゲット文字列のそれぞれに対応する前記重みに基づいて重み付けされた単語長を決定すし、
前記複数のターゲット文字列を前記複数のターゲット文字列のそれぞれについて重み付けされた単語長に基づいて順位付けることを実行するよう構成されている1または複数のプロセッサと、
前記1または複数のプロセッサに接続され、前記1または複数のプロセッサに命令を提供するよう構成されている1または複数のメモリと、
を備える、システム。 - 請求項14に記載のシステムであって、単語の組み合わせと各単語の組み合わに対する重みとの前記マッピングは、
1組の統計サンプルを取得し、
前記1組の統計サンプルから第1の単語および第2の単語を選択し、前記第1および第2の単語の両方が前記統計サンプル内で出現する回数をC(前記第1の単語、前記第2の単語)としてカウントし、
前記第2の単語が前記統計サンプル内で出現する回数をΣC(Yi、前記第2の単語)としてカウントし、Yiは前記第2の単語と一緒に出現するそれぞれの前記単語を表し、
前記第1および第2の単語の両方が前記統計サンプル内で出現する回数と、前記第2の単語が前記統計サンプル内で出現する回数とに基づいて、前記第2の単語が出現する条件のもとでの前記第1の単語の出現確率Pを計算し、
前記第2の単語の検索の際に、前記第1および第2の単語の間の意味的相関の指標となる重みをW=1−Pによって決定し、Wは前記重みであり、Pは前記第2の単語が出現する前記条件のもとでの前記第1の単語の前記確率であり、
前記統計サンプル内の単語の組み合わせの間の意味的相関の指標となる前記重みを決定するために、前記選択、カウント、計算、および、決定を繰り返し、
前記単語の組み合わせと各単語の組み合わせに対する重みとの前記マッピングを格納すること、によって決定される、システム。 - 請求項14に記載のシステムであって、
前記重み付けされた単語長は、最短スライディングウィンドウの前記重み付けされた単語長であり、
前記重みから前記重み付けされた単語長を決定して、それぞれの前記ターゲット文字列を順位付けことは、
前記クエリ文字列の分割単語に対する前記ターゲット文字列の分割単語の最小重み、または、前記ターゲット文字列の分割単語に対する前記クエリ文字列の分割単語の最小重みを決定し、
前記最小重みに基づいて、ターゲット文字列について前記最短スライディングウィンドウの前記重み付けされた長さを計算し、
前記ターゲット文字列の前記最短スライディングウィンドウの前記重み付けされた長さを比較すること、を含み、
重み付けされた長さが短いターゲット文字列が、重み付けされた長さが長いターゲット文字列よりも高く順位付けされる、システム。 - 検索結果を順位付けるためのシステムであって、
1または複数のプロセッサであって、
クエリ文字列を受信し、
クエリ文字列に関連する対応する複数のターゲット文字列を含む複数の検索結果を取得し、
前記クエリ文字列と、前記複数のターゲット文字列のそれぞれを分割し、
単語の組み合わせと単語の組み合わせに対する重みとのマッピングに基づいて、前記クエリ文字列の分割単語に対する各挿入単語の最小重みを決定し、
単語の組み合わせと単語の組み合わせに対する重みとのマッピングに基づいて、前記ターゲット文字列の分割単語に対する各削除単語の最小重みを決定し、
各挿入単語の前記最小重みおよび各削除単語の前記最小重みに少なくとも部分的に基づいて総編集距離を決定し、
前記総編集距離に基づいて前記ターゲット文字列を順位付けることを実行するよう構成されている1または複数のプロセッサと、
前記1または複数のプロセッサに接続され、前記1または複数のプロセッサに命令を提供するよう構成されている1または複数のメモリと、
を備える、システム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009101516473A CN101957828B (zh) | 2009-07-20 | 2009-07-20 | 一种对搜索结果进行排序的方法和装置 |
CN200910151647.3 | 2009-07-20 | ||
US12/804,229 US8856098B2 (en) | 2009-07-20 | 2010-07-15 | Ranking search results based on word weight |
US12/804,229 | 2010-07-15 | ||
PCT/US2010/002000 WO2011011046A1 (en) | 2009-07-20 | 2010-07-16 | Ranking search results based on word weight |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012533818A true JP2012533818A (ja) | 2012-12-27 |
JP5597255B2 JP5597255B2 (ja) | 2014-10-01 |
Family
ID=43465993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012521611A Expired - Fee Related JP5597255B2 (ja) | 2009-07-20 | 2010-07-16 | 単語の重みに基づいた検索結果の順位付け |
Country Status (6)
Country | Link |
---|---|
US (2) | US8856098B2 (ja) |
EP (1) | EP2457151A4 (ja) |
JP (1) | JP5597255B2 (ja) |
CN (1) | CN101957828B (ja) |
HK (1) | HK1149823A1 (ja) |
WO (1) | WO2011011046A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018501597A (ja) * | 2015-12-03 | 2018-01-18 | 小米科技有限責任公司Xiaomi Inc. | 類似性特定方法、装置、端末、プログラム及び記録媒体 |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102637171A (zh) * | 2011-02-10 | 2012-08-15 | 北京百度网讯科技有限公司 | 一种优化搜索结果的方法和装置 |
CN102799586B (zh) * | 2011-05-24 | 2016-04-27 | 北京百度网讯科技有限公司 | 一种用于搜索结果排序的转义度确定方法和装置 |
US8706753B2 (en) * | 2011-08-25 | 2014-04-22 | Oracle International Corporation | Search result ranking with search string certainty weighting |
CN102346777B (zh) * | 2011-10-09 | 2016-06-01 | 北京百度网讯科技有限公司 | 一种对例句检索结果进行排序的方法和装置 |
CN103294727B (zh) * | 2012-03-05 | 2017-09-08 | 阿里巴巴集团控股有限公司 | 一种被推荐对象的过滤方法及系统 |
CN103425691B (zh) * | 2012-05-22 | 2016-12-14 | 阿里巴巴集团控股有限公司 | 一种搜索方法和系统 |
WO2014021824A1 (en) * | 2012-07-30 | 2014-02-06 | Hewlett-Packard Development Company, L.P. | Search method |
US9292621B1 (en) | 2012-09-12 | 2016-03-22 | Amazon Technologies, Inc. | Managing autocorrect actions |
US9305150B2 (en) * | 2012-12-10 | 2016-04-05 | Lookout, Inc. | Method and system for managing user login behavior on an electronic device for enhanced security |
CN103902549B (zh) * | 2012-12-25 | 2017-12-12 | 阿里巴巴集团控股有限公司 | 搜索数据排序的方法和装置,数据搜索的方法和装置 |
US20140223466A1 (en) * | 2013-02-01 | 2014-08-07 | Huawei Technologies Co., Ltd. | Method and Apparatus for Recommending Video from Video Library |
CN103970791B (zh) * | 2013-02-01 | 2018-01-23 | 华为技术有限公司 | 一种从视频库推荐视频的方法、装置 |
US9727544B2 (en) * | 2013-05-06 | 2017-08-08 | Dropbox, Inc. | Animating edits to documents |
CN103488787B (zh) * | 2013-09-30 | 2017-12-19 | 北京奇虎科技有限公司 | 一种基于视频搜索的在线播放入口对象的推送方法和装置 |
WO2015043389A1 (zh) * | 2013-09-30 | 2015-04-02 | 北京奇虎科技有限公司 | 一种基于视频搜索的分词信息推送方法和装置 |
CN103491205B (zh) * | 2013-09-30 | 2016-08-17 | 北京奇虎科技有限公司 | 一种基于视频搜索的关联资源地址的推送方法和装置 |
US20150170067A1 (en) * | 2013-12-17 | 2015-06-18 | International Business Machines Corporation | Determining analysis recommendations based on data analysis context |
US9754020B1 (en) | 2014-03-06 | 2017-09-05 | National Security Agency | Method and device for measuring word pair relevancy |
US10242090B1 (en) * | 2014-03-06 | 2019-03-26 | The United States Of America As Represented By The Director, National Security Agency | Method and device for measuring relevancy of a document to a keyword(s) |
US10353964B2 (en) * | 2014-09-15 | 2019-07-16 | Google Llc | Evaluating semantic interpretations of a search query |
CN104462327B (zh) * | 2014-12-02 | 2018-09-11 | 百度在线网络技术(北京)有限公司 | 语句相似度的计算、搜索处理方法及装置 |
CN104462323B (zh) * | 2014-12-02 | 2018-02-27 | 百度在线网络技术(北京)有限公司 | 语义相似度计算方法、搜索结果处理方法和装置 |
US10528328B2 (en) * | 2015-12-08 | 2020-01-07 | Microsoft Technology Licensing, Llc | Learning from input patterns in Programing-By-Example |
CN106919603B (zh) * | 2015-12-25 | 2020-12-04 | 北京奇虎科技有限公司 | 计算查询词模式中分词权重的方法和装置 |
US10021051B2 (en) * | 2016-01-01 | 2018-07-10 | Google Llc | Methods and apparatus for determining non-textual reply content for inclusion in a reply to an electronic communication |
CN106970919B (zh) * | 2016-01-14 | 2020-05-12 | 北京国双科技有限公司 | 新词组发现的方法及装置 |
CN106997335B (zh) * | 2016-01-26 | 2020-05-19 | 阿里巴巴集团控股有限公司 | 相同字符串的判定方法及装置 |
CN107657471B (zh) * | 2016-09-22 | 2021-04-30 | 腾讯科技(北京)有限公司 | 一种虚拟资源的展示方法、客户端及插件 |
CN107103066A (zh) * | 2017-04-18 | 2017-08-29 | 北京思特奇信息技术股份有限公司 | 一种用户偏好的检索方法及装置 |
CN110580271B (zh) * | 2018-06-08 | 2022-05-24 | 百度在线网络技术(北京)有限公司 | 数据查询方法和装置 |
CN109783498B (zh) * | 2019-01-17 | 2020-06-02 | 北京三快在线科技有限公司 | 数据处理方法及装置、电子设备、存储介质 |
CN110287307B (zh) * | 2019-05-05 | 2022-04-05 | 浙江吉利控股集团有限公司 | 一种搜索结果排序方法、装置及服务器 |
CN112667779B (zh) * | 2020-12-30 | 2023-09-05 | 北京奇艺世纪科技有限公司 | 一种信息查询方法、装置、电子设备及存储介质 |
CN112564988B (zh) * | 2021-02-19 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 告警处理方法、装置及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000194713A (ja) * | 1998-12-25 | 2000-07-14 | Nippon Telegr & Teleph Corp <Ntt> | 文字列検索方法及び装置及び文字列検索プログラムを格納した記憶媒体 |
JP2005063468A (ja) * | 1996-05-29 | 2005-03-10 | Matsushita Electric Ind Co Ltd | 文書検索装置 |
WO2008083211A1 (en) * | 2006-12-29 | 2008-07-10 | Thomson Reuters Global Resources | Information-retrieval systems, methods, and software with concept-based searching and ranking |
WO2009066501A1 (ja) * | 2007-11-19 | 2009-05-28 | Nippon Telegraph And Telephone Corporation | 情報検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6018735A (en) * | 1997-08-22 | 2000-01-25 | Canon Kabushiki Kaisha | Non-literal textual search using fuzzy finite-state linear non-deterministic automata |
AU3292699A (en) | 1998-02-13 | 1999-08-30 | Yahoo! Inc. | Search engine using sales and revenue to weight search results |
US6633868B1 (en) * | 2000-07-28 | 2003-10-14 | Shermann Loyall Min | System and method for context-based document retrieval |
US20020103798A1 (en) | 2001-02-01 | 2002-08-01 | Abrol Mani S. | Adaptive document ranking method based on user behavior |
US20040002849A1 (en) * | 2002-06-28 | 2004-01-01 | Ming Zhou | System and method for automatic retrieval of example sentences based upon weighted editing distance |
US20040064447A1 (en) | 2002-09-27 | 2004-04-01 | Simske Steven J. | System and method for management of synonymic searching |
US20050144162A1 (en) | 2003-12-29 | 2005-06-30 | Ping Liang | Advanced search, file system, and intelligent assistant agent |
US20050198026A1 (en) | 2004-02-03 | 2005-09-08 | Dehlinger Peter J. | Code, system, and method for generating concepts |
US20070250501A1 (en) | 2005-09-27 | 2007-10-25 | Grubb Michael L | Search result delivery engine |
US7707204B2 (en) | 2005-12-13 | 2010-04-27 | Microsoft Corporation | Factoid-based searching |
US7756859B2 (en) * | 2005-12-19 | 2010-07-13 | Intentional Software Corporation | Multi-segment string search |
US9177124B2 (en) | 2006-03-01 | 2015-11-03 | Oracle International Corporation | Flexible authentication framework |
US20080016053A1 (en) | 2006-07-14 | 2008-01-17 | Bea Systems, Inc. | Administration Console to Select Rank Factors |
US20080016061A1 (en) | 2006-07-14 | 2008-01-17 | Bea Systems, Inc. | Using a Core Data Structure to Calculate Document Ranks |
US7873641B2 (en) | 2006-07-14 | 2011-01-18 | Bea Systems, Inc. | Using tags in an enterprise search system |
US20080016071A1 (en) | 2006-07-14 | 2008-01-17 | Bea Systems, Inc. | Using Connections Between Users, Tags and Documents to Rank Documents in an Enterprise Search System |
US7562088B2 (en) * | 2006-12-27 | 2009-07-14 | Sap Ag | Structure extraction from unstructured documents |
CN100517330C (zh) * | 2007-06-06 | 2009-07-22 | 华东师范大学 | 一种基于语义的本地文档检索方法 |
TWI356315B (en) * | 2007-10-16 | 2012-01-11 | Inst Information Industry | Method and system for constructing data tag based |
CN100557612C (zh) * | 2007-11-15 | 2009-11-04 | 深圳市迅雷网络技术有限公司 | 一种基于搜索引擎的搜索结果排序方法及装置 |
US8051187B2 (en) * | 2008-12-22 | 2011-11-01 | Check Point Software Technologies Ltd. | Methods for automatic categorization of internal and external communication for preventing data loss |
-
2009
- 2009-07-20 CN CN2009101516473A patent/CN101957828B/zh active Active
-
2010
- 2010-07-15 US US12/804,229 patent/US8856098B2/en active Active
- 2010-07-16 EP EP10802539.6A patent/EP2457151A4/en not_active Withdrawn
- 2010-07-16 JP JP2012521611A patent/JP5597255B2/ja not_active Expired - Fee Related
- 2010-07-16 WO PCT/US2010/002000 patent/WO2011011046A1/en active Application Filing
-
2011
- 2011-04-21 HK HK11104094.4A patent/HK1149823A1/xx not_active IP Right Cessation
-
2014
- 2014-08-29 US US14/473,677 patent/US9317591B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005063468A (ja) * | 1996-05-29 | 2005-03-10 | Matsushita Electric Ind Co Ltd | 文書検索装置 |
JP2000194713A (ja) * | 1998-12-25 | 2000-07-14 | Nippon Telegr & Teleph Corp <Ntt> | 文字列検索方法及び装置及び文字列検索プログラムを格納した記憶媒体 |
WO2008083211A1 (en) * | 2006-12-29 | 2008-07-10 | Thomson Reuters Global Resources | Information-retrieval systems, methods, and software with concept-based searching and ranking |
JP2010515171A (ja) * | 2006-12-29 | 2010-05-06 | トムソン ルーターズ グローバル リソーシーズ | 概念ベースの検索とランク付けを伴う情報検索のシステム、方法およびソフトウェア |
WO2009066501A1 (ja) * | 2007-11-19 | 2009-05-28 | Nippon Telegraph And Telephone Corporation | 情報検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018501597A (ja) * | 2015-12-03 | 2018-01-18 | 小米科技有限責任公司Xiaomi Inc. | 類似性特定方法、装置、端末、プログラム及び記録媒体 |
US10089301B2 (en) | 2015-12-03 | 2018-10-02 | Xiaomi Inc. | Method and apparatus for determining semantic similarity of character strings |
Also Published As
Publication number | Publication date |
---|---|
WO2011011046A1 (en) | 2011-01-27 |
JP5597255B2 (ja) | 2014-10-01 |
EP2457151A4 (en) | 2017-01-04 |
US9317591B2 (en) | 2016-04-19 |
US20110016111A1 (en) | 2011-01-20 |
US20150081683A1 (en) | 2015-03-19 |
CN101957828A (zh) | 2011-01-26 |
US8856098B2 (en) | 2014-10-07 |
HK1149823A1 (en) | 2011-10-14 |
CN101957828B (zh) | 2013-03-06 |
EP2457151A1 (en) | 2012-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5597255B2 (ja) | 単語の重みに基づいた検索結果の順位付け | |
CN110674429B (zh) | 用于信息检索的方法、装置、设备和计算机可读存储介质 | |
US9846748B2 (en) | Searching for information based on generic attributes of the query | |
JP5450842B2 (ja) | 単語情報エントロピの決定 | |
TWI524193B (zh) | 用於搜尋結果之語義目錄的電腦可讀取媒體及電腦實現方法 | |
US20120323839A1 (en) | Entity recognition using probabilities for out-of-collection data | |
US8949227B2 (en) | System and method for matching entities and synonym group organizer used therein | |
CN106446122B (zh) | 信息检索的方法、装置与计算设备 | |
JP2014501422A (ja) | ユーザ意図の有無に基づく検索キーワードの推薦 | |
CN103577416A (zh) | 扩展查询方法及系统 | |
CN110147494B (zh) | 信息搜索方法、装置,存储介质及电子设备 | |
CN110990533A (zh) | 确定查询文本所对应标准文本的方法及装置 | |
CN111159563A (zh) | 用户兴趣点信息的确定方法、装置、设备及存储介质 | |
JP2009193219A (ja) | インデックス作成装置、その方法、プログラム及び記録媒体 | |
CN115630144B (zh) | 一种文档搜索方法、装置及相关设备 | |
US20230143777A1 (en) | Semantics-aware hybrid encoder for improved related conversations | |
CN113656575B (zh) | 训练数据的生成方法、装置、电子设备及可读介质 | |
CN111144098B (zh) | 扩展问句的召回方法和装置 | |
CN114020867A (zh) | 一种搜索词的扩展方法、装置、设备及介质 | |
JP2009157458A (ja) | インデックス作成装置、その方法、プログラム及び記録媒体 | |
US9652499B1 (en) | Search-based recommendation engine | |
CN116501841B (zh) | 数据模型模糊查询方法、系统及存储介质 | |
CN111159526B (zh) | 查询语句处理方法、装置、设备及存储介质 | |
JP2007149022A (ja) | 文書特徴抽出装置、方法及びプログラム | |
TWI486797B (zh) | Methods and devices for sorting search results |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130702 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140416 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140715 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140808 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5597255 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |