JP2017010514A - 検索エンジン及びその実現方法 - Google Patents
検索エンジン及びその実現方法 Download PDFInfo
- Publication number
- JP2017010514A JP2017010514A JP2015232575A JP2015232575A JP2017010514A JP 2017010514 A JP2017010514 A JP 2017010514A JP 2015232575 A JP2015232575 A JP 2015232575A JP 2015232575 A JP2015232575 A JP 2015232575A JP 2017010514 A JP2017010514 A JP 2017010514A
- Authority
- JP
- Japan
- Prior art keywords
- escape
- query request
- dictionary
- candidate
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24575—Query processing with adaptation to user needs using context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Abstract
Description
(2)
での単語集合は
である。当該単語集合は単語分割位置
と対応する原単語、関連単語及び小粒度構成部分を含む。
の類似度重みを表し、
は2つのセンテンスが対応する重み係数にマッチしたか否かを表し、2つのセンテンスS1、S2の疑問文のタイプがマッチした場合に、対応する重み係数が第1値、例えば1であり、さもないと、第2値、例えば0.8である。
は分割された単語
のターム頻度であり、分割された単語
が当該文書に出現する回数と当該文書の分割された単語の合計数との比として表してもよく、
は分割された単語
の逆文書頻度であり、Nは文書合計数であり、
は分割された単語
が出現した文書の数である。
201:Query−Title対のクリック表示比を取得する
220:ワードアライメントを利用して検索結果からクエリ語句における用語とアライメントする単語と隣接する前後の単語を取得する。
230:クリック表示比が第1の閾値より低いQuery−Title対における対応用語及びその前後の単語を生なエスケープ辞書に加え、クリック表示比が第2の閾値より高いQuery−Title対における対応用語及びその前後の単語を生な非エスケープ辞書に加える。
S1 クエリ
S2 結果
410:ユーザで入力されたクエリ要求を受信する
420:クエリ要求にマッチした候補結果を検索する
430:クリックエスケープモデルに基づいてクエリ要求と各候補結果との間の意味的な関連性を確定する
440:意味的な関連性に応じて候補結果をソートする
510:クエリ要求と候補結果の1つまたは複数の語句との間の意味的な関連性を確定する
511:クリックエスケープモデルに基づいて、センテンス間のテキストテーママッチングモデルを利用してクエリ要求と候補結果の語句との間のテーママッチング類似度を計算する
512:クエリ要求と候補結果の語句との間のマッチング状况に基づいてエスケープ要素を確定する
513:エスケープ要素及びテーママッチング類似度に基づいてクエリ要求と候補結果の語句との間の意味的な関連性を計算する
520:確定されたクエリ要求と候補結果の1つまたは複数の語句との間の意味的な関連性に基づいてクエリ要求と候補結果との間の意味的な関連性を確定する
マッチングが成功した
マッチングが成功した
マッチングが成功した
710:ワードアライメントを利用して候補結果の語句からクエリ要求における用語とアライメントする隣接前文及び後文を確定する。
720:エスケープ辞書及び/または非エスケープ辞書に基づいて候補結果の語句における対応の前文及び後文の類似度重みを調整する。
810受信ユニット
820検索ユニット
840ソートユニット
830意味的な関連性確定ユニット
831計算ユニット
832確定ユニット
905I/Oインターフェース
906入力部
907出力部
908記憶部
909通信部
910ドライバ
911リムーバブルメディア
Claims (22)
- ユーザで入力されたクエリ要求を受信するステップと、
前記クエリ要求にマッチした候補結果を検索するステップと、
クリックエスケープモデルに基づいて前記クエリ要求と各候補結果との間の意味的な関連性を確定するステップと、
前記意味的な関連性に応じて候補結果をソートするステップと、を含んでおり、
ここで、前記クリックエスケープモデルはエスケープ辞書及び/または非エスケープ辞書を含み、前記エスケープ辞書はエスケープが発生したと確定された検索結果の対応用語及びその前後の単語を含み、前記非エスケープ辞書はエスケープが発生していないと確定された検索結果の対応用語及びその前後の単語を含むことを特徴とする検索エンジンの実現方法。 - 前記クエリ要求と各候補結果との間の意味的な関連性を確定するステップにおいては、各候補結果に対して、
前記クエリ要求と候補結果の1つまたは複数の語句との間の意味的な関連性を確定するステップと、
確定されたクエリ要求と候補結果の1つまたは複数の語句との間の意味的な関連性に基づいて前記クエリ要求と前記候補結果との間の意味的な関連性を確定するステップと、を含んでおり、
ここで、前記語句は、候補結果のタイトル、アンカーテキスト及び正文におけるコアセンテンスのうちの少なくとも1つを含むことを特徴とする請求項1に記載の方法。 - 前記クエリ要求と候補結果の語句との間の意味的な関連性を確定するステップにおいては、
前記クリックエスケープモデルに基づいて、センテンス間のテキストテーママッチングモデルを利用して前記クエリ要求と候補結果の語句との間のテーママッチング類似度を計算するステップと、
前記クエリ要求と候補結果の語句との間のマッチング状况に基づいてエスケープ要素を確定するステップと、
前記エスケープ要素及び前記テーママッチング類似度に基づいてクエリ要求と候補結果の語句との間の意味的な関連性を計算するステップと、を含むことを特徴とする請求項2に記載の方法。 - 前記クリックエスケープモデルに基づいて前記クエリ要求と候補結果の語句との間のテーママッチング類似度を計算するステップにおいては
ワードアライメントを利用して候補結果の語句から前記クエリ要求における用語とアライメントする単語と隣接する前の単語及び後の単語を確定するステップと、
前記エスケープ辞書及び/または非エスケープ辞書に基づいて候補結果の語句における対応の前の単語及び後の単語の類似度重みを調整するステップと、
調整後の類似度重みに基づいて、センテンス間のテキストテーママッチングモデルを利用して前記クエリ要求と候補結果の語句との間のテーママッチング類似度を計算するステップと、を含むことを特徴とする請求項3に記載の方法。 - エスケープ辞書及び/または非エスケープ辞書に基づいて候補結果の語句における対応の前文及び後文の類似度重みを調整するステップいおいては、
非エスケープ辞書が候補結果の語句における対応用語及びその前の単語または後の単語を含む場合に、当該前の単語または後の単語の類似度重みを下げるステップと、
エスケープ辞書が候補結果の語句における対応用語及びその前の単語または後の単語を含む場合に、当該前の単語または後の単語の類似度重みを上げるステップと、を含むことを特徴とする請求項4に記載の方法。 - 前記センテンス間のテキストテーママッチングモデルは下記のベクトル空間モデルであることを特徴とする請求項4に記載の方法。
- 前記クエリ要求と候補結果の語句との間のマッチング状况に基づいてエスケープ要素を確定するステップにおいては、
マッチング状况はクエリ要求における最も重要な用語が候補結果の語句に出現していない場合に、エスケープ要素を第1値として確定するステップと、
マッチング状况は前後の単語のマッチングが存在している場合に、エスケープ要素を第2値として確定するステップと、
マッチング状况は前後の単語の完全なマッチングが存在していない場合に、エスケープ要素を第3値として確定するステップと、を含み、
ここで、前記第1値が第2値より小さく、且つ前記第2値が第3値より小さいことを特徴とする請求項3に記載の方法。 - 下記の式でクエリ要求と候補結果の語句との間の意味的な関連性を計算することを特徴とする請求項3に記載の方法。
- 前記クリックエスケープモデルにおけるエスケープ辞書及び非エスケープ辞書はクエリ要求・検索結果Query−Title対のクリック数を学習することにより構築されることを特徴とする請求項1に記載の方法。
- 前記エスケープ辞書及び非エスケープ辞書は、下記の方法で構築された生なエスケープ辞書及び生な非エスケープ辞書を含み、すなわち、
Query−Title対のクリック表示比を取得するステップと、
ワードアライメントを利用して検索結果からクエリ語句における用語とアライメントする単語と隣接する前後の単語を取得するステップと、
クリック表示比が第1の閾値より低いQuery−Title対における対応の用語及びその前後の単語を生なエスケープ辞書に加えるステップと、
クリック表示比が第2の閾値より高いQuery−Title対における対応の用語及びその前後の単語を生な非エスケープ辞書に加えるステップと、を含んでおり、
ここで、前記クリック表示比がクリック数と表示数との比であり、表示数は検索結果がクエリ要求に応じて表示される回数を指し、クリック数は検索結果がクエリ要求に応じて表示される時に、ユーザにクリックされた回数を示すことを特徴とする請求項9に記載の方法。 - 前記エスケープ辞書及び非エスケープ辞書は下記の方法で構築された汎化エスケープ辞書及び汎化非エスケープ辞書を更に含み、すなわち、
クエリ要求における用語に対して意味カテゴリーを表記するステップと、
表記された意味カテゴリーを利用して生なエスケープ辞書及び生な非エスケープ辞書に対応する汎化エスケープ辞書及び汎化非エスケープ辞書を構築するステップを含むことを特徴とする請求項10に記載の方法。 - 前記ワードアライメントは同義ワードアライメントを含むことを特徴とする請求項4または10に記載の方法。
- ユーザで入力されたクエリ要求を受信する受信ユニットと、
前記クエリ要求にマッチした候補結果を検索する検索ユニットと、
クリックエスケープモデルに基づいて前記クエリ要求と各候補結果との間の意味的な関連性を確定する意味的な関連性確定ユニットと、
前記意味的な関連性に応じて候補結果をソートするソートユニットと、を備えており、
ここで、前記クリックエスケープモデルはエスケープ辞書及び/または非エスケープ辞書を含み、前記エスケープ辞書はエスケープが発生したと確定された検索結果の対応用語及びその前後の単語を含み、前記非エスケープ辞書はエスケープが発生していないと確定された検索結果の対応用語及びその前後の単語を含むことを特徴とする検索エンジン。 - 前記意味的な関連性確定ユニットは、
各候補結果に対して、前記クエリ要求と候補結果の1つまたは複数の語句との間の意味的な関連性を確定することに用いられる計算ユニットと、
確定されたクエリ要求と候補結果の1つまたは複数の語句との間の意味的な関連性に基づいて前記クエリ要求と前記候補結果との間の意味的な関連性を確定する確定ユニットと、を備えており、
ここで、前記語句は、候補結果のタイトル、アンカーテキスト及び正文におけるコアセンテンスのうちの少なくとも1つをことを含む特徴とする請求項13に記載の検索エンジン。 - 前記計算ユニットは、
前記クリックエスケープモデルに基づいて、センテンス間のテキストテーママッチングモデルを利用して前記クエリ要求と候補結果の語句との間のテーママッチング類似度を計算するテーママッチング類似度モジュールと、
前記クエリ要求と候補結果の語句との間のマッチング状况に基づいてエスケープ要素を確定するエスケープ要素モジュールと、
前記エスケープ要素及び前記テーママッチング類似度に基づいてクエリ要求と候補結果の語句との間の意味的な関連性を計算する合成モジュールとを備えることを特徴とする請求項14に記載の検索エンジン。 - 前記テーママッチング類似度モジュールは、
ワードアライメントを利用して候補結果の語句から前記クエリ要求における用語とアライメントする単語と隣接する前の単語及び後の単語を確定し、
前記エスケープ辞書及び/または非エスケープ辞書に基づいて候補結果の語句における対応の前の単語及び後の単語の類似度重みを調整し、
調整後の類似度重みに基づいて、センテンス間のテキストテーママッチングモデルを利用して前記クエリ要求と候補結果の語句との間のテーママッチング類似度を計算することを特徴とする請求項15に記載の検索エンジン。 - 前記エスケープ要素モジュールは、
マッチング状况はクエリ要求における最も重要な用語が候補結果の語句に出現していない場合に、エスケープ要素を第1値として確定し、
マッチング状况は前後の単語のマッチングが存在している場合に、エスケープ要素を第2値として確定し、
マッチング状况は前後の単語の完全なマッチングが存在していない場合に、エスケープ要素を第3値として確定し、
ここで、前記第1値が第2値より小さく、且つ前記第2値が第3値より小さいことを特徴とする請求項15に記載の検索エンジン。 - 前記クリックエスケープモデルにおけるエスケープ辞書及び非エスケープ辞書はクエリ要求・検索結果Query−Title対のクリック数を学習することにより構築されることを特徴とする請求項13に記載の検索エンジン。
- 前記エスケープ辞書及び非エスケープ辞書は、下記の方法で構築された生なエスケープ辞書及び生な非エスケープ辞書を含み、すなわち、
Query−Title対のクリック表示比を取得するステップと、
ワードアライメントを利用して検索結果からクエリ語句における用語とアライメントする単語と隣接する前後の単語を取得するステップと、
クリック表示比が第1の閾値より低いQuery−Title対における対応の用語及びその前後の単語を生なエスケープ辞書に加えるステップと、
クリック表示比が第2の閾値より高いQuery−Title対における対応の用語及びその前後の単語を生な非エスケープ辞書に加えるステップと、を含んでおり、
ここで、前記クリック表示比がクリック数と表示数との比であり、表示数は検索結果がクエリ要求に応じて表示される回数を指し、クリック数は検索結果がクエリ要求に応じて表示される時に、ユーザにクリックされた回数を示すことを特徴とする請求項18に記載の検索エンジン。 - 前記エスケープ辞書及び非エスケープ辞書は下記の方法で構築された汎化エスケープ辞書及び汎化非エスケープ辞書を更に含み、すなわち、
クエリ要求における用語に対して意味カテゴリーを表記するステップと、
表記された意味カテゴリーを利用して生なエスケープ辞書及び生な非エスケープ辞書に対応する汎化エスケープ辞書及び汎化非エスケープ辞書を構築するステップと、を含む請求項19に記載の検索エンジン。 - 検索エンジンを実現するシステムであって、
プロセッサと、
記憶部を備えており、
前記記憶部はコンピュータ可読命令を記憶し、前記コンピュータ可読命令が前記プロセッサより実行される場合に、前記プロセッサは、
ユーザで入力されたクエリ要求を受信し、
前記クエリ要求にマッチした候補結果を検索し、
クリックエスケープモデルに基づいて前記クエリ要求と各候補結果との間の意味的な関連性を確定し、
前記意味的な関連性に応じて候補結果をソートしており、
ここで、前記クリックエスケープモデルはエスケープ辞書及び/または非エスケープ辞書を含み、前記エスケープ辞書はエスケープが発生したと確定された検索結果の対応用語及びその前後の単語を含み、前記非エスケープ辞書はエスケープが発生していないと確定された検索結果の対応用語及びその前後の単語を含むことを特徴とするシステム。 - 不揮発性のコンピュータ記憶媒質であって、コンピュータ可読命令を記憶しており、前記コンピュータ可読命令がプロセッサより実行される場合に、前記プロセッサは、
前記記憶部はコンピュータ可読命令を記憶し、前記コンピュータ可読命令が前記プロセッサより実行される場合に、前記プロセッサは、
ユーザで入力されたクエリ要求を受信し、
前記クエリ要求にマッチした候補結果を検索し、
クリックエスケープモデルに基づいて前記クエリ要求と各候補結果との間の意味的な関連性を確定し、
前記意味的な関連性に応じて候補結果をソートしており、
ここで、前記クリックエスケープモデルはエスケープ辞書及び/または非エスケープ辞書を含み、前記エスケープ辞書はエスケープが発生したと確定された検索結果の対応用語及びその前後の単語を含み、前記非エスケープ辞書はエスケープが発生していないと確定された検索結果の対応用語及びその前後の単語を含むことを特徴とする不揮発性のコンピュータ記憶媒質。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510342427.4 | 2015-06-18 | ||
CN201510342427.4A CN104899322B (zh) | 2015-06-18 | 2015-06-18 | 搜索引擎及其实现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017010514A true JP2017010514A (ja) | 2017-01-12 |
JP6161679B2 JP6161679B2 (ja) | 2017-07-12 |
Family
ID=54031984
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015232575A Active JP6161679B2 (ja) | 2015-06-18 | 2015-11-30 | 検索エンジン及びその実現方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10275533B2 (ja) |
EP (1) | EP3107006A1 (ja) |
JP (1) | JP6161679B2 (ja) |
KR (1) | KR101721338B1 (ja) |
CN (1) | CN104899322B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022050379A (ja) * | 2021-02-09 | 2022-03-30 | ペキン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10120949B2 (en) * | 2015-10-29 | 2018-11-06 | Google Llc | Indexing native application data |
CN105893533B (zh) * | 2016-03-31 | 2021-05-07 | 北京奇艺世纪科技有限公司 | 一种文本匹配方法及装置 |
CN105975639B (zh) * | 2016-07-04 | 2019-12-06 | 北京百度网讯科技有限公司 | 搜索结果排序方法和装置 |
CN106776782B (zh) * | 2016-11-21 | 2020-05-22 | 北京百度网讯科技有限公司 | 基于人工智能的语义相似度获取方法及装置 |
CN108090099B (zh) * | 2016-11-22 | 2022-02-25 | 科大讯飞股份有限公司 | 一种文本处理方法及装置 |
CN106776863A (zh) * | 2016-11-28 | 2017-05-31 | 合网络技术(北京)有限公司 | 文本相关度的确定方法、查询结果的推送方法及装置 |
CN108241667B (zh) * | 2016-12-26 | 2019-10-15 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN107402954B (zh) | 2017-05-26 | 2020-07-10 | 百度在线网络技术(北京)有限公司 | 建立排序模型的方法、基于该模型的应用方法和装置 |
US10783149B2 (en) * | 2017-08-02 | 2020-09-22 | Microsoft Technology Licensing, Llc | Dynamic productivity content rendering based upon user interaction patterns |
CN109408794A (zh) * | 2017-08-17 | 2019-03-01 | 阿里巴巴集团控股有限公司 | 一种频次词典建立方法、分词方法、服务器和客户端设备 |
CN109426357B (zh) * | 2017-09-01 | 2023-05-12 | 百度在线网络技术(北京)有限公司 | 信息输入方法和装置 |
CN107704535A (zh) * | 2017-09-21 | 2018-02-16 | 广州大学 | 基于主题相似度的网页信息获取方法、装置及系统 |
CN107590132B (zh) * | 2017-10-17 | 2020-08-11 | 语联网(武汉)信息技术有限公司 | 一种自动更正部分文字的方法-由英文词性判断 |
CN108090121A (zh) * | 2017-11-07 | 2018-05-29 | 曙光信息产业(北京)有限公司 | 图书评论挖掘系统及方法 |
CN107967256B (zh) * | 2017-11-14 | 2021-12-21 | 北京拉勾科技有限公司 | 词语权重预测模型生成方法、职位推荐方法及计算设备 |
CN110147426B (zh) * | 2017-12-01 | 2021-08-13 | 北京搜狗科技发展有限公司 | 一种查询文本的分类标签确定方法及相关装置 |
CN110019888A (zh) * | 2017-12-01 | 2019-07-16 | 北京搜狗科技发展有限公司 | 一种搜索方法及装置 |
CN110134850A (zh) * | 2018-02-09 | 2019-08-16 | 北京搜狗科技发展有限公司 | 一种搜索方法及装置 |
CN108538291A (zh) | 2018-04-11 | 2018-09-14 | 百度在线网络技术(北京)有限公司 | 语音控制方法、终端设备、云端服务器及系统 |
CN109033140B (zh) * | 2018-06-08 | 2020-05-29 | 北京百度网讯科技有限公司 | 一种确定搜索结果的方法、装置、设备和计算机存储介质 |
US11204972B2 (en) * | 2018-06-25 | 2021-12-21 | Ebay Inc. | Comprehensive search engine scoring and modeling of user relevance |
CN110737756B (zh) | 2018-07-03 | 2023-06-23 | 百度在线网络技术(北京)有限公司 | 确定针对用户输入数据的应答的方法、装置、设备和介质 |
CN109508394A (zh) * | 2018-10-18 | 2019-03-22 | 青岛聚看云科技有限公司 | 一种多媒体文件搜索排序模型的训练方法及装置 |
WO2020082272A1 (en) * | 2018-10-24 | 2020-04-30 | Alibaba Group Holding Limited | Intelligent customer services based on a vector propagation on a click graph model |
CN109359302B (zh) * | 2018-10-26 | 2023-04-18 | 重庆大学 | 一种领域化词向量的优化方法及基于其的融合排序方法 |
CN109213937B (zh) * | 2018-11-29 | 2020-07-24 | 深圳爱问科技股份有限公司 | 智能搜索方法及装置 |
CN111259225B (zh) * | 2018-12-03 | 2023-04-25 | 阿里巴巴集团控股有限公司 | 新媒体信息展示方法、装置、电子设备及计算机可读介质 |
CN111382265B (zh) * | 2018-12-28 | 2023-09-19 | 中国移动通信集团贵州有限公司 | 搜索方法、装置、设备和介质 |
CN111381685B (zh) * | 2018-12-29 | 2024-03-22 | 北京搜狗科技发展有限公司 | 一种句联想方法和装置 |
CN109815396B (zh) * | 2019-01-16 | 2021-09-21 | 北京搜狗科技发展有限公司 | 搜索词权重确定方法及装置 |
KR102208412B1 (ko) * | 2019-06-03 | 2021-01-26 | 정제성 | 복합 센서를 이용하여 걸음 수에 대한 정상 측정 여부의 판단이 가능한 전자 단말 장치 및 그 동작 방법 |
CN112149005B (zh) * | 2019-06-27 | 2023-09-01 | 腾讯科技(深圳)有限公司 | 用于确定搜索结果的方法、装置、设备和可读存储介质 |
CN112579535A (zh) * | 2019-09-30 | 2021-03-30 | 北京国双科技有限公司 | 一种文件匹配方法、装置、电子设备及存储介质 |
CN111128376B (zh) * | 2019-11-21 | 2023-06-16 | 泰康保险集团股份有限公司 | 一种推荐评估表单的方法和装置 |
CN113010633B (zh) * | 2019-12-20 | 2023-01-31 | 海信视像科技股份有限公司 | 一种信息交互方法及设备 |
CN111159499B (zh) * | 2019-12-31 | 2022-04-29 | 南方电网调峰调频发电有限公司 | 一种基于字符串间相似性的电力系统模型搜索排序方法 |
CN113139034A (zh) * | 2020-01-17 | 2021-07-20 | 深圳市优必选科技股份有限公司 | 一种语句匹配方法、语句匹配装置及智能设备 |
CN113282779A (zh) | 2020-02-19 | 2021-08-20 | 阿里巴巴集团控股有限公司 | 图像搜索方法、装置、设备 |
CN113536156A (zh) * | 2020-04-13 | 2021-10-22 | 百度在线网络技术(北京)有限公司 | 搜索结果排序方法、模型构建方法、装置、设备和介质 |
CN111753167B (zh) * | 2020-06-22 | 2024-01-12 | 北京百度网讯科技有限公司 | 搜索处理方法、装置、计算机设备和介质 |
CN111897994A (zh) * | 2020-07-15 | 2020-11-06 | 腾讯音乐娱乐科技(深圳)有限公司 | 搜索方法、装置及服务器和计算机可读存储介质 |
CN112084210A (zh) * | 2020-09-28 | 2020-12-15 | 中国建设银行股份有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN112183110A (zh) * | 2020-09-28 | 2021-01-05 | 贵州云腾志远科技发展有限公司 | 一种基于数据中心的人工智能数据应用系统及应用方法 |
CN112507091A (zh) * | 2020-12-01 | 2021-03-16 | 百度健康(北京)科技有限公司 | 检索信息的方法、装置、设备以及存储介质 |
CN113434661A (zh) * | 2021-06-29 | 2021-09-24 | 平安科技(深圳)有限公司 | 公文拟稿提示方法、装置、电子设备及存储介质 |
CN117112773A (zh) * | 2023-09-08 | 2023-11-24 | 中航机载系统共性技术有限公司 | 一种基于nlp的适航非结构化数据的搜索方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08320879A (ja) * | 1995-05-26 | 1996-12-03 | Nec Corp | 適合フィードバック装置 |
JP2006251935A (ja) * | 2005-03-08 | 2006-09-21 | Ricoh Co Ltd | 文書検索装置、文書検索方法、および文書検索プログラム |
JP2009110231A (ja) * | 2007-10-30 | 2009-05-21 | Nippon Telegr & Teleph Corp <Ntt> | 文章検索サーバコンピュータ,文章検索方法,文章検索プログラム,そのプログラムを記録した記録媒体 |
JP2010205189A (ja) * | 2009-03-05 | 2010-09-16 | Nec Corp | 検索結果文書のスコアリングシステム、スコア算出装置、スコアリング方法、及びスコアリングプログラム |
US20110125578A1 (en) * | 2000-04-04 | 2011-05-26 | Aol Inc. | Filtering system for providing personalized information in the absence of negative data |
JP2012515379A (ja) * | 2009-01-12 | 2012-07-05 | アリババ・グループ・ホールディング・リミテッド | 情報をクエリするための方法およびシステム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100776697B1 (ko) * | 2006-01-05 | 2007-11-16 | 주식회사 인터파크지마켓 | 고객 구매행동 분석에 기반한 지능화된 상품 검색 방법 및 시스템 |
US7830815B1 (en) * | 2006-10-25 | 2010-11-09 | At&T Intellectual Property Ii | Method and apparatus for measuring and extracting proximity in networks |
US8583633B2 (en) * | 2007-11-30 | 2013-11-12 | Ebay Inc. | Using reputation measures to improve search relevance |
US8152495B2 (en) | 2008-10-01 | 2012-04-10 | Ametek, Inc. | Peripheral discharge tube axial fan |
US20110208735A1 (en) * | 2010-02-23 | 2011-08-25 | Microsoft Corporation | Learning Term Weights from the Query Click Field for Web Search |
US20110270828A1 (en) * | 2010-04-29 | 2011-11-03 | Microsoft Corporation | Providing search results in response to a search query |
US8473507B2 (en) * | 2011-01-14 | 2013-06-25 | Apple Inc. | Tokenized search suggestions |
CN102722498B (zh) * | 2011-03-31 | 2015-06-03 | 北京百度网讯科技有限公司 | 搜索引擎及其实现方法 |
CN102737022B (zh) * | 2011-03-31 | 2015-01-07 | 百度在线网络技术(北京)有限公司 | 获取和搜索相关知识信息的方法及装置 |
CN102521321B (zh) * | 2011-12-02 | 2013-07-31 | 华中科技大学 | 基于检索词歧义性和用户偏好的视频搜索方法 |
US9009148B2 (en) * | 2011-12-19 | 2015-04-14 | Microsoft Technology Licensing, Llc | Clickthrough-based latent semantic model |
CN103425691B (zh) * | 2012-05-22 | 2016-12-14 | 阿里巴巴集团控股有限公司 | 一种搜索方法和系统 |
CN102982125B (zh) * | 2012-11-14 | 2016-03-02 | 百度在线网络技术(北京)有限公司 | 一种用于确定同义文本的方法和装置 |
CN103902694B (zh) * | 2014-03-28 | 2017-04-12 | 哈尔滨工程大学 | 基于聚类和查询行为的检索结果排序方法 |
CN105278970A (zh) * | 2014-06-16 | 2016-01-27 | 中兴通讯股份有限公司 | 一种数据处理方法、装置和终端 |
-
2015
- 2015-06-18 CN CN201510342427.4A patent/CN104899322B/zh active Active
- 2015-11-25 EP EP15196353.5A patent/EP3107006A1/en not_active Ceased
- 2015-11-30 JP JP2015232575A patent/JP6161679B2/ja active Active
- 2015-11-30 KR KR1020150169288A patent/KR101721338B1/ko active IP Right Grant
- 2015-11-30 US US14/954,784 patent/US10275533B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08320879A (ja) * | 1995-05-26 | 1996-12-03 | Nec Corp | 適合フィードバック装置 |
US20110125578A1 (en) * | 2000-04-04 | 2011-05-26 | Aol Inc. | Filtering system for providing personalized information in the absence of negative data |
JP2006251935A (ja) * | 2005-03-08 | 2006-09-21 | Ricoh Co Ltd | 文書検索装置、文書検索方法、および文書検索プログラム |
JP2009110231A (ja) * | 2007-10-30 | 2009-05-21 | Nippon Telegr & Teleph Corp <Ntt> | 文章検索サーバコンピュータ,文章検索方法,文章検索プログラム,そのプログラムを記録した記録媒体 |
JP2012515379A (ja) * | 2009-01-12 | 2012-07-05 | アリババ・グループ・ホールディング・リミテッド | 情報をクエリするための方法およびシステム |
JP2010205189A (ja) * | 2009-03-05 | 2010-09-16 | Nec Corp | 検索結果文書のスコアリングシステム、スコア算出装置、スコアリング方法、及びスコアリングプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022050379A (ja) * | 2021-02-09 | 2022-03-30 | ペキン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム |
JP7301922B2 (ja) | 2021-02-09 | 2023-07-03 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6161679B2 (ja) | 2017-07-12 |
CN104899322A (zh) | 2015-09-09 |
EP3107006A1 (en) | 2016-12-21 |
KR101721338B1 (ko) | 2017-03-29 |
US10275533B2 (en) | 2019-04-30 |
US20160371379A1 (en) | 2016-12-22 |
KR20160149978A (ko) | 2016-12-28 |
CN104899322B (zh) | 2021-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6161679B2 (ja) | 検索エンジン及びその実現方法 | |
US11232140B2 (en) | Method and apparatus for processing information | |
US10599721B2 (en) | Method and apparatus for automatically summarizing the contents of electronic documents | |
US10037320B2 (en) | Context-aware approach to detection of short irrelevant texts | |
WO2017000402A1 (zh) | 网页生成方法和装置 | |
US20190050396A1 (en) | Method, apparatus and device for recognizing text type | |
US8280829B2 (en) | Efficient algorithm for pairwise preference learning | |
US20160085740A1 (en) | Generating training data for disambiguation | |
US20060287988A1 (en) | Keyword charaterization and application | |
WO2012075884A1 (zh) | 书签智能分类的方法和服务器 | |
US9860337B1 (en) | Machine-based identification of content with differing opinions | |
CN106354856B (zh) | 基于人工智能的深度神经网络强化搜索方法和装置 | |
CN107885717B (zh) | 一种关键词提取方法及装置 | |
US20170235836A1 (en) | Information identification and extraction | |
WO2021051934A1 (zh) | 基于人工智能的合同关键条款提取方法、装置及存储介质 | |
CN112579729A (zh) | 文档质量评价模型的训练方法、装置、电子设备和介质 | |
CN110674635B (zh) | 一种用于文本段落划分的方法和装置 | |
KR101931859B1 (ko) | 전자문서의 대표 단어 선정 방법, 전자 문서 제공 방법, 및 이를 수행하는 컴퓨팅 시스템 | |
US20170235835A1 (en) | Information identification and extraction | |
CN111160007A (zh) | 基于bert语言模型的搜索方法、装置、计算机设备及存储介质 | |
CN111737607B (zh) | 数据处理方法、装置、电子设备以及存储介质 | |
CN113434636A (zh) | 基于语义的近似文本搜索方法、装置、计算机设备及介质 | |
RU2711123C2 (ru) | Способ и система компьютерной обработки одной или нескольких цитат в цифровых текстах для определения их автора | |
CN114742058B (zh) | 一种命名实体抽取方法、装置、计算机设备及存储介质 | |
CN112926297B (zh) | 处理信息的方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170428 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170613 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6161679 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |