JP2023516209A - コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体 - Google Patents

コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体 Download PDF

Info

Publication number
JP2023516209A
JP2023516209A JP2022553192A JP2022553192A JP2023516209A JP 2023516209 A JP2023516209 A JP 2023516209A JP 2022553192 A JP2022553192 A JP 2022553192A JP 2022553192 A JP2022553192 A JP 2022553192A JP 2023516209 A JP2023516209 A JP 2023516209A
Authority
JP
Japan
Prior art keywords
historical search
search
historical
record
records
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022553192A
Other languages
English (en)
Other versions
JP7451747B2 (ja
Inventor
フチュン ジャン,
ウェイ ルー,
リー シー,
ジンドン ワン,
ピン パン,
シキ ザオ,
ファーウェイ ユアン,
シャン ジン,
ビン ワン,
ユーロン ウー,
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
Publication of JP2023516209A publication Critical patent/JP2023516209A/ja
Application granted granted Critical
Publication of JP7451747B2 publication Critical patent/JP7451747B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24539Query rewriting; Transformation using cached or materialised query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3349Reuse of stored results of previous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体であって、データ処理の分野に関す。当該方法では、ターゲット検索項目に対する検索要求を受信したことに応答して、複数の履歴検索要求に関連する複数の履歴検索記録を取得し、各履歴検索記録が、対応する履歴検索要求に対する履歴検索項目を含む。その後、複数の履歴検索記録からターゲット検索にマッチングする第1の履歴検索記録を決定する。さらに、複数の履歴検索記録間の関係に基づいて、複数の履歴検索記録から第1の履歴検索記録に関連する第2の履歴検索記録を決定する。当該方法は、第2の履歴検索記録に対応する検索結果に基づいて、ターゲット検索項目に対する拡張結果を決定するステップをさらに含む。当該方法により、ユーザの検索要件を満たす可能性のある拡張結果を提供し、検索品質と効果を向上させ、ユーザ体験を改善することができる。【選択図】 図2

Description

本開示の実施例は、主にデータ処理の分野に関し、より具体的に、コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体に関する。
情報技術の急速な発展に伴い、多くのユーザとウェブサイトでアクセス可能な情報を提供する。そして、ウェブサイトで提供されるデータ量が増えているため、単一のユーザにとって、各ウェブサイトや情報源で関連する情報を検索するのは非常に困難になる。
情報検索の困難を解決するために、検索エンジンでユーザの情報検索を支援することが多く現われる。検索エンジンで大量のウェブサイトから各種情報がローカルに収集されるため、その後、加工して各種の情報データベースを確立する。ユーザが検索したいコンテンツに対して、検索エンジンに検索コンテンツを入力すると、検索したいコンテンツを簡単かつ迅速に取得することができる。しかしながら、検索エンジンを使用してコンテンツを検索する中で、解決すべき問題がたくさんある。
本開示の例示的な実施例によれば、コンテンツを検索するための解決案を提供する。
本開示の第1の態様では、コンテンツを検索するための方法を提供する。当該方法は、ターゲット検索項目に対する検索要求を受信したことに応答して、複数の履歴検索要求に関連する複数の履歴検索記録を取得するステップであって、各履歴検索記録が、対応する履歴検索要求に対する履歴検索項目を含むステップを含む。当該方法は、複数の履歴検索記録からターゲット検索にマッチングする第1の履歴検索記録を決定するステップをさらに含む。当該方法は、複数の履歴検索記録間の関係に基づいて、複数の履歴検索記録から第1の履歴検索記録に関連する第2の履歴検索記録を決定するステップをさらに含む。当該方法は、第2の履歴検索記録に対応する検索結果に基づいて、ターゲット検索項目に対する拡張結果を決定するステップをさらに含む。
本開示の第2の態様では、コンテンツを検索する装置を提供する。当該装置は、ターゲット検索項目に対する検索要求を受信したことに応答して、複数の履歴検索要求に関連する複数の履歴検索記録を取得するように構成される履歴検索記録取得モジュールであって、各履歴検索記録が、対応する履歴検索要求に対する履歴検索項目を含む履歴検索記録取得モジュールと、複数の履歴検索記録からターゲット検索にマッチングする第1の履歴検索記録を決定するように構成されるターゲット検索項目マッチングモジュールと、複数の履歴検索記録間の関係に基づいて、複数の履歴検索記録から第1の履歴検索記録に関連する第2の履歴検索記録を決定するように構成される履歴検索記録決定モジュール、第2の履歴検索記録に対応する検索結果に基づいて、ターゲット検索項目に対応する拡張結果を決定するように構成される拡張結果決定モジュールと、を備える。
本開示の第3の態様では、1つまたは複数のプロセッサが備えられる電子機器と、1つまたは複数のプログラムを記憶する記憶装置を提供し、1つまたは複数のプログラムが1つまたは複数のプロセッサによって実行される場合、1つまたは複数のプログラムが本開示の第1の態様の方法を実現するようにする。
本開示の第4態様によれば、コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体を提案し、当該プログラムはプロセッサによって実行される場合、本開示の第1態様の方法を実現する。
添付図面と併せて以下の詳細な説明を参照すると、本開示の各実施例の上記および他の特徴、利点および態様がより顕著になる。添付図面では、同じまたは類似の図面表記は、同じまたは類似の要素を表す。
従来の解決案に係る推薦結果を提供する例100の概略図である。 本開示の複数の実施例の実現可能な環境200の概略図である。 本開示のいくつかの実施例のコンテンツを検索する方法300のフローチャートである。 本開示のいくつかの実施例に係る複数の履歴検索記録を取得する方法400のフローチャートである。 本開示のいくつかの実施例に係る履歴検索記録カテゴリと関係を決定する方法500のフローチャートである。 本開示のいくつかの実施例に係る履歴検索記録間の関係を決定する方法600のフローチャートである。 本開示のいくつかの実施例に係るコンテンツを検索する装置700のブロック図である。 本開示のいくつかの実施例に係るコンテンツを検索するための装置800のブロック図である。 本開示の複数の実施例を実施できる装置900のブロック図である。
以下、添付図面を参照して、本開示の実施例をより詳細に説明する。添付図面には、本開示のいくつかの実施例を示すが、本開示は、様々な形態によって実現され得るものであり、ここで説明した実施例に限定されるものではなく、むしろ、これらの実施例を提供することは、本開示をより徹底的かつ完全に理解するためである。なお、本開示の添付図面及び実施例は、例示的な役割のみを果たして、本開示の保護範囲を限定するものではない。
本開示の実施例の説明では、「含む」という用語およびその類似の用語は、「含むがこれに限定されない」という開放的な包含であると理解されたい。「基づく」という用語は、「少なくとも部分的に基づく」こととして理解すべきである。「1つの実施例」または「当該実施例」という用語は、「少なくとも1つの実施例」こととして理解すべきである。「第1」、「第2」などの用語は、異なる又は同じオブジェクトを指すことができるものとして理解すべきである。以下、他の明確かつ暗黙的な定義も含まれる可能性がある。
検索エンジンにユーザは検索項目を提案し、検索エンジンはウェブページライブラリに対して検索を行う。その後に検索エンジンは検索項目にマッチングする結果を取得し、結果に対して順序付けを行った後にユーザに返す。検索項目で明確に表現されている情報要件のほか、ユーザには関連する情報要件が同時に存在することが多い。従って、従来の検索エンジン製品では、いずれも一定の推薦機能を有し、ユーザのこれらの関連する情報要件を満たすために、現在の検索項目に関連する検索項目を推薦する。例えば、図1は、従来の解決案に係る推薦結果を提供する例100の概略図である。ユーザ検索エンジンに「劉**」を入力すると、2つの推薦ボックス102と104が提供される。ブロック102にはいくつかの推薦検索項目が提供され、ブロック104にはいくつかの推薦検索項目も提供される。
しかしながら、従来の解決案で提示された推薦検索項目は、ユーザの相関要件を直接満たすことができず、ユーザが検索項目をクリックし、新しい検索ページで要件を満たすことができるファイルリソースを手動でフィルタリングする必要がある。また、従来の解決案の検索項目のテキストは一般的に短く、推薦コンテンツとしての魅力が弱く、検索項目はユーザがコンテンツを生成することによって生成されたものであり、品質と安全性を制御することが困難である。
本開示の実施例によれば、コンテンツを検索する改善案を提供する。当該解決案では、ターゲット検索項目に対する検索要求を受信した場合、先に複数の履歴検索要求に関連する複数の履歴検索記録を取得し、各履歴検索記録が、対応する履歴検索要求に対する履歴検索項目を含む。その後に複数の履歴検索記録からターゲット検索にマッチングする第1の履歴検索記録を決定する。複数の履歴検索記録間の関係により、複数の履歴検索記録から第1の履歴検索記録に関連する第2の履歴検索記録を決定する。その後に第2の履歴検索記録に対応する検索結果に基づいて、ターゲット検索項目に対応する拡張結果を決定する。当該方法により、ユーザの検索要件を満たす可能性のある拡張結果を提供し、検索品質と効果を向上させ、ユーザ体験を改善することができる。
図2は、本開示の複数の実施例の実現可能な環境200の概略図である。当該例示的な環境200では、端末装置204と計算装置208が備えられる。計算装置208は、端末装置204からの検索要求206に基づいてユーザ202に検索要求206に対する拡張結果212を提供する。
端末装置204は、検索のためのアプリケーションまたはプログラム、例えば、検索エンジンアプリケーションを実行することができる。端末装置204はユーザ202から入力されたターゲット検索項目を受信し、例えば、ユーザ202は「ベンツC 200はいくら」を入力する。その後に、端末装置204は当該ターゲット検索項目に対する検索要求206を生成して検索要求206を計算装置208に送信する。
端末装置204は、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドまたはラップトップデバイス、移動装置(携帯電話、パーソナルデジタルアシスタント(PDA)、メディアプレーヤなどである)、マルチプロセッサシステム、消費電子製品、小型コンピュータ、メインフレームコンピュータ、上記システムまたはデバイスのうちのいずれか1つを備える分散コンピューティング環境などを含むが、これに限定されない。
計算装置208は、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドまたはラップトップデバイス、マルチプロセッサシステム、消費電子製品、小型コンピュータ、メインフレームコンピュータ、上記システムまたはデバイスの任意の1つを備える分散計算環境、クラウドプラットフォームにおける仮想マシンまたは他の計算装置などを含むが、これらに限定されない。
計算装置208は端末装置204からの検索要求206を受信した後、計算装置208は、検索要求206におけるターゲット検索項目に対する検索結果を生成するだけでなく、検索要求206のターゲット検索項目に基づいて計算装置208から拡張結果212を得る。計算装置208は、複数の履歴検索記録210を得て、ターゲット検索項目を複数の履歴検索記録210における履歴検索項目とマッチングさせ、マッチングする履歴検索記録を探す。
図2は、計算装置208が他のデバイスから複数の履歴検索記録210を受信することを示し、本開示を具体的に限定するものではなく、例にすぎない。複数の履歴検索記録210は、計算装置208内に、または計算装置208が検索要求206を受信した時に、生成されてもよい。
複数の履歴検索記録210は、検索ログにおけるログデータによって決定されたものである。複数の履歴検索記録210における各履歴検索記録は、対応する履歴検索要求に対する履歴検索項目を含む。いくつかの実施例では、各履歴検索項目は、ログデータにおける履歴検索項目に対してエンティティ識別子を行うことにより、複数の識別されたエンティティから履歴検索項目にエンティティが現れた回数に基づいて決定されたキーエンティティをさらに含む。代替的または追加的に、各履歴検索項目は、当該履歴検索項目に対応する需要のカテゴリをさらに含む。いくつかの実施例では、各履歴検索記録は、履歴検索項目に加えて、当該履歴検索項目に関連する履歴検索項目、および関連する履歴検索項目の相関度をさらに含む。
いくつかの実施例では、計算装置208は、複数の履歴検索記録210から、例えば、「ベンツC 200はいくら」という履歴検索記録のような、ターゲット検索項目と同じ履歴検索項目を探す。いくつかの実施例では、計算装置208は、複数の履歴検索記録210から、ターゲット検索項目とのマッチング度合いが閾値より高い履歴検索項目を探す。上記の例は、本開示を説明するためのものに過ぎず、本開示を具体的に限定するものではない。
計算装置208は、ターゲット検索項目にマッチングする第1の履歴検索記録を見つけた場合、さらに、複数の履歴検索記録210間の関係を取得する。その後に、計算装置208は、複数の履歴間の関係に基づいて、第1の履歴検索記録に関連する第2の履歴検索記録を決定し、例えば第2の履歴検索記録における履歴検索項目は「ベンツC 200の写真」である。代替的または追加的に、計算装置208は、他の1つまたは複数の履歴検索記録を決定することもできる。いくつかの実施例では、複数の履歴検索記録間の関係は、複数の履歴検索記録の複数のカテゴリ間の相関度合いである。いくつかの実施例では、複数の履歴検索記録間の関係は、複数の履歴検索記録間の相関度である。
その後、計算装置208は、第2の履歴検索記録の履歴検索項目に基づいて、拡張結果212を得る。その後に、計算装置208は、拡張結果212および/またはターゲット検索項目から得られたターゲット検索結果をユーザ202に提供する。
上記の図2は、本開示の複数の実施例の実現可能な環境200の概略図である。以下、図3と併せて、本開示のいくつかの実施例に係るコンテンツを検索する方法300のフローチャートを説明する。方法300は、図2の計算装置208または他の任意の適切なデバイスによって実現することができる。
ブロック302において、計算装置208は、ターゲット検索項目に対する検索要求206を受信したか否かを決定する。検索要求206を受信した場合、ブロック304において、計算装置208は、複数の履歴検索要求に関連する複数の履歴検索記録210を取得する。各履歴検索記録が、対応する履歴検索要求に対する履歴検索項目を含む。
いくつかの実施例では、複数の履歴検索記録210の各履歴検索記録は、履歴検索項目を含む。いくつかの実施例では、複数の履歴検索記録210における各履歴検索記録は、履歴検索項目と履歴検索項目に対応するキーエンティティを含む。いくつかの実施例では、複数の履歴検索記録210の各履歴検索記録は、履歴検索項目と履歴検索項目に対応するキーエンティティとその対応する需要カテゴリを含む。いくつかの実施例では、複数の履歴検索記録210の各履歴検索記録は、履歴検索項目、対応する履歴検索項目、および履歴検索項目と対応する履歴検索項との相関度を含む。上記の例は、本開示を説明するためのものに過ぎず、本開示を具体的に限定するものではない。
いくつかの実施例では、複数の履歴検索記録210は、計算装置208が他のサーバまたはコンピュータから取得されたものである。いくつかの実施例では、複数の履歴検索記録210は、計算装置208内で生成されている。いくつかの実施例では、複数の履歴検索記録210は、ユーザ202が検索を行う時、計算装置208によってオンラインで生成されたものである。計算装置208が複数の履歴検索記録210を取得するプロセスは、図4と併せて説明する。
ブロック306において、計算装置208は、複数の履歴検索記録210から、ターゲット検索項目にマッチングする第1の履歴検索記録を決定する。計算装置208は、複数の履歴検索記録210およびターゲット検索項目を取得し後、複数の履歴検索記録210から、複数の履歴検索記録210にマッチングする第1の履歴検索記録を探す。いくつかの実施例では、ターゲット検索項は、第1の履歴検索記録における履歴検索項目と全く同じである。いくつかの実施例では、ターゲット検索項目と第1の履歴検索記録における履歴検索項目とのマッチング度合いは、予め設定されたマッチング閾値より大きい。上記の例は、本開示を説明するためのものに過ぎず、本開示を具体的に限定するものではない。
ブロック308において、計算装置208は、複数の履歴検索記録210間の関係に基づいて、複数の履歴検索記録210から第1の履歴検索記録に関連する第2の履歴検索記録を決定する。いくつかの実施例では、計算装置208は、第2の履歴検索記録を取得することに加えて、第1の履歴検索記録に関連する他の履歴検索記録も取得する。
いくつかの実施例では、複数の履歴検索記録210における各履歴検索記録が履歴検索項目とキーエンティティを含み、または各履歴検索記録が履歴検索項目とキーエンティティと各履歴検索記録のカテゴリを含む場合、複数の履歴検索記録210間の関係は、複数のカテゴリ間の相関度である。計算装置208は、複数の履歴検索記録210間の関係に基づいて、第1の履歴検索記録の第1のカテゴリに関連する第2のカテゴリを決定する。その後、計算装置208は、複数の履歴検索記録210から、第2のカテゴリを有する第2の履歴検索記録を決定し、第2の履歴検索記録が、第1の履歴検索記録のキーエンティティを含む。上記の方法により、高いマッチング度合いの第2の履歴検索記録を迅速かつ正確に探すことができる。
各履歴検索記録のカテゴリに対して、計算装置208は、複数の履歴検索記録210に含まれる複数の履歴検索項目を用いて、複数の履歴検索記録210のカテゴリを決定する。その後に、計算装置208は、カテゴリに基づいて、複数の履歴検索記録210間の関係を決定する。このようにして、カテゴリと複数の履歴検索記録との間の関係をより迅速かつ正確に決定することができる。カテゴリを決定し、カテゴリに関連する複数の履歴検索記録間の関係を決定するプロセスは、以下図5と併せて説明する。
いくつかの実施例では、計算装置208が複数の履歴検索記録210を取得する場合、複数の履歴検索記録210間の関係を取得する。当該関係は、複数の履歴検索記録210における各履歴検索記録とそれに対応する履歴検索記録との間の相関度を説明する。計算装置208は、複数の履歴検索記録210間の関係に基づいて、第1の履歴検索記録に関連する1組の履歴検索記録を決定することができ、第1の履歴検索記録は、1組の履歴検索記録における各履歴検索記録と相関度がある。その後に、計算装置208は、相関度に基づいて、1組の履歴検索記録から第2の履歴検索記録を決定する。当該方法により、高いマッチング度合いである第2の履歴検索記録を迅速かつ正確に探すことができる。各履歴検索記録とそれに対応する履歴検索記録との間の相関度を決定するプロセスは、以下、図6と併せて説明する。
ブロック310において、計算装置208は、第2の履歴検索記録に対応する検索結果に基づいて、ターゲット検索項目に対応する拡張結果212を決定する。
いくつかの実施例では、第2の履歴検索記録が得られた後、計算装置208は、第2の履歴検索記録における履歴検索項目に対する検索結果を取得する。いくつかの実施例では、計算装置208は、第2の履歴検索記録における履歴検索項目を用いて検索を行い、これによって当該検索結果をリアルタイムで得る。代替的な方式として、いくつかの実施例では、計算装置208は、第2の履歴検索記録における履歴検索項目に関する履歴検索結果を探すこともできる。例えば、計算装置208は検索ログから上記履歴検索結果を探すことができる。なお、上記の例は、本開示を説明するためのものに過ぎず、本開示を具体的に限定するものではない、計算装置208は、第2の履歴検索記録における履歴検索項目に対する検索結果を様々な方式で取得することができる。
その後に、計算装置208は、第2の履歴検索記録における検索項目から得られた検索結果を拡張結果212として決定する。これにより、ユーザに適合する情報を迅速かつ自動的に拡張することができる。
いくつかの実施例では、第2の履歴検索記録が得られた後、計算装置208は、第2の履歴検索記録を用いて検索を行って第2の履歴検索記録における履歴検索結果を取得する。例えば、計算装置208は、検索ログから当該履歴検索結果を探すことができる。その後に、計算装置208は、履歴検索結果から、ユーザ202がアクセスした一部の履歴検索結果を決定する。この時、計算装置208は、一部の履歴検索結果を拡張結果212として決定する。このようにして、ユーザに関連する拡張結果212をより正確に決定することができる。
いくつかの実施例では、第2の履歴検索記録が得られた後、計算装置208は、ユーザ202が第2の履歴検索記録における履歴検索項目に対して検索を行う時に生成された情報ストリームを取得する。いくつかの実施例では、当該情報ストリームは、ログ記録において記録されたユーザが第2の履歴検索記録における履歴検索項目を使用して検索を行う時に、ユーザに提供する履歴情報ストリームである。履歴情報ストリームは、ニュース、各種のネットワーク情報、プッシュ広告などであってもよい。その後に、計算装置208は、当該情報ストリームに基づいて、検索時にユーザ202が閲覧する情報ストリームを拡張結果212として決定する。例えば、第2の履歴検索記録を実行するユーザ202は、情報検索時にネットワークサーバからプッシュされた情報ストリームも表示すると、その表示された情報ストリームを拡張結果212とする。代替的または追加的に、表示された情報ストリームに、ユーザ202によって確立された注目点タグが存在する必要がある。このようして、拡張結果のソースを増やし、より多くの拡張結果を提供することができる。
いくつかの実施例では、拡張結果212が得られた後、計算装置208は、端末装置204に拡張結果212を提供し、または計算装置208は、端末装置204に拡張結果212とターゲット検索項目に対するターゲット検索結果を提供する。このようにして、ユーザが拡張結果とターゲット検索結果を迅速に得ることができるようにする。
いくつかの実施例では、ユーザ202に拡張結果212ターゲット検索結果を提供する時に、計算装置208は、拡張結果212の第1のスコアを決定し、第1のスコアは、拡張結果212と第2の履歴検索記録における履歴検索項目との関連度を示す。当該スコアはニューラルネットワークモデルによって生成されたものである。ニューラルネットワークモジュールに、拡張結果212における各結果のユーザクリック分布、ユーザクリック率推定、タイトル、コンテンツ、長さ、および第2の履歴検索記録の履歴検索項目などの情報を入力することによって各結果のスコアを決定する。当該ニューラルネットワークモデルは、サンプルユーザクリック分布、サンプルユーザクリック率推定、サンプル検索結果項目、サンプル検索項目、拡張結果のタイトル、コンテンツ、長さなどの情報及びサンプルスコアによって決定されたものである。
計算装置208はさらに、ターゲット検索結果の第2のスコアを決定し、第2のスコアは、ターゲット検索結果とターゲット検索項目との関連度を示す。それも、上記のニューラルネットワークモデルにターゲット検索結果の各結果のタイトル、コンテンツの長さ、ターゲット検索項目などの情報を入力してターゲット検索結果のスコアを決定する。
計算装置208は、第1のスコアと第2のスコアに基づいて、拡張結果212とターゲット検索結果の優先度を決定する。その後に、計算装置208は、優先度に基づいて、拡張結果212とターゲット検索結果を提供する。代替的にまたは追加的に、計算装置208は拡張結果212の表示にいくつかの制限条件を設定することもできる。たとえば、提供される予め設定された数の結果のうち、第1の数の拡張結果212のみが存在すること、または、拡張結果212の連続する数を設定することなどである。上記の例は、本開示を説明するためのものに過ぎず、本開示を具体的に限定するものではない。当業者は必要に応じて設定することができる。上記の方法により、関連度がより高く、より正確なターゲット検索結果および推薦結果をユーザに提供することができる。
いくつかの実施例では、計算装置208は、第2の履歴検索記録に対応する検索結果を得るためのターゲットデータソースをも確立する。いくつかの実施例では、当該ターゲットデータソースは、他のデバイスによって生成されたものであり、その後に、計算装置208が他のデバイスから当該ターゲットデータソースを取得する。ターゲットデータソースを確立することにより、ターゲットデータソースの品質を向上させ、ユーザに高品質のコンテンツを提供することができる。
いくつかの実施例では、計算装置208は、ターゲットデータソースを確立する時、先に複数の元のデータソースにおける複数のファイルのスコアを決定、各ファイルのスコアは、ファイルの品質を示す。ファイルを採点する場合、以下の方式で決定する。メディアサイトの採点:自動リンク分析方法に基づくサイトの採点、及び専門家が表記したサイトの採点を含む。メディアの著者の採点:専門家が表記した著者の登録、ビッグデータ分析による著者の知名度、いいね、コメントなどの読者のフィードバック情報によって総合された著者の人気、及びメディアテキスト、画像、ビデオの豊富さを含む。
その後に、計算装置208は、複数のファイルにおけるスコアが閾値スコアを超えるファイルを、ターゲットデータソースにおけるファイルとして決定する。このようにして、カットオフ操作によって良質候補結果を取得することができる。
上記図3と併せて、本開示のいくつかの実施例に係るコンテンツを検索する方法300のフローチャートを説明する。以下、図4と併せて、図3のブロック304において、複数の履歴検索記録を取得するプロセスを詳細に説明する。図4は、本開示のいくつかの実施例に係る複数の履歴検索記録を取得する方法400のフローチャートである。図4の方法400は、図2の計算装置208または他の任意の適切なデバイスによって実行することができる。
ブロック402において、計算装置208は、検索ログから1組の履歴検索要求に対応する1組の履歴検索項目を決定する。通常、検索ログには、すべてのユーザの検索ログ項目が記憶されている。そのため、検索ログから1組の履歴検索項目を決定することができる。
ブロック404において、計算装置208は1組の履歴検索項目から複数のエンティティを決定し、各エンティティが対応する履歴検索項目に関連するオブジェクトを識別する。計算装置208は、1組の履歴検索項目における各履歴検索項目に対してエンティティ識別子を実行し、例えば、固有表現認識の方法によってエンティティを認識する。
ブロック406において、計算装置208は、1組の履歴検索項目における複数のエンティティの出現回数に基づいて、複数のエンティティからキーエンティティを決定する。
いくつかの実施例では、計算装置208は、1組の履歴検索項目から単一のエンティティが含まれる履歴検索項目集合を決定する。その後に、計算装置208は、履歴検索項目集合から少なくとも1つの履歴検索項目を決定し、少なくとも1つの履歴検索項目に含まれる単一のエンティティの履歴検索項目集合における出現回数は第1の閾値回数を超える。計算装置208は、少なくとも1つの履歴検索項目に含まれる単一のエンティティをキーエンティティとして決定する。このようにして、キーエンティティを迅速かつ正確に決定することができる。
例えば、1組の履歴検索項目のうち、履歴検索項目とするエンティティ「ベンツC 200」の数が4であると仮定すると、閾値回数が3である場合、「ベンツC 200」をキーエンティティとすることができる。
いくつかの実施例では、キーエンティティを決定する時、計算装置208は、1組の履歴検索項目における複数のエンティティの出現回数に基づいて、複数のエンティティから出現回数が第2の閾値回数を超える高周波数エンティティを決定する。計算装置208は、対応する履歴検索項目における高周波数エンティティの重みが閾値の重みを超えると決定することにより、高周波数をキーエンティティとして決定し、重みは対応する履歴検索項目における高周波数エンティティの重要性を示す。上記のようにして、キーエンティティを迅速かつ正確に決定することができる。
いくつかの実施例では、計算装置208は、対応する履歴検索項目における高周波数エンティティの位置によって重みを決定する。いくつかの実施例では、計算装置208は、高周波数エンティティの長さと履歴検索項目の長さとの間の関係に基づいて、重みを決定する。いくつかの実施例では、計算装置208は、上記の方法の組み合わせに基づいて、任意の他の適切な情報を用いて、重みを決定することもできる。上記の例は、本開示を具体的に限定するものではなく、本開示を説明することに限定されるものであってもよく、上記のように組み合わせたりして、または他の方式で重みを得ることもできる。上記のようにして、重みを正確かつ迅速に決定することができる。
ブロック408において、計算装置208は、1組の履歴検索項目からキーエンティティが含まれる複数の履歴検索項目を選択する。キーエンティティが決定された後、計算装置208はキーエンティティを用いてキーエンティティのみが含まれる履歴検索項目を決定する。
ブロック410において、計算装置208は、複数の履歴検索項目とキーエンティティに基づいて複数の履歴検索記録210を生成する。このとき、複数の履歴検索記録210における各履歴検索記録は、少なくとも履歴検索項目と、それに対応するキーエンティティとを含む。
いくつかの実施例では、上記複数の履歴検索記録210は他のデバイスによって検索ログに基づいて生成されたものであってもよく、計算装置208は、他のデバイスから複数の履歴検索記録210を受信することができる。
上記のようにして、キーエンティティが含まれる複数の履歴検索記録を検索ログから迅速かつ正確に決定することができ、推薦結果をより正確にすることができる。
上記図4と併せて、本開示のいくつかの実施例に係る複数の複数の履歴検索記録を取得する方法400のフローチャートを説明した。以下、図5と併せて、図3のブロック308における履歴検索記録間のカテゴリと関係を決定するプロセスを詳細に説明する。図5は、本開示のいくつかの実施例によって、履歴検索記録のカテゴリと関係500を決定するフローチャートを示す。図5の方法500は、図2の計算装置208または他の任意の適切なデバイスで実行することができる。
ブロック502において、複数の履歴検索記録210における各履歴検索記録は、履歴検索項目に加えて、キーエンティティも含む。計算装置208は、複数の履歴検索項目から対応するキーエンティティを除去することにより、複数の履歴検索項目のそれぞれの残りの部分を取得する。例えば、複数の履歴検索項目が「ベンツC 200はいくら」、「ベンツC 200の価格」、「ベンツC 200の画像」である場合、キーエンティティが「ベンツC 200」である場合、残りの部分は「いくら」、「の価格」、「の画像」である。
ブロック504において、計算装置208は、少なくとも残りの部分に基づいて、複数の履歴検索項目に関連する需要情報を決定する。計算装置208は、残りの部分をユーザの需要情報として決定し、例えば、残りの部分 「いくら」、「の価格」、「の画像」を需要情報として決定する。
ブロック506において、計算装置208は、需要情報に基づいて、複数の履歴検索記録210のカテゴリを決定する。いくつかの実施例では、計算装置208は、クラスタリング操作を用いて需要情報を処理して、複数の履歴検索記録210のカテゴリを決定し、例えばk-means方法を用いて需要情報を処理する。いくつかの実施例では、計算装置208は、人工的に分類するなど、他の適切な方式によって需要情報のカテゴリを決定することもできる。上記の例は、本開示を説明するためのものに過ぎず、本開示を具体的に限定するものではない。
上記のようにして、複数の履歴検索項目の需要カテゴリを正確に決定することができ、複数の履歴検索記録の分類も実現する。
ブロック508において、計算装置208は、複数の履歴検索項目に対する検索時間または検索結果を検索ログから決定する。各カテゴリが決定された後、計算装置208は、各カテゴリ間の関連付けを決定する必要がある。そのため、計算装置208は、検索ログから複数の履歴検索項目に対するログ記録を決定し、その後、これらのログ記録の検索時間と検索結果を決定する。
ブロック510において、計算装置208は検索時間または検索結果に基づいて、複数のカテゴリ間の相関度合いを決定する。計算装置208は、ログにおける同じユーザの所定時間内の異なるカテゴリを有する2回の履歴検索記録を、この2つのカテゴリ間の相関度合いに1を増やすと決定し、代替的または追加的に、2回の履歴検索記録の履歴検索項目のキーエンティティが同じである。例えば、ユーザ202が所定期間内に「ベンツC 200の価格」と「ベンツC 200の画像」とを検索すると、「画像」に対応するカテゴリと「画像」に対応するカテゴリ間の相関度合いが1であると決定することができる。以下同様であり、複数のカテゴリ間の相関度合いを決定することができる。
ブロック512において、計算装置208は、複数のカテゴリ間の相関度合いに基づいて、複数の履歴検索記録210間の関係を決定する。各カテゴリ間の相関度合いにより、複数の履歴検索記録210間の関係を決定することができる。例えば、1つの履歴検索記録に第1のカテゴリがある場合、第1のカテゴリによってそれとの相関度合いのより高い1つまたは複数の他のカテゴリを決定することができ、その後に当該第1の履歴検索記録のキーエンティティを1つまたは複数の他のカテゴリと組み合わせると、当該履歴検索記録に関連する他の履歴検索記録を決定することができる。
上記のようにして、複数のカテゴリ間の相関度合いを迅速かつ正確に決定することができて、検索時に推薦結果の正確性を確保することができる。
上記、図5と併せて、本開示のいくつかの実施例に係る履歴検索記録カテゴリと関係500を決定するフローチャートを説明した。以下、図6と併せて、図3のブロック308における履歴探索記録間の関係を決定するプロセスを詳細に説明する。図6は、本開示のいくつかの実施例に係る履歴検索記録間の関係600を決定するフローチャートを示す。図6の方法600は、図2の計算装置208または他の任意の適切なデバイスによって実行することができる。
ブロック602において、計算装置208は、複数の履歴検索項目に対する検索時間または検索結果を検索ログから決定する。検索ログには多くのユーザの検索ログ項目が記憶されており、当該検索ログ項目によって複数の履歴検索項目の検索時間と検索結果を決定することができる。
ブロック604において、計算装置208は、検索時間または検索結果に基づいて、複数の履歴検索記録210間の関連度を決定する。計算装置208は、同じユーザが所定の期間内に2つの検索項目を実行しまたは2つの検索項目の検索結果に同じ結果項目があることに基づいて、2つの検索記録間に相関があると決定する。例えば、ユーザ202が所定の期間内に2つの履歴検索項目を実行すると、2つの検索を含む2つの履歴検索記録間の関連度に1を増やすことができる。2つの履歴検索項目に対応する検索結果のうち、所定の数の同じ結果項目がある場合、2つの履歴検索記録間の関連度に1を足すことができる。上記の例は、本開示を説明するためのものに過ぎず、本開示を具体的に限定するものではない。代替的または追加的に、相関度合いによって限定することもでき、2つの履歴検索項目が関連付けられていると決定する場合にのみ、2つの履歴検索項目が属する分野によってその関連度を決定する必要もある。
ブロック606において、計算装置208は、複数の履歴検索記録210間の関連度に基づいて、複数の履歴検索記録210間の関係を決定する。計算装置208は、決定された関連度に基づいて、複数の履歴検索記録210間の関連付けを決定する。
いくつかの実施例では、複数の履歴検索記録210と複数の履歴検索記録210との間の関連付けは、他のデバイスによって生成されてもよく、計算装置208は、他のデバイスから得られる。
いくつかの実施例では、ユーザの検索と閲覧シーケンスに基づいて、重要なキーワードを抽出し、ユーザの注目点タグを確立することはできない。
このようにして、複数の履歴検索記録間の関連付けを迅速かつ正確に決定することができ、拡張結果を迅速かつ正確に決定することができる。
上記図6と併せて、本開示のいくつかの実施例に係る履歴検索記録間の関係600を決定するフローチャートを説明した。以下、図7と併せて、本開示のいくつかの実施例に係るコンテンツを検索する装置700のブロック図を詳細に説明する。
装置700は、良質結果選別モジュール702、相関需要マイニングモジュール704、推薦結果マッチングモジュール706及び検索結果と推薦結果混成モジュール708を備える。ユーザが検索語を提出した後、相関需要マイニングモジュール704は、元の検索語に基づいて、相関需要をマイニングし、相関需要の具体的な表現形態は、検索語である形態であってもよく、キーワードの組み合わせ、意味ベクトルなどの形であってもよい。マイニングされた相関需要に基づいて、推薦結果マッチングモジュール706は、良質結果選別モジュール702が選別した結果を検索し、それから相関需要を満たすことができるリソースを推薦結果として見つける。最後に検索結果と推奨結果混成モジュール708は、推薦結果と検索エンジンが検索した通常の結果とを混成させ、最終的な結果リストを形成してユーザに返す。
相関需要マイニングモジュール704は、ユーザの元の検索語に基づいて相関需要をマイニングし、その使用の技術的方法は、以下のようないくつかを含む。コンテンツに基づくマイニング方法:まず、検索項目コンテンツを分割し、キーエンティティ検索と需要次元という2つの概念を定義する。検索コア主体は、ユーザが検索中に検索シーケンスから抽出できる主体文字列であり、この主体文字列はユーザのコア要求を特徴付けることができる。検索項目が「ベンツc 200はいくら」である場合、コア主体は「ベンツc 200」であり、「いくら」はユーザがコア主体に対する需要描写であり、ここで需要は価格を尋ねることである。「ベンツc 200」という主体には、ベンツc 200画像、ベンツc 200性能油消費量、ベンツc 200販売量など、多くの需要次元がある。コンテンツに基づくマイニングの思想は、キーエンティティを一定に保つ場合、検索項目自体の次元に強く関連付けられた異なる需要次元の文章をユーザに推薦することである。
コア主体をマイニングする場合、まず検索ログから履歴検索項目集合を取得し、固有表現認識(NER)と高周波数サブストリングの統計によってキーエンティティを決定し、キーエンティティは3つの条件を満たす。1)キーエンティティ自体が検索項目としてより多くの数を持つ。2)サブストリングとしてキーエンティティが頻繁に複数の履歴検索項目に表示される。3)主体文字列を含むすべての検索項目において、主体文字列の平均語項目の重みが高い。
需要次元をマイニングする場合、需要次元はキープロダクトのプロパティであり、同じキーエンティティの検索項目を集約することにより、キーエンティティの残りの文字列を需要として除去する。初歩的に取得された需要サブストリングの異なる表現は同じ需要である可能性があり、例えば「ベンツc 200はいくら」と「ベンツc 200の価格」の需要が同じである。クラスタリング方法によって需要サブストリングを集約し、異なる需要カテゴリに対する区分を実現する。同時に、異なるカテゴリの共起関連に基づいて、異なる次元間の関連行列を算出して、次元間の緊密な関係を特徴付ける。
履歴検索項目は、キーエンティティと需要情報との分割、およびマイニングされた需要カテゴリ関連行列により、強く関連付けられた需要の検索項目を現在検索項目の相関拡張需要集合とする。
ユーザがビッグデータを検索するマイニング方法に基づいて拡張履歴検索項目を決定することもできる。すべてのユーザが検索した検索項目をノードとして関連付けグラフを構築し、グラフのエッジは、検索行為(共起、同じ検索結果を持つ検索項目など)と分野関連(同じ分野、強い関連つけある異なる分野)を含む。グラフのマイニング方法に基づいて、現在検索項目に強く関連つけられた検索項目集合をマイニングし、現在検索項目の相関拡張需要とする。同時にユーザの検索と閲覧シーケンスに基づいて、コアキーワードを抽出し、ユーザの注目点タグを確立する。
推薦結果マッチングモジュール706は、マイニングされた相関需要に基づいて、データベースから相関需要を満たすことができる結果をマッチングし、その使用の技術的方法は、以下のいくつかを含む。検索システムの検索に基づくマッチング:拡張検索項目で検索システムを検索し、拡張検索項目にマッチングする満足結果を取得する。関連強度に基づいてすべての結果を検索項目の推薦結果として併合する。ユーザのビッグデータの検索に基づくマッチング:共起や単一出現などのユーザ行為に基づいて、拡張検索項目に関連する文章を検索項目の推奨結果としてマイニングする。ユーザ検索と情報ストリームの閲覧に基づくビッグデータのマッチング:ユーザの検索と情報ストリームの閲覧データからユーザの注目点タグをマイニングして統計し、注目点によってリコール文章をユーザの個人化推薦結果としてマッチングする。
ターゲット検索結果と拡張結果混成モジュール708は、主に検索結果の採点、推薦結果の採点、混成を含む。検索結果の採点:主に履歴クリック分布、ユーザクリック率の推定などの特徴の融合モデルに基づいて採点する。推薦結果採点は履歴クリック分布、ユーザクリック推定に基づいて採点する。
混成時に、検索結果、推薦結果に基づいて上位から下位の順で採点を行う。同時に、推奨結果密度に基づく多様性制御や、同じテーマの推奨結果密度の多様性制御を含む多様性制御も行う。
良質結果選別モジュール702は、いくつかの基本的な品質要因に基づいて、ファイルリソースを採点し、採点に基づいてカットオフし、良質候補結果を取得する。基本的な品質要因は、自動リンク分析方法に基づくサイトの採点、及び専門家が表示したサイトの採点を含むメディアサイトの採点を含む。メディアの著者の採点は、専門家が表記した著者の登録、ビッグデータ分析による著者の知名度、いいね、評論などの読者のフィードバック情報によって総合された著者の人気、メディアテキスト、画像、ビデオの豊富さを含む。
図8は、本開示の実施例に係るコンテンツを検索する装置800の概略ブロック図である。図8に示すように、装置800、ターゲット検索項目に対する検索要求を受信したことに応答して、複数の履歴検索要求に関連する複数の履歴検索記録を取得するように構成される履歴検索記録取得モジュール802であって、各履歴検索記録が、対応する履歴検索要求に対する履歴検索項目を含む履歴検索記録取得モジュール802を備えることができる。装置800は、複数の履歴検索記録からターゲット検索にマッチングする第1の履歴検索記録を決定するように構成されるターゲット検索項目マッチングモジュール804をさらに備える。装置800は、複数の履歴検索記録間の関係に基づいて、複数の履歴検索記録から第1の履歴検索記録に関連する第2の履歴検索記録を決定するように構成される履歴検索記録決定モジュール806をさらに備える。装置800は、第2の履歴検索記録に対応する検索結果に基づいて、ターゲット検索項目に対応する拡張結果を決定するように構成される拡張結果決定モジュールをさらに備える。
いくつかの実施例では、履歴検索記録取得モジュール802は、検索ログから1組の履歴検索要求に対応する1組の履歴検索項目を決定するように構成される第1の履歴検索項目決定モジュールと、1組の履歴検索項目から複数のエンティティを決定し、各エンティティが対応する履歴検索項目に関連するオブジェクトを識別するように構成されるエンティティ決定モジュールと、1組の履歴検索項目における複数のエンティティの出現回数に基づいて、複数のエンティティからキーエンティティを決定するように構成される第1のキーエンティティ決定モジュールと、1組の履歴検索項目からキーエンティティを含む複数の履歴検索項目を選択するように構成される選択モジュールと、複数の履歴検索項目とキーエンティティに基づいて複数の履歴検索記録を生成するように構成される生成モジュールと、を備える。
いくつかの実施例では、第1のキーエンティティ決定モジュールは、1組の履歴検索項目から単一のエンティティが含まれる履歴検索項目集合を決定するように構成される履歴検索項目集合決定モジュールと、履歴検索項目集合から少なくとも1つの履歴検索項目を決定するように構成される第2の履歴検索項目決定モジュール、少なくとも1つの履歴検索項目に含まれる単一のエンティティが履歴検索項目集合における出現回数が第1の閾値回数を超える第2の履歴検索項目決定モジュールと、少なくとも1つの履歴検索項目に含まれる単一のエンティティをキーエンティティとして決定するように構成される単一のエンティティに対応するキーエンティティ決定モジュールと、を備える。
いくつかの実施例では、キーエンティティ決定モジュールは、1組の履歴検索項目における複数のエンティティの出現回数に基づいて、複数のエンティティから出現回数が第2の閾値回数を超える高周波数エンティティを決定するように構成される高周波数エンティティ決定モジュールと、対応する履歴検索項目における高周波数エンティティの重みが閾値重みを超えることに基づいて、高周波数をキーエンティティとして決定するように構成される第2のキーエンティティ決定モジュールであって、重みが対応する履歴検索項目における高周波数エンティティの重要性を示す第2のキーエンティティ決定モジュールと、を備える。
いくつかの実施例では、第2のキーエンティティ決定モジュールは、対応する履歴検索項目における高周波数エンティティの位置を決定するように構成される位置決定モジュールと、高周波数エンティティの長さと対応する履歴検索項目の長さとの関係を決定するように構成される長さ関係決定モジュールと、を備える。
いくつかの実施例では、装置800は、複数の履歴検索記録に含まれる複数の履歴検索項目に基づいて、複数の履歴検索記録のカテゴリを決定するように構成されるカテゴリ決定モジュールと、カテゴリに基づいて、複数の履歴検索記録間の関係を決定するように構成される履歴検索記録関係決定モジュールと、をさらに備える。
いくつかの実施例では、複数の履歴検索記録における各履歴検索記録は、キーエンティティをさらに含み、カテゴリ決定モジュールは、複数の履歴検索項目から対応するキーエンティティを除去することにより、複数の履歴検索項目それぞれの残りの部分を取得するように構成される残りの部分決定モジュールと、少なくとも残りの部分に基づいて複数の履歴検索項目に関連する需要情報を決定するように構成される需要情報決定モジュールと、需要情報に基づいて複数の履歴検索記録のカテゴリを決定するように構成される履歴検索記録カテゴリ決定モジュールと、を備える。
いくつかの実施例では、複数の履歴検索記録は複数のカテゴリがあり、履歴検索記録関係決定モジュールは、検索ログから複数の履歴検索項目に対する検索時間または検索結果を決定するように構成される第1の検索時間または検索結果決定モジュールと、検索時間または検索結果に基づいて、複数のカテゴリ間の相関度合いを決定するように構成される相関度合い決定モジュールと、複数のカテゴリ間の相関度合いに基づいて、複数の履歴検索記録間の関係を決定するように構成される相関度合いに基づく関係決定モジュールと、を備える。
いくつかの実施例では、装置800は、検索ログから複数の履歴検索項目に対する検索時間または検索結果を決定するように構成される第2の検索時間または検索結果構成モジュールと、検索時間や検索結果に基づいて、複数の履歴検索記録間の相関度を決定するように構成される相関度決定モジュールと、複数の履歴検索記録間の相関度に基づいて、複数の履歴検索記録間の関係を決定するように構成される相関度に基づく関係決定モジュールと、をさらに備える。
いくつかの実施例では、複数の履歴検索記録における各履歴検索記録は、キーエンティティと各履歴検索記録のカテゴリをさらに含み、履歴検索記録決定モジュール806は、複数の履歴検索記録間の関係に基づいて、第1の履歴検索記録の第1のカテゴリに関連する第2のカテゴリを決定するように構成される第2のカテゴリ決定モジュールと、カテゴリを有す第2の履歴検索記録決定モジュール、複数の履歴検索記録から第2のカテゴリを有す第2の履歴検索記録を決定するように構成されるカテゴリを有す第2の履歴検索記録決定モジュールであって、第2の履歴検索記録がカテゴリを有す第2の履歴検索記録決定モジュールと、を備える。
いくつかの実施例では、履歴検索記録決定モジュール806は、複数の履歴検索記録間の関係に基づいて、第1の履歴検索記録に関連する1組の履歴検索記録を決定するように構成される1組の履歴検索記録決定モジュールであって、第1の履歴検索記録が、1組の履歴検索記録における各履歴検索記録と相関度がある1組の履歴検索記録決定モジュールと、相関度に基づいて、1組の履歴検索記録から第2の履歴検索記録を決定するように構成される相関度に基づく履歴検索記録決定モジュールと、を備える。
いくつかの実施例では、拡張結果決定モジュール808は、第2の履歴検索記録における履歴検索項目に対する検索結果を取得するように構成される第1の検索結果取得モジュールと、検索結果を拡張結果として決定するように構成される検索結果に対応する拡張結果決定モジュールと、を備える。
いくつかの実施例では、拡張結果決定モジュール808は、第2の履歴検索記録における履歴検索項目に対する履歴検索結果を取得するように構成される第2の検索結果取得モジュールと、履歴検索結果からユーザがアクセスした一部の履歴検索結果を決定するように構成される一部の履歴検索結果決定モジュールと、一部の履歴検索結果を拡張結果として決定するように構成される一部の履歴検索結果拡張モジュールと、を備える。
いくつかの実施例では、拡張結果決定モジュールは、取得ユーザが第2の履歴検索記録における履歴検索項目に対して検索を行う時に生成された情報ストリームを取得するように構成される情報ストリームモジュールと、情報ストリームに基づいて、拡張結果を決定するように構成される情報ストリームに対する拡張結果モジュールと、を備える。
いくつかの実施例では、装置800は、拡張結果を提供するように構成される第1の提供装置、拡張結果とターゲット検索項目に対するターゲット検索結果を提供するように構成される第2の提供装置、のうちの少なくとも1つをさらに備える。
いくつかの実施例では、第2の提供装置は、拡張結果の第1のスコアを決定するように構成される第1のスコア決定モジュールであって、第1のスコアが拡張結果と第2の履歴検索記録における履歴検索項目との相関度を指示する第1のスコア決定モジュールと、ターゲット検索結果の第2のスコアを決定するように構成される第2のスコア決定モジュールであって、第2のスコアがターゲット検索結果とターゲット検索項目との相関度を指示する第2のスコア決定モジュールと、第1のスコアと第2のスコアに基づいて、拡張結果とターゲット検索結果との優先度を決定するように構成される優先度決定モジュールと、優先度に基づいて拡張結果とターゲット検索結果を提供するように構成される拡張結果と検索結果提供モジュールと、を備える。
いくつかの実施例では、装置800は、第2の履歴検索記録に対応する検索結果を得るためのターゲットデータソースを確立するように構成されるターゲットデータソース確立モジュールをさらに備える。
いくつかの実施例では、ターゲットデータソース確立モジュールは、複数の元のデータソースにおける複数のファイルのスコアを決定するように構成されるファイルスコア決定モジュールであって、各ファイルのスコアがファイルの品質を指示するファイルスコア決定モジュールと、複数のファイルにおけるスコアが閾値スコアを超えるファイルをターゲットデータソースにおけるファイルとして決定するように構成されるターゲットデータソースファイル決定モジュールと、を備える。
図9は、本開示の実施例を実行するための例示的な電子機器900の概略ブロック図である。電子機器900は、図1の端末装置204と計算装置208を実現することができる図15に示すように、電子機器900は、読み取り専用メモリ(ROM)902に記憶されているコンピュータプログラム命令または記憶ユニット808からランダムアクセスメモリ(RAM)903にロードされたコンピュータプログラム命令に従って、様々な適切な動作および処理を実行できる計算ユニット901を備える。RAM 903には、電子機器900の動作に必要な各種のプログラムやデータも記憶されてもよい。計算ユニット901、ROM 902、およびRAM 903は、バス904を介して互いに接続されている。パス904には、入力/出力(I/O)インターフェース905も接続されている。
電子機器900の複数のコンポーネントはI/Oインターフェース905に接続され、キーボード、マウスなどの入力ユニット906、各タイプのディスプレイ、スピーカなどの出力ユニット907、磁気ディスク、光ディスクなどの記憶ユニット908、およびネットワークカード、モデム、無線通信トランシーバなどの通信ユニット909を備える。通信ユニット909は、電子機器900が、インターネットなどのコンピュータネットワークおよび/または各種の電信ネットワークを介して他のデバイスと情報/データを交換することを可能にする。
計算ユニット901は、処理および計算能力を有する様々な汎用および/または専用の処理コンポーネントであってもよい。計算ユニット901のいくつかの例は、中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)、各種の専用の人工知能(AI)計算チップ、各種のマシン運転学習モデルアルゴリズムの計算ユニット、デジタル信号プロセッサ(DSP)、およびいずれかの適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット901は、前文に記載の各方法及び処理、例えば、方法300、400、500及び600を実行する。例えば、いくつかの実施例では、300、400、500及び600を、記憶ユニット908などの機械読み取り可能な媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現することができる。いくつかの実施例では、コンピュータプログラムの一部または全部はROM 902及び/又は通信ユニット909を介して電子機器900にロード及び/又はインストールされてもよい。コンピュータプログラムがRAM 903にロードされ、計算ユニット901によって実行される場合、前文に記載の方法300、400、500と600の1つのまたは複数のステップが実行されてもよい。代替的に、他の実施例では、計算ユニット901は方法900を実行するように、他の任意の適切な方式(例えば、ファームウェアを介して)によって構成されてもよい。
本明細書で上記説明した機能は、少なくとも部分的に1つまたは複数のハードウェア論理構成要素によって実行され得る。例えば、非制限的に、使用可能な例示的なハードウェア論理構成要素は、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システム オンチップ(SOC)、プログラマブル論理デバイス(CPLD)などを含む。
本開示の方法を実行するためのプログラムコードは、1つ又は複数のプログラミング言語の任意の組み合わせで書くことができる。これらのプログラムコードは、プロセッサ又はコントローラによって実行された際に、フローチャートおよび/またはブロック図に規定された機能/操作が実施されるように、汎用コンピュータ、専用コンピュータ、又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供されてもよい。プログラムコードは、完全に機械上で実行されるか、部分的に機械上で実行されるか、スタンドアロンソフトウェアパッケージとして、部分的に機械上で実行され、部分的にリモート機械上で実行され又は完全にリモート機械又はサーバ上で実行されてもよい。
本開示のコンテキストでは、機械読み取り可能な媒体は、命令実行システム、装置、またはデバイスによって使用されるために、又は命令実行システム、装置、またはデバイスと組み合わせて使用するためのプログラムを含むか、又は記憶することができる有形の媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体または機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、電子的、磁気的、光学的、電磁気的、赤外線的、又は半導体システム、装置又はデバイス、または上記コンテンツの任意の適切な組み合わせを備えることができるが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例は、1つ又は複数のラインに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能プログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスクリードオンリーメモリ(CD-ROM)、光学記憶装置、磁気記憶装置、または上記コンテンツの任意の適切な組み合わせを含む。
また、各操作は、特定の順序で示されているが、このような操作は、示された特定の順序または順序で実行されるように要求されるか、または、所望の結果を得るために、すべての図示された操作が実行されるように要求されると理解されたい。特定の環境では、マルチタスクと並列処理が有利である可能性がある。同様に、上記の説明にはいくつかの具体的なインプリメンテーションの詳細が含まれているが、これらは本開示の範囲に対しての制限として解釈されるべきではない。個別の実施例のコンテキストに記載のいくつかの特徴は、単一のインプリメンテーションにおいても組み合わせて実現することができる。むしろ、単一のインプリメンテーションのコンテキストにおける記載の様々な特徴は、複数のインプリメンテーションにおいて、単独で、または任意の適切な下位組合せで実現されてもよい。
本主題は、構造特徴および/または方法論理動作に固有の言語を用いて説明されているが、添付の特許請求の範囲に規定された主題は、必ずしも上記説明された特定の特徴または動作に限定されるものではないことを理解されたい。むしろ、上記説明された特定の特徴および動作は、特許請求の範囲を実施するための例示的な形式にすぎない。
本開示の第4態様によれば、コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体を提案し、当該プログラムはプロセッサによって実行される場合、本開示の第1態様の方法を実現する。
本出願の第5態様によれば、コンピュータプログラムをさらに提供し、前記コンピュータプログラムにおける命令がプロセッサによって実行された場合に、本開示の第1態様の方法を実現する。
計算ユニット901は、処理および計算能力を有する様々な汎用および/または専用の処理コンポーネントであってもよい。計算ユニット901のいくつかの例は、中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)、各種の専用の人工知能(AI)計算チップ、各種のマシン運転学習モデルアルゴリズムの計算ユニット、デジタル信号プロセッサ(DSP)、およびいずれかの適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット901は、前文に記載の各方法及び処理、例えば、方法300、400、500及び600を実行する。例えば、いくつかの実施例では、300、400、500及び600を、記憶ユニット908などの機械読み取り可能な媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現することができる。いくつかの実施例では、コンピュータプログラムの一部または全部はROM 902及び/又は通信ユニット909を介して電子機器900にロード及び/又はインストールされてもよい。コンピュータプログラムがRAM 903にロードされ、計算ユニット901によって実行される場合、前文に記載の方法300、400、500と600の1つのまたは複数のステップが実行されてもよい。代替的に、他の実施例では、計算ユニット901は方法900を実行するように、他の任意の適切な方式(例えば、ファームウェアを介して)によって構成されてもよい。
本出願の実施例によれば、コンピュータプログラムが提供される。当該コンピュータプログラムにおける命令がプロセッサによって実行された場合に、本出願の実施例のコンテンツを検索する方法を実現する。

Claims (38)

  1. ターゲット検索項目に対する検索要求を受信したことに応答して、複数の履歴検索要求に関連する複数の履歴検索記録を取得するステップであって、各履歴検索記録が、対応する履歴検索要求に対する履歴検索項目を含むステップと、
    前記複数の履歴検索記録から前記ターゲット検索項目にマッチングする第1の履歴検索記録を決定するステップと、
    前記複数の履歴検索記録間の関係に基づいて、前記複数の履歴検索記録から前記第1の履歴検索記録に関連する第2の履歴検索記録を決定するステップと、
    前記第2の履歴検索記録に対応する検索結果に基づいて、前記ターゲット検索項目に対応する拡張結果を決定するステップと、
    を含む、コンテンツを検索する方法。
  2. 前記複数の履歴検索記録に含まれる複数の履歴検索項目に基づいて、前記複数の履歴検索記録のカテゴリを決定するステップと、
    前記カテゴリに基づいて、前記複数の履歴検索記録間の関係を決定するステップと、を含む請求項1に記載のコンテンツを検索する方法。
  3. 前記複数の履歴検索記録における各履歴検索記録はキーエンティティを含み、
    前記複数の履歴検索記録のカテゴリを決定するステップが、
    前記複数の履歴検索項目から対応するキーエンティティを除去することにより、前記複数の履歴検索項目のそれぞれの残りの部分を取得するステップと、
    少なくとも前記残りの部分に基づいて前記複数の履歴検索項目に関連する需要情報を決定するステップと、
    前記需要情報に基づいて前記複数の履歴検索記録のカテゴリを決定するステップと、
    を含む請求項2に記載のコンテンツを検索する方法。
  4. 前記複数の履歴検索記録は複数のカテゴリを有し、
    前記複数の履歴検索記録間の関係を決定するステップが、
    検索ログから前記複数の履歴検索項目に対する検索時間または検索結果を決定するステップと、
    前記検索時間または前記検索結果に基づいて、前記複数のカテゴリ間の相関度合いを決定するステップと、
    前記複数のカテゴリ間の相関度合いに基づいて、前記複数の履歴検索記録間の関係を決定するステップと、
    を含む請求項2に記載のコンテンツを検索する方法。
  5. 検索ログから前記複数の履歴検索項目に対する検索時間または検索結果を決定するステップと、
    前記検索時間または前記検索結果に基づいて、前記複数の履歴検索記録間の相関度を決定するステップと、
    前記複数の履歴検索記録間の相関度に基づいて、前記複数の履歴検索記録間の関係を決定するステップと、
    を含む請求項1に記載のコンテンツを検索する方法。
  6. 前記複数の履歴検索記録における各履歴検索記録は、キーエンティティと各履歴検索記録のカテゴリを含み、
    前記第2の履歴検索記録を決定するステップが、
    前記複数の履歴検索記録間の前記関係に基づいて、前記第1の履歴検索記録の第1のカテゴリに関連する第2のカテゴリを決定するステップと、
    前記複数の履歴検索記録から第2のカテゴリを有す第2の履歴検索記録を決定するステップであって、前記第2の履歴検索記録が前記第1の履歴検索記録のキーエンティティを含むステップと、
    を含む請求項1に記載のコンテンツを検索する方法。
  7. 前記第2の履歴検索記録を決定するステップが、
    前記複数の履歴検索記録間の関係に基づいて、前記第1の履歴検索記録に関連する1組の履歴検索記録を決定するステップであって、前記第1の履歴検索記録が、前記1組の履歴検索記録における各履歴検索記録と相関度を有するステップと、
    前記相関度に基づいて、前記1組の履歴検索記録から前記第2の履歴検索記録を決定するステップと、
    を含む請求項1に記載のコンテンツを検索する方法。
  8. 前記複数の履歴検索記録を取得するステップが、
    検索ログから1組の履歴検索要求に対応する1組の履歴検索項目を決定するステップと、
    前記1組の履歴検索項目から複数のエンティティを決定し、各エンティティが対応する履歴検索項目に関連するオブジェクトを識別するステップと、
    前記1組の履歴検索項目における前記複数のエンティティの出現回数に基づいて、前記複数のエンティティからキーエンティティを決定するステップと、
    前記1組の履歴検索項目から前記キーエンティティが含まれる複数の履歴検索項目を選択するステップと、
    前記複数の履歴検索項目と前記キーエンティティに基づいて前記複数の履歴検索記録を生成するステップと、
    を含む請求項1に記載のコンテンツを検索する方法。
  9. 前記キーエンティティを決定するステップが、
    前記1組の履歴検索項目から単一のエンティティが含まれる履歴検索項目集合を決定するステップと、
    前記履歴検索項目集合から少なくとも1つの履歴検索項目を決定するステップであって、前記少なくとも1つの履歴検索項目に含まれる単一のエンティティの前記履歴検索項目集合における出現回数が第1の閾値回数を超えるステップと、
    前記少なくとも1つの履歴検索項目に含まれる単一のエンティティを前記キーエンティティとして決定するステップと、
    を含む請求項8に記載のコンテンツを検索する方法。
  10. 前記キーエンティティを決定するステップが、
    前記1組の履歴検索項目における前記複数のエンティティの出現回数に基づいて、前記複数のエンティティから出現回数が第2の閾値回数を超える高周波数エンティティを決定するステップと、
    対応する履歴検索項目における前記高周波数エンティティの重みが閾値重みを超えると決定することにより、前記高周波数エンティティを前記キーエンティティとして決定するステップであって、前記重みが対応する履歴検索項目における前記高周波数エンティティの重要性を示すステップと、
    を含む請求項8に記載のコンテンツを検索する方法。
  11. 前記重みが、
    前記対応する履歴検索項目における前記高周波数エンティティの位置と、
    前記高周波数エンティティの長さと前記対応する履歴検索項目の長さとの関係と、のうちの少なくとも1つに基づいて決定されたものである請求項10に記載のコンテンツを検索する方法。
  12. 前記ターゲット検索項目に対応する拡張結果を決定するステップが、
    前記第2の履歴検索記録における履歴検索項目に対する検索結果を取得するステップと、
    前記検索結果を前記拡張結果として決定するステップと、
    を含む請求項1に記載のコンテンツを検索する方法。
  13. 前記ターゲット検索項目に対応する拡張結果を決定するステップが、
    前記第2の履歴検索記録における履歴検索項目に対する履歴検索結果を取得するステップと、
    前記履歴検索結果からユーザがアクセスした一部の履歴検索結果を決定するステップと、
    前記一部の履歴検索結果を前記拡張結果として決定するステップと、
    を含む請求項1に記載のコンテンツを検索する方法。
  14. 前記ターゲット検索項目に対応する拡張結果を決定するステップが、
    ユーザが前記第2の履歴検索記録における履歴検索項目に対して検索する時に生成された情報ストリームを取得するステップと、
    前記情報ストリームに基づいて、前記拡張結果を決定するステップと、
    を含む請求項1に記載のコンテンツを検索する方法。
  15. 前記拡張結果を提供するステップと、
    前記拡張結果と前記ターゲット検索項目に対応するターゲット検索結果を提供するステップと、
    のうちの少なくとも1つを含む請求項1に記載のコンテンツを検索する方法。
  16. 前記拡張結果と前記ターゲット検索結果を提供するステップが、
    前記拡張結果の第1のスコアを決定するステップであって、前記第1のスコアが前記拡張結果と前記第2の履歴検索記録における履歴検索項目との関連度を示すステップと、
    前記ターゲット検索結果の第2のスコアを決定するステップであって、前記第2のスコアが前記ターゲット検索結果と前記ターゲット検索項目との関連度を示すステップと、
    前記第1のスコアと前記第2のスコアに基づいて、前記拡張結果と前記ターゲット検索結果との優先度を決定するステップと、
    前記優先度に基づいて前記拡張結果と前記ターゲット検索結果を提供するステップと、
    を含む請求項15に記載のコンテンツを検索する方法。
  17. 前記第2の履歴検索記録に対応する検索結果を得るためのターゲットデータソースを確立するステップを含む請求項1に記載のコンテンツを検索する方法。
  18. 前記ターゲットデータソースを確立するステップが、
    複数の元のデータソースにおける複数のファイルのスコアを決定し、各ファイルの前記スコアが前記ファイルの品質を示すステップと、
    前記複数のファイルにおけるスコアが閾値スコアを超えるファイルを、前記ターゲットデータソースにおけるファイルとして決定するステップと、
    を含む請求項17に記載のコンテンツを検索する方法。
  19. ターゲット検索項目に対する検索要求を受信したことに応答して、複数の履歴検索要求に関連する複数の履歴検索記録を取得するように構成される履歴検索記録取得モジュールであって、各履歴検索記録が、対応する履歴検索要求に対する履歴検索項目を含む履歴検索記録取得モジュールと、
    前記複数の履歴検索記録から前記ターゲット検索項目にマッチングする第1の履歴検索記録を決定するように構成されるターゲット検索項目マッチングモジュールと、
    前記複数の履歴検索記録間の関係に基づいて、前記複数の履歴検索記録から前記第1の履歴検索記録に関連する第2の履歴検索記録を決定するように構成される履歴検索記録決定モジュールと、
    前記第2の履歴検索記録に対応する検索結果に基づいて、前記ターゲット検索項目に対応する拡張結果を決定するように構成される拡張結果決定モジュールと、
    を備える、コンテンツを検索する装置。
  20. 前記複数の履歴検索記録に含まれる複数の履歴検索項目に基づいて、前記複数の履歴検索記録のカテゴリを決定するように構成されるカテゴリ決定モジュールと、
    前記カテゴリに基づいて、前記複数の履歴検索記録間の関係を決定するように構成される履歴検索記録関係決定モジュールと、
    を備える請求項19に記載のコンテンツを検索する装置。
  21. 前記複数の履歴検索記録における各履歴検索記録はキーエンティティを含み、
    前記カテゴリ決定モジュールが、
    前記複数の履歴検索項目から対応するキーエンティティを除去することにより、前記複数の履歴検索項目のそれぞれの残りの部分を取得するように構成される残りの部分決定モジュールと、
    少なくとも前記残りの部分に基づいて前記複数の履歴検索項目に関連する需要情報を決定するように構成される需要情報決定モジュールと、
    前記需要情報に基づいて前記複数の履歴検索記録のカテゴリを決定するように構成される履歴検索記録カテゴリ決定モジュールと、
    を含む請求項20に記載のコンテンツを検索する装置。
  22. 前記複数の履歴検索記録は複数のカテゴリを有し、
    前記履歴検索記録関係決定モジュールが、
    検索ログから前記複数の履歴検索項目に対する検索時間または検索結果を決定するように構成される第1の検索時間または検索結果決定モジュールと、
    前記検索時間または前記検索結果に基づいて、前記複数のカテゴリ間の相関度合いを決定するように構成される相関度合い決定モジュールと、
    前記複数のカテゴリ間の相関度合いに基づいて、前記複数の履歴検索記録間の関係を決定するように構成される相関度合いに基づく関係決定モジュールと、
    を備える請求項20に記載のコンテンツを検索する装置。
  23. 検索ログから前記複数の履歴検索項目に対する検索時間または検索結果を決定するように構成される第2の検索時間または検索結果構成モジュールと、
    前記検索時間または前記検索結果に基づいて、前記複数の履歴検索記録間の相関度を決定するように構成される相関度決定モジュールと、
    前記複数の履歴検索記録間の相関度に基づいて、前記複数の履歴検索記録間の関係を決定するように構成される相関度に基づく関係決定モジュールと、
    を含む請求項19に記載のコンテンツを検索する装置。
  24. 前記複数の履歴検索記録における各履歴検索記録はキーエンティティと各履歴検索記録のカテゴリを含み、
    前記履歴検索記録決定モジュールが、
    前記複数の履歴検索記録間の前記関係に基づいて、前記第1の履歴検索記録の第1のカテゴリに関連する第2のカテゴリを決定するように構成される第2のカテゴリ決定モジュールと、
    前記複数の履歴検索記録から第2のカテゴリを有す第2の履歴検索記録を決定するように構成されるカテゴリを有す第2の履歴検索記録決定モジュールであって、前記第2の履歴検索記録が前記第1の履歴検索記録のキーエンティティを含むカテゴリを有す第2の履歴検索記録決定モジュールと、
    を含む請求項19に記載のコンテンツを検索する装置。
  25. 前記履歴検索記録決定モジュールが、
    前記複数の履歴検索記録間の関係に基づいて、前記第1の履歴検索記録に関連する1組の履歴検索記録を決定するように構成される1組の履歴検索記録決定モジュールであって、前記第1の履歴検索記録が、前記1組の履歴検索記録における各履歴検索記録と相関度を有する1組の履歴検索記録決定モジュールと、
    前記相関度に基づいて、前記1組の履歴検索記録から前記第2の履歴検索記録を決定するように構成される相関度に基づく履歴検索記録決定モジュールと、
    を備える請求項19に記載のコンテンツを検索する装置。
  26. 前記履歴検索記録取得モジュールが、
    検索ログから1組の履歴検索要求に対応する1組の履歴検索項目を決定するように構成される第1の履歴検索項目決定モジュールと、
    前記1組の履歴検索項目から複数のエンティティを決定し、各エンティティが対応する履歴検索項目に関連するオブジェクトを識別するように構成されるエンティティ決定モジュールと、
    前記1組の履歴検索項目における前記複数のエンティティの出現回数に基づいて、前記複数のエンティティからキーエンティティを決定するように構成される第1のキーエンティティ決定モジュールと、
    前記1組の履歴検索項目から前記キーエンティティが含まれる複数の履歴検索項目を選択するように構成される選択モジュールと、
    前記複数の履歴検索項目と前記キーエンティティに基づいて前記複数の履歴検索記録を生成するように構成される生成モジュールと、
    を備える請求項19に記載のコンテンツを検索する装置。
  27. 前記第1のキーエンティティ決定モジュールが、
    前記1組の履歴検索項目から単一のエンティティが含まれる履歴検索項目集合を決定するように構成される履歴検索項目集合決定モジュールと、
    前記履歴検索項目集合から少なくとも1つの履歴検索項目を決定するように構成される第2の履歴検索項目決定モジュールであって、前記少なくとも1つの履歴検索項目に含まれる単一のエンティティの前記履歴検索項目集合における出現回数が第1の閾値回数を超える第2の履歴検索項目決定モジュールと、
    前記少なくとも1つの履歴検索項目に含まれる単一のエンティティを前記キーエンティティとして決定する単一のエンティティに対応するキーエンティティ決定モジュールと、
    を備える請求項26に記載のコンテンツを検索する装置。
  28. キーエンティティ決定モジュールが、
    前記1組の履歴検索項目における前記複数のエンティティの出現回数に基づいて、前記複数のエンティティから出現回数が第2の閾値回数を超える高周波数エンティティを決定するように構成される高周波数エンティティ決定モジュールと、
    対応する履歴検索項目における前記高周波数エンティティの重みが閾値重みを超えると決定することにより、前記高周波数エンティティを前記キーエンティティとして決定するように構成される第2のキーエンティティ決定モジュールであって、前記重みが対応する履歴検索項目における前記高周波数エンティティの重要性を示す第2のキーエンティティ決定モジュールと、
    を備える請求項26に記載のコンテンツを検索する装置。
  29. 前記第2のキーエンティティ決定モジュールが、
    前記対応する履歴検索項目における前記高周波数エンティティの位置を決定するように構成される位置決定モジュールと、
    前記高周波数エンティティの長さと前記対応する履歴検索項目の長さとの関係を決定するように構成される長さ関係決定モジュールと、
    を備える請求項28に記載のコンテンツを検索する装置。
  30. 前記拡張結果決定モジュールが、
    前記第2の履歴検索記録における履歴検索項目に対する検索結果を取得するように構成される第1の検索結果取得モジュールと、
    前記検索結果を前記拡張結果として決定するように構成される検索結果に対応する拡張結果決定モジュールと、
    を備える請求項19に記載のコンテンツを検索する装置。
  31. 前記拡張結果決定モジュールが、
    前記第2の履歴検索記録における履歴検索項目に対する履歴検索結果を取得するように構成される第2の検索結果取得モジュールと、
    前記履歴検索結果からユーザがアクセスした一部の履歴検索結果を決定するように構成される一部の履歴検索結果決定モジュールと、
    前記一部の履歴検索結果を前記拡張結果として決定するように構成される一部の履歴検索結果拡張モジュールと、
    を備える請求項19に記載のコンテンツを検索する装置。
  32. 前記拡張結果決定モジュールが、
    ユーザが前記第2の履歴検索記録における履歴検索項目に対して検索する時に生成された情報ストリームを取得するように構成される情報ストリームモジュールと、
    前記情報ストリームに基づいて、前記拡張結果を決定するように構成される情報ストリームに対する拡張結果モジュールと、
    を備える請求項19に記載のコンテンツを検索する装置。
  33. 前記拡張結果を提供するように構成される第1の提供装置と、
    前記拡張結果と前記ターゲット検索項目に対応するターゲット検索結果を提供するように構成される第2の提供装置と、
    のうちの少なくとも1つを含む請求項19に記載のコンテンツを検索する装置。
  34. 第2の提供装置が、
    前記拡張結果の第1のスコアを決定するように構成される第1のスコア決定モジュールであって、前記第1のスコアが前記拡張結果と前記第2の履歴検索記録における履歴検索項目との関連度を示す第1のスコア決定モジュールと、
    前記ターゲット検索結果の第2のスコアを決定するように構成される第2のスコア決定モジュールであって、前記第2のスコアが前記ターゲット検索結果と前記ターゲット検索項目との関連度を示す第2のスコア決定モジュールと、
    前記第1のスコアと前記第2のスコアに基づいて、前記拡張結果と前記ターゲット検索結果との優先度を決定するように構成される優先度決定モジュールと、
    前記優先度に基づいて前記拡張結果と前記ターゲット検索結果を提供するように構成される拡張結果と検索結果提供モジュールと、
    を備える請求項33に記載のコンテンツを検索する装置。
  35. 前記第2の履歴検索記録に対応する検索結果を得るためのターゲットデータソースを確立するように構成されるターゲットデータソース確立モジュールを備える請求項19に記載のコンテンツを検索する装置。
  36. 前記ターゲットデータソース確立モジュールが、
    複数の元のデータソースにおける複数のファイルのスコアを決定するように構成されるファイルスコア決定モジュールであって、各ファイルの前記スコアが前記ファイルの品質を示すファイルスコア決定モジュールと、
    前記複数のファイルにおけるスコアが閾値スコアを超えるファイルを、前記ターゲットデータソースにおけるファイルとして決定するように構成されるターゲットデータソースファイル決定モジュールと、
    を含む請求項35に記載のコンテンツを検索する装置。
  37. 1つまたは複数のプロセッサと、
    1つまたは複数のプログラムが記憶されている記憶装置と、
    を備え、
    前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行される場合、前記1つまたは複数のプロセッサが、請求項1から18のいずれか一項に記載のコンテンツを検索する方法を実現する電子機器。
  38. コンピュータプログラムが含まれるコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータプログラムがプロセッサによって実行される場合、請求項1から18のいずれか一項に記載のコンテンツを検索する方法を実現するコンピュータ読み取り可能な記憶媒体。
JP2022553192A 2020-04-01 2020-09-23 コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体 Active JP7451747B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202010252907.2 2020-04-01
CN202010252907.2A CN111475725B (zh) 2020-04-01 2020-04-01 用于搜索内容的方法、装置、设备和计算机可读存储介质
PCT/CN2020/117129 WO2021196541A1 (zh) 2020-04-01 2020-09-23 用于搜索内容的方法、装置、设备和计算机可读存储介质

Publications (2)

Publication Number Publication Date
JP2023516209A true JP2023516209A (ja) 2023-04-18
JP7451747B2 JP7451747B2 (ja) 2024-03-18

Family

ID=71749483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022553192A Active JP7451747B2 (ja) 2020-04-01 2020-09-23 コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体

Country Status (6)

Country Link
US (1) US20230147941A1 (ja)
EP (1) EP4113329A4 (ja)
JP (1) JP7451747B2 (ja)
KR (1) KR20220119745A (ja)
CN (1) CN111475725B (ja)
WO (1) WO2021196541A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111475725B (zh) * 2020-04-01 2023-11-07 百度在线网络技术(北京)有限公司 用于搜索内容的方法、装置、设备和计算机可读存储介质
CN112053688B (zh) * 2020-08-27 2024-03-08 海信视像科技股份有限公司 一种语音交互方法及交互设备、服务器
CN112528144A (zh) * 2020-12-08 2021-03-19 北京百度网讯科技有限公司 搜索推荐方法、装置、智能设备、电子设备及存储介质
CN113051485B (zh) * 2021-03-26 2023-08-22 北京达佳互联信息技术有限公司 群组搜索方法、装置、终端及存储介质
CN116628129B (zh) * 2023-07-21 2024-02-27 南京爱福路汽车科技有限公司 一种汽车配件搜索方法及系统
CN117972222A (zh) * 2024-04-02 2024-05-03 紫金诚征信有限公司 基于人工智能的企业信息检索方法及装置

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7562069B1 (en) * 2004-07-01 2009-07-14 Aol Llc Query disambiguation
US20060224583A1 (en) 2005-03-31 2006-10-05 Google, Inc. Systems and methods for analyzing a user's web history
CN101192223A (zh) * 2006-11-27 2008-06-04 北京三星通信技术研究有限公司 黄页搜索方法和黄页搜索系统
KR101348598B1 (ko) * 2007-12-21 2014-01-07 삼성전자주식회사 디지털 티비 방송 제공 시스템과 디지털 티비 및 그 제어방법
JP2010122932A (ja) 2008-11-20 2010-06-03 Nippon Telegr & Teleph Corp <Ntt> 文書検索装置、文書検索方法、および文書検索プログラム
JP5220659B2 (ja) 2009-02-27 2013-06-26 ヤフー株式会社 検索装置及び方法
US20100332493A1 (en) * 2009-06-25 2010-12-30 Yahoo! Inc. Semantic search extensions for web search engines
CN102012900B (zh) * 2009-09-04 2013-01-30 阿里巴巴集团控股有限公司 信息检索方法和系统
JP5493845B2 (ja) 2009-12-28 2014-05-14 富士通株式会社 検索支援プログラム、検索支援装置、及び検索支援方法
CN101840420B (zh) 2010-04-02 2011-12-28 清华大学 搜索辅助系统与搜索辅助方法
US20140358971A1 (en) * 2010-10-19 2014-12-04 Google Inc. Techniques for identifying chain businesses and queries
US20120203751A1 (en) * 2011-02-07 2012-08-09 International Business Machines Corporation Capture, Aggregate, and Use Search Activities as a Source of Social Data Within an Enterprise
KR101818717B1 (ko) * 2011-09-27 2018-01-15 네이버 주식회사 컨셉 키워드 확장 데이터 셋을 이용한 검색방법, 장치 및 컴퓨터로 판독 가능한 기록매체
AU2012247097B2 (en) * 2011-11-14 2015-04-16 Google Inc. Visual search history
CN102419776A (zh) * 2011-12-31 2012-04-18 北京百度网讯科技有限公司 一种满足用户多维度搜索需求的方法和设备
CN103577489A (zh) * 2012-08-08 2014-02-12 百度在线网络技术(北京)有限公司 一种网页浏览历史查询方法及装置
CN102929966B (zh) * 2012-10-12 2016-03-09 合一网络技术(北京)有限公司 一种用于提供个性化搜索列表的方法及系统
CN103049495A (zh) * 2012-12-07 2013-04-17 百度在线网络技术(北京)有限公司 用于提供与查询序列相对应的搜索建议的方法、装置与设备
CN103593410B (zh) * 2013-10-22 2017-04-12 上海交通大学 通过替换概念性词语进行搜索推荐的系统
CN103617266A (zh) * 2013-12-03 2014-03-05 北京奇虎科技有限公司 个性化扩展搜索方法及装置、系统
WO2015081792A1 (zh) * 2013-12-03 2015-06-11 北京奇虎科技有限公司 联动性和个性化扩展搜索方法及装置、系统
CN105335391B (zh) * 2014-07-09 2019-02-15 阿里巴巴集团控股有限公司 基于搜索引擎的搜索请求的处理方法和装置
CN104462325B (zh) * 2014-12-02 2019-05-03 百度在线网络技术(北京)有限公司 搜索推荐方法及装置
CN106096003B (zh) * 2014-12-26 2019-12-20 奇飞翔艺(北京)软件有限公司 数据搜索方法及客户端
CN105893397B (zh) * 2015-06-30 2019-03-15 北京爱奇艺科技有限公司 一种视频推荐方法及装置
JP6664599B2 (ja) 2015-08-25 2020-03-13 ヤフー株式会社 曖昧性評価装置、曖昧性評価方法、及び曖昧性評価プログラム
CN105898423A (zh) * 2015-12-08 2016-08-24 乐视网信息技术(北京)股份有限公司 视频推送方法、系统及服务器
CN106095819A (zh) * 2016-05-31 2016-11-09 北京奇艺世纪科技有限公司 一种视频推荐方法及装置
CN106372231A (zh) * 2016-09-08 2017-02-01 乐视控股(北京)有限公司 一种搜索方法及装置
CN109446402B (zh) * 2017-08-29 2022-04-01 阿里巴巴集团控股有限公司 一种搜索方法及装置
CN108399232A (zh) * 2018-02-13 2018-08-14 北京奇虎科技有限公司 一种信息推送方法、装置及电子设备
CN109101658B (zh) * 2018-08-31 2022-05-10 优视科技新加坡有限公司 信息搜索方法、装置及设备/终端/服务器
EP3918486A4 (en) * 2019-02-01 2022-10-19 Ancestry.com Operations Inc. SEARCH AND RANK RECORDS ACROSS DIFFERENT DATABASES
CN110245357B (zh) * 2019-06-26 2023-05-02 北京百度网讯科技有限公司 主实体识别方法和装置
CN111475725B (zh) * 2020-04-01 2023-11-07 百度在线网络技术(北京)有限公司 用于搜索内容的方法、装置、设备和计算机可读存储介质

Also Published As

Publication number Publication date
CN111475725A (zh) 2020-07-31
WO2021196541A1 (zh) 2021-10-07
EP4113329A4 (en) 2024-04-24
KR20220119745A (ko) 2022-08-30
CN111475725B (zh) 2023-11-07
JP7451747B2 (ja) 2024-03-18
EP4113329A1 (en) 2023-01-04
US20230147941A1 (en) 2023-05-11

Similar Documents

Publication Publication Date Title
JP7451747B2 (ja) コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体
CN107832414B (zh) 用于推送信息的方法和装置
KR101721338B1 (ko) 검색 엔진 및 그의 구현 방법
US8782037B1 (en) System and method for mark-up language document rank analysis
JP5721818B2 (ja) 検索におけるモデル情報群の使用
US20130060769A1 (en) System and method for identifying social media interactions
US20220083874A1 (en) Method and device for training search model, method for searching for target object, and storage medium
JP7023865B2 (ja) ランディングページ生成の改良
CN111444304A (zh) 搜索排序的方法和装置
JP2015525929A (ja) 検索品質を改善するための重みベースのステミング
US11874882B2 (en) Extracting key phrase candidates from documents and producing topical authority ranking
US20170351706A1 (en) Method and system for matching images with content using whitelists and blacklists in response to a search query
CN113660541B (zh) 新闻视频的摘要生成方法及装置
JP7395377B2 (ja) コンテンツ検索方法、装置、機器、および記憶媒体
US20090327877A1 (en) System and method for disambiguating text labeling content objects
JP5226241B2 (ja) タグを付与する方法
CN116431895A (zh) 安全生产知识个性化推荐方法及系统
RU2589856C2 (ru) Способ обработки целевого сообщения, способ обработки нового целевого сообщения и сервер (варианты)
CN111368036B (zh) 用于搜索信息的方法和装置
JP2015036892A (ja) 情報処理装置、情報処理方法、及び、プログラム
CN115795023B (zh) 文档推荐方法、装置、设备以及存储介质
CN116501841B (zh) 数据模型模糊查询方法、系统及存储介质
JP2011248827A (ja) 言語横断型情報検索方法、言語横断型情報検索システム及び言語横断型情報検索プログラム
Köhncke et al. Bridging the gap–using external knowledge bases for context-aware document retrieval
CN117390203A (zh) 多媒体推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220905

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230829

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240306

R150 Certificate of patent or registration of utility model

Ref document number: 7451747

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150