JP2022520683A - データプリフェッチ方法、デバイス、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム製品 - Google Patents

データプリフェッチ方法、デバイス、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム製品 Download PDF

Info

Publication number
JP2022520683A
JP2022520683A JP2021516412A JP2021516412A JP2022520683A JP 2022520683 A JP2022520683 A JP 2022520683A JP 2021516412 A JP2021516412 A JP 2021516412A JP 2021516412 A JP2021516412 A JP 2021516412A JP 2022520683 A JP2022520683 A JP 2022520683A
Authority
JP
Japan
Prior art keywords
query prefix
perplexity
prefetch
query
predetermined threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021516412A
Other languages
English (en)
Other versions
JP7209433B2 (ja
Inventor
達 謝
志洵 鄭
彪 範
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
Publication of JP2022520683A publication Critical patent/JP2022520683A/ja
Application granted granted Critical
Publication of JP7209433B2 publication Critical patent/JP7209433B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24539Query rewriting; Transformation using cached or materialised query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本願は、データプリフェッチ方法、デバイス、電子機器及びコンピュータ可読記憶媒体を開示する。具体的な実施形態は、ユーザが入力したクエリプレフィックスを取得し、事前にトレーニングされた言語モデルに基づいて前記クエリプレフィックスを判別して、前記クエリプレフィックスのパープレキシティを取得し、前記パープレキシティが所定の閾値よりも小さいか否かを判断し、前記パープレキシティが前記所定の閾値よりも小さい場合に、前記クエリプレフィックスに基づいてプリフェッチ要求を送信することである。【選択図】図1

Description

本願は、コンピュータの技術分野に関し、特にスマート検索の技術分野に関する。
検索プリフェッチ機能は、ユーザが実際に検索をクリックする前にクライアントにより開始した、クエリプレフィックスに対するプリフェッチ要求であり、事前にプリフェッチ結果を取得してユーザに提示することにより、ユーザに検索速度がより速い体験を与え、ユーザへの喜びを増加させることができる。
現在、プリフェッチ要求を発行する方式は、主に、ユーザが入力したクエリプレフィックスに対する補完マッチングに基づいてプリフェッチ要求を発行することである。例えば、ユーザが「劉徳」というクエリプレフィックスを入力するとき、「劉徳」というクエリプレフィックスを「劉徳華」に補完してプリフェッチ要求発行をトリガーする。これにより、補完マッチングに基づいてプリフェッチ要求を発行する方式により、ユーザがクエリプレフィックスを入力する過程に、大量のプリフェッチ要求を出すことを引き起こし、これらのプリフェッチ要求のプリフェッチ成功率が低く、機器コストを無駄にするとともにシステムの安定性に一定の影響を与える。
本願の実施例は、データプリフェッチ方法、デバイス、電子機器及びコンピュータ可読記憶媒体を提供する。
第1の様態では、本願の実施例に係るデータプリフェッチ方法は、
ユーザが入力したクエリプレフィックスを取得することと、
事前にトレーニングされた言語モデルに基づいて前記クエリプレフィックスを判別して、前記クエリプレフィックスのパープレキシティを取得することと、
前記パープレキシティが所定の閾値よりも小さいか否かを判断することと、
前記パープレキシティが前記所定の閾値よりも小さい場合に、前記クエリプレフィックスに基づいてプリフェッチ要求を送信することと、を含む。
このように、クエリプレフィックスのパープレキシティの判別に基づくプリフェッチ要求の送信は、現在の、補完マッチングに基づくプリフェッチ要求の送信に比べて、パープレキシティの高いプリフェッチ要求を直接フィルタリングして除去することにより、プリフェッチの成功率を向上させ、かつ過剰なプリフェッチ要求によるバックエンドサーバの機器コストをさらに低減することができるとともに、システム安定性に影響を与えることと、過剰なプリフェッチ結果の提示によりユーザに視覚体験上の干渉を与えることとを避け、ユーザ体験を向上させることができる。
好ましくは、前記クエリプレフィックスに特殊文字が含まれる場合に、前記方法は、
前記クエリプレフィックスのパープレキシティ補正係数を取得することをさらに含み、
前記パープレキシティが所定の閾値よりも小さいか否かを判断することは、
前記パープレキシティ補正係数を用いて前記パープレキシティを補正することと、
補正後のパープレキシティが前記所定の閾値よりも小さいか否かを判断することと、を含み、
前記パープレキシティが前記所定の閾値よりも小さい場合に、前記クエリプレフィックスに基づいてプリフェッチ要求を送信することは、
前記補正後のパープレキシティが前記所定の閾値よりも小さい場合に、前記クエリプレフィックスに基づいて前記プリフェッチ要求を送信することを含む。
このように、この補正プロセスにより、特殊文字による、対応するクエリプレフィックスのパープレキシティへの影響を低減することにより、プリフェッチの成功率をさらに向上させることができる。
好ましくは、前記クエリプレフィックスのパープレキシティ補正係数を取得することは、
下式を採用して前記クエリプレフィックスのパープレキシティ補正係数Reを計算することを含み、
Figure 2022520683000002
ここで、Nは、前記クエリプレフィックスの文の長さを表し、count(sw)は、前記クエリプレフィックスに含まれる特殊文字の個数を表し、fは、所定の係数を表す。
このように、特殊文字の個数を用いて対応するパープレキシティ補正係数を算出することにより、クエリプレフィックスのパープレキシティに対する最適化を実現することができる。
好ましくは、事前にトレーニングされた言語モデルに基づいて前記クエリプレフィックスを判別して、前記クエリプレフィックスのパープレキシティを取得することは、
前記クエリプレフィックスを分割して、複数の分割単語を取得することと、
各前記分割単語を事前にトレーニングされた語意モデルにそれぞれ入力して、各前記分割単語の単語埋め込みを生成し、かつ各前記分割単語の単語埋め込みに基づいて前記クエリプレフィックスの単語埋め込みを決定することと、
前記クエリプレフィックスの単語埋め込みを前記事前にトレーニングされた言語モデルに入力して、前記クエリプレフィックスのパープレキシティを取得することと、を含む。
このように、事前にトレーニングされた語意モデルにより、クエリプレフィックスに対応する、中国語の語意の理解力がより強い単語埋め込みを生成することができ、該単語埋め込みに基づいてクエリプレフィックスのパープレキシティを判別することにより、判別精度を向上させることができる。
好ましくは、各前記分割単語の単語埋め込みに基づいて前記クエリプレフィックスの単語埋め込みを決定する前記ことは、
各前記分割単語の単語埋め込みを結合して、前記クエリプレフィックスの単語埋め込みを取得することを含む。
好ましくは、前記クエリプレフィックスに基づいてプリフェッチ要求を送信することの後に、前記方法は、
サーバが前記プリフェッチ要求に基づいて返された前記クエリプレフィックスに対応するプリフェッチ結果を受信することをさらに含む。
このように、ユーザがクエリプレフィックスを入力する過程に、取得されたプリフェッチ結果をユーザに提示し、ユーザに検索速度がより速い体験を与えることができる。
第2の様態では、本願の実施例に係るデータプリフェッチデバイスは、
ユーザが入力したクエリプレフィックスを取得する第1の取得モジュールと、
事前にトレーニングされた言語モデルに基づいて前記クエリプレフィックスを判別して、前記クエリプレフィックスのパープレキシティを取得する判別モジュールと、
前記パープレキシティが所定の閾値よりも小さいか否かを判断する判断モジュールと、
前記パープレキシティが前記所定の閾値よりも小さい場合に、前記クエリプレフィックスに基づいてプリフェッチ要求を送信する送信モジュールと、を含む。
好ましくは、前記デバイスは、
前記クエリプレフィックスに特殊文字が含まれる場合に、前記クエリプレフィックスのパープレキシティ補正係数を取得する第2の取得モジュールをさらに含み、
前記判断モジュールは、
前記パープレキシティ補正係数を用いて前記パープレキシティを補正する補正ユニットと、
補正後のパープレキシティが前記所定の閾値よりも小さいか否かを判断する判断ユニットと、を含み、
前記送信モジュールは、具体的には、前記補正後のパープレキシティが前記所定の閾値よりも小さい場合に、前記クエリプレフィックスに基づいて前記プリフェッチ要求を送信する。
好ましくは、前記第2の取得モジュールは、具体的には、
下式を採用して前記クエリプレフィックスのパープレキシティ補正係数を計算し、
Figure 2022520683000003
ここで、Nは、前記クエリプレフィックスの文の長さを表し、count(sw)は、前記クエリプレフィックスに含まれる特殊文字の個数を表し、fは、所定の係数を表す。
好ましくは、前記判別モジュールは、
前記クエリプレフィックスを分割して、複数の分割単語を取得する分割ユニットと、
各前記分割単語を事前にトレーニングされた語意モデルにそれぞれ入力して、各前記分割単語の単語埋め込みを生成する生成ユニットと、
各前記分割単語の単語埋め込みに基づいて前記クエリプレフィックスの単語埋め込みを決定する決定ユニットと、
前記クエリプレフィックスの単語埋め込みを前記事前にトレーニングされた言語モデルに入力して、前記クエリプレフィックスのパープレキシティを取得する判別ユニットと、を含む。
好ましくは、前記決定ユニットは、具体的には、各前記分割単語の単語埋め込みを結合して、前記クエリプレフィックスの単語埋め込みを取得する。
好ましくは、前記デバイスは、
サーバが前記プリフェッチ要求に基づいて返された前記クエリプレフィックスに対応するプリフェッチ結果を受信する受信モジュールをさらに含む。
第3の態様では、本願の実施例に係る電子機器は、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続されているメモリと、を含み、
前記メモリには、前記少なくとも1つのプロセッサに実行可能で、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに上記データプリフェッチ方法を実行させることができる命令が記憶されている。
第4の態様では、本願の実施例に係る非一時的コンピュータ可読記憶媒体には、上述したデータプリフェッチ方法をコンピュータに実行させるコンピュータ命令が記憶されている。
上記好ましい形態の他の効果について、以下、具体的な実施例と組み合わせて説明する。
図面は、本解決手段をよりよく理解するためのものであり、本願を限定するものではない。
本願の実施例に係るデータプリフェッチ方法のフローチャートである。 本願の実施例に係るパープレキシティの判別プロセスのフローチャートである。 本願の具体的な実施例に係るプリフェッチ要求の発行の論理ブロック図である。 本願の実施例に係るデータプリフェッチ方法を実現するデータプリフェッチデバイスのブロック図である。 本願の実施例に係るデータプリフェッチ方法を実現する電子機器のブロック図である。
以下、図面を参照しながら、本願の例示的な実施例を説明し、理解し易くするために、様々な詳細を説明するが、これらは単なる例示的なものであると考えるべきである。したがって、本願の範囲及び精神から逸脱することなく、ここで説明された実施例に対して様々な変更及び修正を行うことができることを、当業者は認識すべきである。同様に、明確さと簡潔さのために、以下の説明では、公知の機能及び構造についての説明を省略する。
関連技術における、補完マッチングに基づいてプリフェッチ要求を発行する方式の成功率が低いという問題を解決するために、本願の実施例は、事前にトレーニングされた言語モデルを導入してユーザが入力したクエリプレフィックスを判別して、該クエリプレフィックスのパープレキシティを取得するとともに、該クエリプレフィックスのパープレキシティが所定の閾値よりも低い場合に、該クエリプレフィックスに基づいてプリフェッチ要求を送信するデータプリフェッチ方法を提供する。これにより、クエリプレフィックスのパープレキシティを、プリフェッチ要求を発行するか否かの重要な根拠とすることにより、パープレキシティの高いプリフェッチ要求を直接フィルタリングして除去することができ、プリフェッチの成功率を向上させることができる。
図1を参照すると、本願の実施例に係るデータプリフェッチ方法は、電子機器に適用され、図1に示すように、以下のステップ101~104を含む。
ステップ101では、ユーザが入力したクエリプレフィックスを取得する。
本実施例では、上記クエリプレフィックスは、ユーザが入力操作を行うときに電子機器の検索ボックスに入力した、ユーザが現在入力しているクエリ内容を表すことができる。例えば、劉徳華の映画を検索しようとするとき、ユーザが現在入力している「劉徳華」は、クエリプレフィックスであってよい。一実施形態では、該検索ボックスは、電子機器にインストールされているクライアントアプリケーションプログラムの検索ボックスであってよい。該クライアントアプリケーションプログラムは、検索アプリケーションプログラム又は検索機能付きのアプリケーションプログラムであってよく、一般に、そのホームページには検索ボックス及び検索ボタンが設置されている。具体的には、ユーザが対応するアプリケーションプログラムアイコンをクリックした後に、アプリケーションプログラムのホームページを表示することができる。ユーザは、検索ボックスをクリックした後に、検索ボックスにクエリプレフィックスを入力することができる。
理解できるように、本実施例の実行主体である電子機器は、ハードウェアであってもよく、ソフトウェアであってもよい。該電子機器がハードウェアである場合に、ウェブブラウザなどをサポートする様々な端末機器であってよく、例えば、スマートフォン、タブレットコンピュータ、電子書籍リーダー、ラップトップコンピュータ及びデスクトップコンピュータなどを含むが、これらに限定されない。該電子機器がソフトウェアである場合に、上記端末装置にインストールすることができ、かつ複数のソフトウェア又はソフトウェアモジュールとして実現するか、又は単一のソフトウェア又はソフトウェアモジュールとして実現することができる。ここで本実施例の実行主体を限定しない。
ステップ102では、事前にトレーニングされた言語モデルに基づいて前記クエリプレフィックスを判別して、前記クエリプレフィックスのパープレキシティを取得する。
本実施例では、上記事前にトレーニングされた言語モデルは、リカレントニューラルネットワーク(Recurrent Neural Network、RNN)、長期短期記憶(Long Short-Term Memory、LSTM)ネットワーク、ゲート付きリカレントユニット(Gated Recurrent Unit、GRU)ネットワーク、BiLSTMネットワークなどのいずれか1つとして選択されてよい。該GRUネットワークは、LSTMネットワークの効果の高い変形であり、該BiLSTMネットワークは、順方向LSTMと逆方向LSTMを組み合わせて形成される。
なお、該言語モデルのトレーニングプロセスに対して、関連方式を採用し、かつ歴史検索プロセスにおいて入力されたクエリプレフィックスの内容をトレーニングサンプルとしてトレーニングを行うことができ、本実施例は、これを限定しない。具体的なトレーニングプロセスには、パープレキシティ(perplexity、ppl)を用いて言語モデルの良否を判定することができ、tensorflow、paddle、PyTorchなどのトレーニングプラットフォームを用いることができる。事前にトレーニングされた言語モデルを用いてクエリプレフィックスを評価するときに、pplを、該クエリプレフィックスが通じるか否かの定量化の根拠として採用することができ、主に各単語に基づいて文の出現確率を推定し、かつ文の長さを正規化処理(normalize)する。pplに関する式は、以下のとおりである:
Figure 2022520683000004
ここで、Nは、クエリプレフィックスの長さを表し、p(wi)は、i番目の単語の確率を表し、p(wi|w12…wi-1)は、最初のi-1個の単語に基づいて算出されたi番目の単語の確率を表す。一般的には、ppl値が小さいほど、クエリプレフィックスのパープレキシティが低く、通じる程度が高いことを示す。
ステップ103では、上記パープレキシティが所定の閾値よりも小さいか否かを判断する。
本実施例では、上記所定の閾値は、実際の状況に応じて事前に設定することができる。クエリプレフィックスのパープレキシティが所定の閾値よりも小さい場合に、該クエリプレフィックスの通じる程度が高いことを示し、該クエリプレフィックスに基づいてプリフェッチ要求を開始することができる。該クエリプレフィックスのパープレキシティが所定の閾値以上である場合に、該クエリプレフィックスのパープレキシティが高く、かつ通じる程度が低いことを示し、この場合に該クエリプレフィックスに基づいてプリフェッチ要求を開始する意味が大きくなく、対応するプリフェッチ要求を直接フィルタリングして除去することができる。
ステップ104では、上記パープレキシティが所定の閾値よりも小さい場合に、上記クエリプレフィックスに基づいてプリフェッチ要求を送信する。
本実施例では、プリフェッチ要求を送信することは、プリフェッチ要求を検索サーバなどのサーバに送信して、該サーバの検索サービスを呼び出して、現在のクエリプレフィックスに対応するプリフェッチ結果を取得することであってよい。
好ましくは、上記ステップ104の後に、上記方法は、サーバが上記プリフェッチ要求に基づいて返されたクエリプレフィックスに対応するプリフェッチ結果を受信することをさらに含む。さらに、プリフェッチ結果を受信した後、電子機器は、プリフェッチ結果を表示して、取得されたプリフェッチ結果をユーザに提示し、ユーザに検索速度がより速い体験をユーザに与える。
本願の実施例に係るデータプリフェッチ方法は、クエリプレフィックスのパープレキシティの判別に基づいてプリフェッチ要求を送信することにより、パープレキシティの高いプリフェッチ要求を直接フィルタリングして除去することができるため、プリフェッチの成功率を向上させ、かつ過剰なプリフェッチ要求によるバックエンドサーバの機器コストをさらに低減することができるとともに、システム安定性に影響を与えることと、過剰なプリフェッチ結果の提示によりユーザに視覚体験上の干渉を与えることとを避け、ユーザ体験を向上させることができる。
具体的な実際の応用において、関連技術における、補完マッチングに基づいてプリフェッチ要求を発行する方式に比べて、本願の実施例のデータプリフェッチ方式は、プリフェッチ成功率を26.5%から45%まで向上させることができるため、速度体験効果を低減しない前提で40%のプリフェッチトラフィック配信を低減することができ、約1000台のサーバのコストを節減する。
本願の実施例では、クエリプレフィックスに句読点などの特殊文字が含まれる場合に、該特殊文字は、クエリプレフィックスのパープレキシティに大きな影響を与えるため、特殊文字による影響を低減するために、判別して取得されたパープレキシティを最適化することができる。
好ましくは、取得されたクエリプレフィックスに特殊文字が含まれる場合に、上記方法は上記クエリプレフィックスのパープレキシティ補正係数を取得することをさらに含む。さらに、上記ステップ103は、上記パープレキシティ補正係数を用いて上記パープレキシティを補正することと、補正後のパープレキシティが上記所定の閾値よりも小さいか否かを判断することと、を含む。その後、上記補正後のパープレキシティが上記所定の閾値よりも小さい場合に、上記クエリプレフィックスに基づいて上記プリフェッチ要求を送信する。このように、この補正プロセスにより、特殊文字による、対応するクエリプレフィックスのパープレキシティへの影響を低減することにより、プリフェッチの成功率をさらに向上させることができる。
上記パープレキシティ補正係数と特殊文字との関係は、事前に設定することができる。一実施形態では、上記パープレキシティ補正係数は、特殊文字の有無に関連することができる。例えば、クエリプレフィックスに特殊文字が含まれれば、パープレキシティ補正係数、例えば、Xが存在し、このとき、該パープレキシティ補正係数Xを用いて、判別して取得された該クエリプレフィックスのパープレキシティを補正する必要がある。一方、クエリプレフィックスに特殊文字が含まれなければ、パープレキシティ補正係数が存在せず、判別して取得された該クエリプレフィックスのパープレキシティを補正する必要がない。
別の実施形態では、上記パープレキシティ補正係数は、特殊文字の個数、位置などに関連することができる。例えば、上記パープレキシティ補正係数が特殊文字の個数に関連すれば、下式を採用してクエリプレフィックスのパープレキシティ補正係数Reを計算することができ、
Figure 2022520683000005
ここで、Nは、該クエリプレフィックスの文の長さ(例えば、文字の長さであると理解できる)を表し、count(sw)は、該クエリプレフィックスに含まれる特殊文字の個数を表し、fは、所定の係数を表し、例えば、1などとして設定することができる。
このように、事前にトレーニングされた言語モデルに基づいて判別して取得されたクエリプレフィックスのパープレキシティがppl0であり、対応するパープレキシティ補正係数がRe′であれば、補正後のパープレキシティPPLは、PPL=ppl0+Re′である。
本願の実施例では、クエリプレフィックスに対する判別精度を向上させるために、事前にトレーニングされた言語モデルに基づいてクエリプレフィックスを判別する前に、まず、該クエリプレフィックスを処理して、対応する、中国語の語意の理解力がより強い単語埋め込み(word embedding)を生成し、かつ該単語埋め込みに基づいてパープレキシティを判別する。
好ましくは、図2に示すように、上記ステップ102は、以下の3つのことを含んでよい。まず、取得されたクエリプレフィックスを分割して、複数の分割単語を取得し、該分割方式について、例えば、分割単語に基づくアイテムitem分割を用いて、item1、item2、item3などを取得し、次に、各分割単語を事前にトレーニングされた語意モデルにそれぞれ入力して、各分割単語の単語埋め込みを生成し、各分割単語の単語埋め込みに基づいて該クエリプレフィックスの単語埋め込みを決定し、該事前にトレーニングされた語意モデルは、EMLo、GPT、BERT、XLNet、ERNIEなどを用いてもよく、例えば、図2に示すtensor1、tensor2及びtensor3であり、最後に、該クエリプレフィックスの単語埋め込みを事前にトレーニングされた言語モデルに入力して、該クエリプレフィックスのパープレキシティを取得する。このように、クエリプレフィックスの単語埋め込みに基づいてクエリプレフィックスのパープレキシティを判別することにより、判別精度を向上させることができる。
一実施形態では、各分割単語の単語埋め込みに基づいて、該クエリプレフィックスの単語埋め込みを決定するときに、各単語分割の単語埋め込みを結合して、該クエリプレフィックスの単語埋め込みを取得することができる。
以下、図3を参照しながら本願の具体的な実施例に係るプリフェッチ要求の発行の論理を説明する。
本願の具体的な実施例では、図3に示すように、対応するプリフェッチ要求の発行の論理は、以下の場合1~場合4を含む。
場合1、1->2->3->4であり、ここで、「1(mod1)」は、クライアントがユーザによって入力されたクエリプレフィックスを受信した後に、プリフェッチ要求を発行するように準備することを表し、「2」は、事前にトレーニングされた言語モデルに基づいてクエリプレフィックスを判別し、かつ取得されたパープレキシティが所定の閾値よりも小さいか否かを判断することを表し、「3」は、判断結果1、即ち、取得されたパープレキシティが所定の閾値以上であることを取得することを表し、「4」は、プリフェッチ要求を発行しないことを表す。
場合2、1->2->3->5->6->7であり、ここで、「1(mod1)」は、クライアントがユーザによって入力されたクエリプレフィックスを受信した後に、プリフェッチ要求を発行するように準備することを表し、「2」は、事前にトレーニングされた言語モデルに基づいてクエリプレフィックスを判別し、かつ取得されたパープレキシティが所定の閾値よりも小さいか否かを判断することを表し、「3」は、判断結果2、即ち、取得されたパープレキシティが所定の閾値よりも小さいことを取得することを表し、「5」は、サーバにプリフェッチ要求を発行して、サーバの検索サービスを呼び出すことを表す。「6及び7」は、サーバがプリフェッチ結果をフィードバックすることを表す。
場合3、プリフェッチ要求が成功し、8(mod2)は、クライアントがサーバにフィードバックするプリフェッチの成功フラグを表す。
場合4、プリフェッチ要求が失敗し、9->10(mod0)は、プリフェッチが失敗した後に、ユーザが直接開始した検索要求を表す。
図4を参照すると、本願の実施例に係るデータプリフェッチデバイスは、電子機器に適用され、図4に示すように、該データプリフェッチデバイス40は、
ユーザが入力したクエリプレフィックスを取得する第1の取得モジュール41と、
事前にトレーニングされた言語モデルに基づいて上記クエリプレフィックスを判別して、上記クエリプレフィックスのパープレキシティを取得する判別モジュール42と、
上記パープレキシティが所定の閾値よりも小さいか否かを判断する判断モジュール43と、
上記パープレキシティが上記所定の閾値よりも小さい場合に、上記クエリプレフィックスに基づいてプリフェッチ要求を送信する送信モジュール44と、を含む。
好ましくは、上記デバイスは、
上記クエリプレフィックスに特殊文字が含まれる場合に、上記クエリプレフィックスのパープレキシティ補正係数を取得する第2の取得モジュールをさらに含む。
上記判断モジュール43は、
上記パープレキシティ補正係数を用いて上記パープレキシティを補正する補正ユニットと、
補正後のパープレキシティが上記所定の閾値よりも小さいか否かを判断する判断ユニットと、を含む。
上記送信モジュール44は、具体的には、上記補正後のパープレキシティが上記所定の閾値よりも小さい場合に、上記クエリプレフィックスに基づいて上記プリフェッチ要求を送信する。
好ましくは、前記第2の取得モジュールは、具体的には、
下式を採用して上記クエリプレフィックスのパープレキシティ補正係数Reを計算し、
Figure 2022520683000006
ここで、Nは、上記クエリプレフィックスの文の長さを表し、count(sw)は、上記クエリプレフィックスに含まれる特殊文字の個数を表し、fは、所定の係数を表す。
好ましくは、上記判別モジュール42は、
上記クエリプレフィックスを分割して、複数の分割単語を取得する分割ユニットと、
各上記分割単語を事前にトレーニングされた語意モデルにそれぞれ入力して、各上記分割単語の単語埋め込みを生成する生成ユニットと、
各上記分割単語の単語埋め込みに基づいて上記クエリプレフィックスの単語埋め込みを決定する決定ユニットと、
上記クエリプレフィックスの単語埋め込みを上記事前にトレーニングされた言語モデルに入力して、上記クエリプレフィックスのパープレキシティを取得する判別ユニットと、を含む。
好ましくは、上記決定ユニットは、具体的には、各上記分割単語の単語埋め込みを結合して、上記クエリプレフィックスの単語埋め込みを取得する。
好ましくは、上記デバイスは、
サーバが上記プリフェッチ要求に基づいて返された上記クエリプレフィックスに対応するプリフェッチ結果を受信する受信モジュールをさらに含む。
本実施例に係るデータプリフェッチデバイス40は、上記図1に示す実施例において実現された各プロセスを実現し、かつ同様の効果を達成することができ、重複を避けるため、ここでは説明を省略する。
本願の実施例によれば、本願は、電子機器と可読記憶媒体をさらに提供する。
図5に示すように、本願の実施例に係るデータプリフェッチ方法を実現する電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及びその他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを意図する。電子機器は、パーソナルデジタルアシスタント、セルラー電話、スマートフォン、ウェアラブルデバイス及びその他の類似するコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すことができる。本明細書に示すコンポーネント、それらの接続及び関係と、それらの機能とは、例示的なものに過ぎず、本明細書で説明及び/又は要求された本願の実現を限定することを意図するものではない。
図5に示すように、該電子機器は、1つ以上のプロセッサ501と、メモリ502と、高速インタフェース及び低速インタフェースを含む、各コンポーネントを接続するインタフェースと、を含む。各コンポーネントは、異なるバスを介して互いに接続され、かつ共通マザーボード上に取り付けられてもよく、必要に応じて他の方式で取り付けられてもよい。プロセッサは、電子機器内で実行された、外部入力/出力装置(例えば、インタフェースに結合された表示機器)上にGUIのグラフィック情報を表示するようにメモリ内又はメモリ上に記憶されている命令を含む命令を処理することができる。他の実施形態では、必要があれば、複数のプロセッサ及び/又は複数のバスを、複数のメモリ及び複数のメモリと共に使用することができる。同様に、それぞれが必要な動作を提供する複数の電子機器(例えば、サーバアレイ、ブレードサーバのグループ又はマルチプロセッサシステム)を接続することができる。図5において、プロセッサ501を例とする。
メモリ502は、本願に係る非一時的コンピュータ可読記憶媒体である。上記メモリには、少なくとも1つのプロセッサに実行可能で、前記少なくとも1つのプロセッサに本願に係るデータプリフェッチ方法を実行させる命令が記憶されている。本願の非一時的コンピュータ可読記憶媒体には、本願に係るデータプリフェッチ方法をコンピュータに実行させるコンピュータ命令が記憶されている。
メモリ502は、非一時的コンピュータ可読記憶媒体として、非一時的ソフトウェアプログラム、非一時的コンピュータ実行可能なプログラム及びモジュール、例えば、本願の実施例におけるデータプリフェッチ方法に対応するプログラム命令/モジュール(例えば、図4に示す第1の取得モジュール41、判別モジュール42、判断モジュール43及び送信モジュール44)を記憶することができる。プロセッサ501は、メモリ502内に記憶されている非一時的ソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能アプリケーション及びデータ処理を実行し、即ち、上記方法の実施例におけるデータプリフェッチ方法を実現する。
メモリ502は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションプログラムを記憶できるプログラム記憶領域と、電子機器の使用中に作成されたデータなどを記憶できるデータ記憶領域とを含んでよい。また、メモリ502は、高速ランダムアクセスメモリを含んでもよく、少なくとも1つの磁気ディスクメモリデバイス、フラッシュメモリデバイス、又は他の非一時的固体メモリデバイスなどの非一時的メモリを含んでもよい。幾つかの実施例では、メモリ502は、好ましくは、プロセッサ501に対して遠隔に配置されたメモリを含み、これらのリモートメモリは、ネットワークを介して電子機器に接続することができる。上記ネットワークの例は、インターネット、企業イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク及びそれらの組み合わせを含むが、これらに限定されない。
データプリフェッチ方法の電子機器は、入力装置503及び出力装置504をさらに含んでよい。プロセッサ501、メモリ502、入力装置503及び出力装置504は、バス又は他の方式で接続することができ、図5において、バスによる接続を例とする。
入力装置503は、入力された数字又は文字情報を受信するとともに、データプリフェッチ方法の電子機器のユーザ設定及び機能制御に関連するキー信号入力を生成することができ、入力装置は、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、1つ以上のマウスボタン、トラックボール、ジョイスティックである。出力装置504は、表示機器、補助照明装置(例えば、LED)及び触覚フィードバック装置(例えば、振動モータ)などを含んでよい。該表示機器は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ及びプラズマディスプレイなどを含んでよいが、これらに限定されない。幾つかの実施形態では、表示機器は、タッチスクリーンであってよい。
本明細書で説明されたシステム及び技術の各実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行及び/又は解釈できる1つ以上のコンピュータプログラムにおける実施を含んでもよく、該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置及び少なくとも1つの出力装置からデータと命令を受信し、かつデータと命令を該記憶システム、該少なくとも1つの入力装置及び該少なくとも1つの出力装置に伝送することができる。
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、かつこれらのコンピュータプログラムを、高レベルのプロセス及び/又はオブジェクト指向のプログラミング言語、及び/又はアセンブリ/機械言語を用いて実施することができる。本明細書で使用された用語「機械可読媒体」及び「コンピュータ可読媒体」とは、機械命令及び/又はデータをプログラマブルプロセッサに提供する任意のコンピュータプログラム製品、デバイス及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジック装置(PLD))を指し、機械可読信号としての機械命令を受信する機械可読媒体を含む。用語「機械可読信号」とは、機械命令及び/又はデータをプログラマブルプロセッサに提供する任意の信号を指す。
ユーザとの対話を提供するために、本明細書で説明されたシステム及び技術をコンピュータ上で実施することができ、該コンピュータは、ユーザに情報を表示する表示装置(例えば、CRT(ブラウン管)又はLCD(液晶ディスプレイ)モニター)と、キーボードと、ポインティング装置(例えば、マウス又はトラックボール)とを有し、ユーザは、該キーボード及び該ポインティング装置により入力をコンピュータに提供することができる。他の種類の装置は、ユーザとの対話を提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形式の感覚フィードバック(例えば、視覚的フィードバック、聴覚的フィードバック又は触覚フィードバック)であってよく、任意の形式(音響入力、音声入力又は触覚入力を含む)でユーザからの入力を受信することができる。
本明細書で説明されたシステム及び技術は、バックエンドコンポーネントを含むコンピュータシステム(例えば、データサーバとして)、又はミドルウェアコンポーネントを含むコンピュータシステム(例えば、アプリケーションサーバ)、又はフロントエンドコンポーネントを含むコンピュータシステム(例えば、ユーザが本明細書で説明されたシステム及び技術の実施形態と対話できるグラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ)、又はこのようなバックグラウンドコンポーネント、ミドルウェアコンポーネント又はフロントエンドコンポーネントの任意の組み合わせを含むコンピュータシステムにおいて実施することができる。システムのコンポーネントは、任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)を介して互いに接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)及びインターネットを含む。
コンピュータシステムは、クライアント及びサーバを含んでよい。クライアントとサーバは、一般的に、互いに離れ、通常、通信ネットワークを介して対話する。クライアントとサーバとの関係は、対応するコンピュータ上で実行し、互いにクライアント-サーバの関係を有するコンピュータプログラムによって生成される。
本願の実施例の技術手段によれば、パープレキシティの高いプリフェッチ要求を直接フィルタリングして除去することができるため、プリフェッチの成功率を向上させ、かつ過剰なプリフェッチ要求によるバックエンドサーバの機器コストをさらに低減することができるとともに、システム安定性に影響を与えることと、過剰なプリフェッチ結果の提示によりユーザに視覚体験上の干渉を与えることとを避け、ユーザ体験を向上させることができる。
なお、上記様々な形式のフローを使用して、ステップを改めて順序付けたり、追加したり、削除したりしてよい。例えば、本願において開示されている技術手段の所望の結果を実現できる限り、本願に記載された各ステップは、並列的に実行されてもよく、順次実行されてもよく、異なる順序で実行されてもよく、本明細書はこれを限定しない。
当業者は、上記実施例の方法におけるフローの全部又は一部の実現が、コンピュータプログラムによって関連ハードウェアを制御して完成できることを理解すべきであり、上記プログラムはコンピュータ可読記憶媒体に記憶することができ、該プログラムが実行されると、上記各方法の実施例のフローを含んでよい。上記記憶媒体は、磁気ディスク、光ディスク、読み取り専用メモリ(Read-Only Memory、ROM)又はランダムアクセスメモリ(Random Access Memory、RAM)などであってよい。
本開示の幾つかの実施例で説明されたこれらの実施例は、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード又はそれらの組み合わせによって実現できることを理解されたい。ハードウェアによって実現される場合、モジュール、ユニット、サブモジュール、サブユニットなどは、1つ以上の特定用途向け集積回路(Application Specific Integrated Circuits、ASIC)、デジタルシグナルプロセッサ(Digital Signal Processing、DSP)、デジタル信号処理装置(DSP Device、DSPD)、プログラマブルロジックデバイス(Programmable Logic Device、PLD)、フィールドプログラマブルゲートアレイ(Field-Programmable Gate Array、FPGA)、汎用プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、本願に記載の機能を実行する他の電子ユニット又はそれらの組み合わせにおいて実現することができる。
ソフトウェアによって実現される場合、本開示の幾つかの実施例に記載の機能を実行するモジュール(例えば、プロセス、関数など)により、本開示の幾つかの実施例に記載の技術を実現することができる。ソフトウェアコードは、メモリに記憶し、かつプロセッサにより実行することができる。メモリは、プロセッサ内又はプロセッサの外部で実現されてよい。
上記具体的な実施形態は、本願の保護範囲を限定するものではない。当業者は、設計要件及びその他の要因に応じて、様々な修正、組み合わせ、サブ組み合わせ及び置換を行うことができることを、理解すべきである。本願の精神及び原則の範囲内で行われる修正、同等置換及び改善などは、いずれも本願の保護範囲に含まれるべきである。
本願は、2020年1月10日に提出された中国特許出願第202010024434.0号の優先権を主張するものであり、その全ての内容は参照により本願に取り組まれるものとする。
図5に示すように、該電子機器は、1つ以上のプロセッサ501と、メモリ502と、高速インタフェース及び低速インタフェースを含む、各コンポーネントを接続するインタフェースと、を含む。各コンポーネントは、異なるバスを介して互いに接続され、かつ共通マザーボード上に取り付けられてもよく、必要に応じて他の方式で取り付けられてもよい。プロセッサは、電子機器内で実行された、外部入力/出力装置(例えば、インタフェースに結合された表示機器)上にGUIのグラフィック情報を表示するようにメモリ内又はメモリ上に記憶されている命令を含む命令を処理することができる。他の実施形態では、必要があれば、複数のプロセッサ及び/又は複数のバスを、複数のメモリと共に使用することができる。同様に、それぞれが必要な動作を提供する複数の電子機器(例えば、サーバアレイ、ブレードサーバのグループ又はマルチプロセッサシステム)を接続することができる。図5において、プロセッサ501を例とする。

Claims (14)

  1. ユーザが入力したクエリプレフィックスを取得することと、
    事前にトレーニングされた言語モデルに基づいて前記クエリプレフィックスを判別して、前記クエリプレフィックスのパープレキシティを取得することと、
    前記パープレキシティが所定の閾値よりも小さいか否かを判断することと、
    前記パープレキシティが前記所定の閾値よりも小さい場合に、前記クエリプレフィックスに基づいてプリフェッチ要求を送信することと、を含むデータプリフェッチ方法。
  2. 前記クエリプレフィックスに特殊文字が含まれる場合に、
    前記クエリプレフィックスのパープレキシティ補正係数を取得することをさらに含み、
    前記パープレキシティが所定の閾値よりも小さいか否かを判断することは、
    前記パープレキシティ補正係数を用いて前記パープレキシティを補正することと、
    補正後のパープレキシティが前記所定の閾値よりも小さいか否かを判断することと、を含み、
    前記パープレキシティが前記所定の閾値よりも小さい場合に、前記クエリプレフィックスに基づいてプリフェッチ要求を送信することは、
    前記補正後のパープレキシティが前記所定の閾値よりも小さい場合に、前記クエリプレフィックスに基づいて前記プリフェッチ要求を送信することを含む、請求項1に記載の方法。
  3. 前記クエリプレフィックスのパープレキシティ補正係数を取得することは、
    下式を採用して前記クエリプレフィックスのパープレキシティ補正係数Reを計算することを含み、
    Figure 2022520683000007
    ここで、Nは、前記クエリプレフィックスの文の長さを表し、count(sw)は、前記クエリプレフィックスに含まれる特殊文字の個数を表し、fは、所定の係数を表す、請求項2に記載の方法。
  4. 事前にトレーニングされた言語モデルに基づいて前記クエリプレフィックスを判別して、前記クエリプレフィックスのパープレキシティを取得することは、
    前記クエリプレフィックスを分割して、複数の分割単語を取得することと、
    各前記分割単語を事前にトレーニングされた語意モデルにそれぞれ入力して、各前記分割単語の単語埋め込みを生成し、かつ各前記分割単語の単語埋め込みに基づいて前記クエリプレフィックスの単語埋め込みを決定することと、
    前記クエリプレフィックスの単語埋め込みを前記事前にトレーニングされた言語モデルに入力して、前記クエリプレフィックスのパープレキシティを取得することと、を含む請求項1に記載の方法。
  5. 各前記分割単語の単語埋め込みに基づいて前記クエリプレフィックスの単語埋め込みを決定することは、
    各前記分割単語の単語埋め込みを結合して、前記クエリプレフィックスの単語埋め込みを取得することを含む、請求項4に記載の方法。
  6. 前記クエリプレフィックスに基づいてプリフェッチ要求を送信する後に、
    サーバが前記プリフェッチ要求に基づいて返された前記クエリプレフィックスに対応するプリフェッチ結果を受信することをさらに含む、請求項1に記載の方法。
  7. ユーザが入力したクエリプレフィックスを取得する第1の取得モジュールと、
    事前にトレーニングされた言語モデルに基づいて前記クエリプレフィックスを判別して、前記クエリプレフィックスのパープレキシティを取得する判別モジュールと、
    前記パープレキシティが所定の閾値よりも小さいか否かを判断する判断モジュールと、
    前記パープレキシティが前記所定の閾値よりも小さい場合に、前記クエリプレフィックスに基づいてプリフェッチ要求を送信する送信モジュールと、を含むデータプリフェッチデバイス。
  8. 前記クエリプレフィックスに特殊文字が含まれる場合に、前記クエリプレフィックスのパープレキシティ補正係数を取得する第2の取得モジュールをさらに含み、
    前記判断モジュールは、
    前記パープレキシティ補正係数を用いて前記パープレキシティを補正する補正ユニットと、
    補正後のパープレキシティが前記所定の閾値よりも小さいか否かを判断する判断ユニットと、を含み、
    前記送信モジュールは、具体的には、前記補正後のパープレキシティが前記所定の閾値よりも小さい場合に、前記クエリプレフィックスに基づいて前記プリフェッチ要求を送信する、請求項7に記載のデバイス。
  9. 前記第2の取得モジュールは、具体的には、
    下式を採用して前記クエリプレフィックスのパープレキシティ補正係数Reを計算し、
    Figure 2022520683000008
    ここで、Nは、前記クエリプレフィックスの文の長さを表し、count(sw)は、前記クエリプレフィックスに含まれる特殊文字の個数を表し、fは、所定の係数を表す、請求項8に記載のデバイス。
  10. 前記判別モジュールは、
    前記クエリプレフィックスを分割して、複数の分割単語を取得する分割ユニットと、
    各前記分割単語を事前にトレーニングされた語意モデルにそれぞれ入力して、各前記分割単語の単語埋め込みを生成する生成ユニットと、
    各前記分割単語の単語埋め込みに基づいて前記クエリプレフィックスの単語埋め込みを決定する決定ユニットと、
    前記クエリプレフィックスの単語埋め込みを前記事前にトレーニングされた言語モデルに入力して、前記クエリプレフィックスのパープレキシティを取得する判別ユニットと、を含む請求項7に記載のデバイス。
  11. 前記決定ユニットは、具体的には、各前記分割単語の単語埋め込みを結合して、前記クエリプレフィックスの単語埋め込みを取得する、請求項10に記載のデバイス。
  12. サーバが前記プリフェッチ要求に基づいて返された前記クエリプレフィックスに対応するプリフェッチ結果を受信する受信モジュールをさらに含む、請求項7に記載のデバイス。
  13. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサに通信可能に接続されているメモリと、を含み、
    前記メモリには、前記少なくとも1つのプロセッサに実行可能で、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに請求項1~6のいずれか1項に記載の方法を実行させることができる命令が記憶されている、電子機器。
  14. 請求項1~6のいずれか1項に記載の方法をコンピュータに実行させるコンピュータ命令が記憶されている非一時的コンピュータ可読記憶媒体。
JP2021516412A 2020-01-10 2020-08-11 データプリフェッチ方法、デバイス、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム製品 Active JP7209433B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202010024434.0 2020-01-10
CN202010024434.0A CN111241398B (zh) 2020-01-10 2020-01-10 数据预取方法、装置、电子设备及计算机可读存储介质
PCT/CN2020/108438 WO2021139154A1 (zh) 2020-01-10 2020-08-11 数据预取方法、装置、电子设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
JP2022520683A true JP2022520683A (ja) 2022-04-01
JP7209433B2 JP7209433B2 (ja) 2023-01-20

Family

ID=70878169

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021516412A Active JP7209433B2 (ja) 2020-01-10 2020-08-11 データプリフェッチ方法、デバイス、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム製品

Country Status (5)

Country Link
US (1) US20210319021A1 (ja)
EP (1) EP3876115A4 (ja)
JP (1) JP7209433B2 (ja)
CN (1) CN111241398B (ja)
WO (1) WO2021139154A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111241398B (zh) * 2020-01-10 2023-07-25 百度在线网络技术(北京)有限公司 数据预取方法、装置、电子设备及计算机可读存储介质
CN112559843B (zh) * 2020-12-16 2023-10-03 北京百度网讯科技有限公司 确定集合的方法、装置、电子设备、介质和程序产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018206361A (ja) * 2017-06-07 2018-12-27 富士ゼロックス株式会社 ユーザ指向トピック選択及びブラウジングのためのシステム及び方法、複数のコンテンツ項目を表示する方法、プログラム、及びコンピューティングデバイス
US20190278870A1 (en) * 2018-03-12 2019-09-12 Microsoft Technology Licensing, Llc Machine learning model to preload search results
WO2019198386A1 (ja) * 2018-04-13 2019-10-17 国立研究開発法人情報通信研究機構 リクエスト言換システム、リクエスト言換モデル及びリクエスト判定モデルの訓練方法、及び対話システム

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7593920B2 (en) * 2001-04-04 2009-09-22 West Services, Inc. System, method, and software for identifying historically related legal opinions
US20070088681A1 (en) * 2005-10-17 2007-04-19 Veveo, Inc. Method and system for offsetting network latencies during incremental searching using local caching and predictive fetching of results from a remote server
US8255411B1 (en) * 2008-06-19 2012-08-28 Boopsie, Inc. Dynamic menus for multi-prefix interactive mobile searches
CN101639830B (zh) * 2009-09-08 2011-11-16 西安交通大学 一种输入过程中的中文术语自动纠错方法
US9031970B1 (en) * 2011-01-26 2015-05-12 Google Inc. Query autocompletions
CN102857483B (zh) * 2011-06-30 2016-06-29 国际商业机器公司 预取数据的方法、设备和装置
CN103870492B (zh) * 2012-12-14 2017-08-04 腾讯科技(深圳)有限公司 一种基于键排序的数据存储方法和装置
US10073840B2 (en) * 2013-12-20 2018-09-11 Microsoft Technology Licensing, Llc Unsupervised relation detection model training
US10217058B2 (en) * 2014-01-30 2019-02-26 Microsoft Technology Licensing, Llc Predicting interesting things and concepts in content
US9846836B2 (en) * 2014-06-13 2017-12-19 Microsoft Technology Licensing, Llc Modeling interestingness with deep neural networks
US20150379571A1 (en) * 2014-06-30 2015-12-31 Yahoo! Inc. Systems and methods for search retargeting using directed distributed query word representations
JP2019504413A (ja) * 2015-12-29 2019-02-14 エム・ゼット・アイ・ピィ・ホールディングス・リミテッド・ライアビリティ・カンパニーMz Ip Holdings, Llc 絵文字を提案するためのシステムおよび方法
US10305828B2 (en) * 2016-04-20 2019-05-28 Google Llc Search query predictions by a keyboard
WO2018057945A1 (en) * 2016-09-22 2018-03-29 nference, inc. Systems, methods, and computer readable media for visualization of semantic information and inference of temporal signals indicating salient associations between life science entities
US10268679B2 (en) * 2016-12-02 2019-04-23 Microsoft Technology Licensing, Llc Joint language understanding and dialogue management using binary classification based on forward and backward recurrent neural network
US10459928B2 (en) * 2016-12-14 2019-10-29 Microsoft Technology Licensing, Llc Dynamic tensor attention for information retrieval scoring
US20180173692A1 (en) * 2016-12-19 2018-06-21 Google Inc. Iconographic symbol predictions for a conversation
CN108319603A (zh) * 2017-01-17 2018-07-24 腾讯科技(深圳)有限公司 对象推荐方法和装置
US10983853B2 (en) * 2017-03-31 2021-04-20 Microsoft Technology Licensing, Llc Machine learning for input fuzzing
WO2018200979A1 (en) * 2017-04-29 2018-11-01 Google Llc Generating query variants using a trained generative model
US10824678B2 (en) * 2017-06-03 2020-11-03 Apple Inc. Query completion suggestions
US10719744B2 (en) * 2017-12-28 2020-07-21 Intel Corporation Automated semantic inference of visual features and scenes
US10795886B1 (en) * 2018-03-30 2020-10-06 Townsend Street Labs, Inc. Dynamic query routing system
US10782986B2 (en) * 2018-04-20 2020-09-22 Facebook, Inc. Assisting users with personalized and contextual communication content
CN108846016B (zh) * 2018-05-05 2021-08-20 复旦大学 一种面向中文分词的搜索算法
US11734328B2 (en) * 2018-08-31 2023-08-22 Accenture Global Solutions Limited Artificial intelligence based corpus enrichment for knowledge population and query response
US10775976B1 (en) * 2018-10-01 2020-09-15 Splunk Inc. Visual previews for programming an iterative publish-subscribe message processing system
US11335346B1 (en) * 2018-12-10 2022-05-17 Amazon Technologies, Inc. Natural language understanding processing
CN110222160B (zh) * 2019-05-06 2023-09-15 平安科技(深圳)有限公司 智能语义文档推荐方法、装置及计算机可读存储介质
US20200364508A1 (en) * 2019-05-14 2020-11-19 Nvidia Corporation Using decay parameters for inferencing with neural networks
US11238048B1 (en) * 2019-07-16 2022-02-01 Splunk Inc. Guided creation interface for streaming data processing pipelines
US11902705B2 (en) * 2019-09-03 2024-02-13 Nvidia Corporation Video prediction using one or more neural networks
US11636102B2 (en) * 2019-09-05 2023-04-25 Verizon Patent And Licensing Inc. Natural language-based content system with corrective feedback and training
US11379529B2 (en) * 2019-09-09 2022-07-05 Microsoft Technology Licensing, Llc Composing rich content messages
US20210081459A1 (en) * 2019-09-18 2021-03-18 Atlassian Pty Ltd. Notification system for a collaboration tool configured to generate user-specific natural language relevancy ranking and urgency ranking of notification content
US11749281B2 (en) * 2019-12-04 2023-09-05 Soundhound Ai Ip, Llc Neural speech-to-meaning
CN111241398B (zh) * 2020-01-10 2023-07-25 百度在线网络技术(北京)有限公司 数据预取方法、装置、电子设备及计算机可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018206361A (ja) * 2017-06-07 2018-12-27 富士ゼロックス株式会社 ユーザ指向トピック選択及びブラウジングのためのシステム及び方法、複数のコンテンツ項目を表示する方法、プログラム、及びコンピューティングデバイス
US20190278870A1 (en) * 2018-03-12 2019-09-12 Microsoft Technology Licensing, Llc Machine learning model to preload search results
WO2019198386A1 (ja) * 2018-04-13 2019-10-17 国立研究開発法人情報通信研究機構 リクエスト言換システム、リクエスト言換モデル及びリクエスト判定モデルの訓練方法、及び対話システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中村 明 外: "複数モデルの統合によるLDAトピックモデルの高精度化とテキスト入力支援への応用", 情報処理学会論文誌 論文誌ジャーナル VOL.50 NO.4 [CD−ROM], vol. 50, no. 4, JPN6022020828, 15 April 2009 (2009-04-15), JP, pages 1375 - 1389, ISSN: 0004842248 *
鷹合 基行 外: "読影レポートを対象とした予測入力システム", 第72回(平成22年)全国大会講演論文集(2) 人工知能と認知科学, JPN6022020827, 20 March 2010 (2010-03-20), JP, pages 2 - 777, ISSN: 0004842249 *

Also Published As

Publication number Publication date
CN111241398B (zh) 2023-07-25
JP7209433B2 (ja) 2023-01-20
WO2021139154A1 (zh) 2021-07-15
CN111241398A (zh) 2020-06-05
EP3876115A1 (en) 2021-09-08
US20210319021A1 (en) 2021-10-14
EP3876115A4 (en) 2022-12-14

Similar Documents

Publication Publication Date Title
US11178454B2 (en) Video playing method and device, electronic device, and readable storage medium
US10678871B2 (en) Accelerating find in page queries within a web browser
JP7266635B2 (ja) 画面切り替え表示方法、装置、スマートバックミラー及び読み取り可能な記憶媒体
US20210192141A1 (en) Method and apparatus for generating vector representation of text, and related computer device
JP7395445B2 (ja) 検索データに基づくヒューマンコンピュータ対話型インタラクションの方法、装置及び電子機器
KR20210038853A (ko) 이벤트 추출 방법, 이벤트 추출 장치 및 전자 기기
US11270669B2 (en) Rendering method and apparatus, electronic device and storage medium
US11556707B2 (en) Fulfillment of actionable requests ahead of a user selecting a particular autocomplete suggestion for completing a current user input
JP2022520683A (ja) データプリフェッチ方法、デバイス、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム製品
CN110992112B (zh) 广告信息的处理方法和装置
US11216615B2 (en) Method, device and storage medium for predicting punctuation in text
EP3832492A1 (en) Method and apparatus for recommending voice packet, electronic device, and storage medium
US20210096814A1 (en) Speech control method, speech control device, electronic device, and readable storage medium
US20210090562A1 (en) Speech recognition control method and apparatus, electronic device and readable storage medium
CN113722647A (zh) 显示信息的方法和装置
CN111177539A (zh) 搜索结果页生成方法、装置、电子设备及存储介质
CN111126063B (zh) 文本质量评估方法及装置
WO2021218468A1 (zh) 数据更新方法、装置、搜索服务器、终端及存储介质
WO2022105574A1 (zh) 信息传输方法、系统和装置
US20220101216A1 (en) Business Content Output Method, Apparatus, Storage Medium and Program Product
EP2956839A1 (en) Methods and systems for multimodal interaction
KR102556179B1 (ko) 데이터 프리페치 방법, 장치, 전자 기기 및 컴퓨터 판독 가능 저장 매체
CN113448668A (zh) 一种跳过弹窗的方法、装置及电子设备
CN112861029B (zh) 信息展示方法、装置、设备和介质
US20210109965A1 (en) Method and apparatus for recommending speech packet, and storage medium

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210322

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220720

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220802

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220803

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230105

R150 Certificate of patent or registration of utility model

Ref document number: 7209433

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150