JP2022024102A

JP2022024102A - 検索モデルのトレーニング方法、目標対象の検索方法及びその装置

Info

Publication number: JP2022024102A
Application number: JP2021187732A
Authority: JP
Inventors: ドンハイ・ビアン; Donghai Bian; ウェイファ・ペン; Weihua Peng; ユ・ルオ; Yu Luo; シュアイ・ジアーン; Shuai Jiang
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-11-24
Filing date: 2021-11-18
Publication date: 2022-02-08
Also published as: KR20210151017A; EP3937029A2; CN112328891A; CN112328891B; EP3937029A3; US20220083874A1

Abstract

【課題】検索モデルのトレーニングを効率的且つ低コストで完了させ、これによって、ユーザクエリ情報に比較的関連する対象を確定する、検索モデルのトレーニング方法、目標対象の検索方法及びその装置を提供する。
【解決手段】方法は、サンプルクエリ情報に基づいて、検索モデルをトレーニングするための第１サンプルデータセットを取得することと、予めに構築した知識ベースに基づいてサンプルクエリ情報に関連する付加クエリ情報を確定することと、付加クエリ情報に基づいて、検索モデルをトレーニングするための、第１サンプルデータセットと異なる第２サンプルデータセットを取得することを含む。且つ、方法はさらに、サンプルクエリ情報及び第１サンプルデータセットと第２サンプルデータセットに基づいて、検索モデルをトレーニングすることを含む。
【選択図】図４

Description

本開示の実施例は、主に人工知能分野に関し、より具体的には、検索モデルのトレーニング方法、目標対象の検索方法、及びその装置、電子機器、コンピュータ可読記憶媒体、並びにコンピュータプログラム製品に関する。

ユーザが画像を検索する時、類似のユーザクエリ情報（又は、クエリ用語、すなわち、「ｑｕｅｒｙ」と称する）は全く異なる種類を表す可能性があり、例えば、「ファッション性が高い韓国風セーター」と「ファッション性が高い欧米風セーター」では、文字通りにいずれも「セーター」というユーザクエリ情報を検索することであるが、実はユーザが特定スタイルのタイプのセーターに注目している。従来の画像検索方法では、このような詳細な分類に対して比較的効果的な解決手段がまだない。更に、画像検索モデルをトレーニングするための関連するデータセットは基本的にいずれも正サンプルデータである。そのため、トレーニングした画像検索に用いられるモデルでは性能が不十分である場合が存在する恐れがある。

本開示の実施例に基づいて、検索モデルをトレーニングする手段を提供する。
本開示の第１態様では、検索モデルのトレーニング方法を提供する。この方法はサンプルクエリ情報に基づいて、前記検索モデルをトレーニングする第１サンプルデータセットを取得することを含んでもよい。この方法は更に、予めに構築した知識ベースに基づいて前記サンプルクエリ情報に関連する付加クエリ情報を確定することを含んでもよい。また、この方法は更に、前記付加クエリ情報に基づいて、前記検索モデルをトレーニングする、前記第１サンプルデータセットと異なる第２サンプルデータセットを取得することを含んでもよい。且つ、この方法は更に、前記サンプルクエリ情報、前記第１サンプルデータセットと前記第２サンプルデータセットに基づいて、前記検索モデルをトレーニングすることを含んでもよい。

本開示の第２態様では、検索モデルのトレーニング装置を提供し、サンプルクエリ情報に基づいて、前記検索モデルをトレーニングする第１サンプルデータセットを取得するように構成される第１サンプルデータセット取得モジュールと、予めに構築した知識ベースに基づいて前記サンプルクエリ情報に関連する付加クエリ情報を確定するように構成される付加クエリ情報確定モジュールと、前記付加クエリ情報に基づいて、前記検索モデルをトレーニングする、前記第１サンプルデータセットと異なる第２サンプルデータセットを取得するように構成される第２サンプルデータセット取得モジュールと、前記サンプルクエリ情報、前記第１サンプルデータセットと前記第２サンプルデータセットに基づいて、前記検索モデルをトレーニングするように構成される検索モデルトレーニングモジュールと、を含む。

本開示の第３態様では、目標対象の検索方法を提供し、受信したユーザクエリ情報に基づいて複数の候補目標対象を取得することと、本開示の第１態様による方法によってトレーニングされる前記検索モデルに基づいて、それぞれ前記複数の候補目標対象が前記ユーザクエリ情報にヒットする確率を確定することと、確率が閾値確率を超えた候補目標対象を前記目標対象に確定することと、を含む。

本開示の第４態様では、目標対象の検索装置を提供し、受信したユーザクエリ情報に基づいて複数の候補目標対象を取得するように構成される候補目標対象取得モジュールと、本開示の第２態様による装置によってトレーニングされる前記検索モデルに基づいて、それぞれ前記複数の候補目標対象が前記ユーザクエリ情報にヒットする確率を確定するように構成される確率確定モジュールと、確率が閾値確率を超えた候補目標対象を前記目標対象に確定するように構成される目標対象確定モジュールと、を含む。

本開示の第５態様では、電子機器を提供し、１つ又は複数のプロセッサと、１つ又は複数のプロセッサによって実行されることで、本開示の第１態様による方法を実現する１つ又は複数のプログラムを記憶するための記憶装置と、を含む。

本開示の第６態様では、プロセッサによって実行されると、本開示の第１態様による方法を実現するコンピュータプログラムが記憶されたコンピュータ可読記憶媒体を提供する。

本開示の第７態様では、非一時的コンピュータ可読媒体に有形に記憶され且つ機械実行可能なコマンドを含むコンピュータプログラム製品を提供し、前記機械実行可能なコマンドが実行されると、機械に本開示の第１態様による方法のステップを実行させる。

理解すべきことは、本発明の明細書に記述された内容は、本開示の実施例の肝心又は重要な特徴を制限するものでもなく、本開示の範囲を制限するものでもないことである。本発明の他の特徴は、以下の説明により容易に理解され得る。

図面に合わせて以下の詳細な説明を参照しながら、本開示の各実施例の上記と他の特徴、利点及び態様は、より顕著になる。図面において、同一又は類似の符号は同一又は類似の元素を示し、ここで、
本開示の複数の実施例を実現できる例示的な環境の模式図である。本開示の実施例による詳細な例示的な環境の模式図である。本開示の一部の実施例による知識グラフの模式図である。本開示の実施例による検索モデルをトレーニングする過程のフローチャートである。本開示の実施例による検索目標対象の過程のフローチャートである。本開示の実施例による検索モデルのトレーニング装置のブロック図である。本開示の複数の実施例を実施できる計算機器のブロック図である。

以下、図面を参照しながら本開示の実施例をより詳細に説明する。図面では、本開示の幾つかの実施例を示すが、理解すべきことは、本開示は、様々な形態によって実現することができ、そして本明細書に記載される実施例に限定されると解釈すべきではなく、逆で提供するこれらの実施例は、本開示をより明確と全体的に理解するためのものであることである。理解すべきことは、本開示の図面及び実施例は、例示的なものに過ぎず、本開示の保護範囲を限定するためのものではないことである。

本開示の実施例の説明において、「含む」の用語及びその類似用語は、開放的に含む、すなわち「含むがこれらに限定されない」と理解すべきである。用語「に基づいて」は、「少なくとも一部の的に．．．に基づいて」と理解すべきである。「一実施例」又は「当該実施例」は、「少なくとも１つの実施例」であると理解すべきである。「第１」、「第２」などの用語は、異なるまたは同一のものを指すことがある。以下、他の明確な定義と暗黙的定義を含める可能性もある。

従来の画像検索方法では、一般的にサーバ側はユーザの入力したユーザクエリ情報を受信し、サーバ側にある検索エンジンはこのクエリ情報に基づいて複数の候補画像を検索し、更にこれらの画像とユーザクエリ情報をいずれも予めにトレーニングした検索モデルに入力することによって、この検索モデルを利用してユーザクエリ情報に比較的関連する１つ又は複数の画像を確定し、ユーザを表示する。

従来の画像検索方法の欠点は少なくとも、まず、上記複数の候補画像はいずれも対応するユーザクエリ情報に基づいて検索されたものであるため、この検索モデルをトレーニングするデータセットはいずれもこのユーザクエリ情報に関する正サンプルデータセットである。幾つかのトレーニング方法は他のサンプルデータセットを含み、この他のサンプルデータセット自体も正サンプルデータセットに関連せず且つ詳細ではなく、トレーニングしたモデルの性能が不安定であり且つ予測結果が十分に正確ではないことを引き起こす。更に、従来の画像検索方法は詳細な検索に適用せず、検索結果も一般的にユーザを満足させることができない。

上述のように、モデルトレーニング方法が強く求められ、迅速、効率的且つ低コストで検索モデル、特に画像検索モデルをトレーニングし、更にこのモデルを利用してユーザクエリ情報に比較的関連する１つ又は複数の画像を確定する。

本開示の実施例に基づいて、モデルトレーニングの手段を提供する。この手段において、ユーザクエリ情報に対する分野スペクトルを自動的に構築することによって、正例のみがある場合に高精度で画像を細分化し、同時に逆順対学習方式を使用して検索手段の収束速度と予測精度を加速させることができる。具体的には、本開示の検索モデルトレーニング方法は、ユーザの入力したユーザクエリ情報に基づいてモデルをトレーニングする正サンプルデータセットを確定することと、且つ予めに確定された知識グラフに基づいてこのクエリ用語の関連項目を確定し、更にこの関連項目に基づいてモデルをトレーニングする負サンプルデータセットを確定することと、を含んでもよい。これを基にし、この正サンプルデータセットとこの負サンプルデータセットを検索モデルのトレーニング用データセットとして使用することができる。また、本開示の実施例は、更に、上記方法によってトレーニングされる検索モデルを利用して対象（例えば、画像など）を検索することを含む。

以下、図面を参照しながら本開示の実施例を詳細に説明する。図１は本開示の複数の実施例を実現できる例示的な環境１００の模式図を示す。図１に示すように、例示的な環境１００はユーザクエリ情報１１０、計算機器１２０と計算機器１２０により予測される目標対象１３０を含む。

ユーザクエリ情報１１０はネットワークプラットフォームの大容量ユーザにおける１つ又は複数のユーザの入力したクエリ情報であってもよい。理解すべきことは、本明細書で記述された「ユーザクエリ情報１１０」及び「クエリ情報」はいずれもユーザにより入力されたキーワード情報又はユーザにより入力されたテキスト情報から抽出されるキーワード情報を示すことである。本開示において、キーワード情報は主にエンティティワード情報と修飾語情報を含む。幾つかの実施例において、例えば、依存構文分析モデルの意味識別モデルに基づいてユーザの入力したテキスト情報から例えば、エンティティワード情報と修飾語情報のキーワード情報を抽出することによって、ユーザクエリ情報１１０を確定してよい。

その後、計算機器１２０はその中にロードされた例えば、機械学習モデルなどの人工知能ネットワークによりユーザクエリ情報１１０に対応する目標対象１３０を確定してよい。ここで、目標対象１３０はユーザクエリ情報１１０に対応する画像、又はビデオ、ウェブページなどのネットワーク検索エンジンに基づいて検索可能な対象であってもよい。例えば、計算機器１２０は複数の候補画像からユーザクエリ情報１１０に比較的関連する１つ又は複数の目標画像を確定し、目標対象１３０としてユーザに表示してよい。

下記内容は機械学習モデルを一例として図２を参照して計算機器１２０におけるモデルのトレーニングと使用を説明する。
図２は本開示の実施例による詳細な例示的な環境２００の模式図を示す。図１に類似して、例示的な環境２００は計算機器２２０、ユーザクエリ情報２１０と目標対象２３０を含んでもよい。差異は、例示的な環境２００は全体的にモデルトレーニングシステム２６０とモデル応用システム２７０を含んでもよいことである。一例として、モデルトレーニングシステム２６０及び／又はモデル応用システム２７０は図１に示すような計算機器１２０又は図２に示すような計算機器２２０において実現することができる。理解すべきことは、例示的な目的だけで、例示的な環境２００の構造と機能を説明するが、本明細書で説明するテーマの範囲を制限するものではないことである。本明細書で説明するテーマは異なる構造及び／又は機能において実施することができる。

上記のように、ユーザクエリ情報２１０に基づいて検索される複数の候補目標対象からユーザクエリ情報２１０に比較的関連する１つ又は複数の目標対象を選択する過程は、モデルトレーニング段階とモデル応用段階という２つの段階に分けられてよい。一例として、モデルトレーニング段階において、モデルトレーニングシステム２６０はデータセット２５０を利用して確率を確定するモデル２４０をトレーニングしてよい。モデル応用段階において、モデル応用システム２７０はトレーニングされるモデル２４０を受信することで、モデル２４０がユーザクエリ情報２１０及び計算機器２２０に基づいて検索した複数の候補目標対象によりユーザクエリ情報２１０に比較的関連する目標対象２３０を確定する。理解すべきことは、トレーニングデータセット２５０はサンプルクエリ情報及びそれに関連する正、負サンプルデータセットであってもよいことである。

別の実施例において、モデル２４０は学習ネットワークとして構築されてよい。一部の実施例において、この学習ネットワークは複数のネットワークを含んでもよく、ここで、各ネットワークは大量のニューロンで構成される１つの多層ニューラルネットワークであってもよい。トレーニング過程により、各ネットワークにおけるニューロンの対応するパラメータは確定される。これらのネットワークにおけるニューロンのパラメータはモデル２４０のパラメータと総称される。

モデル２４０のトレーニング過程は反復方式で実行されてよい。具体的には、モデルトレーニングシステム２６０はトレーニングデータセット２５０からサンプルデータを取得してよく、このサンプルデータを利用してトレーニング過程を１回反復することで、モデル２４０の対応するパラメータを更新する。モデルトレーニングシステム２６０はトレーニングデータセット２５０における複数のサンプルデータに基づいて上記過程を実行してよく、モデル２４０のパラメータのうちの少なくとも一部のパラメータが収束し又は所定の反復回数に達するまで実行することで、最終のモデルパラメータを取得する。

理解すべきことは、本開示は、サンプルクエリ情報に基づいて正サンプルデータセット（例えば、サンプルクエリ情報に基づいて正サンプルデータセットとして複数の画像が検索された）確定してよいのみならず、更にこのサンプルクエリ情報に関連する付加クエリ情報に基づいて、更に付加クエリ情報に基づいて負サンプルデータセットを確定してよく、よってトレーニングデータセットを拡張することである。図２において、モデル２４０のトレーニング過程の１つの重要なポイントは、付加クエリ情報の確定は知識ベースに基づいて実現されることにある。理解すべきことは、知識ベースは例えば、知識グラフの大容量情報データベースであってもよいことである。一例として、知識ベースはインターネットにおける大容量テキスト情報又は関連機関の内部テキスト情報が知識グラフの形態で作成されてよい。下記内容は知識グラフ形態の知識ベースを詳細に説明する。

図３は本開示の一部の実施例による知識グラフ３００の模式図を示す。図３は複数のノード及びノードとの間の関係を示し且つ各ノードを接続するための複数の辺を含む。例えば、ノード３１０は特定のエンティティワード又は修飾語、例えば、「衣類」を示してよい。図３に示すように、ノード３１０の以外、知識グラフ３００は更に、ノード３２０、３２１、３２２、３３０、３３１と３３２などを含む。例えば、ノード３２０はノード３１０の１つの下位エンティティワード、例えば、「靴」を示してよく、ノード３３０はノード３２０の１つの下位エンティティワード、例えば、「ハイヒール靴」を示してよく、ノード３３１はノード３２０の他の下位エンティティワード、例えば、「フラットシューズ」を示してよい。同様に、ノード３２１はノード３１０の他の下位エンティティワード、例えば、「ズボン」を示してよく、ノード３３２はノード３２１の１つの下位エンティティワード、例えば、「スラックス」を示してよく、及びノード３２２はノード３１０の他の下位エンティティワード、例えば、「スカート」を示してよい。このようにして、知識グラフ３００は各ノードとの間の関係を説明する。

知識グラフ３００が作成された場合、計算機器１２０は知識グラフ３００からあらゆるノードに関連する上位ノード又は下位ノード、又は他の関連ノードを確定してよい。例えば、サンプルクエリ情報が「ハイヒール靴」である場合、「ハイヒール靴」に対応するノード３３０に基づいてその上位ノード３２０（すなわち、付加クエリ情報「靴」）及びノード３２０の他の下位ノード３３１（すなわち、付加クエリ情報「フラットシューズ」）を確定してよい。計算機器１２０は、確定した関連ノード及びそれに対応する付加クエリ情報に基づいて、複数の付加候補目標対象を検索し、モデル２４０をトレーニングする負サンプルデータセットとしてよい。よって、サンプルクエリ情報及び確定された正サンプルデータセット及び負サンプルデータセットに基づいてモデル２４０をトレーニングしてよい。

上記内容で説明した技術的解決手段は例示的なものに過ぎず、本発明を限定するものではない。理解すべきことは、更に他の方式と接続関係に応じて各ネットワークを設置してよいことである。上記解決手段の原理をより明確に説明するために、下記内容は図４を参照してモデル２４０をトレーニングする過程をより詳細に説明する。

図４は本開示の実施例による検索モデルをトレーニングする過程４００のフローチャートを示す。幾つかの実施例において、過程４００は図１の計算機器１２０及び図２の計算機器２２０において実現することができる。図４を参照して本開示実施例によるモデルトレーニングの過程４００を説明する。容易に理解することができるために、下記内容で記述する実施例は、いずれも例示的なものであり、本開示の特許請求の範囲を限定するためのものではない。

４０２では、計算機器２２０はサンプルクエリ情報に基づいて、検索モデルをトレーニングする第１サンプルデータセットを取得してよい。画像検索モデルのトレーニングを一例として、計算機器２２０はサンプルクエリ情報を受信した後、ネットワークには複数の画像を検索することができ、これらの画像は画像検索モデルをトレーニングする第１サンプルデータセットの一部として使用されてよい。理解すべきことは、第１サンプルデータセットは正サンプルデータセットであることである。

４０４では、計算機器２２０は予めに構築した知識ベースに基づいてサンプルクエリ情報に関連する付加クエリ情報を確定してよい。理解すべきことは、この知識ベースは知識グラフ３００又は他のデータベースであってもよいことである。知識ベースが知識グラフ３００である場合、サンプルクエリ情報に関連する付加クエリ情報を確定するために、計算機器２２０はサンプルクエリ情報におけるキーワードを取得し、知識グラフ３００からキーワードと接続関係を有する付加キーワードを確定し、更にこの付加キーワードに基づいて付加クエリ情報を確定してよい。このようにして、本開示は、知識グラフを利用して、正サンプルデータセットと異なり且つ密接に関連する負サンプルデータセットを構築することができるため、モデルトレーニングにより高品質なトレーニングデータセットを提供する。

理解すべきことは、知識グラフ３００は上記複数のノード及びノードとの間の関係を示し且つこれらのノードを接続するための複数の辺を含むことである。
幾つかの実施例において、知識グラフ３００から付加キーワードを確定するために、計算機器２２０はまずサンプルクエリ情報におけるキーワードが知識グラフ３００における対応する「キーノード」の上位ノードを確定してよい。一例として、キーワードが「ハイヒール靴」である場合、まず知識グラフ３００におけるキーワード「ハイヒール靴」のノード３３０を確定してよい。これにより、少なくともノード３３０の上位ノード３２０を確定してよい。理解すべきことは、各ノードに対応するキーワードはエンティティワードであってもよいことである。代替的又は付加的に、キーワードは更に、エンティティワードの修飾語であってもよい。その後、計算機器２２０は上記複数の辺において上位ノード３２０に接続される辺に基づいて、上位ノード３２０に関連する、ノード３３０以外の他の下位ノード３３１を取得してよい。一例として、計算機器２２０はこの上位ノード３２０の他の下位ノード３３１を確定してよい。計算機器２２０はノード３２０、３３１のうちの少なくとも１つのノードに対応するキーワードを付加キーワードとして確定してよい。よって付加クエリ情報が「靴」と「フラットシューズ」であることを確定してよい。このようにして、正サンプルデータセットに関連する負サンプルデータセットを確定することができ、この負サンプルデータセットは非常に参照価値がある。

幾つかの実施例において、予めに構築した知識グラフ３００がない場合、本開示は、サンプルクエリ情報から関連するエンティティワード、修飾語、文脈、同義語などの情報を検索することで知識グラフを構築してよい。一例として、サンプルクエリ情報に対する依存構文分析を行い、関連するエンティティワード、修飾語を得て、対応関係を付する。エンティティワード又は修飾語に対し、従来の概念スペクトルを使用してこのエンティティワード又は修飾語に対応する上下位及び同義語、反義語などを取得する。最後、上記結果に基づいて知識グラフ３００を構築する。

４０６では、計算機器２２０は付加クエリ情報に基づいて、検索モデルをトレーニングする第２サンプルデータセットを取得してよい。理解すべきことは、第２サンプルデータセットは負サンプルデータセットであることである。一例として、計算機器２２０はノード３２０、３３１のうちの少なくとも１つのノードに対応するキーワードを付加キーワードとして確定してよい。その後、例えば、付加キーワード「フラットシューズ」に基づいて複数の画像を検索でき、これらの画像は「ハイヒール靴」ではないが、ハイヒール靴に密接に関連する。このようにして、検索モデルのトレーニングに十分且つ高品質な負サンプルデータセットを提供することができる。

幾つかの実施例において、負サンプルデータセットのデータ量を更に拡張するために、知識グラフ３００からキーワードのノードに関連するより多くの他のノードを選択してよく、これらのノードに基づいて検索した画像を負サンプルデータセットに確定する。しかし、モデルのトレーニングにおいてサンプルが均衡であることを回避するために、各ノードと上記キーノードとの関連性スコアに基づいて複数の負サンプルデータセットに対する分級を行ってもよい。

一例として、計算機器２２０はキーワードと付加キーワードとの経路距離を確定してよい。ここで、経路距離はキーワードと付加キーワードとの間の辺の数である。例えば、ノード３３０とノード３２０との間の辺の数は１であるため、キーワード「ハイヒール靴」と付加キーワード「靴」の経路距離は１である。また例えば、ノード３３０とノード３３１との間の辺の数は２であるため、キーワード「ハイヒール靴」と付加キーワード「フラットシューズ」の経路距離は２である。理解すべきことは、更に経路距離が２より大きい付加キーワードが存在することである。このようにして、モデルトレーニングの開発者は経路距離に基づいて比較的関連しない負サンプルに対する取捨選択を行ってよい。

正負サンプルが不均衡であること及びモデルの学習能力が低下する問題を回避するために、計算機器２２０は各レベルの負サンプルデータに対する動的なサンプリングを行ってよく、よってモデルをトレーニングする。幾つかの実施例において、経路距離が閾値経路距離以下である場合、付加クエリ情報に基づいて負サンプルデータセットを取得してよい。好ましくは、モデル学習の前期において、各分割レベルに対し、１：１の比例に応じて各レベルの負サンプルデータを使用してサンプリング学習を行ってよく、モデル学習の中期において、関連性スコアが低い負サンプルデータセットを除去し、残された３つ又は４つのレベルの負サンプルデータを用いてサンプリング学習を行ってよく、モデル学習の後期において、関連性スコアが最も高い１つ又は２つのみのレベルの負サンプルデータを用いてサンプリング学習を行う。理解すべきことは、上記トレーニング過程において、各レベルのデータセットの選択がランダムであり、好ましくは、モデル精度の変化が１％以下になるまで、上記形態を参照して複数回にトレーニングしてよいことである。

これにより、各ノードとキーノードの関連性スコアを確定することで、優先的にはキーワード比較的に関連する付加キーワードに対応する画像を負サンプルデータセットとして選択することで、トレーニングデータセットの品質を最適化することができる。

４０８では、計算機器２２０は上記サンプルクエリ情報、負サンプルデータセットと正サンプルデータセットに基づいて検索モデルをトレーニングしてよい。一例として、本開示は、逆順対の方式を用いてトレーニング過程を最適化する。例えば、計算機器２２０はサンプルクエリ情報と正サンプルデータセットにおける正サンプルに基づいてこの正サンプルがサンプルクエリ情報にヒットする第１確率を確定し、サンプルクエリ情報と負サンプルデータセットにおける負サンプルに基づいて負サンプルがサンプルクエリ情報にヒットする第２確率を確定してよい。その後、第１確率と第２確率を比較し、第１確率が第２確率より小さい場合、すなわち、正サンプルがサンプルクエリ情報にヒットする確率は負サンプルがサンプルクエリ情報にヒットする確率より小さい場合、このモデルには大きな誤差が存在すると示し、そのため、検索モデルのパラメータを更に最適化して、第１確率と第２確率を、更新された第１確率は更新された第２確率より大きくなるまで更新する。

具体的には、損失関数を改善することでトレーニング過程を最適化してよい。例えば、交差エントロピーの形態に応じて以下の第１損失関数を定義してよい。

ここで、ｌａｂｅｌが正サンプルである場合、１であり、そうでなければ０である。ｐは予測結果が正サンプルである確率である。
また、更に以下の第２損失関数を定義することで逆順対に基づく学習を実現してよい。

ここで、Ｐ_ｐｏｓは予測結果が正サンプルである確率であり、Ｐ_ｎｅｇは予測結果が負サンプルである確率であり、ｍａｒｇｉｎは０．１としてよい。すなわち、予測結果が負サンプルである確率は予測結果が正サンプルである確率以上である場合、予測結果には誤りが存在すると考えられ、この際、第２損失関数Ｌ_{ｌｏｓｓ－２}はゼロより大きい値に与えられることによって、モデルパラメータを更に最適化する。

代替的又は付加的に、以下の第２損失関数を定義して逆順対に基づく学習を実現してよい。

ここで、Ｐ_ｐｏｓは予測結果が正サンプルである確率であり、Ｐ_ｎｅｇは予測結果が負サンプルである確率であり、τは０．１としてよく、ｖは５としてよい。
以上２つの損失関数に対する例えば加重平均演算を行うことで、最適化された目標損失関数を取得してよい。

以上の実施例により、本開示は、目標トレーニングを最適化するための損失関数を設計する。従来の損失関数に比べて、本開示の目標損失関数は正サンプルがサンプルクエリ情報にヒットする確率が閾値確率より大きいか否かを判定することを実行するのみならず、また正サンプルがサンプルクエリ情報にヒットする確率と負サンプルがサンプルクエリ情報にヒットする確率の比較を実行し、よってより細かく、正確にモデルのトレーニング過程を実現する。

図５は本開示の実施例による目標対象を検索する過程５００のフローチャートを示す。幾つかの実施例において、過程５００は図１の計算機器１２０及び図２の計算機器２２０において実現することができる。図５を参照して本開示実施例の目標対象を検索する過程５００に基づいて説明する。容易に理解することができるために、下記内容で記述する実施例は、いずれも例示的なものであり、本開示の特許請求の範囲を限定するためのものではない。

図５に示すように、５０２では、計算機器２２０は受信したユーザクエリ情報２１０に基づいて複数の候補目標対象を取得してよい。計算機器２２０はサーバ側に設置されてよく、その中にはユーザクエリ情報２１０に基づいて候補目標対象を取得する検索モジュールが構成される。また、計算機器２２０には更に、図４で説明した方法を参照してトレーニングするモデル２４０が構成される。

５０４では、計算機器２２０はモデル２４０に基づいて、それぞれ複数の候補目標対象がユーザクエリ情報２１０にヒットする確率を確定してよい。且つ５０６では、計算機器２２０は確率が閾値確率を超えた候補目標対象を目標対象２３０に確定してよい。

幾つかの実施例において、目標対象は画像、ビデオ、ウェブページ又は他のテキストに基づいて検索可能な対象であってもよい。
このようにして、モデル２４０によりユーザにより正確な検索結果を提供することで、ユーザ体験を全体的に向上させることができる。

図６は本開示の実施例による検索モデルのトレーニング装置６００のブロック図を示す。図６に示すように、装置６００は、サンプルクエリ情報に基づいて、前記検索モデルをトレーニングする第１サンプルデータセットを取得するように構成される第１サンプルデータセット取得モジュール６０２と、予めに構築した知識ベースに基づいて前記サンプルクエリ情報に関連する付加クエリ情報を確定するように構成される付加クエリ情報確定モジュール６０４と、前記付加クエリ情報に基づいて、前記検索モデルをトレーニングする、前記第１サンプルデータセットと異なる第２サンプルデータセットを取得するように構成される第２サンプルデータセット取得モジュール６０６と、前記サンプルクエリ情報、前記第１サンプルデータセットと前記第２サンプルデータセットに基づいて、前記検索モデルをトレーニングするように構成される検索モデルトレーニングモジュール６０８と、を含んでもよい。

幾つかの実施例において、前記知識ベースは知識グラフであり、前記付加クエリ情報確定モジュールは、サンプルクエリ情報におけるキーワードを取得するように構成されるキーワード取得モジュールと、知識グラフからキーワードと接続関係を有する付加キーワードを確定するように構成される付加キーワード取得モジュールと、付加キーワードに基づいて前記付加クエリ情報を確定するように構成される情報取得モジュールと、を含んでもよい。

幾つかの実施例において、前記知識グラフは複数のノード及び前記複数のノードとの間の関係を示し且つ前記複数のノードを接続するための複数の辺を含み、前記付加キーワード取得モジュールは、前記知識グラフにおけるキーワードに対応するキーノードの上位ノードを確定するように構成される上位ノード確定モジュールと、前記複数の辺において前記上位ノードに接続される辺に基づいて、前記上位ノードに関連する少なくとも１つの、前記キーノードと異なるノードを取得するように構成される付加ノード確定モジュールと、前記少なくとも１つのノードに対応するキーワードを前記付加キーワードとして確定するように構成される付加キーワード確定モジュールと、を含んでもよい。

幾つかの実施例において、前記付加クエリ情報確定モジュールは更に、前記キーワードと前記付加キーワードとの経路距離、すなわち前記キーワードと前記付加キーワードとの間の辺の数を確定するように構成される経路距離確定モジュールを含んでもよい。

幾つかの実施例において、前記第２サンプルデータセット取得モジュールは、経路距離が閾値経路距離以下であることに応答して、前記付加クエリ情報に基づいて前記第２サンプルデータセットを取得するように構成されるデータセット取得モジュールを含んでもよい。

幾つかの実施例において、前記検索モデルトレーニングモジュールは、前記サンプルクエリ情報と前記第１サンプルデータセットにおける第１サンプルに基づいて、前記第１サンプルが前記サンプルクエリ情報にヒットする第１確率を確定するように構成される第１確率確定モジュールと、前記サンプルクエリ情報と前記第２サンプルデータセットにおける第２サンプルに基づいて、前記第２サンプルが前記サンプルクエリ情報にヒットする第２確率を確定するように構成される第２確率確定モジュールと、第１確率が前記第２確率以下であることに応答して、前記検索モデルのパラメータを最適化することで前記第１確率と前記第２確率を更新し、更新された前記第１確率を更新された前記第２確率より大きくするように構成されるパラメータ最適化モジュールと、を含んでもよい。

幾つかの実施例において、前記キーワードはエンティティワード又は前記エンティティワードの修飾語である。
幾つかの実施例において、前記第１サンプルデータセットと前記第２サンプルデータセットはいずれも画像データセットである。

幾つかの実施例において、前記第１サンプルデータセットは正サンプルデータセットであり、前記第２サンプルデータセットは負サンプルデータセットである。
図７は本開示の複数の実施例を実施できる計算機器７００のブロック図を示す。装置７００は図１の計算機器１２０又は図２の計算機器２２０を実現することができる。図に示すように、装置７００は中央処理ユニット（ＣＰＵ）７０１を含み、読み出し専用メモリ（ＲＯＭ）７０２に記憶されるコンピュータプログラムコマンド又は記憶ユニット７０８からランダム・アクセス・メモリ（ＲＡＭ）７０３にロードされるコンピュータプログラムコマンドに基づいて、様々な適切な動作と処理を実行してよい。ＲＡＭ７０３において、更に装置７００を操作するために必要な様々なプログラムとデータを記憶してよい。ＣＰＵ７０１、ＲＯＭ７０２及びＲＡＭ７０３はバス７０４を介して相互に接続される。入力／出力（Ｉ／Ｏ）インターフェース７０５もバス７０４に接続される。

装置７００における複数の部品はＩ／Ｏインターフェース７０５に接続され、例えば、キーボード、マウスなどの入力ユニット７０６と、例えば、様々なタイプのディスプレイ、スピーカーなどの出力ユニット７０７と、例えば、磁気ディスク、光ディスクなどの記憶ユニット７０８と、例えば、ネットワークカード、モデム、無線通信送受信機など通信ユニット７０９と、を含む。通信ユニット７０９は、装置７００例えば、インターネットであるコンピュータネットワーク及び／又は様々な電気通信ネットワークを介して他の装置と情報／データのやり取りをすることを可能にする。

処理ユニット７０１は上記内容で説明した各方法と処理、例えば、過程４００、５００を実行する。例えば、一部の実施例において、過程４００、５００はコンピュータソフトウェアプログラムとして実現してよく、機械可読記憶媒体、例えば、記憶ユニット７０８に有形に含まれる。一部の実施例において、コンピュータプログラムの部分又は全てはＲＯＭ７０２及び／又は通信ユニット７０９を経由して装置７００にロード及び／又はインストールされてよい。コンピュータプログラムはＲＡＭ７０３にロードされてＣＰＵ７０１により実行される場合、上記内容で説明した過程４００、５００の１つ又は複数のステップを実行してよい。代替的に、別の実施例において、ＣＰＵ７０１は他のいかなる適切な方式で（例えば、ファームウェアにより）過程４００、５００を実行するように構成されてよい。

本明細書で説明した機能は１つ又は複数のハードウェア論理装置により少なくとも部分的に実行してよい。例えば、非限定的に、利用できる例示的な種類のハードウェア論理装置は、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップシステム（ＳＯＣ）、コンプレックス・プログラマブル・ロジック・デバイス（ＣＰＬＤ）などを含んでもよい。

本開示の方法を実施するプログラムコードは１つ又は複数のプログラミング言語のいかなる組み合わせで書かれてよい。これらのプログラムコードを汎用コンピュータ、特殊目的のコンピュータ又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供してよく、よってプログラムコードはプロセッサ又はコントローラにより実行されると、フローチャート及び／又はブロック図に規定の機能／操作を実施する。プログラムコードは完全に機械で実行してよく、部分的に機械で実行してよく、独立ソフトウェアパッケージとして部分的に機械で実行し且つ部分的に遠隔機械で実行してよく、又は完全に遠隔機械又はサーバで実行してよい。

本開示の文脈において、機械可読記憶媒体は有形の媒体であってもよく、コマンド実行システム、装置又は機器に使用される又はコマンド実行システム、装置又は機器に結合されて使用されるプログラムを具備又は記憶してよい。機械可読記憶媒体は機械可読信号媒体又は機械可読記憶媒体であってもよい。機械可読記憶媒体は、電子、磁気、光学、電磁、赤外線、又は半導体システム、装置又は機器、又は上記内容のいかなる適切な組み合わせを含んでもよいが、これらに限定されない。機械可読記憶媒体のより具体的な例は、１つ又は複数のリード線による電気接続、ポータブルコンピュータディスク、ハードディスク、ランダム・アクセス・メモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、消去可能なプログラマブル読み出し専用メモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバー、ポータブルコンパクトディスク読み出し専用メモリ（ＣＤ－ＲＯＭ）、光記憶装置、磁気記憶装置、又は上記内容のいかなる適切な組み合わせを含む。

更に、特定の順序を用いて各操作を示すが、理解すべきことは、示された特定の順序又は順番で実行するためにこれらの操作が求められ、又は全ての図示される操作を実行することで所望の結果を取得することである。一定の環境下で、マルチタスク及び並行処理が有利であり得る。同様に、上記説明に様々な具体的な実施例の詳細が含まれているが、本開示の範囲に対する限制ではないと理解すべきである。別々の実施例で説明されているいくつかの特徴、単一の実現において組み合わせて実現することもできる。逆で、単一の実現の文脈に説明した様々な特徴は、個別に又はいかなる適切な一部の組み合わせの方式で複数の実現において実現してよい。

構造の特徴及び／又は方法のロジックの動作に固有の言語を使用して本主題を説明したが、特許請求の範囲に限定された主題は、必ずしも前述した特定の特徴又は動作に限定されるべきではないことを理解すべきである。逆で、前述した特定の特徴又は動作、単に特許請求の範囲を実現する例示的形式に過ぎない。

Claims

検索モデルのトレーニング方法であって、
サンプルクエリ情報に基づいて、前記検索モデルをトレーニングするための第１サンプルデータセットを取得することと、
予めに構築した知識ベースに基づいて前記サンプルクエリ情報に関連する付加クエリ情報を確定することと、
前記付加クエリ情報に基づいて、前記検索モデルをトレーニングする、前記第１サンプルデータセットと異なる第２サンプルデータセットを取得することと、
前記サンプルクエリ情報、前記第１サンプルデータセットと前記第２サンプルデータセットに基づいて、前記検索モデルをトレーニングすることと、を含む、検索モデルのトレーニング方法。
前記知識ベースは知識グラフであり、前記知識ベースに基づいて前記サンプルクエリ情報に関連する前記付加クエリ情報を確定することは、
前記サンプルクエリ情報におけるキーワードを取得することと、
前記知識グラフから、前記キーワードと接続関係を有する付加キーワードを確定することと、
前記付加キーワードに基づいて前記付加クエリ情報を確定することと、を含む、請求項１に記載の方法。
前記知識グラフは複数のノード及び、前記複数のノード同士間の関係を示し且つ前記複数のノードを接続するための複数の辺を含み、前記知識グラフから前記付加キーワードを確定することは、
前記キーワードの前記知識グラフにおける対応するキーノードの上位ノードを確定することと、
前記複数の辺における前記上位ノードに接続される辺によって、前記上位ノードに関連する、前記キーノードと異なる少なくとも１つのノードを取得することと、
前記少なくとも１つのノードの対応キーワードを前記付加キーワードとして確定することと、を含む、請求項２に記載の方法。
前記知識ベースに基づいて前記サンプルクエリ情報に関連する前記付加クエリ情報を確定することは、
前記キーワードと前記付加キーワードとの経路距離を更に含み、前記経路距離は、前記キーワードと前記付加キーワードとの間の辺の数である、請求項３に記載の方法。
前記付加クエリ情報に基づいて、前記検索モデルをトレーニングするための前記第２サンプルデータセットを取得することは、
前記経路距離が閾値経路距離以下であることに応答して、前記付加クエリ情報に基づいて前記第２サンプルデータセットを取得することを含む、請求項４に記載の方法。
前記検索モデルをトレーニングすることは、
前記サンプルクエリ情報と前記第１サンプルデータセットにおける第１サンプルに基づいて、前記第１サンプルが前記サンプルクエリ情報にヒットする第１確率を確定することと、
前記サンプルクエリ情報と前記第２サンプルデータセットにおける第２サンプルに基づいて、前記第２サンプルが前記サンプルクエリ情報にヒットする第２確率を確定することと、
前記第１確率が前記第２確率以下であることに応答して、前記検索モデルのパラメータを最適化して前記第１確率と前記第２確率を更新し、更新された前記第１確率を更新された前記第２確率より大きくすることと、を含む、請求項１に記載の方法。
前記キーワードはエンティティワード又は前記エンティティワードの修飾語である、請求項１～６のいずれか一項に記載の方法。
前記第１サンプルデータセットと前記第２サンプルデータセットはいずれも画像データセットである、請求項１～６のいずれか一項に記載の方法。
前記第１サンプルデータセットは正サンプルデータセットであり、前記第２サンプルデータセットは負サンプルデータセットである、請求項１～６のいずれか一項に記載の方法。
目標対象を検索するための方法であって、
受信したユーザクエリ情報に基づいて複数の候補目標対象を取得することと、
請求項１～９のいずれか一項に記載の方法によってトレーニングされる前記検索モデルに基づいて、前記複数の候補目標対象が前記ユーザクエリ情報にヒットする確率をそれぞれ確定することと、
確率が閾値確率を超えた候補目標対象を前記目標対象に確定することと、を含む、目標対象の検索方法。
前記目標対象は画像である、請求項１０に記載の方法。
検索モデルをトレーニングする装置であって、
サンプルクエリ情報に基づいて、前記検索モデルをトレーニングするための第１サンプルデータセットを取得するように構成される第１サンプルデータセット取得モジュールと、
予めに構築した知識ベースに基づいて前記サンプルクエリ情報に関連する付加クエリ情報を確定するように構成される付加クエリ情報確定モジュールと、
前記付加クエリ情報に基づいて、前記検索モデルをトレーニングするための、前記第１サンプルデータセットと異なる第２サンプルデータセットを取得するように構成される第２サンプルデータセット取得モジュールと、
前記サンプルクエリ情報、前記第１サンプルデータセットと前記第２サンプルデータセットに基づいて、前記検索モデルをトレーニングするように構成される検索モデルトレーニングモジュールと、を含む、検索モデルをトレーニングする装置。
前記知識ベースは知識グラフであり、前記付加クエリ情報確定モジュールは、
前記サンプルクエリ情報におけるキーワードを取得するように構成されるキーワード取得モジュールと、
前記知識グラフから、前記キーワードと接続関係を有する付加キーワードを確定するように構成される付加キーワード取得モジュールと、
前記付加キーワードに基づいて前記付加クエリ情報を確定するように構成される情報取得モジュールと、を含む、請求項１２に記載の装置。
前記知識グラフは複数のノード及び、前記複数のノード同士間の関係を示し且つ前記複数のノードを接続するための複数の辺を含み、前記付加キーワード取得モジュールは、
前記キーワードの前記知識グラフにおける対応するキーノードの上位ノードを確定するように構成される上位ノード確定モジュールと、
前記複数の辺における前記上位ノードに接続される辺に基づいて、前記上位ノードに関連する、前記キーノードと異なる少なくとも１つのノードを取得するように構成される付加ノード確定モジュールと、
前記少なくとも１つのノードの対応キーワードを前記付加キーワードとして確定するように構成される付加キーワード確定モジュールと、を含む、請求項１３に記載の装置。
前記付加クエリ情報確定モジュールは、
前記キーワードと前記付加キーワードとの経路距離を確定するように配置される経路距離確定モジュールを更に含み、前記経路距離は、前記キーワードと前記付加キーワードとの間の辺の数である、請求項１４に記載の装置。
前記第２サンプルデータセット取得モジュールは、
前記経路距離が閾値経路距離以下であることに応答して、前記付加クエリ情報に基づいて前記第２サンプルデータセットを取得するように構成されるデータセット取得モジュールを含む、請求項１５に記載の装置。
前記検索モデルトレーニングモジュールは、
前記サンプルクエリ情報と前記第１サンプルデータセットにおける第１サンプルに基づいて、前記第１サンプルが前記サンプルクエリ情報にヒットする第１確率を確定するように構成される第１確率確定モジュールと、
前記サンプルクエリ情報と前記第２サンプルデータセットにおける第２サンプルに基づいて、前記第２サンプルが前記サンプルクエリ情報にヒットする第２確率を確定するように構成される第２確率確定モジュールと、
前記第１確率が前記第２確率以下であることに応答して、前記検索モデルのパラメータを最適化して前記第１確率と前記第２確率を更新し、更新された前記第１確率を更新された前記第２確率より大きくするように構成されるパラメータ最適化モジュールと、を含む、請求項１２に記載の装置。
前記キーワードはエンティティワード又は前記エンティティワードの修飾語である、請求項１２～１７のいずれか一項に記載の装置。
前記第１サンプルデータセットと前記第２サンプルデータセットはいずれも画像データセットである、請求項１２～１７のいずれか一項に記載の装置。
前記第１サンプルデータセットは正サンプルデータセットであり、前記第２サンプルデータセットは負サンプルデータセットである、請求項１２～１７のいずれか一項に記載の装置。
目標対象を検索するための装置であって、
受信したユーザクエリ情報に基づいて複数の候補目標対象を取得するように構成される候補目標対象取得モジュールと、
請求項１２～２０のいずれか一項に記載の装置によってトレーニングされる前記検索モデルに基づいて、前記複数の候補目標対象が前記ユーザクエリ情報にヒットする確率をそれぞれ確定するように構成される確率確定モジュールと、
確率が閾値確率を超えた候補目標対象を前記目標対象に確定するように構成される目標対象確定モジュールと、を含む、目標対象を検索するための装置。
前記目標対象は画像である、請求項２１に記載の装置。
電子機器であって、
１つ又は複数のプロセッサと、
前記１つ又は複数のプロセッサによって実行されると、前記１つ又は複数のプロセッサに請求項１～９のいずれか一項に記載の方法を実現させる１つ又は複数のプログラムを記憶するための記憶装置と、を含む、電子機器。
コンピュータ可読記憶媒体であって、プロセッサによって実行されると、請求項１～９のいずれか一項に記載の方法を実現するコンピュータプログラムが記憶されたコンピュータ可読記憶媒体。
コンピュータプログラムコマンドを含むコンピュータプログラム製品であって、前記コンピュータプログラムコマンドはプロセッサによって実行されると、請求項１～９のいずれか一項に記載の方法を実現する、コンピュータプログラム製品。