JP6745384B2

JP6745384B2 - 情報をプッシュするための方法及び装置

Info

Publication number: JP6745384B2
Application number: JP2019105063A
Authority: JP
Inventors: ヂャン，フェン
Original assignee: バイドゥオンラインネットワークテクノロジー（ベイジン）カンパニーリミテッド
Priority date: 2018-08-06
Filing date: 2019-06-05
Publication date: 2020-08-26
Anticipated expiration: 2039-06-05
Also published as: JP2020024674A; CN109165344A; US11172040B2; US20200045122A1

Description

本発明の実施例は、コンピュータ技術の分野に関し、具体的に情報をプッシュするための方法及び装置に関する。

ユーザは検索により大量の知識を取得できるが、選択に困ることがある。ユーザは多くのウェブページを閲覧した後、前に閲覧したウェブページの内容を忘れてしまったことに気づく場合があり、再閲覧したい場合、前に閲覧したウェブページをクリックしてもう一度読む必要がある。

従来の検索プロセスは、通常、次のステップを含む。まずは、ユーザが検索語を入力して検索要求を発送する。次に、検索語に関連するウェブページのトピックを表示する。次に、ユーザによってウェブページのトピックがクリックされると、ユーザがウェブページの内容を閲覧するためにウェブページを表示するようにジャンプさせる。最後にユーザはウェブページを閲覧した後、ウェブページを閉じる。ユーザが以前に閲覧したウェブページの内容を再閲覧したい場合、通常、履歴閲覧記録内のウェブページのトピックをクリックするか、または検索語を再入力して検索を行い、表示されるウェブページのトピックをクリックして、ウェブページを表示するようにジャンプさせる必要がある。

本発明の実施例は、情報をプッシュするための方法及び装置を提供する。

第１態様では、本発明の実施例は、ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得することと、ウェブページコンテンツを少なくとも１つのウェブページコンテンツセグメントに分割して、少なくとも１つのウェブページコンテンツセグメントのトピックを抽出することと、少なくとも１つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュすることとを含む情報をプッシュするための方法を提供する。

いくつかの実施例では、少なくとも１つのウェブページコンテンツセグメントのトピックを抽出することは、少なくとも１つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントを事前訓練されたドキュメントトピック生成モデルに入力して、該ウェブページコンテンツセグメントのトピックを取得することを含む。

いくつかの実施例では、少なくとも１つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュすることは、少なくとも１つのウェブページコンテンツセグメントのトピックをユーザにプッシュすることを含む。

いくつかの実施例では、少なくとも１つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュすることは、少なくとも１つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントのテキストと該ウェブページコンテンツセグメントのトピックとをマッチングさせて、トピックに一致したテキストを取得し、トピックに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成することと、テキスト効果が設けられたウェブページをユーザにプッシュすることとを含む。

いくつかの実施例では、少なくとも１つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュすることは、少なくとも１つのウェブページコンテンツセグメントのトピックに対して単語分割を実行し、単語分割結果に基づいてウェブページコンテンツに対応する単語ベクトルを生成することと、ウェブページコンテンツに対応する単語ベクトルを、検索意図を予測するための事前訓練された意図予測モデルに入力して、ウェブページコンテンツに対応する検索意図を得ることと、ユーザのユーザ画像から関心タグ集合を抽出することと、ウェブページコンテンツに対応する検索意図を関心タグ集合内でマッチングさせて、検索意図に一致した関心タグを取得することと、ウェブページコンテンツ内のテキストと検索意図に一致した関心タグとをマッチングさせて、関心タグに一致したテキストを取得し、一致したテキストに事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成することと、テキスト効果が設けられたウェブページをユーザにプッシュすることとを含む。

いくつかの実施例では、意図予測モデルは、サンプル検索データと、サンプル検索データに対応するサンプル検索意図とを含む訓練サンプル集合を取得するステップと、訓練サンプル集合に基づいて、多層ニューラルネットワークを訓練して意図予測モデルを取得するステップと、によって訓練される。

第２態様では、本発明の実施例は、ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得するように構成される取得ユニットと、ウェブページコンテンツを少なくとも１つのウェブページコンテンツセグメントに分割して、少なくとも１つのウェブページコンテンツセグメントのトピックを抽出するように構成される抽出ユニットと、少なくとも１つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュするように構成されるプッシュユニットと、を備える情報をプッシュするための装置を提供する。

いくつかの実施例では、抽出ユニットは、更に少なくとも１つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントを事前訓練されたドキュメントトピック生成モデルに入力して、該ウェブページコンテンツセグメントのトピックを取得するように構成される。

いくつかの実施例では、プッシュユニットは、少なくとも１つのウェブページコンテンツセグメントのトピックをユーザにプッシュするように構成される第１プッシュサブユニットを備える。

いくつかの実施例では、プッシュユニットは、少なくとも１つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントのテキストと該ウェブページコンテンツセグメントのトピックとをマッチングさせて、トピックに一致したテキストを取得し、トピックに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成するように構成される第１生成サブユニットと、テキスト効果が設けられたウェブページをユーザにプッシュするように構成される第２プッシュサブユニットと、を備える。

いくつかの実施例では、プッシュユニットは、少なくとも１つのウェブページコンテンツセグメントのトピックに対して単語分割を実行し、単語分割結果に基づいてウェブページコンテンツに対応する単語ベクトルを生成するように構成される単語分割サブユニットと、ウェブページコンテンツに対応する単語ベクトルを、検索意図を予測するための事前訓練された意図予測モデルに入力して、ウェブページコンテンツに対応する検索意図を得るように構成される予測サブユニットと、ユーザのユーザ画像から関心タグ集合を抽出するように構成される抽出サブユニットと、ウェブページコンテンツに対応する検索意図を関心タグ集合内でマッチングさせて、検索意図に一致した関心タグを取得するように構成されるマッチングサブユニットと、ウェブページコンテンツのテキストと検索意図に一致した関心タグとをマッチングさせて、関心タグに一致したテキストを取得し、関心タグに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成するように構成される第２生成サブユニットと、テキスト効果が設けられたウェブページをユーザにプッシュするように構成される第３プッシュサブユニットと、を備える。

第３態様では、本発明の実施例は、１つまたは複数のプロセッサと、１つまたは複数のプログラムが記憶される記憶装置と、を備え、１つまたは複数のプログラムが１つまたは複数のプロセッサによって実行されると、１つまたは複数のプロセッサに第１の態様のいずれかの実現形態に記載の方法を実現させるサーバを提供する。

第４態様では、本発明の実施例は、コンピュータプログラムが記憶されるコンピュータ可読媒体であって、該コンピュータプログラムがプロセッサによって実行されると、第１の態様のいずれかの実現形態に記載の方法を実現するコンピュータ可読媒体を提供する。

本発明の実施例により提供された情報をプッシュするための方法および装置は、ユーザが履歴検索データを選択するときに、履歴検索データに対応するウェブページコンテンツを取得し、次にウェブページコンテンツを少なくとも１つのウェブページコンテンツセグメントに分割して、少なくとも１つのウェブページコンテンツセグメントのトピックを抽出し、最後に少なくとも１つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュする。ユーザがウェブページを再び閲覧するときにウェブページのコア情報をユーザに迅速にプッシュすることが実現された。

本発明の他の特徴、目的及び利点は、以下の図面を参照してなされる非限定的な実施例に係る詳細な説明を読むことにより、より明らかになる。

本発明を適用可能な例示的なシステムアーキテクチャである。本発明に係る情報をプッシュするための方法の一実施例を示すフローチャートである。履歴検索データ集合の概略図である。本発明に係る情報をプッシュするための方法のもう一つの実施例を示すフローチャートである。本発明に係る情報をプッシュするための方法のさらなる一つの実施例を示すフローチャートである。本発明に係る情報をプッシュするための装置の一実施例を示す構造概略図である。本発明の実施例を実現するためのサーバに適用されるコンピュータシステムを示す構造概略図である。

以下、図面及び実施例を参照しながら本発明をより詳細に説明する。ここで説明する具体的な実施例は、関連する発明を説明するためのものに過ぎず、当該発明を限定するものではないことが理解されるべきである。なお、説明の便宜上、図面には発明に関連する部分のみが示されている。

なお、本発明の実施例及び実施例における特徴は、矛盾を生じない限り、相互に組み合わせることができる。以下、図面及び実施例を参照しながら本発明を詳細に説明する。

図１は、本発明に係る情報をプッシュするための方法または情報をプッシュするための装置の実施例が適用可能な例示的なシステムアーキテクチャ１００を示している。

図１に示すように、システムアーキテクチャ１００は、端末装置１０１、１０２、１０３、ネットワーク１０４、及びサーバ１０５を含んでもよい。ネットワーク１０４は、端末装置１０１、１０２、１０３とサーバ１０５の間で通信リンクの媒体を提供するために使用される。ネットワーク１０２は、有線、無線通信リンクまたは光ファイバケーブルなどの様々なタイプの接続を含んでもよい。

ユーザは、メッセージを送受信するために、端末装置１０１、１０２、１０３を使用してネットワーク１０４を介してサーバ１０５と情報のやり取りをすることができる。端末装置１０１、１０２、１０３には、ウェブブラウザアプリケーションなどの様々なクライアントアプリケーションをインストールすることができる。

端末装置１０１、１０２、１０３は、ハードウェアでもソフトウェアでもよい。端末装置１０１、１０２、１０３がハードウェアである場合、表示画面を有するとともにウェブ閲覧をサポートする様々な電子機器とすることができる。スマートフォン、タブレットコンピュータ、ラップトップコンピュータ及びデスクトップコンピュータなどを含むが、これらに限定されない。端末装置１０１、１０２、１０３がソフトウェアである場合、上記の電子機器にインストールされてもよい。それは、複数のソフトウェア若しくはソフトウェアモジュールとして実現されてもよく、または単一のソフトウェア若しくはソフトウェアモジュールとして実現されてもよい。ここでは特に限定されない。

サーバ１０５は、様々なサービスを提供することができ、例えば、端末装置１０１、１０２、１０３から取得した履歴検索データなどのデータを解析するなどの処理を行い、処理結果（例えば、プッシュ情報）を端末装置１０１、１０２、１０３にフィードバックしてもよい。

なお、サーバ１０５は、ハードウェアでもソフトウェアでもよい。サーバ１０５がハードウェアである場合、複数のサーバから構成される分散サーバクラスターとしても、単一のサーバとしても実現可能である。サーバ１０５がソフトウェアである場合、複数のソフトウェア若しくはソフトウェアモジュール（例えば、分散サービスを提供するためのもの）として実現されてもよく、または単一のソフトウェア若しくはソフトウェアモジュールとして実現されてもよい。ここでは特に限定されない。

なお、本発明の実施例に係る情報をプッシュするための方法は、通常、サーバ１０５によって実行され、これに応じて、情報をプッシュするための装置は、通常、サーバ１０５に設けられている。

図１における端末装置、ネットワーク及びサーバの数は例示的なものに過ぎないことが理解されるべきである。必要に応じて、端末装置、ネットワーク及びサーバの数を任意に加減してもよい。

次に、本発明に係る情報をプッシュするための方法の一実施例のフローチャート２００を示す図２を参照する。該情報をプッシュするための方法は、次のステップを含む。

ステップ２０１：ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得する。

本実施例では、ユーザによって履歴検索データが選択されると、情報をプッシュするための方法の実行主体（例えば、図１に示すサーバ１０５）は、履歴検索データに対応するウェブページの内容を取得することができる。ここで、履歴検索データは、ユーザによって以前に入力された検索語と、ユーザが以前に閲覧したウェブページのトピックとを含んでもよい。

実際には、ユーザがウェブページを閲覧する必要があるとき、端末装置（例えば、図１に示す端末装置１０１、１０２、１０３）にインストールされたウェブブラウザアプリケーションを開いて、ウェブブラウザアプリケーションの検索窓に検索語を入力することができる。続いて、ユーザは、ウェブブラウザアプリケーションの検索ボタンをクリックして、上記の実行主体に対して検索要求を発送する。前記実行主体が検索要求を受信すると、ユーザによって入力された検索語を用いて検索エンジンから検索し、検索語に関連付けられるウェブページ集合を取得し、検索語に関連付けられたウェブページ集合に対応するトピック集合をユーザに送信して、ユーザの端末装置に表示させることができる。ユーザがトピック集合内のトピックをクリックすると、閲覧要求を前記実行主体に対して発送することができる。前記の実行主体が閲覧要求を受信すると、検索語に関連付けられたウェブページ集合からユーザによってクリックされたトピックに対応するウェブページを取得し、閲覧のためにユーザに送信することができる。したがって、検索プロセスにおいて、前記実行主体は、ユーザによって入力された検索語だけでなく、ユーザが閲覧したウェブページのトピックも取得することができる。このようにして、前記実行主体は、所定の期間内（例えば、直前の１時間以内）にユーザによって入力された検索語と閲覧したウェブページのトピックとに基づいて、履歴検索データ集合を作成することができる。ここで、履歴検索データ集合内の１つの履歴検索データは、ユーザによって入力された１つの検索語およびユーザが閲覧した１つのウェブページを含んでもよい。

一例として、ユーザが直前の１時間内にウェブブラウザアプリケーションに検索語である「ベビーベッドのおすすめ人気ブランド」を入力したことがあり、「ベビーベッドの人気ブランドランキング１０選」および「ベビーベッドのおすすめ人気ブランド」というトピックに関するウェブページを閲覧し、そして、検索語である「＊＊＊ブランドのベビーベッドの評判はどうですか」を入力し、「＊＊＊ブランドのベビーベッドの評判」および「＊＊＊ブランドのベビーベッドの価格」というトピックのウェブページを閲覧した場合、前記実行主体は履歴検索データ集合を収集し、具体的に図３に示す。「最近のフォロー」ボタンをウェブブラウザアプリケーションに設定することができ、ユーザがこれらのページを再び閲覧する必要があるとき、「最近のフォロー」ボタンをクリックすることができる。このとき、前記実行主体は、履歴検索データ集合をユーザの端末装置に送信して表示させることが可能である。ここで、履歴検索データ集合内のウェブページのトピックは、ウェブページのホームページアドレス（ＵＲＬ）に関連付けられることができる。ユーザが履歴検索データ集合内の特定のウェブページのトピックを直接クリックすると、ユーザが該ウェブページの内容を再閲覧するためにそのウェブページを表示するように直接ジャンプすることができる。履歴検索データ集合内の各ウェブページのトピック近く（例えば、ウェブページのトピックの後ろ）に「コントラストに追加」ボタンを設定することができ、ユーザがあるウェブページのトピック近くにある「コントラストに追加」ボタンをクリックすると、該ウェブページのトピックが選択される。履歴検索データ集合の近く（例えば、履歴検索データ集合の後ろ）に「コントラスト開始」ボタンを設定することができる。ユーザが「コントラスト開始」ボタンをクリックすると、ユーザの選択したウェブページのトピックを前記実行主体に送信することができる。例えば、ユーザは、「ベビーベッドの人気ブランドランキング１０選」および「＊＊＊ブランドのベビーベッドの評判はどうですか」というトピックの近くにある「コントラストに追加」ボタンをクリックし、「コントラスト開始」ボタンをクリックした。このとき、前記実行主体は、「ベビーベッドの人気ランキング１０選」および「＊＊＊ブランドのベビーベッドの評判はどうですか」というトピックに従って、対応するウェブページを検索し、ウェブページのコンテンツを取得することができる。

ステップ２０２：ウェブページコンテンツを少なくとも１つのウェブページコンテンツセグメントに分割して、少なくとも１つのウェブページコンテンツセグメントのトピックを抽出する。

本実施例では、前記実行主体は、ウェブページコンテンツを少なくとも１つのウェブページコンテンツセグメントに分割することができる。少なくとも１つのウェブページコンテンツセグメントのそれぞれについて、前記実行主体は該ウェブページコンテンツセグメントのトピックを抽出することができる。例えば、ウェブページコンテンツがＮ（Ｎは正の整数）の段落を含む場合、前記実行主体はウェブページコンテンツをＮ個のウェブページコンテンツセグメントに分割することができる。ここで、１つのウェブページコンテンツセグメントは、ウェブページコンテンツの１つの段落に対応する。別の例では、前記実行主体は、ウェブページコンテンツを複数のウェブページコンテンツセグメントにランダムに分割することができる。ここで、分割されたウェブページコンテンツセグメントの数は、デフォルト設定の数でもよいし、ユーザが所望により自律的に設定した数でもよい。

本実施例のいくつかの所望による実施態様において、少なくとも１つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、前記実行主体は、該ウェブページコンテンツセグメントを事前訓練されたドキュメントトピック生成モデルに入力して、該ウェブページコンテンツセグメントのトピックを取得することができる。その中で、ドキュメントトピック生成モデルは、ドキュメントトピックの確率分布を生成するために使用することができる。具体的には、少なくとも１つのウェブページコンテンツセグメントのそれぞれについて、前記実行主体は、該ウェブページコンテンツセグメントをドキュメントトピック生成モデルに入力し、該ウェブページコンテンツセグメントの一部のトピックの確率分布を出力し、該ウェブページコンテンツセグメントの一部のトピックの確率分布に基づいて、該ウェブページコンテンツセグメントのトピックを取得することができる。ここで、ウェブページコンテンツセグメントのトピックの数は、ゼロ以上の整数であってもよく、すなわち、ウェブページコンテンツセグメントは、トピックを有さなくてもよく、トピックを１つだけ有してもよく、複数のトピックを有してもよい。

一例として、ドキュメントトピック生成モデルは、ＬＤＡ（ＬａｔｅｎｔＤｉｒｉｃｈｌｅｔＡｌｌｏｃａｔｉｏｎ）であってもよい。その中でも、ＬＤＡは、単語、トピック、およびドキュメントの３層構造を含む３層ベイズ確率モデルともいう。ＬＤＡは、大規模なドキュメントコレクション（ｄｏｃｕｍｅｎｔｃｏｌｌｅｃｔｉｏｎ）またはコーパス（ｃｏｒｐｕｓ）内の隠れたトピックを識別するために使用できる、無監督の機械学習技術である。これは、各ドキュメントを単語頻度ベクトルとして扱い、テキスト情報をモデル化が容易なデジタル情報に変換する単語の袋（ＢａｇｏｆＷｏｒｄｓ）の方法を使用している。各ドキュメントはいくつかのトピックからなる確率分布を表し、各トピックは多数の単語からなる確率分布を表す。

ステップ２０３：少なくとも１つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュする。

本実施例では、前記実行主体は、少なくとも１つのウェブページコンテンツセグメントのトピックに基づいて情報をユーザにプッシュすることができる。例えば、前記実行主体は、少なくとも１つのウェブページコンテンツセグメントのトピックをユーザにプッシュすることができる。別の例では、前記実行主体は、少なくとも１つのウェブページコンテンツセグメントのトピックに基づいてウェブページコンテンツを編集し、新しいウェブページを生成してユーザにプッシュすることができる。

なお、ユーザが複数のウェブページを再閲覧する必要がある場合、複数の履歴検索データを選択することができ、複数の履歴検索データのそれぞれに対して、ステップ２０１〜２０３を実行する。これにより、ユーザは、複数の履歴検索データに対応する複数のプッシュ情報を受信することができる。このようにして、ユーザは、複数のプッシュ情報に従って複数のウェブページのコアコンテンツを比較することができる。

本発明の実施例により提供された情報をプッシュするための方法は、ユーザが履歴検索データを選択するときに、履歴検索データに対応するウェブページコンテンツを取得し、次にウェブページコンテンツを少なくとも１つのウェブページコンテンツセグメントに分割して、少なくとも１つのウェブページコンテンツセグメントのトピックを抽出し、最後に少なくとも１つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュする。ユーザが履歴ウェブページを再閲覧するとき、ウェブページのコア情報をユーザに迅速にプッシュすることが実現される。

さらに、本発明に係る情報をプッシュするための方法のもう一つの実施例のフロー４００が示される図４を参照する。この情報をプッシュするための方法は、次のステップを含む。

ステップ４０１：ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得する。

ステップ４０２：ウェブページコンテンツを少なくとも１つのウェブページコンテンツセグメントに分割して、少なくとも１つのウェブページコンテンツセグメントのトピックを抽出する。

本実施例では、ステップ４０１〜４０２の具体的な操作は、図２に示す実施例のステップ２０１〜２０２の操作と実質的に同じであり、ここではこれ以上くどくど述べない。

ステップ４０３：少なくとも１つのウェブページコンテンツセグメントのトピックをユーザにプッシュする。

本実施例では、情報をプッシュするための方法の実行主体（例えば、図１に示すサーバ１０５）は、ユーザの端末装置（例えば、図１に示す端末装置１０１、１０２、１０３）で表示するために、少なくとも１つのウェブページコンテンツセグメントのトピックをユーザにプッシュすることができる。

ステップ４０４：少なくとも１つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントのテキストと該ウェブページコンテンツセグメントのトピックとをマッチングさせて、トピックに一致したテキストを取得する。

本実施例では、少なくとも１つのウェブページコンテンツセグメントのそれぞれについて、前記実行主体は、該ウェブページコンテンツセグメントのテキストを該ウェブページコンテンツセグメントのトピックとマッチングさせて、一致したテキストを取得することができる。一例として、前記実行主体は、該ウェブページコンテンツセグメント内の各語句と該ウェブページコンテンツセグメントのトピックとの類似度を計算することができ、類似度が予め設定された類似度閾値よりも大きい場合、該語句のテキストを一致したテキストとして使用する。ここで、該ウェブページコンテンツセグメント内の各語句について、前記実行主体は、該語句に対して単語分割を実行して該語句のキーワード集合を生成することができる。同様に、前記実行主体は、該ウェブページコンテンツセグメントのトピックに対して単語分割を実行して、該ウェブページコンテンツセグメントのトピックのキーワード集合を生成することができる。その後、前記実行主体は、該語句のキーワード集合と、該ウェブページコンテンツセグメントのトピックのキーワード集合との類似度を計算することができる。例えば、該語句のキーワード集合と該ウェブページコンテンツセグメントのトピックのキーワード集合における同じキーワードの数と、該語句のキーワード集合におけるキーワードの数との比を、該語句と該ウェブページコンテンツセグメントのトピックとの類似度とすることができる。

ステップ４０５：トピックに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成する。

本実施例において、前記実行主体は、トピックに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成することができる。ここで、トピックに一致したテキストに対してテキスト効果を設けると、一致したテキストと一致していないテキストを区別可能であり、それによってユーザはウェブページを閲覧するときに一致したテキストを迅速に取得できる。たとえば、一致したテキストの色を黄色に設定することにより、ユーザがテキスト効果の設けられたウェブページを閲覧するときに、黄色に設定されたテキストに最初に気付くことができる。

ステップ４０６：テキスト効果が設けられたウェブページをユーザにプッシュする。

本実施例において、前記実行主体は、テキスト効果が設けられたウェブページをユーザにプッシュする。通常、端末装置には、先ずは少なくとも１つのウェブページコンテンツセグメントのトピックを表示することがある。ユーザがウェブページコンテンツセグメントのトピックをクリックすると、テキスト効果の設けられたウェブページ内の該ウェブページコンテンツセグメントを表示することができる。ここで、表示された該ウェブページコンテンツセグメントにおいて該ウェブページコンテンツセグメントのトピックに一致するテキストに対してテキスト効果を設定すると、ユーザは、該ウェブページコンテンツセグメントを閲覧した次第にテキスト効果の設定されたテキストに気付くことができる。

図４から分かるように、図２の対応する実施例と比較して、本実施例における情報をプッシュするための方法のフロー４００では、ユーザに情報をプッシュするステップが強調された。したがって、本実施例で説明された技術案は、プッシュ情報を階層的に表現する。先ずは、少なくとも１つのウェブページコンテンツセグメントのトピックが表示される。ユーザがウェブページコンテンツセグメントのトピックをクリックすると、テキスト効果の設定されたウェブページ内の該ウェブページコンテンツセグメントを表示される。表示された該ウェブページコンテンツセグメントにおいて該ウェブページコンテンツセグメントのトピックに一致するテキストに対してテキスト効果を設定することで、ユーザは、該ウェブページコンテンツセグメントを再閲覧する次第にテキスト効果の設定されたテキストに気付くことができる。ユーザはウェブページのコア情報を迅速に取得できるだけでなく、ウェブページのコア情報をより全面的に取得することも可能である。

さらに、本発明に係る情報をプッシュするための方法のさらなる別の実施例のフロー５００が示される図５を参照する。この情報をプッシュするための方法は、次のステップを含む。

ステップ５０１：ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得する。

ステップ５０２：ウェブページコンテンツを少なくとも１つのウェブページコンテンツセグメントに分割して、少なくとも１つのウェブページコンテンツセグメントのトピックを抽出する。

本実施例では、ステップ５０１〜５０２の具体的な操作は、図２に示す実施例のステップ２０１〜２０２の操作と実質的に同じであり、ここではこれ以上くどくど述べない。

ステップ５０３：少なくとも１つのウェブページコンテンツセグメントのトピックに対して単語分割を実行し、単語分割結果に基づいてウェブページコンテンツに対応する単語ベクトルを生成する。

本実施例では、少なくとも１つのウェブページコンテンツセグメントのそれぞれについて、情報をプッシュするための方法の実行主体（例えば、図１に示すサーバ１０５）は、先ず、該ウェブページコンテンツセグメントのトピックを単語分割して、該ウェブページコンテンツセグメントのトピックのキーワード集合を取得し、次に該ウェブページコンテンツセグメントのトピックのキーワード集合に基づいて単語ベクトルの一次元を生成する。したがって、ウェブページコンテンツに対応する単語ベクトルの次元は、ウェブページコンテンツが分割されるウェブページコンテンツセグメントの数と同じである。

ステップ５０４：ウェブページコンテンツに対応する単語ベクトルを、事前訓練された意図予測モデルに入力して、ウェブページコンテンツに対応する検索意図を得る。

本実施例において、前記実行主体は、ウェブページコンテンツに対応する単語ベクトルを、事前訓練された意図予測モデルに入力して、ウェブページコンテンツに対応する検索意図を出力する。ここで、意図予測モデルは、検索意図を予測し、単語ベクトルと検索意図との間の対応関係を特徴付けるために使用することができる。ただし、検索意図は、ユーザの検索動機、すなわち、ユーザが検索を開始するときに実質的に取得したい情報を表現するために使用することができる。

本実施例のいくつかの所望による実施態様では、意図予測モデルは、多数の単語ベクトルおよび対応する検索意図に対して当業者によって統計解析が実行されることで取得された複数の単語ベクトルおよび対応する検索意図が格納された対応関係テーブルであってもよい。このとき、前記実行主体は、ウェブページコンテンツに対応する単語ベクトルと対応関係テーブルにおける各単語ベクトルとの類似度を算出し、類似度算出結果に基づいて該対応関係テーブルからウェブページコンテンツに対応する検索意図を取得することが可能である。例えば、先ずは、ウェブページコンテンツに対応する単語ベクトルの類似度が最も高い単語ベクトルを特定し、次に該対応関係テーブルからウェブページコンテンツに対応する単語ベクトルの類似度が最も高い単語ベクトルに対応する検索意図を検索し、該ウェブページコンテンツに対応する検索意図とする。

本実施例のいくつかの所望による実施態様では、意図予測モデルは、様々な機械学習方法および訓練サンプルを使用して従来の機械学習モデル（たとえば、様々な人工ニューラルネットワークなど）に対して教師付き訓練を行うことによって取得されるものであってもよい。ここで、対象検出モデルはＭＬＰ（Ｍｕｌｔｉ−ＬａｙｅｒＰｅｒｃｅｐｔｒｏｎ，多層パーセプトロン）であってもよく、以下のステップによって訓練されてなる。

先ず、訓練サンプル集合を取得する。

ここで、訓練サンプルは、サンプル検索データおよびサンプル検索データに対応するサンプル検索意図を含んでもよい。サンプル検索データは、サンプル検索語およびサンプルウェブページのトピックを含んでもよい。ここで、当業者は、サンプル検索データを解析することで、サンプル検索データに対応するサンプル検索意図を得ることができる。例えば、当業者は、多数のサンプル検索語を入力してサンプルウェブページを閲覧するユーザに対してアンケート調査を実施してこれらのユーザの検索意図を得ることができる。次いで、これらのユーザの検索意図を要約してサンプル検索意図を取得する。

次いで、訓練サンプル集合に基づいて、多層ニューラルネットワークを訓練して意図予測モデルを取得する。

ここで、訓練サンプル集合内の訓練サンプルについて、前記実行主体は、先ずは該訓練サンプル内のサンプル検索データに対して単語分割を実行し、単語分割結果に基づいて該サンプル検索データに対応する単語ベクトルを生成し、次いで該サンプル検索データに対応する単語ベクトルを入力として、サンプル検索データに対応するサンプル検索意図を出力として、多層ニューラルネットワークを訓練して意図予測モデルを取得することができる。ただし、多層ニューラルネットワークは、訓練されていないまたは訓練が完了していない多層ニューラルネットワークであってもよい。ここで、訓練されていない多層ニューラルネットワークに対して、その様々なパラメータ（例えば、ウェイトパラメータおよびオフセットパラメータ）は、いくつかの異なる小さな乱数で初期化される。「小さな乱数」を使用することにより、ネットワークが過大なウェイトにより飽和状態になることで訓練が失敗してしまうことを防止でき、「異なる」乱数の使用により、ネットワークが正常に学習できることが確保される。訓練が完了していない多層ニューラルネットワークの場合、各パラメータは調整されたパラメータであってもよく、該多層ニューラルネットワークの予測効果は一般に予め設定された制約要件を満たさない。

ステップ５０５：ユーザのユーザ画像から関心タグ集合を抽出する。

本実施例において、前記実行主体は、ユーザのユーザ画像から関心タグの少なくとも一部を抽出して関心タグ集合を生成することができる。例えば、前記実行主体は、ウェイトの大きいものから小さいものへと、ユーザのユーザ画像中の関心タグを順序付け、前の順位に位置する（例えばトップ１０）の関心タグを選択して関心タグ集合を生成することができる。

実際には、ユーザ画像は、事前に蓄積されたユーザデータに基づいて確立された少なくとも１種の記述タグを含むユーザ情報であってもよい。記述タグは、ユーザの性別、年齢、婚姻状況、職業、収入状況、学歴、興味などを記述するために使用することができる。ここで、ユーザの興味を記述するための記述タグは関心タグである。異なる関心タグには異なるウェイトを設定可能であり、一般的に、特定のものに対するユーザの関心が高いほど、対応する関心タグのウェイトが大きくなり、逆に、関心が低いほど、対応する関心タグのウェイトが小さい。一例として、ユーザ画像に含まれるユーザ情報は、「性別：男性、年齢：３０〜３５歳、婚姻状況：既婚、職業：銀行員、収入状況：８０００超、学歴：大学卒業、興味：スポーツ、金融、技術」であってもよい。該ユーザの関心タグは、スポーツ、金融、技術を含んでもよい。

ステップ５０６：ウェブページコンテンツに対応する検索意図を関心タグ集合内でマッチングさせて、検索意図に一致した関心タグを取得する。

本実施例において、前記実行主体は、ウェブページコンテンツに対応する検索意図と関心タグ集合内の関心タグのそれぞれとの類似度を計算し、類似度に基づいて検索意図に一致した関心タグを確定することができる。例えば、類似度の最も高い関心タグを一致した関心タグとする。

ステップ５０７：ウェブページコンテンツのテキストと検索意図に一致した関心タグとをマッチングさせて、関心タグに一致したテキストを取得する。

本実施例では、少なくとも１つのウェブページコンテンツセグメントのそれぞれについて、前記実行主体は、該ウェブページコンテンツセグメントのテキストと検索意図に一致した関心タグとをマッチングさせて、関心タグに一致したテキストを取得することができる。一例として、前記実行主体は、該ウェブページコンテンツセグメント内の各語句と検索意図に一致した関心タグとの類似度を計算することができ、類似度が予め設定された類似度閾値よりも大きい場合、該語句のテキストを関心タグに一致したテキストとする。

ステップ５０８：関心タグに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成する。

ステップ５０９：テキスト効果が設けられたウェブページをユーザにプッシュする。

本実施例では、ステップ５０８〜５０９の具体的な操作は、図４に示す実施例のステップ４０５〜４０６の操作と実質的に同じであり、ここではこれ以上くどくど述べない。

図５から分かるように、図２の対応する実施例と比較して、本実施例における情報をプッシュするための方法のフロー５００では、ユーザに情報をプッシュするステップが強調された。したがって、本実施例で説明される技術案は、テキスト効果が設定されているウェブページを表示する。ウェブページコンテンツにおいて一致した関心タグに一致するテキストに対してテキスト効果が設定されると、ユーザは、ウェブページコンテンツを再閲覧する次第にテキスト効果の設定されたテキストに気付くことができる。ユーザはウェブページのコア情報を迅速に取得できるだけでなく、ウェブページのコア情報をより正確的に取得することも可能である。

更に図６を参照すると、上記の図に示された方法の実施態様として、本発明は、情報をプッシュするための装置の一実施例を提供し、該装置の実施例は、図２に示された方法の実施例に対応しており、該装置は、具体的に様々な電子機器に適用することができる。

図６に示すように、本実施例の情報をプッシュするための装置６００は、取得ユニット６０１と、抽出ユニット６０２と、プッシュユニット６０３とを備えてもよい。ここで、取得ユニット６０１は、ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得するように構成される。抽出ユニット６０２は、ウェブページコンテンツを少なくとも１つのウェブページコンテンツセグメントに分割して、少なくとも１つのウェブページコンテンツセグメントのトピックを抽出するように構成される。プッシュユニット６０３は、少なくとも１つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュするように構成される。

本実施例において、情報をプッシュするための装置６００は、取得ユニット６０１、抽出ユニット６０２、プッシュユニット６０３の具体的な処理及びそれらの技術効果は、それぞれ図２の対応する実施例におけるステップ２０１、ステップ２０２、及びステップ２０３の関連する説明を参照することができ、ここではこれ以上くどくど述べない。

本実施例のいくつかの所望による実施態様において、抽出ユニット６０２は、更に少なくとも１つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントを事前訓練されたドキュメントトピック生成モデルに入力して、該ウェブページコンテンツセグメントのトピックを取得するように構成されてもよい。

本実施例のいくつかの所望による実施態様において、プッシュユニット６０３は、少なくとも１つのウェブページコンテンツセグメントのトピックをユーザにプッシュするように構成される第１プッシュサブユニット（図示せず）を備えてもよい。

本実施例のいくつかの所望による実施態様において、プッシュユニット６０３は、少なくとも１つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントのテキストと該ウェブページコンテンツセグメントのトピックとをマッチングさせて、一致したテキストを取得し、一致したテキストに対して事前設定テキスト効果を設定し、テキスト効果が設けられたウェブページを生成するように構成される第１生成サブユニット（図示せず）と、テキスト効果が設けられたウェブページをユーザにプッシュするように構成される第２プッシュサブユニット（図示せず）と、を備えてもよい。

本実施例のいくつかの所望による実施態様において、プッシュユニット６０３は、少なくとも１つのウェブページコンテンツセグメントのトピックに対して単語分割を実行し、単語分割結果に基づいてウェブページコンテンツに対応する単語ベクトルを生成するように構成される単語分割サブユニット（図示せず）と、ウェブページコンテンツに対応する単語ベクトルを、検索意図を予測するための事前訓練された意図予測モデルに入力して、ウェブページコンテンツに対応する検索意図を得るように構成される予測サブユニット（図示せず）と、ユーザのユーザ画像から関心タグ集合を抽出するように構成される抽出サブユニット（図示せず）と、ウェブページコンテンツに対応する検索意図を関心タグ集合内でマッチングさせて、一致した関心タグを取得するように構成されるマッチングサブユニット（図示せず）と、一致した関心タグとウェブページコンテンツのテキストとをマッチングさせて、一致したテキストを取得し、一致したテキストに対して事前設定テキスト効果を設定し、テキスト効果が設けられたウェブページを生成するように構成される第２生成サブユニット（図示せず）と、テキスト効果が設けられたウェブページをユーザにプッシュするように構成される第３プッシュサブユニット（図示せず）と、を備えてもよい。

本実施例のいくつかの所望による実施態様において、意図予測モデルは、サンプル検索データと、サンプル検索データに対応するサンプル検索意図とを含む訓練サンプル集合を取得するステップと、訓練サンプル集合に基づいて、多層ニューラルネットワークを訓練して意図予測モデルを取得するステップと、によって訓練される。

以下、本発明の実施例を実現するためのサーバ（例えば、図１に示すサーバ１０５）に適用されるコンピュータシステム７００の構造概略図を示す図７を参照する。図７に示すサーバは、一例に過ぎず、本発明の実施例の機能及び使用範囲を限定するものではない。

図７に示すように、コンピュータシステム７００は、読み出し専用メモリ（ＲＯＭ）７０２に記憶されているプログラムまたは記憶部７０８からランダムアクセスメモリ（ＲＡＭ）７０３にロードされたプログラムによって様々な適当な動作および処理を実行することができる中央処理装置（ＣＰＵ）７０１を備える。ＲＡＭ７０３には、システム７００の動作に必要な様々なプログラム及びデータが更に格納されている。ＣＰＵ７０１、ＲＯＭ７０２及びＲＡＭ７０３は、バス７０４を介して互いに接続されている。入力／出力（Ｉ／Ｏ）インターフェース７０５もバス７０４に接続されている。

キーボード、マウスなどを含む入力部７０６、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）など、およびスピーカなどを含む出力部７０７、ハードディスクなどを含む記憶部７０８、並びにＬＡＮカード、モデムなどを含むネットワークインターフェースカードの通信部７０９は、Ｉ／Ｏインターフェース７０５に接続されている。通信部７０９は、例えばインターネットのようなネットワークを介して通信処理を実行する。ドライバ７１０は、必要に応じてＩ／Ｏインターフェース７０５に接続される。リムーバブルメディア７１１は、例えば、マグネチックディスク、光ディスク、光磁気ディスク、半導体メモリなどのようなものであり、必要に応じてドライバ７１０に取り付けられ、したがって、リムーバブルメディア７１１から読み出されたコンピュータプログラムが必要に応じて記憶部７０８にインストールされる。

特に、本発明の実施例によれば、上記のフローチャートを参照しながら記載されたプロセスは、コンピュータのソフトウェアプログラムとして実現されてもよい。例えば、本発明の実施例は、コンピュータ可読媒体に具現化されるコンピュータプログラムを含むコンピュータプログラム製品を備え、該コンピュータプログラムは、フローチャートで示される方法を実行するためのプログラムコードを含む。このような実施例では、該コンピュータプログラムは、通信部７０９を介してネットワークからダウンロードされてインストールされてもよく、および／またはリムーバブルメディア７１１からインストールされてもよい。該コンピュータプログラムが中央処理装置（ＣＰＵ）７０１によって実行されると、本発明の方法で限定された上記の機能を実行する。注意すべきなのは、本発明に記載したコンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読媒体、またはこれらの任意の組み合わせであってもよい。コンピュータ可読媒体は、例えば、電子、磁気、光学、電磁気、赤外線、または半導体システム、装置もしくはデバイス、またはこれらの任意の組み合わせであってもよいが、これらに限定されない。コンピュータ可読媒体のより具体的な例としては、１本または複数の導線を有する電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、消去可能プログラマブル読み出し専用メモリ（ＥＰＲＯＭもしくはフラッシュメモリ）、光ファイバ、ポータブルコンパクトディスク読み出し専用メモリ（ＣＤ−ＲＯＭ）、光メモリ、磁気メモリ、またはこれらの任意の適切な組み合わせを含むことができるが、これらに限定されない。本発明において、コンピュータ可読媒体は、命令実行システム、装置もしくはデバイスによって使用可能な、またはそれらに組み込まれて使用可能なプログラムを包含または格納する任意の有形の媒体であってもよい。本発明において、コンピュータ可読信号媒体は、ベースバンド内で、またはキャリアの一部として伝搬される、コンピュータ可読プログラムコードが担持されたデータ信号を含んでもよい。このような伝搬されたデータ信号は、様々な形態をとることができ、電磁信号、光信号、またはこれらの任意の適切な組み合わせを含むことができるが、これらに限定されない。コンピュータ可読信号媒体は、更にコンピュータ可読記憶媒体以外の任意のコンピュータ可読媒体であってもよい。該コンピュータ可読媒体は、命令実行システム、装置もしくはデバイスによって使用されるか、またはそれらに組み込まれて使用されるプログラムを、送信、伝搬または転送することができる。コンピュータ可読媒体に含まれるプログラムコードは任意の適切な媒体で送信することができ、無線、有線、光ケーブル、ＲＦなど、またはこれらの任意の適切な組み合わせを含むが、これらに限定されない。

本発明の動作を実行するためのコンピュータプログラムコードは、１種または複数のプログラミング言語、またはそれらの組み合わせで作成されることができ、前記プログラミング言語は、Ｊａｖａ（登録商標）、Ｓｍａｌｌｔａｌｋ、Ｃ＋＋などのオブジェクト指向プログラミング言語と、「Ｃ」言語または同様のプログラミング言語などの従来の手続き型プログラミング言語とを含む。プログラムコードは、完全にユーザのコンピュータ上で実行され、部分的にユーザのコンピュータ上で実行され、独立したソフトウェアパッケージとして実行され、一部がユーザのコンピュータ上で一部がリモートコンピュータ上で実行され、または完全にリモートコンピュータまたはサーバ上で実行されてもよい。リモートコンピュータに関わる場合、リモートコンピュータは、ローカルエリアネットワーク（ＬＡＮ）またはワイドエリアネットワーク（ＷＡＮ）を含む任意の種類のネットワークを介してユーザのコンピュータに接続されることができ、または外部のコンピュータに接続されることができる（例えばインターネットサービスプロバイダによりインターネットで接続される）。

図面におけるフローチャート及びブロック図は、本発明の各実施例に係るシステム、方法及びコンピュータプログラム製品により実現可能なアーキテクチャ、機能及び操作を示す。ここで、フローチャートまたはブロック図における各ブロックは、モジュール、プログラムセグメントもしくはコードの一部を表してもよく、該モジュール、プログラムセグメントもしくはコードの一部は、規定されたロジック機能を達成するための１つまたは複数の実行可能な命令を含む。なお、いくつかの代替実施態様において、ブロック内に示された機能は、図面に示された順番とは異なるもので実行されてもよい。例えば、連続して示された２つのブロックは、実際には関連する機能に応じて、ほぼ並行に実行されてもよく、逆の順番で実行されてもよい。なお、ブロック図および／またはフローチャートにおける各ブロック、並びに、ブロック図および／またはフローチャートにおけるブロックの組み合わせは、規定された機能もしくは動作を実行する、ハードウェアに基づく専用システムで実現されてもよく、または、専用ハードウェアとコンピュータ命令との組み合わせで実行されてもよい。

本発明の実施例に記載されたユニットは、ソフトウェアで実現されてもよく、ハードウェアで実現されてもよい。記載されたユニットは、プロセッサに設定されてもよく、例えば、「プロセッサは、取得ユニットと、抽出ユニットと、プッシュユニットとを備える」と記載されてもよい。ここで、これらのユニットの名称は、特定の場合において当該ユニットその自体を限定するものではなく、例えば、取得ユニットは、「ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得するユニット」であると記載されてもよい。

一方、本発明は、コンピュータ可読媒体を更に提供し、該コンピュータ可読媒体は、前記実施例に記載されたサーバに含まれるものであってもよく、独立に存在して該サーバに組み立てられていないものであってもよい。上記のコンピュータ可読媒体は、１つまたは複数のプログラムが格納されており、前記１つまたは複数のプログラムが該サーバによって実行されると、該サーバは、ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得することと、ウェブページコンテンツを少なくとも１つのウェブページコンテンツセグメントに分割して、少なくとも１つのウェブページコンテンツセグメントのトピックを抽出することと、少なくとも１つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュすることとを実行する。

以上の記載は、本発明の好ましい実施例、および使用される技術的原理に関する説明に過ぎない。本発明に係る発明の範囲が、上記の技術的特徴の特定の組み合わせからなる技術案に限定されるものではなく、上記の本発明の趣旨を逸脱しない範囲で、上記の技術的特徴またはそれらの同等の特徴を任意に組み合わせてなる他の技術案も含むべきであることを、当業者に理解されたい。例えば、上記の特徴と、本発明に開示された（これに限定されない）類似の機能を有する技術的特徴とを互いに置き換えてなる技術案が挙げられる。

Claims

情報をプッシュするための方法であって、
ユーザによって履歴検索データが選択されたことに応答して、前記履歴検索データに対応するウェブページコンテンツを取得することと、
前記ウェブページコンテンツを少なくとも１つのウェブページコンテンツセグメントに分割して、前記少なくとも１つのウェブページコンテンツセグメントのトピックを抽出することと、
前記少なくとも１つのウェブページコンテンツセグメントのトピックに基づいて前記ユーザに情報をプッシュすることと
を含む情報をプッシュするための方法。
前記少なくとも１つのウェブページコンテンツセグメントのトピックを抽出することは、
前記少なくとも１つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントを事前訓練されたドキュメントトピック生成モデルに入力して、該ウェブページコンテンツセグメントのトピックを取得することを含む、請求項１に記載の方法。
前記少なくとも１つのウェブページコンテンツセグメントのトピックに基づいて前記ユーザに情報をプッシュすることは、
前記少なくとも１つのウェブページコンテンツセグメントのトピックを前記ユーザにプッシュすることを含む、請求項１に記載の方法。
前記少なくとも１つのウェブページコンテンツセグメントのトピックに基づいて前記ユーザに情報をプッシュすることは、
前記少なくとも１つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントのテキストと該ウェブページコンテンツセグメントのトピックとをマッチングさせて、トピックに一致したテキストを取得し、前記トピックに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成することと、
前記テキスト効果が設けられたウェブページをユーザにプッシュすることと
を含む、請求項１または３に記載の方法。
前記少なくとも１つのウェブページコンテンツセグメントのトピックに基づいて前記ユーザに情報をプッシュすることは、
前記少なくとも１つのウェブページコンテンツセグメントのトピックに対して単語分割を実行し、単語分割結果に基づいて前記ウェブページコンテンツに対応する単語ベクトルを生成することと、
前記ウェブページコンテンツに対応する単語ベクトルを、検索意図を予測するための事前訓練された意図予測モデルに入力して、前記ウェブページコンテンツに対応する検索意図を得ることと、
前記ユーザのユーザ画像から関心タグ集合を抽出することと、
前記ウェブページコンテンツに対応する検索意図を前記関心タグ集合内でマッチングさせて、検索意図に一致した関心タグを取得することと、
前記ウェブページコンテンツのテキストと前記検索意図に一致した関心タグとをマッチングさせて、関心タグに一致したテキストを取得し、前記一致したテキストに事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成することと、
前記テキスト効果が設けられたウェブページを前記ユーザにプッシュすることと
を含む、請求項１に記載の方法。
前記意図予測モデルは、
サンプル検索データと、サンプル検索データに対応するサンプル検索意図とを含む訓練サンプル集合を取得するステップと、
前記訓練サンプル集合に基づいて、多層ニューラルネットワークを訓練して前記意図予測モデルを取得するステップと
によって訓練される請求項５に記載の方法。
情報をプッシュするための装置であって、
ユーザによって履歴検索データが選択されたことに応答して前記履歴検索データに対応するウェブページコンテンツを取得するように構成される取得ユニットと、
前記ウェブページコンテンツを少なくとも１つのウェブページコンテンツセグメントに分割して、前記少なくとも１つのウェブページコンテンツセグメントのトピックを抽出するように構成される抽出ユニットと、
前記少なくとも１つのウェブページコンテンツセグメントのトピックに基づいて前記ユーザに情報をプッシュするように構成されるプッシュユニットと
を備える、情報をプッシュするための装置。
前記抽出ユニットは、更に、前記少なくとも１つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントを事前訓練されたドキュメントトピック生成モデルに入力して、該ウェブページコンテンツセグメントのトピックを取得するように構成される、請求項７に記載の装置。
前記プッシュユニットは、前記少なくとも１つのウェブページコンテンツセグメントのトピックを前記ユーザにプッシュするように構成される第１プッシュサブユニットを備える請求項７に記載の装置。
前記プッシュユニットは、
前記少なくとも１つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントのテキストと該ウェブページコンテンツセグメントのトピックとをマッチングさせて、トピックに一致したテキストを取得し、前記トピックに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成するように構成される第１生成サブユニットと、
前記テキスト効果が設けられたウェブページをユーザにプッシュするように構成される第２プッシュサブユニットと
を備える請求項７または９に記載の装置。
前記プッシュユニットは、
前記少なくとも１つのウェブページコンテンツセグメントのトピックに対して単語分割を実行し、単語分割結果に基づいて前記ウェブページコンテンツに対応する単語ベクトルを生成するように構成される単語分割サブユニットと、
前記ウェブページコンテンツに対応する単語ベクトルを、検索意図を予測するための事前訓練された意図予測モデルに入力して、前記ウェブページコンテンツに対応する検索意図を得るように構成される予測サブユニットと、
前記ユーザのユーザ画像から関心タグ集合を抽出するように構成される抽出サブユニットと、
前記ウェブページコンテンツに対応する検索意図を前記関心タグ集合内でマッチングさせて、検索意図に一致した関心タグを取得するように構成されるマッチングサブユニットと、
前記ウェブページコンテンツのテキストと前記検索意図に一致した関心タグとをマッチングさせて、関心タグに一致したテキストを取得し、前記一致したテキストに事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成するように構成される第２生成サブユニットと、
前記テキスト効果が設けられたウェブページを前記ユーザにプッシュするように構成される第３プッシュサブユニットと
を備える請求項７に記載の装置。
前記意図予測モデルは、
サンプル検索データと、サンプル検索データに対応するサンプル検索意図とを含む訓練サンプル集合を取得するステップと、
前記訓練サンプル集合に基づいて、多層ニューラルネットワークを訓練して前記意図予測モデルを取得するステップと
によって訓練される請求項１１に記載の装置。
サーバであって、
１つまたは複数のプロセッサと、
１つまたは複数のプログラムが記憶される記憶装置と
を備え、
前記１つまたは複数のプログラムが前記１つまたは複数のプロセッサによって実行されると、前記１つまたは複数のプロセッサに請求項１〜６のいずれか一項に記載の方法を実現させる、サーバ。
コンピュータプログラムが記憶されるコンピュータ可読媒体であって、
前記コンピュータプログラムがプロセッサによって実行されると、請求項１〜６のいずれか一項に記載の方法を実現する、コンピュータ可読媒体。
コンピュータプログラムであって、
前記コンピュータプログラムがプロセッサによって実行されると、請求項１〜６のいずれか一項に記載の方法を実現する、コンピュータプログラム。