JP6745384B2 - 情報をプッシュするための方法及び装置 - Google Patents

情報をプッシュするための方法及び装置 Download PDF

Info

Publication number
JP6745384B2
JP6745384B2 JP2019105063A JP2019105063A JP6745384B2 JP 6745384 B2 JP6745384 B2 JP 6745384B2 JP 2019105063 A JP2019105063 A JP 2019105063A JP 2019105063 A JP2019105063 A JP 2019105063A JP 6745384 B2 JP6745384 B2 JP 6745384B2
Authority
JP
Japan
Prior art keywords
web page
page content
content segment
user
topic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019105063A
Other languages
English (en)
Other versions
JP2020024674A (ja
Inventor
ヂャン,フェン
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド, バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Publication of JP2020024674A publication Critical patent/JP2020024674A/ja
Application granted granted Critical
Publication of JP6745384B2 publication Critical patent/JP6745384B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明の実施例は、コンピュータ技術の分野に関し、具体的に情報をプッシュするための方法及び装置に関する。
ユーザは検索により大量の知識を取得できるが、選択に困ることがある。ユーザは多くのウェブページを閲覧した後、前に閲覧したウェブページの内容を忘れてしまったことに気づく場合があり、再閲覧したい場合、前に閲覧したウェブページをクリックしてもう一度読む必要がある。
従来の検索プロセスは、通常、次のステップを含む。まずは、ユーザが検索語を入力して検索要求を発送する。次に、検索語に関連するウェブページのトピックを表示する。次に、ユーザによってウェブページのトピックがクリックされると、ユーザがウェブページの内容を閲覧するためにウェブページを表示するようにジャンプさせる。最後にユーザはウェブページを閲覧した後、ウェブページを閉じる。ユーザが以前に閲覧したウェブページの内容を再閲覧したい場合、通常、履歴閲覧記録内のウェブページのトピックをクリックするか、または検索語を再入力して検索を行い、表示されるウェブページのトピックをクリックして、ウェブページを表示するようにジャンプさせる必要がある。
本発明の実施例は、情報をプッシュするための方法及び装置を提供する。
第1態様では、本発明の実施例は、ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得することと、ウェブページコンテンツを少なくとも1つのウェブページコンテンツセグメントに分割して、少なくとも1つのウェブページコンテンツセグメントのトピックを抽出することと、少なくとも1つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュすることとを含む情報をプッシュするための方法を提供する。
いくつかの実施例では、少なくとも1つのウェブページコンテンツセグメントのトピックを抽出することは、少なくとも1つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントを事前訓練されたドキュメントトピック生成モデルに入力して、該ウェブページコンテンツセグメントのトピックを取得することを含む。
いくつかの実施例では、少なくとも1つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュすることは、少なくとも1つのウェブページコンテンツセグメントのトピックをユーザにプッシュすることを含む。
いくつかの実施例では、少なくとも1つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュすることは、少なくとも1つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントのテキストと該ウェブページコンテンツセグメントのトピックとをマッチングさせて、トピックに一致したテキストを取得し、トピックに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成することと、テキスト効果が設けられたウェブページをユーザにプッシュすることとを含む。
いくつかの実施例では、少なくとも1つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュすることは、少なくとも1つのウェブページコンテンツセグメントのトピックに対して単語分割を実行し、単語分割結果に基づいてウェブページコンテンツに対応する単語ベクトルを生成することと、ウェブページコンテンツに対応する単語ベクトルを、検索意図を予測するための事前訓練された意図予測モデルに入力して、ウェブページコンテンツに対応する検索意図を得ることと、ユーザのユーザ画像から関心タグ集合を抽出することと、ウェブページコンテンツに対応する検索意図を関心タグ集合内でマッチングさせて、検索意図に一致した関心タグを取得することと、ウェブページコンテンツ内のテキストと検索意図に一致した関心タグとをマッチングさせて、関心タグに一致したテキストを取得し、一致したテキストに事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成することと、テキスト効果が設けられたウェブページをユーザにプッシュすることとを含む。
いくつかの実施例では、意図予測モデルは、サンプル検索データと、サンプル検索データに対応するサンプル検索意図とを含む訓練サンプル集合を取得するステップと、訓練サンプル集合に基づいて、多層ニューラルネットワークを訓練して意図予測モデルを取得するステップと、によって訓練される。
第2態様では、本発明の実施例は、ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得するように構成される取得ユニットと、ウェブページコンテンツを少なくとも1つのウェブページコンテンツセグメントに分割して、少なくとも1つのウェブページコンテンツセグメントのトピックを抽出するように構成される抽出ユニットと、少なくとも1つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュするように構成されるプッシュユニットと、を備える情報をプッシュするための装置を提供する。
いくつかの実施例では、抽出ユニットは、更に少なくとも1つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントを事前訓練されたドキュメントトピック生成モデルに入力して、該ウェブページコンテンツセグメントのトピックを取得するように構成される。
いくつかの実施例では、プッシュユニットは、少なくとも1つのウェブページコンテンツセグメントのトピックをユーザにプッシュするように構成される第1プッシュサブユニットを備える。
いくつかの実施例では、プッシュユニットは、少なくとも1つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントのテキストと該ウェブページコンテンツセグメントのトピックとをマッチングさせて、トピックに一致したテキストを取得し、トピックに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成するように構成される第1生成サブユニットと、テキスト効果が設けられたウェブページをユーザにプッシュするように構成される第2プッシュサブユニットと、を備える。
いくつかの実施例では、プッシュユニットは、少なくとも1つのウェブページコンテンツセグメントのトピックに対して単語分割を実行し、単語分割結果に基づいてウェブページコンテンツに対応する単語ベクトルを生成するように構成される単語分割サブユニットと、ウェブページコンテンツに対応する単語ベクトルを、検索意図を予測するための事前訓練された意図予測モデルに入力して、ウェブページコンテンツに対応する検索意図を得るように構成される予測サブユニットと、ユーザのユーザ画像から関心タグ集合を抽出するように構成される抽出サブユニットと、ウェブページコンテンツに対応する検索意図を関心タグ集合内でマッチングさせて、検索意図に一致した関心タグを取得するように構成されるマッチングサブユニットと、ウェブページコンテンツのテキストと検索意図に一致した関心タグとをマッチングさせて、関心タグに一致したテキストを取得し、関心タグに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成するように構成される第2生成サブユニットと、テキスト効果が設けられたウェブページをユーザにプッシュするように構成される第3プッシュサブユニットと、を備える。
いくつかの実施例では、意図予測モデルは、サンプル検索データと、サンプル検索データに対応するサンプル検索意図とを含む訓練サンプル集合を取得するステップと、訓練サンプル集合に基づいて、多層ニューラルネットワークを訓練して意図予測モデルを取得するステップと、によって訓練される。
第3態様では、本発明の実施例は、1つまたは複数のプロセッサと、1つまたは複数のプログラムが記憶される記憶装置と、を備え、1つまたは複数のプログラムが1つまたは複数のプロセッサによって実行されると、1つまたは複数のプロセッサに第1の態様のいずれかの実現形態に記載の方法を実現させるサーバを提供する。
第4態様では、本発明の実施例は、コンピュータプログラムが記憶されるコンピュータ可読媒体であって、該コンピュータプログラムがプロセッサによって実行されると、第1の態様のいずれかの実現形態に記載の方法を実現するコンピュータ可読媒体を提供する。
本発明の実施例により提供された情報をプッシュするための方法および装置は、ユーザが履歴検索データを選択するときに、履歴検索データに対応するウェブページコンテンツを取得し、次にウェブページコンテンツを少なくとも1つのウェブページコンテンツセグメントに分割して、少なくとも1つのウェブページコンテンツセグメントのトピックを抽出し、最後に少なくとも1つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュする。ユーザがウェブページを再び閲覧するときにウェブページのコア情報をユーザに迅速にプッシュすることが実現された。
本発明の他の特徴、目的及び利点は、以下の図面を参照してなされる非限定的な実施例に係る詳細な説明を読むことにより、より明らかになる。
本発明を適用可能な例示的なシステムアーキテクチャである。 本発明に係る情報をプッシュするための方法の一実施例を示すフローチャートである。 履歴検索データ集合の概略図である。 本発明に係る情報をプッシュするための方法のもう一つの実施例を示すフローチャートである。 本発明に係る情報をプッシュするための方法のさらなる一つの実施例を示すフローチャートである。 本発明に係る情報をプッシュするための装置の一実施例を示す構造概略図である。 本発明の実施例を実現するためのサーバに適用されるコンピュータシステムを示す構造概略図である。
以下、図面及び実施例を参照しながら本発明をより詳細に説明する。ここで説明する具体的な実施例は、関連する発明を説明するためのものに過ぎず、当該発明を限定するものではないことが理解されるべきである。なお、説明の便宜上、図面には発明に関連する部分のみが示されている。
なお、本発明の実施例及び実施例における特徴は、矛盾を生じない限り、相互に組み合わせることができる。以下、図面及び実施例を参照しながら本発明を詳細に説明する。
図1は、本発明に係る情報をプッシュするための方法または情報をプッシュするための装置の実施例が適用可能な例示的なシステムアーキテクチャ100を示している。
図1に示すように、システムアーキテクチャ100は、端末装置101、102、103、ネットワーク104、及びサーバ105を含んでもよい。ネットワーク104は、端末装置101、102、103とサーバ105の間で通信リンクの媒体を提供するために使用される。ネットワーク102は、有線、無線通信リンクまたは光ファイバケーブルなどの様々なタイプの接続を含んでもよい。
ユーザは、メッセージを送受信するために、端末装置101、102、103を使用してネットワーク104を介してサーバ105と情報のやり取りをすることができる。端末装置101、102、103には、ウェブブラウザアプリケーションなどの様々なクライアントアプリケーションをインストールすることができる。
端末装置101、102、103は、ハードウェアでもソフトウェアでもよい。端末装置101、102、103がハードウェアである場合、表示画面を有するとともにウェブ閲覧をサポートする様々な電子機器とすることができる。スマートフォン、タブレットコンピュータ、ラップトップコンピュータ及びデスクトップコンピュータなどを含むが、これらに限定されない。端末装置101、102、103がソフトウェアである場合、上記の電子機器にインストールされてもよい。それは、複数のソフトウェア若しくはソフトウェアモジュールとして実現されてもよく、または単一のソフトウェア若しくはソフトウェアモジュールとして実現されてもよい。ここでは特に限定されない。
サーバ105は、様々なサービスを提供することができ、例えば、端末装置101、102、103から取得した履歴検索データなどのデータを解析するなどの処理を行い、処理結果(例えば、プッシュ情報)を端末装置101、102、103にフィードバックしてもよい。
なお、サーバ105は、ハードウェアでもソフトウェアでもよい。サーバ105がハードウェアである場合、複数のサーバから構成される分散サーバクラスターとしても、単一のサーバとしても実現可能である。サーバ105がソフトウェアである場合、複数のソフトウェア若しくはソフトウェアモジュール(例えば、分散サービスを提供するためのもの)として実現されてもよく、または単一のソフトウェア若しくはソフトウェアモジュールとして実現されてもよい。ここでは特に限定されない。
なお、本発明の実施例に係る情報をプッシュするための方法は、通常、サーバ105によって実行され、これに応じて、情報をプッシュするための装置は、通常、サーバ105に設けられている。
図1における端末装置、ネットワーク及びサーバの数は例示的なものに過ぎないことが理解されるべきである。必要に応じて、端末装置、ネットワーク及びサーバの数を任意に加減してもよい。
次に、本発明に係る情報をプッシュするための方法の一実施例のフローチャート200を示す図2を参照する。該情報をプッシュするための方法は、次のステップを含む。
ステップ201:ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得する。
本実施例では、ユーザによって履歴検索データが選択されると、情報をプッシュするための方法の実行主体(例えば、図1に示すサーバ105)は、履歴検索データに対応するウェブページの内容を取得することができる。ここで、履歴検索データは、ユーザによって以前に入力された検索語と、ユーザが以前に閲覧したウェブページのトピックとを含んでもよい。
実際には、ユーザがウェブページを閲覧する必要があるとき、端末装置(例えば、図1に示す端末装置101、102、103)にインストールされたウェブブラウザアプリケーションを開いて、ウェブブラウザアプリケーションの検索窓に検索語を入力することができる。続いて、ユーザは、ウェブブラウザアプリケーションの検索ボタンをクリックして、上記の実行主体に対して検索要求を発送する。前記実行主体が検索要求を受信すると、ユーザによって入力された検索語を用いて検索エンジンから検索し、検索語に関連付けられるウェブページ集合を取得し、検索語に関連付けられたウェブページ集合に対応するトピック集合をユーザに送信して、ユーザの端末装置に表示させることができる。ユーザがトピック集合内のトピックをクリックすると、閲覧要求を前記実行主体に対して発送することができる。前記の実行主体が閲覧要求を受信すると、検索語に関連付けられたウェブページ集合からユーザによってクリックされたトピックに対応するウェブページを取得し、閲覧のためにユーザに送信することができる。したがって、検索プロセスにおいて、前記実行主体は、ユーザによって入力された検索語だけでなく、ユーザが閲覧したウェブページのトピックも取得することができる。このようにして、前記実行主体は、所定の期間内(例えば、直前の1時間以内)にユーザによって入力された検索語と閲覧したウェブページのトピックとに基づいて、履歴検索データ集合を作成することができる。ここで、履歴検索データ集合内の1つの履歴検索データは、ユーザによって入力された1つの検索語およびユーザが閲覧した1つのウェブページを含んでもよい。
一例として、ユーザが直前の1時間内にウェブブラウザアプリケーションに検索語である「ベビーベッドのおすすめ人気ブランド」を入力したことがあり、「ベビーベッドの人気ブランドランキング10選」および「ベビーベッドのおすすめ人気ブランド」というトピックに関するウェブページを閲覧し、そして、検索語である「***ブランドのベビーベッドの評判はどうですか」を入力し、「***ブランドのベビーベッドの評判」および「***ブランドのベビーベッドの価格」というトピックのウェブページを閲覧した場合、前記実行主体は履歴検索データ集合を収集し、具体的に図3に示す。「最近のフォロー」ボタンをウェブブラウザアプリケーションに設定することができ、ユーザがこれらのページを再び閲覧する必要があるとき、「最近のフォロー」ボタンをクリックすることができる。このとき、前記実行主体は、履歴検索データ集合をユーザの端末装置に送信して表示させることが可能である。ここで、履歴検索データ集合内のウェブページのトピックは、ウェブページのホームページアドレス(URL)に関連付けられることができる。ユーザが履歴検索データ集合内の特定のウェブページのトピックを直接クリックすると、ユーザが該ウェブページの内容を再閲覧するためにそのウェブページを表示するように直接ジャンプすることができる。履歴検索データ集合内の各ウェブページのトピック近く(例えば、ウェブページのトピックの後ろ)に「コントラストに追加」ボタンを設定することができ、ユーザがあるウェブページのトピック近くにある「コントラストに追加」ボタンをクリックすると、該ウェブページのトピックが選択される。履歴検索データ集合の近く(例えば、履歴検索データ集合の後ろ)に「コントラスト開始」ボタンを設定することができる。ユーザが「コントラスト開始」ボタンをクリックすると、ユーザの選択したウェブページのトピックを前記実行主体に送信することができる。例えば、ユーザは、「ベビーベッドの人気ブランドランキング10選」および「***ブランドのベビーベッドの評判はどうですか」というトピックの近くにある「コントラストに追加」ボタンをクリックし、「コントラスト開始」ボタンをクリックした。このとき、前記実行主体は、「ベビーベッドの人気ランキング10選」および「***ブランドのベビーベッドの評判はどうですか」というトピックに従って、対応するウェブページを検索し、ウェブページのコンテンツを取得することができる。
ステップ202:ウェブページコンテンツを少なくとも1つのウェブページコンテンツセグメントに分割して、少なくとも1つのウェブページコンテンツセグメントのトピックを抽出する。
本実施例では、前記実行主体は、ウェブページコンテンツを少なくとも1つのウェブページコンテンツセグメントに分割することができる。少なくとも1つのウェブページコンテンツセグメントのそれぞれについて、前記実行主体は該ウェブページコンテンツセグメントのトピックを抽出することができる。例えば、ウェブページコンテンツがN(Nは正の整数)の段落を含む場合、前記実行主体はウェブページコンテンツをN個のウェブページコンテンツセグメントに分割することができる。ここで、1つのウェブページコンテンツセグメントは、ウェブページコンテンツの1つの段落に対応する。別の例では、前記実行主体は、ウェブページコンテンツを複数のウェブページコンテンツセグメントにランダムに分割することができる。ここで、分割されたウェブページコンテンツセグメントの数は、デフォルト設定の数でもよいし、ユーザが所望により自律的に設定した数でもよい。
本実施例のいくつかの所望による実施態様において、少なくとも1つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、前記実行主体は、該ウェブページコンテンツセグメントを事前訓練されたドキュメントトピック生成モデルに入力して、該ウェブページコンテンツセグメントのトピックを取得することができる。その中で、ドキュメントトピック生成モデルは、ドキュメントトピックの確率分布を生成するために使用することができる。具体的には、少なくとも1つのウェブページコンテンツセグメントのそれぞれについて、前記実行主体は、該ウェブページコンテンツセグメントをドキュメントトピック生成モデルに入力し、該ウェブページコンテンツセグメントの一部のトピックの確率分布を出力し、該ウェブページコンテンツセグメントの一部のトピックの確率分布に基づいて、該ウェブページコンテンツセグメントのトピックを取得することができる。ここで、ウェブページコンテンツセグメントのトピックの数は、ゼロ以上の整数であってもよく、すなわち、ウェブページコンテンツセグメントは、トピックを有さなくてもよく、トピックを1つだけ有してもよく、複数のトピックを有してもよい。
一例として、ドキュメントトピック生成モデルは、LDA(Latent Dirichlet Allocation)であってもよい。その中でも、LDAは、単語、トピック、およびドキュメントの3層構造を含む3層ベイズ確率モデルともいう。LDAは、大規模なドキュメントコレクション(document collection)またはコーパス(corpus)内の隠れたトピックを識別するために使用できる、無監督の機械学習技術である。これは、各ドキュメントを単語頻度ベクトルとして扱い、テキスト情報をモデル化が容易なデジタル情報に変換する単語の袋(Bag of Words)の方法を使用している。各ドキュメントはいくつかのトピックからなる確率分布を表し、各トピックは多数の単語からなる確率分布を表す。
ステップ203:少なくとも1つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュする。
本実施例では、前記実行主体は、少なくとも1つのウェブページコンテンツセグメントのトピックに基づいて情報をユーザにプッシュすることができる。例えば、前記実行主体は、少なくとも1つのウェブページコンテンツセグメントのトピックをユーザにプッシュすることができる。別の例では、前記実行主体は、少なくとも1つのウェブページコンテンツセグメントのトピックに基づいてウェブページコンテンツを編集し、新しいウェブページを生成してユーザにプッシュすることができる。
なお、ユーザが複数のウェブページを再閲覧する必要がある場合、複数の履歴検索データを選択することができ、複数の履歴検索データのそれぞれに対して、ステップ201〜203を実行する。これにより、ユーザは、複数の履歴検索データに対応する複数のプッシュ情報を受信することができる。このようにして、ユーザは、複数のプッシュ情報に従って複数のウェブページのコアコンテンツを比較することができる。
本発明の実施例により提供された情報をプッシュするための方法は、ユーザが履歴検索データを選択するときに、履歴検索データに対応するウェブページコンテンツを取得し、次にウェブページコンテンツを少なくとも1つのウェブページコンテンツセグメントに分割して、少なくとも1つのウェブページコンテンツセグメントのトピックを抽出し、最後に少なくとも1つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュする。ユーザが履歴ウェブページを再閲覧するとき、ウェブページのコア情報をユーザに迅速にプッシュすることが実現される。
さらに、本発明に係る情報をプッシュするための方法のもう一つの実施例のフロー400が示される図4を参照する。この情報をプッシュするための方法は、次のステップを含む。
ステップ401:ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得する。
ステップ402:ウェブページコンテンツを少なくとも1つのウェブページコンテンツセグメントに分割して、少なくとも1つのウェブページコンテンツセグメントのトピックを抽出する。
本実施例では、ステップ401〜402の具体的な操作は、図2に示す実施例のステップ201〜202の操作と実質的に同じであり、ここではこれ以上くどくど述べない。
ステップ403:少なくとも1つのウェブページコンテンツセグメントのトピックをユーザにプッシュする。
本実施例では、情報をプッシュするための方法の実行主体(例えば、図1に示すサーバ105)は、ユーザの端末装置(例えば、図1に示す端末装置101、102、103)で表示するために、少なくとも1つのウェブページコンテンツセグメントのトピックをユーザにプッシュすることができる。
ステップ404:少なくとも1つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントのテキストと該ウェブページコンテンツセグメントのトピックとをマッチングさせて、トピックに一致したテキストを取得する。
本実施例では、少なくとも1つのウェブページコンテンツセグメントのそれぞれについて、前記実行主体は、該ウェブページコンテンツセグメントのテキストを該ウェブページコンテンツセグメントのトピックとマッチングさせて、一致したテキストを取得することができる。一例として、前記実行主体は、該ウェブページコンテンツセグメント内の各語句と該ウェブページコンテンツセグメントのトピックとの類似度を計算することができ、類似度が予め設定された類似度閾値よりも大きい場合、該語句のテキストを一致したテキストとして使用する。ここで、該ウェブページコンテンツセグメント内の各語句について、前記実行主体は、該語句に対して単語分割を実行して該語句のキーワード集合を生成することができる。同様に、前記実行主体は、該ウェブページコンテンツセグメントのトピックに対して単語分割を実行して、該ウェブページコンテンツセグメントのトピックのキーワード集合を生成することができる。その後、前記実行主体は、該語句のキーワード集合と、該ウェブページコンテンツセグメントのトピックのキーワード集合との類似度を計算することができる。例えば、該語句のキーワード集合と該ウェブページコンテンツセグメントのトピックのキーワード集合における同じキーワードの数と、該語句のキーワード集合におけるキーワードの数との比を、該語句と該ウェブページコンテンツセグメントのトピックとの類似度とすることができる。
ステップ405:トピックに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成する。
本実施例において、前記実行主体は、トピックに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成することができる。ここで、トピックに一致したテキストに対してテキスト効果を設けると、一致したテキストと一致していないテキストを区別可能であり、それによってユーザはウェブページを閲覧するときに一致したテキストを迅速に取得できる。たとえば、一致したテキストの色を黄色に設定することにより、ユーザがテキスト効果の設けられたウェブページを閲覧するときに、黄色に設定されたテキストに最初に気付くことができる。
ステップ406:テキスト効果が設けられたウェブページをユーザにプッシュする。
本実施例において、前記実行主体は、テキスト効果が設けられたウェブページをユーザにプッシュする。通常、端末装置には、先ずは少なくとも1つのウェブページコンテンツセグメントのトピックを表示することがある。ユーザがウェブページコンテンツセグメントのトピックをクリックすると、テキスト効果の設けられたウェブページ内の該ウェブページコンテンツセグメントを表示することができる。ここで、表示された該ウェブページコンテンツセグメントにおいて該ウェブページコンテンツセグメントのトピックに一致するテキストに対してテキスト効果を設定すると、ユーザは、該ウェブページコンテンツセグメントを閲覧した次第にテキスト効果の設定されたテキストに気付くことができる。
図4から分かるように、図2の対応する実施例と比較して、本実施例における情報をプッシュするための方法のフロー400では、ユーザに情報をプッシュするステップが強調された。したがって、本実施例で説明された技術案は、プッシュ情報を階層的に表現する。先ずは、少なくとも1つのウェブページコンテンツセグメントのトピックが表示される。ユーザがウェブページコンテンツセグメントのトピックをクリックすると、テキスト効果の設定されたウェブページ内の該ウェブページコンテンツセグメントを表示される。表示された該ウェブページコンテンツセグメントにおいて該ウェブページコンテンツセグメントのトピックに一致するテキストに対してテキスト効果を設定することで、ユーザは、該ウェブページコンテンツセグメントを再閲覧する次第にテキスト効果の設定されたテキストに気付くことができる。ユーザはウェブページのコア情報を迅速に取得できるだけでなく、ウェブページのコア情報をより全面的に取得することも可能である。
さらに、本発明に係る情報をプッシュするための方法のさらなる別の実施例のフロー500が示される図5を参照する。この情報をプッシュするための方法は、次のステップを含む。
ステップ501:ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得する。
ステップ502:ウェブページコンテンツを少なくとも1つのウェブページコンテンツセグメントに分割して、少なくとも1つのウェブページコンテンツセグメントのトピックを抽出する。
本実施例では、ステップ501〜502の具体的な操作は、図2に示す実施例のステップ201〜202の操作と実質的に同じであり、ここではこれ以上くどくど述べない。
ステップ503:少なくとも1つのウェブページコンテンツセグメントのトピックに対して単語分割を実行し、単語分割結果に基づいてウェブページコンテンツに対応する単語ベクトルを生成する。
本実施例では、少なくとも1つのウェブページコンテンツセグメントのそれぞれについて、情報をプッシュするための方法の実行主体(例えば、図1に示すサーバ105)は、先ず、該ウェブページコンテンツセグメントのトピックを単語分割して、該ウェブページコンテンツセグメントのトピックのキーワード集合を取得し、次に該ウェブページコンテンツセグメントのトピックのキーワード集合に基づいて単語ベクトルの一次元を生成する。したがって、ウェブページコンテンツに対応する単語ベクトルの次元は、ウェブページコンテンツが分割されるウェブページコンテンツセグメントの数と同じである。
ステップ504:ウェブページコンテンツに対応する単語ベクトルを、事前訓練された意図予測モデルに入力して、ウェブページコンテンツに対応する検索意図を得る。
本実施例において、前記実行主体は、ウェブページコンテンツに対応する単語ベクトルを、事前訓練された意図予測モデルに入力して、ウェブページコンテンツに対応する検索意図を出力する。ここで、意図予測モデルは、検索意図を予測し、単語ベクトルと検索意図との間の対応関係を特徴付けるために使用することができる。ただし、検索意図は、ユーザの検索動機、すなわち、ユーザが検索を開始するときに実質的に取得したい情報を表現するために使用することができる。
本実施例のいくつかの所望による実施態様では、意図予測モデルは、多数の単語ベクトルおよび対応する検索意図に対して当業者によって統計解析が実行されることで取得された複数の単語ベクトルおよび対応する検索意図が格納された対応関係テーブルであってもよい。このとき、前記実行主体は、ウェブページコンテンツに対応する単語ベクトルと対応関係テーブルにおける各単語ベクトルとの類似度を算出し、類似度算出結果に基づいて該対応関係テーブルからウェブページコンテンツに対応する検索意図を取得することが可能である。例えば、先ずは、ウェブページコンテンツに対応する単語ベクトルの類似度が最も高い単語ベクトルを特定し、次に該対応関係テーブルからウェブページコンテンツに対応する単語ベクトルの類似度が最も高い単語ベクトルに対応する検索意図を検索し、該ウェブページコンテンツに対応する検索意図とする。
本実施例のいくつかの所望による実施態様では、意図予測モデルは、様々な機械学習方法および訓練サンプルを使用して従来の機械学習モデル(たとえば、様々な人工ニューラルネットワークなど)に対して教師付き訓練を行うことによって取得されるものであってもよい。ここで、対象検出モデルはMLP(Multi−Layer Perceptron,多層パーセプトロン)であってもよく、以下のステップによって訓練されてなる。
先ず、訓練サンプル集合を取得する。
ここで、訓練サンプルは、サンプル検索データおよびサンプル検索データに対応するサンプル検索意図を含んでもよい。サンプル検索データは、サンプル検索語およびサンプルウェブページのトピックを含んでもよい。ここで、当業者は、サンプル検索データを解析することで、サンプル検索データに対応するサンプル検索意図を得ることができる。例えば、当業者は、多数のサンプル検索語を入力してサンプルウェブページを閲覧するユーザに対してアンケート調査を実施してこれらのユーザの検索意図を得ることができる。次いで、これらのユーザの検索意図を要約してサンプル検索意図を取得する。
次いで、訓練サンプル集合に基づいて、多層ニューラルネットワークを訓練して意図予測モデルを取得する。
ここで、訓練サンプル集合内の訓練サンプルについて、前記実行主体は、先ずは該訓練サンプル内のサンプル検索データに対して単語分割を実行し、単語分割結果に基づいて該サンプル検索データに対応する単語ベクトルを生成し、次いで該サンプル検索データに対応する単語ベクトルを入力として、サンプル検索データに対応するサンプル検索意図を出力として、多層ニューラルネットワークを訓練して意図予測モデルを取得することができる。ただし、多層ニューラルネットワークは、訓練されていないまたは訓練が完了していない多層ニューラルネットワークであってもよい。ここで、訓練されていない多層ニューラルネットワークに対して、その様々なパラメータ(例えば、ウェイトパラメータおよびオフセットパラメータ)は、いくつかの異なる小さな乱数で初期化される。「小さな乱数」を使用することにより、ネットワークが過大なウェイトにより飽和状態になることで訓練が失敗してしまうことを防止でき、「異なる」乱数の使用により、ネットワークが正常に学習できることが確保される。訓練が完了していない多層ニューラルネットワークの場合、各パラメータは調整されたパラメータであってもよく、該多層ニューラルネットワークの予測効果は一般に予め設定された制約要件を満たさない。
ステップ505:ユーザのユーザ画像から関心タグ集合を抽出する。
本実施例において、前記実行主体は、ユーザのユーザ画像から関心タグの少なくとも一部を抽出して関心タグ集合を生成することができる。例えば、前記実行主体は、ウェイトの大きいものから小さいものへと、ユーザのユーザ画像中の関心タグを順序付け、前の順位に位置する(例えばトップ10)の関心タグを選択して関心タグ集合を生成することができる。
実際には、ユーザ画像は、事前に蓄積されたユーザデータに基づいて確立された少なくとも1種の記述タグを含むユーザ情報であってもよい。記述タグは、ユーザの性別、年齢、婚姻状況、職業、収入状況、学歴、興味などを記述するために使用することができる。ここで、ユーザの興味を記述するための記述タグは関心タグである。異なる関心タグには異なるウェイトを設定可能であり、一般的に、特定のものに対するユーザの関心が高いほど、対応する関心タグのウェイトが大きくなり、逆に、関心が低いほど、対応する関心タグのウェイトが小さい。一例として、ユーザ画像に含まれるユーザ情報は、「性別:男性、年齢:30〜35歳、婚姻状況:既婚、職業:銀行員、収入状況:8000超、学歴:大学卒業、興味:スポーツ、金融、技術」であってもよい。該ユーザの関心タグは、スポーツ、金融、技術を含んでもよい。
ステップ506:ウェブページコンテンツに対応する検索意図を関心タグ集合内でマッチングさせて、検索意図に一致した関心タグを取得する。
本実施例において、前記実行主体は、ウェブページコンテンツに対応する検索意図と関心タグ集合内の関心タグのそれぞれとの類似度を計算し、類似度に基づいて検索意図に一致した関心タグを確定することができる。例えば、類似度の最も高い関心タグを一致した関心タグとする。
ステップ507:ウェブページコンテンツのテキストと検索意図に一致した関心タグとをマッチングさせて、関心タグに一致したテキストを取得する。
本実施例では、少なくとも1つのウェブページコンテンツセグメントのそれぞれについて、前記実行主体は、該ウェブページコンテンツセグメントのテキストと検索意図に一致した関心タグとをマッチングさせて、関心タグに一致したテキストを取得することができる。一例として、前記実行主体は、該ウェブページコンテンツセグメント内の各語句と検索意図に一致した関心タグとの類似度を計算することができ、類似度が予め設定された類似度閾値よりも大きい場合、該語句のテキストを関心タグに一致したテキストとする。
ステップ508:関心タグに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成する。
ステップ509:テキスト効果が設けられたウェブページをユーザにプッシュする。
本実施例では、ステップ508〜509の具体的な操作は、図4に示す実施例のステップ405〜406の操作と実質的に同じであり、ここではこれ以上くどくど述べない。
図5から分かるように、図2の対応する実施例と比較して、本実施例における情報をプッシュするための方法のフロー500では、ユーザに情報をプッシュするステップが強調された。したがって、本実施例で説明される技術案は、テキスト効果が設定されているウェブページを表示する。ウェブページコンテンツにおいて一致した関心タグに一致するテキストに対してテキスト効果が設定されると、ユーザは、ウェブページコンテンツを再閲覧する次第にテキスト効果の設定されたテキストに気付くことができる。ユーザはウェブページのコア情報を迅速に取得できるだけでなく、ウェブページのコア情報をより正確的に取得することも可能である。
更に図6を参照すると、上記の図に示された方法の実施態様として、本発明は、情報をプッシュするための装置の一実施例を提供し、該装置の実施例は、図2に示された方法の実施例に対応しており、該装置は、具体的に様々な電子機器に適用することができる。
図6に示すように、本実施例の情報をプッシュするための装置600は、取得ユニット601と、抽出ユニット602と、プッシュユニット603とを備えてもよい。ここで、取得ユニット601は、ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得するように構成される。抽出ユニット602は、ウェブページコンテンツを少なくとも1つのウェブページコンテンツセグメントに分割して、少なくとも1つのウェブページコンテンツセグメントのトピックを抽出するように構成される。プッシュユニット603は、少なくとも1つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュするように構成される。
本実施例において、情報をプッシュするための装置600は、取得ユニット601、抽出ユニット602、プッシュユニット603の具体的な処理及びそれらの技術効果は、それぞれ図2の対応する実施例におけるステップ201、ステップ202、及びステップ203の関連する説明を参照することができ、ここではこれ以上くどくど述べない。
本実施例のいくつかの所望による実施態様において、抽出ユニット602は、更に少なくとも1つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントを事前訓練されたドキュメントトピック生成モデルに入力して、該ウェブページコンテンツセグメントのトピックを取得するように構成されてもよい。
本実施例のいくつかの所望による実施態様において、プッシュユニット603は、少なくとも1つのウェブページコンテンツセグメントのトピックをユーザにプッシュするように構成される第1プッシュサブユニット(図示せず)を備えてもよい。
本実施例のいくつかの所望による実施態様において、プッシュユニット603は、少なくとも1つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントのテキストと該ウェブページコンテンツセグメントのトピックとをマッチングさせて、一致したテキストを取得し、一致したテキストに対して事前設定テキスト効果を設定し、テキスト効果が設けられたウェブページを生成するように構成される第1生成サブユニット(図示せず)と、テキスト効果が設けられたウェブページをユーザにプッシュするように構成される第2プッシュサブユニット(図示せず)と、を備えてもよい。
本実施例のいくつかの所望による実施態様において、プッシュユニット603は、少なくとも1つのウェブページコンテンツセグメントのトピックに対して単語分割を実行し、単語分割結果に基づいてウェブページコンテンツに対応する単語ベクトルを生成するように構成される単語分割サブユニット(図示せず)と、ウェブページコンテンツに対応する単語ベクトルを、検索意図を予測するための事前訓練された意図予測モデルに入力して、ウェブページコンテンツに対応する検索意図を得るように構成される予測サブユニット(図示せず)と、ユーザのユーザ画像から関心タグ集合を抽出するように構成される抽出サブユニット(図示せず)と、ウェブページコンテンツに対応する検索意図を関心タグ集合内でマッチングさせて、一致した関心タグを取得するように構成されるマッチングサブユニット(図示せず)と、一致した関心タグとウェブページコンテンツのテキストとをマッチングさせて、一致したテキストを取得し、一致したテキストに対して事前設定テキスト効果を設定し、テキスト効果が設けられたウェブページを生成するように構成される第2生成サブユニット(図示せず)と、テキスト効果が設けられたウェブページをユーザにプッシュするように構成される第3プッシュサブユニット(図示せず)と、を備えてもよい。
本実施例のいくつかの所望による実施態様において、意図予測モデルは、サンプル検索データと、サンプル検索データに対応するサンプル検索意図とを含む訓練サンプル集合を取得するステップと、訓練サンプル集合に基づいて、多層ニューラルネットワークを訓練して意図予測モデルを取得するステップと、によって訓練される。
以下、本発明の実施例を実現するためのサーバ(例えば、図1に示すサーバ105)に適用されるコンピュータシステム700の構造概略図を示す図7を参照する。図7に示すサーバは、一例に過ぎず、本発明の実施例の機能及び使用範囲を限定するものではない。
図7に示すように、コンピュータシステム700は、読み出し専用メモリ(ROM)702に記憶されているプログラムまたは記憶部708からランダムアクセスメモリ(RAM)703にロードされたプログラムによって様々な適当な動作および処理を実行することができる中央処理装置(CPU)701を備える。RAM703には、システム700の動作に必要な様々なプログラム及びデータが更に格納されている。CPU701、ROM702及びRAM703は、バス704を介して互いに接続されている。入力/出力(I/O)インターフェース705もバス704に接続されている。
キーボード、マウスなどを含む入力部706、陰極線管(CRT)、液晶ディスプレイ(LCD)など、およびスピーカなどを含む出力部707、ハードディスクなどを含む記憶部708、並びにLANカード、モデムなどを含むネットワークインターフェースカードの通信部709は、I/Oインターフェース705に接続されている。通信部709は、例えばインターネットのようなネットワークを介して通信処理を実行する。ドライバ710は、必要に応じてI/Oインターフェース705に接続される。リムーバブルメディア711は、例えば、マグネチックディスク、光ディスク、光磁気ディスク、半導体メモリなどのようなものであり、必要に応じてドライバ710に取り付けられ、したがって、リムーバブルメディア711から読み出されたコンピュータプログラムが必要に応じて記憶部708にインストールされる。
特に、本発明の実施例によれば、上記のフローチャートを参照しながら記載されたプロセスは、コンピュータのソフトウェアプログラムとして実現されてもよい。例えば、本発明の実施例は、コンピュータ可読媒体に具現化されるコンピュータプログラムを含むコンピュータプログラム製品を備え、該コンピュータプログラムは、フローチャートで示される方法を実行するためのプログラムコードを含む。このような実施例では、該コンピュータプログラムは、通信部709を介してネットワークからダウンロードされてインストールされてもよく、および/またはリムーバブルメディア711からインストールされてもよい。該コンピュータプログラムが中央処理装置(CPU)701によって実行されると、本発明の方法で限定された上記の機能を実行する。注意すべきなのは、本発明に記載したコンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読媒体、またはこれらの任意の組み合わせであってもよい。コンピュータ可読媒体は、例えば、電子、磁気、光学、電磁気、赤外線、または半導体システム、装置もしくはデバイス、またはこれらの任意の組み合わせであってもよいが、これらに限定されない。コンピュータ可読媒体のより具体的な例としては、1本または複数の導線を有する電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能プログラマブル読み出し専用メモリ(EPROMもしくはフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み出し専用メモリ(CD−ROM)、光メモリ、磁気メモリ、またはこれらの任意の適切な組み合わせを含むことができるが、これらに限定されない。本発明において、コンピュータ可読媒体は、命令実行システム、装置もしくはデバイスによって使用可能な、またはそれらに組み込まれて使用可能なプログラムを包含または格納する任意の有形の媒体であってもよい。本発明において、コンピュータ可読信号媒体は、ベースバンド内で、またはキャリアの一部として伝搬される、コンピュータ可読プログラムコードが担持されたデータ信号を含んでもよい。このような伝搬されたデータ信号は、様々な形態をとることができ、電磁信号、光信号、またはこれらの任意の適切な組み合わせを含むことができるが、これらに限定されない。コンピュータ可読信号媒体は、更にコンピュータ可読記憶媒体以外の任意のコンピュータ可読媒体であってもよい。該コンピュータ可読媒体は、命令実行システム、装置もしくはデバイスによって使用されるか、またはそれらに組み込まれて使用されるプログラムを、送信、伝搬または転送することができる。コンピュータ可読媒体に含まれるプログラムコードは任意の適切な媒体で送信することができ、無線、有線、光ケーブル、RFなど、またはこれらの任意の適切な組み合わせを含むが、これらに限定されない。
本発明の動作を実行するためのコンピュータプログラムコードは、1種または複数のプログラミング言語、またはそれらの組み合わせで作成されることができ、前記プログラミング言語は、Java(登録商標)、Smalltalk、C++などのオブジェクト指向プログラミング言語と、「C」言語または同様のプログラミング言語などの従来の手続き型プログラミング言語とを含む。プログラムコードは、完全にユーザのコンピュータ上で実行され、部分的にユーザのコンピュータ上で実行され、独立したソフトウェアパッケージとして実行され、一部がユーザのコンピュータ上で一部がリモートコンピュータ上で実行され、または完全にリモートコンピュータまたはサーバ上で実行されてもよい。リモートコンピュータに関わる場合、リモートコンピュータは、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)を含む任意の種類のネットワークを介してユーザのコンピュータに接続されることができ、または外部のコンピュータに接続されることができる(例えばインターネットサービスプロバイダによりインターネットで接続される)。
図面におけるフローチャート及びブロック図は、本発明の各実施例に係るシステム、方法及びコンピュータプログラム製品により実現可能なアーキテクチャ、機能及び操作を示す。ここで、フローチャートまたはブロック図における各ブロックは、モジュール、プログラムセグメントもしくはコードの一部を表してもよく、該モジュール、プログラムセグメントもしくはコードの一部は、規定されたロジック機能を達成するための1つまたは複数の実行可能な命令を含む。なお、いくつかの代替実施態様において、ブロック内に示された機能は、図面に示された順番とは異なるもので実行されてもよい。例えば、連続して示された2つのブロックは、実際には関連する機能に応じて、ほぼ並行に実行されてもよく、逆の順番で実行されてもよい。なお、ブロック図および/またはフローチャートにおける各ブロック、並びに、ブロック図および/またはフローチャートにおけるブロックの組み合わせは、規定された機能もしくは動作を実行する、ハードウェアに基づく専用システムで実現されてもよく、または、専用ハードウェアとコンピュータ命令との組み合わせで実行されてもよい。
本発明の実施例に記載されたユニットは、ソフトウェアで実現されてもよく、ハードウェアで実現されてもよい。記載されたユニットは、プロセッサに設定されてもよく、例えば、「プロセッサは、取得ユニットと、抽出ユニットと、プッシュユニットとを備える」と記載されてもよい。ここで、これらのユニットの名称は、特定の場合において当該ユニットその自体を限定するものではなく、例えば、取得ユニットは、「ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得するユニット」であると記載されてもよい。
一方、本発明は、コンピュータ可読媒体を更に提供し、該コンピュータ可読媒体は、前記実施例に記載されたサーバに含まれるものであってもよく、独立に存在して該サーバに組み立てられていないものであってもよい。上記のコンピュータ可読媒体は、1つまたは複数のプログラムが格納されており、前記1つまたは複数のプログラムが該サーバによって実行されると、該サーバは、ユーザによって履歴検索データが選択されたことに応答して履歴検索データに対応するウェブページコンテンツを取得することと、ウェブページコンテンツを少なくとも1つのウェブページコンテンツセグメントに分割して、少なくとも1つのウェブページコンテンツセグメントのトピックを抽出することと、少なくとも1つのウェブページコンテンツセグメントのトピックに基づいてユーザに情報をプッシュすることとを実行する。
以上の記載は、本発明の好ましい実施例、および使用される技術的原理に関する説明に過ぎない。本発明に係る発明の範囲が、上記の技術的特徴の特定の組み合わせからなる技術案に限定されるものではなく、上記の本発明の趣旨を逸脱しない範囲で、上記の技術的特徴またはそれらの同等の特徴を任意に組み合わせてなる他の技術案も含むべきであることを、当業者に理解されたい。例えば、上記の特徴と、本発明に開示された(これに限定されない)類似の機能を有する技術的特徴とを互いに置き換えてなる技術案が挙げられる。

Claims (15)

  1. 情報をプッシュするための方法であって、
    ユーザによって履歴検索データが選択されたことに応答して、前記履歴検索データに対応するウェブページコンテンツを取得することと、
    前記ウェブページコンテンツを少なくとも1つのウェブページコンテンツセグメントに分割して、前記少なくとも1つのウェブページコンテンツセグメントのトピックを抽出することと、
    前記少なくとも1つのウェブページコンテンツセグメントのトピックに基づいて前記ユーザに情報をプッシュすることと
    を含む情報をプッシュするための方法。
  2. 前記少なくとも1つのウェブページコンテンツセグメントのトピックを抽出することは、
    前記少なくとも1つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントを事前訓練されたドキュメントトピック生成モデルに入力して、該ウェブページコンテンツセグメントのトピックを取得することを含む、請求項1に記載の方法。
  3. 前記少なくとも1つのウェブページコンテンツセグメントのトピックに基づいて前記ユーザに情報をプッシュすることは、
    前記少なくとも1つのウェブページコンテンツセグメントのトピックを前記ユーザにプッシュすることを含む、請求項1に記載の方法。
  4. 前記少なくとも1つのウェブページコンテンツセグメントのトピックに基づいて前記ユーザに情報をプッシュすることは、
    前記少なくとも1つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントのテキストと該ウェブページコンテンツセグメントのトピックとをマッチングさせて、トピックに一致したテキストを取得し、前記トピックに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成することと、
    前記テキスト効果が設けられたウェブページをユーザにプッシュすることと
    を含む、請求項1または3に記載の方法。
  5. 前記少なくとも1つのウェブページコンテンツセグメントのトピックに基づいて前記ユーザに情報をプッシュすることは、
    前記少なくとも1つのウェブページコンテンツセグメントのトピックに対して単語分割を実行し、単語分割結果に基づいて前記ウェブページコンテンツに対応する単語ベクトルを生成することと、
    前記ウェブページコンテンツに対応する単語ベクトルを、検索意図を予測するための事前訓練された意図予測モデルに入力して、前記ウェブページコンテンツに対応する検索意図を得ることと、
    前記ユーザのユーザ画像から関心タグ集合を抽出することと、
    前記ウェブページコンテンツに対応する検索意図を前記関心タグ集合内でマッチングさせて、検索意図に一致した関心タグを取得することと、
    前記ウェブページコンテンツのテキストと前記検索意図に一致した関心タグとをマッチングさせて、関心タグに一致したテキストを取得し、前記一致したテキストに事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成することと、
    前記テキスト効果が設けられたウェブページを前記ユーザにプッシュすることと
    を含む、請求項1に記載の方法。
  6. 前記意図予測モデルは、
    サンプル検索データと、サンプル検索データに対応するサンプル検索意図とを含む訓練サンプル集合を取得するステップと、
    前記訓練サンプル集合に基づいて、多層ニューラルネットワークを訓練して前記意図予測モデルを取得するステップと
    によって訓練される請求項5に記載の方法。
  7. 情報をプッシュするための装置であって、
    ユーザによって履歴検索データが選択されたことに応答して前記履歴検索データに対応するウェブページコンテンツを取得するように構成される取得ユニットと、
    前記ウェブページコンテンツを少なくとも1つのウェブページコンテンツセグメントに分割して、前記少なくとも1つのウェブページコンテンツセグメントのトピックを抽出するように構成される抽出ユニットと、
    前記少なくとも1つのウェブページコンテンツセグメントのトピックに基づいて前記ユーザに情報をプッシュするように構成されるプッシュユニットと
    を備える、情報をプッシュするための装置。
  8. 前記抽出ユニットは、更に、前記少なくとも1つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントを事前訓練されたドキュメントトピック生成モデルに入力して、該ウェブページコンテンツセグメントのトピックを取得するように構成される、請求項7に記載の装置。
  9. 前記プッシュユニットは、前記少なくとも1つのウェブページコンテンツセグメントのトピックを前記ユーザにプッシュするように構成される第1プッシュサブユニットを備える請求項7に記載の装置。
  10. 前記プッシュユニットは、
    前記少なくとも1つのウェブページコンテンツセグメントのうちのウェブページコンテンツセグメントについて、該ウェブページコンテンツセグメントのテキストと該ウェブページコンテンツセグメントのトピックとをマッチングさせて、トピックに一致したテキストを取得し、前記トピックに一致したテキストに対して事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成するように構成される第1生成サブユニットと、
    前記テキスト効果が設けられたウェブページをユーザにプッシュするように構成される第2プッシュサブユニットと
    を備える請求項7または9に記載の装置。
  11. 前記プッシュユニットは、
    前記少なくとも1つのウェブページコンテンツセグメントのトピックに対して単語分割を実行し、単語分割結果に基づいて前記ウェブページコンテンツに対応する単語ベクトルを生成するように構成される単語分割サブユニットと、
    前記ウェブページコンテンツに対応する単語ベクトルを、検索意図を予測するための事前訓練された意図予測モデルに入力して、前記ウェブページコンテンツに対応する検索意図を得るように構成される予測サブユニットと、
    前記ユーザのユーザ画像から関心タグ集合を抽出するように構成される抽出サブユニットと、
    前記ウェブページコンテンツに対応する検索意図を前記関心タグ集合内でマッチングさせて、検索意図に一致した関心タグを取得するように構成されるマッチングサブユニットと、
    前記ウェブページコンテンツのテキストと前記検索意図に一致した関心タグとをマッチングさせて、関心タグに一致したテキストを取得し、前記一致したテキストに事前設定テキスト効果を設け、テキスト効果が設けられたウェブページを生成するように構成される第2生成サブユニットと、
    前記テキスト効果が設けられたウェブページを前記ユーザにプッシュするように構成される第3プッシュサブユニットと
    を備える請求項7に記載の装置。
  12. 前記意図予測モデルは、
    サンプル検索データと、サンプル検索データに対応するサンプル検索意図とを含む訓練サンプル集合を取得するステップと、
    前記訓練サンプル集合に基づいて、多層ニューラルネットワークを訓練して前記意図予測モデルを取得するステップと
    によって訓練される請求項11に記載の装置。
  13. サーバであって、
    1つまたは複数のプロセッサと、
    1つまたは複数のプログラムが記憶される記憶装置と
    を備え、
    前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項1〜6のいずれか一項に記載の方法を実現させる、サーバ。
  14. コンピュータプログラムが記憶されるコンピュータ可読媒体であって、
    前記コンピュータプログラムがプロセッサによって実行されると、請求項1〜6のいずれか一項に記載の方法を実現する、コンピュータ可読媒体。
  15. コンピュータプログラムであって、
    前記コンピュータプログラムがプロセッサによって実行されると、請求項1〜6のいずれか一項に記載の方法を実現する、コンピュータプログラム。
JP2019105063A 2018-08-06 2019-06-05 情報をプッシュするための方法及び装置 Active JP6745384B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810887222.8A CN109165344A (zh) 2018-08-06 2018-08-06 用于推送信息的方法和装置
CN201810887222.8 2018-08-06

Publications (2)

Publication Number Publication Date
JP2020024674A JP2020024674A (ja) 2020-02-13
JP6745384B2 true JP6745384B2 (ja) 2020-08-26

Family

ID=64895164

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019105063A Active JP6745384B2 (ja) 2018-08-06 2019-06-05 情報をプッシュするための方法及び装置

Country Status (3)

Country Link
US (1) US11172040B2 (ja)
JP (1) JP6745384B2 (ja)
CN (1) CN109165344A (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114065011A (zh) * 2020-07-29 2022-02-18 苏州新谷产业园管理有限公司 一种基于人工智能的在线学习系统及方法
CN112153424B (zh) * 2020-09-23 2024-01-26 腾讯科技(深圳)有限公司 内容推送方法、装置、电子设备和存储介质
CN114357278B (zh) * 2020-09-28 2024-03-19 腾讯科技(深圳)有限公司 一种话题推荐方法、装置及设备
CN113626686A (zh) * 2021-07-19 2021-11-09 上海泛宥信息科技有限公司 基于用户数据分析的自动推送方法、装置和计算机设备
CN113705698B (zh) * 2021-08-31 2024-05-14 平安科技(深圳)有限公司 基于点击行为预测的信息推送方法及装置
CN114708008A (zh) * 2021-12-30 2022-07-05 北京有竹居网络技术有限公司 一种推广内容处理方法、装置、设备、介质及产品
CN114443847A (zh) * 2022-01-27 2022-05-06 北京字节跳动网络技术有限公司 文本分类、文本处理方法、装置、计算机设备及存储介质
CN114519153B (zh) * 2022-02-16 2023-09-29 北京百度网讯科技有限公司 一种网页历史记录显示方法、装置、设备及存储介质
CN114978889B (zh) * 2022-05-13 2024-04-16 厦门兆翔智能科技有限公司 一种机场企业服务总线系统
CN114997297B (zh) * 2022-05-26 2024-05-03 哈尔滨工业大学 一种基于多级区域划分的目标运动意图推理方法及系统
US20240152569A1 (en) * 2022-11-07 2024-05-09 International Business Machines Corporation Finding and presenting content relevant to a user objective
JP7520097B2 (ja) 2022-12-20 2024-07-22 Lineヤフー株式会社 判定装置、判定方法および判定プログラム

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6691106B1 (en) * 2000-05-23 2004-02-10 Intel Corporation Profile driven instant web portal
US7284008B2 (en) * 2000-08-30 2007-10-16 Kontera Technologies, Inc. Dynamic document context mark-up technique implemented over a computer network
JP2005202766A (ja) * 2004-01-16 2005-07-28 National Institute Of Information & Communication Technology 類似コンテンツの同時提示システム
US7299407B2 (en) * 2004-08-24 2007-11-20 International Business Machines Corporation Marking and annotating electronic documents
JP2006309509A (ja) * 2005-04-28 2006-11-09 Nippon Telegr & Teleph Corp <Ntt> 閲覧画面再利用装置、閲覧画面再利用プログラム、及び記録媒体
US20060259462A1 (en) * 2005-05-12 2006-11-16 Sybase, Inc. System and Methodology for Real-time Content Aggregation and Syndication
US8204950B2 (en) * 2005-09-15 2012-06-19 Qwest Communications International Inc. Webpage search
US20070239682A1 (en) * 2006-04-06 2007-10-11 Arellanes Paul T System and method for browser context based search disambiguation using a viewed content history
US20080022216A1 (en) * 2006-07-21 2008-01-24 Duval John J Method and system for obtaining primary search terms for use in conducting an internet search
US7783622B1 (en) * 2006-07-21 2010-08-24 Aol Inc. Identification of electronic content significant to a user
JP4935396B2 (ja) * 2007-02-09 2012-05-23 日本電気株式会社 Webコンテンツ提供装置、Webコンテンツ提供方法およびプログラム
US20090089246A1 (en) * 2007-09-28 2009-04-02 Yahoo! Inc. System and method for history clustering
US8090740B2 (en) * 2007-10-16 2012-01-03 Microsoft Corp. Search-centric hierarchichal browser history
US10867123B2 (en) * 2009-11-09 2020-12-15 Microsoft Technology Licensing, Llc Social browsing
CN101739407A (zh) * 2008-11-19 2010-06-16 日电(中国)有限公司 自动构建用于相关信息浏览的信息组织结构的方法和系统
US9405841B2 (en) * 2009-10-15 2016-08-02 A9.Com, Inc. Dynamic search suggestion and category specific completion
US8359193B2 (en) * 2009-12-31 2013-01-22 International Business Machines Corporation Pre-highlighting text in a semantic highlighting system
US8600967B2 (en) * 2010-02-03 2013-12-03 Apple Inc. Automatic organization of browsing histories
US8392435B1 (en) * 2010-04-14 2013-03-05 Google Inc. Query suggestions for a document based on user history
US9310879B2 (en) * 2011-11-09 2016-04-12 Xerox Corporation Methods and systems for displaying web pages based on a user-specific browser history analysis
US9201868B1 (en) * 2011-12-09 2015-12-01 Guangsheng Zhang System, methods and user interface for identifying and presenting sentiment information
US9336321B1 (en) * 2012-01-26 2016-05-10 Amazon Technologies, Inc. Remote browsing and searching
JP5905638B2 (ja) * 2012-04-11 2016-04-20 インテル コーポレイション ユーザ・インターフェース・コンテンツ個人別最適化システム
US20160283055A1 (en) * 2013-12-20 2016-09-29 Intel Corporation Customized contextual user interface information displays
US20150331240A1 (en) * 2014-05-15 2015-11-19 Adam G. Poulos Assisted Viewing Of Web-Based Resources
US20160012104A1 (en) * 2014-07-11 2016-01-14 Yahoo!, Inc. Search interfaces with preloaded suggested search queries
WO2016197316A1 (en) * 2015-06-09 2016-12-15 Yahoo! Inc. Method and system for sponsored search results placement in a search results page
CN104965905B (zh) * 2015-06-30 2018-05-04 北京奇虎科技有限公司 一种网页分类的方法和装置
US20170193118A1 (en) * 2015-10-14 2017-07-06 Jerry Edward Pratt Search Engine with Easy Marking of Relevant and Irrelevant Links, and Summary and Sharing of Searches
CN106960030B (zh) * 2017-03-21 2020-11-10 北京百度网讯科技有限公司 基于人工智能的推送信息方法及装置
CN107220386B (zh) 2017-06-29 2020-10-02 北京百度网讯科技有限公司 信息推送方法和装置
CN107766328B (zh) * 2017-10-24 2020-06-12 平安科技(深圳)有限公司 结构化文本的文本信息提取方法、存储介质和服务器
CN107908789A (zh) * 2017-12-12 2018-04-13 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN108052613B (zh) * 2017-12-14 2021-12-31 北京百度网讯科技有限公司 用于生成页面的方法和装置
US20180260481A1 (en) * 2018-04-01 2018-09-13 Yogesh Rathod Displaying search result associated identified or extracted unique identity associated structured contents or structured website
US11138276B2 (en) * 2018-06-27 2021-10-05 At&T Intellectual Property I, L.P. Method and apparatus for generating a search query for a search engine

Also Published As

Publication number Publication date
JP2020024674A (ja) 2020-02-13
CN109165344A (zh) 2019-01-08
US11172040B2 (en) 2021-11-09
US20200045122A1 (en) 2020-02-06

Similar Documents

Publication Publication Date Title
JP6745384B2 (ja) 情報をプッシュするための方法及び装置
KR102354716B1 (ko) 딥 러닝 모델을 이용한 상황 의존 검색 기법
US20190188326A1 (en) Domain specific natural language understanding of customer intent in self-help
US9910930B2 (en) Scalable user intent mining using a multimodal restricted boltzmann machine
CN112231569B (zh) 新闻推荐方法、装置、计算机设备及存储介质
US11429405B2 (en) Method and apparatus for providing personalized self-help experience
US10762083B2 (en) Entity- and string-based search using a dynamic knowledge graph
CN109241403B (zh) 项目推荐方法、装置、机器设备和计算机可读存储介质
WO2023065211A1 (zh) 一种信息获取方法以及装置
US10606910B2 (en) Ranking search results using machine learning based models
US20180137589A1 (en) Contextual personalized list of recommended courses
US9767417B1 (en) Category predictions for user behavior
US11651015B2 (en) Method and apparatus for presenting information
WO2017173773A1 (zh) 信息搜索方法和装置
Jiang et al. Cloud service recommendation based on unstructured textual information
US10042944B2 (en) Suggested keywords
US9767204B1 (en) Category predictions identifying a search frequency
JP2015162244A (ja) 発話ワードをランク付けする方法、プログラム及び計算処理システム
CN113806588B (zh) 搜索视频的方法和装置
CN113688310B (zh) 一种内容推荐方法、装置、设备及存储介质
US20190026281A1 (en) Method and apparatus for providing information by using degree of association between reserved word and attribute language
US20190347068A1 (en) Personal history recall
EP4162372A1 (en) Generating a graph data structure that identifies relationships among topics expressed in web documents
US10474670B1 (en) Category predictions with browse node probabilities
US10387934B1 (en) Method medium and system for category prediction for a changed shopping mission

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190807

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200728

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200722

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200803

R150 Certificate of patent or registration of utility model

Ref document number: 6745384

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250