JP6511487B2 - 情報プッシュ用の方法及び装置 - Google Patents

情報プッシュ用の方法及び装置 Download PDF

Info

Publication number
JP6511487B2
JP6511487B2 JP2017108224A JP2017108224A JP6511487B2 JP 6511487 B2 JP6511487 B2 JP 6511487B2 JP 2017108224 A JP2017108224 A JP 2017108224A JP 2017108224 A JP2017108224 A JP 2017108224A JP 6511487 B2 JP6511487 B2 JP 6511487B2
Authority
JP
Japan
Prior art keywords
phrase
frequency
candidate keyword
target text
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017108224A
Other languages
English (en)
Other versions
JP2018106658A (ja
Inventor
ティアン ウェイ
ティアン ウェイ
ウェンカイ ダイ
ウェンカイ ダイ
カイ サン
カイ サン
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド, バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Publication of JP2018106658A publication Critical patent/JP2018106658A/ja
Application granted granted Critical
Publication of JP6511487B2 publication Critical patent/JP6511487B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本願はコンピュータ技術分野に関し、具体的にインターネット技術分野に関し、特に情報をプッシュするための方法及び装置に関する。
検索広告はインターネット商業の換金可能な市場を構成する重要な一部である。インターネットユーザが検索する問題と広告主が購買したキーワードとの関連度をマッチングすることによって、検索エンジンはインターネットユーザへ彼らが興味を持つ可能性がある広告を表示し、インターネットユーザのクリックで広告主から所定の費用を請求することによって、検索エンジン、インターネットユーザ、広告主の三方のウィンウィン(tripartite win-win)を実現する。この過程で、広告主が購買したキーワードは三方を結びつける重要な絆である。従って、適切なキーワードをどのように選択するかは、多くの広告主と検索エンジンマーケティング(Search Engine Marketing、SEM)会社が直面している基本的な問題の1つである。
しかしながら、従来のキーワード選別方式は通常、広告主が購買したワードから見て、それらと候補キーワードとの字面の関連性(literal relevance)を、広告主サービスと候補キーワードとの関連性として計算するが、このような方式は精度が低いという問題が存在する。
本願は、改良された情報をプッシュするための方法及び装置を提供することで、以上の背景技術に記載の技術的問題を解決することを目的とする。
第1態様では、本願は情報をプッシュするための方法を提供し、この方法は、ターゲットテキストを単語分割して、フレーズの集合を生成するステップと、フレーズの集合における各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度を計算するステップと、予め設定した候補キーワードと各フレーズとの類似度を取得するステップと、各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度と、候補キーワードと各フレーズとの類似度とに基づいて、候補キーワードとターゲットテキストとの関連度を計算するステップと、予め設定した関連度閾値に基づいて、又は関連度と予め設定したプッシュ数とに基づいて、候補キーワードからプッシュしようとする候補キーワードを選択し、第1ユーザ端末へプッシュしようとする候補キーワードをプッシュするステップと、を含む。
いくつかの実施例では、各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度と、候補キーワードと各フレーズとの類似度とに基づいて、候補キーワードとターゲットテキストとの関連度を計算するステップにおいては、フレーズの集合における各フレーズに対して、候補キーワードと当該フレーズとの類似度に当該フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度を乗じ、得られた各積を加算し、候補キーワードとターゲットテキストとの関連度を取得するステップを含む。
いくつかの実施例では、第1ユーザ端末へプッシュしようとする候補キーワードをプッシュした後に、さらに、プッシュしようとする候補キーワードとターゲットテキストの対応関係を確立するステップと、プッシュしようとする候補キーワードに対する第2ユーザ端末の検索操作を検出したことに応答して、第2ユーザ端末へプッシュしようとする候補キーワードに対応するテキストをプッシュするステップと、を含む。
いくつかの実施例では、フレーズの集合における各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度を計算するステップにおいては、各フレーズが予め設定したテキスト集合に出現した逆文書頻度を統計するステップと、各フレーズがターゲットテキストに出現した頻度を統計するステップと、逆文書頻度と頻度との積を各フレーズの単語の出現頻度-逆文書頻度として計算するステップと、を含む。
いくつかの実施例では、フレーズの集合を生成した後に、さらに、フレーズの集合におけるストップワードを削除するステップを含む。
第2態様では、本願は、情報をプッシュするための装置を提供し、この装置は、ターゲットテキストを単語分割して、フレーズの集合を生成するように配置されている生成ユニットと、フレーズの集合における各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度を計算するように配置されている第1計算ユニットと、予め設定した候補キーワードと各フレーズとの類似度を取得するように配置されている取得ユニットと、各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度と、候補キーワードと各フレーズとの類似度とに基づいて、候補キーワードとターゲットテキストとの関連度を計算するように配置されている第2計算ユニットと、予め設定した関連度閾値に基づいて、又は関連度と予め設定したプッシュ数とに基づいて、候補キーワードからプッシュしようとする候補キーワードを選択し、第1ユーザ端末へプッシュしようとする候補キーワードをプッシュするように配置されている第1プッシュユニットと、を備える。
いくつかの実施例では、第2計算ユニットは、さらに、フレーズの集合における各フレーズに対して、候補キーワードと当該フレーズとの類似度に当該フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度を乗じ、得られた各積を加算し、候補キーワードとターゲットテキストとの関連度を取得するように配置されている。
いくつかの実施例では、当該装置は、さらに、プッシュしようとする候補キーワードとターゲットテキストとの対応関係を確立するように配置されている確立ユニットと、プッシュしようとする候補キーワードに対する第2ユーザ端末の検索操作を検索したことに応答して、第2ユーザ端末へプッシュしようとする候補キーワードに対応するテキストをプッシュするように配置されている第2プッシュユニットと、さらにを備える。
いくつかの実施例では、第1計算ユニットは、各フレーズが予め設定したテキスト集合に出現した逆文書頻度を統計するように配置されている第1統計モジュールと、各フレーズがターゲットテキストに発生した頻度を統計するように配置されている第2統計モジュールと、逆文書頻度と頻度との積を各フレーズの単語の出現頻度-逆文書頻度として計算するように配置されている計算モジュールと、を備える。
いくつかの実施例では、フレーズの集合におけるストップワードを削除するように配置されている削除ユニットをさらに備える。
本願に係る情報プッシュ用の方法及び装置は、ターゲットテキストでの各フレーズと候補キーワードとの類似度及び各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度に基づいて、各候補キーワードとターゲットテキストとの関連度を得て、関連度に基づいて情報プッシュを行うことによって、情報プッシュの精度を向上させる。
以下の図面を参照しながら行った非限定的な実施例についての詳細な説明に基づいて、本願の他の特徴、目的や利点はより明瞭になる。
本願を適用できる例示的なシステムアーキテクチャー図である。 本願に係る情報プッシュ用の方法の一実施例のフローチャートである。 本願に係る情報プッシュ用の方法の別実施例のフローチャートである。 本願に係る情報プッシュ用の装置の一実施例の構造模式図である。 本願の実施例を実現するための端末装置又はサーバに適用されるコンピュータシステムを示す構造模式図である。
以下、図面及び実施例を参照しながら本発明をより詳細に説明する。ここで説明する具体的な実施例は、かかる発明を説明するものに過ぎず、当該発明を限定するものではないと理解すべきである。ただし、説明の便宜上、図面に発明に関連する部分のみが示されている。
なお、衝突しない場合、本願の実施例及び実施例の特徴を相互に組み合せてもよい。以下、図面及び実施例を参照しながら本願を詳細に説明する。
図1は本願を適用できる、プッシュ用の方法又はプッシュ用の装置の実施例の例示的なシステムアーキテクチャー100である。
図1に示されるように、システムアーキテクチャー100は、端末装置101、102、103、ネットワーク104及びサーバ105を備えてもい。ネットワーク104は端末装置101、102、103とサーバ104の間に通信リンクを提供する媒体に用いられている。ネットワーク104は様々な接続タイプ、例えば有線、無線通信リンク又は光ファイバーケーブルなどを含んでもよい。
ユーザ110は端末装置101、102、103を用いてネットワーク104を介してサーバ105とインタラクションして、それによりメッセージなどを送受信することができる。端末装置101、102、103に、様々な通信クライアントアプリケーション、例えば、ショッピングアプリケーション、捜索アプリケーション、ウェブブラウザアプリケーション、インスタントメッセージツール、電子メールクライアント、ソーシャルプラットフォームソフト、支払ソフトなどがインストールされてもよい。
端末装置101、102、103はディスプレイを有するとともにデータ送受信をサポートする様々な電子デバイスであってもよく、スマートフォン、タブレットPC、スマートウォッチ、ラップトップ型コンピュータ及びデスクトップコンピュータなどを含むが、それらに限定されるものではない。端末装置101、102、103は広告主がある第1ユーザ端末であってもよく、検索ユーザがある第2ユーザ端末であってもよい。
スケジューリングサーバ105は様々なサービスを提供するサーバ、例えば、ターゲットテキストと候補キーワードをサポートするバックグラウンドサーバであってもよい。バックグラウンドサーバはターゲットテキストと候補キーワードに分析などの処理を行って、処理結果(例えばプッシュしようとするキーワード)を端末装置にフィードバックすることができる。
本願の実施例に係る情報プッシュ用の方法は通常にサーバ105で実行される。それに対応して、情報プッシュ用の装置は通常にサーバ105に設置されることを理解すべきである。
なお、図1における端末装置、ネットワーク及びサーバの数は例示的なものに過ぎない。必要に応じて、端末装置、ネットワーク及びサーバの数が任意であってもよい。
次に、本願に係る情報プッシュ用の方法の一実施例のプロセス200を示す図2を参照する。当該情報プッシュ用の方法は、ステップ201〜205を含む。
ステップ201:ターゲットテキストを単語分割して、フレーズの集合を生成する。
ステップ202:フレーズの集合における各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度を計算する。
本実施例では、上記電子機器はステップ201において生成したフレーズの集合における各フレーズの上記ターゲットテキストでの単語の出現頻度逆文書頻度(単語の出現頻度-逆文書頻度(Term Frequency-Inverse Document Frequency、TF-IDF)と呼ばれてもよい)を計算し、すなわち各フレーズの上記ターゲットテキストに対する重要性を計算する。上記単語の出現頻度-逆文書頻度方法の主旨は、ある単語又はフレーズが1つの文章に出現した頻度(Term Frequency、TF)が高く、且つほかの文章に非常にめったに出現しない場合、この単語又はフレーズが非常に良好なカテゴリ区分能力を有し、分類に適すると考えられる。逆文書頻度(Inverse Document Frequency、IDF)については、主に、ある単語又はフレーズを含むドキュメントが少なければ少ないほど、IDFが大きくなり、当該単語又はフレーズが非常に良好なカテゴリ区分能力を有することでなる。したがって、単語の出現頻度-逆文書頻度方法を用いることで、ある単語又はフレーズのある文章内での重要性を計算できる。
本実施例のいくつかの好ましい実施形態では、上記電子機器、先ず各フレーズが予め設定したテキスト集合に出現した逆文書頻度を統計してもよく、テキスト集合におけるすべてのテキストを単語分割し、各フレーズがすべてのテキストのフレーズの集合に出現した逆文書頻度を統計してもよく、予め設定したテキスト集合における、各フレーズのそれぞれを含むテキストの数を統計してもよく、それから、すべてのテキスト数を当該フレーズを含むテキストの数で割って当該フレーズの逆文書頻度を得て、ここで、上記ターゲットテキストが広告コンセプトテキストである場合、上記テキスト集合はすべての広告コンセプトテキストで構成される集合であってもよく、上記ターゲットテキストとの関連度が予め設定した関連度閾値より大きい広告コンセプトテキストで構成される集合であってもよく、上記ターゲットテキストが所属するユーザのアカウントにおけるすべての広告コンセプトテキストで構成される集合であってもよい。次に、上記電子機器は各フレーズの上記テキスト集合に出現した頻度を統計し、最終的に、上記統計した逆文書頻度と上記統計した頻度との積を当該ワードの単語の出現頻度-逆文書頻度とすることができる。
ステップ203:予め設定した候補キーワードと各フレーズとの類似度を取得する。
本実施例では、上記電子機器は、先ず例えば推薦アルゴリズム(例えば、協調フィルタリング(Collaborative Filtering)アルゴリズム、コンテンツベースの推薦アルゴリズムなど)で、予め設定した候補キーワードを取得でき、例えば、協調フィルタリングアルゴリズムでユーザの候補キーワードを取得する場合、通常、先ずキーワードに対するユーザの履歴行為データ、例えばユーザの購買履歴、フォロー、お気に入りに追加する行為、評価や採点行為などを収集し、次に、ユーザの履歴行為データに基づいて類似度アルゴリズム(例えば、ユークリッド距離(Euclidean distance)、ピアソン相関係数(Pearson Correlation Coefficient)など)で当該ユーザとほかのユーザとの類似度、又はユーザが興味を持つキーワードとほかのキーワードとの類似度を計算し、最終的に、キーワードに対する当該ユーザの好みに基づいて当該ユーザと同じ好みを有する近傍ユーザを探し、次に近傍ユーザが興味を持つキーワードを候補キーワードとして、又は当該ユーザが興味を持つキーワードとの類似度が高いほかのキーワードを候補キーワードとすることができる。それから、上記候補キーワードと各フレーズに対してコサイン類似度(cosine similarity)アルゴリズムなどの公知の類似度計算方法で類似度計算を行ってもよい。
ステップ204:各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度と、候補キーワードと各フレーズとの類似度とに基づいて、候補キーワードとターゲットテキストとの関連度を計算する。
本実施例では、上記電子機器はステップ202において計算した各フレーズの上記ターゲットテキストでの単語の出現頻度-逆文書頻度、及びステップ203において取得した候補キーワードと各フレーズとの類似度に基づいて、当該候補キーワードとターゲットテキストとの関連度を計算するようにしてもよい。例として、単語の出現頻度-逆文書頻度が最大のフレーズの単語の出現頻度-逆文書頻度と、候補キーワードと当該フレーズとの類似度との積を当該候補キーワードとターゲットテキストとの関連度としてもよく、単語の出現頻度-逆文書頻度が予め設定した頻度閾値より大きい各フレーズのそれぞれの単語の出現頻度-逆文書頻度に当該候補キーワードと当該フレーズとの類似度を乗じ、積を加算して当該候補キーワードとターゲットテキストとの関連度を取得するようにしてもよい。
本実施例のいくつかの選択可能な実施形態では、上記テキスト集合における各フレーズに対して、候補キーワードと当該ワードとの類似度に当該ワードの上記ターゲットテキストでの単語の出現頻度-逆文書頻度を乗じ、得られた各積を加算し、上記候補キーワードと上記ターゲットテキストとの関連度を取得することができ、下記式(1)により候補キーワードとターゲットテキストとの関連度を計算することができる。
ステップ205:予め設定した関連度閾値に基づいて、又は関連度と予め設定したプッシュ数とに基づいて、候補キーワードからプッシュしようとする候補キーワードを選択し、第1ユーザ端末へプッシュしようとする候補キーワードをプッシュする。
本実施例では、ステップ204において各候補キーワードと上記ターゲットテキストとの関連度を計算した後に、上記電子機器は候補キーワードから予め設定した関連度閾値より大きい候補キーワードをプッシュしようとする候補キーワードとして選択してもよく、関連度の降順に従って候補キーワードから予め設定したプッシュ数の候補キーワードをプッシュしようとする候補キーワードとして選択してもよく、次に、第1ユーザ端末へ上記プッシュしようとする候補キーワードをプッシュする。例として、第1ユーザ端末が広告主である場合、上記電子機器は広告主へプッシュしようとする候補キーワードをプッシュすることができ、これによって、上記広告主が候補キーワードを購買に供する。
本願の上記実施例に係る方法はターゲットテキストでの各フレーズと候補キーワードとの類似度及び各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度に基づいて、各候補キーワードとターゲットテキストとの関連度を得て、関連度に基づいて情報をプッシュすることによって、情報プッシュの精度を向上させる。
さらに、情報プッシュ用の方法の別の実施例のプロセス300を示す図3を参照する。当該情報プッシュ用の方法のプロセス300は、ステップ301〜ステップ308を含む。
ステップ301:ターゲットテキストを単語分割して、フレーズの集合を生成する。
本実施例では、情報プッシュ用の方法を実行する電子機器(例えば図1に示されるサーバ)は予め取得したターゲットテキスト(例えば、広告コンセプトテキスト)を有線接続又は無線接続で単語分割し、フレーズの集合を生成することができる。上記電子機器は多種の単語分割方法でターゲットテキストを単語分割でき、単語分割方法は辞書に基づく単語分割方法(例えば、最大マッチングアルゴリズム、隣接マッチングアルゴリズム、最短パスマッチングアルゴリズム及び統計に基づく最短パス単語分割アルゴリズムなど)、統計に基づく単語分割方法(例えば、N-グラムモデル又は隠れマルコフモデルを用いる統計単語分割方法)、ルールに基づく単語分割方法や人工知能技術に基づく中国語単語分割方法などを含むが、それらに制限されない。
ステップ302:フレーズの集合における各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度を計算する。
本実施例では、上記電子機器はステップ301において生成したフレーズの集合における各フレーズの上記ターゲットテキストでの単語の出現頻度逆文書頻度(単語の出現頻度-逆文書頻度と呼ばれてもよい)を計算し、すなわち各フレーズの上記ターゲットテキストに対する重要性を計算する。上記単語の出現頻度-逆文書頻度方法の主旨は、ある単語又はフレーズが1つの文章に出現した頻度が高く、且つほかの文章に非常にめったに出現しない場合、この単語又はフレーズが非常に良好なカテゴリ区分能力を有し、分類に適すると考えられる。逆文書頻度については、主に、ある単語又はフレーズを含むドキュメントが少なければ少ないほど、IDFが大きくなり、当該単語又はフレーズが非常に良好なカテゴリ区分能力を有することでなる。したがって、単語の出現頻度-逆文書頻度方法を用いることで、ある単語又はフレーズのある文章内での重要性を計算できる。
ステップ303:予め設定した候補キーワードと各フレーズとの類似度を取得する。
本実施例では、上記電子機器は、先ず例えば推薦アルゴリズム(例えば、協調フィルタリングアルゴリズム、コンテンツベースの推薦アルゴリズムなど)で、予め設定した候補キーワードを取得でき、例えば、協調フィルタリングアルゴリズムでユーザの候補キーワードを取得する場合、通常、先ずキーワードに対するユーザの履歴行為データ、例えばユーザの購買履歴、フォロー、お気に入りに追加する行為、評価や採点行為などを収集し、次に、ユーザの履歴行為データに基づいて類似度アルゴリズム(例えば、ユークリッド距離、ピアソン相関係数など)で当該ユーザとほかのユーザとの類似度、又はユーザが興味を持つキーワードとほかのキーワードとの類似度を計算し、最終的に、キーワードに対する当該ユーザの好みに基づいて当該ユーザと同じ好みを有する近傍ユーザを探し、次に近傍ユーザが興味を持つキーワードを候補キーワードとして、又は当該ユーザが興味を持つキーワードとの類似度が高いほかのキーワードを候補キーワードとすることができる。それから、上記候補キーワードと各フレーズに対してコサイン類似度アルゴリズムなどの公知の類似度計算方法で類似度計算を行ってもよい。
ステップ304:各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度、候補キーワードと各フレーズの類似度に基づいて、候補キーワードとターゲットテキストの関連度を計算する。
本実施例では、上記電子機器はステップ302において計算した各フレーズの上記ターゲットテキストでの単語の出現頻度-逆文書頻度と、ステップ303において取得した候補キーワードと各フレーズとの類似度に基づいて、当該候補キーワードとターゲットテキストとの関連度を計算するようにしてもよい。例として、さらに上記候補キーワードとの類似度が予め設定した類似度閾値より大きい各フレーズのそれぞれの類似度に当該フレーズの単語の出現頻度-逆文書頻度を乗じ、積を加算して当該候補キーワードとターゲットテキストとの関連度を取得するようにしてもよい。
ステップ305:予め設定した関連度閾値に基づいて、又は関連度と予め設定したプッシュ数とに基づいて、候補キーワードからプッシュしようとする候補キーワードを選択する。
本実施例では、ステップ304において各候補キーワードと上記ターゲットテキストとの関連度を計算した後に、上記電子機器は候補キーワードから予め設定した関連度閾値より大きい候補キーワードをプッシュしようとする候補キーワードとして選択してもよく、関連度の降順に従って候補キーワードから予め設定したプッシュ数の候補キーワードをプッシュしようとする候補キーワードとして選択してもよい。
ステップ306:プッシュしようとする候補キーワードとターゲットテキストとの対応関係を確立する。
本実施例では、上記電子機器はステップ305で選択されたプッシュしようとする候補キーワードと上記ターゲットテキストとの対応関係を確立でき、1つのターゲットテキストは複数のプッシュしようとする候補キーワードに対応してもよく、1つのプッシュしようとする候補キーワードは複数のテキストに対応してもよい。
ステップ307:プッシュしようとする候補キーワードに対する第2ユーザ端末の検索操作を検出したことに応答して、第2ユーザ端末へプッシュしようとする候補キーワードに対応するテキストをプッシュする。
図3から分かるように、図2に対応する実施例に比べて、本実施例における情報プッシュ用の方法のプロセス300はプッシュしようとする候補キーワードとターゲットテキストとの対応関係を確立するステップ306、及びプッシュしようとする候補キーワードに対する第2ユーザ端末の検索操作を検出したことに応答して、第2ユーザ端末へプッシュしようとする候補キーワードに対応するテキストをプッシュするステップ307を強調する。したがって、本実施例で説明した手段は、検索側が検索する時に、プッシュしようとする候補キーワードに対応するテキストに対するプッシュに用いられるため、さらに情報プッシュの精度を向上させる。
さらに図4参照し、上記各図に示す方法の実現として、本願はプッシュ用の装置の一実施例を提供し、当該装置の実施例は図2に示される方法の実施例に対応し、当該装置は具体的に各種の電子機器に適用できる。
図4に示すように、本実施例の情報プッシュ用の装置400は、生成ユニット401、第1計算ユニット402、取得ユニット403、第2計算ユニット404及び第1プッシュユニット405を備える。生成ユニット401はターゲットテキストを単語分割して、フレーズの集合を生成するように配置され、第1計算ユニット402はフレーズの集合における各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度を計算するように配置され、取得ユニット403は予め設定した候補キーワードと各フレーズとの類似度を取得するように配置され、第2計算ユニット404は各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度と、候補キーワードと各フレーズとの類似度とに基づいて、候補キーワードとターゲットテキストとの関連度を計算するように配置され、第1プッシュユニット405は予め設定した関連度閾値に基づいて、又は関連度と予め設定したプッシュ数とに基づいて、候補キーワードからプッシュしようとする候補キーワードを選択し、第1ユーザ端末へプッシュしようとする候補キーワードをプッシュするように配置されている。
本実施例では、情報プッシュ用の装置400の生成ユニット401は予め取得したターゲットテキストを有線接続又は無線接続で単語分割し、フレーズの集合を生成することができる。上記電子機器は多種の単語分割方法でターゲットテキストを単語分割することができ、単語分割方法は、辞書に基づく単語分割方法、統計に基づく単語分割方法、ルールに基づく単語分割方法や、人工知能技術に基づく中国語単語分割方法などを含むが、それらに制限されない。
本実施例では、上記第1計算ユニット402は、上記生成ユニット401が生成したフレーズの集合における各フレーズの上記ターゲットテキストでの単語の出現頻度逆文書頻度(単語の出現頻度-逆文書頻度と呼ばれてもよい)を計算でき、すなわち各フレーズの上記ターゲットテキストに対する重要性を計算する。上記用語頻度-逆文書頻度方法の主旨は、ある単語又はフレーズが1つの文章に発生した頻度が高く、ほかの文章に非常に少なく発生する場合、この単語又はフレーズが非常に良好なカテゴリ区分能力を有し、分類に適すると考えられる。逆文書頻度については、主に、ある単語又はフレーズを含むドキュメントが少なければ少ないほど、IDFが大きくなり、当該単語又はフレーズが非常に良好なカテゴリ区分能力を有することでなる。したがって、単語の出現頻度-逆文書頻度方法を用いることで、ある単語又はフレーズのある文章内での重要性を計算できる。
本実施例では、上記取得ユニット403は、先ず例えば推薦アルゴリズムで予め設定した候補キーワードを取得でき、例えば、協調フィルタリングアルゴリズムでユーザの候補キーワードを取得する場合、通常、先ずキーワードに対するユーザの履歴行為データ、例えばユーザの購買履歴、フォロー、お気に入りに追加する行為、評価や採点行為などを収集し、次に、ユーザの履歴行為データに基づいて類似度アルゴリズムで当該ユーザとほかのユーザとの類似度、又はユーザが興味を持つキーワードとほかのキーワードとの類似度を計算し、最終的に、キーワードに対する当該ユーザの好みに基づいて当該ユーザと同じ好みを有する近傍ユーザを探し、次に近傍ユーザが興味を持つキーワードを候補キーワードとして、又は当該ユーザが興味を持つキーワードとの類似度が高いほかのキーワードを候補キーワードとすることができる。それから、上記候補キーワードと各フレーズに対してコサイン類似度アルゴリズムなどの公知の類似度計算方法で類似度計算を行ってもよい。
本実施例では、上記第2計算ユニット404は上記第1計算ユニット402が計算した各フレーズの上記ターゲットテキストでの単語の出現頻度-逆文書頻度と、上記取得ユニット403が取得した候補キーワードと各フレーズの類似度とに基づいて、当該候補キーワードとターゲットテキストとの関連度を計算することができる。例として、単語の出現頻度-逆文書頻度が最大のフレーズの単語の出現頻度-逆文書頻度と、候補キーワードと当該フレーズとの類似度との積を当該候補キーワードとターゲットテキストとの関連度としてもよく、単語の出現頻度-逆文書頻度が予め設定した頻度閾値より大きい各フレーズにおける各フレーズの単語の出現頻度-逆文書頻度に当該候補キーワードと当該フレーズとの類似度を乗じ、積を加算して当該候補キーワードとターゲットテキストとの関連度を取得するようにしてもよい。
本実施例では、上記第2計算ユニット404で各候補キーワードと上記ターゲットテキストとの関連度が計算された後に、上記第1プッシュユニット405は候補キーワードから予め設定した関連度閾値より大きい候補キーワードをプッシュしようとする候補キーワードとして選択してもよく、関連度の降順に従って候補キーワードから予め設定したプッシュ数の候補キーワードをプッシュしようとする候補キーワードとして選択してもよく、次に、第1ユーザ端末へ上記プッシュしようとする候補キーワードをプッシュする。
本実施例のいくつかの選択可能な実施形態では、上記テキスト集合における各フレーズに対して、上記第2計算ユニット404は候補キーワードと当該ワードとの類似度に当該ワードの上記ターゲットテキストでの単語の出現頻度-逆文書頻度を乗じ、得られた各積を加算し、上記候補キーワードと上記ターゲットテキストとの関連度を取得することができ、上記第2計算ユニット404は下記式(1)によって候補キーワードとターゲットテキストとの関連度を計算できる。
本実施例のいくつかの好ましい実施形態では、情報プッシュ用の装置400はさらに、確立ユニット407と第2プッシュユニット408を備えてもよい。上記確立ユニット407は上記第1プッシュユニット405から選択されたプッシュしようとする候補キーワードと上記ターゲットテキストとの対応関係を確立でき、ここで、1つのターゲットテキストは複数のプッシュしようとする候補キーワードに対応してもよく、1つのプッシュしようとする候補キーワードは複数のテキストに対応してもよい。プッシュしようとする候補キーワードに対する第2ユーザ端末の検索操作を検出した場合、上記第2プッシュユニット408は上記第2ユーザ端末へそれが検索したプッシュしようとする候補キーワードに対応するテキストをプッシュすることができる。上記第2プッシュユニット408は、先ず第2ユーザ端末が検索したプッシュしようとする候補キーワードに対応するテキスト集合を取得し、次に、検索したプッシュしようとする候補キーワードに対応するすべてのテキストをプッシュしてもよく、上記プッシュしようとする候補キーワードに対応するテキスト集合における予め設定した数のテキストをプッシュしてもよい。
本実施例のいくつかの好ましい実施形態では、上記第1計算ユニット402は第1統計モジュール4021、第2統計モジュール4022及び計算モジュール4023を備えてもよい。ここで、上記第1統計モジュール4021は先ず各フレーズが予め設定したテキスト集合に出現した逆文書頻度を統計してもよく、テキスト集合におけるすべてのテキストを単語分割し、各フレーズがすべてのテキストのフレーズの集合に出現した逆文書頻度を統計してもよく、予め設定したテキスト集合において各フレーズのそれぞれを含むテキストの数を統計してもよく、次にすべてのテキスト数を当該フレーズを含むテキストの数で割って当該フレーズの逆文書頻度を得て、上記ターゲットテキストが広告コンセプトテキストである場合、上記テキスト集合はすべての広告コンセプトテキストで構成される集合であってもよく、上記ターゲットテキストとの関連度が予め設定した関連度閾値より大きい広告コンセプトテキストで構成される集合であってもよく、上記ターゲットテキストの属するユーザのアカウントにおけるすべての広告コンセプトテキストで構成される集合であってもよく、次に、上記第2統計モジュール4022は各フレーズの上記テキスト集合に出現した頻度を統計し、最終的に、上記計算モジュール4023は上記統計した逆文書頻度と上記統計した頻度の積を当該ワードの単語の出現頻度-逆文書頻度とすることができる。
本実施例のいくつかの好ましい実施形態では、情報プッシュ用の装置400はさらに削除ユニット406を備えてもよい。フレーズの集合を生成した後に、上記削除ユニット406は上記フレーズの集合におけるストップワードを削除できる。情報検索において、メモリ領域を節約し且つ検索効率を向上させるために、自然言語データ(又はテキスト)を処理する前又は処理した後に、ストップワード(Stop Words)と呼ばれる所定の字又は単語を自動的にフィルタリングする。これらのストップワードは手動で入力されたものであり、自動的に生成するものではなく、生成後のストップワードはストップワードテーブルを形成する。上記削除ユニット406はフレーズの集合におけるフレーズとストップワードテーブルにおけるワードを比較し、ストップワードテーブルに発生したフレーズを削除することができる。
以下、本発明の実施例を実現するためのサーバに適用されるコンピュータシステム500を示す構造模式図である図5を参照する。
図5に示すように、コンピュータシステム500は、読み出し専用メモリ(ROM)502に記憶されているプログラム又は記憶部508からランダムアクセスメモリ(RAM)503にロードされたプログラムに基づいて様々な適当な動作及び処理を実行することができる中央処理装置(CPU)501を備える。RAM503には、システム500の操作に必要な様々なプログラム及びデータがさらに記憶されている。CPU501、ROM502及びRAM503は、バス504を介して互いに接続されている。入力/出力(I/O)インターフェース505もバス504に接続されている。
キーボード、マウスなどを含む入力部506、陰極線管(CRT)、液晶ディスプレイ(LCD)など、及びスピーカなどを含む出力部507、ハードディスクなどを含む記憶部508、及びLANカード、モデムなどを含むネットワークインターフェースカードの通信部509は、I/Oインターフェース505に接続されている。通信部509は、例えばインターネットのようなネットワークを介して通信処理を実行する。ドライバ510は、必要に応じてI/Oインターフェース505に接続される。リムーバブルメディア511は、例えば、マグネチックディスク、光ディスク、光磁気ディスク、半導体メモリなどのようなものであり、必要に応じてドライバ510に取り付けられ、したがって、ドライバ510から読み出されたコンピュータプログラムが必要に応じて記憶部508にインストールされる。
特に、本発明の実施例によれば、フローチャートを参照しながら記載された上記のプロセスは、コンピュータのソフトウェアプログラムとして実現されてもよい。例えば、本発明の実施例は、コンピュータプログラム製品を含み、当該コンピュータプログラム製品は、機械可読媒体に有形に具現化されるコンピュータプログラムを含み、前記コンピュータプログラムは、フローチャートで示される方法を実行するためのプログラムコードを含む。このような実施例では、当該コンピュータプログラムは、通信部509を介してネットワークからダウンロードされてインストールされてもよく、及び/又はリムーバブルメディア511からインストールされてもよい。
図面におけるフローチャート及びブロック図は、本発明の各実施例に係るシステム、方法及びコンピュータプログラム製品により実現可能なアーキテクチャ、機能及び操作を示す。ここで、フローチャート又はブロック図における各枠は、1つのモジュール、プログラムセグメント、又はコードの一部を代表してもよく、前記モジュール、プログラムセグメント、又はコードの一部は、規定された論理機能を達成するための1つ以上の実行可能な命令を含む。また、いくつかの代替実施態様として、枠に示された機能は、図面に示された順番と異なる順番で実行されてもよい。例えば、連続して示された2つの枠は、関連する機能に応じて、実際にほぼ並行に実行されてもよく、逆の順番で実行されてもよい。また、ブロック図及び/又はフローチャートにおける各枠と、ブロック図及び/又はフローチャートにおける枠の組合せは、規定された機能又は操作を実行する、ハードウェアに基づく専用システムで実現されてもよく、あるいは、専用ハードウェアとコンピュータの命令との組合せで実行されてもよい。
本発明の実施例に記載されたユニットは、ソフトウェアで実現されてもよく、ハードウェアで実現されてもよい。記載されたユニットは、プロセッサに設定されてもよく、例えば、「生成ユニット、第1計算ユニット、取得ユニット、第2計算ユニット及び第1プッシュユニットを備えるプロセッサ」として記載されてもよい。その中でも、これらのユニットの名称は、ある場合において当該ユニットその自体を限定するものではなく、例えば、生成ユニットは、「フレーズの集合を生成するユニット」として記載されてもよい。
一方、本発明は、不揮発性コンピュータ記憶媒体をさらに提供し、当該不揮発性コンピュータ記憶媒体は、上記実施例の装置に含まれる不揮発性コンピュータ記憶媒体であってもよく、独立に存在して端末に組み立てられていない不揮発性コンピュータ記憶媒体であってもよい。不揮発性コンピュータ記憶媒体は、1つ以上のプログラムが記憶され、1つ以上のプログラムが1つの機器により実行された場合、機器に、ターゲットテキストを単語分割して、フレーズの集合を生成し、フレーズの集合における各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度を計算し、予め設定した候補キーワードと各フレーズとの類似度を取得し、各フレーズのターゲットテキストでの単語の出現頻度-逆文書頻度と、候補キーワードと各フレーズとの類似度とに基づいて、候補キーワードとターゲットテキストとの関連度を計算し、予め設定した関連度閾値に基づいて、又は関連度と予め設定したプッシュ数とに基づいて、候補キーワードからプッシュしようとする候補キーワードを選択し、第1ユーザ端末へプッシュしようとする候補キーワードをプッシュするようにさせる。
以上の記載は、本発明の好ましい実施例、及び使用された技術的原理の説明に過ぎない。本発明に係る特許請求の範囲が、上記した技術的特徴の特定な組合せからなる技術案に限定されることではなく、本発明の趣旨を逸脱しない範囲で、上記の技術的特徴又は同などの特徴の任意の組合せからなる他の技術案も含むべきであることを、当業者は理解すべきである。例えば、上記の特徴と、本発明に開示された類似の機能を持っている技術的特徴(これらに限定されていない)とを互いに置き換えてなる技術案が挙げられる。

Claims (10)

  1. 情報プッシュ用の装置が実行する情報プッシュ用の方法であって、
    ターゲットテキストを単語分割して、フレーズの集合を生成するステップと、
    前記フレーズの集合における各フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度を計算するステップと、
    予め設定した候補キーワードと各フレーズとの類似度を取得するステップと、
    各フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度と、前記候補キーワードと各フレーズとの類似度との積に基づいて、前記候補キーワードと前記ターゲットテキストとの関連度を計算するステップと、
    予め設定した関連度閾値に基づいて、又は関連度と予め設定したプッシュ数とに基づいて、前記候補キーワードからプッシュしようとする候補キーワードを選択し、第1ユーザ端末へ前記プッシュしようとする候補キーワードをプッシュするステップと、を含む
    ことを特徴とする情報プッシュ用の方法。
  2. 前記の各フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度と、前記候補キーワードと各フレーズとの類似度とに基づいて、前記候補キーワードと前記ターゲットテキストとの関連度を計算するステップにおいては、
    前記フレーズの集合における各フレーズに対して、前記候補キーワードと当該フレーズとの類似度に当該フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度を乗じ、得られた各積を加算し、前記候補キーワードと前記ターゲットテキストとの関連度を取得するステップを含む
    ことを特徴とする請求項1に記載の方法。
  3. 前記の第1ユーザ端末へ前記プッシュしようとする候補キーワードをプッシュするステップの後に、さらに、
    前記プッシュしようとする候補キーワードと前記ターゲットテキストの対応関係を確立するステップと、
    前記プッシュしようとする候補キーワードに対する第2ユーザ端末の検索操作を検出したことに応答して、前記第2ユーザ端末へ前記プッシュしようとする候補キーワードに対応するテキストをプッシュするステップと、を含む
    ことを特徴とする請求項1に記載の方法。
  4. 前記の前記フレーズの集合における各フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度を計算するステップにおいては、
    各フレーズが予め設定したテキスト集合に出現した逆文書頻度を統計するステップと、
    各フレーズが前記ターゲットテキストに出現した頻度を統計するステップと、
    前記逆文書頻度と前記頻度との積を各フレーズの単語の出現頻度-逆文書頻度として計算するステップと、を含む
    ことを特徴とする請求項1に記載の方法。
  5. 前記のフレーズの集合を生成するステップの後に、さらに、前記フレーズの集合におけ
    るストップワードを削除するステップを含む
    ことを特徴とする請求項1に記載の方法。
  6. ターゲットテキストを単語分割して、フレーズの集合を生成するように配置されている生成ユニットと、
    前記フレーズの集合における各フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度を計算するように配置されている第1計算ユニットと、
    予め設定した候補キーワードと各フレーズとの類似度を取得するように配置されている取得ユニットと、
    各フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度と、前記候補キーワードと各フレーズとの類似度との積に基づいて、前記候補キーワードと前記ターゲットテキストとの関連度を計算するように配置されている第2計算ユニットと、
    予め設定した関連度閾値に基づいて、又は関連度と予め設定したプッシュ数とに基づいて、前記候補キーワードからプッシュしようとする候補キーワードを選択し、第1ユーザ端末へ前記プッシュしようとする候補キーワードをプッシュするように配置されている第1プッシュユニットと、を備える
    ことを特徴とする情報プッシュ用の装置。
  7. 前記第2計算ユニットは、さらに、
    前記フレーズの集合における各フレーズに対して、前記候補キーワードと当該フレーズとの類似度に当該フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度を乗じ、得られた各積を加算し、前記候補キーワードと前記ターゲットテキストとの関連度を取得するように配置されている
    ことを特徴とする請求項6に記載の装置。
  8. 前記プッシュしようとする候補キーワードと前記ターゲットテキストとの対応関係を確立するように配置されている確立ユニットと、
    前記プッシュしようとする候補キーワードに対する第2ユーザ端末の検索操作を検索したことに応答して、前記第2ユーザ端末へ前記プッシュしようとする候補キーワードに対応するテキストをプッシュするように配置されている第2プッシュユニットと、さらにを備える
    ことを特徴とする請求項6に記載の装置。
  9. 前記第1計算ユニットは、
    各フレーズが予め設定したテキスト集合に出現した逆文書頻度を統計するように配置されている第1統計モジュールと、
    各フレーズが前記ターゲットテキストに発生した頻度を統計するように配置されている第2統計モジュールと、
    前記逆文書頻度と前記頻度との積を各フレーズの単語の出現頻度-逆文書頻度として計算するように配置されている計算モジュールと、を備える
    ことを特徴とする請求項6に記載の装置。
  10. 前記フレーズの集合におけるストップワードを削除するように配置されている削除ユニットをさらに備える
    ことを特徴とする請求項6に記載の装置。
JP2017108224A 2016-12-26 2017-05-31 情報プッシュ用の方法及び装置 Active JP6511487B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201611216735.3 2016-12-26
CN201611216735.3A CN108241667B (zh) 2016-12-26 2016-12-26 用于推送信息的方法和装置

Publications (2)

Publication Number Publication Date
JP2018106658A JP2018106658A (ja) 2018-07-05
JP6511487B2 true JP6511487B2 (ja) 2019-05-15

Family

ID=62629914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017108224A Active JP6511487B2 (ja) 2016-12-26 2017-05-31 情報プッシュ用の方法及び装置

Country Status (3)

Country Link
US (1) US10726446B2 (ja)
JP (1) JP6511487B2 (ja)
CN (1) CN108241667B (ja)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10572491B2 (en) 2014-11-19 2020-02-25 Google Llc Methods, systems, and media for presenting related media content items
CN110750708A (zh) * 2018-07-23 2020-02-04 北京字节跳动网络技术有限公司 关键词推荐方法、装置和电子设备
CN109325796B (zh) * 2018-08-13 2023-09-26 中国平安人寿保险股份有限公司 潜在用户筛选方法、装置、计算机设备及存储介质
CN109325178A (zh) * 2018-09-14 2019-02-12 北京字节跳动网络技术有限公司 用于处理信息的方法和装置
CN109344247B (zh) * 2018-09-29 2020-01-10 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN110032622B (zh) * 2018-11-28 2023-07-14 创新先进技术有限公司 关键词确定方法、装置、设备及计算机可读存储介质
CN110008396B (zh) * 2018-11-28 2023-11-24 创新先进技术有限公司 对象信息推送方法、装置、设备及计算机可读存储介质
CN109828748A (zh) * 2018-12-15 2019-05-31 深圳壹账通智能科技有限公司 代码命名方法、系统、计算机装置及计算机可读存储介质
CN109918657B (zh) * 2019-02-28 2023-04-18 云孚科技(北京)有限公司 一种从文本中提取目标关键词的方法
CN110008474B (zh) * 2019-04-04 2023-06-02 科大讯飞股份有限公司 一种关键短语确定方法、装置、设备及存储介质
CN111831796A (zh) * 2019-04-15 2020-10-27 北京嘀嘀无限科技发展有限公司 一种用户请求的处理方法、装置、电子设备及存储介质
CN110083837B (zh) * 2019-04-26 2023-11-24 科大讯飞股份有限公司 一种关键词生成方法及装置
CN110232126B (zh) * 2019-06-14 2023-10-24 腾讯科技(深圳)有限公司 热点挖掘方法及服务器和计算机可读存储介质
CN112241894A (zh) * 2019-07-16 2021-01-19 百度时代网络技术(北京)有限公司 内容投放方法、装置以及终端
CN110609958A (zh) * 2019-09-19 2019-12-24 Oppo广东移动通信有限公司 数据推送方法、装置、电子设备及存储介质
CN112579869B (zh) * 2019-09-29 2022-02-01 北京星选科技有限公司 对象提取方法、装置、电子设备及存储介质
CN110888970B (zh) * 2019-11-29 2023-10-03 腾讯科技(深圳)有限公司 文本生成方法、装置、终端和存储介质
CN111191446B (zh) * 2019-12-10 2022-11-25 平安医疗健康管理股份有限公司 交互信息处理方法、装置、计算机设备和存储介质
CN111191126B (zh) * 2019-12-24 2023-11-03 绍兴市上虞区理工高等研究院 一种基于关键词的科技成果精准推送方法及装置
CN113127766B (zh) * 2019-12-31 2023-04-14 飞书数字科技(上海)有限公司 广告兴趣词的获取方法、装置、存储介质和处理器
CN111242692B (zh) * 2020-01-16 2022-05-17 南京领行科技股份有限公司 一种信息推送方法及装置
CN111371844B (zh) * 2020-02-20 2024-01-19 平安科技(深圳)有限公司 课程推送方法及相关装置
CN113495997A (zh) * 2020-04-01 2021-10-12 北京四维图新科技股份有限公司 Poi别名的探索方法、装置和车辆
CN111767713B (zh) * 2020-05-09 2023-07-21 北京奇艺世纪科技有限公司 关键词的提取方法、装置、电子设备及存储介质
CN111881339B (zh) * 2020-06-05 2024-03-22 百度在线网络技术(北京)有限公司 资源信息的推送、通知方法、装置、电子设备及存储介质
CN111711559B (zh) * 2020-06-12 2022-04-05 北京百度网讯科技有限公司 用于撤回信息的方法和装置
CN112256822A (zh) * 2020-10-21 2021-01-22 平安科技(深圳)有限公司 文本搜索方法、装置、计算机设备和存储介质
CN112395044B (zh) * 2020-11-10 2023-04-28 新华三技术有限公司合肥分公司 命令行关键词填充方法、装置及网络设备
CN112487297A (zh) * 2020-12-09 2021-03-12 贝壳技术有限公司 信息推送方法、装置、电子设备和存储介质
CN112861534B (zh) * 2021-01-18 2023-07-21 北京奇艺世纪科技有限公司 一种对象名称识别方法及装置
CN112819512B (zh) * 2021-01-22 2023-03-24 北京有竹居网络技术有限公司 一种文本处理方法、装置、设备及介质
CN112768080A (zh) * 2021-01-25 2021-05-07 武汉大学 基于医疗大数据的医学关键词库建立方法及系统
CN113033198B (zh) * 2021-03-25 2022-08-26 平安国际智慧城市科技股份有限公司 相似文本推送方法、装置、电子设备及计算机存储介质
CN113111085B (zh) * 2021-04-08 2024-01-30 达观数据有限公司 基于流式数据的自动化层级探索方法和装置
CN113177402B (zh) * 2021-04-26 2024-03-01 平安科技(深圳)有限公司 词语替换方法、装置、电子设备和存储介质
CN113191811B (zh) * 2021-05-10 2022-07-01 北京顶当互动科技有限公司 一种广告智能推送方法、设备及计算机可读存储介质
CN113177061B (zh) * 2021-05-25 2023-05-16 马上消费金融股份有限公司 一种搜索方法、装置和电子设备
CN113836346B (zh) * 2021-09-08 2023-08-08 网易(杭州)网络有限公司 为音频文件生成摘要的方法、装置、计算设备及存储介质
CN114422584B (zh) * 2021-12-16 2023-07-07 北京百度网讯科技有限公司 资源的推送方法、设备和存储介质
CN116167352B (zh) * 2023-04-03 2023-07-21 联仁健康医疗大数据科技股份有限公司 数据处理方法、装置、电子设备及存储介质
CN116842138A (zh) * 2023-07-24 2023-10-03 上海诚狐信息科技有限公司 基于文档的检索方法、装置、设备及存储介质
CN117076658B (zh) * 2023-08-22 2024-05-03 南京朗拓科技投资有限公司 基于信息熵的引文推荐方法、装置及终端

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070150342A1 (en) * 2005-12-22 2007-06-28 Law Justin M Dynamic selection of blended content from multiple media sources
CN101315624B (zh) * 2007-05-29 2015-11-25 阿里巴巴集团控股有限公司 一种文本主题推荐的方法和装置
JP4859893B2 (ja) * 2008-08-12 2012-01-25 ヤフー株式会社 広告配信装置、広告配信方法、及び広告配信制御プログラム
JP4934169B2 (ja) * 2009-06-24 2012-05-16 ヤフー株式会社 カテゴリを対応付けする装置、方法、およびプログラム
CN102081642A (zh) * 2010-10-28 2011-06-01 华南理工大学 搜索引擎检索结果聚类的中文标签提取方法
JP5559750B2 (ja) * 2011-07-12 2014-07-23 ヤフー株式会社 広告処理装置、情報処理システム及び広告処理方法
US20150287080A1 (en) * 2014-04-04 2015-10-08 Gayathri Ravichandran Geetha Contextual promotions
JP6235443B2 (ja) * 2014-09-17 2017-11-22 ヤフー株式会社 抽出装置、抽出方法および抽出プログラム
CN104899322B (zh) * 2015-06-18 2021-09-17 百度在线网络技术(北京)有限公司 搜索引擎及其实现方法
US20170017998A1 (en) * 2015-07-17 2017-01-19 Adobe Systems Incorporated Determining context and mindset of users
CN105893410A (zh) * 2015-11-18 2016-08-24 乐视网信息技术(北京)股份有限公司 一种关键词提取方法和装置

Also Published As

Publication number Publication date
CN108241667B (zh) 2019-10-15
US10726446B2 (en) 2020-07-28
JP2018106658A (ja) 2018-07-05
US20180181988A1 (en) 2018-06-28
CN108241667A (zh) 2018-07-03

Similar Documents

Publication Publication Date Title
JP6511487B2 (ja) 情報プッシュ用の方法及び装置
US11281860B2 (en) Method, apparatus and device for recognizing text type
US20130263019A1 (en) Analyzing social media
CN110069698B (zh) 信息推送方法和装置
US20150046371A1 (en) System and method for determining sentiment from text content
WO2017000402A1 (zh) 网页生成方法和装置
CN107679119B (zh) 生成品牌衍生词的方法和装置
JP2012160201A (ja) レビュー処理方法およびシステム
TW201905736A (zh) 資訊推送方法及系統
US11423096B2 (en) Method and apparatus for outputting information
Thomaidou et al. Automated snippet generation for online advertising
CN107609192A (zh) 一种搜索引擎的补充搜索方法和装置
WO2016040772A1 (en) Method and apparatus of matching an object to be displayed
CN110750707A (zh) 关键词推荐方法、装置和电子设备
Hidayatullah et al. Topic modeling on Indonesian online shop chat
CN112116426A (zh) 一种推送物品信息的方法和装置
JP6341899B2 (ja) 広告システム及び広告配信方法
CN106257449B (zh) 一种信息确定方法和装置
US10339559B2 (en) Associating social comments with individual assets used in a campaign
JP6509590B2 (ja) 商品に対するユーザの感情分析装置及びプログラム
Yengi et al. Distributed recommender systems with sentiment analysis
Sharma et al. Recommending who to follow in the software engineering twitter space
CN107679030B (zh) 基于用户操作行为数据提取同义词的方法和装置
CN110750708A (zh) 关键词推荐方法、装置和电子设备
US11568137B2 (en) Mapping text content feedback to a process via a synonym graph

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190326

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190408

R150 Certificate of patent or registration of utility model

Ref document number: 6511487

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250