JP2022088540A

JP2022088540A - ユーザ興味画像の生成方法、装置、電子機器及び記憶媒体

Info

Publication number: JP2022088540A
Application number: JP2022054740A
Authority: JP
Inventors: チャオファン，; Chao Huang; グァンジュンワン，; Guangjun Wang; グォリンカオ，; Guolin Cao; シャオロンリン，; Xiaolong Lin; ガンキャオ，; Gang Qiao; ツェンペンツァン，; Zhenpeng Zhan
Original assignee: Baidu International Technology Shenzhen Co Ltd
Current assignee: Baidu International Technology Shenzhen Co Ltd
Priority date: 2021-04-27
Filing date: 2022-03-30
Publication date: 2022-06-14
Anticipated expiration: 2042-03-30
Also published as: EP3992814A3; CN115248890A; CN115248890B; JP7369228B2; US20220198358A1; EP3992814A2

Abstract

【課題】生成する際に必要な人件費を削減するユーザ興味画像の生成方法、装置、電子機器及び記憶媒体を提供する。【解決手段】ユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成し、少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、少なくとも１つのキーワードに対応する興味ラベルを生成し、少なくとも１つのキーワードに対応する興味ラベルを並び替え、並び替えられた後の前記少なくとも１つのキーワードに対応する興味ラベルに基づいて、ユーザ興味画像を生成する。【選択図】図１

Description

本開示は、コンピュータ技術分野に関し、自然言語処理、ナレッジグラフなどの人工知能技術分野に関し、特にユーザ興味画像の生成方法、装置、電子機器及び記憶媒体に関する。

ユーザ興味画像は実際にユーザ興味ラベルの集合であり、ユーザが興味を持つ内容を反映することができる。インターネットがビッグデータ時代に入った後、ユーザ行為は企業の製品とサービスに一連の変化と再構築をもたらし、ユーザ画像は企業がビッグデータを応用する基礎として、インターネット分野におけるページのプレゼンス、データの流れ、広告の展示、内容の推薦などの前提条件であり、ユーザ興味画像を正確に決定することはすでに多くの企業が注目する重要なポイントとなっている。

関連技術では、通常、ユーザ行為データに基づいて、人為的に作られた規則を用いてユーザ興味ラベルを生成したり、機械学習マイニングによってユーザ興味ラベルを生成したりする。しかしながら、人為的に作られた規則を用いてユーザ興味ラベルを生成するには、大量のヒューマンリソースを投入してユーザ行為データを分析し、ユーザの行為から興味ラベルまでの規則を作る必要があり、機械学習マイニングによってユーザの興味ラベルを生成するにも、大量のヒューマンリソースを投入してデータ表示を行う必要があり、これによって関連機器学習モデルをトレーニングするために大量の表記データを得て、そのため、関連技術におけるユーザ興味画像の生成方法の人件費が高すぎる。

本開示は、ユーザ興味画像の生成方法、装置、電子機器、記憶媒体及びコンピュータプログラムを提供する。

本開示の別の態様によれば、ユーザ興味画像の生成方法を提供し、ユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成するステップと、前記少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、前記少なくとも１つのキーワードに対応する興味ラベルを生成するステップと、前記少なくとも１つのキーワードに対応する興味ラベルを並び替え、並び替えられた後の前記少なくとも１つのキーワードに対応する興味ラベルに基づいて、前記ユーザ興味画像を生成するステップと、を含む。

本開示の別の態様によれば、ユーザ興味画像の生成装置を提供し、ユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成する抽出モジュールと、前記少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、前記少なくとも１つのキーワードに対応する興味ラベルを生成するマッチングモジュールと、前記少なくとも１つのキーワードに対応する興味ラベルを並び替え、並び替えられた後の前記少なくとも１つのキーワードに対応する興味ラベルに基づいて、前記ユーザ興味画像を生成する生成モジュールと、を備える。

本開示の別の態様によれば、電子機器を提供し、少なくとも１つのプロセッサと、該少なくとも１つのプロセッサと通信可能に接続されるメモリと、を備え、前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも１つのプロセッサが上記に記載のユーザ興味画像の生成方法を実行できるように、前記少なくとも１つのプロセッサによって実行される。

本開示の別の態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、コンピュータに上記に記載のユーザ興味画像の生成方法を実行させる。

本開示の別の態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムはプロセッサによって実行される場合、上記に記載のユーザ興味画像の生成方法を実現する。

なお、この部分に記載されている内容は、本開示の実施例の肝心または重要な特徴を特定することを意図しておらず、本開示の範囲を限定することも意図していないことを理解されたい。本開示の他の特徴は、以下の説明を通して容易に理解される。

図面は、本技術案をよりよく理解するために使用され、本開示を限定するものではない。
本開示の第１の実施例に係るユーザ興味画像の生成方法のフローチャートである。本開示の第２の実施例に係るユーザ興味画像の生成方法のフローチャートである。本開示の第３の実施例に係るユーザ興味画像の生成方法のフローチャートである。本開示の第３の実施例に係るユーザ興味画像の生成方法の別のフローチャートである。本開示の第４の実施例に係るユーザ興味画像の生成装置の概略構成図である。本開示の第５の実施例に係るユーザ興味画像の生成装置の概略構成図である。本開示の実施例のユーザ興味画像の生成方法を実現するための電子機器のブロック図である。

以下、図面と併せて本開示の例示的な実施例を説明し、理解を容易にするためにその中には本開示の実施例の様々な詳細事項を含んでおり、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本開示の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができることを認識されたい。同様に、明確及び簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。

なお、本開示の技術案では、関連するユーザ個人情報の取得、記憶、応用などは、いずれも関連法律法規の規定に合致し、公序良俗に違反しない。

関連技術では、通常ユーザ行為データに基づいて人為的に作られた規則を用いてユーザ興味ラベルを生成し、または機械学習マイニングによってユーザ興味ラベルを生成し、しかしながら、人為的に作られた規則を用いてユーザ興味ラベルを生成するには、大量のヒューマンリソースを投入してユーザ行為データを分析し、ユーザの行為から興味ラベルまでの規則を作る必要があり、機械学習マイニングによってユーザの興味ラベルを生成するにも、大量のヒューマンリソースを投入してデータ表示を行う必要があり、これによって関連機器学習モデルをトレーニングするために大量の表記データを得て、そのため、関連技術におけるユーザ興味画像の生成方法の人件費が高すぎる。

本開示は、最低の人件費でユーザ興味画像を生成するために、ユーザ興味画像の生成方法を提供し、当該ユーザ興味画像の生成方法は、まずユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成し、その後、少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、少なくとも１つのキーワードに対応する興味ラベルを生成してから、少なくとも１つのキーワードに対応する興味ラベル並び替え、並び替えられた後の少なくとも１つのキーワードに対応する興味ラベルに基づいて、ユーザ興味画像を生成する。興味ラベルはナレッジグラフの各ノードにそれぞれ対応するラベルによるものであるため、人為的にデータを表記したり、規則を作ったりして取得する必要がなく、ユーザの画像構造過程全体に人為的に介入する必要がなく、これによってユーザ興味画像の生成に必要な人件費を削減する。

以下、図面を参照しながら、本開示の実施例のユーザ興味画像の生成方法、装置、電子機器及びコンピュータプログラムを説明する。

まず、図１と併せて、本開示によって提供されるユーザ興味画像の生成方法に対して詳細に説明する。

図１は本開示の第１の実施例に係るユーザ興味画像の生成方法のフローチャートである。なお、本実施例によって提供されるユーザ興味画像の生成方法は、実行主体がユーザ興味画像の生成装置であり、以下、生成装置と略し、ユーザ興味画像を生成するに必要な人件費を削減するために、当該生成装置は、電子機器であってもよく、電子機器内に設置されたものであってもよい。本開示の実施例は、生成装置が電子機器内に設置される場合を例として説明する。

電子機器は、データ処理が可能な任意の静止又はモバイルコンピューティング機器、例えば、ノートパソコン、スマートフォン、ウェアラブルデバイスなどのモバイルコンピューティング機器、又はデスクトップコンピュータなどの静止のコンピューティング機器、又はサーバ、又はその他のタイプのコンピューティング機器などであってもよく、本開示はこれに対して限定しない。

図１に示すように、ユーザ興味画像の生成方法は、以下のステップ１０１～１０３を含むことができる。

ステップ１０１、ユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成する。

なお、ユーザの入力情報は、生成装置が存在する電子機器のヒューマンコンピューターインタラクションインターフェースを介してユーザに入力された任意の情報であってもよく、ユーザが他の電子機器のヒューマンコンピューターインタラクションインターフェースで入力された任意の情報、すなわちユーザの入力情報であってもよく、生成装置が存在する電子機器から取得する任意の情報であってもよく、生成装置が他の電子機器から取得した任意の情報であってもよく、または、生成装置が他の方式で取得した任意の情報であってもよいが、本開示はこれに対して限定しない。

なお、ユーザの入力情報は、中国語の入力情報であってもよく、日本語又は他の言語タイプの入力情報であってもよく、本開示は入力情報の言語タイプに対しては限定しない。

例示的な実施例では、生成装置は以下の方式によってユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成することができる。

まず、生成装置は先にユーザの入力情報に対して単語分割処理を行って、少なくとも１つの字句単位を得て、単語分割処理後に得られた字句単位が１つである場合に、得られた１つの字句単位を情報抽出後に生成されたキーワードとすることができる。

単語分割処理後に得られる字句単位が複数である場合、各字句単位に重みを付け、複数の字句単位における各字句単位の字句性質に基づいて、各字句単位に対して昇格または降格処理を行い、処理後の各字句単位を得ることができる。具体的には、複数の字句単位における各字句単位に対して、それぞれ字句性質、例えば、個々字句単位が一般名詞、固有名詞、助詞、動詞などであることを表記することができ、さらに、各字句単位の字句性質に基づいて、アプリオリ知識に基づいて、各字句単位に対して昇格または降格処理を行い、例えば、固有名詞に対して昇格を行い、語気語に対して降格などを行い、これによって処理後の各字句単位を得る。

字句性質に基づいて各字句単位を昇格または降格処理を行った後、各字句単位に対してネーミングエンティティ識別し、識別結果に基づいて各字句単位をさらに昇格または降格処理を行うことができ、例えば、ある字句単位が人名、地名、組織機構名、薬物または時間などの実体語である場合、当該字句単位に対して昇格処理を行うことができ、他の字句単位に対して降格処理を行い、さらに昇格または降格処理を行った後の各字句単位を得る。

さらに、人為的に作られた規則に基づいて、各字句単位の重要性を決定することができ、これによって各字句単位の重要性に基づいて、各字句単位に対して更なる昇格または降格処理を行い、処理後の各字句単位を得る。人為的に作られた規則は、統計分析とアプリオリ経験に基づいて決定された、字句単位の重要性を計算する規則方法である。

さらに、ナレッジグラフにおける属性抽出と関係抽出とを組み合わせて、各字句単位抽出の属性特徴の正確性を高めることができ、これによって各字句単位の属性特徴の正確性に基づいて、さらに各字句単位に対して昇格または降格処理を行い、さらに予め設定された重み閾値を超える字句単位を、情報抽出後に生成されるキーワードとする。

なお、上記ユーザの入力情報に対して情報抽出を行う方式は、例示にすぎず、実際の応用においては、当業者は、必要に応じて自然言語処理技術における任意の情報抽出方法を用いてユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成することができ、本開示はこれに対して限定しない。

ステップ１０２、少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、少なくとも１つのキーワードに対応する興味ラベルを生成する。

ナレッジグラフは、百科知識ベースに基づいて、情報抽出技術と知識融合技術を用いて構築するものであってもよい。少なくとも１つのキーワードに対応する興味ラベルは、すべてのキーワードに対応するすべての興味ラベルである。

ナレッジグラフの個々のノードにおける各ノードはそれぞれ１つのラベルに対応すう。本出願の実施例では、少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、少なくとも１つのキーワードに対応する興味ラベルを生成することができる。

なお、１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングして、当該キーワードに対応する１つの興味ラベルまたは複数の興味ラベルが得られる可能性があり、当該キーワードに対応する興味ラベルが得られない可能性があり、異なるキーワードに対応する興味ラベルは同じである可能性があり、本開示の実施例では、少なくとも１つのキーワードに対応する興味ラベルは、１つである可能性があり、複数である可能性があり、本開示はこれに対して限定しない。

例えば、ユーザの入力情報に対して抽出を行い、２つのキーワード「ＡＡ」と「ＢＢ」を生成したと仮定すると、「ＡＡ」がある俳優の名前であり、「ＢＢ」がある漫画の名前であり、「ＡＡ」と、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングして、「ＡＡ」に対応する２つの興味ラベル「ＡＡ」と「俳優」が得られ、「ＢＢ」と、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングして、「ＢＢ」に対応する３つの興味ラベル「ＢＢ」、「熱血アニメ」及び「アニメ」が得られ、「ＡＡ」と「ＢＢ」に対応する５つの興味ラベル「ＡＡ」、「俳優」、「ＢＢ」、「熱血アニメ」及び「アニメ」を生成することができる。

ステップ１０３、少なくとも１つのキーワードに対応する興味ラベルを並び替え、並び替えられた後の少なくとも１つのキーワードに対応する興味ラベルに基づいて、ユーザ興味画像を生成する。

本開示の実施例では、少なくとも１つのキーワードに対応する興味ラベルを生成した後、これらの興味ラベルを並び替えることができ、さらに並び替えられた後の興味ラベルに基づいて、ユーザ興味画像を生成する。

少なくとも１つのキーワードに対応する興味ラベルを並び替える方法は、必要に応じて設定されてもよい。例えば、各興味ラベルのページアクセス数に基づいて、少なくとも１つのキーワードに対応する興味ラベルを並び替えてもよく、または、予めトレーニングして並び替えモデルを得てから、並び替えモデルを使用して各興味ラベルに対して採点し、さらに各興味ラベルに対応するスコアの高低に基づいて、少なくとも１つのキーワードに対応する興味ラベルを並び替えてもよく、または、少なくとも１つのキーワードに対応する興味ラベルを別の方法で並び替えてもよいが、本開示はこれに対して限定しない。

例えば、上記の例に続き、ユーザの入力情報に対して抽出を行い、２つのキーワード「ＡＡ」と「ＢＢ」を生成したと仮定すると、「ＡＡ」と「ＢＢ」に対応する興味ラベルは「ＡＡ」、「俳優」、「ＢＢ」、「熱血アニメ」及び「アニメ」であり、ＸＸ百科における「ＡＡ」に対応するページアクセス数が１００００であり、「ＢＢ」に対応するページアクセス数が２００００であり、「俳優」に対応するページアクセス数が５００であり、「熱血アニメ」に対応するページアクセス数が６００であり、「アニメ」に対応するページアクセス数が４００であると仮定すると、並び替えられた後の興味ラベルが「ＢＢ」、「ＡＡ」、「熱血アニメ」、「俳優」「アニメ」であることを得ることができ、これによって並び替えられた後のこれらの５つの興味ラベルに基づいて、ユーザ興味画像を生成することができる。

なお、少なくとも１つのキーワードに対応する興味ラベルの数が１つである場合、直接この１つの興味ラベルに基づいてユーザ興味画像を生成すればよい。

本開示の実施例によって提供されるユーザ興味画像の生成方法は、ユーザの入力情報に対して情報抽出を行って少なくとも１つのキーワードを得た後、少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングすることにより、興味ラベルを生成すればよく、さらに並び替えられた後の興味ラベルに基づいてユーザ興味画像を生成することができ、興味ラベルがナレッジグラフの各ノードにそれぞれ対応するラベルによるものであるため、大量のデータを人為的に表記することによって機械学習マイニングモデルをトレーニングして興味ラベルを生成する必要がなく、または大量のヒューマンリソースを投入してユーザ行為データを分析し、ユーザ行為から興味ラベルまでの規則を作って興味ラベルを取得する必要がなく、ユーザ画像全体の構造プロセスに人為的な介入を必要とせず、ユーザ興味画像を生成する時に必要な人件費を削減する。また、ナレッジグラフは百科知識ベースに基づいて構造されるため、ナレッジグラフにおける各ノードに対応するラベルは百科知識ベースの更新に伴って更新することができ、これによって高信頼度の興味ラベルを得ることでユーザ興味画像を生成することができて、ユーザ興味画像の正確性を高め、本開示の実施例ではどの言語タイプのユーザの入力情報に対しても、ユーザ興味画像を迅速に生成することができ、汎用性と汎化性がよい。

本開示の実施例によって提供されるユーザ興味画像の生成方法は、まずユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成し、その後、少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、少なくとも１つのキーワードに対応する興味ラベルを生成してから、少なくとも１つのキーワードに対応する興味ラベル並び替え、並び替えられた後の少なくとも１つのキーワードに対応する興味ラベルに基づいて、ユーザ興味画像を生成する。それにより、ユーザ興味画像を生成するために必要な人件費を削減する。

上記分析から分かるように、本開示の実施例では、少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、少なくとも１つのキーワードに対応する興味ラベルを生成することができ、図２と併せて、本開示によって提供されるユーザ興味画像の生成方法では、少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングして、少なくとも１つのキーワードに対応する興味ラベルを生成するプロセスに対して更なる説明を行う。

図２は本開示の第２の実施例に係るユーザ興味画像の生成方法のフローチャートである。図２に示すように、ユーザ興味画像の生成方法は、以下のステップ２０１～２０５を含むことができる。

ステップ２０１、ユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成する。

上記ステップ２０１の具体的な実現プロセス及び原理は、上記実施例の説明を参照してもよい、ここでは説明を省略する。

ステップ２０２、前記キーワードに対して、前記キーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、ナレッジグラフにおける前記キーワードにマッチングする第１のノードを決定する。

例示的な実施例では、ユーザの入力情報に対して情報抽出を行い、生成されたキーワードが１つである場合、生成された１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、ナレッジグラフにおける当該キーワードに対応する興味ラベルを決定することができる。ユーザの入力情報に対して情報抽出を行い、生成されたキーワードが複数である場合、各キーワードに対して、キーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、ナレッジグラフにおける各キーワードに対応する興味ラベルを決定することができ、さらに各キーワードに対応するすべての興味ラベルを生成する。本開示の実施例はユーザの入力情報に対して情報抽出を行い、生成されたキーワードが複数である例を挙げて、各キーワードに対応するすべての興味ラベルを生成するプロセスに対して説明する。

例示的な実施例では、ユーザの入力情報に対して情報抽出を行い、複数のキーワードを生成する時、各キーワードに対して、正則マッチング規則により、キーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、ナレッジグラフにおけるキーワードにマッチングする第１のノードを決定することができる。

ナレッジグラフにおけるキーワードにマッチングする第１のノードは、対応するラベルとキーワードが完全にマッチングするノードであってもよく、対応するラベルとキーワードのマッチング度が予め設定されたマッチング度閾値より大きいノードであってもよいが、本開示はこれに対して限定しない。予め設定されたマッチング度閾値は、必要に応じて任意に設定することができ、例えば９０％、８０％などであり、本開示はこれに対して限定しない。

例えば、キーワードが「熱血漫画」であると仮定すると、それぞれナレッジグラフの各ノードに対応するラベルには「漫画」、「熱血漫画」、「カートゥーン」などが含まれ、ラベル「漫画」に対応するノードがノードＣであり、ラベル「熱血漫画」に対応するノードがノードＢであり、ラベル「カートゥーン」に対応するノードがノードＤであり、ナレッジグラフにおけるキーワード「熱血漫画」と完全にマッチングするラベルが存在するノードＢを、ナレッジグラフにおけるキーワード「熱血漫画」にマッチングする第１のノードとして決定することができる。

ステップ２０３、ナレッジグラフにおける第１のノードに対応するルートノードを取得する。

本開示の実施例では、ナレッジグラフにおける各ノードの最終親ノードを、当該ノードに対応するルートノードと呼ぶ。

例えば、ナレッジグラフにおけるノードＡに対応するラベルが「ＢＢ」であり、ノードＡの親ノードがノードＢであり、ノードＢに対応するラベルが「熱血アニメ」であり、ノードＢの親ノードがノードＣであり、ノードＣに対応するラベルが「アニメ」であり、ノードＣに親ノードが存在しなく、すなわちノードＣがノードＡの最終親ノードであると仮定すると、ノードＣをノードＡに対応するルートノードと呼ぶ。

例示的な実施例では、ナレッジグラフにおけるキーワードにマッチングする第１のノードを決定した後、ナレッジグラフにおける第１のノードに対応するルートノードを取得することができる。例えば、ナレッジグラフにおけるキーワード「ＢＢ」にマッチングする第１のノードがノードＡであることを決定した後、ノードＣをノードＡに対応するルートノードとして決定することができる。

ステップ２０４、第１のノードに対応するラベル、ルートノードに対応するラベル、及び第１のノードとルートノードとの間のパスにおける個々のノードにそれぞれ対応するラベルを、前記キーワードに対応する興味ラベルとして決定する。

例えば、引き続き上記の例を参照し、キーワードにマッチングする第１のノードがノードＡであり、第１のノードに対応するルートノードがノードＣであると決定した後、ノードＡに対応するラベル「ＢＢ」、ノードＣに対応するラベル「漫画」、及びノードＡとノードＣとの間のパスにおけるノードＢに対応するラベル「熱血漫画」を、キーワード「ＢＢ」に対応する興味ラベルとして決定することができる。

上記のプロセスから分かるように、本開示の実施例では、各キーワードに対して、ナレッジグラフにおいて当該キーワードにマッチングする第１のノードから第１のノードのルートノードまでのパスにおいて、個々のノードにそれぞれ対応するラベル（第１のノードに対応するラベル及び第１のノードに対応するルートノードに対応するラベルが含まれる）を、当該キーワードに対応する興味ラベルとして決定することができ、これによってユーザの入力情報から抽出された複数のキーワードに対応する全ての興味ラベルを決定することができる。このようにして各キーワードに対応する興味ラベルを取得することにより、最終的に取得された各キーワードに対応する興味ラベルが完全に当該キーワードにマッチングし、またはマッチング度が予め設定されたマッチング度閾値を超えるラベルだけでなく、当該キーワードにマッチングする興味ラベルの親ラベルも含み、これによって生成された各キーワードに対応する興味ラベルが豊富になり、さらに各キーワードに対応する興味ラベルに基づいて生成されたユーザ興味画像がより正確になる。

ステップ２０５、少なくとも１つのキーワードに対応する興味ラベルを並び替え、並び替えられた後の少なくとも１つのキーワードに対応する興味ラベルに基づいて、ユーザ興味画像を生成する。

上記ステップ２０５の具体的な実現プロセス及び原理は、上記実施例の説明を参照することができ、ここでは説明を省略する。

本開示の実施例のユーザ興味画像の生成方法は、ユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成した後、前記キーワードに対して、前記キーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングすることができ、ナレッジグラフにおける前記キーワードにマッチングする第１のノードを決定し、ナレッジグラフにおける第１のノードに対応するルートノードを取得してから、第１のノードに対応するラベル、ルートノードに対応するラベル、及び第１のノードとルートノードとの間のパスにおける個々のノードにそれぞれ対応するラベルを、前記キーワードに対応する興味ラベルとして決定し、さらに少なくとも１つのキーワードに対応する興味ラベルを並び替え、並び替えられた後の少なくとも１つのキーワードに対応する興味ラベルに基づいて、ユーザ興味画像を生成し、それにより、ユーザ興味画像を生成する際に必要な人件費を削減する。

上記分析から分かるように、本開示の実施例では、少なくとも１つのキーワードに対応する興味ラベルを生成した後、少なくとも１つのキーワードに対応する興味ラベルを並び替え、並び替えられた後の少なくとも１つのキーワードに対応する興味ラベルに基づいて、ユーザ興味画像を生成することができる。以下、図３と併せて、本開示によって提供されるユーザ興味画像の生成方法において、少なくとも１つのキーワードに対応する興味ラベルを並び替えるプロセスに対してさらに説明する。

図３は、本開示の第３の実施例に係るユーザ興味画像の生成方法のフローチャートである。図３に示すように、ユーザ興味画像の生成方法は、以下のステップ３０１～３０５を含むことができる。

ステップ３０１、ユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成する。

ステップ３０２、少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、少なくとも１つのキーワードに対応する興味ラベルを生成する。

少なくとも１つのキーワードに対応する興味ラベルの数は複数である。

ステップ３０３、各興味ラベルに対して、並び替えモデルを使用して、興味ラベルに対応するスコアを取得する。

ステップ３０４、少なくとも１つのキーワードに対応する興味ラベルに対応するスコアに基づいて、少なくとも１つのキーワードに対応する興味ラベルを並び替える。

例示的な実施例では、並び替えモデルを使用して各興味ラベルに対して採点し、各興味ラベルのスコアを取得することができ、各興味ラベルのスコア、当該興味ラベルをステップ３０１における前記ユーザに対応する興味ラベルの確率として特徴付け、さらに各キーワードに対応する全ての興味ラベルにそれぞれ対応するスコアに基づいて、スコアの高い順から低い順に、各キーワードに対応する全ての興味ラベルを並び替える。

並び替えモデルは、ＬＲ（ＬｏｇｉｓｔｉｃＲｅｇｒｅｓｓｉｏｎ、ロジスティック回帰）モデルであってもよく、他の二項分類モデルであってもよいが、本開示の実施例はこれに対して限定しない。

並び替えモデルを使用して各興味ラベルを取得して採点し、さらに各キーワードに対応する全ての興味ラベルにそれぞれ対応するスコアに基づいて各キーワードに対応する全ての興味ラベルを並び替えることにより、各キーワードに対応する全ての興味ラベルのより正確な並び替えを取得することができる。

例示的な実施例では、各興味ラベルに対して、並び替えモデルを使用して興味ラベルのスコアを取得するプロセスは、興味ラベルの重み及び興味ラベルに対応するキーワードの重みを取得し、ナレッジグラフにおける興味ラベルに対応するキーワードにマッチングする第２のノード及び興味ラベルが存在する第３のノードを取得し、ナレッジグラフにおける第２のノードから第３のノードまでのトポロジー長さを決定し、興味ラベルの重み、興味ラベルに対応するキーワードの重み、及び第２のノードから第３のノードまでのトポロジー長さを、並び替えモデルに入力して、興味ラベルに対応するスコアを取得することであってもよい。

本開示の実施例では、興味ラベルは、少なくとも１つのキーワードを、ナレッジグラフにおける各ノードにそれぞれ対応するラベルにマッチングして得られたものであり、各々の興味ラベルについて、１つのキーワードに対応する可能性があり、複数のキーワードに対応する可能性もある。

例えば、ユーザの入力情報に対して情報抽出を行い、生成されたキーワードが「ＢＢ」「熱血漫画」であると仮定すると、「ＢＢ」がある漫画の名前であり、キーワード「ＢＢ」をナレッジグラフにおける各ノードにそれぞれ対応するラベルにマッチングすると、キーワード「ＢＢ」に対応する興味ラベル「ＢＢ」、「熱血漫画」及び「漫画」が得られ、キーワード「熱血漫画」をナレッジグラフにおける各ノードにそれぞれ対応するラベルにマッチングすると、キーワード「熱血漫画」に対応する興味ラベル「熱血漫画」と「漫画」が得られ、すなわち、最終的にキーワード「ＢＢ」と「熱血漫画」に対応する３つの興味ラベル「ＢＢ」、「熱血漫画」及び「漫画」を生成する。本開示の実施例では、興味ラベル「ＢＢ」に対して、キーワード「ＢＢ」は興味ラベル「ＢＢ」に対応するキーワードであり、興味ラベル「熱血漫画」に対して、キーワード「ＢＢ」とキーワード「熱血漫画」は興味ラベル「熱血漫画」に対応するキーワードであり、興味ラベル「漫画」に対して、キーワード「ＢＢ」とキーワード「熱血漫画」は興味ラベル「漫画」に対応するキーワードである。

例示的な実施例では、各興味ラベルに対して、興味ラベルに対応するページアクセス数に基づいて、興味ラベルの重みを取得することができる。例えば、ページアクセス数と重みとの対応関係を予め設定することができ、これによって各興味ラベルに対して、例えば百科知識ベースなどの知識ベースにおける興味ラベルに対応するページアクセス数を検索した後、ページアクセス数、ページアクセス数と重みとの対応関係に基づいて、興味ラベルの重みを取得することができる。

例示的な実施例では、各興味ラベルに対して、ＴＦ－ＩＤＦ（ＴｅｒｍＦｒｅｑｕｅｎｃｙ－ＩｎｖｅｒｓｅＤｏｃｕｍｅｎｔＦｒｅｑｕｅｎｃｙ、単語の出現頻度－逆文書頻度）アルゴリズムを使用して、興味ラベルに対応するキーワードの重みを取得することができる。例えば、複数のユーザの入力情報を予め取得し、複数のユーザの入力情報に対して情報抽出を行うことができて、複数のキーワードを生成し、各キーワードが全てのユーザの入力情報に出現する頻度を決定し、各ユーザの入力情報における各キーワードが当該ユーザの履歴入力情報に出現する回数を取得し、さらにステップ３０１においてユーザの入力情報から抽出された各キーワードに対して、当該ユーザの入力情報において当該キーワードが当該ユーザの履歴入力情報に出現する回数、及び当該キーワードが全てのユーザの入力情報内に出現する頻度に基づいて、当該キーワードの重みを決定し、これによってユーザの入力情報における抽出された各キーワードの重みを決定することができる。さらに各興味ラベルに対して、当該興味ラベルに対応するキーワードを決定した後、決定された各キーワードにそれぞれ対応する重みに基づいて、当該興味ラベルに対応するキーワードの重みを決定することができる。

上記実施例から分かるように、各興味ラベルに対して、興味ラベルに対応するキーワードは１つである可能性があり、複数である可能性もある。各興味ラベルに対して、興味ラベルに対応するキーワードが１つである場合、ナレッジグラフにおける当該キーワードにマッチングするノードを第２のノードとして決定し、当該興味ラベルが存在するノードが第３のノードであることを決定することができ、さらにナレッジグラフにおける第２のノードから第３のノードまでのトポロジー長さを決定することができる。各興味ラベルに対して、興味ラベルに対応するキーワードが複数である場合、各興味ラベルに対応する各キーワードに対して、ナレッジグラフにおける当該キーワードにマッチングするノードを第２のノードとして決定し、当該興味ラベルが存在するノードが第３のノードであることを決定することができ、さらにナレッジグラフにおける第２のノードから第３のノードまでのトポロジー長さを決定することができ、これによって複数のトポロジー長さを決定する。

例示的な実施例では、並び替えモデルを予めトレーニングすることができ、並び替えモデルの入力は興味ラベルの重み、当該興味ラベルに対応するキーワードの重みであり、ナレッジグラフにおいて当該興味ラベルに対応するキーワードにマッチングするノードから当該興味ラベルが存在するノードのトポロジー長さは、当該興味ラベルに対応するスコアとして入力され、さらに各興味ラベルに対して、当該興味ラベルの重み、当該興味ラベルに対応するキーワードの重み、及びナレッジグラフにおける当該興味ラベルに対応するキーワードにマッチングする第２のノードから当該興味ラベルが存在する第３のノードまでのトポロジー長さを決定した後、当該興味ラベルの重み、当該興味ラベルに対応するキーワードの重み、及びナレッジグラフにおける当該興味ラベルに対応するキーワードにマッチングする第２のノードから当該興味ラベルが存在する第３のノードまでのトポロジー長さを並び替えモデルに入力して、興味ラベルに対応するスコアを取得する。

なお、各興味ラベルに対して、当該興味ラベルに対応するキーワード个数が複数である場合、並び替えモデルに入力された当該興味ラベルに対応するキーワードの重みは、各キーワードにそれぞれ対応する重みの和であり、ナレッジグラフにおける当該興味ラベルに対応するキーワードにマッチングする第２のノードから当該興味ラベルが存在する第３のノードまでのトポロジー長さは、ナレッジグラフにおける、当該興味ラベルに対応する個々キーワードにマッチングする第２のノードから当該興味ラベルが存在する第３のノードまでのトポロジー長さの和である。

例えば、ナレッジグラフ内のラベル「ＢＢ」に対応するノードはノードＡであると仮定すると、ラベル「熱血漫画」に対応するノードはノードＢであり、ラベル「漫画」に対応するノードはノードＣであり、ノードＡの親ノードはノードＢであり、ノードＢの親ノードはノードＣであり、ノードＣに親ノードが存在しない。

ユーザの入力情報に対して情報抽出を行い、生成されたキーワードは「ＢＢ」「熱血漫画」であり、「ＢＢ」がある漫画の名前であり、キーワード「ＢＢ」をナレッジグラフにおける各ノードにそれぞれ対応するラベルにマッチングし、キーワード「ＢＢ」に対応する興味ラベル「ＢＢ」、「熱血漫画」及び「漫画」が得られ、キーワード「熱血漫画」をナレッジグラフにおける各ノードにそれぞれ対応するラベルにマッチングし、キーワード「熱血漫画」に対応する興味ラベル「熱血漫画」と「漫画」が得られ、すなわち、最終的にキーワード「ＢＢ」と「熱血漫画」に対応する３つの興味ラベル「ＢＢ」、「熱血漫画」及び「漫画」を生成する。興味ラベル「ＢＢ」に対応するキーワードはキーワード「ＢＢ」であり、興味ラベル「熱血漫画」に対応するキーワードはキーワード「ＢＢ」及びキーワード「熱血漫画」であり、興味ラベル「漫画」に対応するキーワードはキーワード「ＢＢ」とキーワード「熱血漫画」である。

興味ラベル「ＢＢ」に対して、興味ラベル「ＢＢ」の重み、興味ラベル「ＢＢ」に対応するキーワード「ＢＢ」の重み、及びナレッジグラフにおけるキーワード「ＢＢ」にマッチングするノードＡから興味ラベル「ＢＢ」が存在するノードＡまでのトポロジー長さ０を取得することができ、さらにこの３つのパラメータを並び替えモデルに入力して、興味ラベル「ＢＢ」のスコアを取得する。

興味ラベル「熱血漫画」に対して、興味ラベル「熱血漫画」の重み、興味ラベル「熱血漫画」に対応するキーワード「ＢＢ」の重み、興味ラベル「熱血漫画」に対応するキーワード「熱血漫画」の重み、ナレッジグラフにおけるキーワード「ＢＢ」にマッチングするノードＡから興味ラベル「熱血漫画」が存在するノードＢまでのトポロジー長さ１、ナレッジグラフにおけるキーワード「熱血漫画」にマッチングするノードＢから興味ラベル「熱血漫画」が存在するノードＢまでのトポロジー長さ０を取得することができ、さらに興味ラベル「熱血漫画」の重み、キーワード「ＢＢ」とキーワード「熱血漫画」の重みの和、トポロジー長さ１とトポロジー長さ０との和、この３つのパラメータを並び替えモデルに入力して、興味ラベル「熱血漫画」のスコアを取得する。

興味ラベル「漫画」に対して、興味ラベル「漫画」の重み、興味ラベル「漫画」に対応するキーワード「ＢＢ」の重み、興味ラベル「漫画」に対応するキーワード「熱血漫画」の重み、ナレッジグラフにおけるキーワード「ＢＢ」にマッチングするノードＡから興味ラベル「漫画」が存在するノードＣまでのトポロジー長さ２、ナレッジグラフにおけるキーワード「熱血漫画」にマッチングするノードＢから興味ラベル「漫画」が存在するノードＣまでのトポロジー長さ１を取得することができ、さらに興味ラベル「漫画」の重み、キーワード「ＢＢ」とキーワード「熱血漫画」の重みの和、トポロジー長さ２とトポロジー長さ１との和、この３つのパラメータを並び替えモデルに入力して、興味ラベル「漫画」のスコアを取得する。

各興味ラベルに対して、興味ラベルに対応するページアクセス数に基づいて、興味ラベルの重みを取得し、ＴＦ－ＩＤＦアルゴリズムを使用して、興味ラベルに対応するキーワードの重みを取得し、ナレッジグラフにおける興味ラベルに対応するキーワードにマッチングする第２のノードから興味ラベルが存在する第３のノードまでのトポロジー長さを取得し、さらに興味ラベルの重み、興味ラベルに対応するキーワードの重み、及び第２のノードから第３のノードまでのトポロジー長さを、並び替えモデルに入力して、興味ラベルに対応するスコアを取得することにより、各興味ラベルのスコアを正確に決定することができ、さらに生成されたユーザ興味画像の正確性を向上させる。

例示的な実施例では、ステップ３０３の前に、トレーニングして並び替えモデルを得られることができ、すなわちステップ３０３の前に、トレーニングデータを取得するステップと、初期の並び替えモデルを取得するステップと、トレーニングデータを使用して、初期の並び替えモデルをトレーニングして、トレーニングされた後の並び替えモデルを得るステップと、を含むことができる。

例示的な実施例では、複数のユーザのサンプル入力情報を取得し、各ユーザに属するポジティブサンプルの興味ラベルを手動で表記すると共に、各ユーザのために当該のユーザに属しないいくつかのラベルをネガティブサンプルの興味ラベルとして設定し、複数のユーザのサンプルを情報に入力し、複数のユーザにおける各ユーザのポジティブサンプル興味ラベル及びネガティブサンプルの興味ラベルを、トレーニングデータとすることができ、さらにトレーニングデータを使用して初期の並び替えモデルをトレーニングして、トレーニング後の並び替えモデルを得る。

初期の並び替えモデルは、ＬＲモデルであってもよく、他の二項分類モデルであってもよいが、本開示の実施例はこれに対して限定しない。

例示的な実施例では、トレーニングデータを使用して、初期の並び替えモデルをトレーニングする時、例えば、深層学習によってトレーニングすることができ、他の機械学習方法に比較して、深層学習がビッグデータセット上でよりよく表現される。

例示的な実施例では、各ユーザのサンプル入力情報に対して、上記の実施例に記載の方法に従って、ユーザのサンプル入力情報に対して情報抽出を行って、少なくとも１つのサンプルキーワードを生成し、少なくとも１つのサンプルキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、少なくとも１つのサンプルキーワードに対応するサンプル興味ラベルを生成してから、各サンプル興味ラベルに対して、サンプル興味ラベルの重み、サンプル興味ラベルに対応するサンプルキーワードの重み及びナレッジグラフにおけるサンプル興味ラベルに対応するサンプルキーワードにマッチングする第２のノードからサンプル興味ラベルが存在する第３のノードまでのトポロジー長さを取得することができる。

深層学習によって初期の並び替えモデルをトレーニングする時、まずユーザａのサンプル入力情報に基づいて得られた１つのサンプル興味ラベルａ１の重み、当該サンプル興味ラベルａ１に対応するサンプルキーワードａ１’の重み、ナレッジグラフにおける当該サンプルキーワードａ１’にマッチングする第２のノードから当該サンプル興味ラベルａ１が存在する第３までのノードのトポロジー長さを入力として、初期の並び替えモデルに入力して、当該サンプル興味ラベルａ１のスコアを取得することができ、サンプル興味ラベルａ１のスコアは、サンプル興味ラベルａ１がユーザａに対応する興味ラベルの確率であることを表し、サンプル興味ラベルａ１のスコア、及びトレーニングデータにおいてａ１がユーザａのポジティブサンプル興味ラベルであるかネガティブサンプルの興味ラベルであるかと併せて、初期の並び替えモデルのモデルパラメータを調整し、調整後の並び替えモデルを得る。さらにユーザａのサンプル入力情報に基づいて得られた別のサンプル興味ラベルａ２の重み、当該サンプル興味ラベルａ２に対応するサンプルキーワードａ２’の重み、ナレッジグラフにおける当該サンプルキーワードａ２’にマッチングする第２のノードから当該サンプル興味ラベルａ２が存在する第３のノードまでのトポロジー長さを入力として、調整後の並び替えモデルに入力し、当該サンプル興味ラベルａ２のスコアを取得し、サンプル興味ラベルａ２のスコアは、サンプル興味ラベルａ２がユーザａに対応する興味ラベルの確率であることを表し、サンプル興味ラベルａ２のスコア、及びトレーニングデータにおいてａ２がユーザａのポジティブサンプル興味ラベルであるかネガティブサンプルの興味ラベルであるかと併せて、調整後の並び替えモデルのモデルパラメータに対して調整し、更なる調整後の並び替えモデルを得る。そのため、個々ユーザのサンプル入力情報に基づいて得られたサンプル興味ラベルの重み、サンプル興味ラベルに対応するサンプルキーワードの重み、ナレッジグラフにおけるサンプル興味ラベルに対応するサンプルキーワードにマッチングする第２のノードからサンプル興味ラベルが存在する第３のノードまでのトポロジー長さ、サンプル興味ラベルが対応するユーザのポジティブサンプル興味ラベルであるかネガティブサンプルの興味ラベルであるかにより、並び替えモデルによって出力されたサンプル興味ラベルのスコアの精度が予め設定された閾値を満たすまで、初期の並び替えモデルのモデルパラメータを絶えず調整して初期の並び替えモデルに対して反復トレーニングし、トレーニングが終了し、トレーニングされた並び替えモデルを得る。

ステップ３０５、並び替えられた後の少なくとも１つのキーワードに対応する興味ラベルに基づいて、ユーザ興味画像を生成する。

なお、並び替えられた後の少なくとも１つのキーワードに対応する興味ラベルを取得した後、必要に応じて少なくとも１つのキーワードに対応する興味ラベルに対して後処理を行ってもよく、例えばブラックリスト内の単語をフィルタリングし、興味ラベルがホットワードである場合に当該興味ラベルの並び替えを早めるなどしてもよい。

以下、図４と併せて、本開示の実施例によって提供されるユーザ興味画像の生成方法に対してさらに説明する。

図４に示すように、まずユーザの入力情報（ステップ４０１）を取得してから、ユーザの入力情報に対して情報抽出を行うことができ（ステップ４０２）、さらに少なくとも１つのキーワード（ステップ４０３）を生成する。さらに、例えば少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングして（ステップ４０４）、少なくとも１つのキーワードに対応する興味ラベルを生成する（ステップ４０５）。各興味ラベルに対して、当該興味ラベルの重み（図４に示されない）、当該興味ラベルに対応するキーワードの重み（図４に示されない）、ナレッジグラフにおける当該興味ラベルに対応するキーワードにマッチングするノードから当該興味ラベルが存在するノードまでのトポロジー長さ（ステップ４０６）を取得することができ、さらに各興味ラベルに対して、当該興味ラベルの重み、当該興味ラベルに対応するキーワードの重み、及びナレッジグラフにおける当該興味ラベルに対応するキーワードにマッチングする第２のノードから当該興味ラベルが存在する第３のノードまでのトポロジー長さを並び替えモデルに入力して、興味ラベルに対応するスコアを取得し、これによって少なくとも１つのキーワードに対応する興味ラベルに対応するスコアに基づいて、少なくとも１つのキーワードに対応する興味ラベルを並び替えて（ステップ４０７）ユーザ興味画像を生成することができる（ステップ４０８）。

上記のプロセスによれば、ユーザの入力情報に対して情報抽出を行い、少なくとも１つのキーワードを生成し、少なくとも１つのキーワードに対応する興味ラベルを生成した後、ナレッジグラフにおける興味ラベルに対応するキーワードにマッチングするノードから興味ラベルが存在するノードまでのトポロジー長さに基づいて、並び替えモデルを使用して、少なくとも１つのキーワードに対応する興味ラベルを並び替え、さらに並び替えられた後の少なくとも１つのキーワードに対応する興味ラベルに基づいて、ユーザ興味画像を生成する。

以下、図５と併せて、本開示によって提供されるユーザ興味画像の生成装置に対して説明する。

図５は本開示の第４の実施例に係るユーザ興味画像の生成装置の概略構成図である。

図５に示すように、本開示によって提供されるユーザ興味画像の生成装置５００は、抽出モジュール５０１、マッチングモジュール５０２及び生成モジュール５０３を備える。

抽出モジュール５０１は、ユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成する。

マッチングモジュール５０２は、少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、少なくとも１つのキーワードに対応する興味ラベルを生成する。

生成モジュール５０３は、少なくとも１つのキーワードに対応する興味ラベルを並び替え、並び替えられた後の少なくとも１つのキーワードに対応する興味ラベルに基づいて、ユーザ興味画像を生成する。

なお、本実施例によって提供されるユーザ興味画像の生成装置は、上記実施例のユーザ興味画像の生成方法を実行することができる。ユーザ興味画像の生成装置は電子機器であってもよく、電子機器に設置されたものであってもよく、ユーザ興味画像を生成する時に必要な人件費を削減する。

なお、上記ユーザ興味画像の生成方法の実施例についての説明は、本開示によって提供されるユーザ興味画像の生成方法にも適用され、ここでは説明を省略する。

本開示の実施例によって提供されるユーザ興味画像の生成装置は、まずユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成し、その後、少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、少なくとも１つのキーワードに対応する興味ラベルを生成してから、少なくとも１つのキーワードに対応する興味ラベル並び替え、並び替えられた後の少なくとも１つのキーワードに対応する興味ラベルに基づいて、ユーザ興味画像を生成する。それにより、ユーザ興味画像を生成するために必要な人件費を削減する。

以下、図６と併せて、本開示によって提供されるユーザ興味画像の生成装置に対して説明する。

図６は本開示の第５の実施例に係るユーザ興味画像の生成装置の概略構成図である。

図６に示すように、ユーザ興味画像の生成装置６００は、具体的に抽出モジュール６０１、マッチングモジュール６０２及び生成モジュール６０３を備えることができる。図６における抽出モジュール６０１、マッチングモジュール６０２及び生成モジュール６０３は図５における抽出モジュール５０１、マッチングモジュール５０２及び生成モジュール５０３とは同じ機能と構造を有する。

例示的な実施例では、マッチングモジュール６０２は、キーワードに対して、キーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、ナレッジグラフにおけるキーワードにマッチングする第１のノードを決定するマッチングサブモジュール６０２１と、ナレッジグラフにおける第１のノードに対応するルートノードを取得する第１の取得サブモジュール６０２２と、第１のノードに対応するラベル、ルートノードに対応するラベル、及び第１のノードとルートノードとの間のパスにおける個々のノードにそれぞれ対応するラベルを、キーワードに対応する興味ラベルとして決定する決定サブモジュール６０２３と、を備える。

例示的な実施例では、興味ラベルは複数であり、生成モジュール６０３は、各興味ラベルに対して、並び替えモデルを使用して、興味ラベルに対応するスコアを取得する第２の取得サブモジュール６０３１と、少なくとも１つのキーワードに対応する興味ラベルに対応するスコアに基づいて、少なくとも１つのキーワードに対応する興味ラベルを並び替える並び替えサブモジュール６０３２と、を備える。

例示的な実施例では、第２の取得サブモジュール６０３１は、興味ラベルの重み及び興味ラベルに対応するキーワードの重みを取得する第１の取得ユニットと、ナレッジグラフにおける興味ラベルに対応するキーワードにマッチングする第２のノード及び興味ラベルが存在する第３のノードを取得する第２の取得ユニットと、ナレッジグラフにおける第２のノードから第３のノードまでのトポロジー長さを決定する決定ユニットと、興味ラベルの重み、興味ラベルに対応するキーワードの重み、及び第２のノードから第３のノードまでのトポロジー長さを、並び替えモデルに入力して、興味ラベルに対応するスコアを取得する第３の取得ユニットと、を備える。

例示的な実施例では、第１の取得ユニットは、興味ラベルに対応するページアクセス数に基づいて、興味ラベルの重みを取得する第１の取得サブユニットと、単語の出現頻度－逆文書頻度ＴＦ－ＩＤＦアルゴリズムを使用して、興味ラベルに対応するキーワードの重みを取得する第２の取得サブユニットと、を備える。

例示的な実施例では、ユーザ興味画像の生成装置６００は、トレーニングデータを取得する第１の取得モジュール６０４と、初期の並び替えモデルを取得する第２の取得モジュール６０５と、トレーニングデータを使用して、初期の並び替えモデルをトレーニングして、トレーニングされた後の並び替えモデルを得るトレーニングモジュール６０６と、をさらに備えることができる。

なお、上記ユーザ興味画像の生成方法の実施例に対する説明は、本開示によって提供されるユーザ興味画像の生成装置にも適用され、ここでは説明を省略する。

本開示の実施例によれば、本開示は、電子機器、読み取り可能な記憶媒体、及びコンピュータプログラムをさらに提供する。

図７は、本開示の実施例を実行するための例示的な電子機器７００の概略ブロック図を示す。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、携帯情報端末、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の同様のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すこともできる。本明細書で示される部品、それらの接続と関係、及びそれらの機能は、単なる例であり、本明細書で説明された及び／又は求められた本開示の実現を限定することを意図したものではない。

図７に示すように、電子機器７００は、読み取り専用メモリ（ＲＯＭ）７０２に記憶されているコンピュータプログラムまたは記憶部７０８からランダムアクセスメモリ（ＲＡＭ）７０３にロードされたコンピュータプログラムに従って様々な適切な動作および処理を実行する計算ユニット７０１を備える。ＲＡＭ７０３には、電子機器７００の動作に必要な各種のプログラムやデータも記憶されてもよい。計算ユニット７０１、ＲＯＭ７０２、およびＲＡＭ７０３は、バス７０４を介して互いに接続されている。パス７０４には、入力／出力（Ｉ／Ｏ）インターフェース７０５も接続されている。

電子機器７００の複数のコンポーネントはＩ／Ｏインターフェース７０８に接続され、キーボード、マウスなどの入力ユニット７０６、各タイプのディスプレイ、スピーカなどの出力ユニット７０７、磁気ディスク、光ディスクなどの記憶ユニット７０５、およびネットワークカード、モデム、無線通信トランシーバなどの通信ユニット７０９を備える。通信ユニット７０９は、電子機器７００が、インターネットなどのコンピュータネットワークと／または各種の電信ネットワークを介して他のデバイスと情報／データを交換することを可能にする。

計算ユニット７０１は、処理および計算能力を有する様々な汎用と／または専用の処理コンポーネントであってもよい。計算ユニット７０１のいくつかの例は、中央処理装置（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、各種の専用の人工知能（ＡＩ）計算チップ、各種のマシン運転学習モデルアルゴリズムの計算ユニット、デジタル信号プロセッサ（ＤＳＰ）、およびいずれかの適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット７０１は、上記に記載された各方法及び処理、例えば、ユーザ興味画像の生成方法を実行する。例えば、いくつかの実施例では、ユーザ興味画像の生成方法を、記憶ユニット７０８などの機械読み取り可能な媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現することができる。いくつかの実施例では、コンピュータプログラムの一部または全部はＲＯＭ７０２および／または通信ユニット７０９を介して電子機器７００にロードおよび／またはインストールされてもよい。コンピュータプログラムがＲＡＭ７０３にロードされ、計算ユニット７０１によって実行される場合、前文に記載されたユーザ興味画像の生成方法の１つまたは複数のステップが実行されてもよい。代替的に、他の実施例では、計算ユニット７０１はユーザ興味画像の生成方法を実行するように、他のいずれかの適切な方式（例えば、ファームウェアを介して）によって構成されてもよい。

本明細書の上記記載されたシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップ（ＳＯＣ）、コンプレックス・プログラマブル・ロジック・デバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを備えるプログラム可能なシステムで実行及び／又は解釈されることができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも１つの入力装置、及び当該少なくとも１つの出力装置に伝送することができる。

本開示の方法を実行するためのプログラムコードは、１つ又は複数のプログラミング言語の任意の組み合わせで書くことができる。これらのプログラムコードは、プロセッサ又はコントローラによって実行された際に、フローチャート及び／又はブロック図に規定された機能／操作が実施されるように、汎用コンピュータ、専用コンピュータ、又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供されてもよい。プログラムコードは、完全に機械上で実行され、部分的に機械上で実行され、スタンドアロンソフトウェアパッケージとして、部分的に機械上で実行され、部分的にリモート機械上で実行され、又は完全にリモート機械又はサーバ上で実行されてもよい。

本開示のコンテキストでは、機械読み取り可能な媒体は、命令実行システム、装置、またはデバイスによって使用されるために、又は命令実行システム、装置、またはデバイスと組み合わせて使用するためのプログラムを含むか、又は記憶することができる有形の媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体または機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、電子的、磁気的、光学的、電磁気的、赤外線的、又は半導体システム、装置又はデバイス、または上記内容のいずれかの適切な組み合わせを備えることができるが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例は、１つ又は複数のラインに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、消去可能プログラマブルリードオンリーメモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバ、ポータブルコンパクトディスクリードオンリーメモリ（ＣＤ－ＲＯＭ）、光学記憶装置、磁気記憶装置、または上記内容のいずれかの適切な組み合わせを含む。

ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータ上で実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウス又はトラックボール）とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザによって提供されるフィードバックは、任意の形式のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、任意の形式（音響入力と、音声入力、または、触覚入力とを含む）でユーザからの入力を受信することができる。

ここで説明されたシステム及び技術は、バックエンドコンポーネントを備えるコンピューティングシステム（例えば、データサーバとする）、又はミドルウェアコンポーネントを備えるコンピューティングシステム（例えば、アプリケーションサーバー）、又はフロントエンドコンポーネントを備えるコンピューティングシステム（例えば、グラフィカルユーザインターフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインターフェース又は当該ウェブブラウザによってここで説明されたシステム及び技術の実施形態とインタラクションできる）、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントのいずれかの組み合わせを備えるコンピューティングシステムで実行することができる。いずれかの形態又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットと、ブロックチェーンネットワークを含む。

コンピュータシステムは、クライアントとサーバを備えることができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント－サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバはクラウドサーバであってもよい、クラウドコンピューティングサーバまたはクラウドホストとも呼ばれ、クラウドコンピューティングサービスシステムにおける１つのホスト製品であり、従来の物理ホストとＶＰＳサービス（「ＶｉｒｔｕａｌＰｒｉｖａｔｅＳｅｒｖｅｒ」、または「ＶＰＳ」と略す）に存在する管理が難しくて業務拡張性が弱いという欠陥を解決した。サーバは分散システムのサーバであってもよいし、ブロックチェーンを組み込んだサーバであってもよい。

本開示は、コンピュータ技術分野に関し、特に自然言語処理、ナレッジグラフなどの人工知能技術分野に関する。

なお、人工知能はコンピュータに人間のある思惟過程と知能行為（学習、推理、思考、計画など）をシミュレートさせることを研究する学科であり、ハードウェアレベルの技術とソフトウェアレベルの技術ともある。人工知能ハードウェア技術は一般にセンサー、専用人工知能チップ、クラウド計算、分散記憶、ビッグデータ処理などの技術を含む。人工知能ソフトウェア技術は主にコンピュータ視覚技術、音声認識技術、自然言語処理技術及び機械学習／深層学習、ビッグデータ処理技術、ナレッジグラフ技術などのいくつかの方向を含む。

本開示の実施例の技術案に基づいて、まずユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成し、さらに前記少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、前記少なくとも１つのキーワードに対応する興味ラベルを生成してから、前記少なくとも１つのキーワードに対応する興味ラベルを並び替え、並び替えられた後の前記少なくとも１つのキーワードに対応する興味ラベルに基づいて、前記ユーザ興味画像を生成する。それにより、ユーザ興味画像を生成するために必要な人件費を削減する。

上記に示される様々な形態のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本開示に記載されている各ステップは、並列に実行されてもよいし、順次実行されてもよいし、異なる順序で実行されてもよいが、本開示で開示されている技術案の所望の結果を実現することができれば、本明細書では限定されない。

当業者は、設計要件と他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができることを理解されたい。任意の本開示の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本開示の保護範囲内に含まれなければならない。

Claims

ユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成するステップと、
前記少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、前記少なくとも１つのキーワードに対応する興味ラベルを生成するステップと、
前記少なくとも１つのキーワードに対応する興味ラベルを並び替え、並び替えられた後の前記少なくとも１つのキーワードに対応する興味ラベルに基づいて、ユーザ興味画像を生成するステップと、
を含む、ユーザ興味画像の生成方法。
前記少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、前記少なくとも１つのキーワードに対応する興味ラベルを生成するステップが、
前記キーワードに対して、前記キーワードと、それぞれ前記ナレッジグラフの各ノードに対応するラベルとをマッチングして、前記ナレッジグラフにおける前記キーワードにマッチングする第１のノードを決定するステップと、
前記ナレッジグラフにおける前記第１のノードに対応するルートノードを取得するステップと、
前記第１のノードに対応するラベル、前記ルートノードに対応するラベル、及び前記第１のノードと前記ルートノードとの間のパスにおける各ノードにそれぞれ対応するラベルを、前記キーワードに対応する興味ラベルとして決定するステップと、
を含む請求項１に記載の方法。
前記興味ラベルは複数であり、前記少なくとも１つのキーワードに対応する興味ラベルを並び替える前記ステップが、
各前記興味ラベルに対して、並び替えモデルを使用して、前記興味ラベルに対応するスコアを取得するステップと、
前記少なくとも１つのキーワードに対応する興味ラベルに対応するスコアに基づいて、前記少なくとも１つのキーワードに対応する興味ラベルを並び替えるステップと、
を含む請求項１または２に記載の方法。
各前記興味ラベルに対して、並び替えモデルを使用して、前記興味ラベルに対応するスコアを取得するステップが、
前記興味ラベルの重み及び前記興味ラベルに対応するキーワードの重みを取得するステップと、
前記ナレッジグラフにおける前記興味ラベルに対応するキーワードにマッチングする第２のノード及び前記興味ラベルが存在する第３のノードを取得するステップと、
前記ナレッジグラフにおける前記第２のノードから前記第３のノードまでのトポロジー長さを決定するステップと、
前記興味ラベルの重み、前記興味ラベルに対応するキーワードの重み、及び前記第２のノードから前記第３のノードまでのトポロジー長さを、前記並び替えモデルに入力して、前記興味ラベルに対応するスコアを取得するステップと、
を含む請求項３に記載の方法。
前記興味ラベルの重み及び前記興味ラベルに対応するキーワードの重みを取得するステップが、
前記興味ラベルに対応するページアクセス数に基づいて、前記興味ラベルの重みを取得するステップと、
単語の出現頻度－逆文書頻度ＴＦ－ＩＤＦアルゴリズムを使用して、前記興味ラベルに対応するキーワードの重みを取得するステップと、
を含む請求項４に記載の方法。
各前記興味ラベルに対して、並び替えモデルを使用して、前記興味ラベルに対応するスコアを取得するステップ前に、
トレーニングデータを取得するステップと、
初期の並び替えモデルを取得するステップと、
トレーニングデータを使用して、初期の並び替えモデルをトレーニングして、トレーニングされた後の並び替えモデルを得るステップと、
を含む請求項３に記載の方法。
ユーザの入力情報に対して情報抽出を行って、少なくとも１つのキーワードを生成する抽出モジュールと、
前記少なくとも１つのキーワードと、それぞれナレッジグラフの各ノードに対応するラベルとをマッチングし、前記少なくとも１つのキーワードに対応する興味ラベルを生成するマッチングモジュールと、
前記少なくとも１つのキーワードに対応する興味ラベルを並び替え、並び替えられた後の前記少なくとも１つのキーワードに対応する興味ラベルに基づいて、ユーザ興味画像を生成する生成モジュールと、
を備える、ユーザ興味画像の生成装置。
前記マッチングモジュールが、
前記キーワードに対して、前記キーワードと、それぞれ前記ナレッジグラフの各ノードに対応するラベルとをマッチングして、前記ナレッジグラフにおける前記キーワードにマッチングする第１のノードを決定するマッチングサブモジュールと、
前記ナレッジグラフにおける前記第１のノードに対応するルートノードを取得する第１の取得サブモジュールと、
前記第１のノードに対応するラベル、前記ルートノードに対応するラベル、及び前記第１のノードと前記ルートノードとの間のパスにおける各ノードにそれぞれ対応するラベルを、前記キーワードに対応する興味ラベルとして決定する決定サブモジュールと、
を含む請求項７に記載の装置。
前記興味ラベルは複数であり、前記生成モジュールが、
各前記興味ラベルに対して、並び替えモデルを使用して、前記興味ラベルに対応するスコアを取得する第２の取得サブモジュールと、
前記少なくとも１つのキーワードに対応する興味ラベルに対応するスコアに基づいて、前記少なくとも１つのキーワードに対応する興味ラベルを並び替える並び替えサブモジュールと、
を含む請求項７または８に記載の装置。
前記第２の取得サブモジュールが、
前記興味ラベルの重み及び前記興味ラベルに対応するキーワードの重みを取得する第１の取得ユニットと、
前記ナレッジグラフにおける前記興味ラベルに対応するキーワードにマッチングする第２のノード及び前記興味ラベルが存在する第３のノードを取得する第２の取得ユニットと、
前記ナレッジグラフにおける前記第２のノードから前記第３のノードまでのトポロジー長さを決定する決定ユニットと、
前記興味ラベルの重み、前記興味ラベルに対応するキーワードの重み、及び前記第２のノードから前記第３のノードまでのトポロジー長さを、前記並び替えモデルに入力して、前記興味ラベルに対応するスコアを取得する第３の取得ユニットと、
を含む請求項９に記載の装置。
前記第１の取得ユニットが、
前記興味ラベルに対応するページアクセス数に基づいて、前記興味ラベルの重みを取得する第１の取得サブユニットと、
単語の出現頻度－逆文書頻度ＴＦ－ＩＤＦアルゴリズムを使用して、前記興味ラベルに対応するキーワードの重みを取得する第２の取得サブユニットと、
を含む請求項１０に記載の装置。
トレーニングデータを取得する第１の取得モジュールと、
初期の並び替えモデルを取得する第２の取得モジュールと、
トレーニングデータを使用して、初期の並び替えモデルをトレーニングして、トレーニングされた後の並び替えモデルを得るトレーニングモジュールと、
を備える請求項９に記載の装置。
少なくとも１つのプロセッサと、
該少なくとも１つのプロセッサと通信可能に接続されるメモリと、
を備え、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令が、前記少なくとも１つのプロセッサが請求項１から６のいずれか一項に記載の方法を実行できるように、前記少なくとも１つのプロセッサによって実行される電子機器。
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令が、コンピュータに請求項１から６のいずれか一項に記載の方法を実行させる、非一時的なコンピュータ読み取り可能な記憶媒体。
プロセッサによって実行される場合に、請求項１から６のいずれか一項に記載の方法を実現するコンピュータプログラム。