JP7018762B2 - Information processing equipment, information processing methods, and programs - Google Patents

Information processing equipment, information processing methods, and programs Download PDF

Info

Publication number
JP7018762B2
JP7018762B2 JP2017245345A JP2017245345A JP7018762B2 JP 7018762 B2 JP7018762 B2 JP 7018762B2 JP 2017245345 A JP2017245345 A JP 2017245345A JP 2017245345 A JP2017245345 A JP 2017245345A JP 7018762 B2 JP7018762 B2 JP 7018762B2
Authority
JP
Japan
Prior art keywords
article
content
distributed
contents
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017245345A
Other languages
Japanese (ja)
Other versions
JP2019113945A (en
Inventor
俊平 大倉
翔悟 湯浅
真吾 星野
秀平 宇野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2017245345A priority Critical patent/JP7018762B2/en
Publication of JP2019113945A publication Critical patent/JP2019113945A/en
Application granted granted Critical
Publication of JP7018762B2 publication Critical patent/JP7018762B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関する。 The present invention relates to an information processing apparatus, an information processing method, and a program.

従来、ウェブページに掲載される記事や広告等のコンテンツに対してユーザが行動(例えば、クリック操作)を起こす可能性を高めるための方法が知られている。例えば、ユーザのクリック率等のアクセス履歴情報に基づいて、所定数の広告の組み合わせの内、過去に行動を起こした重複ないユーザの数が最も多くなるように広告を選択する方法が知られている(例えば、特許文献1参照)。 Conventionally, a method for increasing the possibility that a user takes an action (for example, a click operation) with respect to a content such as an article or an advertisement posted on a web page has been known. For example, there is known a method of selecting an advertisement so that the number of unique users who have acted in the past is the largest among a predetermined number of combinations of advertisements based on access history information such as a user's click rate. (For example, see Patent Document 1).

特開2013-89080号公報Japanese Unexamined Patent Publication No. 2013-89080

あるウェブページにおいて、内容が互いに類似するコンテンツが多く掲載されていると、このウェブページ全体におけるコンテンツのクリック率が低下する傾向があることが知られている。このため、クリック率を向上させるためには、ウェブページに掲載されるコンテンツに多様性を持たせることが重要となる。 It is known that when a large amount of content similar in content is posted on a certain web page, the click rate of the content on the entire web page tends to decrease. Therefore, in order to improve the click rate, it is important to have diversity in the content posted on the web page.

また、特許文献1に開示されている方法において、配信対象のコンテンツを決定するためにはユーザのアクセス履歴情報が必要となる。このため、ユーザによるアクセスの実績がない新たなコンテンツは、配信対象として選択されにくくなる場合や、全く選択されない場合があった。 Further, in the method disclosed in Patent Document 1, user access history information is required to determine the content to be distributed. For this reason, new content that has not been accessed by the user may be difficult to be selected as a distribution target, or may not be selected at all.

本発明は、このような事情を考慮してなされたものであり、提供するコンテンツの多様性を高めることが可能な情報処理装置、情報処理方法、およびプログラムを提供することを目的の一つとする。 The present invention has been made in consideration of such circumstances, and one of the objects of the present invention is to provide an information processing device, an information processing method, and a program capable of increasing the variety of contents to be provided. ..

本発明の一態様は、ネットワークを介して配信される候補となる複数のコンテンツの各々に対応するベクトルデータを生成する第1生成部と、前記第1生成部により生成された複数のベクトルデータに基づいて、コンテンツの多様性を高めるように、前記複数のコンテンツの中から、配信対象のコンテンツを決定する決定部と、を備える情報処理装置である。 One aspect of the present invention includes a first generation unit that generates vector data corresponding to each of a plurality of candidate contents distributed via a network, and a plurality of vector data generated by the first generation unit. Based on this, it is an information processing device including a determination unit that determines the content to be distributed from the plurality of contents so as to increase the diversity of the contents.

本発明の一態様によれば、提供するコンテンツの多様性を高めることが可能である。 According to one aspect of the present invention, it is possible to increase the variety of contents to be provided.

実施形態に係るコンテンツの多様性を説明する図である。It is a figure explaining the diversity of contents which concerns on embodiment. 実施形態に係るサービス提供装置20の機能構成を示す機能ブロック図である。It is a functional block diagram which shows the functional structure of the service providing apparatus 20 which concerns on embodiment. 実施形態に係る記事ベクトル生成部25の処理の内容を概念的に示す図である。It is a figure which conceptually shows the content of the process of the article vector generation part 25 which concerns on embodiment. 実施形態に係る配信記事情報33の内容の一例を示す図である。It is a figure which shows an example of the content of the distribution article information 33 which concerns on embodiment. 実施形態に係る記事ベクトル情報35の内容の一例を示す図である。It is a figure which shows an example of the content of the article vector information 35 which concerns on embodiment. 実施形態に係るサービス提供装置20の処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the processing flow of the service providing apparatus 20 which concerns on embodiment. 実施形態における第3候補記事のベクトル空間上での位置と、第1および第2記事ベクトルにより構成される部分空間との距離を説明する図である。It is a figure explaining the distance between the position of the 3rd candidate article in the vector space in embodiment, and the subspace composed of the 1st and 2nd article vectors. 実施形態における第4候補記事のベクトル空間上での位置と、第1から第3記事ベクトルにより構成される部分空間との距離を説明する図である。It is a figure explaining the distance between the position of the 4th candidate article in the vector space in embodiment, and the subspace composed of the 1st to 3rd article vectors.

以下、図面を参照して、本発明の情報処理装置、情報処理方法、およびプログラムの実施形態について説明する。 Hereinafter, embodiments of the information processing apparatus, information processing method, and program of the present invention will be described with reference to the drawings.

[概要]
実施形態の情報処理装置(サービス提供装置)は、ユーザにより操作される端末装置からのリクエストに対応するウェブページを提供するウェブサーバ装置、アプリケーションが起動された端末装置と通信を行って各種情報の受け渡しを行ってアプリページを提供するアプリケーションサーバ装置等である。これらのウェブページおよびアプリページは、検索サイト、ニュースサイト、ショッピングサイト、オークションサイト、天気予報サイト、SNS(Social Networking Service)サイト、ゲームサイト等を構成するページである。
[Overview]
The information processing device (service providing device) of the embodiment communicates with a web server device that provides a web page corresponding to a request from a terminal device operated by a user, and a terminal device in which an application is started to obtain various information. It is an application server device or the like that delivers and provides an application page. These web pages and application pages are pages constituting a search site, a news site, a shopping site, an auction site, a weather forecast site, an SNS (Social Networking Service) site, a game site, and the like.

上述のウェブページ或いはアプリページは、各種ジャンルのニュース等の記事、広告(電子広告)等のコンテンツを複数含む。記事とは、インターネット等のネットワークを介して提供される電子的な記事であり、テキスト情報を含むものである。情報処理装置は、コンテンツに含まれる内容の多様性が保たれるように複数のコンテンツを選択し、選択した複数のコンテンツを含むウェブページ或いはアプリページを生成する。以下においては、コンテンツが、記事である例について説明する。 The above-mentioned web page or application page includes a plurality of articles such as news of various genres and a plurality of contents such as advertisements (electronic advertisements). An article is an electronic article provided via a network such as the Internet, and includes text information. The information processing device selects a plurality of contents so that the diversity of the contents included in the contents is maintained, and generates a web page or an application page containing the selected plurality of contents. In the following, an example in which the content is an article will be described.

[多様性]
「多様性」とは、複数の記事が存在する場合において、記事の内容が幅広いカテゴリに亘っている度合いをいう。あるウェブページに複数の記事が掲載される場合、記事の多様性が高いほど、これらの記事に関心を持つユーザの範囲が広くなることが推定される。一方、記事の多様性が低いほど、すなわち、記事の内容が同じようなカテゴリに集中しているほど、これらの記事に関心を持つユーザの範囲が狭くなることが推定される。
[Diversity]
"Diversity" refers to the degree to which the content of an article covers a wide range of categories when there are multiple articles. When multiple articles are posted on a web page, it is estimated that the greater the variety of articles, the wider the range of users who are interested in these articles. On the other hand, it is presumed that the less diverse the articles, that is, the more the content of the articles is concentrated in similar categories, the narrower the range of users who are interested in these articles.

多様性は、例えば、記事のベクトルに基づいて定量化される。図1は、多様性を説明する図である。ここで、記事の内容に関する特徴を表すために、複数の観点で定義された多次元のベクトルデータを用いる。図1においては、2次元のベクトルを構成する要素1および要素2により記事の特徴が表されるものとして説明する。要素1および要素2は、互いに異なる観点の特徴を示すものである。要素1および要素2は、例えば、記事がニュースである場合に「即時性」という観点の特徴や、「野球」または「サッカー」といったスポーツの「種別」という観点の特徴をベクトルで表現したものである。 Diversity is quantified, for example, based on article vectors. FIG. 1 is a diagram illustrating diversity. Here, in order to represent the characteristics of the content of the article, multidimensional vector data defined from a plurality of viewpoints is used. In FIG. 1, it is assumed that the features of the article are represented by the elements 1 and 2 constituting the two-dimensional vector. Element 1 and element 2 show characteristics of different viewpoints from each other. Element 1 and element 2 are vector representations of, for example, the characteristics of the viewpoint of "immediateness" when the article is news, and the characteristics of the viewpoint of "type" of sports such as "baseball" or "soccer". be.

図1において、U1は第1のカテゴリに属する記事を参照したユーザの集合を示しており、U2は第2のカテゴリに属する記事を参照したユーザの集合を示している。集合U1と集合U2とは、範囲R1の部分において互いに重なっている。ウェブページに掲載される記事として2つの記事を選択する場合には、このような重なりの範囲R1が小さくなるように記事を選択する。これにより、ウェブページ全体としての記事の多様性を高めることができる。 In FIG. 1, U1 shows a set of users who referred to articles belonging to the first category, and U2 shows a set of users who referred to articles belonging to the second category. The set U1 and the set U2 overlap each other in the portion of the range R1. When selecting two articles as articles to be posted on a web page, select the articles so that the overlap range R1 becomes small. This can increase the variety of articles on the web page as a whole.

次に、ウェブページに掲載される記事として、第1のカテゴリに属する記事と、第2のカテゴリに属する記事とが選択されている場合において、3つ目の記事を選択する場合を考える。第1のカテゴリに属する記事と、第2のカテゴリに属する記事とは、要素1の方向に並んで配置されている。すなわち、第1のカテゴリに属する記事と、第2のカテゴリに属する記事とにおいて、要素1に関する記事の多様性(バリエーション)が確保されている。ここで、3つ目の記事を選択する場合、要素1の方向に位置する記事(例えば、集合U3に属するユーザによって参照された第3のカテゴリに属する記事)よりも、この要素1とは異なる要素2の方向に位置する記事(例えば、集合U4に属するユーザによって参照された第4のカテゴリに属する記事)を選択した方が、ウェブページ全体としての多様性が高くなる。すなわち、多様性は、記事の重なりの範囲だけでなく、基準とした要素における重なりが既に出現している場合、他の要素の方向に関して重なっている方が高いと評価される。情報処理装置は、このように多様性を高めるように複数の記事を選択する。 Next, consider a case where an article belonging to the first category and an article belonging to the second category are selected as articles to be posted on a web page, and a third article is selected. Articles belonging to the first category and articles belonging to the second category are arranged side by side in the direction of element 1. That is, the variety of articles related to element 1 is ensured between the articles belonging to the first category and the articles belonging to the second category. Here, when the third article is selected, it is different from the article located in the direction of the element 1 (for example, the article belonging to the third category referenced by the user belonging to the set U3). Selecting an article located in the direction of element 2 (for example, an article belonging to the fourth category referenced by a user belonging to the set U4) increases the diversity of the web page as a whole. That is, diversity is evaluated to be higher not only in the range of article overlap, but also in the direction of other elements when overlap in the reference element has already appeared. The information processing device selects a plurality of articles so as to increase the diversity in this way.

[全体構成]
図2は、サービス提供装置20の機能構成を示す機能ブロック図である。サービス提供装置20は、ネットワークNWに接続される。ネットワークNWには、サービス提供装置20の他、例えば、少なくとも1つの端末装置10が接続される。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)やLAN(Local Area Network)、プロバイダ装置、無線基地局、専用回線等のうち一部または全部を含む。
[overall structure]
FIG. 2 is a functional block diagram showing a functional configuration of the service providing device 20. The service providing device 20 is connected to the network NW. In addition to the service providing device 20, for example, at least one terminal device 10 is connected to the network NW. The network NW includes, for example, a part or all of the Internet, WAN (Wide Area Network), LAN (Local Area Network), provider equipment, wireless base station, dedicated line, and the like.

端末装置10は、サービス提供装置20によって提供されるウェブページ等のサービスを利用するユーザによって操作される。端末装置10は、例えば、パーソナルコンピュータ、スマートフォン等の携帯電話やタブレット端末、PDA(Personal Digital Assistant)等である。 The terminal device 10 is operated by a user who uses a service such as a web page provided by the service providing device 20. The terminal device 10 is, for example, a personal computer, a mobile phone such as a smartphone, a tablet terminal, a PDA (Personal Digital Assistant), or the like.

例えば、端末装置10は、ユーザから所定の操作を受け付けると、予めインストールされたブラウザによって、サービス提供装置20によって提供されるウェブページを表示する。このウェブページには、複数の記事(例えば、少なくとも3つの記事)が含まれる。また、端末装置10は、ユーザから所定の操作を受け付けると、予めインストールされたアプリケーションを介してサービス提供装置20と通信を行い、アプリケーション上で表示或いは再生するコンテンツを取得する。コンテンツは、例えば、動画データや、画像データ、音声データ、テキストデータ等であり、複数の記事が含まれる。これによって、端末装置10には、アプリケーションを介して、上述した各種ウェブページにより提供されるサービスと同様のサービスが提供される。以下においては、サービス提供装置20が、端末装置10にウェブページを提供する例について説明する。 For example, when the terminal device 10 receives a predetermined operation from the user, the terminal device 10 displays a web page provided by the service providing device 20 by a browser installed in advance. This web page contains multiple articles (eg, at least three articles). Further, when the terminal device 10 receives a predetermined operation from the user, the terminal device 10 communicates with the service providing device 20 via the application installed in advance, and acquires the content to be displayed or reproduced on the application. The content is, for example, video data, image data, audio data, text data, or the like, and includes a plurality of articles. As a result, the terminal device 10 is provided with a service similar to the service provided by the various web pages described above via the application. In the following, an example in which the service providing device 20 provides a web page to the terminal device 10 will be described.

サービス提供装置20は、例えば、通信部21と、候補記事抽出部23と、記事ベクトル生成部25(第1生成部)と、記事決定部27(算出部、決定部)と、ページ生成部29(第2生成部)と、記憶部31とを備える。通信部21は、例えば、NIC等の通信インターフェースを含む。通信部21は、ネットワークNWを介して、端末装置10等と通信する。 The service providing device 20 is, for example, a communication unit 21, a candidate article extraction unit 23, an article vector generation unit 25 (first generation unit), an article determination unit 27 (calculation unit, determination unit), and a page generation unit 29. (Second generation unit) and a storage unit 31 are provided. The communication unit 21 includes, for example, a communication interface such as a NIC. The communication unit 21 communicates with the terminal device 10 and the like via the network NW.

候補記事抽出部23は、記憶部31に記憶された配信記事情報33の中から、所定数の候補記事を抽出する。例えば、サービス提供装置20により提供されるサービスが、ユーザIDおよびパスワードを入力しログインすることで個別のユーザに対してカスタマイズされたサービスとして提供されるものである場合、候補記事抽出部23は、ユーザの過去のアクセス履歴情報等に基づいて、ユーザが関心および興味のある内容と推定される記事を、候補記事として抽出してよい。或いは、候補記事抽出部23は、配信記事情報33の中から、ランダムに記事を候補記事として抽出してもよい。 The candidate article extraction unit 23 extracts a predetermined number of candidate articles from the distribution article information 33 stored in the storage unit 31. For example, when the service provided by the service providing device 20 is provided as a customized service for individual users by inputting a user ID and a password and logging in, the candidate article extraction unit 23 may use the candidate article extraction unit 23. Articles that are presumed to be of interest to the user based on the user's past access history information or the like may be extracted as candidate articles. Alternatively, the candidate article extraction unit 23 may randomly extract articles as candidate articles from the distributed article information 33.

記事ベクトル生成部25は、例えば、候補記事抽出部23により抽出された候補記事に対応する記事ベクトル(特徴情報)を生成する。記事ベクトルは、例えば、記事に含まれる単語を形態素解析等によって抽出した後、word2vec等の手法により分散表現化した単語ベクトルをモデルに入力することで生成されるベクトルデータである。 The article vector generation unit 25 generates, for example, an article vector (feature information) corresponding to the candidate article extracted by the candidate article extraction unit 23. The article vector is vector data generated by, for example, extracting words contained in an article by morphological analysis or the like, and then inputting a word vector distributed and expressed by a method such as word2vec into a model.

図3は、記事ベクトル生成部25の処理の内容を概念的に示す図である。記事ベクトル生成部25には、候補記事抽出部23により抽出された候補記事の内容(テキスト)が入力される。 FIG. 3 is a diagram conceptually showing the contents of the processing of the article vector generation unit 25. The content (text) of the candidate article extracted by the candidate article extraction unit 23 is input to the article vector generation unit 25.

記事ベクトル生成部25は、まず、記事の内容に対して形態素解析等を行って、単語(形態素)に分割する。次に、記事ベクトル生成部25は、各単語に対してword2vec等の手法を適用して、分散表現化された単語ベクトルを取得する。形態素解析とword2vecとのうち一方または双方は、記事ベクトル生成部25が自ら処理を行うのではなく、外部装置に処理を依頼することで実現されてもよい。 The article vector generation unit 25 first performs morphological analysis or the like on the content of the article and divides it into words (morphemes). Next, the article vector generation unit 25 applies a method such as word2vec to each word to acquire a distributed expression word vector. One or both of the morphological analysis and word2vec may be realized by requesting the processing to an external device instead of the article vector generation unit 25 performing the processing by itself.

次に、記事ベクトル生成部25は、記事から取得された一以上の単語ベクトルを予め定義されたモデルに入力することで、記事ベクトルを生成する。このモデルは、例えば、機械学習によって生成されるモデルである。このモデルは、例えば、ディープラーニング等の手法により、既知の単語ベクトルと記事ベクトルとの関係が再現できるような、隠れ層の活性化関数のパラメータを求めることで生成される。尚、上記の定義に拘わらず、第1モデルとは、word2vecの特定、すなわち、どのようなコーパスをword2vecに与えるか、までを含んでもよい。記事ベクトル生成部25は、生成した記事ベクトルを、記事ベクトル情報35として、記憶部31に記憶させる。 Next, the article vector generation unit 25 generates an article vector by inputting one or more word vectors acquired from the article into a predefined model. This model is, for example, a model generated by machine learning. This model is generated by finding the parameters of the activation function of the hidden layer so that the relationship between the known word vector and the article vector can be reproduced by, for example, a method such as deep learning. Regardless of the above definition, the first model may include the identification of word2vec, that is, what kind of corpus is given to word2vec. The article vector generation unit 25 stores the generated article vector as the article vector information 35 in the storage unit 31.

記事決定部27は、記事ベクトル生成部25によって生成された候補記事の各々の記事ベクトルに基づいて、配信対象とする複数の記事(例えば、少なくとも3つの記事)を決定する。記事決定部27は、所定数の記事の組み合わせの内、記事の多様性を高めるように、記事を決定する。記事決定部27は、既に選択された記事の記事ベクトルにより構成される部分空間との距離が最大である記事を優先的に配信対象として決定する。 The article determination unit 27 determines a plurality of articles (for example, at least three articles) to be distributed based on each article vector of the candidate articles generated by the article vector generation unit 25. The article determination unit 27 determines an article so as to increase the diversity of the article among a predetermined number of combinations of articles. The article determination unit 27 preferentially determines the article having the maximum distance from the subspace composed of the article vectors of the already selected articles as the distribution target.

ページ生成部29は、記事決定部27により決定された複数の記事を含むウェブページを生成する。すなわち、ページ生成部29は、記事決定部27により決定された配信対象のコンテンツを表示装置に表示させるための表示用情報を生成する。ページ生成部29は、生成したウェブページを、通信部21を介して、端末装置10に送信する。 The page generation unit 29 generates a web page including a plurality of articles determined by the article determination unit 27. That is, the page generation unit 29 generates display information for displaying the content to be distributed determined by the article determination unit 27 on the display device. The page generation unit 29 transmits the generated web page to the terminal device 10 via the communication unit 21.

サービス提供装置20の上記の各機能部は、例えば、CPU(Central Processing Unit)等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。 Each of the above functional units of the service providing device 20 is realized by, for example, a hardware processor such as a CPU (Central Processing Unit) executing a program (software). In addition, some or all of these components are hardware (circuits) such as LSI (Large Scale Integration), ASIC (Application Specific Integrated Circuit), FPGA (Field-Programmable Gate Array), GPU (Graphics Processing Unit), etc. It may be realized by the part; including circuitry), or it may be realized by the cooperation of software and hardware.

記憶部31は、例えば、配信記事情報33と、記事ベクトル情報35とを記憶する。図4は、配信記事情報33の内容の一例を示す図である。配信記事情報33は、例えば、記事の識別情報である記事IDに対し、記事データが対応付けられた情報である。記事データは、例えば、テキストデータ、画像データ、またはこれらの組み合わせ、或いはURL(Uniform Resource Locator)等の参照情報である。 The storage unit 31 stores, for example, the delivered article information 33 and the article vector information 35. FIG. 4 is a diagram showing an example of the contents of the delivered article information 33. The delivered article information 33 is, for example, information in which article data is associated with an article ID, which is article identification information. The article data is, for example, text data, image data, a combination thereof, or reference information such as a URL (Uniform Resource Locator).

図5は、記事ベクトル情報35の内容の一例を示す図である。記事ベクトル情報35は、例えば、記事の識別情報である記事IDに対し、記事ベクトルが対応付けられた情報である。 FIG. 5 is a diagram showing an example of the contents of the article vector information 35. The article vector information 35 is, for example, information in which an article vector is associated with an article ID which is an article identification information.

記憶部31は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ、またはこれらのうち複数が組み合わされたハイブリッド型記憶装置等により実現される。また、記憶部31は、NASや外部のストレージサーバ等、サービス提供装置20がアクセス可能な外部装置であってもよい。 The storage unit 31 is realized by, for example, a RAM (Random Access Memory), a ROM (Read Only Memory), an HDD (Hard Disk Drive), a flash memory, or a hybrid storage device in which a plurality of these are combined. Further, the storage unit 31 may be an external device such as NAS or an external storage server that can be accessed by the service providing device 20.

[サービス提供装置20の動作]
以下、サービス提供装置20の動作について説明する。図6は、サービス提供装置20の処理の流れの一例を示すフローチャートである。以下においては、サービス提供装置20が3つの記事を含むウェブページを生成して、端末装置10に送信する例について説明する。
[Operation of service providing device 20]
Hereinafter, the operation of the service providing device 20 will be described. FIG. 6 is a flowchart showing an example of the processing flow of the service providing device 20. In the following, an example in which the service providing device 20 generates a web page containing three articles and transmits the web page to the terminal device 10 will be described.

まず、サービス提供装置20は、端末装置10から送信されたウェブページを要求するリクエストを受信する(S101)。 First, the service providing device 20 receives a request for a web page transmitted from the terminal device 10 (S101).

次に、サービス提供装置20は、記憶部31に記憶された配信記事情報33の中から、2つの候補記事(以下、「第1候補記事」および「第2候補記事」と呼ぶ)を抽出する(S103)。例えば、サービス提供装置20は、ユーザの過去のアクセス履歴情報等に基づいて、ユーザが関心および興味のある内容と推定される第1候補記事および第2候補記事を抽出する。また、サービス提供装置20は、抽出した第1および第2候補記事を、ウェブページに掲載する第1および第2記事として決定する。 Next, the service providing device 20 extracts two candidate articles (hereinafter, referred to as "first candidate article" and "second candidate article") from the distribution article information 33 stored in the storage unit 31. (S103). For example, the service providing device 20 extracts the first candidate article and the second candidate article that are presumed to be of interest to the user based on the user's past access history information and the like. Further, the service providing device 20 determines the extracted first and second candidate articles as the first and second articles to be posted on the web page.

次に、サービス提供装置20は、決定した第1記事および第2記事の各々と対応する記事ベクトルを生成する(S105)。例えば、サービス提供装置20は、第1記事の内容に対して形態素解析等を行って、単語に分割する。次に、サービス提供装置20は、各単語に対してword2vec等の手法を適用して、分散表現化された単語ベクトルを取得する。次に、サービス提供装置20は、取得した一以上の単語ベクトルを予め定義されたモデルに入力することで、記事ベクトル(以下、「第1記事ベクトル」と呼ぶ)を生成する。サービス提供装置20は、第2記事に対しても同様な処理を行い、記事ベクトル(以下、「第2記事ベクトル」と呼ぶ)を生成する。 Next, the service providing device 20 generates an article vector corresponding to each of the determined first article and the second article (S105). For example, the service providing device 20 performs morphological analysis or the like on the content of the first article and divides it into words. Next, the service providing device 20 applies a method such as word2vec to each word to acquire a distributed expression word vector. Next, the service providing device 20 generates an article vector (hereinafter referred to as "first article vector") by inputting one or more acquired word vectors into a predefined model. The service providing device 20 performs the same processing on the second article to generate an article vector (hereinafter, referred to as “second article vector”).

尚、記憶部31の記事ベクトル情報35に、予め、配信記事情報33に含まれる記事の各々と対応する記事ベクトルが記憶されている場合、サービス提供装置20は、抽出した第1記事および第2記事の各々と対応する記事ベクトルを記事ベクトル情報35から読み出してもよい。 When the article vector information 35 of the storage unit 31 stores in advance the article vectors corresponding to each of the articles included in the delivered article information 33, the service providing device 20 has extracted the first article and the second article. The article vector corresponding to each of the articles may be read from the article vector information 35.

次に、サービス提供装置20は、記憶部31に記憶された配信記事情報33の中から、第1記事および第2記事以外の第3候補記事を抽出する(S107)。次に、サービス提供装置20は、抽出した第3候補記事と対応する記事ベクトル(以下、「第3記事ベクトル」と呼ぶ)を生成する(S109)。次に、サービス提供装置20は、第3候補記事のベクトル空間上での位置と、第1および第2記事ベクトルにより構成される部分空間との距離を算出する(S111)。例えば、サービス提供装置20は、配信記事情報33に含まれる第1記事および第2記事以外の全ての記事に対して上述の処理を繰り返す。或いは、サービス提供装置20は、配信記事情報33に含まれる記事のうち、ユーザが関心および興味のある内容と推定される所定のカテゴリに属する記事に対して上述の処理を行ってもよい。 Next, the service providing device 20 extracts a third candidate article other than the first article and the second article from the delivered article information 33 stored in the storage unit 31 (S107). Next, the service providing device 20 generates an article vector (hereinafter, referred to as “third article vector”) corresponding to the extracted third candidate article (S109). Next, the service providing device 20 calculates the distance between the position of the third candidate article on the vector space and the subspace composed of the first and second article vectors (S111). For example, the service providing device 20 repeats the above processing for all articles other than the first article and the second article included in the delivered article information 33. Alternatively, the service providing device 20 may perform the above-mentioned processing on articles belonging to a predetermined category presumed to be of interest to the user among the articles included in the delivered article information 33.

図7は、第3候補記事のベクトル空間上での位置と、第1および第2記事ベクトルにより構成される部分空間との距離を説明する図である。図7においては、各記事が要素1および要素2による2次元のベクトル空間内で表されている。第1記事ベクトルおよび第2記事ベクトルにより構成される部分空間は、一次元の部分空間P1である。第3候補記事は、この部分空間P1の外部の空間に位置する記事から選択される。このため、部分空間P1内に位置する記事A0は、第3候補記事として選択されない。 FIG. 7 is a diagram illustrating the distance between the position of the third candidate article on the vector space and the subspace composed of the first and second article vectors. In FIG. 7, each article is represented in a two-dimensional vector space with elements 1 and 2. The subspace composed of the first article vector and the second article vector is a one-dimensional subspace P1. The third candidate article is selected from articles located in the space outside this subspace P1. Therefore, the article A0 located in the subspace P1 is not selected as the third candidate article.

サービス提供装置20は、この2次元のベクトル空間内において、第3候補記事のベクトル空間上での位置と、部分空間P1との間の最短距離を算出する。例えば、第3候補記事の一つである第3候補記事A1と部分空間P1との距離D1は、第3候補記事A1から部分空間P1に下した垂線の長さに相当する。また、第3候補記事の他の一つである第3候補記事A2と部分空間P1との距離D2は、第3候補記事A2と第2記事との間の距離に相当する。また、第3候補記事のさらに他の一つである第3候補記事A3と部分空間P1との距離D3は、第3候補記事A3から部分空間P1に下した垂線の長さに相当する。 The service providing device 20 calculates the shortest distance between the position of the third candidate article in the vector space and the subspace P1 in this two-dimensional vector space. For example, the distance D1 between the third candidate article A1 and the subspace P1, which is one of the third candidate articles, corresponds to the length of the perpendicular line drawn from the third candidate article A1 to the subspace P1. Further, the distance D2 between the third candidate article A2 and the subspace P1, which is one of the other third candidate articles, corresponds to the distance between the third candidate article A2 and the second article. Further, the distance D3 between the third candidate article A3 and the subspace P1, which is still another one of the third candidate articles, corresponds to the length of the perpendicular line drawn from the third candidate article A3 to the subspace P1.

次に、サービス提供装置20は、算出した部分空間との距離が最も長い第3候補記事を、ウェブページに掲載する第3記事として決定する(S113)。図7に示す例においては、算出された距離D1からD3の中で、距離D1が最も長い。この場合、サービス提供装置20は、第3候補記事A1を第3記事として決定する。 Next, the service providing device 20 determines the third candidate article having the longest distance to the calculated subspace as the third article to be posted on the web page (S113). In the example shown in FIG. 7, the distance D1 is the longest among the calculated distances D1 to D3. In this case, the service providing device 20 determines the third candidate article A1 as the third article.

次に、サービス提供装置20は、決定した第1から第3記事を含むウェブページを生成し、生成したウェブページを端末装置10に送信する(S115)。端末装置10は、ウェブブラウザの機能により、サービス提供装置20から受信した第1から第3記事を含むウェブページを表示する。以上により、サービス提供装置20は、本フローチャートの処理を終了する。 Next, the service providing device 20 generates a web page including the determined first to third articles, and transmits the generated web page to the terminal device 10 (S115). The terminal device 10 displays a web page including the first to third articles received from the service providing device 20 by the function of the web browser. As a result, the service providing device 20 ends the processing of this flowchart.

尚、上述の実施形態においては、3個の記事を決定する例について説明したが、この3個の記事に加えて、4個目の記事(以下、「第4候補記事」と呼ぶ)を決定する場合にも同様な処理を適用することができる。図8は、第4候補記事のベクトル空間上での位置と、第1から第3記事ベクトルにより構成される部分空間との距離を説明する図である。第1から第3記事ベクトルにより構成される部分空間は、2次元の部分空間P2である。第4候補記事は、この部分空間P2の外部の空間に位置する記事から選択される。このため、部分空間P2内に位置する記事A0は、第4候補記事として選択されない。 In the above-described embodiment, an example of determining three articles has been described, but in addition to these three articles, a fourth article (hereinafter referred to as "fourth candidate article") is determined. The same process can be applied to the above cases. FIG. 8 is a diagram illustrating the distance between the position of the fourth candidate article on the vector space and the subspace composed of the first to third article vectors. The subspace composed of the first to third article vectors is a two-dimensional subspace P2. The fourth candidate article is selected from articles located in the space outside this subspace P2. Therefore, the article A0 located in the subspace P2 is not selected as the fourth candidate article.

サービス提供装置20は、要素1および要素2により構成される2次元のベクトル空間内において、配信記事情報33の中から抽出した第4候補記事の位置と、部分空間P2との間の最短距離を算出する。例えば、第4候補記事の一つである第4候補記事A4と部分空間P2との距離D4は、第4候補記事A4から部分空間P2に下した垂線の長さに相当する。また、第4候補記事の他の一つである第4候補記事A5と部分空間P2との距離D5は、第4候補記事A5と第3記事との間の距離に相当する。この場合、サービス提供装置20は、算出した部分空間との距離が最も長い第4候補記事A5を、ウェブページに掲載する第4記事として決定する。 The service providing device 20 determines the shortest distance between the position of the fourth candidate article extracted from the delivered article information 33 and the subspace P2 in the two-dimensional vector space composed of the elements 1 and 2. calculate. For example, the distance D4 between the fourth candidate article A4 and the subspace P2, which is one of the fourth candidate articles, corresponds to the length of the perpendicular line drawn from the fourth candidate article A4 to the subspace P2. Further, the distance D5 between the fourth candidate article A5 and the subspace P2, which is one of the other fourth candidate articles, corresponds to the distance between the fourth candidate article A5 and the third article. In this case, the service providing device 20 determines the fourth candidate article A5 having the longest distance to the calculated subspace as the fourth article to be posted on the web page.

また、サービス提供装置20は、n+1個目の第n+1候補記事を決定する場合、選択済みであるn個の候補により構成される部分空間Pnと、第n+1候補記事との間の距離を算出し、部分空間Pnとの距離が最も長い第n+1候補記事を、ウェブページに掲載する第n+1記事として決定する。 Further, when the service providing device 20 determines the n + 1th n + 1 candidate article, the service providing device 20 calculates the distance between the subspace Pn composed of the selected n candidates and the n + 1th candidate article. , The n + 1 candidate article having the longest distance from the subspace Pn is determined as the n + 1 article to be posted on the web page.

この場合、第n+1候補記事と、第1から第n記事ベクトルにより構成される部分空間Pnとの距離は以下の式によって表される。 In this case, the distance between the n + 1 candidate article and the subspace Pn composed of the first to nth article vectors is expressed by the following equation.

Figure 0007018762000001
Figure 0007018762000001

上記の式(1)は、選択済みのn個の記事に対応する記事ベクトルを示す。選択済みのn個の記事に対応する記事ベクトルにより構成される部分空間Pnは、これらの記事ベクトルの線形和である式(2)により表される。αはパラメータを示す。部分区間Pnの外部の空間から選択された第n+1候補記事である記事xの位置と部分空間Pnとの距離は、記事xの位置ベクトルから、記事xとの距離が最小となるαが選択された場合の部分空間Pn内の位置ベクトルを減算してノルムを求めた式(3)により表される。これらの式に基づいて、サービス提供装置20は第n+1記事を決定することができる。 The above equation (1) shows an article vector corresponding to n selected articles. The subspace Pn composed of the article vectors corresponding to the selected n articles is represented by the equation (2) which is the linear sum of these article vectors. α k indicates a parameter. The distance between the position of the article x, which is the n + 1 candidate article selected from the space outside the subspace Pn, and the subspace Pn is selected from the position vector of the article x by α k , which minimizes the distance to the article x. It is expressed by the equation (3) for which the norm is obtained by subtracting the position vector in the subspace Pn in the case of. Based on these equations, the service providing device 20 can determine the n + 1 article.

本発明の実施形態による情報処理装置は、ネットワークを介して配信される候補となる複数のコンテンツの各々に対応するベクトルデータを生成する第1生成部と、前記第1生成部により生成された複数のベクトルデータに基づいて、コンテンツの多様性を高めるように、前記複数のコンテンツの中から、配信対象のコンテンツを決定する決定部と、を備えることで、提供するコンテンツの多様性を高めることができる。 The information processing apparatus according to the embodiment of the present invention has a first generation unit that generates vector data corresponding to each of a plurality of candidate contents distributed via a network, and a plurality of generation units generated by the first generation unit. It is possible to increase the diversity of the content to be provided by providing a decision unit for determining the content to be distributed from the plurality of contents so as to increase the diversity of the content based on the vector data of. can.

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何ら限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 Although the embodiments for carrying out the present invention have been described above with reference to the embodiments, the present invention is not limited to these embodiments, and various modifications and substitutions are made without departing from the gist of the present invention. Can be added.

10…端末装置
20…サービス提供装置
21…通信部
23…候補記事抽出部
25…記事ベクトル生成部
27…記事決定部
29…ページ生成部
31…記憶部
10 ... Terminal device 20 ... Service providing device 21 ... Communication unit 23 ... Candidate article extraction unit 25 ... Article vector generation unit 27 ... Article determination unit 29 ... Page generation unit 31 ... Storage unit

Claims (6)

ネットワークを介して配信される候補となる複数のコンテンツの各々に対応するベクトルデータを生成する第1生成部と、
前記第1生成部により生成された複数のベクトルデータに基づいて、コンテンツの多様性を高めるように、前記複数のコンテンツの中から、配信対象のコンテンツを決定する決定部と、
前記決定部により既に決定された複数の前記配信対象のコンテンツの各々と対応する複数の前記ベクトルデータにより構成される部分空間と、配信される候補となる複数のコンテンツの各々との距離を算出する算出部と、
を備え、
前記決定部は、前記算出部により算出された複数の距離に基づいて、前記配信対象のコンテンツを決定する、
情報処理装置。
A first generation unit that generates vector data corresponding to each of a plurality of candidate contents distributed via a network, and a first generation unit.
A determination unit that determines the content to be distributed from the plurality of contents so as to increase the diversity of the contents based on the plurality of vector data generated by the first generation unit.
The distance between the subspace composed of the plurality of vector data corresponding to each of the plurality of contents to be distributed already determined by the determination unit and each of the plurality of candidate contents to be distributed is calculated. Calculation unit and
Equipped with
The determination unit determines the content to be distributed based on the plurality of distances calculated by the calculation unit.
Information processing equipment.
前記決定部は、前記算出部により算出された距離が最大であるコンテンツを、前記配信対象のコンテンツとして決定する、
請求項1に記載の情報処理装置。
The determination unit determines the content having the maximum distance calculated by the calculation unit as the content to be distributed.
The information processing apparatus according to claim 1.
前記コンテンツは、前記ネットワークを介して配信される記事であり、
前記ベクトルデータは、前記記事の特徴を示す情報であり、
前記決定部は、既に決定された記事とは異なる特徴を有する記事を、配信対象の記事として決定する、
請求項1または2に記載の情報処理装置。
The content is an article distributed via the network.
The vector data is information showing the characteristics of the article, and is
The determination unit determines an article having characteristics different from the already determined article as an article to be distributed.
The information processing apparatus according to claim 1 or 2.
前記決定部により決定された配信対象のコンテンツを表示装置に表示させるための表示用情報を生成する第2生成部をさらに備える、
請求項1から3のいずれか一項に記載の情報処理装置。
A second generation unit for generating display information for displaying the content to be distributed determined by the determination unit on the display device is further provided.
The information processing apparatus according to any one of claims 1 to 3.
コンピュータが、
ネットワークを介して配信される候補となる複数のコンテンツの各々に対応するベクトルデータを生成し、
前記生成された複数のベクトルデータに基づいて、コンテンツの多様性を高めるように、前記複数のコンテンツの中から、配信対象のコンテンツを決定する、
情報処理方法であって、
既に決定された複数の前記配信対象のコンテンツの各々と対応する複数の前記ベクトルデータにより構成される部分空間と、配信される候補となる複数のコンテンツの各々との距離を算出し、
前記算出された複数の距離に基づいて、前記配信対象のコンテンツを決定する、
情報処理方法。
The computer
Generate vector data corresponding to each of multiple candidate contents to be delivered via the network.
Based on the plurality of generated vector data, the content to be distributed is determined from the plurality of contents so as to increase the diversity of the contents.
It is an information processing method
The distance between the subspace composed of the plurality of vector data corresponding to each of the plurality of content to be distributed already determined and the plurality of content to be distributed is calculated.
The content to be delivered is determined based on the calculated distances.
Information processing method.
コンピュータに、
ネットワークを介して配信される候補となる複数のコンテンツの各々に対応するベクトルデータを生成させ、
前記生成された複数のベクトルデータに基づいて、コンテンツの多様性を高めるように、前記複数のコンテンツの中から、配信対象のコンテンツを決定させる、
プログラムであって、
既に決定された複数の前記配信対象のコンテンツの各々と対応する複数の前記ベクトルデータにより構成される部分空間と、配信される候補となる複数のコンテンツの各々との距離を算出させ、
前記算出された複数の距離に基づいて、前記配信対象のコンテンツを決定させる、
プログラム。
On the computer
Generate vector data corresponding to each of multiple candidate contents to be delivered via the network.
Based on the plurality of generated vector data, the content to be distributed is determined from the plurality of contents so as to increase the diversity of the contents.
It ’s a program,
The distance between the subspace composed of the plurality of vector data corresponding to each of the plurality of content to be distributed that has already been determined and the plurality of content that is candidates for distribution is calculated.
The content to be delivered is determined based on the calculated distances.
program.
JP2017245345A 2017-12-21 2017-12-21 Information processing equipment, information processing methods, and programs Active JP7018762B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017245345A JP7018762B2 (en) 2017-12-21 2017-12-21 Information processing equipment, information processing methods, and programs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017245345A JP7018762B2 (en) 2017-12-21 2017-12-21 Information processing equipment, information processing methods, and programs

Publications (2)

Publication Number Publication Date
JP2019113945A JP2019113945A (en) 2019-07-11
JP7018762B2 true JP7018762B2 (en) 2022-02-14

Family

ID=67223327

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017245345A Active JP7018762B2 (en) 2017-12-21 2017-12-21 Information processing equipment, information processing methods, and programs

Country Status (1)

Country Link
JP (1) JP7018762B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023084954A1 (en) * 2021-11-15 2023-05-19 株式会社Nttドコモ Recommendation device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013168582A1 (en) 2012-05-11 2013-11-14 ソニー株式会社 Information processing device, information processing method, and program
JP2017054257A (en) 2015-09-08 2017-03-16 ヤフー株式会社 Determination device, determination method, and determination program
JP2017054214A (en) 2015-09-07 2017-03-16 ヤフー株式会社 Determination device, learning device, information distribution device, determination method, and determination program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101544141B1 (en) * 2013-10-07 2015-08-12 주식회사 솔트룩스 System for grouping articles based on subject thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013168582A1 (en) 2012-05-11 2013-11-14 ソニー株式会社 Information processing device, information processing method, and program
JP2017054214A (en) 2015-09-07 2017-03-16 ヤフー株式会社 Determination device, learning device, information distribution device, determination method, and determination program
JP2017054257A (en) 2015-09-08 2017-03-16 ヤフー株式会社 Determination device, determination method, and determination program

Also Published As

Publication number Publication date
JP2019113945A (en) 2019-07-11

Similar Documents

Publication Publication Date Title
US10146743B2 (en) Systems and methods for optimizing content layout using behavior metrics
JP6262886B2 (en) Automated click type selection for content performance optimization
US20200081896A1 (en) Computerized system and method for high-quality and high-ranking digital content discovery
US20130080428A1 (en) User-Centric Opinion Analysis for Customer Relationship Management
US20140095308A1 (en) Advertisement distribution apparatus and advertisement distribution method
CN104216881A (en) Method and device for recommending individual labels
US20160283585A1 (en) Method and system for providing a personalized snippet
JP5507607B2 (en) Content providing apparatus, low rank approximate matrix generating apparatus, content providing method, low rank approximate matrix generating method, and program
US10019419B2 (en) Method, server, browser, and system for recommending text information
CN110489574B (en) Multimedia information recommendation method and device and related equipment
US11694018B2 (en) Machine-learning based generation of text style variations for digital content items
JP2018156473A (en) Analysis device, analysis method, and program
JP2019053386A (en) Information processing apparatus, information processing method, and program
JP2018156238A (en) Information processing apparatus, information processing method, and program
JP6434954B2 (en) Information processing apparatus, information processing method, and program
US20140372207A1 (en) Profit index value generation system and profit index value generation method
JP2016153972A (en) Extraction device, extraction method and extraction program
JP7018762B2 (en) Information processing equipment, information processing methods, and programs
JP6680663B2 (en) Information processing apparatus, information processing method, prediction model generation apparatus, prediction model generation method, and program
JP2018136721A (en) Distribution system, distribution method and distribution program
JP2017134675A (en) Device and program for searching for information
JP6937235B2 (en) Information processing equipment, information processing methods, and programs
JP5011185B2 (en) Information analysis apparatus, information analysis method, and information analysis program
US9805097B2 (en) Method and system for providing a search result
JP2021096867A (en) Search system and search method

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210312

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211115

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20211115

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20211122

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20211124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220201

R150 Certificate of patent or registration of utility model

Ref document number: 7018762

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350