JP7191763B2 - Conversion device, conversion method and conversion program - Google Patents
Conversion device, conversion method and conversion program Download PDFInfo
- Publication number
- JP7191763B2 JP7191763B2 JP2019082255A JP2019082255A JP7191763B2 JP 7191763 B2 JP7191763 B2 JP 7191763B2 JP 2019082255 A JP2019082255 A JP 2019082255A JP 2019082255 A JP2019082255 A JP 2019082255A JP 7191763 B2 JP7191763 B2 JP 7191763B2
- Authority
- JP
- Japan
- Prior art keywords
- content
- input
- easy
- difficult
- viewing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000006243 chemical reaction Methods 0.000 title claims description 214
- 238000000034 method Methods 0.000 title claims description 29
- 230000014509 gene expression Effects 0.000 claims description 113
- 238000000605 extraction Methods 0.000 claims description 43
- 239000000284 extract Substances 0.000 claims description 39
- 239000013598 vector Substances 0.000 description 46
- 238000012545 processing Methods 0.000 description 19
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 230000000877 morphologic effect Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Description
本発明は、変換装置、変換方法及び変換プログラムに関する。 The present invention relates to a conversion device, a conversion method and a conversion program.
近年、言語モデルを用いて言語処理を行う技術が知られている。このような技術の一例として、複数の言語モデルから、利用者の発話テキストに対し最適な言語モデルを選択する技術が知られている。 In recent years, techniques for performing language processing using language models have been known. As an example of such technology, there is known a technology for selecting the optimal language model for a user's uttered text from among a plurality of language models.
しかしながら、上述した従来技術では、利用者に対し適切な表現のコンテンツを提供できるとは限らない。 However, with the above-described conventional technology, it is not always possible to provide content with appropriate expressions to users.
例えば、上述した従来技術では、ユーザからの発話テキストに対して、当該ユーザのユ-ザ属性に対応付けられた付随属性に基づく言語モデルを適用する言語処理や、原文から類似文を生成する際、類似文として採用できる採択文と採用できない棄却文との識別を行うに過ぎない。したがって、上述した従来技術では、利用者に対し適切な表現のコンテンツを提供できるとは限らない。 For example, in the above-described conventional technology, language processing that applies a language model based on accompanying attributes associated with the user's user attributes to the uttered text from the user, and when generating a similar sentence from the original text , it merely distinguishes between accepted sentences that can be adopted as similar sentences and rejected sentences that cannot be adopted. Therefore, with the above-described conventional technology, it is not always possible to provide the user with appropriate content.
本願は、上記に鑑みてなされたものであって、利用者に対し適切な表現のコンテンツを提供することを目的とする。 The present application has been made in view of the above, and aims to provide users with content with appropriate expressions.
本願に係る変換装置は、提供コンテンツの提供先となる利用者と関連性を有する関連コンテンツを特定する特定部と、前記特定部により特定された関連コンテンツの表現に基づいて、前記提供コンテンツの表現を変換する変換部とを有することを特徴とする。 A conversion device according to the present application includes a specifying unit that specifies related content that is related to a user to whom the provided content is provided, and an expression of the provided content based on the expression of the related content that is specified by the specifying unit. and a conversion unit that converts the
実施形態の一態様によれば、利用者に対し適切な表現のコンテンツを提供することができるという効果を奏する。 According to one aspect of the embodiment, there is an effect that it is possible to provide the user with content with appropriate expressions.
以下に本願に係る変換装置、変換方法及び変換プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る変換装置、変換方法及び変換プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Embodiments for implementing the conversion device, conversion method, and conversion program according to the present application (hereinafter referred to as "embodiments") will be described in detail below with reference to the drawings. Note that the conversion device, conversion method, and conversion program according to the present application are not limited to this embodiment. Also, in each of the following embodiments, the same parts are denoted by the same reference numerals, and overlapping descriptions are omitted.
〔1.実施形態〕
図1を用いて、本実施形態の変換装置等により実現される変換処理を説明する。図1は、実施形態に係る変換処理の一例を示す図である。図1に示す例において、変換システム1は、端末装置10、視聴コンテンツサーバ20、入力コンテンツサーバ30及び変換装置100を有する。端末装置10と、視聴コンテンツサーバ20と、入力コンテンツサーバ30と、変換装置100とは、図示しない所定の通信網を介して、有線又は無線により通信可能に接続される。なお、図1に示す変換システム1は、複数台の端末装置10や、複数台の視聴コンテンツサーバ20、複数台の入力コンテンツサーバ30、複数台の変換装置100が含まれてもよい。
[1. embodiment]
The conversion processing realized by the conversion device and the like of this embodiment will be described with reference to FIG. FIG. 1 is a diagram illustrating an example of conversion processing according to an embodiment. In the example shown in FIG. 1, the
図1に示す端末装置10は、利用者によって利用される情報処理装置である。例えば、端末装置10は、デスクトップ型PC(Personal Computer)や、ノート型PCや、タブレット端末や、携帯電話機や、PDA(Personal Digital Assistant)等である。なお、図1に示す例において、端末装置10は、利用者によって利用されるスマートフォンやタブレット等のスマートデバイスである場合を示す。また、図1に示す例において、端末装置10は、液晶ディスプレイ等の出力部(以下、画面と記載する場合がある)を有し、タッチパネルが採用されているものとする。すなわち、利用者は、指や専用ペンで出力部の表示面をタッチすることにより端末装置10の各種操作を行う。
A
図1に示す視聴コンテンツサーバ20は、利用者が視聴する視聴コンテンツを端末装置10に提供するサーバ装置である。また、視聴コンテンツサーバ20は、利用者が視聴した視聴コンテンツに関する視聴履歴を管理する。
The
図1に示す入力コンテンツサーバ30は、端末装置10に各種コンテンツを提供し、利用者が各種コンテンツにおいて入力(投稿)した文字列に関する入力コンテンツを受け付けるサーバ装置である。また、入力コンテンツサーバ30は、利用者が入力した入力コンテンツに関する投稿情報を管理する。
The
図1に示す変換装置100は、端末装置10に各種コンテンツ(以下、変換装置100が端末装置10に提供するコンテンツを「提供コンテンツ」と記載する場合がある)を提供するサーバ装置である。また、図1の例において、変換装置100は、利用者が視聴した視聴コンテンツに関する視聴履歴や、利用者が入力した入力コンテンツに関する投稿履歴を取得し、利用者と関連性を有する関連コンテンツに関する情報として関連コンテンツ記憶部に格納する。そして、変換装置100は、関連コンテンツ記憶部に格納した情報に基づいて生成したモデルを用いて提供コンテンツの表現を変換し、端末装置10に提供する。また、図1の例において、変換装置100は、階層構造を有する概念を体系的にまとめたシソーラスの情報を記憶部に格納する。
The
なお、視聴コンテンツサーバ20、入力コンテンツサーバ30及び変換装置100が端末装置10に提供するコンテンツは、例えば、ポータルサイト、ニュースサイト、オークションサイト、天気予報サイト、ショッピング(電子商取引)サイト、ファイナンス(株価)サイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、SNS(Social Networking Service)サイト、ウェブブログなどに関するコンテンツであってもよい。また、視聴コンテンツサーバ20、入力コンテンツサーバ30及び変換装置100が提供するコンテンツは、例えば、端末装置10にインストールされた各種アプリケーション(以下、「アプリ」と記載する場合がある)に関するコンテンツであってもよい。具体的には、ポータルアプリ、ニュースアプリ、オークションサイト、天気予報アプリ、ショッピングアプリ、ファイナンス(株価)アプリ、路線検索アプリ、地図提供アプリ、旅行アプリ、飲食店紹介アプリ、SNSアプリ、ブログ閲覧アプリ等に関するコンテンツであってもよい。
The content provided to the
以下、図1を用いて、変換装置100が行う変換処理について説明する。なお、以下の説明では、端末装置10が利用者U1により利用される例を示す。
The conversion processing performed by the
まず、端末装置10は、視聴コンテンツを表示する(ステップS11)。例えば、図1の例において、端末装置10は、利用者U1の操作に応じて視聴コンテンツを視聴コンテンツサーバ20から取得し、画面に表示する。そして、端末装置10は、利用者U1が視聴コンテンツを視聴した際の態様(以下、「視聴態様」と記載する場合がある)を視聴コンテンツサーバ20に送信する。例えば、図1の例において、端末装置10は、画面に表示された視聴コンテンツに対する利用者U1のスクロール速度に関する情報を、視聴態様として視聴コンテンツサーバ20に送信する。そして、視聴コンテンツサーバ20は、視聴態様が対応する視聴コンテンツに関連付けられた情報を視聴履歴として記憶部に格納する。
First, the
続いて、端末装置10は、入力コンテンツサーバ30から提供されたコンテンツにおいて、利用者U1が入力した入力コンテンツを入力コンテンツサーバ30に送信する(ステップS12)。例えば、図1の例において、端末装置10は、利用者U1が入力した検索クエリや、ショッピングサイト、飲食店紹介サイトなどにおいて利用者U1が入力したレビュー、ニュースサイト、SNSサイトなどにおいて利用者U1が入力したコメントを入力コンテンツとして入力コンテンツサーバ30に送信する。また、端末装置10は、利用者U1が入力コンテンツを入力した際の態様(以下、「入力態様」と記載する場合がある)を入力コンテンツサーバ30に送信する。例えば、図1の例において、端末装置10は、利用者U1が入力コンテンツを入力した速度(入力速度)に関する情報を入力態様として入力コンテンツサーバ30に送信する。そして、入力コンテンツサーバ30は、入力態様が対応する入力コンテンツに関連付けられた情報を投稿履歴として記憶部に格納する。
Subsequently, the
続いて、変換装置100は、視聴コンテンツサーバ20から視聴履歴を収集し、利用者U1と関連性を有する関連コンテンツを特定する(ステップS13)。例えば、図1の例において、変換装置100は、利用者U1が視聴した視聴コンテンツを関連コンテンツとして特定し、対応する視聴態様と共に関連コンテンツ記憶部に格納する。
Subsequently, the
続いて、変換装置100は、入力コンテンツサーバ30から投稿履歴を収集し、利用者U1と関連性を有する関連コンテンツを特定する(ステップS14)。例えば、図1の例において、変換装置100は、利用者U1が入力した入力コンテンツを関連コンテンツとして特定し、対応する入力態様と共に関連コンテンツ記憶部に格納する。
Subsequently, the
続いて、変換装置100は、関連コンテンツの容易部分と、非容易部分とを抽出し、容易部分を学習した容易言語モデルと、非容易部分を学習した非容易言語モデルとを生成する(ステップS15)。ここで、視聴コンテンツのうち、利用者のスクロール速度が速い部分は、利用者が理解に時間を要さない部分(例えば、利用者が日常的に接している単語や文体等で表現された部分)であり、利用者にとって視聴が容易な部分であると想定される。一方、視聴コンテンツのうち、利用者のスクロール速度が遅い部分は、利用者が理解に時間を要する部分(例えば、利用者が不慣れな単語や文体等で表現された部分)であり、利用者にとって視聴が非容易な部分であると想定される。したがって、図1の例において、変換装置100は、関連コンテンツが視聴コンテンツである場合、関連コンテンツのうち、利用者U1のスクロール速度が所定の閾値以上である部分を、利用者U1の視聴が容易と推定される容易部分として抽出する。そして、変換装置100は、利用者U1のスクロール速度が所定の閾値以下である部分を、利用者U1の視聴が非容易と推定される非容易部分として抽出する。
Subsequently, the
また、入力コンテンツのうち、利用者の入力速度が速い部分は、利用者が日常的に接している単語や文体等で表現した部分であり、利用者の視聴が容易な部分であると想定される。一方、入力コンテンツのうち、利用者の入力速度が遅い部分は、利用者が不慣れな単語や文体等で表現した部分であり、利用者にとって視聴が非容易な部分であると想定される。したがって、図1の例において、変換装置100は、関連コンテンツが入力コンテンツである場合、関連コンテンツのうち、利用者U1の入力速度が所定の閾値以上である部分を、利用者U1の入力が容易(言い換えると、利用者U1の視聴が容易)と推定される容易部分として抽出する。そして、変換装置100は、利用者U1の入力速度が所定の閾値以下である部分を、利用者U1の入力が非容易(言い換えると、利用者U1の視聴が非容易)と推定される非容易部分として抽出する。
In addition, it is assumed that the part of the input content that the user inputs at a high speed is the part that is expressed by the words and writing styles that the user encounters on a daily basis, and that it is easy for the user to view. be. On the other hand, portions of the input content for which the user's input speed is slow are portions expressed by unfamiliar words, style of writing, etc., and are assumed to be portions that are difficult for the user to view. Therefore, in the example of FIG. 1, when the related content is the input content, the
そして、変換装置100は、抽出した容易部分及び非容易部分に含まれる文字列に基づいて、容易言語モデル及び非容易言語モデルを生成する。例えば、図1の例において、変換装置100は、容易部分から形態素解析等の技術により抽出した単語や文章を、w2v(word2vec)やs2v(sentence2vec)等によりベクトル(多次元量)に変換し、当該ベクトルに基づいて学習が行われた容易言語モデルを生成する。また、変換装置100は、非容易部分から抽出した単語や文章をベクトルに変換し、当該ベクトルに基づいて学習が行われた非容易言語モデルを生成する。
Then, the
なお、図1の例において、容易言語モデルは、単語や文章が入力された場合に、関連コンテンツの容易部分から抽出した単語や文章群との類似度を示すスコアを出力するように学習が行われているものとする。例えば、図1の例において、容易言語モデルは、入力された単語や文章をベクトルに変換し、関連コンテンツの容易部分から抽出した単語や文章群に対応するベクトルとのベクトル空間上におけるユークリッド距離に応じて、スコアを出力する。 In the example of FIG. 1, the easy language model is learned so that when a word or sentence is input, a score indicating the degree of similarity to the word or sentence group extracted from the easy part of the related content is output. It is assumed that For example, in the example of FIG. 1, the easy language model converts the input words and sentences into vectors, and the Euclidean distance on the vector space between the vectors corresponding to the words and sentences extracted from the easy part of the related content. Output the score accordingly.
また、図1の例において、非容易言語モデルは、変換装置100が利用者U1に提供する提供コンテンツが入力された場合に、当該提供コンテンツのうち利用者U1の視聴が非容易と推定される非容易部分を出力するよう学習が行われているものとする。例えば、図1の例において、非容易言語モデルは、提供コンテンツのうち、関連コンテンツの非容易部分と類似する部分を非容易部分として出力する。具体的には、非容易言語モデルは、形態素解析等の技術により提供コンテンツから抽出した単語や文章をベクトルに変換し、関連コンテンツの非容易部分から抽出した単語や文章群に対応するベクトルとのベクトル空間上におけるユークリッド距離が所定の閾値以下(すなわち、関連コンテンツの非容易部分から抽出した単語や文章群との類似度が所定の閾値以上)である単語や文章が含まれる部分を、提供コンテンツの非容易部分として出力する。
In addition, in the example of FIG. 1, the difficult language model is estimated to be difficult for the user U1 to view when provided content provided by the
なお、容易言語モデル及び非容易言語モデルの学習には、例えば、RNN(Recurrent Neural Network)やLSTM(Long short-term memory)等の各種ニューラルネットワークを用いた公知技術が採用可能である。 For learning the easy language model and the hard language model, for example, known techniques using various neural networks such as RNN (Recurrent Neural Network) and LSTM (Long short-term memory) can be adopted.
続いて、変換装置100は、端末装置10から提供コンテンツの提供要求を受け付ける(ステップS16)。続いて、変換装置100は、非容易言語モデルを用いて、提供要求に対応する提供コンテンツから非容易部分を抽出する(ステップS17)。例えば、図1の例において、変換装置100は、形態素解析等の技術により提供コンテンツから抽出した単語や文章を非容易言語モデルに入力し、提供コンテンツのうち利用者U1の視聴が非容易と推定される非容易部分を抽出する。
Subsequently, the
続いて、変換装置100は、シソーラス及び容易言語モデルを用いて、提供コンテンツの非容易部分に含まれる表現を変換する(ステップS18)。例えば、図1の例において、変換装置100は、シソーラスを用いて、提供コンテンツの非容易部分から抽出した単語や文章の同義語や類似語を候補として抽出する。そして、変換装置100は、抽出した候補のうち、容易言語モデルにより出力したスコアが最も高い候補(「候補#2」)を用いて、提供コンテンツの非容易部分の表現を変換する。
Subsequently, the
続いて、変換装置100は、変換後の提供コンテンツを端末装置10に提供する(ステップS19)。
Subsequently, the
なお、図1の例では、容易言語モデル及び非容易言語モデルを生成し、変換処理に用いる例を示したが、変換処理に用いるモデルはこのような例に限定されない。例えば、変換装置100は、容易言語モデル及び非容易言語モデルを統合した統合言語モデルを生成し、学習を行ってもよい。ここで、図2を用いて、統合言語モデルの学習処理について説明する。図2は、実施形態に係る統合言語モデルの学習処理の一例を示す図である。
Although the example of FIG. 1 shows an example in which an easy language model and a hard language model are generated and used for conversion processing, models used for conversion processing are not limited to such examples. For example, the
図2に示すように、変換装置100は、単語や文章が入力された場合に同義語や類似語を出力する統合言語モデルにおいて、入力した単語や文章の表現(以下、「入力表現」と記載する場合がある)の意図と、出力した同義語や類似語の表現(以下、「出力表現」と記載する場合がある)の意図とが類似するように統合言語モデルの学習を行う。例えば、変換装置100は、w2vやs2v等により、入力した単語や文章を変換したベクトルと、出力した同義語や類似語を変換したベクトルとが、ベクトル空間上におけるユークリッド距離が所定の閾値以内となるように学習を行う。
As shown in FIG. 2, the
また、図2の例において、変換装置100は、関連コンテンツから抽出した容易部分の表現(以下、「容易表現」と記載する場合がある)及び出力表現の類似度が向上し、関連コンテンツから抽出した非容易部分の表現(以下、「非容易表現」と記載する場合がある)及び出力表現の類似度が低下するように統合言語モデルの学習を行う。例えば、変換装置100は、w2vやs2v等により、入力した単語や文章を変換したベクトルと、容易部分又は非容易部分に含まれる文字列を変換したベクトルとのベクトル空間上におけるユークリッド距離に応じた類似度に基づき、統合言語モデルの学習を行う。
In addition, in the example of FIG. 2, the
このようにして、実施形態に係る変換装置100は、利用者のコンテンツの利用履歴に基づいて、当該利用者に提供するコンテンツの表現を変換する。
In this manner, the
利用者が言葉に対して感じる難しさは利用者の世代や経験によって大きく異なるため、コンテンツを利用者に合わせて平易化することは重要である。従来の技術では、特定の軸で非容易と定義した語を容易と定義された語に機械的に変換する手法が用いられるが、この手法では世代や経験の差が考慮されず、利用者にとって平易とは限らない。 Since the difficulty users feel with words varies greatly depending on the generation and experience of the users, it is important to simplify the contents according to the users. Conventional technology uses a method that mechanically converts words defined as difficult on a specific axis into terms that are defined as easy, but this method does not take into account differences in generations and experience, and is It's not always easy.
これに対し、実施形態に係る変換装置100は、利用者のコンテンツの利用履歴に基づいて、利用者に提供するコンテンツのうち、利用者の視聴が非容易と推定される部分を容易な表現に変換する。すなわち、実施形態に係る変換装置100は、利用者に対し適切な表現のコンテンツを提供することができる。
On the other hand, the
〔2.変換システムの構成〕
次に、上述した表示処理を実現するための変換システム1ついて図3を用いて説明する。図3は、実施形態に係る変換システムの構成例を示す図である。図3に示すように、変換システム1は、端末装置10と、視聴コンテンツサーバ20と、入力コンテンツサーバ30と、変換装置100とを含む。端末装置10、視聴コンテンツサーバ20、入力コンテンツサーバ30及び変換装置100は、ネットワークNを介して有線または無線により通信可能に接続される。なお、ネットワークNは、LAN(Local Area Network)、WAN(Wide Area Network)、電話網(携帯電話網、固定電話網等)、地域IP(Internet Protocol)網、インターネット等の通信ネットワークである。ネットワークNには、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。また、図2に示す変換システム1には、複数台の端末装置10や、複数台の視聴コンテンツサーバ20、複数台の入力コンテンツサーバ30、複数台の変換装置100が含まれてもよい。
[2. Configuration of conversion system]
Next, the
端末装置10は、利用者によって利用される情報処理装置である。端末装置10は、視聴コンテンツサーバ20、入力コンテンツサーバ30及び変換装置100によって提供される情報を、ウェブブラウザやアプリケーションにより表示する。また、端末装置10は、視聴コンテンツサーバ20、入力コンテンツサーバ30及び変換装置100によって提供される情報の表示処理を実現する制御情報を視聴コンテンツサーバ20、入力コンテンツサーバ30及び変換装置100から受け取った場合には、制御情報に従って表示処理を実現する。また、端末装置10は、利用者が視聴コンテンツを視聴した際の態様(視聴態様)を視聴コンテンツサーバ20に送信する。また、入力コンテンツサーバ30から提供されたコンテンツにおいて利用者が入力した入力コンテンツと、利用者が当該入力コンテンツを入力した際の態様(入力態様)を入力コンテンツサーバ30に送信する。
The
なお、端末装置10は、利用者が視聴した視聴コンテンツや、視聴態様に関する情報を変換装置100に送信してもよい。また、端末装置10は、利用者が入力した入力コンテンツや、入力態様に関する情報を変換装置100に送信してもよい。
Note that the
視聴コンテンツサーバ20は、利用者が視聴する視聴コンテンツを端末装置10に提供するサーバ装置である。また、視聴コンテンツサーバ20は、端末装置10から送信される視聴態様を対応する視聴コンテンツに関連付けた情報を視聴履歴として記憶部に格納する。なお、視聴コンテンツサーバ20は、視聴コンテンツに関するアプリケーションのデータそのものを配信するサーバであってもよい。また、視聴コンテンツサーバ20は、端末装置10に制御情報を配信する配信装置として機能してもよい。ここで、制御情報は、例えば、JavaScript(登録商標)等のスクリプト言語やCSS(Cascading Style Sheets)等のスタイルシート言語により記述される。なお、視聴コンテンツサーバ20から配信される視聴コンテンツに関するアプリそのものを制御情報とみなしてもよい。
The
入力コンテンツサーバ30は、端末装置10に各種コンテンツを提供し、利用者が各種コンテンツにおいて入力した文字列に関する入力コンテンツを受け付けるサーバ装置である。また、入力コンテンツサーバ30は、端末装置10から送信される入力態様を対応する入力コンテンツに関連付けた情報を投稿履歴として記憶部に格納する。なお、入力コンテンツサーバ30は、コンテンツに関するアプリケーションのデータそのものを配信するサーバであってもよい。また、入力コンテンツサーバ30は、端末装置10に制御情報を配信する配信装置として機能してもよい。ここで、制御情報は、例えば、JavaScript(登録商標)等のスクリプト言語やCSS等のスタイルシート言語により記述される。なお、入力コンテンツサーバ30から配信されるコンテンツに関するアプリそのものを制御情報とみなしてもよい。
The
変換装置100は、端末装置10に提供コンテンツを提供するサーバ装置である。変換装置100は、視聴履歴や、投稿履歴を取得し、利用者と関連性を有する関連コンテンツに関する情報として、後述する関連コンテンツ記憶部121に格納する。そして、変換装置100は、関連コンテンツ記憶部121に格納した情報に基づいて生成したモデルを用いて提供コンテンツの表現を変換し、端末装置10に提供する。また、変換装置100は、階層構造を有する概念を体系的にまとめたシソーラスの情報を記憶部に格納する。なお、変換装置100は、提供コンテンツに関するアプリケーションのデータそのものを配信するサーバであってもよい。また、変換装置100は、端末装置10に制御情報を配信する配信装置として機能してもよい。ここで、制御情報は、例えば、JavaScript(登録商標)等のスクリプト言語やCSS等のスタイルシート言語により記述される。なお、変換装置100から配信されるコンテンツに関するアプリそのものを制御情報とみなしてもよい。変換装置100の構成は後述する。
The
〔3.変換装置の構成〕
次に、図4を用いて、変換装置100の構成について説明する。図4は、実施形態に係る変換装置の構成例を示す図である。図4に示すように、変換装置100は、通信部110と、記憶部120と、制御部130とを有する。
[3. Configuration of conversion device]
Next, the configuration of the
(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線または無線で接続され、端末装置10、視聴コンテンツサーバ20、入力コンテンツサーバ30等との間で情報の送受信を行う。
(Regarding communication unit 110)
The communication unit 110 is realized by, for example, a NIC (Network Interface Card) or the like. The communication unit 110 is connected to the network N by wire or wirelessly, and transmits and receives information to and from the
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図4に示すように、記憶部120は、関連コンテンツ記憶部121と、モデル記憶部122とを有する。
(Regarding storage unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory device such as a RAM (Random Access Memory) or a flash memory, or a storage device such as a hard disk or an optical disk. As shown in FIG. 4 , storage unit 120 has related content storage unit 121 and model storage unit 122 .
(関連コンテンツ記憶部121について)
関連コンテンツ記憶部121は、利用者と関連性を有する関連コンテンツに関する情報を記憶する。ここで、図5を用いて、関連コンテンツ記憶部121が記憶する情報の一例を説明する。図5は、実施形態に係る関連コンテンツ記憶部の一例を示す図である。図5の例では、関連コンテンツ記憶部121は、「利用者ID」、「コンテンツ情報」、「態様」といった項目を有する。
(Regarding Related Content Storage Unit 121)
The related content storage unit 121 stores information related to related content related to the user. An example of information stored in the related content storage unit 121 will now be described with reference to FIG. 5 is a diagram illustrating an example of a related content storage unit according to the embodiment; FIG. In the example of FIG. 5, the related content storage unit 121 has items such as "user ID", "content information", and "mode".
「利用者ID」は、利用者を識別するための識別情報を示す。「コンテンツ情報」は、関連コンテンツに関する情報を示す。なお、図5では、「コンテンツ情報」に「コンテンツ情報#1」といった概念的な情報が格納される例を示したが、実際には、視聴コンテンツや入力コンテンツを識別するための識別情報や、視聴コンテンツや入力コンテンツに対応するテキスト情報などが格納される。
"User ID" indicates identification information for identifying a user. "Content information" indicates information about related content. Note that FIG. 5 shows an example in which conceptual information such as "
「態様」は、利用者の視聴コンテンツに対する視聴態様や、利用者の入力コンテンツに対する入力態様に関する情報であり、「行動内容」、「操作内容」といった項目を有する。「行動内容」は、コンテンツに対する利用者の行動を示す情報を示し、視聴コンテンツを視聴したことを示す「視聴」や、入力コンテンツを入力したことを示す「入力」などといった情報が格納される。「操作内容」は、利用者が視聴コンテンツを視聴した際の操作内容(視聴態様)や、入力コンテンツを入力した際の操作内容(入力態様)を示す。なお、図5では、「操作内容」に「操作内容#1」といった概念的な情報が格納される例を示したが、実際には、視聴コンテンツの所定範囲(例えば、単語や、段落、文章、フレーズなどに基づき規定される範囲)ごとのスクロール速度や、入力コンテンツの所定範囲ごとの入力速度などといった情報が格納される。
The "mode" is information about the viewing mode of the user's viewing content and the input mode of the user's input content, and has items such as "behavior details" and "operation details". The 'activity content' indicates information indicating the behavior of the user with respect to the content, and stores information such as 'viewing' indicating that the viewing content has been viewed, and 'input' indicating that the input content has been input. The “operation content” indicates the operation content (viewing mode) when the user views the viewing content or the operation content (input mode) when inputting the input content. Note that FIG. 5 shows an example in which conceptual information such as "
すなわち、図5では、利用者ID「U1」によって識別される利用者が、「コンテンツ情報#1」に対応するコンテンツを視聴し、視聴した際の操作内容が「操作内容#1」である例を示す。
That is, in FIG. 5, the user identified by the user ID "U1" views the content corresponding to "
(モデル記憶部122について)
モデル記憶部122は、関連コンテンツが有する表現の特徴を学習させた表現モデルを格納する。例えば、図1の例において、モデル記憶部122は、容易言語モデル及び非容易言語モデルや、容易言語モデル及び非容易言語モデルを統合した統合言語モデルを格納する。なお、モデル記憶部122は、利用者ごとに生成された表現モデルを格納してもよい。また、モデル記憶部122は、利用者のサイコグラフィック属性、デモグラフィック属性、視聴履歴、投稿履歴、検索履歴等に基づき利用者を分類し、各分類に対応付けた表現モデルを格納してもよい。例えば、モデル記憶部122は、同一の分類に属する利用者に対応する関連コンテンツを学習させた表現モデルを、当該分類に対応付けて格納する。
(Regarding the model storage unit 122)
The model storage unit 122 stores an expression model that has learned the characteristics of the expression of the related content. For example, in the example of FIG. 1, the model storage unit 122 stores an easy language model, a difficult language model, and an integrated language model that integrates the easy language model and the difficult language model. Note that the model storage unit 122 may store an expression model generated for each user. In addition, the model storage unit 122 may classify users based on their psychographic attributes, demographic attributes, viewing history, posting history, search history, etc., and store expression models associated with each classification. . For example, the model storage unit 122 stores expression models that have learned related content corresponding to users belonging to the same classification, in association with the classification.
なお、モデル記憶部122は、形態素解析等の技術により関連コンテンツを解析し、生成されたシソーラスに関する情報を格納してもよい。 Note that the model storage unit 122 may store information about the generated thesaurus by analyzing the related content using techniques such as morphological analysis.
(制御部130について)
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、変換装置100内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。実施形態に係る制御部130は、図4に示すように、特定部131と、抽出部132と、生成部133と、変換部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。
(Regarding the control unit 130)
The
(特定部131について)
特定部131は、提供コンテンツの提供先となる利用者と関連性を有する関連コンテンツを特定する。例えば、図1の例において、特定部131は、視聴コンテンツサーバ20から視聴履歴を収集し、利用者U1と関連性を有する関連コンテンツを特定する。また、特定部131は、入力コンテンツサーバ30から投稿履歴を収集し、利用者U1と関連性を有する関連コンテンツを特定する。そして、特定部131は、特定した関連コンテンツを関連コンテンツ記憶部121に格納する。
(Regarding the identification unit 131)
The identifying unit 131 identifies related content that is related to the user to whom the provided content is provided. For example, in the example of FIG. 1, the identifying unit 131 collects viewing histories from the
また、特定部131は、関連コンテンツとして、利用者が視聴した視聴コンテンツを特定してもよい。例えば、図1の例において、特定部131は、利用者U1が視聴した視聴コンテンツを関連コンテンツとして特定し、対応する視聴態様と共に関連コンテンツ記憶部121に格納する。 Further, the identifying unit 131 may identify the viewing content viewed by the user as the related content. For example, in the example of FIG. 1, the identification unit 131 identifies the viewing content viewed by the user U1 as the related content, and stores it in the related content storage unit 121 together with the corresponding viewing mode.
また、特定部131は、関連コンテンツとして、利用者が入力した入力コンテンツを特定してもよい。例えば、図1の例において、特定部131は、利用者U1が入力した入力コンテンツを関連コンテンツとして特定し、対応する入力態様と共に関連コンテンツ記憶部121に格納する。 The identifying unit 131 may also identify input content input by the user as related content. For example, in the example of FIG. 1, the identification unit 131 identifies the input content input by the user U1 as the related content, and stores it in the related content storage unit 121 together with the corresponding input mode.
(抽出部132について)
抽出部132は、利用者が視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易であると推定されるコンテンツを容易コンテンツとして抽出する。例えば、図1の例において、抽出部132は、視聴コンテンツに対する利用者U1の操作に基づき容易コンテンツを抽出する。
(Regarding the extraction unit 132)
The extraction unit 132 extracts, as easy content, content that is estimated to be easy to view from the viewing content, based on the manner in which the user views the viewing content. For example, in the example of FIG. 1, the extraction unit 132 extracts easy content based on user U1's operation on the viewing content.
また、抽出部132は、視聴に要した時間が所定の閾値を下回る視聴コンテンツを、容易コンテンツとして抽出してもよい。例えば、図1の例において、抽出部132は、端末装置10の画面に表示されてから他の画面への遷移操作が行われるまでの時間が所定の閾値以下である視聴コンテンツを、容易コンテンツとして抽出する。
Also, the extracting unit 132 may extract viewing content whose viewing time is less than a predetermined threshold as easy content. For example, in the example of FIG. 1, the extracting unit 132 selects viewing content whose time from being displayed on the screen of the
また、抽出部132は、視聴中における操作の内容が所定の条件を満たす視聴コンテンツを、容易コンテンツとして抽出してもよい。例えば、図1の例において、抽出部132は、利用者U1の視聴中のスクロール速度が所定の閾値以上である視聴コンテンツを、容易コンテンツとして抽出する。 The extraction unit 132 may also extract, as easy content, viewing content that satisfies a predetermined condition for details of operations performed during viewing. For example, in the example of FIG. 1, the extraction unit 132 extracts, as easy content, viewing content whose scroll speed during viewing by the user U1 is equal to or higher than a predetermined threshold.
また、抽出部132は、視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易であると推定される部分を容易部分として抽出してもよい。例えば、図1の例において、抽出部132は、視聴コンテンツの所定範囲(例えば、単語や、段落、文章、フレーズなどに基づき規定される範囲)ごとの利用者U1のスクロール速度に基づき、スクロール速度が所定の閾値以上である範囲を、容易部分として抽出する。 Further, the extracting unit 132 may extract, as an easy part, a portion of the viewing content that is estimated to be easy to view, based on the manner in which the viewing content is viewed. For example, in the example of FIG. 1, the extraction unit 132 extracts the scroll speed is greater than or equal to a predetermined threshold is extracted as an easy portion.
また、抽出部132は、さらに、視聴コンテンツのうち視聴が容易でないと推定されるコンテンツを非容易コンテンツとして抽出してもよい。例えば、図1の例において、抽出部132は、視聴コンテンツに対する利用者U1の操作に基づき非容易コンテンツを抽出する。 Moreover, the extracting unit 132 may further extract content estimated to be not easy to view from the viewing content as non-easy content. For example, in the example of FIG. 1, the extraction unit 132 extracts difficult content based on user U1's operation on the viewing content.
また、抽出部132は、視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易でないと推定される部分を非容易部分として抽出してもよい。例えば、図1の例において、抽出部132は、視聴コンテンツの所定範囲ごとの利用者U1のスクロール速度に基づき、スクロール速度が所定の閾値以下である範囲を、非容易部分として抽出する。 Further, the extracting unit 132 may extract a portion of the viewing content that is estimated to be difficult to view as an uneasy portion based on the manner in which the viewing content is viewed. For example, in the example of FIG. 1, the extracting unit 132 extracts a range in which the scroll speed is equal to or less than a predetermined threshold value as an uneasy portion based on the scroll speed of the user U1 for each predetermined range of viewing content.
また、抽出部132は、利用者が入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易であると推定される入力容易コンテンツを抽出してもよい。例えば、図1の例において、抽出部132は、利用者U1の入力速度が所定の閾値以上である入力コンテンツを、入力容易コンテンツとして抽出する。なお、抽出部132は、例えば、入力コンテンツサーバ30からコンテンツが配信され、端末装置10が入力コンテンツを入力コンテンツサーバ30に送信するまでの時間や、中断時間、削除操作の回数などに基づく入力速度に応じて、入力容易コンテンツ抽出してもよい。
Further, the extracting unit 132 may extract easy-to-input content estimated to be easy to input from the input content based on the manner in which the user inputs the input content. For example, in the example of FIG. 1, the extracting unit 132 extracts input content whose input speed of the user U1 is equal to or higher than a predetermined threshold as easy-to-input content. Note that the extracting unit 132, for example, determines the input speed based on the time from when the content is distributed from the
また、抽出部132は、入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易と推定される部分を入力容易部分として抽出してもよい。例えば、図1の例において、抽出部132は、入力コンテンツの所定範囲(例えば、単語や、段落、文章、フレーズなどに基づき規定される範囲)ごとの利用者U1の入力速度に基づき、入力速度が所定の閾値以上である範囲を、入力容易部分として抽出する。 Further, the extracting unit 132 may extract, as an easy-to-input portion, a portion of the input content that is estimated to be easy to input, based on the manner in which the input content is input. For example, in the example of FIG. 1, the extraction unit 132 calculates the input speed based on the input speed of the user U1 for each predetermined range of input content (for example, a range defined based on words, paragraphs, sentences, phrases, etc.). is greater than or equal to a predetermined threshold is extracted as an easy-to-input portion.
また、抽出部132は、さらに、入力コンテンツのうち入力が容易でないと推定される入力非容易コンテンツを抽出してもよい。例えば、図1の例において、抽出部132は、利用者U1の入力速度が所定の閾値以下である入力コンテンツを、入力非容易コンテンツとして抽出する。 Moreover, the extraction unit 132 may further extract, from the input content, hard-to-input content estimated to be difficult to input. For example, in the example of FIG. 1, the extracting unit 132 extracts input content whose input speed of the user U1 is equal to or less than a predetermined threshold as content that is difficult to input.
また、抽出部132は、入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易でないと推定される部分を入力非容易部分として抽出してもよい。例えば、図1の例において、抽出部132は、入力コンテンツの所定範囲ごとの利用者U1の入力速度に基づき、入力速度が所定の閾値以下である範囲を、入力非容易部分として抽出する。 Further, the extracting unit 132 may extract a portion of the input content that is estimated to be difficult to input as the difficult-to-input portion, based on the manner in which the input content was input. For example, in the example of FIG. 1, the extracting unit 132 extracts ranges in which the input speed is equal to or less than a predetermined threshold as input-difficult portions, based on user U1's input speed for each predetermined range of input content.
(生成部133について)
生成部133は、特定部131により特定された関連コンテンツが有する表現の特徴を学習させた表現モデルを生成する。例えば、生成部133は、特定部131により特定された関連コンテンツをw2vやs2v等によりベクトルに変換し、当該ベクトルに基づいて学習が行われた表現モデルを生成し、モデル記憶部122に格納する。例えば、図1の例において、生成部133は、容易部分から形態素解析等の技術により抽出した単語や文章をベクトルに変換し、当該ベクトルに基づいて学習が行われた容易言語モデルであって、単語や文章が入力された場合に、関連コンテンツの容易部分から抽出した単語や文章群との類似度を示すスコアを出力する容易言語モデルを生成する。また、生成部133は、非容易部分から抽出した単語や文章をベクトルに変換し、当該ベクトルに基づいて学習が行われた非容易言語モデルであって、利用者U1に提供する提供コンテンツが入力された場合に、当該提供コンテンツのうち利用者U1の視聴が非容易と推定される非容易部分を出力する非容易言語モデルを生成する。
(Regarding the generation unit 133)
The generation unit 133 generates an expression model by learning the characteristics of the expressions of the related content identified by the identification unit 131 . For example, the generating unit 133 converts the related content identified by the identifying unit 131 into a vector using w2v, s2v, or the like, generates an expression model learned based on the vector, and stores it in the model storage unit 122. . For example, in the example of FIG. 1, the generation unit 133 converts words and sentences extracted from easy parts by techniques such as morphological analysis into vectors, and is an easy language model trained based on the vectors. When a word or sentence is input, an easy language model is generated that outputs a score indicating the degree of similarity with a group of words or sentences extracted from the easy part of the related content. In addition, the generation unit 133 converts the words and sentences extracted from the difficult part into vectors, and is a difficult language model trained based on the vector, and the provided content to be provided to the user U1 is input. Then, a difficult language model is generated that outputs a difficult part of the provided content that is estimated to be difficult for the user U1 to view.
また、生成部133は、所定のコンテンツが入力された場合に、関連コンテンツと共通する表現を有するコンテンツであって、入力されたコンテンツと意図が類似するコンテンツを出力するように、表現モデルを生成する。例えば、生成部133は、提供コンテンツが入力された場合、容易コンテンツ及び入力容易コンテンツの表現へ近づけるように表現を変換した提供コンテンツを出力し、且つ、入力された提供コンテンツと、出力された提供コンテンツとの類似度が所定の閾値以上となるよう学習された表現モデルを生成する。 In addition, the generation unit 133 generates an expression model so that, when predetermined content is input, content having a common expression with related content and having a similar intention to the input content is output. do. For example, when the provided content is input, the generation unit 133 outputs the provided content whose expression is converted so as to approach the expression of the easy content and the easy-to-input content, A representation model that has been learned such that the degree of similarity with content is equal to or greater than a predetermined threshold is generated.
なお、生成部133は、形態素解析等の技術により関連コンテンツを解析し、シソーラスに関する情報を生成してもよい。 Note that the generating unit 133 may analyze the related content using techniques such as morphological analysis and generate information about the thesaurus.
(変換部134について)
変換部134は、特定部131により特定された関連コンテンツの表現に基づいて、提供コンテンツの表現を変換する。例えば、図1の例において、変換部134は、視聴コンテンツ及び入力コンテンツを含む関連コンテンツの表現に基づいて、提供コンテンツの表現を変換する。
(Regarding the conversion unit 134)
The conversion unit 134 converts the expression of the provided content based on the expression of the related content identified by the identification unit 131 . For example, in the example of FIG. 1, the conversion unit 134 converts the presentation of the provided content based on the presentation of related content including the viewing content and the input content.
また、変換部134は、抽出部132により抽出された容易コンテンツの表現へ近づけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した視聴コンテンツのうち、利用者U1の視聴が容易と推定される視聴コンテンツに対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似するように、提供コンテンツの表現を変換する。 Further, the conversion unit 134 may convert the representation of the provided content so as to approximate the representation of the easy content extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134 converts a vector corresponding to the viewing content that is estimated to be easily viewed by the user U1 among the viewing content specified as the related content, and a vector corresponding to the provided content after conversion. Transform the representation of the provided content so that it resembles a vector.
また、変換部134は、抽出部132により抽出された容易部分の表現へ近づけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した視聴コンテンツのうち、利用者U1の視聴が容易と推定される容易部分に対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似するように、提供コンテンツの表現を変換する。 Further, the conversion unit 134 may convert the expression of the provided content so as to approximate the expression of the easy part extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134 converts a vector corresponding to an easy part that is estimated to be easily viewed by the user U1 among the viewing contents specified as related contents, and a vector corresponding to the provided content after conversion. Transform the representation of the provided content so that it resembles a vector.
また、変換部134は、さらに、抽出部132により抽出された非容易コンテンツの表現から遠ざけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した視聴コンテンツのうち、利用者U1の視聴が非容易と推定される視聴コンテンツに対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似しないように、提供コンテンツの表現を変換する。 Further, the conversion unit 134 may further convert the representation of the provided content so as to move away from the representation of the difficult content extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134 corresponds to a vector corresponding to viewing content that is estimated to be difficult for the user U1 to view, among the viewing content specified as related content, and the provided content after conversion. Transform the representation of the provided content so that it is not similar to the vector that
また、変換部134は、抽出部132により抽出された非容易部分の表現から遠ざけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した視聴コンテンツのうち、利用者U1の視聴が非容易と推定される非容易部分に対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似しないように、提供コンテンツの表現を変換する。 Further, the conversion unit 134 may convert the representation of the provided content so as to move away from the representation of the difficult part extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134 converts a vector corresponding to a difficult portion that is estimated to be difficult for the user U1 to view among the viewing content specified as the related content, and the provided content after conversion. Transform the representation of the provided content so that the corresponding vectors are dissimilar.
また、変換部134は、提供コンテンツのうち、抽出部132により抽出された非容易部分と表現が類似する部分を特定し、特定した部分の表現を変換してもよい。例えば、図1の例において、変換部134は、提供コンテンツに対応するベクトルと、非容易部分に対応するベクトルとを比較することにより、提供コンテンツのうち非容易部分と表現が類似する部分を特定し、当該部分の表現を変換する。 Further, the conversion unit 134 may identify a portion of the provided content whose expression is similar to the difficult portion extracted by the extraction unit 132, and convert the expression of the identified portion. For example, in the example of FIG. 1, the conversion unit 134 identifies a portion of the provided content whose expression is similar to the difficult portion by comparing the vector corresponding to the provided content with the vector corresponding to the difficult portion. and convert the representation of that part.
また、変換部134は、抽出部132により抽出された入力容易コンテンツの表現へ近づけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した入力コンテンツのうち、利用者U1の入力が容易と推定される入力コンテンツに対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似するように、提供コンテンツの表現を変換する。 Further, the conversion unit 134 may convert the expression of the provided content so as to approximate the expression of the easy-to-input content extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134 converts a vector corresponding to the input content that is estimated to be input easily by the user U1 among the input content specified as the related content, and a vector corresponding to the provided content after conversion. Transform the representation of the provided content so that it resembles a vector.
また、変換部134は、抽出部132により抽出された入力容易部分の表現へ近づけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した入力コンテンツのうち、利用者U1の入力が容易と推定される入力容易部分に対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似するように、提供コンテンツの表現を変換する。 Also, the conversion unit 134 may convert the expression of the provided content so as to approximate the expression of the easy-to-input portion extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134, of the input content specified as related content, corresponds to a vector corresponding to an easy-to-input portion that is estimated to be easy for user U1 to input, and a provided content after conversion. Transform the representation of the provided content so that it is similar to the vector that
また、変換部134は、抽出部132により抽出された入力非容易コンテンツの表現から遠ざけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した入力コンテンツのうち、利用者U1の入力が非容易と推定される入力コンテンツに対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似しないように、提供コンテンツの表現を変換する。 Further, the conversion unit 134 may convert the expression of the provided content so as to move away from the expression of the difficult-to-input content extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134 corresponds to a vector corresponding to the input content that is estimated to be difficult for the user U1 to input among the input contents specified as the related content, and the provided content after conversion. Transform the representation of the provided content so that it is not similar to the vector that
また、変換部134は、抽出部132により抽出された入力非容易部分の表現から遠ざけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した入力コンテンツのうち、利用者U1の入力が非容易と推定される入力非容易部分に対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似しないように、提供コンテンツの表現を変換する。 Further, the conversion unit 134 may convert the expression of the provided content so as to move away from the expression of the difficult-to-input portion extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134 converts a vector corresponding to an input-difficult part that is estimated to be difficult for the user U1 to input from among the input content specified as related content, and the provided content after conversion. Transform the representation of the provided content so that it is dissimilar to the vectors corresponding to .
また、変換部134は、提供コンテンツのうち、抽出部132により抽出された入力非容易部分と表現が類似する部分を特定し、特定した部分の表現を変換してもよい。例えば、図1の例において、変換部134は、提供コンテンツに対応するベクトルと、入力非容易部分に対応するベクトルとを比較することにより、提供コンテンツのうち入力非容易部分と表現が類似する部分を特定し、当該部分の表現を変換する。 Further, the conversion unit 134 may identify a portion of the provided content whose expression is similar to the difficult-to-input portion extracted by the extraction unit 132, and convert the expression of the identified portion. For example, in the example of FIG. 1, the conversion unit 134 compares the vector corresponding to the provided content with the vector corresponding to the hard-to-input portion, and converts the portion of the provided content that is similar in expression to the difficult-to-input portion. , and transform the representation of that part.
また、変換部134は、表現の変換前の提供コンテンツが有する意図を変化させないように、提供コンテンツの表現を変換してもよい。例えば、変換部134は、変換前の提供コンテンツに対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似するように提供コンテンツを変換する。 Further, the conversion unit 134 may convert the expression of the provided content so as not to change the intention of the provided content before conversion of the expression. For example, the conversion unit 134 converts the provided content such that the vector corresponding to the provided content before conversion is similar to the vector corresponding to the provided content after conversion.
また、変換部134は、表現モデルを用いて、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、形態素解析等の技術により提供コンテンツから抽出した単語や文章を非容易言語モデルに入力し、提供コンテンツのうち利用者U1の視聴が非容易と推定される非容易部分を抽出する。そして、変換部134は、シソーラスを用いて、提供コンテンツの非容易部分から抽出した単語や文章の同義語や類似語を候補として抽出し、当該候補のうち、容易言語モデルにより出力したスコアが最も高い候補を用いて、提供コンテンツの非容易部分の表現を変換する。 Also, the conversion unit 134 may convert the representation of the provided content using the representation model. For example, in the example of FIG. 1, the conversion unit 134 inputs words and sentences extracted from the provided content by techniques such as morphological analysis into the difficult language model, and presumes that viewing of the provided content is difficult for the user U1. Extract the non-easy parts that are Then, the conversion unit 134 uses the thesaurus to extract synonyms and similar words of words and sentences extracted from the difficult part of the provided content as candidates, and among the candidates, the score output by the easy language model is the highest. High candidates are used to transform the representation of the difficult part of the provided content.
〔4.変換処理のフロー〕
ここで、図6を用いて、実施形態に係る変換装置100の変換処理の手順について説明する。図6は、実施形態に係る変換処理の手順の一例を示すフローチャートである。
[4. Flow of conversion process]
Here, the procedure of conversion processing of the
図6に示すように、変換装置100は、関連コンテンツを特定する(ステップS101)。例えば、図1の例において、変換装置100は、視聴コンテンツサーバ20から視聴履歴を収集し、利用者U1と関連性を有する関連コンテンツを特定する。また、変換装置100は、入力コンテンツサーバ30から投稿履歴を収集し、利用者U1と関連性を有する関連コンテンツを特定する。
As shown in FIG. 6, the
続いて、変換装置100は、関連コンテンツから容易コンテンツ及び非容易コンテンツを抽出する(ステップS102)。例えば、図1の例において、変換装置100は、関連コンテンツの容易部分と、非容易部分とを抽出し、容易部分を学習した容易言語モデルと、非容易部分を学習した非容易言語モデルとを生成する。
Subsequently, the
続いて、変換装置100は、端末装置10から提供コンテンツの提供要求を受け付けたか否か判定する(ステップS103)。提供要求を受け付けていない場合(ステップS103;No)、変換装置100は、関連コンテンツを特定する処理、並びに、容易コンテンツ及び非容易コンテンツを抽出する処理を繰り返す。
Subsequently, the
一方、提供要求を受け付けた場合(ステップS103;Yes)、変換装置100は、容易コンテンツの表現に近づけ、非容易コンテンツの表現から遠ざけるように表現を変換した提供コンテンツを提供し(ステップS104)、処理を終了する。
On the other hand, if a provision request has been accepted (step S103; Yes), the
〔5.変形例〕
上述の実施形態は一例を示したものであり、種々の変更及び応用が可能である。
[5. Modification]
The above-described embodiment is an example, and various modifications and applications are possible.
〔5-1.「容易」及び「非容易」の関係について〕
上述の実施形態において、抽出部132が、スクロール速度が速い視聴コンテンツや、入力速度が速い入力コンテンツを容易コンテンツとし、コンテンツのスクロール速度が遅い視聴コンテンツや、入力速度が遅い入力コンテンツを非容易コンテンツとする例を示したが、容易コンテンツ及び非容易コンテンツは、任意の関係であってもよい。例えば、抽出部132は、関連コンテンツのうち、スクロール速度が所定の閾値以上である視聴コンテンツや、入力速度が所定の閾値以上である入力コンテンツを容易コンテンツとし、それ以外の関連コンテンツを全て非容易コンテンツとしてもよい。また、例えば、抽出部132は、関連コンテンツのうち、スクロール速度が第1閾値以上である視聴コンテンツを容易コンテンツとし、スクロール速度が第2閾値以下である視聴コンテンツを非容易コンテンツとしてもよい。そして、抽出部132は、関連コンテンツのうち、入力速度が第1閾値以上である入力コンテンツを容易コンテンツとし、入力速度が第2閾値以下である入力コンテンツを非容易コンテンツとしてもよい。
[5-1. Regarding the relationship between "easy" and "not easy"]
In the above-described embodiment, the extracting unit 132 treats viewing content with a fast scroll speed and input content with a fast input speed as easy content, and determines viewing content with a slow scroll speed and input content with a slow input speed as non-easy content. However, the easy content and the non-easy content may have any relationship. For example, the extracting unit 132 determines viewing content whose scrolling speed is equal to or higher than a predetermined threshold value and input content whose input speed is equal to or higher than a predetermined threshold among the related content as easy content, and regards all other related content as non-easy content. It can also be used as content. Further, for example, the extracting unit 132 may regard viewing content with a scroll speed equal to or higher than a first threshold as easy content, and may regard viewing content with a scroll speed equal to or lower than a second threshold as non-easy content. Then, the extracting unit 132 may regard input content whose input speed is equal to or higher than the first threshold among the related content as easy content, and may regard input content whose input speed is equal to or lower than the second threshold as non-easy content.
〔5-2.提供コンテンツの変換について〕
上述の実施形態において、変換部134が、提供コンテンツの非容易部分から抽出した単語や文章の同義語や類似語に変換する例を示したが、変換部134の機能はこのような構成に限定されない。例えば、変換部134は、1つの単語を複数の単語に変換、若しくは、複数の単語を1つの単語に変換してもよく、漢字を平仮名に変更してもよい。また、例えば、変換部134は、非容易部分として抽出した文章の語順や、文章の長さを変更してもよい。また、変換部134は、標準語とは異なった地方特有の表現(例えば、なまり)が提供コンテンツに含まれる場合、利用者が拠点とする地域に応じて当該提供コンテンツを変換してもよい。
[5-2. Conversion of provided content]
In the above-described embodiment, an example was given in which the conversion unit 134 converts words or sentences extracted from the difficult part of the provided content into synonyms or similar words, but the function of the conversion unit 134 is limited to such a configuration. not. For example, the conversion unit 134 may convert one word into multiple words, convert multiple words into one word, or change kanji into hiragana. Further, for example, the conversion unit 134 may change the word order of the sentence extracted as the difficult part or the length of the sentence. In addition, if the provided content includes expressions unique to the region (for example, dialects) different from the standard language, the conversion unit 134 may convert the provided content according to the region where the user is based.
また、上述の実施形態では、変換部134が、利用者の視聴が非容易と推定される提供コンテンツを変換する例を示したが、変換部134の機能はこのような構成に限定されない。例えば、変換部134は、提供コンテンツが利用者の視聴が容易と推定される場合、利用者の語彙力の高さや提供コンテンツが属するカテゴリに対する利用者の理解度の高さに応じた表現へ近づけるように提供コンテンツの表現を変換してもよい。 Further, in the above-described embodiment, an example was given in which the conversion unit 134 converts provided content that is assumed to be difficult for the user to view, but the function of the conversion unit 134 is not limited to such a configuration. For example, when it is estimated that the provided content is easy for the user to view, the conversion unit 134 approximates the expression to an expression according to the user's high vocabulary and the user's degree of understanding of the category to which the provided content belongs. The representation of the provided content may be converted as follows.
また、上述の実施形態では、変換部134が、提供コンテンツに含まれる単語や文章を変換する例を示したが、変換部134の機能はこのような構成に限定されない。例えば、変換部134は、利用者の視聴が非容易と推定される提供コンテンツにおける文章や画像の構成を、容易コンテンツ又は容易部分の構成に近づけるように変換してもよい。また、利用者の視聴が非容易と推定される提供コンテンツが音声に関するコンテンツである場合、変換部134は、利用者の視聴が容易と推定される容易コンテンツや容易部分の表現へ近づけるように音声を変換する。 Further, in the above-described embodiment, an example in which the conversion unit 134 converts words and sentences included in the provided content has been described, but the function of the conversion unit 134 is not limited to such a configuration. For example, the conversion unit 134 may convert the structure of sentences and images in the provided content that is estimated to be difficult for the user to view so as to approximate the structure of the easy content or the easy part. In addition, when the provided content that is estimated to be difficult for the user to view is audio-related content, the conversion unit 134 converts the audio so as to approach the expression of the easy content or the easy part that is estimated to be easy for the user to view. to convert
なお、変換装置100は、変換部134が変換した部分を強調表示する提供コンテンツを端末装置10に提供してもよい。また、変換装置100は、変換部134が変換した単語や文章を列挙して表示する提供コンテンツを端末装置10に提供してもよい。
Note that the
〔6.効果〕
上述してきたように、実施形態に係る変換装置100は、特定部131と、抽出部132と、生成部133と、変換部134とを有する。特定部131は、提供コンテンツの提供先となる利用者と関連性を有する関連コンテンツを特定する。また、特定部131は、関連コンテンツとして、利用者が視聴した視聴コンテンツを特定する。抽出部132は、利用者が視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易であると推定されるコンテンツを容易コンテンツとして抽出する。生成部133は、特定部131により特定された関連コンテンツが有する表現の特徴を学習させた表現モデルを生成する。変換部134は、特定部131により特定された関連コンテンツの表現に基づいて、提供コンテンツの表現を変換する。
[6. effect〕
As described above, the
これにより、実施形態に係る変換装置100は、利用者に関連するコンテンツの表現に基づいて提供コンテンツの表現を変換するため、利用者に対し適切な表現のコンテンツを提供することができる。
As a result, the
また、実施形態に係る変換装置100において、例えば、抽出部132は、視聴に要した時間が所定の閾値を下回る視聴コンテンツを、容易コンテンツとして抽出する。また、抽出部132は、視聴中における操作の内容が所定の条件を満たす視聴コンテンツを、容易コンテンツとして抽出する。そして、変換部134は、抽出部132により抽出された容易コンテンツの表現へ近づけるように、提供コンテンツの表現を変換する。また、抽出部132は、視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易であると推定される部分を容易部分として抽出する。そして、変換部134は、抽出部132により抽出された容易部分の表現へ近づけるように、提供コンテンツの表現を変換する。
Further, in the
これにより、実施形態に係る変換装置100は、提供コンテンツの表現を容易コンテンツ又は容易部分の表現へ近づけることができるため、利用者に対し適切な表現のコンテンツを提供することができる。
As a result, the
また、実施形態に係る変換装置100において、例えば、抽出部132は、さらに、視聴コンテンツのうち視聴が容易でないと推定されるコンテンツを非容易コンテンツとして抽出する。そして、変換部134は、さらに、抽出部132により抽出された非容易コンテンツの表現から遠ざけるように、提供コンテンツの表現を変換する。また、抽出部132は、視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易でないと推定される部分を非容易部分として抽出する。そして、変換部134は、抽出部132により抽出された非容易部分の表現から遠ざけるように、提供コンテンツの表現を変換する。また、変換部134は、提供コンテンツのうち、抽出部132により抽出された非容易部分と表現が類似する部分を特定し、特定した部分の表現を変換する。
In addition, in the
これにより、実施形態に係る変換装置100は、提供コンテンツの表現を非容易コンテンツ又は非容易部分の表現から遠ざけることができるため、利用者に対し適切な表現のコンテンツを提供することができる。
As a result, the
また、実施形態に係る変換装置100において、例えば、特定部131は、関連コンテンツとして、利用者が入力した入力コンテンツを特定する。また、抽出部132は、利用者が入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易であると推定される入力容易コンテンツを抽出する。そして、変換部134は、抽出部132により抽出された入力容易コンテンツの表現へ近づけるように、提供コンテンツの表現を変換する。また、抽出部132は、入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易と推定される部分を入力容易部分として抽出する。そして、変換部134は、抽出部132により抽出された入力容易部分の表現へ近づけるように、提供コンテンツの表現を変換する。
Further, in the
これにより、実施形態に係る変換装置100は、提供コンテンツの表現を入力容易コンテンツ又は入力容易部分の表現へ近づけることができるため、利用者に対し適切な表現のコンテンツを提供することができる。
As a result, the
また、実施形態に係る変換装置100において、例えば、抽出部132は、さらに、入力コンテンツのうち入力が容易でないと推定される入力非容易コンテンツを抽出する。そして、変換部134は、抽出部132により抽出された入力非容易コンテンツの表現から遠ざけるように、提供コンテンツの表現を変換する。また、抽出部132は、入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易でないと推定される部分を入力非容易部分として抽出する。そして、変換部134は、抽出部132により抽出された入力非容易部分の表現から遠ざけるように、提供コンテンツの表現を変換する。また、変換部134は、提供コンテンツのうち、抽出部132により抽出された入力非容易部分と表現が類似する部分を特定し、特定した部分の表現を変換する。
In addition, in the
これにより、実施形態に係る変換装置100は、提供コンテンツの表現を入力非容易コンテンツ又は入力非容易部分の表現から遠ざけることができるため、利用者に対し適切な表現のコンテンツを提供することができる。
As a result, the
また、実施形態に係る変換装置100において、例えば、変換部134は、表現の変換前の提供コンテンツが有する意図を変化させないように、提供コンテンツの表現を変換する。
Further, in the
これにより、実施形態に係る変換装置100は、コンテンツの意図を変化させずに表現を変換するため、利用者に対し適切な表現のコンテンツを提供することができる。
As a result, the
また、実施形態に係る変換装置100において、例えば、変換部134は、表現モデルを用いて、提供コンテンツの表現を変換する。また、生成部133は、所定のコンテンツが入力された場合に、関連コンテンツと共通する表現を有するコンテンツであって、入力されたコンテンツと意図が類似するコンテンツを出力するように、表現モデルを生成する。
Also, in the
これにより、実施形態に係る変換装置100は、利用者に関連するコンテンツを学習したモデルを用いて変換処理を行うため、利用者に対し適切な表現のコンテンツを提供することができる。
As a result, the
〔7.ハードウェア構成〕
また、上述してきた各実施形態に係る変換装置は、例えば図7に示すような構成のコンピュータ1000によって実現される。以下、変換装置100を例に挙げて説明する。図7は、変換装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、ROM1200、RAM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
[7. Hardware configuration]
Also, the conversion apparatus according to each of the embodiments described above is implemented by a
CPU1100は、ROM1200又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1200は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
The
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(実施形態のネットワークNに対応する)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。
The
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
The
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1300を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1300上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が変換装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1300上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、変換装置100の記憶装置内の各データが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。
For example, when the
〔8.その他〕
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
[8. others〕
As described above, some of the embodiments of the present application have been described in detail based on the drawings. It is possible to carry out the invention in other forms with modifications.
また、上述した変換装置100は、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
Further, the configuration of the
また、特許請求の範囲に記載した「部」は、「手段」や「回路」などに読み替えることができる。例えば、特定部は、特定手段や特定回路に読み替えることができる。 In addition, the "unit" described in the claims can be read as "means", "circuit", or the like. For example, the identifying unit can be read as identifying means or a specific circuit.
10 端末装置
20 視聴コンテンツサーバ
30 入力コンテンツサーバ
100 変換装置
110 通信部
120 記憶部
121 関連コンテンツ記憶部
122 モデル記憶部
130 制御部
131 特定部
132 抽出部
133 生成部
134 変換部
10
Claims (11)
前記利用者が前記視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易であると推定されるコンテンツを容易コンテンツとして抽出し、当該視聴コンテンツのうち視聴が非容易であると推定されるコンテンツを非容易コンテンツとして抽出する第1抽出部と、
前記容易コンテンツに基づいて、コンテンツが入力された場合に、容易コンテンツとの類似度を出力するように学習が行われた容易言語モデルを生成し、前記非容易コンテンツに基づいて、コンテンツが入力された場合に、当該コンテンツのうち前記利用者の視聴が非容易と推定される非容易部分を出力するよう学習が行われた非容易言語モデルを生成するする生成部と、
前記非容易言語モデルを用いて、前記提供コンテンツから非容易部分を抽出し、当該非容易部分の表現を変換した複数の候補のうち、前記容易言語モデルにより出力された類似度が最も高い候補を用いて当該非容易部分の表現を変換する変換部と
を有することを特徴とする変換装置。 a specifying unit that specifies viewing content viewed by the user as related content related to the user to whom the provided content is provided;
Based on the manner in which the user views the viewing content, content that is estimated to be easy to view is extracted as easy content from the viewing content, and viewing is difficult from the viewing content. a first extraction unit that extracts content estimated to be as non-easy content;
generating an easy language model trained to output a degree of similarity with easy content when content is input based on the easy content; a generation unit that generates a difficult language model that has been trained to output a difficult part of the content that is estimated to be difficult for the user to view when the content is viewed;
Using the difficult language model, a difficult part is extracted from the provided content, and among a plurality of candidates obtained by converting the expression of the difficult part, a candidate with the highest similarity output by the easy language model is selected. and a conversion unit that converts the expression of the difficult part using the conversion device.
視聴に要した時間が所定の閾値を下回る視聴コンテンツを、前記容易コンテンツとして抽出する
ことを特徴とする請求項1に記載の変換装置。 The first extraction unit is
2. The conversion device according to claim 1 , wherein viewing content whose viewing time is less than a predetermined threshold is extracted as said easy content.
視聴中における操作の内容が所定の条件を満たす視聴コンテンツを、前記容易コンテンツとして抽出する
ことを特徴とする請求項1または2に記載の変換装置。 The first extraction unit is
3. The conversion device according to claim 1 , wherein viewing contents satisfying a predetermined condition for details of operation during viewing are extracted as said easy contents.
前記関連コンテンツとして、前記利用者が入力した入力コンテンツを特定する
ことを特徴とする請求項1~3のうちいずれか1つに記載の変換装置。 The identification unit
4. The conversion device according to any one of claims 1 to 3 , wherein input content input by said user is specified as said related content.
をさらに有し、
前記変換部は、
前記第2抽出部により抽出された入力容易コンテンツの表現へ近づけるように、前記提供コンテンツの表現を変換する
ことを特徴とする請求項4に記載の変換装置。 a second extraction unit that extracts easy-to-input content that is estimated to be easy to input from among the input content based on the manner in which the input content is input by the user;
The conversion unit
5. The conversion device according to claim 4 , wherein the expression of the provided content is converted so as to approximate the expression of the easy-to-input content extracted by the second extraction unit.
前記入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易と推定される部分を入力容易部分として抽出し、
前記変換部は、
前記第2抽出部により抽出された入力容易部分の表現へ近づけるように、前記提供コンテンツの表現を変換する
ことを特徴とする請求項5に記載の変換装置。 The second extractor is
extracting a portion of the input content that is presumed to be easy to input as an easy-to-input portion, based on the manner in which the input content is input;
The conversion unit
6. The conversion device according to claim 5 , wherein the expression of the provided content is converted so as to approximate the expression of the easy-to-input portion extracted by the second extraction unit.
さらに、前記入力コンテンツのうち入力が容易でないと推定される入力非容易コンテンツを抽出し
前記変換部は、
前記第2抽出部により抽出された入力非容易コンテンツの表現から遠ざけるように、前記提供コンテンツの表現を変換する
ことを特徴とする請求項5または6に記載の変換装置。 The second extractor is
Furthermore, the conversion unit extracts content that is estimated to be difficult to input from the input content,
7. The conversion device according to claim 5 , wherein the expression of the provided content is converted so as to move away from the expression of the hard-to-input content extracted by the second extraction unit.
前記入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易でないと推定される部分を入力非容易部分として抽出し、
前記変換部は、
前記第2抽出部により抽出された入力非容易部分の表現から遠ざけるように、前記提供コンテンツの表現を変換する
ことを特徴とする請求項7に記載の変換装置。 The second extractor is
extracting a portion of the input content that is presumed to be difficult to input as a non-easy-to-input portion, based on the manner in which the input content is input;
The conversion unit
8. The conversion device according to claim 7 , wherein the expression of the provided content is converted so as to move away from the expression of the difficult-to-input portion extracted by the second extraction unit.
前記提供コンテンツのうち、前記第2抽出部により抽出された入力非容易部分と表現が類似する部分を特定し、特定した部分の表現を変換する
ことを特徴とする請求項8に記載の変換装置。 The conversion unit
9. The conversion device according to claim 8 , wherein a part whose expression is similar to the hard-to-input part extracted by the second extraction unit is specified in the provided content, and the expression of the specified part is converted. .
提供コンテンツの提供先となる利用者と関連性を有する関連コンテンツとして、当該利用者が視聴した視聴コンテンツを特定する特定工程と、
前記利用者が前記視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易であると推定されるコンテンツを容易コンテンツとして抽出し、当該視聴コンテンツのうち視聴が非容易であると推定されるコンテンツを非容易コンテンツとして抽出する第1抽出工程と、
前記容易コンテンツに基づいて、コンテンツが入力された場合に、容易コンテンツとの類似度を出力するように学習が行われた容易言語モデルを生成し、前記非容易コンテンツに基づいて、コンテンツが入力された場合に、当該コンテンツのうち前記利用者の視聴が非容易と推定される非容易部分を出力するよう学習が行われた非容易言語モデルを生成するする生成工程と、
前記非容易言語モデルを用いて、前記提供コンテンツから非容易部分を抽出し、当該非容易部分の表現を変換した複数の候補のうち、前記容易言語モデルにより出力された類似度が最も高い候補を用いて当該非容易部分の表現を変換する変換工程と
を含むことを特徴とする変換方法。 A conversion method executed by a conversion device,
an identifying step of identifying viewing content viewed by the user as related content related to the user to whom the provided content is provided;
Based on the manner in which the user views the viewing content, content that is estimated to be easy to view is extracted as easy content from the viewing content, and viewing is difficult from the viewing content. a first extracting step of extracting content estimated to be as non-easy content;
generating an easy language model trained to output a degree of similarity with easy content when content is input based on the easy content; a generation step of generating a difficult language model that has been trained to output a difficult part of the content that is estimated to be difficult for the user to view when the content is viewed;
Using the difficult language model, a difficult part is extracted from the provided content, and among a plurality of candidates obtained by converting the expression of the difficult part, a candidate with the highest similarity output by the easy language model is selected. a conversion step of converting the representation of the difficult part using :
前記利用者が前記視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易であると推定されるコンテンツを容易コンテンツとして抽出し、当該視聴コンテンツのうち視聴が非容易であると推定されるコンテンツを非容易コンテンツとして抽出する第1抽出手順と、
前記容易コンテンツに基づいて、コンテンツが入力された場合に、容易コンテンツとの類似度を出力するように学習が行われた容易言語モデルを生成し、前記非容易コンテンツに基づいて、コンテンツが入力された場合に、当該コンテンツのうち前記利用者の視聴が非容易と推定される非容易部分を出力するよう学習が行われた非容易言語モデルを生成するする生成手順と、
前記非容易言語モデルを用いて、前記提供コンテンツから非容易部分を抽出し、当該非容易部分の表現を変換した複数の候補のうち、前記容易言語モデルにより出力された類似度が最も高い候補を用いて当該非容易部分の表現を変換する変換手順と
をコンピュータに実行させるための変換プログラム。 an identification procedure for identifying the viewing content viewed by the user as related content related to the user to whom the provided content is provided;
Based on the manner in which the user views the viewing content, content that is estimated to be easy to view is extracted as easy content from the viewing content, and viewing is difficult from the viewing content. a first extraction procedure for extracting content estimated to be as non-easy content;
generating an easy language model trained to output a degree of similarity with easy content when content is input based on the easy content; a generation procedure for generating a difficult language model that has been trained to output a difficult part of the content that is estimated to be difficult for the user to view, when
Using the difficult language model, a difficult part is extracted from the provided content, and among a plurality of candidates obtained by converting the expression of the difficult part, a candidate with the highest similarity output by the easy language model is selected. A conversion program for causing a computer to execute a conversion procedure for converting the representation of the difficult part using a conversion procedure.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019082255A JP7191763B2 (en) | 2019-04-23 | 2019-04-23 | Conversion device, conversion method and conversion program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019082255A JP7191763B2 (en) | 2019-04-23 | 2019-04-23 | Conversion device, conversion method and conversion program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020181270A JP2020181270A (en) | 2020-11-05 |
JP7191763B2 true JP7191763B2 (en) | 2022-12-19 |
Family
ID=73024023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019082255A Active JP7191763B2 (en) | 2019-04-23 | 2019-04-23 | Conversion device, conversion method and conversion program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7191763B2 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011227849A (en) | 2010-04-23 | 2011-11-10 | Jvc Kenwood Corp | Text conversion device, text conversion method, program and data structure |
JP2012118773A (en) | 2010-12-01 | 2012-06-21 | Dainippon Printing Co Ltd | Electronic book browsing system, electronic book browsing method, program and storage medium |
JP2017194864A (en) | 2016-04-21 | 2017-10-26 | 株式会社Nttドコモ | Browsing support system |
JP2017215845A (en) | 2016-06-01 | 2017-12-07 | 富士通株式会社 | Reading support system, reading support program, and reading support method |
JP2018005324A (en) | 2016-06-28 | 2018-01-11 | ヤフー株式会社 | Generation apparatus, generation method, and generation program |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3813665B2 (en) * | 1996-09-04 | 2006-08-23 | 松下電器産業株式会社 | Document display device |
US7207003B1 (en) * | 2000-08-31 | 2007-04-17 | International Business Machines Corporation | Method and apparatus in a data processing system for word based render browser for skimming or speed reading web pages |
-
2019
- 2019-04-23 JP JP2019082255A patent/JP7191763B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011227849A (en) | 2010-04-23 | 2011-11-10 | Jvc Kenwood Corp | Text conversion device, text conversion method, program and data structure |
JP2012118773A (en) | 2010-12-01 | 2012-06-21 | Dainippon Printing Co Ltd | Electronic book browsing system, electronic book browsing method, program and storage medium |
JP2017194864A (en) | 2016-04-21 | 2017-10-26 | 株式会社Nttドコモ | Browsing support system |
JP2017215845A (en) | 2016-06-01 | 2017-12-07 | 富士通株式会社 | Reading support system, reading support program, and reading support method |
JP2018005324A (en) | 2016-06-28 | 2018-01-11 | ヤフー株式会社 | Generation apparatus, generation method, and generation program |
Also Published As
Publication number | Publication date |
---|---|
JP2020181270A (en) | 2020-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2018226402B2 (en) | Method to generate summaries tuned to a target vocabulary | |
US10733197B2 (en) | Method and apparatus for providing information based on artificial intelligence | |
KR102223727B1 (en) | Systems and methods for providing content selection | |
Amplayo et al. | Incorporating product description to sentiment topic models for improved aspect-based sentiment analysis | |
US20140280513A1 (en) | Pro-buffering proxy for seamless media object navigation | |
JP6745384B2 (en) | Method and apparatus for pushing information | |
US20150100524A1 (en) | Smart selection of text spans | |
KR102355212B1 (en) | Browsing images via mined hyperlinked text snippets | |
US11900046B2 (en) | Intelligent feature identification and presentation | |
US20210073255A1 (en) | Analyzing the tone of textual data | |
CN111414561B (en) | Method and device for presenting information | |
Arumugam et al. | Hands-On Natural Language Processing with Python: A practical guide to applying deep learning architectures to your NLP applications | |
US20220121668A1 (en) | Method for recommending document, electronic device and storage medium | |
WO2023108993A1 (en) | Product recommendation method, apparatus and device based on deep clustering algorithm, and medium | |
CN109325223A (en) | Article recommended method, device and electronic equipment | |
KR102193228B1 (en) | Apparatus for evaluating non-financial information based on deep learning and method thereof | |
JP2020173779A (en) | Identifying sequence of headings in document | |
US20230401250A1 (en) | Systems and methods for generating interactable elements in text strings relating to media assets | |
CN110807097A (en) | Method and device for analyzing data | |
JP6224682B2 (en) | Information display program, information display device, information display method, and distribution device | |
JP7191763B2 (en) | Conversion device, conversion method and conversion program | |
WO2023020160A1 (en) | Recommendation method and apparatus, training method and apparatus, device, and recommendation system | |
US11768867B2 (en) | Systems and methods for generating interactable elements in text strings relating to media assets | |
JP6158903B2 (en) | Information display program, information display device, information display method, and distribution device | |
US20230351091A1 (en) | Presenting Intelligently Suggested Content Enhancements |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210916 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220722 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7191763 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |