JP7191763B2 - Conversion device, conversion method and conversion program - Google Patents

Conversion device, conversion method and conversion program Download PDF

Info

Publication number
JP7191763B2
JP7191763B2 JP2019082255A JP2019082255A JP7191763B2 JP 7191763 B2 JP7191763 B2 JP 7191763B2 JP 2019082255 A JP2019082255 A JP 2019082255A JP 2019082255 A JP2019082255 A JP 2019082255A JP 7191763 B2 JP7191763 B2 JP 7191763B2
Authority
JP
Japan
Prior art keywords
content
input
easy
difficult
viewing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019082255A
Other languages
Japanese (ja)
Other versions
JP2020181270A (en
Inventor
健 小林
隼人 小林
一真 村尾
毅司 増山
太一 谷塚
立 日暮
義宗 田渕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2019082255A priority Critical patent/JP7191763B2/en
Publication of JP2020181270A publication Critical patent/JP2020181270A/en
Application granted granted Critical
Publication of JP7191763B2 publication Critical patent/JP7191763B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、変換装置、変換方法及び変換プログラムに関する。 The present invention relates to a conversion device, a conversion method and a conversion program.

近年、言語モデルを用いて言語処理を行う技術が知られている。このような技術の一例として、複数の言語モデルから、利用者の発話テキストに対し最適な言語モデルを選択する技術が知られている。 In recent years, techniques for performing language processing using language models have been known. As an example of such technology, there is known a technology for selecting the optimal language model for a user's uttered text from among a plurality of language models.

特開2018-173846号公報JP 2018-173846 A 特開2018-55670号公報JP 2018-55670 A

しかしながら、上述した従来技術では、利用者に対し適切な表現のコンテンツを提供できるとは限らない。 However, with the above-described conventional technology, it is not always possible to provide content with appropriate expressions to users.

例えば、上述した従来技術では、ユーザからの発話テキストに対して、当該ユーザのユ-ザ属性に対応付けられた付随属性に基づく言語モデルを適用する言語処理や、原文から類似文を生成する際、類似文として採用できる採択文と採用できない棄却文との識別を行うに過ぎない。したがって、上述した従来技術では、利用者に対し適切な表現のコンテンツを提供できるとは限らない。 For example, in the above-described conventional technology, language processing that applies a language model based on accompanying attributes associated with the user's user attributes to the uttered text from the user, and when generating a similar sentence from the original text , it merely distinguishes between accepted sentences that can be adopted as similar sentences and rejected sentences that cannot be adopted. Therefore, with the above-described conventional technology, it is not always possible to provide the user with appropriate content.

本願は、上記に鑑みてなされたものであって、利用者に対し適切な表現のコンテンツを提供することを目的とする。 The present application has been made in view of the above, and aims to provide users with content with appropriate expressions.

本願に係る変換装置は、提供コンテンツの提供先となる利用者と関連性を有する関連コンテンツを特定する特定部と、前記特定部により特定された関連コンテンツの表現に基づいて、前記提供コンテンツの表現を変換する変換部とを有することを特徴とする。 A conversion device according to the present application includes a specifying unit that specifies related content that is related to a user to whom the provided content is provided, and an expression of the provided content based on the expression of the related content that is specified by the specifying unit. and a conversion unit that converts the

実施形態の一態様によれば、利用者に対し適切な表現のコンテンツを提供することができるという効果を奏する。 According to one aspect of the embodiment, there is an effect that it is possible to provide the user with content with appropriate expressions.

図1は、実施形態に係る変換処理の一例を示す図である。FIG. 1 is a diagram illustrating an example of conversion processing according to an embodiment. 図2は、実施形態に係る統合言語モデルの学習処理の一例を示す図である。FIG. 2 is a diagram illustrating an example of integrated language model learning processing according to the embodiment. 図3は、実施形態に係る変換システムの構成例を示す図である。FIG. 3 is a diagram illustrating a configuration example of a conversion system according to the embodiment; 図4は、実施形態に係る変換装置の構成例を示す図である。FIG. 4 is a diagram illustrating a configuration example of a conversion device according to the embodiment; 図5は、実施形態に係る関連コンテンツ記憶部の一例を示す図である。5 is a diagram illustrating an example of a related content storage unit according to the embodiment; FIG. 図6は、実施形態に係る変換処理の手順の一例を示すフローチャートである。FIG. 6 is a flowchart illustrating an example of a procedure of conversion processing according to the embodiment. 図7は、変換装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。FIG. 7 is a hardware configuration diagram showing an example of a computer that implements the functions of the conversion device.

以下に本願に係る変換装置、変換方法及び変換プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る変換装置、変換方法及び変換プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Embodiments for implementing the conversion device, conversion method, and conversion program according to the present application (hereinafter referred to as "embodiments") will be described in detail below with reference to the drawings. Note that the conversion device, conversion method, and conversion program according to the present application are not limited to this embodiment. Also, in each of the following embodiments, the same parts are denoted by the same reference numerals, and overlapping descriptions are omitted.

〔1.実施形態〕
図1を用いて、本実施形態の変換装置等により実現される変換処理を説明する。図1は、実施形態に係る変換処理の一例を示す図である。図1に示す例において、変換システム1は、端末装置10、視聴コンテンツサーバ20、入力コンテンツサーバ30及び変換装置100を有する。端末装置10と、視聴コンテンツサーバ20と、入力コンテンツサーバ30と、変換装置100とは、図示しない所定の通信網を介して、有線又は無線により通信可能に接続される。なお、図1に示す変換システム1は、複数台の端末装置10や、複数台の視聴コンテンツサーバ20、複数台の入力コンテンツサーバ30、複数台の変換装置100が含まれてもよい。
[1. embodiment]
The conversion processing realized by the conversion device and the like of this embodiment will be described with reference to FIG. FIG. 1 is a diagram illustrating an example of conversion processing according to an embodiment. In the example shown in FIG. 1, the conversion system 1 has a terminal device 10, a viewing content server 20, an input content server 30, and a conversion device 100. FIG. The terminal device 10, the viewing content server 20, the input content server 30, and the conversion device 100 are communicably connected by wire or wirelessly via a predetermined communication network (not shown). Note that the conversion system 1 shown in FIG. 1 may include a plurality of terminal devices 10, a plurality of viewing content servers 20, a plurality of input content servers 30, and a plurality of conversion devices 100. FIG.

図1に示す端末装置10は、利用者によって利用される情報処理装置である。例えば、端末装置10は、デスクトップ型PC(Personal Computer)や、ノート型PCや、タブレット端末や、携帯電話機や、PDA(Personal Digital Assistant)等である。なお、図1に示す例において、端末装置10は、利用者によって利用されるスマートフォンやタブレット等のスマートデバイスである場合を示す。また、図1に示す例において、端末装置10は、液晶ディスプレイ等の出力部(以下、画面と記載する場合がある)を有し、タッチパネルが採用されているものとする。すなわち、利用者は、指や専用ペンで出力部の表示面をタッチすることにより端末装置10の各種操作を行う。 A terminal device 10 shown in FIG. 1 is an information processing device used by a user. For example, the terminal device 10 is a desktop PC (Personal Computer), a notebook PC, a tablet terminal, a mobile phone, a PDA (Personal Digital Assistant), or the like. In the example shown in FIG. 1, the terminal device 10 is a smart device such as a smart phone or a tablet used by the user. In the example shown in FIG. 1, the terminal device 10 has an output unit such as a liquid crystal display (hereinafter sometimes referred to as a screen) and adopts a touch panel. That is, the user performs various operations of the terminal device 10 by touching the display surface of the output unit with a finger or a dedicated pen.

図1に示す視聴コンテンツサーバ20は、利用者が視聴する視聴コンテンツを端末装置10に提供するサーバ装置である。また、視聴コンテンツサーバ20は、利用者が視聴した視聴コンテンツに関する視聴履歴を管理する。 The viewing content server 20 shown in FIG. 1 is a server device that provides the terminal device 10 with viewing content viewed by the user. The viewing content server 20 also manages the viewing history of viewing content viewed by the user.

図1に示す入力コンテンツサーバ30は、端末装置10に各種コンテンツを提供し、利用者が各種コンテンツにおいて入力(投稿)した文字列に関する入力コンテンツを受け付けるサーバ装置である。また、入力コンテンツサーバ30は、利用者が入力した入力コンテンツに関する投稿情報を管理する。 The input content server 30 shown in FIG. 1 is a server device that provides various contents to the terminal device 10 and receives input contents related to character strings input (posted) by users in various contents. The input content server 30 also manages posted information about input content input by the user.

図1に示す変換装置100は、端末装置10に各種コンテンツ(以下、変換装置100が端末装置10に提供するコンテンツを「提供コンテンツ」と記載する場合がある)を提供するサーバ装置である。また、図1の例において、変換装置100は、利用者が視聴した視聴コンテンツに関する視聴履歴や、利用者が入力した入力コンテンツに関する投稿履歴を取得し、利用者と関連性を有する関連コンテンツに関する情報として関連コンテンツ記憶部に格納する。そして、変換装置100は、関連コンテンツ記憶部に格納した情報に基づいて生成したモデルを用いて提供コンテンツの表現を変換し、端末装置10に提供する。また、図1の例において、変換装置100は、階層構造を有する概念を体系的にまとめたシソーラスの情報を記憶部に格納する。 The conversion device 100 shown in FIG. 1 is a server device that provides various contents to the terminal device 10 (hereinafter, content provided to the terminal device 10 by the conversion device 100 may be referred to as "provided content"). In the example of FIG. 1, the conversion device 100 acquires a viewing history of viewing content viewed by the user and a posting history of input content input by the user, and acquires information related to related content related to the user. , and stored in the related content storage unit. Then, the conversion device 100 converts the expression of the content to be provided using a model generated based on the information stored in the related content storage unit, and provides the content to the terminal device 10 . In the example of FIG. 1, the conversion device 100 stores thesaurus information in which concepts having a hierarchical structure are systematically summarized in the storage unit.

なお、視聴コンテンツサーバ20、入力コンテンツサーバ30及び変換装置100が端末装置10に提供するコンテンツは、例えば、ポータルサイト、ニュースサイト、オークションサイト、天気予報サイト、ショッピング(電子商取引)サイト、ファイナンス(株価)サイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、SNS(Social Networking Service)サイト、ウェブブログなどに関するコンテンツであってもよい。また、視聴コンテンツサーバ20、入力コンテンツサーバ30及び変換装置100が提供するコンテンツは、例えば、端末装置10にインストールされた各種アプリケーション(以下、「アプリ」と記載する場合がある)に関するコンテンツであってもよい。具体的には、ポータルアプリ、ニュースアプリ、オークションサイト、天気予報アプリ、ショッピングアプリ、ファイナンス(株価)アプリ、路線検索アプリ、地図提供アプリ、旅行アプリ、飲食店紹介アプリ、SNSアプリ、ブログ閲覧アプリ等に関するコンテンツであってもよい。 The content provided to the terminal device 10 by the viewing content server 20, the input content server 30, and the conversion device 100 is, for example, a portal site, a news site, an auction site, a weather forecast site, a shopping (electronic commerce) site, a finance (stock price ) site, route search site, map providing site, travel site, restaurant introduction site, SNS (Social Networking Service) site, web blog, and the like. The content provided by the viewing content server 20, the input content server 30, and the conversion device 100 is, for example, content related to various applications installed in the terminal device 10 (hereinafter sometimes referred to as "apps"). good too. Specifically, portal apps, news apps, auction sites, weather forecast apps, shopping apps, finance (stock prices) apps, route search apps, map providing apps, travel apps, restaurant introduction apps, SNS apps, blog browsing apps, etc. may be content related to

以下、図1を用いて、変換装置100が行う変換処理について説明する。なお、以下の説明では、端末装置10が利用者U1により利用される例を示す。 The conversion processing performed by the conversion device 100 will be described below with reference to FIG. Note that the following description shows an example in which the terminal device 10 is used by the user U1.

まず、端末装置10は、視聴コンテンツを表示する(ステップS11)。例えば、図1の例において、端末装置10は、利用者U1の操作に応じて視聴コンテンツを視聴コンテンツサーバ20から取得し、画面に表示する。そして、端末装置10は、利用者U1が視聴コンテンツを視聴した際の態様(以下、「視聴態様」と記載する場合がある)を視聴コンテンツサーバ20に送信する。例えば、図1の例において、端末装置10は、画面に表示された視聴コンテンツに対する利用者U1のスクロール速度に関する情報を、視聴態様として視聴コンテンツサーバ20に送信する。そして、視聴コンテンツサーバ20は、視聴態様が対応する視聴コンテンツに関連付けられた情報を視聴履歴として記憶部に格納する。 First, the terminal device 10 displays viewing content (step S11). For example, in the example of FIG. 1, the terminal device 10 acquires the viewing content from the viewing content server 20 according to the operation of the user U1, and displays it on the screen. Then, the terminal device 10 transmits to the viewing content server 20 the manner in which the viewing content is viewed by the user U1 (hereinafter sometimes referred to as “viewing manner”). For example, in the example of FIG. 1, the terminal device 10 transmits information about the scroll speed of the user U1 with respect to the viewing content displayed on the screen to the viewing content server 20 as the viewing mode. Then, the viewing content server 20 stores information associated with the viewing content corresponding to the viewing mode as a viewing history in the storage unit.

続いて、端末装置10は、入力コンテンツサーバ30から提供されたコンテンツにおいて、利用者U1が入力した入力コンテンツを入力コンテンツサーバ30に送信する(ステップS12)。例えば、図1の例において、端末装置10は、利用者U1が入力した検索クエリや、ショッピングサイト、飲食店紹介サイトなどにおいて利用者U1が入力したレビュー、ニュースサイト、SNSサイトなどにおいて利用者U1が入力したコメントを入力コンテンツとして入力コンテンツサーバ30に送信する。また、端末装置10は、利用者U1が入力コンテンツを入力した際の態様(以下、「入力態様」と記載する場合がある)を入力コンテンツサーバ30に送信する。例えば、図1の例において、端末装置10は、利用者U1が入力コンテンツを入力した速度(入力速度)に関する情報を入力態様として入力コンテンツサーバ30に送信する。そして、入力コンテンツサーバ30は、入力態様が対応する入力コンテンツに関連付けられた情報を投稿履歴として記憶部に格納する。 Subsequently, the terminal device 10 transmits the input content input by the user U1 to the input content server 30 among the content provided from the input content server 30 (step S12). For example, in the example of FIG. 1, the terminal device 10 can be used for search queries input by the user U1, reviews input by the user U1 on shopping sites, restaurant introduction sites, and the like, news sites, SNS sites, and the like. transmits the input comment to the input content server 30 as input content. In addition, the terminal device 10 transmits to the input content server 30 the manner in which the user U1 has input the input content (hereinafter sometimes referred to as “input manner”). For example, in the example of FIG. 1, the terminal device 10 transmits to the input content server 30 information about the speed at which the user U1 inputs input content (input speed) as an input mode. Then, the input content server 30 stores information associated with the input content corresponding to the input mode as a posting history in the storage unit.

続いて、変換装置100は、視聴コンテンツサーバ20から視聴履歴を収集し、利用者U1と関連性を有する関連コンテンツを特定する(ステップS13)。例えば、図1の例において、変換装置100は、利用者U1が視聴した視聴コンテンツを関連コンテンツとして特定し、対応する視聴態様と共に関連コンテンツ記憶部に格納する。 Subsequently, the conversion device 100 collects viewing histories from the viewing content server 20, and identifies related content related to the user U1 (step S13). For example, in the example of FIG. 1, the conversion device 100 identifies the viewing content viewed by the user U1 as the related content, and stores it in the related content storage unit together with the corresponding viewing mode.

続いて、変換装置100は、入力コンテンツサーバ30から投稿履歴を収集し、利用者U1と関連性を有する関連コンテンツを特定する(ステップS14)。例えば、図1の例において、変換装置100は、利用者U1が入力した入力コンテンツを関連コンテンツとして特定し、対応する入力態様と共に関連コンテンツ記憶部に格納する。 Subsequently, the conversion device 100 collects posting histories from the input content server 30, and identifies related content related to the user U1 (step S14). For example, in the example of FIG. 1, the conversion device 100 identifies the input content input by the user U1 as the related content, and stores it in the related content storage unit together with the corresponding input mode.

続いて、変換装置100は、関連コンテンツの容易部分と、非容易部分とを抽出し、容易部分を学習した容易言語モデルと、非容易部分を学習した非容易言語モデルとを生成する(ステップS15)。ここで、視聴コンテンツのうち、利用者のスクロール速度が速い部分は、利用者が理解に時間を要さない部分(例えば、利用者が日常的に接している単語や文体等で表現された部分)であり、利用者にとって視聴が容易な部分であると想定される。一方、視聴コンテンツのうち、利用者のスクロール速度が遅い部分は、利用者が理解に時間を要する部分(例えば、利用者が不慣れな単語や文体等で表現された部分)であり、利用者にとって視聴が非容易な部分であると想定される。したがって、図1の例において、変換装置100は、関連コンテンツが視聴コンテンツである場合、関連コンテンツのうち、利用者U1のスクロール速度が所定の閾値以上である部分を、利用者U1の視聴が容易と推定される容易部分として抽出する。そして、変換装置100は、利用者U1のスクロール速度が所定の閾値以下である部分を、利用者U1の視聴が非容易と推定される非容易部分として抽出する。 Subsequently, the conversion device 100 extracts the easy part and the difficult part of the related content, and generates an easy language model trained on the easy part and a difficult language model trained on the difficult part (step S15). ). Here, the part of the viewing content that the user scrolls at a high speed is the part that does not require time for the user to understand (for example, the part that is expressed in words or writing styles that the user encounters on a daily basis). ), which is assumed to be easy for users to view. On the other hand, the part of the viewing content that the user scrolls slowly is the part that takes time for the user to understand (for example, the part expressed with unfamiliar words or writing style). It is assumed that viewing is a non-easy part. Therefore, in the example of FIG. 1, when the related content is viewing content, the conversion device 100 selects a portion of the related content for which the user U1's scrolling speed is equal to or higher than a predetermined threshold so that the user U1 can easily view the portion of the related content. is extracted as an easy part estimated to be Then, the conversion device 100 extracts a portion where the user U1's scrolling speed is equal to or less than a predetermined threshold as a difficult portion that is estimated to be difficult for the user U1 to view.

また、入力コンテンツのうち、利用者の入力速度が速い部分は、利用者が日常的に接している単語や文体等で表現した部分であり、利用者の視聴が容易な部分であると想定される。一方、入力コンテンツのうち、利用者の入力速度が遅い部分は、利用者が不慣れな単語や文体等で表現した部分であり、利用者にとって視聴が非容易な部分であると想定される。したがって、図1の例において、変換装置100は、関連コンテンツが入力コンテンツである場合、関連コンテンツのうち、利用者U1の入力速度が所定の閾値以上である部分を、利用者U1の入力が容易(言い換えると、利用者U1の視聴が容易)と推定される容易部分として抽出する。そして、変換装置100は、利用者U1の入力速度が所定の閾値以下である部分を、利用者U1の入力が非容易(言い換えると、利用者U1の視聴が非容易)と推定される非容易部分として抽出する。 In addition, it is assumed that the part of the input content that the user inputs at a high speed is the part that is expressed by the words and writing styles that the user encounters on a daily basis, and that it is easy for the user to view. be. On the other hand, portions of the input content for which the user's input speed is slow are portions expressed by unfamiliar words, style of writing, etc., and are assumed to be portions that are difficult for the user to view. Therefore, in the example of FIG. 1, when the related content is the input content, the conversion device 100 converts the portion of the related content where the user U1's input speed is greater than or equal to a predetermined threshold value to a portion that the user U1 can easily input. (In other words, it is easy for the user U1 to view) is extracted as an easy portion. Then, the conversion device 100 converts the part where the input speed of the user U1 is equal to or less than a predetermined threshold value to a non-easy input that is estimated to be difficult for the user U1 (in other words, difficult for the user U1 to view). Extract as part.

そして、変換装置100は、抽出した容易部分及び非容易部分に含まれる文字列に基づいて、容易言語モデル及び非容易言語モデルを生成する。例えば、図1の例において、変換装置100は、容易部分から形態素解析等の技術により抽出した単語や文章を、w2v(word2vec)やs2v(sentence2vec)等によりベクトル(多次元量)に変換し、当該ベクトルに基づいて学習が行われた容易言語モデルを生成する。また、変換装置100は、非容易部分から抽出した単語や文章をベクトルに変換し、当該ベクトルに基づいて学習が行われた非容易言語モデルを生成する。 Then, the conversion device 100 generates an easy language model and a non-easy language model based on the character strings included in the extracted easy part and non-easy part. For example, in the example of FIG. 1, the conversion device 100 converts words and sentences extracted from easy parts by techniques such as morphological analysis into vectors (multidimensional quantities) using w2v (word2vec), s2v (sentence2vec), etc. An easy language model trained based on the vectors is generated. The conversion device 100 also converts the words and sentences extracted from the difficult part into vectors, and generates a difficult language model trained based on the vectors.

なお、図1の例において、容易言語モデルは、単語や文章が入力された場合に、関連コンテンツの容易部分から抽出した単語や文章群との類似度を示すスコアを出力するように学習が行われているものとする。例えば、図1の例において、容易言語モデルは、入力された単語や文章をベクトルに変換し、関連コンテンツの容易部分から抽出した単語や文章群に対応するベクトルとのベクトル空間上におけるユークリッド距離に応じて、スコアを出力する。 In the example of FIG. 1, the easy language model is learned so that when a word or sentence is input, a score indicating the degree of similarity to the word or sentence group extracted from the easy part of the related content is output. It is assumed that For example, in the example of FIG. 1, the easy language model converts the input words and sentences into vectors, and the Euclidean distance on the vector space between the vectors corresponding to the words and sentences extracted from the easy part of the related content. Output the score accordingly.

また、図1の例において、非容易言語モデルは、変換装置100が利用者U1に提供する提供コンテンツが入力された場合に、当該提供コンテンツのうち利用者U1の視聴が非容易と推定される非容易部分を出力するよう学習が行われているものとする。例えば、図1の例において、非容易言語モデルは、提供コンテンツのうち、関連コンテンツの非容易部分と類似する部分を非容易部分として出力する。具体的には、非容易言語モデルは、形態素解析等の技術により提供コンテンツから抽出した単語や文章をベクトルに変換し、関連コンテンツの非容易部分から抽出した単語や文章群に対応するベクトルとのベクトル空間上におけるユークリッド距離が所定の閾値以下(すなわち、関連コンテンツの非容易部分から抽出した単語や文章群との類似度が所定の閾値以上)である単語や文章が含まれる部分を、提供コンテンツの非容易部分として出力する。 In addition, in the example of FIG. 1, the difficult language model is estimated to be difficult for the user U1 to view when provided content provided by the conversion device 100 to the user U1 is input. It is assumed that learning is performed so as to output the difficult part. For example, in the example of FIG. 1, the difficult language model outputs portions of the provided content that are similar to the difficult portions of the related content as difficult portions. Specifically, the difficult language model converts the words and sentences extracted from the provided content into vectors using techniques such as morphological analysis, and compares them with the vectors corresponding to the words and sentences extracted from the difficult part of the related content. Provided Content output as the non-easy part of

なお、容易言語モデル及び非容易言語モデルの学習には、例えば、RNN(Recurrent Neural Network)やLSTM(Long short-term memory)等の各種ニューラルネットワークを用いた公知技術が採用可能である。 For learning the easy language model and the hard language model, for example, known techniques using various neural networks such as RNN (Recurrent Neural Network) and LSTM (Long short-term memory) can be adopted.

続いて、変換装置100は、端末装置10から提供コンテンツの提供要求を受け付ける(ステップS16)。続いて、変換装置100は、非容易言語モデルを用いて、提供要求に対応する提供コンテンツから非容易部分を抽出する(ステップS17)。例えば、図1の例において、変換装置100は、形態素解析等の技術により提供コンテンツから抽出した単語や文章を非容易言語モデルに入力し、提供コンテンツのうち利用者U1の視聴が非容易と推定される非容易部分を抽出する。 Subsequently, the conversion device 100 receives a request for providing content to be provided from the terminal device 10 (step S16). Subsequently, the conversion device 100 uses the difficult language model to extract a difficult part from the provided content corresponding to the provision request (step S17). For example, in the example of FIG. 1, the conversion device 100 inputs words and sentences extracted from the provided content by techniques such as morphological analysis into the difficult language model, and presumes that viewing of the provided content is difficult for the user U1. Extract the non-easy parts that are

続いて、変換装置100は、シソーラス及び容易言語モデルを用いて、提供コンテンツの非容易部分に含まれる表現を変換する(ステップS18)。例えば、図1の例において、変換装置100は、シソーラスを用いて、提供コンテンツの非容易部分から抽出した単語や文章の同義語や類似語を候補として抽出する。そして、変換装置100は、抽出した候補のうち、容易言語モデルにより出力したスコアが最も高い候補(「候補#2」)を用いて、提供コンテンツの非容易部分の表現を変換する。 Subsequently, the conversion device 100 uses the thesaurus and the easy language model to convert expressions included in the difficult part of the provided content (step S18). For example, in the example of FIG. 1, the conversion device 100 uses a thesaurus to extract, as candidates, synonyms and similar words for words and sentences extracted from the difficult part of the provided content. Then, the conversion device 100 converts the expression of the difficult part of the provided content using the candidate with the highest score output by the easy language model (“candidate #2”) among the extracted candidates.

続いて、変換装置100は、変換後の提供コンテンツを端末装置10に提供する(ステップS19)。 Subsequently, the conversion device 100 provides the converted provided content to the terminal device 10 (step S19).

なお、図1の例では、容易言語モデル及び非容易言語モデルを生成し、変換処理に用いる例を示したが、変換処理に用いるモデルはこのような例に限定されない。例えば、変換装置100は、容易言語モデル及び非容易言語モデルを統合した統合言語モデルを生成し、学習を行ってもよい。ここで、図2を用いて、統合言語モデルの学習処理について説明する。図2は、実施形態に係る統合言語モデルの学習処理の一例を示す図である。 Although the example of FIG. 1 shows an example in which an easy language model and a hard language model are generated and used for conversion processing, models used for conversion processing are not limited to such examples. For example, the conversion device 100 may generate an integrated language model that integrates the easy language model and the difficult language model, and perform learning. Here, the integrated language model learning process will be described with reference to FIG. FIG. 2 is a diagram illustrating an example of integrated language model learning processing according to the embodiment.

図2に示すように、変換装置100は、単語や文章が入力された場合に同義語や類似語を出力する統合言語モデルにおいて、入力した単語や文章の表現(以下、「入力表現」と記載する場合がある)の意図と、出力した同義語や類似語の表現(以下、「出力表現」と記載する場合がある)の意図とが類似するように統合言語モデルの学習を行う。例えば、変換装置100は、w2vやs2v等により、入力した単語や文章を変換したベクトルと、出力した同義語や類似語を変換したベクトルとが、ベクトル空間上におけるユークリッド距離が所定の閾値以内となるように学習を行う。 As shown in FIG. 2, the conversion device 100 uses an integrated language model that outputs synonyms and similar words when words and sentences are input, and expresses the input words and sentences (hereinafter referred to as “input expressions”). The integrated language model is trained so that the intention of the output synonyms and similar words (hereinafter sometimes referred to as "output expression") is similar to the intention of the output. For example, the conversion device 100 uses w2v, s2v, or the like to determine whether the Euclidean distance between a vector obtained by converting an input word or sentence and a vector obtained by converting an output synonym or similar word is within a predetermined threshold in the vector space. learn to become

また、図2の例において、変換装置100は、関連コンテンツから抽出した容易部分の表現(以下、「容易表現」と記載する場合がある)及び出力表現の類似度が向上し、関連コンテンツから抽出した非容易部分の表現(以下、「非容易表現」と記載する場合がある)及び出力表現の類似度が低下するように統合言語モデルの学習を行う。例えば、変換装置100は、w2vやs2v等により、入力した単語や文章を変換したベクトルと、容易部分又は非容易部分に含まれる文字列を変換したベクトルとのベクトル空間上におけるユークリッド距離に応じた類似度に基づき、統合言語モデルの学習を行う。 In addition, in the example of FIG. 2, the conversion device 100 improves the similarity of the expression of the easy part extracted from the related content (hereinafter sometimes referred to as "easy expression") and the output expression, The integrated language model is trained so that the similarity between the expression of the difficult part (hereinafter sometimes referred to as "difficult expression") and the output expression is reduced. For example, the conversion device 100 uses w2v, s2v, or the like to convert a vector obtained by converting an input word or sentence, and a vector obtained by converting a character string included in an easy part or a non-easy part according to the Euclidean distance on the vector space. The integrated language model is trained based on the similarity.

このようにして、実施形態に係る変換装置100は、利用者のコンテンツの利用履歴に基づいて、当該利用者に提供するコンテンツの表現を変換する。 In this manner, the conversion device 100 according to the embodiment converts the representation of content to be provided to the user based on the content usage history of the user.

利用者が言葉に対して感じる難しさは利用者の世代や経験によって大きく異なるため、コンテンツを利用者に合わせて平易化することは重要である。従来の技術では、特定の軸で非容易と定義した語を容易と定義された語に機械的に変換する手法が用いられるが、この手法では世代や経験の差が考慮されず、利用者にとって平易とは限らない。 Since the difficulty users feel with words varies greatly depending on the generation and experience of the users, it is important to simplify the contents according to the users. Conventional technology uses a method that mechanically converts words defined as difficult on a specific axis into terms that are defined as easy, but this method does not take into account differences in generations and experience, and is It's not always easy.

これに対し、実施形態に係る変換装置100は、利用者のコンテンツの利用履歴に基づいて、利用者に提供するコンテンツのうち、利用者の視聴が非容易と推定される部分を容易な表現に変換する。すなわち、実施形態に係る変換装置100は、利用者に対し適切な表現のコンテンツを提供することができる。 On the other hand, the conversion device 100 according to the embodiment converts a portion of the content to be provided to the user, which is estimated to be difficult for the user to view, into a simple expression based on the content usage history of the user. Convert. In other words, the conversion device 100 according to the embodiment can provide the user with content with appropriate expressions.

〔2.変換システムの構成〕
次に、上述した表示処理を実現するための変換システム1ついて図3を用いて説明する。図3は、実施形態に係る変換システムの構成例を示す図である。図3に示すように、変換システム1は、端末装置10と、視聴コンテンツサーバ20と、入力コンテンツサーバ30と、変換装置100とを含む。端末装置10、視聴コンテンツサーバ20、入力コンテンツサーバ30及び変換装置100は、ネットワークNを介して有線または無線により通信可能に接続される。なお、ネットワークNは、LAN(Local Area Network)、WAN(Wide Area Network)、電話網(携帯電話網、固定電話網等)、地域IP(Internet Protocol)網、インターネット等の通信ネットワークである。ネットワークNには、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。また、図2に示す変換システム1には、複数台の端末装置10や、複数台の視聴コンテンツサーバ20、複数台の入力コンテンツサーバ30、複数台の変換装置100が含まれてもよい。
[2. Configuration of conversion system]
Next, the conversion system 1 for realizing the display processing described above will be described with reference to FIG. FIG. 3 is a diagram illustrating a configuration example of a conversion system according to the embodiment; As shown in FIG. 3 , the conversion system 1 includes a terminal device 10 , a viewing content server 20 , an input content server 30 and a conversion device 100 . The terminal device 10, the viewing content server 20, the input content server 30, and the conversion device 100 are connected via a network N so as to be communicable by wire or wirelessly. The network N is a communication network such as a LAN (Local Area Network), a WAN (Wide Area Network), a telephone network (mobile telephone network, fixed telephone network, etc.), a local IP (Internet Protocol) network, or the Internet. The network N may include wired networks or wireless networks. Further, the conversion system 1 shown in FIG. 2 may include a plurality of terminal devices 10, a plurality of viewing content servers 20, a plurality of input content servers 30, and a plurality of conversion devices 100. FIG.

端末装置10は、利用者によって利用される情報処理装置である。端末装置10は、視聴コンテンツサーバ20、入力コンテンツサーバ30及び変換装置100によって提供される情報を、ウェブブラウザやアプリケーションにより表示する。また、端末装置10は、視聴コンテンツサーバ20、入力コンテンツサーバ30及び変換装置100によって提供される情報の表示処理を実現する制御情報を視聴コンテンツサーバ20、入力コンテンツサーバ30及び変換装置100から受け取った場合には、制御情報に従って表示処理を実現する。また、端末装置10は、利用者が視聴コンテンツを視聴した際の態様(視聴態様)を視聴コンテンツサーバ20に送信する。また、入力コンテンツサーバ30から提供されたコンテンツにおいて利用者が入力した入力コンテンツと、利用者が当該入力コンテンツを入力した際の態様(入力態様)を入力コンテンツサーバ30に送信する。 The terminal device 10 is an information processing device used by a user. The terminal device 10 displays information provided by the viewing content server 20, the input content server 30, and the conversion device 100 using a web browser or an application. Further, the terminal device 10 receives control information for realizing display processing of information provided by the viewing content server 20, the input content server 30 and the conversion device 100 from the viewing content server 20, the input content server 30 and the conversion device 100. In this case, the display processing is implemented according to the control information. In addition, the terminal device 10 transmits to the viewing content server 20 the mode (viewing mode) in which the user views the viewing content. In addition, it transmits to the input content server 30 the input content input by the user in the content provided from the input content server 30 and the mode (input mode) when the user inputs the input content.

なお、端末装置10は、利用者が視聴した視聴コンテンツや、視聴態様に関する情報を変換装置100に送信してもよい。また、端末装置10は、利用者が入力した入力コンテンツや、入力態様に関する情報を変換装置100に送信してもよい。 Note that the terminal device 10 may transmit the viewing content viewed by the user and the viewing mode information to the conversion device 100 . In addition, the terminal device 10 may transmit input content input by the user and information on the input mode to the conversion device 100 .

視聴コンテンツサーバ20は、利用者が視聴する視聴コンテンツを端末装置10に提供するサーバ装置である。また、視聴コンテンツサーバ20は、端末装置10から送信される視聴態様を対応する視聴コンテンツに関連付けた情報を視聴履歴として記憶部に格納する。なお、視聴コンテンツサーバ20は、視聴コンテンツに関するアプリケーションのデータそのものを配信するサーバであってもよい。また、視聴コンテンツサーバ20は、端末装置10に制御情報を配信する配信装置として機能してもよい。ここで、制御情報は、例えば、JavaScript(登録商標)等のスクリプト言語やCSS(Cascading Style Sheets)等のスタイルシート言語により記述される。なお、視聴コンテンツサーバ20から配信される視聴コンテンツに関するアプリそのものを制御情報とみなしてもよい。 The viewing content server 20 is a server device that provides the terminal device 10 with viewing content viewed by the user. In addition, the viewing content server 20 stores, in the storage unit, information associating the viewing mode transmitted from the terminal device 10 with the corresponding viewing content as a viewing history. Note that the viewing content server 20 may be a server that distributes application data itself regarding viewing content. Also, the viewing content server 20 may function as a distribution device that distributes control information to the terminal device 10 . Here, the control information is described in, for example, a script language such as JavaScript (registered trademark) or a style sheet language such as CSS (Cascading Style Sheets). Note that the application itself related to the viewing content distributed from the viewing content server 20 may be regarded as the control information.

入力コンテンツサーバ30は、端末装置10に各種コンテンツを提供し、利用者が各種コンテンツにおいて入力した文字列に関する入力コンテンツを受け付けるサーバ装置である。また、入力コンテンツサーバ30は、端末装置10から送信される入力態様を対応する入力コンテンツに関連付けた情報を投稿履歴として記憶部に格納する。なお、入力コンテンツサーバ30は、コンテンツに関するアプリケーションのデータそのものを配信するサーバであってもよい。また、入力コンテンツサーバ30は、端末装置10に制御情報を配信する配信装置として機能してもよい。ここで、制御情報は、例えば、JavaScript(登録商標)等のスクリプト言語やCSS等のスタイルシート言語により記述される。なお、入力コンテンツサーバ30から配信されるコンテンツに関するアプリそのものを制御情報とみなしてもよい。 The input content server 30 is a server device that provides various contents to the terminal device 10 and receives input contents related to character strings input by the user in the various contents. In addition, the input content server 30 stores, in the storage unit, information associating the input mode transmitted from the terminal device 10 with the corresponding input content as a posting history. Note that the input content server 30 may be a server that distributes application data itself regarding content. Also, the input content server 30 may function as a distribution device that distributes control information to the terminal device 10 . Here, the control information is described in, for example, a script language such as JavaScript (registered trademark) or a style sheet language such as CSS. Note that the application itself related to the content distributed from the input content server 30 may be regarded as the control information.

変換装置100は、端末装置10に提供コンテンツを提供するサーバ装置である。変換装置100は、視聴履歴や、投稿履歴を取得し、利用者と関連性を有する関連コンテンツに関する情報として、後述する関連コンテンツ記憶部121に格納する。そして、変換装置100は、関連コンテンツ記憶部121に格納した情報に基づいて生成したモデルを用いて提供コンテンツの表現を変換し、端末装置10に提供する。また、変換装置100は、階層構造を有する概念を体系的にまとめたシソーラスの情報を記憶部に格納する。なお、変換装置100は、提供コンテンツに関するアプリケーションのデータそのものを配信するサーバであってもよい。また、変換装置100は、端末装置10に制御情報を配信する配信装置として機能してもよい。ここで、制御情報は、例えば、JavaScript(登録商標)等のスクリプト言語やCSS等のスタイルシート言語により記述される。なお、変換装置100から配信されるコンテンツに関するアプリそのものを制御情報とみなしてもよい。変換装置100の構成は後述する。 The conversion device 100 is a server device that provides provided content to the terminal device 10 . The conversion device 100 acquires a viewing history and a posting history, and stores them in the related content storage unit 121, which will be described later, as information related to related content related to the user. Then, the conversion device 100 converts the expression of the provided content using a model generated based on the information stored in the related content storage unit 121 and provides the terminal device 10 with the converted content. In addition, the conversion device 100 stores thesaurus information that systematically organizes concepts having a hierarchical structure in the storage unit. Note that the conversion device 100 may be a server that distributes the application data itself regarding the provided content. Also, the conversion device 100 may function as a distribution device that distributes control information to the terminal device 10 . Here, the control information is described in, for example, a script language such as JavaScript (registered trademark) or a style sheet language such as CSS. Note that the application itself related to the content distributed from the conversion device 100 may be regarded as the control information. The configuration of the conversion device 100 will be described later.

〔3.変換装置の構成〕
次に、図4を用いて、変換装置100の構成について説明する。図4は、実施形態に係る変換装置の構成例を示す図である。図4に示すように、変換装置100は、通信部110と、記憶部120と、制御部130とを有する。
[3. Configuration of conversion device]
Next, the configuration of the conversion device 100 will be described with reference to FIG. FIG. 4 is a diagram illustrating a configuration example of a conversion device according to the embodiment; As shown in FIG. 4, the conversion device 100 has a communication section 110, a storage section 120, and a control section .

(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線または無線で接続され、端末装置10、視聴コンテンツサーバ20、入力コンテンツサーバ30等との間で情報の送受信を行う。
(Regarding communication unit 110)
The communication unit 110 is realized by, for example, a NIC (Network Interface Card) or the like. The communication unit 110 is connected to the network N by wire or wirelessly, and transmits and receives information to and from the terminal device 10, the viewing content server 20, the input content server 30, and the like.

(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図4に示すように、記憶部120は、関連コンテンツ記憶部121と、モデル記憶部122とを有する。
(Regarding storage unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory device such as a RAM (Random Access Memory) or a flash memory, or a storage device such as a hard disk or an optical disk. As shown in FIG. 4 , storage unit 120 has related content storage unit 121 and model storage unit 122 .

(関連コンテンツ記憶部121について)
関連コンテンツ記憶部121は、利用者と関連性を有する関連コンテンツに関する情報を記憶する。ここで、図5を用いて、関連コンテンツ記憶部121が記憶する情報の一例を説明する。図5は、実施形態に係る関連コンテンツ記憶部の一例を示す図である。図5の例では、関連コンテンツ記憶部121は、「利用者ID」、「コンテンツ情報」、「態様」といった項目を有する。
(Regarding Related Content Storage Unit 121)
The related content storage unit 121 stores information related to related content related to the user. An example of information stored in the related content storage unit 121 will now be described with reference to FIG. 5 is a diagram illustrating an example of a related content storage unit according to the embodiment; FIG. In the example of FIG. 5, the related content storage unit 121 has items such as "user ID", "content information", and "mode".

「利用者ID」は、利用者を識別するための識別情報を示す。「コンテンツ情報」は、関連コンテンツに関する情報を示す。なお、図5では、「コンテンツ情報」に「コンテンツ情報#1」といった概念的な情報が格納される例を示したが、実際には、視聴コンテンツや入力コンテンツを識別するための識別情報や、視聴コンテンツや入力コンテンツに対応するテキスト情報などが格納される。 "User ID" indicates identification information for identifying a user. "Content information" indicates information about related content. Note that FIG. 5 shows an example in which conceptual information such as "content information #1" is stored in "content information". Text information and the like corresponding to viewing contents and input contents are stored.

「態様」は、利用者の視聴コンテンツに対する視聴態様や、利用者の入力コンテンツに対する入力態様に関する情報であり、「行動内容」、「操作内容」といった項目を有する。「行動内容」は、コンテンツに対する利用者の行動を示す情報を示し、視聴コンテンツを視聴したことを示す「視聴」や、入力コンテンツを入力したことを示す「入力」などといった情報が格納される。「操作内容」は、利用者が視聴コンテンツを視聴した際の操作内容(視聴態様)や、入力コンテンツを入力した際の操作内容(入力態様)を示す。なお、図5では、「操作内容」に「操作内容#1」といった概念的な情報が格納される例を示したが、実際には、視聴コンテンツの所定範囲(例えば、単語や、段落、文章、フレーズなどに基づき規定される範囲)ごとのスクロール速度や、入力コンテンツの所定範囲ごとの入力速度などといった情報が格納される。 The "mode" is information about the viewing mode of the user's viewing content and the input mode of the user's input content, and has items such as "behavior details" and "operation details". The 'activity content' indicates information indicating the behavior of the user with respect to the content, and stores information such as 'viewing' indicating that the viewing content has been viewed, and 'input' indicating that the input content has been input. The “operation content” indicates the operation content (viewing mode) when the user views the viewing content or the operation content (input mode) when inputting the input content. Note that FIG. 5 shows an example in which conceptual information such as "operation content #1" is stored in "operation content", but in reality, a predetermined range (for example, words, paragraphs, sentences, etc.) of viewing content is stored. , a range defined based on phrases, etc.), an input speed for each predetermined range of input content, and other information is stored.

すなわち、図5では、利用者ID「U1」によって識別される利用者が、「コンテンツ情報#1」に対応するコンテンツを視聴し、視聴した際の操作内容が「操作内容#1」である例を示す。 That is, in FIG. 5, the user identified by the user ID "U1" views the content corresponding to "content information #1", and the operation details at the time of viewing is "operation details #1". indicates

(モデル記憶部122について)
モデル記憶部122は、関連コンテンツが有する表現の特徴を学習させた表現モデルを格納する。例えば、図1の例において、モデル記憶部122は、容易言語モデル及び非容易言語モデルや、容易言語モデル及び非容易言語モデルを統合した統合言語モデルを格納する。なお、モデル記憶部122は、利用者ごとに生成された表現モデルを格納してもよい。また、モデル記憶部122は、利用者のサイコグラフィック属性、デモグラフィック属性、視聴履歴、投稿履歴、検索履歴等に基づき利用者を分類し、各分類に対応付けた表現モデルを格納してもよい。例えば、モデル記憶部122は、同一の分類に属する利用者に対応する関連コンテンツを学習させた表現モデルを、当該分類に対応付けて格納する。
(Regarding the model storage unit 122)
The model storage unit 122 stores an expression model that has learned the characteristics of the expression of the related content. For example, in the example of FIG. 1, the model storage unit 122 stores an easy language model, a difficult language model, and an integrated language model that integrates the easy language model and the difficult language model. Note that the model storage unit 122 may store an expression model generated for each user. In addition, the model storage unit 122 may classify users based on their psychographic attributes, demographic attributes, viewing history, posting history, search history, etc., and store expression models associated with each classification. . For example, the model storage unit 122 stores expression models that have learned related content corresponding to users belonging to the same classification, in association with the classification.

なお、モデル記憶部122は、形態素解析等の技術により関連コンテンツを解析し、生成されたシソーラスに関する情報を格納してもよい。 Note that the model storage unit 122 may store information about the generated thesaurus by analyzing the related content using techniques such as morphological analysis.

(制御部130について)
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、変換装置100内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。実施形態に係る制御部130は、図4に示すように、特定部131と、抽出部132と、生成部133と、変換部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。
(Regarding the control unit 130)
The control unit 130 is a controller. For example, various programs stored in a storage device inside the conversion device 100 are executed by a CPU (Central Processing Unit), MPU (Micro Processing Unit), etc., using the RAM as a work area. It is realized by being executed. Also, the control unit 130 is a controller, and is implemented by an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array). The control unit 130 according to the embodiment includes, as shown in FIG. Realize or carry out.

(特定部131について)
特定部131は、提供コンテンツの提供先となる利用者と関連性を有する関連コンテンツを特定する。例えば、図1の例において、特定部131は、視聴コンテンツサーバ20から視聴履歴を収集し、利用者U1と関連性を有する関連コンテンツを特定する。また、特定部131は、入力コンテンツサーバ30から投稿履歴を収集し、利用者U1と関連性を有する関連コンテンツを特定する。そして、特定部131は、特定した関連コンテンツを関連コンテンツ記憶部121に格納する。
(Regarding the identification unit 131)
The identifying unit 131 identifies related content that is related to the user to whom the provided content is provided. For example, in the example of FIG. 1, the identifying unit 131 collects viewing histories from the viewing content server 20 and identifies related content related to the user U1. Further, the specifying unit 131 collects posting histories from the input content server 30, and specifies related content that is related to the user U1. The specifying unit 131 then stores the specified related content in the related content storage unit 121 .

また、特定部131は、関連コンテンツとして、利用者が視聴した視聴コンテンツを特定してもよい。例えば、図1の例において、特定部131は、利用者U1が視聴した視聴コンテンツを関連コンテンツとして特定し、対応する視聴態様と共に関連コンテンツ記憶部121に格納する。 Further, the identifying unit 131 may identify the viewing content viewed by the user as the related content. For example, in the example of FIG. 1, the identification unit 131 identifies the viewing content viewed by the user U1 as the related content, and stores it in the related content storage unit 121 together with the corresponding viewing mode.

また、特定部131は、関連コンテンツとして、利用者が入力した入力コンテンツを特定してもよい。例えば、図1の例において、特定部131は、利用者U1が入力した入力コンテンツを関連コンテンツとして特定し、対応する入力態様と共に関連コンテンツ記憶部121に格納する。 The identifying unit 131 may also identify input content input by the user as related content. For example, in the example of FIG. 1, the identification unit 131 identifies the input content input by the user U1 as the related content, and stores it in the related content storage unit 121 together with the corresponding input mode.

(抽出部132について)
抽出部132は、利用者が視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易であると推定されるコンテンツを容易コンテンツとして抽出する。例えば、図1の例において、抽出部132は、視聴コンテンツに対する利用者U1の操作に基づき容易コンテンツを抽出する。
(Regarding the extraction unit 132)
The extraction unit 132 extracts, as easy content, content that is estimated to be easy to view from the viewing content, based on the manner in which the user views the viewing content. For example, in the example of FIG. 1, the extraction unit 132 extracts easy content based on user U1's operation on the viewing content.

また、抽出部132は、視聴に要した時間が所定の閾値を下回る視聴コンテンツを、容易コンテンツとして抽出してもよい。例えば、図1の例において、抽出部132は、端末装置10の画面に表示されてから他の画面への遷移操作が行われるまでの時間が所定の閾値以下である視聴コンテンツを、容易コンテンツとして抽出する。 Also, the extracting unit 132 may extract viewing content whose viewing time is less than a predetermined threshold as easy content. For example, in the example of FIG. 1, the extracting unit 132 selects viewing content whose time from being displayed on the screen of the terminal device 10 to performing a transition operation to another screen is equal to or less than a predetermined threshold as easy content. Extract.

また、抽出部132は、視聴中における操作の内容が所定の条件を満たす視聴コンテンツを、容易コンテンツとして抽出してもよい。例えば、図1の例において、抽出部132は、利用者U1の視聴中のスクロール速度が所定の閾値以上である視聴コンテンツを、容易コンテンツとして抽出する。 The extraction unit 132 may also extract, as easy content, viewing content that satisfies a predetermined condition for details of operations performed during viewing. For example, in the example of FIG. 1, the extraction unit 132 extracts, as easy content, viewing content whose scroll speed during viewing by the user U1 is equal to or higher than a predetermined threshold.

また、抽出部132は、視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易であると推定される部分を容易部分として抽出してもよい。例えば、図1の例において、抽出部132は、視聴コンテンツの所定範囲(例えば、単語や、段落、文章、フレーズなどに基づき規定される範囲)ごとの利用者U1のスクロール速度に基づき、スクロール速度が所定の閾値以上である範囲を、容易部分として抽出する。 Further, the extracting unit 132 may extract, as an easy part, a portion of the viewing content that is estimated to be easy to view, based on the manner in which the viewing content is viewed. For example, in the example of FIG. 1, the extraction unit 132 extracts the scroll speed is greater than or equal to a predetermined threshold is extracted as an easy portion.

また、抽出部132は、さらに、視聴コンテンツのうち視聴が容易でないと推定されるコンテンツを非容易コンテンツとして抽出してもよい。例えば、図1の例において、抽出部132は、視聴コンテンツに対する利用者U1の操作に基づき非容易コンテンツを抽出する。 Moreover, the extracting unit 132 may further extract content estimated to be not easy to view from the viewing content as non-easy content. For example, in the example of FIG. 1, the extraction unit 132 extracts difficult content based on user U1's operation on the viewing content.

また、抽出部132は、視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易でないと推定される部分を非容易部分として抽出してもよい。例えば、図1の例において、抽出部132は、視聴コンテンツの所定範囲ごとの利用者U1のスクロール速度に基づき、スクロール速度が所定の閾値以下である範囲を、非容易部分として抽出する。 Further, the extracting unit 132 may extract a portion of the viewing content that is estimated to be difficult to view as an uneasy portion based on the manner in which the viewing content is viewed. For example, in the example of FIG. 1, the extracting unit 132 extracts a range in which the scroll speed is equal to or less than a predetermined threshold value as an uneasy portion based on the scroll speed of the user U1 for each predetermined range of viewing content.

また、抽出部132は、利用者が入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易であると推定される入力容易コンテンツを抽出してもよい。例えば、図1の例において、抽出部132は、利用者U1の入力速度が所定の閾値以上である入力コンテンツを、入力容易コンテンツとして抽出する。なお、抽出部132は、例えば、入力コンテンツサーバ30からコンテンツが配信され、端末装置10が入力コンテンツを入力コンテンツサーバ30に送信するまでの時間や、中断時間、削除操作の回数などに基づく入力速度に応じて、入力容易コンテンツ抽出してもよい。 Further, the extracting unit 132 may extract easy-to-input content estimated to be easy to input from the input content based on the manner in which the user inputs the input content. For example, in the example of FIG. 1, the extracting unit 132 extracts input content whose input speed of the user U1 is equal to or higher than a predetermined threshold as easy-to-input content. Note that the extracting unit 132, for example, determines the input speed based on the time from when the content is distributed from the input content server 30 until the terminal device 10 transmits the input content to the input content server 30, the interruption time, the number of deletion operations, and the like. Easy-to-enter content may be extracted according to

また、抽出部132は、入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易と推定される部分を入力容易部分として抽出してもよい。例えば、図1の例において、抽出部132は、入力コンテンツの所定範囲(例えば、単語や、段落、文章、フレーズなどに基づき規定される範囲)ごとの利用者U1の入力速度に基づき、入力速度が所定の閾値以上である範囲を、入力容易部分として抽出する。 Further, the extracting unit 132 may extract, as an easy-to-input portion, a portion of the input content that is estimated to be easy to input, based on the manner in which the input content is input. For example, in the example of FIG. 1, the extraction unit 132 calculates the input speed based on the input speed of the user U1 for each predetermined range of input content (for example, a range defined based on words, paragraphs, sentences, phrases, etc.). is greater than or equal to a predetermined threshold is extracted as an easy-to-input portion.

また、抽出部132は、さらに、入力コンテンツのうち入力が容易でないと推定される入力非容易コンテンツを抽出してもよい。例えば、図1の例において、抽出部132は、利用者U1の入力速度が所定の閾値以下である入力コンテンツを、入力非容易コンテンツとして抽出する。 Moreover, the extraction unit 132 may further extract, from the input content, hard-to-input content estimated to be difficult to input. For example, in the example of FIG. 1, the extracting unit 132 extracts input content whose input speed of the user U1 is equal to or less than a predetermined threshold as content that is difficult to input.

また、抽出部132は、入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易でないと推定される部分を入力非容易部分として抽出してもよい。例えば、図1の例において、抽出部132は、入力コンテンツの所定範囲ごとの利用者U1の入力速度に基づき、入力速度が所定の閾値以下である範囲を、入力非容易部分として抽出する。 Further, the extracting unit 132 may extract a portion of the input content that is estimated to be difficult to input as the difficult-to-input portion, based on the manner in which the input content was input. For example, in the example of FIG. 1, the extracting unit 132 extracts ranges in which the input speed is equal to or less than a predetermined threshold as input-difficult portions, based on user U1's input speed for each predetermined range of input content.

(生成部133について)
生成部133は、特定部131により特定された関連コンテンツが有する表現の特徴を学習させた表現モデルを生成する。例えば、生成部133は、特定部131により特定された関連コンテンツをw2vやs2v等によりベクトルに変換し、当該ベクトルに基づいて学習が行われた表現モデルを生成し、モデル記憶部122に格納する。例えば、図1の例において、生成部133は、容易部分から形態素解析等の技術により抽出した単語や文章をベクトルに変換し、当該ベクトルに基づいて学習が行われた容易言語モデルであって、単語や文章が入力された場合に、関連コンテンツの容易部分から抽出した単語や文章群との類似度を示すスコアを出力する容易言語モデルを生成する。また、生成部133は、非容易部分から抽出した単語や文章をベクトルに変換し、当該ベクトルに基づいて学習が行われた非容易言語モデルであって、利用者U1に提供する提供コンテンツが入力された場合に、当該提供コンテンツのうち利用者U1の視聴が非容易と推定される非容易部分を出力する非容易言語モデルを生成する。
(Regarding the generation unit 133)
The generation unit 133 generates an expression model by learning the characteristics of the expressions of the related content identified by the identification unit 131 . For example, the generating unit 133 converts the related content identified by the identifying unit 131 into a vector using w2v, s2v, or the like, generates an expression model learned based on the vector, and stores it in the model storage unit 122. . For example, in the example of FIG. 1, the generation unit 133 converts words and sentences extracted from easy parts by techniques such as morphological analysis into vectors, and is an easy language model trained based on the vectors. When a word or sentence is input, an easy language model is generated that outputs a score indicating the degree of similarity with a group of words or sentences extracted from the easy part of the related content. In addition, the generation unit 133 converts the words and sentences extracted from the difficult part into vectors, and is a difficult language model trained based on the vector, and the provided content to be provided to the user U1 is input. Then, a difficult language model is generated that outputs a difficult part of the provided content that is estimated to be difficult for the user U1 to view.

また、生成部133は、所定のコンテンツが入力された場合に、関連コンテンツと共通する表現を有するコンテンツであって、入力されたコンテンツと意図が類似するコンテンツを出力するように、表現モデルを生成する。例えば、生成部133は、提供コンテンツが入力された場合、容易コンテンツ及び入力容易コンテンツの表現へ近づけるように表現を変換した提供コンテンツを出力し、且つ、入力された提供コンテンツと、出力された提供コンテンツとの類似度が所定の閾値以上となるよう学習された表現モデルを生成する。 In addition, the generation unit 133 generates an expression model so that, when predetermined content is input, content having a common expression with related content and having a similar intention to the input content is output. do. For example, when the provided content is input, the generation unit 133 outputs the provided content whose expression is converted so as to approach the expression of the easy content and the easy-to-input content, A representation model that has been learned such that the degree of similarity with content is equal to or greater than a predetermined threshold is generated.

なお、生成部133は、形態素解析等の技術により関連コンテンツを解析し、シソーラスに関する情報を生成してもよい。 Note that the generating unit 133 may analyze the related content using techniques such as morphological analysis and generate information about the thesaurus.

(変換部134について)
変換部134は、特定部131により特定された関連コンテンツの表現に基づいて、提供コンテンツの表現を変換する。例えば、図1の例において、変換部134は、視聴コンテンツ及び入力コンテンツを含む関連コンテンツの表現に基づいて、提供コンテンツの表現を変換する。
(Regarding the conversion unit 134)
The conversion unit 134 converts the expression of the provided content based on the expression of the related content identified by the identification unit 131 . For example, in the example of FIG. 1, the conversion unit 134 converts the presentation of the provided content based on the presentation of related content including the viewing content and the input content.

また、変換部134は、抽出部132により抽出された容易コンテンツの表現へ近づけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した視聴コンテンツのうち、利用者U1の視聴が容易と推定される視聴コンテンツに対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似するように、提供コンテンツの表現を変換する。 Further, the conversion unit 134 may convert the representation of the provided content so as to approximate the representation of the easy content extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134 converts a vector corresponding to the viewing content that is estimated to be easily viewed by the user U1 among the viewing content specified as the related content, and a vector corresponding to the provided content after conversion. Transform the representation of the provided content so that it resembles a vector.

また、変換部134は、抽出部132により抽出された容易部分の表現へ近づけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した視聴コンテンツのうち、利用者U1の視聴が容易と推定される容易部分に対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似するように、提供コンテンツの表現を変換する。 Further, the conversion unit 134 may convert the expression of the provided content so as to approximate the expression of the easy part extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134 converts a vector corresponding to an easy part that is estimated to be easily viewed by the user U1 among the viewing contents specified as related contents, and a vector corresponding to the provided content after conversion. Transform the representation of the provided content so that it resembles a vector.

また、変換部134は、さらに、抽出部132により抽出された非容易コンテンツの表現から遠ざけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した視聴コンテンツのうち、利用者U1の視聴が非容易と推定される視聴コンテンツに対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似しないように、提供コンテンツの表現を変換する。 Further, the conversion unit 134 may further convert the representation of the provided content so as to move away from the representation of the difficult content extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134 corresponds to a vector corresponding to viewing content that is estimated to be difficult for the user U1 to view, among the viewing content specified as related content, and the provided content after conversion. Transform the representation of the provided content so that it is not similar to the vector that

また、変換部134は、抽出部132により抽出された非容易部分の表現から遠ざけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した視聴コンテンツのうち、利用者U1の視聴が非容易と推定される非容易部分に対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似しないように、提供コンテンツの表現を変換する。 Further, the conversion unit 134 may convert the representation of the provided content so as to move away from the representation of the difficult part extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134 converts a vector corresponding to a difficult portion that is estimated to be difficult for the user U1 to view among the viewing content specified as the related content, and the provided content after conversion. Transform the representation of the provided content so that the corresponding vectors are dissimilar.

また、変換部134は、提供コンテンツのうち、抽出部132により抽出された非容易部分と表現が類似する部分を特定し、特定した部分の表現を変換してもよい。例えば、図1の例において、変換部134は、提供コンテンツに対応するベクトルと、非容易部分に対応するベクトルとを比較することにより、提供コンテンツのうち非容易部分と表現が類似する部分を特定し、当該部分の表現を変換する。 Further, the conversion unit 134 may identify a portion of the provided content whose expression is similar to the difficult portion extracted by the extraction unit 132, and convert the expression of the identified portion. For example, in the example of FIG. 1, the conversion unit 134 identifies a portion of the provided content whose expression is similar to the difficult portion by comparing the vector corresponding to the provided content with the vector corresponding to the difficult portion. and convert the representation of that part.

また、変換部134は、抽出部132により抽出された入力容易コンテンツの表現へ近づけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した入力コンテンツのうち、利用者U1の入力が容易と推定される入力コンテンツに対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似するように、提供コンテンツの表現を変換する。 Further, the conversion unit 134 may convert the expression of the provided content so as to approximate the expression of the easy-to-input content extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134 converts a vector corresponding to the input content that is estimated to be input easily by the user U1 among the input content specified as the related content, and a vector corresponding to the provided content after conversion. Transform the representation of the provided content so that it resembles a vector.

また、変換部134は、抽出部132により抽出された入力容易部分の表現へ近づけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した入力コンテンツのうち、利用者U1の入力が容易と推定される入力容易部分に対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似するように、提供コンテンツの表現を変換する。 Also, the conversion unit 134 may convert the expression of the provided content so as to approximate the expression of the easy-to-input portion extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134, of the input content specified as related content, corresponds to a vector corresponding to an easy-to-input portion that is estimated to be easy for user U1 to input, and a provided content after conversion. Transform the representation of the provided content so that it is similar to the vector that

また、変換部134は、抽出部132により抽出された入力非容易コンテンツの表現から遠ざけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した入力コンテンツのうち、利用者U1の入力が非容易と推定される入力コンテンツに対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似しないように、提供コンテンツの表現を変換する。 Further, the conversion unit 134 may convert the expression of the provided content so as to move away from the expression of the difficult-to-input content extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134 corresponds to a vector corresponding to the input content that is estimated to be difficult for the user U1 to input among the input contents specified as the related content, and the provided content after conversion. Transform the representation of the provided content so that it is not similar to the vector that

また、変換部134は、抽出部132により抽出された入力非容易部分の表現から遠ざけるように、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、関連コンテンツとして特定した入力コンテンツのうち、利用者U1の入力が非容易と推定される入力非容易部分に対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似しないように、提供コンテンツの表現を変換する。 Further, the conversion unit 134 may convert the expression of the provided content so as to move away from the expression of the difficult-to-input portion extracted by the extraction unit 132 . For example, in the example of FIG. 1, the conversion unit 134 converts a vector corresponding to an input-difficult part that is estimated to be difficult for the user U1 to input from among the input content specified as related content, and the provided content after conversion. Transform the representation of the provided content so that it is dissimilar to the vectors corresponding to .

また、変換部134は、提供コンテンツのうち、抽出部132により抽出された入力非容易部分と表現が類似する部分を特定し、特定した部分の表現を変換してもよい。例えば、図1の例において、変換部134は、提供コンテンツに対応するベクトルと、入力非容易部分に対応するベクトルとを比較することにより、提供コンテンツのうち入力非容易部分と表現が類似する部分を特定し、当該部分の表現を変換する。 Further, the conversion unit 134 may identify a portion of the provided content whose expression is similar to the difficult-to-input portion extracted by the extraction unit 132, and convert the expression of the identified portion. For example, in the example of FIG. 1, the conversion unit 134 compares the vector corresponding to the provided content with the vector corresponding to the hard-to-input portion, and converts the portion of the provided content that is similar in expression to the difficult-to-input portion. , and transform the representation of that part.

また、変換部134は、表現の変換前の提供コンテンツが有する意図を変化させないように、提供コンテンツの表現を変換してもよい。例えば、変換部134は、変換前の提供コンテンツに対応するベクトルと、変換後の提供コンテンツに対応するベクトルとが類似するように提供コンテンツを変換する。 Further, the conversion unit 134 may convert the expression of the provided content so as not to change the intention of the provided content before conversion of the expression. For example, the conversion unit 134 converts the provided content such that the vector corresponding to the provided content before conversion is similar to the vector corresponding to the provided content after conversion.

また、変換部134は、表現モデルを用いて、提供コンテンツの表現を変換してもよい。例えば、図1の例において、変換部134は、形態素解析等の技術により提供コンテンツから抽出した単語や文章を非容易言語モデルに入力し、提供コンテンツのうち利用者U1の視聴が非容易と推定される非容易部分を抽出する。そして、変換部134は、シソーラスを用いて、提供コンテンツの非容易部分から抽出した単語や文章の同義語や類似語を候補として抽出し、当該候補のうち、容易言語モデルにより出力したスコアが最も高い候補を用いて、提供コンテンツの非容易部分の表現を変換する。 Also, the conversion unit 134 may convert the representation of the provided content using the representation model. For example, in the example of FIG. 1, the conversion unit 134 inputs words and sentences extracted from the provided content by techniques such as morphological analysis into the difficult language model, and presumes that viewing of the provided content is difficult for the user U1. Extract the non-easy parts that are Then, the conversion unit 134 uses the thesaurus to extract synonyms and similar words of words and sentences extracted from the difficult part of the provided content as candidates, and among the candidates, the score output by the easy language model is the highest. High candidates are used to transform the representation of the difficult part of the provided content.

〔4.変換処理のフロー〕
ここで、図6を用いて、実施形態に係る変換装置100の変換処理の手順について説明する。図6は、実施形態に係る変換処理の手順の一例を示すフローチャートである。
[4. Flow of conversion process]
Here, the procedure of conversion processing of the conversion device 100 according to the embodiment will be described with reference to FIG. FIG. 6 is a flowchart illustrating an example of a procedure of conversion processing according to the embodiment.

図6に示すように、変換装置100は、関連コンテンツを特定する(ステップS101)。例えば、図1の例において、変換装置100は、視聴コンテンツサーバ20から視聴履歴を収集し、利用者U1と関連性を有する関連コンテンツを特定する。また、変換装置100は、入力コンテンツサーバ30から投稿履歴を収集し、利用者U1と関連性を有する関連コンテンツを特定する。 As shown in FIG. 6, the conversion device 100 identifies related content (step S101). For example, in the example of FIG. 1, the conversion device 100 collects viewing histories from the viewing content server 20 and identifies related content related to the user U1. Conversion device 100 also collects posting histories from input content server 30 and identifies related content that is related to user U1.

続いて、変換装置100は、関連コンテンツから容易コンテンツ及び非容易コンテンツを抽出する(ステップS102)。例えば、図1の例において、変換装置100は、関連コンテンツの容易部分と、非容易部分とを抽出し、容易部分を学習した容易言語モデルと、非容易部分を学習した非容易言語モデルとを生成する。 Subsequently, the conversion device 100 extracts easy content and non-easy content from the related content (step S102). For example, in the example of FIG. 1, the conversion device 100 extracts the easy part and the difficult part of the related content, and creates an easy language model that has learned the easy part and a difficult language model that has learned the difficult part. Generate.

続いて、変換装置100は、端末装置10から提供コンテンツの提供要求を受け付けたか否か判定する(ステップS103)。提供要求を受け付けていない場合(ステップS103;No)、変換装置100は、関連コンテンツを特定する処理、並びに、容易コンテンツ及び非容易コンテンツを抽出する処理を繰り返す。 Subsequently, the conversion device 100 determines whether or not a request for providing content to be provided has been received from the terminal device 10 (step S103). If no provision request has been received (step S103; No), the conversion device 100 repeats the process of identifying related content and the process of extracting easy content and non-easy content.

一方、提供要求を受け付けた場合(ステップS103;Yes)、変換装置100は、容易コンテンツの表現に近づけ、非容易コンテンツの表現から遠ざけるように表現を変換した提供コンテンツを提供し(ステップS104)、処理を終了する。 On the other hand, if a provision request has been accepted (step S103; Yes), the conversion device 100 provides content to be provided whose expression has been converted so as to approximate the expression of easy content and away from the expression of difficult content (step S104), End the process.

〔5.変形例〕
上述の実施形態は一例を示したものであり、種々の変更及び応用が可能である。
[5. Modification]
The above-described embodiment is an example, and various modifications and applications are possible.

〔5-1.「容易」及び「非容易」の関係について〕
上述の実施形態において、抽出部132が、スクロール速度が速い視聴コンテンツや、入力速度が速い入力コンテンツを容易コンテンツとし、コンテンツのスクロール速度が遅い視聴コンテンツや、入力速度が遅い入力コンテンツを非容易コンテンツとする例を示したが、容易コンテンツ及び非容易コンテンツは、任意の関係であってもよい。例えば、抽出部132は、関連コンテンツのうち、スクロール速度が所定の閾値以上である視聴コンテンツや、入力速度が所定の閾値以上である入力コンテンツを容易コンテンツとし、それ以外の関連コンテンツを全て非容易コンテンツとしてもよい。また、例えば、抽出部132は、関連コンテンツのうち、スクロール速度が第1閾値以上である視聴コンテンツを容易コンテンツとし、スクロール速度が第2閾値以下である視聴コンテンツを非容易コンテンツとしてもよい。そして、抽出部132は、関連コンテンツのうち、入力速度が第1閾値以上である入力コンテンツを容易コンテンツとし、入力速度が第2閾値以下である入力コンテンツを非容易コンテンツとしてもよい。
[5-1. Regarding the relationship between "easy" and "not easy"]
In the above-described embodiment, the extracting unit 132 treats viewing content with a fast scroll speed and input content with a fast input speed as easy content, and determines viewing content with a slow scroll speed and input content with a slow input speed as non-easy content. However, the easy content and the non-easy content may have any relationship. For example, the extracting unit 132 determines viewing content whose scrolling speed is equal to or higher than a predetermined threshold value and input content whose input speed is equal to or higher than a predetermined threshold among the related content as easy content, and regards all other related content as non-easy content. It can also be used as content. Further, for example, the extracting unit 132 may regard viewing content with a scroll speed equal to or higher than a first threshold as easy content, and may regard viewing content with a scroll speed equal to or lower than a second threshold as non-easy content. Then, the extracting unit 132 may regard input content whose input speed is equal to or higher than the first threshold among the related content as easy content, and may regard input content whose input speed is equal to or lower than the second threshold as non-easy content.

〔5-2.提供コンテンツの変換について〕
上述の実施形態において、変換部134が、提供コンテンツの非容易部分から抽出した単語や文章の同義語や類似語に変換する例を示したが、変換部134の機能はこのような構成に限定されない。例えば、変換部134は、1つの単語を複数の単語に変換、若しくは、複数の単語を1つの単語に変換してもよく、漢字を平仮名に変更してもよい。また、例えば、変換部134は、非容易部分として抽出した文章の語順や、文章の長さを変更してもよい。また、変換部134は、標準語とは異なった地方特有の表現(例えば、なまり)が提供コンテンツに含まれる場合、利用者が拠点とする地域に応じて当該提供コンテンツを変換してもよい。
[5-2. Conversion of provided content]
In the above-described embodiment, an example was given in which the conversion unit 134 converts words or sentences extracted from the difficult part of the provided content into synonyms or similar words, but the function of the conversion unit 134 is limited to such a configuration. not. For example, the conversion unit 134 may convert one word into multiple words, convert multiple words into one word, or change kanji into hiragana. Further, for example, the conversion unit 134 may change the word order of the sentence extracted as the difficult part or the length of the sentence. In addition, if the provided content includes expressions unique to the region (for example, dialects) different from the standard language, the conversion unit 134 may convert the provided content according to the region where the user is based.

また、上述の実施形態では、変換部134が、利用者の視聴が非容易と推定される提供コンテンツを変換する例を示したが、変換部134の機能はこのような構成に限定されない。例えば、変換部134は、提供コンテンツが利用者の視聴が容易と推定される場合、利用者の語彙力の高さや提供コンテンツが属するカテゴリに対する利用者の理解度の高さに応じた表現へ近づけるように提供コンテンツの表現を変換してもよい。 Further, in the above-described embodiment, an example was given in which the conversion unit 134 converts provided content that is assumed to be difficult for the user to view, but the function of the conversion unit 134 is not limited to such a configuration. For example, when it is estimated that the provided content is easy for the user to view, the conversion unit 134 approximates the expression to an expression according to the user's high vocabulary and the user's degree of understanding of the category to which the provided content belongs. The representation of the provided content may be converted as follows.

また、上述の実施形態では、変換部134が、提供コンテンツに含まれる単語や文章を変換する例を示したが、変換部134の機能はこのような構成に限定されない。例えば、変換部134は、利用者の視聴が非容易と推定される提供コンテンツにおける文章や画像の構成を、容易コンテンツ又は容易部分の構成に近づけるように変換してもよい。また、利用者の視聴が非容易と推定される提供コンテンツが音声に関するコンテンツである場合、変換部134は、利用者の視聴が容易と推定される容易コンテンツや容易部分の表現へ近づけるように音声を変換する。 Further, in the above-described embodiment, an example in which the conversion unit 134 converts words and sentences included in the provided content has been described, but the function of the conversion unit 134 is not limited to such a configuration. For example, the conversion unit 134 may convert the structure of sentences and images in the provided content that is estimated to be difficult for the user to view so as to approximate the structure of the easy content or the easy part. In addition, when the provided content that is estimated to be difficult for the user to view is audio-related content, the conversion unit 134 converts the audio so as to approach the expression of the easy content or the easy part that is estimated to be easy for the user to view. to convert

なお、変換装置100は、変換部134が変換した部分を強調表示する提供コンテンツを端末装置10に提供してもよい。また、変換装置100は、変換部134が変換した単語や文章を列挙して表示する提供コンテンツを端末装置10に提供してもよい。 Note that the conversion device 100 may provide the terminal device 10 with provision content in which the portion converted by the conversion unit 134 is highlighted. The conversion device 100 may also provide the terminal device 10 with provision content in which the words and sentences converted by the conversion unit 134 are listed and displayed.

〔6.効果〕
上述してきたように、実施形態に係る変換装置100は、特定部131と、抽出部132と、生成部133と、変換部134とを有する。特定部131は、提供コンテンツの提供先となる利用者と関連性を有する関連コンテンツを特定する。また、特定部131は、関連コンテンツとして、利用者が視聴した視聴コンテンツを特定する。抽出部132は、利用者が視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易であると推定されるコンテンツを容易コンテンツとして抽出する。生成部133は、特定部131により特定された関連コンテンツが有する表現の特徴を学習させた表現モデルを生成する。変換部134は、特定部131により特定された関連コンテンツの表現に基づいて、提供コンテンツの表現を変換する。
[6. effect〕
As described above, the conversion device 100 according to the embodiment has the identification unit 131, the extraction unit 132, the generation unit 133, and the conversion unit . The identifying unit 131 identifies related content that is related to the user to whom the provided content is provided. Further, the identifying unit 131 identifies viewing content viewed by the user as related content. The extraction unit 132 extracts, as easy content, content that is estimated to be easy to view from the viewing content, based on the manner in which the user views the viewing content. The generation unit 133 generates an expression model by learning the characteristics of the expressions of the related content identified by the identification unit 131 . The conversion unit 134 converts the expression of the provided content based on the expression of the related content identified by the identification unit 131 .

これにより、実施形態に係る変換装置100は、利用者に関連するコンテンツの表現に基づいて提供コンテンツの表現を変換するため、利用者に対し適切な表現のコンテンツを提供することができる。 As a result, the conversion device 100 according to the embodiment converts the expression of the content to be provided based on the expression of the content related to the user, so that it is possible to provide the user with the content with an appropriate expression.

また、実施形態に係る変換装置100において、例えば、抽出部132は、視聴に要した時間が所定の閾値を下回る視聴コンテンツを、容易コンテンツとして抽出する。また、抽出部132は、視聴中における操作の内容が所定の条件を満たす視聴コンテンツを、容易コンテンツとして抽出する。そして、変換部134は、抽出部132により抽出された容易コンテンツの表現へ近づけるように、提供コンテンツの表現を変換する。また、抽出部132は、視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易であると推定される部分を容易部分として抽出する。そして、変換部134は、抽出部132により抽出された容易部分の表現へ近づけるように、提供コンテンツの表現を変換する。 Further, in the conversion device 100 according to the embodiment, for example, the extraction unit 132 extracts viewing content whose viewing time is less than a predetermined threshold as easy content. Further, the extracting unit 132 extracts, as easy content, viewing content that satisfies a predetermined condition in terms of operation details during viewing. Then, the conversion unit 134 converts the expression of the provided content so as to approximate the expression of the easy content extracted by the extraction unit 132 . Moreover, the extracting unit 132 extracts a portion of the viewing content that is estimated to be easy to view as an easy portion, based on the manner in which the viewing content is viewed. Then, the conversion unit 134 converts the expression of the provided content so as to approximate the expression of the easy part extracted by the extraction unit 132 .

これにより、実施形態に係る変換装置100は、提供コンテンツの表現を容易コンテンツ又は容易部分の表現へ近づけることができるため、利用者に対し適切な表現のコンテンツを提供することができる。 As a result, the conversion device 100 according to the embodiment can bring the expression of the provided content closer to the expression of the easy content or the easy part, so that it can provide the user with content of appropriate expression.

また、実施形態に係る変換装置100において、例えば、抽出部132は、さらに、視聴コンテンツのうち視聴が容易でないと推定されるコンテンツを非容易コンテンツとして抽出する。そして、変換部134は、さらに、抽出部132により抽出された非容易コンテンツの表現から遠ざけるように、提供コンテンツの表現を変換する。また、抽出部132は、視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易でないと推定される部分を非容易部分として抽出する。そして、変換部134は、抽出部132により抽出された非容易部分の表現から遠ざけるように、提供コンテンツの表現を変換する。また、変換部134は、提供コンテンツのうち、抽出部132により抽出された非容易部分と表現が類似する部分を特定し、特定した部分の表現を変換する。 In addition, in the conversion device 100 according to the embodiment, for example, the extracting unit 132 further extracts content estimated to be difficult to view from the viewing content as non-easy content. Then, the conversion unit 134 further converts the representation of the provided content so as to move away from the representation of the difficult content extracted by the extraction unit 132 . Moreover, the extracting unit 132 extracts a portion of the viewing content that is estimated to be difficult to view as an uneasy portion based on the manner in which the viewing content is viewed. Then, the conversion unit 134 converts the expression of the provided content so as to move away from the expression of the difficult part extracted by the extraction unit 132 . Further, the conversion unit 134 identifies a portion of the provided content whose expression is similar to the difficult portion extracted by the extraction unit 132, and converts the expression of the identified portion.

これにより、実施形態に係る変換装置100は、提供コンテンツの表現を非容易コンテンツ又は非容易部分の表現から遠ざけることができるため、利用者に対し適切な表現のコンテンツを提供することができる。 As a result, the conversion device 100 according to the embodiment can keep the expression of the provided content away from the expression of the difficult content or the difficult part, so that it is possible to provide the user with the content of appropriate expression.

また、実施形態に係る変換装置100において、例えば、特定部131は、関連コンテンツとして、利用者が入力した入力コンテンツを特定する。また、抽出部132は、利用者が入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易であると推定される入力容易コンテンツを抽出する。そして、変換部134は、抽出部132により抽出された入力容易コンテンツの表現へ近づけるように、提供コンテンツの表現を変換する。また、抽出部132は、入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易と推定される部分を入力容易部分として抽出する。そして、変換部134は、抽出部132により抽出された入力容易部分の表現へ近づけるように、提供コンテンツの表現を変換する。 Further, in the conversion device 100 according to the embodiment, for example, the identifying unit 131 identifies input content input by the user as related content. Further, the extracting unit 132 extracts easy-to-input content estimated to be easy to input from among the input content, based on the manner in which the user inputs the input content. Then, the conversion unit 134 converts the expression of the provided content so as to approximate the expression of the easy-to-input content extracted by the extraction unit 132 . Further, the extracting unit 132 extracts a portion of the input content that is estimated to be easy to input as an easy-to-input portion, based on the manner in which the input content is input. Then, the conversion unit 134 converts the expression of the provided content so as to approximate the expression of the easy-to-input portion extracted by the extraction unit 132 .

これにより、実施形態に係る変換装置100は、提供コンテンツの表現を入力容易コンテンツ又は入力容易部分の表現へ近づけることができるため、利用者に対し適切な表現のコンテンツを提供することができる。 As a result, the conversion device 100 according to the embodiment can bring the expression of the provided content closer to the expression of the easy-to-input content or the easy-to-input portion, so that it is possible to provide the user with content of appropriate expression.

また、実施形態に係る変換装置100において、例えば、抽出部132は、さらに、入力コンテンツのうち入力が容易でないと推定される入力非容易コンテンツを抽出する。そして、変換部134は、抽出部132により抽出された入力非容易コンテンツの表現から遠ざけるように、提供コンテンツの表現を変換する。また、抽出部132は、入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易でないと推定される部分を入力非容易部分として抽出する。そして、変換部134は、抽出部132により抽出された入力非容易部分の表現から遠ざけるように、提供コンテンツの表現を変換する。また、変換部134は、提供コンテンツのうち、抽出部132により抽出された入力非容易部分と表現が類似する部分を特定し、特定した部分の表現を変換する。 In addition, in the conversion device 100 according to the embodiment, for example, the extracting unit 132 further extracts, from among the input contents, hard-to-input contents estimated to be not easy to input. Then, the conversion unit 134 converts the expression of the provided content so as to move away from the expression of the hard-to-input content extracted by the extraction unit 132 . Moreover, the extracting unit 132 extracts a portion of the input content that is estimated to be difficult to input as an input-hard-to-input portion, based on the manner in which the input content was input. Then, the conversion unit 134 converts the expression of the provided content so as to move away from the expression of the difficult-to-input portion extracted by the extraction unit 132 . In addition, the conversion unit 134 identifies a portion of the provided content whose expression is similar to the difficult-to-input portion extracted by the extraction unit 132, and converts the expression of the identified portion.

これにより、実施形態に係る変換装置100は、提供コンテンツの表現を入力非容易コンテンツ又は入力非容易部分の表現から遠ざけることができるため、利用者に対し適切な表現のコンテンツを提供することができる。 As a result, the conversion device 100 according to the embodiment can keep the representation of the provided content away from the representation of the content that is difficult to input or the part that is difficult to input, so that it is possible to provide the user with content that is appropriately represented. .

また、実施形態に係る変換装置100において、例えば、変換部134は、表現の変換前の提供コンテンツが有する意図を変化させないように、提供コンテンツの表現を変換する。 Further, in the conversion device 100 according to the embodiment, for example, the conversion unit 134 converts the expression of the provided content so as not to change the intention of the provided content before expression conversion.

これにより、実施形態に係る変換装置100は、コンテンツの意図を変化させずに表現を変換するため、利用者に対し適切な表現のコンテンツを提供することができる。 As a result, the conversion device 100 according to the embodiment converts the expression without changing the intention of the content, so it is possible to provide the user with content with an appropriate expression.

また、実施形態に係る変換装置100において、例えば、変換部134は、表現モデルを用いて、提供コンテンツの表現を変換する。また、生成部133は、所定のコンテンツが入力された場合に、関連コンテンツと共通する表現を有するコンテンツであって、入力されたコンテンツと意図が類似するコンテンツを出力するように、表現モデルを生成する。 Also, in the conversion device 100 according to the embodiment, for example, the conversion unit 134 converts the representation of the provided content using the representation model. In addition, the generation unit 133 generates an expression model so that, when predetermined content is input, content having a common expression with related content and having a similar intention to the input content is output. do.

これにより、実施形態に係る変換装置100は、利用者に関連するコンテンツを学習したモデルを用いて変換処理を行うため、利用者に対し適切な表現のコンテンツを提供することができる。 As a result, the conversion device 100 according to the embodiment performs conversion processing using a model that has learned content related to the user, and therefore can provide content with appropriate expressions to the user.

〔7.ハードウェア構成〕
また、上述してきた各実施形態に係る変換装置は、例えば図7に示すような構成のコンピュータ1000によって実現される。以下、変換装置100を例に挙げて説明する。図7は、変換装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、ROM1200、RAM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
[7. Hardware configuration]
Also, the conversion apparatus according to each of the embodiments described above is implemented by a computer 1000 configured as shown in FIG. 7, for example. The conversion device 100 will be described below as an example. FIG. 7 is a hardware configuration diagram showing an example of a computer that implements the functions of the conversion device. Computer 1000 has CPU 1100 , ROM 1200 , RAM 1300 , HDD 1400 , communication interface (I/F) 1500 , input/output interface (I/F) 1600 and media interface (I/F) 1700 .

CPU1100は、ROM1200又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1200は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。 The CPU 1100 operates based on programs stored in the ROM 1200 or HDD 1400 and controls each section. The ROM 1200 stores a boot program executed by the CPU 1100 when the computer 1000 is started, programs dependent on the hardware of the computer 1000, and the like.

HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(実施形態のネットワークNに対応する)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。 The HDD 1400 stores programs executed by the CPU 1100, data used by the programs, and the like. Communication interface 1500 receives data from another device via communication network 500 (corresponding to network N in the embodiment) and sends it to CPU 1100, and also transmits data generated by CPU 1100 via communication network 500 to other devices. Send to device.

CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。 The CPU 1100 controls output devices such as displays and printers, and input devices such as keyboards and mice, through an input/output interface 1600 . CPU 1100 acquires data from an input device via input/output interface 1600 . Also, CPU 1100 outputs the generated data to an output device via input/output interface 1600 .

メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1300を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1300上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。 Media interface 1700 reads programs or data stored in recording medium 1800 and provides them to CPU 1100 via RAM 1300 . CPU 1100 loads such a program from recording medium 1800 onto RAM 1300 via media interface 1700, and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or a PD (Phase change rewritable disc), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. etc.

例えば、コンピュータ1000が変換装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1300上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、変換装置100の記憶装置内の各データが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。 For example, when the computer 1000 functions as the conversion device 100 , the CPU 1100 of the computer 1000 implements the functions of the control unit 130 by executing a program loaded onto the RAM 1300 . Further, each data in the storage device of the conversion device 100 is stored in the HDD 1400 . CPU 1100 of computer 1000 reads these programs from recording medium 1800 and executes them, but as another example, these programs may be obtained from another device via a predetermined communication network.

〔8.その他〕
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
[8. others〕
As described above, some of the embodiments of the present application have been described in detail based on the drawings. It is possible to carry out the invention in other forms with modifications.

また、上述した変換装置100は、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。 Further, the configuration of the conversion device 100 described above can be flexibly changed, for example, by calling an external platform or the like using an API (Application Programming Interface), network computing, or the like, depending on the function.

また、特許請求の範囲に記載した「部」は、「手段」や「回路」などに読み替えることができる。例えば、特定部は、特定手段や特定回路に読み替えることができる。 In addition, the "unit" described in the claims can be read as "means", "circuit", or the like. For example, the identifying unit can be read as identifying means or a specific circuit.

10 端末装置
20 視聴コンテンツサーバ
30 入力コンテンツサーバ
100 変換装置
110 通信部
120 記憶部
121 関連コンテンツ記憶部
122 モデル記憶部
130 制御部
131 特定部
132 抽出部
133 生成部
134 変換部
10 terminal device 20 viewing content server 30 input content server 100 conversion device 110 communication unit 120 storage unit 121 related content storage unit 122 model storage unit 130 control unit 131 identification unit 132 extraction unit 133 generation unit 134 conversion unit

Claims (11)

提供コンテンツの提供先となる利用者と関連性を有する関連コンテンツとして、当該利用者が視聴した視聴コンテンツを特定する特定部と、
前記利用者が前記視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易であると推定されるコンテンツを容易コンテンツとして抽出し、当該視聴コンテンツのうち視聴が非容易であると推定されるコンテンツを非容易コンテンツとして抽出する第1抽出部と、
前記容易コンテンツに基づいて、コンテンツが入力された場合に、容易コンテンツとの類似度を出力するように学習が行われた容易言語モデルを生成し、前記非容易コンテンツに基づいて、コンテンツが入力された場合に、当該コンテンツのうち前記利用者の視聴が非容易と推定される非容易部分を出力するよう学習が行われた非容易言語モデルを生成するする生成部と、
前記非容易言語モデルを用いて、前記提供コンテンツから非容易部分を抽出し、当該非容易部分の表現を変換した複数の候補のうち、前記容易言語モデルにより出力された類似度が最も高い候補を用いて当該非容易部分の表現を変換する変換部と
を有することを特徴とする変換装置。
a specifying unit that specifies viewing content viewed by the user as related content related to the user to whom the provided content is provided;
Based on the manner in which the user views the viewing content, content that is estimated to be easy to view is extracted as easy content from the viewing content, and viewing is difficult from the viewing content. a first extraction unit that extracts content estimated to be as non-easy content;
generating an easy language model trained to output a degree of similarity with easy content when content is input based on the easy content; a generation unit that generates a difficult language model that has been trained to output a difficult part of the content that is estimated to be difficult for the user to view when the content is viewed;
Using the difficult language model, a difficult part is extracted from the provided content, and among a plurality of candidates obtained by converting the expression of the difficult part, a candidate with the highest similarity output by the easy language model is selected. and a conversion unit that converts the expression of the difficult part using the conversion device.
前記第1抽出部は、
視聴に要した時間が所定の閾値を下回る視聴コンテンツを、前記容易コンテンツとして抽出する
ことを特徴とする請求項に記載の変換装置。
The first extraction unit is
2. The conversion device according to claim 1 , wherein viewing content whose viewing time is less than a predetermined threshold is extracted as said easy content.
前記第1抽出部は、
視聴中における操作の内容が所定の条件を満たす視聴コンテンツを、前記容易コンテンツとして抽出する
ことを特徴とする請求項またはに記載の変換装置。
The first extraction unit is
3. The conversion device according to claim 1 , wherein viewing contents satisfying a predetermined condition for details of operation during viewing are extracted as said easy contents.
前記特定部は、
前記関連コンテンツとして、前記利用者が入力した入力コンテンツを特定する
ことを特徴とする請求項1~のうちいずれか1つに記載の変換装置。
The identification unit
4. The conversion device according to any one of claims 1 to 3 , wherein input content input by said user is specified as said related content.
前記利用者が前記入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易であると推定される入力容易コンテンツを抽出する第2抽出部
をさらに有し、
前記変換部は、
前記第2抽出部により抽出された入力容易コンテンツの表現へ近づけるように、前記提供コンテンツの表現を変換する
ことを特徴とする請求項に記載の変換装置。
a second extraction unit that extracts easy-to-input content that is estimated to be easy to input from among the input content based on the manner in which the input content is input by the user;
The conversion unit
5. The conversion device according to claim 4 , wherein the expression of the provided content is converted so as to approximate the expression of the easy-to-input content extracted by the second extraction unit.
前記第2抽出部は、
前記入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易と推定される部分を入力容易部分として抽出し、
前記変換部は、
前記第2抽出部により抽出された入力容易部分の表現へ近づけるように、前記提供コンテンツの表現を変換する
ことを特徴とする請求項に記載の変換装置。
The second extractor is
extracting a portion of the input content that is presumed to be easy to input as an easy-to-input portion, based on the manner in which the input content is input;
The conversion unit
6. The conversion device according to claim 5 , wherein the expression of the provided content is converted so as to approximate the expression of the easy-to-input portion extracted by the second extraction unit.
前記第2抽出部は、
さらに、前記入力コンテンツのうち入力が容易でないと推定される入力非容易コンテンツを抽出し
前記変換部は、
前記第2抽出部により抽出された入力非容易コンテンツの表現から遠ざけるように、前記提供コンテンツの表現を変換する
ことを特徴とする請求項またはに記載の変換装置。
The second extractor is
Furthermore, the conversion unit extracts content that is estimated to be difficult to input from the input content,
7. The conversion device according to claim 5 , wherein the expression of the provided content is converted so as to move away from the expression of the hard-to-input content extracted by the second extraction unit.
前記第2抽出部は、
前記入力コンテンツを入力した際の態様に基づいて、当該入力コンテンツのうち入力が容易でないと推定される部分を入力非容易部分として抽出し、
前記変換部は、
前記第2抽出部により抽出された入力非容易部分の表現から遠ざけるように、前記提供コンテンツの表現を変換する
ことを特徴とする請求項に記載の変換装置。
The second extractor is
extracting a portion of the input content that is presumed to be difficult to input as a non-easy-to-input portion, based on the manner in which the input content is input;
The conversion unit
8. The conversion device according to claim 7 , wherein the expression of the provided content is converted so as to move away from the expression of the difficult-to-input portion extracted by the second extraction unit.
前記変換部は、
前記提供コンテンツのうち、前記第2抽出部により抽出された入力非容易部分と表現が類似する部分を特定し、特定した部分の表現を変換する
ことを特徴とする請求項に記載の変換装置。
The conversion unit
9. The conversion device according to claim 8 , wherein a part whose expression is similar to the hard-to-input part extracted by the second extraction unit is specified in the provided content, and the expression of the specified part is converted. .
変換装置が実行する変換方法であって、
提供コンテンツの提供先となる利用者と関連性を有する関連コンテンツとして、当該利用者が視聴した視聴コンテンツを特定する特定工程と、
前記利用者が前記視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易であると推定されるコンテンツを容易コンテンツとして抽出し、当該視聴コンテンツのうち視聴が非容易であると推定されるコンテンツを非容易コンテンツとして抽出する第1抽出工程と、
前記容易コンテンツに基づいて、コンテンツが入力された場合に、容易コンテンツとの類似度を出力するように学習が行われた容易言語モデルを生成し、前記非容易コンテンツに基づいて、コンテンツが入力された場合に、当該コンテンツのうち前記利用者の視聴が非容易と推定される非容易部分を出力するよう学習が行われた非容易言語モデルを生成するする生成工程と、
前記非容易言語モデルを用いて、前記提供コンテンツから非容易部分を抽出し、当該非容易部分の表現を変換した複数の候補のうち、前記容易言語モデルにより出力された類似度が最も高い候補を用いて当該非容易部分の表現を変換する変換工程と
を含むことを特徴とする変換方法。
A conversion method executed by a conversion device,
an identifying step of identifying viewing content viewed by the user as related content related to the user to whom the provided content is provided;
Based on the manner in which the user views the viewing content, content that is estimated to be easy to view is extracted as easy content from the viewing content, and viewing is difficult from the viewing content. a first extracting step of extracting content estimated to be as non-easy content;
generating an easy language model trained to output a degree of similarity with easy content when content is input based on the easy content; a generation step of generating a difficult language model that has been trained to output a difficult part of the content that is estimated to be difficult for the user to view when the content is viewed;
Using the difficult language model, a difficult part is extracted from the provided content, and among a plurality of candidates obtained by converting the expression of the difficult part, a candidate with the highest similarity output by the easy language model is selected. a conversion step of converting the representation of the difficult part using :
提供コンテンツの提供先となる利用者と関連性を有する関連コンテンツとして、当該利用者が視聴した視聴コンテンツを特定する特定手順と、
前記利用者が前記視聴コンテンツを視聴した際の態様に基づいて、当該視聴コンテンツのうち視聴が容易であると推定されるコンテンツを容易コンテンツとして抽出し、当該視聴コンテンツのうち視聴が非容易であると推定されるコンテンツを非容易コンテンツとして抽出する第1抽出手順と、
前記容易コンテンツに基づいて、コンテンツが入力された場合に、容易コンテンツとの類似度を出力するように学習が行われた容易言語モデルを生成し、前記非容易コンテンツに基づいて、コンテンツが入力された場合に、当該コンテンツのうち前記利用者の視聴が非容易と推定される非容易部分を出力するよう学習が行われた非容易言語モデルを生成するする生成手順と、
前記非容易言語モデルを用いて、前記提供コンテンツから非容易部分を抽出し、当該非容易部分の表現を変換した複数の候補のうち、前記容易言語モデルにより出力された類似度が最も高い候補を用いて当該非容易部分の表現を変換する変換手順と
をコンピュータに実行させるための変換プログラム。
an identification procedure for identifying the viewing content viewed by the user as related content related to the user to whom the provided content is provided;
Based on the manner in which the user views the viewing content, content that is estimated to be easy to view is extracted as easy content from the viewing content, and viewing is difficult from the viewing content. a first extraction procedure for extracting content estimated to be as non-easy content;
generating an easy language model trained to output a degree of similarity with easy content when content is input based on the easy content; a generation procedure for generating a difficult language model that has been trained to output a difficult part of the content that is estimated to be difficult for the user to view, when
Using the difficult language model, a difficult part is extracted from the provided content, and among a plurality of candidates obtained by converting the expression of the difficult part, a candidate with the highest similarity output by the easy language model is selected. A conversion program for causing a computer to execute a conversion procedure for converting the representation of the difficult part using a conversion procedure.
JP2019082255A 2019-04-23 2019-04-23 Conversion device, conversion method and conversion program Active JP7191763B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019082255A JP7191763B2 (en) 2019-04-23 2019-04-23 Conversion device, conversion method and conversion program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019082255A JP7191763B2 (en) 2019-04-23 2019-04-23 Conversion device, conversion method and conversion program

Publications (2)

Publication Number Publication Date
JP2020181270A JP2020181270A (en) 2020-11-05
JP7191763B2 true JP7191763B2 (en) 2022-12-19

Family

ID=73024023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019082255A Active JP7191763B2 (en) 2019-04-23 2019-04-23 Conversion device, conversion method and conversion program

Country Status (1)

Country Link
JP (1) JP7191763B2 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011227849A (en) 2010-04-23 2011-11-10 Jvc Kenwood Corp Text conversion device, text conversion method, program and data structure
JP2012118773A (en) 2010-12-01 2012-06-21 Dainippon Printing Co Ltd Electronic book browsing system, electronic book browsing method, program and storage medium
JP2017194864A (en) 2016-04-21 2017-10-26 株式会社Nttドコモ Browsing support system
JP2017215845A (en) 2016-06-01 2017-12-07 富士通株式会社 Reading support system, reading support program, and reading support method
JP2018005324A (en) 2016-06-28 2018-01-11 ヤフー株式会社 Generation apparatus, generation method, and generation program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3813665B2 (en) * 1996-09-04 2006-08-23 松下電器産業株式会社 Document display device
US7207003B1 (en) * 2000-08-31 2007-04-17 International Business Machines Corporation Method and apparatus in a data processing system for word based render browser for skimming or speed reading web pages

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011227849A (en) 2010-04-23 2011-11-10 Jvc Kenwood Corp Text conversion device, text conversion method, program and data structure
JP2012118773A (en) 2010-12-01 2012-06-21 Dainippon Printing Co Ltd Electronic book browsing system, electronic book browsing method, program and storage medium
JP2017194864A (en) 2016-04-21 2017-10-26 株式会社Nttドコモ Browsing support system
JP2017215845A (en) 2016-06-01 2017-12-07 富士通株式会社 Reading support system, reading support program, and reading support method
JP2018005324A (en) 2016-06-28 2018-01-11 ヤフー株式会社 Generation apparatus, generation method, and generation program

Also Published As

Publication number Publication date
JP2020181270A (en) 2020-11-05

Similar Documents

Publication Publication Date Title
AU2018226402B2 (en) Method to generate summaries tuned to a target vocabulary
US10733197B2 (en) Method and apparatus for providing information based on artificial intelligence
KR102223727B1 (en) Systems and methods for providing content selection
Amplayo et al. Incorporating product description to sentiment topic models for improved aspect-based sentiment analysis
US20140280513A1 (en) Pro-buffering proxy for seamless media object navigation
JP6745384B2 (en) Method and apparatus for pushing information
US20150100524A1 (en) Smart selection of text spans
KR102355212B1 (en) Browsing images via mined hyperlinked text snippets
US11900046B2 (en) Intelligent feature identification and presentation
US20210073255A1 (en) Analyzing the tone of textual data
CN111414561B (en) Method and device for presenting information
Arumugam et al. Hands-On Natural Language Processing with Python: A practical guide to applying deep learning architectures to your NLP applications
US20220121668A1 (en) Method for recommending document, electronic device and storage medium
WO2023108993A1 (en) Product recommendation method, apparatus and device based on deep clustering algorithm, and medium
CN109325223A (en) Article recommended method, device and electronic equipment
KR102193228B1 (en) Apparatus for evaluating non-financial information based on deep learning and method thereof
JP2020173779A (en) Identifying sequence of headings in document
US20230401250A1 (en) Systems and methods for generating interactable elements in text strings relating to media assets
CN110807097A (en) Method and device for analyzing data
JP6224682B2 (en) Information display program, information display device, information display method, and distribution device
JP7191763B2 (en) Conversion device, conversion method and conversion program
WO2023020160A1 (en) Recommendation method and apparatus, training method and apparatus, device, and recommendation system
US11768867B2 (en) Systems and methods for generating interactable elements in text strings relating to media assets
JP6158903B2 (en) Information display program, information display device, information display method, and distribution device
US20230351091A1 (en) Presenting Intelligently Suggested Content Enhancements

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221207

R150 Certificate of patent or registration of utility model

Ref document number: 7191763

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350