JP2019008440A

JP2019008440A - テキスト抽出装置、コメント投稿装置、コメント投稿支援装置、再生端末および文脈ベクトル計算装置

Info

Publication number: JP2019008440A
Application number: JP2017122042A
Authority: JP
Inventors: 優理小田桐; Yuri Odagiri; 一浩服部; Kazuhiro Hattori
Original assignee: Dwango Co Ltd
Current assignee: Dwango Co Ltd
Priority date: 2017-06-22
Filing date: 2017-06-22
Publication date: 2019-01-17
Anticipated expiration: 2037-06-22
Also published as: JP6337183B1

Abstract

【課題】対象のテキスト群と類似の文脈を示唆するテキスト群を抽出する。【解決手段】テキスト抽出装置１００は、文脈ベクトル計算部１０２と、類似度計算部１０４と、探索部１０７とを含む。文脈ベクトル計算部１０２は、複数のテキストを含む対象テキスト群の第１の文脈ベクトルを、機械学習済みのニューラルネットワークを用いて計算する。類似度計算部１０４は、それぞれ１以上のテキストを含む複数の候補テキスト群の第２の文脈ベクトルの各々と第１の文脈ベクトルとの類似度を計算する。探索部１０７は、類似度に基づいて、第１の文脈ベクトルに類似する１つ以上の第２の文脈ベクトルにそれぞれ対応する１つ以上の候補テキスト群を探索し、類似テキスト群を得る。【選択図】図１

Description

本発明は、コンテンツの文脈にふさわしいテキストを抽出する技術に関する。

従来、一部の動画像配信サービスでは、ユーザが動画像に対してコメントを投稿することができる。コメントは、動画像に重ね表示され、同一の動画像を視聴するユーザ同士の一体感を高めて気分を盛り上げることに寄与する。また、動画像に対するコメントの投稿数は、その動画像の盛り上がり（人気度）を評価する指標の１つとして利用できる。

配信されて間もない動画像は、コメント数が少なく盛り上がりに欠け、再生数が増えにくいことがある。また、ユーザは、既に多くのコメントが投稿されている動画像に対しては気軽にコメントを投稿しやすいが、未だあまりコメントが投稿されていない動画像に対してはコメントの投稿を躊躇しがちである。また、ユーザは、典型的には、キーボード（ソフトウェアキーボードを含む）、マウス、タッチスクリーン、リモートコントローラなどの入力装置を操作してテキストを直接的に入力し、コメントを投稿する。故に、ユーザは、かかる入力装置が快適に操作できる状況でなければ、コメントの投稿を積極的には行わない可能性がある。

仮に、例えば「ｗｗｗ」、「乙」などの定型的なコメントを自動生成して投稿したとすれば、動画像のコメント数を容易に増やすことはできる。しかしながら、このような当たり障りのないコメントよりも、ユーザの共感を誘う、動画像のその時々の文脈にふさわしいコメントが求められる。

特許文献１には、対象の動画データに対する正規コメントからベクトルを生成し、当該ベクトルに関して類似する他の正規コメントを抽出する技術が開示されている（［００４２］〜［００４３］）。また、対象の動画データとは異なる動画データに対する正規コメントを抽出することも開示されている（［００５０］）。

特開２０１５−２２０６１０号公報

本発明は、対象のテキスト群と類似の文脈を示唆するテキスト群を抽出することを目的とする。

本発明の第１の態様によれば、テキスト抽出装置は、文脈ベクトル計算部と、類似度計算部と、探索部とを含む。文脈ベクトル計算部は、複数のテキストを含む対象テキスト群の第１の文脈ベクトルを、機械学習済みのニューラルネットワークを用いて計算する。類似度計算部は、それぞれ１以上のテキストを含む複数の候補テキスト群の第２の文脈ベクトルの各々と第１の文脈ベクトルとの類似度を計算する。探索部は、類似度に基づいて、第１の文脈ベクトルに類似する１つ以上の第２の文脈ベクトルにそれぞれ対応する１つ以上の候補テキスト群を探索し、類似テキスト群を得る。

本発明の第２の態様によれば、コメント投稿装置は、文脈ベクトル計算部と、類似度計算部と、探索部と、送信部とを含む。文脈ベクトル計算部は、コンテンツに関連付けられる複数のテキストを含む対象テキスト群の第１の文脈ベクトルを、機械学習済みのニューラルネットワークを用いて計算する。類似度計算部は、それぞれ１以上のテキストを含む複数の候補テキスト群の第２の文脈ベクトルの各々と第１の文脈ベクトルとの類似度を計算する。探索部は、類似度に基づいて、第１の文脈ベクトルに類似する１つ以上の第２の文脈ベクトルにそれぞれ対応する１つ以上の候補テキスト群を探索し、類似テキスト群を得る。送信部は、類似テキスト群に含まれるテキストの少なくとも１つをコンテンツに関連付けられるコメントとして投稿するために送信する。

本発明の第３の態様によれば、コメント投稿支援装置は、文脈ベクトル計算部と、類似度計算部と、探索部と、送信部とを含む。文脈ベクトル計算部は、コンテンツに関連付けられる複数のテキストを含む対象テキスト群の第１の文脈ベクトルを、機械学習済みのニューラルネットワークを用いて計算する。類似度計算部は、それぞれ１以上のテキストを含む複数の候補テキスト群の第２の文脈ベクトルの各々と第１の文脈ベクトルとの類似度を計算する。探索部は、類似度に基づいて、第１の文脈ベクトルに類似する１つ以上の第２の文脈ベクトルにそれぞれ対応する１つ以上の候補テキスト群を探索し、類似テキスト群を得る。送信部は、類似テキスト群に含まれるテキストの少なくとも１つを投稿可能コメントとして、コンテンツを再生する再生端末へ送信する。

本発明の第４の態様によれば、再生端末は、受信部と、再生部と、文脈ベクトル計算部と、類似度計算部と、探索部と、送信部とを含む。受信部は、コンテンツを受信する。再生部は、コンテンツを再生する。文脈ベクトル計算部は、コンテンツに関連付けられる複数のテキストを含む対象テキスト群の第１の文脈ベクトルを、機械学習済みのニューラルネットワークを用いて計算する。類似度計算部は、それぞれ１以上のテキストを含む複数の候補テキスト群の第２の文脈ベクトルの各々と第１の文脈ベクトルとの類似度を計算する。探索部は、類似度に基づいて、第１の文脈ベクトルに類似する１つ以上の第２の文脈ベクトルにそれぞれ対応する１つ以上の候補テキスト群を探索し、類似テキスト群を得る。送信部は、類似テキスト群に含まれるテキストの少なくとも１つをコンテンツに関連付けられるコメントとして投稿するために送信する。

本発明の第５の態様によれば、再生端末は、受信部と、再生部と、文脈ベクトル計算部と、類似度計算部と、探索部と、出力部と、送信部とを含む。受信部は、コンテンツを受信する。再生部は、コンテンツを再生する。文脈ベクトル計算部は、コンテンツに関連付けられる複数のテキストを含む対象テキスト群の第１の文脈ベクトルを、機械学習済みのニューラルネットワークを用いて計算する。類似度計算部は、それぞれ１以上のテキストを含む複数の候補テキスト群の第２の文脈ベクトルの各々と第１の文脈ベクトルとの類似度を計算する。探索部は、類似度に基づいて、第１の文脈ベクトルに類似する１つ以上の第２の文脈ベクトルにそれぞれ対応する１つ以上の候補テキスト群を探索し、類似テキスト群を得る。出力部は、類似テキスト群に含まれるテキストの少なくとも１つを投稿可能コメントとして、再生されたコンテンツと共に出力する。送信部は、ユーザによって選択された投稿可能コメントをコンテンツに関連付けられるコメントとして投稿するために送信する。

本発明の第６の態様によれば、文脈ベクトル計算装置は、文脈ベクトル計算部を含む。文脈ベクトル計算部は、複数のテキストを含む対象テキスト群の文脈ベクトルを、機械学習済みのニューラルネットワークを用いて計算する。ニューラルネットワークは、複数の学習データを用いて行われた機械学習の結果が設定されている。複数の学習データは、それぞれ、入力データとしてのテキスト群のペアと、テキスト群のペアが類似する文脈を示唆するか、それとも類似しない文脈を示唆するかを表す教師データとを含む。

本発明によれば、対象のテキスト群と類似の文脈を示唆するテキスト群を抽出することができる。

実施形態に係るテキスト抽出装置を例示するブロック図。ユーザの再生端末における表示画面例を示す図。図２の表示画面から抽出される対象テキスト群を例示する図。図１の文脈ベクトル計算部によって計算される、対象テキスト群の文脈ベクトルの説明図。図２の対象テキスト群に基づいて抽出される類似テキストを例示する図。図２の対象テキスト群に基づいて抽出される類似テキスト群を例示する図。図１のテキスト抽出装置の動作を例示するフローチャート。図１のテキスト抽出装置を含むコメント投稿装置を例示するブロック図。図１のテキスト抽出装置を含む再生端末を例示するブロック図。図８のコメント投稿装置および図９の再生端末を含むコンテンツ配信システムを例示するブロック図。

以下、図面を参照しながら実施形態の説明を述べる。なお、以降、説明済みの要素と同一または類似の要素には同一または類似の符号を付し、重複する説明については基本的に省略する。

（実施形態）
本発明の実施形態に係るテキスト抽出装置は、機械学習済みのＮＮ（ＮｅｕｒａｌＮｅｔｗｏｒｋ）を用いて、複数のテキストを含む入力テキスト群（以降、対象テキスト群と称される）の示唆する文脈を定量化する文脈ベクトルを計算する。

本実施形態において、テキストとは、単語、フレーズ、文、文章など、文字からなる任意の情報単位を意味し得る。

対象テキスト群は、例えばコンテンツ配信サービスにおいて配信されるコンテンツ、典型的には動画像、の再生に同期して表示される複数のコメントから抽出され得る。

ここで、コンテンツの再生に同期して表示されるとは、コメントがコンテンツの再生位置によって定められる時間的位置（時刻）に表示されることを意味する。そして、このテキスト抽出装置は、複数の候補テキスト群のうち、対象テキスト群の文脈ベクトルに類似する文脈ベクトルを持つもの（以降、類似テキスト群と称される）を探索する。

これにより、このテキスト抽出装置は、複数の候補テキスト群から、対象テキスト群と類似の文脈を示唆する類似テキスト群を抽出することができる。抽出された類似テキスト群は、例えば、対象テキスト群の抽出されたコンテンツに新規コメントとして自動投稿するために用いられてもよいし、当該コンテンツを視聴するユーザによるコメント投稿を支援するための投稿可能コメントとして用いられてもよい。

なお、コメントに加えて、或いは、コメントの代わりに、タイトル、説明文、タグ、カテゴリなどのコンテンツに付与されるメタデータに関わるテキストを対象に同様の処理を行ってもよい。ただし、タイトル、説明文、タグおよびカテゴリは、コンテンツの全体に付与されるのに対して、コメントは、コンテンツ中の限られた部分に対して付与されるので当該コンテンツの局所的な文脈が反映されやすい。

図１に例示されるように、実施形態に係るテキスト抽出装置１００は、テキスト群入力部１０１と、文脈ベクトル計算部１０２と、ＮＮ１０３と、類似度計算部１０４と、候補テキスト群記憶部１０５と、類似度記憶部１０６と、類似テキスト群探索部１０７とを含む。

テキスト抽出装置１００は、典型的にはコンピュータであるが、これらに限られない。テキスト抽出装置１００は、文脈ベクトルの計算、類似度の計算、類似テキスト群の探索などを行うプロセッサ、例えばＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）およびＧＰＵ（ＧｒａｐｈｉｃａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）と、かかる処理を実現するために当該プロセッサによって実行されるプログラムおよび当該プロセッサによって使用されるデータなどを一時的に格納するメモリとを含んでいる。

テキスト抽出装置１００は、さらに、ネットワークに接続するための通信装置と、ユーザ入力を受け付けるための入力装置と、プログラムまたはデータを保存する補助記憶装置とを利用可能である。これらの通信装置、入力装置および補助記憶装置は、テキスト抽出装置１００に内蔵されていてもよいし、テキスト抽出装置１００に外付けされてもよい。

通信装置は、ネットワーク経由で、Ｗｅｂサーバ、コンテンツ配信サーバ、コメント配信サーバなどの外部装置と通信をする。

入力装置は、例えば、キーボード、マウス、テンキー、リモートコントローラ、マイクロフォンなどであってもよいし、タッチスクリーンのように表示装置の機能を備えていてもよい。ユーザ入力は、典型的には、テキスト入力、または音声入力であり得る。音声入力は、ＡＳＲ（ＡｕｔｏｍａｔｉｃＳｐｅｅｃｈＲｅｃｏｇｎｉｔｉｏｎ）を利用してテキストに変換可能である。

補助記憶装置は、例えば、プログラムまたはデータを格納する。補助記憶装置は、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）などの不揮発性記憶媒体であることが好ましい。補助記憶装置は、テキスト抽出装置１００にネットワーク経由で接続されたファイルサーバであり得る。

テキスト群入力部１０１は、対象テキスト群を獲得し、これを文脈ベクトル計算部１０２へ送る。テキスト群入力部１０１は、以下に説明する手法（１）〜（３）、またはその他の手法で、対象テキスト群を獲得することができる。テキスト群入力部１０１は、前述の入力装置若しくは通信装置、またはこれらとのインターフェースであってもよいし、前述のプロセッサおよびメモリであってもよい。

（１）テキスト群入力部１０１は、例えば前述の入力装置を操作してユーザが入力したテキスト群を獲得してもよい。かかる対象テキスト群に基づいて抽出した類似テキスト群を、自動投稿のために用いたり、コメント投稿を支援するための投稿可能コメントとして用いたりすれば、ユーザは、直接入力したコメント群に加えて、これらと類似の文脈を示唆するコメント群が投稿可能となる。これにより、ユーザは、軽い入力負荷で、自分が盛り上げたいコンテンツに対し、その時々の文脈にふさわしいコメントを多数投稿することができる。

（２）テキスト群入力部１０１は、例えば、コンテンツの再生中に、当該コンテンツの再生に同期して表示されるコメント群の少なくとも一部を対象テキスト群として獲得してもよい。テキスト群入力部１０１は、コメント群を、例えばバッファ（メモリ）から読み出す。かかる対象テキスト群に基づいて抽出した類似テキスト群を、コメント投稿を支援するための投稿可能コメントとして用いれば、ユーザに再生中のコンテンツの文脈にふさわしい投稿可能コメントを提示することができる。これにより、ユーザは、自ら文章を考えなくても、提示された投稿可能コメントのうち気に入ったものを選択するだけで、コメントを投稿することができる。すなわち、コメント投稿に対するユーザの心理的ハードルを下げることができる。

なお、抽出可能なテキスト群は、抽出時のコンテンツの再生位置を基準に設定されたタイムウィンドウに含まれる位置（表示時刻）で表示されるコメントに限られてよい。このように抽出されたテキスト群は、コンテンツのこのタイムウィンドウ内の文脈を示唆する可能性が高い。

図２に、ユーザの再生端末における表示画面例が示される。動画像表示領域には、動画像に加えてコメントが重ね表示される。各コメントは、当該コメントが表示される再生位置（表示時刻）が定められている。図２の例では、動画像表示領域の右側にコメントとその表示時刻とが一覧可能なテーブルを表示する領域が用意されている。動画像表示領域の上側には、例えば動画タイトル、説明文、動画の種類を表す動画カテゴリ、動画に対してユーザが付与したキーワードである動画タグ、などのメタデータを表示する領域が用意されている。他方、動画像表示領域の下側には、動画像の現在の再生位置を示すシークバー、および再生／停止などの再生制御のためのボタンを表示する領域が用意されている。

図２の例において、現在の再生時間（００：０１：００）の例えば直前５秒間にタイムウィンドウが設定されたとすると、テキスト群入力部１０１は、図３に例示されるように、「ロンドネタ混ぜていくｗ」、「夜の攻撃回数」、「廃課金兵どもめぇｗ」および「自分の出番は？」の４つのコメントを対象テキスト群として抽出できる。なお、動画カテゴリである「スポーツ」は、対象テキスト群の一部として含まれてもよいし、対象テキスト群とは別の付加的な、コンテンツの属性情報として扱われてもよい。

（３）テキスト群入力部１０１は、例えばコンテンツ配信サービスにおいて配信される特定のコンテンツを指定する情報を受け取り、このコンテンツに関連付けられるテキスト群をコメント配信サーバから獲得（例えばネットワーク経由で受信）してもよい。かかる対象テキスト群に基づいて抽出した類似テキスト群を、自動投稿のために用いれば、特定のコンテンツに対し、その時々の文脈にふさわしいコメントを多数投稿して盛り上げることができる。特定のコンテンツは、例えば、新規に投稿されたコンテンツ、コメント数の伸び悩んでいるコンテンツ、コメント数の落ち込み始めたコンテンツなどであり得る。

なお、抽出可能なテキスト群は、コンテンツの特定の再生位置を基準に設定されたタイムウィンドウに含まれる位置（表示時刻）で表示されるコメントに限られてよい。このように抽出されたテキスト群は、コンテンツのこのタイムウィンドウ内の文脈を示唆する可能性が高い。特定の再生位置は、特定のコンテンツと共に明示的に指定されてもよいし、予め定められていてもよいし、例えばコメント数の分布などに基づいて自動的に決定されてもよい。

文脈ベクトル計算部１０２は、テキスト群入力部１０１から対象テキスト群を受け取り、この対象テキスト群の文脈ベクトルを、機械学習済みのＮＮ１０３を用いて計算する。例えば、文脈ベクトル計算部１０２は、対象テキスト群に含まれる各テキストをＮＮ１０３へ与え、そして、ＮＮ１０３からテキスト毎の文脈ベクトルを受け取り、これらを合成することで対象テキスト群の文脈ベクトルを計算してもよい。文脈ベクトル計算部１０２は、対象テキスト群の文脈ベクトルを類似度計算部１０４へ送る。文脈ベクトル計算部１０２は、前述のプロセッサおよびメモリであり得る。

ＮＮ１０３は、入力テキストを文脈ベクトルへ変換する能力を獲得するための機械学習の学習結果（学習済みモデル）が設定されたニューラルネットワークである。この機械学習については後述する。ＮＮ１０３は、前述のプロセッサ（通常はＧＰＵ）およびメモリであり得る。

ここで、対象テキスト群Ｔを、ｎ個のテキストｔ［１］，ｔ［２］，・・・，ｔ［ｎ］の集合であるとする。ｎは、２以上の任意の自然数であって、可変値であり得る。図３の例ではｎ＝４である。対象テキスト群Ｔの要素であるテキストｔ［１］，ｔ［２］，・・・，ｔ［ｎ］は、それぞれ、図４に示すように、機械学習済みのＮＮ１０３（ｇ）に与えられ、文脈ベクトルｇ［１］，ｇ［２］，・・・，ｇ［ｎ］へと変換される。文脈ベクトルはｄ次元実ベクトルであって、ｄは設計により定められ得る。

文脈ベクトル計算部１０２は、これら文脈ベクトルｇ［１］，ｇ［２］，・・・，ｇ［ｎ］を合成することで、対象テキスト群Ｔの文脈ベクトルｇ［Ｔ］を計算する。合成とは、複数の文脈ベクトルを１つに統合する演算を指す。具体的には、単に複数の文脈ベクトルの和を計算することであってもよいし、複数の文脈ベクトルを用いて畳み込み演算を行うことであってもよい。以降の説明では、対象テキスト群Ｔの文脈ベクトルｇ［Ｔ］を、便宜的に、第１の文脈ベクトルと称することがある。

類似度計算部１０４は、文脈ベクトル計算部１０２から第１の文脈ベクトルを受け取り、候補テキスト群記憶部１０５から複数（Ｍ群）の候補テキスト群の文脈ベクトルを読み出す。以降の説明では、候補テキスト群の文脈ベクトルを、便宜的に、第２の文脈ベクトルと称することがある。

候補テキスト群の群数であるＭは、２以上の任意の自然数であるが類似テキスト群の探索範囲を規定するので、ある程度大きいことが好ましい。これら候補テキスト群は、例えば大量のコンテンツに関連付けられるテキスト群を、対象テキスト群と同様の抽出法で、予め抽出することにより収集可能である。各候補テキスト群に含まれるテキストの数は、任意の自然数であり、ばらばらであってもよいし、全て同じであってもよい。また、これら候補テキスト群の文脈ベクトルは、第１の文脈ベクトルと同様の計算法で、予め計算することができる。これら候補テキスト群Ｓ［１］，Ｓ［２］，・・・，Ｓ［Ｍ］と、その文脈ベクトルｇ［Ｓ［１］］，ｇ［Ｓ［２］］，・・・，ｇ［Ｓ［Ｍ］］により、類似テキスト群を探索するためのコーパスを以下の様に構築する。
Ｃｏｒｐｕｓ＝｛（Ｓ［１］，ｇ［Ｓ［１］］），（Ｓ［２］，ｇ［Ｓ［２］］），・・・，（Ｓ［Ｍ］，ｇ［Ｓ［Ｍ］］）｝
類似度計算部１０４は、第１の文脈ベクトルに対するＭ個の第２の文脈ベクトルそれぞれの類似度を計算する。類似度は、ベクトル間の類似性を評価するための任意の指標であってよく、典型的には、コサイン類似度、または正規化された文脈ベクトル間のユークリッド距離である。第１の文脈ベクトルｇ［Ｔ］に対する第ｉ番目の候補テキスト群の第２の文脈ベクトルｇ［Ｓ［ｉ］］のコサイン類似度は、ｃｏｓ（ａｒｇ（ｇ［Ｔ］，ｇ［Ｓ［ｉ］］））で定義される。ｉはＭ以下の任意の自然数である。類似度計算部１０４は、各候補テキスト群を識別する情報（例えばｉの値）に、第１の文脈ベクトルと当該候補テキスト群の第２の文脈ベクトルとの類似度を関連付けて類似度記憶部１０６に保存する。類似度計算部１０４は、前述のプロセッサおよびメモリであり得る。

なお、Ｍ個の第２の文脈ベクトルの全てについて、類似度を計算することは必須ではない。例えば、大量のデータから類似するインスタンスのペアを高速に抽出するアルゴリズムとして、局所鋭敏型ハッシュ（ＬＳＨ：ＬｏｃａｌｉｔｙＳｅｎｓｉｔｉｖｅＨａｓｈｉｎｇ）が知られている。このアルゴリズムは、ベクトルを入力してスカラ値を出力するように定義されたハッシュ関数を用いる。このハッシュ関数は、類似するベクトルが入力された場合に同一のスカラ値を返しやすいという特徴がある。故に、Ｍ個の第２の文脈ベクトルについてスカラ値を予め計算して候補テキスト群記憶部１０５に保存しておき、ハッシュ関数を用いて第１の文脈ベクトルのスカラ値を計算し、このスカラ値と同一のスカラ値に関連付けられる第２の文脈ベクトルを抽出してから類似度計算部１０４に与えるようにしてもよい。類似度計算部１０４は、抽出された第２の文脈ベクトルに限って類似度を計算することで、計算量を大幅に低減することができる。

候補テキスト群記憶部１０５には前述のコーパスが構築されており、類似度計算部１０４によってコーパス、または第２の文脈ベクトルを読み出される。また、類似テキスト群探索部１０７によって類似テキスト群に相当する候補テキスト群を読み出される。候補テキスト群記憶部１０５は、前述の補助記憶装置であり得る。

類似度記憶部１０６は、類似度計算部１０４によって類似度（および対応する候補テキスト群を識別する情報）を書き込まれ、類似テキスト群探索部１０７によってこれを読み出される。類似度記憶部１０６は、前述のメモリであり得る。

類似テキスト群探索部１０７は、類似度記憶部１０６に記憶された類似度に基づいて、対象テキスト群と文脈ベクトルに関して類似する候補テキスト群である類似テキスト群を探索する。具体的には、類似テキスト群探索部１０７は、対象テキスト群と文脈ベクトルに関して最も類似する候補テキスト群を探索してもよいし、対象テキスト群と文脈ベクトルに関して類似する順に所定数の候補テキスト群を探索してもよいし、類似度が所定の数値条件を満足する候補テキスト群を探索してもよい。

なお、類似度の定義次第で、類似度が小さいほど、第１の文脈ベクトルと第２の文脈ベクトルとが類似すること意味し得る点に注意を要する。具体的には、コサイン類似度は、その値が大きいほど第１の文脈ベクトルと第２の文脈ベクトルとが類似すること意味するが、正規化された文脈ベクトル間のユークリッド距離は、その値が小さいほど第１の文脈ベクトルと第２の文脈ベクトルとが類似すること意味する。

類似テキスト群探索部１０７は、探索した１つまたは複数の類似テキスト群を候補テキスト群記憶部１０５から読み出し、これを出力する。類似テキスト群探索部１０７は、前述のプロセッサおよびメモリであり得る。

出力された類似テキスト群は、対象テキスト群の抽出されたコンテンツに新規コメントとして自動投稿するために用いられてもよいし、当該コンテンツを視聴するユーザによるコメント投稿を支援するための投稿可能コメントとして用いられてもよい。

図３の対象テキスト群に基づいて抽出される類似テキスト群、より具体的には類似コメント群、が図６に例示される。図６では、５つの類似テキスト群が正規化された文脈ベクトル間のユークリッド距離の昇順、すなわち、対象テキスト群と文脈ベクトルに関して類似する順に、ソートされている。

なお、候補テキスト群の代わりに、候補テキスト単位で探索が行われてもよい。これにより、対象テキスト群と文脈ベクトルに関して類似する候補テキストである類似テキストを抽出することができる。これは、各候補テキスト群に含まれるテキストの数を全て１とした場合と等価である。或いは、類似テキスト群を一旦抽出してから、類似テキスト群に属するテキストから類似テキストをさらに抽出してもよい。これにより、候補テキスト単位で探索を行う場合に比べて、類似度の計算および類似テキストの探索に伴う計算量を削減することができる。

図５に、図３の対象テキスト群に基づいて抽出される類似テキスト、より具体的には類似コメント、が例示される。図５では、５つの類似テキストが正規化された文脈ベクトル間のユークリッド距離の昇順、すなわち、対象テキスト群と文脈ベクトルに関して類似する順に、ソートされている。

図５および図６の例では、対象テキスト群が抽出されたコンテンツ（動画像）に関連付けられるカテゴリ「スポーツ」とは異なるカテゴリ「ゲーム」または「エンターテイメント」に関連付けられるコンテンツから抽出された候補テキスト（群）が、類似テキスト（群）として抽出されている。このように、文脈ベクトルに関する類似度を基準として用いることで、カテゴリの異なる動画像から抽出された候補テキスト（群）であっても、類似テキスト（群）の候補とすることができる。

以下、入力テキストを文脈ベクトルへ変換する能力を獲得するための機械学習について説明する。この機械学習を実行するＮＮは、ＮＮ１０３と同一であってもよいし、異なってもよい。いずれにせよ、ＮＮ１０３にはこの機械学習の学習結果が設定される。

この機械学習は、第１のテキスト群と第２のテキスト群とが類似の文脈を示唆する場合には、当該第１のテキスト群の文脈ベクトルと当該第２のテキスト群の文脈ベクトルとが類似するように、例えばコサイン類似度が０に比べて十分大きくなるように、文脈ベクトルを計算することを目指す。他方、この機械学習は、第１のテキスト群と第２のテキスト群とが類似しない文脈を示唆する場合には、当該第１のテキスト群の文脈ベクトルと当該第２のテキスト群の文脈ベクトルとが類似しないように、例えばコサイン類似度が１に比べて十分小さくなるように、文脈ベクトルを計算することを目指す。

かかる学習目標を達成するために、それらの示唆する文脈が類似するテキスト群のペアを入力データとし、両テキスト群が類似であることを表す類似度の値（コサイン類似度であれば１）を教師データとする第１の学習データ（ｐｏｓｉｔｉｖｅｄａｔａ）と、それらの示唆する文脈が類似しないテキスト群のペアを入力データとし、両テキスト群が非類似であることを表す類似度の値（コサイン類似度であれば０）を教師データとする第２の学習データ（ｎｅｇａｔｉｖｅｄａｔａ）とを用いて機械学習を行う。なお、この機械学習が妥当な文脈ベクトルを計算できるようにするためには、第１の学習データおよび第２の学習データそれぞれ十分な件数揃えることが好ましいが、一方の学習データを十分には揃えられなかったとしても相応の効果は期待できる。

第１の学習データおよび第２の学習データに含まれる入力データは、例えば、ユーザが動画像に対してコメントを投稿することができる動画像配信サービスの提供事業者によって蓄積された膨大なコメントデータから抽出することができる。

それらの示唆する文脈が類似するテキスト群のペアは、同一のコンテンツに対して投稿されたコメントから抽出することができる。なお、文脈は、コンテンツの再生位置に依存して変化し得る。故に、コンテンツの任意の再生位置の近傍にあるコメントを抽出して２群に分けることで、類似の文脈を示唆する可能性の高いテキスト群のペアを得ることができる。或いは、それらの示唆する文脈が類似するテキスト群のペアは、同じメタデータに関連付けられる（例えば、同じカテゴリに属する）２つのコンテンツに対して投稿されたコメントから抽出することもできる。

それらの示唆する文脈が類似しないテキスト群のペアは、例えば異なるメタデータにそれぞれ関連付けられる（例えば、異なるカテゴリにそれぞれ属する）２つのコンテンツに対して投稿されたコメントからそれぞれ抽出することができる。

なお、いずれの場合にも、抽出されたテキスト群の間でコメントは交差しないようにする。

かかる機械学習を行うことで、学習対象のＮＮは、例えば、同一のコンテンツに対して投稿されたコメントから抽出されたテキスト群のペア、または同じメタデータに関連付けられる２つのコンテンツに対して投稿されたコメントから抽出されたテキスト群のペアに対して、両テキスト群の文脈ベクトルが類似するように文脈ベクトルを計算することができるようになる。他方、このＮＮは、例えば、異なるメタデータにそれぞれ関連付けられる２つのコンテンツに対して投稿されたコメントからそれぞれ抽出されたテキスト群のペアに対して、両テキスト群の文脈ベクトルが類似しないように文脈ベクトルを計算することができるようになる。

以下、図７を用いて、テキスト抽出装置１００の動作例を説明する。
まず、テキスト群入力部１０１は、対象テキスト群を獲得する（ステップＳ２０１）。対象テキスト群は、前述のように様々な手法により獲得され得る。文脈ベクトル計算部１０２は、機械学習済みのＮＮ１０３を用いて、ステップＳ２０１において獲得された対象テキスト群の第１の文脈ベクトルを計算する（ステップＳ２０２）。

類似度計算部１０４は、ステップＳ２０２において計算された第１の文脈ベクトルに対する、複数の候補テキスト群の第２の文脈ベクトルそれぞれの類似度を計算する（ステップＳ２０３）。類似テキスト群探索部１０７は、ステップＳ２０３において計算された類似度に基づいて、対象テキスト群と文脈ベクトルに関して類似する候補テキスト群である類似テキスト群を探索し（ステップＳ２０４）、処理は終了する。

図１のテキスト抽出装置１００は、図８に例示されるように、コメント投稿装置３００に組み込まれてもよい。このコメント投稿装置３００は、受信部３０１と、テキスト抽出装置１００と、送信部３０２とを含む。このコメント投稿装置３００は、コンテンツに関連付けられるコメントを自動的に生成して投稿する。

コメント投稿装置３００は、典型的にはコンピュータであるが、これに限られない。コメント投稿装置３００は、図１のテキスト抽出装置の機能に相当するテキスト抽出処理、および通信制御などを行うプロセッサ、例えばＣＰＵおよびＧＰＵと、かかる処理を実現するために当該プロセッサによって実行されるプログラムおよび当該プロセッサによって使用されるデータなどを一時的に格納するメモリとを含んでいる。

コメント投稿装置３００は、さらに、ネットワークに接続するための通信装置を利用可能である。通信装置は、ネットワーク経由で、再生端末、コンテンツ配信サーバ、コメント配信サーバなどの外部装置と通信をする。通信装置は、コメント投稿装置３００に内蔵されていてもよいし、コメント投稿装置３００に外付けされてもよい。

受信部３０１は、例えば、コメントを投稿する対象となるコンテンツを特定する情報を受信する。かかるコンテンツは、ユーザまたはコンテンツ配信サービスの運営者によって意図的に選択されてもよいし、何らかのアルゴリズムに従って自動的に選択されてもよい。受信部３０１は、さらに、かかるコンテンツに関連付けられる複数のテキスト、すなわち対象テキスト群の候補または対象テキスト群そのものを受信することもできる。ここで、複数のテキストは、例えばコンテンツに関連付けられるコメント、タイトル、説明文、タグ、カテゴリなどのメタデータを含み得る。なお、図８のコメント投稿装置３００が、コンテンツに付与されるコメントなどのメタデータを配信するサーバに組み込まれているならば、当該メタデータを外部装置から受信する必要はない。受信部３０１は、コンテンツを特定する情報をテキスト抽出装置１００へ送る。受信部３０１は、前述の通信装置であってもよいし、当該通信装置とのインターフェースであってもよい。

テキスト抽出装置１００は、受信部３０１から受け取った情報によって特定されるコンテンツに関連付けられる複数のテキストを対象テキスト群として抽出し、それからこの対象テキスト群に文脈ベクトルに関して類似する類似テキスト群を探索する。テキスト抽出装置１００は、類似テキスト群に含まれるテキストの少なくとも１つを送信部３０２へ送る。

送信部３０２は、テキスト抽出装置１００から少なくとも１つのテキストを受け取り、これをコンテンツに関連付けられるコメントとして、例えばコメント配信サーバへ投稿のために送信する。送信部３０２は、前述の通信装置であってもよいし、当該通信装置とのインターフェースであってもよい。

なお、送信部３０２が、テキスト抽出装置１００から受け取った少なくとも１つのテキストを投稿可能コメントとして、コンテンツを再生する再生端末へ送信してもよい。かかる変形によれば、図８のコメント投稿装置３００を、ユーザによるコメント投稿を支援するコメント投稿支援装置として構成することができる。

図１のテキスト抽出装置１００は、図９に例示されるように、再生端末４００に組み込まれてもよい。この再生端末４００は、受信部４０１と、バッファ４０２と、再生部４０３と、出力部４０４と、ユーザ入力部４０５と、テキスト抽出装置１００と、送信部４０６とを含む。

再生端末４００は、（１）再生中のコンテンツに関してユーザが入力したテキストに基づいて、当該コンテンツに対するコメントを自動生成して投稿する機能、ならびに（２）再生中のコンテンツに関してユーザが入力したテキスト、または、再生中のコンテンツに関連付けられる受信テキストに基づいて、投稿可能コメントを自動生成してコンテンツと共に出力し、ユーザの選択に応じて投稿可能コメントを実際に投稿する機能、のうち両方または一方を備える。

再生端末４００は、典型的には、テレビ受像機（インターネットテレビを含む）、ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）、モバイル端末（例えば、タブレット、スマートフォン、ラップトップ、フィーチャーフォン、ポータブルゲーム機、デジタルミュージックプレイヤー、電子書籍リーダなど）、ＶＲ（ＶｉｒｔｕａｌＲｅａｌｉｔｙ）端末、ＡＲ(ＡｕｇｍｅｎｔｅｄＲｅａｌｉｔｙ)端末であるが、これらに限られない。

再生端末４００は、コンテンツの再生制御、当該再生端末４００に接続された出力装置に対する出力制御、ユーザ入力に対するデータ処理、図１のテキスト抽出装置の機能に相当するテキスト抽出処理、および通信制御などを行うプロセッサ、例えばＣＰＵおよびＧＰＵと、かかる処理を実現するために当該プロセッサによって実行されるプログラムおよび当該プロセッサによって使用されるデータなどを一時的に格納するメモリとを含んでいる。

再生端末４００は、さらに、ネットワークに接続するための通信装置と、コンテンツなどを出力するための出力装置と、ユーザ入力を受け付けるための入力装置と、プログラムまたはデータを保存する補助記憶装置とを利用可能である。これらの通信装置、出力装置、入力装置および補助記憶装置は、再生端末４００に内蔵されていてもよいし、再生端末４００に外付けされてもよい。

通信装置は、ネットワーク経由で、Ｗｅｂサーバ、コンテンツ配信サーバ、コメント配信サーバ、コメント投稿装置３００などの外部装置と通信をする。

出力装置は、動画像、静止画像、テキストなどを表示するための表示装置および／または音声、楽曲などを出力するためのスピーカを含み得る。表示装置は、例えば、液晶ディスプレイ、有機ＥＬ（ｅｌｅｃｔｒｏｌｕｍｉｎｅｓｃｅｎｃｅ）ディスプレイ、ＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）ディスプレイなどである。表示装置は、コンテンツを含む表示データを表示する。なお、表示装置は、タッチスクリーンのように入力装置の機能を備えていてもよい。

入力装置は、例えば、キーボード、マウス、テンキー、リモートコントローラなどであってもよいし、タッチスクリーンのように表示装置の機能を備えていてもよい。ユーザ入力は、典型的には、タップ、クリック、特定のキーの押下などであり得る。このほか、ユーザ入力は、例えば、マイクロフォンによって捉えられる音声、生体センサによって検出される生体データ（例えば体温、表情など）、ＧＰＳ（ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ）または基地局情報によって識別される位置データ、加速度センサによって検出される加速度データに基づいて推定されるユーザのアクション（例えば、再生端末４００を振り回した）などを含むこともできる。

補助記憶装置は、例えば、プログラムまたはデータを格納する。補助記憶装置は、例えば、ＨＤＤ、ＳＳＤなどの不揮発性記憶媒体であることが好ましい。補助記憶装置は、再生端末４００にネットワーク経由で接続されたファイルサーバであり得る。

受信部４０１は、再生対象のコンテンツを、例えばコンテンツ配信サーバから受信する。再生対象のコンテンツは、ユーザによって意図的に選択されてもよいし、何らかのアルゴリズムに従って自動的に選択されてもよい。受信部４０１は、受信コンテンツをバッファ４０２へ送る。受信部４０１は、さらに、再生対象のコンテンツに付与されたメタデータを、例えばコメント配信サーバまたはその他のメタデータ配信サーバから受信してもよい。このメタデータは、再生対象のコンテンツに関連付けられるコメント、タイトル、説明文、タグ、カテゴリなどのテキストを含み得る。受信部４０１は、メタデータを受信した場合には、受信メタデータをバッファ４０２へ送る。受信部４０１は、前述の通信装置であってもよいし、当該通信装置とのインターフェースであってもよい。

バッファ４０２は、受信部４０１からのデータ、すなわち受信コンテンツ、および／または受信メタデータを一時的に保存する。バッファ４０２は、保存しているデータを、再生部４０３からの要求に応じて、再生部４０３へ送る。このとき、バッファ４０２は、保存しているメタデータをテキスト抽出装置１００へも送ってよい。バッファ４０２は、前述のメモリであり得る。

再生部４０３は、バッファ４０２から必要に応じてデータを読み出す。再生部４０３は、バッファ４０２から読み出したコンテンツを再生し、再生したコンテンツを定められたタイミングで出力部４０４へ送る。コンテンツの再生は、例えば、符号化されたビデオデータ、音声データなどのコンテンツの復号、復号されたビデオデータおよびメタデータに基づく表示データの生成、例えば復号ビデオデータにコメントを合成する処理、などを含み得る。再生部４０３は、ユーザ入力部４０５からコンテンツの再生制御に関するユーザ入力を受け取り、これに応じてコンテンツを再生／停止したり、コンテンツの再生状態を指定された再生位置へジャンプさせたりしてもよい。再生部４０３は、前述のプロセッサおよびメモリであり得る。

出力部４０４は、再生部４０３から再生されたコンテンツ、例えば表示データおよび／または音声データを出力する。さらに、出力部４０４は、テキスト抽出装置１００から、少なくとも１つのテキストを投稿可能コメントとして受け取り、これをコンテンツと共に出力してもよい。出力部４０４は、前述の出力装置であってもよいし、当該出力装置とのインターフェースであってもよい。

ユーザ入力部４０５は、様々なユーザ入力を受け取る。例えば、ユーザ入力部４０５は、コンテンツの再生制御に関するユーザ入力を受け取り、これを再生部４０３に送ってもよい。ユーザ入力部４０５は、再生中のコンテンツに関連付けられるテキストを投稿するためのユーザ入力を受け取り、これを送信部４０６へ送ってもよい。かかるユーザ入力は、直接的なテキスト入力に限られず、出力部４０４によって出力された投稿可能コメントへの選択入力であり得る。さらに、ユーザ入力部４０５は、再生中のコンテンツに関連付けられるテキストとして投稿するためにユーザによって直接入力されたテキストを、対象テキスト群の候補としてテキスト抽出装置１００へ送ってもよい。ユーザ入力部４０５は、前述の入力装置であってもよいし、当該入力装置とのインターフェースであってもよい。

テキスト抽出装置１００は、再生中のコンテンツに付与されたメタデータをバッファ４０２から受け取ってよいし、当該コンテンツに関連付けられるテキストとして投稿するためにユーザによって直接入力されたテキストをユーザ入力部４０５から受け取ってもよい。いずれにせよ、テキスト抽出装置１００は、対象テキスト群に文脈ベクトルに関して類似する類似テキスト群を探索し、類似テキスト群に含まれるテキストのうち少なくとも１つを、投稿可能コメントとして出力部４０４へ送るか、コメント投稿のために送信部４０６へ送るかする。

送信部４０６は、テキスト抽出装置１００から少なくとも１つのテキストを受け取り、これを再生中のコンテンツに関連付けられるコメントとして投稿するために、例えばコメント配信サーバへ送信する。また、送信部４０６は、ユーザによって直接入力されたテキストを受け取り、これを再生中のコンテンツに関連付けられるテキストとして投稿するために、例えばコメント配信サーバまたはその他のメタデータ配信サーバへ送信してもよい。送信部４０６は、前述の通信装置であってもよいし、当該通信装置とのインターフェースであってもよい。

図８のコメント投稿装置３００および図９の再生端末４００は、図１０に例示されるコンテンツ配信システムへ組み込むことができる。このコンテンツ配信システムは、コメント投稿装置３００と、再生端末４００と、Ｗｅｂサーバ５０１と、コンテンツ配信サーバ５０２と、コメント配信サーバ５０３とを含む。

図１０の各装置は、ネットワーク経由で互いに接続しており、データを互いに送受信できる。なお、図１０の各装置の数は、１つに限られず複数であり得る。また、図１０に示されるサーバ構成は例示に過ぎず、１つのサーバの機能が複数の装置によって分担されてもよいし、複数のサーバの機能が１つの装置に割り当てられてもよい。

Ｗｅｂサーバ５０１は、再生端末４００からネットワーク経由でアクセスされると、図１０のコンテンツ配信システムから配信可能なコンテンツが列挙されたリストを含むウェブページを当該再生端末４００にネットワーク経由で提供する。

再生端末４００のユーザは、当該再生端末４００に表示されたウェブページ中のリストから配信を希望するコンテンツを、例えば、タップ、クリック、特定のキーの押下などの所定の操作を行うことで選択する。再生端末４００は、このような所定の操作を検知すると、ユーザによって選択されたコンテンツの配信要求をＷｅｂサーバ５０１へとネットワーク経由で送信する。

Ｗｅｂサーバ５０１は、ネットワーク経由で再生端末４００からコンテンツの配信要求を受信すると、当該コンテンツを取得するための情報（典型的にはＵＲＬ（ＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＬｏｃａｔｏｒ））と、当該コンテンツに関連付けられるコメント（および／またはその他のメタデータ）を取得するための情報（典型的にはＵＲＬ）とを当該再生端末４００へとネットワーク経由で返信する。

再生端末４００は、ネットワーク経由でＷｅｂサーバ５０１から前述の情報を受信すると、コンテンツを取得するための情報を用いてコンテンツ配信サーバ５０２にネットワーク経由でアクセスし、コメントを取得するための情報を用いてコメント配信サーバ５０３にネットワーク経由でアクセスする。

コンテンツ配信サーバ５０２およびコメント配信サーバ５０３は、それぞれ、再生端末４００からネットワーク経由でコンテンツおよびコメントの配信要求を受けると、当該再生端末４００の用いた情報に関連付けられたコンテンツおよびコメントを当該再生端末４００へとネットワーク経由で配信する。

コンテンツ配信サーバ５０２は、再生端末４００からネットワーク経由でコンテンツの配信要求を受けると、当該配信要求の対象となるコンテンツを特定し、当該再生端末４００へとネットワーク経由で配信する。コンテンツ配信サーバ５０２は、典型的には、大量の録画済みの動画像データと、それぞれのコンテンツを取得するための情報（典型的にはＵＲＬ）とを関連付けて記憶部に格納している。

なお、コンテンツ配信サーバ５０２は、生配信機能を備えていてもよい。すなわち、コンテンツ配信サーバ５０２は、図示されない送信源（例えば、ビデオカメラに接続されたコンピュータ）から送信される動画像データをネットワーク経由で順次受信し、そのままもしくは必要な加工を行ってから、当該動画像データを再生中の再生端末４００へとネットワーク経由で配信してもよい。テキスト抽出装置１００は、かかる生配信されるコンテンツに関連付けられるテキストも対象テキスト群として扱うことができる。また、コメント投稿装置３００および再生端末４００は、かかる生配信コンテンツに関連付けられるコメントの自動投稿またはその支援が可能となる。

コメント配信サーバ５０３は、再生端末４００からネットワーク経由でコメントデータの配信要求を受けると、当該配信要求の対象となるコメントを特定し、当該再生端末４００へとネットワーク経由で配信する。コメント配信サーバ５０３は、コンテンツ配信サーバ５０２から配信可能なコンテンツのそれぞれに関連付けられるコメントと、当該コメントを取得するための情報（典型的にはＵＲＬ）を関連付けて記憶部に格納している。

コメント配信サーバ５０３は、再生端末４００またはコメント投稿装置３００によって投稿された新たなコメントをネットワーク経由で受信すると、当該新たなコメントを追加して、コンテンツに関連付けられるコメントを更新する。コメント配信サーバ５０３は、更新後のコメントを、更新前のコメントを配信済みの再生端末４００へネットワーク経由で自動配信してもよい。

再生端末４００は、Ｗｅｂサーバ５０１からネットワーク経由で提供されたウェブページを表示し、当該ウェブページの表示中にユーザによってなされたコンテンツを選択する操作を検知し、当該コンテンツの配信要求をＷｅｂサーバ５０１へとネットワーク経由で送信する。

再生端末４００は、このコンテンツを取得するための情報と当該コンテンツに関連付けられるコメントを取得するための情報とをＷｅｂサーバ５０１からネットワーク経由で受信し、これらの情報を用いてコンテンツ配信サーバ５０２およびコメント配信サーバ５０３にそれぞれネットワーク経由でアクセスする。

なお、再生端末４００がコンテンツを再生している間に、コメント配信サーバ５０３から当該コンテンツに関連付けられる最新のコメントデータが配信される可能性がある。この場合に、再生端末４００は、古いコメントを破棄し、最新のコメントを用いてコンテンツの再生制御を行うようにすればよい。

コメント投稿装置３００は、再生端末４００またはその他の装置からの要求に応じて、コメント配信サーバ５０３に対してコメントの自動投稿を行う。

図１０のコンテンツ配信システムにおいて、コメント投稿装置３００および再生端末４００が省略、簡略化または変形されてよい。例えば、コメント投稿装置３００は省略されてもよいし、前述のコメント投稿支援装置に変形されてもよい。後者の場合に、コメント投稿支援装置は、再生端末４００またはその他の装置からの要求に応じて、再生端末４００へ投稿可能コメントを送ってもよい。また、再生端末４００は、前述の、（１）再生中のコンテンツに関してユーザが入力したテキストに基づいて、当該コンテンツに対するコメントを自動生成して投稿する機能、ならびに（２）再生中のコンテンツに関してユーザが入力したテキスト、または、再生中のコンテンツに関連付けられる受信テキストに基づいて、投稿可能コメントを自動生成してコンテンツと共に出力し、ユーザの選択に応じて投稿可能コメントを実際に投稿する機能、のうち一方または両方を備えなくてもよい。

以上説明したように、実施形態に係るテキスト抽出装置は、複数のテキストを含む対象テキスト群の示唆する文脈を定量化する文脈ベクトルを計算する。そして、このテキスト抽出装置は、複数の候補テキスト群のうち、対象テキスト群の文脈ベクトルに類似する文脈ベクトルを持つ類似テキスト群を探索する。故に、このテキスト抽出装置によれば、複数の候補テキスト群から、対象テキスト群と類似の文脈を示唆する類似テキスト群を抽出することができる。抽出された類似テキスト群は、例えば、対象テキスト群の抽出されたコンテンツに新規コメントとして自動投稿するために用いられてもよいし、当該コンテンツを視聴するユーザによるコメント投稿を支援するための投稿可能コメントとして用いられてもよい。

（変形例１）
実施形態に係るテキスト抽出装置は、対象テキスト群の示唆する文脈が、関心テキストの示唆する文脈に類似するか否かをチェックするために利用することもできる。かかる変形例では、第２の文脈ベクトルとして関心テキストの文脈ベクトルが使用され、例えば類似度が閾値以上であれば、対象テキスト群の示唆する文脈が、関心テキストの示唆する文脈に類似する、と判定される。関心テキストは、例えばＮＧワード、またはその他の規制対象となるテキストであり得る。対象テキスト群がかかる関心テキストに類似する文脈を示唆する場合には、コンテンツ配信サービスの運用者に通報したり、当該対象テキスト群の投稿を拒否したり、当該対象テキスト群が投稿済みであればこれを削除したり、投稿したユーザによるコンテンツ配信サービスの利用、例えばサーバアクセスを制限したりしてもよい。

（変形例２）
コンテンツの属性情報を用いて、コンテンツに新規コメントとして自動投稿されるコメントを決定したり、当該コンテンツを視聴するユーザによるコメント投稿を支援するためにユーザに提示される投稿可能コメントを決定したり、第１の文脈ベクトルを補正したりしてもよい。コンテンツの属性情報は、コメントの自動投稿を行う、または投稿可能コメントを提示する時間的位置付近でのコンテンツの局所的な特徴（例えば、特定の人物、キャラクタ、モノ、場所などが写っているか、特定の楽曲、メロディー、効果音などが流れているか）、または、その時間的位置がコンテンツ全体のうちどの部分にあたるか（例えば開始直後か、それとも終了間際か）など、であり得る。また、タグ、カテゴリなどのメタデータも、ここでいうコンテンツの属性情報として利用可能である。

（変形例３）
実施形態に係るテキスト抽出装置のうち文脈ベクトル計算部およびＮＮに着目して、文脈ベクトル計算装置を構成することも可能である。この文脈ベクトル計算装置によれば、任意のテキスト群によって形成される文脈を定量化する文脈ベクトルを計算することが可能となる。文脈ベクトルは、例えば、大規模コメントの自動分類、コンテンツの文脈構造の自動分析などの様々な応用例に活用できる可能性がある。

上述の実施形態は、本発明の概念の理解を助けるための具体例を示しているに過ぎず、本発明の範囲を限定することを意図されていない。実施形態は、本発明の要旨を逸脱しない範囲で、様々な構成要素の付加、削除または転換をすることができる。

上記各実施形態において説明された種々の機能部は、回路を用いることで実現されてもよい。回路は、特定の機能を実現する専用回路であってもよいし、プロセッサのような汎用回路であってもよい。

上記各実施形態の処理の少なくとも一部は、汎用のコンピュータを基本ハードウェアとして用いることでも実現可能である。上記処理を実現するプログラムは、コンピュータで読み取り可能な記録媒体に格納して提供されてもよい。プログラムは、インストール可能な形式のファイルまたは実行可能な形式のファイルとして記録媒体に記憶される。記録媒体としては、磁気ディスク、光ディスク（ＣＤ−ＲＯＭ、ＣＤ−Ｒ、ＤＶＤ等）、光磁気ディスク（ＭＯ等）、半導体メモリなどである。記録媒体は、プログラムを記憶でき、かつ、コンピュータが読み取り可能であれば、何れであってもよい。また、上記処理を実現するプログラムを、インターネットなどのネットワークに接続されたコンピュータ（サーバ）上に格納し、ネットワーク経由でコンピュータ（クライアント）にダウンロードさせてもよい。

１００・・・テキスト抽出装置
１０１・・・テキスト群入力部
１０２・・・文脈ベクトル計算部
１０３・・・ＮＮ
１０４・・・類似度計算部
１０５・・・候補テキスト群記憶部
１０６・・・類似度記憶部
１０７・・・類似テキスト群探索部
３００・・・コメント投稿装置
３０１，４０１・・・受信部
３０２，４０６・・・送信部
４００・・・再生端末
４０２・・・バッファ
４０３・・・再生部
４０４・・・出力部
４０５・・・ユーザ入力部
５０１・・・Ｗｅｂサーバ
５０２・・・コンテンツ配信サーバ
５０３・・・コメント配信サーバ

Claims

複数のテキストを含む対象テキスト群の第１の文脈ベクトルを、機械学習済みのニューラルネットワークを用いて計算する文脈ベクトル計算部と、
それぞれ１以上のテキストを含む複数の候補テキスト群の第２の文脈ベクトルの各々と前記第１の文脈ベクトルとの類似度を計算する類似度計算部と、
前記類似度に基づいて、前記第１の文脈ベクトルに類似する１つ以上の第２の文脈ベクトルにそれぞれ対応する１つ以上の候補テキスト群を探索し、類似テキスト群を得る探索部と
を具備する、テキスト抽出装置。
前記文脈ベクトル計算部は、前記対象テキスト群に含まれる複数のテキストの各々を前記ニューラルネットワークに与えてテキスト毎の文脈ベクトルを計算させ、当該テキスト毎の文脈ベクトルを合成することで前記第１の文脈ベクトルを計算する、請求項１に記載のテキスト抽出装置。
前記対象テキスト群に含まれるテキストのうち少なくとも１つは、特定のコンテンツの再生に同期して表示される少なくとも１つのコメントから抽出される、請求項１または請求項２に記載のテキスト抽出装置。
前記対象テキスト群に含まれるテキストのうち少なくとも１つは、特定のコンテンツの再生に同期して表示される複数のコメントのうち、特定の再生位置を基準に設定されたタイムウィンドウに含まれる位置で表示されるコメントから抽出される、請求項１または請求項２に記載のテキスト抽出装置。
前記第１の文脈ベクトルに最も類似する第２の文脈ベクトルに対応する候補テキスト群が複数のテキストを含む場合には、前記探索部は、当該候補テキスト群に含まれるテキスト毎の文脈ベクトルのうち前記第１の文脈ベクトルに最も類似するものをさらに探索し、前記第１の文脈ベクトルに最も類似する文脈ベクトルに対応するテキストを得る、請求項１乃至請求項４のいずれか１項に記載のテキスト抽出装置。
前記対象テキスト群に含まれるテキストのうち少なくとも１つは、コンテンツに関連するテキストであって、
前記コンテンツの属性情報が、前記第１の文脈ベクトルを補正するために用いられる、
請求項１乃至請求項５のいずれか１項に記載のテキスト抽出装置。
コンテンツに関連付けられる複数のテキストを含む対象テキスト群の第１の文脈ベクトルを、機械学習済みのニューラルネットワークを用いて計算する文脈ベクトル計算部と、
それぞれ１以上のテキストを含む複数の候補テキスト群の第２の文脈ベクトルの各々と前記第１の文脈ベクトルとの類似度を計算する類似度計算部と、
前記類似度に基づいて、前記第１の文脈ベクトルに類似する１つ以上の第２の文脈ベクトルにそれぞれ対応する１つ以上の候補テキスト群を探索し、類似テキスト群を得る探索部と、
前記類似テキスト群に含まれるテキストの少なくとも１つを前記コンテンツに関連付けられるコメントとして投稿するために送信する送信部と
を具備する、コメント投稿装置。
コンテンツに関連付けられる複数のテキストを含む対象テキスト群の第１の文脈ベクトルを、機械学習済みのニューラルネットワークを用いて計算する文脈ベクトル計算部と、
それぞれ１以上のテキストを含む複数の候補テキスト群の第２の文脈ベクトルの各々と前記第１の文脈ベクトルとの類似度を計算する類似度計算部と、
前記類似度に基づいて、前記第１の文脈ベクトルに類似する１つ以上の第２の文脈ベクトルにそれぞれ対応する１つ以上の候補テキスト群を探索し、類似テキスト群を得る探索部と、
前記類似テキスト群に含まれるテキストの少なくとも１つを投稿可能コメントとして、前記コンテンツを再生する再生端末へ送信する送信部と
を具備する、コメント投稿支援装置。
コンテンツを受信する受信部と、
前記コンテンツを再生する再生部と、
前記コンテンツに関連付けられる複数のテキストを含む対象テキスト群の第１の文脈ベクトルを、機械学習済みのニューラルネットワークを用いて計算する文脈ベクトル計算部と、
それぞれ１以上のテキストを含む複数の候補テキスト群の第２の文脈ベクトルの各々と前記第１の文脈ベクトルとの類似度を計算する類似度計算部と、
前記類似度に基づいて、前記第１の文脈ベクトルに類似する１つ以上の第２の文脈ベクトルにそれぞれ対応する１つ以上の候補テキスト群を探索し、類似テキスト群を得る探索部と、
前記類似テキスト群に含まれるテキストの少なくとも１つを前記コンテンツに関連付けられるコメントとして投稿するために送信する送信部と
を具備する、再生端末。
コンテンツを受信する受信部と、
前記コンテンツを再生する再生部と、
前記コンテンツに関連付けられる複数のテキストを含む対象テキスト群の第１の文脈ベクトルを、機械学習済みのニューラルネットワークを用いて計算する文脈ベクトル計算部と、
それぞれ１以上のテキストを含む複数の候補テキスト群の第２の文脈ベクトルの各々と前記第１の文脈ベクトルとの類似度を計算する類似度計算部と、
前記類似度に基づいて、前記第１の文脈ベクトルに類似する１つ以上の第２の文脈ベクトルにそれぞれ対応する１つ以上の候補テキスト群を探索し、類似テキスト群を得る探索部と、
前記類似テキスト群に含まれるテキストの少なくとも１つを投稿可能コメントとして、再生された前記コンテンツと共に出力する出力部と、
ユーザによって選択された投稿可能コメントを前記コンテンツに関連付けられるコメントとして投稿するために送信する送信部と
を具備する、再生端末。
複数のテキストを含む対象テキスト群の文脈ベクトルを、機械学習済みのニューラルネットワークを用いて計算する文脈ベクトル計算部を具備し、
前記ニューラルネットワークは、複数の学習データを用いて行われた機械学習の結果が設定されていて、
前記複数の学習データは、それぞれ、入力データとしてのテキスト群のペアと、前記テキスト群のペアが類似する文脈を示唆するか、それとも類似しない文脈を示唆するかを表す教師データとを含む、
文脈ベクトル計算装置。
コンピュータを、
複数のテキストを含む対象テキスト群の第１の文脈ベクトルを、機械学習済みのニューラルネットワークを用いて計算する手段、
それぞれ１以上のテキストを含む複数の候補テキスト群の第２の文脈ベクトルの各々と前記第１の文脈ベクトルとの類似度を計算する手段、
前記類似度に基づいて、前記第１の文脈ベクトルに類似する１つ以上の第２の文脈ベクトルにそれぞれ対応する１つ以上の候補テキスト群を探索し、類似テキスト群を得る手段、
として機能させるためのテキスト抽出プログラム。