JP7315321B2 - 生成装置、生成方法および生成プログラム - Google Patents

生成装置、生成方法および生成プログラム Download PDF

Info

Publication number
JP7315321B2
JP7315321B2 JP2018234770A JP2018234770A JP7315321B2 JP 7315321 B2 JP7315321 B2 JP 7315321B2 JP 2018234770 A JP2018234770 A JP 2018234770A JP 2018234770 A JP2018234770 A JP 2018234770A JP 7315321 B2 JP7315321 B2 JP 7315321B2
Authority
JP
Japan
Prior art keywords
information providing
user
sentence
unit
generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018234770A
Other languages
English (en)
Other versions
JP2020095615A (ja
Inventor
壮一朗 遠藤
洋光 本間
勇樹 藤井
奏実 奥原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2018234770A priority Critical patent/JP7315321B2/ja
Publication of JP2020095615A publication Critical patent/JP2020095615A/ja
Application granted granted Critical
Publication of JP7315321B2 publication Critical patent/JP7315321B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、生成装置、生成方法および生成プログラムに関する。
従来、画像に含まれる各種のオブジェクトを認識する画像認識に関する技術が知られている。このような技術の一例として、入力された画像に撮影されているオブジェクトやオブジェクトの状態等を示すキャプションを生成する技術が知られている。
特開2017-199383号公報
しかしながら、上述した従来技術では、入力された画像のキャプションを生成しているに過ぎず、利用者に興味を抱かせるような文章を生成しているとは言えない場合がある。
本願は、上記に鑑みてなされたものであって、入力された情報から利用者に対して興味を抱かせるような文章を生成することを目的とする。
本願に係る生成装置は、入力情報が示すオブジェクトを特定する特定部と、特定部により特定されたオブジェクトに基づいて、所定の制約を満たす形式の文章を生成する生成部とを有することを特徴とする。
実施形態の一態様によれば、入力された情報から利用者に対して興味を抱かせるような文章を生成することができる。
図1は、実施形態に係る情報提供装置の一例を示す図である。 図2は、実施形態に係る情報提供装置が実行する公開処理と修正処理との一例について説明する図である。 図3は、実施形態に係る情報提供装置が実行する公開処理と修正処理との他の例について説明する図である。 図4は、実施形態に係る情報提供装置の構成例を示す図である。 図5は、実施形態に係るモデルデータベースの一例を示す図である。 図6は、実施形態に係る生成処理の流れの一例を示すフローチャートである。 図7は、ハードウェア構成の一例を示す図である。
以下に、本願に係る生成装置、生成方法および生成プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る生成装置、生成方法および生成プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。
[実施形態]
〔1-1.情報提供装置の一例について〕
まず、図1を用いて、実施形態に係る生成装置の一例である情報提供装置10の一例について説明する。図1は、実施形態に係る情報提供装置の一例を示す図である。図1では、提供装置の一例である情報提供装置10によって実行される生成処理の一例として、所定の端末装置100によって撮影された動画像から、所定の制約を有する形式の文章として俳句を生成する生成処理の一例について記載した。しかしながら、後述した説明で明らかとなるように、実施形態は、これに限定されるものではない。
図1に示す情報提供装置10は、生成処理を行う情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、情報提供装置10は、4G(Generation)、5G、LTE(Long Term Evolution)、Wifi(登録商標)若しくは無線LAN(Local Area Network)等といった各種の無線通信網若しくは各種の有線通信網といったネットワークN(例えば、図4参照)を介して、利用者が使用する端末装置100との間で通信を行う。
端末装置100は、PC(Personal Computer)、サーバ装置、スマートテレビジョン、スマートフォン若しくはタブレット等といったスマートデバイス等により実現され、ネットワークNを介して、情報提供装置10との間で通信を行うことができる携帯端末装置である。また、端末装置100は、液晶ディスプレイ等の画面であって、タッチパネルの機能を有する画面を有し、利用者から指やスタイラス等によりタップ操作、スライド操作、スクロール操作等、情報提供装置10から配信されるコンテンツに対する各種の操作を受付け可能な機能を有していてもよい。
ここで、端末装置100は、画像(動画或いは静止画)を撮像するための撮像装置を有する。例えば、端末装置100は、CCD(Charged-coupled devices)センサやCMOS(Complementary metal-oxide-semiconductor)センサ等の撮像素子により構成されるカメラ有し、任意の静止画像若しくは動画像を撮影可能である。なお、端末装置100は、背面側(画面が設置された面の反対側の面)に設置されるメインカメラと、正面側(画面が設置された面)に設置されるサブカメラとにより構成されるカメラを有していてもよい。
〔1-2.生成処理について〕
ここで、撮影された画像に撮影されているオブジェクトやオブジェクトの状態を示すキャプションを生成する技術が知られている。このような技術では、撮影対象とキャプションとの間の関係性をあらかじめ学習したモデルを用いて、画像から画像に撮影されたオブジェクトやオブジェクトの状態を示すキャプションを生成する。例えば、このような技術では、木の横に象が佇んでいる画像から、「象が木のそばにいる」といったキャプションを生成する。しかしながら、このような技術では、単に画像に撮影されているオブジェクトの説明を出力しているに過ぎず、画像等の入力情報から利用者の興味を生じさせるような文章を生成しているとは言えない。
ここで、利用者に文章を印象づける手法としては、インパクトのある内容の文章を作成する他にも、文章が有する形式を所定の形式に揃える手法が考えられる。例えば、俳句や短歌は、各文節の文字数(音数)を所定の数に揃えることで、利用者に内容を覚えやすくさせることができると考えられる。また、俳句や短歌以外にも、中国語における律詩やソネット等の定型詩は、文字数や単語数といった形式に対して所定の制約を課すことで、文章全体を利用者に対してより強く印象づけ、利用者に記憶させやすくすることができる。また、文章中において所定の場所に含まれる単語の韻を揃える押韻の手法により、利用者に対して文章をより強く印象付け、記憶させやすくすることができると考えられる。
そこで、情報提供装置10は、以下の生成処理を実行する。まず、情報提供装置10は、入力情報が示すオブジェクトを特定する。例えば、情報提供装置10は、入力情報として受付けられた動画像に撮影されたオブジェクトを特定する。そして、情報提供装置10は、特定されたオブジェクトに基づいて、所定の制約を満たす形式の文章を生成する。すなわち、情報提供装置10は、単に入力情報が示すオブジェクトに基づいた文章を生成するのではなく、利用者に強く印象づけられるような所定の制約を満たす形式の文章を生成する。例えば、情報提供装置10は、所定の制約を満たす形式の文章として、俳句の形式を有する文章や、同一又は類似の韻を有する単語を同一又は類似の位置に含む文章等、所定の定型詩の形式を有する文章を生成する。
このような処理の結果、情報提供装置10は、利用者に強く印象付けるような文章を生成することができるので、利用者の興味を引くことができる。この結果、情報提供装置10は、利用者に対して興味を抱かせるような文章を生成することができる。
〔1-3.生成処理の一例について〕
以下、図1を用いて、情報提供装置10が実行する生成処理の一例について説明する。まず、端末装置100は、利用者の操作に応じて、任意の動画像を撮影する(ステップS1)。図1に示す例では、端末装置100は、蛙が池に飛び込む際の動画像P1を撮影する。そして、端末装置100は、撮影した動画像P1を情報提供装置10へと送信する(ステップS2)。
このような場合、情報提供装置10は、動画像に撮影された撮影対象や撮影対象の動作を特定する(ステップS3)。すなわち、情報提供装置10は、動画像に撮影された各種のオブジェクトを特定する。ここで、情報提供装置10は、任意の画像認識技術を用いて、オブジェクトの特定を行ってよい。例えば、情報提供装置10は、動画像を入力した際に、入力された静止画像や動画像に撮影されている撮影対象を示す単語や文字列を出力するように学習が行われたニューラルネットワーク等を用いて、動画像に撮影された撮影対象をオブジェクトとして特定してもよい。
なお、情報提供装置10は、任意の撮影対象をオブジェクトとして特定してもよい。例えば、情報提供装置10は、動画像に撮影された主となる被写体をオブジェクトとして特定してもよく、空や室内等、背景を構成する各種の被写体をオブジェクトとして特定してもよい。また、情報提供装置10は、動画像に撮影されたオブジェクトの動きを特定してもよい。例えば、情報提供装置10は、動画像P1に蛙が池に飛び込んでいる映像が含まれる場合、「蛙」をオブジェクトとして特定するだけではなく、「蛙」の動作である「飛び込む」を特定してもよい。このような特定は、各種公知の画像解析技術により実現可能である。例えば、図1に示す例では、情報提供装置10は、動画像P1から、オブジェクト「カエル」や「池」を特定するとともに、オブジェクトの動作である「飛び込む」を特定する。そして、情報提供装置10は、特定したオブジェクトやオブジェクトの動作を示す文字列のリストをオブジェクトリストOLとして生成する。
ここで、俳句には、予め定められた単語であって、季節を示す単語である季語を含める必要がある。そこで、情報提供装置10は、特定結果と季語リストとの比較結果に基づいて、季語の選択を行う(ステップS4)。すなわち、情報提供装置10は、特定されたオブジェクトに基づいて、複数の季語の中からいずれかの季語を選択する。
例えば、図1に示す例では、季語リストSWLには、「かわず」、「子猫」、「山繭」といった季語が含まれている。情報提供装置10は、このような季語リストSWLとオブジェクトリストOLとを比較する、動画像P1から検出されたオブジェクトやオブジェクトの動作と関連性が高い季語を選択する。例えば、図1に示す例では、オブジェクトリストOLに「カエル」が含まれており、季語リストSWLには「カエル」の別名である「かわず」が含まれている。このような場合、情報提供装置10は、季語リストSWLから季語「かわず」を選択する。
そして、情報提供装置10は、選択した季語と、特定した撮影対象と、各種の品詞とを組み合わせることで、所定の条件を満たす文章を生成する(ステップS5)。例えば、図1に示す例では、情報提供装置10は、動詞、接続詞、名詞等の各種品詞が登録された品詞リストPLを有する。このような場合、情報提供装置10は、選択した季語「かわず」、動画像P1から特定したオブジェクトを示す「カエル」、「池」、オブジェクトの動きを示す「飛び込む」、および品詞リストPLに含まれる各種の品詞から、俳句が有する形式的な制約を満たす文章を生成する。例えば、情報提供装置10は、5文字の第1文章、第1文章に続く文章であって7文字の第2文章、および第2文章に続く文章であって5文字の第3文章からなる文章、すなわち、俳句を生成する。換言すると、情報提供装置10は、文字制限を有する3つの文節からなる文章を生成する。
例えば、情報提供装置10は、「カエル」、「池」、「飛び込む」といったオブジェクトリストと関連性が高いと推定される名刺や、文章を成立させるための各種の品詞を品詞リストPLから抽出する。例えば、情報提供装置10は、「池」と関連性が高いと推定される「水」という単語や、「飛び込む」と関連性が高いと推定される「音」といった単語を抽出する。また、情報提供装置10は、体言となる「や」、連体修飾語を示す「の」等、各種の品詞を接続することで文章を成立させるための品詞を品詞リストPLから抽出する。なお、このような処理は、例えば、w2v等の技術を用いて、共起性を有する単語を特定したり、単語間の関連度を推定する各種の推定技術により実現可能である。
そして、情報提供装置10は、抽出した各品詞と、季語と、特定したオブジェクトを示す単語等を組み合わせることで、第1文章、第2文章、および第3文章を生成する。例えば、情報提供装置10は、各文章ののいずれかに季語を含め、かつ、各文章の文字列が制約を満たすように、各品詞、季語、および単語を組み合わせることで、各文章を生成してもよい。例えば、情報提供装置10は、第1文章「古池や」、第2文章「かわず飛び込む」、第3文章「水の音」といった俳句を構成する複数の文章であって、それぞれ文字数の制約を有する文章を生成する。
このような文章の生成は、各文章の制約条件を満たすように、各品詞、季語、および単語を組み合わせることで実現されてもよい。また、このような文章の生成は、例えば、各品詞、季語、および単語が入力された場合に、制約条件を満たす文章を出力するように学習が行われたモデルを用いて実現されてもよい。このようなモデルは、例えば、RNN(Recurrent Neural Network)やLSTM(Long short-term memory)等の各種ニューラルネットワークを用いた公知技術が採用可能である。
そして、情報提供装置10は、生成した文章、すなわち、動画像P1と対応する俳句を端末装置100に提供する(ステップS6)。このような処理の結果、情報提供装置10は、利用者の興味を抱かせるような情報を動画像P1から生成することができる。
〔1-4.季語の選択について〕
上述した処理では、情報提供装置10は、季語リストSWLに登録された季語の中から、動画像P1から特定されたオブジェクトやオブジェクトの動きと関連性が高い季語を選択した。しかしながら、実施形態は、これに限定されるものではない。
例えば、情報提供装置10は、季語リストSWLの中から季語をランダムに選択し、選択した季語を含む俳句の生成を行ってもよい。また、情報提供装置10は、オブジェクトリストに登録された単語からランダムに選択された季語と関連性が高い単語を選択し、選択した単語と、季語と、品詞とを用いた俳句の生成を行ってもよい。このように、ランダムな季語が選択された場合、利用者が思いもしなかった内容の俳句が作成されるので、利用者の興味をより強く引くことができる。
また、情報提供装置10は、端末装置100が動画像P1を撮影した日時と対応する季語を選択してもよい。例えば、情報提供装置10は、動画像P1を端末装置100から取得した日時を特定し、特定した日時と対応する季節を示す季語を選択してもよい。また、情報提供装置10は、動画像P1に付与されているメタ情報を用いて、動画像P1が撮影された日時を特定し、特定した日時と対応する季節を示す季語を選択してもよい。
また、情報提供装置10は、動画像P1を撮影した位置と日時とに対応する季節を推定し、推定した季節と対応する季語を特定してもよい。例えば、情報提供装置10は、動画像P1に撮影されたオブジェクトに基づいて、動画像P1を撮影した際の端末装置100の位置を推定する。なお、情報提供装置10は、例えば、端末装置100が(Global Positioning System)等の測位技術を用いて特定した位置の履歴から、動画像P1を撮影した際の端末装置100の位置を推定してもよい。また、情報提供装置10は、推定した位置と、動画像P1を撮影した日時とから、利用者が動画像P1を撮影した位置において、利用者が動画像P1を撮影した季節を推定する。例えば、情報提供装置10は、動画像P1が日本で12月に撮影されていた場合は、季節「冬」を推定し、動画像P1がオーストラリアで12月に撮影されていた場合は、季節「夏」を推定する。そして、情報提供装置10は、推定した季節と対応する季語を選択してもよい。
また、情報提供装置10は、動画像P1を撮影した際の気象に応じて季語の選択を行ってもよい。例えば、情報提供装置10は、動画像P1を撮影した日時や位置を推定し、推定した位置において推定した日時における天気や気温等の気象情報を特定する。そして、情報提供装置10は、特定した気象情報と対応する季語を選択してもよい。
また、情報提供装置10は、オブジェクトの状態と対応する季節を示す季語を選択してもよい。例えば、情報提供装置10は、動画像P1に空や雲の映像が含まれている場合、空の色彩や雲の形等から動画像P1が撮影された季節を推定する。より具体的には、情報提供装置10は、動画像P1に積乱雲が撮影されている場合や、夕焼けの映像が含まれている場合は、動画像P1が夏に撮影されたと推定してもよい。そして、情報提供装置10は、推定された季節を示す季語を選択してもよい。
なお、情報提供装置10は、季節ごとに異なる季語リストSWLを保持し、動画像P1に撮影されたオブジェクトやオブジェクトの動き、動画像P1が撮影された日時や動画像P1を取得した日時と対応する季節を特定し、特定した季節と対応する季語リストSWLの中から、季語の選択を行ってもよい。
なお、このような季語リストに含まれる季語は、予め登録されたものであってもよく、利用者から登録されたものであってもよい。例えば、情報提供装置10は、利用者から季語となる文字列と、その季語に対応する季節との登録を受付けてもよい。
〔1-5.オブジェクトの特定について〕
また、情報提供装置10は、動画像P1に撮影されたオブジェクトの中から、重要性が高いと推定されるオブジェクトを特定し、特定したオブジェクトに基づいた文章を生成してもよい。例えば、情報提供装置10は、動画像に撮影された複数のオブジェクトのうち、撮影された時間もしくは撮影された大きさに応じた優先度が所定の閾値を超えるオブジェクトを特定する。そして、情報提供装置10は、特定したオブジェクトに基づいて、俳句等の文章を生成してもよい。
例えば、情報提供装置10は、動画像P1に撮影されたオブジェクトを特定するとともに、特定したオブジェクトごとに、動画像P1中に撮影されている期間を特定する。そして、情報提供装置10は、特定した期間が長ければ長いほど、より高い値の優先度を算出し、算出された優先度が所定の閾値を超えるオブジェクトを示すオブジェクトリストOLを生成してもよい。また、情報提供装置10は、優先度が所定の閾値を超えるオブジェクトの動きのみを特定してもよい。
また、情報提供装置10は、動画像P1に撮影されたオブジェクトを特定し、特定したオブジェクトごとに、撮影されている面積の累積を算出する。そして、情報提供装置10は、算出した累積に基づいて、優先度の算出を行ってもよい。例えば、情報提供装置10は、撮影されている面積の累積が大きければ大きいほど、高い値の優先度を算出してもよい。また、情報提供装置10は、撮影されている期間と、撮影されている面積とに基づいて、優先度の算出を行ってもよい。
また、情報提供装置10は、撮影されている面積や期間以外にも、任意の情報に基づいて、動画像P1の撮影目的の主題となりえるオブジェクトを推定し、推定したオブジェクトを示すオブジェクトリストOLを生成してもよい。例えば、情報提供装置10は、動画像P1の中心部分に撮影されているオブジェクトや、焦点が合っているオブジェクト、注視点を含むオブジェクト等を推定し、推定したオブジェクトを示すオブジェクトリストOLを生成してもよい。
また、例えば、情報提供装置10は、動画像のうち所定の範囲に含まれているオブジェクトを主題となるオブジェクトとして特定してもよい。例えば、情報提供装置10は、動画像のうち先頭に位置する所定の範囲(例えば、再生開始10秒)と、動画像のうち終端に位置する所定の範囲(例えば、最後の10秒)とに撮影されたオブジェクトを主題となりえるオブジェクトとして特定してもよい。
また、情報提供装置10は、動画像の先頭と最後との比較結果から、オブジェクトの動きを推定してもよい。例えば、情報提供装置10は、動画像の先頭におけるあるオブジェクトの状態と、動画像の末尾におけるそのオブジェクトの状態とを推定し、推定した状態の遷移を示す単語を、オブジェクトの動きを示す単語として特定してもよい。また、情報提供装置10は、主題となるオブジェクトについて、そのオブジェクトの動きお示す単語の特定を行ってもよい。
また、情報提供装置10は、入力情報として受付けられた音声に基づいて、入力情報が示すオブジェクトを特定してもよい。例えば、情報提供装置10は、動画像P1に含まれる音声を解析し、解析した音声と関連性を有するオブジェクトを推定する。そして、情報提供装置10は、推定したオブジェクトを示すオブジェクトリストOLを生成してもよい。例えば、情報提供装置10は、動画像P1に蝉の音声が含まれる場合は、「蝉」といったオブジェクトを推定してもよく、動画像P1に含まれる音声そのものである「蝉の声」をオブジェクトとして推定してもよい。なお、このような推定は、各種の音声認識技術により実現可能である。
〔1-6.入力情報について〕
なお、上述した説明では、動画像P1や動画像P1に含まれる音声から、オブジェクトの特定を行う処理の一例について記載した。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、動画像以外にも、各種の静止画像に含まれる撮影対象等をオブジェクトとして特定し、特定したオブジェクトに基づいた俳句等の文章を生成してもよい。また、情報提供装置10は、音声のみからオブジェクトの特定を行ってもよい。
また、情報提供装置10は、小説等のテキスト情報から、テキスト情報が示すオブジェクトのうち主体となるオブジェクト(例えば、主人公等)を特定し、特定したオブジェクトに基づいた俳句等の文章を生成してもよい。
また、例えば、情報提供装置10は、入力情報として受付けられた利用者の行動履歴を示す履歴情報が示すオブジェクトを特定してもよい。例えば、情報提供装置10は、端末装置100がGPS等の測位技術を用いて特定した位置の履歴を取得する。続いて、情報提供装置10は、取得した位置の履歴と対応するオブジェクトを特定する。例えば、情報提供装置10は、利用者が訪問する頻度に応じて、利用者の自宅や職場等といった拠点を特定し、特定した拠点のうち所定の期間内に訪問した拠点をオブジェクトとして特定してもよい。また、情報提供装置10は、各種の地図情報を用いて、利用者が訪問した店舗の名称や店舗の種別(例えば、レストランや喫茶店等)、利用者が訪問した地域等をオブジェクトとして特定してもよい。また、情報提供装置10は、位置の履歴に基づいて、利用者の移動態様を示すオブジェクト(例えば、「渋谷から東京」)を特定してもよい。
そして、情報提供装置10は、特定した各種のオブジェクトに基づいて、俳句等の文章を生成してもよい。例えば、情報提供装置10は、利用者の位置の履歴が、渋谷のカフェを訪問した後に、東京の美術館に移動した旨を示す場合、「カフェの後、渋谷東京、美術館」といった文章を生成してもよい。
また、情報提供装置10は、利用者が閲覧したコンテンツが示すオブジェクトの特定を行い、特定したオブジェクトに応じた文章を生成してもよい。例えば、情報提供装置10は、利用者が閲覧したニュース記事等からオブジェクトを示す単語の抽出を行い、抽出した単語を含む文章を生成してもよい。
なお、情報提供装置10は、端末装置100により撮影された動画像をリアルタイムに取得してもよく、例えば、端末装置100が有する記憶装置内に保持されていた動画像を取得してもよい。
〔1-7.パーソナライズについて〕
また、情報提供装置10は、動画像P1を撮影した利用者等、入力情報を入力した利用者に応じた文章のパーソナライズを行ってもよい。例えば、情報提供装置10は、入力情報を入力した利用者の投稿履歴若しくは検索履歴に基づく表現を含む文章を生成してもよい。
例えば、情報提供装置10は、動画像P1を撮影した利用者がSNS等に投稿した情報である投稿情報や、利用者が入力した検索クエリの履歴である検索履歴を取得する。そして、情報提供装置10は、投稿情報や検索履歴に基づいて、動画像P1を入力した利用者による使用頻度が高い表現や使用頻度が高い単語を、動画像P1を入力した利用者による表現の特徴として特定する。その後、情報提供装置10は、特定した特徴と類似する特徴の文章を生成する。例えば、情報提供装置10は、利用者の投稿情報や検索クエリにおいて頻繁に用いられる表現や単語を含む文章を生成する。
なお、例えば、情報提供装置10は、利用者の投稿情報や検索履歴の特徴をモデルに学習させ、学習済モデルを用いることで文章の作成を行ってもよい。例えば、情報提供装置10は、形態素解析の技術を用いて、利用者の投稿情報から単語を抽出し、抽出した単語を入力した際に、利用者の投稿情報を出力するようにモデルの学習を行う。そして、情報提供装置10は、学習を行ったモデルに、オブジェクトを示す単語や季語等を入力することで、あたかも利用者が作成したような文章を生成してもよい。
また、情報提供装置10は、動画像P1を撮影した際の利用者の感情を推定し、推定した感情に応じた文章を生成してもよい。例えば、動画像P1の大部分に空が含まれている場合や、彩度や明度が低い映像が含まれている場合、利用者の感情は、暗い状態であると推定される。一方、動画像P1の大部分に多くの人物が含まれている場合や、彩度や明度が高い映像が含まれている場合、利用者の感情は、明るい状態であると推定される。
そこで、情報提供装置10は、動画像P1に含まれるオブジェクトに基づいて、利用者の感情を推定する。例えば、情報提供装置10は、動画像P1に含まれるオブジェクトの種別や、彩度や明度に基づいて、利用者の感情が明るい状態であるか、暗い状態であるかを推定する。そして、情報提供装置10は、推定した結果に応じた文章を生成する。例えば、情報提供装置10は、利用者の感情が明るい状態であると推定される場合は、文章全体の印象が明るくなるように、文章の表現を調整したり、文章に含める季語や単語を選択する。一方、情報提供装置10は、利用者の感情が暗い状態であると推定される場合は、文章全体の印象が暗くなるように、文章の表現を調整したり、文章に含める季語や単語を選択する。
なお、このような処理は、例えば、各単語が明るい感情と紐づくか、暗い感情と紐づくかを示す辞書をあらかじめ作成し、推定された感情と対応する単語を優先的に利用することで、実現可能である。また、情報提供装置10は、推定された利用者の感情のみに基づいて、文章の生成を行ってもよい。例えば、情報提供装置10は、推定された感情と対応する季語や単語を抽出し、抽出した季語や単語を組み合わせた文章を生成してもよい。
なお、情報提供装置10は、動画像を撮影していた際の利用者の表情に基づいて、利用者の感情を推定してもよい。例えば、端末装置100は、メインカメラを用いて動画像P1を撮影するとともに、サブカメラを用いて、動画像P1を撮影中の利用者の表情を撮影する。そして、端末装置100は、動画像P1と、利用者の表情を撮影した画像や動画像を情報提供装置10へと送信する。このような場合、情報提供装置10は、利用者の表情から利用者の感情を推定し、推定した感情や、動画像P1から特定されたオブジェクトに応じた文章を生成してもよい。
〔1-8.生成手法について〕
上述した説明では、情報提供装置10は、単一の動画像P1から3つの文章(上の句、中の句、下の句)により構成される文章を生成した。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、複数の動画像から文章の作成を行ってもよい。例えば、情報提供装置10は、第1動画像~第3動画像を取得した場合、第1動画像を用いて上の句を生成し、第2動画像を用いて中の句を生成し、第3動画像を用いて下の句を生成してもよい。また、情報提供装置10は、このような処理を実行する際、第1動画像~第3動画像に共通して撮影されているオブジェクトを特定し、特定したオブジェクトに基づいて季語の選択を行ってもよい。すなわち、情報提供装置10は、複数の動画像において共通するオブジェクトを特定し、特定したオブジェクトに基づいて文章の生成を行ってもよい。
また、上述した説明では、生成文章の制約として、文字数の制限について説明した。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、生成する複数の文章において、季語がいずれかの文章に1回だけ出現するように、文章の生成を行ってもよい。また、情報提供装置10は、季語と同義の他の単語が含まれないように、文章の生成を行ってもよい。
また、情報提供装置10は、例えば、文章における各文節の末尾の韻が共通するように、文章に含まれる単語や品詞の選択を行ってもよい。また、情報提供装置10は、あいうえお作文のように、各文節の先頭の音や文字が所定の制約に従った文章を生成してもよい。すなわち、情報提供装置10は、各文章に含まれる単語数や文字数、文字を呼んだ際の音等といった形式に関する任意の制約を採用してもよい。
なお、このような制約は、情報提供装置10が生成する文章の言語に応じて適宜変化させてもよい。例えば、情報提供装置10は、日本語で俳句を生成する場合は、5文字の第1文章、7文字の第2文章、および5文字の第3文章を生成し、英語で俳句を生成する場合は、5単語の第1文章、7単語の第2文章、および5単語の第3文章を生成してもよい。
また、情報提供装置10は、既存の著名な文章が有する特徴を学習したモデルを用いて、文章の生成を行ってもよい。例えば、情報提供装置10は、所定の俳人が作成した俳句や、所定の詩人が作成した詩を学習データとして収集する。続いて、情報提供装置10は、収集した学習データから各単語や品詞を抽出し、抽出した各単語や品詞を入力した際に、元の俳句や詩を出力するようにモデルの学習を行う。そして、情報提供装置10は、学習を行ったモデルに対して、オブジェクトやオブジェクトの動きを示す単語や季語を入力することで、俳句や詩の作成を行ってもよい。また、情報提供装置10は、利用者から俳人や詩人の指定を受付けた場合は、指定された俳人や詩人による文章の特徴を学習したモデルを用いて、文章の生成を行ってもよい。
また、情報提供装置10は、同一の動画像から複数の文章を生成してもよい。例えば、情報提供装置10は、同一の動画像P1から、それぞれ異なる季語を含む複数の俳句を生成し、生成した俳句の中から、最終的な生成結果として提供若しくは公開する俳句の指定を利用者から受付けてもよい。また、情報提供装置10は、それぞれ異なる利用者が撮影した複数の動画像から、オブジェクトの特定を行い、特定したオブジェクトに応じた単一の文章の生成を行ってもよい。
なお、情報提供装置10は、上述した各種の技術を組み合わせて実現してもよい。例えば、情報提供装置10は、撮影されたオブジェクト、各オブジェクトの優先度、動画像が撮影された季節との関連度等に応じたスコアを季語ごとに算出し、算出されたスコアに基づいて、季語の選択を行ってもよい。また、このような処理を行う際に、どの情報を重要視するかといった重みづけについては、任意の設定が採用可能である。
〔1-9.文章の利用について〕
なお、上述した生成処理により生成された文章は、例えば、利用者の操作によりSNS等に投稿されてもよい。このような利用態様において、生成された文章は、例えば、利用者が過去の出来事を思い出すために利用される。なお、情報提供装置10は、例えば、動画像と、その動画像から生成した文章とをまとめた情報を1つの投稿としてSNSに投稿してもよい。
〔2.評価を用いた処理について〕
上述した説明では、情報提供装置10は、利用者から受付けた動画像P1から俳句等の文章の生成を行った。しかしながら、実施形態は、これに限定されるものではない。以下の説明では、上述した生成処理により生成された文章の提供態様のバリエーションや、文章に対する評価に基づいて、文章を生成するモデルの修正を行う処理の一例について説明する。
〔2-1.文章の公開について〕
例えば、情報提供装置10は、それぞれ異なる利用者から受付けた入力情報ごとに生成した複数の文章を公開し、公開された文章に対する評価を受付けてもよい。また、情報提供装置10は、例えば、情報提供装置10は、それぞれ異なる利用者から受付けた入力情報であって、各利用者が所定の主題に沿って生成した入力情報から、文章を入力情報ごとに生成し、公開してもよい。そして、情報提供装置10は、受付けられた評価結果に基づいて、特定されたオブジェクトから文章を生成する際に用いるモデルを修正してもよい。
例えば、図2は、実施形態に係る情報提供装置が実行する公開処理と修正処理との一例について説明する図である。図2に示す例では、情報提供装置10は、各利用者U1、U2からそれぞれ動画像を受付けるとともに、受付けた動画像から俳句を生成し、生成した俳句に対する評価を受付けることで、利用者U1、U2のどちらがより適切な動画像を撮影したかを競う対戦型のサービスを提供する処理の一例について記載した。また、図2に示す例では、評価結果に応じて、俳句を生成するためのモデルを修正する処理の一例について記載した。
例えば、情報提供装置10は、利用者U1および利用者U2に対し、お題となる文章を提供する(ステップS1)。このような場合、利用者U1、U2は、お題となる文章を生成しうる動画像の撮影を行う。そして、利用者U1は、端末装置101を介して、利用者U1が撮影した第1動画像を情報提供装置10へと送信する(ステップS2)。一方、利用者U2は、端末装置100は、装置102を介して、利用者U2が撮影した第2動画像を情報提供装置10へと送信する(ステップS3)。
このような場合、情報提供装置10は、上述した生成処理を実行することで、第1動画像から第1文章を生成し、第2動画像から第2文章を生成する(ステップS4)。そして、情報提供装置10は、第1文章と第2文章とを任意の利用者EUに対して公開する(ステップS5)。また、情報提供装置10は、利用者EUから、第1文章および第2文章に対する評価結果を受付ける(ステップS6)。例えば、情報提供装置10は、第1文章や第2文章に対して個別に「いいね!」といった評価や、任意の点数等を評価結果として受付けてもよい。また、情報提供装置10は、第1文章と第2文章とのいずれかよかったか、より主題にそった内容であるか等といった評価を受付ける。
そして、情報提供装置10は、第1文章と第2文章とのうち、より評価が高かった文章を特定する。その後、情報提供装置10は、特定した文章の元となる利用者に対して、各種のポイントを付与してもよい。なお、情報提供装置10は、3人以上の利用者がそれぞれ個別に撮影した動画像から文章をそれぞれ個別に生成し、各動画像に対する評価を受付け、受付けた評価に対応する各種の処理を実現してもよい。
ここで、各文章に対する評価結果は、各動画像から文章を生成する際に用いるモデルの修正に用いられてもよい。例えば、情報提供装置10は、評価結果に基づいて、制約に沿った文章を生成するためのモデルを再学習してもよい(ステップS7)。例えば、情報提供装置10は、第1動画像から第1文章を生成する際は、第1モデルを利用し、第2動画像から第2文章を生成する場合は、第1モデルとは各種のパラメータと変更した第2モデルを利用する。そして、情報提供装置10は、第1文章よりも第2文章の方が評価が高い場合は、以後の生成処理において、第2モデルを用いて各種のオブジェクトから文章の生成を行ってもよい。
〔2-2.文章の比較を用いた処理について〕
また、情報提供装置10は、動画像から生成された文章と、お題となる文章との類似度に応じた対戦型のサービスを提供してもよい。例えば、図3は、実施形態に係る情報提供装置が実行する公開処理と修正処理との他の例について説明する図である。なお、図3に示す処理のうち、ステップS1~ステップS4については、図2に示すステップS1~ステップS4と同様の処理であるものとして、説明を省略する。
例えば、お題となる文章に沿った動画像が撮影された場合、撮影された動画像から生成される文章は、お題となる文章により近い内容の文章になると考えられる。そこで、情報提供装置10は、生成された文章であって、利用者が所定の文章に沿って生成した入力情報から生成された文章と、所定の文章とを比較する。そして、情報提供装置10は、複数の利用者により入力された入力情報のうち、生成された文章が、所定の文章に最も類似する入力情報を判定する。
例えば、情報提供装置10は、第1文章とお題として利用者U1に提供した文章との間の類似度を算出する。また、情報提供装置10は、第2文章と、お題として利用者U2に提供した文章との間の類似度を算出する。そして、情報提供装置10は、類似度がより高い文章を特定し、特定した文章の元となる動画像を撮影した利用者に対してポイントを付与する。なお、情報提供装置10は、類似度を利用者EUに対して公開してもよい。
また、情報提供装置10は、お題との一致度に基づいて、制約に沿った文章を生成するためのモデルを再学習してもよい(ステップS5)。例えば、情報提供装置10は、第1動画像から第1文章を生成する際は、第1モデルを利用し、第2動画像から第2文章を生成する場合は、第1モデルとは各種のパラメータと変更した第2モデルを利用する。そして、情報提供装置10は、第1文章よりも第2文章の方がお題との類似度が高い場合は、以後の生成処理において、第2モデルを用いて各種のオブジェクトから文章の生成を行ってもよい。
〔2-3.評価内容について〕
ここで、情報提供装置10は、撮影された文章をSNS等に自動的に投稿してもよい。このような処理を行った場合、利用者EUから受付けられる評価は、文章を投稿したSNSにおいてどれくらい人気が出たか(すなわち、バズりやすいか)の指標となりえる。このような指標を用いて、情報提供装置10は、そのSNSにおいて人気が出やすい文章を生成するようなモデルの学習を行ってもよい。例えば、情報提供装置10は、そのSNSにおいて人気が出た文章と類似する文章を生成するように、文章を生成するモデルの学習や修正を行ってもよい。
〔3.情報提供装置の構成〕
以下、上記した情報提供装置10が有する機能構成の一例について説明する。図4は、実施形態に係る情報提供装置の構成例を示す図である。図4に示すように、情報提供装置10は、通信部20、記憶部30、および制御部40を有する。
通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、端末装置100との間で情報の送受信を行う。
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、品詞データベース31、季語データベース32、およびモデルデータベース33を記憶する。
品詞データベース31には、各種の品詞が登録されている。例えば、品詞データベース31には、各種の名詞や動詞、連体詞、副詞、接続詞等を構成する文字列が登録されている。なお、品詞データベース31は、例えば、公知の文章生成技術において用いられる辞書データが採用可能であるものとする。
季語データベース32には、各種の季語が登録されている。例えば、季語データベース32には、各種の季語と、その季語が示す季節とが対応付けて登録されているものとする。
モデルデータベース33には、生成処理において用いられる各種のモデルが登録されている。例えば、図5は、実施形態に係るモデルデータベースの一例を示す図である。なお、モデルデータベース33には、DNN(Deep Neural Network)、RNN、CNN(Convolutional Neural Network)、LSTM等の各種ネットワークがモデルとして登録されていてもよく、各種文章の生成を行うためのプログラム等がモデルとして登録されていてもよい。
図5に示す例では、モデルデータベース33には、「モデルID(Identifier)」、「モデル種別」、「モデルデータ」、「入力情報」、および「制約条件」が対応付けて登録されている。ここで、「モデルID」とは、モデルを識別するための識別子である。また、「モデル種別」とは、モデルがどのような処理を実行するのかを示す情報である。また、「モデルデータ」とは、モデルのデータである。また、「入力情報」、とは、モデルに対して入力する情報である。また、「制約条件」とは、対応付けられたモデルに対応付けられた「入力情報」を入力した際に出力する文章の形式に対する制約条件を示す情報である。なお、図5に示す情報以外にも、モデルデータベース33には、各種のモデルが登録されていてもよく、モデルに関する各種の情報が登録されていてもよい。
例えば、図5に示す例では、モデルID「モデル#1」、モデル種別「認識モデル」、モデルデータ「モデルデータ#1」、および入力情報「動画像」が対応付けて登録されている。このような情報は、モデルID「モデル#1」が示すモデルが、動画像からオブジェクトを認識するための「認識モデル」であり、モデルのデータが「モデルデータ#1」である旨を示す。また、このような情報は、モデルID「モデル#1」が示すモデルに入力する情報の種別が「動画像」である旨を示す。
また、図5に示す例では、モデルID「モデル#2」、モデル種別「俳句生成モデル」、モデルデータ「モデルデータ#2」、入力情報「動画像、品詞、季語」、制約条件「第1文章:5文字_第2文章:7文字_第3文章:5文字_入力季語をいずれかの文章に含む」が対応付けて登録されている。このような情報は、モデルID「モデル#2」が示すモデルが、俳句を生成する「俳句生成モデル」であり、データが「モデルデータ#2」である旨を示す。また、このような情報は、モデルID「モデル#2」が示すモデルに対し、入力情報「動画像、品詞、季語」が示す種別の情報を入力した際に、制約条件「第1文章:5文字_第2文章:7文字_第3文章:5文字_入力季語をいずれかの文章に含む」を満たすような文章を生成する旨を示す。
なお、図5に示す例では、「モデルデータ#2」といった概念的な値を記載したが、実際には、各種モデルのパラメータやプログラムデータ等がモデルデータベース33に登録されることとなる。また、図5に示す例では、制約条件として「第1文章:5文字_第2文章:7文字_第3文章:5文字_入力季語をいずれかの文章に含む」といった情報を記載したが、実際には、このような制約条件の内容を示す各種の数式やパラメータが登録されることとなる。
図4に戻って説明を続ける。制御部40は、例えば、コントローラ(controller)であり、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報提供装置10内部の記憶装置に記憶されている各種プログラム(通知プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部40は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図4に示すように、制御部40は、取得部41、特定部42、生成部43、提供部44、公開部45、受付部46、および修正部47を有する。取得部41は、各種の入力情報を端末装置100から取得する。例えば、取得部41は、利用者によって撮影された動画像を入力情報として取得する。なお、取得部41は、入力情報として、音声や利用者の位置履歴、投稿履歴、検索履歴、閲覧履歴等、各種の情報を取得してもよい。
特定部42は、入力情報が示すオブジェクトを特定する。例えば、特定部42は、入力情報として受付けられた動画像が示すオブジェクトを特定する。例えば、特定部42は、動画像に撮影されたオブジェクトを認識するための認識モデルをモデルデータベース33から読出し、読み出した認識モデルに動画像を入力することで、動画像に撮影されたオブジェクトの特定を行う。
なお、特定部42は、動画像に撮影された複数のオブジェクトのうち、撮影された時間もしくは撮影された大きさに応じた優先度が所定の閾値を超えるオブジェクトを特定してもよい。例えば、特定部42は、各オブジェクトが動画像内に現れる秒数や面積等に基づいて、オブジェクト毎の優先度を特定し、特定した優先度が所定の閾値を超えるオブジェクトを特定してもよい。
また、特定部42は、入力情報として受付けられた音声に基づいて、入力情報が示すオブジェクトを特定してもよい。例えば、特定部42は、取得された音声の解析を行い、音声の元となるオブジェクトを特定してもよい。また、特定部42は、受付けられた利用者の行動履歴を示す履歴情報が示すオブジェクトを特定してもよい。例えば、特定部42は、利用者が訪れた店舗や地域等をオブジェクトとして特定してもよい。また、特定部42は、動画像に撮影されたオブジェクトの動きを特定してもよい。また、特定部42は、それぞれ異なる利用者によって撮影された動画像等、複数の入力情報のそれぞれについてオブジェクトの特定を行ってもよい。
生成部43は、特定されたオブジェクトに基づいて、所定の制約を満たす形式の文章を生成する。例えば、生成部43は、所定の制約を満たす形式の文章として、所定の定型詩の形式を有する文章を生成してもよく、同一又は類似の韻を有する単語を同一又は類似の位置に含む文章を生成してもよい。また、生成部34は、俳句の形式を有する文章を生成してもよい。
以下、俳句を生成する際の処理の一例について説明する。まず、生成部43は、季語データベース32を参照し、動画像から特定されたオブジェクトやオブジェクトの動きに基づいて、いずれかの季語を選択する。なお、生成部43は、ランダムに季語の選択を行ってもよく、動画像が撮影された日時と対応する季語を選択してもよい。また、生成部43は、特定されたオブジェクトやオブジェクトの動きと関連する季節を推定し、推定した季節と対応する季語を選択してもよい。
また、生成部43は、品詞データベース31を参照し、特定されたオブジェクトやオブジェクトの動きを示す単語や、各単語とともに文章を構成するための品詞を抽出する。そして、生成部43は、各種の品詞、特定されたオブジェクトやオブジェクトの動きを示す単語、および選択された季語とを含む文章であって、俳句の形式を有する文章を生成する。例えば、生成部43は、俳句生成モデルをモデルデータベース33から読出し、読み出した俳句生成モデルに各種の単語、品詞、および季語を入力することで、俳句の形式を有する文章を生成する。なお、生成部43は、予め定めれられた単語であって、季節を示す単語である季語と、前記オブジェクトを示す単語と、所定の品詞とを組み合わせることで、俳句の形式を有する文章の生成を実現してもよい。
また、生成部43は、入力情報を入力した利用者の投稿履歴若しくは検索履歴に基づく表現を含む文章を生成してもよい。例えば、生成部43は、動画像を撮影した利用者の投稿履歴や検索履歴から、利用者が頻繁に利用する単語や表現を特定し、特定した単語や表現が有する特徴を俳句生成モデルに学習させる。そして、生成部43は、特徴を学習した俳句生成モデルを用いて、俳句の形式を有する文章の生成を行ってもよい。また、生成部43は、利用者が頻繁に利用する単語を用いた文章の生成を行ってもよい。
また、生成部43は、各入力情報と対応する複数の文節を含む文章を生成してもよい。例えば、特定部42は、上の句と対応する第1動画像、中の句と対応する第2動画像、および下の句と対応する第3動画像の各動画像からオブジェクトやオブジェクトの動きを特定する。そして、生成部43は、第1動画像から特定されたオブジェクトやオブジェクトの動きを示す単語等から上の句を生成し、第2動画像から特定されたオブジェクトやオブジェクトの動きを示す単語等から中の句を生成し、第3動画像から特定されたオブジェクトやオブジェクトの動きを示す単語等から下の句を生成してもよい。
また、生成部43は、特定されたオブジェクトに基づいて、入力情報を入力した利用者の感情を推定し、推定した感情に応じて文章を生成してもよい。例えば、生成部43は、特定されたオブジェクトの種別や、動画像の彩度や明度等に応じて、利用者の感情を推定し、推定された感情に沿った雰囲気を醸成する単語や表現を含めるように文章の作成を行ってもよい。
なお、生成部43は、それぞれ異なる利用者から所定の主題に沿って撮影された動画像を受付けた場合は、動画像ごとに、文章の生成を行うこととなる。
提供部44は、生成された文章を端末装置100に提供する。例えば、提供部44は、生成部43により生成された文章を、動画像から生成された文章として端末装置100に送信する。
公開部45は、それぞれ異なる利用者から受付けた入力情報ごとに生成した複数の文章を公開する。例えば、公開部45は、それぞれ異なる利用者が所定の主題に沿って撮影した動画像から生成された複数の文章を、任意の利用者に対して公開する。例えば、公開部45は、所定のSNSやウェブコンテンツを介して各文章を公開してもよく、各利用者が利用する端末装置100に対して文章を送信してもよい。
受付部46は、公開された文章に対する評価を受付ける。例えば、受付部46は、公開部45によって公開された文章に対する評価を各利用者から受付ける。そして、受付部46は、受付けた評価結果を、各文章の元となる動画像を撮影した利用者や他の任意の利用者に対して提供する。
修正部47は、評価結果に基づいて、生成部43が文章を生成する際に用いるモデルを修正する。例えば、生成部43は、動画像ごとにパラメータを変更した俳句生成モデルを用いて、複数の利用者から受付けた動画像ごとに俳句の生成を行う。そして、修正部47は、最も評価が高かった俳句を生成したパラメータを、俳句生成モデルの新たなパラメータとして採用する。ここで、パラメータとは、例えば、ニューラルネットワークが有するノード間の接続係数や、文章を生成する際に用いられる各種のパラメータである。
なお、制御部40は、お題となった文章と、お題にそって各利用者が撮影した動画像から生成された文章との比較結果に基づいた処理を実行してもよい。例えば、公開部45は、利用者が所定の文章に沿って生成した入力情報から生成された文章を公開するとともに、生成された文章と、お題となった所定の文章との類似度を算出し、算出した類似度を公開してもよい。また、公開部45は、複数の利用者により入力された入力情報のうち、生成された文章が、所定の文章に最も類似する入力情報を判定し、判定された入力情報を示す情報を公開してもよい。例えば、公開部45は、お題となった所定の文章との類似度が最も高い文章の元となった動画像を公開してもよく、その動画像を撮影した利用者を示す情報を公開してもよい。
〔4.処理手順〕
次に、図6を用いて、実施形態に係る情報提供装置10による生成処理の手順について説明する。図6は、実施形態に係る生成処理の流れの一例を示すフローチャートである。なお、図6に示す例では、情報提供装置10が動画像から俳句を生成する処理の一例について記載した。
まず、情報提供装置10は、動画像を取得する(ステップS101)。このような場合、情報提供装置10は、撮影対象、すなわち、オブジェクトの特定を行う(ステップS102)。続いて、情報提供装置10は、特定結果に基づいて、季語リストから季語を1つ選択する(ステップS103)。そして、情報提供装置10は、選択した季語を含み、俳句の制約条件を満たす文章を生成する(ステップS104)。その後、情報提供装置10は、生成した文章を利用者に提供し(ステップS105)、処理を終了する。
〔5.変形例〕
上述した情報提供装置10は、上記実施形態以外にも種々の異なる形態にて実施されてもよい。そこで、以下では、情報提供装置10の他の実施形態について説明する。
〔5-1.実行主体について〕
上記実施形態では、情報提供装置10が、端末装置100から受付けた動画像からオブジェクトやオブジェクトの動きを特定し、特定したオブジェクトやオブジェクトの動きを示す単語を含む俳句等、形式に所定の制約を有する文章を生成した。しかしながら、実施形態は、これに限定されるものではない。例えば、上述した生成処理は、端末装置100により実行されるアプリケーションにより実現されてもよい。このような場合、端末装置100は、図4に示す各部41~44の機能構成を有することとなる。
〔5-2.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、逆に、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
〔5-3.プログラム〕
また、上述した実施形態に係る情報提供装置10は、例えば図7に示すような構成のコンピュータ1000によって実現される。図7は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
例えば、コンピュータ1000が情報提供装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。
〔6.効果〕
上述してきたように、情報提供装置10は、入力情報が示すオブジェクトを特定し、特定されたオブジェクトに基づいて、所定の制約を満たす形式の文章を生成する。このような処理の結果、情報提供装置10は、利用者が覚えやすく興味を持ちやすい文章を生成することができる。
また、情報提供装置10は、所定の制約を満たす形式の文章として、所定の定型詩の形式を有する文章を生成する。また、情報提供装置10は、同一又は類似の韻を有する単語を同一又は類似の位置に含む文章を生成する。また、情報提供装置10は、俳句の形式を有する文章を生成する。例えば、情報提供装置10は、予め定めれられた単語であって、季節を示す単語である季語と、オブジェクトを示す単語と、所定の品詞とを組み合わせることで、文章を生成する。このような処理の結果、情報提供装置10は、利用者が覚えやすく、興味を持ちやすい文章を生成することができる。
また、情報提供装置10は、複数の季語の中からランダムに選択された季語を含む文章を生成する。このため、情報提供装置10は、利用者が想定していなかった内容の文章を生成することができる結果、利用者の興味をより強く引くことができる文章を生成できる。
また、情報提供装置10は、特定されたオブジェクトに基づいて、複数の季語の中からいずれかの季語を選択し、選択した季語を含む文章を生成する。また、情報提供装置10は、入力情報として受付けられた動画像が示すオブジェクトを特定し、動画像が撮影された日時と対応する季語を含む文章を生成する。このため、情報提供装置10は、適切な季語を含む俳句を生成することができる。
また、情報提供装置10は、入力情報として受付けられた動画像に撮影された複数のオブジェクトのうち、撮影された時間もしくは撮影された大きさに応じた優先度が所定の閾値を超えるオブジェクトを特定する。このため、情報提供装置10は、例えば、主題となるオブジェクトに応じた内容の文章を生成することができる。
また、情報提供装置10は、入力情報を入力した利用者の投稿履歴若しくは検索履歴に基づく表現を含む文章を生成する。また、情報提供装置10は、入力情報として受付けられた動画像に撮影されたオブジェクトを特定する。また、情報提供装置10は、入力情報として受付けられた音声に基づいて、その入力情報が示すオブジェクトを特定する。また、情報提供装置10は、入力情報として受付けられた利用者の行動履歴を示す履歴情報が示すオブジェクトを特定する。この結果、情報提供装置10は、各種の情報から、俳句等の文章を生成することができる。
また、情報提供装置10は、入力情報として受付けられた動画像に撮影されたオブジェクトの動きをさらに特定し特定されたオブジェクトの動きを示す単語を含む文章を生成する。このため、情報提供装置10は、オブジェクトの動きを示す文章を生成することができる。
また、情報提供装置10は、複数の入力情報のそれぞれについてオブジェクトを特定し、各入力情報と対応する複数の文節を含む文章を生成する。このため、情報提供装置10は、より複雑な内容の文章を生成することができる。
また、情報提供装置10は、特定されたオブジェクトに基づいて、入力情報を入力した利用者の感情を推定し、推定した感情に応じて文章を生成する。このため、情報提供装置10は、利用者の感情を反映させた文章を生成することができる。
また、情報提供装置10は、それぞれ異なる利用者から受付けた入力情報ごとに生成した複数の文章を公開し、公開された文章に対する評価を受付ける。また、情報提供装置10は、それぞれ異なる利用者から受付けた入力情報であって、各利用者が所定の主題に沿って生成した入力情報から、文章を入力情報ごとに生成する。また、情報提供装置10は、利用者が所定の文章に沿って生成した入力情報から生成された文章と、その所定の文章とを比較し、複数の利用者により入力された入力情報のうち、生成された文章が、所定の文章に最も類似する入力情報を判定する。このため、情報提供装置10は、このため、情報提供装置10は、例えば、主題とより対応性が高い動画像を誰が撮影できるかというアクティビティを利用者に提供することができる。
また、情報提供装置10は、評価結果に基づいて、オブジェクトから文章を生成する際に用いるモデルを修正する。このため、情報提供装置10は、より利用者が興味を有する文章を生成することができる。
以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
10 情報提供装置
20 通信部
30 記憶部
31 品詞データベース
32 季語データベース
33 モデルデータベース
40 制御部
41 取得部
42 特定部
43 生成部
44 提供部
45 公開部
46 受付部
47 修正部
100 端末装置

Claims (11)

  1. 入力情報として受付けられた利用者の位置の履歴から当該利用者が訪問した場所の名称をオブジェクトの名称として特定する特定部と、
    特定部により特定されたオブジェクトの名称を含む文章であって、所定の制約を満たす形式の文章を生成する生成部と
    前記生成部がそれぞれ異なる利用者から受付けた入力情報ごとに生成した複数の文章を公開する公開部と、
    前記公開部により公開された文章に対する評価を受付ける受付部と
    を有することを特徴とする生成装置。
  2. 前記生成部は、前記所定の制約を満たす形式の文章として、所定の定型詩の形式を有する文章を生成する
    ことを特徴とする請求項1に記載の生成装置。
  3. 前記生成部は、同一又は類似の韻を有する単語を同一又は類似の位置に含む文章を生成する
    ことを特徴とする請求項2に記載の生成装置。
  4. 前記生成部は、俳句の形式を有する文章を生成する
    ことを特徴とする請求項2または3に記載の生成装置。
  5. 前記特定部は、複数の入力情報のそれぞれについてオブジェクトを特定し、
    前記生成部は、各入力情報と対応する複数の文節を含む文章を生成する
    ことを特徴とする請求項1~4のうちいずれか1つに記載の生成装置。
  6. 前記生成部は、前記特定部により特定されたオブジェクトに基づいて、前記入力情報を入力した利用者の感情を推定し、推定した感情に応じて前記文章を生成する
    ことを特徴とする請求項1~5のうちいずれか1つに記載の生成装置。
  7. 前記生成部は、前記生成部がそれぞれ異なる利用者から受付けた入力情報であって、各利用者が所定の主題に沿って生成した入力情報から、前記文章を入力情報ごとに生成する
    ことを特徴とする請求項に記載の生成装置。
  8. 前記受付部により受付けられた評価結果に基づいて、前記生成部が前記特定部により特定されたオブジェクトから前記文章を生成する際に用いるモデルを修正する修正部
    を有することを特徴とする請求項またはに記載の生成装置。
  9. 前記生成部により生成された文章であって、利用者が所定の文章に沿って撮影した動画像から生成された文章と、当該所定の文章とを比較する比較部と、
    複数の利用者が前記所定の文章に沿って撮影し動画像のうち、前記生成部により生成された文章が、前記所定の文章に最も類似する動画像を判定する判定部と
    を有することを特徴とする請求項1~6のうちいずれか1つに記載の生成装置。
  10. 生成装置が実行する生成方法であって、
    入力情報として受付けられた利用者の位置の履歴から当該利用者が訪問した場所の名称をオブジェクトの名称として特定する特定工程と、
    特定工程により特定されたオブジェクトの名称を含む文章であって、所定の制約を満たす形式の文章を生成する生成工程と
    前記生成工程がそれぞれ異なる利用者から受付けた入力情報ごとに生成した複数の文章を公開する公開工程と、
    前記公開工程により公開された文章に対する評価を受付ける受付工程と
    を含むことを特徴とする生成方法。
  11. 入力情報として受付けられた利用者の位置の履歴から当該利用者が訪問した場所の名称をオブジェクトの名称として特定する特定手順と、
    特定手順により特定されたオブジェクトの名称を含む文章であって、所定の制約を満たす形式の文章を生成する生成手順と
    前記生成手順がそれぞれ異なる利用者から受付けた入力情報ごとに生成した複数の文章を公開する公開手順と、
    前記公開手順により公開された文章に対する評価を受付ける受付手順と
    をコンピュータに実行させるための生成プログラム。
JP2018234770A 2018-12-14 2018-12-14 生成装置、生成方法および生成プログラム Active JP7315321B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018234770A JP7315321B2 (ja) 2018-12-14 2018-12-14 生成装置、生成方法および生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018234770A JP7315321B2 (ja) 2018-12-14 2018-12-14 生成装置、生成方法および生成プログラム

Publications (2)

Publication Number Publication Date
JP2020095615A JP2020095615A (ja) 2020-06-18
JP7315321B2 true JP7315321B2 (ja) 2023-07-26

Family

ID=71086436

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018234770A Active JP7315321B2 (ja) 2018-12-14 2018-12-14 生成装置、生成方法および生成プログラム

Country Status (1)

Country Link
JP (1) JP7315321B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111832275B (zh) * 2020-09-21 2022-02-25 北京百度网讯科技有限公司 文本的创作方法、装置、设备以及存储介质
JP7359196B2 (ja) * 2021-09-08 2023-10-11 カシオ計算機株式会社 情報処理装置、情報処理方法、及び、情報処理プログラム
JP2023177649A (ja) * 2022-06-02 2023-12-14 株式会社シーズ 情報処理システム、情報処理方法、及びプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004133721A (ja) 2002-10-11 2004-04-30 Advanced Telecommunication Research Institute International 俳句生成システムおよび俳句生成装置
JP2008205650A (ja) 2007-02-16 2008-09-04 Sony Corp 画像処理装置及び画像処理方法、撮像装置、並びにコンピュータ・プログラム
JP2012168861A (ja) 2011-02-16 2012-09-06 Nomura Research Institute Ltd 行動情報記録装置
JP2013131234A (ja) 2013-02-25 2013-07-04 Olympus Imaging Corp 文書自動作成装置
JP2017156799A (ja) 2016-02-29 2017-09-07 学校法人甲南学園 台本自動作成装置、台本自動作成方法、及び台本自動作成プログラム
US20180203851A1 (en) 2017-01-13 2018-07-19 Microsoft Technology Licensing, Llc Systems and methods for automated haiku chatting

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004133721A (ja) 2002-10-11 2004-04-30 Advanced Telecommunication Research Institute International 俳句生成システムおよび俳句生成装置
JP2008205650A (ja) 2007-02-16 2008-09-04 Sony Corp 画像処理装置及び画像処理方法、撮像装置、並びにコンピュータ・プログラム
JP2012168861A (ja) 2011-02-16 2012-09-06 Nomura Research Institute Ltd 行動情報記録装置
JP2013131234A (ja) 2013-02-25 2013-07-04 Olympus Imaging Corp 文書自動作成装置
JP2017156799A (ja) 2016-02-29 2017-09-07 学校法人甲南学園 台本自動作成装置、台本自動作成方法、及び台本自動作成プログラム
US20180203851A1 (en) 2017-01-13 2018-07-19 Microsoft Technology Licensing, Llc Systems and methods for automated haiku chatting

Also Published As

Publication number Publication date
JP2020095615A (ja) 2020-06-18

Similar Documents

Publication Publication Date Title
CN107563500B (zh) 一种基于用户头像的视频推荐方法及系统
CN108431802B (zh) 组织与用户关联的图像
US11704501B2 (en) Providing a response in a session
US9436682B2 (en) Techniques for machine language translation of text from an image based on non-textual context information from the image
CN110968736B (zh) 视频生成方法、装置、电子设备及存储介质
JP7315321B2 (ja) 生成装置、生成方法および生成プログラム
CN103988202A (zh) 基于索引和搜索的图像吸引力
US20170316256A1 (en) Automatic animation triggering from video
CN109063662B (zh) 数据处理方法、装置、设备及存储介质
US20140108541A1 (en) Terminal apparatus, terminal control method, information processing apparatus, information processing method, and program
JP2011215964A (ja) サーバ装置、クライアント装置、コンテンツ推薦方法及びプログラム
KR101905501B1 (ko) 컨텐츠를 추천하는 방법 및 장치
US9525841B2 (en) Imaging device for associating image data with shooting condition information
EP3308300A1 (en) Determining image captions
CN104615639B (zh) 一种用于提供图片的呈现信息的方法和设备
CN112163560A (zh) 一种视频信息处理方法、装置、电子设备及存储介质
CN110414001B (zh) 语句生成方法和装置、存储介质及电子装置
US11651280B2 (en) Recording medium, information processing system, and information processing method
JP6900334B2 (ja) 映像出力装置、映像出力方法および映像出力プログラム
JP2015179399A (ja) テキスト生成装置、テキスト生成プログラム及びテキスト生成方法
CN110866148A (zh) 信息处理系统、信息处理装置及存储介质
CN113269141B (zh) 一种图像处理方法及装置
KR102342843B1 (ko) 주변 환경 및 사용자의 선호도를 고려한 맞춤형 컨텐츠 제공 방법
CN111083525B (zh) 一种自动生成智能影像的方法及其系统
WO2022100665A1 (zh) 一种图像分享的方法、装置及终端设备

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200917

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211105

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220712

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20220712

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20220720

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20220726

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20220916

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20220927

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20221025

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20221220

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20230131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230403

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230713

R150 Certificate of patent or registration of utility model

Ref document number: 7315321

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350