JP2015179399A

JP2015179399A - テキスト生成装置、テキスト生成プログラム及びテキスト生成方法

Info

Publication number: JP2015179399A
Application number: JP2014056435A
Authority: JP
Inventors: 寛子小林; Hiroko Kobayashi
Original assignee: Nikon Corp
Current assignee: Nikon Corp
Priority date: 2014-03-19
Filing date: 2014-03-19
Publication date: 2015-10-08

Abstract

【課題】バリエーションのあるテキストを生成するテキスト生成装置、テキスト生成プログラム及びテキスト生成方法を提供する。
【解決手段】テキスト生成装置は、複数のデータから単語を抽出するＳ４単語抽出部と、単語抽出部で抽出された単語と複数のデータとに基づいてテンプレートを生成するＳ５テンプレート生成部と、単語抽出部で抽出された単語とテンプレート生成部で生成されたテンプレートと画像とに基づいてテキストを生成するＳ９テキスト生成部と、テキスト生成部で生成されたテキストを画像に関連付けるＳ１０テキスト関連付部と、を備える。
【選択図】図６

Description

本発明は、テキスト生成装置、テキスト生成プログラム及びテキスト生成方法に関するものである。

従来、撮像画像に対し、文字情報を付与することができる画像処理装置が知られている。例えば、特許文献１では、画像から特徴量を抽出し、その特徴量を単語に変換し、その単語を文章テンプレートに挿入することによって文章を作成する技術が開示されている。

特開２０１３−１４０５５９

しかしながら、従来技術では、あらかじめ単語とテンプレートを準備する必要がある。そのため、あらかじめ準備された単語またはテンプレートの数が少ない場合、その組み合わせによって作成される文章のバリエーション数が制限されるおそれがあった。

本発明は、このような問題点に鑑みてなされたものであり、テキストのバリエーション数を増やすことを目的とする。

本発明の一態様に係るテキスト生成装置は、複数のデータから単語を抽出する単語抽出部と、単語抽出部で抽出された単語と複数のデータとに基づいてテンプレートを生成するテンプレート生成部と、単語抽出部で抽出された単語とテンプレート生成部で生成されたテンプレートと画像とに基づいてテキストを生成するテキスト生成部と、テキスト生成部で生成されたテキストを画像に関連付けるテキスト関連付部とを備える。

本発明の一態様に係るテキスト生成装置は、複数のキーワードごとに分類された複数のデータからキーワードごとに単語を抽出する単語抽出部と、単語抽出部でキーワードごとに抽出された単語とキーワードごとに分類された複数のデータとに基づいてキーワードごとにテンプレートを生成するテンプレート生成部と、単語抽出部でキーワードごとに抽出された単語とテンプレート生成部でキーワードごとに生成されたテンプレートとキーワードとに基づいて、キーワードごとにテキストを生成するテキスト生成部とを備える。

本発明の一態様に係るテキスト生成方法は、複数のデータから単語を抽出し、単語抽出部で抽出された単語と複数のデータとに基づいてテンプレートを生成し、単語抽出部で抽出された単語とテンプレート生成部で生成されたテンプレートと画像とに基づいてテキストを生成し、テキスト生成部で生成されたテキストを画像に関連付ける。

本発明の一態様に係るプログラムは、複数のデータから単語を抽出する単語抽出ステップと、単語抽出部で抽出された単語と複数のデータとに基づいてテンプレートを生成するテンプレート生成ステップと、単語抽出部で抽出された単語とテンプレート生成部で生成されたテンプレートと画像とに基づいてテキストを生成するテキスト生成ステップと、テキスト生成部で生成されたテキストを画像に関連付けるテキスト関連付ステップとを実行させる。

本発明によれば、テキストのバリエーション数を増やすことができる。

実施例１によるテキスト生成装置１の機能ブロック図である。画像記憶部３に記憶される画像の一例である。データ記憶部１２ａに記憶されるデータの一例である。単語テンプレート記憶部１２ｂに記憶されるデータの一例である。生成されたテキストを対象画像に重畳したときのイメージ図である。実施例１によるテキスト生成装置１の動作の全体の流れを示したフローチャートである。実施例１によるテキスト生成装置１の単語Ｔｗの抽出方法を示したフローチャートである。形態素解析の結果例である。各単語の重要度の計算結果と、単語Ｔｗとをキーワードごとに示した図である。実施例１によるテキスト生成装置１のテンプレートＴｔの生成方法を示したフローチャートである。実施例１によるテキスト生成装置１のテキストの生成方法を示したフローチャートである。実施例２によるテキスト生成装置１の機能ブロック図である。実施例２によるテキスト生成装置１の動作の全体の流れを示したフローチャートである。実施例２によるテキスト生成装置１の単語Ｔｗの抽出方法を示したフローチャートである。単語の評価テーブルの一例である。実施例２によるテキスト生成装置１のテンプレートＴｔの生成方法を示したフローチャートである。実施例３によるテキスト生成装置１の機能ブロック図である。実施例３によるテキスト生成装置１のデータ記憶部１２ａに記憶されるデータの一例である。実施例３によるテキスト生成装置１の単語テンプレート記憶部１２ｂに記憶されるデータの一例である。実施例３によるテキスト生成装置１の動作の全体の流れを示したフローチャートである。実施例３によるテキスト生成装置１の単語Ｔｗの抽出方法を示したフローチャートである。実施例３によるテキスト生成装置１のテキストの生成方法を示したフローチャートである。

本発明によるテキスト生成装置ついて、以下、図面やフローチャートを参照しながら説明する。なお、本明細書内において特別な記載がない限り、言葉の定義は以下のようにする。「単語」とは、文法上の意味を持つ最小単位である。例えば「花が咲く」を単語に分割すると、「花」「が」「咲く」となる。「テンプレート」とは、コンピュータのソフトウェアで、設定ずみのパターンである。「テキスト」とは、コンピュータで文字データのことである。「文」とは、一つの事態を表す言語表現の一単位である。通常は主語と述語を含むが、命令文や感嘆文のように主語と述語を含まないものも文である。「文章」とは、複数の文から構成されるものである。「データ」とは、コンピュータで処理する情報で
ある。

図１は、本実施例に係るテキスト生成装置１の機能ブロック図の一例である。

テキスト生成装置１は、生成部１０と、テキスト関連付部１１と、記憶部１２と、シーン分類判定部１３と、通信部１４と、制御部１５と、を備える。生成部１０は、単語抽出部１０ａと、テンプレート生成部１０ｂと、テキスト生成部１０ｃと、を備える。記憶部１２は、データ記憶部１２ａと、単語テンプレート記憶部１２ｂと、を備える。

外部記憶装置２は、データ記憶部２０と、通信部２１と、制御部２２と、を備える。本実施例の外部記憶装置２として、例えばブログやＳＮＳ（ＳｏｃｉａｌＮｅｔｗｏｒｋｉｎｇＳｅｒｖｉｃｅ）や写真共有サイト等のデータベースサーバなどが挙げられる。データ記憶部２０は、パソコンやスマートフォン、デジタルカメラ等から、ブログ、ＳＮＳ、写真共有サイト等に投稿された文字データや音声データ、画像データ等を記憶する。通信部２１は、データ記憶部２０に記憶されている文字データをテキスト生成装置１へ送信する。制御部２２は、データ記憶部２０と通信部２１とを制御する。本実施例では、テキスト生成装置１が外部記憶装置２から受信するデータは、文字データのみとする。

画像記憶部３は、テキスト生成装置１に対して着脱可能に接続される記憶部である。例えば、ＵＳＢメモリやメモリーカード等が挙げられる。画像記憶部３は、図２に示すようなテキストを関連付けする対象画像を記憶する。

テキスト生成装置１は、制御部１５の制御により、外部記憶装置２の制御部２２によってデータ記憶部２０に記憶されているデータが読み出だされ通信部２１を介してデータ記憶部２０に記憶された文字データを、通信部１４から受信する。さらに、テキスト生成装置１は、制御部１５の制御により、画像記憶部３に記憶されている、テキストと関連付けを行う対象画像を通信部１４から受信する。

記憶部１２は、外部記憶装置２から受信した文字データと、テキスト生成のために必要な単語とテンプレートを記憶する。

データ記憶部１２ａは、通信部１４が外部記憶装置２から受信した文字データをキーワードごとに分類して記憶する。本実施例では、キーワードは画像のシーン分類と一致する。例えば、データ記憶部１２ａは、図３に示すように、複数の文字データを所定の４つのキーワード（犬、スイーツ、イルミネーションおよびその他）ごとに分類し、４つのデータグループとして記憶する。データグループとは、データを有するグループのことである。４つのデータグループは、図３に示されるように、複数の文字データをそれぞれ有する。キーワードの数は４つに限定されるものではなく、いくつでもよい。また、キーワードは犬、スイーツ、イルミネーション、その他に限定されるものではなく、その他の言葉でもよい。ここでキーワードごとに分類するとは、文字データをグループにまとめることと同様の意味である。例えばキーワードＡに応じて分類されたデータグループとは、データグループＡを意味する。

生成部１０は、複数の文字データと画像からテキストを生成する。

単語抽出部１０ａは、データ記憶部１２ａに記憶された全ての文字データを使用して、データグループごとに単語Ｔｗを抽出する。本実施例では、単語抽出部１０ａで抽出された単語を単語Ｔｗと記載する。単語Ｔｗの例として、本実施例では、重要度の高い単語のことをいう。単語Ｔｗは、各データグループについて複数抽出されることが望ましい。単語
Ｔｗの抽出方法は後に詳述する。

テンプレート生成部１０ｂは、データ記憶部１２ａでデータグループが有する複数の文字データと、単語抽出部１０ａでデータグループごとに抽出された単語Ｔｗとを使用して、データグループごとにテンプレートＴｔを生成する。本実施例では、テンプレート生成部１０ｂで生成されたテンプレートをテンプレートＴｔと記載する。本実施例でテンプレートＴｔとは、単語Ｔｗを挿入してテキストを生成するための雛形である。例えばテンプレートＴｔは、図４のテンプレートＴｔが示すようなアスタリスク＊部分に、単語Ｔｗを挿入することでテキストとなる文字データである。テンプレートＴｔは、各データグループについて複数生成されることが望ましい。テンプレートＴｔの生成方法は後に詳述する。

単語テンプレート記憶部１２ｂは、図４に示すように単語ＴｗとテンプレートＴｔをキーワードごとに分類して記憶する。

シーン分類判定部１３は、テキストを関連付けする対象画像の特徴量を抽出することにより、対象画像のシーン分類を判定する。このシーン分類は、データ記憶部１２ａ、単語テンプレート記憶部１２ｂで使用しているいずれかのキーワードと一致する。特徴量は、対象画像の色や輝度、エッジ量、焦点距離、顔認識の有無、ｅｘｉｆに記録されている情報等や、それら情報を加工したものであってもよい。なお、判定に用いる特徴量や判定方法は、特開２０１３−１４０５５９に記載されているものを用いることが可能である。

テキスト生成部１０ｃは、単語テンプレート記憶部１２ｂにキーワードごとに分類して記憶されている単語ＴｗとテンプレートＴｔと、シーン分類判定部１３で判定された対象画像のシーン分類と、を使用してテキストを生成する。対象画像のシーン分類と一致するキーワードに分類して記憶されている単語ＴｗとテンプレートＴｔを組み合わせることでテキストを生成する。テキストの生成方法は後に詳述する。

テキスト関連付部１１は、テキスト生成部１０ｃで生成されたテキストを対象画像に関連付ける。関連付けるテキストは１つであってもよいし、複数でもよい。関連付けの方法は、例えば、テキストを対象画像に重畳する、テキストと対象画像を別々に表示する、テキストを文字データとして対象画像のｅｘｉｆに記録されている情報に追加する、テキストを音声データに変換して対象画像のｅｘｉｆに記録されている情報に追加する、等が挙げられる。図５は、図２のような対象画像に対して「この犬とてもかしこい。」というテキストが生成され、対象画像に重畳したときの例である。

制御部１５は、単語抽出部１０ａと、テンプレート生成部１０ｂと、テキスト生成部１０ｃと、テキスト関連付部１１と、データ記憶部１２ａと、単語テンプレート記憶部１２ｂと、シーン分類判定部１３と、通信部１４と、を制御する。

次に、本実施例に係るテキスト生成装置１の動作を説明する。

まず、テキスト生成装置１における動作の全体の流れを図６に示すフローチャートを用いて説明する。

（Ｓ１）ユーザがテキスト生成装置１のスイッチをＯＮにする。なお、本実施例では、ユーザがテキスト生成装置１のスイッチをＯＮにすることに基づいて、図６に示す処理を実行するが、それに限定されるものではない。図示しない表示部にメニュー画面を表示させ、メニュー画面を操作することによって、図６に示す処理を実行してもよい。また、必ずしもユーザによる操作は必要なく、自動的に図６に示す処理が実行されてもよい。

（Ｓ２）通信部１４は、外部記憶装置２から複数の文字データを受信する。例えば、外部記憶装置２のデータ記憶部２０にはブログやＳＮＳ、写真共有サイトに投稿された文字データや音声データ、画像データ等が記憶されており、文字データのみを受信する。外部記憶装置２の制御部２２は、データ記憶部２０に記憶されているデータを読み出し、通信部２１を介して記憶部２０に記憶された文字データをテキスト生成装置１へ送信する。テキスト生成装置１は、外部記憶装置２に記憶された文字データを、通信部１４を介して受信する。

（Ｓ３）データ記憶部１２ａは、Ｓ２で受信した複数の文字データをキーワードごとに分類して記憶する。例えば図３に示すように、複数の文字データを所定の４つのキーワード（犬、スイーツ、イルミネーションおよびその他）ごとに分類し、４つのデータグループとして記憶する。４つのデータグループのそれぞれは、複数の文字データを有する。本実施例では、前述したようにキーワードはシーン分類と一致するものとする。

（Ｓ４）単語抽出部１０ａは、データ記憶部１２ａでデータグループが有する複数の文字データから、データグループごとに単語Ｔｗを抽出する。単語Ｔｗとは、重要度の高い単語を意味する。本実施例において、重要度の高い単語とは、ある特定のデータグループにのみ含まれていて、かつ、含まれている数が多い単語である。図３を用いて詳しく説明する。

図３に示すように、単語「かわいい」は、データグループ「犬」、データグループ「スイーツ」、データグループ「イルミネーション」、に含まれている。このように単語「かわいい」を含むデータグループの数が多い場合、単語「かわいい」の重要度は低くなる。一方、単語「大きい」や単語「かしこい」は、データグループ「犬」にのみ記憶されている。このように、ある特定データグループにのみ含まれている単語「大きい」「かしこい」の重要度は高くなる。さらに、単語「大きい」はデータグループ「犬」に２つ含まれており、単語「かしこい」はデータグループ「犬」に１つ含まれている。この場合、データグループ「犬」に含まれている単語「大きい」の重要度は、単語「かしこい」の重要度より高くなる。以上より、データグループ「犬」に含まれている単語「かわいい」「大きい」「かしこい」を重要度が高い順番に並べると、大きい→かしこい→かわいい、となる。このような単語の重要度を考慮することによって、多くのデータグループに含まれている単語は一般的な単語として抽出されず、ある特定のデータグループにのみ含まれている単語は重要度が高い単語として抽出することができる。以上の単語Ｔｗの抽出方法の一例を図７に示すフローチャートを用いて詳しく説明する。単語の重要度の計算にはｔｆ・ｉｄｆ値を用いる。ｔｆ・ｉｄｆ値とは、単語に関する重みの一種である。

図７は、図６に示すＳ４の詳細な処理について説明をするフローチャートである。図７に示す（Ｓ４１）において、単語抽出部１０ａは、データ記憶部１２ａに記憶された複数の文字データを取得し、全ての文字データに対して形態素解析を行う。形態素解析は、自然言語で書かれた文を、意味を持つ最小の言語単位に区切り、それぞれの品詞を判定する技術である。形態素解析は、コンピュータ等の計算機を用いた自然言語処理技術のひとつであり、かな漢字変換や機械翻訳などに応用されている。例えば、「お待ちしております。」という文字データに対して形態素解析を行うと、図８のような結果が得られる。これは、既存の形態素解析ツールを使用して解析した結果である。本実施例では、既存の形態素解析ツールを用いて形態素解析を利用する。

（Ｓ４２）単語抽出部１０ａは、Ｓ４１で区切られた単語を１つ選択する。選択された単語を単語ｉとする。本実施例では、単語ｉに対して、単語の重要度を計算する。

（Ｓ４３）単語抽出部１０ａは、単語ｉの品詞が形容詞であるかどうかを判定する。単
語ｉの品詞は、Ｓ４１で形態素解析を行った際に判定されているため、形態素解析の結果を使用すればよい。単語ｉが形容詞でなければ、Ｓ４７へ進む。単語ｉが形容詞であればＳ４４へ進む。

（Ｓ４４）単語抽出部１０ａは、単語ｉの出現頻度ｔｆを計算する。出現頻度ｔｆは、１つのデータグループに単語ｉがどれだけの頻度で含まれているかを示す。出願頻度ｔｆは、下記（数１）を使用して計算する。
（数１）ｔｆ_ｉ，ｊ＝ｎ_ｉ，ｊ／Σ_ｋｎ_ｋ，ｊ
ｉは単語、ｊはキーワードを表している。ｎ_ｉ，ｊは、データグループｊに含まれている単語ｉの数である。Σ_ｋｎ_ｋ，ｊは、データグループｊに含まれている単語の総数である。（数１）を書き換えると、
（数１ａ）ｔｆ_ｉ，ｊ＝データグループｊに含まれている単語ｉの数／データグループｊに含まれている単語の総数
となる。例えば、図３で、単語ｉは「かわいい」、キーワードｊは「犬」、とする。単語ｉ「かわいい」はデータグループｊ「犬」に２つ含まれており、データグループｊ「犬」に含まれている単語の総数は２５なので、ｔｆ_ｉ，ｊ＝２／２５、となる。

（Ｓ４５）単語抽出部１０ａは、単語ｉの逆文書頻度ｉｄｆを計算する。逆文書頻度ｉｄｆは、単語ｉがどれだけの数のデータグループに含まれているかを示す。逆文書頻度ｉｄｆは、下記（数２）を使用して計算する。
（数２）ｉｄｆ_ｉ＝ｌｏｇ（｜ｊ｜／｜｛ｊ：ｊ∋ｔ_ｉ｝｜）
｜ｊ｜はキーワードの総数、すなわちデータグループの総数である。｛ｊ：ｊ∋ｔ_ｉ｝は単語ｉを含んでいるデータグループの数を表す。（数２）書き換えると、
（数２ａ）ｉｄｆ_ｉ＝ｌｏｇ（データグループの総数／単語ｉを含んでいるデータグループの数）
となる。例えば、図３で、単語ｉは「かわいい」とする。キーワードは、「犬」「スイーツ」「イルミネーション」「その他」の４つなので、データグループの総数は４である。単語ｉ「かわいい」を含んでいるデータグループは、「犬」「スイーツ」「イルミネーション」の３つなので、ｉｄｆ_ｉ＝ｌｏｇ（４／３）となる。対数を用いているため、ｉｄｆは多くのデータグループに含まれている単語、つまり一般的な単語、の重要度を低くし、ある特定のデータグループにのみ含まれている単語の重要度を高くする役割を果たす。つまり、ｉｄｆは一種の一般語フィルタの役割を果たす。

（Ｓ４６）単語抽出部１０ａは、単語ｉのｔｆ・ｉｄｆ値を計算する。本実施例では、ｔｆ・ｉｄｆ値が高い単語ほど、重要度の高い単語である。（数３）を使用して計算する。
（数３）ｔｆ・ｉｄｆ＝ｔｆ_ｉ，ｊ×ｉｄｆ_ｉ
単語ｉのｔｆ・ｉｄｆ値は、出現頻度ｔｆと逆文書頻度ｉｄｆの積で求められる。例えば、図３で単語ｉは「かわいい」、キーワードｊは「犬」、とすると、ｔｆ・ｉｄｆ＝（２／２５）×ｌｏｇ（４／３）となる。つまり、データグループｊ「犬」に含まれる単語ｉ「かわいい」の重要度は（２／２５）×ｌｏｇ（４／３）≒１．０×０．０１である。同様に、データグループｊ「犬」に含まれる単語ｉ「大きい」の重要度は、ｔｆ・ｉｄｆ＝（２／２５）×ｌｏｇ（４／１）≒４．８×０．０１となる。データグループｊ「犬」に含まれる単語ｉ「かしこい」の重要度は、ｔｆ・ｉｄｆ＝（１／２５）×ｌｏｇ（４／１）≒２．４×０．０１となる。よって、データグループｊ「犬」に含まれている「かわいい」「大きい」「かしこい」という単語を重要度の高い順番に並べると、前述したように、大きい→かしこい→かわいい、となる。

（Ｓ４７）単語抽出部１０ａは、Ｓ４１で区切られた単語のうち、単語ｉが最後の単語であるか判断する。最後の単語であるかの判断は、全ての単語に対して図７のフローチャ
ートの処理を実行したかどうかで判断する。最後の単語でなければＳ４２に戻り、次の単語を選択する。最後の単語であればＳ４８へ進む。

（Ｓ４８）単語抽出部１０ａは、Ｓ４６で計算された重要度の高い単語を単語Ｔｗとして、データグループごとに抽出する。このとき、単語Ｔｗは、各データグループについて複数抽出されることが望ましい。本実施例では重要度の高い方から順に２つずつデータグループごとに単語Ｔｗを抽出する。図３を例に、単語ｉの重要度と、抽出された単語Ｔｗを、キーワード「犬」とキーワード「スイーツ」についてまとめたものを図９に示す。このときデータグループ「犬」に含まれている単語の総数は２５、データグループ「スイーツ」に含まれている単語の総数は２３、である。また、各データグループに含まれていない単語の欄は空白になっている。

図６に戻ってテキスト生成装置１の動作を説明する。
（Ｓ５）テンプレート生成部１０ｂは、Ｓ３で記憶した文字データとＳ４で抽出した単語Ｔｗとを使用して、データグループごとにテンプレートＴｔを生成する。テンプレートＴｔは、アスタリスク＊部分に単語Ｔｗを挿入するとテキストとなる雛形である。テンプレートＴｔの生成方法の一例を図１０に示すフローチャートを用いて詳しく説明する。

図１０は、図６に示すＳ５の詳細な処理について説明をするフローチャートである。図１０に示す（Ｓ５１）において、テンプレート生成部１０ｂは、データ記憶部１２ａに記憶された文字データを取得し、文を１つ選択する。本実施例では、文字データを句点やスペース、疑問符、感嘆符等で区切ったものを１つの文とする。選択された文を文Ｄとする。例えば図３で、「この犬とても大きい。」が文Ｄとして選択される。

（Ｓ５２）テンプレート生成部１０ｂは、文Ｄがどのデータグループに含まれているか判定する。さらに、テンプレート生成部１０ｂは、文Ｄを含むデータグループから抽出された単語Ｔｗが、文Ｄに含まれているか判定する。文Ｄは同じ単語Ｔｗを複数含んでいてもよいし、異なる単語Ｔｗを複数含んでいてもよい。単語Ｔｗが文Ｄに含まれていなければＳ５４へ進む。単語Ｔｗが文Ｄに含まれていればＳ５３へ進む。例えば図３で、「この犬とても大きい。」という文Ｄは、データグループ「犬」に含まれていると判定する。さらにデータグループ「犬」から抽出された単語Ｔｗは「大きい」「かしこい」であり、単語Ｔｗ「大きい」が文Ｄに含まれているため、Ｓ５３へ進む。

（Ｓ５３）テンプレート生成部１０ｂは、文Ｄに含まれる単語Ｔｗをアスタリスク＊に置き換え、テンプレートＴｔを生成する。例えば、文Ｄ「この犬とても大きい。」から、単語Ｔｗ「大きい」をアスタリスク＊に置き換え、「この犬とても＊。」というテンプレートＴｔが生成される。

（Ｓ５４）テンプレート生成部１０ｂは、取得した文字データに含まれる文のうち文Ｄが最後の文であるか判断する。最後の文であるかの判断は、全ての文に対して図１０のフローチャートの処理を実行したかどうかで判断する。最後の文でなければＳ５１へ戻り、次の文でテンプレートＴｔを生成する処理を行う。文Ｄが最後の文であれば、テンプレート生成部１０ｂは処理を終了する。例えば、文Ｄ「この犬とても大きい。」は最後の文ではないので、Ｓ５１へ戻り、次の文「うちの犬が１番かわいい！」を文Ｄとして選択する。このようにテンプレートＴｔの生成処理を繰り返すと、図４に示すようなテンプレートＴｔがデータグループごとに生成される。

図６に戻ってテキスト生成装置１の動作を説明する。
（Ｓ６）単語テンプレート記憶部１２ｂは、Ｓ４で抽出した単語ＴｗとＳ５で生成したテンプレートＴｔを、図４に示すようにキーワードごとに分類して記憶する。

（Ｓ７）シーン分類判定部１３は、通信部１４を介して、画像記憶部３に記憶されているテキストを関連付けする対象画像を取得する。

（Ｓ８）シーン分類判定部１３は、取得した対象画像の特徴量を抽出し、対象画像のシーン分類を判定する。シーン分類の判定に用いる特徴量や判定方法は、前述したように特開２０１３−１４０５５９に記載されているものを用いることが可能である。具体的には、対象画像の色や輝度、エッジ量、焦点距離、顔認識の有無や数、ｅｘｉｆに記録されている情報等や、それらを加工したものを特徴量として抽出し、その特徴量に応じて対象画像のシーン分類を判定する。ここでいうシーン分類は、データ記憶部１２ａまたは単語テンプレート記憶部１２ｂで使用しているいずれかのキーワードと一致する。

（Ｓ９）テキスト生成部１０ｃは、Ｓ６で単語テンプレート記憶部１２ｂにキーワードごとに分類して記憶された単語ＴｗとテンプレートＴｔと、Ｓ８で判定された対象画像のシーン分類とを使用してテキストを生成する。テキストの生成方法の一例を図１１に示すフローチャートを用いて詳しく説明する。

図１１は、図６に示すＳ９の詳細な処理について説明をするフローチャートである。図１１に示す（Ｓ９１）において、テキスト生成部１０ｃは、シーン分類判定部１３で判定された対象画像のシーン分類を取得する。

（Ｓ９２）テキスト生成部１０ｃは、Ｓ９１で取得したシーン分類が、どのキーワードと一致するのか判定する。ここでいうキーワードとは、データ記憶部１２ａまたは単語テンプレート記憶部１２ｂで使用しているいずれかのキーワードである。つまり、テキスト生成部１０ｃは画像に対応するキーワードの判定を行うキーワード判定部の役割も担う。テキスト生成部１０ｃは、一致するキーワードに分類して記憶されている単語ＴｗとテンプレートＴｔを、単語テンプレート記憶部１２ｂからランダムに選択する。例えば、シーン分類判定部１３は図２の画像のシーン分類を「犬」と判定する。テキスト生成部１０ｃは、シーン分類「犬」と一致するキーワード「犬」に分類して記憶されている単語Ｔｗ「かしこい」とテンプレートＴｔ「この犬とても＊。」を選択する（図４）。

（Ｓ９３）テキスト生成部１０ｃは、Ｓ９２で選択した単語ＴｗをテンプレートＴｔのアスタリスク＊部分に挿入してテキストを生成する。例えば、単語Ｔｗ「かしこい」をテンプレートＴｔ「この犬とても＊。」に挿入すると、「この犬とてもかしこい。」というテキストが生成される。

（Ｓ９４）Ｓ９３で生成されたテキストを、図示しない表示部に表示する。

（Ｓ９５）ユーザは、Ｓ９４で表示されたテキストを見て、そのテキストを選択するか否か判断する。ユーザがテキストを選択しなければＳ９２に戻り、選択する単語ＴｗとテンプレートＴｔの組み合わせを変えてテキストを生成する。ユーザがテキストを選択したら、テキスト生成処理を終了する。また、生成されうる全てのテキストを表示したら、その旨をユーザに通知し、テキスト生成処理を終了してもよい。例えば、図４ではキーワード「犬」では、「この犬とても大きい。」「大きいわんちゃん大好き！」「大きい犬だ。」「この犬とてもかしこい。」「かしこいわんちゃん大好き！」「かしこい犬だ。」という６パターンのテキストを生成することができる。

図６に戻ってテキスト生成装置１の動作を説明する。
（Ｓ１０）テキスト関連付部１１は、Ｓ９で生成されたテキストと対象画像とを関連付ける。関連付けるテキストは１つであってもよいし、複数でもよい。関連付ける方法として
は、テキストを対象画像に重畳する、テキストと対象画像を別々に表示する、テキストを文字データとして対象画像のｅｘｉｆに記録されている情報に追加する、テキストを音声データに変換して対象画像のｅｘｉｆに記録されている情報に追加する、等が考えられる。図５は、図２のような対象画像に対して「この犬とてもかしこい。」というテキストが生成され、対象画像に重畳した一例である。

以上のように、本実施例によれば、あらかじめ単語とテンプレートを準備する必要がないため、テキストのバリエーション数を増やすことができる。さらに、あらかじめ準備された単語とテンプレートに依存しないテキストを生成することができるため、ユーザが共感や感動するテキスト、面白いと思うテキスト、驚くテキスト等を生成することができる。

本実施例では、外部記憶装置２のデータ記憶部２０に記憶されているデータのうち文字データのみを使用してテキストを生成するとしたが、それに限定されるものではない。例えば音声認識技術を用いて音声データを文字データに変換し、テキスト生成に使用してもよい。また、画像データから特徴量を抽出し、その特徴量に基づいて画像データを文字データに変換してテキストを生成してもよい。外部記憶装置２のデータ記憶部２０に記憶されている画像データに対して、テキストを生成してもよい。

本実施例では、テキスト生成に使用するデータは外部記憶装置２にあるとしたが、それに限定されるものではない。テキスト生成に使用するデータは、あらかじめテキスト生成装置１に記憶されていてもよい。この場合、ある一定の期間が経過したら、データを更新できるようにしてもよい。また、ユーザが文字データや音声データを入力し、テキスト生成に使用するデータとして記憶させてもよい。ユーザが使用しないと判断したデータを、自動または手動で削除してもよい。

本実施例では、画像記憶部３はテキスト生成装置１に着脱可能な記録媒体として、ＵＳＢメモリやメモリーカードとしたが、それに限定されるものではない。例えば、テキスト生成装置１のもっている内部メモリでもよいし、サーバにあるデータベース等でもよい。また、画像記憶部３はカメラの内部メモリまたはカメラに着脱可能な外部メモリであってもよい。通信部１４は、無線または有線で画像を取得してもよい。

本実施例では、外部記憶装置２からデータを受信するタイミングとして、ユーザがスイッチをＯＮにした後としたが、それに限定されるものではない。スイッチがＯＮになる度にデータを受信しなくてもよい。例えば、ユーザがデータを受信するタイミングを指定し、指定されたタイミングでテキスト生成装置１は外部記憶装置２からデータを受信してもよい。ユーザがデータを受信するタイミングを指定しなかった場合、すでにデータ記憶部１２ａに記憶されているデータ、または単語テンプレート記憶部１２ｂに記憶されている単語ＴｗとテンプレートＴｔを使用してテキストを生成してもよい。また、テキスト生成装置１は、所定の期間が経過したタイミングで自動的に外部記憶装置２からデータを受信してもよい。所定の期間が経過したタイミングは、１週間や１か月、テキスト生成装置１のスイッチが１０回ＯＮされたとき等が挙げられる。その結果、テキスト生成装置１が外部記憶装置２からデータを受信する回数を減らすことができる。

本実施例では、キーワードは画像のシーン分類と一致するとしたが、それに限定されるものではない。キーワードは時間や場所等でもよい。例えば、キーワードを「０時〜５時」「５時〜１０時」「１０時〜１５時」「１５時〜１９時」「１９時〜２４時」とした場合、データグループ「５時〜１０時」では朝の時間に特徴的である「おはよう」等を使用したテキストが生成できる。また、キーワードを「東京」「名古屋」「大阪」「その他」とした場合、データグループ「大阪」では大阪に特徴的である「おおきに」等の地域特有の言葉を使用したテキストが生成できる。また、キーワードを「アメリカ」「イギリス」「
その他」とした場合、データグループ「アメリカ」では「ｆａｌｌ」「ｍｏｖｉｅ」「ｓｏｃｃｅｒ」、データグループ「イギリス」では「ａｕｔｕｍｎ」「ｆｉｌｍ」「ｆｏｏｔｂａｌｌ」、等の地域特有の言葉を使用したテキストが生成できる。このようにキーワードに時間や場所等を用いる場合、テキスト生成部１０ｃは、画像のｅｘｉｆに記録されている情報から、画像が作成された時刻や場所等の情報を取得し、画像と一致するキーワードを判定すればよい。その結果、その時間や場所に対して特徴的なテキストが生成できる。また、ユーザがキーワードを設定してもよい。あらかじめ準備されたキーワードからユーザが選択してもよいし、ユーザが図示しない入力部からキーワードを入力してもよい。その場合、シーン分類判定部１３は、ユーザが設定したキーワードと一致するように画像の特徴量を抽出すればよい。その結果、ユーザの興味のあるキーワードに対して特徴的なテキストが生成できる。

本実施例では、データ記憶部１２ａに記憶されているデータは文字データであるとしたが、それに限定されるものではない。例えば音声データが記憶されており、音声データを文字データに変換してテキストを生成してもよい。また、画像データが記憶されており、画像データの特徴量を抽出することで文字データに変換し、テキストを生成してもよい。その結果、生成されるテキストのバリエーションがより増える。

本実施例では、単語抽出部１０ａはデータ記憶部１２ａに記憶されている全てのデータを使用して単語Ｔｗを抽出するとしたが、それに限定されるものではない。テキスト生成装置１に含まれる図示しないデータ選択部が、データ記憶部１２ａに記憶されているデータの一部を選択し、選択されたデータを使用して単語Ｔｗを抽出してもよい。例えば、データが投稿された時刻や場所、データを投稿した人、もしくはテキストの付与を指定した人の性別や世代や所属するグループ等で、データ数を絞り、絞られたデータを使用して単語Ｔｗを抽出してもよい。データを投稿した人の所属するグループとは、その人の出身校や趣味、仕事、その他特徴等で分類されたグループが考えられる。具体的には、テキスト生成装置１のユーザが２０代の場合、２０代の人が投稿したデータを使用してテキストを生成する。または、過去にユーザ自身が投稿したデータのみを使用してテキストを生成する。その結果、ユーザに関係のあるデータに絞ってテキストを生成できるため、ユーザがより共感できるテキストが生成できる。

以上のようなテキスト生成に使用するデータの選択は、単語抽出部１０ａが単語Ｔｗを抽出する前のタイミングで行われてもよいし、通信部１４が外部記憶装置２からデータを受信するタイミングで行われてもよい。

本実施例では、単語抽出部１０ａは形容詞であるかどうかを判定するとしたが、それに限定されるものではない。例えば名詞、形容動詞、副詞等でもよいし、これら品詞の組み合わせでもよい。その場合、テンプレートＴｔのアスタリスク＊部分に対応する品詞と、アスタリスク＊部分に挿入する単語Ｔｗの品詞とが一致するのが望ましい。具体的には、テキスト生成部１０ｃは単語テンプレート記憶部１２ｂから選択したテンプレートＴｔのアスタリスク＊部分に対応する品詞を判定する。テキスト生成部１０ｃは、判定された品詞と一致する単語Ｔｗを単語テンプレート記憶部１２ｂから選択し、テンプレートＴｔのアスタリスク＊部分へ単語Ｔｗを挿入する。また、テキスト生成部１０ｃは、単語テンプレート記憶部１２ｂから選択した単語Ｔｗの品詞を判定し、判定された品詞に対応するアスタリスク＊部をもつテンプレートＴｔを単語テンプレート記憶部１２ｂから選択してテキストを生成してもよい。その結果、テキストのバリエーションをさらに増やすことができる。

本実施例では、単語抽出部１０ａは、単語の重要度の計算にｔｆ・ｉｄｆ値を使用したが、それに限定されるものではない。例えば、単語ｉが異なるデータグループに含まれてい
れば、単語ｉが含まれているデータグループの数だけ重要度を低くし、同じデータグループに複数含まれていれば、同じデータグループに記憶されている数だけ重要度を高くする計算方法でもよい。例えば図３で、単語「かわいい」は３つの異なるデータグループに含まれているため、重要度を３低くする。単語「かわいい」はデータグループ「犬」に２つ含まれているため、重要度を２高くする。よってデータグループ「犬」に含まれている単語「かわいい」の重要度は、−３＋２＝−１である。同様にしてデータグループ「犬」に含まれている単語「大きい」の重要度は、−１＋２＝１である。データグループ「犬」に含まれている単語「かしこい」の重要度は、−１＋１＝０である。よってデータグループ「犬」に記憶されている「かわいい」「大きい」「かしこい」という単語の重要度を本手法を用いて高い順番に並べると、大きい→かしこい→かわいい、となる。この計算方法であれば、計算回数を減らすことができる。

また、単語抽出部１０ａは必ずしもｔｆ・ｉｄｆ値を計算しなくてもよい。単語の重要度はユーザが指定してもよい。例えば、図示しない表示部に単語を表示し、ユーザが単語の重要度を、図示しない入力部から入力する。入力された重要度の高い単語を単語Ｔｗとして抽出する。また、図示しない表示部に単語を表示し、ユーザがテキスト生成に使用する単語を選択してもよい。その結果、計算を行わなくても単語Ｔｗを抽出することができる。

本実施例では、抽出する単語Ｔｗの数をデータグループごとに２つずつとしたがそれに限定されるものではない。例えば重要度の高い方から順に複数の単語Ｔｗを抽出してもよいし、データグループごとに、抽出される単語Ｔｗの数が異なってもよい。抽出される単語Ｔｗの数は、あらかじめ設定されていてもよいし、ユーザが設定してもよい。

本実施例では、テンプレートＴｔは、単語Ｔｗを挿入してテキストを生成するための雛形であるとしたが、それに限定されるものではない。例えば、テンプレートＴｔは単語Ｔｗを挿入する部分がない、文章であってもよい。その場合、テンプレートＴｔは単語Ｔｗを含むデータである。テキスト生成部１０ｃは、テンプレートＴｔの前または後ろに単語Ｔｗを追加することでテキストを生成する。また、テキスト生成部１０ｃは、テンプレートＴｔまたは単語Ｔｗを複数つなげることによってテキストを生成してもよい。例えば、テンプレートＴｔが「この犬とても大きい。」、単語Ｔｗが「かしこい」であれば、テキストは「この犬とても大きい。かしこい。」となる。

単語テンプレート記憶部１２ｂは、単語ＴｗとテンプレートＴｔが生成される度に追加で記憶してもよい。その結果、テキストのバリエーションをより増やすことができる。また、単語テンプレート記憶部１２ｂは、単語ＴｗとテンプレートＴｔが抽出または生成される度に記憶内容を更新してもよい。その場合、使用回数の低い単語ＴｗやテンプレートＴｔを単語テンプレート記憶部１２ｂから削除し、新しく生成された単語ＴｗやテンプレートＴｔを追加してもよい。生成された日時が古い単語ＴｗやテンプレートＴｔから削除してもよい。またユーザが削除する単語ＴｗやテンプレートＴｔを選択してもよい。その結果、単語テンプレート記憶部１２ｂで使用するメモリ量を少なくすることができる。

本実施例では、単語ＴｗとテンプレートＴｔの選択方法をランダムとしたが、それに限定されるものではない。例えば、単語Ｔｗは抽出された順、テンプレートＴｔは生成された順に選択されてもよい。また、ユーザが選択したテキストを記憶しておき、その結果からユーザの好みを自動学習し、ユーザの好み順に単語ＴｗとテンプレートＴｔを選択してもよい。

本実施例では、生成されたテキストを図示しない表示部に１つずつ表示したが、それに限定されるものではない。例えば、生成されたテキストの全てまたは一部を表示部に表示し
、その中からユーザが好きなものを選択してもよい。その結果、よりユーザ好みのテキストを対象画像に関連付けることができる。また、必ずしもユーザによる操作は必要なく、生成されたテキストを表示部に表示せずに、自動的にテキストが選択されてもよい。

テキスト生成装置１は、撮像装置に備わっていてもよい。例えば、デジタルカメラにテキスト生成装置１を内蔵すれば、撮像した画像に対し、テキストを生成することができる。

続いて、実施例２について説明する。実施例２は、画像に対し、より多くのユーザから共感が得られ、違和感のないテキストを生成するテキスト生成装置である。実施例１に係るテキスト生成装置１と実施例２に係るテキスト生成装置１との主な相違点は、共感度判定部１００、単語評価部１０１、フィルタリング部１０２、テキスト記憶部１２０が追加された点である。なお本実施例において、実施例１と同様の構成部、動作の説明は省略する。

図１２は、実施例２に係るテキスト生成装置１の機能ブロック図の一例である。実施例２において、実施例１と同様の構成部は、実施例１と同様の数字で表している。

テキスト生成装置１は、生成部１０と、テキスト関連付部１１と、記憶部１２と、シーン分類判定部１３と、通信部１４と、制御部１５と、を備える。生成部１０は、共感度判定部１００と、単語抽出部１０ａと、単語評価部１０１と、テンプレート生成部１０ｂと、フィルタリング部１０２と、テキスト生成部１０ｃとを備える。記憶部１２は、データ記憶部１２ａと、単語テンプレート記憶部１２ｂと、テキスト記憶部１２０とを備える。

共感度判定部１００は、データ記憶部１２ａに記憶されたデータのうち、共感度の高いデータを取得する。共感度の高いデータとは、より多くの人から反応があったデータである。例えば、コメント数が多いブログ、多くの人からお気に入り登録されているサイト、ＳＮＳで多くの人が閲覧した投稿、写真投稿サイトで多くの人が閲覧した画像、有名な映画や文書や名言、などに関わる文字データや音声データ等が考えられる。つまり、本実施例での共感度判定部は、データを選択し、取得する。

単語抽出部１０ａは、共感度判定部１００で取得したデータを使用して、データグループごとに単語Ｔｗを抽出する。本実施例では、単語抽出部１０ａで抽出された単語を単語Ｔｗと記載する。単語Ｔｗの例として、本実施例では、重要度の高い単語のことをいう。単語Ｔｗは、各データグループについて複数抽出されることが望ましい。単語Ｔｗの抽出方法は実施例１と同様である。

単語評価部１０１は、単語抽出部１０ａで抽出された単語Ｔｗの表現を評価し、表現がマイナスであると評価された単語Ｔｗを削除する。単語の表現を評価する方法としては、評価表現辞書を用いて分析する方法がある。後に詳述する。

テンプレート生成部１０ｂは、単語評価部１０１から単語Ｔｗを取得する。テンプレート生成部１０ｂは、データ記憶部１２ａで各データグループが有する複数のデータと、取得した単語Ｔｗを使用して、データグループごとにテンプレートＴｔを生成する。本実施例では、テンプレート生成部１０ｂで生成されたテンプレートをテンプレートＴｔと記載する。本実施例でテンプレートＴｔとは、単語Ｔｗを挿入してテキストを生成するための雛形である。テンプレートＴｔは、各データグループについて複数生成されることが望ましい。

フィルタリング部１０２は、テンプレート生成部１０ｂで生成されたテンプレートＴｔに対してフィルタリングを実行し、適切でないと判断されたテンプレートＴｔを削除する。判断方法は後に詳述する。

テキスト記憶部１２０は、テキスト生成部１０ｃで生成されたテキストをキーワードごとに分類して記憶する。

テキスト関連付部１１は、テキスト記憶部１２０に記憶されているテキストのうち少なくとも１つを対象画像に関連付ける。関連付けの方法は、実施例１と同様である。

制御部１５は、共感度判定部１００と、単語抽出部１０ａと、単語評価部１０１と、テンプレート生成部１０ｂと、フィルタリング部１０２と、テキスト生成部１０ｃと、テキスト関連付部１１と、データ記憶部１２ａと、単語テンプレート記憶部１２ｂと、テキスト記憶部１２０と、シーン分類判定部１３と、通信部１４と、を制御する。

まず、テキスト生成装置１における動作の全体の流れを図１３に示すフローチャートを用いて説明する。実施例１と同様の処理は、実施例１と同様のステップ番号がついている。実施例１と同様の処理は説明を省略する。

（ＳＳ４）単語抽出部１０ａは、データ記憶部１２ａで各データグループが有する複数の文字データから、データグループごとに単語Ｔｗを抽出する。単語Ｔｗとは、重要度の高い単語であり、実施例１と同様である。

本実施例に係る単語Ｔｗの抽出方法の一例を図１４に示すフローチャートを用いて説明する。実施例１と同様の処理は、実施例１と同様のステップ番号がついている。実施例１と同様の処理は説明を省略する。

（Ｓ４００）共感度判定部１００は、データ記憶部１２ａに記憶された文字データのうち、人からの共感度の高い文字データを取得する。例えば、コメント数が多いブログ、多くの人からお気に入り登録されているサイト、ＳＮＳで多くの人が閲覧した投稿、写真投稿サイトで多くの人が閲覧した画像、有名な映画や文書や名言、などに関わる文字データを選択して、取得する。本実施例では、共感度判定部１００で取得したデータから、単語Ｔｗを抽出し、テンプレートＴｔとテキストを生成する。

（Ｓ４０１）単語評価部１０１は、単語Ｔｗの表現を評価し、表現がマイナスであると評価された単語Ｔｗは削除する。例えば、単語Ｔｗとして「悪い」という単語が抽出されたとする。「悪い」という単語がマイナスな表現と評価されると、単語評価部１０１は単語Ｔｗから削除する。単語の表現を評価する方法としては、単語とその単語の表現の評価をテーブルとしてあらかじめ記憶していてもよいし、ユーザが設定してもよい。また、このようなテーブルの既存技術として、評価表現辞書がある。評価表現辞書とは、評価表現とその表現がもつ評価極性の対の集合である（図１５）。評価極性とは、評判情報の良い／悪いに関する軸を表す。図１５のようなテーブルを使用して、評価値がマイナスな単語Ｔｗは削除するようにしてもよい。このような評価表現辞書をインターネット等からダウンロードし、使用してもよい。

図１３に戻ってテキスト生成装置１の動作を説明する。
（ＳＳ５）テンプレート生成部１０ｂは、Ｓ３で記憶した文字データとＳ４で抽出した単語Ｔｗとを使用して、データグループごとにテンプレートＴｔを生成する。テンプレート
Ｔｔは、アスタリスク＊部分に単語Ｔｗを挿入するとテキストとなる雛形である。

本実施例に係るテンプレートＴｔの生成方法の一例を図１６に示すフローチャートを用いて説明する。実施例１と同様の処理は、実施例１と同様のステップ番号がついている。実施例１と同様の処理は説明を省略する。

（Ｓ５００）フィルタリング部１０２は、テンプレートＴｔに対してフィルタリングを実行し、適切でないと判断されたテンプレートを削除する。例えば、図４で、キーワード「スイーツ」のテンプレートＴｔとして「銀座のロールケーキ＊よ。」が生成されたとする。しかし、固有名詞「銀座」は画像に適切でない場合が多いと考えられる。同様に数詞も適切でない場合が多いと考えられる。よって、固有名詞や数詞等のようにテンプレートに適切でないと判断された品詞を含むテンプレートＴｔは削除する。品詞の判定としては、図１４に示すフローチャートのＳ４１で行った形態素解析の結果を使用すればよい。また、フィルタリングの対象は品詞に限られない。テンプレートＴｔの文字数をカウントし、長文と判断されたテンプレートＴｔはテンプレートに適さないとして削除し、短文のテンプレートＴｔを生成するようにしてもよい。このとき何文字以下を短文とするかは、あらかじめ設定されていてもよいし、ユーザが任意に設定してもよい。

図１３に戻ってテキスト生成装置１の動作を説明する。
（ＳＳ１０）テキスト記憶部１２０は、Ｓ９で生成されたテキストをキーワードごとに分類して記憶する。テキスト記憶部１２０は、テキストが生成される度に追加で記憶してもよいし、記憶内容を更新してもよい。記憶内容を更新する場合、使用回数の低いテキストをテキスト記憶部１２０から削除し、新しく生成されたテキストを追加してもよい。生成された日時が古いテキストから削除してもよい。またユーザが削除するテキストを選択してもよい。

（ＳＳ１１）テキスト関連付部１１は、テキスト記憶部１２０に記憶されているテキストのうち少なくとも１つを対象画像に関連付ける。テキスト記憶部１２０には、過去に生成されたテキストも記憶されているため、過去に生成されてユーザが気に入ったテキストを再度使用することができる。テキストのバリエーションも増える。関連付けるテキストは１つであってもよいし、複数でもよい。テキストを対象画像に関連付ける方法は、テキストを対象画像に重畳する、テキストと対象画像を別々に表示する、テキストを文字データとして対象画像のｅｘｉｆに記録されている情報に追加する、テキストを音声データとして対象画像のｅｘｉｆに記録されている情報に追加する、等が考えられる。図５は、図２のような対象画像に対して「この犬とてもかしこい。」というテキストが生成され、対象画像に重畳したときのイメージ図である。

以上のように、本実施例によれば、あらかじめ単語とテンプレートを準備する必要がないため、テキストのバリエーション数を増やすことができる。さらに、適切でないと判断されたデータ、単語Ｔｗ、テンプレートＴｔは使用せずにテキストを生成しているため、画像に対し、より多くのユーザから共感が得られ、違和感のないテキストを生成することができる。

本実施例では、共感度の高いデータを取得するタイミングとして、共感度判定部１００がデータ記憶部１２ａに記憶されたデータのうち共感度の高いデータを取得したが、それに限定されるものではない。例えば、外部記憶装置２のデータ記憶部２０からデータを取得するタイミングで、共感度の高いデータのみ取得するようにしてもよい。その結果、データ記憶部１２ａのメモリ容量を減らすことができる。

続いて、実施例３について説明する。実施例３は、時刻情報を用いて自動的にテキストを生成するテキスト生成装置である。実施例１に係るテキスト生成装置１と実施例３に係るテキスト生成装置１との主な相違点は、構成部においてシーン分類判定部１３とテキスト関連付部１１とを削除し、情報取得部１６とデータ選択部１７とを追加した点である。また、テキスト生成に用いるデータを分類するキーワードに時間を用いている。なお本実施例において、実施例１と同様の構成部、動作の説明は省略する。

図１７は、実施例２に係るテキスト生成装置１の機能ブロック図の一例である。実施例３において、実施例１と同様の構成部は、実施例１と同様の数字で表している。

テキスト生成装置１は、生成部１０と、記憶部１２と、通信部１４と、制御部１５と、情報取得部１６と、データ選択部１７とを備える。生成部１０は、単語抽出部１０ａと、テンプレート生成部１０ｂと、テキスト生成部１０ｃと、を備える。記憶部１２は、データ記憶部１２ａと、単語テンプレート記憶部１２ｂと、を備える。

テキスト生成装置１は、制御部１５の制御により、外部記憶装置２の制御部２２によってデータ記憶部２０に記憶されているデータが読み出だされ通信部２１を介してデータ記憶部２０に記憶されたデータを、通信部１４から受信する。

データ選択部１７は、通信部１４が受信したデータのうち、テキスト生成に使用するデータを選択する。データ選択部１７は、通信部１４が受信したデータを、１．文字データのみのデータと、２．画像データが関連付けられているデータと、３．それ以外のデータと、に分類し、１．文字データのみのデータを選択する。

データ記憶部１２ａは、データ選択部１７で選択されたデータをキーワードごとに分類して記憶する。本実施例では、キーワードに時間を用いる。例えば、データ記憶部１２ａは、図１８に示すように、複数のデータを所定の４つの時間（６時〜９時、１１時〜１４時、１９時〜２２時およびその他の時間）ごとに分類し、４つのデータグループとして記憶する。４つのデータグループは、図１８に示されるように、複数のデータをそれぞれ有する。本実施例では、データ記憶部１２ａに記憶されているデータは文字データである。キーワードの数は４つに限定されるものではなく、いくつでもよい。また、キーワードは６時〜９時、１１時〜１４時、１９時〜２２時およびその他の時間に限定されるものではなく、その他の時間分類でもよい。ここでキーワードごとに分類するとは、文字データをグループにまとめることと同様の意味である。例えばキーワードＡに応じて分類されたデータグループとは、データグループＡを意味する。

生成部１０は、複数の文字データと時刻情報からテキストを生成する。

単語抽出部１０ａは、データ記憶部１２ａに記憶された文字データを使用して、データグループごとに単語Ｔｗを抽出する。本実施例では、単語Ｔｗは感動詞であるとする。単語Ｔｗは、各データグループについて複数抽出されることが望ましい。単語Ｔｗの抽出方法は後に詳述する。

テンプレート生成部１０ｂは、データ記憶部１２ａでデータグループが有する文字データと、単語抽出部１０ａでデータグループごとに抽出された単語Ｔｗとを使用して、データグループごとにテンプレートＴｔを生成する。本実施例でテンプレートＴｔとは、単語Ｔｗを挿入してテキストを生成するための雛形である。例えばテンプレートＴｔは、図１９のテンプレートＴｔが示すようなアスタリスク＊部分に、単語Ｔｗを挿入することでテキストとなる文字データである。テンプレートＴｔは、各データグループについて複数生成されることが望ましい。テンプレートＴｔの生成方法は実施例１と同様である。

単語テンプレート記憶部１２ｂは、図１９に示すように単語ＴｗとテンプレートＴｔをキーワードごとに分類して記憶する。

情報取得部１６は、テキストを生成する際の情報を取得する。テキストを生成する際の情報としては、例えば、テキストを生成する時刻やテキストを生成する場所等の情報が挙げられる。本実施例では、テキストを生成する際の情報として、時刻を用いる。

テキスト生成部１０ｃは、単語テンプレート記憶部１２ｂでキーワードごとに分類して記憶されている単語ＴｗとテンプレートＴｔと、情報取得部１６で取得した時刻とを使用してテキストを生成する。情報取得部１６で取得した時刻と一致するキーワードに分類して記憶されている単語ＴｗとテンプレートＴｔを組み合わせることでテキストを生成する。テキストの生成方法は後に詳述する。

制御部１５は、単語抽出部１０ａと、テンプレート生成部１０ｂと、テキスト生成部１０ｃと、データ記憶部１２ａと、単語テンプレート記憶部１２ｂと、通信部１４と、情報取得部１６と、データ選択部１７とを制御する。

まず、テキスト生成装置１における動作の全体の流れを図２０に示すフローチャートを用いて説明する。実施例１と同様の処理は、実施例１と同様のステップ番号がついている。実施例１と同様の処理は説明を省略する。

（ＳＳ２）通信部１４は外部記憶装置２からデータを受信し、データ選択部１７は通信部１４が受信したデータのうちテキスト生成に使用するデータを選択する。例えば、外部記憶装置２のデータ記憶部２０にはブログやＳＮＳ、写真共有サイトに投稿された文字データや音声データ、画像データ等が記憶されている。通信部１４は、それらのデータを受信する。外部記憶装置２の制御部２２は、データ記憶部２０に記憶されているデータを読み出し、通信部２１を介して記憶部２０に記憶されたデータをテキスト生成装置１へ送信する。テキスト生成装置１は、外部記憶装置２に記憶されたデータを、通信部１４を介して受信する。データ選択部１７は、通信部１４が受信したデータを、１．文字データのみのデータと、２．画像データが関連付けられているデータと、３．それ以外のデータと、に分類し、１．文字データのみのデータを選択する。２．画像データが関連付けられているデータは、実施例１または２の処理を行う。画像が関連付けられているデータと文字データのみのデータとで異なる処理を行う。３．それ以外のデータは、テキスト生成に使用しない。

（ＳＳ３）データ記憶部１２ａは、ＳＳ２で選択された文字データをキーワードごとに分類して記憶する。例えば図１８に示すように、複数の文字データを所定の４つの時間（６時〜９時、１１時〜１４時、１９時〜２２時およびその他の時間）ごとに分類し、４つのデータグループとして記憶する。４つのデータグループは、図１８に示されるように、複数の文字データをそれぞれ有する。

（ＳＳ４）単語抽出部１０ａは、データ記憶部１２ａでデータグループが有する複数の文字データから、データグループごとに単語Ｔｗを抽出する。本実施例では、単語Ｔｗは感動詞であるとする。単語Ｔｗの抽出方法について図２１を用いて詳しく説明する。実施例１と同様の処理は、実施例１と同様のステップ番号がついている。実施例１と同様の処理は説明を省略する。

図２１は、図２０に示すＳ４の詳細な処理について説明をするフローである。図２１に示す（Ｓ４０３）において、単語抽出部１０ａは、単語ｉの品詞が感動詞であるかどうかを判定する。単語ｉの品詞は、Ｓ４１で形態素解析を行った際に判定されているため、形態素解析の結果を使用すればよい。単語ｉが感動詞でなければ、Ｓ４７へ進む。単語ｉが感動詞であればＳ４０４へ進む。

（Ｓ４０４）単語抽出部１０ａは、単語ｉが含まれているデータグループに、単語ｉがいくつ含まれているかカウントする。例えば図１８において、単語「おはよう」はデータグループ「６時〜９時」に２つ含まれている。

（Ｓ４０８）単語抽出部１０ａは、Ｓ４０４でカウントされた数が多い単語、つまり各データグループに含まれている数が多い感動詞、を単語Ｔｗとしてデータグループごとに抽出する。このとき、単語Ｔｗは、各データグループについて複数抽出されることが望ましい。

図２０に戻ってテキスト生成装置１の動作を説明する。
（Ｓ５）テンプレート生成部１０ｂは、ＳＳ３で記憶した文字データとＳＳ４で抽出した単語Ｔｗとを使用して、データグループごとにテンプレートＴｔを生成する。テンプレートＴｔは、アスタリスク＊部分に単語Ｔｗを挿入するとテキストとなる雛形である。テンプレートＴｔの生成方法は、実施例１と同様である。

（Ｓ６）単語テンプレート記憶部１２ｂは、ＳＳ４で抽出した単語ＴｗとＳ５で生成したテンプレートＴｔを、図１９に示すようにキーワードごとに分類して記憶する。

（ＳＳ８）情報取得部１６は、テキストを生成する時刻を取得する。

（ＳＳ９）テキスト生成部１０ｃは、Ｓ６で単語テンプレート記憶部１２ｂにキーワードごとに分類して記憶された単語ＴｗとテンプレートＴｔと、ＳＳ８で取得した時刻とを使用してテキストを生成する。テキストの生成方法の一例を図２２に示すフローチャートを用いて詳しく説明する。

図２２は、図２０に示すＳＳ９の詳細な処理について説明をするフローチャートである。図２２に示す（Ｓ９０１）において、テキスト生成部１０ｃは、情報取得部１６で取得した時刻情報を取得する。

（Ｓ９０２）テキスト生成部１０ｃは、Ｓ９０１で取得した時刻情報が、どのキーワードと一致するのかを判定する。ここでいうキーワードとは、データ記憶部１２ａまたは単語テンプレート記憶部１２ｂで使用しているいずれかのキーワードである。テキスト生成部１０ｃは、一致するキーワードに分類して記憶されている単語ＴｗとテンプレートＴｔを、単語テンプレート記憶部１２ｂからランダムに選択する。例えば、情報取得部１６はテキストを生成する時刻として「８時」という時刻情報を取得する。テキスト生成部１０ｃは、時刻情報「８時」と一致するキーワード「６時〜９時」に分類して記憶されている単語Ｔｗ「おはよう」とテンプレートＴｔ「すがすがしい！＊。」を選択する（図１９）。

テキスト生成部１０ｃは、実施例１と同様に、Ｓ９０２で選択した単語ＴｗとテンプレートＴｔを使用してテキストを生成する。上記の例では、「すがすがしい！おはよう。」というテキストが生成される。また、生成されたテキストの選択方法や更新方法などは実施例１と同様である。

以上のように、本実施例によれば、あらかじめ単語とテンプレートを準備する必要がないため、テキストのバリエーション数を増やすことができる。さらに、画像データを使用せずに、時刻情報や位置情報のみで自動的にテキストを生成することができる。

本実施例を使用すれば、ユーザが入力する文字を考えなくても、その時刻や場所に適した文字データを自動で生成することができる。例えば、ユーザがＳＮＳに文章を投稿したいと思った時、ユーザは投稿ボタンを押す。テキスト生成装置１は、ユーザが投稿ボタンを押した時刻や場所に基づいてテキストを自動で生成し、ＳＮＳに投稿する。そのときに、テキスト生成に使用した時刻や場所を、生成されたテキストと共に表示してもよい。

本実施例では、データ選択部１７は文字データのみのデータを選択するとしたが、それに限定されるものではない。データが投稿された時刻や場所、データを投稿した人、もしくはテキストの付与を指定した人の性別や世代や所属するグループ等に基づいて、データを選択してもよい。データを投稿した人の所属するグループとは、その人の出身校や趣味、仕事、その他特徴等で分類されたグループが考えられる。具体的には、テキスト生成装置１のユーザが２０代の場合、２０代の人が投稿したデータを使用してテキストを生成する。または、過去にユーザ自身が投稿したデータのみを使用してテキストを生成する。その結果、ユーザに関係のあるデータに絞ってテキストを生成できるため、ユーザがより共感できるテキストが生成できる。

本実施例では、データ選択部１７がテキスト生成に使用するデータを選択するとしたが、それに限定されるものではない。例えば、通信部１４がテキスト生成に使用するデータを選択し、受信してもよい。単語抽出部１０ａが、データ記憶部１２ａに記憶されたデータを取得する際に、テキスト生成に使用するデータを選択してもよい。この処理は必須ではなく、実行しなくてもよい。

本実施例では、テキストを生成する際の情報として時刻を用いたが、それに限定されるものではない。例えば、場所情報でもよい。その結果、テキストを生成する場所に対して特徴的なテキストが生成できる。

本実施例では、単語Ｔｗは感動詞であるとしたが、それに限定されるものではない。形容詞、動詞、形容動詞等、いずれの品詞でもよい。

本実施例では、単語Ｔｗの抽出方法としてデータグループに含まれている数が多い単語を抽出したが、それに限定されるものではない。例えば、実施例１や実施例２に示した単語Ｔｗの抽出方法を使用してもよい。

以上、本発明の実施例について図面やフローチャートを使用して詳述してきたが、具体的な構成はこの実施例に限られるものではなく、本発明の要旨を逸脱しない範囲の設計なども含まれる。

本発明の実施例における各部は、テキスト生成装置１に備えられているとしたが、それに限定されるものではない。各部のいずれか又は組み合わせが、複数の装置やサーバに分かれて備えられていてもよい。例えば、テキスト関連付部１１は携帯端末に備えられ、テキスト関連付部１１以外の各部はサーバに備えられていてもよい。その結果、一連のテキスト生成の処理はサーバで行われ、生成されたテキストは携帯端末で表示または画像と関連付けされる。具体的には、実施例１または実施例２の場合では、サーバは、画像記憶部３からテキストを関連付ける対象画像もしくはその対象画像に関する情報（画像が属するキーワード）を取得し、対象画像もしくは対象画像に関する情報に基づいてテキストを生成する。サーバは、生成したテキストを携帯端末に送信する。携帯端末は、画像記憶部３
から対象画像を取得し、サーバから受信したテキストを対象画像に関連付ける。なお、画像記憶部３は携帯端末の外部にあってもよいし、携帯端末の内部に備わっていてもよい。また、実施例３の場合には、サーバは、携帯端末から時刻情報を取得し、時刻情報に基づいてテキストを生成する。サーバは、生成したテキストを携帯端末に送信する。携帯端末は、受信したテキストを携帯端末に設けられた図示しない表示部に表示する。もしくは、テキスト生成部１０ｃとテキスト関連付部１１は携帯端末に備えられ、それ以外の各部はサーバに備えられていてもよい。具体的には、上述と同様に、サーバは画像、画像に関する情報、時刻情報を取得し、取得された画像、画像に関する情報、時刻情報に基づいて、単語ＴｗとテンプレートＴｔを抽出または生成する。携帯端末は、抽出または生成された単語ＴｗとテンプレートＴｔをサーバから受信してテキストを生成する。なお、各部の組み合わせは以上の例に限定されるものではなく、いずれの組み合わせでもよい。また、複数のサーバや複数の携帯端末や複数の装置に分かれて備えられていてもよい。単語ＴｗとテンプレートＴｔをキーワードごとに分類したデータベースがあり、テキスト生成装置１はそのデータベースから単語ＴｗとテンプレートＴｔをダウンロードし、テキストを生成してもよい。生成されたテキストをダウンロードしてもよい。

なお、本発明の実施例における各部は、専用のハードウェアにより実現されるものであってもよく、また、メモリおよびマイクロプロセッサにより実現させるものであってもよい。

なお、本発明の実施例における制御部１５は、メモリおよびＣＰＵ（中央演算装置）により構成され、制御部１５の機能を実現するためのプログラムをメモリにロードして実行することによりその機能を実現させるものであってもよい。

また、制御部１５の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、制御部１５による処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、ＯＳや周辺機器等のハードウェアを含むものとする。

また、「コンピュータシステム」は、ＷＷＷシステムを利用している場合であれば、ホームページ提供環境（あるいは表示環境）も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ−ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。

Claims

複数のデータから単語を抽出する単語抽出部と、
前記単語抽出部で抽出された前記単語と前記複数のデータとに基づいてテンプレートを生成するテンプレート生成部と、
前記単語抽出部で抽出された前記単語と前記テンプレート生成部で生成された前記テンプレートと画像とに基づいてテキストを生成するテキスト生成部と、
前記テキスト生成部で生成された前記テキストを前記画像に関連付けるテキスト関連付部と、を備える
ことを特徴とするテキスト生成装置。
前記テンプレート生成部は、単語を挿入することでテキストとなるテンプレートを生成する
ことを特徴とする請求項１に記載のテキスト生成装置。
前記単語抽出部で抽出された前記単語と前記テンプレート生成部で生成された前記テンプレートとを記憶する記憶部を備え、
前記テキスト生成部は、前記記憶部に記憶された、前記単語と前記テンプレートとを前記画像に基づいて少なくとも１つずつ取得してテキストを生成する
ことを特徴とする請求項１から２に記載のテキスト生成装置。
前記複数のデータは、複数のキーワードごとに分類されており、
前記単語抽出部は、前記複数のキーワードごとに分類された前記複数のデータから、前記キーワードごとに少なくとも１つずつ単語を抽出し、
前記テンプレート生成部は、前記キーワードごとに分類された前記複数のデータと、前記キーワードごとに抽出された前記単語とに基づいて、前記キーワードごとにテンプレートを生成する
ことを特徴とする請求項１から３に記載のテキスト生成装置。
前記画像に対応する前記キーワードを判定するキーワード判定部を備え、
前記テキスト生成部は、前記キーワード判定部によって判定された前記キーワードに分類された、前記単語と前記テンプレートとに基づいてテキストを生成する
ことを特徴とする請求項４に記載のテキスト生成装置。
前記単語抽出部は、
前記複数のデータを単語に分割する単語分割部と、
前記単語分割部で分割された前記単語から１つを選択する第１処理部と、
前記複数のキーワードから１つを選択する第２処理部と、
前記第１処理部で選択された前記単語が前記第２処理部で選択された前記キーワードに分類された前記複数のデータに含まれている数に基づいて前記第１処理部で選択された前記単語の重要度を計算する第３処理部と、
前記第１処理部で選択された前記単語を含むデータが分類されている前記キーワードの数に基づいて前記第１処理部で選択された前記単語の前記重要度を計算する第４処理部と、前記第３処理部と前記第４処理部とに基づいて、前記重要度が高い単語を前記キーワードごとに抽出する第５処理部と、を備える
ことを特徴とする請求項４から５に記載のテキスト生成装置。
前記テンプレート生成部は、前記複数のデータのうち前記単語抽出部で抽出された前記単語を含むデータを取得し、取得された前記データに含まれる前記単語を単語挿入部分に置き換えることでテンプレートを生成し、
前記テキスト生成部は、前記画像に基づいて、前記テンプレートの前記単語挿入部分に前記単語を挿入することでテキストを生成する
ことを特徴とする請求項１から６に記載のテキスト生成装置。
前記単語分割部で分割された前記単語の品詞を判定する品詞判定部を備え、
前記単語抽出部は、前記品詞判定部で判定された前記品詞に基づいて単語を抽出する
ことを特徴とする請求項６に記載のテキスト生成装置。
前記テンプレートは、単語を挿入する単語挿入部分を有しており、
前記テキスト生成部は、
前記テンプレートの前記単語挿入部分の品詞を判定するテンプレート品詞判定部と、
前記テンプレート品詞判定部で判定された前記単語挿入部分の品詞と一致する前記単語抽出部で抽出された前記単語を取得する単語取得部と、
前記単語取得部で取得された前記単語を前記単語挿入部分へ挿入してテキストを生成する単語挿入部と、を備える
ことを特徴とする請求項８に記載のテキスト生成装置。
前記複数のデータを記憶する外部記憶装置と通信を行う通信部と、
前記通信部を介して、前記外部記憶装置から前記複数のデータを取得し、前記記憶部に前記複数のデータを記憶させる制御を行う制御部と、を備える
ことを特徴とする請求項３に記載のテキスト生成装置。
前記複数のデータのうち、テキスト生成に使用するデータを選択するデータ選択部を備え、
前記単語抽出部は、前記データ選択部で選択された前記データから単語を抽出する、
ことを特徴とする請求項１から１０に記載のテキスト生成装置。
前記データは識別情報を有しており、
前記データ選択部は、前記識別情報と前記画像とに基づいて前記データを選択する
ことを特徴とする請求項１１に記載のテキスト生成装置。
複数のデータから単語を抽出する単語抽出方法と、
前記単語抽出部で抽出された前記単語と前記複数のデータとに基づいてテンプレートを生成するテンプレート生成方法と、
前記単語抽出部で抽出された前記単語と前記テンプレート生成部で生成された前記テンプレートと画像とに基づいてテキストを生成するテキスト生成方法と、
前記テキスト生成部で生成された前記テキストを前記画像に関連付けるテキスト関連付方法と、を備える
ことを特徴とするテキスト生成方法。
複数のデータから単語を抽出する単語抽出ステップと、
前記単語抽出部で抽出された前記単語と前記複数のデータとに基づいてテンプレートを生成するテンプレート生成ステップと、
前記単語抽出部で抽出された前記単語と前記テンプレート生成部で生成された前記テンプレートと画像とに基づいてテキストを生成するテキスト生成ステップと、
前記テキスト生成部で生成された前記テキストを前記画像に関連付けるテキスト関連付ステップと、を備える
ことを特徴とするプログラム。
複数のキーワードごとに分類された複数のデータから、前記キーワードごとに単語を抽出
する単語抽出部と、
前記単語抽出部で前記キーワードごとに抽出された前記単語と前記キーワードごとに分類された前記複数のデータとに基づいて、前記キーワードごとにテンプレートを生成するテンプレート生成部と、
前記単語抽出部で前記キーワードごとに抽出された前記単語と前記テンプレート生成部で前記キーワードごとに生成された前記テンプレートと前記キーワードとに基づいて、前記キーワードごとにテキストを生成するテキスト生成部と、を備える
ことを特徴とするテキスト生成装置。
前記キーワードは、時間または場所または画像に関連することを特徴とする
請求項１５に記載のテキスト生成装置。