JP2015179399A - テキスト生成装置、テキスト生成プログラム及びテキスト生成方法 - Google Patents

テキスト生成装置、テキスト生成プログラム及びテキスト生成方法 Download PDF

Info

Publication number
JP2015179399A
JP2015179399A JP2014056435A JP2014056435A JP2015179399A JP 2015179399 A JP2015179399 A JP 2015179399A JP 2014056435 A JP2014056435 A JP 2014056435A JP 2014056435 A JP2014056435 A JP 2014056435A JP 2015179399 A JP2015179399 A JP 2015179399A
Authority
JP
Japan
Prior art keywords
word
text
unit
data
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014056435A
Other languages
English (en)
Inventor
寛子 小林
Hiroko Kobayashi
寛子 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nikon Corp
Original Assignee
Nikon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Corp filed Critical Nikon Corp
Priority to JP2014056435A priority Critical patent/JP2015179399A/ja
Publication of JP2015179399A publication Critical patent/JP2015179399A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】バリエーションのあるテキストを生成するテキスト生成装置、テキスト生成プログラム及びテキスト生成方法を提供する。
【解決手段】テキスト生成装置は、複数のデータから単語を抽出するS4単語抽出部と、単語抽出部で抽出された単語と複数のデータとに基づいてテンプレートを生成するS5テンプレート生成部と、単語抽出部で抽出された単語とテンプレート生成部で生成されたテンプレートと画像とに基づいてテキストを生成するS9テキスト生成部と、テキスト生成部で生成されたテキストを画像に関連付けるS10テキスト関連付部と、を備える。
【選択図】図6

Description

本発明は、テキスト生成装置、テキスト生成プログラム及びテキスト生成方法に関するものである。
従来、撮像画像に対し、文字情報を付与することができる画像処理装置が知られている。例えば、特許文献1では、画像から特徴量を抽出し、その特徴量を単語に変換し、その単語を文章テンプレートに挿入することによって文章を作成する技術が開示されている。
特開2013−140559
しかしながら、従来技術では、あらかじめ単語とテンプレートを準備する必要がある。そのため、あらかじめ準備された単語またはテンプレートの数が少ない場合、その組み合わせによって作成される文章のバリエーション数が制限されるおそれがあった。
本発明は、このような問題点に鑑みてなされたものであり、テキストのバリエーション数を増やすことを目的とする。
本発明の一態様に係るテキスト生成装置は、複数のデータから単語を抽出する単語抽出部と、単語抽出部で抽出された単語と複数のデータとに基づいてテンプレートを生成するテンプレート生成部と、単語抽出部で抽出された単語とテンプレート生成部で生成されたテンプレートと画像とに基づいてテキストを生成するテキスト生成部と、テキスト生成部で生成されたテキストを画像に関連付けるテキスト関連付部とを備える。
本発明の一態様に係るテキスト生成装置は、複数のキーワードごとに分類された複数のデータからキーワードごとに単語を抽出する単語抽出部と、単語抽出部でキーワードごとに抽出された単語とキーワードごとに分類された複数のデータとに基づいてキーワードごとにテンプレートを生成するテンプレート生成部と、単語抽出部でキーワードごとに抽出された単語とテンプレート生成部でキーワードごとに生成されたテンプレートとキーワードとに基づいて、キーワードごとにテキストを生成するテキスト生成部とを備える。
本発明の一態様に係るテキスト生成方法は、複数のデータから単語を抽出し、単語抽出部で抽出された単語と複数のデータとに基づいてテンプレートを生成し、単語抽出部で抽出された単語とテンプレート生成部で生成されたテンプレートと画像とに基づいてテキストを生成し、テキスト生成部で生成されたテキストを画像に関連付ける。
本発明の一態様に係るプログラムは、複数のデータから単語を抽出する単語抽出ステップと、単語抽出部で抽出された単語と複数のデータとに基づいてテンプレートを生成するテンプレート生成ステップと、単語抽出部で抽出された単語とテンプレート生成部で生成されたテンプレートと画像とに基づいてテキストを生成するテキスト生成ステップと、テキスト生成部で生成されたテキストを画像に関連付けるテキスト関連付ステップとを実行させる。
本発明によれば、テキストのバリエーション数を増やすことができる。
実施例1によるテキスト生成装置1の機能ブロック図である。 画像記憶部3に記憶される画像の一例である。 データ記憶部12aに記憶されるデータの一例である。 単語テンプレート記憶部12bに記憶されるデータの一例である。 生成されたテキストを対象画像に重畳したときのイメージ図である。 実施例1によるテキスト生成装置1の動作の全体の流れを示したフローチャートである。 実施例1によるテキスト生成装置1の単語Twの抽出方法を示したフローチャートである。 形態素解析の結果例である。 各単語の重要度の計算結果と、単語Twとをキーワードごとに示した図である。 実施例1によるテキスト生成装置1のテンプレートTtの生成方法を示したフローチャートである。 実施例1によるテキスト生成装置1のテキストの生成方法を示したフローチャートである。 実施例2によるテキスト生成装置1の機能ブロック図である。 実施例2によるテキスト生成装置1の動作の全体の流れを示したフローチャートである。 実施例2によるテキスト生成装置1の単語Twの抽出方法を示したフローチャートである。 単語の評価テーブルの一例である。 実施例2によるテキスト生成装置1のテンプレートTtの生成方法を示したフローチャートである。 実施例3によるテキスト生成装置1の機能ブロック図である。 実施例3によるテキスト生成装置1のデータ記憶部12aに記憶されるデータの一例である。 実施例3によるテキスト生成装置1の単語テンプレート記憶部12bに記憶されるデータの一例である。 実施例3によるテキスト生成装置1の動作の全体の流れを示したフローチャートである。 実施例3によるテキスト生成装置1の単語Twの抽出方法を示したフローチャートである。 実施例3によるテキスト生成装置1のテキストの生成方法を示したフローチャートである。
本発明によるテキスト生成装置ついて、以下、図面やフローチャートを参照しながら説明する。なお、本明細書内において特別な記載がない限り、言葉の定義は以下のようにする。「単語」とは、文法上の意味を持つ最小単位である。例えば「花が咲く」を単語に分割すると、「花」「が」「咲く」となる。「テンプレート」とは、コンピュータのソフトウェアで、設定ずみのパターンである。「テキスト」とは、コンピュータで文字データのことである。「文」とは、一つの事態を表す言語表現の一単位である。通常は主語と述語を含むが、命令文や感嘆文のように主語と述語を含まないものも文である。「文章」とは、複数の文から構成されるものである。「データ」とは、コンピュータで処理する情報で
ある。
図1は、本実施例に係るテキスト生成装置1の機能ブロック図の一例である。
テキスト生成装置1は、生成部10と、テキスト関連付部11と、記憶部12と、シーン分類判定部13と、通信部14と、制御部15と、を備える。生成部10は、単語抽出部10aと、テンプレート生成部10bと、テキスト生成部10cと、を備える。記憶部12は、データ記憶部12aと、単語テンプレート記憶部12bと、を備える。
外部記憶装置2は、データ記憶部20と、通信部21と、制御部22と、を備える。本実施例の外部記憶装置2として、例えばブログやSNS(Social Networking Service)や写真共有サイト等のデータベースサーバなどが挙げられる。データ記憶部20は、パソコンやスマートフォン、デジタルカメラ等から、ブログ、SNS、写真共有サイト等に投稿された文字データや音声データ、画像データ等を記憶する。通信部21は、データ記憶部20に記憶されている文字データをテキスト生成装置1へ送信する。制御部22は、データ記憶部20と通信部21とを制御する。本実施例では、テキスト生成装置1が外部記憶装置2から受信するデータは、文字データのみとする。
画像記憶部3は、テキスト生成装置1に対して着脱可能に接続される記憶部である。例えば、USBメモリやメモリーカード等が挙げられる。画像記憶部3は、図2に示すようなテキストを関連付けする対象画像を記憶する。
テキスト生成装置1は、制御部15の制御により、外部記憶装置2の制御部22によってデータ記憶部20に記憶されているデータが読み出だされ通信部21を介してデータ記憶部20に記憶された文字データを、通信部14から受信する。さらに、テキスト生成装置1は、制御部15の制御により、画像記憶部3に記憶されている、テキストと関連付けを行う対象画像を通信部14から受信する。
記憶部12は、外部記憶装置2から受信した文字データと、テキスト生成のために必要な単語とテンプレートを記憶する。
データ記憶部12aは、通信部14が外部記憶装置2から受信した文字データをキーワードごとに分類して記憶する。本実施例では、キーワードは画像のシーン分類と一致する。例えば、データ記憶部12aは、図3に示すように、複数の文字データを所定の4つのキーワード(犬、スイーツ、イルミネーションおよびその他)ごとに分類し、4つのデータグループとして記憶する。データグループとは、データを有するグループのことである。4つのデータグループは、図3に示されるように、複数の文字データをそれぞれ有する。キーワードの数は4つに限定されるものではなく、いくつでもよい。また、キーワードは犬、スイーツ、イルミネーション、その他に限定されるものではなく、その他の言葉でもよい。ここでキーワードごとに分類するとは、文字データをグループにまとめることと同様の意味である。例えばキーワードAに応じて分類されたデータグループとは、データグループAを意味する。
生成部10は、複数の文字データと画像からテキストを生成する。
単語抽出部10aは、データ記憶部12aに記憶された全ての文字データを使用して、データグループごとに単語Twを抽出する。本実施例では、単語抽出部10aで抽出された単語を単語Twと記載する。単語Twの例として、本実施例では、重要度の高い単語のことをいう。単語Twは、各データグループについて複数抽出されることが望ましい。単語
Twの抽出方法は後に詳述する。
テンプレート生成部10bは、データ記憶部12aでデータグループが有する複数の文字データと、単語抽出部10aでデータグループごとに抽出された単語Twとを使用して、データグループごとにテンプレートTtを生成する。本実施例では、テンプレート生成部10bで生成されたテンプレートをテンプレートTtと記載する。本実施例でテンプレートTtとは、単語Twを挿入してテキストを生成するための雛形である。例えばテンプレートTtは、図4のテンプレートTtが示すようなアスタリスク*部分に、単語Twを挿入することでテキストとなる文字データである。テンプレートTtは、各データグループについて複数生成されることが望ましい。テンプレートTtの生成方法は後に詳述する。
単語テンプレート記憶部12bは、図4に示すように単語TwとテンプレートTtをキーワードごとに分類して記憶する。
シーン分類判定部13は、テキストを関連付けする対象画像の特徴量を抽出することにより、対象画像のシーン分類を判定する。このシーン分類は、データ記憶部12a、単語テンプレート記憶部12bで使用しているいずれかのキーワードと一致する。特徴量は、対象画像の色や輝度、エッジ量、焦点距離、顔認識の有無、exifに記録されている情報等や、それら情報を加工したものであってもよい。なお、判定に用いる特徴量や判定方法は、特開2013−140559に記載されているものを用いることが可能である。
テキスト生成部10cは、単語テンプレート記憶部12bにキーワードごとに分類して記憶されている単語TwとテンプレートTtと、シーン分類判定部13で判定された対象画像のシーン分類と、を使用してテキストを生成する。対象画像のシーン分類と一致するキーワードに分類して記憶されている単語TwとテンプレートTtを組み合わせることでテキストを生成する。テキストの生成方法は後に詳述する。
テキスト関連付部11は、テキスト生成部10cで生成されたテキストを対象画像に関連付ける。関連付けるテキストは1つであってもよいし、複数でもよい。関連付けの方法は、例えば、テキストを対象画像に重畳する、テキストと対象画像を別々に表示する、テキストを文字データとして対象画像のexifに記録されている情報に追加する、テキストを音声データに変換して対象画像のexifに記録されている情報に追加する、等が挙げられる。図5は、図2のような対象画像に対して「この犬とてもかしこい。」というテキストが生成され、対象画像に重畳したときの例である。
制御部15は、単語抽出部10aと、テンプレート生成部10bと、テキスト生成部10cと、テキスト関連付部11と、データ記憶部12aと、単語テンプレート記憶部12bと、シーン分類判定部13と、通信部14と、を制御する。
次に、本実施例に係るテキスト生成装置1の動作を説明する。
まず、テキスト生成装置1における動作の全体の流れを図6に示すフローチャートを用いて説明する。
(S1)ユーザがテキスト生成装置1のスイッチをONにする。なお、本実施例では、ユーザがテキスト生成装置1のスイッチをONにすることに基づいて、図6に示す処理を実行するが、それに限定されるものではない。図示しない表示部にメニュー画面を表示させ、メニュー画面を操作することによって、図6に示す処理を実行してもよい。また、必ずしもユーザによる操作は必要なく、自動的に図6に示す処理が実行されてもよい。
(S2)通信部14は、外部記憶装置2から複数の文字データを受信する。例えば、外部記憶装置2のデータ記憶部20にはブログやSNS、写真共有サイトに投稿された文字データや音声データ、画像データ等が記憶されており、文字データのみを受信する。外部記憶装置2の制御部22は、データ記憶部20に記憶されているデータを読み出し、通信部21を介して記憶部20に記憶された文字データをテキスト生成装置1へ送信する。テキスト生成装置1は、外部記憶装置2に記憶された文字データを、通信部14を介して受信する。
(S3)データ記憶部12aは、S2で受信した複数の文字データをキーワードごとに分類して記憶する。例えば図3に示すように、複数の文字データを所定の4つのキーワード(犬、スイーツ、イルミネーションおよびその他)ごとに分類し、4つのデータグループとして記憶する。4つのデータグループのそれぞれは、複数の文字データを有する。本実施例では、前述したようにキーワードはシーン分類と一致するものとする。
(S4)単語抽出部10aは、データ記憶部12aでデータグループが有する複数の文字データから、データグループごとに単語Twを抽出する。単語Twとは、重要度の高い単語を意味する。本実施例において、重要度の高い単語とは、ある特定のデータグループにのみ含まれていて、かつ、含まれている数が多い単語である。図3を用いて詳しく説明する。
図3に示すように、単語「かわいい」は、データグループ「犬」、データグループ「スイーツ」、データグループ「イルミネーション」、に含まれている。このように単語「かわいい」を含むデータグループの数が多い場合、単語「かわいい」の重要度は低くなる。一方、単語「大きい」や単語「かしこい」は、データグループ「犬」にのみ記憶されている。このように、ある特定データグループにのみ含まれている単語「大きい」「かしこい」の重要度は高くなる。さらに、単語「大きい」はデータグループ「犬」に2つ含まれており、単語「かしこい」はデータグループ「犬」に1つ含まれている。この場合、データグループ「犬」に含まれている単語「大きい」の重要度は、単語「かしこい」の重要度より高くなる。以上より、データグループ「犬」に含まれている単語「かわいい」「大きい」「かしこい」を重要度が高い順番に並べると、大きい→かしこい→かわいい、となる。このような単語の重要度を考慮することによって、多くのデータグループに含まれている単語は一般的な単語として抽出されず、ある特定のデータグループにのみ含まれている単語は重要度が高い単語として抽出することができる。以上の単語Twの抽出方法の一例を図7に示すフローチャートを用いて詳しく説明する。単語の重要度の計算にはtf・idf値を用いる。tf・idf値とは、単語に関する重みの一種である。
図7は、図6に示すS4の詳細な処理について説明をするフローチャートである。図7に示す(S41)において、単語抽出部10aは、データ記憶部12aに記憶された複数の文字データを取得し、全ての文字データに対して形態素解析を行う。形態素解析は、自然言語で書かれた文を、意味を持つ最小の言語単位に区切り、それぞれの品詞を判定する技術である。形態素解析は、コンピュータ等の計算機を用いた自然言語処理技術のひとつであり、かな漢字変換や機械翻訳などに応用されている。例えば、「お待ちしております。」という文字データに対して形態素解析を行うと、図8のような結果が得られる。これは、既存の形態素解析ツールを使用して解析した結果である。本実施例では、既存の形態素解析ツールを用いて形態素解析を利用する。
(S42)単語抽出部10aは、S41で区切られた単語を1つ選択する。選択された単語を単語iとする。本実施例では、単語iに対して、単語の重要度を計算する。
(S43)単語抽出部10aは、単語iの品詞が形容詞であるかどうかを判定する。単
語iの品詞は、S41で形態素解析を行った際に判定されているため、形態素解析の結果を使用すればよい。単語iが形容詞でなければ、S47へ進む。単語iが形容詞であればS44へ進む。
(S44)単語抽出部10aは、単語iの出現頻度tfを計算する。出現頻度tfは、1つのデータグループに単語iがどれだけの頻度で含まれているかを示す。出願頻度tfは、下記(数1)を使用して計算する。
(数1)tfi,j=ni,j/Σk,j
iは単語、jはキーワードを表している。ni,jは、データグループjに含まれている単語iの数である。Σk,jは、データグループjに含まれている単語の総数である。(数1)を書き換えると、
(数1a)tfi,j=データグループjに含まれている単語iの数/データグループjに含まれている単語の総数
となる。例えば、図3で、単語iは「かわいい」、キーワードjは「犬」、とする。単語i「かわいい」はデータグループj「犬」に2つ含まれており、データグループj「犬」に含まれている単語の総数は25なので、tfi,j=2/25、となる。
(S45)単語抽出部10aは、単語iの逆文書頻度idfを計算する。逆文書頻度idfは、単語iがどれだけの数のデータグループに含まれているかを示す。逆文書頻度idfは、下記(数2)を使用して計算する。
(数2)idf=log(|j|/|{j:j∋t}|)
|j|はキーワードの総数、すなわちデータグループの総数である。{j:j∋t}は単語iを含んでいるデータグループの数を表す。(数2)書き換えると、
(数2a)idf=log(データグループの総数/単語iを含んでいるデータグループの数)
となる。例えば、図3で、単語iは「かわいい」とする。キーワードは、「犬」「スイーツ」「イルミネーション」「その他」の4つなので、データグループの総数は4である。単語i「かわいい」を含んでいるデータグループは、「犬」「スイーツ」「イルミネーション」の3つなので、idf=log(4/3)となる。対数を用いているため、idfは多くのデータグループに含まれている単語、つまり一般的な単語、の重要度を低くし、ある特定のデータグループにのみ含まれている単語の重要度を高くする役割を果たす。つまり、idfは一種の一般語フィルタの役割を果たす。
(S46)単語抽出部10aは、単語iのtf・idf値を計算する。本実施例では、tf・idf値が高い単語ほど、重要度の高い単語である。(数3)を使用して計算する。
(数3)tf・idf=tfi,j×idf
単語iのtf・idf値は、出現頻度tfと逆文書頻度idfの積で求められる。例えば、図3で単語iは「かわいい」、キーワードjは「犬」、とすると、tf・idf=(2/25)×log(4/3)となる。つまり、データグループj「犬」に含まれる単語i「かわいい」の重要度は(2/25)×log(4/3)≒1.0×0.01である。同様に、データグループj「犬」に含まれる単語i「大きい」の重要度は、tf・idf=(2/25)×log(4/1)≒4.8×0.01となる。データグループj「犬」に含まれる単語i「かしこい」の重要度は、tf・idf=(1/25)×log(4/1)≒2.4×0.01となる。よって、データグループj「犬」に含まれている「かわいい」「大きい」「かしこい」という単語を重要度の高い順番に並べると、前述したように、大きい→かしこい→かわいい、となる。
(S47)単語抽出部10aは、S41で区切られた単語のうち、単語iが最後の単語であるか判断する。最後の単語であるかの判断は、全ての単語に対して図7のフローチャ
ートの処理を実行したかどうかで判断する。最後の単語でなければS42に戻り、次の単語を選択する。最後の単語であればS48へ進む。
(S48)単語抽出部10aは、S46で計算された重要度の高い単語を単語Twとして、データグループごとに抽出する。このとき、単語Twは、各データグループについて複数抽出されることが望ましい。本実施例では重要度の高い方から順に2つずつデータグループごとに単語Twを抽出する。図3を例に、単語iの重要度と、抽出された単語Twを、キーワード「犬」とキーワード「スイーツ」についてまとめたものを図9に示す。このときデータグループ「犬」に含まれている単語の総数は25、データグループ「スイーツ」に含まれている単語の総数は23、である。また、各データグループに含まれていない単語の欄は空白になっている。
図6に戻ってテキスト生成装置1の動作を説明する。
(S5)テンプレート生成部10bは、S3で記憶した文字データとS4で抽出した単語Twとを使用して、データグループごとにテンプレートTtを生成する。テンプレートTtは、アスタリスク*部分に単語Twを挿入するとテキストとなる雛形である。テンプレートTtの生成方法の一例を図10に示すフローチャートを用いて詳しく説明する。
図10は、図6に示すS5の詳細な処理について説明をするフローチャートである。図10に示す(S51)において、テンプレート生成部10bは、データ記憶部12aに記憶された文字データを取得し、文を1つ選択する。本実施例では、文字データを句点やスペース、疑問符、感嘆符等で区切ったものを1つの文とする。選択された文を文Dとする。例えば図3で、「この犬とても大きい。」が文Dとして選択される。
(S52)テンプレート生成部10bは、文Dがどのデータグループに含まれているか判定する。さらに、テンプレート生成部10bは、文Dを含むデータグループから抽出された単語Twが、文Dに含まれているか判定する。文Dは同じ単語Twを複数含んでいてもよいし、異なる単語Twを複数含んでいてもよい。単語Twが文Dに含まれていなければS54へ進む。単語Twが文Dに含まれていればS53へ進む。例えば図3で、「この犬とても大きい。」という文Dは、データグループ「犬」に含まれていると判定する。さらにデータグループ「犬」から抽出された単語Twは「大きい」「かしこい」であり、単語Tw「大きい」が文Dに含まれているため、S53へ進む。
(S53)テンプレート生成部10bは、文Dに含まれる単語Twをアスタリスク*に置き換え、テンプレートTtを生成する。例えば、文D「この犬とても大きい。」から、単語Tw「大きい」をアスタリスク*に置き換え、「この犬とても*。」というテンプレートTtが生成される。
(S54)テンプレート生成部10bは、取得した文字データに含まれる文のうち文Dが最後の文であるか判断する。最後の文であるかの判断は、全ての文に対して図10のフローチャートの処理を実行したかどうかで判断する。最後の文でなければS51へ戻り、次の文でテンプレートTtを生成する処理を行う。文Dが最後の文であれば、テンプレート生成部10bは処理を終了する。例えば、文D「この犬とても大きい。」は最後の文ではないので、S51へ戻り、次の文「うちの犬が1番かわいい!」を文Dとして選択する。このようにテンプレートTtの生成処理を繰り返すと、図4に示すようなテンプレートTtがデータグループごとに生成される。
図6に戻ってテキスト生成装置1の動作を説明する。
(S6)単語テンプレート記憶部12bは、S4で抽出した単語TwとS5で生成したテンプレートTtを、図4に示すようにキーワードごとに分類して記憶する。
(S7)シーン分類判定部13は、通信部14を介して、画像記憶部3に記憶されているテキストを関連付けする対象画像を取得する。
(S8)シーン分類判定部13は、取得した対象画像の特徴量を抽出し、対象画像のシーン分類を判定する。シーン分類の判定に用いる特徴量や判定方法は、前述したように特開2013−140559に記載されているものを用いることが可能である。具体的には、対象画像の色や輝度、エッジ量、焦点距離、顔認識の有無や数、exifに記録されている情報等や、それらを加工したものを特徴量として抽出し、その特徴量に応じて対象画像のシーン分類を判定する。ここでいうシーン分類は、データ記憶部12aまたは単語テンプレート記憶部12bで使用しているいずれかのキーワードと一致する。
(S9)テキスト生成部10cは、S6で単語テンプレート記憶部12bにキーワードごとに分類して記憶された単語TwとテンプレートTtと、S8で判定された対象画像のシーン分類とを使用してテキストを生成する。テキストの生成方法の一例を図11に示すフローチャートを用いて詳しく説明する。
図11は、図6に示すS9の詳細な処理について説明をするフローチャートである。図11に示す(S91)において、テキスト生成部10cは、シーン分類判定部13で判定された対象画像のシーン分類を取得する。
(S92)テキスト生成部10cは、S91で取得したシーン分類が、どのキーワードと一致するのか判定する。ここでいうキーワードとは、データ記憶部12aまたは単語テンプレート記憶部12bで使用しているいずれかのキーワードである。つまり、テキスト生成部10cは画像に対応するキーワードの判定を行うキーワード判定部の役割も担う。テキスト生成部10cは、一致するキーワードに分類して記憶されている単語TwとテンプレートTtを、単語テンプレート記憶部12bからランダムに選択する。例えば、シーン分類判定部13は図2の画像のシーン分類を「犬」と判定する。テキスト生成部10cは、シーン分類「犬」と一致するキーワード「犬」に分類して記憶されている単語Tw「かしこい」とテンプレートTt「この犬とても*。」を選択する(図4)。
(S93)テキスト生成部10cは、S92で選択した単語TwをテンプレートTtのアスタリスク*部分に挿入してテキストを生成する。例えば、単語Tw「かしこい」をテンプレートTt「この犬とても*。」に挿入すると、「この犬とてもかしこい。」というテキストが生成される。
(S94)S93で生成されたテキストを、図示しない表示部に表示する。
(S95)ユーザは、S94で表示されたテキストを見て、そのテキストを選択するか否か判断する。ユーザがテキストを選択しなければS92に戻り、選択する単語TwとテンプレートTtの組み合わせを変えてテキストを生成する。ユーザがテキストを選択したら、テキスト生成処理を終了する。また、生成されうる全てのテキストを表示したら、その旨をユーザに通知し、テキスト生成処理を終了してもよい。例えば、図4ではキーワード「犬」では、「この犬とても大きい。」「大きいわんちゃん大好き!」「大きい犬だ。」「この犬とてもかしこい。」「かしこいわんちゃん大好き!」「かしこい犬だ。」という6パターンのテキストを生成することができる。
図6に戻ってテキスト生成装置1の動作を説明する。
(S10)テキスト関連付部11は、S9で生成されたテキストと対象画像とを関連付ける。関連付けるテキストは1つであってもよいし、複数でもよい。関連付ける方法として
は、テキストを対象画像に重畳する、テキストと対象画像を別々に表示する、テキストを文字データとして対象画像のexifに記録されている情報に追加する、テキストを音声データに変換して対象画像のexifに記録されている情報に追加する、等が考えられる。図5は、図2のような対象画像に対して「この犬とてもかしこい。」というテキストが生成され、対象画像に重畳した一例である。
以上のように、本実施例によれば、あらかじめ単語とテンプレートを準備する必要がないため、テキストのバリエーション数を増やすことができる。さらに、あらかじめ準備された単語とテンプレートに依存しないテキストを生成することができるため、ユーザが共感や感動するテキスト、面白いと思うテキスト、驚くテキスト等を生成することができる。
本実施例では、外部記憶装置2のデータ記憶部20に記憶されているデータのうち文字データのみを使用してテキストを生成するとしたが、それに限定されるものではない。例えば音声認識技術を用いて音声データを文字データに変換し、テキスト生成に使用してもよい。また、画像データから特徴量を抽出し、その特徴量に基づいて画像データを文字データに変換してテキストを生成してもよい。外部記憶装置2のデータ記憶部20に記憶されている画像データに対して、テキストを生成してもよい。
本実施例では、テキスト生成に使用するデータは外部記憶装置2にあるとしたが、それに限定されるものではない。テキスト生成に使用するデータは、あらかじめテキスト生成装置1に記憶されていてもよい。この場合、ある一定の期間が経過したら、データを更新できるようにしてもよい。また、ユーザが文字データや音声データを入力し、テキスト生成に使用するデータとして記憶させてもよい。ユーザが使用しないと判断したデータを、自動または手動で削除してもよい。
本実施例では、画像記憶部3はテキスト生成装置1に着脱可能な記録媒体として、USBメモリやメモリーカードとしたが、それに限定されるものではない。例えば、テキスト生成装置1のもっている内部メモリでもよいし、サーバにあるデータベース等でもよい。また、画像記憶部3はカメラの内部メモリまたはカメラに着脱可能な外部メモリであってもよい。通信部14は、無線または有線で画像を取得してもよい。
本実施例では、外部記憶装置2からデータを受信するタイミングとして、ユーザがスイッチをONにした後としたが、それに限定されるものではない。スイッチがONになる度にデータを受信しなくてもよい。例えば、ユーザがデータを受信するタイミングを指定し、指定されたタイミングでテキスト生成装置1は外部記憶装置2からデータを受信してもよい。ユーザがデータを受信するタイミングを指定しなかった場合、すでにデータ記憶部12aに記憶されているデータ、または単語テンプレート記憶部12bに記憶されている単語TwとテンプレートTtを使用してテキストを生成してもよい。また、テキスト生成装置1は、所定の期間が経過したタイミングで自動的に外部記憶装置2からデータを受信してもよい。所定の期間が経過したタイミングは、1週間や1か月、テキスト生成装置1のスイッチが10回ONされたとき等が挙げられる。その結果、テキスト生成装置1が外部記憶装置2からデータを受信する回数を減らすことができる。
本実施例では、キーワードは画像のシーン分類と一致するとしたが、それに限定されるものではない。キーワードは時間や場所等でもよい。例えば、キーワードを「0時〜5時」「5時〜10時」「10時〜15時」「15時〜19時」「19時〜24時」とした場合、データグループ「5時〜10時」では朝の時間に特徴的である「おはよう」等を使用したテキストが生成できる。また、キーワードを「東京」「名古屋」「大阪」「その他」とした場合、データグループ「大阪」では大阪に特徴的である「おおきに」等の地域特有の言葉を使用したテキストが生成できる。また、キーワードを「アメリカ」「イギリス」「
その他」とした場合、データグループ「アメリカ」では「fall」「movie」「soccer」、データグループ「イギリス」では「autumn」「film」「football」、等の地域特有の言葉を使用したテキストが生成できる。このようにキーワードに時間や場所等を用いる場合、テキスト生成部10cは、画像のexifに記録されている情報から、画像が作成された時刻や場所等の情報を取得し、画像と一致するキーワードを判定すればよい。その結果、その時間や場所に対して特徴的なテキストが生成できる。また、ユーザがキーワードを設定してもよい。あらかじめ準備されたキーワードからユーザが選択してもよいし、ユーザが図示しない入力部からキーワードを入力してもよい。その場合、シーン分類判定部13は、ユーザが設定したキーワードと一致するように画像の特徴量を抽出すればよい。その結果、ユーザの興味のあるキーワードに対して特徴的なテキストが生成できる。
本実施例では、データ記憶部12aに記憶されているデータは文字データであるとしたが、それに限定されるものではない。例えば音声データが記憶されており、音声データを文字データに変換してテキストを生成してもよい。また、画像データが記憶されており、画像データの特徴量を抽出することで文字データに変換し、テキストを生成してもよい。その結果、生成されるテキストのバリエーションがより増える。
本実施例では、単語抽出部10aはデータ記憶部12aに記憶されている全てのデータを使用して単語Twを抽出するとしたが、それに限定されるものではない。テキスト生成装置1に含まれる図示しないデータ選択部が、データ記憶部12aに記憶されているデータの一部を選択し、選択されたデータを使用して単語Twを抽出してもよい。例えば、データが投稿された時刻や場所、データを投稿した人、もしくはテキストの付与を指定した人の性別や世代や所属するグループ等で、データ数を絞り、絞られたデータを使用して単語Twを抽出してもよい。データを投稿した人の所属するグループとは、その人の出身校や趣味、仕事、その他特徴等で分類されたグループが考えられる。具体的には、テキスト生成装置1のユーザが20代の場合、20代の人が投稿したデータを使用してテキストを生成する。または、過去にユーザ自身が投稿したデータのみを使用してテキストを生成する。その結果、ユーザに関係のあるデータに絞ってテキストを生成できるため、ユーザがより共感できるテキストが生成できる。
以上のようなテキスト生成に使用するデータの選択は、単語抽出部10aが単語Twを抽出する前のタイミングで行われてもよいし、通信部14が外部記憶装置2からデータを受信するタイミングで行われてもよい。
本実施例では、単語抽出部10aは形容詞であるかどうかを判定するとしたが、それに限定されるものではない。例えば名詞、形容動詞、副詞等でもよいし、これら品詞の組み合わせでもよい。その場合、テンプレートTtのアスタリスク*部分に対応する品詞と、アスタリスク*部分に挿入する単語Twの品詞とが一致するのが望ましい。具体的には、テキスト生成部10cは単語テンプレート記憶部12bから選択したテンプレートTtのアスタリスク*部分に対応する品詞を判定する。テキスト生成部10cは、判定された品詞と一致する単語Twを単語テンプレート記憶部12bから選択し、テンプレートTtのアスタリスク*部分へ単語Twを挿入する。また、テキスト生成部10cは、単語テンプレート記憶部12bから選択した単語Twの品詞を判定し、判定された品詞に対応するアスタリスク*部をもつテンプレートTtを単語テンプレート記憶部12bから選択してテキストを生成してもよい。その結果、テキストのバリエーションをさらに増やすことができる。
本実施例では、単語抽出部10aは、単語の重要度の計算にtf・idf値を使用したが、それに限定されるものではない。例えば、単語iが異なるデータグループに含まれてい
れば、単語iが含まれているデータグループの数だけ重要度を低くし、同じデータグループに複数含まれていれば、同じデータグループに記憶されている数だけ重要度を高くする計算方法でもよい。例えば図3で、単語「かわいい」は3つの異なるデータグループに含まれているため、重要度を3低くする。単語「かわいい」はデータグループ「犬」に2つ含まれているため、重要度を2高くする。よってデータグループ「犬」に含まれている単語「かわいい」の重要度は、−3+2=−1である。同様にしてデータグループ「犬」に含まれている単語「大きい」の重要度は、−1+2=1である。データグループ「犬」に含まれている単語「かしこい」の重要度は、−1+1=0である。よってデータグループ「犬」に記憶されている「かわいい」「大きい」「かしこい」という単語の重要度を本手法を用いて高い順番に並べると、大きい→かしこい→かわいい、となる。この計算方法であれば、計算回数を減らすことができる。
また、単語抽出部10aは必ずしもtf・idf値を計算しなくてもよい。単語の重要度はユーザが指定してもよい。例えば、図示しない表示部に単語を表示し、ユーザが単語の重要度を、図示しない入力部から入力する。入力された重要度の高い単語を単語Twとして抽出する。また、図示しない表示部に単語を表示し、ユーザがテキスト生成に使用する単語を選択してもよい。その結果、計算を行わなくても単語Twを抽出することができる。
本実施例では、抽出する単語Twの数をデータグループごとに2つずつとしたがそれに限定されるものではない。例えば重要度の高い方から順に複数の単語Twを抽出してもよいし、データグループごとに、抽出される単語Twの数が異なってもよい。抽出される単語Twの数は、あらかじめ設定されていてもよいし、ユーザが設定してもよい。
本実施例では、テンプレートTtは、単語Twを挿入してテキストを生成するための雛形であるとしたが、それに限定されるものではない。例えば、テンプレートTtは単語Twを挿入する部分がない、文章であってもよい。その場合、テンプレートTtは単語Twを含むデータである。テキスト生成部10cは、テンプレートTtの前または後ろに単語Twを追加することでテキストを生成する。また、テキスト生成部10cは、テンプレートTtまたは単語Twを複数つなげることによってテキストを生成してもよい。例えば、テンプレートTtが「この犬とても大きい。」、単語Twが「かしこい」であれば、テキストは「この犬とても大きい。かしこい。」となる。
単語テンプレート記憶部12bは、単語TwとテンプレートTtが生成される度に追加で記憶してもよい。その結果、テキストのバリエーションをより増やすことができる。また、単語テンプレート記憶部12bは、単語TwとテンプレートTtが抽出または生成される度に記憶内容を更新してもよい。その場合、使用回数の低い単語TwやテンプレートTtを単語テンプレート記憶部12bから削除し、新しく生成された単語TwやテンプレートTtを追加してもよい。生成された日時が古い単語TwやテンプレートTtから削除してもよい。またユーザが削除する単語TwやテンプレートTtを選択してもよい。その結果、単語テンプレート記憶部12bで使用するメモリ量を少なくすることができる。
本実施例では、単語TwとテンプレートTtの選択方法をランダムとしたが、それに限定されるものではない。例えば、単語Twは抽出された順、テンプレートTtは生成された順に選択されてもよい。また、ユーザが選択したテキストを記憶しておき、その結果からユーザの好みを自動学習し、ユーザの好み順に単語TwとテンプレートTtを選択してもよい。
本実施例では、生成されたテキストを図示しない表示部に1つずつ表示したが、それに限定されるものではない。例えば、生成されたテキストの全てまたは一部を表示部に表示し
、その中からユーザが好きなものを選択してもよい。その結果、よりユーザ好みのテキストを対象画像に関連付けることができる。また、必ずしもユーザによる操作は必要なく、生成されたテキストを表示部に表示せずに、自動的にテキストが選択されてもよい。
テキスト生成装置1は、撮像装置に備わっていてもよい。例えば、デジタルカメラにテキスト生成装置1を内蔵すれば、撮像した画像に対し、テキストを生成することができる。
続いて、実施例2について説明する。実施例2は、画像に対し、より多くのユーザから共感が得られ、違和感のないテキストを生成するテキスト生成装置である。実施例1に係るテキスト生成装置1と実施例2に係るテキスト生成装置1との主な相違点は、共感度判定部100、単語評価部101、フィルタリング部102、テキスト記憶部120が追加された点である。なお本実施例において、実施例1と同様の構成部、動作の説明は省略する。
図12は、実施例2に係るテキスト生成装置1の機能ブロック図の一例である。実施例2において、実施例1と同様の構成部は、実施例1と同様の数字で表している。
テキスト生成装置1は、生成部10と、テキスト関連付部11と、記憶部12と、シーン分類判定部13と、通信部14と、制御部15と、を備える。生成部10は、共感度判定部100と、単語抽出部10aと、単語評価部101と、テンプレート生成部10bと、フィルタリング部102と、テキスト生成部10cとを備える。記憶部12は、データ記憶部12aと、単語テンプレート記憶部12bと、テキスト記憶部120とを備える。
共感度判定部100は、データ記憶部12aに記憶されたデータのうち、共感度の高いデータを取得する。共感度の高いデータとは、より多くの人から反応があったデータである。例えば、コメント数が多いブログ、多くの人からお気に入り登録されているサイト、SNSで多くの人が閲覧した投稿、写真投稿サイトで多くの人が閲覧した画像、有名な映画や文書や名言、などに関わる文字データや音声データ等が考えられる。つまり、本実施例での共感度判定部は、データを選択し、取得する。
単語抽出部10aは、共感度判定部100で取得したデータを使用して、データグループごとに単語Twを抽出する。本実施例では、単語抽出部10aで抽出された単語を単語Twと記載する。単語Twの例として、本実施例では、重要度の高い単語のことをいう。単語Twは、各データグループについて複数抽出されることが望ましい。単語Twの抽出方法は実施例1と同様である。
単語評価部101は、単語抽出部10aで抽出された単語Twの表現を評価し、表現がマイナスであると評価された単語Twを削除する。単語の表現を評価する方法としては、評価表現辞書を用いて分析する方法がある。後に詳述する。
テンプレート生成部10bは、単語評価部101から単語Twを取得する。テンプレート生成部10bは、データ記憶部12aで各データグループが有する複数のデータと、取得した単語Twを使用して、データグループごとにテンプレートTtを生成する。本実施例では、テンプレート生成部10bで生成されたテンプレートをテンプレートTtと記載する。本実施例でテンプレートTtとは、単語Twを挿入してテキストを生成するための雛形である。テンプレートTtは、各データグループについて複数生成されることが望ましい。
フィルタリング部102は、テンプレート生成部10bで生成されたテンプレートTtに対してフィルタリングを実行し、適切でないと判断されたテンプレートTtを削除する。判断方法は後に詳述する。
テキスト記憶部120は、テキスト生成部10cで生成されたテキストをキーワードごとに分類して記憶する。
テキスト関連付部11は、テキスト記憶部120に記憶されているテキストのうち少なくとも1つを対象画像に関連付ける。関連付けの方法は、実施例1と同様である。
制御部15は、共感度判定部100と、単語抽出部10aと、単語評価部101と、テンプレート生成部10bと、フィルタリング部102と、テキスト生成部10cと、テキスト関連付部11と、データ記憶部12aと、単語テンプレート記憶部12bと、テキスト記憶部120と、シーン分類判定部13と、通信部14と、を制御する。
次に、本実施例に係るテキスト生成装置1の動作を説明する。
まず、テキスト生成装置1における動作の全体の流れを図13に示すフローチャートを用いて説明する。実施例1と同様の処理は、実施例1と同様のステップ番号がついている。実施例1と同様の処理は説明を省略する。
(SS4)単語抽出部10aは、データ記憶部12aで各データグループが有する複数の文字データから、データグループごとに単語Twを抽出する。単語Twとは、重要度の高い単語であり、実施例1と同様である。
本実施例に係る単語Twの抽出方法の一例を図14に示すフローチャートを用いて説明する。実施例1と同様の処理は、実施例1と同様のステップ番号がついている。実施例1と同様の処理は説明を省略する。
(S400)共感度判定部100は、データ記憶部12aに記憶された文字データのうち、人からの共感度の高い文字データを取得する。例えば、コメント数が多いブログ、多くの人からお気に入り登録されているサイト、SNSで多くの人が閲覧した投稿、写真投稿サイトで多くの人が閲覧した画像、有名な映画や文書や名言、などに関わる文字データを選択して、取得する。本実施例では、共感度判定部100で取得したデータから、単語Twを抽出し、テンプレートTtとテキストを生成する。
(S401)単語評価部101は、単語Twの表現を評価し、表現がマイナスであると評価された単語Twは削除する。例えば、単語Twとして「悪い」という単語が抽出されたとする。「悪い」という単語がマイナスな表現と評価されると、単語評価部101は単語Twから削除する。単語の表現を評価する方法としては、単語とその単語の表現の評価をテーブルとしてあらかじめ記憶していてもよいし、ユーザが設定してもよい。また、このようなテーブルの既存技術として、評価表現辞書がある。評価表現辞書とは、評価表現とその表現がもつ評価極性の対の集合である(図15)。評価極性とは、評判情報の良い/悪いに関する軸を表す。図15のようなテーブルを使用して、評価値がマイナスな単語Twは削除するようにしてもよい。このような評価表現辞書をインターネット等からダウンロードし、使用してもよい。
図13に戻ってテキスト生成装置1の動作を説明する。
(SS5)テンプレート生成部10bは、S3で記憶した文字データとS4で抽出した単語Twとを使用して、データグループごとにテンプレートTtを生成する。テンプレート
Ttは、アスタリスク*部分に単語Twを挿入するとテキストとなる雛形である。
本実施例に係るテンプレートTtの生成方法の一例を図16に示すフローチャートを用いて説明する。実施例1と同様の処理は、実施例1と同様のステップ番号がついている。実施例1と同様の処理は説明を省略する。
(S500)フィルタリング部102は、テンプレートTtに対してフィルタリングを実行し、適切でないと判断されたテンプレートを削除する。例えば、図4で、キーワード「スイーツ」のテンプレートTtとして「銀座のロールケーキ*よ。」が生成されたとする。しかし、固有名詞「銀座」は画像に適切でない場合が多いと考えられる。同様に数詞も適切でない場合が多いと考えられる。よって、固有名詞や数詞等のようにテンプレートに適切でないと判断された品詞を含むテンプレートTtは削除する。品詞の判定としては、図14に示すフローチャートのS41で行った形態素解析の結果を使用すればよい。また、フィルタリングの対象は品詞に限られない。テンプレートTtの文字数をカウントし、長文と判断されたテンプレートTtはテンプレートに適さないとして削除し、短文のテンプレートTtを生成するようにしてもよい。このとき何文字以下を短文とするかは、あらかじめ設定されていてもよいし、ユーザが任意に設定してもよい。
図13に戻ってテキスト生成装置1の動作を説明する。
(SS10)テキスト記憶部120は、S9で生成されたテキストをキーワードごとに分類して記憶する。テキスト記憶部120は、テキストが生成される度に追加で記憶してもよいし、記憶内容を更新してもよい。記憶内容を更新する場合、使用回数の低いテキストをテキスト記憶部120から削除し、新しく生成されたテキストを追加してもよい。生成された日時が古いテキストから削除してもよい。またユーザが削除するテキストを選択してもよい。
(SS11)テキスト関連付部11は、テキスト記憶部120に記憶されているテキストのうち少なくとも1つを対象画像に関連付ける。テキスト記憶部120には、過去に生成されたテキストも記憶されているため、過去に生成されてユーザが気に入ったテキストを再度使用することができる。テキストのバリエーションも増える。関連付けるテキストは1つであってもよいし、複数でもよい。テキストを対象画像に関連付ける方法は、テキストを対象画像に重畳する、テキストと対象画像を別々に表示する、テキストを文字データとして対象画像のexifに記録されている情報に追加する、テキストを音声データとして対象画像のexifに記録されている情報に追加する、等が考えられる。図5は、図2のような対象画像に対して「この犬とてもかしこい。」というテキストが生成され、対象画像に重畳したときのイメージ図である。
以上のように、本実施例によれば、あらかじめ単語とテンプレートを準備する必要がないため、テキストのバリエーション数を増やすことができる。さらに、適切でないと判断されたデータ、単語Tw、テンプレートTtは使用せずにテキストを生成しているため、画像に対し、より多くのユーザから共感が得られ、違和感のないテキストを生成することができる。
本実施例では、共感度の高いデータを取得するタイミングとして、共感度判定部100がデータ記憶部12aに記憶されたデータのうち共感度の高いデータを取得したが、それに限定されるものではない。例えば、外部記憶装置2のデータ記憶部20からデータを取得するタイミングで、共感度の高いデータのみ取得するようにしてもよい。その結果、データ記憶部12aのメモリ容量を減らすことができる。
続いて、実施例3について説明する。実施例3は、時刻情報を用いて自動的にテキストを生成するテキスト生成装置である。実施例1に係るテキスト生成装置1と実施例3に係るテキスト生成装置1との主な相違点は、構成部においてシーン分類判定部13とテキスト関連付部11とを削除し、情報取得部16とデータ選択部17とを追加した点である。また、テキスト生成に用いるデータを分類するキーワードに時間を用いている。なお本実施例において、実施例1と同様の構成部、動作の説明は省略する。
図17は、実施例2に係るテキスト生成装置1の機能ブロック図の一例である。実施例3において、実施例1と同様の構成部は、実施例1と同様の数字で表している。
テキスト生成装置1は、生成部10と、記憶部12と、通信部14と、制御部15と、情報取得部16と、データ選択部17とを備える。生成部10は、単語抽出部10aと、テンプレート生成部10bと、テキスト生成部10cと、を備える。記憶部12は、データ記憶部12aと、単語テンプレート記憶部12bと、を備える。
テキスト生成装置1は、制御部15の制御により、外部記憶装置2の制御部22によってデータ記憶部20に記憶されているデータが読み出だされ通信部21を介してデータ記憶部20に記憶されたデータを、通信部14から受信する。
データ選択部17は、通信部14が受信したデータのうち、テキスト生成に使用するデータを選択する。データ選択部17は、通信部14が受信したデータを、1.文字データのみのデータと、2.画像データが関連付けられているデータと、3.それ以外のデータと、に分類し、1.文字データのみのデータを選択する。
データ記憶部12aは、データ選択部17で選択されたデータをキーワードごとに分類して記憶する。本実施例では、キーワードに時間を用いる。例えば、データ記憶部12aは、図18に示すように、複数のデータを所定の4つの時間(6時〜9時、11時〜14時、19時〜22時およびその他の時間)ごとに分類し、4つのデータグループとして記憶する。4つのデータグループは、図18に示されるように、複数のデータをそれぞれ有する。本実施例では、データ記憶部12aに記憶されているデータは文字データである。キーワードの数は4つに限定されるものではなく、いくつでもよい。また、キーワードは6時〜9時、11時〜14時、19時〜22時およびその他の時間に限定されるものではなく、その他の時間分類でもよい。ここでキーワードごとに分類するとは、文字データをグループにまとめることと同様の意味である。例えばキーワードAに応じて分類されたデータグループとは、データグループAを意味する。
生成部10は、複数の文字データと時刻情報からテキストを生成する。
単語抽出部10aは、データ記憶部12aに記憶された文字データを使用して、データグループごとに単語Twを抽出する。本実施例では、単語Twは感動詞であるとする。単語Twは、各データグループについて複数抽出されることが望ましい。単語Twの抽出方法は後に詳述する。
テンプレート生成部10bは、データ記憶部12aでデータグループが有する文字データと、単語抽出部10aでデータグループごとに抽出された単語Twとを使用して、データグループごとにテンプレートTtを生成する。本実施例でテンプレートTtとは、単語Twを挿入してテキストを生成するための雛形である。例えばテンプレートTtは、図19のテンプレートTtが示すようなアスタリスク*部分に、単語Twを挿入することでテキストとなる文字データである。テンプレートTtは、各データグループについて複数生成されることが望ましい。テンプレートTtの生成方法は実施例1と同様である。
単語テンプレート記憶部12bは、図19に示すように単語TwとテンプレートTtをキーワードごとに分類して記憶する。
情報取得部16は、テキストを生成する際の情報を取得する。テキストを生成する際の情報としては、例えば、テキストを生成する時刻やテキストを生成する場所等の情報が挙げられる。本実施例では、テキストを生成する際の情報として、時刻を用いる。
テキスト生成部10cは、単語テンプレート記憶部12bでキーワードごとに分類して記憶されている単語TwとテンプレートTtと、情報取得部16で取得した時刻とを使用してテキストを生成する。情報取得部16で取得した時刻と一致するキーワードに分類して記憶されている単語TwとテンプレートTtを組み合わせることでテキストを生成する。テキストの生成方法は後に詳述する。
制御部15は、単語抽出部10aと、テンプレート生成部10bと、テキスト生成部10cと、データ記憶部12aと、単語テンプレート記憶部12bと、通信部14と、情報取得部16と、データ選択部17とを制御する。
次に、本実施例に係るテキスト生成装置1の動作を説明する。
まず、テキスト生成装置1における動作の全体の流れを図20に示すフローチャートを用いて説明する。実施例1と同様の処理は、実施例1と同様のステップ番号がついている。実施例1と同様の処理は説明を省略する。
(SS2)通信部14は外部記憶装置2からデータを受信し、データ選択部17は通信部14が受信したデータのうちテキスト生成に使用するデータを選択する。例えば、外部記憶装置2のデータ記憶部20にはブログやSNS、写真共有サイトに投稿された文字データや音声データ、画像データ等が記憶されている。通信部14は、それらのデータを受信する。外部記憶装置2の制御部22は、データ記憶部20に記憶されているデータを読み出し、通信部21を介して記憶部20に記憶されたデータをテキスト生成装置1へ送信する。テキスト生成装置1は、外部記憶装置2に記憶されたデータを、通信部14を介して受信する。データ選択部17は、通信部14が受信したデータを、1.文字データのみのデータと、2.画像データが関連付けられているデータと、3.それ以外のデータと、に分類し、1.文字データのみのデータを選択する。2.画像データが関連付けられているデータは、実施例1または2の処理を行う。画像が関連付けられているデータと文字データのみのデータとで異なる処理を行う。3.それ以外のデータは、テキスト生成に使用しない。
(SS3)データ記憶部12aは、SS2で選択された文字データをキーワードごとに分類して記憶する。例えば図18に示すように、複数の文字データを所定の4つの時間(6時〜9時、11時〜14時、19時〜22時およびその他の時間)ごとに分類し、4つのデータグループとして記憶する。4つのデータグループは、図18に示されるように、複数の文字データをそれぞれ有する。
(SS4)単語抽出部10aは、データ記憶部12aでデータグループが有する複数の文字データから、データグループごとに単語Twを抽出する。本実施例では、単語Twは感動詞であるとする。単語Twの抽出方法について図21を用いて詳しく説明する。実施例1と同様の処理は、実施例1と同様のステップ番号がついている。実施例1と同様の処理は説明を省略する。
図21は、図20に示すS4の詳細な処理について説明をするフローである。図21に示す(S403)において、単語抽出部10aは、単語iの品詞が感動詞であるかどうかを判定する。単語iの品詞は、S41で形態素解析を行った際に判定されているため、形態素解析の結果を使用すればよい。単語iが感動詞でなければ、S47へ進む。単語iが感動詞であればS404へ進む。
(S404)単語抽出部10aは、単語iが含まれているデータグループに、単語iがいくつ含まれているかカウントする。例えば図18において、単語「おはよう」はデータグループ「6時〜9時」に2つ含まれている。
(S408)単語抽出部10aは、S404でカウントされた数が多い単語、つまり各データグループに含まれている数が多い感動詞、を単語Twとしてデータグループごとに抽出する。このとき、単語Twは、各データグループについて複数抽出されることが望ましい。
図20に戻ってテキスト生成装置1の動作を説明する。
(S5)テンプレート生成部10bは、SS3で記憶した文字データとSS4で抽出した単語Twとを使用して、データグループごとにテンプレートTtを生成する。テンプレートTtは、アスタリスク*部分に単語Twを挿入するとテキストとなる雛形である。テンプレートTtの生成方法は、実施例1と同様である。
(S6)単語テンプレート記憶部12bは、SS4で抽出した単語TwとS5で生成したテンプレートTtを、図19に示すようにキーワードごとに分類して記憶する。
(SS8)情報取得部16は、テキストを生成する時刻を取得する。
(SS9)テキスト生成部10cは、S6で単語テンプレート記憶部12bにキーワードごとに分類して記憶された単語TwとテンプレートTtと、SS8で取得した時刻とを使用してテキストを生成する。テキストの生成方法の一例を図22に示すフローチャートを用いて詳しく説明する。
図22は、図20に示すSS9の詳細な処理について説明をするフローチャートである。図22に示す(S901)において、テキスト生成部10cは、情報取得部16で取得した時刻情報を取得する。
(S902)テキスト生成部10cは、S901で取得した時刻情報が、どのキーワードと一致するのかを判定する。ここでいうキーワードとは、データ記憶部12aまたは単語テンプレート記憶部12bで使用しているいずれかのキーワードである。テキスト生成部10cは、一致するキーワードに分類して記憶されている単語TwとテンプレートTtを、単語テンプレート記憶部12bからランダムに選択する。例えば、情報取得部16はテキストを生成する時刻として「8時」という時刻情報を取得する。テキスト生成部10cは、時刻情報「8時」と一致するキーワード「6時〜9時」に分類して記憶されている単語Tw「おはよう」とテンプレートTt「すがすがしい!*。」を選択する(図19)。
テキスト生成部10cは、実施例1と同様に、S902で選択した単語TwとテンプレートTtを使用してテキストを生成する。上記の例では、「すがすがしい!おはよう。」というテキストが生成される。また、生成されたテキストの選択方法や更新方法などは実施例1と同様である。
以上のように、本実施例によれば、あらかじめ単語とテンプレートを準備する必要がないため、テキストのバリエーション数を増やすことができる。さらに、画像データを使用せずに、時刻情報や位置情報のみで自動的にテキストを生成することができる。
本実施例を使用すれば、ユーザが入力する文字を考えなくても、その時刻や場所に適した文字データを自動で生成することができる。例えば、ユーザがSNSに文章を投稿したいと思った時、ユーザは投稿ボタンを押す。テキスト生成装置1は、ユーザが投稿ボタンを押した時刻や場所に基づいてテキストを自動で生成し、SNSに投稿する。そのときに、テキスト生成に使用した時刻や場所を、生成されたテキストと共に表示してもよい。
本実施例では、データ選択部17は文字データのみのデータを選択するとしたが、それに限定されるものではない。データが投稿された時刻や場所、データを投稿した人、もしくはテキストの付与を指定した人の性別や世代や所属するグループ等に基づいて、データを選択してもよい。データを投稿した人の所属するグループとは、その人の出身校や趣味、仕事、その他特徴等で分類されたグループが考えられる。具体的には、テキスト生成装置1のユーザが20代の場合、20代の人が投稿したデータを使用してテキストを生成する。または、過去にユーザ自身が投稿したデータのみを使用してテキストを生成する。その結果、ユーザに関係のあるデータに絞ってテキストを生成できるため、ユーザがより共感できるテキストが生成できる。
本実施例では、データ選択部17がテキスト生成に使用するデータを選択するとしたが、それに限定されるものではない。例えば、通信部14がテキスト生成に使用するデータを選択し、受信してもよい。単語抽出部10aが、データ記憶部12aに記憶されたデータを取得する際に、テキスト生成に使用するデータを選択してもよい。この処理は必須ではなく、実行しなくてもよい。
本実施例では、テキストを生成する際の情報として時刻を用いたが、それに限定されるものではない。例えば、場所情報でもよい。その結果、テキストを生成する場所に対して特徴的なテキストが生成できる。
本実施例では、単語Twは感動詞であるとしたが、それに限定されるものではない。形容詞、動詞、形容動詞等、いずれの品詞でもよい。
本実施例では、単語Twの抽出方法としてデータグループに含まれている数が多い単語を抽出したが、それに限定されるものではない。例えば、実施例1や実施例2に示した単語Twの抽出方法を使用してもよい。
以上、本発明の実施例について図面やフローチャートを使用して詳述してきたが、具体的な構成はこの実施例に限られるものではなく、本発明の要旨を逸脱しない範囲の設計なども含まれる。
本発明の実施例における各部は、テキスト生成装置1に備えられているとしたが、それに限定されるものではない。各部のいずれか又は組み合わせが、複数の装置やサーバに分かれて備えられていてもよい。例えば、テキスト関連付部11は携帯端末に備えられ、テキスト関連付部11以外の各部はサーバに備えられていてもよい。その結果、一連のテキスト生成の処理はサーバで行われ、生成されたテキストは携帯端末で表示または画像と関連付けされる。具体的には、実施例1または実施例2の場合では、サーバは、画像記憶部3からテキストを関連付ける対象画像もしくはその対象画像に関する情報(画像が属するキーワード)を取得し、対象画像もしくは対象画像に関する情報に基づいてテキストを生成する。サーバは、生成したテキストを携帯端末に送信する。携帯端末は、画像記憶部3
から対象画像を取得し、サーバから受信したテキストを対象画像に関連付ける。なお、画像記憶部3は携帯端末の外部にあってもよいし、携帯端末の内部に備わっていてもよい。また、実施例3の場合には、サーバは、携帯端末から時刻情報を取得し、時刻情報に基づいてテキストを生成する。サーバは、生成したテキストを携帯端末に送信する。携帯端末は、受信したテキストを携帯端末に設けられた図示しない表示部に表示する。もしくは、テキスト生成部10cとテキスト関連付部11は携帯端末に備えられ、それ以外の各部はサーバに備えられていてもよい。具体的には、上述と同様に、サーバは画像、画像に関する情報、時刻情報を取得し、取得された画像、画像に関する情報、時刻情報に基づいて、単語TwとテンプレートTtを抽出または生成する。携帯端末は、抽出または生成された単語TwとテンプレートTtをサーバから受信してテキストを生成する。なお、各部の組み合わせは以上の例に限定されるものではなく、いずれの組み合わせでもよい。また、複数のサーバや複数の携帯端末や複数の装置に分かれて備えられていてもよい。単語TwとテンプレートTtをキーワードごとに分類したデータベースがあり、テキスト生成装置1はそのデータベースから単語TwとテンプレートTtをダウンロードし、テキストを生成してもよい。生成されたテキストをダウンロードしてもよい。
なお、本発明の実施例における各部は、専用のハードウェアにより実現されるものであってもよく、また、メモリおよびマイクロプロセッサにより実現させるものであってもよい。
なお、本発明の実施例における制御部15は、メモリおよびCPU(中央演算装置)により構成され、制御部15の機能を実現するためのプログラムをメモリにロードして実行することによりその機能を実現させるものであってもよい。
また、制御部15の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、制御部15による処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。

Claims (16)

  1. 複数のデータから単語を抽出する単語抽出部と、
    前記単語抽出部で抽出された前記単語と前記複数のデータとに基づいてテンプレートを生成するテンプレート生成部と、
    前記単語抽出部で抽出された前記単語と前記テンプレート生成部で生成された前記テンプレートと画像とに基づいてテキストを生成するテキスト生成部と、
    前記テキスト生成部で生成された前記テキストを前記画像に関連付けるテキスト関連付部と、を備える
    ことを特徴とするテキスト生成装置。
  2. 前記テンプレート生成部は、単語を挿入することでテキストとなるテンプレートを生成する
    ことを特徴とする請求項1に記載のテキスト生成装置。
  3. 前記単語抽出部で抽出された前記単語と前記テンプレート生成部で生成された前記テンプレートとを記憶する記憶部を備え、
    前記テキスト生成部は、前記記憶部に記憶された、前記単語と前記テンプレートとを前記画像に基づいて少なくとも1つずつ取得してテキストを生成する
    ことを特徴とする請求項1から2に記載のテキスト生成装置。
  4. 前記複数のデータは、複数のキーワードごとに分類されており、
    前記単語抽出部は、前記複数のキーワードごとに分類された前記複数のデータから、前記キーワードごとに少なくとも1つずつ単語を抽出し、
    前記テンプレート生成部は、前記キーワードごとに分類された前記複数のデータと、前記キーワードごとに抽出された前記単語とに基づいて、前記キーワードごとにテンプレートを生成する
    ことを特徴とする請求項1から3に記載のテキスト生成装置。
  5. 前記画像に対応する前記キーワードを判定するキーワード判定部を備え、
    前記テキスト生成部は、前記キーワード判定部によって判定された前記キーワードに分類された、前記単語と前記テンプレートとに基づいてテキストを生成する
    ことを特徴とする請求項4に記載のテキスト生成装置。
  6. 前記単語抽出部は、
    前記複数のデータを単語に分割する単語分割部と、
    前記単語分割部で分割された前記単語から1つを選択する第1処理部と、
    前記複数のキーワードから1つを選択する第2処理部と、
    前記第1処理部で選択された前記単語が前記第2処理部で選択された前記キーワードに分類された前記複数のデータに含まれている数に基づいて前記第1処理部で選択された前記単語の重要度を計算する第3処理部と、
    前記第1処理部で選択された前記単語を含むデータが分類されている前記キーワードの数に基づいて前記第1処理部で選択された前記単語の前記重要度を計算する第4処理部と、前記第3処理部と前記第4処理部とに基づいて、前記重要度が高い単語を前記キーワードごとに抽出する第5処理部と、を備える
    ことを特徴とする請求項4から5に記載のテキスト生成装置。
  7. 前記テンプレート生成部は、前記複数のデータのうち前記単語抽出部で抽出された前記単語を含むデータを取得し、取得された前記データに含まれる前記単語を単語挿入部分に置き換えることでテンプレートを生成し、
    前記テキスト生成部は、前記画像に基づいて、前記テンプレートの前記単語挿入部分に前記単語を挿入することでテキストを生成する
    ことを特徴とする請求項1から6に記載のテキスト生成装置。
  8. 前記単語分割部で分割された前記単語の品詞を判定する品詞判定部を備え、
    前記単語抽出部は、前記品詞判定部で判定された前記品詞に基づいて単語を抽出する
    ことを特徴とする請求項6に記載のテキスト生成装置。
  9. 前記テンプレートは、単語を挿入する単語挿入部分を有しており、
    前記テキスト生成部は、
    前記テンプレートの前記単語挿入部分の品詞を判定するテンプレート品詞判定部と、
    前記テンプレート品詞判定部で判定された前記単語挿入部分の品詞と一致する前記単語抽出部で抽出された前記単語を取得する単語取得部と、
    前記単語取得部で取得された前記単語を前記単語挿入部分へ挿入してテキストを生成する単語挿入部と、を備える
    ことを特徴とする請求項8に記載のテキスト生成装置。
  10. 前記複数のデータを記憶する外部記憶装置と通信を行う通信部と、
    前記通信部を介して、前記外部記憶装置から前記複数のデータを取得し、前記記憶部に前記複数のデータを記憶させる制御を行う制御部と、を備える
    ことを特徴とする請求項3に記載のテキスト生成装置。
  11. 前記複数のデータのうち、テキスト生成に使用するデータを選択するデータ選択部を備え、
    前記単語抽出部は、前記データ選択部で選択された前記データから単語を抽出する、
    ことを特徴とする請求項1から10に記載のテキスト生成装置。
  12. 前記データは識別情報を有しており、
    前記データ選択部は、前記識別情報と前記画像とに基づいて前記データを選択する
    ことを特徴とする請求項11に記載のテキスト生成装置。
  13. 複数のデータから単語を抽出する単語抽出方法と、
    前記単語抽出部で抽出された前記単語と前記複数のデータとに基づいてテンプレートを生成するテンプレート生成方法と、
    前記単語抽出部で抽出された前記単語と前記テンプレート生成部で生成された前記テンプレートと画像とに基づいてテキストを生成するテキスト生成方法と、
    前記テキスト生成部で生成された前記テキストを前記画像に関連付けるテキスト関連付方法と、を備える
    ことを特徴とするテキスト生成方法。
  14. 複数のデータから単語を抽出する単語抽出ステップと、
    前記単語抽出部で抽出された前記単語と前記複数のデータとに基づいてテンプレートを生成するテンプレート生成ステップと、
    前記単語抽出部で抽出された前記単語と前記テンプレート生成部で生成された前記テンプレートと画像とに基づいてテキストを生成するテキスト生成ステップと、
    前記テキスト生成部で生成された前記テキストを前記画像に関連付けるテキスト関連付ステップと、を備える
    ことを特徴とするプログラム。
  15. 複数のキーワードごとに分類された複数のデータから、前記キーワードごとに単語を抽出
    する単語抽出部と、
    前記単語抽出部で前記キーワードごとに抽出された前記単語と前記キーワードごとに分類された前記複数のデータとに基づいて、前記キーワードごとにテンプレートを生成するテンプレート生成部と、
    前記単語抽出部で前記キーワードごとに抽出された前記単語と前記テンプレート生成部で前記キーワードごとに生成された前記テンプレートと前記キーワードとに基づいて、前記キーワードごとにテキストを生成するテキスト生成部と、を備える
    ことを特徴とするテキスト生成装置。
  16. 前記キーワードは、時間または場所または画像に関連することを特徴とする
    請求項15に記載のテキスト生成装置。
JP2014056435A 2014-03-19 2014-03-19 テキスト生成装置、テキスト生成プログラム及びテキスト生成方法 Pending JP2015179399A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014056435A JP2015179399A (ja) 2014-03-19 2014-03-19 テキスト生成装置、テキスト生成プログラム及びテキスト生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014056435A JP2015179399A (ja) 2014-03-19 2014-03-19 テキスト生成装置、テキスト生成プログラム及びテキスト生成方法

Publications (1)

Publication Number Publication Date
JP2015179399A true JP2015179399A (ja) 2015-10-08

Family

ID=54263397

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014056435A Pending JP2015179399A (ja) 2014-03-19 2014-03-19 テキスト生成装置、テキスト生成プログラム及びテキスト生成方法

Country Status (1)

Country Link
JP (1) JP2015179399A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018503145A (ja) * 2015-11-17 2018-02-01 小米科技有限責任公司Xiaomi Inc. 情報テンプレートをマイニングする方法、その装置、プログラム、及び記録媒体
JP2020135799A (ja) * 2019-02-26 2020-08-31 セコム株式会社 見守りシステム、見守り方法及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018503145A (ja) * 2015-11-17 2018-02-01 小米科技有限責任公司Xiaomi Inc. 情報テンプレートをマイニングする方法、その装置、プログラム、及び記録媒体
US10180976B2 (en) 2015-11-17 2019-01-15 Xiaomi Inc. Method and device for mining an information template
JP2020135799A (ja) * 2019-02-26 2020-08-31 セコム株式会社 見守りシステム、見守り方法及びプログラム
JP7200003B2 (ja) 2019-02-26 2023-01-06 セコム株式会社 見守りシステム、見守り方法及びプログラム

Similar Documents

Publication Publication Date Title
US11762915B2 (en) Multi-modal virtual experiences of distributed content
WO2019100319A1 (en) Providing a response in a session
US20180268307A1 (en) Analysis device, analysis method, and computer readable storage medium
JP6569183B2 (ja) 情報処理装置、方法及びプログラム
CN112464115A (zh) 一种信息展示的方法、装置以及计算机存储介质
CN112689189A (zh) 一种视频展示、生成方法及装置
US20160140389A1 (en) Information extraction supporting apparatus and method
CN112069326B (zh) 知识图谱的构建方法、装置、电子设备及存储介质
KR20200046523A (ko) 인공지능 기반의 자동 로고생성 시스템 및 이를 이용한 로고생성 서비스 방법
JP6680026B2 (ja) 情報処理装置及びプログラム
CN110414001B (zh) 语句生成方法和装置、存储介质及电子装置
US9058328B2 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
CN113536172A (zh) 一种百科信息展示的方法、装置及计算机存储介质
CN114372160A (zh) 一种搜索请求处理方法、装置、计算机设备及存储介质
JP7315321B2 (ja) 生成装置、生成方法および生成プログラム
Hiramoto et al. Building a body of followers: Neoliberalism and online discourse of fitness and masculinity
US11651280B2 (en) Recording medium, information processing system, and information processing method
JP2015179399A (ja) テキスト生成装置、テキスト生成プログラム及びテキスト生成方法
KR20160013537A (ko) 감정표현 콘텐츠를 자동으로 생성하고 분류하는 시스템 및 그 방법
JP6043460B2 (ja) データ分析システム、データ分析方法、およびデータ分析プログラム
Kim et al. # ShoutYourAbortion on Instagram: exploring the visual representation of hashtag movement and the public’s responses
KR101786823B1 (ko) Sns의 프로필 사진 제공 방법
JP6836147B2 (ja) 画像関連付け装置、画像検索装置、画像検索システム及びプログラム
JP5134882B2 (ja) コンテンツ管理装置
Roldán-Robles et al. A conceptual architecture for content analysis about abortion using the Twitter platform