JP2015146550A - 情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
JP2015146550A
JP2015146550A JP2014019360A JP2014019360A JP2015146550A JP 2015146550 A JP2015146550 A JP 2015146550A JP 2014019360 A JP2014019360 A JP 2014019360A JP 2014019360 A JP2014019360 A JP 2014019360A JP 2015146550 A JP2015146550 A JP 2015146550A
Authority
JP
Japan
Prior art keywords
information
content
user
display
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014019360A
Other languages
English (en)
Inventor
淳也 小野
Onojunya
淳也 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2014019360A priority Critical patent/JP2015146550A/ja
Priority to US14/605,033 priority patent/US9697632B2/en
Publication of JP2015146550A publication Critical patent/JP2015146550A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Studio Circuits (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)

Abstract

【課題】コンテンツと当該コンテンツに関連付けられたタグ情報との関係性を理解しやすく表示させることが可能な、情報処理装置、情報処理方法、及びプログラムを提案する。
【解決手段】コンテンツにおいてタグ情報が関連付けられている第1の点と前記コンテンツにおけるユーザにより指定された第2の点との間の指示関係を示す表示を前記コンテンツに重畳して表示させ、前記タグ情報に含まれるユーザの入力情報を出力させる出力制御部、を備える、情報処理装置。
【選択図】図2

Description

本開示は、情報処理装置、情報処理方法、及びプログラムに関する。
従来、動画像などのコンテンツに対して、情報を付加して表示したり、音声出力する技術が開発されている。
例えば、特許文献1には、撮像手段による撮像中にユーザの音声を認識し、認識された音声から単語を抽出し、そして、音声が認識された時点の画像フレームに対して、抽出された単語をタグ情報として付加する技術が開示されている。
特開2010−021638号公報
しかしながら、特許文献1に記載の技術では、コンテンツと当該コンテンツに関連付けられたタグ情報との関係性をユーザが理解し難い。例えば、特許文献1に記載の技術では、画像フレームに付加されたタグ情報を画像フレームとともに表示させる場合には、タグ情報は、画像フレームにおいて独立した点として表示される。このため、タグ情報が例えば人の音声のような、何らかの関係性を前提とする情報を含む場合には、画像フレームの閲覧者は、タグ情報が画像フレームにおけるどの位置と関係を有するのかを理解し難い。
そこで、本開示では、コンテンツと当該コンテンツに関連付けられたタグ情報との関係性を理解しやすく表示させることが可能な、新規かつ改良された情報処理装置、情報処理方法、及びプログラムを提案する。
上記課題を解決するために、本開示のある観点によれば、コンテンツにおいてタグ情報が関連付けられている第1の点と前記コンテンツにおけるユーザにより指定された第2の点との間の指示関係を示す表示を前記コンテンツに重畳して表示させ、前記タグ情報に含まれるユーザの入力情報を出力させる出力制御部、を備える、情報処理装置が提供される。
また、上記課題を解決するために、本開示の別の観点によれば、コンテンツにおいてタグ情報が関連付けられている第1の点と前記コンテンツにおけるユーザにより指定された第2の点との間の指示関係を示す表示を前記コンテンツに重畳して表示させるステップと、前記タグ情報に含まれるユーザの入力情報をプロセッサにより出力させるステップと、
を備える、情報処理方法が提供される。
また、上記課題を解決するために、本開示の別の観点によれば、コンピュータを、コンテンツにおいてタグ情報が関連付けられている第1の点と前記コンテンツにおけるユーザにより指定された第2の点との間の指示関係を示す表示を前記コンテンツに重畳して表示させ、前記タグ情報に含まれるユーザの入力情報を出力させる出力制御部、として機能させるためのプログラムが提供される。
以上説明したように本開示によれば、コンテンツと当該コンテンツに関連付けられたタグ情報との関係性を理解しやすく表示させることができる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
本開示の実施形態による情報処理システムの基本構成を示した説明図である。 同実施形態による静止画像におけるタグ指示表示の表示例を示した説明図である。 同実施形態による情報処理装置10のハードウェア構成を示した説明図である。 同実施形態による情報処理装置10の構成を示した機能ブロック図である。 同実施形態による静止画像におけるタグ指示表示の表示例を示した説明図である。 同実施形態による動画像におけるタグ指示表示の表示例を示した説明図である。 同実施形態による動画像におけるタグ指示表示の表示例を示した説明図である。 同実施形態による動画像におけるタグ指示表示の表示例を示した説明図である。 同実施形態による二枚の静止画像におけるタグ指示表示の表示例を示した説明図である。 同実施形態によるタグ指示表示の形状の変形の例を示した説明図である。 同実施形態によるタグ指示表示の表示態様の動的変化の例を示した説明図である。 同実施形態による複数のタグ指示表示の表示例を示した説明図である。 同実施形態によるタグごとに算出された重要度の一例を示したグラフである。 同実施形態によるユーザの入力情報の強調表示の例を示した説明図である。 同実施形態による関連情報の表示例を示した説明図である。 同実施形態による動作の一部を示したフローチャートである。 同実施形態による動作の一部を示したフローチャートである。 本開示の変形例による複数のユーザによるタグ付けの例を示した説明図である。 同変形例によるスロットテーブルの構成例を示した説明図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、以下に示す項目順序に従って当該「発明を実施するための形態」を説明する。
1.情報処理システムの基本構成
1−1.情報処理装置10
1−2.通信網12
1−3.サーバ20
2.実施形態の詳細な説明
2−1.構成
2−2.動作
2−3.効果
3.変形例
<<1.情報処理システムの基本構成>>
本開示は、一例として「2.実施形態の詳細な説明」において詳細に説明するように、多様な形態で実施され得る。最初に、本実施形態による情報処理システムの基本構成について図1を参照して説明する。
図1に示したように、本実施形態による情報処理システムは、情報処理装置10、通信網12およびサーバ20を含む。
<1−1.情報処理装置10>
情報処理装置10は、例えば静止画像や動画像などのコンテンツを表示画面に表示可能な装置である。例えば、情報処理装置10は、PC(Personal Computer)、スマートフォンなどの携帯電話、タブレット型端末、デジタルカメラ、ウェアラブルコンピュータ、ゲーム機などであってもよい。
また、情報処理装置10は、例えばユーザにより音声やテキストなどの入力情報が入力された場合に、当該入力情報を含むタグ情報をコンテンツ内のいずれかの位置(以下、タグ付け位置とも称する)に関連付けて生成することが可能である。ここで、タグ情報は、例えばユーザの音声やテキストなどの入力情報、タグ情報がコンテンツに関連付けられた時刻、タグ付け位置、後述するコンテンツにおいてタグ情報が指し示す位置としてユーザにより指定された位置(以下、指示位置とも称する)、または、後述するタグ情報の重要度などを含む。なお、タグ付け位置は、本開示における第1の点の一例であり、また、指示位置は、本開示における第2の点の一例である。
例えば図2は、コンテンツの一例である静止画像30に対してタグ情報が関連付けられている例を示した説明図である。図2に示した例では、ユーザにより「ありがとう」という音声が情報処理装置10に対して入力され、かつ、「From」と記載された位置がユーザによりタグ付け位置300として指定された例を示している。この場合、情報処理装置10は、入力された音声を含むタグ情報をタグ付け位置300に関連付けて生成することが可能である。
なお、図2における「From」および「To」というテキストは、説明の便宜上記載したものであり、実際には表示されない。同様に、例えば図5〜図12等に関しても、「From」または「To」というテキストが記載されているが、実際には表示されない。
[1−1−1.ハードウェア構成]
なお、情報処理装置10は、例えば図3に示すようなハードウェア構成を有する。図3に示したように、情報処理装置10は、CPU(Central Processing Unit)150、ROM(Read Only Memory)152、RAM(Random Access Memory)154、内部バス156、インターフェース158、入力装置160、出力装置162、ストレージ装置164、および通信装置166を備える。
(1−1−1−1.CPU150)
CPU150は、演算処理装置および制御装置として機能し、各種プログラムに従って情報処理装置10内の動作全般を制御する。また、CPU150は、情報処理装置10において制御部100の機能を実現する。なお、CPU150は、マイクロプロセッサなどのプロセッサにより構成される。
(1−1−1−2.ROM152)
ROM152は、CPU150が使用するプログラムや演算パラメータなどの制御用データなどを記憶する。
(1−1−1−3.RAM154)
RAM154は、例えば、CPU150により実行されるプログラムなどを一時的に記憶する。
(1−1−1−4.インターフェース158)
インターフェース158は、入力装置160、出力装置162、ストレージ装置164、および通信装置166を、内部バス156と接続する。例えば出力装置162は、このインターフェース158および内部バス156を介して、CPU150との間でデータをやり取りする。
(1−1−1−5.入力装置160)
入力装置160は、例えば、後述する入力部134の一例として構成される。この入力装置160は、例えばタッチパネル、ボタン、マイクロフォン、およびスイッチなどユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、CPU150に出力する入力制御回路などから構成されている。ユーザは、入力装置160を操作することにより、情報処理装置10に対して各種のデータを入力したり、処理動作を指示したりすることができる。
(1−1−1−6.出力装置162)
出力装置162は、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)装置、OLED(Organic Light Emitting Diode)装置およびランプなどの表示装置を含む。この表示装置は、CPU150により生成された画像などを表示する。
さらに、出力装置162は、スピーカーなどの音声出力装置を含む。この音声出力装置は、音声データ等を音声に変換して出力する。
(1−1−1−7.ストレージ装置164)
ストレージ装置164は、データ格納用の装置である。ストレージ装置164は、例えば、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置、または記憶媒体に記録されたデータを削除する削除装置などを含む。
(1−1−1−8.通信装置166)
通信装置166は、例えば公衆網やインターネットなどの通信網に接続するための通信デバイス等で構成された通信インターフェースである。また、通信装置166は、無線LAN対応通信装置、LTE(Long Term Evolution)対応通信装置、または有線による通信を行うワイヤー通信装置であってもよい。
<1−2.通信網12>
通信網12は、通信網12に接続されている装置から送信される情報の無線、または有線の伝送路である。例えば、通信網12は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、WAN(Wide Area Network)などを含んでもよい。また、通信網12は、IP−VPN(Internet Protocol−Virtual Private Network)などの専用回線網を含んでもよい。
<1−3.サーバ20>
サーバ20は、図1に示したように、知識データベース22を備えた装置である。
[1−3−1.知識データベース22]
知識データベース22は、コンテンツと、情報処理装置10により生成されたタグ情報とを対応づけて管理するデータベースである。
また、知識データベース22は、ユーザ別に、例えば年齢、性別、好きなジャンル、好きな単語などを含むユーザプロファイル情報を記録している。
また、知識データベース22は、単語ごとの強調度が記録されたマッピングテーブルを保持している。このマッピングテーブルでは、例えば各単語の意味に応じて強調度が記録されている。一例として、「とても」という副詞は強調度が高く、また、「あまり」という副詞は強調度が低く記録されている。また、「きれい」という形容詞はポジティブな意味を有するので、強調度が高く記録されており、また、「汚い」という形容詞はネガティブな意味を有するので、強調度が低く記録されている。但し、上記の例に限定されず、強調度の高低はそれぞれ逆になるように記録されていてもよい。
また、マッピングテーブルでは、さらにユーザ別に各単語の強調度が記録されていることも可能である。例えば、マッピングテーブルは、各ユーザのユーザプロファイル情報に基づいて、各単語の強調度が決定されるように構成されていてもよい。一例として、ユーザプロファイル情報においてユーザの趣味が「登山」と記録されている場合には、知識データベース22では、当該ユーザに関して「山」という単語の強調度が高くなるように記録されていてもよい。
なお、知識データベース22では、データをsubject−predicate−valueという3つ組の形式で構造化して管理している。例えば、知識データベース22では、「野球−意味概念−スポーツ」、「太郎−家族−小野家」、「太郎−友達−次郎」などのような形式でデータを管理する。このため、サーバ20は、例えばある単語に関連する単語や、単語の意味概念などを知識データベース22から抽出することができる。
以上、本実施形態による情報処理システムの基本構成について説明した。上述した情報処理システムにおいて、本実施形態による情報処理装置10は、コンテンツと当該コンテンツに関連付けられたタグ情報との関係性を理解しやすく表示させることが可能である。以下、このような本実施形態について順次詳細に説明する。
<<2.実施形態の詳細な説明>>
<2−1.構成>
まず、本実施形態による情報処理装置10の構成について詳細に説明する。図4は、本実施形態による情報処理装置10の構成を示した機能ブロック図である。図4に示したように、情報処理装置10は、制御部100、通信部130、出力部132、および入力部134を有する。
[2−1−1.制御部100]
制御部100は、情報処理装置10に内蔵されるCPU150、RAM154などのハードウェアを用いて、情報処理装置10の動作を全般的に制御する。また、図4に示したように、制御部100は、操作認識部102、タグ管理部104、解析部106、出力制御部112、および検索処理部120を有する。
[2−1−2.操作認識部102]
操作認識部102は、後述する入力部134が受け付けた、表示画面に対するユーザの操作内容を認識する。例えば、操作認識部102は、表示画面に対してユーザによりタッチ操作がなされた場合には、ユーザによりタッチされた位置がユーザにより選択されたことを認識する。
[2−1−3.タグ管理部104]
タグ管理部104は、コンテンツに関連づけてタグ情報を生成したり、タグ情報を消去するなど、タグ情報を管理する。例えば、タグ管理部104は、入力部134に対して入力されたユーザの音声やテキストなどの入力情報、および操作認識部102により認識された、ユーザにより指定されたタグ付け位置に基づいて、タグ情報を生成する。また、タグ管理部104は、生成したタグ情報をサーバ20へ後述する通信部130に送信させることにより、コンテンツとタグ情報とを関連付けて知識データベース22に記憶させる。
また、タグ管理部104は、図4に示したように、強調度特定部116、および重要度算出部118を有する。
[2−1−4.解析部106]
解析部106は、入力部134に対してユーザにより入力された音声やテキストなどの入力情報や、コンテンツに含まれる情報などの解析を行う。
また、解析部106は、図4に示したように、音声解析部108、言語解析部110、および関連情報解析部114を有する。
[2−1−5.音声解析部108]
音声解析部108は、入力部134に対して入力されたユーザの音声を、例えば音声認識技術などを用いてテキストに変換する。
[2−1−6.言語解析部110]
言語解析部110は、入力部134に対して入力されたテキストや、音声解析部108により変換されたテキストから複数の単語を特定する。
なお、テキストの言語が例えば日本語や中国語などの場合には、言語解析部110は、入力部134に対して入力されたテキストや、音声解析部108により変換されたテキストに対して形態素解析を行うことにより、複数の形態素を特定することも可能である。
[2−1−7.出力制御部112]
(2−1−7−1.タグ指示表示の表示制御)
出力制御部112は、コンテンツにおいてタグ情報が関連付けられているタグ付け位置と、コンテンツにおけるユーザにより指定された指示位置との間においてタグ指示表示をコンテンツに重畳して表示させる。以下、出力制御部112によるタグ指示表示の表示制御の具体的な内容について「表示制御例1」〜「表示制御例6」において説明を行う。
‐表示制御例1‐
例えば、出力制御部112は、コンテンツにおけるタグ付け位置を始点とし、コンテンツにおける指示位置を指し示す表示として、タグ指示表示を表示させることが可能である。
ここで、図2、図5、および図6を参照して、上記の機能についてより詳細に説明する。図2は、静止画像30におけるタグ指示表示の表示例を示した説明図である。なお、図2では、「From」と記載したタグ付け位置300においてタグ情報が静止画像30に関連付けられており、また、「To」と記載した位置がユーザにより指示位置302として指定されている。
図2に示したように、出力制御部112は、タグ付け位置300を始点とし、指示位置302を示す例えば三角形や矢印などの表示として、タグ指示表示304を静止画像30に重畳して表示させる。
この表示例によれば、タグ情報に含まれる「ありがとう」というメッセージが、タグ付け位置300に位置する人物画像に対応する人物から、指示位置302に位置する人物画像に対応する人物へ向けられていること、つまり、タグ情報に含まれるユーザの入力情報が誰から誰に対する情報であるかを、コンテンツの閲覧者は、容易に理解することができる。
また、図5は、静止画像30における複数のタグ指示表示の表示例を示した説明図である。図5に示したように、出力制御部112は、あるユーザのタッチ操作により指示位置302aが指定された際に、タグ付け位置300aと指示位置302aとの間においてタグ指示表示304aを静止画像30に重畳して表示させる。また、出力制御部112は、別のユーザのタッチ操作により指示位置302bが指定された際に、タグ付け位置300bと指示位置302bとの間においてタグ指示表示304bを静止画像30に重畳して表示させる。
この表示例によれば、タグ付け位置300aに位置する人物画像に対応する人物と、タグ付け位置300bに位置する人物画像に対応する人物との間でのメッセージのやりとりをコンテンツにおいて表現することができる。
なお、出力制御部112は、タグ付けするユーザに応じて、タグ指示表示の例えば表示色などの表示態様を変化させることも可能である。例えば、図5に示した例において、タグ付け位置300aにタグ情報を関連付けたユーザとタグ付け位置300bにタグ情報を関連付けたユーザとが異なる場合には、出力制御部112は、タグ指示表示304aとタグ指示表示304bとをそれぞれ異なる色で表示させてもよい。
また、図6は、動画像に含まれる一枚のフレーム画像30におけるタグ指示表示の表示例を示した説明図である。なお、図6では、動画像の一時停止時におけるフレーム画像30に対して、ユーザによりタグ情報がタグ付け位置300に関連づけられ、また、同じフレーム画像30内にユーザにより指示位置302が指定された例を示している。
図6に示したように、出力制御部112は、図2と同様に、ユーザにより指示位置302が指定された際に、タグ付け位置300から指示位置302を指し示す表示として、タグ指示表示304をフレーム画像30に重畳して表示させる。
‐表示制御例2‐
また、コンテンツが動画像である場合に、出力制御部112は、コンテンツにおいてタグ情報が関連付けられているフレーム画像(以下、タグ付けフレーム画像とも称する)と、当該フレーム画像よりも後のフレーム画像であり、ユーザにより指示位置が設定されたフレーム画像(以下、指示位置設定フレーム画像とも称する)とにおいて、タグ指示表示304を同じ位置に表示させることが可能である。ここで、タグ付けフレーム画像は、本開示における第1のフレーム画像の一例であり、また、指示位置設定フレーム画像は、本開示における第2のフレーム画像の一例である。
より具体的には、出力制御部112は、タグ付けフレーム画像から指示位置設定フレーム画像までに位置する各フレーム画像において、タグ付けフレーム画像におけるタグ付け位置と同一の位置と、指示位置設定フレーム画像における指示位置と同一の位置との間にタグ指示表示304を表示させることが可能である。
ここで、図7を参照して、上記の機能についてより詳細に説明する。図7は、動画像におけるタグ指示表示の別の表示例を示した説明図である。図7に示した例では、フレーム画像30a、フレーム画像30b、およびフレーム画像30cは、それぞれ同一の動画像内の「00:00:00」におけるフレーム画像、「00:00:10」におけるフレーム画像、および「00:00:03」におけるフレーム画像を示している。また、図7では、フレーム画像30aは、タグ付け位置300においてタグ情報が関連付けられているフレーム画像(タグ付けフレーム画像)であり、また、フレーム画像30bは、ユーザにより指示位置302が設定されたフレーム画像(指示位置設定フレーム画像)である。
図7に示したように、フレーム画像30c、つまりフレーム画像30aとフレーム画像30bとの間に位置するフレーム画像において、出力制御部112は、フレーム画像30aにおけるタグ付け位置300と同一の位置と、フレーム画像30bにおける指示位置302と同一の位置との間にタグ指示表示304を表示させる。
この表示例によれば、タグ付けフレーム画像から指示位置設定フレーム画像までにおいて固定的にタグ指示表示304が表示されるので、タグ付けフレーム画像に位置しているオブジェクトから、指示位置設定フレーム画像に位置しているオブジェクトへの指示関係を、動画像の閲覧者に理解させることが可能となる。
‐表示制御例3‐
また、コンテンツが動画像である場合に、出力制御部112は、後述する関連情報解析部114によりタグ付け位置に位置するオブジェクト(以下、タグ付けオブジェクトとも称する)、および指示位置に位置するオブジェクト(以下、指示オブジェクトとも称する)が認識された場合には、コンテンツにおけるタグ付けオブジェクトまたは指示オブジェクトの表示位置の移動に応じて、タグ指示表示の表示位置または長さを変化させることが可能である。
ここで、図8を参照して、上記の機能についてより詳細に説明する。図8は、動画像におけるタグ指示表示の別の表示例を示した説明図である。なお、図8では、図7と同様に、フレーム画像30a、フレーム画像30b、およびフレーム画像30cは、それぞれ同一の動画像内の「00:00:00」におけるフレーム画像、「00:00:10」におけるフレーム画像、および「00:00:03」におけるフレーム画像を示している。また、図8では、フレーム画像30aがタグ付けフレーム画像であり、タグ付け位置300に位置する人物画像が関連情報解析部114により認識済みであることを前提としている。また、フレーム画像30bが指示位置設定フレーム画像であり、指示位置302に位置する人物画像が関連情報解析部114により認識済みであることを前提としている。
図8に示したように、フレーム画像30aとフレーム画像30bとの間に位置するフレーム画像30cでは、出力制御部112は、タグ付けオブジェクトから指示オブジェクトへ向けてタグ指示表示を表示させる。
この表示例によれば、タグ付けオブジェクトまたは指示オブジェクトの表示位置の移動に追随しながらタグ指示表示の表示位置や長さが変化されるので、タグ付けオブジェクトと指示オブジェクトとの間の指示関係を、コンテンツの閲覧者はさらに容易に理解することができる。
‐表示制御例4‐
また、出力制御部112は、例えば複数の静止画像が連動して表示されるコンテンツにおいて、タグ情報が関連付けられている静止画像(以下、タグ付け画像とも称する)と、ユーザにより指示位置が設定された静止画像(以下、指示位置設定画像とも称する)とに、タグ指示表示304を表示させることが可能である。
ここで、図9を参照して、上記の機能についてより詳細に説明する。図9は、2枚の静止画像を横に並べて表示させるコンテンツにおけるタグ指示表示の表示例を示した説明図である。図9に示した例では、静止画像30aは、タグ付け位置300においてタグ情報が関連付けられている静止画像(タグ付け画像)であり、また、静止画像30bは、ユーザにより指示位置302が設定された静止画像(指示位置設定画像)である。
図9に示したように、出力制御部112は、表示画面において静止画像30aにおけるタグ付け位置300と、静止画像30bにおける指示位置302との間にタグ指示表示304を表示させる。より具体的には、出力制御部112は、静止画像30aの内部ではタグ指示表示の一部304aを表示させ、また、静止画像30bの内部ではタグ指示表示の残りの一部304bを表示させる。
この表示例によれば、静止画像30aにおけるタグ情報に含まれる「20年後は小さい」というメッセージが、静止画像30bに表示されている山の画像へ向けられていること、つまり、タグ付け画像に関連付けられたタグ情報と、指示位置設定画像における指示位置との間での指示関係を、コンテンツの閲覧者に理解させることができる。
‐表示制御例5‐
また、出力制御部112は、操作認識部102によりタグ指示表示の形状を変化させる操作が認識された場合には、認識されたユーザの指示に沿った形状にタグ指示表示を変形させることが可能である。
ここで、図10を参照して、上記の機能についてより詳細に説明する。図10は、タグ指示表示を変形して表示させる表示例を示した説明図である。なお、図10における左図は、コンテンツ30において指示位置302aがユーザにより指示された際の、タグ指示表示304aが表示された例を示しており、また、右図は、左図に示したタグ指示表示304aがユーザの操作に沿って変形された場合の表示例を示している。
図10に示したように、出力制御部112は、例えば表示画面に対するタッチ操作により、タグ指示表示304aからタグ指示表示304bへ変化させるように、ユーザの指示に沿ってタグ指示表示304の形状を変形させる。
この表示例によれば、タグ付けするユーザは、図10において「ケーキの画像」と重なるようにタグ指示表示304を変形させることにより、タグ情報に含まれる「お誕生日おめでとう」というメッセージをより強調して、コンテンツの閲覧者に伝えることが可能となる。
‐表示制御例6‐
また、出力制御部112は、タグ情報に含まれるユーザの入力情報の出力に応じて、タグ指示表示の表示態様を例えばタグ付け位置から指示位置へ向けて動的に変化させることが可能である。例えば、出力制御部112は、タグ付け位置から指示位置までの距離および入力音声の録音時間に基づいて、入力音声の出力経過時間に応じた表示態様でタグ指示表示を表示させる。
ここで、図11を参照して、上記の機能についてより詳細に説明する。図11は、タグ情報に含まれるユーザの入力情報が出力されている際の、時間経過に伴うタグ指示表示の表示変化を示した説明図である。なお、図11における左図は、「ありがとう」という入力音声のうち「あり」という音までが出力された時点におけるタグ指示表示の表示例を示しており、また、右図は、「ありがとう」という入力音声のうち「ありがと」という音までが出力された時点におけるタグ指示表示の表示例を示している。
図11において網掛けで示したように、出力制御部112は、入力音声の出力の進捗に応じて、タグ指示表示304aからタグ指示表示304bのように、最大の長さ、つまりタグ指示位置300から指示位置302までの長さに対する表示割合を徐々に増加させながら、タグ指示表示304を表示させる。
この表示例によれば、コンテンツの閲覧者は、入力情報が出力されている際に入力情報の出力の進捗状況や、出力総時間を把握することができる。
(2−1−7−2.ユーザの入力情報の出力制御)
また、出力制御部112は、コンテンツに関連付けられているタグ情報に含まれるユーザの入力情報を出力させる。以下、入力情報の出力制御の具体的な内容について「出力制御例1」〜「出力制御例4」において、説明を行う。
‐出力制御例1‐
例えば、出力制御部112は、コンテンツの再生時においてタグ情報がユーザにより選択された場合に、選択されたタグ情報に含まれるユーザの入力情報を出力させることが可能である。
図5に示した例では、タグ付け位置300aに関連付けられているタグ情報がユーザにより選択された場合には、出力制御部112は、選択されたタグ情報に含まれる「ありがとう」というユーザの入力音声を出力する。また、タグ付け位置300bに関連付けられているタグ情報がユーザにより選択された場合には、出力制御部112は、選択されたタグ情報に含まれる「こちらこそ」というユーザの入力音声を出力する。
‐変形例1‐
なお、ユーザの入力情報が(テキストではなく)ユーザの音声である場合には、出力制御部112は、ユーザの入力情報を、タグ情報の関連時におけるユーザの音声のままで出力させてもよいし、例えば知識データベース22に記録されている直近のユーザの音声で出力させてもよい。または、出力制御部112は、例えば知識データベース22に記録されている俳優の音声などの音声データや効果音などによりユーザの入力情報を出力させてもよい。
‐変形例2‐
また、出力制御部112は、タグ情報を再生するユーザの年齢をサーバ20に問い合わせることにより、入力音声の読み上げ速度(出力速度)を当該ユーザの年齢に応じて変化させることも可能である。例えば、出力制御部112は、ユーザの年齢が所定の年齢より高い場合には、入力音声の読み上げ速度を遅くさせる。
あるいは、出力制御部112は、タグ情報を再生するユーザが設定した速度で入力音声を出力させることも可能である。
‐変形例3‐
また、図5に示したように、出力制御部112は、ユーザの入力音声の出力と同時に、音声解析部108によりユーザの入力音声から変換されたテキストを含む例えば吹き出しの形状の入力情報表示306をコンテンツに重畳して表示させることも可能である。なお、変形例として、出力制御部112は、入力情報表示306を表示させる一方、ユーザの入力音声は出力させないことも可能である。
‐出力制御例2‐
また、出力制御部112は、複数のタグ情報がコンテンツに関連付けられた時刻の順で、複数のタグ情報の各々に含まれるユーザの入力情報を出力させることが可能である。
ここで、図12を参照して、上記の機能についてより詳細に説明する。図12は、コンテンツ30に複数のタグ情報が関連づけられている場合におけるユーザの入力情報の出力例を示した説明図である。なお、図12では、左図のタグ付け位置300aにタグ情報が関連付けられた時刻の方が、右図のタグ付け位置300bにタグ情報が関連付けられた時刻よりも早い場合における出力例を示している。
図12に示したように、出力制御部112は、まず、タグ情報が関連付けられた時刻がより早いタグ付け位置300aに関連付けられているタグ情報に含まれる入力音声を出力させ、その後に、タグ付け位置300bに関連付けられているタグ情報に含まれる入力音声を出力させる。
なお、図12に示したように、出力制御部112は、タグ情報に含まれるユーザの入力音声の出力の順に沿って、タグ指示表示304aを表示させた後にタグ指示表示304bを表示させるというように、タグ指示表示304をスライドショーのように切り替えて表示させることも可能である。
‐出力制御例3‐
また、出力制御部112は、後述する重要度算出部118により算出されたタグ情報の重要度が所定の閾値以上であるタグ情報を抽出し、そして、抽出されたタグ情報に含まれるユーザの入力情報を出力させることが可能である。
ここで、図13を参照して、上記の機能についてより詳細に説明する。図13は、コンテンツに複数のタグ情報が関連づけられている場合において、重要度算出部118により算出されたタグ情報の重要度をタグ情報ごとに示したグラフである。
図13に示したように、例えば、出力制御部112は、算出された重要度が閾値以上である例えば「タグB」および「タグC」を抽出し、そして、抽出されたタグ情報に含まれるユーザの入力情報を出力させる。
この出力例によれば、例えばコンテンツにおいて多数のタグ情報が関連付けられている場合において、コンテンツの閲覧者は、多数のタグ情報のうち重要度の高いタグ情報のみを短時間で見たり、聞くことができる。
‐変形例‐
なお、変形例として、コンテンツが動画像等であり、かつ、編集後の総時間数がユーザにより指定された場合には、出力制御部112は、コンテンツに関連付けられている全てのタグ情報から抽出されるタグ情報に対応するコンテンツの再生時間が、ユーザにより指定された時間数に適合するように、閾値を自動的に設定することも可能である。
但し、抽出されたタグ情報に対応するコンテンツの部分を接続してコンテンツを再生させた場合には、閲覧者にとって不自然に接続される可能性がある。このため、出力制御部112は、閲覧者に自然に見えるように、コンテンツに含まれる例えば画像情報、音声情報、カメラ情報などに基づいて、接続部分の変化ができるだけ小さくなるように、(抽出されたタグ情報に対応する部分の)コンテンツを切り出すことも可能である。
‐出力制御例4‐
また、出力制御部112は、タグ情報に含まれるユーザの入力情報から言語解析部110により特定された複数の単語に関して、後述する強調度特定部116により特定された各単語の強調度に応じた表示態様で各単語をコンテンツに重畳して表示させることが可能である。
ここで、図14を参照して、上記の機能についてより詳細に説明する。図14は、ユーザの音声から言語解析部110により特定された複数の単語の強調表示の例を示した説明図である。図14に示したように、例えば、出力制御部112は、「山」という単語や「きれい」という単語の方が「この」という単語よりもフォントサイズが大きくなるように、強調度特定部116により特定された強調度が高い単語ほどフォントサイズを大きく表示させる。
この表示例によれば、例えばタグ付けしたユーザにとって関心の高い単語やポジティブな意味の単語がより強調して表示される。このため、コンテンツの閲覧者は、タグ付けしたユーザの関心や、タグ付け当時の感動を容易に理解することができる。
なお、変形例として、出力制御部112は、タグ情報に含まれるユーザの入力音声の音声レベルに追従して、ユーザの入力音声から言語解析部110により特定された単語(または文字)を強調させて表示させることが可能である。より具体的には、出力制御部112は、タグ情報に含まれるユーザの入力音声から音声解析部108により特定される音量や周波数、および言語解析部110により特定される複数の単語に基づいて、音声の音量や周波数のレベルと、単語(または文字)とのマッピングを作成し、そして、当該マッピングに基づいて単語(または文字)を強調させて表示させることが可能である。
この変形例によれば、ユーザは、特に伝えたい、記録しておきたい部分に関して、例えば声の強弱や、声の高低を変化させて発話することにより、単語(または文字)をエフェクトさせることが可能となる。例えば、ユーザが「この山はきれい」と発話する場合において、ユーザは「山」と「きれい」を強く発話することにより、コンテンツに表示される「山」および「きれい」というテキストに関して、フォントを他のテキストよりも大きくしたり、色を他のテキストと変えたり、または、揺らす等のアニメーション等のエフェクトを加えることができる。また、ユーザが例えば感動したり、驚いた際などに「すごい」と発話した場合には、情報処理装置10は、当該音声を音声レベルからも判断して、より強調させて表示させることができるので、ユーザが発する情報をより自然な形で表現し、また、ユーザの感動をさらに明確に表現することができる。
(2−1−7−3.タグ付け位置および指示位置の表示制御)
また、出力制御部112は、タグ付け位置を示す表示、および指示位置を示す表示をコンテンツにさらに重畳して表示させることが可能である。さらに、出力制御部112は、タグ付け位置を示す表示と、指示位置を示す表示とを異なる表示態様で表示させることが可能である。例えば、出力制御部112は、タグ付け位置を示す表示を図10等に示したような星形で表示させ、指示位置を示す表示を円形で表示させるように、形状を異ならせて表示させる。または、出力制御部112は、タグ付け位置を示す表示を赤色、指示位置を示す表示を青色のように、色を異ならせて表示させる。
この表示例によれば、タグ付け位置を示す表示と指示位置を示す表示とが異なる表示態様で表示されるので、コンテンツの閲覧者は、タグ付け位置と指示位置とをさらに容易に区別することができる。特に、図5に示した入力情報表示306を表示させない場合において有効である。
(2−1−7−4.関連情報の表示制御)
また、出力制御部112は、後述する関連情報解析部114により特定された関連情報をコンテンツにさらに重畳して表示させることも可能である。例えば、出力制御部112は、後述する関連情報解析部114により特定された、タグ付け位置または指示位置に位置するオブジェクトに関する、タグ情報が関連付けられた当時の関連情報をコンテンツに重畳して表示させる。
ここで、図15を参照して、上記の機能についてより詳細に説明する。図15は、コンテンツ30にタグ情報が関連付けられた後における関連情報の表示例を示した説明図である。
図15に示したように、例えば、出力制御部112は、タグ付け位置300に位置する人物画像に関する、タグ情報の関連付け時における例えば名前や、タグ付けしたユーザとの関係性などの関連情報を示す関連情報表示欄308aをコンテンツに表示させる。また、出力制御部112は、指示位置302に位置する山の画像に関する例えば名称や、高さなどの関連情報を示す関連情報表示欄308bをコンテンツに表示させる。
なお、出力制御部112は、コンテンツの内容を阻害しないように関連情報表示欄308を表示させることも可能である。例えば、図15に示したように、出力制御部112は、人物画像における顔領域や、表示されているテキストなどと重ならないように、関連情報表示欄308をコンテンツに表示させる。
‐変形例‐
また、出力制御部112は、コンテンツの関連情報を、タグ情報に含まれる入力情報の出力時において表示させてもよいし、また、ユーザがタグ情報をコンテンツに関連付けている際に表示させてもよい。なお、後者の場合では、出力制御部112は、例えばユーザが表示画面にタッチしている位置などに、コンテンツの関連情報を表示させることが可能である。この表示例によれば、例えばコンテンツに含まれる人物画像に関する関連情報を表示させることにより、ユーザは人物画像に対応する人物を把握しながら、所望の位置にタグ情報を関連付けることが可能になる。
(2−1−7−5.検索結果の表示制御)
また、出力制御部112は、後述する検索処理部120によりコンテンツに関連付けられているタグ情報が検索された場合に、検索結果を表示画面に表示させることが可能である。例えば、出力制御部112は、検索処理部120により抽出された複数のタグ情報を、タグ情報がコンテンツに関連付けられた時刻の順に表示画面に表示させる。または、出力制御部112は、検索処理部120により抽出された複数のタグ情報を、後述する重要度算出部118により算出された重要度の高い順に表示画面に表示させる。
[2−1−8.関連情報解析部114]
関連情報解析部114は、本開示における画像認識部の一例である。関連情報解析部114は、例えばタグ付け位置や指示位置などの、コンテンツにおける特定の位置の周辺を解析することにより、関連情報を取得する。例えば、関連情報解析部114は、コンテンツにおけるタグ付け位置(または指示位置)の周辺を解析することにより、タグ付けオブジェクト(または指示オブジェクト)を認識することが可能である。
また、関連情報解析部114は、コンテンツにおける特定の位置の周辺の解析結果に基づいてサーバ20へ問い合わせを行うことにより、当該特定の位置における関連情報を取得することが可能である。例えば、図15に示した例では、関連情報解析部114は、タグ付け位置300に位置する人物画像を特定し、そして、特定した結果をサーバ20へ問い合わせることにより、関連情報表示欄308aに示したような関連情報をサーバ20から取得する。
[2−1−9.強調度特定部116]
強調度特定部116は、タグ情報に含まれるユーザの入力情報から言語解析部110により特定された複数の単語の各々に関して、例えばサーバ20に問合せを行うことにより、各単語の強調度を特定する。
[2−1−10.重要度算出部118]
重要度算出部118は、コンテンツに関連付けられているタグ情報の重要度を算出する。より具体的には、重要度算出部118は、タグ情報に含まれるユーザの入力情報から強調度特定部116により特定された各単語の強調度に基づいて、タグ情報の重要度を算出することが可能である。例えば、重要度算出部118は、ユーザの入力情報において、副詞が形容詞を修飾しているなどの、各単語の修飾・被修飾の関係に基づいて、タグ情報の重要度を算出する。一例として、ユーザの入力音声から言語解析部110により変換されたテキストが「この山はとてもきれいだ」というテキストである場合には、「とても」という副詞が「きれい」という形容詞を修飾している。このため、重要度算出部118は、「とても」という単語の強調度と「きれい」という単語の強調度を掛け合わせることにより、タグ情報の重要度を算出する。
[2−1−11.検索処理部120]
検索処理部120は、例えば操作認識部102により認識されたユーザの検索指示に基づいて、コンテンツに関連付けられている複数のタグ情報に対して検索を行う。
また、検索処理部120は、検索するユーザの例えばユーザIDをサーバ20へ送信することにより、知識データベース22に記録されているユーザプロファイル情報から当該ユーザの嗜好を特定し、そして、特定した結果を用いてタグ情報を検索することも可能である。例えば、検索処理部120は、ユーザプロファイル情報から、検索するユーザが「山」が好きであることを特定した場合には、入力情報の中に「山」に関連した単語が含まれているタグ情報だけを抽出したり、または、入力情報の中に「山」に関連した単語が含まれているタグ情報が検索結果の上位に表示されるようにタグ情報を抽出する。
なお、上述したように、知識データベース22では、データが3つ組で管理されている。このため、検索処理部120は、意味概念や、例えば家族、友達、スポーツなどの関係ジャンルを検索条件として、タグ情報の検索を行うことも可能である。例えば、入力情報の中に「野球」という単語が含まれているタグ情報がユーザにより検索キーとされた場合には、検索処理部120は、(「野球」の関係ジャンルである)「スポーツ」に関する単語が入力情報に含まれているタグ情報を抽出することが可能である。また、入力情報の中に人物の名前が含まれているタグ情報が検索キーとされた場合には、検索処理部120は、当該人物の家族や友達の名前が入力情報に含まれているタグ情報を抽出することが可能である。
[2−1−12.通信部130]
通信部130は、通信網12を介して通信網12に接続された各種の装置との間で情報を送受信する。例えば、通信部130は、関連情報解析部114、強調度特定部116、または重要度算出部118の制御により、タグ付け位置や指示位置の位置情報をサーバ20へ送信する。また、通信部130は、関連情報や単語の強調度などをサーバ20から受信する。
[2−1−13.出力部132]
出力部132は、出力制御部112の制御に従って、コンテンツやタグ指示表示を表示画面に表示したり、または、タグ情報に含まれるユーザの入力音声を出力する。
[2−1−14.入力部134]
入力部134は、ユーザによる情報処理装置10に対する各種の入力操作を受け付ける。例えば、入力部134は、コンテンツにおいて指示位置を指定するためのタッチ操作などを受け付ける。
なお、本実施形態による情報処理装置10の構成は、上述した構成に限定されない。例えば、情報処理装置10は、関連情報解析部114、強調度特定部116、重要度算出部118、検索処理部120、通信部130、出力部132、または入力部134のうちいずれか1以上を含まなくてもよい。
<2−2.動作>
以上、本実施形態による構成について説明した。続いて、本実施形態による動作について、「2−2−1.タグ情報の関連付け・再生動作」〜「2−2−2.タグ情報の検索動作」において説明を行う。なお、以下では、入力情報として、ユーザの音声が入力される例について説明する。
[2−2−1.タグ情報の関連付け・再生動作]
図16は、本実施形態によるタグ情報の関連付け動作およびタグ情報の再生動作を示したフローチャートである。図16に示したように、まず、ユーザは、例えば出力装置162に表示されたコンテンツ選択画面において、タグ情報を関連付けることを希望するコンテンツを選択する。そして、情報処理装置10の出力制御部112は、選択されたコンテンツを表示画面に表示させる(S101)。
その後、ユーザは、表示画面に表示されたコンテンツにおいてタグ付け位置を指定する(S102)。そして、ユーザは、入力部134に対して、ユーザの音声を入力する(S103)。
その後、タグ管理部104は、S102で指定されたタグ付け位置の位置情報およびS103で入力された音声を含むタグ情報を生成する。そして、タグ管理部104は、生成したタグ情報と、S101で選択されたコンテンツの識別情報とをサーバ20へ通信部130に送信させる。そして、サーバ20は、情報処理装置10から受信されたタグ情報と、S101で選択されたコンテンツとを関連付けて知識データベース22に記録する(S104)。
その後、ユーザは、(S104で生成されたタグ情報に関して)コンテンツにおける指示位置を例えば表示画面に対するタッチ操作により指定する(S105)。
続いて、出力制御部112は、タグ付け位置と指示位置との間にタグ指示表示をコンテンツに重畳して表示させる(S106)。
続いて、操作認識部102は、コンテンツに関連付けられた複数のタグ情報のうちいずれかを再生させるための選択操作がなされたか否かを判断する(S107)。
そして、いずれかのタグ情報を選択する操作が認識された場合には(S107:Yes)、出力制御部112は、選択されたタグ情報に含まれるユーザの入力音声を出力する(S108)。
(2−2−1−1.変形例)
なお、S102〜S105に関しては、この順番通りに行われなくても良く、各ステップの順番は適宜入れ替え可能である。
[2−2−2.タグ情報の検索動作]
次に、タグ情報の検索動作について説明する。図17は、本実施形態によるタグ情報の検索動作を示したフローチャートである。図17に示したように、まず、ユーザは、例えば出力装置162に表示されたコンテンツ選択画面において、タグ情報の検索を希望するコンテンツを選択する。そして、情報処理装置10の出力制御部112は、選択されたコンテンツを表示画面に表示させる(S201)。
続いて、検索処理部120は、例えばサーバ20へ問い合わせることにより、S201で選択されたコンテンツに関連づけられている複数のタグ情報を検索する。そして、重要度算出部118は、検索された複数のタグ情報の各々に関して重要度を算出する(S202)。
続いて、検索処理部120は、例えば検索するユーザのユーザIDをサーバ20へ通信部130に送信させることより、当該ユーザの嗜好情報をサーバ20に問い合わせる(S203)。
その後、通信部130は、ユーザの嗜好情報をサーバ20から受信する(S204)。
続いて、重要度算出部118は、S202で算出された重要度、およびS204で受信されたユーザの嗜好情報に基づいて、検索された複数のタグ情報の各々について表示の優先度を算出する(S205)。
その後、出力制御部112は、S205で算出された優先度順に、検索された複数のタグ情報を表示画面に表示させる(S206)。
[2−2−3.効果]
(2−2−3−1.効果1)
以上、例えば図2、図4、図16等を参照して説明したように、本実施形態による情報処理装置10は、コンテンツにおけるタグ付け位置と指示位置との間においてタグ指示表示をコンテンツに重畳して表示させる。このため、情報処理装置10は、コンテンツと当該コンテンツに関連付けられたタグ情報との関係性をコンテンツの閲覧者に理解しやすく表示させることができる。
例えば、情報処理装置10は、タグ付け位置を始点とし、指示位置を指し示す表示として、タグ指示表示をコンテンツに重畳して表示させる。このため、コンテンツの閲覧者は、タグ情報に含まれる音声やテキストなどの入力情報が誰から誰へ向けられた情報であるかを明確かつ容易に理解することができる。
さらに、コンテンツの閲覧者は、他者によるタグ情報が自分に対するメッセージであることを理解した場合には、当該メッセージに対する返信のタグ情報をさらにコンテンツに関連づけることにより、他者との間でコミュニケーションを取ることができる。また、コンテンツの閲覧者は、タグ情報の関連付け後にコンテンツを再び閲覧することにより、タグ情報の関連付け当時のコミュニケーションを振り替えることができる。
(2−2−3−2.効果2)
また、コンテンツの閲覧者は、タグ情報に含まれる入力音声や入力テキストを出力させることにより、タグ情報の関連付け当時の他者の感情を知ることができたり、または、タグ情報の関連付け当時の自己の感情を再体験することができる。
<<3.変形例>>
なお、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示はかかる例に限定されない。本開示の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
<3−1.変形例1>
例えば、コンテンツがSNS(Social Networking Service)のようなWebサービス上に公開されている場合には、図18に示したように、複数のユーザが一つのコンテンツに対してタグ情報を同時に関連づけることも可能である。
なお、Webサービスでは匿名性が要求される場合も想定される。このため、変形例1では、情報処理装置10は、タグ情報に含まれるユーザの入力音声を一律にシステム音声に変換し、そして、変換した音声を出力してもよい。
この変形例1によれば、複数人が同じコンテンツに対して情報を無制限、かつ容易に付加することができる。また、タグ情報に含まれるユーザの入力情報をシステム音やユーザのお気に入りの音声などで出力させることにより、入力情報の匿名性を守りながら、タグ付け時の感動を複数のユーザにより再体験することができる。
<3−2.変形例2>
また、変形例2として、知識データベース22は、コンテンツに対応づけて、例えば図19に示したような、コンテンツの内容の要約が記録されたスロットテーブルをさらに記憶することも可能である。
ここで、図19を参照して、スロットテーブルの構成例について説明する。例えば、スロットテーブルでは、コンテンツタイプ400、日時402、場所404、およびイベント概要406が対応づけて記録される。ここで、コンテンツタイプ400には、例えば画像など、コンテンツの種類が記録される。また、日時402には、例えば画像の撮影日時など、コンテンツが作成された日時が記録される。また、場所404には、例えば画像の撮影場所など、コンテンツの位置情報が記録される。また、イベント概要406には、例えばコンテンツに関連付けられたタグ情報のうち重要度が最も高いタグ情報から抽出された単語や、予めユーザにより入力された説明文など、コンテンツの概要を示す文言が記録される。
この変形例2によれば、情報処理装置10は、例えばコンテンツの再生前において、スロットテーブルの記録内容をサーバ20から取得することにより、当該コンテンツに関する情報をシンプルに表示させたり、音声出力させることができる。このため、コンテンツの閲覧者は、コンテンツの再生前に、例えば当該コンテンツの作成日の情報を思い出すことができる。
<3−3.変形例3>
また、上記の説明では、サーバ20が知識データベース22を記憶する例について説明したが、かかる例に限定されない。例えば、情報処理装置10が知識データベース22を記憶することも可能である。
<3−4.変形例4>
また、2−1−7−1節において、コンテンツにタグ情報が関連付けられた後に、ユーザの操作に応じてタグ指示表示を変形して表示させる例について説明したが、かかる例に限定されない。変形例4として、情報処理装置10は、コンテンツにタグ情報が関連付けられた後のユーザの操作に応じて、タグ情報に含まれるユーザの入力音声、入力テキスト、タグ付け位置、または指示位置を変更することも可能である。
<3−5.変形例5>
また、上記の説明では、情報処理装置10が例えばスマートフォンなどの携帯型の装置である例を中心に説明したが、かかる例に限定されず、情報処理装置10はサーバ装置であってもよい。
<3−6.変形例6>
また、本実施形態によれば、CPU150、ROM152、およびRAM154などのハードウェアを、上述した情報処理装置10の各構成と同等の機能を発揮させるためのコンピュータプログラムも提供可能である。また、該コンピュータプログラムが記録された記録媒体も提供される。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
コンテンツにおいてタグ情報が関連付けられている第1の点と前記コンテンツにおけるユーザにより指定された第2の点との間の指示関係を示す表示を前記コンテンツに重畳して表示させ、前記タグ情報に含まれるユーザの入力情報を出力させる出力制御部、
を備える、情報処理装置。
(2)
前記指示関係を示す表示は、前記第1の点を始点とし、前記第2の点を指し示す表示である、前記(1)に記載の情報処理装置。
(3)
前記コンテンツにおいて、前記第1の点および前記第2の点は、同一の画像に含まれる、前記(1)または(2)に記載の情報処理装置。
(4)
前記コンテンツは、複数のフレーム画像を含み、
前記出力制御部は、前記コンテンツに含まれる第1のフレーム画像、および前記第1のフレーム画像より後の第2のフレーム画像において、前記指示関係を示す表示を同じ位置に表示させる、前記(3)に記載の情報処理装置。
(5)
前記情報処理装置は、前記コンテンツにおいて前記第1の点に位置する第1のオブジェクト、および前記第2の点に位置する第2のオブジェクトを認識する画像認識部をさらに備え、
前記出力制御部は、前記第1のオブジェクトまたは前記第2のオブジェクトの表示位置の移動に応じて、前記指示関係を示す表示の位置または長さを変化させる、前記(3)に記載の情報処理装置。
(6)
前記出力制御部は、前記ユーザの入力情報の出力に応じて、前記指示関係を示す表示の表示態様を前記第1の点から前記第2の点へ向けて動的に変化させる、前記(1)〜5に記載の情報処理装置。
(7)
前記コンテンツは、複数の画像を含み、
前記コンテンツにおいて、前記第1の点と前記第2の点は異なる画像に含まれる、前記(1)または(2)に記載の情報処理装置。
(8)
前記情報処理装置は、表示画面に対するユーザの操作を認識する操作認識部をさらに備え、
前記出力制御部は、前記操作認識部により認識されたユーザの指示に沿った形状に、前記指示関係を示す表示を変形させる、前記(1)〜(7)のいずれか一項に記載の情報処理装置。
(9)
前記出力制御部は、前記コンテンツの再生時において前記タグ情報がユーザにより選択された場合に、選択されたタグ情報に含まれるユーザの入力情報を出力させる、前記(1)〜(8)のいずれか一項に記載の情報処理装置。
(10)
前記タグ情報は、前記コンテンツに複数関連付けられ、
前記出力制御部は、複数のタグ情報が前記コンテンツに関連付けられた時刻の順で、前記複数のタグ情報の各々に含まれるユーザの入力情報を出力させる、前記(1)〜(8)のいずれか一項に記載の情報処理装置。
(11)
前記タグ情報は、前記コンテンツに複数関連付けられ、
前記情報処理装置は、前記ユーザの入力情報から複数の単語を特定する言語解析部と、
単語ごとの重要度が記録されているデータベースから、前記言語解析部により特定された複数の単語の各々の重要度を抽出することにより、タグ情報の重要度を算出する重要度算出部と、をさらに備え、
前記出力制御部は、算出されたタグ情報の重要度が所定の閾値以上であるタグ情報に含まれるユーザの入力情報を出力させる、前記(1)〜(8)のいずれか一項に記載の情報処理装置。
(12)
前記情報処理装置は、前記ユーザの入力情報から複数の単語を特定する言語解析部と、
単語ごとの強調度が記録されているデータベースから、前記言語解析部により特定された複数の単語の各々の強調度を特定する強調度特定部と、をさらに備え、
前記出力制御部は、特定された各単語の強調度に応じた表示態様で特定された各単語を前記コンテンツに重畳して表示させる、前記(1)〜(8)のいずれか一項に記載の情報処理装置。
(13)
前記出力制御部は、前記第1の点を示す表示と前記第2の点を示す表示とを異なる表示態様で表示させる、前記(1)〜(12)のいずれか一項に記載の情報処理装置。
(14)
前記ユーザの入力情報は、ユーザの音声である、前記(1)〜(13)のいずれか一項に記載の情報処理装置。
(15)
前記ユーザの入力情報は、ユーザにより入力された文字列である、前記(1)〜(13)のいずれか一項に記載の情報処理装置。
(16)
コンテンツにおいてタグ情報が関連付けられている第1の点と前記コンテンツにおけるユーザにより指定された第2の点との間の指示関係を示す表示を前記コンテンツに重畳して表示させるステップと、
前記タグ情報に含まれるユーザの入力情報をプロセッサにより出力させるステップと、
を備える、情報処理方法。
(17)
コンピュータを、
コンテンツにおいてタグ情報が関連付けられている第1の点と前記コンテンツにおけるユーザにより指定された第2の点との間の指示関係を示す表示を前記コンテンツに重畳して表示させ、前記タグ情報に含まれるユーザの入力情報を出力させる出力制御部、
として機能させるためのプログラム。
10 情報処理装置
12 通信網
20 サーバ
22 知識データベース
100 制御部
102 操作認識部
104 タグ管理部
106 解析部
108 音声解析部
110 言語解析部
112 出力制御部
114 関連情報解析部
116 強調度特定部
118 重要度算出部
120 検索処理部
130 通信部
132 出力部
134 入力部
150 CPU
152 ROM
154 RAM
156 内部バス
158 インターフェース
160 入力装置
162 出力装置
164 ストレージ装置
166 通信装置

Claims (17)

  1. コンテンツにおいてタグ情報が関連付けられている第1の点と前記コンテンツにおけるユーザにより指定された第2の点との間の指示関係を示す表示を前記コンテンツに重畳して表示させ、前記タグ情報に含まれるユーザの入力情報を出力させる出力制御部、
    を備える、情報処理装置。
  2. 前記指示関係を示す表示は、前記第1の点を始点とし、前記第2の点を指し示す表示である、請求項1に記載の情報処理装置。
  3. 前記コンテンツにおいて、前記第1の点および前記第2の点は、同一の画像に含まれる、請求項1に記載の情報処理装置。
  4. 前記コンテンツは、複数のフレーム画像を含み、
    前記出力制御部は、前記コンテンツに含まれる第1のフレーム画像、および前記第1のフレーム画像より後の第2のフレーム画像において、前記指示関係を示す表示を同じ位置に表示させる、請求項3に記載の情報処理装置。
  5. 前記情報処理装置は、前記コンテンツにおいて前記第1の点に位置する第1のオブジェクト、および前記第2の点に位置する第2のオブジェクトを認識する画像認識部をさらに備え、
    前記出力制御部は、前記第1のオブジェクトまたは前記第2のオブジェクトの表示位置の移動に応じて、前記指示関係を示す表示の位置または長さを変化させる、請求項3に記載の情報処理装置。
  6. 前記出力制御部は、前記ユーザの入力情報の出力に応じて、前記指示関係を示す表示の表示態様を前記第1の点から前記第2の点へ向けて動的に変化させる、請求項1に記載の情報処理装置。
  7. 前記コンテンツは、複数の画像を含み、
    前記コンテンツにおいて、前記第1の点と前記第2の点は異なる画像に含まれる、請求項1に記載の情報処理装置。
  8. 前記情報処理装置は、表示画面に対するユーザの操作を認識する操作認識部をさらに備え、
    前記出力制御部は、前記操作認識部により認識されたユーザの指示に沿った形状に、前記指示関係を示す表示を変形させる、請求項1に記載の情報処理装置。
  9. 前記出力制御部は、前記コンテンツの再生時において前記タグ情報がユーザにより選択された場合に、選択されたタグ情報に含まれるユーザの入力情報を出力させる、請求項1に記載の情報処理装置。
  10. 前記タグ情報は、前記コンテンツに複数関連付けられ、
    前記出力制御部は、複数のタグ情報が前記コンテンツに関連付けられた時刻の順で、前記複数のタグ情報の各々に含まれるユーザの入力情報を出力させる、請求項1に記載の情報処理装置。
  11. 前記タグ情報は、前記コンテンツに複数関連付けられ、
    前記情報処理装置は、前記ユーザの入力情報から複数の単語を特定する言語解析部と、
    単語ごとの重要度が記録されているデータベースから、前記言語解析部により特定された複数の単語の各々の重要度を抽出することにより、タグ情報の重要度を算出する重要度算出部と、をさらに備え、
    前記出力制御部は、算出されたタグ情報の重要度が所定の閾値以上であるタグ情報に含まれるユーザの入力情報を出力させる、請求項1に記載の情報処理装置。
  12. 前記情報処理装置は、前記ユーザの入力情報から複数の単語を特定する言語解析部と、
    単語ごとの強調度が記録されているデータベースから、前記言語解析部により特定された複数の単語の各々の強調度を特定する強調度特定部と、をさらに備え、
    前記出力制御部は、特定された各単語の強調度に応じた表示態様で特定された各単語を前記コンテンツに重畳して表示させる、請求項1に記載の情報処理装置。
  13. 前記出力制御部は、前記第1の点を示す表示と前記第2の点を示す表示とを異なる表示態様で表示させる、請求項1に記載の情報処理装置。
  14. 前記ユーザの入力情報は、ユーザの音声である、請求項1に記載の情報処理装置。
  15. 前記ユーザの入力情報は、ユーザにより入力された文字列である、請求項1に記載の情報処理装置。
  16. コンテンツにおいてタグ情報が関連付けられている第1の点と前記コンテンツにおけるユーザにより指定された第2の点との間の指示関係を示す表示を前記コンテンツに重畳して表示させるステップと、
    前記タグ情報に含まれるユーザの入力情報をプロセッサにより出力させるステップと、
    を備える、情報処理方法。
  17. コンピュータを、
    コンテンツにおいてタグ情報が関連付けられている第1の点と前記コンテンツにおけるユーザにより指定された第2の点との間の指示関係を示す表示を前記コンテンツに重畳して表示させ、前記タグ情報に含まれるユーザの入力情報を出力させる出力制御部、
    として機能させるためのプログラム。
JP2014019360A 2014-02-04 2014-02-04 情報処理装置、情報処理方法、及びプログラム Pending JP2015146550A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014019360A JP2015146550A (ja) 2014-02-04 2014-02-04 情報処理装置、情報処理方法、及びプログラム
US14/605,033 US9697632B2 (en) 2014-02-04 2015-01-26 Information processing apparatus, information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014019360A JP2015146550A (ja) 2014-02-04 2014-02-04 情報処理装置、情報処理方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2015146550A true JP2015146550A (ja) 2015-08-13

Family

ID=53755277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014019360A Pending JP2015146550A (ja) 2014-02-04 2014-02-04 情報処理装置、情報処理方法、及びプログラム

Country Status (2)

Country Link
US (1) US9697632B2 (ja)
JP (1) JP2015146550A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020091647A (ja) * 2018-12-05 2020-06-11 トヨタ自動車株式会社 情報処理装置及び情報処理プログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239725B (zh) * 2016-03-29 2020-10-16 阿里巴巴集团控股有限公司 一种信息展示方法、装置及系统
US11495209B2 (en) * 2016-08-25 2022-11-08 Sony Corporation Information presentation device, and information presentation method
US10733325B1 (en) * 2019-11-15 2020-08-04 Capital One Services, Llc Securing user-entered text in-transit

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7103848B2 (en) * 2001-09-13 2006-09-05 International Business Machines Corporation Handheld electronic book reader with annotation and usage tracking capabilities
EP1629350A4 (en) * 2003-05-16 2007-08-01 Philip Pearson SYSTEM AND METHOD FOR PRODUCING A REPORT USING A KNOWLEDGE BASIS
US7218783B2 (en) * 2003-06-13 2007-05-15 Microsoft Corporation Digital ink annotation process and system for recognizing, anchoring and reflowing digital ink annotations
US7343552B2 (en) * 2004-02-12 2008-03-11 Fuji Xerox Co., Ltd. Systems and methods for freeform annotations
JP4866396B2 (ja) 2008-07-08 2012-02-01 株式会社デンソーアイティーラボラトリ タグ情報付加装置、タグ情報付加方法及びコンピュータプログラム
JP2010057902A (ja) * 2008-08-06 2010-03-18 Toshiba Corp レポート作成支援装置、レポート作成支援システム、及び医用画像参照装置
JP2012221393A (ja) * 2011-04-13 2012-11-12 Fujifilm Corp 校正情報処理装置、校正情報処理方法、プログラム及び電子校正システム
US20140237357A1 (en) * 2013-02-20 2014-08-21 Google Inc. Two-dimensional document navigation

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020091647A (ja) * 2018-12-05 2020-06-11 トヨタ自動車株式会社 情報処理装置及び情報処理プログラム
JP7176383B2 (ja) 2018-12-05 2022-11-22 トヨタ自動車株式会社 情報処理装置及び情報処理プログラム

Also Published As

Publication number Publication date
US20150221114A1 (en) 2015-08-06
US9697632B2 (en) 2017-07-04

Similar Documents

Publication Publication Date Title
CN110968736B (zh) 视频生成方法、装置、电子设备及存储介质
JP7112508B2 (ja) 動画スタンプの生成方法並びにそのコンピュータプログラム及びコンピュータ装置
CN110418208B (zh) 一种基于人工智能的字幕确定方法和装置
TWI720062B (zh) 語音輸入方法、裝置和終端設備
US20110078564A1 (en) Converting Text Messages into Graphical Image Strings
JP6289662B2 (ja) 情報送信方法及び送信装置
CN105827516B (zh) 消息处理方法和装置
CN112367551B (zh) 视频编辑的方法及装置、电子设备和可读存储介质
KR102196199B1 (ko) 음성인식 기반의 사진 공유 방법, 장치 및 시스템
CN107071512B (zh) 一种配音方法、装置及系统
CN112188266A (zh) 视频生成方法、装置及电子设备
CN107977928A (zh) 表情生成方法、装置、终端及存储介质
CN106649712B (zh) 输入表情信息的方法及装置
JP2015146550A (ja) 情報処理装置、情報処理方法、及びプログラム
US20110258017A1 (en) Interpretation of a trending term to develop a media content channel
KR101791979B1 (ko) 오버레이 아이템 또는 추가 아이템을 통해 메신저 서비스를 제공하는 방법 및 그를 이용한 서버
Zhang et al. Ga11y: An automated gif annotation system for visually impaired users
US10120539B2 (en) Method and device for setting user interface
US20140013193A1 (en) Methods and systems for capturing information-enhanced images
JP6814604B2 (ja) 会議情報表示システム、会議情報表示方法および会議情報表示プログラム
CN109714248B (zh) 一种数据处理方法及装置
JP2017045374A (ja) 情報処理装置及びプログラム
CN109725798A (zh) 智能角色的切换方法及相关装置
WO2022041178A1 (zh) 基于脑电波的信息处理方法、设备及即时通信客户端
CN112565913A (zh) 视频通话方法、装置和电子设备