JP2020162138A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2020162138A
JP2020162138A JP2020096695A JP2020096695A JP2020162138A JP 2020162138 A JP2020162138 A JP 2020162138A JP 2020096695 A JP2020096695 A JP 2020096695A JP 2020096695 A JP2020096695 A JP 2020096695A JP 2020162138 A JP2020162138 A JP 2020162138A
Authority
JP
Japan
Prior art keywords
feature
image
information
display
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020096695A
Other languages
English (en)
Other versions
JP6973567B2 (ja
Inventor
麻衣 鈴木
Mai Suzuki
麻衣 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2015183453A external-priority patent/JP2017058978A/ja
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2020096695A priority Critical patent/JP6973567B2/ja
Publication of JP2020162138A publication Critical patent/JP2020162138A/ja
Application granted granted Critical
Publication of JP6973567B2 publication Critical patent/JP6973567B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】時系列情報を区分した各パートの重要度を利用者に認識させる情報処理装置を提供する。【解決手段】情報処理装置は、音声情報及び画像情報を含み時間とともに変化する時系列情報を複数のパートに区分する区分手段と、利用者による操作指示を受け付ける操作指示受付手段と、前記区分されたパートの重要度に応じた大きさで表示された、前記区分されたパートの特徴を示す特徴画像を含む要約画像を表示すよう制御する表示制御手段と、を備え、前記表示制御手段は、前記特徴画像の大きさに応じて、当該特徴画像に関連付けられた、前記区分されたパートの特徴を示す特徴語の表示を制限し、前記操作指示受付手段が、前記特徴語の表示の制限をされた前記特徴画像を指示する操作を受け付けると、前記表示の制限をされた前記特徴語を表示させた前記要約画像を表示するよう制御する。【選択図】図9

Description

本発明は、情報処理装置及びプログラムに関する。
例えば、利用者が視聴する映画等の時系列情報を複数のパートに区分し、区分された各パートにおいてパートに含まれる音声から得られる当該パートに関する特徴語と、パートに含まれる画像から得られる当該パートに関する特徴画像と、を関連付けて要約を作成する技術がある(特許文献1)。
特開2008−148121号公報
各パートにおける特徴語の重要度は、各パート間で異なるため、特徴語の重要度に応じてユーザーが時系列情報を閲覧した場合、各パートの特徴語の重要度をユーザーに示す必要がある。そこで、複数の特徴画像を含む要約を作成する際に特徴語の重要度に応じて複数の特徴画像の大きさを異ならせることができれば利用者の利便性が向上する。
本発明の目的の一つは、時系列情報を区分した各パートの特徴語の重要度を利用者に把握させることができる情報処理装置を提供することにある。
本発明に係る情報処理装置は、音声情報及び画像情報を含み時間とともに変化する時系列情報を複数のパートに区分する区分手段と、利用者による操作指示を受け付ける操作指示受付手段と、前記区分されたパートの重要度に応じた大きさで表示された、前記区分されたパートの特徴を示す特徴画像を含む要約画像を表示すよう制御する表示制御手段と、を備え、前記表示制御手段は、前記特徴画像の大きさに応じて、当該特徴画像に関連付けられた、前記区分されたパートの特徴を示す特徴語の表示を制限し、前記操作指示受付手段が、前記特徴語の表示の制限をされた前記特徴画像を指示する操作を受け付けると、前記表示の制限をされた前記特徴語を表示させた前記要約画像を表示するよう制御することを特徴とする。
本発明の請求項2に係る情報処理装置は、請求項1に記載の情報処理装置において、前記区分されたパートの特徴を示す前記特徴語を当該パートに含まれる前記音声情報に基づいて取得する特徴語取得手段をさらに含み、前記特徴語取得手段は、前記区分されたパートに対応する前記音声情報における出現頻度に応じて前記特徴語を取得する。
本発明に係る情報処理装置は、それぞれが前記重要度に応じた大きさで表示される前記複数の特徴画像を含む前記要約画像を生成する。
本発明の請求項3に係る情報処理装置は、請求項1に記載の情報処理装置において、前記特徴画像は、前記重要度が高いほど大きく表示され、前記重要度が低いほど小さく表示される。
本発明の請求項4に係る情報処理装置は、請求項1に記載の情報処理装置において、前記重要度は前記音声情報における前記特徴語の出現回数から決定される。
本発明の請求項5に係る情報処理装置は、請求項1に記載の情報処理装置において、前記重要度は前記音声情報における前記特徴語の音量から決定される。
本発明の請求項6に係る情報処理装置は、請求項1に記載の情報処理装置において、前記重要度は前記音声情報において前記特徴語が出現する時間の直前に無音の時間があるか否かによって決定される。
本発明に係る情報処理装置は、前記要約画像は、前記特徴語が関連付けられた前記特徴画像を含む。
本発明に係る情報処理装置は、前記要約画像は、前記特徴画像の大きさに応じた態様の前記特徴語が関連付けられた前記特徴画像を含む。
本発明に係る情報処理装置は、前記要約画像生成手段は、前記特徴画像の大きさに応じて当該特徴画像に関連付けられる前記特徴語の表示を制限する。
本発明の請求項7に係る情報処理装置は、請求項1に記載の情報処理装置において、前記要約画像生成手段は、前記特徴画像の大きさが予め定められた閾値以下または未満の場合に、当該特徴画像に関連付けられる前記特徴語を表示させない。
本発明の請求項8に係る情報処理装置は、請求項1に記載の情報処理装置において、前記要約画像生成手段は、前記特徴画像の大きさが予め定められた閾値以下または未満の場合に、当該特徴画像に関連付けられる前記特徴語の一部を表示させる。
本発明に係る情報処理装置は、利用者による操作指示を受け付ける操作指示受付手段、をさらに含み、前記操作指示受付手段が、前記特徴語の表示の制限をされた前記特徴画像を指示する操作を受け付けると、前記要約画像生成手段は前記表示の制限をされた前記特徴語を表示させた前記要約画像を生成する。
本発明に係るプログラムは、音声情報及び画像情報を含み時間とともに変化する時系列情報を複数のパートに区分する区分手段、前記区分されたパートの特徴を示す特徴画像を当該パートに含まれる前記画像情報から取得する特徴画像取得手段、前記区分されたパートの特徴を示す特徴語を当該パートに含まれる前記音声情報に基づいて取得する特徴語取得手段、前記区分されたパートの特徴語の重要度に応じた態様で表示された複数の前記特徴画像を含む要約画像を生成する要約画像生成手段、としてコンピュータを機能させるためのプログラムである。
本発明によれば、時系列情報を区分した各パートの特徴語の重要度を利用者に把握させることができる。
本発明の請求項2によれば、各パートにおける出現頻度に応じて特徴語を決定することができる。
本発明によれば、特徴画像の大きさにより各パートの特徴語の重要度を利用者に把握させることができる。
本発明の請求項3によれば、特徴画像が大きいほど特徴語の重要度が高く、特徴画像が小さいほど特徴語の重要度が低い、ことを利用者に把握させることができる。
本発明の請求項4によれば、音声情報における特徴語の出現回数から特徴語の重要度を決定することができる。
本発明の請求項5によれば、音声情報における特徴語の音量から特徴語の重要度を決定することができる。
本発明の請求項6によれば、音声情報において特徴語が出現する時間の直前に無音の時間があるか否かから特徴語の重要度を決定することができる。
本発明によれば、利用者に各パートの情報把握をさせやすくする。
本発明によれば、特徴語の表示態様から各パートの特徴語の重要度を利用者に把握させることができる。
本発明によれば、特徴語の重要度の低いパートについての情報量を少なくすることができる。
本発明によれば、特徴語の重要度の低いパートについては利用者が要求したときだけ情報を提供することができる。
本実施形態に係る情報処理システムのハードウェア構成の一例を示す図である。 本実施形態に係るサーバが実現する主な機能の一例を示す機能ブロック図である。 本実施形態に係る要約画像の一例を示す図である。 本実施形態に係るサーバが実行する要約画像生成処理の一例を示すフロー図である。 本実施形態に係るサーバが実行する特徴情報取得処理の一例を示すフロー図である。 本実施形態に係るサーバが実行する表示態様設定処理の一例を示すフロー図である。 本実施形態に係る要約画像の一例を示す図である。 本実施形態に係るサーバが実行する表示態様設定処理の一例を示すフロー図である。 本実施形態に係る要約画像の一例を示す図である。
以下、本発明の一実施形態について図面に基づき詳細に説明する。
図1は、本実施形態に係る情報処理システム1のハードウェア構成の一例を示す図である。図1に示すように、本実施形態に係る情報処理システム1は、ネットワークを介して接続されるサーバ10及び端末装置20を含んで構成される。なお、図1においては、情報処理システム1は、1つの端末装置20のみを含んでいるが、その他複数の端末装置20を含んでいてもよい。
サーバ10は、例えばサーバコンピュータ等の情報処理装置であって、制御部11と、記憶部12と、通信部13と、を含んで構成される。
制御部11は、例えばCPU等であって、記憶部12に格納されるプログラムに従って各種の情報処理を実行する。
記憶部12は、例えばRAMやEOM等のメモリ素子、ハードディスクなどを含んで構成される。記憶部12は、制御部11によって実行されるプログラムや、各種のデータを保持する。また、記憶部12は、制御部11のワークメモリとしても動作する。
通信部13は、例えばLANカード等のネットワークインタフェースであって、LANや無線通信網などの通信手段を介して、サーバ10との間で情報の送受信を行う。なお、制御部11、記憶部12、通信部13は、それぞれバスを介して接続される。
端末装置20は、例えばパーソナルコンピュータ等の情報処理装置であって、制御部21と、記憶部22と、通信部23と、表示部24と、操作部25と、を含んで構成される。上記各部21〜25はバスを介して接続される。なお、制御部21、記憶部22、及び通信部23は、それぞれ制御部11、記憶部12、及び通信部13と同様の構成であってよい。
表示部24は、例えば液晶ディスプレイ、CRTディスプレイ、有機ELディスプレイ等であって、制御部21からの指示に従って、情報の表示を行う。
操作部25は、例えばキーボード、マウス、ボタンやタッチパネル等であって、利用者の指示操作を受け付けて、当該指示操作の内容を制御部21に出力する。
次に、本実施形態に係る情報処理システム1が実現する機能について、説明する。図2は、本実施形態に係るサーバ10が実現する主な機能の一例を示す機能ブロック図である。図2に示すように、サーバ10は、機能的には、時系列情報取得部50、パート区分部51、特徴語取得部52、特徴画像取得部53、特徴情報関連付け部54、重要度算出部55、表示態様設定部56、及び要約画像生成部57を含んで構成される。これらの機能は、記憶部12に記憶されたプログラムを制御部11が実行することにより実現される。
このプログラムは、例えば、磁気ディスク(HDD、FD(Flexible Disk))など)、光記録媒体(光ディスク(CD(Compact Disk)、DVD(Digital Versatile Disk))など)、光磁気記録媒体、半導体メモリ(フラッシュROMなど)などのコンピュータが読み取り可能な記録媒体を介して、あるいは、インターネットなどの通信手段を介してサーバ10に供給される。
時系列情報取得部50は、時系列情報を取得する。ここで、時系列情報は、時間とともに変化する情報であり、本実施形態では音声情報と、複数のフレーム画像を含む画像情報と、を含む情報とする。具体的な時系列情報としては、講演を記録した講演情報や、テレビやインターネットで配信されている映像を記録した配信記録情報であってよい。当該時系列情報は、サーバ10の記憶部12に記憶されていてもよいし、端末装置20から提供されてもよい。
パート区分部51は、時系列情報を複数のパートに区分する。パート区分部51は、時系列情報に含まれる音声情報及び画像情報を複数のパートに区分する。パート区分部51は、例えば、連続する2つのフレーム画像のカラーヒストグラムの差、画素差、離散コサイン変換などの変換係数差などを算出し、算出された差が所定の閾値以上となった場合に当該2つのフレーム画像をパートの区切りとする。
特徴語取得部52は、パート区分部51が区分した各パートにおいて、当該パートの特徴を示す特徴語を取得する。本実施形態に係る特徴語取得部52は、音声情報に応じて特徴語を取得する。まず特徴語取得部52は、各パートの音声情報に対して音声認識を行い文字情報に変換する。そして特徴語取得部52は、変換した文字情報から特徴語を取得する。例えば、特徴語取得部52は、変換した文字情報のなかから出現する頻度の最も高い単語を特徴語として抽出する。
特徴画像取得部53は、パート区分部51が区分した各パートにおいて、当該パートの特徴を示す特徴画像を取得する。特徴画像取得部53は、特徴語取得部52が取得した特徴語に対応するフレーム画像を特徴画像として取得する。具体的には、特徴画像取得部53は、音声情報における特徴語の出現位置を取得し、当該出現位置に対応するフレーム画像を特徴画像として取得する。なお特徴画像取得部53は、画像情報に基づいて特徴画像を取得してもよい。例えば特徴画像取得部53は、パートにおいて最初に出現するフレーム画像を特徴画像として取得してもよいし、パートに含まれる複数のフレーム画像から所定の基準を満たすフレーム画像を特徴画像として取得してもよい。
特徴情報関連付け部54は、特徴語取得部52が取得した特徴語と、特徴画像取得部53が取得した特徴画像と、を関連付けた関連付け情報を関連付け情報記憶部に保存する。
関連付け情報は、パート毎に特徴語と特徴画像とが関連付けられていることとする。関連付け情報には、パート毎に特徴語や特徴画像に関連する情報がさらに関連付けられてもよい。例えば時系列情報において特徴語が出現する出現位置(例えば再生時間など)や、時系列情報において特徴画像が出現する出現位置などが関連付けられてもよい。
重要度算出部55は、パート区分部51が区分した各パートの重要度を算出する。重要度算出部55は、特徴語取得部52が取得した特徴語に基づいて各パートの重要度を算出する。例えば、重要度算出部55は、音声情報において特徴語が出現する時間の音量に基づいて重要度を算出する。具体的には重要度算出部55は、特徴語が出現する時間の音量が大きいほど重要度を高く算出し、特徴語が出現する時間の音量が小さいほど重要度を低く算出する。これは音量が大きいほど主張したい内容が含まれていると考えられるからである。また重要度算出部55は、音声情報において特徴語が出現する時間の直前に無音の時間があるか否かにより重要度を算出してもよい。具体的には重要度算出部55は、特徴語が出現する時間の直前に無音の時間がある場合に重要度を高く算出する。これは時系列情報が講演の記録である場合など、聴衆の注意を惹きつけるためにあえて沈黙していると判断し、無音の時間の後に主張したい内容が含まれていると考えられるからである。また重要度算出部55は、各パートにおける特徴語の出現回数に応じて重要度を算出してもよい。これは、パート内における特徴語の出現回数が多いほど、該パートの特徴語が重要だと考えられるからである。なお、重要度算出部55は、特徴画像に基づいて重要度を算出してもよい。例えば重要度算出部55は、特徴画像のカラーヒストグラムや画像分布等から重要度を算出してもよい。また重要度算出部55は、上述した重要度算出手法の2つ以上を組み合わせて各パートの重要度を算出してもよい。例えば、重要度算出部55は、特徴語と特徴画像とに基づいて重要度を算出してもよい。
表示態様設定部56は、要約画像生成部57が複数の特徴画像を用いて時系列情報の要約を表す要約画像を生成する際の、各特徴画像の表示態様を設定する。そして、要約画像生成部57は、表示態様設定部56が設定した表示態様にしたがって要約画像を生成する。
表示態様設定部56は、重要度算出部55が算出した各パートの重要度に基づいて、各特徴画像の表示態様を設定する。具体的には表示態様設定部56は、複数の特徴画像の大きさを重要度に応じて異ならせる。つまり表示態様設定部56は、重要度の高いパートの特徴画像を大きく、重要度の低いパートの特徴画像を小さく表示されるよう設定する。
図3は、本実施形態に係る要約画像100の一例を示す図である。図3に示す要約画像100は、複数のコマ110を含み、各コマ110に特徴画像が表示される。複数のコマ110は、それぞれ大きさが異なっており、例えばコマ110aはコマ110bより大きい。そして複数の特徴画像は、各コマ110の大きさに応じてそれぞれ異なる大きさで表示されている。これらコマの大きさ、特徴画像の大きさは上述したように重要度に応じて設定されている。なお、表示態様設定部56は、特徴画像の大きさを設定してもよいし、要約画像100の各コマ110の大きさを設定してもよい。表示態様設定部56が各コマ110の大きさを設定する場合は、要約画像生成部57が各特徴画像を対応するコマ110に応じた大きさに変換して表示させればよい。
図3に示すような要約画像100は、ネットワークを介して端末装置20へ送信され、端末装置20の表示部24に表示される。端末装置20の利用者は、端末装置20の表示部24に表示された要約画像100を見ることができる。そして、利用者がいずれかの特徴画像を選択すると、当該特徴画像の出現位置から時系列情報が再生され利用者が視聴できるようになっている。このように利用者はコマ割りされた特徴画像の大きさから重要度を判断することができ、重要度に応じて再生位置を選択することが可能となる。
また、表示態様設定部56は、要約画像100における複数の特徴画像それぞれの表示位置を設定してもよい。例えば表示態様設定部56は、時系列順に特徴画像が並ぶように各特徴画像の表示位置を設定してもよい。また表示態様設定部56は、特徴画像の大きさに応じて各特徴画像の表示位置を設定してもよい。例えば表示態様設定部56は特徴画像の大きさが大きい順に並ぶよう各特徴画像の表示位置を設定してもよいし、最も大きい特徴画像が要約画像100の中心に位置するよう各特徴画像の表示位置を設定してもよい。
また、図3に示す要約画像100において各特徴画像に当該特徴画像に関連付けられている特徴語を文字で示した文字画像を重畳して表示させる場合がある。このとき、特徴画像の大きさが予め定められた閾値以下または未満の場合に、特徴語文字をすべて表示できないことがある。例えば、特徴語の文字数に対して特徴画像が小さいと、特徴語の文字をすべて表示できない場合がある。そこで、表示態様設定部56は、各特徴画像の大きさに応じて文字画像を調整する。例えば表示態様設定部56は、特徴画像の大きさに応じて特徴語の文字がすべて表示されるよう文字画像のサイズを小さくする。また表示態様設定部56は、特徴画像の大きさに対して特徴語の文字をすべて表示できない場合には、文字画像の表示を制限させてもよい。この場合、要約画像100を見た利用者が、文字画像の表示が制限されている特徴画像にマウスオーバーすると、文字画像が表示されるようにしてもよい。これらの具体的な処理については後述する。
ここで、本実施形態に係るサーバ10が実行する要約画像生成処理の一例について図4に示すフロー図を用いて説明する。
まず、時系列情報取得部50が、時系列情報を取得する(S101)。ここで時系列情報は、音声情報と、複数のフレーム画像を含む画像情報と、を含む。
パート区分部51は、時系列情報取得部50が取得した時系列情報を複数のパートに区分する(S102)。ここでパート区分部51は、時系列情報をK個のパートに区分し、区分した各パートに時系列順に1〜Kの番号を付す。
そして、変数nにn=1の初期値が設定され(S103)、特徴情報取得処理が実行される(S104)。ここで変数nは、1以上の整数値をとるカウンタ変数である。
本実施形態に係るサーバが実行する特徴情報取得処理の一例については図5のフロー図を用いて説明する。ここで特徴情報取得処理により取得される特徴情報は各パートの特徴を示す情報であり、本実施形態においては特徴語と特徴画像とが取得される。
まず特徴語取得部52は、n番目パートの音声情報を取得する(S201)。
次に特徴語取得部52は、n番目パートの音声情報を音声認識することで文字情報に変換する(S202)。
そして特徴情報取得部は、処理S202において得られた文字情報から、n番目パートの特徴を示す特徴語を抽出する(S203)。
次に特徴画像取得部53は、処理S203において得られた特徴語の、音声情報における出現位置を取得し、当該出現位置に対応するフレーム画像をn番目パートの特徴を示す特徴画像として取得する(S204)。
そして、特徴情報関連付け部54が、処理S203において取得された特徴語と、処理S204において取得された特徴画像と、を関連付けて(S205)、リターンする。ここで特徴情報関連付け部54は、パートを識別する番号と、特徴語と、特徴画像と、を関連付けた関連付け情報を記憶部に記憶することとする。
処理S104における特徴情報抽出処理が終了すると、n=Kが成立するか否かが判断される(S105)。つまりK個のパートすべてにおいて特徴情報抽出処理が行われたかを判断される。
処理S105の判断の結果、n=Kが成立しないと判断された場合は(S105:N)、変数nに1が加算され(S106)、処理S104以降の処理が繰り返し実行される。
処理S105の判断の結果、n=Kが成立すると判断された場合は(S105:Y)、重要度算出部55がK個のパートそれぞれについての重要度を算出する(S107)。ここで重要度算出部55により算出された重要度は、関連付け情報に追加して関連付けられて記憶されることとする。
そして、表示態様設定処理が実行される(S108)。本実施形態に係るサーバが実行する表示態様設定処理の一例については図6のフロー図を用いて説明する。
図6に示すように、まず、表示態様設定部56は、処理S107において重要度算出部55が算出した各パートの重要度に基づいて、各パートの特徴画像を表示させるコマ110の大きさを設定する(S301)。ここでは表示態様設定部56は、K個のパートにそれぞれ対応するK個のコマ110の大きさを設定する。例えば表示態様設定部56は、重要度の高いパートに対応するコマ110を大きく、重要度の低いパートに対応するコマ110を小さく設定する。ここで表示態様設定部56が設定した情報は各パートの関連付け情報に追加して関連付ける。
次に、変数mにm=1の初期値が設定される(S302)。ここで変数mは、1以上の整数値をとるカウンタ変数である。
そして表示態様設定部56は、mパートの特徴語の文字数を算出する(S303)。また表示態様設定部56は、mパートに対応するコマ110に文字を配置する際の配置可能な文字数を算出する(S304)。ここでコマ110に配置可能な文字数は、コマ110の大きさと使用する文字サイズとに応じて予め定められていることとする。
そして配置可能な文字数が、特徴語の文字数以上となるかが判断される(S305)。
つまり処理S301において設定されたコマ110に特徴語の文字をすべて配置することができるかが判断される。
処理S305の判断の結果、配置可能な文字数が特徴語の文字数以上となる場合は(S305:Y)、表示態様設定部56は、特徴語の文字を示す特徴語文字データを特徴画像に関連付ける(S306)。ここで表示態様設定部56は、mパートに対応する関連付け情報に特徴語文字データを追加して関連付けて記憶する。特徴語文字データは、文字のフォント、配置位置等の情報を含んでいてもよい。なお表示態様設定部56が、特徴語文字データを関連付けた特徴画像を新たに生成して記憶してもよい。
そして、m=Kが成立するか否かが判断される(S307)。つまりK個のパートすべてにおいて特徴語文字データが関連付けられたか判断される。
処理S307の判断の結果、m=Kが成立しないと判断された場合は(S307:N)、変数mに1が加算され(S308)、処理S303以降の処理が繰り返し実行される。
処理S307の判断の結果、m=Kが成立すると判断された場合は(S307:Y)、リターンする。
また、処理S305の判断の結果、配置可能な文字数が特徴語の文字数より少ない場合は(S305:N)、表示態様設定部56は、コマ110に配置する特徴語の文字を示す特徴語文字データを調整する(S309)。例えば表示態様設定部56は、特徴語文字データの文字サイズを、コマ110に配置可能なサイズに変更する。そして、処理S307以降の処理を実行する。なお、表示態様設定部56は、特徴語の一部を特徴語文字データとして特徴画像に関連付けてもよい。また表示態様設定部56は、特徴語文字データが示す特徴語の文字をテロップ表示させるよう設定してもよい。
表示態様設定処理が終了すると、要約画像生成部57が表示態様設定処理において設定された表示態様に従って要約画像100を生成し(S109)、要約画像生成処理が終了する。ここでは要約画像生成部57は、関連付け情報のパート毎に、関連付けられている各種情報に従って要約画像100を生成すればよい。
図7は、本実施形態に係る要約画像100の一例を示す図である。図7は、処理S109において要約画像生成部57が生成する要約画像100の一例を示している。図7に示す要約画像100は、各コマ110の特徴画像に特徴語文字データに対応する特徴語文字画像200が重畳されている。そして、小さいコマ110bの特徴画像に重畳されている特徴語文字画像200bは、大きいコマ110aの特徴画像に重畳されている特徴語文字画像200aより文字サイズが小さくなっている。このように小さいコマ110bの特徴画像にも特徴語の文字をすべて表示させることで、利用者に各パートの情報把握をさせやすくする。
次に、本実施形態に係るサーバが実行する表示態様設定処理の他の例について図8のフロー図を用いて説明する。ここでは特徴画像に特徴語文字画像を重畳させない場合の処理について説明する。
まず表示態様設定部56は、処理S107において重要度算出部55が算出した各パートの重要度に基づいて、各パートの特徴画像を表示させるコマ110の大きさを設定する
(S401)。
次に表示態様設定部56は、特徴語文字画像を重畳させないパートを選択する(S402)。ここでは表示態様設定部56は、配置可能文字数が特徴語文字数より少ないパートを選択する。なお、表示態様設定部56は、すべてのパートを選択してもよい。
そして表示態様設定部56は、特徴語文字画像を重畳させないパートについて、特徴語文字画像の代わりに重畳させる代替データを生成する(S403)。ここで代替データは、特徴語文字画像は重畳されていないが文字情報が存在することを、要約画像100を見る利用者に知らせるためのものである。代替データとしては、例えば画像アイコンや、「・・・」などの文字データとする。
そして表示態様設定部56は、表示文字データを生成する(S404)。表示文字データは、利用者が特徴語文字画像を重畳させていない特徴画像を選択する操作指示(例えばマウスオーバー操作など)を行った場合に、表示させるものである。表示文字データは、特徴語の文字を示すものであってもよいし、パートに含まれる音声情報を音声認識により変換した文字情報を示すものであってもよい。
表示態様設定部56は、処理S403において生成した代替データと、表示文字データとを特徴画像に関連付けて(S404)、リターンする。ここで表示態様設定部56は、各パートに対応する関連付け情報に代替データ及び表示文字データを追加して関連付けて記憶する。
図9は、本実施形態に係る要約画像100の一例を示す図である。図9は、要約画像生成部57が、図8に示した表示態様設定処理により設定された表示態様に従って生成した要約画像100の一例を示している。図9に示す要約画像100において、小さいコマ110bの特徴画像には代替データに対応する代替データ画像300が重畳されている。ここで利用者がマウスオーバー操作等により代替データ画像300を選択すると、当該操作指示が端末装置20からサーバ10へ送信される。サーバ10が操作指示を受け付けると、要約画像生成部57が表示文字データに対応する表示文字画像400を重畳させた要約画像100を生成する。そして生成された要約画像は端末装置20へ送信される。そして表示文字画像400が重畳された要約画像100が端末装置20の表示部24に表示される。なお表示文字画像400は、表示文字データが示す文字がテロップ表示されるよう構成されていてもよい。
またサーバ10が、利用者によるマウスオーバー操作等により代替データ画像300を選択する操作指示を受け付けると、要約画像生成部57が表示文字データに対応する表示文字画像400を生成して端末装置20へ送信することとしてもよい。
本発明は、上記の実施形態に限定されるものではない。
例えば、処理S305において配置可能な文字数が、特徴語の文字数より少ない場合に、特徴語を変更してもよい。ここでは特徴情報取得処理を実行させて、特徴語取得部52が表示態様設定部56の設定した大きさのコマに配置される特徴語を取得してもよい。
また、上記の実施形態では、サーバ10と端末装置20とが別体の例を示したが、サーバ10と端末装置20とが一体の装置であってもよい。
1 情報処理システム、10 サーバ、11,21 制御部、12,22 記憶部、13,23 通信部、20 端末装置、24 表示部、25 操作部、50 時系列情報取得部、51 パート区分部、52 特徴語取得部、53 特徴画像取得部、54 特徴情報関連付け部、55 重要度算出部、56 表示態様設定部、57 要約画像生成部、100 要約画像、110,110a,110b コマ、200,200a,200b 特徴語文字画像、300 代替データ画像、400 表示文字画像。

Claims (9)

  1. 音声情報及び画像情報を含み時間とともに変化する時系列情報を複数のパートに区分する区分手段と、
    利用者による操作指示を受け付ける操作指示受付手段と、
    前記区分されたパートの重要度に応じた大きさで表示された、前記区分されたパートの特徴を示す特徴画像を含む要約画像を表示すよう制御する表示制御手段と、を備え、
    前記表示制御手段は、前記特徴画像の大きさに応じて、当該特徴画像に関連付けられた、前記区分されたパートの特徴を示す特徴語の表示を制限し、前記操作指示受付手段が、前記特徴語の表示の制限をされた前記特徴画像を指示する操作を受け付けると、前記表示の制限をされた前記特徴語を表示させた前記要約画像を表示するよう制御する、
    ことを特徴とする情報処理装置。
  2. 前記区分されたパートの特徴を示す前記特徴語を当該パートに含まれる前記音声情報に基づいて取得する特徴語取得手段をさらに含み、
    前記特徴語取得手段は、前記区分されたパートに対応する前記音声情報における出現頻度に応じて前記特徴語を取得する、
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記特徴画像は、
    前記重要度が高いほど大きく表示され、前記重要度が低いほど小さく表示される、
    ことを特徴とする請求項1に記載の情報処理装置。
  4. 前記重要度は前記音声情報における前記特徴語の出現回数から決定される、
    ことを特徴とする請求項1に記載の情報処理装置。
  5. 前記重要度は前記音声情報における前記特徴語の音量から決定される、
    ことを特徴とする請求項1に記載の情報処理装置。
  6. 前記重要度は前記音声情報において前記特徴語が出現する時間の直前に無音の時間があるか否かによって決定される、
    ことを特徴とする請求項1に記載の情報処理装置。
  7. 前記要約画像生成手段は、
    前記特徴画像の大きさが予め定められた閾値以下または未満の場合に、当該特徴画像に関連付けられる前記特徴語を表示させない、
    ことを特徴とする請求項1に記載の情報処理装置。
  8. 前記要約画像生成手段は、
    前記特徴画像の大きさが予め定められた閾値以下または未満の場合に、当該特徴画像に関連付けられる前記特徴語の一部を表示させる、
    ことを特徴とする請求項1に記載の情報処理装置。
  9. 音声情報及び画像情報を含み時間とともに変化する時系列情報を複数のパートに区分する区分手段、
    前記区分されたパートの特徴を示す特徴画像を当該パートに含まれる前記画像情報から取得する特徴画像取得手段、
    前記区分されたパートの特徴を示す特徴語を当該パートに含まれる前記音声情報に基づいて取得する特徴語取得手段、
    利用者による操作指示を受け付ける操作指示受付手段、
    前記区分されたパートの特徴語の重要度に応じた大きさでそれぞれが表示された複数の前記特徴画像であって前記特徴画像の大きさに応じた態様の前記特徴語が関連付けられた前記特徴画像を含む要約画像を生成し、前記特徴画像の大きさに応じて当該特徴画像に関連付けられる前記特徴語の表示を制限し、前記操作指示受付手段が、前記特徴語の表示の制限をされた前記特徴画像を指示する操作を受け付けると、前記表示の制限をされた前記特徴語を表示させた前記要約画像を生成する要約画像生成手段、
    としてコンピュータを機能させるためのプログラム。

JP2020096695A 2015-09-16 2020-06-03 情報処理装置及びプログラム Active JP6973567B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020096695A JP6973567B2 (ja) 2015-09-16 2020-06-03 情報処理装置及びプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015183453A JP2017058978A (ja) 2015-09-16 2015-09-16 情報処理装置及びプログラム
JP2020096695A JP6973567B2 (ja) 2015-09-16 2020-06-03 情報処理装置及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015183453A Division JP2017058978A (ja) 2015-09-16 2015-09-16 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2020162138A true JP2020162138A (ja) 2020-10-01
JP6973567B2 JP6973567B2 (ja) 2021-12-01

Family

ID=72640077

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020096695A Active JP6973567B2 (ja) 2015-09-16 2020-06-03 情報処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6973567B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08292965A (ja) * 1995-02-20 1996-11-05 Hitachi Ltd 映像支援システム
JPH10232884A (ja) * 1996-11-29 1998-09-02 Media Rinku Syst:Kk 映像ソフトウェア処理方法及び映像ソフトウェア処理装置
JP2000308008A (ja) * 1999-03-12 2000-11-02 Fuji Xerox Co Ltd ビデオのセグメント重要度を決定する方法及びフレーム・セットを限定領域にパックする方法
JP2002084492A (ja) * 2000-09-08 2002-03-22 Just Syst Corp 編集処理装置、及び編集処理プログラムが記憶された記憶媒体
WO2005050986A1 (ja) * 2003-11-19 2005-06-02 National Institute Of Information And Communications Technology, Independent Administrative Agency 映像内容の提示方法及び装置
JP2008148121A (ja) * 2006-12-12 2008-06-26 Yahoo Japan Corp 動画要約自動作成装置、方法、及びコンピュータ・プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08292965A (ja) * 1995-02-20 1996-11-05 Hitachi Ltd 映像支援システム
JPH10232884A (ja) * 1996-11-29 1998-09-02 Media Rinku Syst:Kk 映像ソフトウェア処理方法及び映像ソフトウェア処理装置
JP2000308008A (ja) * 1999-03-12 2000-11-02 Fuji Xerox Co Ltd ビデオのセグメント重要度を決定する方法及びフレーム・セットを限定領域にパックする方法
JP2002084492A (ja) * 2000-09-08 2002-03-22 Just Syst Corp 編集処理装置、及び編集処理プログラムが記憶された記憶媒体
WO2005050986A1 (ja) * 2003-11-19 2005-06-02 National Institute Of Information And Communications Technology, Independent Administrative Agency 映像内容の提示方法及び装置
JP2008148121A (ja) * 2006-12-12 2008-06-26 Yahoo Japan Corp 動画要約自動作成装置、方法、及びコンピュータ・プログラム

Also Published As

Publication number Publication date
JP6973567B2 (ja) 2021-12-01

Similar Documents

Publication Publication Date Title
US11188208B2 (en) Display apparatus for classifying and searching content, and method thereof
US11816111B2 (en) Methods, systems, and media for presenting related media content items
JP2011130279A (ja) コンテンツ提供サーバ、コンテンツ再生装置、コンテンツ提供方法、コンテンツ再生方法、プログラムおよびコンテンツ提供システム
CN111095939A (zh) 识别媒体项目的先前流传输部分以避免重复重放
JP5424930B2 (ja) 画像編集装置およびその制御方法およびプログラム
KR20210091082A (ko) 영상 처리 장치, 이의 제어 방법 및 컴퓨터 프로그램이 기록된 기록 매체
CN114095793A (zh) 一种视频播放方法、装置、计算机设备及存储介质
JP6973567B2 (ja) 情報処理装置及びプログラム
CN104270676B (zh) 一种信息处理方法及电子设备
WO2018012113A1 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2017058978A (ja) 情報処理装置及びプログラム
JP2017199058A (ja) 認識装置、映像コンテンツ提示システム、プログラム
JP6623905B2 (ja) サーバ装置、情報処理方法およびプログラム
TWI672946B (zh) 播放視頻的方法及裝置
WO2022201305A1 (ja) 画像処理装置、方法およびプログラム
US20170053615A1 (en) Server apparatus, information processing system, terminal apparatus, and non-transitory computer readable medium
CN108875315B (zh) 变换指纹以检测未授权媒体内容项的方法、系统和介质
US20240170024A1 (en) Information processing apparatus, information processing method, and non-transitory computer-readable storage medium
JP2005309526A (ja) クラスタリング処理のための入力データの構成方法及び装置及びプログラム
US20200159769A1 (en) Methods, systems, and media for combining classifier scores of a hierarchical set of entities
WO2020137371A1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
CN105242845A (zh) 一种信息处理方法及装置
CN116324905A (zh) 主观评分中的资格测试
CN114764321A (zh) 信息处理装置、记录介质及信息处理方法
CN116521925A (zh) 一种视频录播检索回放方法、装置、电子设备及介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200604

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211018

R150 Certificate of patent or registration of utility model

Ref document number: 6973567

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150