JP2014146066A5 - データ処理装置、データ処理方法及びプログラム - Google Patents

データ処理装置、データ処理方法及びプログラム Download PDF

Info

Publication number
JP2014146066A5
JP2014146066A5 JP2013012464A JP2013012464A JP2014146066A5 JP 2014146066 A5 JP2014146066 A5 JP 2014146066A5 JP 2013012464 A JP2013012464 A JP 2013012464A JP 2013012464 A JP2013012464 A JP 2013012464A JP 2014146066 A5 JP2014146066 A5 JP 2014146066A5
Authority
JP
Japan
Prior art keywords
data
keyword
specifying
data processing
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013012464A
Other languages
English (en)
Other versions
JP2014146066A (ja
JP6095381B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2013012464A priority Critical patent/JP6095381B2/ja
Priority claimed from JP2013012464A external-priority patent/JP6095381B2/ja
Publication of JP2014146066A publication Critical patent/JP2014146066A/ja
Publication of JP2014146066A5 publication Critical patent/JP2014146066A5/ja
Application granted granted Critical
Publication of JP6095381B2 publication Critical patent/JP6095381B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、音声データ及び動画データを処理する技術に関する。
しかしながら、従来の議事録文書への写真等の挿入は、編集者による手作業により行われており、作業効率が悪いという問題があった。また、上述の自動議事録生成システムにおいては、テキストデータは生成できるものの、話題に即した静止画等をテキストデータに対して付加することができない
本発明はこのような問題点に鑑みなされたもので、閲覧者にとって利便性の高いデータを提示することを目的とする。
そこで、本発明は、互いに関連付けられている音声データと動画データとを処理するデータ処理装置であって、キーワードを決定する決定手段と、前記決定されたキーワードに合致する音声データを特定する特定手段と、前記特定された音声データに関連付けられている動画データの画像を提示する提示手段と、を有することを特徴とする。
本発明によれば、閲覧者にとって利便性の高いデータを提示することができる。

Claims (19)

  1. 互いに関連付けられている音声データと動画データとを処理するデータ処理装置であって、
    キーワードを決定する決定手段と、
    前記決定されたキーワードに合致する音声データを特定する特定手段と、
    前記特定された音声データに関連付けられている動画データの画像を提示する提示手段と、
    を有することを特徴とするデータ処理装置。
  2. 前記特定された音声データの発話時刻を特定し、当該特定された発話時刻に対応する動画データの画像を抽出する抽出手段を有し、
    前記提示手段は、前記抽出された画像を提示することを特徴とする請求項1に記載のデータ処理装置。
  3. 前記特定手段によって、前記決定されたキーワードに合致する音声データが複数特定された場合、前記提示手段は、前記特定された複数の音声データそれぞれに関連付けられている動画データの画像を複数提示することを特徴とする請求項1又は2に記載のデータ処理装置。
  4. 前記提示手段は、前記決定されたキーワードと前記画像とを共に提示することを特徴とする請求項1乃至3何れか1項に記載のデータ処理装置。
  5. 音声認識処理により、音声データからテキストデータを生成する音声認識手段と、
    前記テキストデータにおいて、キーワードを検索するキーワード検索手段と、
    前記テキストデータから検出された前記キーワードに対応する音声データの時間位置を特定する時間位置特定手段と、
    前記時間位置に基づいて、動画データから静止画データを抽出する静止画データ抽出手段と、
    前記テキストデータの前記キーワードに対応する位置に前記静止画データを配置した文書データを生成する文書データ生成手段と
    を有することを特徴とするデータ処理装置。
  6. 前記静止画データ抽出手段は、前記動画データのうち前記時間位置に対応付けられている静止画データを抽出することを特徴とする請求項5に記載のデータ処理装置。
  7. 前記テキストデータを段落単位に分割する分割手段をさらに有し、
    前記文書データ生成手段は、前記テキストデータを前記段落単位で配置し、前記静止画データを、前記キーワードが含まれる前記段落に対応する位置に配置した前記文書データを生成することを特徴とする請求項5又は6に記載のデータ処理装置。
  8. 前記段落に対応する前記動画データの時間範囲を特定する時間範囲特定手段をさらに有し、
    前記静止画データ抽出手段は、前記時間範囲内において複数の前記キーワードが検出された場合に、時間経過に伴う前記動画データの画像の変化に基づいて、前記時間範囲に対応する前記動画データから前記静止画データを抽出することを特徴とする請求項7に記載のデータ処理装置。
  9. 前記分割手段は、前記テキストデータの生成元の前記音声データに基づいて、前記テキストデータを前記段落単位に分割することを特徴とする請求項7又は8に記載のデータ処理装置。
  10. 前記テキストデータの前記生成元の前記音声データの無音区間を特定する無音区間特定手段をさらに有し、
    前記分割手段は、前記無音区間に対応する前記テキストデータの位置を境界位置として、前記テキストデータを前記段落単位に分割することを特徴とする請求項9に記載のデータ処理装置。
  11. 前記音声認識手段は、第1の音声データ及び第2の音声データそれぞれから第1のテキストデータ及び第2のテキストデータを生成し、
    前記無音区間特定手段は、前記第1の音声データ及び前記第2の音声データそれぞれから前記無音区間を特定し、
    前記分割手段は、前記第1の音声データの無音区間に対応し、且つ前記第2の音声データの無音区間に対応しない、前記第1のテキストデータの範囲を1つの段落として前記第1のテキストデータを分割することを特徴とする請求項10に記載のデータ処理装置。
  12. 前記無音区間特定手段は、無音状態が規定時間以上継続する場合に、前記無音状態が継続する区間を前記無音区間として特定することを特徴とする請求項10又は11に記載のデータ処理装置。
  13. 前記音声データと前記動画データとに関連する文書データを記憶する記憶手段と、
    前記文書データに基づいて前記キーワードを決定するキーワード決定手段と
    をさらに有し、
    前記キーワード検索手段は、前記キーワード決定手段により決定された前記キーワードを検索することを特徴とする請求項5乃至12何れか1項に記載のデータ処理装置。
  14. 互いに関連付けられている音声データと動画データとを処理するデータ処理方法であって、
    キーワードを決定する決定ステップと、
    前記決定されたキーワードに合致する音声データを特定する特定ステップと、
    前記特定された音声データに関連付けられている動画データの画像を提示する提示ステップと、
    を含むことを特徴とするデータ処理方法。
  15. 前記特定された音声データの発話時刻を特定し、当該特定された発話時刻に対応する動画データの画像を抽出する抽出ステップを含み、
    前記提示ステップは、前記抽出された画像を提示することを特徴とする請求項14に記載のデータ処理方法。
  16. 前記特定ステップによって、前記決定されたキーワードに合致する音声データが複数特定された場合、前記提示ステップは、前記特定された複数の音声データそれぞれに関連付けられている動画データの画像を複数提示することを特徴とする請求項14又は15に記載のデータ処理方法。
  17. 前記提示ステップは、前記決定されたキーワードと前記画像とを共に提示することを特徴とする請求項14乃至16の何れか1項に記載のデータ処理方法。
  18. データ処理方法であって、
    音声認識処理により、音声データからテキストデータを生成する音声認識ステップと、前記テキストデータにおいて、キーワードを検索するキーワード検索ステップと、
    前記テキストデータから検出された前記キーワードに対応する音声データの時間位置を特定する時間位置特定ステップと、
    前記時間位置に基づいて、動画データから静止画データを抽出する静止画データ抽出ステップと、
    前記テキストデータの前記キーワードに対応する位置に前記静止画データを配置した文書データを生成する文書データ生成ステップと、
    を含むことを特徴とするデータ処理方法。
  19. コンピュータを、請求項1乃至13何れか1項に記載の各手段として機能させるためのプログラム。
JP2013012464A 2013-01-25 2013-01-25 データ処理装置、データ処理方法及びプログラム Active JP6095381B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013012464A JP6095381B2 (ja) 2013-01-25 2013-01-25 データ処理装置、データ処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013012464A JP6095381B2 (ja) 2013-01-25 2013-01-25 データ処理装置、データ処理方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2014146066A JP2014146066A (ja) 2014-08-14
JP2014146066A5 true JP2014146066A5 (ja) 2016-03-10
JP6095381B2 JP6095381B2 (ja) 2017-03-15

Family

ID=51426311

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013012464A Active JP6095381B2 (ja) 2013-01-25 2013-01-25 データ処理装置、データ処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6095381B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6374771B2 (ja) * 2014-11-19 2018-08-15 Kddi株式会社 ユーザの記憶が曖昧なレコードを検索する検索装置、プログラム及び方法
JP6627315B2 (ja) * 2015-08-04 2020-01-08 コニカミノルタ株式会社 情報処理装置、情報処理方法、および制御プログラム
JP6897286B2 (ja) * 2016-07-11 2021-06-30 株式会社リコー 情報処理システム、情報処理装置、情報処理方法およびプログラム
KR101856192B1 (ko) * 2016-10-06 2018-06-20 주식회사 카카오 자막 생성 시스템, 자막 생성 방법, 그리고 콘텐트 생성 프로그램
JP2019176375A (ja) * 2018-03-29 2019-10-10 株式会社アドバンスト・メディア 動画出力装置、動画出力方法および動画出力プログラム
JP6949075B2 (ja) * 2018-05-08 2021-10-13 日本放送協会 音声認識誤り修正支援装置およびそのプログラム
JP7131075B2 (ja) * 2018-05-24 2022-09-06 富士フイルムビジネスイノベーション株式会社 検索処理装置およびプログラム
CN112270918A (zh) * 2020-10-22 2021-01-26 北京百度网讯科技有限公司 信息处理方法、装置、系统、电子设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11331760A (ja) * 1998-05-15 1999-11-30 Nippon Telegr & Teleph Corp <Ntt> 映像の要約方法および記憶媒体
JP3621686B2 (ja) * 2002-03-06 2005-02-16 日本電信電話株式会社 データ編集方法、データ編集装置、データ編集プログラム
JP2006333065A (ja) * 2005-05-26 2006-12-07 Fujifilm Holdings Corp 写真アルバム作成方法
JP2007150724A (ja) * 2005-11-28 2007-06-14 Toshiba Corp 映像視聴支援システムおよび方法
JP4920395B2 (ja) * 2006-12-12 2012-04-18 ヤフー株式会社 動画要約自動作成装置、方法、及びコンピュータ・プログラム
JP4873018B2 (ja) * 2009-01-09 2012-02-08 ソニー株式会社 データ処理装置、データ処理方法、及び、プログラム

Similar Documents

Publication Publication Date Title
JP2014146066A5 (ja) データ処理装置、データ処理方法及びプログラム
US8484017B1 (en) Identifying media content
US10943600B2 (en) Systems and methods for interrelating text transcript information with video and/or audio information
RU2016115348A (ru) Мобильный видеопоиск
JP2017505475A5 (ja)
EP3767620A3 (en) Speech endpointing based on word comparisons
WO2018014109A8 (en) System and method for analyzing and searching for features associated with objects
GB2541581A (en) Retrieving multi-generational stored data in a dispersed storage network
WO2015184196A3 (en) Speech summary and action item generation
US10909972B2 (en) Spoken language understanding using dynamic vocabulary
JP2015109068A5 (ja)
KR102029276B1 (ko) 환경 콘텍스트를 이용한 질문 답변
JP2017503273A5 (ja)
US10135950B2 (en) Creating a cinematic storytelling experience using network-addressable devices
JP2015206906A (ja) 音声検索方法、音声検索装置、並びに、音声検索装置用のプログラム
WO2016090960A1 (zh) 搜索建议的展示方法和装置
JP2016535335A5 (ja)
JP2015508205A5 (ja)
GB2541343A (en) Method and system for generating references to related video
JP2016085697A5 (ja)
US9508386B2 (en) Method and apparatus for synchronizing audio and video signals
US20200065589A1 (en) Automatic tagging of images using speech recognition
GB2560785A (en) Contextually disambiguating queries
EP2706470A1 (en) Answering questions using environmental context
JP2014134860A5 (ja)