JP2014146066A5 - データ処理装置、データ処理方法及びプログラム - Google Patents
データ処理装置、データ処理方法及びプログラム Download PDFInfo
- Publication number
- JP2014146066A5 JP2014146066A5 JP2013012464A JP2013012464A JP2014146066A5 JP 2014146066 A5 JP2014146066 A5 JP 2014146066A5 JP 2013012464 A JP2013012464 A JP 2013012464A JP 2013012464 A JP2013012464 A JP 2013012464A JP 2014146066 A5 JP2014146066 A5 JP 2014146066A5
- Authority
- JP
- Japan
- Prior art keywords
- data
- keyword
- specifying
- data processing
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims 8
- 238000000034 method Methods 0.000 claims description 3
- 230000000875 corresponding Effects 0.000 claims 10
- 238000000605 extraction Methods 0.000 claims 5
- 239000000284 extract Substances 0.000 claims 1
- 238000007796 conventional method Methods 0.000 description 1
Description
本発明は、音声データ及び動画データを処理する技術に関する。
しかしながら、従来の議事録文書への写真等の挿入は、編集者による手作業により行われており、作業効率が悪いという問題があった。また、上述の自動議事録生成システムにおいては、テキストデータは生成できるものの、話題に即した静止画等をテキストデータに対して付加することができない。
本発明はこのような問題点に鑑みなされたもので、閲覧者にとって利便性の高いデータを提示することを目的とする。
そこで、本発明は、互いに関連付けられている音声データと動画データとを処理するデータ処理装置であって、キーワードを決定する決定手段と、前記決定されたキーワードに合致する音声データを特定する特定手段と、前記特定された音声データに関連付けられている動画データの画像を提示する提示手段と、を有することを特徴とする。
本発明によれば、閲覧者にとって利便性の高いデータを提示することができる。
Claims (19)
- 互いに関連付けられている音声データと動画データとを処理するデータ処理装置であって、
キーワードを決定する決定手段と、
前記決定されたキーワードに合致する音声データを特定する特定手段と、
前記特定された音声データに関連付けられている動画データの画像を提示する提示手段と、
を有することを特徴とするデータ処理装置。 - 前記特定された音声データの発話時刻を特定し、当該特定された発話時刻に対応する動画データの画像を抽出する抽出手段を有し、
前記提示手段は、前記抽出された画像を提示することを特徴とする請求項1に記載のデータ処理装置。 - 前記特定手段によって、前記決定されたキーワードに合致する音声データが複数特定された場合、前記提示手段は、前記特定された複数の音声データそれぞれに関連付けられている動画データの画像を複数提示することを特徴とする請求項1又は2に記載のデータ処理装置。
- 前記提示手段は、前記決定されたキーワードと前記画像とを共に提示することを特徴とする請求項1乃至3何れか1項に記載のデータ処理装置。
- 音声認識処理により、音声データからテキストデータを生成する音声認識手段と、
前記テキストデータにおいて、キーワードを検索するキーワード検索手段と、
前記テキストデータから検出された前記キーワードに対応する音声データの時間位置を特定する時間位置特定手段と、
前記時間位置に基づいて、動画データから静止画データを抽出する静止画データ抽出手段と、
前記テキストデータの前記キーワードに対応する位置に前記静止画データを配置した文書データを生成する文書データ生成手段と
を有することを特徴とするデータ処理装置。 - 前記静止画データ抽出手段は、前記動画データのうち前記時間位置に対応付けられている静止画データを抽出することを特徴とする請求項5に記載のデータ処理装置。
- 前記テキストデータを段落単位に分割する分割手段をさらに有し、
前記文書データ生成手段は、前記テキストデータを前記段落単位で配置し、前記静止画データを、前記キーワードが含まれる前記段落に対応する位置に配置した前記文書データを生成することを特徴とする請求項5又は6に記載のデータ処理装置。 - 前記段落に対応する前記動画データの時間範囲を特定する時間範囲特定手段をさらに有し、
前記静止画データ抽出手段は、前記時間範囲内において複数の前記キーワードが検出された場合に、時間経過に伴う前記動画データの画像の変化に基づいて、前記時間範囲に対応する前記動画データから前記静止画データを抽出することを特徴とする請求項7に記載のデータ処理装置。 - 前記分割手段は、前記テキストデータの生成元の前記音声データに基づいて、前記テキストデータを前記段落単位に分割することを特徴とする請求項7又は8に記載のデータ処理装置。
- 前記テキストデータの前記生成元の前記音声データの無音区間を特定する無音区間特定手段をさらに有し、
前記分割手段は、前記無音区間に対応する前記テキストデータの位置を境界位置として、前記テキストデータを前記段落単位に分割することを特徴とする請求項9に記載のデータ処理装置。 - 前記音声認識手段は、第1の音声データ及び第2の音声データそれぞれから第1のテキストデータ及び第2のテキストデータを生成し、
前記無音区間特定手段は、前記第1の音声データ及び前記第2の音声データそれぞれから前記無音区間を特定し、
前記分割手段は、前記第1の音声データの無音区間に対応し、且つ前記第2の音声データの無音区間に対応しない、前記第1のテキストデータの範囲を1つの段落として前記第1のテキストデータを分割することを特徴とする請求項10に記載のデータ処理装置。 - 前記無音区間特定手段は、無音状態が規定時間以上継続する場合に、前記無音状態が継続する区間を前記無音区間として特定することを特徴とする請求項10又は11に記載のデータ処理装置。
- 前記音声データと前記動画データとに関連する文書データを記憶する記憶手段と、
前記文書データに基づいて前記キーワードを決定するキーワード決定手段と
をさらに有し、
前記キーワード検索手段は、前記キーワード決定手段により決定された前記キーワードを検索することを特徴とする請求項5乃至12何れか1項に記載のデータ処理装置。 - 互いに関連付けられている音声データと動画データとを処理するデータ処理方法であって、
キーワードを決定する決定ステップと、
前記決定されたキーワードに合致する音声データを特定する特定ステップと、
前記特定された音声データに関連付けられている動画データの画像を提示する提示ステップと、
を含むことを特徴とするデータ処理方法。 - 前記特定された音声データの発話時刻を特定し、当該特定された発話時刻に対応する動画データの画像を抽出する抽出ステップを含み、
前記提示ステップは、前記抽出された画像を提示することを特徴とする請求項14に記載のデータ処理方法。 - 前記特定ステップによって、前記決定されたキーワードに合致する音声データが複数特定された場合、前記提示ステップは、前記特定された複数の音声データそれぞれに関連付けられている動画データの画像を複数提示することを特徴とする請求項14又は15に記載のデータ処理方法。
- 前記提示ステップは、前記決定されたキーワードと前記画像とを共に提示することを特徴とする請求項14乃至16の何れか1項に記載のデータ処理方法。
- データ処理方法であって、
音声認識処理により、音声データからテキストデータを生成する音声認識ステップと、前記テキストデータにおいて、キーワードを検索するキーワード検索ステップと、
前記テキストデータから検出された前記キーワードに対応する音声データの時間位置を特定する時間位置特定ステップと、
前記時間位置に基づいて、動画データから静止画データを抽出する静止画データ抽出ステップと、
前記テキストデータの前記キーワードに対応する位置に前記静止画データを配置した文書データを生成する文書データ生成ステップと、
を含むことを特徴とするデータ処理方法。 - コンピュータを、請求項1乃至13何れか1項に記載の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013012464A JP6095381B2 (ja) | 2013-01-25 | 2013-01-25 | データ処理装置、データ処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013012464A JP6095381B2 (ja) | 2013-01-25 | 2013-01-25 | データ処理装置、データ処理方法及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2014146066A JP2014146066A (ja) | 2014-08-14 |
JP2014146066A5 true JP2014146066A5 (ja) | 2016-03-10 |
JP6095381B2 JP6095381B2 (ja) | 2017-03-15 |
Family
ID=51426311
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013012464A Active JP6095381B2 (ja) | 2013-01-25 | 2013-01-25 | データ処理装置、データ処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6095381B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6374771B2 (ja) * | 2014-11-19 | 2018-08-15 | Kddi株式会社 | ユーザの記憶が曖昧なレコードを検索する検索装置、プログラム及び方法 |
JP6627315B2 (ja) * | 2015-08-04 | 2020-01-08 | コニカミノルタ株式会社 | 情報処理装置、情報処理方法、および制御プログラム |
JP6897286B2 (ja) * | 2016-07-11 | 2021-06-30 | 株式会社リコー | 情報処理システム、情報処理装置、情報処理方法およびプログラム |
KR101856192B1 (ko) * | 2016-10-06 | 2018-06-20 | 주식회사 카카오 | 자막 생성 시스템, 자막 생성 방법, 그리고 콘텐트 생성 프로그램 |
JP2019176375A (ja) * | 2018-03-29 | 2019-10-10 | 株式会社アドバンスト・メディア | 動画出力装置、動画出力方法および動画出力プログラム |
JP6949075B2 (ja) * | 2018-05-08 | 2021-10-13 | 日本放送協会 | 音声認識誤り修正支援装置およびそのプログラム |
JP7131075B2 (ja) * | 2018-05-24 | 2022-09-06 | 富士フイルムビジネスイノベーション株式会社 | 検索処理装置およびプログラム |
CN112270918A (zh) * | 2020-10-22 | 2021-01-26 | 北京百度网讯科技有限公司 | 信息处理方法、装置、系统、电子设备及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11331760A (ja) * | 1998-05-15 | 1999-11-30 | Nippon Telegr & Teleph Corp <Ntt> | 映像の要約方法および記憶媒体 |
JP3621686B2 (ja) * | 2002-03-06 | 2005-02-16 | 日本電信電話株式会社 | データ編集方法、データ編集装置、データ編集プログラム |
JP2006333065A (ja) * | 2005-05-26 | 2006-12-07 | Fujifilm Holdings Corp | 写真アルバム作成方法 |
JP2007150724A (ja) * | 2005-11-28 | 2007-06-14 | Toshiba Corp | 映像視聴支援システムおよび方法 |
JP4920395B2 (ja) * | 2006-12-12 | 2012-04-18 | ヤフー株式会社 | 動画要約自動作成装置、方法、及びコンピュータ・プログラム |
JP4873018B2 (ja) * | 2009-01-09 | 2012-02-08 | ソニー株式会社 | データ処理装置、データ処理方法、及び、プログラム |
-
2013
- 2013-01-25 JP JP2013012464A patent/JP6095381B2/ja active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2014146066A5 (ja) | データ処理装置、データ処理方法及びプログラム | |
US8484017B1 (en) | Identifying media content | |
US10943600B2 (en) | Systems and methods for interrelating text transcript information with video and/or audio information | |
RU2016115348A (ru) | Мобильный видеопоиск | |
JP2017505475A5 (ja) | ||
EP3767620A3 (en) | Speech endpointing based on word comparisons | |
WO2018014109A8 (en) | System and method for analyzing and searching for features associated with objects | |
GB2541581A (en) | Retrieving multi-generational stored data in a dispersed storage network | |
WO2015184196A3 (en) | Speech summary and action item generation | |
US10909972B2 (en) | Spoken language understanding using dynamic vocabulary | |
JP2015109068A5 (ja) | ||
KR102029276B1 (ko) | 환경 콘텍스트를 이용한 질문 답변 | |
JP2017503273A5 (ja) | ||
US10135950B2 (en) | Creating a cinematic storytelling experience using network-addressable devices | |
JP2015206906A (ja) | 音声検索方法、音声検索装置、並びに、音声検索装置用のプログラム | |
WO2016090960A1 (zh) | 搜索建议的展示方法和装置 | |
JP2016535335A5 (ja) | ||
JP2015508205A5 (ja) | ||
GB2541343A (en) | Method and system for generating references to related video | |
JP2016085697A5 (ja) | ||
US9508386B2 (en) | Method and apparatus for synchronizing audio and video signals | |
US20200065589A1 (en) | Automatic tagging of images using speech recognition | |
GB2560785A (en) | Contextually disambiguating queries | |
EP2706470A1 (en) | Answering questions using environmental context | |
JP2014134860A5 (ja) |