JP2012150363A - メッセージ映像編集プログラムおよびメッセージ映像編集装置 - Google Patents
メッセージ映像編集プログラムおよびメッセージ映像編集装置 Download PDFInfo
- Publication number
- JP2012150363A JP2012150363A JP2011010248A JP2011010248A JP2012150363A JP 2012150363 A JP2012150363 A JP 2012150363A JP 2011010248 A JP2011010248 A JP 2011010248A JP 2011010248 A JP2011010248 A JP 2011010248A JP 2012150363 A JP2012150363 A JP 2012150363A
- Authority
- JP
- Japan
- Prior art keywords
- data
- video
- message
- audio data
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
Abstract
【解決手段】映像データに付随し時刻毎に分割された音声データの発声内容を示すと共に前記映像データと前記発声内容とを対応付ける対応情報を格納する素材情報データベース17と、ユーザにより入力されたテキストデータを構成する最小単位のテキストデータにそれぞれ対応する発声内容の音声データおよび前記音声データに対応付けられた映像データを、対応情報に基づいて元映像データベース3から抽出する素材選択部23と、前記抽出した音声データおよび映像データを前記テキストデータの並び順に連結して音声データが付随した映像データの候補を提示する候補提示部25と、を備える。
【選択図】図1
Description
3 元映像DB
5 音声認識部
7 音響モデル
9 言語モデル
11 音声調整部
13 音響モデル学習部
15 素材情報付加部
17 素材情報DB
19 メッセージ入力部
21 条件指定部
23 素材選択部
25 候補提示部
27 候補選択部
29 映像出力部
Claims (14)
- 複数の映像データを用いてメッセージ映像を編集するメッセージ映像編集プログラムであって、
映像データに付随し時刻毎に分割された音声データの発声内容を示すと共に前記映像データと前記発声内容とを対応付ける対応情報を素材情報データベースに格納する処理と、
ユーザにより入力されたテキストデータを構成する最小単位のテキストデータにそれぞれ対応する発声内容の音声データおよび前記音声データに対応付けられた映像データを、前記対応情報を用いて映像データベースから抽出する処理と、
前記抽出した音声データおよび映像データを前記テキストデータの並び順に連結して音声データが付随した映像データの候補を提示する処理と、の一連の処理を、コンピュータに読み込み可能および実行可能にコマンド化したことを特徴とするメッセージ映像編集プログラム。 - 前記映像データおよび音声データを抽出する際の絞り込み条件を指定する処理を更に含むことを特徴とする請求項1記載のメッセージ映像編集プログラム。
- 前記指定された条件を満たす音声データからいずれかの音声データを無作為に抽出する処理を更に含むことを特徴とする請求項2記載のメッセージ映像編集プログラム。
- 前記提示された音声データが付随した映像データの候補のいずれか一つを選択する処理と、
前記選択された音声データが付随した映像データを出力する処理と、を更に含むことを特徴とする請求項1記載のメッセージ映像編集プログラム。 - 映像データに付随する音声データに対して音声認識処理を実行し、時刻毎に分割した音声データの発声内容を取得する処理と、
前記取得した時刻毎の音声データの発声内容を示すと共に前記映像データと前記発声内容とを対応付ける対応情報を、前記素材情報データベースに格納する処理と、を更に含むことを特徴とする請求項1記載のメッセージ映像編集プログラム。 - 不特定の話者を対象とした汎用音響モデルまたは特定の話者を対象とした特定話者音響モデルを用いて、話者を特定する音声認識処理と、
前記特定された話者を示す話者特定情報を、前記対応情報と共に前記素材情報データベースに格納する処理と、を更に含むことを特徴とする請求項5記載のメッセージ映像編集プログラム。 - 前記映像データに付随する音声データと、前記取得した時刻毎の音声データとを用いて、音響モデル学習を実行する処理と、を更に含むことを特徴とする請求項5記載のメッセージ映像編集プログラム。
- 複数の映像データを用いてメッセージ映像を編集するメッセージ映像編集装置であって、
映像データに付随し時刻毎に分割された音声データの発声内容を示すと共に前記映像データと前記発声内容とを対応付ける対応情報を格納する素材情報データベースと、
ユーザにより入力されたテキストデータを構成する最小単位のテキストデータにそれぞれ対応する発声内容の音声データおよび前記音声データに対応付けられた映像データを、前記対応情報を用いて映像データベースから抽出する素材選択部と、
前記抽出した音声データおよび映像データを前記テキストデータの並び順に連結して音声データが付随した映像データの候補を提示する候補提示部と、を備えることを特徴とするメッセージ映像編集装置。 - 前記映像データおよび音声データを抽出する際の絞り込み条件を指定する条件指定部を更に備えることを特徴とする請求項8記載のメッセージ映像編集装置。
- 前記素材選択部は、前記指定された条件を満たす音声データからいずれかの音声データを無作為に抽出することを特徴とする請求項9記載のメッセージ映像編集装置。
- 前記候補提示部により提示された音声データが付随した映像データの候補のいずれか一つを選択する候補選択部と、
前記候補選択部により選択された音声データが付随した映像データを出力する映像出力部と、を更に備えることを特徴とする請求項8記載のメッセージ映像編集装置。 - 映像データに付随する音声データに対して音声認識処理を実行し、時刻毎に分割した音声データの発声内容を取得する音声認識部と、
前記取得した時刻毎の音声データの発声内容を示すと共に前記映像データと前記発声内容とを対応付ける対応情報を、前記素材情報データベースに格納する素材情報付加部と、を更に備えることを特徴とする請求項8記載のメッセージ映像編集装置。 - 前記音声認識部は、不特定の話者を対象とした汎用音響モデルまたは特定の話者を対象とした特定話者音響モデルを用いて、話者を特定する音声認識処理を実行し、
前記素材情報付加部は、前記特定された話者を示す話者特定情報を、前記対応情報と共に前記素材情報データベースに格納することを特徴とする請求項12記載のメッセージ映像編集装置。 - 前記映像データに付随する音声データと、前記取得した時刻毎の音声データとを用いて、音響モデル学習を実行する音響モデル学習部を更に備えることを特徴とする請求項12記載のメッセージ映像編集装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011010248A JP2012150363A (ja) | 2011-01-20 | 2011-01-20 | メッセージ映像編集プログラムおよびメッセージ映像編集装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011010248A JP2012150363A (ja) | 2011-01-20 | 2011-01-20 | メッセージ映像編集プログラムおよびメッセージ映像編集装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012150363A true JP2012150363A (ja) | 2012-08-09 |
Family
ID=46792650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011010248A Pending JP2012150363A (ja) | 2011-01-20 | 2011-01-20 | メッセージ映像編集プログラムおよびメッセージ映像編集装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012150363A (ja) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05313686A (ja) * | 1992-04-02 | 1993-11-26 | Sony Corp | 表示制御装置 |
JPH06348811A (ja) * | 1993-06-07 | 1994-12-22 | Sharp Corp | 動画像表示装置 |
JPH09130736A (ja) * | 1995-11-02 | 1997-05-16 | Sony Corp | 撮像装置及び編集装置 |
JP2001155467A (ja) * | 1999-11-29 | 2001-06-08 | Just Syst Corp | 編集処理装置、及び編集処理プログラムが記憶された記憶媒体 |
JP2003259320A (ja) * | 2002-03-05 | 2003-09-12 | Matsushita Electric Ind Co Ltd | 映像音声合成装置 |
JP2004361965A (ja) * | 1997-05-08 | 2004-12-24 | Korea Electronics Telecommun | 多重媒体との連動のためのテキスト/音声変換器及びその入力データ構造化方法 |
JP2005128177A (ja) * | 2003-10-22 | 2005-05-19 | Ace:Kk | 発音学習支援方法、学習者端末及び処理プログラム並びに該プログラムを記録した記録媒体 |
JP2005522074A (ja) * | 2002-03-25 | 2005-07-21 | ヒューレット・パッカード・カンパニー | 話者識別に基づくビデオのインデックスシステムおよび方法 |
JP2005202425A (ja) * | 2005-02-21 | 2005-07-28 | Daiichikosho Co Ltd | 楽曲の伴奏音と歌詞字幕映像を同期出力する装置 |
JP2006133559A (ja) * | 2004-11-08 | 2006-05-25 | Nippon Telegr & Teleph Corp <Ntt> | 録音編集・テキスト音声合成併用型音声合成装置、録音編集・テキスト音声合成併用型音声合成プログラム、記録媒体 |
JP2006235671A (ja) * | 2005-02-22 | 2006-09-07 | Norinaga Tsukiji | 会話装置及びコンピュータ読み取り可能な記録媒体。 |
JP2007295218A (ja) * | 2006-04-25 | 2007-11-08 | Nippon Hoso Kyokai <Nhk> | ノンリニア編集装置およびそのプログラム |
JP2008046425A (ja) * | 2006-08-17 | 2008-02-28 | National Institute Of Information & Communication Technology | 印象表現出力装置及び方法 |
JP2009103945A (ja) * | 2007-10-24 | 2009-05-14 | Nec Electronics Corp | 映像コンテンツ処理装置およびプログラム |
-
2011
- 2011-01-20 JP JP2011010248A patent/JP2012150363A/ja active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05313686A (ja) * | 1992-04-02 | 1993-11-26 | Sony Corp | 表示制御装置 |
JPH06348811A (ja) * | 1993-06-07 | 1994-12-22 | Sharp Corp | 動画像表示装置 |
JPH09130736A (ja) * | 1995-11-02 | 1997-05-16 | Sony Corp | 撮像装置及び編集装置 |
JP2004361965A (ja) * | 1997-05-08 | 2004-12-24 | Korea Electronics Telecommun | 多重媒体との連動のためのテキスト/音声変換器及びその入力データ構造化方法 |
JP2001155467A (ja) * | 1999-11-29 | 2001-06-08 | Just Syst Corp | 編集処理装置、及び編集処理プログラムが記憶された記憶媒体 |
JP2003259320A (ja) * | 2002-03-05 | 2003-09-12 | Matsushita Electric Ind Co Ltd | 映像音声合成装置 |
JP2005522074A (ja) * | 2002-03-25 | 2005-07-21 | ヒューレット・パッカード・カンパニー | 話者識別に基づくビデオのインデックスシステムおよび方法 |
JP2005128177A (ja) * | 2003-10-22 | 2005-05-19 | Ace:Kk | 発音学習支援方法、学習者端末及び処理プログラム並びに該プログラムを記録した記録媒体 |
JP2006133559A (ja) * | 2004-11-08 | 2006-05-25 | Nippon Telegr & Teleph Corp <Ntt> | 録音編集・テキスト音声合成併用型音声合成装置、録音編集・テキスト音声合成併用型音声合成プログラム、記録媒体 |
JP2005202425A (ja) * | 2005-02-21 | 2005-07-28 | Daiichikosho Co Ltd | 楽曲の伴奏音と歌詞字幕映像を同期出力する装置 |
JP2006235671A (ja) * | 2005-02-22 | 2006-09-07 | Norinaga Tsukiji | 会話装置及びコンピュータ読み取り可能な記録媒体。 |
JP2007295218A (ja) * | 2006-04-25 | 2007-11-08 | Nippon Hoso Kyokai <Nhk> | ノンリニア編集装置およびそのプログラム |
JP2008046425A (ja) * | 2006-08-17 | 2008-02-28 | National Institute Of Information & Communication Technology | 印象表現出力装置及び方法 |
JP2009103945A (ja) * | 2007-10-24 | 2009-05-14 | Nec Electronics Corp | 映像コンテンツ処理装置およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108305643B (zh) | 情感信息的确定方法和装置 | |
US8396714B2 (en) | Systems and methods for concatenation of words in text to speech synthesis | |
US8712776B2 (en) | Systems and methods for selective text to speech synthesis | |
US8355919B2 (en) | Systems and methods for text normalization for text to speech synthesis | |
US9154629B2 (en) | System and method for generating personalized tag recommendations for tagging audio content | |
US10510342B2 (en) | Voice recognition server and control method thereof | |
US10224030B1 (en) | Dynamic gazetteers for personalized entity recognition | |
US9489944B2 (en) | Information processing device, method and computer program product for processing voice recognition data | |
JP2009216986A (ja) | 音声データ検索システム及び音声データの検索方法 | |
JP5779032B2 (ja) | 話者分類装置、話者分類方法および話者分類プログラム | |
JP2014063088A (ja) | 音声認識装置、音声認識システム、音声認識方法および音声認識プログラム | |
CN110740275B (zh) | 一种非线性编辑系统 | |
JP2012194245A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP6305629B2 (ja) | 分類装置、方法及びプログラム | |
JP2016102920A (ja) | 文書記録システム及び文書記録プログラム | |
CN109326284B (zh) | 语音搜索的方法、装置和存储介质 | |
US20160005421A1 (en) | Language analysis based on word-selection, and language analysis apparatus | |
US11967248B2 (en) | Conversation-based foreign language learning method using reciprocal speech transmission through speech recognition function and TTS function of terminal | |
CN109376145B (zh) | 影视对白数据库的建立方法、建立装置及存储介质 | |
CN110992984B (zh) | 音频处理方法及装置、存储介质 | |
JP5997813B2 (ja) | 話者分類装置、話者分類方法および話者分類プログラム | |
JP6322125B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
JP2013061591A (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP5713782B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
KR101920653B1 (ko) | 비교음 생성을 통한 어학학습방법 및 어학학습프로그램 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130816 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140401 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140514 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141202 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150331 |