JP2008089628A - 録音ナレーション自動出力システム - Google Patents

録音ナレーション自動出力システム Download PDF

Info

Publication number
JP2008089628A
JP2008089628A JP2006266953A JP2006266953A JP2008089628A JP 2008089628 A JP2008089628 A JP 2008089628A JP 2006266953 A JP2006266953 A JP 2006266953A JP 2006266953 A JP2006266953 A JP 2006266953A JP 2008089628 A JP2008089628 A JP 2008089628A
Authority
JP
Japan
Prior art keywords
narration
voice
data
recording
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006266953A
Other languages
English (en)
Inventor
Makoto Umeda
誠 梅田
Naotaka Nomura
直孝 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daiichikosho Co Ltd
Original Assignee
Daiichikosho Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daiichikosho Co Ltd filed Critical Daiichikosho Co Ltd
Priority to JP2006266953A priority Critical patent/JP2008089628A/ja
Publication of JP2008089628A publication Critical patent/JP2008089628A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)

Abstract

【課題】本発明は、所定内容の台詞が音声出力され、台詞の合間でナレーションを出力させる録音ナレーション自動出力システムに関し、ナレーションによるエンターテイメント性の向上を図ることを目的とする。
【解決手段】所定の台詞キーワードに対応付けられた録音ナレーションデータをNRデータDB35に記憶しおき、音声処理部20の音声認識手段31で入力した台詞音声を解析した音声データと、照合テーブル33の台詞キーワードとを音声照合手段32が照合し、一致したときの当該台詞キーワードで特定されるNRファイル名に基づいてNR制御手段34が対応する録音ナレーションをNRデータDB35より抽出して音声出力制御部16に送出し、音声出力制御部16が当該録音ナレーションを音声出力させ、当該録音ナレーションの音声出力区間以外のときにのみ台詞を音声出力させる構成とする。
【選択図】 図1

Description

本発明は、所定内容の台詞が音声出力され、台詞の合間でナレーションを出力させる録音ナレーション自動出力システムに関する。
例えば、語り手による台詞読み上げにより物語やあるシーンを表現する場合に、語るシーンに対応したナレーションを流すこともエンターテイメント性等の向上の一つとして考えられる。ナレーションは、通常、語り手とは異なる声が好ましく、また、語られる台詞とは異なり、予め録音しておいたものでも語られる台詞に影響を与えず、むしろ録音しておいた方が台詞語りも効率的となる。
ところで、会話中に効果音を流す手法として下記の特許文献で開示されているものがある。下記特許文献には、移動体通信装置に関して、予め効果音データとキーワードとが対応付けられて記憶され、ユーザの通話音声信号に含まれるキーワードを音声認識手段が検出したときに、当該キーワードに対応する効果音データを移動体通信装置に送出することが開示されている。
特開2002−051116号公報
しかしながら、上記特許文献では、効果音データとキーワードとが単に対応付けられたものであり、ユーザによる通話の時間経過で音声信号に同じキーワードが複数含まれていても、常に同じ効果音が流れることとなり、これを語りとナレーションの出力に適用した場合に、語りのシーンが切り替わっても同じキーワードでは同じ録音ナレーションを出力するということとなって録音ナレーションの効果が薄れてくるという問題がある。また、台詞と台詞との間に録音ナレーションを出力させるためには、所定のナレーションの選択や出力トリガの発信などのマニュアル操作を必要として、操作自体を行うという煩わしさがあるという問題がある。さらには、語り手がナレーションの内容を記憶していないと録音ナレーションが終了する前に語りを再開してしまい、語り手に負担を強いることとなるという問題もある。
そこで、本発明は上記課題に鑑みなされたもので、特別の操作を要せずに録音ナレーションを適時に出力可能とすると共に、台詞音声と録音ナレーション音声との重合出力を回避してナレーションによるエンターテイメント性の向上を図る静止画像対応録音ナレーション自動出力システムを提供することを目的とする。
上記課題を解決するために、請求項1の発明では、所定内容の台詞が音声出力され、台詞合間でナレーションを出力させる録音ナレーション自動出力システムであって、録音ナレーション記憶部、音声入力部、照合テーブル、音声処理部、録音ナレーション制御手段及び音声出力制御部を備え、前記録音ナレーション記憶部は、所定の台詞キーワードに対応付けられた録音ナレーションデータを記憶し、前記音声入力部は、台詞音声を入力し、前記照合テーブルは、所定の台詞キーワードと前記録音ナレーション記憶部に記憶されている録音ナレーションデータに関する情報とが関連付けられ、前記音声処理部は、前記入力した台詞音声を解析して生成した音声データと前記照合テーブルの台詞キーワードとを照合し、一致したときに上記台詞キーワードで個々に特定される前記録音ナレーションデータに関する情報を出力し、前記録音ナレーション制御手段は、前記音声処理部からの前記録音ナレーションデータに関する情報に応じて、対応の録音ナレーションデータを前記録音ナレーション記憶部より抽出して前記音声出力制御部に出力し、前記音声出力制御部は、前記台詞又は録音ナレーションの何れか一方の音声データを選択的に音声出力させるものであり、前記録音ナレーション制御部から前記録音ナレーションデータを入力した場合には当該録音ナレーションを音声出力し、当該録音ナレーションの音声出力区間以外のときに台詞を音声出力可能とする、構成とする。
本発明によれば、所定の台詞キーワードに対応付けられた録音ナレーションデータを記憶しておき、入力した台詞音声を解析した音声データと照合テーブルの台詞キーワードとを照合し、一致したときに当該台詞キーワードで個々に特定される録音ナレーションデータに関する情報に基づいて対応する録音ナレーションを出力させ、音声出力に際して録音ナレーションデータを入力した場合には当該録音ナレーションを音声出力可能とさせ、当該録音ナレーションの音声出力区間以外のときに台詞を音声出力させる構成とすることにより、特別の操作を要せずに録音ナレーションを適時に出力可能とすると共に、台詞音声と録音ナレーション音声との重合出力を回避してナレーションによるエンターテイメント性の向上を図ることができるものである。
以下、本発明の最良の実施形態を図により説明する。
図1に、本発明に係る録音ナレーション自動出力システムのブロック構成図を示す。図1において、録音ナレーション自動出力システム11は、バス12、中央制御部13、ROM14、RAM15、音声出力制御部16、ミキシングアンプ17、音声入力部であるマイク18、スピーカ19、音声処理部20、記憶装置21及び操作部22を適宜備える。また、音声処理部20には、音声認識手段31及び音声照合手段32を備える。さらに、記憶装置21には、照合テーブル33、録音ナレーション制御手段であるNR制御手段34及び録音ナレーション記憶部であるNRデータDB(データベース)35が記憶される。
中央制御部13は、このシステムを統括的に処理制御する物理的なCPUであり、ROM14に記憶されているプログラムに基づくアルゴリズム処理を行う。上記RAM15は、種々のプログラムを展開、実行させるための作業領域としての役割をなすもので、例えば半導体メモリで構成され、仮想的にハードディスク上に構築される場合をも含む概念である。
上記音声出力制御部16は、マイク18からの台詞音声又は録音ナレーション音声の何れか一方の音声データを選択的にミキシングアンプ17に出力するものであり、録音ナレーションのデータ(ファイル)の場合には当該録音ナレーションデータをデコードしてミキシングアンプ17に出力し、録音ナレーション出力区間以外のときに台詞音声データを出力可能とする電子回路である。当該ミキシングアンプ17は、音声出力制御部16からの台詞又は録音ナレーションの何れかの音声データを増幅してスピーカ19より出力させるものである。また、上記操作部22は、電源ボタンやスタートボタン等のスイッチ類を備えたものである。
上記音声処理部20の備える上記音声認識手段31は、入力される台詞音声を解析して音声データとするプログラムでありRAM15に展開されて実行される。本実施形態では、例えば、アナログ信号の台詞音声をデジタル変換し、フォントコード化した音声データとする。なお、アナログ波形を画像化して解析した音声データとしてもよい。
上記音声処理部20の備える音声照合手段32は、音声認識手段31からの音声データと照合テーブル33(図2で説明する)の対応する台詞キーワードとを照合し、一致したときに上記台詞キーワードで個々に特定されるNRファイル名を出力するプログラムであり、RAM15に展開されて実行される。
ここで、音声データと台詞キーワードとの照合は、例えば、随時入力されて解析された音声データ(フォントコード)を、まず台詞キーワードの最初の一音データ(フォントコード)と照合し、一致したときに順次2番目以降の一音データ(フォントコード)と照合していく処理であり、台詞キーワードの総ての一音データ(フォントコード)とが一致したときに、当該台詞キーワードで個々に特定されるNRファイル名を出力する。逆に、一つでも一致しないものがあれば、台詞キーワードの最初の一音データとの照合から繰り返すものである。
記憶装置21に記憶される照合テーブル33は、図2で一例を説明するが、所定の台詞キーワードと録音ナレーションデータに関する情報としてのファイル名(NRファイル名)とを関連付けたテーブルである。上記記憶装置21に記憶されるNR制御手段34は、音声照合手段32から照合結果として出力される上記NRファイル名に基づいて、録音ナレーションデータ(ファイル)をNRデータDB35より抽出して音声出力制御部16に送出するプログラムであり、RAM15に展開されて実行される。上記記憶装置21に記憶されるNRデータDB35は、所定の台詞キーワードに対応付けられた録音ナレーションデータを記憶するデータベースである。
ここで、図2に、図1の照合テーブルの説明図を示す。図2に示す照合テーブル33は、例えば語り手の読み上げる台詞に含まれる所定の台詞キーワードとそれぞれのNRファイル名とが対応付けられたものである。上記のように、当該NRファイル名に対応した録音ナレーションデータ(ファイル)がNRデータDB35に記憶されている。なお、台詞キーワードのワード数の長さを異ならせることで、重複した台詞キーワードの設定を回避させることができるものである。
そこで、図3に、図1の録音ナレーション音声出力のフローチャートを示す。図3において、まず、物語などの読み手が台詞を、マイク18を介して読み上げると、当該マイク18に入力される読み上げられた台詞音声は、音声処理部20に入力されると共に、音声出力制御部16に一旦入力される(ステップ(S)1)。当該音声処理部20の音声認識手段31が入力した台詞音声を解析して音声データとし、当該音声データと照合テーブル33で定められている台詞キーワードとを実時間で順次照合する(S2)。一致するまで照合が繰り返される(S3)。
音声照合手段32による照合の結果(S3)、一致した場合には、照合テーブル33の当該一致した台詞キーワードに関連付けられたNRファイル名をNR制御手段34に出力する(S4)。NR制御手段34では、音声照合手段32より入力したNRファイル名に基づいて、録音ナレーションデータをNRデータDB35より抽出して音声出力制御部16に送出する(S5)。
そして、音声出力制御部16は、ミキシングアンプ17に対してマイク18からの台詞音声データの出力から、録音ナレーションデータに切り替えて出力することでスピーカ19より出力させる(S6)。すなわち、音声出力制御部16は、マイク18からの音声データの出力と録音ナレーションデータの出力とを切り替えて出力させることで、台詞と録音ナレーションとが重なって出力されることを回避させている。この処理が録音ナレーションの終了まで出力されるものである(S7)。そして、録音ナレーションが終了すると(S7)、音声出力制御部16が録音ナレーションデータの出力区間以外のときとして、ミキシングアンプ17に対して録音ナレーションデータの出力から、マイク18からの台詞音声データに切り替えて出力させることでスピーカ19より出力させるものである(S8)。
このように、特別の操作を要せずに録音ナレーションを適時に出力可能とすると共に、台詞音声と録音ナレーション音声との重合出力を回避してナレーションによるエンターテイメント性の向上を図ることができるものである。
次に、図4に、本発明に係る録音ナレーション自動出力システムの一適用例の説明図を示す。図4(A)は、図1の録音ナレーション自動出力システム11の、主要な一部のブロック図であり、デジタル紙芝居やプレゼンテーションなどの静止画像に対応させたものである。すなわち、表示制御部41及び画像表示部42が設けられ、また、記憶装置21にはさらに画像DB43、画像制御手段44及び台詞DB45が記憶され、対応の照合テーブル33Aが記憶される。
上記表示制御部41は、画像表示制御手段44より送られてくる画像をデコードして画像表示部42に表示させる電子回路及びこれに付随したプログラムを備える。当該画像表示部42としては例えば、プロジェクタスクリーン、ブラウン管(CRT)ディスプレイ、液晶ディスプレイ(LCD)、プラズマディスプレイ(PDP)等がある。記憶装置21に記憶される上記画像DB43は、例えば一連で構成される複数の静止画像を一組として所定数記憶させておくデータベースである。
記憶装置21に記憶される上記画像表示制御手段44は、画像表示部42に一連の静止画像を所定の切替信号(例えば、操作部22の切替ボタン等)により順次切り替え表示させるために、当該画像データを画像DB43より抽出して表示制御部41に送出するプログラムであり、RAM15に展開されて実行される。記憶装置21に記憶される上記台詞DB45は、画像DB43に記憶されている一連で構成される静止画像に関連付けられている対応の台詞データ(台詞ファイル名)をそれぞれ記憶しておくデータベースである。
この場合、照合テーブル33Aは、図4(B)に示すように、一連の静止画像を例えば10シーン(第10画像)で構成した場合、例えば第1画像の静止画像に、当該第1画像に対応した台詞、すなわち台詞DB45に記憶された台詞ファイル名で特定される台詞データのうち、所定数の台詞キーワードとそれぞれのNRファイル名とが対応付けられたもので、第10画像の静止画像まで存在するとして、当該静止画像毎に所定数の台詞キーワードとNRファイル名とを関連付けている。
すなわち、当該照合テーブル33Aは、静止画像毎に定められた台詞キーワードが対応のNRファイル名と関連付けられていることから、当該静止画像間で同じ台詞キーワードが存在しても異なるNRファイル名として区別したものである。この場合においても、台詞キーワードのワード数の長さを異ならせることで、重複した台詞キーワードの設定を回避させることができるものである。
そこで、図5に、図4の録音ナレーション音声出力のフローチャートを示す。図5において、まず、画像表示制御手段44が所定の静止画像データを画像DB43より抽出して表示制御部41に送出することで、当該表示制御部41が当該画像データをデコードして画像表示部42に表示する。このときに読み上げ者が当該画像に対応した台詞を、マイク18を介して読み上げると、読み上げられた台詞音声が随時入力され、当該台詞音声データは音声処理部20に入力されると共に、音声出力制御部16に一旦入力される(S11)。
音声処理部20では、音声認識手段31が画像表示制御手段44より画像表示部42で現に表示されている静止画像の情報を取得すると共に、入力した台詞音声を解析して音声データとし、音声照合手段32が当該音声データと照合テーブル33Aの現に表示されている静止画像に対応する台詞キーワードとを実時間で順次照合していく(S12)。一致するまで照合が繰り返される(S13)。
音声照合手段32による照合の結果(S13)、一致した場合には、照合テーブル33Aの当該一致した台詞キーワードに関連付けられたNRファイル名をNR制御手段34に出力する(S14)。NR制御手段34では、音声照合手段32より入力したNRファイル名に基づいて、録音ナレーションデータをNRデータDB35より抽出して音声出力制御部16に送出する(S15)。
そして、音声出力制御部16は、ミキシングアンプ17に対してマイク18からの台詞音声データの出力から、録音ナレーションデータに切り替えて出力することでスピーカ19より録音ナレーションが出力される(S16)。すなわち、音声出力制御部16は、マイク18からの音声データの出力と録音ナレーションデータの出力とを切り替えて出力させることで、台詞と録音ナレーションとが重なって出力されることを回避させている。これらの処理が録音ナレーションの終了まで出力されるものである(S17)。
そして、録音ナレーションが終了すると(S17)、音声出力制御部16が録音ナレーションデータの出力区間以外のときとして、ミキシングアンプ17に対して録音ナレーションデータの出力から、マイク18からの台詞音声データに切り替えて出力させることでスピーカ19より出力させるものである(S18)
このように、デジタル紙芝居やプレゼンテーションなどの静止画像毎の対応した録音ナレーションの出力に適用することができ、特別の操作を要せずに録音ナレーションを適時に出力可能とすると共に、台詞音声と録音ナレーション音声との重合出力を回避してナレーションによるエンターテイメント性の向上を図ることができるものである。
本発明の録音ナレーション自動出力システムは、語り手の台詞が音声出力され、語られる台詞間に語られるシーンの録音ナレーションを出力するシステムに利用可能である。
本発明に係る静止画像対応録音ナレーション自動出力システムのブロック構成図である。 図1の照合テーブルの説明図である。 図1の録音ナレーション音声出力のフローチャートである。 本発明に係る録音ナレーション自動出力システムの一適用例の説明図である。 図4の録音ナレーション音声出力のフローチャートである。
符号の説明
11 録音ナレーション自動出力システム
16 音声出力制御部
20 音声処理部
31 音声認識手段
32 音声照合手段
33 照合テーブル
34 NR制御手段
35 NRデータDB
42 画像表示部
43 画像DB
44 画像表示制御手段

Claims (1)

  1. 所定内容の台詞が音声出力され、台詞の合間でナレーションを出力させる録音ナレーション自動出力システムであって、
    録音ナレーション記憶部、照合テーブル、音声入力部、音声処理部、録音ナレーション制御手段及び音声出力制御部を備え、
    前記録音ナレーション記憶部は、所定の台詞キーワードに対応付けられた録音ナレーションデータを記憶し、
    前記照合テーブルは、所定の台詞キーワードと前記録音ナレーション記憶部に記憶されている録音ナレーションデータに関する情報とが関連付けられ、
    前記音声入力部は、台詞音声を入力し、
    前記音声処理部は、前記入力した台詞音声を解析して生成した音声データと前記照合テーブルの台詞キーワードとを照合し、一致したときに上記台詞キーワードで個々に特定される前記録音ナレーションデータに関する情報を出力し、
    前記録音ナレーション制御手段は、前記音声処理部からの前記録音ナレーションデータに関する情報に応じて、対応の録音ナレーションデータを前記録音ナレーション記憶部より抽出して前記音声出力制御部に出力し、
    前記音声出力制御部は、前記台詞又は録音ナレーションの何れか一方の音声データを選択的に音声出力させるものであり、前記録音ナレーション制御部から前記録音ナレーションデータを入力した場合には当該録音ナレーションを音声出力し、当該録音ナレーションの音声出力区間以外のときに台詞を音声出力可能とする、
    ことを特徴とする録音ナレーション自動出力システム。
JP2006266953A 2006-09-29 2006-09-29 録音ナレーション自動出力システム Withdrawn JP2008089628A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006266953A JP2008089628A (ja) 2006-09-29 2006-09-29 録音ナレーション自動出力システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006266953A JP2008089628A (ja) 2006-09-29 2006-09-29 録音ナレーション自動出力システム

Publications (1)

Publication Number Publication Date
JP2008089628A true JP2008089628A (ja) 2008-04-17

Family

ID=39373899

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006266953A Withdrawn JP2008089628A (ja) 2006-09-29 2006-09-29 録音ナレーション自動出力システム

Country Status (1)

Country Link
JP (1) JP2008089628A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106850148A (zh) * 2017-03-01 2017-06-13 广州广哈通信股份有限公司 数据帧传输的方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106850148A (zh) * 2017-03-01 2017-06-13 广州广哈通信股份有限公司 数据帧传输的方法及系统

Similar Documents

Publication Publication Date Title
JP6570651B2 (ja) 音声対話装置および音声対話方法
WO2020153109A1 (ja) 発言禁止用語に対し注意を喚起するためのプレゼンテーション支援装置
JP2006251545A (ja) 音声対話システム及びコンピュータプログラム
JP2018097029A (ja) 音声認識装置および音声認識方法
WO2018074023A1 (ja) 単語学習支援装置、単語学習支援プログラム、単語学習支援方法
US20180151198A1 (en) Moving image editing apparatus and moving image editing method
JP2007249653A (ja) マークアップ言語情報の処理装置、情報処理方法、およびプログラム
JP2009104047A (ja) 情報処理方法及び情報処理装置
JP6641680B2 (ja) 音声出力装置、音声出力プログラムおよび音声出力方法
JP2008089628A (ja) 録音ナレーション自動出力システム
JP2007041302A (ja) 音声再生装置および音声再生処理プログラム
JP2007127896A (ja) 音声認識装置及び音声認識方法
JP2017021245A (ja) 語学学習支援装置、語学学習支援方法および語学学習支援プログラム
JP5041754B2 (ja) 静止画像表示切替システム
JP4679480B2 (ja) 静止画像対応録音ナレーション自動出力システム
JP2006113439A (ja) 音声自動応答装置及びプログラム
JP4679463B2 (ja) 静止画像表示システム
JP2008136530A (ja) 録音データ自動出力システム
JP2004020739A (ja) 議事録作成装置、議事録作成方法、議事録作成プログラム
JP3231693B2 (ja) 音声対話装置
JP2007183516A (ja) 音声対話装置及び音声認識方法
JP4679462B2 (ja) 静止画像表示切替システム
US20080256071A1 (en) Method And System For Selection Of Text For Editing
JP3614116B2 (ja) トランスクリプション装置、トランスクリプション方法、トランスクリプションプログラム、およびそのプログラムを記録した記録媒体
JP2003202890A (ja) 音声認識装置及びその方法、プログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20091201