JP5427622B2 - 音声変更装置、音声変更方法、プログラム及び記録媒体 - Google Patents
音声変更装置、音声変更方法、プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP5427622B2 JP5427622B2 JP2010012255A JP2010012255A JP5427622B2 JP 5427622 B2 JP5427622 B2 JP 5427622B2 JP 2010012255 A JP2010012255 A JP 2010012255A JP 2010012255 A JP2010012255 A JP 2010012255A JP 5427622 B2 JP5427622 B2 JP 5427622B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- person
- designated
- information
- cuts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 34
- 238000010586 diagram Methods 0.000 description 6
- 230000015654 memory Effects 0.000 description 3
- 101100328887 Caenorhabditis elegans col-34 gene Proteins 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
本実施形態に係る音声変更装置は、音声情報と経時画像データ(動画データでも良い)とから成るビデオデータを再生している際に、指定人物の音声を聞きやすくすることを特徴とする。図1は、本実施形態に係る音声変更装置の機能ブロック図である。本実施形態に係る音声変更装置は、ビデオデータ保持部9、指定人物認識部10、指定人物特徴分析部11、ビデオデータ検索部12、指定人物音声特定部13、音声変更情報保持部14、音声変更部15、から構成される。
次に、本実施形態に係る音声変更の動作処理について図4を用いて説明する。図4は、本実施形態に係る音声変更の動作処理を示すフローチャートである。
ビデオデータ検索部12から送られた検索結果から、指定人物の特徴を有する人物のみが写っているカットを抽出し、そのカットで流れている音声情報を、指定人物の音声情報として特定する。ビデオデータを再生した際に、特定された音声が流れる場面では、当該音声の信号が音声変更部15に渡される。音声変更部15は、音声変更情報保持部14に保持された音声変更の指示に従って音声を変更し、変更された音声信号を出力する。これにより、ビデオデータ再生時に指定人物の音声情報が変更されて再生される。
指定人物のみが写り、流れている音声情報が一つであるカットがない場合も想定されるため、他の実施例として以下の方法が考え得る。指定人物を含む複数の人物と複数の音声が登場するカットを2つ以上抽出し、どのカットにも共通する音声を1つ抽出し、指定人物の音声と特定する。
指定人物のみが写っているが、流れている音声が複数あるカットしか抽出されない場合も想定される。そこで、例えばあるカットでの複数の音声を音声X、音声Yと認識し、別のカットの音声を音声X、音声Z、さらに別のカットでの音声を音声X、音声Y、音声Zと認識した場合に、全てのカットで多く重複している音声Xが指定人物の音声である可能性が高く、最も重複する音声を指定人物の音声と特定する。ここで「重複」とは、指定人物Aのみが写っており、(Aの音声X以外の他の人物の)音声Y,Zのみが流れているカットも含めたうえでの判断を意味する。上記実施例2は、カットに複数の人物が写っていること(少なくとも指定人物が写っていれば良い)が前提の特定方法であるが、実施例3はカットに指定人物のみ写っている場合を前提とした特定方法である。
また、写っている人物と結びつかない、いわゆるナレータ等の音声の認識も以下の方法により可能となる。まず人物が一人しか映っておらず、複数の音声のあるカットをビデオデータから検索し、それらのカットの中で多く重複している音声を、ナレータ等の映像に表示されない人物の音声として認識することが出来る。若しくは、人物が映っておらず、音声のあるカットを全てビデオデータから検索し、検索されたカットの中で多く重複している音声をナレータ等の映像に表示されない人物の音声として認識することも出来る。
なお、その後、ナレータ等の音声として認識した音声は指定人物の音声候補から除外して、上記各実施例の特定方法を実施しても良い。
上記実施例により特定された音声情報を、例えば一定時間流して(スピーカ7から出力して)ユーザに提示し、許可されてから音声変更を行っても良い。実施例1で特定した音声情報で許可されなかった場合は実施例2を実行する等、複数の特定方法を用いても良い。
2 CPU
3 ROM
4 RAM
5 操作部
6 表示部
7 スピーカ
8 バス
9 ビデオデータ保持部
10 指定人物認識部
11 指定人物特徴分析部
12 ビデオデータ検索部
13 指定人物音声特定部
14 音声変更情報保持部
15 音声変更部
Claims (8)
- 複数の人物が撮像された動画データと音声情報とから成るビデオデータを保持するビデオデータ保持手段と、
ユーザに指定された人物を認識する指定人物認識手段と、
前記認識した指定人物の特徴を分析する指定人物特徴分析手段と、
前記分析した特徴を有する人物の画像データを含む全てのカットを、前記ビデオデータから検索し、該当するカットで流れている音声情報とセットにして検索結果として出力するビデオデータ検索手段と、
前記検索結果に基づき、前記指定人物の音声情報を特定する指定人物音声特定手段と、
ユーザに指定された音声変更指示に基づき、前記指定人物の音声情報を変更する音声変更手段と、を備え、
前記指定人物音声特定手段は、前記検索結果のカットのうち、前記指定人物と1以上の他の人物が写っている複数のカットの全てにおいて共通する音声情報が流れている場合は、前記共通する音声情報を前記指定人物の音声情報と特定することを特徴とする音声変更装置。 - 前記指定人物音声特定手段は、前記検索結果のカットのうち、前記指定人物のみが写っている複数のカットにおいて複数の音声情報が流れている場合は、前記指定人物を含む他のカットにおいて流れている音声情報と最も多く共通する音声情報を、前記指定人物の音声情報と特定することを特徴とする請求項1に記載の音声変更装置。
- 前記ビデオデータから、複数の音声が流れているカットであって、人物が一人写っている若しくは一人も写っていないカットを検索し、検索されたカットのうち多く共通している音声情報を、前記ビデオデータに撮像されていない人物の音声情報として認識し、
前記指定人物音声特定手段は、前記ビデオデータに撮像されていない人物の音声情報として認識された音声情報を除外して、前記指定人物の音声情報を特定することを特徴とする請求項1又は2に記載の音声変更装置。 - 前記指定人物認識手段は、前記ビデオデータ再生中に、ユーザがポインティングデバイスを用いて指定した人物を指定人物と認識することを特徴とする請求項1から3のいずれか1項記載の音声変更装置。
- 前記音声変更手段は、前記音声変更指示に基づき、前記指定人物の音声情報以外の音声情報も変更することを特徴とする請求項1から4のいずれか1項記載の音声変更装置。
- 複数の人物が撮影されたカットを含むビデオデータのうち、ユーザに指定された人物のみが撮影されたカットを検索するステップと、
前記検索されたカットのうち、前記指定された人物と1以上の他の人物が写っている複数のカットの全てにおいて共通する音声情報が流れている場合は、前記共通する音声情報を前記指定された人物の音声情報と特定するステップと、
前記特定された音声情報を変更するステップと、
を備えることを特徴とする音声変更方法。 - 複数の人物が撮影されたカットを含むビデオデータのうち、ユーザに指定された人物のみが撮影されたカットを検索する処理と、
前記検索されたカットのうち、前記指定された人物と1以上の他の人物が写っている複数のカットの全てにおいて共通する音声情報が流れている場合は、前記共通する音声情報を前記指定された人物の音声情報と特定する処理と、
前記特定された音声情報を変更する処理と、
をコンピュータに実行させることを特徴とする音声変更プログラム。 - 請求項7記載の音声変更プログラムが記録されたコンピュータ読取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010012255A JP5427622B2 (ja) | 2010-01-22 | 2010-01-22 | 音声変更装置、音声変更方法、プログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010012255A JP5427622B2 (ja) | 2010-01-22 | 2010-01-22 | 音声変更装置、音声変更方法、プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011150191A JP2011150191A (ja) | 2011-08-04 |
JP5427622B2 true JP5427622B2 (ja) | 2014-02-26 |
Family
ID=44537226
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010012255A Active JP5427622B2 (ja) | 2010-01-22 | 2010-01-22 | 音声変更装置、音声変更方法、プログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5427622B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015087695A (ja) * | 2013-11-01 | 2015-05-07 | セイコーエプソン株式会社 | 情報処理装置および情報処理装置の制御方法 |
CN110458130B (zh) * | 2019-08-16 | 2022-12-06 | 百度在线网络技术(北京)有限公司 | 人物识别方法、装置、电子设备及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007013256A (ja) * | 2005-06-28 | 2007-01-18 | Sony Corp | 撮像装置、記録装置および方法、記録媒体、および、プログラム |
JP4441879B2 (ja) * | 2005-06-28 | 2010-03-31 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びに記録媒体 |
JP2007233075A (ja) * | 2006-03-01 | 2007-09-13 | Murata Mach Ltd | 議事録作成装置 |
JP4765732B2 (ja) * | 2006-04-06 | 2011-09-07 | オムロン株式会社 | 動画編集装置 |
JP2009156888A (ja) * | 2007-12-25 | 2009-07-16 | Sanyo Electric Co Ltd | 音声補正装置及びそれを備えた撮像装置並びに音声補正方法 |
JP4488091B2 (ja) * | 2008-06-24 | 2010-06-23 | ソニー株式会社 | 電子機器、映像コンテンツ編集方法及びプログラム |
-
2010
- 2010-01-22 JP JP2010012255A patent/JP5427622B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011150191A (ja) | 2011-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020007185A1 (zh) | 图像处理方法、装置、存储介质和计算机设备 | |
WO2020237855A1 (zh) | 声音分离方法、装置及计算机可读存储介质 | |
WO2021109678A1 (zh) | 视频生成方法、装置、电子设备及存储介质 | |
JP4600828B2 (ja) | 文書対応付け装置、および文書対応付け方法 | |
US8447065B2 (en) | Method of facial image reproduction and related device | |
KR101533065B1 (ko) | 화상통화 중 애니메이션 효과 제공 방법 및 장치 | |
US10409547B2 (en) | Apparatus for recording audio information and method for controlling same | |
KR20140114238A (ko) | 오디오와 결합된 이미지 표시 방법 | |
CN110517689A (zh) | 一种语音数据处理方法、装置及存储介质 | |
CN104170374A (zh) | 在视频会议期间修改参与者的外观 | |
JP2005202854A (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
CN107430851A (zh) | 发言提示装置、发言提示方法以及程序 | |
CN108596107A (zh) | 基于ar设备的唇语识别方法及其装置、ar设备 | |
JP2016102920A (ja) | 文書記録システム及び文書記録プログラム | |
US20230290382A1 (en) | Method and apparatus for matching music with video, computer device, and storage medium | |
CN113395569B (zh) | 视频生成方法及装置 | |
US10347299B2 (en) | Method to automate media stream curation utilizing speech and non-speech audio cue analysis | |
JP5427622B2 (ja) | 音声変更装置、音声変更方法、プログラム及び記録媒体 | |
JP2017064853A (ja) | ロボット、コンテンツ決定装置、コンテンツ決定方法、及びプログラム | |
CN110232909A (zh) | 一种音频处理方法、装置、设备及可读存储介质 | |
JP6838739B2 (ja) | 近時記憶支援装置 | |
KR101562901B1 (ko) | 대화 지원 서비스 제공 시스템 및 방법 | |
JP2019213160A (ja) | 動画編集装置、動画編集方法、及び動画編集プログラム | |
WO2023160515A1 (zh) | 视频处理方法、装置、设备及介质 | |
JP7313518B1 (ja) | 評価方法、評価装置、および、評価プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20110830 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130828 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130903 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131202 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5427622 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |