JP4533234B2 - 記録再生装置及び記録再生方法 - Google Patents
記録再生装置及び記録再生方法 Download PDFInfo
- Publication number
- JP4533234B2 JP4533234B2 JP2005137894A JP2005137894A JP4533234B2 JP 4533234 B2 JP4533234 B2 JP 4533234B2 JP 2005137894 A JP2005137894 A JP 2005137894A JP 2005137894 A JP2005137894 A JP 2005137894A JP 4533234 B2 JP4533234 B2 JP 4533234B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- signal
- recording
- data
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 56
- 230000005236 sound signal Effects 0.000 claims description 192
- 238000000605 extraction Methods 0.000 claims description 55
- 238000004458 analytical method Methods 0.000 claims description 39
- 238000006243 chemical reaction Methods 0.000 claims description 20
- 238000012217 deletion Methods 0.000 claims description 9
- 230000037430 deletion Effects 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 7
- 230000006835 compression Effects 0.000 description 32
- 238000007906 compression Methods 0.000 description 32
- 230000006870 function Effects 0.000 description 11
- 230000006837 decompression Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000004904 shortening Methods 0.000 description 5
- 238000007689 inspection Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
- G11B2020/10555—Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Quality & Reliability (AREA)
- Television Signal Processing For Recording (AREA)
Description
本実施形態では、音データが付随した画像データの記録再生装置は図1のように構成される。
図2は、母音、子音、無声区間の分布した音声信号を各区間毎に時間的に並べた模式図であり、Pa1〜Pa7は、音声信号の各区間を示すポインタである。母1〜母7は母音区間、子1〜子3は子音区間、無1〜無4は無声区間を表している。音声信号抽出開始ポイントの時間をST、音声信号抽出時間長をSTLとする。図3は、音声信号に対する、無声区間探索、発声開始探索、短時間音声信号区間内の発声区間割合検査の各処理を示すフローチャート、図4は、短時間音声信号の時間短縮のための加工・編集処理1を示すフローチャート、図5は、短時間音声信号の時間短縮のための加工・編集処理2を示すフローチャートである。
・パワー値=P
・パワー値Pの所定しきい値=PT
・パワー値Pが所定しきい値PTを超えた継続時間長=PGT
・PGTの所定しきい値=PGTT
・周期性値=R
・周期性値Rの所定しきい値=RT
・周期性値RがRTを超えた継続時間長=RGT
・RGTの所定しきい値=RGTT
・ゼロクロス値=Z
・ゼロクロス値Zの所定しきい値=ZT
・低域と高域のパワー比(低域パワー/高域パワー)=A
(低域は100〜900Hz、高域は3700〜5000Hz)
・パワー比Aの所定しきい値=AT
・STを起点として、パワー値Pが所定しきい値PTを超えた、のべ時間=PGTSUM・STを起点として、パワー値Pが所定しきい値PT未満だった、のべ時間=PLTSUM
・(PGTSUM/PLTSUM)値の所定しきい値=PGLR
・STを起点として、周期性値Rが所定しきい値RTを超えた、のべ時間=RGTSUM
・STを起点として、周期性値Rが所定しきい値RT未満だった、のべ時間=RLTSUM
・(RGTSUM/RLTSUM値)値の所定しきい値=RGLR
・STを起点として、パワー比Aが所定しきい値ATを超えた、のべ時間=AGTSUM
・STを起点として、パワー比Aが所定しきい値AT未満だった、のべ時間=ALTSUM
・(AGTSUM/ALTSUM)値の所定しきい値=AGLR
・一般的な子音の継続時間長=CT
更に、本実施形態における短時間で抽出する音声信号は、時間STを始点として、時間長STLの音声信号として、
・音声信号抽出開始ポイントの時間=ST
・音声信号抽出時間長=STL
と定める。
次に、上記音声以外の音を用いて音声サムネイルを作成する方法について、図1、図6〜9を用いて説明する。
次に、本実施形態の音声サムネイルの記録再生動作について図10と図11を用いて説明する。
以上、本発明に係る実施形態について具体例を用いて詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体(記録媒体)等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
上記実施形態によれば、音データ中の音又は音声信号から、音又は音声信号区間を抽出して音声サムネイルを生成し画像データに関連付けて保存するため、音声サムネイルを画像データと同時に利用できるようになる。
2 撮像部
3,3a ディスプレイ
4 マイク
5 オーディオ入力部
6 オーディオ出力部
7 スピーカ
8 信号処理部
9 CPU
10 RAM
11 ROM
12 インターフェース
13,13a メディア
14 シャッターキー
15 上下左右キー
15a 右キー
15b 上キー
15c 左キー
15d 下キー
16,16a 決定キー
17 メニューキー
18 モードキー
19 音声メモキー
20 記録再生装置
21 上下左右キー及び決定キー
Claims (21)
- 音データが付随した画像データの記録再生装置であって、
前記音データ中に音声が存在する場合には音声信号を抽出し、音声が存在しなければ音声以外の音信号を抽出する抽出手段と、
前記抽出手段により抽出された音声信号又は音信号を、単位時間あたりの情報量を増加させて画像データに関連付けて記録する記録手段とを具備することを特徴とする記録再生装置。 - 前記画像データは縮小画像を含み、当該縮小画像の選択時に前記抽出手段により抽出された音声信号又は音信号を再生する再生手段を更に備えることを特徴とする請求項1に記載の記録再生装置。
- 前記抽出手段は、前記音データから発声信号区間を探索して音声信号を抽出することを特徴とする請求項1に記載の記録再生装置。
- 前記発声信号区間の音声信号を分析する手段と、
前記分析手段による分析結果に基づいて、音声信号を時間圧縮するための話速変換処理及び信号削除処理を行う手段とを更に備えることを特徴とする請求項3に記載の記録再生装置。 - 前記分析手段は、音声信号の、パワー、周期性、波形のゼロクロス、低域高域のパワー比の少なくとも1つを分析することを特徴とする請求項4に記載の記録再生装置。
- 前記抽出手段は、前記音データから発音信号区間を探索して音信号を抽出することを特徴とする請求項1に記載の記録再生装置。
- 前記発音信号区間の音信号を分析する手段と、
前記分析手段による分析結果に基づいて、音信号を時間圧縮するための話速変換処理及び信号削除処理を行う手段とを更に備えることを特徴とする請求項6に記載の記録再生装置。 - 前記分析手段は、音信号のパワーを分析することを特徴とする請求項7に記載の記録再生装置。
- 前記音データが付随した画像データは、音声メモデータの付随した静止画データであることを特徴とする請求項1乃至8のいずれか1項に記載の記録再生装置。
- 前記音データが付随した画像データは、音声付き動画データであることを特徴とする請求項1乃至8のいずれか1項に記載の記録再生装置。
- 前記音データが付随した画像データは、音声メモデータの付随した音声付き動画データであることを特徴とする請求項1乃至8のいずれか1項に記載の記録再生装置。
- 音データが付随した画像データの記録再生方法であって、
前記音データ中に音声が存在する場合には音声信号を抽出し、音声が存在しなければ音声以外の音信号を抽出する抽出工程と、
前記抽出工程により抽出された音声信号又は音信号を、単位時間あたりの情報量を増加させて画像データに関連付けて記録する記録工程とを具備することを特徴とする方法。 - 前記画像データは縮小画像を含み、当該縮小画像の選択時に前記抽出手段により抽出された音声信号又は音信号を再生する再生工程を更に備えることを特徴とする請求項12に記載の方法。
- 前記抽出工程では、前記音データから発声信号区間を探索して音声信号を抽出することを特徴とする請求項12に記載の方法。
- 前記発声信号区間の音声信号を分析する工程と、
前記分析工程による分析結果に基づいて、音声信号を時間圧縮するための話速変換処理及び信号削除処理を行う工程とを更に備えることを特徴とする請求項14に記載の方法。 - 前記分析工程では、音声信号の、パワー、周期性、波形のゼロクロス、低域高域のパワー比の少なくとも1つを分析することを特徴とする請求項15に記載の方法。
- 前記抽出工程では、前記音データから発音信号区間を探索して音信号を抽出することを特徴とする請求項12に記載の方法。
- 前記発音信号区間の音信号を分析する工程と、
前記分析工程による分析結果に基づいて、音信号を時間圧縮するための話速変換処理及び信号削除処理を行う工程とを更に備えることを特徴とする請求項17に記載の方法。 - 前記分析工程では、音信号のパワーを分析することを特徴とする請求項18に記載の方法。
- 請求項12乃至19のいずれか1項に記載の記録再生方法をコンピュータに実行させるためのプログラム。
- 請求項20に記載のプログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005137894A JP4533234B2 (ja) | 2005-05-10 | 2005-05-10 | 記録再生装置及び記録再生方法 |
US11/408,281 US8538244B2 (en) | 2005-05-10 | 2006-04-20 | Recording/reproduction apparatus and recording/reproduction method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005137894A JP4533234B2 (ja) | 2005-05-10 | 2005-05-10 | 記録再生装置及び記録再生方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006319483A JP2006319483A (ja) | 2006-11-24 |
JP2006319483A5 JP2006319483A5 (ja) | 2008-06-19 |
JP4533234B2 true JP4533234B2 (ja) | 2010-09-01 |
Family
ID=37539781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005137894A Expired - Fee Related JP4533234B2 (ja) | 2005-05-10 | 2005-05-10 | 記録再生装置及び記録再生方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8538244B2 (ja) |
JP (1) | JP4533234B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008158788A (ja) * | 2006-12-22 | 2008-07-10 | Fujifilm Corp | 情報処理装置および情報処理方法 |
US20100026816A1 (en) * | 2008-07-30 | 2010-02-04 | Jonathan Bergstrom | Wireless data capture and sharing system, such as image capture and sharing of digital camera images via a wireless cellular network |
US8392957B2 (en) * | 2009-05-01 | 2013-03-05 | T-Mobile Usa, Inc. | Automatic content tagging, such as tagging digital images via a wireless cellular network using metadata and facial recognition |
KR102081347B1 (ko) * | 2013-03-21 | 2020-02-26 | 삼성전자주식회사 | 라이브 픽쳐 파일 생성 및 재생 장치, 방법 및 컴퓨터 판독 가능한 기록 매체 |
CN106375681A (zh) * | 2016-09-29 | 2017-02-01 | 维沃移动通信有限公司 | 一种动静结合影像的生成方法和移动终端 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08307827A (ja) * | 1995-05-09 | 1996-11-22 | Sanyo Electric Co Ltd | ビデオテープレコーダ |
JP2004356982A (ja) * | 2003-05-29 | 2004-12-16 | Fuji Photo Film Co Ltd | カメラ |
JP2004363924A (ja) * | 2003-06-04 | 2004-12-24 | Hitachi Ltd | 記録再生装置及びその制御方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3162945B2 (ja) | 1995-04-20 | 2001-05-08 | 三洋電機株式会社 | ビデオテープレコーダ |
JP3434195B2 (ja) | 1998-03-18 | 2003-08-04 | 日本電信電話株式会社 | 音楽映像管理方法、装置および音楽映像管理プログラムを記録した記録媒体 |
US7212972B2 (en) * | 1999-12-08 | 2007-05-01 | Ddi Corporation | Audio features description method and audio video features description collection construction method |
JP2001298711A (ja) | 2000-04-17 | 2001-10-26 | Sony Corp | 画像記録再生装置および方法、並びに記録媒体 |
JP2003288096A (ja) | 2002-03-27 | 2003-10-10 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ情報配信方法、コンテンツ情報配信装置、コンテンツ情報配信プログラム |
JP2003111011A (ja) | 2001-09-28 | 2003-04-11 | Matsushita Electric Ind Co Ltd | 動画検索装置 |
JP2003348530A (ja) | 2002-05-23 | 2003-12-05 | Nikon Corp | 画像取扱い装置、電子カメラおよび画像取扱い処理用プログラム |
JP2005101859A (ja) | 2003-09-24 | 2005-04-14 | Sony Corp | テレビジョン受像機、番組表提示プログラムおよび番組表提示方法 |
JP2005117077A (ja) | 2003-10-02 | 2005-04-28 | Konica Minolta Photo Imaging Inc | 携帯電子機器およびデータ再生方法 |
US7509255B2 (en) * | 2003-10-03 | 2009-03-24 | Victor Company Of Japan, Limited | Apparatuses for adaptively controlling processing of speech signal and adaptively communicating speech in accordance with conditions of transmitting apparatus side and radio wave and methods thereof |
-
2005
- 2005-05-10 JP JP2005137894A patent/JP4533234B2/ja not_active Expired - Fee Related
-
2006
- 2006-04-20 US US11/408,281 patent/US8538244B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08307827A (ja) * | 1995-05-09 | 1996-11-22 | Sanyo Electric Co Ltd | ビデオテープレコーダ |
JP2004356982A (ja) * | 2003-05-29 | 2004-12-16 | Fuji Photo Film Co Ltd | カメラ |
JP2004363924A (ja) * | 2003-06-04 | 2004-12-24 | Hitachi Ltd | 記録再生装置及びその制御方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2006319483A (ja) | 2006-11-24 |
US8538244B2 (en) | 2013-09-17 |
US20070061133A1 (en) | 2007-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4250301B2 (ja) | 映像シーケンスを編集する方法及びシステム | |
JP5144424B2 (ja) | 撮像装置及び情報処理方法 | |
JP4533234B2 (ja) | 記録再生装置及び記録再生方法 | |
JP2009157272A (ja) | 音声再生装置 | |
JP5910379B2 (ja) | 情報処理装置、情報処理方法、表示制御装置および表示制御方法 | |
JP2008153795A (ja) | 動画撮影装置、動画再生制御方法、及び動画再生制御プログラム | |
JP2006166407A (ja) | 撮像装置及びその制御方法 | |
JP6589838B2 (ja) | 動画像編集装置及び動画像編集方法 | |
JP2000023075A (ja) | ディジタル画像音声記録再生装置 | |
JP2000222417A (ja) | 画像ファイリング装置 | |
JP2006339817A (ja) | 情報処理装置およびその表示方法 | |
JPWO2009090705A1 (ja) | 記録再生装置 | |
JP2005033714A (ja) | 情報信号再生装置および情報信号再生方法並びに情報信号処理装置及び情報信号処理方法 | |
JP2005326811A (ja) | 音声合成装置および音声合成方法 | |
KR20070042000A (ko) | 동영상 스트림의 챕터 별 제목 설정 방법 및 장치 | |
JP5045597B2 (ja) | 編集装置および編集方法、並びにプログラム | |
KR100383194B1 (ko) | 미디어 파일 재생 방법 | |
JP2007279241A (ja) | 復号処理装置 | |
JP2007078985A (ja) | データ検索装置及びその制御方法 | |
JP4563418B2 (ja) | 音声処理装置、音声処理方法、ならびに、プログラム | |
JP4665550B2 (ja) | 再生装置および再生方法 | |
JP3426957B2 (ja) | 映像中への音声録音支援表示方法及び装置及びこの方法を記録した記録媒体 | |
JP2005204003A (ja) | 連続メディアデータ高速再生方法、複合メディアデータ高速再生方法、多チャンネル連続メディアデータ高速再生方法、映像データ高速再生方法、連続メディアデータ高速再生装置、複合メディアデータ高速再生装置、多チャンネル連続メディアデータ高速再生装置、映像データ高速再生装置、プログラム、および、記録媒体 | |
JP5471138B2 (ja) | 音素符号変換装置および音声合成装置 | |
JP2007036945A (ja) | 情報再生装置、情報記録媒体、及び情報再生プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080507 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080507 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100607 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100611 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4533234 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130618 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |