JPWO2013183078A1 - 自動記録装置 - Google Patents
自動記録装置 Download PDFInfo
- Publication number
- JPWO2013183078A1 JPWO2013183078A1 JP2014519697A JP2014519697A JPWO2013183078A1 JP WO2013183078 A1 JPWO2013183078 A1 JP WO2013183078A1 JP 2014519697 A JP2014519697 A JP 2014519697A JP 2014519697 A JP2014519697 A JP 2014519697A JP WO2013183078 A1 JPWO2013183078 A1 JP WO2013183078A1
- Authority
- JP
- Japan
- Prior art keywords
- content
- unit
- information storage
- identification data
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 claims description 24
- 239000000284 extract Substances 0.000 claims description 4
- 238000000034 method Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000007429 general method Methods 0.000 description 4
- 108090000237 interleukin-24 Proteins 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 101100018027 Pisum sativum HSP70 gene Proteins 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/82—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
- H04N9/8205—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Abstract
Description
実施の形態1.
図1は、この発明の実施の形態1による自動記録装置の一例を示すブロック図である。この実施の形態では、ラジオ、テレビなどで放送される放送データから、コンテンツおよび当該コンテンツの識別データを音声取得、音声認識して記録する自動記録装置として、音楽コンテンツ(楽曲)とそのコンテンツ(楽曲)の識別データである曲名とアーティスト名を対応付けて保存する場合を例として説明する。なお、以下の実施の形態においても同様とする。
そして前述の制御部4は、音声認識部2から受け取った曲名とアーティスト名(識別データ)を映像音声記録部7により記録された楽曲(コンテンツ)と対応付けて情報記憶部5に保存する。
まず、音声取得部1は、オーディオ機器より入力された音声をライン入力で取得する(ステップST11)。この時、オーディオ機器から入力された音声がアナログ形式の場合はA/D変換を行い、例えばPCM形式に変換してデジタルデータとして取得する。
次に、音声認識部2は、音声取得部1により取得された音声データを認識し、認識結果を文字列で出力する。この際、定型文記憶部3と比較した上で、大語彙連続音声認識を行うことにより、曲名およびアーティスト名を抽出する(ステップST12)。
そして、映像音声記録部7は、コンテンツ区間検出部6からの命令を受けて、ステップST13で検知された楽曲の開始位置から楽曲の記録を開始する(ステップST14)。
そして、映像音声記録部7は、コンテンツ区間検出部6からの命令を受けて楽曲の記録を停止し(ステップST16)、その録音された楽曲を情報記憶部5に保存する(ステップST17)。
この結果、例えば図3に示すような関連付けテーブルが保存される。
また、識別データと、コンテンツ開始部分が抽出できたことを条件にコンテンツを記録するため、記憶媒体の容量を圧迫せずに曲部分のみを効率的に保存することができる。
図5は、この発明の実施の形態2による自動記録装置の一例を示すブロック図である。なお、実施の形態1で説明したものと同様の構成には、同一の符号を付して重複した説明を省略する。以下に示す実施の形態2では、実施の形態1と比べると、制御部4が情報記憶部5に保存されている情報を参照することにより、ユーザの嗜好にあったコンテンツのみを記録するものである。
まず、音声取得部1は、オーディオ機器より入力された音声をライン入力で取得する(ステップST21)。この時、オーディオ機器から入力された音声がアナログ形式の場合はA/D変換を行い、例えばPCM形式に変換してデジタルデータとして取得する。
次に、音声認識部2は、音声取得部1により取得された音声データを認識し、認識結果を文字列で出力する。この際、定型文記憶部3と比較した上で、大語彙連続音声認識を行うことにより、曲名およびアーティスト名を抽出する(ステップST22)。
なお、ステップST24〜ST29の処理については、実施の形態1における図4に示したステップST13〜ST18の処理と同一であるため、説明を省略する。
この発明の実施の形態3による自動記録装置の一例を示すブロック図は、実施の形態2の図5に示したブロック図と同じであるため、図示および説明を省略する。そして、以下に示す実施の形態3では、実施の形態2と比べると、楽曲(コンテンツ)の区間検出開始の命令を行うかどうかを、その楽曲(コンテンツ)がユーザの嗜好に合ったものであるか否かによるのではなく、音声認識の尤度によって決定するものである。
なお、この実施の形態3では、音声認識部2が認識結果を制御部4に出力する際に、その認識結果とともにその認識の尤度も出力する。
まず、音声取得部1は、オーディオ機器より入力された音声をライン入力で取得する(ステップST31)。この時、オーディオ機器から入力された音声がアナログ形式の場合はA/D変換を行い、例えばPCM形式に変換してデジタルデータとして取得する。
次に、音声認識部2は、音声取得部1により取得された音声データを認識し、認識結果を文字列で出力する。この際、定型文記憶部3と比較した上で、大語彙連続音声認識を行うことにより、曲名およびアーティスト名を抽出する(ステップST32)。
なお、ステップST34〜ST39の処理については、実施の形態1における図4に示したステップST13〜ST18の処理と同一であるため、説明を省略する。
図9は、この発明の実施の形態4による自動記録装置の一例を示すブロック図である。なお、実施の形態1〜3で説明したものと同様の構成には、同一の符号を付して重複した説明を省略する。この実施の形態4のブロック図には、実施の形態1〜3では図示を省略した、キーやタッチパネル等による入力信号を取得することによりユーザからの操作入力を受け付ける入力部8と、データを表示または音声出力することによりユーザにデータを提示する出力部9も図示されており、以下に示す実施の形態4では、これらの入力部8および出力部9を介して、ユーザが楽曲(コンテンツ)の保存の要否を選択することができるものである。
出力部9は、制御部4により出力された曲名、アーティスト名(識別データ)を、例えば合成音声を利用して出力するものでもよいし、ディスプレイ画面に文字を表示するものでもよい。また、それら両方に出力しても構わない。
ステップST41〜ST46の処理については、実施の形態1における図4に示したステップST11〜ST16の処理と同一であるため、説明を省略する。
図11は、この発明の実施の形態5による自動記録装置の一例を示すブロック図である。なお、実施の形態1〜4で説明したものと同様の構成には、同一の符号を付して重複した説明を省略する。以下に示す実施の形態5では、実施の形態4と比べると、制御部4がコンテンツ区間検出部6による楽曲の終了区間検知時に映像音声記録部7で記録された楽曲と、情報記憶部5に保存されている楽曲とを比較して、既に同一の曲名・アーティスト名の楽曲が保存済みの場合には、音質の良い方を保存するようにしたものである。
ステップST61〜ST66の処理については、実施の形態1における図4に示したステップST11〜ST16の処理と同一であるため、説明を省略する。
また、ステップST67の判断において、同一の楽曲が情報記憶部5に保存されていない場合(ステップST67のNOの場合)にも、上記ステップST69およびST70の処理を行う。
この場合には、既存の楽曲の音質以下だった場合には楽曲(コンテンツ)を上書きしないことに加え、既存の楽曲の音質より高かった場合であっても、ユーザの確認を得た上で上書き保存するようにしたので、ユーザの都合により、音質の良い方を保存するよう選択したり、音質は多少悪くても好みの録音状態の楽曲を残すように選択したりすることができる。
図13は、この発明の実施の形態6による自動記録装置の一例を示すブロック図である。なお、実施の形態1〜5で説明したものと同様の構成には、同一の符号を付して重複した説明を省略する。以下に示す実施の形態6では、実施の形態2と比べると、音声認識部2が複数の音声認識器21,22,23,・・・により構成されており、複数の言語ごとに認識辞書(図示せず)を有するものであり、それら言語ごとの複数の音声認識エンジンを使用して、複数の言語ごとに音声認識を行うようにしたものである。
まず、音声取得部1は、オーディオ機器より入力された音声をライン入力で取得する(ステップST81)。この時、オーディオ機器から入力された音声がアナログ形式の場合はA/D変換を行い、例えばPCM形式に変換してデジタルデータとして取得する。
次に、音声認識部2は、音声取得部1により取得された音声データを認識し、認識結果を文字列で出力する。この際、定型文記憶部3と比較した上で、大語彙連続音声認識を行うことにより、曲名およびアーティスト名を抽出する(ステップST82)。
なお、ステップST85〜ST90の処理については、実施の形態1における図4に示したステップST13〜ST18の処理と同一であるため、説明を省略する。
Claims (6)
- 放送データから、コンテンツおよび当該コンテンツの識別データを含む音声を検知して取得する音声取得部と、
前記コンテンツを紹介する際の文言を記憶する定型文記憶部と、
前記音声取得部により取得された音声データを認識するとともに、当該認識結果と前記定型文記憶部に記憶されている文言とに基づいて、前記コンテンツの識別データを抽出して出力する音声認識部と、
前記音声認識部から前記コンテンツの識別データを受け取った場合に、前記コンテンツの開始時点および終了時点を検知するよう指示する制御部と、
前記制御部からの指示にしたがって、前記音声取得部により取得された音声データから前記コンテンツの開始時点および終了時点を検知するコンテンツ区間検出部と、
前記コンテンツ区間検出部により検出された開始時点と終了時点の間のコンテンツ区間におけるコンテンツを記録する映像音声記録部と、
少なくとも前記映像音声記録部により記録されたコンテンツと、前記コンテンツの識別データとを記憶する情報記憶部とを備え、
前記制御部は、前記コンテンツの識別データを前記映像音声記録部により記録されたコンテンツと対応付けて前記情報記憶部に保存する
ことを特徴とする自動記録装置。 - 前記情報記憶部に記憶されているデータは、前記コンテンツを取得した回数を含み、
前記制御部は、前記情報記憶部に記憶されているデータを参照することにより、前記コンテンツを取得した回数が所定の回数以上である場合にのみ、前記コンテンツの識別データを前記コンテンツと対応付けて前記情報記憶部に保存する
ことを特徴とする請求項1記載の自動記録装置。 - 前記音声認識部は、前記認識結果とともに当該認識の尤度も出力し、
前記制御部は、前記認識の尤度が所定の値以上である場合にのみ、前記コンテンツの識別データを前記コンテンツと対応付けて前記情報記憶部に保存する
ことを特徴とする請求項1記載の自動記録装置。 - ユーザからの操作入力を受け付ける入力部と、
前記ユーザにデータを提示する出力部とをさらに備え、
前記制御部は、前記コンテンツの識別データを前記コンテンツと対応付けて前記情報記憶部に保存する際に、前記出力部を介して前記保存の要否を前記ユーザに確認し、前記入力部を介して保存要である旨の入力を受け付けた場合には、前記コンテンツの識別データを前記コンテンツと対応付けて前記情報記憶部に保存し、前記入力部を介して保存否である旨の入力を受け付けた場合には、前記コンテンツの識別データのみを前記情報記憶部に保存する
ことを特徴とする請求項1記載の自動記録装置。 - 前記制御部は、前記情報記憶部に記憶されているデータを参照することにより、前記抽出されたコンテンツの識別データと同一のデータが前記情報記憶部に存在するか否かを判別し、存在する場合には、前記映像音声記録部により記録されたコンテンツと、前記情報記憶部に保存されているコンテンツの音質を比較し、前記映像音声記録部により記録されたコンテンツの方が音質が高い場合にのみ、当該映像音声記録部により記録されたコンテンツを前記情報記憶部に保存されているコンテンツに上書きして保存する
ことを特徴とする請求項1記載の自動記録装置。 - 前記音声認識部は、複数の言語ごとに認識辞書を有するものであり、前記複数の言語ごとに音声認識を行い、その認識結果とともに当該認識の尤度も出力し、
前記制御部は、前記認識の尤度に基づいて前記コンテンツの識別データの言語を特定し、当該特定された言語により抽出されたコンテンツの識別データを前記コンテンツと対応付けて前記情報記憶部に保存する
ことを特徴とする請求項1記載の自動記録装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2012/003652 WO2013183078A1 (ja) | 2012-06-04 | 2012-06-04 | 自動記録装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5591428B2 JP5591428B2 (ja) | 2014-09-17 |
JPWO2013183078A1 true JPWO2013183078A1 (ja) | 2016-01-21 |
Family
ID=49711508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014519697A Expired - Fee Related JP5591428B2 (ja) | 2012-06-04 | 2012-06-04 | 自動記録装置 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP5591428B2 (ja) |
CN (1) | CN104350545B (ja) |
WO (1) | WO2013183078A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015161632A (ja) * | 2014-02-28 | 2015-09-07 | 富士通テン株式会社 | 画像表示システム、ヘッドアップディスプレイ装置、画像表示方法、及び、プログラム |
JP6845446B2 (ja) * | 2017-03-31 | 2021-03-17 | 株式会社オプティム | 音声内容記録システム、方法及びプログラム |
JP2019200393A (ja) * | 2018-05-18 | 2019-11-21 | シャープ株式会社 | 判定装置、電子機器、応答システム、判定装置の制御方法、および制御プログラム |
JP7009338B2 (ja) * | 2018-09-20 | 2022-01-25 | Tvs Regza株式会社 | 情報処理装置、情報処理システム、および映像装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1054484C (zh) * | 1993-12-21 | 2000-07-12 | 罗伊·J·曼科维茨 | 识别广播节目与存取其有关信息的装置和方法 |
JP2003085884A (ja) * | 2001-09-14 | 2003-03-20 | Pioneer Electronic Corp | 情報記録装置 |
EP1573462A2 (en) * | 2002-10-28 | 2005-09-14 | Gracenote, Inc. | Personal audio recording system |
JP2007219178A (ja) * | 2006-02-16 | 2007-08-30 | Sony Corp | 楽曲抽出プログラム、楽曲抽出装置及び楽曲抽出方法 |
JP4442585B2 (ja) * | 2006-05-11 | 2010-03-31 | 三菱電機株式会社 | 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置 |
GB0625178D0 (en) * | 2006-12-18 | 2007-01-24 | Ubc Media Group Plc | Improvements relating to downloading data |
JP2011043710A (ja) * | 2009-08-21 | 2011-03-03 | Sony Corp | 音声処理装置、音声処理方法及びプログラム |
JP2011223205A (ja) * | 2010-04-07 | 2011-11-04 | Onkyo Corp | 放送記録装置およびそのプログラム |
-
2012
- 2012-06-04 JP JP2014519697A patent/JP5591428B2/ja not_active Expired - Fee Related
- 2012-06-04 CN CN201280073736.0A patent/CN104350545B/zh not_active Expired - Fee Related
- 2012-06-04 WO PCT/JP2012/003652 patent/WO2013183078A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
CN104350545A (zh) | 2015-02-11 |
JP5591428B2 (ja) | 2014-09-17 |
WO2013183078A1 (ja) | 2013-12-12 |
CN104350545B (zh) | 2016-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107305541B (zh) | 语音识别文本分段方法及装置 | |
US9798934B2 (en) | Method and apparatus for providing combined-summary in imaging apparatus | |
JP4459267B2 (ja) | 辞書データ生成装置及び電子機器 | |
US6332122B1 (en) | Transcription system for multiple speakers, using and establishing identification | |
US8924853B2 (en) | Apparatus, and associated method, for cognitively translating media to facilitate understanding | |
JP2002032213A (ja) | ボイス・メール・メッセージを転記する方法およびシステム | |
JP5787780B2 (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
JP2011002656A (ja) | 音声認識結果修正候補検出装置、音声書き起こし支援装置、方法及びプログラム | |
JP5824829B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP5591428B2 (ja) | 自動記録装置 | |
JPWO2007069372A1 (ja) | 音声認識装置 | |
JPWO2007097390A1 (ja) | 音声認識システム、音声認識結果出力方法、及び音声認識結果出力プログラム | |
US7010485B1 (en) | Method and system of audio file searching | |
US20150269930A1 (en) | Spoken word generation method and system for speech recognition and computer readable medium thereof | |
JP2013088477A (ja) | 音声認識システム | |
JP2004333738A (ja) | 映像情報を用いた音声認識装置及び方法 | |
JP4675691B2 (ja) | コンテンツ情報提供装置 | |
JP4639094B2 (ja) | 音声認識システム、音声認識装置及び音声認識プログラム | |
JP2012003090A (ja) | 音声認識装置および音声認識方法 | |
CN110895938B (zh) | 语音校正系统及语音校正方法 | |
JP4175141B2 (ja) | 音声認識機能を有する番組情報表示装置 | |
CN110782899A (zh) | 信息处理装置、存储介质及信息处理方法 | |
JP7297266B2 (ja) | 検索支援サーバ、検索支援方法及びコンピュータプログラム | |
JP4854030B2 (ja) | 映像分類装置および受信装置 | |
US20080256071A1 (en) | Method And System For Selection Of Text For Editing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20140625 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140701 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140729 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5591428 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |