JP6785486B2 - 音声データの比較処理プログラム - Google Patents
音声データの比較処理プログラム Download PDFInfo
- Publication number
- JP6785486B2 JP6785486B2 JP2017029658A JP2017029658A JP6785486B2 JP 6785486 B2 JP6785486 B2 JP 6785486B2 JP 2017029658 A JP2017029658 A JP 2017029658A JP 2017029658 A JP2017029658 A JP 2017029658A JP 6785486 B2 JP6785486 B2 JP 6785486B2
- Authority
- JP
- Japan
- Prior art keywords
- section
- data
- voice data
- blocks
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
図1は、音声データの比較処理装置100を示す図である。音声データの比較処理装置100は、CPU(Central Processing Unit:中央演算装置)、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive:ハードディスクドライブ)等を内蔵するコンピュータによって実現される。音声データの比較処理装置100には、ディスプレイ、キーボード、マウス、及びモデム等が接続される。
110 主制御部
120 分割処理部
130 判定処理部
140 測定処理部
150 判定処理部
160 分類処理部
170 画像生成処理部
180 メモリ
Claims (6)
- 第1音声データを時間軸方向に所定のブロック長毎に複数のブロックに分ける分割処理と、
前記第1音声データに対して編集が行われた第2音声データを、前記ブロックのブロック長と等しい長さを有する探索窓を用いて前記ブロック長の区間毎に順番に選択し、前記第1音声データの前記複数のブロックの各々と、前記探索窓によって選択される区間との一致性を総当たり形式で判定する第1判定処理と、
前記第1音声データ及び前記第2音声データに含まれる前記一致性がある区間を第1区間、前記一致性がない区間のうち前記第1音声データに含まれ、前記第2音声データに含まれない区間を第2区間、前記一致性がない区間のうち前記第2音声データに含まれ、前記第1音声データに含まれない区間を第3区間に分類する分類処理と、
前記第1音声データを表す帯状の第1画像であって、互いに表示が異なる前記第1区間、前記第2区間、及び前記第3区間のうちの前記第1区間及び前記第2区間を含む第1画像を生成するとともに、前記第2音声データを表す帯状の第2画像であって、互いに表示が異なる前記第1区間、前記第2区間、及び前記第3区間のうちの前記第1区間及び前記第3区間を含む第2画像を生成する第1画像生成処理と
をコンピュータに実行させる、音声データの比較処理プログラム。 - 前記第1判定処理は、
前記複数のブロックの各々のデータのオーディオフィンガープリントと、前記探索窓によって選択される区間のデータのオーディオフィンガープリントとの一致性を判定する処理である、請求項1記載の音声データの比較処理プログラム。 - 前記第1判定処理は、
相互相関関数を用いて、前記複数のブロックの各々のデータに対する前記探索窓によって選択される区間のデータの遅延量を測定して、前記複数のブロックの各々のデータ、又は、前記探索窓によって選択される区間のデータを時間軸方向に補正して、前記複数のブロックの各々のデータと、前記探索窓によって選択される区間のデータとを時間軸方向に合わせ、
前記時間軸方向に合わせた前記複数のブロックの各々のデータと前記探索窓によって選択される区間のデータとのサンプル値の差分を測定し、
前記差分が人間の聴感で感じ取れない程度の小さな値である場合に、前記複数のブロックの各々のデータと、前記探索窓によって選択される区間のデータとの一致性があると判定する処理である、請求項1記載の音声データの比較処理プログラム。 - 前記第1判定処理によって前記一致性があると判定された、前記複数のブロックの各々のデータと、前記探索窓によって選択される区間のデータとについて、相互相関関数を用いて、前記複数のブロックの各々のデータに対する前記探索窓によって選択される区間のデータの遅延量を測定する測定処理と、
前記第1判定処理によって前記一致性があると判定された、前記複数のブロックの各々のデータ、又は、前記探索窓によって選択される区間のデータを時間軸方向に補正して、前記第1判定処理によって前記一致性があると判定された、前記複数のブロックの各々のデータと、前記探索窓によって選択される区間のデータとを時間軸方向に合わせる処理と、
前記時間軸方向に合わせた前記複数のブロックの各々のデータと前記探索窓によって選択される区間のデータとのサンプル値の差分を測定する処理と、
前記差分が人間の聴感で感じ取れない程度の小さな値である場合に、前記複数のブロックの各々のデータと、前記探索窓によって選択される区間のデータとの一致性があると判定する第2判定処理と
をさらに含み、
前記分類処理は、
前記第1音声データ及び前記第2音声データに含まれる前記第2判定処理における一致性がある区間を第1区間、前記第2判定処理における一致性がない区間のうち前記第1音声データに含まれ、前記第2音声データに含まれない区間を第2区間、前記第2判定処理における一致性がない区間のうち前記第2音声データに含まれ、前記第1音声データに含まれない区間を第3区間に分類する処理である、請求項1または2に記載の音声データの比較処理プログラム。 - 前記第1画像に含まれる前記第1区間と、当該第1区間に対応する、前記第2画像に含まれる前記第1区間との間を結ぶ線の画像を生成する第2画像生成処理をさらに含む、請求項1乃至4のいずれか一項記載の音声データの比較処理プログラム。
- 第1音声データと、前記第1音声データに対して編集が行われた第2音声データとを時間軸方向に所定のブロック長毎に複数のブロックに分ける分割処理と、
前記第1音声データの前記複数のブロックと、前記第2音声データの前記複数のブロックとの時間軸上で対応するブロック同士の一致性を判定する判定処理と、
前記第1音声データ及び前記第2音声データに含まれる前記一致性がある区間を第1区間、前記一致性がない区間のうち前記第1音声データに含まれ、前記第2音声データに含まれない区間を第2区間、前記一致性がない区間のうち前記第2音声データに含まれ、前記第1音声データに含まれない区間を第3区間に分類する分類処理と、
前記第1音声データを表す帯状の第1画像であって、互いに表示が異なる前記第1区間、前記第2区間、及び前記第3区間のうちの前記第1区間及び前記第2区間を含む第1画像を生成するとともに、前記第2音声データを表す帯状の第2画像であって、互いに表示が異なる前記第1区間、前記第2区間、及び前記第3区間のうちの前記第1区間及び前記第3区間を含む第2画像を生成する第1画像生成処理と
をコンピュータに実行させる、音声データの比較処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017029658A JP6785486B2 (ja) | 2017-02-21 | 2017-02-21 | 音声データの比較処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017029658A JP6785486B2 (ja) | 2017-02-21 | 2017-02-21 | 音声データの比較処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018136389A JP2018136389A (ja) | 2018-08-30 |
JP6785486B2 true JP6785486B2 (ja) | 2020-11-18 |
Family
ID=63366760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017029658A Active JP6785486B2 (ja) | 2017-02-21 | 2017-02-21 | 音声データの比較処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6785486B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4109705B2 (ja) * | 2007-08-23 | 2008-07-02 | 富士通株式会社 | 文書処理プログラム、および、文書処理方法 |
CN102265610A (zh) * | 2008-12-25 | 2011-11-30 | 日本电气株式会社 | 已编辑信息提供设备、已编辑信息提供方法、程序以及存储介质 |
EP2648418A1 (en) * | 2012-04-05 | 2013-10-09 | Thomson Licensing | Synchronization of multimedia streams |
JP6122814B2 (ja) * | 2014-07-17 | 2017-04-26 | 富士フイルム株式会社 | 情報処理装置、プログラム、及びデジタル検版方法 |
-
2017
- 2017-02-21 JP JP2017029658A patent/JP6785486B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018136389A (ja) | 2018-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10541003B2 (en) | Performance content synchronization based on audio | |
JP4703480B2 (ja) | 映像内の移動体検出方法、映像システムの異常発生原因分析支援方法及び支援システム | |
EP1081960A1 (en) | Signal processing method and video/voice processing device | |
JP2018514118A (ja) | ビデオプログラムのセグメントの検出 | |
CN106797498A (zh) | 信息处理设备、信息处理方法和程序 | |
JP2008022103A (ja) | テレビ番組動画像ハイライト抽出装置及び方法 | |
CN104050208A (zh) | 信息处理装置、信息处理方法和程序 | |
US8676024B2 (en) | Method and apparatus for generating data representing digests of pictures | |
WO2013093175A1 (en) | A method, an apparatus and a computer program for determination of an audio track | |
JP2011124979A (ja) | 映像処理装置、映像処理方法、および映像処理プログラム | |
CN110381336B (zh) | 基于5.1声道的视频片段情感判定方法、装置和计算机设备 | |
JP6785486B2 (ja) | 音声データの比較処理プログラム | |
KR20170130729A (ko) | 동영상 데이터와 음성 데이터의 자동 편집 방법 및 컴퓨터-판독가능 매체 | |
JP5137783B2 (ja) | ハッシュ生成装置及び検証装置及びハッシュ生成プログラム及びハッシュ生成方法 | |
CN110739006B (zh) | 音频处理方法、装置、存储介质及电子设备 | |
JP2008084021A (ja) | 動画シナリオ生成方法、プログラムおよび装置 | |
JP2000285242A (ja) | 信号処理方法及び映像音声処理装置 | |
JP2007335984A (ja) | イベント終了点抽出装置、イベント終了点抽出方法および抽出プログラム | |
JP2018084443A (ja) | 画像処理装置、画像処理システム、画像処理方法、及び画像処理プログラム | |
JP2003069946A (ja) | 映像解析装置,映像解析方法,映像解析プログラムおよびそのプログラム記録媒体 | |
JP2012114559A (ja) | 映像処理装置、映像処理方法及び映像処理プログラム | |
US11042274B2 (en) | Extracting demonstrations from in-situ video content | |
WO2021240677A1 (ja) | 映像処理装置、映像処理方法、訓練装置、訓練方法、及び、記録媒体 | |
US10219047B1 (en) | Media content matching using contextual information | |
JP2003283795A (ja) | 電子透かし装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200907 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200929 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201019 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6785486 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |