JPWO2020208811A1 - 再生制御装置、プログラムおよび再生制御方法 - Google Patents

再生制御装置、プログラムおよび再生制御方法 Download PDF

Info

Publication number
JPWO2020208811A1
JPWO2020208811A1 JP2021513138A JP2021513138A JPWO2020208811A1 JP WO2020208811 A1 JPWO2020208811 A1 JP WO2020208811A1 JP 2021513138 A JP2021513138 A JP 2021513138A JP 2021513138 A JP2021513138 A JP 2021513138A JP WO2020208811 A1 JPWO2020208811 A1 JP WO2020208811A1
Authority
JP
Japan
Prior art keywords
voice processing
music
processing section
lyrics
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021513138A
Other languages
English (en)
Other versions
JP7197688B2 (ja
Inventor
貫太 香田
明秀 長谷川
実 渡辺
祐多 石井
英輝 宮田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AlphaTheta Corp
Original Assignee
AlphaTheta Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AlphaTheta Corp filed Critical AlphaTheta Corp
Publication of JPWO2020208811A1 publication Critical patent/JPWO2020208811A1/ja
Application granted granted Critical
Publication of JP7197688B2 publication Critical patent/JP7197688B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

再生制御装置(100)は、楽曲の再生位置情報(111T)に対応付けられた歌詞データ(111)に基づいて、楽曲の歌詞に含まれる特定の単語またはフレーズに対応する楽曲内の音声加工区間を決定する音声加工区間決定部(120)と、楽曲の音声データ(131)を再生するときに、音声加工区間において楽曲の音声を加工する音声加工部(150)とを備える。

Description

本発明は、再生制御装置、プログラムおよび再生制御方法に関する。
楽曲の歌詞をテキストデータとして提供することは一般的である。歌詞のテキストデータは、例えば楽曲の再生に同期して当該楽曲の歌詞を表示させるために用いられる。このような技術の例として、特許文献1には、オーディオファイルの再生時にテキストを同期化させて出力できるようにするための同期信号をオーディオファイルに埋め込むことによって、楽曲の再生に同期した歌詞の表示を可能にする技術が記載されている。また、特許文献2には、クライアントが既に音楽ファイルを所有している場合に音楽データの取得費用が重複して発生することのない同期歌詞配信システムが記載されている。
特開2004−318162号公報 特開2008−112158号公報
上記のような技術は、専ら楽曲の再生時に歌詞を表示するために用いられる。その一方で、楽曲が再生される状況によって、特定の歌詞が再生に適さないことがありうる。具体的には、プライベートな場で再生する場合には問題がない歌詞であっても、公共の場で再生するのには適さない場合がある。また、ある国や地域では問題がない歌詞であっても、他の国や地域で再生するのには適さない場合がある。例えば放送局で楽曲を再生する場合には、編集機材を用いて予め楽曲の音声を加工して問題のある歌詞を聴取不能にすることができるが、例えばDJ(Disc Jockey)がリアルタイムで楽曲を再生する場合、上記のような対処は困難である。
そこで、本発明は、楽曲に対応付けられた歌詞データを用いて不適切な単語またはフレーズが聴取されないようにすることが可能な再生制御装置、プログラムおよび再生制御方法を提供することを目的とする。
本発明のある観点によれば、楽曲の再生位置情報に対応付けられた歌詞データに基づいて、楽曲の歌詞に含まれる特定の単語またはフレーズに対応する楽曲内の音声加工区間を決定する音声加工区間決定部と、楽曲の音声データを再生するときに、音声加工区間において楽曲の音声を加工する音声加工部とを備える再生制御装置が提供される。
本発明の別の観点によれば、上記の再生制御装置としてコンピュータを機能させるように構成されたプログラムが提供される。
本発明のさらに別の観点によれば、楽曲の再生位置情報に対応付けられた歌詞データに基づいて、楽曲の歌詞に含まれる特定の単語またはフレーズに対応する楽曲内の音声加工区間を決定するステップと、楽曲の音声データを再生するときに、音声加工区間において楽曲の音声を加工するステップとを含む再生制御方法が提供される。
本発明の第1の実施形態に係る再生制御装置の概略的な機能構成を示すブロック図である。 図1に示す再生制御装置による音声加工区間の特定の第1の例を示す図である。 図1に示す再生制御装置による音声加工区間の特定の第2の例を示す図である。 本発明の第2の実施形態に係る再生制御装置の概略的な機能構成を示すブロック図である。
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
(第1の実施形態)
図1は、本発明の第1の実施形態に係る再生制御装置の概略的な機能構成を示すブロック図である。図1に示されるように、再生制御装置100は、歌詞データ取得部110と、音声加工区間決定部120と、音声データ取得部130と、音声再生部140と、音声加工部150とを含む。上記の各部の機能は、例えばコンピュータのハードウェア構成を備える再生制御装置において、プロセッサがプログラムに従って動作することによって実現される。以下、各部の機能についてさらに説明する。
歌詞データ取得部110は、楽曲の歌詞データ111を取得する。より具体的には、歌詞データ取得部110は、記憶装置から歌詞データ111を読み込む。記憶装置は外部装置に備えられていてもよく、その場合、歌詞データ取得部110は有線または無線の通信によって歌詞データ111を受信する。歌詞データ111は、例えば歌詞をテキストとして記述したデータであり、単語単位またはフレーズ単位で楽曲の再生位置情報111Tに対応付けられている。なお、歌詞に含まれる単語またはフレーズを識別することが可能であれば、歌詞データ111の形式は特に限定されない。
音声加工区間決定部120は、歌詞データ111に基づいて、楽曲の歌詞に含まれる特定の単語またはフレーズに対応する楽曲内の音声加工区間を決定する。より具体的には、本実施形態において、音声加工区間決定部120は、予め定義された不適切用語リスト121を参照することによって音声加工区間を決定する。不適切用語リスト121は、ユーザーにより任意の単語を追加または削除することが可能であってもよい。不適切用語リスト121には、例えば公共の場で再生するのには適さない単語やフレーズが規定されている。音声加工区間決定部120は、歌詞の中に不適切用語リスト121に含まれる単語またはフレーズが検出された場合に、当該単語またはフレーズに対応付けられた再生位置情報111Tに基づいて、楽曲内の音声加工区間を決定する。
音声データ取得部130は、楽曲の音声データ131を取得する。より具体的には、音声データ取得部130は、記憶装置から音声データ131読み込む。歌詞データ111と同様に、記憶装置は外部装置に備えられていてもよく、その場合、音声データ取得部130は有線または無線の通信によって音声データ131を受信する。なお、歌詞データ111と音声データ131とは、それぞれ異なる記憶装置に格納されていてもよい。例えば、歌詞データ取得部110が歌詞データ111を外部装置から受信し、音声データ取得部130が再生制御装置100の記憶装置から音声データ131を読み込んでもよい。
音声再生部140は、楽曲の音声データ131を再生する。具体的には、音声再生部は、音声データ131に基づいて音声信号を合成し、合成された音声信号をスピーカーなどの出力装置141に出力する。出力装置141は外部装置に備えられていてもよく、その場合、音声再生部140が出力した音声信号は有線または無線の通信によって出力装置141に送信される。
音声加工部150は、音声再生部140が音声データ131を再生するときに、音声加工区間決定部120によって特定された音声加工区間において楽曲の音声を加工する。本実施形態において、音声加工部150は、音声加工区間に含まれる歌詞の単語やフレーズ(すなわち、不適切用語リスト121に含まれる単語またはフレーズ)が聴き取れないように、楽曲の音声を加工する。例えば、ヴォーカルの周波数帯域をカットするフィルタをかけたり、または歌詞が聴き取れない程度に強く残響音を付加したり、楽曲の音声を別の音声に差し替えたりすることによって、単語やフレーズが聴き取れないように音声を加工することができる。音声再生部140は、例えば音声加工区間の長さに応じて、上記のような音声の加工の種類を選択してもよい。
図2は、図1に示す再生制御装置による音声加工区間の特定の第1の例を示す図である。図示された例において、歌詞データ111が対応付けられる楽曲の再生位置情報111Tは、楽曲の再生区間を分割したセグメントのIDと、各セグメントの始点のタイムスタンプとを含む。歌詞データ111に含まれる単語またはフレーズは、いずれかのセグメントに対応付けられている。楽曲の歌詞がない部分では、単語またはフレーズに対応付けられないセグメントがあってもよい。図示された例では、「What the hell is this?」という歌詞を含む歌詞データ111に対応付けられる再生位置情報111Tは、単語「What」に対応付けられるセグメントS1(始点はタイムスタンプ「00’09”30」)と、フレーズ「the hell」に対応付けられるセグメントS2(始点はタイムスタンプ「00’10”00」)、単語またはフレーズに対応付けられないセグメントS3(始点はタイムスタンプ「00’10”50」)と、フレーズ「is this?」に対応付けられるセグメントS4(始点はタイムスタンプ「00’13”10」)とを含む。
ここで、例えば、図1に示した不適切用語リスト121に「hell」という単語が含まれていたとする。この場合、音声加工区間決定部120は、不適切用語リスト121を参照した検索によって歌詞データ111に含まれる単語「hell」を検出し、さらに再生位置情報111Tにおいて「hell」を含むフレーズ「the hell」に対応付けられたセグメントS2を音声加工区間として特定する。音声加工部150は、音声再生部140が楽曲の音声データ131を再生するときに、セグメントS2、すなわちタイムスタンプ「00’10”00」から「00’10”50」までの区間において楽曲の音声を加工する(「EFFECT」として図示)。
図3は、図1に示す再生制御装置による音声加工区間の特定の第2の例を示す図である。図示された例において、歌詞データ111が対応付けられる楽曲の再生位置情報111Tは、歌詞に含まれる単語またはフレーズの始点のタイムスタンプを含む。図示された例では、「What the hell is this?」という歌詞を含む歌詞データ111に対応付けられる再生位置情報111Tは、単語「What」に対応付けられるタイムスタンプ「00’09”30」と、フレーズ「the hell」に対応付けられるタイムスタンプ「00’10”00」と、フレーズ「is this?」に対応付けられるタイムスタンプ「00’13”10」とを含む。
ここで、例えば、上記の例と同様に、不適切用語リスト121に「hell」という単語が含まれていたとする。この場合、音声加工区間決定部120は、不適切用語リスト121を参照した検索によって歌詞データ111に含まれる単語「hell」を検出し、さらに再生位置情報111Tにおいて「hell」を含むフレーズ「the hell」に対応付けられたタイムスタンプ「00’10”00」を始点とする音声加工区間を決定する。ここで、図3の例の再生位置情報111Tでは単語またはフレーズに対応する区間の終点が明示されていないため、例えば音声加工区間決定部120は、タイムスタンプによって特定される始点から所定の継続時間(Duration:図示された例では0”50)の音声加工区間を決定する。継続時間は、始点のタイムスタンプに対応付けられるのが単語の場合よりもフレーズの場合に長く設定されてもよい。また、継続時間は、フレーズに含まれる語数に応じて長くなるように設定されてもよい。音声加工部150は、音声再生部140が楽曲の音声データ131を再生するときに、タイムスタンプ「00’10”00」から0”50後、すなわち「00’10”50」までの区間において楽曲の音声を加工する(「EFFECT」として図示)。
なお、図3に示した例のように音声加工区間決定部120が始点のタイムスタンプから所定の継続時間の音声加工区間を決定する場合、例えば歌詞が長く引き伸ばされて発音されていると、音声加工区間は必ずしも単語またはフレーズの全体を含まない。しかしながら、そのような場合においても、例えば単語またはフレーズの一部分が聴き取れなければ、全体として単語またはフレーズの意味は把握されにくいため、不適切な単語またはフレーズが聴取されないようにするという効果を得ることができる。
(第2の実施形態)
図4は、本発明の第2の実施形態に係る再生制御装置の概略的な機能構成を示すブロック図である。図4に示される再生制御装置200は、上記の第1の実施形態と同様の歌詞データ取得部110と、音声データ取得部130と、音声再生部140と、音声加工部150とを含む。第1の実施形態との相違として、再生制御装置200において、音声加工区間決定部220は、タッチスクリーンディスプレイ221で取得される、単語またはフレーズを指定する操作に従って音声加工区間を決定する。ここで、タッチスクリーンディスプレイ221は、歌詞データ取得部110が取得した歌詞データ111に基づいて楽曲の歌詞を表示する歌詞表示部、および表示された歌詞に含まれる単語またはフレーズを指定する操作を受け付ける操作部の例である。
本実施形態の場合、音声加工区間決定部220は、第1の実施形態のように予め定義されたリストを参照する代わりに、歌詞を表示する画像を参照したユーザーが歌詞に含まれる単語またはフレーズを指定する操作に従って音声加工区間を決定する。従って、予めリストを定義する必要がなく、また楽曲が再生される状況により細かく対応した歌詞の制御が可能である。
なお、他の例では、上記の第1の実施形態と第2の実施形態とを組み合わせ、音声加工区間決定部が、予め定義されたリストを参照するとともにユーザーの操作に従って音声加工区間を決定してもよい。この場合、例えば、リストにはない単語またはフレーズを追加で聴取されないようにしたり、リストにある単語またはフレーズであっても状況によっては聴取を可能にしたりすることができる。
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範囲内において、各種の変形例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
100,200,300…再生制御装置、110…歌詞データ取得部、111…歌詞データ、111T…再生位置情報、120,220…音声加工区間決定部、121…不適切用語リスト、130…音声データ取得部、131…音声データ、140…音声再生部、141…出力装置、150…音声加工部、221…タッチスクリーンディスプレイ、350…歌詞画像生成部、351…出力装置、360…歌詞画像加工部。

Claims (9)

  1. 楽曲の再生位置情報に対応付けられた歌詞データに基づいて、前記楽曲の歌詞に含まれる特定の単語またはフレーズに対応する前記楽曲内の音声加工区間を決定する音声加工区間決定部と、
    前記楽曲の音声データを再生するときに、前記音声加工区間において前記楽曲の音声を加工する音声加工部と
    を備える再生制御装置。
  2. 前記音声加工区間決定部は、予め定義された単語またはフレーズのリストを参照することによって前記音声加工区間を決定する、請求項1に記載の再生制御装置。
  3. 前記予め定義された単語またはフレーズのリストは、ユーザーにより追加または削除することが可能である、請求項2に記載の再生制御装置。
  4. 前記音声加工区間決定部は、前記歌詞データに基づいて表示された前記歌詞に含まれる単語またはフレーズを指定する操作に従って前記音声加工区間を決定する、請求項1に記載の再生制御装置。
  5. 前記再生位置情報は、前記楽曲の再生区間を分割したセグメントのIDを含み、
    前記音声加工区間決定部は、前記特定の単語またはフレーズに対応付けられた前記セグメントを前記音声加工区間として特定する、請求項1から請求項4のいずれか1項に記載の再生制御装置。
  6. 前記再生位置情報は、前記歌詞に含まれる単語またはフレーズに対応付けられたタイムスタンプを含み、
    前記音声加工区間決定部は、前記特定の単語またはフレーズに対応付けられた前記タイムスタンプを始点とする所定の継続時間の前記音声加工区間を決定する、請求項1から請求項4のいずれか1項に記載の再生制御装置。
  7. 前記音声加工部は、前記音声加工区間の長さに応じて加工の種類を選択する、請求項1から請求項6のいずれか1項に記載の再生制御装置。
  8. 請求項1から請求項7のいずれか1項に記載の再生制御装置としてコンピュータを機能させるように構成されたプログラム。
  9. 楽曲の再生位置情報に対応付けられた歌詞データに基づいて、前記楽曲の歌詞に含まれる特定の単語またはフレーズに対応する前記楽曲内の音声加工区間を決定するステップと、
    前記楽曲の音声データを再生するときに、前記音声加工区間において前記楽曲の音声を加工するステップと
    を含む再生制御方法。
JP2021513138A 2019-04-12 2019-04-12 再生制御装置、プログラムおよび再生制御方法 Active JP7197688B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/015982 WO2020208811A1 (ja) 2019-04-12 2019-04-12 再生制御装置、プログラムおよび再生制御方法

Publications (2)

Publication Number Publication Date
JPWO2020208811A1 true JPWO2020208811A1 (ja) 2021-12-16
JP7197688B2 JP7197688B2 (ja) 2022-12-27

Family

ID=72750507

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021513138A Active JP7197688B2 (ja) 2019-04-12 2019-04-12 再生制御装置、プログラムおよび再生制御方法

Country Status (2)

Country Link
JP (1) JP7197688B2 (ja)
WO (1) WO2020208811A1 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991285A (ja) * 1995-09-25 1997-04-04 Toshiba Corp 機械翻訳装置及び処理対象語取得方法
JP2002318580A (ja) * 2001-04-23 2002-10-31 Sony Corp 音声再生装置、音声再生方法、音声再生プログラム、音声再生プログラム格納媒体、およびデータ格納媒体
JP2004007344A (ja) * 2002-03-25 2004-01-08 Sanyo Electric Co Ltd 光ディスク再生装置
KR20050119817A (ko) * 2004-06-17 2005-12-22 삼성전자주식회사 서브타이틀 데이터를 제한하는 광재생장치 및 그 방법
JP2007102949A (ja) * 2005-10-05 2007-04-19 Funai Electric Co Ltd ディスク装置
JP2009037458A (ja) * 2007-08-02 2009-02-19 Toyota Motor Corp 応答システム、及び応答内容制御方法
US20180197532A1 (en) * 2017-01-10 2018-07-12 Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America Audio content censoring in vehicle infotainment system

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991285A (ja) * 1995-09-25 1997-04-04 Toshiba Corp 機械翻訳装置及び処理対象語取得方法
JP2002318580A (ja) * 2001-04-23 2002-10-31 Sony Corp 音声再生装置、音声再生方法、音声再生プログラム、音声再生プログラム格納媒体、およびデータ格納媒体
JP2004007344A (ja) * 2002-03-25 2004-01-08 Sanyo Electric Co Ltd 光ディスク再生装置
KR20050119817A (ko) * 2004-06-17 2005-12-22 삼성전자주식회사 서브타이틀 데이터를 제한하는 광재생장치 및 그 방법
JP2007102949A (ja) * 2005-10-05 2007-04-19 Funai Electric Co Ltd ディスク装置
JP2009037458A (ja) * 2007-08-02 2009-02-19 Toyota Motor Corp 応答システム、及び応答内容制御方法
US20180197532A1 (en) * 2017-01-10 2018-07-12 Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America Audio content censoring in vehicle infotainment system

Also Published As

Publication number Publication date
WO2020208811A1 (ja) 2020-10-15
JP7197688B2 (ja) 2022-12-27

Similar Documents

Publication Publication Date Title
KR100739723B1 (ko) 오디오 썸네일 기능을 지원하는 오디오 재생 방법 및 장치
US9601029B2 (en) Method of presenting a piece of music to a user of an electronic device
JP4174940B2 (ja) カラオケ装置
US8253006B2 (en) Method and apparatus to automatically match keys between music being reproduced and music being performed and audio reproduction system employing the same
JP6201460B2 (ja) ミキシング管理装置
JP2004157260A (ja) ミキシング記録装置およびその制御方法を実現するためのプログラム
JPH1152966A (ja) 音楽演奏システム
WO2019208067A1 (ja) 任意信号挿入方法及び任意信号挿入システム
WO2020208811A1 (ja) 再生制御装置、プログラムおよび再生制御方法
JP4327165B2 (ja) 楽曲再生装置
JP2022139888A (ja) 情報処理装置
JP5454530B2 (ja) カラオケ装置
JP4994890B2 (ja) 録音した自分の歌声と模範歌唱とを厳しく比較できるカラオケ装置
US7385129B2 (en) Music reproducing system
JP6474292B2 (ja) カラオケ装置
JP2018112725A (ja) 音楽コンテンツ送信装置、音楽コンテンツ送信プログラムおよび音楽コンテンツ送信方法
JP2018112724A (ja) 演奏ガイド装置、演奏ガイドプログラムおよび演奏ガイド方法
WO2023195353A1 (ja) 音処理装置及びカラオケシステム
JP6924119B2 (ja) カラオケ装置
JP2007093658A (ja) オーディオ装置及びカラオケ装置
JP4479635B2 (ja) オーディオ装置及びカラオケ装置
JP2005189878A (ja) 音楽演奏装置と音楽演奏方法とプログラム
JP3363667B2 (ja) カラオケ装置
JP5510435B2 (ja) カラオケ装置及びプログラム
JP4267513B2 (ja) カラオケ録音装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220905

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221011

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221215

R150 Certificate of patent or registration of utility model

Ref document number: 7197688

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150