JP2020022158A - 音源フィルタリングのための方法およびシステム - Google Patents

音源フィルタリングのための方法およびシステム Download PDF

Info

Publication number
JP2020022158A
JP2020022158A JP2019124748A JP2019124748A JP2020022158A JP 2020022158 A JP2020022158 A JP 2020022158A JP 2019124748 A JP2019124748 A JP 2019124748A JP 2019124748 A JP2019124748 A JP 2019124748A JP 2020022158 A JP2020022158 A JP 2020022158A
Authority
JP
Japan
Prior art keywords
sound source
filtering
filter
source data
renderer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019124748A
Other languages
English (en)
Inventor
宇植 邊
Woo Sik Byun
宇植 邊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Publication of JP2020022158A publication Critical patent/JP2020022158A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10046Improvement or modification of read or write signals filtering or equalising, e.g. setting the tap weights of an FIR filter
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel

Abstract

【課題】 音源フィルタリングのための方法およびシステムを提供する。【解決手段】 音源データをデコードするためのデコーダ、前記デコードされた音源データを処理するためのレンダラー、および音源再生のためのプレイヤを含み、前記レンダラーは、音源と関連する設定にしたがって特定区間の音源データに前記設定と対応する効果を適用するためのフィルタを含み、前記プレイヤは、前記レンダラーから前記効果が適用された音源データを受け取って再生させる、コンピュータシステムを提供する。【選択図】 図6

Description

以下の説明は、音源にフィルタ効果を適用する技術に関する。
近年は、多様なオンライン音楽サービスが登場している。一般的なオンライン音楽サービスは、音源をユーザ端末に提供したりストリーミングサービスを提供したりするなどの方式により、オンライン接続したユーザにリアルタイムで音源を提供している。
オンライン音楽サービスの一例として、特許文献1(登録日2006年08月17日)は、音楽コンテンツを内容に基づいて分類し、これによってネットワーク接続するユーザに音楽コンテンツを提供する技術を開示している。
韓国登録特許第10−0615522号公報
音源の特定区間に正確にフィルタ効果を適用することができる方法およびシステムを提供する。
コンピュータシステムであって、少なくとも1つのプロセッサ、および、前記少なくとも1つのプロセッサと連結し、前記少なくとも1つのプロセッサによって実行可能な命令を含むメモリを含み、前記少なくとも1つのプロセッサは、音源データをデコードするためのデコーダ、前記デコードされた音源データを処理するためのレンダラー(renderer)、および音源再生のためのプレイヤを含み、前記レンダラーは、音源と関連する設定にしたがって特定区間の音源データに前記設定と対応する効果を適用するためのフィルタを含み、前記プレイヤは、前記レンダラーから前記効果が適用された音源データを受け取って再生させる、コンピュータシステムを提供する。
本発明の実施形態によると、音源の特定区間に正確にフィルタ効果を適用することができる。
本発明の一実施形態における、音声基盤インタフェースを活用したサービス環境の例を示した図である。 本発明の一実施形態における、音声基盤インタフェースを活用したサービス環境の他の例を示した図である。 本発明の一実施形態における、クラウド人工知能プラットフォームの例を示した図である。 本発明の一実施形態における、電子機器およびサーバの内部構成を説明するためのブロック図である。 一般的なフィルタ構造をもつ音源フィルタリング装置を説明するためのブロック図である。 本発明の一実施形態における、改善されたフィルタ構造をもつ音源フィルタリング装置を説明するためのブロック図である。 本発明の一実施形態における、具体的な音源フィルタリング過程を説明するためのフローチャートである。 本発明の一実施形態における、PCMデータのフィルタリングオプションテーブルを例示的に示した図である。 本発明の一実施形態における、他のフィルタ構造をもつ音源フィルタリング装置を説明するためのブロック図である。
<発明の概要>
コンピュータシステムであって、少なくとも1つのプロセッサ、および、前記少なくとも1つのプロセッサと連結し、前記少なくとも1つのプロセッサによって実行可能な命令を含むメモリを含み、前記少なくとも1つのプロセッサは、音源データをデコードするためのデコーダ、前記デコードされた音源データを処理するためのレンダラー(renderer)、および音源再生のためのプレイヤを含み、前記レンダラーは、音源と関連する設定にしたがって特定区間の音源データに前記設定と対応する効果を適用するためのフィルタを含み、前記プレイヤは、前記レンダラーから前記効果が適用された音源データを受け取って再生させる、コンピュータシステムを提供する。
一側面によると、前記レンダラーは、前記特定区間の音源データを時間単位に分けて複数のセグメントとして生成した後、各セグメント別にフィルタリングを実行してよい。
他の側面によると、前記レンダラーは、前記特定区間の音源データを時間単位に分けて複数のセグメントとして生成した後、各セグメント別にフィルタリングオプションを指定し、指定されたオプションにしたがってフィルタリングを実行してよい。
また他の側面によると、前記音源と関連する設定は、前記音源に関する事前設定情報としてフィルタリングオプションとフィルタリング区間情報を含むフィルタ情報が含まれてよい。
また他の側面によると、前記プレイヤは、前記レンダラーから前記効果が適用された音源データを受け取り、スピーカの要求に応じて前記スピーカに伝達するバッファを含み、前記バッファは、前記バッファ前に前記フィルタによって前記効果が適用された音源データを受け取って記録してよい。
さらに他の側面によると、前記プレイヤは、前記プレイヤのUI(user interface)に入力されるユーザ要求によって定義された効果を音源データに追加で適用するフィルタをさらに含んでよい。
コンピュータシステムで実行される音源フィルタリング方法であって、前記コンピュータシステムは、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、前記少なくとも1つのプロセッサは、音源処理のためのレンダラー、および音源再生のためのプレイヤを含み、前記音源フィルタリング方法は、前記レンダラーにより、音源と関連する設定にしたがって特定区間の音源データに前記設定と対応するフィルタ効果を適用する段階、および前記プレイヤにより、前記特定区間に前記フィルタ効果が適用された音源データを再生させる段階を含む、音源フィルタリング方法を提供する。
前記音源フィルタリング方法をコンピュータに実行させるためのプログラムが記録されている、非一時なコンピュータ読み取り可能な記録媒体を提供する。
<発明の詳細>
以下、本発明の実施形態について、添付の図面を参照しながら詳細に説明する。
本発明の実施形態は、音源にフィルタ効果を適用する技術に関する。
本明細書で具体的に開示される事項などを含む実施形態は、プレイヤ前端で希望する音源区間にフィルタ効果を適用することができ、これによって正確性、精密性、効率性などの側面において相当な長所を達成することができる。
図1は、本発明の一実施形態における、会話基盤インタフェースを活用したサービス環境の例を示した図である。図1の実施形態では、スマートホームやホームネットワークサービスのように宅内のデバイス同士を連結させて制御する技術において、ユーザとの会話を基盤として動作するインタフェースを提供する電子機器100がユーザ110の発話によって受信した音声入力「音楽をかけて」を認識および分析し、電子機器100のスピーカや電子機器100と内部ネットワークを介して連係している宅内スピーカを制御する例を示している。
例えば、宅内のデバイスは、上述した宅内スピーカの他にも、照明機器、テレビ、PC(Personal Computer)、周辺機器、エアコン、冷蔵庫、ロボット掃除機などのような家電製品はもちろん、水道、電気、冷暖房機器などのようなエネルギー消費装置、ドアロック、監視カメラなどのような保安機器など、オンライン上で連結して制御することが可能な多様なデバイスを含んでよい。また、内部ネットワークは、イーサネット(登録商標(Ethernet))、HomePNA、IEEE1394のような有線ネットワーク技術、ブルートゥース(登録商標(Bluetooth))、UWB(ultra Wide Band)、ジグビー(ZigBee)、Wireless 1394、Home RFのような無線ネットワーク技術などが活用されてよい。
電子機器100は、宅内のデバイスのうちの1つであってよい。例えば、電子機器100は、宅内に配置された人工知能スピーカや会話ロボット、ロボット清掃機などのようなデバイスの1つであってよい。または、電子機器100は、スマートフォン、携帯電話、ノート型PC、デジタル放送用端末、PDA(Personal Digital Assistants)、PMP(Portable Multimedia Player)、タブレットなどのようなユーザ110のモバイル機器であってもよい。このように、電子機器100は、ユーザ110の音声入力を認識することができ、これに対応する動作のために各種デバイスと連結する機能を含む機器であれば、特に制限されることはない。また、実施形態によっては、上述したユーザ110のモバイル機器が宅内のデバイスとして含まれてもよい。
図2は、本発明の一実施形態における、会話基盤インタフェースを活用したサービス環境の他の例を示した図である。図2は、ユーザとの会話を基盤として動作するインタフェースを提供する電子機器100がユーザ110の発話によって受信した音声入力「音楽をかけて」を認識および分析し、外部ネットワークを介して外部サーバ210から音源を取得し、取得した音源を出力する例を示している。
例えば、外部ネットワークは、PAN(personal area network)、LAN(local area network)、CAN(campus area network)、MAN(metropolitan area network)、WAN(wide area network)、BBN(broadband network)、インターネットなどのネットワークのうちの1つ以上の任意のネットワークを含んでよい。
図2の実施形態でも、電子機器100は、宅内のデバイスの1つであるか、ユーザ110のモバイル機器の1つであってよく、ユーザ110の音声入力を認識して処理するための機能と、外部ネットワークを介して外部サーバ210に接続し、外部サーバ210が提供するサービスやコンテンツをユーザ110に提供するための機能を含む機器であれば、特に制限されることはない。
このように、本発明の実施形態に係る電子機器100は、会話基盤インタフェースによってユーザ110の音声入力をはじめとするユーザ命令を処理することのできる機器であれば、特に制限されることはない。例えば、電子機器100は、ユーザの音声入力を直接に認識および分析し、これに対応する動作を実行することによってユーザ命令を処理することも可能であるが、実施形態によっては、ユーザの音声入力認識や分析、ユーザに提供される音声や情報合成などの処理を、電子機器100と連係する外部のプラットフォームで実行することも可能である。
図3は、本発明の一実施形態における、クラウド人工知能プラットフォームの例を示した図である。図3は、電子機器310とクラウド人工知能プラットフォーム320およびコンテンツ・サービス330を示している。
一例として、電子機器310は、宅内に配置されたデバイスを意味してよく、少なくとも上述した電子機器100を含んでよい。このような電子機器310や電子機器310においてインストールおよび実行されるアプリケーション(以下、アプリ)は、インタフェースコネクト340を介してクラウド人工知能プラットフォーム320と連係してよい。ここで、インタフェースコネクト340は、電子機器310や電子機器310においてインストールおよび実行されるアプリの開発のためのSDK(Software Development Kit)および/または開発文書を開発者に提供してよい。また、インタフェースコネクト340は、電子機器310や電子機器310においてインストールおよび実行されるアプリが、クラウド人工知能プラットフォーム320が提供する機能を活用できるようにしたAPI(Application Program Interface)を提供してよい。具体的な例として、開発者がインタフェースコネクト340から提供されるSDK(Software Development Kit)および/または開発文書を利用して開発した機器やアプリは、インタフェースコネクト340が提供するAPIを利用することで、クラウド人工知能プラットフォーム320が提供する機能を活用することができるようになる。
ここで、クラウド人工知能プラットフォーム320は、会話基盤のサービスを提供するための機能を提供してよい。例えば、クラウド人工知能プラットフォーム320は、受信した音声入力を認識して出力する情報を合成するための音声処理モジュール321、受信した映像や動画を分析して処理するためのビジョン処理モジュール322、受信した音声入力に適した情報を出力するために適切な会話を決定するための会話処理モジュール323、受信した音声入力に適した機能を推薦するための推薦モジュール324、人工知能がデータ学習に基づいて文章単位で言語を翻訳するように支援するニューラル機械翻訳(Neural Machine Translation:NMT)325などのように、会話基盤サービスを提供するための多様なモジュールを含んでよい。
例えば、図1および図2の実施形態において、電子機器100は、ユーザ110の音声入力をインタフェースコネクト340が提供するAPIを利用してクラウド人工知能プラットフォーム320に送信してよい。この場合、クラウド人工知能プラットフォーム320は、受信した音声入力を上述したモジュール321〜325を活用しながら認識および分析してよく、受信した音声入力に適した返答音声を合成して提供したり、適した動作を推薦したりしてよい。
また、拡張キット350は、第三者コンテンツ開発者または会社がクラウド人工知能プラットフォーム320を基盤として新たな人工知能会話基盤機能を実現することのできる開発キットを提供してよい。例えば、図2の実施形態において、電子機器100は、受信したユーザ110の音声入力を外部サーバ210に送信してよく、外部サーバ210は、拡張キット350が提供するAPIを利用してクラウド人工知能プラットフォーム320に音声入力を送信してよい。この場合、上述と同じように、クラウド人工知能プラットフォーム320は、受信した音声入力を認識および分析して適した返答情報を合成して提供したり、音声入力によって処理されなければならない機能に関する推薦情報を外部サーバ210に提供したりしてよい。一例として、図2において、外部サーバ210は、音声入力「音楽をかけて」をクラウド人工知能プラットフォーム320に送信してよく、クラウド人工知能プラットフォーム320から音声入力「音楽をかけて」の認識によって抽出されるキーワード「音楽」および「再生」を受信してよい。この場合、外部サーバ210は、キーワード「音楽」および「再生」に基づいて音源リストを生成し、生成された音源リストをクラウド人工知能プラットフォーム320に送信してよい。このとき、クラウド人工知能プラットフォーム320は、音源リストを外部サーバ210に提供してよい。外部サーバ210は、音源リストを電子機器100に送信してよく、電子機器100で音源リストを再生することにより、ユーザ110から受信した音声入力「音楽をかけて」が処理されてよい。
図4は、本発明の一実施形態における、電子機器およびサーバの内部構成を説明するためのブロック図である。
図4の電子機器410は、上述した電子機器100に対応してよく、サーバ420は、上述した外部サーバ210やクラウド人工知能プラットフォーム320を実現する1つのコンピュータ装置に対応してよい。
電子機器410およびサーバ420は、メモリ411、421、プロセッサ412、422、通信モジュール413、423、および入力/出力インタフェース414、424を含んでよい。メモリ411、421は、コンピュータ読み取り可能な記録媒体であって、RAM(random access memory)、ROM(read only memory)、ディスクドライブのような永続的大容量記録装置を含んでよい。ここで、ROMやディスクドライブのような永続的大容量記録装置は、メモリ411、421とは区分される別の永続的記録装置として電子機器410やサーバ420に含まれてもよい。また、メモリ411、421には、オペレーティングシステムと、少なくとも1つのプログラムコード(一例として、電子機器410においてインストールされ、特定のサービスの提供のために電子機器410で実行されるアプリケーションなどのためのコード)が記録されてよい。このようなソフトウェア構成要素は、メモリ411、421とは別のコンピュータ読み取り可能な記録媒体からロードされてよい。このような別のコンピュータ読み取り可能な記録媒体は、フロッピー(登録商標)ドライブ、ディスク、テープ、DVD/CD−ROMドライブ、メモリカードなどのコンピュータ読み取り可能な記録媒体を含んでよい。他の実施形態において、ソフトウェア構成要素は、コンピュータ読み取り可能な記録媒体ではない通信モジュール413、423を通じてメモリ411、421にロードされてもよい。例えば、少なくとも1つのプログラムは、開発者またはアプリケーションのインストールファイルを配布するファイル配布システムがネットワーク430を介して提供するファイルによってインストールされるコンピュータプログラム(一例として、上述したアプリケーション)に基づいて電子機器410のメモリ411にロードされてよい。
プロセッサ412、422は、基本的な算術、ロジック、および入出力演算を実行することにより、コンピュータプログラムの命令を処理するように構成されてよい。命令は、メモリ411、421または通信モジュール413、423によって、プロセッサ412、422に提供されてよい。例えば、プロセッサ412、422は、メモリ411、421のような記録装置に記録されたプログラムコードにしたがって受信される命令を実行するように構成されてよい。
通信モジュール413、423は、ネットワーク430を介して電子機器410とサーバ420とが互いに通信するための機能を提供してもよいし、電子機器410および/またはサーバ420が他の電子機器または他のサーバと通信するための機能を提供してもよい。一例として、電子機器410のプロセッサ412がメモリ411のような記録装置に記録されたプログラムコードにしたがって生成した要求が、通信モジュール413の制御にしたがってネットワーク430を介してサーバ420に伝達されてよい。これとは逆に、サーバ420のプロセッサ422の制御にしたがって提供される制御信号や命令、コンテンツ、ファイルなどが、通信モジュール423とネットワーク430を経て電子機器410の通信モジュール413を通じて電子機器410に受信されてよい。例えば、通信モジュール413を通じて受信されたサーバ420の制御信号や命令、コンテンツ、ファイルなどは、プロセッサ412やメモリ411に伝達されてよく、コンテンツやファイルなどは、電子機器410がさらに含むことのできる記録媒体(上述した永続的記録装置)に記録されてよい。
入力/出力インタフェース414は、入力/出力装置415とのインタフェースのための手段であってよい。例えば、入力装置は、マイク、キーボードまたはマウス、カメラなどのような装置を、出力装置は、ディスプレイ、スピーカなどのような装置を含んでよい。他の例として、入力/出力インタフェース414は、タッチスクリーンのように入力と出力のための機能が1つに統合された装置とのインタフェースのための手段であってもよい。入力/出力装置415は、電子機器410と1つの装置で構成されてもよい。また、サーバ420の入力/出力インタフェース424は、サーバ420に接続するかサーバ420が含むことのできる入力または出力のための装置(図示せず)とのインタフェースのための手段であってよい。
また、他の実施形態において、電子機器410およびサーバ420は、図4の構成要素よりも多くの構成要素を含んでもよい。しかし、大部分の従来技術的構成要素を明確に図に示す必要はない。例えば、電子機器410は、上述した入力/出力装置415のうちの少なくとも一部を含むように実現されてもよいし、トランシーバ、GPS(Global Positioning System)モジュール、カメラ、各種センサ、データベースなどのような他の構成要素をさらに含んでもよい。より具体的な例として、電子機器410がスマートフォンである場合、一般的にスマートフォンが含んでいる加速度センサやジャイロセンサ、カメラモジュール、物理的な各種ボタン、タッチパネルを利用したボタン、入力/出力ポート、振動のための振動器などのような多様な構成要素が、電子機器410にさらに含まれるように実現されてよい。電子機器410は、ユーザの音声入力を受信するためのマイク、音源を出力するためのスピーカ、音源に関する情報を表示するためのディスプレイなどを入力/出力装置415として含んでよい。
サーバ420は、クライアントである電子機器410を対象に音源提供サービスを提供するプラットフォームの役割を行うものである。サーバ420は、電子機器410上にインストールされたアプリケーションと連動して音源提供サービスを提供するようになるが、このとき、ユーザの要求に対して音源を自動選曲してミキシングした音源ミックスリストを電子機器410に提供してよい。
本実施形態に係る電子機器410は、ユーザの要求に対応する音源をサーバ420から受信してスピーカで出力するにおいて、該当の音源にLPF(low pass filter)、HPF(high pass filter)、タイムストレッチ、フェードアウトなどのような多様な効果を適用することができる音源フィルタを含んでよい。
本発明に係る音源フィルタリング技術は、プレイヤ前端で希望する音源区間にフィルタ効果を適用するという特徴を含んでよい。本発明に係る音源フィルタリング技術は、図1〜図3を参照しながら説明した会話基盤インタフェースを活用したサービス環境、あるいは図4を参照しながら説明した一般的なクライアント−サーバ環境に適用されてよいが、これに限定されることはなく、復号化(デコード)機能が搭載されたすべての音源再生機器に適用可能である。
図5は、一般的なフィルタ構造をもつ音源フィルタリング装置を説明するためのブロック図である。
図5を参照すると、音源フィルタリング装置500は、電子機器410に含まれるように構成されてよく、音源をデコードするためのデコーダ501、デコードされた音源データを一時記録するためのバッファ502、バッファリングされた音源データに所望する効果を適用するためのフィルタ503、およびフィルタ効果が適用された音源データを出力するためのスピーカ504を含んでよい。
デコーダ501、バッファ502、フィルタ503は、電子機器410のプロセッサ412の構成要素として含まれてよく、スピーカ504は、電子機器410の入力/出力装置415として含まれてよい。バッファ502、フィルタ503、およびスピーカ504は、音源再生のためのプレイヤ領域510として構成されてよい。プロセッサ412およびプロセッサ412の構成要素は、メモリ411が含むオペレーティングシステムのコードと少なくとも1つのプログラムのコードとによる命令を実行するように実現されてよい。
上述したフィルタ構造の音源フィルタリング過程は、次のとおりとなる。
デコーダ501は、音源をPCM(pulse code modulation)データにデコードした後、デコードされたPCMデータを非同期でバッファ502に伝達する(S511)。
一方、スピーカ504は、スピーカ504で現在再生しようとするPCMデータをフィルタ503に要求する(S521)。
フィルタ503は、スピーカ504の要求に対応し、フィルタリングするPCMデータをバッファ502に要求する(S522)。
バッファ502は、フィルタ503が要求する部分のPCMデータをフィルタ503に伝達する(S523)。
フィルタ503は、バッファ502から受け取ったPCMデータに該当の音源に関する事前設定に基づいて定義された効果を適用した後、該当の効果が適用されたPCMデータをスピーカ504に伝達する(S524)。
スピーカ504の要求に対して迅速な応答が必要となる状況において、スピーカ504がPCMデータを要求する方式であるため、特定の時間内に所望するフィルタ効果を正確に適用するのが困難であり、スピーカ504のPCMデータ要求時点にフィルタ503の適用値を能動的に変えれば、正確性も低下する。
所望する時間に希望する効果を適用するためには、タイマーなどを利用して該当のタイミングに効果を適用しなければならない。タイマーなどを利用すると、所望の時間にある程度合わせて効果を適用することは可能となるが、プレイヤ領域510でスピーカ504の要求に応じてフィルタ503の効果を適用する構造においては、正確なタイミングに効果を適用することは不可能である。
これを解決するために、本発明では、PCMデータにフィルタ効果を予め適用させた後、フィルタ効果が適用されたPCMデータを音源再生のためのバッファとして伝達する方式を適用する。
本発明に係る音源フィルタの実現要求事項は、次のとおりとなる。
先ず、希望する区間に所望するフィルタ効果を適用しなければならない。例えば、音源再生うちの50秒から55秒までの区間の再生速度を1.5倍に処理する効果を適用してよい。
次に、漸進的なフィルタ効果を適用しなければならない。例えば、音源再生うちの50秒から55秒までにLPFを適用するが、フィルタリング周波数を20,000Hzから500Hzまで線形的に適用してよい。
図6は、改善されたフィルタ構造をもつ音源フィルタリング装置を説明するためのブロック図である。
図6を参照すると、本発明に係る音源フィルタリング装置600は、電子機器410に含まれるように構成されてよく、音源をデコードするためのデコーダ601、デコードされた音源データに所望する効果を適用するためのフィルタ602、フィルタ効果が適用された音源データを一時記録するためのバッファ603、フィルタ効果が適用された音源データを出力するためのスピーカ604を含んでよい。
デコーダ601、フィルタ602、バッファ603は、電子機器410のプロセッサ412の構成要素として含まれてよく、スピーカ604は、電子機器410の入力/出力装置415として含まれてよい。このとき、バッファ603およびスピーカ604は、音源再生のためのプレイヤ領域610として構成されてよい。
音源フィルタリング装置600は、プレイヤ領域610の前端に、フィルタ602を含む構成要素として音源処理のためのレンダラー620を含んでよい。
PCMデータにフィルタ効果を順に適用し、これをプレイヤ610のバッファ603に伝達するようになるが、フィルタ効果が音源再生時間に応じて変化し続けるため、効果的な音源処理のためにプレイヤ領域610の前にレンダラー620を含んでよい。
プロセッサ412およびプロセッサ412の構成要素は、メモリ411が含むオペレーティングシステムのコードと少なくとも1つのプログラムのコードとによる命令を実行するように実現されてよい。
上述したフィルタ構造の音源フィルタリング過程は、次のとおりとなる。
デコーダ601は、音源をPCMデータにデコードした後、デコードされたPCMデータをフィルタ602が含まれたレンダラー620に伝達する(S611)。
レンダラー620は、デコーダ601から受け取ったPCMデータに該当の音源に関する事前設定に基づいて提議されたフィルタ効果を適用させた後、フィルタ効果が適用されたPCMデータをプレイヤ610のバッファ603に伝達する(S612)。
レンダラー620で適用されるフィルタ情報は、音源に関する事前設定情報であり、サーバ420から該当の音源に関する個別の情報として伝達されてよく、フィルタリングオプションやフィルタ効果を適用する区間情報などを含んでよい。
レンダラー620は、音源に関する事前設定情報にしたがい、該当の設定と対応する特定の区間に所望するフィルタ効果を正確に適用してよい。
スピーカ604は、スピーカ604で現在再生しようとするPCMデータをバッファ603に要求する(S621)。
バッファ603は、スピーカ604が要求する部分のPCMデータ、すなわち、事前設定によって定義したフィルタ効果が適用されたPCMデータをスピーカ604に伝達する(S622)。
図7は、レンダラー620の具体的な音源フィルタリング過程を説明するためのフローチャートである。
図7を参照すると、レンダラー620は、デコーダ601からデコーダ601によってデコードされたPCMデータの入力を受ける(S701)。
レンダラー620は、入力されたPCMデータを時間単位に分けて複数のセグメントとして生成してよい(S702)。
レンダラー620は、音源に関するフィルタ情報に基づいてフィルタ効果を適用する特定区間のPCMデータを複数のセグメントとして生成し、セグメント別にフィルタリングオプションを予め設定しておく。
例えば、図8を参照すると、LPFを適用するための4000フレームのPCMデータが入力されると、入力されたPCMデータを4つのセグメント(segment1〜segment4)に分け、各セグメント別にフィルタリングオプションと周波数を設定しておいてよい。このとき、各セグメントに対し、LPFの周波数を段階的に減らしていく形態で設定してよい。
フィルタ効果を適用するPCMデータを複数のセグメントに分け、各セグメント別にフィルタリングオプションを設定することにより、フィルタ効果を適用するにあたり、精密な制御はもちろん、漸進的な制御が可能となる。
レンダラー620は、フィルタ効果を適用するPCMデータをセグメント別に順にフィルタ602に入力してよい(S703)。
レンダラー620は、フィルタ602に入力されたセグメントに対し、予め設定されたフィルタリングオプションを指定してよい(S704)。
レンダラー620は、フィルタ602を利用して該当のセグメントのPCMデータに予め設定されたオプションによるフィルタリングを実行してよい(S705)。
レンダラー620は、上述した過程703〜705をセグメント別に繰り返し実行しながら、セグメントが残っているか確認してよい(S706)。
レンダラー620は、特定区間のPCMデータの全セグメントに対するフィルタリングが完了すれば、フィルタリングが実行されたPCMデータを、音源再生のためのプレイヤ領域610のバッファ603に伝達してよい(S707)。
したがって、本発明では、音源再生のためのプレイヤ610のバッファ603の前にレンダラー620を利用してフィルタ効果を予め適用させたPCMデータを生成し、これを再生させることにより、フィルタ効果を希望する区間に正確に適用することができる。
さらに、本発明では、フィルタ効果を適用するPCMデータを複数のセグメントに分け、セグメント別にフィルタリングオプションを指定することにより、フィルタ効果を漸進的に適用することも可能である。
フィルタ設定は、音源に関する事前設定はもちろん、プレイヤのUI(user interface)に入力されるユーザ要求によっても調節可能である。
図9は、他のフィルタ構造をもつ音源フィルタリング装置を説明するためのブロック図である。
図9を参照すると、本発明に係る音源フィルタリング装置900は、電子機器410に含まれるように構成されてよく、デコーダ901、第1フィルタ902、バッファ903、スピーカ905は、図6を参照しながら説明した音源フィルタリング装置600の構成要素と等しい。ただし、音源フィルタリング装置900には、電子機器410のユーザ要求によって定義されたフィルタ効果を追加で適用するための第2フィルタ904がさらに含まれてよい。
デコーダ901、第1フィルタ902、バッファ903、第2フィルタ904は、電子機器410のプロセッサ412の構成要素として含まれてよく、スピーカ905は、電子機器410の入力/出力装置415として含まれてよい。このとき、バッファ903、第2フィルタ904、およびスピーカ905は、音源再生のためのプレイヤ領域910として構成されてよい。
音源フィルタリング装置900は、プレイヤ領域910の前端に、第1フィルタ902を含む構成要素として音源処理のためのレンダラー920を含んでよい。
第1フィルタ902は、サーバ420の事前設定と対応するフィルタ効果を適用してよく、第2フィルタ902は、次曲再生などのようにプレイヤ側から入力されるユーザのアクションに基づいて定義されたフィルタ効果を適用してよい。
上述したフィルタ構造の音源フィルタリング過程は、次のとおりとなる。
デコーダ901は、音源をPCMデータにデコードした後、デコードされたPCMデータを第1フィルタ902が含まれたレンダラー920に伝達する(S911)。
レンダラー920は、デコーダ901から受け取ったPCMデータに、該当の音源に関する事前設定に基づいて定義されたフィルタ効果を適用させた後、フィルタ効果が適用されたPCMデータをプレイヤ910のバッファ903に伝達する(S912)。
一方、スピーカ905は、スピーカ905で現在再生しようとするPCMデータを第2フィルタ904に要求する(S921)。
第2フィルタ904は、スピーカ905の要求に対応し、フィルタリングするPCMデータをバッファ903に要求する(S922)。
バッファ903は、第2フィルタ904が要求する部分のPCMデータを第2フィルタ904に伝達する(S923)。
第2フィルタ904は、バッファ903から受け取ったPCMデータに、ユーザ設定に基づいて定義されたフィルタ効果を適用させた後、該当の効果が適用されたPCMデータをスピーカ905に伝達する(S924)。
したがって、本発明では、音源データに対して該当の音源の事前設定によるフィルタ効果はもちろん、非同期で入力されるユーザ要求に基づいて定義されたフィルタ効果を追加で適用することができる。
このように、本発明の実施形態によると、プレイヤ前端で音源の特定区間に所望するフィルタ効果を適用することができる。音源データを複数のセグメントに分け、各セグメント別にフィルタリングオプションを指定してフィルタリングを実行することにより、正確なタイミングにフィルタ効果を適用することができ、漸進的なフィルタ効果を適用することができる。
上述した装置は、ハードウェア構成要素、ソフトウェア構成要素、および/またはハードウェア構成要素とソフトウェア構成要素との組み合わせによって実現されてよい。例えば、実施形態で説明された装置および構成要素は、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ、マイクロコンピュータ、FPGA(field programmable gate array)、PLU(programmable logic unit)、マイクロプロセッサ、または命令を実行して応答することができる様々な装置のように、1つ以上の汎用コンピュータまたは特殊目的コンピュータを利用して実現されてよい。処理装置は、オペレーティングシステム(OS)およびOS上で実行される1つ以上のソフトウェアアプリケーションを実行してよい。また、処理装置は、ソフトウェアの実行に応答し、データにアクセスし、データを記録、操作、処理、および生成してもよい。理解の便宜のために、1つの処理装置が使用されるとして説明される場合もあるが、当業者は、処理装置が複数個の処理要素および/または複数種類の処理要素を含んでもよいことが理解できるであろう。例えば、処理装置は、複数個のプロセッサまたは1つのプロセッサおよび1つのコントローラを含んでよい。また、並列プロセッサのような、他の処理構成も可能である。
ソフトウェアは、コンピュータプログラム、コード、命令、またはこれらのうちの1つ以上の組み合わせを含んでもよく、思うままに動作するように処理装置を構成したり、独立的または集合的に処理装置に命令したりしてよい。ソフトウェアおよび/またはデータは、処理装置に基づいて解釈されたり、処理装置に命令またはデータを提供したりするために、いかなる種類の機械、コンポーネント、物理装置、コンピュータ記録媒体または装置に具現化されてよい。ソフトウェアは、ネットワークによって接続されたコンピュータシステム上に分散され、分散された状態で記録されても実行されてもよい。ソフトウェアおよびデータは、1つ以上のコンピュータ読み取り可能な記録媒体に記録されてよい。
実施形態に係る方法は、多様なコンピュータ手段によって実行可能なプログラム命令の形態で実現されてコンピュータ読み取り可能な媒体に記録されてよい。ここで、媒体は、コンピュータ実行可能なプログラムを継続して記録するものであっても、実行またはダウンロードのために一時記録するものであってもよい。また、媒体は、単一または複数のハードウェアが結合した形態の多様な記録手段または格納手段であってよく、あるコンピュータシステムに直接接続する媒体に限定されることはなく、ネットワーク上に分散して存在するものであってもよい。媒体の例は、ハードディスク、フロッピー(登録商標)ディスク、および磁気テープのような磁気媒体、CD−ROMおよびDVDのような光媒体、フロプティカルディスクのような光磁気媒体、およびROM、RAM、フラッシュメモリなどを含み、プログラム命令が記録されるように構成されたものであってよい。また、媒体の他の例として、アプリケーションを配布するアプリケーションストアやその他の多様なソフトウェアを供給または配布するサイト、サーバなどで管理する記録媒体または格納媒体が挙げられる。
以上のように、実施形態を、限定された実施形態および図面に基づいて説明したが、当業者であれば、上述した記載から多様な修正および変形が可能であろう。例えば、説明された技術が、説明された方法とは異なる順序で実行されたり、かつ/あるいは、説明されたシステム、構造、装置、回路などの構成要素が、説明された方法とは異なる形態で結合されたりまたは組み合わされたり、他の構成要素または均等物によって対置されたり置換されたとしても、適切な結果を達成することができる。
したがって、異なる実施形態であっても、特許請求の範囲と均等なものであれば、添付される特許請求の範囲に属する。
さらに、本発明は、精密な制御によって漸進的にフィルタ効果を適用することができる方法およびシステムを提供する。
本発明の実施形態によると、さらに、精密な制御によって漸進的にフィルタ効果を適用することができる。
601:デコーダ
602:フィルタ
603:バッファ
604:スピーカ
610:プレイヤ領域
620:レンダラー

Claims (13)

  1. コンピュータシステムであって、
    少なくとも1つのプロセッサ、および
    前記少なくとも1つのプロセッサと連結し、前記少なくとも1つのプロセッサによって実行可能な命令を含むメモリ
    を含み、
    前記少なくとも1つのプロセッサは、
    音源データをデコードするためのデコーダ、前記デコードされた音源データを処理するためのレンダラー、および音源再生のためのプレイヤを含み、
    前記レンダラーは、音源と関連する設定にしたがって特定区間の音源データに前記設定と対応する効果を適用するためのフィルタを含み、
    前記プレイヤは、前記レンダラーから前記効果が適用された音源データを受け取って再生させる、
    コンピュータシステム。
  2. 前記レンダラーは、前記特定区間の音源データを時間単位に分けて複数のセグメントとして生成した後、各セグメント別にフィルタリングを実行する、
    請求項1に記載のコンピュータシステム。
  3. 前記レンダラーは、前記特定区間の音源データを時間単位に分けて複数のセグメントとして生成した後、各セグメント別にフィルタリングオプションを指定し、指定されたオプションにしたがってフィルタリングを実行する、
    請求項1に記載のコンピュータシステム。
  4. 前記音源と関連する設定は、前記音源に関する事前設定情報としてフィルタリングオプションとフィルタリング区間情報を含むフィルタ情報が含まれる、
    請求項1に記載のコンピュータシステム。
  5. 前記プレイヤは、前記レンダラーから前記効果が適用された音源データを受け取り、スピーカの要求に応じて前記スピーカに伝達するバッファを含み、
    前記バッファは、前記バッファの前に前記フィルタによって前記効果が適用された音源データを受け取って記録する、
    請求項1に記載のコンピュータシステム。
  6. 前記プレイヤは、前記プレイヤのUI(user interface)に入力されるユーザ要求によって定義された効果を音源データに追加で適用するフィルタをさらに含む、
    請求項1に記載のコンピュータシステム。
  7. コンピュータシステムが実行する音源フィルタリング方法であって、
    前記コンピュータシステムは、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、
    前記少なくとも1つのプロセッサは、音源処理のためのレンダラー、および音源再生のためのプレイヤを含み、
    前記音源フィルタリング方法は、
    前記レンダラーにより、音源と関連する設定にしたがって特定区間の音源データに前記設定と対応するフィルタ効果を適用する段階、および
    前記プレイヤにより、前記特定区間に前記フィルタ効果が適用された音源データを再生させる段階
    を含む、音源フィルタリング方法。
  8. 前記フィルタ効果を適用する段階は、
    前記特定区間の音源データを時間単位に分けて複数のセグメントとして生成した後、各セグメント別にフィルタリングを実行する段階
    を含む、請求項7に記載の音源フィルタリング方法。
  9. 前記フィルタ効果を適用する段階は、
    前記特定区間の音源データを時間単位に分けて複数のセグメントとして生成する段階、および
    各セグメント別にフィルタリングオプションを指定し、指定されたオプションにしたがってフィルタリングを実行する段階
    を含む、請求項7に記載の音源フィルタリング方法。
  10. 前記音源と関連する設定は、前記音源に関する事前設定情報としてフィルタリングオプションとフィルタリング区間情報を含むフィルタ情報が含まれる、
    請求項7に記載の音源フィルタリング方法。
  11. 前記フィルタ効果が適用された音源データを再生させる段階は、
    前記プレイヤのバッファにおいて、前記レンダラーから前記バッファの前に前記フィルタ効果が適用された音源データを受け取って記録した後、スピーカの要求に応じて前記スピーカに伝達する段階
    を含む、請求項7に記載の音源フィルタリング方法。
  12. 前記フィルタ効果が適用された音源データを再生させる段階は、
    前記プレイヤのUIに入力されるユーザ要求によって定義されたフィルタ効果を音源データに追加で適用する段階
    を含む、請求項7に記載の音源フィルタリング方法。
  13. 請求項7〜12のうちのいずれか一項に記載の音源フィルタリング方法をコンピュータに実行させるためのプログラムが記録されている、非一時なコンピュータ読み取り可能な記録媒体。
JP2019124748A 2018-07-31 2019-07-03 音源フィルタリングのための方法およびシステム Pending JP2020022158A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2018-0089190 2018-07-31
KR1020180089190A KR102152334B1 (ko) 2018-07-31 2018-07-31 음원 필터링을 위한 방법 및 시스템

Publications (1)

Publication Number Publication Date
JP2020022158A true JP2020022158A (ja) 2020-02-06

Family

ID=69588820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019124748A Pending JP2020022158A (ja) 2018-07-31 2019-07-03 音源フィルタリングのための方法およびシステム

Country Status (2)

Country Link
JP (1) JP2020022158A (ja)
KR (1) KR102152334B1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010100895A1 (ja) * 2009-03-06 2010-09-10 パナソニック株式会社 音声再生装置及び映像音声再生装置
JP2012205087A (ja) * 2011-03-25 2012-10-22 Olympus Imaging Corp 音声処理装置
WO2018024953A1 (fr) * 2016-08-04 2018-02-08 Damien Plisson Systeme de decodage et de lecture audio

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060028240A (ko) * 2004-09-24 2006-03-29 (주)잉카엔트웍스 음원 편집 방법 및 그 장치
KR101114431B1 (ko) * 2010-01-19 2012-02-24 전자부품연구원 실시간 스트리밍을 위한 오디오 생성장치, 오디오 재생장치 및 그 방법
KR101698097B1 (ko) * 2011-03-11 2017-01-19 엘지전자 주식회사 음향 효과 발생이 가능한 멀티미디어 장치, 음향 효과 발생 장치, 그리고 음향 효과 발생 방법
KR101369458B1 (ko) * 2012-02-07 2014-03-06 주식회사 네오위즈인터넷 음원 파일을 편집하는 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010100895A1 (ja) * 2009-03-06 2010-09-10 パナソニック株式会社 音声再生装置及び映像音声再生装置
JP2012205087A (ja) * 2011-03-25 2012-10-22 Olympus Imaging Corp 音声処理装置
WO2018024953A1 (fr) * 2016-08-04 2018-02-08 Damien Plisson Systeme de decodage et de lecture audio

Also Published As

Publication number Publication date
KR102152334B1 (ko) 2020-09-04
KR20200013937A (ko) 2020-02-10

Similar Documents

Publication Publication Date Title
KR102025391B1 (ko) 사용자의 발화 위치에 따른 디바이스 제어
JP6752870B2 (ja) 複数のウェイクワードを利用して人工知能機器を制御する方法およびシステム
US10657963B2 (en) Method and system for processing user command to provide and adjust operation of electronic device by analyzing presentation of user speech
US11721341B2 (en) Electronic device and controlling method thereof
TWI511125B (zh) 語音操控方法、行動終端裝置及語音操控系統
JP6567727B2 (ja) 受信した音声入力の入力音量に基づいて出力される音の出力音量を調節するユーザ命令処理方法およびシステム
JP6607999B2 (ja) 音声要請に対応する情報提供のためのメディア選択
KR102209092B1 (ko) 복수의 호출 용어를 이용하여 인공지능 기기를 제어하는 방법 및 시스템
US11341966B2 (en) Output for improving information delivery corresponding to voice request
JP6728319B2 (ja) 人工知能機器で複数のウェイクワードを利用したサービス提供方法およびそのシステム
US11004452B2 (en) Method and system for multimodal interaction with sound device connected to network
JP6920398B2 (ja) 人工知能機器における連続会話機能
JP6775563B2 (ja) 人工知能機器の自動不良検出のための方法およびシステム
US11908464B2 (en) Electronic device and method for controlling same
KR102152334B1 (ko) 음원 필터링을 위한 방법 및 시스템
KR102309509B1 (ko) 인공지능 기기 상호간의 호출을 활용한 IoT 디바이스를 제어하는 방법 및 시스템
JP6713032B2 (ja) 雰囲気コントロールが可能な音源ミキシング方法およびシステム
CN111312280B (zh) 用于控制语音的方法和装置
US20200357414A1 (en) Display apparatus and method for controlling thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190703

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201224

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210406