JP2001282261A - 音声データ設定装置及び方法、音声データ生成装置及び方法、記録媒体 - Google Patents
音声データ設定装置及び方法、音声データ生成装置及び方法、記録媒体Info
- Publication number
- JP2001282261A JP2001282261A JP2000095350A JP2000095350A JP2001282261A JP 2001282261 A JP2001282261 A JP 2001282261A JP 2000095350 A JP2000095350 A JP 2000095350A JP 2000095350 A JP2000095350 A JP 2000095350A JP 2001282261 A JP2001282261 A JP 2001282261A
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- metadata
- audio
- output format
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H7/00—Instruments in which the tones are synthesised from a data store, e.g. computer organs
- G10H7/002—Instruments in which the tones are synthesised from a data store, e.g. computer organs using a common processing for different operations or calculations, and a set of microinstructions (programme) to control the sequence thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0033—Recording/reproducing or transmission of music for electrophonic musical instruments
- G10H1/0041—Recording/reproducing or transmission of music for electrophonic musical instruments in coded form
- G10H1/0058—Transmission between separate instruments or between individual components of a musical system
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99942—Manipulating data structure, e.g. compression, compaction, compilation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Telephone Function (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
- Stereophonic System (AREA)
- Telephonic Communication Services (AREA)
Abstract
(57)【要約】
【課題】 音声のソースの種別に関わらず、各音声の内
容に即した出力形式の設定を行うこと。 【解決手段】 複数の音声データに係る音声を所定の出
力形式で出力するための音声データを生成する音声デー
タ生成装置であって、各々の前記音声データの内容を示
すメタデータを取得するメタデータ受信部101と、取
得したメタデータに基づいて、各メタデータに対応する
音声データに係る音声の出力形式を設定する出力形式設
定部103と、設定された出力形式に基づいて、各々の
音声データから新たな音声データを生成する出力データ
作成部105と、を備え、音声のソースではなく、メタ
データに基づいて出力形式を設定することにより、音声
の内容に即した出力形式が設定できる。
容に即した出力形式の設定を行うこと。 【解決手段】 複数の音声データに係る音声を所定の出
力形式で出力するための音声データを生成する音声デー
タ生成装置であって、各々の前記音声データの内容を示
すメタデータを取得するメタデータ受信部101と、取
得したメタデータに基づいて、各メタデータに対応する
音声データに係る音声の出力形式を設定する出力形式設
定部103と、設定された出力形式に基づいて、各々の
音声データから新たな音声データを生成する出力データ
作成部105と、を備え、音声のソースではなく、メタ
データに基づいて出力形式を設定することにより、音声
の内容に即した出力形式が設定できる。
Description
【0001】
【発明の属する技術分野】本発明は、音声データの処理
に関し、特に、複数の音声の出力が略同時に要求された
場合における各音声に係る音声データの処理に関する。
に関し、特に、複数の音声の出力が略同時に要求された
場合における各音声に係る音声データの処理に関する。
【0002】
【従来の技術】従来、複数のソースの音声を並行して聴
取可能にする装置として、オーディオ再生装置の音声と
携帯電話等の通信装置の音声とを切替えたり重畳したり
する装置が提案されている。
取可能にする装置として、オーディオ再生装置の音声と
携帯電話等の通信装置の音声とを切替えたり重畳したり
する装置が提案されている。
【0003】例えば、ヘッドホンステレオ等から音楽を
聞いている最中に、携帯電話やページャ等からの着信が
あった場合に、これを知らせる発明としては、実開昭6
2−155546号、特開昭63−146647号、特
開平03−158047号、特開平04−334240
号、実開平05−031432号、特開平05−091
169号、特開平07−307773号、特開平09−
181797号、特開平09−321844号に記載さ
れた発明が提案されている。
聞いている最中に、携帯電話やページャ等からの着信が
あった場合に、これを知らせる発明としては、実開昭6
2−155546号、特開昭63−146647号、特
開平03−158047号、特開平04−334240
号、実開平05−031432号、特開平05−091
169号、特開平07−307773号、特開平09−
181797号、特開平09−321844号に記載さ
れた発明が提案されている。
【0004】これらに記載された発明は、オーディオ再
生装置と通信装置の接続構成、切替や重畳を行なう方法
に違いはあるものの、いずれもオーディオ再生装置等か
らの音声に、通信装置からの着信通知音声や通話音声を
切替もしくは重畳して出力している。いずれの装置で
も、音声の切替もしくは重畳は、通信装置への着信を契
機として自動的に行なわれている。
生装置と通信装置の接続構成、切替や重畳を行なう方法
に違いはあるものの、いずれもオーディオ再生装置等か
らの音声に、通信装置からの着信通知音声や通話音声を
切替もしくは重畳して出力している。いずれの装置で
も、音声の切替もしくは重畳は、通信装置への着信を契
機として自動的に行なわれている。
【0005】ここで、特開平05−091169号で提
案されている音声出力データ作成装置では、音声出力デ
ータ作成装置にオーディオ再生装置と通信装置が接続さ
れており、通信装置に着信があった時に、オーディオ再
生装置の音声出力レベルを0にし(ミュートさせ)着信
通知音声および通話音声を出力する。
案されている音声出力データ作成装置では、音声出力デ
ータ作成装置にオーディオ再生装置と通信装置が接続さ
れており、通信装置に着信があった時に、オーディオ再
生装置の音声出力レベルを0にし(ミュートさせ)着信
通知音声および通話音声を出力する。
【0006】また、実開昭62−155546号、特開
昭63−146647号、特開平03−158047号
で提案されている音声出力データ作成装置も、機能面か
ら見ると同様であるが、オーディオ再生モジュールと通
信モジュールが一体となった構成になっている。
昭63−146647号、特開平03−158047号
で提案されている音声出力データ作成装置も、機能面か
ら見ると同様であるが、オーディオ再生モジュールと通
信モジュールが一体となった構成になっている。
【0007】また、実開平05−031432号で提案
されている音声出力データ作成装置は、オーディオ再生
装置を接続できる通信機能を持つ音声出力データ作成装
置であり、音声出力データ作成装置の通信モジュールに
着信があった時に、オーディオ再生装置からの音声に着
信通知音声および通話音声をミキシングして出力する。
通話音声のミキシングにおいては、オーディオ再生装置
の音声のレベルを一定値以下に抑制して、通話を妨げな
いようにしている。
されている音声出力データ作成装置は、オーディオ再生
装置を接続できる通信機能を持つ音声出力データ作成装
置であり、音声出力データ作成装置の通信モジュールに
着信があった時に、オーディオ再生装置からの音声に着
信通知音声および通話音声をミキシングして出力する。
通話音声のミキシングにおいては、オーディオ再生装置
の音声のレベルを一定値以下に抑制して、通話を妨げな
いようにしている。
【0008】また、特開平07−307773号、特開
平09−181797号、特開平09−321844号
で提案されている音声出力データ作成装置は、ミュート
とミキシングのいずれかあるいは両方を用いてオーディ
オ音声に着信通知音声および通話音声を重畳している。
特開平04−334240号も同様であるが、オーディ
オ装置と通信装置が一体となった構成であり、通信装置
の音声を出力する場合に、オーディオ装置のテープを停
止することができる。
平09−181797号、特開平09−321844号
で提案されている音声出力データ作成装置は、ミュート
とミキシングのいずれかあるいは両方を用いてオーディ
オ音声に着信通知音声および通話音声を重畳している。
特開平04−334240号も同様であるが、オーディ
オ装置と通信装置が一体となった構成であり、通信装置
の音声を出力する場合に、オーディオ装置のテープを停
止することができる。
【0009】
【発明が解決しようとする課題】ここで、上記従来技術
では、いずれも、音声のソースがオーディオ機器の出
力、通信機器の着信通知あるいは通話内容といった予め
定められたソースであり、また、複数の音声の切替え、
重畳といった出力形式の設定も各ソースに対応して定め
られたものであった。
では、いずれも、音声のソースがオーディオ機器の出
力、通信機器の着信通知あるいは通話内容といった予め
定められたソースであり、また、複数の音声の切替え、
重畳といった出力形式の設定も各ソースに対応して定め
られたものであった。
【0010】しかし、近年では、ソースのディジタル化
が進み、ネットワークを通して多様なソースから音声が
供給可能となっており、音声のソースは、オーディオ出
力や通信機器への着信通知あるいは通話以外にも様々で
あり、その組み合せの自由度は大きい。例えば、ネット
ワーク経由で音楽データを取得して聴取したり、音声放
送を聴取したり、他者と通話したり、電子メールの着信
通知など各種機器や計算構上の各種アプリケーションか
らの通知を聴取したりと多様な音声のソースが存在す
る。
が進み、ネットワークを通して多様なソースから音声が
供給可能となっており、音声のソースは、オーディオ出
力や通信機器への着信通知あるいは通話以外にも様々で
あり、その組み合せの自由度は大きい。例えば、ネット
ワーク経由で音楽データを取得して聴取したり、音声放
送を聴取したり、他者と通話したり、電子メールの着信
通知など各種機器や計算構上の各種アプリケーションか
らの通知を聴取したりと多様な音声のソースが存在す
る。
【0011】従って、各ソースの組み合せに基づいて、
複数の音声の切替え、重畳といった出力形式を設定して
いたのでは、予定していないソースからの音声に対応で
きない。
複数の音声の切替え、重畳といった出力形式を設定して
いたのでは、予定していないソースからの音声に対応で
きない。
【0012】また、同一のソースからの音声であって
も、その内容が多様化しており、各ソースの組み合せに
基づいて音声の出力形式を設定したのでは、その内容に
即した音声の出力が困難である。
も、その内容が多様化しており、各ソースの組み合せに
基づいて音声の出力形式を設定したのでは、その内容に
即した音声の出力が困難である。
【0013】従って、本発明の目的は、音声のソースの
種別に関わらず、各音声の内容に即した出力形式の設定
をなし得る音声データ設定装置及び方法、音声データ生
成装置及び方法、記録媒体を提供することにある。
種別に関わらず、各音声の内容に即した出力形式の設定
をなし得る音声データ設定装置及び方法、音声データ生
成装置及び方法、記録媒体を提供することにある。
【0014】
【課題を解決するための手段】本発明によれば、複数の
音声データに係る音声を出力するにあたり、各音声の出
力形式を設定するための音声データ設定装置であって、
各々の前記音声データの内容を示すメタデータを取得す
る取得手段と、各々の前記メタデータに基づいて、該メ
タデータに対応する前記音声データに係る音声の出力形
式を設定する設定手段と、を備えたことを特徴とする音
声データ設定装置が提供される。
音声データに係る音声を出力するにあたり、各音声の出
力形式を設定するための音声データ設定装置であって、
各々の前記音声データの内容を示すメタデータを取得す
る取得手段と、各々の前記メタデータに基づいて、該メ
タデータに対応する前記音声データに係る音声の出力形
式を設定する設定手段と、を備えたことを特徴とする音
声データ設定装置が提供される。
【0015】また、本発明によれば、複数の音声データ
に係る音声を所定の出力形式で出力するための音声デー
タを生成する音声データ生成装置であって、各々の前記
音声データの内容を示すメタデータを取得する取得手段
と、各々の前記メタデータに基づいて、該メタデータに
対応する前記音声データに係る音声の出力形式を設定す
る設定手段と、設定された前記出力形式に基づいて、各
々の前記音声データから新たな音声データを生成する手
段と、を備えたことを特徴とする音声データ生成装置が
提供される。
に係る音声を所定の出力形式で出力するための音声デー
タを生成する音声データ生成装置であって、各々の前記
音声データの内容を示すメタデータを取得する取得手段
と、各々の前記メタデータに基づいて、該メタデータに
対応する前記音声データに係る音声の出力形式を設定す
る設定手段と、設定された前記出力形式に基づいて、各
々の前記音声データから新たな音声データを生成する手
段と、を備えたことを特徴とする音声データ生成装置が
提供される。
【0016】また、本発明によれば、複数の音声データ
に係る音声を出力するにあたり、各音声の出力形式を設
定するための音声データ設定方法であって、各々の前記
音声データの内容を示すメタデータを取得する取得工程
と、各々の前記メタデータに基づいて、該メタデータに
対応する前記音声データに係る音声の出力形式を設定す
る設定工程と、を含むことを特徴とする音声データ設定
方法が提供される。
に係る音声を出力するにあたり、各音声の出力形式を設
定するための音声データ設定方法であって、各々の前記
音声データの内容を示すメタデータを取得する取得工程
と、各々の前記メタデータに基づいて、該メタデータに
対応する前記音声データに係る音声の出力形式を設定す
る設定工程と、を含むことを特徴とする音声データ設定
方法が提供される。
【0017】また、本発明によれば、複数の音声データ
に係る音声を所定の出力形式で出力するための音声デー
タを生成する音声データ生成方法であって、各々の前記
音声データの内容を示すメタデータを取得する取得工程
と、各々の前記メタデータに基づいて、該メタデータに
対応する前記音声データに係る音声の出力形式を設定す
る設定工程と、設定された前記出力形式に基づいて、各
々の前記音声データから新たな音声データを生成する工
程と、を含むことを特徴とする音声データ生成方法が提
供される。
に係る音声を所定の出力形式で出力するための音声デー
タを生成する音声データ生成方法であって、各々の前記
音声データの内容を示すメタデータを取得する取得工程
と、各々の前記メタデータに基づいて、該メタデータに
対応する前記音声データに係る音声の出力形式を設定す
る設定工程と、設定された前記出力形式に基づいて、各
々の前記音声データから新たな音声データを生成する工
程と、を含むことを特徴とする音声データ生成方法が提
供される。
【0018】また、本発明によれば、複数の音声データ
に係る音声を出力するにあたり、各音声の出力形式を設
定するために、コンピュータを、各々の前記音声データ
の内容を示すメタデータを取得する取得手段、各々の前
記メタデータに基づいて、該メタデータに対応する前記
音声データに係る音声の出力形式を設定する設定手段、
として機能させるプログラムを記録した記録媒体が提供
される。
に係る音声を出力するにあたり、各音声の出力形式を設
定するために、コンピュータを、各々の前記音声データ
の内容を示すメタデータを取得する取得手段、各々の前
記メタデータに基づいて、該メタデータに対応する前記
音声データに係る音声の出力形式を設定する設定手段、
として機能させるプログラムを記録した記録媒体が提供
される。
【0019】また、本発明によれば、複数の音声データ
に係る音声を所定の出力形式で出力するための音声デー
タを生成するために、コンピュータを、各々の前記音声
データの内容を示すメタデータを取得する取得手段、各
々の前記メタデータに基づいて、該メタデータに対応す
る前記音声データに係る音声の出力形式を設定する設定
手段、設定された前記出力形式に基づいて、各々の前記
音声データから新たな音声データを生成する手段、とし
て機能させるプログラムを記録した記録媒体が提供され
る。
に係る音声を所定の出力形式で出力するための音声デー
タを生成するために、コンピュータを、各々の前記音声
データの内容を示すメタデータを取得する取得手段、各
々の前記メタデータに基づいて、該メタデータに対応す
る前記音声データに係る音声の出力形式を設定する設定
手段、設定された前記出力形式に基づいて、各々の前記
音声データから新たな音声データを生成する手段、とし
て機能させるプログラムを記録した記録媒体が提供され
る。
【0020】
【発明の実施の形態】以下、図面を参照して本発明の好
適な実施の形態について説明する。
適な実施の形態について説明する。
【0021】図1は、本発明の一実施形態に係る音声デ
ータ生成装置の基本構成を示すブロック図である。
ータ生成装置の基本構成を示すブロック図である。
【0022】図1において、101は、音声データの内
容を記述したメタデータを受信するメタデータ受信部で
ある。102は、メタデータ受信部101で受信したメ
タデータを保持するメタデータ保持部である。103
は、メタデータ保持部102に保持されている各メタデ
ータを用いて、対応する音声データの出力形式を設定す
る設定手段としての出力形式設定部である。104は、
出力形式設定部103で決定された出力形式に基づき音
声データを受信する音声データ受信部である。105
は、出力形式設定部103で決定された出力形式に基づ
き、音声データ受信部104で受信した音声データを必
要に応じて選択および重畳して出力データを作成する出
力データ作成部である。
容を記述したメタデータを受信するメタデータ受信部で
ある。102は、メタデータ受信部101で受信したメ
タデータを保持するメタデータ保持部である。103
は、メタデータ保持部102に保持されている各メタデ
ータを用いて、対応する音声データの出力形式を設定す
る設定手段としての出力形式設定部である。104は、
出力形式設定部103で決定された出力形式に基づき音
声データを受信する音声データ受信部である。105
は、出力形式設定部103で決定された出力形式に基づ
き、音声データ受信部104で受信した音声データを必
要に応じて選択および重畳して出力データを作成する出
力データ作成部である。
【0023】図2は、上記音声データ生成装置が機能的
に実現されるハードウエアの構成例を示す図である。
に実現されるハードウエアの構成例を示す図である。
【0024】図2において、201はCPUであり、後
述する手順を実現するプログラムに従って動作する。2
02はRAMであり、メタデータ又は音声データの保存
のための領域や上記プログラムの動作に必要な領域を提
供する。203はディスク装置であり、後述する手順を
実現するプログラムを保持する。204はネットワーク
インタフェースであり、ネットワーク経由で他の機器か
ら送られるメタデータや音声データの受信を実現する。
205はバスである。
述する手順を実現するプログラムに従って動作する。2
02はRAMであり、メタデータ又は音声データの保存
のための領域や上記プログラムの動作に必要な領域を提
供する。203はディスク装置であり、後述する手順を
実現するプログラムを保持する。204はネットワーク
インタフェースであり、ネットワーク経由で他の機器か
ら送られるメタデータや音声データの受信を実現する。
205はバスである。
【0025】以下、図3のフローチャートを参照して、
上記音声データ生成装置で実行される出力形式の設定処
理の手順を示す。
上記音声データ生成装置で実行される出力形式の設定処
理の手順を示す。
【0026】まず、ステップS301では、メタデータ
保持部102に新たにメタデータが保持されたかを調べ
る。ネットワークインタフェースを通して新しいメタデ
ータがメタデータ受信部101に届くと、メタデータ受
信部101は、これをメタデータ保持部102に保持す
る処理を独立して行なっている。新たなメタデータが保
持されない場合はステップS301を繰り返す。この繰
り返しの際に一定時間処理を中断してもよい。新たなメ
タデータが保持された場合は、ステップS302に移
る。
保持部102に新たにメタデータが保持されたかを調べ
る。ネットワークインタフェースを通して新しいメタデ
ータがメタデータ受信部101に届くと、メタデータ受
信部101は、これをメタデータ保持部102に保持す
る処理を独立して行なっている。新たなメタデータが保
持されない場合はステップS301を繰り返す。この繰
り返しの際に一定時間処理を中断してもよい。新たなメ
タデータが保持された場合は、ステップS302に移
る。
【0027】なお、メタデータは、例えば、本装置とネ
ットワークで結合された任意の装置から送られる。例え
ば、インターネットラジオの番組を選択する装置があ
り、その装置で利用者が番組を選択した時に、その番組
のメタデータが本装置に送信される場合等である。ま
た、本装置が他のアプリケーションが実行されるコンピ
ュータとして実現される場合は、該アプリケーションか
ら送られる場合もある。
ットワークで結合された任意の装置から送られる。例え
ば、インターネットラジオの番組を選択する装置があ
り、その装置で利用者が番組を選択した時に、その番組
のメタデータが本装置に送信される場合等である。ま
た、本装置が他のアプリケーションが実行されるコンピ
ュータとして実現される場合は、該アプリケーションか
ら送られる場合もある。
【0028】図6は、このメタデータの例である。図6
のメタデータは、XML言語により記述されていて、そ
の意味は次の通りである。まず、当該番組の音声データ
のソースは、“http://radio/program1”でアクセスで
き、音声ソースのタイプはラジオ番組で、音声データの
形式はストリームであり、再生の開始や停止を制御でき
ない。また、音声の種類は音楽で、長さは15分であ
る。
のメタデータは、XML言語により記述されていて、そ
の意味は次の通りである。まず、当該番組の音声データ
のソースは、“http://radio/program1”でアクセスで
き、音声ソースのタイプはラジオ番組で、音声データの
形式はストリームであり、再生の開始や停止を制御でき
ない。また、音声の種類は音楽で、長さは15分であ
る。
【0029】図7は別のメタデータの例である。これ
は、スケジュール管理を行なう装置が、アポの開始時間
が迫ったときに利用者に注意を促すメッセージを送る場
合に、本装置に送信するメタデータの例である。その意
味は次の通りである。まず、当該メッセージの音声デー
タのソースは、“http://schedular/”でアクセスで
き、音声ソースのタイプはスケジューラであり、音声デ
ータの形式はストリームであり、再生の開始や停止を制
御できる。また、音声の種類は肉声で、長さは20秒で
ある。
は、スケジュール管理を行なう装置が、アポの開始時間
が迫ったときに利用者に注意を促すメッセージを送る場
合に、本装置に送信するメタデータの例である。その意
味は次の通りである。まず、当該メッセージの音声デー
タのソースは、“http://schedular/”でアクセスで
き、音声ソースのタイプはスケジューラであり、音声デ
ータの形式はストリームであり、再生の開始や停止を制
御できる。また、音声の種類は肉声で、長さは20秒で
ある。
【0030】ステップS302では、メタデータ保持部
102に保持されている各メタデータから、出力する音
声データの組み合わせを決定する。例えば、音声の種類
が音楽と肉声との二つであるとすると、次のルールに従
って組み合わせを決定することができる。 (1)メタデータ保持部102に保持されているメタデ
ータが一つの場合、すなわちそれまで音声が出力されて
いなかった場合は、新たな音声データをゲイン1でその
まま出力データとする。 (2)メタデータ保持部102に保持されているメタデ
ータが二つであり、それぞれの音声の種類が音楽及び肉
声についてそれぞれ一つずつの場合は、音楽の音声デー
タをゲイン0.5で、声の音声データをゲイン1で重畳
する。 (3)メタデータ保持部102に保持されているメタデ
ータが二つ以上であり、その音声の種類が一致するメタ
データが複数ある場合は、各音声を切替えて出力するよ
うにする。例えば、それまで出力していた方の音声デー
タに係る音声の出力を中止し、新たに保持されたメタデ
ータが示す音声データに係る音声を、出力を中止した音
声のゲインと同じゲインで出力する。出力を中止した音
声データのメタデータは、メタデータ保持部102から
削除する。
102に保持されている各メタデータから、出力する音
声データの組み合わせを決定する。例えば、音声の種類
が音楽と肉声との二つであるとすると、次のルールに従
って組み合わせを決定することができる。 (1)メタデータ保持部102に保持されているメタデ
ータが一つの場合、すなわちそれまで音声が出力されて
いなかった場合は、新たな音声データをゲイン1でその
まま出力データとする。 (2)メタデータ保持部102に保持されているメタデ
ータが二つであり、それぞれの音声の種類が音楽及び肉
声についてそれぞれ一つずつの場合は、音楽の音声デー
タをゲイン0.5で、声の音声データをゲイン1で重畳
する。 (3)メタデータ保持部102に保持されているメタデ
ータが二つ以上であり、その音声の種類が一致するメタ
データが複数ある場合は、各音声を切替えて出力するよ
うにする。例えば、それまで出力していた方の音声デー
タに係る音声の出力を中止し、新たに保持されたメタデ
ータが示す音声データに係る音声を、出力を中止した音
声のゲインと同じゲインで出力する。出力を中止した音
声データのメタデータは、メタデータ保持部102から
削除する。
【0031】この場合、例えば、図6のメタデータが示
す音声データを出力中に、図7のメタデータを受信する
と、図6のメタデータが示す音声データのゲインを0.
5に下げ、図7のメタデータを示す音声データをゲイン
1で出力するという決定を下す。
す音声データを出力中に、図7のメタデータを受信する
と、図6のメタデータが示す音声データのゲインを0.
5に下げ、図7のメタデータを示す音声データをゲイン
1で出力するという決定を下す。
【0032】このようなルールは任意に設定することが
できる。
できる。
【0033】ステップS303では、新たに出力するこ
とになった音声データについて、そのソースから音声デ
ータを受信するスレッドを新たに生成する。具体的に
は、当該メタデータ中の音声のソースを示すURLデー
タを渡して、そのURLデータからストリームデータを
取得するスレッドを新たに生成する。また、出力を中止
することになった音声データについて、それまでソース
から音声データを受信していたスレッドを終了させる。
そしてステップS304に移る。
とになった音声データについて、そのソースから音声デ
ータを受信するスレッドを新たに生成する。具体的に
は、当該メタデータ中の音声のソースを示すURLデー
タを渡して、そのURLデータからストリームデータを
取得するスレッドを新たに生成する。また、出力を中止
することになった音声データについて、それまでソース
から音声データを受信していたスレッドを終了させる。
そしてステップS304に移る。
【0034】ステップS304では、ステップS303
で決定された新しい出力形式を、出力データ作成部10
5に通知する。具体的には、新たに生成されたスレッド
がストリームデータを取得して変換するPCMデータを
保持するバッファと、そのバッファに保持されるPCM
データを出力するゲインのデータを出力データ作成部に
通知する。そして、ステップS301に戻る。
で決定された新しい出力形式を、出力データ作成部10
5に通知する。具体的には、新たに生成されたスレッド
がストリームデータを取得して変換するPCMデータを
保持するバッファと、そのバッファに保持されるPCM
データを出力するゲインのデータを出力データ作成部に
通知する。そして、ステップS301に戻る。
【0035】次に、図4のフローチャートを参照して、
音声データの受信処理について説明する。この処理は、
上述したステップS303において起動されるスレッド
において実行される。
音声データの受信処理について説明する。この処理は、
上述したステップS303において起動されるスレッド
において実行される。
【0036】まず、ステップS401では初期化を行な
う。ソースとの接続を確立し、ソースに対し音声データ
の送信を依頼する。そして、ステップS402に移る。
う。ソースとの接続を確立し、ソースに対し音声データ
の送信を依頼する。そして、ステップS402に移る。
【0037】ステップS402では、ソースから処理単
位の音声データパケットを受信する。そして、ステップ
S403に移る。
位の音声データパケットを受信する。そして、ステップ
S403に移る。
【0038】ステップS403では、ソースからの音声
データが終了したかどうかを調べ、終了した場合はステ
ップS406に移る。終了していない場合はステップS
404に移る。
データが終了したかどうかを調べ、終了した場合はステ
ップS406に移る。終了していない場合はステップS
404に移る。
【0039】ステップS404では、受信したパケット
を、所定のビット数、サンプリングレートのPCM符号
に変換する。ソースからの音声データの符号化方式には
様々な方式があるが、いずれもある時間長のPCMデー
タに変換可能である。そして、ステップS405に移
る。
を、所定のビット数、サンプリングレートのPCM符号
に変換する。ソースからの音声データの符号化方式には
様々な方式があるが、いずれもある時間長のPCMデー
タに変換可能である。そして、ステップS405に移
る。
【0040】ステップS405では、ステップS404
で変換したPCMデータをバッファに保存する。そして
ステップS402に戻り、次のパケットの処理を行な
う。
で変換したPCMデータをバッファに保存する。そして
ステップS402に戻り、次のパケットの処理を行な
う。
【0041】ステップS406では、終了処理を行な
う。バッファにデータが終了した旨を示すデータを保持
し、当該処理を行なっていたスレッドを終了する。
う。バッファにデータが終了した旨を示すデータを保持
し、当該処理を行なっていたスレッドを終了する。
【0042】次に、図5のフローチャートを参照して、
出力データの作成処理について説明する。
出力データの作成処理について説明する。
【0043】まず、ステップS501では、出力形式設
定部103から通知された各バッファについて、そのバ
ッファから、一定時間長のPCMデータを取得する。バ
ッファはリングバッファになっており、取得したデータ
が占有していた領域は、新たに取得されたデータのため
に使用される。そしてステップS502に移る。
定部103から通知された各バッファについて、そのバ
ッファから、一定時間長のPCMデータを取得する。バ
ッファはリングバッファになっており、取得したデータ
が占有していた領域は、新たに取得されたデータのため
に使用される。そしてステップS502に移る。
【0044】ステップS502では、バッファに入って
いたデータに、終了を示すデータが含まれているかを調
べ、データが終了していることが判明したら、ステップ
S503に移る。どの音声データも終了していない場合
はステップS504に移る。
いたデータに、終了を示すデータが含まれているかを調
べ、データが終了していることが判明したら、ステップ
S503に移る。どの音声データも終了していない場合
はステップS504に移る。
【0045】ステップS503では、終了した音声デー
タのメタデータを、メタデータ保持部102から削除す
る。そして、ステップS504に移る。
タのメタデータを、メタデータ保持部102から削除す
る。そして、ステップS504に移る。
【0046】ステップS504では、ステップS501
で取り出した各データに、出力形式設定部103から通
知されたゲインを掛けあわせた上で、各データの和を取
り、出力データを作成する。そしてステップS505に
移る。
で取り出した各データに、出力形式設定部103から通
知されたゲインを掛けあわせた上で、各データの和を取
り、出力データを作成する。そしてステップS505に
移る。
【0047】ステップS505では、ステップS504
で作成した一定時間長の出力データを出力バッファに保
持する。そして、ステップS501に戻る。
で作成した一定時間長の出力データを出力バッファに保
持する。そして、ステップS501に戻る。
【0048】このようにして出力バッファに格納された
音声データは、別の音声出力装置から読み出され、D/
A変換が行なわれて、ヘッドホンなどの音声出力手段に
より音声となり利用者に伝わる。
音声データは、別の音声出力装置から読み出され、D/
A変換が行なわれて、ヘッドホンなどの音声出力手段に
より音声となり利用者に伝わる。
【0049】このように、本実施形態の音声データ生成
装置によれば、各音声データのメタデータを利用してそ
の出力形式が設定されるため、音声データのソースの種
別に関わらず、音声データの内容に応じた出力形式の設
定が可能となる。
装置によれば、各音声データのメタデータを利用してそ
の出力形式が設定されるため、音声データのソースの種
別に関わらず、音声データの内容に応じた出力形式の設
定が可能となる。
【0050】なお、上記実施形態においては、メタデー
タの項目として、音声データのソース、音声ソースのタ
イプ、音声データの形式、再生開始の制御の可否、音声
データの内容タイプ、音声データの長さを挙げたが、こ
れらは例示であり、他の項目もあり得る。例えば、音声
データの送信者、音声データの重要度、音声データの内
容を示すキーワード、肉声の場合の話者タイプ(例えば
女性か男性か)などがある。また、メタデータの項目に
与えられる値も、上記実施形態で説明したものには限ら
れず、例えば、音声ソースのタイプは、他にもテレビ、
CD、電話などの任意のデータソースタイプを示す値を
取り得るし、音声の種類も、音楽、肉声のほか、警告音
も含むことができる。
タの項目として、音声データのソース、音声ソースのタ
イプ、音声データの形式、再生開始の制御の可否、音声
データの内容タイプ、音声データの長さを挙げたが、こ
れらは例示であり、他の項目もあり得る。例えば、音声
データの送信者、音声データの重要度、音声データの内
容を示すキーワード、肉声の場合の話者タイプ(例えば
女性か男性か)などがある。また、メタデータの項目に
与えられる値も、上記実施形態で説明したものには限ら
れず、例えば、音声ソースのタイプは、他にもテレビ、
CD、電話などの任意のデータソースタイプを示す値を
取り得るし、音声の種類も、音楽、肉声のほか、警告音
も含むことができる。
【0051】また、メタデータの項目の全てに基づいて
出力形式を設定する必要は無く、一部の項目に基づいて
設定してもよい。また、各メタデータにおいて統一され
た項目に基づいて出力形式を定める必要はなく、各メタ
データ毎に異なる項目に基づいて出力形式を設定しても
よい。
出力形式を設定する必要は無く、一部の項目に基づいて
設定してもよい。また、各メタデータにおいて統一され
た項目に基づいて出力形式を定める必要はなく、各メタ
データ毎に異なる項目に基づいて出力形式を設定しても
よい。
【0052】また、上記実施形態においては、音声の種
類により、各音声の切替え、重畳若しくは重畳時の出力
レベル、を定める場合を例示したが、これに限られない
ことはいうまでもない。
類により、各音声の切替え、重畳若しくは重畳時の出力
レベル、を定める場合を例示したが、これに限られない
ことはいうまでもない。
【0053】また、上記実施形態においては、メタデー
タを受信した時に、直ちに音声出力を開始し、それまで
出力していた音声データが同じ内容タイプであればその
出力を直ちに中止する場合を例示したが、これに限定さ
れるものではなく、今までの音声出力が終了するまで待
って新しい音声データを出力したり、今までの音声出力
を一時的に中断して新しい音声データを出力し、その後
元の音声データの出力を再開するなど、様々な重畳やス
ケジューリング手法やその組み合わせを用いてもよい。
タを受信した時に、直ちに音声出力を開始し、それまで
出力していた音声データが同じ内容タイプであればその
出力を直ちに中止する場合を例示したが、これに限定さ
れるものではなく、今までの音声出力が終了するまで待
って新しい音声データを出力したり、今までの音声出力
を一時的に中断して新しい音声データを出力し、その後
元の音声データの出力を再開するなど、様々な重畳やス
ケジューリング手法やその組み合わせを用いてもよい。
【0054】音声出力のスケジューリングも行なう場合
については、図8に示す構成を採用することもできる。
図8は、本発明の他の実施形態に係る音声データ生成装
置の基本構成を示すブロック図である。
については、図8に示す構成を採用することもできる。
図8は、本発明の他の実施形態に係る音声データ生成装
置の基本構成を示すブロック図である。
【0055】図8において、801は、音声データの内
容を記述したメタデータを受信するメタデータ受信部で
ある。802は、メタデータ受信部801で受信したメ
タデータを保持するメタデータ保持部である。803
は、メタデータ保持部802に保持されている各メタデ
ータを用いて、各音声の出力スケジュールを含む出力形
式を決定する出力形式設定部である。804は、出力形
式設定部803で決定された、出力スケジュールを含む
出力形式を保持する出力形式保持部である。805は、
出力形式保持部804に保持されているスケジュールに
基づき音声データを受信する音声データ受信部である。
806は、出力形式保持部804に保持されているスケ
ジュールに基づき、音声データ受信部805で受信した
音声データを必要に応じて選択および重畳して出力デー
タを作成する出力データ作成部である。
容を記述したメタデータを受信するメタデータ受信部で
ある。802は、メタデータ受信部801で受信したメ
タデータを保持するメタデータ保持部である。803
は、メタデータ保持部802に保持されている各メタデ
ータを用いて、各音声の出力スケジュールを含む出力形
式を決定する出力形式設定部である。804は、出力形
式設定部803で決定された、出力スケジュールを含む
出力形式を保持する出力形式保持部である。805は、
出力形式保持部804に保持されているスケジュールに
基づき音声データを受信する音声データ受信部である。
806は、出力形式保持部804に保持されているスケ
ジュールに基づき、音声データ受信部805で受信した
音声データを必要に応じて選択および重畳して出力デー
タを作成する出力データ作成部である。
【0056】この実施形態では、図3で説明した出力形
式の決定処理のステップS303及びステップS304
に代わり、出力形式を出力形式保持部804に保持する
処理を行なう。図9は、出力形式保持部804に保持さ
れるスケジュールデータの構成例を示す図である。
式の決定処理のステップS303及びステップS304
に代わり、出力形式を出力形式保持部804に保持する
処理を行なう。図9は、出力形式保持部804に保持さ
れるスケジュールデータの構成例を示す図である。
【0057】図9において、各行が一つの音声データに
関するスケジュールを保持するデータである。列901
のフィールドには、音声データのソースを示すURL文
字列が保持される。列902のフィールドには、音声デ
ータの出力開始時刻が保持される。ただし、図9で示し
たような文字列ではなく、時刻を表現する整数値で保持
される方が好ましい。
関するスケジュールを保持するデータである。列901
のフィールドには、音声データのソースを示すURL文
字列が保持される。列902のフィールドには、音声デ
ータの出力開始時刻が保持される。ただし、図9で示し
たような文字列ではなく、時刻を表現する整数値で保持
される方が好ましい。
【0058】そして、出力形式保持部804に保持され
ているもので、出力開始時刻が到来したものに対し、図
4で説明した音声データ受信処理を行なうスレッドを起
動する。また、新たに取得することになった音声データ
を、図5で説明した出力データ作成処理の対象に加え
る。
ているもので、出力開始時刻が到来したものに対し、図
4で説明した音声データ受信処理を行なうスレッドを起
動する。また、新たに取得することになった音声データ
を、図5で説明した出力データ作成処理の対象に加え
る。
【0059】また、出力形式保持部804に、出力再開
時刻を示すデータを保持する領域を設け、中断が指示さ
れた音声データは、その出力再開時刻を保持し、出力再
開時刻になれば出力を再開することも可能である。
時刻を示すデータを保持する領域を設け、中断が指示さ
れた音声データは、その出力再開時刻を保持し、出力再
開時刻になれば出力を再開することも可能である。
【0060】また、出力形式保持部に、出力ゲインを変
更する時刻とそのゲイン値を示すデータを保持する領域
を設け、その時刻になればゲインを変更することも可能
である。例えば、別の音声データの出力に伴い、ある音
声データの出力ゲインを0にし、別の音声データの出力
が終了する時刻に1に戻す設定をすれば、別の音声デー
タの出力中、当該音声をミュートさせることもできる。
更する時刻とそのゲイン値を示すデータを保持する領域
を設け、その時刻になればゲインを変更することも可能
である。例えば、別の音声データの出力に伴い、ある音
声データの出力ゲインを0にし、別の音声データの出力
が終了する時刻に1に戻す設定をすれば、別の音声デー
タの出力中、当該音声をミュートさせることもできる。
【0061】なお、上記実施形態においては、メタデー
タが新たに受信された時に出力形式を変更する場合につ
いて説明したが、これに限定されるものではなく、出力
中の音声データが終了した時や一定あるいは任意の時間
間隔で出力形式を変更する処理を行なってもよい。
タが新たに受信された時に出力形式を変更する場合につ
いて説明したが、これに限定されるものではなく、出力
中の音声データが終了した時や一定あるいは任意の時間
間隔で出力形式を変更する処理を行なってもよい。
【0062】また、上記実施形態においては、メタデー
タから出力形式を決定するための規則(ルール)は、必
ずしも装置固有のものである必要は無く、適宜変更でき
るようにすることができる。
タから出力形式を決定するための規則(ルール)は、必
ずしも装置固有のものである必要は無く、適宜変更でき
るようにすることができる。
【0063】図10は、本発明の他の実施形態として、
出力形式の設定のための規則を別に保持する構成を採用
した場合の、音声データ生成装置の基本構成を示すブロ
ック図である。
出力形式の設定のための規則を別に保持する構成を採用
した場合の、音声データ生成装置の基本構成を示すブロ
ック図である。
【0064】図10において、1001は、音声データ
の内容を記述したメタデータを受信するメタデータ受信
部である。1002は、メタデータ受信部1001で受
信したメタデータを保持するメタデータ保持部である。
1003は、出力形式を決定するための規則を保持する
規則保持部である。1004は、規則保持部1003に
保持されている規則に従って、メタデータ保持部100
2に保持されている各メタデータを用いて音声の出力形
式を決定する出力形式設定部である。1005は、出力
形式設定部1004で決定された出力形式に基づき音声
データを受信する音声データ受信部である。1006
は、出力形式設定部1004で決定された出力形式に基
づき、音声データ受信部1005で受信した音声データ
を必要に応じて選択および重畳して出力データを作成す
る出力データ作成部である。
の内容を記述したメタデータを受信するメタデータ受信
部である。1002は、メタデータ受信部1001で受
信したメタデータを保持するメタデータ保持部である。
1003は、出力形式を決定するための規則を保持する
規則保持部である。1004は、規則保持部1003に
保持されている規則に従って、メタデータ保持部100
2に保持されている各メタデータを用いて音声の出力形
式を決定する出力形式設定部である。1005は、出力
形式設定部1004で決定された出力形式に基づき音声
データを受信する音声データ受信部である。1006
は、出力形式設定部1004で決定された出力形式に基
づき、音声データ受信部1005で受信した音声データ
を必要に応じて選択および重畳して出力データを作成す
る出力データ作成部である。
【0065】図11は、複数の音声データ出力する場合
にゲインを定める規則を保持する規則保持部1003の
データ構成例を示す図である。
にゲインを定める規則を保持する規則保持部1003の
データ構成例を示す図である。
【0066】図11において、各行が一つの規則を表現
するデータである。列1101のフィールドには、タグ
名を示す文字列が保持される。列1102のフィールド
には、値を示す文字列が保持される。列1103のフィ
ールドには、ゲインを示す数値が保持される。音声デー
タのメタデータにおいて、列1101に保持されている
タグ名と同じタグの要素の値が、列1101に保持され
ている値と同じ場合に、列1103に保持されている値
をゲインとすることを表現したデータである。図11の
例では、前記の実施形態と同じ動作となるが、例えば1
行目の列1103の値を0とすれば、音楽データがミュ
ートされることになる。
するデータである。列1101のフィールドには、タグ
名を示す文字列が保持される。列1102のフィールド
には、値を示す文字列が保持される。列1103のフィ
ールドには、ゲインを示す数値が保持される。音声デー
タのメタデータにおいて、列1101に保持されている
タグ名と同じタグの要素の値が、列1101に保持され
ている値と同じ場合に、列1103に保持されている値
をゲインとすることを表現したデータである。図11の
例では、前記の実施形態と同じ動作となるが、例えば1
行目の列1103の値を0とすれば、音楽データがミュ
ートされることになる。
【0067】そして、上記実施形態においては、規則保
持部1003に保持する規則を、ユーザが任意に変更す
るようにもできる。この場合、例えば、ディスク装置で
規則保持部1003を実現する場合は、当該規則を保持
しているファイルを入れ替えるといった手法を採用する
ことができる。このようにすることで、利用者の好みに
合わせた規則を設定することができ、例えば、どのよう
に音声データを選択し重畳するかを利用者の好みに合わ
せることができる。
持部1003に保持する規則を、ユーザが任意に変更す
るようにもできる。この場合、例えば、ディスク装置で
規則保持部1003を実現する場合は、当該規則を保持
しているファイルを入れ替えるといった手法を採用する
ことができる。このようにすることで、利用者の好みに
合わせた規則を設定することができ、例えば、どのよう
に音声データを選択し重畳するかを利用者の好みに合わ
せることができる。
【0068】なお、上記実施形態においては、メタデー
タだけを受信し、必要に応じて音声データを受信する場
合について説明したが、これに限定されるものではな
く、メタデータと音声データとを同時に受信してもよ
い。以下、音声データとメタデータが一体化したデータ
の場合の装置の構成例について図12を参照して説明す
る。
タだけを受信し、必要に応じて音声データを受信する場
合について説明したが、これに限定されるものではな
く、メタデータと音声データとを同時に受信してもよ
い。以下、音声データとメタデータが一体化したデータ
の場合の装置の構成例について図12を参照して説明す
る。
【0069】図12は、本発明の他の実施形態として、
メタデータと音声データが一体化したデータを扱う音声
データ生成装置の基本構成を示すブロック図である。
メタデータと音声データが一体化したデータを扱う音声
データ生成装置の基本構成を示すブロック図である。
【0070】同図において、1201は、音声データと
メタデータが一体化したデータを受信するメタデータ受
信部である。
メタデータが一体化したデータを受信するメタデータ受
信部である。
【0071】1202は、メタデータ受信部1201で
受信されたデータをメタデータと音声データに分離する
データ分離部である。1203は、メタデータ分離部1
202で分離されたメタデータを保持するメタデータ保
持部である。1204は、メタデータ分離部1202で
分離された音声データを保持するメタデータ保持部であ
る。1205は、メタデータ保持部1203に保持され
ている各メタデータを用いて音声の出力形式を決定する
出力形式設定部である。1206は、出力形式設定部1
205で決定された出力形式に基づき、音声データ保持
部1206に保持されている音声データを必要に応じて
選択および重畳して出力データを作成する出力データ作
成部である。
受信されたデータをメタデータと音声データに分離する
データ分離部である。1203は、メタデータ分離部1
202で分離されたメタデータを保持するメタデータ保
持部である。1204は、メタデータ分離部1202で
分離された音声データを保持するメタデータ保持部であ
る。1205は、メタデータ保持部1203に保持され
ている各メタデータを用いて音声の出力形式を決定する
出力形式設定部である。1206は、出力形式設定部1
205で決定された出力形式に基づき、音声データ保持
部1206に保持されている音声データを必要に応じて
選択および重畳して出力データを作成する出力データ作
成部である。
【0072】音声データとメタデータが一体化したデー
タの例としては、図6や図7で示したデータのうち、音
声ソースを示すURLの代わりに、音声データそのもの
を含むタグを持つデータがある。このデータは、タグを
参照することで、音声データとメタデータの分離は容易
にできる。その他の処理は、上記の実施形態と同様であ
る。
タの例としては、図6や図7で示したデータのうち、音
声ソースを示すURLの代わりに、音声データそのもの
を含むタグを持つデータがある。このデータは、タグを
参照することで、音声データとメタデータの分離は容易
にできる。その他の処理は、上記の実施形態と同様であ
る。
【0073】なお、上記実施形態においては、複数の音
声データを重畳する場合において、単純に重畳していた
が、これに限定されるものではなく、ステレオや3D出
力の場合に、音声データごとに音源の位置を変えるとい
った重畳方法を取ってもよい。この場合、音源の位置の
決定も、メタデータを利用して行なってもよいことは言
うまでもない。
声データを重畳する場合において、単純に重畳していた
が、これに限定されるものではなく、ステレオや3D出
力の場合に、音声データごとに音源の位置を変えるとい
った重畳方法を取ってもよい。この場合、音源の位置の
決定も、メタデータを利用して行なってもよいことは言
うまでもない。
【0074】また、上記実施形態においては、出力デー
タ作成部105が作成した出力音声データをバッファに
蓄積する場合について説明したが、これに限定されるも
のではなく、他の処理をしてもよい。例えば、ネットワ
ークを介して他の音声出力装置に送信してもよい。
タ作成部105が作成した出力音声データをバッファに
蓄積する場合について説明したが、これに限定されるも
のではなく、他の処理をしてもよい。例えば、ネットワ
ークを介して他の音声出力装置に送信してもよい。
【0075】また、上記実施形態においては、出力デー
タ作成部105が作成した出力音声データを単にバッフ
ァに蓄積する場合について説明したが、これに限定され
るものではなく、上記音声データ生成装置内に、例えば
D/Aコンバータとスピーカを備えて音声出力したり、
あるいはD/Aコンバータとアナログ音声信号の出力端
子を備えて、他の音声出力機器を接続することで、その
音声出力機器にアナログ音声信号を送信できるようにし
てもよい。
タ作成部105が作成した出力音声データを単にバッフ
ァに蓄積する場合について説明したが、これに限定され
るものではなく、上記音声データ生成装置内に、例えば
D/Aコンバータとスピーカを備えて音声出力したり、
あるいはD/Aコンバータとアナログ音声信号の出力端
子を備えて、他の音声出力機器を接続することで、その
音声出力機器にアナログ音声信号を送信できるようにし
てもよい。
【0076】また、上記実施形態においては、音声デー
タは全てデジタルデータである場合について説明した
が、これに限定されるものではなく、一部あるいは全部
がアナログデータでもよい。その場合、例えば出力デー
タ作成部105は、デジタルデータの演算ではなく、ア
ナログ信号を重畳する回路により実現することができ
る。
タは全てデジタルデータである場合について説明した
が、これに限定されるものではなく、一部あるいは全部
がアナログデータでもよい。その場合、例えば出力デー
タ作成部105は、デジタルデータの演算ではなく、ア
ナログ信号を重畳する回路により実現することができ
る。
【0077】また、上記実施形態においては、音声デー
タがストリームデータである場合について説明したが、
これに限定されるものではなく、任意の音声データでよ
い。すなわち、音声データを一括して取得してもよい。
また、ネットワークから受信するのではなく、同一装置
内あるいはシステムとして構成される他の装置にある音
声データ蓄積手段(例えばハードディスク装置)に蓄積
されている音声データを逐次読み出して使用してもよ
い。図4で説明した音声データ受信処理において、ネッ
トワーク以外の信号伝達手段を用いて音声データを取得
したり、自装置内の記憶手段から直接読み取ることにな
る。
タがストリームデータである場合について説明したが、
これに限定されるものではなく、任意の音声データでよ
い。すなわち、音声データを一括して取得してもよい。
また、ネットワークから受信するのではなく、同一装置
内あるいはシステムとして構成される他の装置にある音
声データ蓄積手段(例えばハードディスク装置)に蓄積
されている音声データを逐次読み出して使用してもよ
い。図4で説明した音声データ受信処理において、ネッ
トワーク以外の信号伝達手段を用いて音声データを取得
したり、自装置内の記憶手段から直接読み取ることにな
る。
【0078】また、上記実施形態においては、音声デー
タが全て外部より提供される場合について説明したが、
これに限定されるものではなく、自装置内で音声データ
に変換してもよい。例えば、テキストデータが与えられ
て、それを音声合成して音声出力データの一部としても
よい。
タが全て外部より提供される場合について説明したが、
これに限定されるものではなく、自装置内で音声データ
に変換してもよい。例えば、テキストデータが与えられ
て、それを音声合成して音声出力データの一部としても
よい。
【0079】また、上記実施形態においては、出力形式
決定処理の中でメタデータの受信を定期的に調べる方法
をとっていたが、受信したメタデータに応じて出力形式
決定が行なわれる任意の処理形態でよい。例えば、メタ
データの到着をイベントとしたイベント駆動型の処理で
実現してもよい。この場合、上記イベントに対して、ス
テップS302以降の処理を行なうという処理手順にな
る。
決定処理の中でメタデータの受信を定期的に調べる方法
をとっていたが、受信したメタデータに応じて出力形式
決定が行なわれる任意の処理形態でよい。例えば、メタ
データの到着をイベントとしたイベント駆動型の処理で
実現してもよい。この場合、上記イベントに対して、ス
テップS302以降の処理を行なうという処理手順にな
る。
【0080】また、上記実施形態においては、各音声デ
ータの取得処理を独立したスレッドで実現する場合につ
いて説明したが、これに限定されるものではなく、他の
処理と同一のスレッドで実現してもよい。
ータの取得処理を独立したスレッドで実現する場合につ
いて説明したが、これに限定されるものではなく、他の
処理と同一のスレッドで実現してもよい。
【0081】また、上記実施形態においては、PCMで
符号化したデジタル音声データを使用する場合について
説明したが、これに限定されるものではなく、他の符号
化形式によるデジタルデータでもよい。
符号化したデジタル音声データを使用する場合について
説明したが、これに限定されるものではなく、他の符号
化形式によるデジタルデータでもよい。
【0082】また、上記実施形態においては、XML文
書でメタデータを表現する場合について説明したが、こ
れに限定されるものではなく、他のデータ形式でもよ
い。例えば、属性と属性名のペアを列挙する方式でもよ
いし、メタデータ項目が定まっている場合には、CVS
形式など項目が固定された形式のデータ形式を使うこと
もできる。
書でメタデータを表現する場合について説明したが、こ
れに限定されるものではなく、他のデータ形式でもよ
い。例えば、属性と属性名のペアを列挙する方式でもよ
いし、メタデータ項目が定まっている場合には、CVS
形式など項目が固定された形式のデータ形式を使うこと
もできる。
【0083】また、上記実施形態においては、図2にハ
ードウエアの一例を示したが、これに限られず、上述し
た本実施形態の音声データ生成装置の処理の全部又は一
部を実行する論理回路により構成することもできる。
ードウエアの一例を示したが、これに限られず、上述し
た本実施形態の音声データ生成装置の処理の全部又は一
部を実行する論理回路により構成することもできる。
【0084】以上、本発明の好適な実施形態について説
明したが、各実施形態において説明した内容は、本発明
の趣旨及び目的を逸脱しない範囲で相互に適用可能であ
る。
明したが、各実施形態において説明した内容は、本発明
の趣旨及び目的を逸脱しない範囲で相互に適用可能であ
る。
【0085】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納されたプログ
ラムコードを読み出し実行することによっても、達成さ
れることは言うまでもない。この場合、記憶媒体から読
み出されたプログラムコード自体が前述した実施形態の
機能を実現することになり、そのプログラムコードを記
憶した記憶媒体は本発明を構成することになる。また、
コンピュータが読み出したプログラムコードを実行する
ことにより、前述した実施形態の機能が実現されるだけ
でなく、そのプログラムコードの指示に基づき、コンピ
ュータ上で稼働しているオペレーティングシステム(OS)
などが実際の処理の一部または全部を行い、その処理に
よって前述した実施形態の機能が実現される場合も含ま
れることは言うまでもない。
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納されたプログ
ラムコードを読み出し実行することによっても、達成さ
れることは言うまでもない。この場合、記憶媒体から読
み出されたプログラムコード自体が前述した実施形態の
機能を実現することになり、そのプログラムコードを記
憶した記憶媒体は本発明を構成することになる。また、
コンピュータが読み出したプログラムコードを実行する
ことにより、前述した実施形態の機能が実現されるだけ
でなく、そのプログラムコードの指示に基づき、コンピ
ュータ上で稼働しているオペレーティングシステム(OS)
などが実際の処理の一部または全部を行い、その処理に
よって前述した実施形態の機能が実現される場合も含ま
れることは言うまでもない。
【0086】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。本発明を上記記憶
媒体に適用する場合、その記憶媒体には、例えば、先に
説明した図3に示すフローチャートに対応するプログラ
ムコードが格納されることになる。
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。本発明を上記記憶
媒体に適用する場合、その記憶媒体には、例えば、先に
説明した図3に示すフローチャートに対応するプログラ
ムコードが格納されることになる。
【0087】
【発明の効果】以上説明したように、本発明によれば、
音声のソースの種別に関わらず、各音声の内容に即した
出力形式の設定を行うことができる。
音声のソースの種別に関わらず、各音声の内容に即した
出力形式の設定を行うことができる。
【図1】本発明の一実施形態に係る音声データ生成装置
の基本構成を示すブロック図である。
の基本構成を示すブロック図である。
【図2】本発明の一実施形態に係る音声データ生成装置
が機能的に実現されるハードウエアの構成例を示す図で
ある。
が機能的に実現されるハードウエアの構成例を示す図で
ある。
【図3】出力形式の設定処理の概要を示すフローチャー
トである。
トである。
【図4】音声データの受信処理の概要を示すフローチャ
ートである。
ートである。
【図5】出力データの作成処理の概要を示すフローチャ
ートである。
ートである。
【図6】メタデータの具体例を示す図である。
【図7】メタデータの別の具体例を示す図である。
【図8】本発明の他の実施形態に係る音声データ生成装
置の基本構成を示すブロック図である。
置の基本構成を示すブロック図である。
【図9】出力形式保持部804に保持されるスケジュー
ルデータの構成例を示す図である。
ルデータの構成例を示す図である。
【図10】本発明の別の実施形態に係る音声データ生成
装置の基本構成を示すブロック図である。
装置の基本構成を示すブロック図である。
【図11】規則保持部1003に保持されるデータの構
成例を示す図である。
成例を示す図である。
【図12】本発明の別の実施形態に係る音声データ生成
装置の基本構成を示すブロック図である。
装置の基本構成を示すブロック図である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 上田 隆也 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 池田 裕治 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 Fターム(参考) 5K027 AA11 DD14 HH19 HH29
Claims (42)
- 【請求項1】 複数の音声データに係る音声を出力する
にあたり、各音声の出力形式を設定するための音声デー
タ設定装置であって、 各々の前記音声データの内容を示すメタデータを取得す
る取得手段と、 各々の前記メタデータに基づいて、該メタデータに対応
する前記音声データに係る音声の出力形式を設定する設
定手段と、を備えたことを特徴とする音声データ設定装
置。 - 【請求項2】 複数の音声データに係る音声を所定の出
力形式で出力するための音声データを生成する音声デー
タ生成装置であって、 各々の前記音声データの内容を示すメタデータを取得す
る取得手段と、 各々の前記メタデータに基づいて、該メタデータに対応
する前記音声データに係る音声の出力形式を設定する設
定手段と、 設定された前記出力形式に基づいて、各々の前記音声デ
ータから新たな音声データを生成する手段と、を備えた
ことを特徴とする音声データ生成装置。 - 【請求項3】 前記設定手段は、前記出力形式として、
複数の前記音声データの出力スケジュールを決定するこ
とを特徴とする請求項2に記載の音声データ生成装置。 - 【請求項4】 前記メタデータに対応した前記出力形式
の規則を記録した手段を備え、前記設定手段は、該規則
に従って前記出力形式を設定することを特徴とする請求
項2又は3に記載の音声データ生成装置。 - 【請求項5】 前記規則が変更可能であることを特徴と
する請求項4に記載の音声データ生成装置。 - 【請求項6】 前記メタデータを保持する手段と、前記
音声データを保持する手段と、を備えたことを特徴とす
る請求項に2乃至5のいずれかに記載の音声データ生成
装置。 - 【請求項7】 前記取得手段は、前記音声データと前記
メタデータとを含むデータから前記メタデータを抽出す
ることを特徴とする請求項2乃至6のいずれかに記載の
音声データ生成装置。 - 【請求項8】 前記取得手段は、前記音声データとは別
に、その前記メタデータを取得するものであり、また、
前記音声データ生成装置は、取得した前記メタデータに
基づいて、該メタデータに係る前記音声データに係るデ
ータを取得する手段を備えたことを特徴とする請求項2
乃至6のいずれかに記載の音声データ生成装置。 - 【請求項9】 前記音声データに係るデータは、音声デ
ータであることを特徴とする請求項8に記載の音声デー
タ生成装置。 - 【請求項10】 前記音声データに係るデータに基づい
て、音声データを生成する手段を備えたことを特徴とす
る請求項8に記載の音声データ生成装置。 - 【請求項11】 前記設定手段は、前記出力形式とし
て、異なる種類の音声に係る前記音声データについて
は、両者の重畳を設定することを特徴とする請求項2に
記載の音声データ生成装置。 - 【請求項12】 前記種類には、音楽と肉声とが含まれ
ることを特徴とする請求項11に記載の音声データ生成
装置。 - 【請求項13】 前記設定手段は、前記出力形式とし
て、同じ種類の音声に係る前記音声データについては、
両者の切替えを設定することを特徴とする請求項2に記
載の音声データ生成装置。 - 【請求項14】 前記出力形式には、複数の音声の重
畳、切替え、若しくは、音声の出力のゲイン、のうちの
少なくともいずれかが含まれることを特徴とする請求項
2に記載の音声データ生成装置。 - 【請求項15】 複数の音声データに係る音声を出力す
るにあたり、各音声の出力形式を設定するための音声デ
ータ設定方法であって、 各々の前記音声データの内容を示すメタデータを取得す
る取得工程と、 各々の前記メタデータに基づいて、該メタデータに対応
する前記音声データに係る音声の出力形式を設定する設
定工程と、を含むことを特徴とする音声データ設定方
法。 - 【請求項16】 複数の音声データに係る音声を所定の
出力形式で出力するための音声データを生成する音声デ
ータ生成方法であって、 各々の前記音声データの内容を示すメタデータを取得す
る取得工程と、 各々の前記メタデータに基づいて、該メタデータに対応
する前記音声データに係る音声の出力形式を設定する設
定工程と、 設定された前記出力形式に基づいて、各々の前記音声デ
ータから新たな音声データを生成する工程と、を含むこ
とを特徴とする音声データ生成方法。 - 【請求項17】 前記設定工程では、前記出力形式とし
て、複数の前記音声データの出力スケジュールを決定す
ることを特徴とする請求項16に記載の音声データ生成
方法。 - 【請求項18】 前記メタデータに対応した前記出力形
式の規則を記録した工程を含み、前記設定工程では、該
規則に従って前記出力形式を設定することを特徴とする
請求項16又は17に記載の音声データ生成方法。 - 【請求項19】 前記規則が変更可能であることを特徴
とする請求項18に記載の音声データ生成方法。 - 【請求項20】 前記メタデータを保存する工程と、前
記音声データを保存する工程と、を含むことを特徴とす
る請求項16乃至19のいずれかに記載の音声データ生
成方法。 - 【請求項21】 前記取得工程では、前記音声データと
前記メタデータとを含むデータから前記メタデータを抽
出することを特徴とする請求項16乃至20のいずれか
に記載の音声データ生成方法。 - 【請求項22】 前記取得工程では、前記音声データと
は別に、その前記メタデータを取得するものであり、ま
た、前記音声データ生成方法は、取得した前記メタデー
タに基づいて、該メタデータに係る前記音声データに係
るデータを取得する工程を含むことを特徴とする請求項
16乃至20のいずれかに記載の音声データ生成方法。 - 【請求項23】 前記音声データに係るデータは、音声
データであることを特徴とする請求項22に記載の音声
データ生成方法。 - 【請求項24】 前記音声データに係るデータに基づい
て、音声データを生成する工程を含むことを特徴とする
請求項22に記載の音声データ生成方法。 - 【請求項25】 前記設定工程では、前記出力形式とし
て、異なる種類の音声に係る前記音声データについて
は、両者の重畳を設定することを特徴とする請求項16
に記載の音声データ生成方法。 - 【請求項26】 前記種類には、音楽と肉声とが含まれ
ることを特徴とする請求項25に記載の音声データ生成
方法。 - 【請求項27】 前記設定工程では、前記出力形式とし
て、同じ種類の音声に係る前記音声データについては、
両者の切替えを設定することを特徴とする請求項16に
記載の音声データ生成方法。 - 【請求項28】 前記出力形式には、複数の音声の重
畳、切替え、若しくは、音声の出力のゲイン、のうちの
少なくともいずれかが含まれることを特徴とする請求項
16に記載の音声データ生成方法。 - 【請求項29】 複数の音声データに係る音声を出力す
るにあたり、各音声の出力形式を設定するために、コン
ピュータを、 各々の前記音声データの内容を示すメタデータを取得す
る取得手段、 各々の前記メタデータに基づいて、該メタデータに対応
する前記音声データに係る音声の出力形式を設定する設
定手段、として機能させるプログラムを記録した記録媒
体。 - 【請求項30】 複数の音声データに係る音声を所定の
出力形式で出力するための音声データを生成するため
に、コンピュータを、 各々の前記音声データの内容を示すメタデータを取得す
る取得手段、 各々の前記メタデータに基づいて、該メタデータに対応
する前記音声データに係る音声の出力形式を設定する設
定手段、 設定された前記出力形式に基づいて、各々の前記音声デ
ータから新たな音声データを生成する手段、として機能
させるプログラムを記録した記録媒体。 - 【請求項31】 前記設定手段は、前記出力形式とし
て、複数の前記音声データの出力スケジュールを決定す
ることを特徴とする請求項30に記載の記録媒体。 - 【請求項32】 前記プログラムは、コンピュータを、
前記メタデータに対応した前記出力形式の規則を記録し
た手段として機能させるプログラムを含み、前記設定手
段は、該規則に従って前記出力形式を設定することを特
徴とする請求項30又は31に記載の記録媒体。 - 【請求項33】 前記規則が変更可能であることを特徴
とする請求項32に記載の記録媒体。 - 【請求項34】 前記プログラムが、コンピュータを、
前記メタデータを保持する手段、前記音声データを保持
する手段、として機能させるプログラムを含むことを特
徴とする請求項に30乃至33のいずれかに記載の記録
媒体。 - 【請求項35】 前記取得手段は、前記音声データと前
記メタデータとを含むデータから前記メタデータを抽出
することを特徴とする請求項30乃至34のいずれかに
記載の記録媒体。 - 【請求項36】 前記取得手段は、前記音声データとは
別に、その前記メタデータを取得するものであり、ま
た、前記プログラムは、コンピュータを、取得した前記
メタデータに基づいて、該メタデータに係る前記音声デ
ータに係るデータを取得する手段、として機能させるプ
ログラムを含むことを特徴とする請求項30乃至34の
いずれかに記載の記録媒体。 - 【請求項37】 前記音声データに係るデータは、音声
データであることを特徴とする請求項36に記載の記録
媒体。 - 【請求項38】 前記プログラムは、コンピュータを、
前記音声データに係るデータに基づいて、音声データを
生成する手段、として機能させるプログラムを含むこと
を特徴とする請求項36に記載の記録媒体。 - 【請求項39】 前記設定手段は、前記出力形式とし
て、異なる種類の音声に係る前記音声データについて
は、両者の重畳を設定することを特徴とする請求項30
に記載の記録媒体。 - 【請求項40】 前記種類には、音楽と肉声とが含まれ
ることを特徴とする請求項39に記載の記録媒体。 - 【請求項41】 前記設定手段は、前記出力形式とし
て、同じ種類の音声に係る前記音声データについては、
両者の切替えを設定することを特徴とする請求項30に
記載の記録媒体。 - 【請求項42】 前記出力形式には、複数の音声の重
畳、切替え、若しくは、音声の出力のゲイン、のうちの
少なくともいずれかが含まれることを特徴とする請求項
30に記載の記録媒体。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000095350A JP2001282261A (ja) | 2000-03-30 | 2000-03-30 | 音声データ設定装置及び方法、音声データ生成装置及び方法、記録媒体 |
US09/817,302 US6845379B2 (en) | 2000-03-30 | 2001-03-27 | Sound data processing system and processing method |
EP01302995A EP1139213B1 (en) | 2000-03-30 | 2001-03-29 | Sound data processing system and processing method |
DE60134600T DE60134600D1 (de) | 2000-03-30 | 2001-03-29 | System und Verfahren zur Verarbeitung von Schalldaten |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000095350A JP2001282261A (ja) | 2000-03-30 | 2000-03-30 | 音声データ設定装置及び方法、音声データ生成装置及び方法、記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001282261A true JP2001282261A (ja) | 2001-10-12 |
Family
ID=18610264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000095350A Withdrawn JP2001282261A (ja) | 2000-03-30 | 2000-03-30 | 音声データ設定装置及び方法、音声データ生成装置及び方法、記録媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6845379B2 (ja) |
EP (1) | EP1139213B1 (ja) |
JP (1) | JP2001282261A (ja) |
DE (1) | DE60134600D1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008104123A (ja) * | 2006-10-20 | 2008-05-01 | Matsushita Electric Works Ltd | 住宅設備監視システム |
JP2012504260A (ja) * | 2008-09-30 | 2012-02-16 | ドルビー・インターナショナル・アーベー | オーディオメタデータのトランスコーディング |
JP5074766B2 (ja) * | 2004-10-01 | 2012-11-14 | パナソニック株式会社 | 音響調整装置および音響調整方法 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003196142A (ja) * | 2001-12-25 | 2003-07-11 | Sony Corp | ライトワンス型メモリ装置及びファイル管理方法 |
US20030159153A1 (en) * | 2002-02-20 | 2003-08-21 | General Instrument Corporation | Method and apparatus for processing ATVEF data to control the display of text and images |
US20040073561A1 (en) * | 2002-08-26 | 2004-04-15 | Dana Quest Inc. | Method for autonomously searching a plurality of non-related databases residing on inter and intra networks with the intent to locate a plurality of documents containing a plurality of desired parameters and to communicate with the owners of said documents for the purpose of engaging said owners in a transaction |
JP2006139492A (ja) * | 2004-11-11 | 2006-06-01 | Canon Inc | プロファイル情報取得システム、プロファイル情報取得機器、プロファイル情報送信機器、プロファイル情報取得方法、及びプログラム |
US7787974B2 (en) | 2005-01-05 | 2010-08-31 | Verint Americas Inc. | Independent source recording |
CN101154375B (zh) * | 2006-09-25 | 2012-07-25 | 蔡本伟 | 卡拉ok形式音频修正及处理系统 |
US7791348B2 (en) * | 2007-02-27 | 2010-09-07 | Midtronics, Inc. | Battery tester with promotion feature to promote use of the battery tester by providing the user with codes having redeemable value |
EP2108417B1 (en) * | 2008-04-11 | 2018-07-18 | Sony Interactive Entertainment Inc. | Audio apparatus and method |
JP2010027007A (ja) * | 2008-07-24 | 2010-02-04 | Canon Inc | 処理装置、要求装置、及びそれらの処理方法 |
JP5627330B2 (ja) | 2010-08-02 | 2014-11-19 | キヤノン株式会社 | 情報処理装置、キャッシュ装置およびデータ処理方法 |
EP3389046B1 (en) * | 2015-12-08 | 2021-06-16 | Sony Corporation | Transmission device, transmission method, reception device, and reception method |
DK3427496T3 (da) * | 2016-03-11 | 2020-04-06 | Widex As | Fremgangsmåde og hørehjælpemiddel til at håndtere streamet lyd |
DK3427497T3 (da) * | 2016-03-11 | 2020-06-08 | Widex As | Fremgangsmåde og høreunderstøttelsesindretning til håndtering af streamet lyd |
JP6924088B2 (ja) | 2017-07-12 | 2021-08-25 | キヤノン株式会社 | 情報処理装置及びその制御方法、並びにプログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62155546A (ja) | 1985-12-27 | 1987-07-10 | Toshiba Corp | メモリ−モジユ−ル |
JPS63146647A (ja) | 1986-12-10 | 1988-06-18 | Matsushita Electric Ind Co Ltd | 電話付テレビ |
JPH03158047A (ja) | 1989-11-15 | 1991-07-08 | Uingu:Kk | ラジオ付コードレス電話機ハンドセット |
US5054360A (en) * | 1990-11-01 | 1991-10-08 | International Business Machines Corporation | Method and apparatus for simultaneous output of digital audio and midi synthesized music |
JPH04334240A (ja) | 1991-05-10 | 1992-11-20 | Sony Corp | 電話一体型音響機器 |
JPH0531432A (ja) | 1991-07-29 | 1993-02-09 | Sony Corp | 塗布装置 |
JPH0591169A (ja) | 1991-09-30 | 1993-04-09 | Nitsuko Corp | ポータブル端末装置 |
JP3149093B2 (ja) * | 1991-11-21 | 2001-03-26 | カシオ計算機株式会社 | 自動演奏装置 |
US6611607B1 (en) * | 1993-11-18 | 2003-08-26 | Digimarc Corporation | Integrating digital watermarks in multimedia content |
JP2556291B2 (ja) | 1994-05-10 | 1996-11-20 | 日本電気株式会社 | 電話機の着信報知装置 |
JPH09181797A (ja) | 1995-12-22 | 1997-07-11 | Sony Corp | 無線呼び出し装置 |
JPH09321844A (ja) | 1996-05-31 | 1997-12-12 | Casio Comput Co Ltd | 携帯型通信装置 |
US5890017A (en) * | 1996-11-20 | 1999-03-30 | International Business Machines Corporation | Application-independent audio stream mixer |
US6408301B1 (en) * | 1999-02-23 | 2002-06-18 | Eastman Kodak Company | Interactive image storage, indexing and retrieval system |
US6523046B2 (en) * | 2000-02-25 | 2003-02-18 | Microsoft Corporation | Infrastructure and method for supporting generic multimedia metadata |
US6180312B1 (en) * | 2000-03-22 | 2001-01-30 | Eastman Kodak Company | Photographic imaging system incorporating metadata recording capability |
-
2000
- 2000-03-30 JP JP2000095350A patent/JP2001282261A/ja not_active Withdrawn
-
2001
- 2001-03-27 US US09/817,302 patent/US6845379B2/en not_active Expired - Lifetime
- 2001-03-29 DE DE60134600T patent/DE60134600D1/de not_active Expired - Lifetime
- 2001-03-29 EP EP01302995A patent/EP1139213B1/en not_active Expired - Lifetime
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5074766B2 (ja) * | 2004-10-01 | 2012-11-14 | パナソニック株式会社 | 音響調整装置および音響調整方法 |
JP2008104123A (ja) * | 2006-10-20 | 2008-05-01 | Matsushita Electric Works Ltd | 住宅設備監視システム |
JP2012504260A (ja) * | 2008-09-30 | 2012-02-16 | ドルビー・インターナショナル・アーベー | オーディオメタデータのトランスコーディング |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
TWI457913B (zh) * | 2008-09-30 | 2014-10-21 | Dolby Int Ab | 音訊元資料的轉碼方法與系統、及其電腦程式產品與機上盒 |
Also Published As
Publication number | Publication date |
---|---|
DE60134600D1 (de) | 2008-08-14 |
US6845379B2 (en) | 2005-01-18 |
EP1139213A2 (en) | 2001-10-04 |
US20010029540A1 (en) | 2001-10-11 |
EP1139213A3 (en) | 2004-11-17 |
EP1139213B1 (en) | 2008-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7053687B2 (ja) | ラストマイル等化 | |
JP2001282261A (ja) | 音声データ設定装置及び方法、音声データ生成装置及び方法、記録媒体 | |
US20200202860A1 (en) | Method for controlling terminal by voice, terminal, server and storage medium | |
JP2009536500A (ja) | 移動無線端末のユーザにオーディオ及びビデオコンテンツを通知する方法及びシステム | |
US7865833B2 (en) | Data processing apparatus, data processing server, data processing system, method of controlling data processing apparatus, method of controlling data processing server, computer program, and computer readable storage medium | |
JP2006172432A (ja) | コンパクトメディアフォーマットファイルを同期マルチメディア統合言語に変換するためのシステムおよび方法 | |
CN106098056B (zh) | 一种语音新闻的处理方法、新闻服务器及系统 | |
WO2014117660A1 (zh) | 视频短信的发送、接收方法及其装置和手持电子设备 | |
WO2008132579A2 (en) | Audio with sound effect generation for text -only applications | |
CN108271096A (zh) | 一种任务执行方法、装置、智能音箱及存储介质 | |
CN102427465A (zh) | 语音服务代理方法及装置、通过代理集成语音应用的系统 | |
CN112399134A (zh) | 一种云会议录制的自管理发布方法及系统 | |
JP3850616B2 (ja) | 情報処理装置および情報処理方法、ならびに情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP5737357B2 (ja) | 音楽再生装置及び音楽再生プログラム | |
CN113760219A (zh) | 信息处理方法和装置 | |
EP1954048A2 (en) | Viewing/hearing device | |
CN113423007A (zh) | 多音频播放的控制方法、装置、电子设备及存储介质 | |
JP2009053342A (ja) | 議事録作成装置 | |
US8849089B2 (en) | Motion picture creation method in portable device and related transmission method | |
JP2005300783A (ja) | 音声変換装置 | |
JP2007323512A (ja) | 情報提供システム、携帯端末及びプログラム | |
CN101483617A (zh) | 音乐同步播放系统、方法及音乐播放器 | |
JP4293115B2 (ja) | ダウンロードされた音楽コンテンツを再生又は記録する方法、端末及びプログラム | |
JP2001285806A (ja) | 映像・音声作製方法およびシステム | |
JP2008182319A (ja) | ストリームデータ再生システム、携帯端末機およびストリームデータ再生方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070605 |