JP2005519336A

JP2005519336A - 自動オーディオ録音・再生機及びその操作方法

Info

Publication number: JP2005519336A
Application number: JP2003573781A
Authority: JP
Inventors: ディミトロワ，ネヴェンカ; ダグタス，サーラン
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2002-03-01
Filing date: 2003-02-21
Publication date: 2005-06-30
Also published as: WO2003075459A1; EP1483831A1; AU2003248912A1; US20030167174A1; KR20040082445A; CN1639975A

Abstract

オーディオ録音・再生機が、Ｎ個のオーディオ・ソースによって送信されたＮ個のオーディオ信号を生成するＭ個のチューナと、上記Ｎ個のオーディオ信号からＲ×Ｎ個のオーディオ信号特性を抽出する分析器と、上記Ｒ×Ｎ個のオーディオ信号特性を記憶するメモリと、上記Ｒ×Ｎ個のオーディオ信号特性の少なくとも１つの選択に応じて上記Ｎ個のオーディオ信号の１つに対応したオーディオ信号を再現する出力回路とを有し、上記Ｒは正の整数であり、上記Ｍ及びＮは１より大きい正の整数である。所望であれば、このオーディオ録音・再生機は、有益的なことに、ラジオ、コンピュータ、又は、セットトップ・ボックスのうちの１つに含めることができる。このオーディオ録音・再生機を作動させる方法も記載されている。

Description

本発明は、概して、エンターテイメント・システムに係り、特に、録音、処理、及び録音されたオーディオ信号の選択再生が可能なオーディオ録音・再生機が組み込まれたオーディオ・エンターテイメント・システムに関する。このオーディオ録音・再生機は、有益的なことに、ユーザが以前に録音されたオーディオ信号サンプルに対する処理結果に基づいてライブの又は録音されたオーディオ選択を再生できるようにする。

ライブのオーディオ信号又はオーディオ信号ファイルに対して許容できる精度（すなわち、９５％より良い精度）で音声認識を実行するソフトウェアが市場で入手可能である。例えば、特許文献１及び２は、様々な態様の音声認識ソフトウェアをカバーしている。さらに、オーディオ・コンテンツを特徴付ける類似の方法も既知である。特許文献３及び４は、ビート、エネルギ、ピッチなどにより音楽を特徴付ける方法をカバーしている。加えて、ほとんどのカーラジオは、スキャン・モードを有する。スキャン・モードでは、ラジオは、ＡＭ若しくはＦＭ周波数帯域を自動的に進み、現存するオーディオ信号ソース（すなわち、チャンネル）の各々で数秒停止する。

近年に行われたストライド（ｓｔｒｉｄｅｓ）と音声認識及びオーディオ信号分析・特徴付けの双方に関する進行中の開発とにもかかわらず、現在のオーディオ製品のトレンドは、相変わらず、様々な種類のプログラミングを見分ける市場動向に頼っているか、或いは、音楽を様々なチャンネルに並び替える単一のエンティティに頼っている。その後、これらのチャンネルは、衛星経由で又はインターネットを通じて放送される。
米国特許第４，２７７，６４４号明細書米国特許第６，１０１，４６７号明細書米国特許第６，０５４，６４６号明細書米国特許第６，１７３，２６０号明細書

近年、未知の「オーディオ・プログラマ」が複数のチャンネルとなる音楽を選択する「高性能ラジオ」がいくつか導入されている（それらのほとんどはその後市場から撤収されている）。例えば、コンテンツ別にソートされた複数のオーディオ・チャンネルがＳｐｉｎｎｅｒなどのサービス又はプロバイダからインターネットを通じて入手可能である。近年導入されたＸＭラジオ（ＸＭＲａｄｉｏ）は、専門的にプログラムされた音楽、スポーツ、ニュースなどのチャンネルを１００以上提供する。しかし、衛星放送を受信するのに用いられるこのラジオは、１０年前に売り出されたカーラジオと同程度の機能性である。代替的なＫｅｒｂａｎｇｏラジオ（及びチューニング・サービス）は、インターネットを経由して利用可能なオーディオ・ソースのデータベースを提供することによっていくつかの進歩した機能性を提供した。すなわち、コンテンツは、ユーザの好みではなく、企業側の基準で分類されている。対照的に、ＡｕｄｉｏＲａｍｐ．ｃｏｍより売り出されているインターネット・ラジオ機器は、約１０００のＭＰ３オーディオ・ファイルを格納している。しかし、ユーザはそれらファイルをオンライン・ストリーミング・ソースから取得するため、ここでもオーディオ・ファイルはユーザではなくストリーミング・ソースにより選択される。

必要とされているものは、ユーザにより再生されるオーディオ・ソースがユーザの好みに応じて選択されるように、複数のオーディオ・ソースからのオーディオ信号を分析し特徴付けすることが可能なオーディオ録音・再生機である。このオーディオ録音・再生機が例えば自動車用エンターテイメント・システム、パーソナル・コンピュータ、セットトップ・ボックスなどの多くの機器内に組み込まれれば有益的であろう。このオーディオ録音・再生機は音声又は音楽のいずれかを含むオーディオ信号サンプルを処理できることが望ましい。また、このオーディオ録音・再生機は、ハイレベル音声コマンドに応答できることも望ましい。最後に、任意の要素が実物でも仮想（すなわち、プロセッサにより具体化されたソフトウェア機能）でもよいオーディオ録音・再生機が特に有益的である。

以上より、現在、本技術分野では、上述の困難を克服するオーディオ録音・再生機及び対応する操作方法に対する必要性が存在することは明らかであろう。本発明は、現在利用可能な技術の欠点及び短所を克服して上記必要性を満たしたいという願望が動機となっている。

一態様によれば、本発明は、オーディオ録音・再生機であって、少なくとも２つのオーディオ・ソースに周波数を合わせることによって第一及び第二のオーディオ信号を生成する第一の装置と、上記第一及び第二のオーディオ信号に対応した第一及び第二のオーディオ信号特性を生成する第二の装置と、上記第一及び第二のオーディオ信号及び上記第一及び第二のオーディオ信号特性の双方を記憶する第三の装置と、上記第一及び第二のオーディオ信号特性の一方の選択に応じて上記第一及び第二のオーディオ信号の一方を再現する第四の装置とを有するオーディオ録音・再生機を提供する。所望であれば、このオーディオ録音・再生機は、有益的なことに、ラジオ、コンピュータ、又は、セットトップ・ボックスの中に含めることができる。有利なことに、上記記憶装置はハードディスクを含むことができる。一実施形態において、上記チューニング装置はプロセッサによって具体化される音声認識ルーチンを有する。さらに、上記生成装置は、プロセッサによって具体化される音声認識ルーチンを有することができる。所望であれば、本オーディオ録音・再生機は、発話コマンドに応じて生成された制御信号を適用して上記再現装置を制御する装置を更に有する。

別の態様によれば、本発明は、オーディオ録音・再生機であって、Ｎ個のオーディオ・ソースによって送信されたＮ個のオーディオ信号を生成するＭ個のチューナと、上記Ｎ個のオーディオ信号からＲ×Ｎ個のオーディオ信号特性を抽出する分析器と、上記Ｒ×Ｎ個のオーディオ信号特性を記憶するメモリと、上記Ｒ×Ｎ個のオーディオ信号特性の少なくとも１つの選択に応じて上記Ｎ個のオーディオ信号の１つに対応したオーディオ信号を再現する出力回路とを有し、上記Ｒは正の整数であり、上記Ｍ及びＮは１より大きい正の整数である、オーディオ録音・再生機を提供する。所望であれば、上記Ｍ個のチューナの各々はプロセッサによって具体化されるソフトウェア・ルーチンを含む。加えて、上記分析器は、有益的なことに、プロセッサにより具体化される音声認識ルーチンを含んでもよい。一例として、この音声認識ルーチンは、発話コマンドに応じて上記出力回路を制御する信号を生成するのに用いることができる。

更に別の態様によれば、本発明は、Ｍ個のチューナと分析器と記憶装置とオーディオ出力回路とを含むオーディオ録音・再生機の作動方法であって、上記Ｍ個のチューナを作動させてＮ個のオーディオ・ソースからＮ個のオーディオ信号を取得する工程と、上記分析器を作動させて上記Ｎ個のオーディオ信号に特徴を付け、Ｒ×Ｎ個のオーディオ信号特性を生成する工程と、上記Ｎ個のオーディオ信号及び上記Ｒ×Ｎ個のオーディオ信号特性の双方を上記記憶装置に記憶する工程と、上記Ｒ×Ｎ個のオーディオ信号特性の１つの選択に応じて、上記Ｎ個のオーディオ信号の選択された１つを上記オーディオ出力回路を通じて再現する工程とを有し、上記Ｒは正の整数であり、上記Ｍ及びＮは１より大きい正の整数である、方法を提供する。所望であれば、ＭはＮと等しくすることができる。特に、上記チューナの各々がプロセッサにより具体化されるチューナ・ルーチンである場合には。一例として、上記Ｎ個のオーディオ信号の１つは、上記Ｍ個のチューナの１つが上記Ｎ個のオーディオ・ソースの対応した１つに周波数が合わせられている間に記憶され、上記Ｒ×Ｎ個のオーディオ信号特性は、上記記憶されたＮ個のオーディオ信号から抽出される。上記Ｒ×Ｎ個のオーディオ信号特性のうち選択されたものは、上記Ｎ個のオーディオ信号に含まれる音楽についての速度、トーン、及びエネルギに対応することが好ましい。あるいは、上記Ｒ×Ｎ個のオーディオ信号特性のうち選択されたものは、上記Ｎ個のオーディオ信号に含まれる発話から抽出された言葉に対応する。いずれにしても、本作動方法は、上記Ｒ×Ｎ個のオーディオ信号特性の１つをユーザが選択したのに応じて、上記Ｎ個のオーディオ信号の上記選択された１つを上記オーディオ出力回路に再現させる制御信号を生成する工程を含むことができる。

更に別の態様によれば、本発明は、Ｍ個のチューナと分析器と記憶装置とオーディオ出力回路とを含むオーディオ録音・再生機の作動方法であって、上記Ｍ個のチューナを作動させてＮ個のオーディオ・ソースからＮ個のオーディオ信号セグメントを取得する工程と、上記分析器を作動させて上記Ｎ個のオーディオ信号セグメントに特徴を付け、Ｒ×Ｎ個のオーディオ信号特性を生成する工程と、上記Ｒ×Ｎ個のオーディオ信号特性を上記記憶装置に記憶する工程と、上記Ｒ×Ｎ個のオーディオ信号特性の１つの選択に応じて、上記Ｎ個のオーディオ信号の選択された１つによって生成されたオーディオ信号を上記オーディオ出力回路を通じて再現する工程とを有し、上記Ｒは正の整数であり、上記Ｍ及びＮは１より大きい正の整数である、方法を提供する。所望であれば、ＭはＮと等しくすることができる。一例として、上記Ｎ個のオーディオ信号セグメントの１つは上記Ｍ個のチューナの１つが上記Ｎ個のオーディオ・ソースの対応した１つに合わせられるたびに一時的に記憶され、上記Ｒ×Ｎ個のオーディオ信号特性は上記一時的に記憶されたＮ個のオーディオ信号セグメントから抽出される。上記Ｒ×Ｎ個のオーディオ信号特性のうち選択されたものは、上記Ｎ個のオーディオ信号セグメントに含まれる音楽についての速度、トーン、及びエネルギに対応することが好ましい。あるいは、上記Ｒ×Ｎ個のオーディオ信号特性のうち選択されたものは、上記Ｎ個のオーディオ信号セグメントに含まれる発話から抽出された言葉に対応する。いずれにしても、本作動方法は、上記Ｒ×Ｎ個のオーディオ信号特性の１つをユーザが選択したのに応じて、上記Ｎ個のオーディオ信号の上記選択された１つを上記オーディオ出力回路に再現させる制御信号を生成する工程を含むことができる。

本発明の上記及び他の様々な特徴は、添付図面と共に以下の詳細な説明を参照することによって容易に理解できる。図面中、同じ又は類似の数字が通して用いられる。

図１を参照して本発明の第一の好ましい実施形態について説明する。図１は、オーディオ録音・再生機１のハイレベル・ブロック図である。このオーディオ録音・再生機は、アンテナ１０と作動可能に結合されたチューナ２０及び２２を含むことが好ましい。チューナ２０、２２の各々は、プロセッサ３０により制御される。プロセッサ３０は、有益的なことに、入出力（Ｉ／Ｏ）ポート３２を通じて、チューナに制御信号を提供する。

プロセッサ３０は、ランダム・アクセス・メモリ（ＲＡＭ）４２、不揮発性ランダム・アクセス・メモリ（ＮＶＲＡＭ）４４、及び、リード・オンリ・メモリ（ＲＯＭ）４６に作動可能に結合される。ＲＡＭ４２は、プロセッサ３０により具体化されたプログラム及びルーチンとにより生成されたデータ用の一時的なストレージを提供し、ＮＶＲＡＭは特徴付けの結果、すなわちオーディオ信号の特性を示すデータを格納する。ＲＯＭ４６は、プログラムと、これらプログラムが使用する永久データとを格納する。ここで、プロセッサ３０は、有益的なことに、マイクロプロセッサかディジタル・シグナル・プロセッサ（ＤＳＰ）のいずれかであってもよい点が言及されるべきである。一例として、プロセッサ３０は両種類のプロセッサを含んでもよい。別の一例において、このプロセッサは、後に詳述するように作動する分析器を具体化するＤＳＰである。また、ＮＶＲＡＭ４４がスタティックＲＡＭ（ＳＲＡＭ）や強磁性体ＲＡＭ（ＦＥＲＡＭ）などであり、ＲＯＭ４６が新しいプログラムが利用可能となったときにプログラム及び「永久」データを更新できるＳＲＡＭや電気的にプログラム可能なＲＯＭ（ＥＰＲＯＭ又はＥＥＰＲＯＭ）であってもよいことも言及されるべきである。あるいは、ＲＡＭ４２、ＮＶＲＡＭ４４、及びＲＯＭ４６によって提供される機能は、本発明において、単一のハードドライブとして具現化されてもよい。その場合、離散型メモリ４２、４４、及び４６が例えばハードドライブ若しくはディスクなどの単一の記憶装置４０内に組み込まれる。

チューナ２０、２２の各々は、出力回路に作動可能に接続されている。この出力回路は、一例として、選択スイッチ２４、ディジタル／アナログ変換器（ＤＡＣ）５０、増幅器６０、及び、スピーカ７０を含む。出力回路内の様々な装置は、従来通りの方法で、グランド８０へ接続される。チューナ２０、２２がアナログ装置の場合、ＤＡＣ５０は有益なことに省くことができる点に注意。しかし、チューナ２０、２２の出力は分析及び特徴付けのためにＩ／Ｏポート３２を通じてプロセッサ３０にも提供されるため、チューナ２０、２２をディジタル装置であるものとして説明する。すなわち、便宜上、チューナはディジタル出力を有するものとする。この開示を読んだ当業者には他の構成も思い浮かぶであろう。そのような構成は本発明の範囲内と考えられる。

図１に例示したオーディオ録音・再生機１の構成は空中又はケーブルなどの地上線を通じて複数のオーディオ・ソースからの伝送を受信する装置を含めるのに適していることに注意。このような装置は、ラジオ（すなわち、カーラジオや衛星ラジオなど）や、セットトップ・ボックス（例えば、ケーブルテレビ用や衛星放送用のＳＴＢなど）などである。オーディオ録音・再生機１がオーディオ・コンテンツを分析し特徴付ける速度はその装置に含まれるチューナの数により制約される。例えば、オーディオ録音・再生機１が図示したチューナ２０、２２のみを含むとき（より多くのチューナが含まれると有益的であるが）、チューナ２０はユーザのお気に入りのラジオ局を再生しており、チューナ２２のみがオーディオ・サンプリングに利用可能である点に注意。各サンプルの長さは数秒であること、各放送局のコンテンツの分析及び特徴付けの品質は一般的にその局のサンプル数に反比例すること、及び、チューナがあるオーディオ・ソースから別のオーディオ・ソースに合わせられたとき、受信したオーディオ信号には有限の隙間が存在することにより、特定の聴取者に役立つすべてのオーディオ・ソースを分析し特徴付けるのには何分も時には数時間も掛かる可能性もある。複数の仮想チューナ（例えば、記憶されたチューナ・プログラム又はソフトウェア・ルーチンを読み出したプロセッサにより具体化されたチューナ）を作動させることができる装置が利用可能であれば、有益的である。そのような装置を図２に例示する。

本発明の別の一実施形態を図２に示す。図２は、オーディオ録音・再生機１００のハイレベル・ブロック図である。オーディオ録音・再生機１００において採用されている構成要素の一部は後に詳述するようにソフトウェア装置であることは明らかである。オーディオ録音・再生機１００は、有益的なことに、様々な流れているオーディオ・ソース（ある時点で、米国だけでもそのようなソースは２，５００くらい作動中であった）に接続できる。プロセッサ１３０はこれら流れているオーディオ・ソースをインターネット（Ｉ）からＩ／Ｏポート１３２を通じて受信することが好ましい。インターネットに接続するのに必要な実際のハードウェアは、モデム（例えば、アナログモデム、ケーブルモデム、又は、ＤＳＬモデム、など）や、場合によってはネットワーク・インターフェース・カード（ＮＩＣ）などであることに注意。本発明の一部を構成しないこのような従来通りの装置はこれ以上説明しない。

引き続き図２を参照すると、プロセッサ１３０は、共同でメモリ１４０を構成するＲＡＭ１４２、ＮＶＲＡＭ１４４、及びＲＯＭ１４６に接続されることが好ましい。図１に関して既に述べたように、ＲＡＭ１４２はとプロセッサ１３０により具体化されたプログラム及びルーチンとにより生成されたデータ用の一時的なストレージを提供し、ＮＶＲＡＭ１４４は特徴付けの結果、すなわちオーディオ信号の特性を示すデータを格納する。ＲＯＭ１４６は、プログラムと、これらプログラムが使用する永久データとを格納する。ここで、ＮＶＲＡＭ１４４がスタティックＲＡＭ（ＳＲＡＭ）や強磁性体ＲＡＭ（ＦＥＲＡＭ）などであり、ＲＯＭ１４６が新しいプログラム・バージョンが利用可能となったときにプログラム及び「永久」データを更新できるＳＲＡＭや電気的にプログラム可能なＲＯＭ（ＥＰＲＯＭ又はＥＥＰＲＯＭ）であってもよいことに言及されるべきである。別の方法として、ＲＡＭ４２、ＮＶＲＡＭ４４、及びＲＯＭ４６の機能は、本発明において、有益的なことに、単一のハードドライブ（すなわち、単一のメモリ装置１４０）として具現化することができる。プロセッサ３０（１３０）が複数のプロセッサを含むとき、これら複数のプロセッサの各々は、有益的なことに、メモリ装置１４０を共有してもよく、或いは、個別のメモリ装置を有してもよいことは明らかである。例えばすべてのＤＳＰがメモリ装置１４０を用い、すべてのマイクロプロセッサがメモリ装置１４０Ａ（図示せず）を用いるなどの他の構成も可能である。

図２から明らかなように、プロセッサ１３０は、プロセッサ・リソースの許す限り、多くの仮想チューナ（例えば、ＴＣＰ／ＩＰチューナ１２０ａ〜１２０ｎ）を具体化する。ＴＣＰ／ＩＰチューナ１２０ａ〜１２０ｎの１つは、Ｉ／Ｏポート１３２を通じて出力回路に作動可能に接続することができる。出力回路は、一例として、光学ディジタル／アナログ変換器（ＤＡＣ）１５０、増幅器１６０、及び、スピーカ１７０を含む。出力回路内の様々な装置は、従来通りの方法で、グランド１８０へ接続される。再記するが、この開示を読んだ当業者には他の構成も思い浮かぶであろう。そのような構成は本発明の範囲内と考えられる。オーディオ録音・再生機がディジタル増幅器１６０を含み、ＤＡＣが必要ないとき、ＤＡＣ１５０は省くことができる点に注意。

以下、図３を参照して、オーディオ録音・再生機１及び１００のオペレーション全体を説明する。図３は、本発明に係るオーディオ録音・再生機を作動させる方法のフローチャートを示している。ステップＳ１０において、オーディオ録音・再生機に電源が入れられ、初期化される。図１及び２に示したオーディオ録音・再生機のいずれについても、初期化ルーチンは、有益的なことに、ＲＡＭ４２（１４２）を初期化してディジタル・オーディオ信号サンプルを受け入れることができる。さらに、オーディオ録音・再生機１（１００）のプロセッサ３０（１３０）は、ＲＯＭ４６（１４６）からソフトウェアを検索することもＮＶＲＡＭ４４（１４４）に予め記憶されたオーディオ信号特性を読み出すこともできる。

オーディオ録音・再生機１（１００）の作動方法の残りのステップについて述べる前に、有益的なことにＲＡＭ４２、ＮＶＲＡＭ４４、及びＲＯＭ４６に帰する機能を提供する例えばメモリ４０の構成について述べることが有用であるかもしれない。図４Ａから、ＲＯＭ４６又はメモリ４０の対応する部分は、有益的なことに、プロセッサ３０により実行できる又はプロセッサ３０上で具体化できるソフトウェア・プログラム及びルーチンを記憶することは明らかである。これらソフトウェア・プログラム及びルーチンは、例えば、分析器ソフトウェア（ＡＮ）、ＴＣＰ／ＩＰチューナ・ソフトウェア（ＴＳ）、音声認識ソフトウェア（ＶＲ）、一致ソフトウェア（ＣＳ）、音声案内ソフトウェア（ＶＮ）、及び、オペレーティング・システム（ＯＳ）である。また、ルーチン（例えば、ＴＰＣ／ＩＰチューナ・ソフトウェア（ＴＳ）など）の複数のコピーが同時に具体化できるならば、あるプログラムのコピーは１つだけ記憶されればよいことも明らかである。対照的に、メモリ４０のＲＡＭ部分は、チューナからオーディオ信号サンプルを受信するビン、キャッシュ、バッファ、又は、キューＡＳ１〜ＡＳＮから成る。サンプリングされるオーディオ信号ソースの各々について１つずつ、複数の記憶位置が用意される。メモリ４０のＲＡＭ部分に設けられた各キャッシュ又はバッファについて、対応するオーディオ信号サンプルのオーディオ信号特性が記憶される対応するＮＶＲＡＭ部分ＡＳＣ１〜ＡＳＣＮが存在する。

図４Ｂは、メモリ４０（１４０）の大部分が大規模音楽記憶エリア４８に分離されている代替的なメモリ構造を示す。大きなハードドライブ（例えば１ＧＢ超）の場合、この記憶エリアは、サンプル記憶キャッシュＡＳ１〜ＡＳＮをこれらキャッシュ又はバッファの少なくとも一部がユーザのお気に入りのオーディオ・ソースからの何分もの及び好ましくは何時間ものマテリアルを圧縮有り又は無しで含むことができるところまで増やすために、省くことができることに注意。ここで、様々なキャッシュＡＳ１〜ＡＳＮ及びＡＳＣ１〜ＡＳＣＮがオーディオ録音・再生機により設けられるため、各キャッシュのサイズは任意でよいことが言及されるべきである。例えば、キャッシュＡＳ１は、比較的小さいサンプル・サイズを必要とするすべてのトーク・オーディオ・ソース又はすべての天気オーディオ・ソースからのオーディオ信号サンプル又はセグメントを記憶する。しかし、ユーザが設定したユーザが関心あるキーワード又はフレーズは、広範囲すぎて、オーディオ信号特性の数がそのオーディオ・ソースに専用のメモリ４２に対応するメモリ４４のエリアがそのオーディオ・ソースに割り当てられたエリアより広いことが必要となり得る。他の構成も可能であり、そのような構成のすべては本発明の範囲内と考えられる。

オーディオ録音・再生機１がカーラジオ内に組み込まれたとき、キャッシュ・サイズはすべての考えられるオーディオ信号ソースからオーディオ信号サンプルを集めるために制限される可能性がある。なぜなら、ユーザの好みはオーディオ録音・再生機によって学習されるため、数字又はキャッシュ位置は残りのキャッシュのサイズを増やすために減らすことができる。換言すれば、オーディオ録音・再生機は、ユーザが再生する可能性の低いオーディオ信号ソースからのオーディオ信号サンプルを記憶する必要はない。例えば、ユーザが単にオペラ音楽とラップ音楽を好きでない場合、オペラ及びラップ音楽に特化した放送局からの伝送を分析する意味がない。

再び図３を参照すると、ステップＳ１２において、オーディオ・サンプル（又はプログラム）は、利用可能なオーディオ信号ソース又はそのサブセットから取得される。利用可能な実物の又は仮想のチューナ（例えば、チューナ２０及び２２又はＴＣＰ／ＩＰチューナ１２０ａ〜１２０ｎ）が複数存在するとき、サンプリングは、有益的なことに、並列に実行することができることは明らかである。例えば、ユーザが本発明に係るオーディオ録音・再生機が組み込まれた自動車用エンターテイメント・システムのＣＤプレイヤーを作動させているとき、チューナ２０及び２２の双方はバックグラウンドにおいてオーディオ信号ソースの積極的なスキャンを行うことができる。ユーザがチューナ２０により「引き込まれた」局を聴いているとき、チューナ２２だけがオーディオ・サンプリング・ステップを実行するのに利用可能である。オーディオ録音・再生機１００のプロセッサ１３０は、単に、実行される他の機能と釣り合いの取れた数のＴＣＰ／ＩＰチューナ１２０ａ〜１２０ｎを具体化することに注意。例えば、オーディオ録音・再生機１００がパーソナル・コンピュータに組み込まれ、そのコンピュータがワード・プロセッサとして用いられている場合、プロセッサ１３０は、ワード・プロセッシング・ルーチンの性能が劣化し始めるまでＴＣＰ／ＩＰチューナ（及び他のソフトウェア装置）を具体化することができる。その場合、ユーザは彼／彼女のスプレッドシート・プログラムを開始すると、プロセッサ１３０は１以上のＴＣＰ／ＩＰチューナをアンロードし（すなわち殺し）、コンピュータのパフォーマンス・レベルを維持する。

ここで、実物の又は仮想のチューナは限られた数しかなく、オーディオ・ソースは１つの長く連続したサンプルでは特徴付けることができないが、より長い時間期間をカバーする複数のオーディオ・サンプル・セグメントでは可能であることから、利用可能なチューナは利用可能なオーディオ信号ソース中を繰り返しスキャンすることができる点が言及されるべきである。したがって、Ｎ番目のオーディオ信号ソースが選択されるたびに、オーディオ信号セグメントは後続の分析のためにＡＳＮに記憶される。対照的に、ユーザの好みがオーディオ録音・再生機１（１００）により学習された後では、オーディオ録音・再生機は、有益的なことに、好みのオーディオ・ソースから何分もの又は何時間ものコンテンツを録音することができるため、例えばユーザが旅行中であって好みのラジオ局を受信できないときなど好みのオーディオ・ソースが利用可能でないときなどに、そのマテリアルを再生することができる。

ステップＳ１４において、オーディオ録音・再生機は記憶されたオーディオ信号サンプルを分析し、オーディオ信号特性を識別する１以上のデータを生成する。例えば、ＡＳ１に記憶されたオーディオ信号サンプル又はセグメントは、有益的なことに、音声認識ソフトウェア又は音楽分類ソフトウェアのいずれか或いは双方によって処理できる。オーディオ信号サンプルが両種類の処理を受けるとき、そのような処理は並列に実行されることが好ましいことは明らかである。しかし、直列処理も排除されない。さらに、予め記憶されたオーディオ信号特性が特定のオーディオ信号ソース（例えば、放送局）がすべてのトークのオーディオ信号ソースであることを示しているとき、オーディオ録音・再生機は音楽分類処理を実行する必要はない。なぜなら、「音楽」の圧倒的多数は広告に関連するものであるからである。このステップＳ１４において実行される分析及び特徴付けのルーチンに関する更なる詳細は後述する。

ステップＳ１６において、メモリ４０のメモリ位置ＡＳ１〜ＡＳＮに記憶されたオーディオ信号サンプルのオーディオ信号特性に対応するデータが、対応するメモリ位置ＡＳＣ１〜ＡＳＣＮに記憶される。オーディオ信号特性データは、有益的なことに、不変のデータであること、すなわちそのデータは電源オフ及び初期化（すなわち、ステップＳ１０）によっても保持されることは明らかである。例えばＲＡＭ４２のメモリ位置ＡＳ１〜ＡＳＮに記憶されたオーディオ信号サンプルは、一般的に、ユーザが次にオーディオ録音・再生機が組み込まれた自動車用エンターテイメント・システムを起動したときに利用可能ではない。

周期的に、オーディオ録音・再生機１（１００）は、ユーザがコマンドを入力したか否かをチェックする。より具体的には、ステップＳ１８において、ユーザにより音声コマンドが入力されたか否かを判断するためのチェックが実行される。代替的に又は同時に、オーディオ録音・再生機は、ステップＳ２０において、例えばオーディオ録音・再生機のコントロール・パネルの（又は、オーディオ録音・再生機に関連付けられたリモコン装置（図示せず）の）キーを操作しているユーザによりキー・コマンドが生成されたか否かを判断するためのチェックを実行する。上記チェックの少なくとも一方の答えが否定（Ｎ）の場合、ルーチンはステップＳ１２のスタートに戻り、追加的オーディオ信号セグメント又はサンプルの取得を開始する。しかし、いずれかのチェックの結果が肯定（Ｙ）のとき、ルーチンはステップＳ２２へ進む。

ステップＳ２２においては、ステップＳ１８又はステップＳ２０のいずれかにおけるコマンド入力に対応したチューナ制御信号（ＴＣＳ）が生成される。この信号は、ステップＳ２４において、所定のチューナ（例えば、チューナ２０又はＴＣＰ／ＩＰチューナ１２０ａなど）に入力され、そのチューナをＴＣＳにおいて指定されたオーディオ信号ソースへジャンプさせる。ＴＣＳは、有益的なことに、オーディオ信号がそのチューナによって再生される際の様態（例えば、音量、低音及び高音設定、など）に関する指示を含むことができる。

ステップＳ２６において、オーディオ録音・再生機１（１００）にシャットダウン・コマンドが入力されたか否かを判断するチェックが実行される。シャットダウン・コマンドは、例えば、エンターテイメント・システムの電源ボタンの操作の形を採り得る。あるいは、特にオーディオ録音・再生機１００の場合においては、ユーザのインターネット接続の意図的なシャットダウン（又は喪失）の形を採ってもよい。シャットダウン・コマンドは、例えばユーザが様々なオーディオ録音・再生機ソフトウェア・モジュールを具体化するのに十分なプロセッサ・リソースが存在しないほど他のプログラムを起動したときなどはいつでも、プロセッサ１３０自体がシャットダウン・コマンドを提供することができる。いずれにしても、判定結果が否定（Ｎ）であれば、本作動方法はステップＳ１２の先頭に戻る。結果が肯定（Ｙ）のとき、オーディオ録音・再生機は、ステップＳ２８において、シャットダウンする。

したがって、本発明に係るオーディオ録音・再生機は、様々なラジオ（又はインターネット・ラジオ）の番組の中を自動的にスキャンして各ラジオ局又はオーディオ信号ソースからオーディオ信号サンプルを収集することができるシステムを提供する。さらに、オーディオ録音・再生機は、有益的なことに、オーディオ・パーソナル化機能（例えば、収集されたオーディオ信号サンプルの一時停止、検索、及び／又は、分類）を実行することができる。自動車のエンターテイメント・システムに組み込まれたとき、本オーディオ録音・再生機は、コンテンツを自動的にスキャンし、音楽が発話かを分類することができる。

オーディオ細分化及び分類はオーディオ信号を異なるカテゴリ（例えば、発話、音楽、など）に対応する部分に分割することを含むことを明らかである。第一の工程は、オーディオ・データの連続的なビット・ストリームを各セグメントがそのクラスについて均質化しているように複数の重ならないセグメントに分割することである。次いで、各オーディオ・セグメントは、上述のような低レベル・オーディオ特性（帯域幅、エネルギ、ピッチ、など）を用いて、分類される。オーディオ・セグメント化及び分類は、本分野では既知であり、その概略は、文献：Ｄ．Ｌｉ、Ｋ．Ｓｅｔｈｉ、Ｎ．Ｄｉｍｉｔｒｏｖａ、及びＴ．Ｍｃｇｅｅ、「ＣｌａｓｓｉｆｉｃａｔｉｏｎＯｆＧｅｎｅｒａｌＡｕｄｉｏＤａｔａＦｏｒＣｏｎｔｅｎｔ−ＢａｓｅｄＲｅｔｒｉｅｖａｌ」、ＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎＬｅｔｔｅｒｓ、５３３〜５４４頁、Ｖｏｌ．２２、Ｎｏ．５、２００１年４月、に説明されている。その開示全体はここに参考文献として組み込まれる。この論文は、連続した汎用のオーディオ・データをセグメント化し分類基準により７つのカテゴリへ分類する問題を解決する。本発明に係るオーディオ録音・再生機において用いられる７つのオーディオ・カテゴリは、無音、単独話者発話、音楽、環境騒音、複数話者発話、発話と音楽の混在、発話と雑音の混在、を含む。上記論文は、ＭｅｌＣｅｐｓｔｒａｌＦｒｅｑｕｅｎｃｙＣｏｅｆｆｉｃｉｅｎｔｓ（ＭＦＣＣ）、ＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅＣｏｄｉｎｇｃｏｅｆｆｉｃｉｅｎｔｓ（ＬＰＣ）、ｄｅｌｔａＭＦＣＣ、ｄｅｌｔａＬＰＣ、ａｕｔｏｃｏｒｒｅｌａｔｉｏｎＭＦＣＣなどの６つの音響特性セットと複数の時間的・スペクトラム的特性との抽出に用いられる低レベル特性検知に適用できる基本的な定義及びアルゴリズムを提示している。

ここで、オーディオ信号サンプル及びセグメントについて分類及び特徴抽出に関する追加的な詳細は、例えば米国特許第５，９１８，２２３号及び米国特許第６，３２０，６２３号（Ｂ１）に開示されていることが言及されるべきである。特に、米国特許第６，３２０，６２３号は、所定のオーディオ・イベントがデータ及び音検知器に接続された補助チューナ（すなわち、ピクチャ・イン・ピクチャ（ＰＩＰ）・チューナ）の支援により所定のオーディオ・イベントが検知されたときにイベント（例えば、チャンネル切替イベント）をトリガするテレビについて開示している。加えて、米国特許第５，９１８，２２３号は、オーディオ・データ・ファイルの分析及び比較を実行する装置について開示している。後者の特許は、特徴の抽出（すなわち、特徴ベクトルの生成）を実行する際に上述のＭＦＣＣアルゴリズムを用いることは明らかである。さらに、論文：ＳｅｒｈａｎＤａｇｔａｓ及びＭｏｈａｍｅｄＡｂｄｅｌ−Ｍｏｔｔａｌｅｂ、「ＥｘｔｒａｃｔｉｏｎｏｆＴＶＨｉｇｈｌｉｇｈｔｓｕｓｉｎｇＭｕｌｔｉｍｅｄｉａＦｅａｔｕｒｅｓ」、ＰｒｏｃｅｅｄｉｎｇｓＩｎｔｅｒｎａｔｉｏｎａｌＷｏｒｋｓｈｏｐｏｎＭｕｌｔｉｍｅｄｉａＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ、２００１年１０月、フランス、カンヌ、は、特徴抽出に関する追加的詳細を提供している。

さらに、利用可能なオーディオ・ソースからの音楽は分類することができ、オーディオ録音・再生機はチューナの１つがユーザの個人プロファイルに対応した局に留まるように制御することができる。例えば、ユーザがジャズの熱烈な愛好家である場合、自動車用エンターテイメント・システムは自動車がある放送領域から別の放送領域に移動しても、ジャズ局に合わせたままにしておく。オーディオ録音・再生機は、音楽ストリームに知覚できる程度の不連続が生じないように、例えば２つの局がコマーシャルを放送中に切り替えたり、隙間をオーディオ録音・再生機のメモリに予め記憶されたジャズで埋めたりして、第一の局と第二の局との間の切替を調整することができることは明らかである。いずれにしても、オーディオ録音・再生機は、ユーザが「何か素敵なものを（ｆｉｎｄｓｏｍｅｔｈｉｎｇｎｉｃｅ）」などのハイレベル音声コマンドを発したときに、この特定の作動モードに入ることができる。ここで、「素敵な（ｎｉｃｅ）」とはそのユーザに関連付けられた１以上の音楽カテゴリに対応する。

ラジオ・ニュース局について、本オーディオ録音・再生機は、有益的なことに、ユーザが聴き逃した項目又は関心ある項目を検索するメカニズムを提供することができる。これらの項目は、予め定められていてもよく、或いは、走行中に設定されてもよい。ニュースを記憶し、後で再生するためにユーザのＰＤＡ又は携帯電話へ転送できること、又は、キャッシュし、次の日まで、すなわちユーザが彼／彼女の自動車を次回運転するまで保持できること、が好ましい。この作動モードは、現在のレポートが進むのを待機したり、古いレポートを聴いたりするのを防止し、天気及び交通に関する最新のレポートを直ちに再生するために記憶するように拡張することができる。「只今の天気」又は「只今のスコア」に対応する専用のキー及びハイレベル音声コマンドを本オーディオ録音・最盛期に組み込むことができることは明らかである。

また、スキャン・モードにおいて、本オーディオ録音・再生機は、有益的なことに、特定のチャンネルをモニタし、特定のユーザ指定イベントが発生したときにユーザに警告することができることにも注意。これについてのシナリオの一例は、ユーザがニュース・チャンネルを聴いている間、スキャナは複数の様々なスポーツ・イベント（例えば、複数の大学野球やフットボールの試合）を放送している複数のチャンネルをモニタする。本オーディオ録音・再生機は、それらチャンネルを短い間切り替え、面白いイベント（例えば、アナウンサーが「タッチダウン」が決まったこと又は試合が延長戦に入ったことを指摘した）が発生したときはいつでも個別のオーディオ信号を出力する。換言すれば、本オーディオ録音・再生機は、有益的なことにメモリ４４（１４４）に記憶できる「グローバルな」オーディオ信号特性が満足されたとき、すなわち、モニタされたオーディオ信号の１つの特性であると認識されたときはいつでも、そのモニタされたオーディオ信号の１つを出力する。イベントは、音声認識ソフトウェア・モジュールを用いた分析により検知される必要はないことは明らかである。ここで、イベントとは、例えば、群集興奮レベルを示すオーディオ信号サンプルにより指定された一般的に面白いイベントである。いずれにしても、本発明に係るオーディオ録音・再生機は、自動イベント検出及び特徴監視をユーザに提供する。

加えて、本オーディオ録音・再生機は、自動的に、識別されたコンテンツをその貯蔵室に加えることができる。例えば、監視されたオーディオ・ソース（チャンネル又は局）は、所定の十分なメモリにバッファすることができる。有利なことに、ユーザが番組を録音しようとすると、現在の歌の先頭ポイントが検出され、番組全体が録音される。逆に、ユーザが現在の放送中の番組をスキップしたいとき、録音されたマテリアルが再生され、ユーザ経験を向上させることができる。本オーディオ録音・再生機は、繰り返された歌を摘み取り又はコマーシャルやニュース、天気、交通情報を除去することによって、記憶された音楽の量を最適化することができることは明らかである。また、ユーザは、別のハイレベル音声コマンドを用いて、メモリから所望でない歌を除去することもできる。ユーザがオーディオ録音・再生機のメモリ４０に記憶された歌のすべて又は少なくともほとんどを魅力的であると考えたとすると、本オーディオ録音・再生機は、有益的なことに、利用可能な曲が無いときに音楽をランダムに選曲することによって「素敵な（ｎｉｃｅ）」ものという基準に応答することができる。つまり、本オーディオ録音・再生機は複数のチューナと番組マテリアル記憶用のメモリとを有するため、本オーディオ録音・再生機は、有益的なことに、時間ワープ能力を提供する。

好ましいことに、本オーディオ録音・再生機は、概して、複数のオーディオ・ソースについてオーディオ信号サンプル又はセグメントをスキャン及び記憶するため、記憶される音楽の量はわずか数秒にすべきである。これは、本オーディオ録音・再生機にとって、オーディオ特性を抽出し、発話セグメントに対して音声テキスト変換を実行し、そのオーディオ・コンテンツを分析するのに十分なオーディオ信号サンプルである。オーディオから特性が抽出されるとすぐに、本オーディオ録音・再生機は、有益的なことに、分類及び要約機能を実行することができる。これら機能は、次いで、本オーディオ録音・再生機をパーソナル化して高性能なスキャン、検索、記憶、及び転送機能を提供するのに用いられる。本発明に係るオーディオ録音・再生機は、一例として、以下の機能を有する。

１）音楽分類再生機能：本オーディオ録音・再生機は、ビート、エネルギ、ピッチ、メロディの種類、メロディの反復、などに基づいて音楽の種類を識別するのに用いることができるオーディオ特性を認識することができる。これは、特にユーザにとって魅力的に映る音楽の亜属であってもよい。ラジオ局はジャズ、ソフト、クラシック、ロックにカテゴリ分けされるが、この分類方法は多くのユーザにとってしばしば広すぎる。すなわち、ユーザができれば聴きたくない歌手や歌が依然としてそこには存在する。本オーディオ録音・再生機は、例えばユーザが好きな音楽スタイルの複数の歌に対して「好き」ボタンを押すことによって、特定の例を本オーディオ録音・再生機に提供したとき、ユーザが関心さる歌又はコンテンツを選択するのを支援することができる。これは、本オーディオ録音・さいせいきにより出力された音楽をユーザが聴いているときに、又は、ユーザが複数の楽曲の所定の部分（例えば、１５秒）を聴くプレビュー・セッション中に行うことができることは明らかである。

２）監視機能：ユーザは、本オーディオ録音・再生機のオーディオ分析器にあるパターンを歌う又はハミングすることができ、本オーディオ録音・再生機はその特定の節を様々なチャンネルでモニタすることができる。さらに、ユーザは、音声認識ソフトウェアを通じて本オーディオ録音・再生機に発話を入力することができ、本オーディオ録音・再生機は、それらの言葉の一部又は全部を含む会話又は独話を様々なチャンネルでモニタすることができる。また、高性能マッチング・アルゴリズム（すなわち、所定の秒数内で２度又は３度同じフレーズが現れたときに一致を宣言するアルゴリズム）もプロセッサ３０（１３）によって具体化することができる。

３）ニュース・レビュー機能：本オーディオ録音・再生機は、有益的なことに、興味の無い項目をスキップしながら、ユーザが興味あるすべてのニュース・セグメントを要約することができる。事実、本オーディオ録音・再生機は、ダイジェスト版のニュースのみを、すなわち音声認識ソフトウェアによって処理されたニュースのみを再生するようにセットすることができる。ユーザのリクエストにより、本オーディオ録音・再生機は、そのニュース全体を再生することもでき、或いは、より長いバージョンへリンクさせ、ウェブ・サイトから自動的にダウンロードすることもできる。多くの音声認識ソフトウェア・プログラムはテキスト音声変換能力を有していることは明らかであり、本オーディオ録音・再生機は、長いテキスト・ファイルをダウンロードし、それをユーザに読み上げることができる。さらに、本オーディオ録音・再生機は、異なるチャンネル上のニュースを要約し、ユーザがニュースを検索したいときにクイック・サマリー・オプションを提供することができる。この機能は、音声認識ユーザ・インターフェースを通じてアクセスすることができる。

４）時間シフト機能：本オーディオ録音・再生機は、歌又はニュース又は番組（例えば、毎週土曜日のＳｃｈｉｋｅｌｙｍｉｘ）を記憶し、ユーザが別の局を聴いている場合又はラジオに電源を入れていない場合に専用の音声コマンドを通じてそれらを検索することができる。

５）オートパイロット機能：本オーディオ録音・再生機は、オーディオ話者識別を通じてユーザを識別し、そのユーザが本オーディオ録音・再生機を操作しているのと同じように動作するオートパイロット・モードに入る。例えば、ユーザが本オーディオ録音・再生機が組み込まれた自動車用エンターテイメント・システムを操作するときにユーザがいつも決まって行う操作にしたがって、本オーディオ録音・再生機は、最初にニュースをスキャンし、次にクラシック音楽（朝であれば）又はお気に入りのロック（夕方であれば）を再生する。

オーディオ信号特性はジャンル情報を含むことができることが言及されるべきである。ジャンル情報は、ＭＰ３ファイルには通常記憶されており、ストリーミング・オーディオ・トラックを伴ってもよく又は識別してもよい。このジャンル情報は、数値でもよく、或いは、直列処理無しでファイル又はストリームを解釈するのに慣れた本オーディオ録音・再生機が容易に読むことができる例えば「ｎｅｗａｇｅ」又は「ＮｅｗＡｇｅ」などの文字列でもよい。これは、ユーザがインターネット無しで放送中のオーディオ・チャンネルを聴いているときに「再生中」の情報をどのように見るか、ユーザが歌の題名や歌手などをどのように受信するか、ということであることは明らかである。追加的な所定の特性情報は、プロセッサ３０（１３０）により具体化されたソフトウェアにより実行された分析及び特徴付けを補完又は贈呈するために本オーディオ録音・再生機に送信され得る。

加えて、欧州において１９９０年代初期に始まったラジオ局及び信号規格は、コールサインなどのラジオ局に関する情報を取得する「イネーブルド」ラジオを許可したことも明らかである。ラジオがＲＤＳ（ラジオ・データ・システム）特徴を用いてネットワーク内のあるプログラムされたサービス放送に合わせられると、同じ放送局からの他の番組に関する高性能他ネットワーク（ＥＯＮ）追加データが受信される。これにより、聴取者は、彼の選択に応じて、旅行情報又は好みの番組種類（ＰＴＹ；例えばニュース）について自動的に切り替えるモードで彼のラジオを作動させることができ、この情報はあるサービスから到来する。このサービスは、ある時点において、必ずしも上記のような旅行情報を含まず、所望の番組種類も放送しない。この追加データは、有益的なことに、オーディオ信号特性内に組み込むことができる。米国の複数のラジオ局が異なる地理的領域において同じ周波数で作動しており、すべての局が固有のコールサインを用いていることに注意。したがって、本発明に係るオーディオ録音・再生機を備えた自動車は、別々の商圏で作動するロック局９９ＦＭ及びジャズ局９９ＦＭに関するオーディオ特性データを記憶することができる。

つまり、本発明に係るオーディオ録音・再生機は、オーディオ・チャンネル（アナログ及びディジタル放送、インターネットもそれ以外も）の自動モニタリングを可能にすると共に、複数のライブの及び録音されたオーディオ・ソースからの番組マテリアルの自動録音又は再生を可能にすることによってユーザのリスニング経験を向上させる。

多くの特許について上に述べられたことに注意。これら特許の各々は、その全体がここに参考文献として組み込まれる。

本発明の現時点で好ましい実施形態についてここに詳細に説明したが、当業者には明らかなここに開示した基本的な発明のコンセプトの多くの変形例及び／又は改良は請求項記載の本発明の意図及び範囲内に入る。

本発明の第一の好ましい実施形態に係るオーディオ録音・再生機のハイレベル・ブロック図である。本発明の第二の好ましい実施形態に係るオーディオ録音・再生機のハイレベル・ブロック図である。図１及び２に示したオーディオ録音・再生機の様々な作動態様を示すフローチャートである。図１及び２に示したオーディオ録音・再生機で用いることができる代替的メモリ構成の一例を示す図である。図１及び２に示したオーディオ録音・再生機で用いることができる代替的メモリ構成の一例を示す図である。

Claims

オーディオ録音・再生機であって、
少なくとも２つのオーディオ・ソースに周波数を合わせることによって第一及び第二のオーディオ信号を生成する手段と、
前記第一及び第二のオーディオ信号に対応した第一及び第二のオーディオ信号特性を生成する手段と、
前記第一及び第二のオーディオ信号及び前記第一及び第二のオーディオ信号特性の双方を記憶する手段と、
前記第一及び第二のオーディオ信号特性の一方の選択に応じて前記第一及び第二のオーディオ信号の一方を再現する手段と、を有することを特徴とするオーディオ録音・再生機。
請求項１記載のオーディオ録音・再生機であって、
前記チューニング手段は、プロセッサによって具体化される音声認識ルーチンを有する、ことを特徴とするオーディオ録音・再生機。
請求項１記載のオーディオ録音・再生機であって、
前記生成手段は、プロセッサによって具体化される音声認識ルーチンを有する、ことを特徴とするオーディオ録音・再生機。
請求項１記載のオーディオ録音・再生機であって、
発話コマンドに応じて生成された制御信号を適用して前記再現手段を制御する手段を更に有する、ことを特徴とするオーディオ録音・再生機。
オーディオ録音・再生機であって、
少なくとも２つのオーディオ・ソースに周波数を合わせることによって第一及び第二のオーディオ信号を生成する手段と、
前記第一及び第二のオーディオ信号の双方について、無音、単独話者発話、音楽、環境雑音、複数話者発話、音声と音楽の混在、及び、音声と雑音の混在を含むＮ個のオーディオ信号特性を生成する手段と、
前記第一及び第二のオーディオ信号及び前記第一及び第二のオーディオ信号特性の双方を記憶する手段と、
前記Ｎ個のオーディオ信号特性の一方の選択に応じて前記第一及び第二のオーディオ信号の一方を再現する手段と、を有することを特徴とするオーディオ録音・再生機。
オーディオ録音・再生機であって、
Ｎ個のオーディオ・ソースによって送信されたＮ個のオーディオ信号を生成するＭ個のチューナと、
前記Ｎ個のオーディオ信号からＲ×Ｎ個のオーディオ信号特性を抽出する分析器と、
前記Ｒ×Ｎ個のオーディオ信号特性を記憶するメモリと、
前記Ｒ×Ｎ個のオーディオ信号特性の少なくとも１つの選択に応じて前記Ｎ個のオーディオ信号の１つに対応したオーディオ信号を再現する出力回路とを有し、
前記Ｒは正の整数であり、
前記Ｍ及びＮは１より大きい正の整数である、ことを特徴とするオーディオ録音・再生機。
Ｍ個のチューナと分析器と記憶装置とオーディオ出力回路とを含むオーディオ録音・再生機の作動方法であって、
前記Ｍ個のチューナを作動させてＮ個のオーディオ・ソースからＮ個のオーディオ信号を取得し、
前記分析器を作動させて前記Ｎ個のオーディオ信号に特徴を付け、Ｒ×Ｎ個のオーディオ信号特性を生成し、
前記Ｎ個のオーディオ信号及び前記Ｒ×Ｎ個のオーディオ信号特性の双方を前記記憶装置に記憶し、
前記Ｒ×Ｎ個のオーディオ信号特性の１つの選択に応じて、前記Ｎ個のオーディオ信号の選択された１つを前記オーディオ出力回路を通じて再現し、
前記Ｒは正の整数であり、
前記Ｍ及びＮは１より大きい正の整数である、ことを特徴とする方法。
請求項７記載の方法であって、
前記Ｎ個のオーディオ信号の１つは、前記Ｍ個のチューナの１つが前記Ｎ個のオーディオ・ソースの対応した１つに周波数が合わせられている間に記憶され、
前記Ｒ×Ｎ個のオーディオ信号特性は、前記記憶されたＮ個のオーディオ信号から抽出される、ことを特徴とする方法。
請求項７記載の方法であって、
前記Ｒ×Ｎ個のオーディオ信号特性のうち選択されたものは、前記Ｎ個のオーディオ信号に含まれる音楽についての速度、トーン、及びエネルギに対応する、ことを特徴とする方法。
請求項７記載の方法であって、
前記Ｒ×Ｎ個のオーディオ信号特性のうち選択されたものは、前記Ｎ個のオーディオ信号に含まれる発話から抽出された言葉に対応する、ことを特徴とする方法。
請求項７記載の方法であって、更に、
前記Ｒ×Ｎ個のオーディオ信号特性の１つをユーザが選択したのに応じて、前記Ｎ個のオーディオ信号の前記選択された１つを前記オーディオ出力回路に再現させる制御信号を生成する、ことを特徴とする方法。
Ｍ個のチューナと分析器と記憶装置とオーディオ出力回路とを含むオーディオ録音・再生機の作動方法であって、
前記Ｍ個のチューナを作動させてＮ個のオーディオ・ソースからＮ個のオーディオ信号セグメントを取得し、
前記分析器を作動させて前記Ｎ個のオーディオ信号セグメントに特徴を付け、Ｒ×Ｎ個のオーディオ信号特性を生成し、
前記Ｒ×Ｎ個のオーディオ信号特性を前記記憶装置に記憶し、
前記Ｒ×Ｎ個のオーディオ信号特性の１つの選択に応じて、前記Ｎ個のオーディオ信号の選択された１つによって生成されたオーディオ信号を前記オーディオ出力回路を通じて再現し、
前記Ｒは正の整数であり、
前記Ｍ及びＮは１より大きい正の整数である、ことを特徴とする方法。
請求項１２記載の方法であって、更に、
オーディオ信号サンプルがユーザが関心あるイベントの発生を示すときはいつでも前記Ｎ個のオーディオ信号の出力された１つと前記Ｎ個のオーディオ信号のモニタされた１つとを前記オーディオ出力回路に切り替えさせる制御信号を生成する、ことを特徴とする方法。
オーディオ録音・再生機に関連付けられたプロセッサに所定の機能のうち少なくとも１つを具体化させるコンピュータ可読命令を記憶したメモリであって、
前記所定の機能は、
前記オーディオ録音・再生機が受信したオーディオ信号中の音楽をオーディオ特徴に基づいて自動的に分類することを可能にする音楽分類機能と、
前記オーディオ録音・再生機が所定のオーディオ・イベントの発生に自動的に応答することを可能にする監視機能と、
前記オーディオ録音・再生機が該オーディオ録音・再生機のユーザが関心さるニュースに対応したオーディオ信号を蓄積・再生することを可能にするニュース・レビュー機能と、
前記オーディオ録音・再生機が後で再生されるオーディオ信号番組を記録することを可能にする時間シフト機能と、
前記オーディオ録音・再生機がユーザにより設定された作動上の好みのパターンに基づいて自動的に作動することを可能にするオートパイロット機能とを含む、ことを特徴とするメモリ。