JP2005099805A - 音楽処理プリンタ - Google Patents

音楽処理プリンタ Download PDF

Info

Publication number
JP2005099805A
JP2005099805A JP2004278348A JP2004278348A JP2005099805A JP 2005099805 A JP2005099805 A JP 2005099805A JP 2004278348 A JP2004278348 A JP 2004278348A JP 2004278348 A JP2004278348 A JP 2004278348A JP 2005099805 A JP2005099805 A JP 2005099805A
Authority
JP
Japan
Prior art keywords
audio
music
music data
file
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004278348A
Other languages
English (en)
Inventor
Jonathan J Hull
ジェー ハル ジョナサン
Jamey Graham
グラハム ジャメイ
Peter E Hart
イー ハート ピーター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/813,849 external-priority patent/US7314994B2/en
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2005099805A publication Critical patent/JP2005099805A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

【課題】 本発明はオーディオ/音楽データを受信し、これを処理して各種電子形式及び/又は紙ベース形式で出力する方法及び装置を提供する。
【解決手段】 本発明のある実施形態によると、オーディオ処理装置は、音楽又はオーディオファイルに基づいてスコアを作成し、更に/あるいはこのファイルを既存のデータベースに記憶された複数のメロディー農地の1つと一致させることができる。また、ある実施形態によると、オーディオ処理装置とPCとが処理負担を分担する。また、更なる実施形態によると、スコアにおいて識別される音楽セグメントがマッピングされてオーディオ又は音楽ファイルに含まれ、これによりユーザは後に特定のセグメントをアクセスすることができる。
【選択図】 図1

Description

本発明は一般に印刷装置に関し、特に音楽ファイルを受信してこの音楽ファイルに関する様々な形式の紙出力や電子出力を作成し送出することが可能な印刷装置に関する。
オーディオ技術の発展に伴い、ミュージシャン、作曲家、音楽愛好家などにとって音楽を演奏、作成、あるいは楽しむための様々な新しい技術が開発されてきた。この分野における最先端技術として注目を浴びているものとしてMPEGオーディオレイヤ3(MP3)及びこれに関連するデジタルオーディオファイルの圧縮技術の標準規格などが挙げられる。音楽ファイルを元の大きさのほんの一部に圧縮する技術の発展により、ピアツーピア・ネットワークなどを介して何百万もの音楽ファイルやその他のオーディオファイルの共有が可能となった。MP3やその他のデジタルオーディオ形式はスタジオレコーディング級の高品質なオーディオを提供するのに適しているが、現在では他にも例えば音楽スコアやMIDI(Musical Instruments Digital Interface)ファイルなどの音楽ファイル形式も求められている。
スコアやMIDIファイルは特に音楽を作曲・作成する際に便利である。作曲家は多くの場合、音楽作品やアイデアを着想した直後にこれをスコア化し、それからこのスコアを磨き上げていく。MIDIファイルもファイルサイズが小さく操作が簡単であることから音楽の作曲、編曲、アレンジなどに適している。また、MIDIファイルはメモリ制限のあるアプリケーションなどにおいてはMP3よりも適応性が優れている。したがって携帯電話、PDAや、その他の手持ち式装置の多くはMIDIトーンを信号トーンなどとして適用する。また、ウェブサイト・インタフェースやゲームなどの多くも大きなデジタルオーディオファイルの代わりにMIDIファイルを適用する。さらに多くの場合音楽スコア及びMIDIファイルは曲のテンポ、フレーズ、スタンザや、ある音がいつ、どの程度の音量と長さで演奏されるかなど完成されたレコーディングに埋め込まれる音楽情報を記憶する。このような情報は完成されたレコーディングにマークを入れ、及び/又はこのインデックスを作成去る際に便利である。
現在オーディオ及び音楽ファイルを紙形式、デジタル形式、アナログ形式などの異なる形式に変換するには大概いくつかのステップ及び装置が要される。例えばアナログのレコーディングをMP3などのデジタルファイルに変換してこのMP3に対応する音楽スコア及びMIDIファイルを携帯電話の呼び出し音などとして出力する場合いくつかの異なるシステム及び出力の間での調和が必要となる。
したがって本発明は従来技術の問題点を克服することを目的とし、具体的には統合されたシステムにおいてオーディオファイルを様々な紙及び電子形式に変換できその結果を出力できるようにすることを目的とする。
本発明は音楽やオーディオファイルを変換し様々な紙や電子媒体に印刷又は出力することを可能にする。ある実施形態によると、ユーザは第1形式のオーディオ又は音楽ファイルをオーディオ処理装置に送信することでこのファイルの出力を第2形式で受信することができる。また別の実施形態によると、オーディオ処理装置は音楽スコア及び音楽ファイルを受信し、この音楽スコアの配置に応じてこの音楽ファイルのコンテンツをインデックス化する。また、ある実施形態によると、処理されたオーディオ/音楽ファイルを出力するための装置が提供される。この装置はオーディオ/音楽データを第1形式で受信するためのインタフェース、このオーディオ/音楽データを処理するためのプロセッサ、及びこの処理されたオーディオ/音楽データを第2形式で出力するための出力系から構成される。
本発明はオーディオファイルを処理して様々な出力を生成するための装置及び方法を提供する。ある実施形態によると、デジタルオーディオファイルがオーディオ処理装置100に供給され、このファイルがMIDIファイルに変換され、スコア化され、そしてこの結果得られたオーディオ記録が印刷される。また別の実施形態によると、ある音楽ファイルを表す複数の異なる形式のファイルがオーディオ処理装置100に供給され、この複数形式ファイルのうちの1つの形式のファイルに含まれる情報に基づいて他の形式のファイルのインデックスが作成される。また別の実施形態によると、オーディオファイルを編集して出力するよう指示するコマンドがプリンタによって受信され、ここでこのコマンドが実行され、その結果が記憶媒体又はネットワークサーバに出力される。また更に別の実施形態によると、ネットワークを介して未処理状態のオーディオファイルを受信するプリンタ又はオーディオ処理装置100には再生装置が搭載されていてこの再生装置により処理されたオーディオファイルが放送される。
本発明による実施形態を適用してオーディオ/音楽ファイルの変換を管理することによって、以下に示すような効果が得られる。まず、オーディオデータをより小さいデータサイズのMIDI形式又は紙ベース形式に変換することでデータの操作を容易にすることが可能である。また、ファイルを自動的に適切な形式に変換することにより複数のファイルを比較して相互に一致する部分を検出し、ファイル内の各種パターンを識別する際の負担が軽減されうる。また、本発明の実施形態による音楽セグメントに基づいてオーディオファイルのインデックスを作成する技術を適用することでオーディオファイルにおける特定部分へ容易にアクセスすることが可能になる。
なお、本発明の説明において、「オーディオ/音楽データ」、「オーディオ/音楽ファイル」、「オーディオ/音楽情報」又は「オーディオ/音楽コンテンツ」とはオーディオデータ及び音楽データのうちの1つ又はこれらの組み合わせに相当しうる。ここにおいて「オーディオデータ」、「オーディオファイル」、「オーディオ情報」、または「オーディオコンテンツ」とは発話、レコーディング、音、MIDIデータ、または音楽などを含むデータを指す。このデータはアナログ形式で磁気テープなどに記憶されるか、あるいはMIDI,MP3(.mp3)、WAV(.wav)などを含む様々なデジタルファイル形式で記憶されることも可能である。また、オーディオデータは例えばオーディオ及びビデオ成分を含有するマルチメディアファイルなどのより大きなファイルのオーディオ部分に相当することも可能である。また、「音楽ファイル」、「音楽データ」、「音楽情報」、または「音楽コンテンツ」とは、音や発話でなく音楽やメロディーを含むオーディオデータをさし、このような音楽データを表すデータとしては例えば音楽スコアや音楽マップなどのデータがある。なお、音楽ファイルはこのような音楽やメロディーを伝達するオーディオデータであってもよい。また、音楽ファイルは例えばポストスクリプト、TIFF(.tiff)、GIF(.gif)、JPEG(.jpeg)などのドキュメント又はグラフィック形式で表現されることも可能である。
また、本発明の説明において言及されるオーディオ/音楽データは様々な方法でオーディオ処理装置100に供給されることが可能である。例えばこのオーディオ/音楽データはストリーミングコンテンツ、オーディオ取り込み装置からの生フィードデータ、ディスクリート・ファイル、又はより大きなファイルの一部としてオーディオ処理装置100に供給されうる。また、本発明の説明において「印刷」という表現が何らかの媒体に印刷を行うという文脈で用いられる場合これは、印刷、書き込み、描出、押印、エンボス処理、デジタル形式でのデータ生成や、その他の方法によるデータ提示出力の生成を含むものとする。また「ドキュメント」及び「紙」という用語は本発明によるシステム101の出力を指し、これらは紙媒体などの物理的媒体に限られない。すなわち上記用語は実体のある媒体に配当されるあらゆる出力に相当しうる。本発明の一実施形態として、オーディオ処理装置100の出力はオーディオ/音楽データが物理的な紙ドキュメントに印刷された形で提示されうる。このように紙ドキュメントを生成することにより、本発明の実施形態では携帯性の優れた読める形式のオーディオ/音楽情報を提供することができる。
以下において本発明の理解を容易にする目的で本発明の好適な実施例の特徴を詳細に説明する。しかし同業者には自明であるように本発明はこれらの実施例における詳細な特徴を適用せずに実現することも可能である。なお、本発明の明確な理解を可能にするために本発明に係る構造や装置はブロック図によって示される。
また、本発明の説明において用いられる「一実施形態」または「ある実施形態」などという表現は、当該実施形態に関連して示される特定の機能、構造又は特徴が本発明の範囲に含まれる少なくとも1つの実施形態において適用されるものであることを意味する。また、本発明の説明で「ある(一)実施形態によると」などといった表現が各所で用いられているが、これらは必ずしも同一の実施形態に言及しているとは限らない。
図1は本発明の一実施形態によるオーディオ処理装置又は音楽処理プリンタ100の構成を示すブロック図である。このオーディオ処理装置100は好適にはオーディオ/音楽インタフェース102、メモリ104、プロセッサ106、及び出力系108から構成される。
この図に示されるように、ある実施形態によると、オーディオ/音楽データ150がオーディオ処理装置100に結合される信号線130aを介してこのオーディオ処理装置100のオーディオ/音楽インタフェース102に供給される。なお、ここでの「信号線」とは、あらゆる通信装置、ルータ、またはプロトコルなどによって支持される接続及び接続の組み合わせを含み、例えばデジタル、アナログ、衛星、無線、ファイアワイヤ(IEEE1394)、802.11、RF、ローカル及び/又はワイドエリアのネットワーク、イーサーネット、9ピンコネクタ、パラレルポート、USB,シリアル又は小型コンピュータシステムインタフェース(SCSI)、TCP/IP、HTTP、Eメール、ウェブサーバーなどによって支持される接続を含む。オーディオ/音楽データ150はテープ、ディスク、フラッシュメモリ、スマートドライブ、CD−ROM、DVDやその他の磁気/光学/一時的コンピュータ又は半導体メモリなどからのデータであってもよい。ある実施形態によると、データ150はオーディオ処理装置100によって記憶媒体から各種カード、ディスク、又はテープ読取器などを介してアクセスさうる。なお、これらのアクセス手段は同オーディオ処理装置100に搭載されていてもされていなくてもよい。また、オーディオ/音楽データ150は信号線130aを介してオーディオ/音楽インタフェース102に結合されるピアツーピア・ネットワークやその他のネットワーク(非図示)からのデータや、信号線130dから受信するデータなどであってもよく、またオーディオ/音楽インタフェース102上でリアルタイムで生成されストリーミングされるデータなどであってもよい。
ある実施形態によると、オーディオ/音楽データ150は、マイクロホン、テープレコーダ、ビデオカメラなどのデータ取り込み装置(非図示)から信号線130aを介して受信される。また、このデータは例えばオーディオ/音楽ファイルのデータベースのホストサーバーなどからネットワークを介して信号線130aからマルチメディア・インタフェース102へ送信されうる。また、オーディオ/音楽データは受信器(パラボラアンテナやケーブル受信器など)からのデータであってよく、この場合受信器は外部ソース(非図示)からのオーディオ/音楽データを(例えば無線リンクなどを介して)受信あるいは取得してこのデータを信号線130aからオーディオ/音楽インタフェース102に供給する。
このようにしてオーディオ/音楽データ150は信号線130からデータを受信するように構成されるオーディオ/音楽インタフェース102に供給される。このオーディオ/音楽インタフェース120はパラレル、USB、シリアル、SCSI、ブルートゥース(登録商標)/IR受信器などの典型的な通信ポートを具備し、また、ディスクドライブ、アナログテープ読取器、スキャナ、ファイアワイヤ、IEEE1394、インターネット、またはその他のデータインタフェースやデータ通信インタフェースを具備しうる。
データを受信したオーディオ/音楽インタフェース102はこのオーディオ/音楽データ150またはこれを処理したものをシステムバス110に供給する。システムバス110はISA(Industry Standard Architecture)バス、PCI(Peripheral Component Interconnect)バス、USB(Universal Serial Bus)、またはその他上記同様の機能を実現しうる既知のバスのうちの1つまたは複数を表す。ある実施形態によると、オーディオ/音楽データ150がアナログ形式で受信された場合、このデータはまず一般的なアナログ/デジタル変換器によってデジタル形式の処理可能データに変換される。同様にオーディオ/音楽データ150が例えば紙のスコアなどの紙入力である場合、オーディオ/音楽インタフェース102は、この紙スコアの記録をデジタル出力信号に変換することができる光学式文字読取(OCR)機能などを有するスキャナ(非図示)などに結合されうる。こうしてオーディオ/音楽データ150はデジタル形式でオーディオ処理装置100のシステムバス110に送信される。
なお、図1の例ではオーディオ/音楽データ150は信号線130aを介してオーディオ処理装置100に送信される。しかし他の実施形態によってはこのオーディオ/音楽データ150はオーディオ処理装置100内で生成され、この生成データがシステムバス110によってプロセッサ106に送信されることも可能である。例えばオーディオ/音楽データ150はオーディオ処理装置100においてMIDIファイルを作成するための音楽製作ソフトなどによって生成されうる。このようにしてオーディオ処理装置100でMIDIファイルが作成されると、このMIDIファイルは例えばシステムバス110を介してプロセッサ106やメモリ104などに送信されうる。また別の実施形態によると、オーディオ処理装置100はデジタルオーディオリコーダ(非図示)を有し、これによりオーディオ処理装置100外部で楽器などによって演奏されるかあるいは出力装置によって再生される生の音楽が記録されうる。このようにして取得されたオーディオ記録からなるデジタル信号はこのオーディオ処理装置100によって更に処理されうる。
また、オーディオ/音楽データ150の処理/出力などを要求するコマンド190が信号線130bを介してオーディオ処理装置100に送信されることも可能である。ある実施形態によると、コマンド190はユーザの希望する変換、処理、及び出力形態などを反映する。このようなコマンドは例えばオーディオ/音楽データ150をアナログからデジタル形式に変換する指示や、デジタル形式からアナログ形式へ変換する指示、あるデジタル形式から別のデジタル形式へ変換する指示、スコアから音楽へまたはこの反対の変換を行う指示などであってよい。また別の例として、コマンド190は、プロセッサ106に一連の変換動作を実施するように指示し、あるいは生または処理されたオーディオ/音楽データ150をインデックス形式に編成するように指示することも可能である。また、ある実施形態によると、コマンド190は処理されたオーディオ/音楽データ150がどこに出力されるべきかを指定しうる。例えばコマンド190はオーディオ/音楽データ150を紙ドキュメント170、電子データ180、携帯記憶媒体などを出力として指定することができる。具体的な例として、デジタル信号という形で信号線130bを介してバス110へ送信されるある特定のコマンドの集合は、WAV形式のオーディオ/音楽データ150をより小さなMIDI形式に変換し、これをスコア化し、その結果をCDに焼くよう指示することが可能である。
また、ある実施形態によると、プロセッサ106へのコマンド190は処理されたオーディオ/音楽データ150を紙ドキュメント170に出力するように指示する。この場合これらのコマンド190は好ましくはドキュメント上のページレイアウトを記述していて、これらのコマンド190はプロセッサ106によって認知可能である形式のデジタル信号という形で信号線130bを介してプロセッサ106に送信さる。このコマンド190の形式としては、例えばPDL(ページ記述言語:Page Description Language)、PCL(プリンタコマンド言語Printer Command Language)、GDI(グラフィックス装置インタフェース:Graphical Device Interface)形式、アボード社のポストスクリプト言語、ベクトルベース又はビットマップベース言語などが適用されうる。なお、コマンド190は、紙ソース、ページフォーマット、フォント、余白、ページレイアウトオプションなどを指定することができる。また、コマンド190は様々なソースから発されることが可能であるが、その一例としてコマンド190は信号線130cを介してオーディオ処理装置100と結合する処理装置160におけるプリントダイアログをソースとすることも可能である。このプリントダイアログは例えばユーザがオーディオ処理装置100にオーディオ/音楽データ150を送信しようとするたびに発生するようにプログラムされうる。図3は本発明の一実施形態において表示されうるプリント・ダイアログ・インタフェース300を示す。
また、グラフィック・ユーザ・インタフェースに提示される選択肢に対するユーザの応答(選択)という形をとるコマンド190がネットワーク(非図示)を介して信号線130bまたは130及びシステムバス110経由でプロセッサ106に送信されることも可能である。また、上述のような選択オプション及びこれに対する応答はハードウェアディスプレイによって提示されうる。例えばこれらオプション及び応答は、信号線によってオーディオ処理装置100に結合されているか、あるいはオーディオ処理装置100の一部として導入されている周辺機器に具備されるタッチスクリーン又はキーパッドなどによって提示されることが可能である。そしてこれらのコマンドは周辺機器と接続する信号線130bを介してオーディオ処理装置100に送信されるか、あるいは直接オーディオ処理装置100に供給されうる。また別の実施形態によると、ある装置(非図示)に具備される一般的なソフトを調整し、ユーザの処理及び出力オプションの選択を促し、この選択オプションをオーディオ処理装置100のプロセッサ106に送信するようにすることも可能である。このようなソフトは、例えばウィンドウズ(登録商標)・メディアプレーヤなどのマルチメディア提供アプリケーションに「印刷」オプションを追加することを可能にするドライバや、特製プログラム、ソフトウェア・プラグインなどによって変更されうる。また、ここにおいて本願に参照により挿入される“Multimedia Print Driver Dialog Interfaces”と題されるHull et. alによる米国特許出願10/814,944号(2004年3月30日出願)においてオーディオ/音楽データを制御・管理するために適用される様々なインタフェースの実施形態が開示される。
具体的には上記米国特許出願は、ユーザがマルチメディア変換プロセスと対話し、オーディオ/音楽データをフォーマットしてオーディオ/音楽データの表示を作成することを可能にするメディア印刷インタフェース、並びにこれを適用するシステム及び方法を開示する。このユーザインタフェースによりユーザはメディアコンテンツ分析及びメディア表示の作成に干渉することができる。ある実施形態によると、メディア分析ソフトウェアモジュールはユーザからユーザインタフェースを介してメディアコンテンツの分析を指示するコマンドを受信すると、これに応じてメディアコンテンツの様々な特徴(例えば顔、発話、テキスト、など)を分析・検出する。メディア表示は紙ベースの形式、デジタル形式、あるいはその他あらゆる表示形式で作成されうる。ユーザインタフェースは複数のフィールドを有し、これを通してユーザはメディアコンテンツをみて作成されるメディア表示の変更を行うことができる。ある実施形態による方法は、メディアデータ分析及びメディア表示作成を制御するためにユーザインタフェースと対話し、メディアデータの特徴を分析する工程を含む。またある実施形態による方法はメディア表示パラメータに関するコマンドを受信・送信することによりメディアデータ分析プロセス及びメディア表示作成プロセスを起動する工程を含む。更にこれらの方法はメディア表示を生成する工程を含みうる。
なお、上述のように図1おけるオーディオ処理装置100のプロセッサ106は信号線130bを介して各種処理コマンド190を受信するように構成されるが、これとはまた別の実施形態によると、処理コマンド190はオーディオ処理装置100に直接入力されるかあるいはここで生成されることも可能である。また別の実施形態によると、オーディオ処理装置100はオーディオ/音楽データ150を処理するコマンドを受信することなく、その代わりに例えば特定のデータ150を受信した際、これに応じて自動的に実行すべき処理ステップを規定する論理を含む。例えばオーディオ処理装置100はMP3又はWAVファイルを受信するたびにこれをMIDIファイルに変換し、このMIDIファイルを信号線130dよりアクセス可能なネットワーク上にあるサーバーに記憶するようにプログラミングされることが可能である。
また、図1に示されるように、オーディオ処理装置100は信号線130a、130bからオーディオ/音楽データ150及びコマンド190を受信し、処理されたオーディオ/音楽データ150を、信号線130cを介して印紙ドキュメント170として出力するか、あるいは信号線130dを介して電子データ180として出力する。なお、オーディオ処理装置100はオーディオ/音楽データ150への適用ノアためにカスタマイズされることが可能であって、図2に示すような各種モジュール200〜212や、オーディオ/音楽データ150を生成するための各種周辺機器(例えばここでは図示されないが、電子キーボード、ビデオレコーダなど)を備えることが可能である。なお、ここにおける「モジュール」という用語はハードウェア、ファームウェア、及び/又はソフトウェアに具備されうる特定機能を提供するためのプログラム論理を指す。ある実施形態によると、オーディオ処理装置100は紙出力を生成する機能を有する印刷装置であって、場合によっては電子出力を生成する機能をも有しうる(これは有さなくてもよい)印刷装置を構成する。ここにおいて「印刷装置」又は「プリンタ」とはオーディオ/音楽データ150を受信し、紙ドキュメントを印刷する機能を備え、随意にファックス機能、コピー機能、及び/又はその他物理的ドキュメントを生成するための機能を備えることができる装置を指す。なお、この印刷装置は一般的なレーザ、インクジェット、携帯用、バブルジェット(登録商標)、手持ち式、又はその他のプリンタや、複合プリンタ・コピー機、デジタル送信機、プリンタ・スキャナ、特殊写真用又は携帯用プリンタ、その他紙ドキュメントを印刷可能な装置などに相当しうる。また、ある実施形態によると、印刷装置はオーディオ/音楽データを受信し、及び/又は電子データを出力するように適応された一般のプリンタであってもよい。
オーディオ処理装置100は好ましくはデータを複数種類の形式で出力することができる出力系108を有する。例えば出力系108は好ましくは一般のプリンタ及びCDやDVDへ書き込みができるディスクドライブからなる。また、出力系108はラスタ画像プロセッサや、その他オーディオ/音楽データ150を紙ドキュメント170上に出力するためデバイスやモジュールから構成されることも可能である。また別の実施形態によると、出力系108はプリンタ及び不揮発性メモリにデータを記憶するための1又は複数のインタフェースから構成されうる。この不揮発性メモリとしては、ROM、PROM(Programmable Read-Only Memory)EPROM(Erasable Programmable Read-Only Memory)、EEPROM(Electrically Erasable Programmable Read-Only Memory)、フラッシュメモリ、RAM(Random Access Memory)などが挙げられる。また、出力系108は、携帯電話メモリカード、PDAメモリカード、フラッシュメディア、メモリスティック、またはその他の携帯用媒体に電子データ180を記憶するためのインタフェースを有することも可能である。この出力された電子データ180はその後特定のターゲットデバイスからアクセスされうる。ある実施形態によると、出力系108は信号線130dを用いて処理されたオーディオ/音楽データ150をこのデータを添付したEメールという形でネットワークインタフェース(非図示)を介して所定のアドレスへ出力することも可能である。また別の実施形態によると、処理されたオーディオ/音楽データ150は信号線130dを介してこのデータをレンダリングあるいは放送するCDプレーヤやメディアプレーヤなどのレンダリング/再生装置(非図示)に送信されうる。また別の実施形態によると、信号線130dはイーサーネット・コネクションなどのサーバーへの接続を構成し、ここに処理されたコンテンツを記憶するためのアーカイブを設けるような構成にすることが可能である。またこの他の出力形式を適用することももちろん可能である。
オーディオ処理装置100は更にプロセッサ106及びメモリ104を有する。プロセッサ106はバス110を介して送信されてくるオーディオ/音楽データ150信号の処理に関連するタスクを実行するための論理を備える。このプロセッサ106は例えばRISC(Reduced Instruction Set Computer)アーキテクチャ、CISC(Complex Instruction Set Computer)アーキテクチャや、インストラクションセットの組み合わせを実現するアーキテクチャなど様々な演算アーキテクチャを具備しうる。ある実施形態によると、プロセッサ106は、例えばINTELx86、SUN MICROSYSTEMS SPARC、POWERPC適応CPUなどパソコンに搭載される汎用のプロセッサに相当しうる。なお、図1においてはプロセッサ106が1つ示されるが、複数のプロセッサを設けることも可能である。
オーディオ処理装置100のメモリ104はいくつかの機能を具備しうる。まずこのメモリ104はプロセッサ106によって実行されうるインストラクションやこれに関するデータ(ソフトやその他の要素を含む)を記憶することができる。このインストラクション及び/又はデータはここで示される機能の一部あるいはすべてを実行するためのコードを構成することが可能である。メモリ104は例えばDRAM(Dynamic Random Access Memory)装置、SRAM(Static Random Access Memory)装置、又はその他既知の記憶装置に相当しうる。メモリ104は更にプロセッサ106で処理されたオーディオ/音楽データ150を記憶するためのデータ・アーカイブ(非図示)を含むことが可能である。また、オーディオ/音楽データ150が最初に信号線130aを介してオーディオ処理装置100に送信されてきた際このデータ150は処理される前に一時的にメモリ104に記憶されることが可能である。また、メモリ104に記憶される他のモジュール200〜212は、例えばオーディオ/音楽データを処理し、インデックス化し、記憶するなどの各種機能を支持しうる。以下において本発明による実施形態に係るモジュールの例を図2を参照しながら詳細に説明する。
なお、図1の例では電子データ出力180が信号線130dを介してオーディオ処理装置100の外部に送信されるように示されているが、また別の実施形態においてはこの電子データ出力180はオーディオ処理装置100内にとどまることも可能である。例えば処理されたオーディオ/音楽データ150は、外部媒体に出力される代わりに、オーディオ処理装置100のメモリ104内のリポジトリ(非図示)に記憶されうる。また、オーディオ処理装置100はスピーカ(非図示)やその他の放送装置を含むことも可能である。オーディオ/音楽データ150はマルチメディアカードやその他のマルチメディア処理論理によって処理され、バス110を介してスピーカなどの放送装置に出力されうる。なお、本発明の出力系108は実施形態によっては紙ドキュメント出力170及び電子データ出力180の両機能を有さない場合がある。すなわち一部の実施形態では、これらの出力形式のいずれか1つのみを適用する。
図1のオーディオ処理装置100は処理装置160と通信できるように構成される。ある実施形態によると、オーディオ処理装置100はオーディオ/音楽データ150を処理するのに要される負担をこの処理装置160と分担するかあるいはこの装置に負担をシフトすることが可能である。処理装置160は例えばバスに結合されるプロセッサ(非図示)を1以上有するパソコンなどに相当しうる。このバスにはメモリ、記憶装置、キーボード、グラフィックスアダプタ、ポインタ装置、及びネットワークアダプタなどが結合されうる。またグラフィックスアダプタにはディスプレイが結合されうる。なお、処理装置160のプロセッサは例えばINTELx86、SUN
MICROSYSTEMS SPARC、POWERPC適応CPUなどの汎用プロセッサに相当しうる。なお、処理装置160はこれらの要素すべてを含む必要はないが、少なくともプロセッサ及びオーディオ処理装置100と通信を行うためのインタフェースを含む。ある実施形態によると、処理装置160はオーディオ処理装置100から信号線130cを介して未処理のオーディオ/音楽データ150を受信する。これに応じて処理装置160はこのオーディオ/音楽データ150を処理し、処理されたオーディオ/音楽データ150を信号線130c経由でオーディオ処理装置100に戻す。続いてこのオーディオ処理装置100の出力系108がこの処理されたオーディオ/音楽データ150を紙ドキュメント170または電子データ180として出力する。また別の実施形態によると、オーディオ処理装置100と処理装置160は処理負担を共有するか、あるいは対話式に相補的な処理動作を実行し、データやインストラクションを相互に信号線130cを介して送信しあう。
図2は本発明の一実施形態による図1のオーディオ処理装置100のメモリ104の構成を示すブロック図である。メモリ104はバス110によってプロセッサ106やオーディオ処理装置100における他の構成要素に結合されていて、同オーディオ処理装置100が実現する処理機能の一部又は全部を実施するためのインストラクション及び/又はデータを格納しうる。また、ある実施形態によると、図2のメモリ104は図1の処理装置160またはその他の装置をホスト装置とすることができる。この場合オーディオ処理装置100のプロセッサ106は処理装置160に配属するメモリ104と信号線130cを用いてこの処理装置100,160間の通信を容易に実現するためのインタフェースを介して通信する。なお、本発明の実施形態によっては図2に示されるメモリ104のモジュール200〜212のうちの1つ又は複数がオーディオ処理装置100のメモリに具備されてなく、また処理装置160のほうに記憶されている場合などもあるいる。また、これ以外のモジュールを適用することも可能である。
図2のメモリ104は、バス110によってオーディオ処理装置100のプロセッサ106及びその他の構成要素に結合されるメインシステムモジュール200、各種処理モジュール204〜212及びオーディオ/音楽ストレージ202から構成される。このオーディオ/音楽ストレージ202は処理の各段階におけるオーディオ/音楽データ及びその他この処理に関するデータを記憶するよう構成されうる。図2において、オーディオ/音楽ストレージ202はメモリ104の一部を構成し、オーディオ/音楽データの処理に関連するデータを記憶するために設けられる。しかし同業者には自明であるように、オーディオ/音楽ストレージ202は他にもデータベースや、その他の機能を備えることが可能であり、またオーディオ処理装置100又は処理装置160の一部を構成しうる。メインシステムモジュール200は、オーディオ/音楽ストレージ202と、オーディオ処理装置100における他の構成要素と、モジュール204〜212との間の中央インタフェースとしての機能を果たす。本発明の各種実施形態においてこのメインシステムモジュール200はプロセッサ106やその他の構成要素からシステムバス110を介してオーディオ/ビデオデータの処理に関する入力を受信する。メインシステムモジュール200はこの入力を解釈し、モジュール204〜212のうち適正なモジュールを起動させる。またこのシステムモジュール200はこの入力に関連するデータをメモリ104の処理ストレージ202から取り出し、適正なモジュール204〜212に転送する。これに対しそれぞれのモジュール204〜212はプロセッサ(典型的にはプロセッサ106)を用いてこのデータを処理し、その結果をシステムモジュール200に返信する。続いてこの結果が出力系108に転送され、紙ドキュメント170又は電子データ180として出力されうる。
ある実施形態によると、システムモジュール200は、所望の結果を得るためにはどの一連ステップをどの順序で実施すべきかを把握するための論理を含む。例えばシステムモジュール200はシステムバス110から所定の事象が起きた場合に実行すべき所定の一連動作を規定するインストラクションのセットを受信しうる。例えばシステムモジュール200はシステムバス110から携帯電話カードにある楽曲の最初の2小節を記憶してこの楽曲が呼び出し音としてこの楽曲のMP3ファイルに基づいて再生されるようにするインストラクションを受信しうる。システムモジュール200はこれらのインストラクションを解析して、この楽曲の最初の2小節を分離するためにはこのファイルはまずMP3ファイルからMIDIファイルへ変換し、次にこれをスコア化し、そしてMIDIファイルの最初の2小節を解析してから携帯電話カードにこれを出力する手順が要されることを把握する。そしてシステムモジュール200は以下に説明する各種モジュールに対してこれらのステップを実施するようコマンドを送信し、ファイルの各種バージョンをオーディオ/音楽ストレージ202に記憶する。
変換モジュール204はバス110によってシステムモジュール200及びオーディオ/音楽ストレージ202に結合される。システムモジュール200は、適確な入力を受信すると、変換モジュール204に対してオーディオ/音楽ストレージ202に記憶される第1形式のオーディオ/音楽データを第2形式のファイルに変換する動作を開始させるための信号を送る。変換モジュール204は、例えばMIDIファイル、WAV、MP3や、その他各種デジタルオーディオ形式などの電子形式間の変換を容易にする。なお、同業者には自明であるように、このような変換を容易にするためには各種一般ソフト・パッケージを変更しあるいは変更なしで用いることが可能である。このソフトの例としては、http://www.perfectdownloads.com/audio-mp3/other/download-solo-explorer.htmでダウンロード可能なフレーウェア「Solo Explorer」、http://www.akoff.com/で入手可能なAkoff社の製品「Music Composer」(WAVからMIDIへの変換ソフト)、ノースカロライナ州シャーロットのLead Technologies社の各種製品(WAVからウィンドウズ(登録商標)メディア又はMP3への変換ソフト)、カリフォルニア州クパチーノのアップルコンピュータ社の製品ITunes(登録商標)(MIDIからMP3/WAVへの変換ソフト)などがあげられる。なお、変換モジュール204はシステムバス110を介してこれら及びその他のソフトモジュールに対して所望の変換処理を実行するよう指示し、この処理結果をオーディオ/音楽ストレージ202に記憶するよう指示するような各種信号を送信しうる。また、変換モジュール204は、デジタルからアナログまたはアナログからデジタルへの変換など特定の変換動作を実現するためにA/D変換器などのハードウェアに結合されうる。
また別の実施形態によると、変換モジュール204は、音楽データの処理を実行する前の段階において、アナログ形式で受信された音楽ファイルをデジタル形式に変換する作業を容易にすることができる。変換モジュール204はこれを例えばアナログ/デジタル変換器を用いて実現する。この場合変換モジュール204はシステムバス110を介してこのアナログ/デジタル変換器に結合されていて、この変換を実現するためにこの変換器を起動させる。ある実施形態によると、ここで得られたデジタルファイルはたとえば更なる処理を施されるためにシステムバス110を介してメモリ104に戻されうる。また別の実子形態によると、変換モジュール204はデジタルデータをオーディオファイルに「変換」することができる。例えば、ある実施形態によると、オーディオ処理装置100はポストスクリプトファイルの形式で記憶された音楽スコアをバス110から受信しうる。そこで例えば光学認識機能を有する変換モジュール204はこの受信ファイルを解析し、音符情報を取得し、この音符情報に基づいてMIDI推定ファイルを作成しうる。なお、これらの処理ステップを実行するために例えばカリフォルニア州サンタローザのHohner Media社によって販売されるMusicScan(スコアからMIDIへの変換ソフト)などの一般ソフトを適用することが可能である。その後このMIDIファイルは上述の技術を用いてWAVファイルやMP3ファイルに変換されうる。また、別の実施形態によると、システムモジュール200によって再生モジュール(非図示)が起動されることも可能である。これによって再生モジュールはオーディオ/音楽ストレージ202からMIDIを取り出し、これをシステムモジュール200に渡す。これに応じてシステムモジュール200はこのファイルをオーディオ処理装置100の再生装置(非図示)に出力する。
スコア化/転記モジュール208はバス110によってシステムモジュール200及びオーディオ/音楽ストレージ202に結合される。ある実施形態によると、スコア化/転記はシステムモジュール200がオーディオ/音楽ストレージ202に記憶されるデジタル音楽ファイルをスコア化するかあるいは発話ファイルを転記するコマンドを受信した場合に起動される。例えばスコア化/転記モジュール208はオーディオ/音楽ストレージ202に記憶される音楽ファイルにアクセスし、この音楽ファイルの音符情報を含むスコアからなるポストスクリプトファイルなどのデジタルファイルを作成することができる。こうして得られたポストスクリプトファイルはオーディオ/音楽ストレージ202に記憶されることが可能である。また、スコア化/転記モジュール208はデジタル録音されてオーディオ/音楽ストレージ202に記憶されたオーディオスピーチ(発話)を転記して発話のスクリプトを含むファイルを作成することができる。これらの出力はオーディオ/音楽ストレージ202に記憶されるか、メモリ104におけるその他の場所に記憶されうるか、あるいはシステムバス110を介してオーディオ処理装置100の内部または外部に送信されることも可能である。なお、音楽ファイルをスコアへ変換するためには様々な一般ソフト・パッケージを適用することが可能である。この例としては、ワシントン州ベルビューのNotation Software社によるMIDIからへの変換ソフト、英国のSeventh String Software社によるオーディオ記録からスコアへの変換ソフトなどがある。なお、スコア出力はユーザの要望などに応じてカストマイズされることが可能であり、例えば音、テンポ、フレーズや、その他のパラメータの変更などをスコア化ソフトに自動的に実行させることが可能である。同様に転記モジュールは生または録音された発話を取り込み、この発話ファイルに発話認識技術(例えばマサチューセッツ州ピーボディのScanSoft社によるDragon Naturally Speaking 7や、ニュージャージー州ホワイトプレーンズのIBM社によるViaVoice(登録商標)など)を適用して、この発話のテキスト表示を作成することができる。
インデックス化/マッピング・モジュール210はバス110によってシステムモジュール200及びオーディオ/音楽ストレージ202に結合される。ある実施形態によると、システムモジュール200は適確な入力を受信すると、インデックス化/マッピング・モジュール210に対してオーディオ/音楽ファイルをセグメントにインデックス化するようなコマンド信号を送信する。このコマンドを実行するためにインデックス化/マッピング・モジュール210はシステムバス110を介してオーディオ/音楽ストレージ202に記憶されるこのオーディオ/音楽ファイルをアクセスし、このファイルに含まれるオーディオデータを解析し、これを音楽のライン、バー、スタンザ、小節、曲、ディスクリート音、話し手による発話、またはその他のオーディオセグメントに分割しうる。なお、音楽ファイルにおける各種区切りはこの音楽のメロディーフレーズ、ポーズや、その他のオーディオキューに基づいてインデックス化/マッピング・モジュール210によって検出されうる。ある実施形態によると、インデックス化/マッピング・モジュール210はインデックス情報を臆するための新たなファイルを作成し、この新たなファイルをバス110を介してオーディオ/音楽ストレージ202に送信しここに記憶する。また別の実施形態によると、インデックス化/マッピング・モジュール210はシステムモジュール200から送信されるデジタルコマンドに反応して、オーディオ/音楽ストレージ202に記憶されるMP3ファイルにアクセスしてこのMP3ファイルの波形記録を作成する。この波形記録は例えばグラフィック形式の電子ドキュメントとしてメモリ104に記憶されることが可能であり、これは後に出力系108に送信されて紙出力として印刷されうる。なお、オーディオのセグメント化及びオーディオ・マッピング技術についての詳細は上記で紹介された米国特許出願10/814,944号“Multimedia Print Driver Dialog Interfaces” Hull et. al(2004年3月30日出願)に記載される。
マッチング・モジュール212はバス110によってシステムモジュール200及びオーディオ/音楽ストレージ202に結合される。ある実施形態によると、システムモジュール200は適確な入力を受信すると、マッチング・モジュール212に対して予め用意された音楽ファイルのなかからユーザによって提供されオーディオ/音楽ストレージ202に記憶されたオーディオデータにもっとも近い音楽ファイルを識別するコマンド信号を送信する。このマッチングの対象とされるオーディオデータは例えばメロディーの一部などであってよい。このオーディオデータは例えばユーザがデジタルオーディオレーコーダを用いてラジオに流れる曲の一部を録音するか、あるいはユーザが曲のリフを思い起こしてMIDIファイルを作成することなどによって得られたものに相当しうる。ある実施形態によると、マッチング・モジュール212はこのオーディオデータを既に存在するレコーディングやスコアと比較して、このオーディオデータと一致するファイルを検索する。なお、マッチング・モジュール212は、ライセンスされたレコーディングへのアクセスを有するメロディー・マッチング・ソフト、例えばカリフォルニア州エメリービルのGracenote社によるGraceNote CDDBやGraceNote MusicIDなどを適用することができる。これらのレコーディングは好ましくはネットワークに接続されたサーバー(非図示)におけるデータベースに記憶される。これらのれーコーディングにアクセスするっために、マッチング・モジュール212は、例えばイーサーネット接続などの信号線を介してこのサーバーからデータを取得するようにシステムモジュール200に対してリクエストを送信する。メロディー・マッチング・ソフトは受信したデータに基づいてデータベースに記憶されるレコーディングのうちどれが最もこのオーディオデータに近似するかを判断する。ある実施形態によると、一致するレコーディングが検出された場合マッチング・モジュール212はシステムモジュール200に対してこの一致するレコーディングを識別するメッセージをユーザへ出力してユーザがこのレコーディングのコピーの入手を希望するか問い合わせるように指示する信号を送信する。このメッセージは例えばシステムバス110を介して送信され、オーディオ処理装置100の出力インタフェースに表示されることが可能である。ある実施形態によると、ユーザがこのレコーディングのコピーの入手を希望する意思を示した場合、ユーザがこのレコーディングを入手するための支払いを行うための金銭取引が立ち上げられる。
図3はオーディオ処理装置100において適用されうるプリント・ダイアログ・ボックス300を示す。ユーザはこのプリント・ダイアログ・ボックス300のフィールドに情報を入力することでレイアウトやセグメント状態などに関する各種オプションを指定することができる。図示されるプリント・ダイアログ・ボックス300は例えばユーザがアプリケーションからプリントオプションを選択するたびにオーディオ処理装置100に結合されるグラフィックディスプレイ表示されうる。プリント・ダイアログ・ボックス300はプリンタフィールド304など一般のプリント・ダイアログ・ボックスにおいてもみられるフィールドを有することが可能であるが、プリント・ダイアログ・ボックス300はこれ以外にも出力オプション・フィールド314、アドバンスオプション・フィールド310及びプレビュー・フィールド312など一般のプリント・ダイアログ・ボックスにはないフィールドを有する。一般のプリント・ダイアログ・ボックスと同様にプリント・ダイアログ・ボックス300はその上部に印刷されるオーディオ/音楽ファイルの名称(Vesoul.mp3)が含まれる。プリンタフィールド304では、ユーザは印刷ジョブを実行するプリンタを選択し、またその他の印刷ジョブのプロパティや、画像又はファイルとして印刷するか、印刷の順序などに関するオプションを設定することができる。また、プリンタフィールド304は選択されたプリンタの状態、種類、設置場所などを示す。
出力オプション・フィールド314では、ユーザはオーディオ/音楽ファイルの出力形式や出力媒体などに関するオプションを設定することができる。入力データ形式フィールド350にはユーザが印刷しようとしているファイルの形式が自動的に表示される(なお、ここではこのファイル形式が認識されうることが前提となる)。図3の入力データ形式フィールド350では印刷ファイルがMP3形式のファイルであることが示される。次にユーザは出力データ形式フィールド352及び356において2つまでの出力データ形式を指定することができる。なお、本発明のほかの実施形態では2種類以上の出力形式を指定することが可能である。また各出力データ形式フィールド352及び356にはメニュー(非図示)が対応付けられていて、ユーザはこのメニューに示されるMP3,WAV,MIDI、スコア、転記などを含む各種オーディオ及び音楽形式のなかから形式を指定することができる。なお第2の出力データ形式フィールド356は「なし」をその選択オプションの1つとして含み、ユーザは2種類目のデータ形式での出力を望まない場合このオプションを選択することができる。
図3に示すように、この例ではユーザはMIDIファイルと波形タイムラインとの2つの形式を選択している。また、出力オプション・フィールド314でユーザは印刷出力先フィールド354及び358を用いてそれぞれの出力が出力される媒体を指定することができる。具体的には、ユーザはプルダウンメニューを用いて、ドライブに記憶されるメモリ、印刷トレー、再生装置、アーカイブや、その他にもオーディオ処理装置100に接続された様々な出力先を含む選択オプションの中から出力先媒体を選択することができる。ある実施形態によると、ユーザはEメールアドレスに出力が送信されることを希望する医師を示すことができる。このような選択がなされた場合、Eメール・インタフェースが立ち上げられ、これによりユーザは送信者及び受信者のEメールアドレスを指定することができ、さらにこの出力の添付先となるテキストメッセージが作成される。図3に示されるプリント・ダイアログ・ボックス300に入力されるユーザの選択によると、入力ファイルをMIDI形式で表したファイルは、オーディオ処理装置100の「D://drive」に保持されるCDに出力されるように示され、入力ファイルの波形表示は紙ドキュメントに印刷されてオーディオ処理装置100の「印刷トレー2」に排紙されるように示される。またプリント・ダイアログ・ボックス300はインデックス形式フィールド360及び時間記フィールド362を含む。インデックス形式フィールド360でユーザは出力のインデックス形式を指定することができ、図3の例ではユーザはバーコード・インデックするウォ選択している。また、図3においてユーザは時間記フィールド362で出力に時間記が付与されることを希望しないことを示している。
アドバンスオプション・フィールド310においてユーザはオーディオデータの形式やレイアウトに特有のオプションを選択することができる。この例では、ユーザはオーディオデータに適用するセグメント形式を選択する。具体的にはセグメント形式フィールド316の矢印をクリックすることにより、選択可能なセグメント形式を示すプルダウンメニューが表示され、ユーザはここから所望のセグメント形式を選択することができる。セグメント形式の例としては、話し手、メロディー一致、小節、バー、スタンザ、ディスクリート音などによるセグメント化が挙げられるが、これ以外のセグメント形式を提供することも可能である。図3ではユーザはセグメント形式を選択していなく、よってセグメント形式フィールド316は「なし」と示される。なお、各セグメント形式にはそれぞれのセグメントで検出される事象についての確実性レベルが対応付けられうる。例えばユーザがオーディオ処理装置100に対してオーディオファイルをスタンザによってセグメント化することを指示した場合、識別された各スタンザにはそれぞれについての確実性レベルが付与され、この確実性レベルは対応するスタンザが正確に検出された確率を示す。アドバンスオプション・フィールド310においてユーザは特定のセグメント化形式における確実性レベルの閾値を設定・調整することができる。
ある実施形態によると、ユーザはさらに作成されるデータ表示のレイアウトに関するオプションを設定することができる。この例では、ユーザは配当フィールド320に波形タイムラインを表示する際に使う用紙の枚数を設定する。また、ユーザは1枚の用紙に表示されるタイムラインの数を選択することができる。また、ユーザは方位フィールド324においてデータ出力におけるタイムライン表示の方位(縦又は横方向)を選択することができる。例えば、ユーザは1つのタイムラインを1枚の用紙に横方向で表示するように設定することができ、この結果入力オーディオデータに対応するオーディオ波形タイムラインの全体が1枚の用紙に表示されることとなる。また別の例では、ユーザはオーディオ波形タイムラインを4つの部分に分割してこれらの部分を2枚の用紙の上に縦に表示するように設定することができる(すなわち1枚の用紙に2つのタイムラインを表示する)。
プレビュー・フィールド312はユーザのオプション設定に基づいて印刷トレー2に出力される波形タイムラインのプレビューを示す。また別の実施形態によると、2つの異なる出力に対応する2つのプレビュー・フィールドを備えることも可能である。なお、
MP3ファイルなどの電子出力の場合は、例えばCDのクリップアート表示などこのファイルが出力される記憶媒体の一般的な象徴が示されうる。図3では、プレビュー・フィールド312はユーザの設定どおり、1枚の用紙につき3つのタイムラインを表示し、また印刷されるファイルの名称(Vesoul.mp3)を表示する。また、ユーザのバーコード・インデックスの選択にしたがい、この出力プレビューは音楽ファイルへの動的リンクであるバーコード364リファレンスを含み、このリンクによってユーザは後にファイルにアクセスすることができる。
図3の実施形態によると、上述以外にも、更新ボタン326、ページ設定ボタン328、OKボタン330、キャンセルボタン332などを含む各種ボタンが提示される。ユーザが更新ボタン326を選択すると、プレビュー・フィールド312に示される℃ky面とのイメージが更新され、ユーザがプリント・ダイアログ・ボックス300において加えた新たな変更が更新されたイメージに反映される。ユーザがOKボタンを選択した場合、現在ユーザによって選択されているオプション設定が出力系に送信されファイルが出力されるユーザがキャンセルボタン332を選択した場合、設定作業がどの段階にあったかに関わらず印刷ジョブの生成は終了し、プリント・ダイアログ・ボックス300は消滅する。
なお、本発明の実施形態では図2に示されるメモリ104のモジュールを組み合わせてオーディオ/音楽データを処理することが可能である。図4は本発明の好適な実施形態によるオーディオ処理装置100がモジュール200〜212をいくつか適用して図5に示されるような紙出力を作成するために実行する処理ステップを示すフローチャートである。ある実施形態によると、図4に示される処理ステップは、図2に示されるメモリ104を備える図1のオーディオ処理装置100によって実行されうる。しかし以下に示されるようなメモリを有する他の形態のオーディオ処理装置100によってこれらの処理ステップを実現することも可能である。図4の処理は、オーディオ処理装置100はオーディオファイルを受信する(410)ことによって開始する。ここではユーザがネットワークに接続されたPCなどからイーサーネット接続などを介してこのファイルをオーディオ処理装置100へ送信することができる。そしてこのファイルはオーディオ/音楽ストレージ202に記憶される。また、このファイルを送信すると共にユーザはこのオーディオファイルに基づいてインデックス化されたスコアを作成するインストラクションを、信号線を介してオーディオ処理装置100に送信する。このインストラクションはバス110を介してシステムモジュール200にルーチングされる。システムモジュール200はこのインストラクションを受信すると、これを実行するための各種処理ステップを開始させる。
まず、システムモジュール200は受信されたファイルがMIDIファイルであるか否かを判断する(420)。ここでこのファイルがMIDIファイルではないと判断された場合、システムモジュール200は検出モジュール(非図示)に補助されて、このファイルの形式を判別する(422)。この例ではこのファイルがMP3形式のオーディオファイルであることが判別される。そしてシステムモジュール200はシステムバス110を介して変換モジュール204に対してこのファイルをMP3からMIDIに変換する(424)コマンドを送信する。変換モジュール204はシステムバス110を介してオーディオ/音楽ストレージ202に記憶されるこのファイルをアクセスし、このオーディオファイルに近似するMIDIファイルを作成する。そして変換モジュール204はこのMIDIファイルをシステムモジュール200に送信し、これに応じてシステムモジュール200はこのMIDIファイルをオーディオ/音楽ストレージ202に記憶する。受信したオーディオファイルがMIDIファイルであるか、あるいはMIDIファイルに変換されている場合システムモジュール200はユーザインタフェース・モジュール(非図示)を起動し、これに対してユーザによるスコアのオプション選択を促す(432)ように指示する。ユーザインタフェースはシステムバス110を介してデータ信号を送信することにより図3に示されるプリント・ダイアログ・ボックス300とどうようのプリント・ダイアログ・ボックスをシステムモジュール200に供給し、これをユーザのPCに出力されるようにする。このダイアログ・ボックス432の表示に応じてユーザは出力データ形式のオプションを設定し、すなわちこの例ではスコア及び小節によってインデックス化されたMIDIファイルの選択し、そしてさらに楽譜の線の数、音符のスタイル、バーコードの出現頻度、バーコードの形式などのパラメータの設定を伴う出力提示形式(例えば紙への印刷やCDへの記録など)の設定を行う。システムモジュール200はこのスコアについてのオプション選択を受信し(430)、これらをオーディオ/音楽ストレージ202に記憶する。
次にシステムモジュール200はスコア化/転記モジュール208のスコア化処理を開始させる。まずスコア化/転記モジュール208はスコアを記憶するためのファイルをセットアップし、このファイルに番号などのスコア識別子を割り当てる(440)。次にスコア化/転記モジュール208はこのMIDIファイルの変換を実行し、スコアを作成する(450)。そしてスコア化/転記モジュール208はこの変換データをスコアファイルに記憶して、このスコアファイルをユーザによって入力されたオプション選択に応じてフォーマットし、所望の形式で表す。その後スコア化/転記モジュール208はスコアが完成したことをシステムモジュール200に通知する。続いてシステムモジュール200はこのスコアファイルを受信し、これをユーザによって提供されるスコアを紙ドキュメントに印刷する出力指示と共に出力系108に送信する。よってこのドキュメントが印刷される(460)。これと同時にシステムモジュール200は第2の出力の作成処理を開始させる。すなわちシステムモジュール200はインデックス化/マッピング・モジュール210に対してこのスコアに応じてMIDIファイルの小節を基準とするインデックスを作成する(470)指示を送信する。したがってインデックス化/マッピング・モジュール210はシステムバス110を介してオーディオ/音楽ストレージ202に記憶されるこのMIDIファイル及びこのファイルのスコアにアクセスする。
そしてインデックス化/マッピング・モジュール210はスコアに基づき各音楽小節の始まりを判別し、このMIDIファイルにおける各小節の始まり及び終わりをリファレンスする小節インデックスを作成する(470)。また、システムモジュール200からの指示に応じてインデックス化/マッピング・モジュール210は、3つの小節セグメントごとにバーコードポインタなどの識別子を割り当てる。そしてインデックス化/マッピング・モジュール210はオリジナルのスコアをアクセスし、ユーザによって指定される形式に従って、バーコードをスコアにおける適正な場所にマッピングする(480)。なお、インデックス化/マッピング・モジュール210は例えば“A rule-based system for dense-map name placement,”J.S. Doerschler, H. Freeman; Communications of the ACM; v.. 35 no. 1, pp. 68-79; 1992に示されるような配置アルゴリズムを用いてバーコードの適正な配置場所を判別しうる。
図5は上述の処理の結果得られるファイルの一例としてのポストスクリプトファイルを示す。この図に示されるように、この音楽ファイルのメロディーは2又は3小節からなる4つのセグメント510に分割される。このスコアからこの楽曲がト長調であることがわかり、またこのスコアには各セグメントの始まり及び終わりに動的ポインタがバーコード520によってリファレンスされる。これらのバーコードはメロディーを含むMIDIファイルにおける特定箇所を指す。またインデックス化/マッピング・モジュール210によってさらにMIDIファイル全体を識別するための2次元バーコード530が作成されていて、これがファイルのリファレンスを容易にするためにスコアの下部に備えられる。ある実施形態によると、ユーザが後にこのメロディーの一部を聞くことを望んだ場合、このポストスクリプトファイルのコピーを印刷し、解読装置(2次元バーコードスキャナなど)を用いてMIDIデータにアクセスし、このファイルの選択された箇所を聞くことができる。
図4に戻って、インデックスされたスコアが作成された後、インデックス化/マッピング・モジュール210はシステムモジュール200に対してファイル名及びインデックス付のスコアを含むメッセージを送信する。そしてシステムモジュール200はこのインデックス付のスコアを出力系108に送信し、このMIDIファイルに動的にリンクされるインデックス付スコアをオーディオ処理装置100のドライブに格納される空のCDに記憶する(490)ように指示する。またこれらの出力を作成するために用いられたMP3ファイルやスコアの一部などを含む各種ファイルはさらに後のある時点においてメモリ104から消去されるようにマークされる。また別の実施形態によると、バーコード520aによってリファレンスされるMIDIファイルの第1小節510aが抽出され、オーディオ/音楽ストレージ202に記憶される。そして出力系108がこの短いセグメントをメモリカードに出力する。このメモリカードは携帯電話などに挿入されてここに記憶されるセグメントが携帯電話の呼び出し音として適用されうる。また別の実施形態によると、オーディオ処理装置100はスコアとMIDIファイルとの2つのファイルを直接受信し、図4の処理ステップの省略されたステップ410、470,480、及び490を含む処理ステップを実行することができる。
図6はオーディオ処理装置100プリンタによって記憶されたスコアファイルの一部をアクセス装置が取り出して読み取る動作を示すフローチャートである。例えばCDは音楽クリップのアーカイブを格納し、またこれら音楽クリップに対応するバーコード・インデックスをイメージファイルに記憶して格納する。アクセス装置(非図示)は例えば信号線によってバーコード読取器に接続されるCDドライブを有する標準のPCなどであってよい。CDに記憶されるクリップにアクセスするために、まずアクセス装置はPCのCDドライブに保持されるCDからバーコード・インデックスのイメージをアクセスする(602)。なお、ユーザは操作を容易にするためにこのバーコード・インデックスのイメージを信号線によってPCに接続される一般のプリンタで印刷することもできる。次にユーザは目的のバーコードを探し出す(604)。そしてユーザはバーコード読取器を用いてこのバーコードを読み取り、ユーザのアクセスしたいファイル部分に対応する特定のスコア番号及び線番号を提示させる。次に適正なスコア番号のスコア(例えばremap_ScoreNo.xml)がロードし(606)、所望のクリップに対応する線番号(例えばremap_LineNo.xml)を用いてCDにおけるこの所望の線及びクリップの場所を探し当てる。これらの線及びクリップの場所が把握されると、コンピュータが該当するレコーディングをスキャンされたバーコードに最も近い線の開始時点から再生する(610)。
なお、上述の実施形態は本発明の理解を容易にするために示される例に過ぎず、本発明の範囲を限定するものではない。同業者には自明であるように本発明の範囲をいつ出す刷ることなくこれらの実施形態から様々な変形及び変更を構想することが可能である。したがって本発明の範囲は上述の好適な実施形態の説明には限定されることなく、本発明の特許請求範囲によってのみ規定されうる。
なお、本願は、米国仮特許出願整理番号60/506,303“Printer Including One or More Specialized Hardware Devices”(2003年9月25日出願)及び米国特許仮出願整理番号60/506,302“Printer Including Interface and Specialized Information Processing Capabilities”(2003年9月25日出願)に基づく出願であってこれら米国出願による優先権を主張する。なお、ここにおいてこれら米国出願の内容を参照により本願に挿入する。
また、本願は以下の同時係属出願の一部継続出願であって、ここにおいて以下の米国特許出願の内容を参照により本願に挿入する。
・米国特許出願整理番号10/001,895“(Video Paper)Paper-based Interface for Multimedia Information”(2001年11月19日出願)
・米国特許出願整理番号10/001,849“(Video Paper)Techniques for Annotating Multimedia Information”(2001年11月19日出願)
・米国特許出願整理番号10/001,893“(Video Paper)Techniques for Generating a Coversheet for paper-based Interface for Multimedia Information”(2001年11月19日出願)
・米国特許出願整理番号10/001,894“(Video Paper)Techniques for Retrieving Multimedia Information Using a Paper-Based Interface”(2001年11月19日出願)
・米国特許出願整理番号10/001,891“(Video Paper)Paper-based Interface for Multimedia Information Stored by Multiple Multimedia Documents”(2001年11月19日出願)
・米国特許出願整理番号10/175,540“(Video Paper)Device for Generating a Multimedia Paper Document”(2002年6月18日出願)
・米国特許出願整理番号10/645,821“(Video Paper)Paper-Based Interface for Specifying Ranges CIP”(2003年8月20日出願)
また、本願はここにおいて参照によりその内容が挿入される以下の米国特許出願に関連する出願である。
・米国特許出願10/814,931号“Printer Having Embedded Functionality for Printing Time-Based Media”Hart et. al(2004年3月30日出願)
・米国特許出願10/814,948号“Networked Printing System Having Embedded Functionality for Printing Time-Based Media”Hart et. al(2004年3月30日出願)
・米国特許出願10/814,944号“Multimedia Print Driver Dialog Interfaces”Hull et. al(2004年3月30日出願)
本発明の一実施形態によるオーディオ処理装置の構成を示すブロック図である。 図1のオーディオ処理装置のメモリの構成を示すブロック図である。 本発明の一実施形態によるオーディオ処理装置において適用されうるプリント・ダイアログ・インタフェースの一例を示す図である。 本発明の好適な実施形態によるオーディオ処理装置の処理ステップを示すフローチャートである。 本発明の一実施形態によるオーディオ処理装置によって出力されるドキュメントの一例を示す図である。 本発明の好適な実施形態によるオーディオ処理装置に記憶されるファイルを取り出す処理ステップを示すフローチャートである。
符号の説明
100 オーディオ処理装置
102 オーディオ/音楽インタフェース
104 メモリ
106 プロセッサ
108 出力系
110 バス
150 オーディオ/音楽データ
160 処理装置
170 紙ドキュメント
180 電子データ
190 処理コマンド
200 システムモジュール
202 オーディオ/音楽ストレージ
204 変換モジュール
208 スコア化/転記モジュール
210 インデックス化/マッピング・モジュール
212 マッチング・モジュール

Claims (42)

  1. 第1形式のオーディオ/音楽データをオーディオ処理装置において受信し、
    前記オーディオ/音楽データを処理し、
    処理された紙ベース形式及び/又は電子形式のオーディオ/音楽データをオーディオ処理装置において出力するステップを含むことを特徴とする方法。
  2. 前記オーディオ/音楽データは音楽データに相当することを特徴とする請求項1記載の方法。
  3. 前記音楽データの音楽コンテンツをファイルにマッピングするステップをさらに含むことを特徴とする請求項2記載の方法。
  4. 前記音楽データのメロディーを複数のメロディーと比較し、
    前記音楽データのメロディーを前記複数のメロディーのうちの1つと一致させるステップをさらに含むことを特徴とする請求項2記載の方法。
  5. 前記音楽データを音楽セグメントに解析するステップをさらに含むことを特徴とする請求項2記載の方法。
  6. 前記音楽セグメントは楽曲、歌曲、スタンザ、動き、小節、コーラス、及びリフのうちのいずれか1つから構成されることを特徴とする請求項5記載の方法。
  7. 前記音楽データのセグメントに識別子を割り当てるステップをさらに含むことを特徴とする請求項2記載の方法。
  8. 前記識別子は媒体へのポインタを構成することを特徴とする請求項7記載の方法。
  9. プリントダイアログ、PDLコメント、プリントドライバ、及び前記オーディオ処理装置にネットワーク接続されるグラフィック・ユーザ・インタフェースのうちのいずれか1つによって供給されるコマンドに応じて前記オーディオ/音楽データを処理するステップをさらに含むことを特徴とする請求項1記載の方法。
  10. 前記処理されたオーディオ/音楽データをアーカイブファイルに記憶し、
    前記アーカイブファイルに記憶されたオーディオ/音楽データファイルにインデックスを付与するステップステップをさらに含むことを特徴とする請求項1記載の方法。
  11. 前記インデックスを付与するステップは音楽セグメンにバーコードを割り当てるステップを構成することを特徴とする請求項10記載の方法。
  12. 前記オーディオ/音楽データはオーディオ発話を含むことを特徴とする請求項1記載の方法。
  13. 前記発話を認識するステップをさらに含むことを特徴とする請求項12記載の方法。
  14. 前記処理されたオーディオ/音楽データは紙ドキュメントに印刷可能なファイルを構成することを特徴とする請求項1記載の方法。
  15. 前記処理されたオーディオ/音楽データは音楽スコアを構成することを特徴とする請求項14記載の方法。
  16. 前記処理されたオーディオ/音楽データを出力するステップは、前記オーディオ/音楽データを再生装置において再生するステップを構成することを特徴とする請求項1記載の方法。
  17. 前記処理されたオーディオ/音楽データを出力するステップは、前記処理されたオーディオ/音楽データのファイルを記憶媒体に記憶するステップを構成することを特徴とする請求項1記載の方法。
  18. 前記処理されたオーディオ/音楽データを出力するステップは、前記処理されたオーディオ/音楽データのファイルをネットワーク上に送信するステップを構成することを特徴とする請求項1記載の方法。
  19. 前記処理されたオーディオ/音楽データのオーディオコンテンツに基づいて前記処理されたオーディオ/音楽データにインデックスを付与するステップをさらに含むことを特徴とする請求項1記載の方法。
  20. 前記オーディオ/音楽データを処理するステップは前記オーディオ処理装置以外の装置によって実行されることを特徴とする請求項1記載の方法。
  21. 音楽スコア及び音楽ファイルをオーディオ処理装置において受信し、
    前記音楽スコアに基づいて前記音楽ファイルのコンテンツにインデックスを付与するステップを含む方法。
  22. 音楽ファイルを印刷装置において受信し、
    前記音楽ファイルに基づいて音楽スコアを作成し、
    前記音楽スコアに基づいて前記音楽ファイルのコンテンツにインデックスを付与するステップを含むことを特徴とする方法。
  23. 第1形式のオーディオデータをプリンタにおいて受信し、
    前記オーディオデータを処理し、
    前記処理され第2形式のオーディオデータを出力するステップを含むことを特徴とする方法。
  24. 前記第1形式のオーディオデータは音楽データを構成し、前記方法は
    前記音楽データの音楽コンテンツをマッピングして第2形式のファイルを作成するステップを更に含むことを特徴とする請求項23記載の方法。
  25. 前記第1形式のオーディオデータは音楽データを構成し、前記方法は、
    前記音楽データのメロディーと複数のメロディーとを比較し、
    前記音楽データのメロディーを前記複数のメロディーのうちの1つと一致させるステップを更に含むことを特徴とする請求項23記載の方法。
  26. 前記第1形式のオーディオデータは音楽テータを構成し、前記方法は、
    前記音楽データを音楽セグメントに解析するステップを含むことを特徴とする請求項23記載の方法。
  27. 前記オーディオデータのオーディオコンテンツに基づいて前記オーディオデータにインデックスを付与するステップを更に含むことを特徴とする請求項23記載の方法。
  28. 前記オーディオデータを処理するステップは前記オーディオ処理装置以外の装置によって実行されることを特徴とする請求項23記載の方法。
  29. 処理されたオーディオ/音楽ファイルを出力する装置であって、
    第1形式のオーディオ/音楽データを受信するインタフェース、
    前記オーディオ/音楽データを処理するプロセッサ、及び
    前記処理されたオーディオ/音楽データを出力する出力系から構成されることを特徴とする装置。
  30. 前記出力系は、前記処理されたオーディオ/音楽データを印刷ドキュメント、アナログファイル、光学ディスク、携帯機器用メモリ、ネットワーク接続されたサーバー、及びネットワーク接続されたディスプレイのうちの少なくとも1つに出力するよう構成されることを特徴とする請求項29記載の装置。
  31. 前記出力系は、前記処理されたオーディオ/音楽データをデジタル形式で出力し、且つ印刷ドキュメント、アナログファイル、及びネットワーク接続されたディスプレイのうちの少なく1つに出力するように構成されることを特徴とする請求項29記載の装置。
  32. 前記出力系は電子データを出力することが可能なディスクドライブに相当することを特徴とする請求項29記載の装置。
  33. 前記出力系はオーディオ/音楽データを放送するトランスミッタに相当することを特徴とする請求項29記載の装置。
  34. 前記オーディオ/音楽データを第1形式から第2形式へ変換するための変換モジュールを更に含み、
    前記第2形式はデジタル形式であることを特徴とする請求項29記載の装置。
  35. 前記オーディオ/音楽データを第1形式から第3形式へ自動的に変換するための変換モジュールであって、前記オーディオ/音楽データを第1形式から第2形式へ、そして第2形式から第3形式へ変換するように構成される変換モジュール更に含むことを特徴とする請求項29記載の装置。
  36. 前記第2形式は電子スコア、WAV、MIDI、及びMP3のうちのいずれか1つに相当することを特徴とする請求項35記載の装置。
  37. 前記第1形式のオーディオ/音楽データはアナログ音楽ファイルを構成することを特徴とする請求項29記載の装置。
  38. オーディオ/音楽ファイルに基づいてスコアを作成するためのスコア化モジュールを更に含むことを特徴とする請求項29記載の装置。
  39. 前記第1形式のオーディオ/音楽データを出力形式のファイルに変換する際の変換経路を自動的に判別するためのコマンドモジュールを更に含み、
    前記変換経路は少なくとも前記第1形式のオーディオ/音楽データを第2形式へ変換し、前記第2形式から前記出力形式へ変換する過程を含むことを特徴とする請求項29記載の装置。
  40. 前記オーディオ/音楽データのオーディオコンテンツに基づいて前記オーディオ/音楽データをセグメントに解析するための解析モジュールを更に含むことを特徴とする請求項29記載の装置。
  41. 前記出力インタフェースはプリンタを含むことを特徴とする請求項29記載の装置。
  42. 音楽スコアをオーディオ処理装置において受信し、
    前記音楽スコアに基づいて音楽ファイルを作成し、
    前記音楽スコアに基づいて前記音楽ファイルのコンテンツにインデックスを付与するステップを含む方法。
JP2004278348A 2003-09-25 2004-09-24 音楽処理プリンタ Pending JP2005099805A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US50630203P 2003-09-25 2003-09-25
US50630303P 2003-09-25 2003-09-25
US10/813,849 US7314994B2 (en) 2001-11-19 2004-03-30 Music processing printer

Publications (1)

Publication Number Publication Date
JP2005099805A true JP2005099805A (ja) 2005-04-14

Family

ID=34468355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004278348A Pending JP2005099805A (ja) 2003-09-25 2004-09-24 音楽処理プリンタ

Country Status (1)

Country Link
JP (1) JP2005099805A (ja)

Similar Documents

Publication Publication Date Title
US7314994B2 (en) Music processing printer
US6385581B1 (en) System and method of providing emotive background sound to text
US10600397B2 (en) Musical score generator
US20060150803A1 (en) System and method for music score capture and synthesized audio performance with synchronized presentation
JP2010518459A (ja) 配布オーディオファイル編集用ウェブポータル
JP2003271143A (ja) 演奏音提供装置、通信端末、演奏音提供方法、プログラムおよび記録媒体
US6184454B1 (en) Apparatus and method for reproducing a sound with its original tone color from data in which tone color parameters and interval parameters are mixed
US20090173217A1 (en) Method and apparatus to automatically match keys between music being reproduced and music being performed and audio reproduction system employing the same
JP2007256618A (ja) 検索装置
JP5034599B2 (ja) 楽曲紹介文生成装置、ナレーション付加装置およびプログラム
JP4471640B2 (ja) 音楽再生装置
JP4327165B2 (ja) 楽曲再生装置
JP2005099805A (ja) 音楽処理プリンタ
KR102020341B1 (ko) 악보 구현 및 음원 재생 시스템 및 그 방법
JP4534967B2 (ja) 音色及び/又は効果設定装置並びにプログラム
JP4498221B2 (ja) カラオケ装置、およびプログラム
JP5394301B2 (ja) タイミング指定装置、曲再生装置、カラオケシステム及びタイミング指定方法
WO2022209557A1 (ja) 電子楽器、電子楽器の制御方法、及びプログラム
US20050234870A1 (en) Automatic association of audio data file with document data file
JP2001306070A (ja) シーケンスデータファイル処理装置及び方法並びに記憶媒体
JP7423164B2 (ja) カラオケ装置
US20240169962A1 (en) Audio data processing method and apparatus
KR102001314B1 (ko) 노래방 녹음 음질 개선 장치 및 방법
JP2008197501A (ja) 電子楽器及び演奏データ利用プログラム
JP6492754B2 (ja) 楽器及び楽器システム