JP2024513865A - 聴覚的に正しい形態を有する楽曲を自動的に生成するためのシステム及び方法 - Google Patents

聴覚的に正しい形態を有する楽曲を自動的に生成するためのシステム及び方法 Download PDF

Info

Publication number
JP2024513865A
JP2024513865A JP2023560980A JP2023560980A JP2024513865A JP 2024513865 A JP2024513865 A JP 2024513865A JP 2023560980 A JP2023560980 A JP 2023560980A JP 2023560980 A JP2023560980 A JP 2023560980A JP 2024513865 A JP2024513865 A JP 2024513865A
Authority
JP
Japan
Prior art keywords
musical
atomic
chord
texture
music
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023560980A
Other languages
English (en)
Inventor
ジョセフ マイケル ウィリアム リスケ
Original Assignee
ダーシ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US17/219,610 external-priority patent/US11978426B2/en
Priority claimed from GB2104696.6A external-priority patent/GB2605440A/en
Priority claimed from US17/707,923 external-priority patent/US11514877B2/en
Application filed by ダーシ リミテッド filed Critical ダーシ リミテッド
Publication of JP2024513865A publication Critical patent/JP2024513865A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • G10H1/0025Automatic or semi-automatic music composition, e.g. producing random music, applying rules from music theory or modifying a musical piece
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/061Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of musical phrases, isolation of musically relevant segments, e.g. musical thumbnail generation, or for temporal structure analysis of a musical piece, e.g. determination of the movement sequence of a musical work
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/101Music Composition or musical creation; Tools or processes therefor
    • G10H2210/125Medley, i.e. linking parts of different musical pieces in one single piece, e.g. sound collage, DJ mix
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/075Musical metadata derived from musical analysis or for use in electrophonic musical instruments
    • G10H2240/085Mood, i.e. generation, detection or selection of a particular emotional content or atmosphere in a musical piece

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

生成系作曲システムは、既存の音楽人工産物を、「原子形態」と呼ばれる構成要素に縮小する。これらの原子形態は、それぞれ様々な長さのものであり得、且つマルコフ連鎖を通して一緒にリンクする音楽的特性及び関連付けを有し得る。無数の新しい楽曲を提供するために、ヒューリスティックのセットは、連結された音楽セクション間の音楽テクスチャが、新しい楽曲のための供給及び定義されたブリーフィングナラティブに従うことを保証する一方、連続する連結された原子形態も、それらの音楽セクションのための音楽テクスチャのそれぞれの且つ識別された属性における類似性が、音楽形態の維持をサポートするように維持されることを確実にするように自動的に選択される。本開示の独立した態様は、メディア製品又はリアルタイムオーディオストリーム等の楽曲作品内において、コードスペーシングの決定及び制御が実施されて、新しい楽曲内で音楽的意味を維持することを更に保証する。更に、プリミティブヒューリスティックの構造化は、ピッチを維持し、且つキー変換を可能にするように機能する。システム及びその機能は、感情含意が指定され、且つ相互参照される原子形態から再現されることを可能にすることを通して信号解析及び音楽生成を提供する。

Description

本発明は、概して、オーディオ入力信号を[装置によって]信号処理して、その信号を基本構成データ要素に分割すること並びにこの信号と、マッピング及び/又はテクスチャ分類、構成データ要素間の許容される連結及び識別された数学関数からの後続の生成系出力の両方の識別を通して、異なる構造を有する異なる信号への連結された再組み立てを可能にする異なる内部構造特性及び異なる境界条件を有する多量の新しい信号とを再現するために必要な数学関数に関する。より詳細には、本発明は、特に音楽及び映画スクリプトにおける記述されたシーン等の感情的に記述的なナラティブと同調し、且つそれを反映するためにオリジナルの楽曲がどのように生成され得るかに関連して、既存のマテリアルの単なる再組合せではなく、オリジナルの生成系作曲をサポートするシステムに関する。排他的ではないが、より詳細には、本発明は、既存の調性(及び非調性)音楽において、様々な長さの原子形態を識別及びパーズするプロセスに関し、各原子形態は、複数の原子形態を自動的に連結して、少なくとも許容可能な音楽形態ではなく、良好な音楽形態を有する新しい楽曲にすることを可能にする境界条件及び楽曲性の両方を有する音楽コンテンツのコンテキスト的に最小の有意味なスニペット又は要素を定義する。
音楽は、科学によって検出不可能であるため、それ自体では存在しない。むしろ、音楽は、脳内の反応を提供する精神による観測を反映する。しかし、音楽、より具体的には音楽の鑑賞は、聴取者の精神において「緊張」及び「解放」が解決される際、「緊張」及び「解放」の概念を利用したサウンドの主観的に構築された行程の解釈と関連付けられた信号処理及び心のシミュレーションに帰着するという事実を反映した幾つかの深い意見がある。音楽が何を意味するか及びそれが西洋、種族又は東洋の構造に基づくかを問わず、音楽と関連付けられた望ましい生理学的効果が存在し、これらの効果は、感情的反応及び態度に更に影響を及ぼす。
音楽理論は、古典的には、曲中のパッセージ又は次の音若しくはコードの有効性を予測することができる科学的な意味での理論ではなく、むしろ音楽を命名し、カテゴリ化するために使用される民族心理学であった。
「よい」音楽 - 芸術的に認められている構造化された楽曲の意味において - は、音楽の行程内の緊張の高まり、それに続くその緊張の解放の両方を予測することが可能であることにより、精神(即ち関連する神経経路及び脳の中枢)が問題なくモデル化する音楽である。代替的に、これは、音楽のフレーズ又は音楽構造に反映される疑問を投げかけ、次にその疑問に答えて[疑問が呈された直後]、楽曲における音楽の行程である全体内の特定の部分を心情的に終えられるようにする楽曲として考えることができる。したがって、疑問は、音楽における緊張の高まり及び調性変化を視点に置き変える適切な音楽的応答に相関する構想概念の解放である。これらの意味論的用語がより科学的な意味で何を意味するかの読者の理解を促進するために、これらの用語についてのより詳細な定義を以下提供する。
上記を心理学的視点に置き換えると、「よい音楽」は、精神が、まず音楽の行程によって何が届けられると思うかを予測し、「私が正しかった」という予測が裏付けられたとき、脳の報酬系が報酬の完了をトリガーする、自己欲求を満足させる過程を通して認識される。理論による拘束を望むものではないが、報酬系は、刺激に対する報酬を与えるか又は刺激を補強することによって活性化される構造群を指すことが理解される。報酬刺激(よい音楽等)に曝されると、脳は、それに応答して、神経伝達物質であるドーパミンの放出を増大させる。報酬系と関連付けられた構造は、腹側被蓋領域(VTA)及び腹側線条体における側座核を含め、脳内の主要なドーパミン経路に沿って見られる。別の主要なドーパミン経路である中脳皮質経路は、VTAから大脳皮質に進み、これも報酬系の一部と見なされる。
逆に、「悪い音楽」、悪い楽曲又は「悪い形態」は、一見すると/表向きは意味のないランダムな(音楽)事象から何も脳が予測できず、したがって、脳が、刺激から生じた報酬で自らを褒めることができないことから生じる報酬/満足感の低下に対応する。
「よい」音楽の有効な自動生成を妨げてきた重要な依然として対処されていない問題は、「形態」である。問題は、ランダム性を生成しないプロセスを技術的にどのように実施するかであり、その技術的システムには、信号成分の一貫した評価を提供して、まず根源的に適合可能な音楽セクションを分類し、次いでそれらの音楽セクションを自動的に選択し、シームレスに一緒に連結して、新しい生成系楽曲を提供できるようにする技術的メカニズムが浸透している。これは、シンプルからほど遠い。
実際に、「形態」に関して、作曲家は「形態」を識別するために経験を要し、熟達した作曲家でも、多くの場合、進化する作曲家人生の後半になるまで許容できる形態を理解することができない。形態の理解を得ても、作曲家は、多くの場合、自らの全ての楽曲におけるテンプレートに戻る。テンプレートは、所望のナラティブが掛けられる予め構造化された構造を提供する。テンプレートは、例えば、理解されるように、ソナタ形態又はロンド形態及び他の形態であり得る。具体例として、任意の交響曲又は協奏曲の最初のムーブメントは、同一形態を共有するが、ナラティブが異なり、例えばA-B-A-B-C及びDであり、ここで、Aは、メジャー/ドミナント主音における最初の主題であり、Bは、メジャー/ドミナント主音とは対照的なキーセンターであり、A及びBは、一緒になって「提示部」を形成し、Cは、AとBとの対立であり(「展開部」としても知られる)、Dは、A及びBの「再現部」又は解決である。
「形態」は、「ナラティブ」とは対照的に[後者は、音楽的に表現することを意図するものであり、即ち激しさの膨張及びクライマックス等の感情アイコンのセットによって表現される開始点と終了点との間のストーリーである]、滑らかな遷移が構成要素のシンタックス間で達成されるように不連続性又はランダム性(音楽的意味において)を回避する音楽的に賢明な様式で音楽要素を一緒にリンクする構造である。「形態」をより明白に、しかしなお主観的に表現すると、「よい形態」とは、許容される楽曲における規約及び決まりに反映されたシンタックスであり得る一方、「悪い形態」とは、連続した音楽要素間に任意の音楽的意味をなす明らかな又は既知のリンクがなく、実際に、「悪い形態」[音楽における]は、サウンド信号を脳によって論理的に処理できないため、構造を伝達することができない。
問題は、任意の生成系作曲が、初期形態テンプレートによって策定することができるものと異なるナラティブに従うように適合される必要がある場合、人間ベースであるか又はマシンベースであるかを問わず、システムが、一貫して「良好な形態」、したがって脳の報酬中枢における比較的高レベルのドーパミンの生成を達成する生成系メカニズムを必死で実現しようとすることである。したがって、「よい形態」を達成できない場合、定義上、楽曲は、「悪い形態」を取得し、それに対応して特に報酬中枢と関連付けられた脳刺激の識別可能な定性的及び/又は測定可能な低下を得る。したがって、有効な生成系作曲は、関連付けられた技術的評価プロセスを用いて具体的な技術的効果に繋がる。実際に、よりよい生成系作曲は、検出可能な刺激/脳活動のレベルの増加に繋がる。
実際に、スプライス適合性音楽要素における共通の音楽的特性の識別が望ましく、動画出力と共に音楽強度を上げる(ドラマ及び緊急性を発展させる意味が増す状況において且つ必ずしも絶対的なオーディオパワー出力レベルの状況ではなく)等の関連する音楽テーマと同調する適したマルチメディア製品を迅速に集めるタスクを有するゲーム開発者及び/又は広告若しくは映画トレーラープロデューサー/エディターにとって有用である。商業的環境における作曲の問題にコンテキストを提供するために、適切な映画楽譜の生成が最初の例である。現在、映画ディレクターは、シーンにおけるアクションの進化を反映したナラティブを記述し、次いで適した作曲について作曲家に打診する。作曲家は、ナラティブを検討し、映画ディレクター又はゲームデザイナー等のクライアントへの「デモ」の提供において楽曲をナラティブに合わせようとする。
より具体的には、映画、TV及び広告の音楽は、同様の委託及び制作パターンを辿る。作曲家は、典型的には、ディレクター又はプロデューサーによって委託される。ディレクター又はプロデューサーによる作曲家の選択は、音楽ショーリールに基づくか、又はコミッショナーが作曲家の特定の言説を知っており、自らのプロジェクトにそれを望むことを通してのいずれかである。作曲家が映画を見る前に、テンプトラックが典型的に使用されて、編集プロセスを促進すると共に、コミッショナーが特定の時点で映画に持たせたいペース及びムードのタイプについてのアイディアを与える。作曲家及びコミッショナーは、次いで、「スポッティングセッション」として知られるもののために集まる。この会合では、当事者がテンプトラックを見て、音楽がどこで開始及び停止すべきか、即ちスポッティングとして知られているプロセスに関してプロジェクトを議論する。映画における自己内包的音楽の各セクション、即ち音楽キューの他の全てのパラメータも検討される。このプロセスは、ブリーフを完成させ、ブリーフは、各キューの入るタイミング及び出るタイミング、キュー内の任意のヒットポイント並びにキューのムード、編曲及びペースからなる。[ヒットポイントとは、トムがジェリーによってフライパンで頭を叩かれる等の音楽が動作に「ヒット」すべきタイムライン上のポイントである]。これから、作曲家は、各キューに望ましいトラックのデモを制作する。次いで、これらのトラックは、コミッショナーによるオーディションを受け、キューの改良のためにフィードバックが提供される。全当事者によってトラックが満足のいく状態であると見なされると、トラックは、録音されるか又は知られているようにバッキングされる。
興味深いことに、映画スターウォーズ(Kurtz&Lucas,1977)のオープニングクレジットでは、ホルストの惑星の曲集からの火星のクロージングの完全なオーケストラセクションを盗用したときにジョン・ウィリアムズが行ったのと全く同じように、映画作曲家は、種々のブリーフを満足させるために、過去の曲及び他の現代の作曲家の曲からアイディアを拝借し、盗みがちである。実際に、このポイントは、BFI(Meeker,1978)におけるデイビッド・ミーカーとのインタビューでジョン・ウィリアムズ自身によってオープンに話されている。実際に、作曲家が楽譜を再考して、バッハが行ったように微調整するのみならず(Ledbetter,2002)、ラフマニノフのピアノ協奏曲第4番(Norris,2001)のように、よりよい時間的ナラティブにするために楽譜を完全に作り直すことは、明らかに明確である。
これは、近年認識されている作曲の芸術的プロセスの問題にも繋がるが、生成系作曲を用いる場合、これは、必然的に「形態」を技術的に評価しなければならず、そのような「形態」は、生成系作品を組み立てているシステムインテリジェンスの制御下に十分に維持されなければならない。
映画楽譜のマルチメディア作曲のこの反復プロセスは、「よい形態」を有する楽曲に繋がることもあり - 又は繋がらないこともあり -、ここでも、求められるレベルの「よい形態」でもって、遠くで作曲された楽譜が許容可能であるか否かについての意思決定に映画ディレクターが関わることになる。作曲家は、上述したように、自らの過去の楽曲による影響も受ける可能性が高く、多くの場合、「新しい」音楽作品を作曲するに当たりこれらの個人のテンプレートを利用する。そのような個人のテンプレートの使用は、一般に、テンプレートが許容可能な形態品質を有することを意味し、必ず「単調」な楽譜に繋がり、これは、必ずしもよいことではない。例えば、映画Superman(登録商標)及びStar Wars(登録商標)は、両方ともジョン・ウィリアムズによって書かれたため、これらの両方の映画のメインテーマの楽曲には顕著な共通の特性がある。
検討のために生成される少なくとも1つの「デモ」を提供するに当たり、制作者又は編集者は、既に、潜在的に適した音楽を識別し、次いで選択された音楽を動画に当てはめる/同調させることに相当な時間を費やしている。商業的に使用可能なオーディオトラックを識別する必要性を遅らせるために、コンテンツ制作者は、現在、容易に取得することができない権利を有する周知のトラックであることが多い、いわゆる「テンプトラック」を利用し得るが、使用権を取得することができる適した商業的に採算の合うトラックを識別するために調査が必要とされるため、これは、単なる応急処置にすぎない。次いで、編集がオリジナルブリーフと一致するか否かを評価するようにクライアントに指示することから、更なる時間遅延が生じる。したがって、「形態」の意味でコンテキスト的に互いに関連する有効な一揃いの相互参照された音楽要素は、有益には、例えばビジュアルシーケンス又は音楽プログラムの構築と同調した有効な生成系作曲を促進する(映画楽譜制作、TV又はストリーミング広告及び作業率を上げるために音楽に合わせてサイクリングエクササイズを演出する「スピン」クラス内で行われる等)。
興味深いことに、任意の作曲判断に曲作りの記録が入ることは、希であるが、幾らかは存在し、作曲プロセスへの大きい洞察を提供する(Ledbetter,2002)(Norris,2001)(Cooper,1992)。主に、1つの楽譜又は演奏を残すのみであり、選択された音、即ち完璧主義者の視点から選択されたように見える、最終的な楽譜まで辿り着いた音を崇拝する姿勢に繋がる。作曲家が採用し得る代替の証拠は、任意の特性のある種の判断に必然的に繋がった曲作り及び選択の実態を表す。(Meeker,1978)において、ジョン・ウィリアムズは、未知との遭遇(Phillips&Spielberg,1977)への5音テーマになるものに97の異なるバージョンがあったと述べている。これらは、まず、バリエーションの4つの群に群化され、知られている有名な5音メロディに辿り着くまで、そこからディレクターであるスティーブン・スピルバーグとの議論を通して減らされて更に改良された。しかしながら、ウィリアムズ自身の所見は、それにもかかわらず、特定のタイミング及び音の持続時間を有する、特定のコードにおけるそれらの5つのピッチのウィリアムズ及びディレクターの最終選択の明確な数学及び物理学関連の完全性について人が書くことを止めなかった。ウィリアムズにとって、これが多くの他よりもよい音のセットであったことは、明らかであったが、それらは、ある意味で事前に定められた、略間違いなく最良の「よい形態」を有する音であると他の人々が思わざるを得なくなった選択された音であった。
別の例として、インタラクティブゲームは、付随する音楽楽譜に関して適合されたユーザ経験を提供しない。現在、ゲーム又はゲームのシーンの特定の態様にとって「そういうもの」であり、単にベースプログラミングを反映するにすぎない。有効な生成系プロセスが存在した場合、音楽テクスチャに関して経験されるサウンドは、画面上のアバターの感情視点から見て、強化された気配をユーザに提供することができる。例えば、プレーヤが、プレーヤのゲーム内アバターの高まる感情又は物理的状況を反映したユーザ専用の特定の音楽セグメントに曝される没入経験である。現在、ゲーミングシステムは、アバターが直面/経験しているゲーム内の問題の可聴示唆を提供しておらず、これは、物理的プレーヤ経験にとって不利益である。しかしながら、問題は、各プレーヤの行程がユニークであり、したがって、妥当な適合された有意味なサウンド経験をオンザフライでどのように生成されるか、及び実際に特定の含意及び特定のユーザへの関連性を有する音楽に向けてそのようなサウンド経験を合わせることができるかである。現在、いずれの付随するゲーム関連楽譜も、単にプレーヤに対する感情含意を有する可能性がない一般的なパスにすぎず、実際に、楽譜は、実際にプレーヤと感情的に共振しないか又は実際にプレーヤによって嫌われることがある。
生成系音楽コンパイラが存在する。これらの既存のシステムは、典型的には、何らかの形態のマルコフプロセスを使用してコードを生成するが、全て異なる楽器にわたり異なる音を生成する一連のアルゴリズムを有する。従来技術による手法に伴う問題は、創造性をほとんどサポートしないに等しく、楽曲内容を操作する能力がほとんどないに等しいことである。実際に、従来技術による手法は、全て一般に同じに聞こえる楽曲を生成し、その理由は、生成される全ての楽曲が一定数の予め定義された楽器テンプレートに基づくためである。このストレートジャケッティング手法の結果は、音楽テクスチャの損失である。これは、生成される単調性によって有用性が低下する大きい問題である。
長年にもわたって実施されてきたコードスキームを記述するための種々の方法が存在する(C.Johnson,Carballal,&Correia,2015;Lerdahl&Jackendoff,1996;Nierhaus,2009)。任意の所与の方法の美的評価は、制作者の芸術的要件、正当化、事後合理化又はシンプルな許容差に基づく。経験は、実際には、周囲のハーモニー進行における十分な状況を所与として、任意のコードが任意の他のコードに続くことを許容可能と見なすことができることを示す。別のコードに続くコードを選択する際、この状況が無視され、一例におけるシーケンスの証拠のみを探す場合、それによりコードスキームが単にランダムなシーケンスになる。
本発明は、特に生成系の意味で使用されるサウンド信号の信号処理に関連するが、更なる前後情報を提供するために、音楽家によって使用され、本発明の特定の実施形態及び実装形態に関連する用語の作業基盤を提供することが適切である。これに関して、
- 西洋音楽理論では、カデンツとは、特に任意のカデンツが降下エンファシスを有するため、解決[終止又は一時停止]の意味をもたらすメロディ又はハーモニー構成である。ハーモニーカデンツは、音楽のフレーズ、セクション又は曲を終わらせる(少なくとも)2つのコードの進行である。したがって、リズムカデンツは、フレーズの終わりを示す特徴的なリズムパターンである。カデンツは、終止の意味に応じて弱いこともあれば強いこともある。カデンツは、通常、特定のコード又はメロディ進行により分類されるが、そのような進行の使用は、必ずしもカデンツを構成するわけではなく、音楽フレーズの終わりの時点でクロージャーの意味がなければならない。一般に、ハーモニックリズムが、カデンツが生じる場所を決めるに当たり重要な役割を果たす。カデンツは、音楽のパッセージ又は曲の主音又は中央ピッチの強力なインジケータでもある。
- 音楽では、主音とは、ダイアトニックスケールの最初の音度(スケールの最初の音)であり、調性(音楽的にキーベース)クラシック音楽、ポピュラー音楽及び古典的な音楽において最後のカデンツで一般に使用される調性中心又は最後の解決音である。ド・ソルフェージュ系では、主音は、ドと歌われる。より一般には、主音は、曲の他の全ての音が階層的に参照される音である。スケールは、スケールの主音にちなんで命名される。例えば、Cメジャースケールの主音は、C音である。主音という用語は、キーセンターと呼ぶこともできる。局所主音、例えばCm又はBbは、スケールの最初及び最後の音の両方を提供する。
- したがって、主音上に形成されたトライアドである主音コードは、最も重要なコードである。
- コードは、互いと並行して演奏され、キーセンターと結び付けられる一連のピッチである。機能に関して、精神は、コードを利用して、それが楽曲のどこにあるかを予測する。音楽的意味は、シンタックス、即ちコードシーケンスから導出されるため、コードは、それ自体でいかなる語彙的意味も有しない。
- コードスキームは、コード鎖である。
- メタコードスキームは、コードスキームがどのように記述されるかの原理である。
- メジャー及びマイナースケールは、西洋音楽で最もポピュラーで一般に使用されるスケールの2つであり、別個のピッチを各々有する音のセットがスケールを形成する。メジャー及びマイナースケールは、5つの全音程及び2つの半音程のピッチインターバルが存在するダイアトニックスケールのバリエーションであり、3度の音の相対的なピッチ/物理的変位により、スケールがメジャーであるか又はマイナーであるかが決まる。この3度の音は、メジャースケールをより明るくより陽気なサウンドにする一方、マイナースケールに悲しみ、憂鬱及び暗さを与える。メジャースケールでは、3度の音は、マイナーサード音よりも1音高い。メジャースケールにおけるステップのパターンは、音のスペーシングWWHWWWHを有する(Wは、全音の遷移を表し、Hは、半音の遷移を表す)一方、マイナーダイアトニックスケールにおけるパターンは、音のスペーシングWHWWHWWを有する。西洋音楽の慣例では、任意のメジャー又はマイナーキーは、スケール内に7度/音、即ちAからGの音を有することになる。
ここで、本発明の概念 - 多く存在する - について詳細に説明するが、追加の音楽用語の以下の説明が更に補助となり得る。
特に西洋音楽では、コード間の関係は、音度により定義される。音度とは、主音、即ち各オクターブが始まると仮定される起点であるスケールの最初のメインの音に対するスケール上の特定の音(特定のピッチを有する)の位置を指す。音楽理論では、ダイアトニックスケールは、各オクターブに5つの全音程(全音)及び2つの半音程(半音)を含む任意のヘプタトニックスケールであり、2つの半音程は、互いからスケール内のそれらの位置に応じて2つ又は2つの全音程により隔てられる。このパターンは、1オクターブを越えて広がるダイアトニックスケールにおいて、全ての半音程が互いから最大に隔てられる(即ち少なくとも2つの全音程で隔てられる)ことを保証する。
1オクターブとは、一方が他方の2倍の周波数を有する2つの音間のピッチ差である。1オクターブ離れた2つの音は、常に同様に聞こえ、同じ音名、例えばCを有する一方、それらの間の全ての音は、明確に異なって聞こえ、他の音名、例えば、D、E、F等を有する。音は、自然に12の群に入り、12の群は、全て互いから1オクターブ離れる。したがって、1オクターブは、12の等しい半音を含み、したがって、各半音は、前の周波数に対して21/12の比率の周波数ステップを有する。
更に、コード内の音の選択がその分類に繋がることも理解されるであろう。例えば、3音コード[偶然に「トライアド」である]は、3音間に、
マイナートライアドの場合、3つの半音の後に4つの半音が続き、
メジャートライアドの場合、4つの半音の後に3つの半音が続き、
オグメントトライアドの場合、4つの半音の後に4つの半音が続き、
ディミニッシュトライアドの場合、3つの半音の後に3つの半音が続く
といった様々な音スペーシングを有することができる。
無駄な説明を望むものではないが、ドミナントセブンスとは、[ピアノ]コードが、8度(即ち次のオクターブにおける音を繰り返す)から1度/スケール下がった音である4度音を含む場合である一方、メジャーセブンスは、コードが8度から半音下がった4度音を含む場合である。
明らかに、理解されるように、複数の楽器のフルオーケストレーションは、各楽器に異なる楽譜があり、異なる楽器は、音楽楽器デジタルインタフェースプロトコル(MIDI)スケールで異なる数値表現を有する。例えば、中央Cは、値60を有する(現代チューニングA=440Hzを使用して現実世界の周波数261.63Hzを表す)。
楽器は、イディオマティック制限を有する。例えば、従来通りにチューニングされた4弦ベースギターであり、最低MIDI値は、位置28である。逆に、バイオリンは、一般に、同時に演奏することができるのが2音のみであり、これらは、MIDI値55を有する最低音を有する。
有効な自動生成系作曲に関連する根本的な技術的問題に戻ると、音楽業界が直面している別の問題は、特にパーソナル/個人レベルで聴取者/ユーザ経験をどのように最良に向上させるかである。実際に、音楽の曲及び事象の文脈上の関連性又は音楽の曲と事象との間の関係が、相補的な感情的反応、例えば映画中の恐れ若しくは不安な感じ又はTV広告で生じる製品関連付けの認識をもたらすか又は相補的な感情的反応を誘導することが長い間認識されてきた。
生成系サウンド経験を楽曲に何らの資格もないエンドユーザが打ち出したナラティブを合わせるのは、楽曲が迅速に生成され、認識できる基準のものであった場合に有利である。しかしながら、手短に言えば、自動生成系作曲の場合、現在、典型的には小節で表現される選択的にリンクされた音楽フレーズから構成されるサウンド信号における「形態」又は実際に「悪い形態」を回避し、したがって関連する結果を人間の心理及び精神の状態に課すように生成系作曲の手順をどのように自動化することができるかを評価する有効な方法は、存在しない。
概説すると、生成系作曲システムは、既存の音楽人工産物を、「原子形態」と呼ばれる構成要素に縮小する。これらの原子形態は、それぞれ様々な長さのものであり得、且つマルコフ連鎖を通して一緒にリンクする音楽的特性及び関連付けを有し得る。無数の新しい楽曲を提供するために、ヒューリスティックのセットは、連結された音楽セクション間の音楽テクスチャが、新しい楽曲のための供給及び定義されたブリーフィングナラティブに従うことを保証する一方、原子形態等の連続する連結されたセクションも、それらの音楽セクションのための音楽テクスチャのそれぞれの且つ識別された属性における類似性が、音楽形態の維持をサポートするように維持されることを確実にするように自動的に選択される。本開示の独立した態様は、メディア製品又はリアルタイムオーディオストリーム等の楽曲作品内において、コードスペーシングの決定及び制御が実施されて、新しい楽曲内で音楽的意味を維持することを更に保証する。更に且つ加えて、新しく相補的であるが、独立した技術的手法は、ピッチを維持し、且つキー変換を可能にするプリミティブヒューリスティックを構造化する。
本発明の第1の態様によれば、生成系作曲システムが提供され、本システムは、音楽の行程に沿った複数の音楽セクションの複数の感情記述を参照して音楽の行程を記述するブリーフィングナラティブを受信するために結合された入力と、インスタンス生成時にそれぞれ原譜を生成する複数の音楽データファイルを含むデータベースであって、各原譜は、自己内包的構造特性を有する複数の識別可能な連結された原子形態に分割され、各原子形態は、そのそれぞれの原子形態の楽曲性を記述するタグ、局所主音におけるコードのセット並びに疑問、応答及びステートメントの1つを音楽的に表現する形態関数と組み合わされた進行記述子を有し、原子形態間の音楽的遷移は、複数の原譜における原子形態間の確立された遷移を識別し、且つその後、記録し、及びそれによりシステム内において、原子形態が、同様のタグを有するが、異なる構造特性を有するものとして識別されるグループが存在するようにマッピングされる、データベースと、ブリーフィングナラティブに応答し、且つデータベースに結合された処理インテリジェンスとを含み、処理インテリジェンスは、複数の音楽セクションのそれぞれの1つによって求められる感情記述と時間的に同調するタグを有する原子形態の選択及び連結を通して、ブリーフィングナラティブに関する生成系楽曲を組み立てることと、異なる原譜から原子形態を選択し、且つ生成系楽曲に代入することであって、代入原子形態は、任意の原譜から導出され、且つ感情記述と同調されたその楽曲性を有する、選択及び代入することとを行うように構成される。
データベースは、オリジナルの音楽人工産物及びそれに対する代替物をどのように再構築するかを説明する情報を含むメタデータの形態のヒューリスティックを含み得る。
原子形態は、関連付けられたタイミングを有するコードスキームの列を生成する原子形態の列に組み立てられ得る。
本システムは、規定された時間窓にわたってコードを分布させるように構成されたコードスペーサヒューリスティックを含むことができる。
システムインテリジェンスは、コードスキームを処理して、テクスチャ音がコード及びそれらの関連付けられたタイミングから導出されるテクスチャをインスタンス生成するように構成され得る。
各原子形態は、最小長を有し、異なる原子形態は、異なる音楽持続時間を具現化し得る。
一実施形態では、タグのサブセットは、意味的に同一であり得る。
別の実施形態では、各原子形態は、原子形態の中央セクションに主音を決して含まない。
各原子形態は、ピッチ及び調性の両方を有する局所主音に対する音程距離として表現される、局所主音におけるコードの特定のセットを有する。
一実施形態では、各原子形態は、コードタイプ及びコードの低音部を記憶する。
一実施形態では、データベースは、人工産物のコーパスから、良好な形態で音楽的に機能している以前の遷移を識別するマルコフ連鎖関連付けを通して、先行又は後続する原子形態のリストにリンクされる原子形態のリストを記憶する。
原子形態は、ハーモニック構造と、楽曲的に良好な形態に従うハーモニック構造を生成する能力とを提供する。
原子形態は、楽曲のためのテクスチャを定義し、及び選択的に選択され、且つコードスキーム鎖を用いて記述される場合、生成系楽曲におけるテクスチャ連続性の維持を可能にするマッピングされたテクスチャコンポーネントのリストへの関連付けを有し得る。
本発明の別の態様では、生成系作曲の方法が提供され、本方法は、音楽の行程に沿った複数の音楽セクションの複数の感情記述を参照して音楽の行程を記述するブリーフィングナラティブを受信することと、複数の音楽セクションのそれぞれの1つによって求められる感情記述と時間的に同調するタグを有する原子形態の選択及び連結を通して、ブリーフィングナラティブに関する生成系楽曲を組み立てることと、異なる原譜から原子形態を選択し、且つ生成系楽曲に代入することであって、代入原子形態は、任意の原譜から導出され、且つ感情記述と同調されたその楽曲性を有し、各原譜は、自己内包的構造特性を有する複数の識別可能な連結された原子形態であって、各々は、そのそれぞれの原子形態の楽曲性を記述するタグ、局所主音におけるコードのセット並びに疑問、応答及びステートメントの1つを音楽的に表現する形態関数と組み合わされた進行記述子を有する、複数の識別可能な連結された原子形態に分割される、選択及び代入することと、複数の原譜における原子形態間の確立された遷移を識別し、且つその後、記録し、及びそれにより、原子形態が、同様のタグを有するが、異なる構造特性を有するものとして識別される原子形態のグループが存在するように、原子形態間の音楽的遷移をマッピングすることとを更に含む。
本発明の更なる態様では、複数の音楽セクションを含む楽譜を解析する方法が提供され、本方法は、複数のセクションにおける音楽テクスチャと関連付けられた感情含意の存在を識別することを含み、音楽テクスチャは、複数の識別可能に異なる楽曲特性によって表され、i)音楽テクスチャは、感情含意を有し、及びii)任意の音楽セクションの各音楽テクスチャは、複数の予め定義された音楽テクスチャ分類子を含むセットから選択される音楽テクスチャ分類子の存在に関して音楽的に表現され、及びそれにより、a)異なる音楽セクションは、予め定義された音楽テクスチャ分類子の異なるサブセットを含み得、b)所与の音楽セクションについて、それぞれの予め定義された音楽テクスチャ分類子は、テクスチャ分類子に対するゼロ又は少なくとも1つのいずれかのコンポーネントを有し、存在する各コンポーネントは、伴奏又は音楽的特徴のいずれかとして更にタグ付けされ、存在するコンポーネントを有する各音楽テクスチャ分類子は、i)音楽的特徴を保有しないか又は単一の音楽的特徴を保有するかのいずれかであり、且つii)1つ又は複数の伴奏を保有し、及びc)異なる音楽セクションは、共通の記述子又は共通の記述子との関連付けを有する同様の記述子を有し得るが、同時に、異なる音楽セクションは、音楽テクスチャ分類子の異なるサブセット又は音楽テクスチャ分類子におけるコンポーネントの異なるサブセットを保有する。
テクスチャ分類子は、メロディ、カウンターメロディ、ハーモニー、低音部、ピッチリズム、非ピッチリズム及びドラムの少なくとも幾つかを含む群から選択され得る。音楽的特徴は、音楽テクスチャにおける顕著な音楽コンポーネントであり、且つ音楽セクション内の音楽的緊張及び解放についての情報を含み、緊張及び解放は、音楽的特徴が音楽セクション内及び同じ予め定義された音楽テクスチャ分類子内の別の音楽的特徴と組み合わされた場合、音楽的文脈に関して破壊されることになる。伴奏は、音楽セクションのいかなる特定のテクスチャ分類子における別の伴奏又は特徴にも干渉せず、且つ音楽セクションのテクスチャを厚くするか又は薄くするために選択的に追加又は除去され得る。
本発明の更に別の態様では、自動生成系作曲プロセスにおいてテクスチャを提供する方法が提供され、本方法は、ナラティブブリーフに対する少なくとも1つのコードスキームを生成することであって、コードスキームは、原子形態に基づき、及びナラティブブリーフは、一連の事象に対する感情含意を提供する、生成することと、導出されたテクスチャを少なくとも1つのコードスキームに適用して、ナラティブブリーフを反映する楽曲を生成することとを含む。
本方法は、テクスチャプロファイルを有する第2の音楽セクションと連結された第1の音楽セクション内にテクスチャナラティブがないことを識別することと、伴奏又は音楽的特徴である少なくとも1つのコンポーネントで第1の音楽セクションを埋めることであって、少なくとも1つのコンポーネントの選択は、先行するテクスチャ分類子の履歴及びテクスチャ分類子のうちの主要なものの連続性、さもなければそれぞれのサブセットの強度に基づく、予め定義された音楽テクスチャ分類子の宛先サブセット間の論理的ブリッジの一方に基づく、埋めることとを更に含む。
したがって、本開示の種々の構成要素態様によれば、効果的な生成系作曲は、特に「良好な形態」を有する生成系作業の生成を通して有形の技術的効果に繋がる。実施形態は、非標準の様々な持続時間の、原子形態にリンクされた技術的特性が抽出され、各原子形態の表現品質の記述子に関して記憶されるカテゴリ化プロセスを通してこれを達成する。隣接する原子形態間の音楽的遷移が知覚的に良好な形態であるように、ある原子形態によって示される技術的特性が隣接する原子形態の技術的特性と連結することができるように関係マップが異なる原子形態間に確立される。この手法は、自動生成系作曲を生成する能力を実証する。
本発明の更に別の態様では、タグ付き原子形態のデータベースが提供され、各原子形態は、そのそれぞれの原子形態の楽曲性を記述するタグ、局所主音におけるコードのセット並びに疑問、応答及びステートメントの1つを音楽的に表現する形態関数と組み合わされた進行記述子を含む。
種々の実施形態では、疑問は、音であって、ハーモニー又はメロディ内に出現しており、且つそれらが原子形態の局所主音のキーセンター外であるために疑わしく存在する音によって示される、心の落ち着きを必要とする緊張を示唆するコードスキームであり、応答は、局所主音又は応答原子形態の任意の新しい主音のいずれかのキーセンターを補強することにより、精神の視点からの疑いのある音調又は音の存在を解決するように作用する疑問の解決であり、及びステートメントは、音楽的疑問から全体的に独立しており、且つ解決を通した解放を必要とするいかなる有意味な音楽的緊張も暗示又は誘導せず、及びステートメントは、疑問でも応答でもない。
各原子形態は、ハーモニック構造と、楽曲的に良好な形態に従うハーモニック構造を生成する能力とを提供する。
別の態様では、複数の選択可能な原子形態を含むデータベース内の音楽的原子形態が提供され、配置された各原子形態は、ハーモニック構造と、楽曲的に良好な形態に従うハーモニック構造を生成する能力とを提供する。
本発明は、とりわけ、異なるキー/主音間の任意の転位で生じるピッチ関係を維持しながら、コードをベース主音への関係位置に縮小するように機能する。その場合、遷移の連鎖は、維持される。換言すれば、好ましい実装形態における任意の音楽キーにおいて、コード間の関係は、音度によって表現される。したがって、オクターブを問わず、Fのキーセンターにおいて、音階におけるF音は、値Iとして表現され、Bbは、IVとして、Cは、Vとして表現される。したがって、この手法は、選択される主音を問わず、コードスキーム間の等価性に繋がり、メジャースケール及びマイナースケールの両方にわたり維持可能である(又は本明細書で使用されるように、西洋の7音音階の例示的な状況から逸脱しない任意の選択された音度)。したがって、コード内の音をベース主音に相対する関係位置に縮小することは、任意のコードの相対構造状況が異なる主音への転位を問わずに維持されること、即ち遷移の連鎖が維持されることを意味する。したがって、ピアノでのCメジャーの例示的なキーにおいて、
ピアノでのミドルCは、MIDI値60及び位置Iを有し、
ピアノでのDbは、MIDI値61及び位置IIbを有し、
ピアノでのDは、MIDI値62及び位置IIを有し、
ピアノでのEbは、MIDI値63及び位置IIIbを有し、
ピアノでのEは、MIDI値64及び位置IIIを有し、
ピアノでのFは、MIDI値65及び位置IVを有し、
ピアノでのGbは、MIDI値66及び位置Vbを有し、
ピアノでのGは、MIDI値67及び位置Vを有し、
ピアノでのAbは、MIDI値68及び位置VIbを有し、
ピアノでのAは、MIDI値69及び位置VIを有し、
ピアノでのBbは、MIDI値70及び位置VIIbを有し、
ピアノでのBは、MIDI値71及び位置VIIを有し、
ピアノでのC(次のオクターブにあり、主音に戻る)は、MIDI値72及び位置Iを有する(再び)。
したがって、好ましい実施形態は、あらゆるコードが整数により局所主音/キーセンターの状況で測定することができ、その関係が、特定のコードのシーケンシングだけでなく、コード間で確立することができるという前提で機能する。
したがって、有利には、本発明の態様は、音楽を解析し、次いで音楽をパーズして、音楽テクスチャ並びにプロセッサ由来の生成系作業の最終組み立て/性能の品質を確保するために必要な性能パラメータ及び構築ブロックの生成を可能にする種々のヒューリスティックを推測する。分類メカニズムは、異なる楽器コンポーネントを異なる楽曲状況で使用できるようにし、それにより異なる楽曲のプリンシパルの組み合わせを通して全く新しいテクスチャを作成することができる。有益な結果は、クライアントにより提供されるブリーフ、即ちナラティブに従い、したがって音楽的に関連性があり、形式的に可変であり(従来技術の手法と異なり、形式的にテンプレートに結び付けられないため)、且つオーディブル的に - したがって報酬中枢型の満足感が得られる - 良好な音楽形態を有する生成系作曲である。
有益には、bespokeエキスパートシステム等の音楽情報検索技法及びプロセッサベースのシステムインテリジェンスによりサポートされる解析の処理に基づいて、本開示は、複数の相補的であるが、なお発明的に異なる技術的解決策を提供する。処理メカニズムは、原曲/原譜の再現並びに脳の報酬中枢を刺激してドーパミンの放出を促進する予測的緊張及び解放の人間の要件を満たす無数の他の代替の生成系楽曲の両方をサポートする一連の数学関数[正しく適用されたパラメータを有する]を通して原曲を圧縮するように機能する。これに関して、開発されたコアヒューリスティック、即ちルールと共に、これらのコアヒューリスティックのシーケンシャル実行順序に基づいて、正しいパラメータは、数学的選択の適用になる。本発明は、オッカムの剃刀手法を適用し、即ち、生成系数学関数は、(a)ピッチ生成、(b)新しい主音へのピッチ変換、(c)生成系楽曲における生成系コードの演奏速度を維持するコードスペーシング、及び(d)生成系楽曲におけるテクスチャ維持等において手法の種々の生成系態様においてヒューリスティックを選択する上で元の音楽的意図の客観的再現をサポートするために最もシンプルであるべきである。そのような数学関数の例は、その多くが本明細書で詳細に開示され、転位における低音がベースギターの最低音よりも低い音であることができないか、又は転調されたバイオリンコンポーネントの楽譜が、最大でも2つの音の演奏のみが同時に関連し得るという公理を含み得る。
本開示の実施形態及び態様の技法の適用は、映画音楽、広告制作及びゲーミング(特に演奏者感情への直接的な演奏者含意を有する、演奏者が選択した音楽を反映するように生成されるユーザ固有の伴奏を生成する状況で)を含め、任意の音楽からビデオ用途に至るまで採用することができる。生成系の曲は、「良好な形態」及び独創性を具現化するため、本技術の適用は、歌詞を記述することができる新しい楽曲の生成に適用することもできる。
本発明は、異なる音楽源/楽譜から適合性のある音楽要素を識別し、生成系ヒューリスティック/数学関数を相補的に連結するプロセスから、精神にとって等しく満足のいく代替の生成系音楽作品を生成する。
出願された本特許又は出願は、カラーで実行される少なくとも1つの図面を含む/含んだ。カラー図面を有する本特許又は特許出願公開のコピーは、要求に応じて、必要とされる料金を支払った上で特許庁により提供されることになる。ここで、本発明の例示的な実施形態について添付図面を参照して説明する。
従来技術における作曲手法を示す図である。 本発明の作曲手法を示す図である。 The High and the Mightyへの従来技術による最終楽譜のスケッチを示す。 The High and the Mightyへの従来技術による正式な最終楽譜を示す。 本発明の一態様の一実施形態によるテクスチャ分類及び生成系組み立ての一表現である。 本発明の一態様の一実施形態によるテクスチャ分類及び生成系組み立ての一表現であり、中間音楽セクションは、未指定であり、テクスチャ連続性を提供するために「埋められている」。 好ましい実施形態の生成系作曲システムの階層タスクフローである。 一実施形態による、許容可能な原子形態間のマッピング関係の組み立てを表す。 本発明の実施形態の手法により実施される、階層論理フローを有するヒューリスティックメカニズムのアフォーダンスを示す。 生成系作曲の好ましい作曲アーキテクチャ及び方法論の概略図である。 好ましい実施形態による、単一の楽曲が、実行可能な原子形態分岐を有するツリーのセットにどのようにパーズされるかを示す。 本発明の好ましい実施形態によるテクスチャ生成の概略表現である。 本発明の一実施形態による曲アノテーションシステムのグラフィカルユーザインタフェースの画面例である。 本発明の一実施形態において使用されるスペーシングヒューリスティックを表すコード配置チャートである。 本発明の一実施形態において使用されるシーケンシャル原子形態テンプレートである。 本発明の一実装形態による、再現及び解析のためにアノテーションが付されたジョン・ウィリアムズによるThe Quidditch Match楽譜の一部分である。 本発明の一実装形態による、The Quidditch Match楽曲から導出されたシーケンス原子形態3のエスケープ原子形態4とのループを表す例示的なテンプレートである。 本発明の一実装形態による、The Quidditch Match楽曲から導出された原子形態6シーケンシャルカデンツを表すテンプレートである。 本発明の一実装形態による、The Quidditch Matchから導出されたシーケンスフレーズ7及びエスケープフレーズ8を表すテンプレートである。 音のピッチを示すカラーラベルが関連付けられた、本発明の一実装形態により強化されたデタシェストリングライティングの4小節セクションの楽譜である。 本発明の一実装形態により、予め定義されたカラースキームによりシンタックス構造及び音のピッチを強調表示することにより改変されたヨハン・セバスティアン・バッハによるCマイナー前奏曲の最初の2小節の楽譜である。 本発明によるテクスチャ解析における、対応する小節のローカルドミナントと関連した16分音符3の音度を示す表である。 バッハ前奏曲の第1小節から第3小節内の音を数値配列として表現する本発明の一実装形態による例示的な図である。 バッハ前奏曲の第1小節から第3小節内の音を数値配列として表現する本発明の一実装形態による代替の例示的な図である。 バッハ前奏曲の第4小節から第6小節内の音を数値配列として表現する本発明の一実装形態による別の例示的な図である。 パターンの方向、低音部の5度の16分音符が着地するコード構成要素及び高音部T又は低音部Bのいずれかにおける5度の位置を含む、16分音符5における低音部のパターン変化を示す表である。 バッハ前奏曲の第7小節から第9小節内の音を数値配列として表現する本発明の一実装形態による別の例示的な図である。 バッハ前奏曲の第10小節から第11小節内の音を数値配列として表現する本発明の一実装形態による別の例示的な図である。 バッハ前奏曲の第12小節から第14小節内の音を数値配列として表現する本発明の一実装形態による別の例示的な図である。 「Clavier-Buchlein版」からのヨハン・セバスティアン・バッハのCマイナー前奏曲1の第14小節のヴィルヘルム・フリーデマン・バッハによる手書きコピーの画像である。 バッハ前奏曲の第15小節から第17小節内の音を数値配列として表現する本発明の一実装形態による例示的な図である。 バッハ前奏曲の第18小節内の音を数値配列として表現する本発明の一実装形態による例示的な図である。 本発明の一実装形態による、階層フロー及びエントロピーの強調表示されたポイントを示す配色ヒューリスティックを使用するバッハ前奏曲の楽譜表現である。 本発明の一実装形態による、上部延長部としてC及びEbとのメジャー及びマイナートライアドの可能な全ての組合せ(1オクターブにわたる)の楽譜表現である。 本発明の一実装形態による、バッハ前奏曲の第19及び20小節のテクスチャ内の可能な音を示す鍵盤表現の画像である。
本願及び本発明の拡張性により、概説、それに続く説明セクション、それに続く具体例への信号処理手法の適用及び関数の適用の範例に分割することが役立つ。本願内では、システムは「Heresy生成系システム」、「生成系作曲システム」又は技術的出力の改善に繋がるチューリング等価を適用する出願された技術的プロセス内での新しい数学的解析及び再組み立て手法の現実世界用途を監督するコンピュータ実装システムの他の適切な記述タグと呼ばれ得る。
「Heresy生成系システム」の背後にある原理は、従来の楽曲及び作曲プロセスの見方からのシフトを中心に展開し、変更できない最終的な固定状態を決して有しない流体の非静止実体として音楽(及びオーディオ信号の関連する信号処理)を扱う。
好ましい実施形態の生成系システムの各態様が、既存の[解析された]人工産物から新しい楽譜を作成するためにどのように相互作用するかを検討する前に、「ブリーフ」作成に関わる要件を理解することが重要である。ブリーフ自体は、生成系システムのバックボーンである構成要件のセットである。次いで、説明は、種々の実施形態及び態様の生成系手法を検討する。
本発明は、コーパスとして、潜在的な全ての楽曲を解析、参照及び生成系システムへの入力のソースと見なす。このプロセスを通して、本発明は、所与の1つの楽曲又は複数の楽曲からある種の特定の楽曲原理を抽出し(AI若しくはプロセッサベースのインテリジェンスによる信号処理を通したデジタル解析を通して又は音楽学者により他の方法で)、したがって、本発明が異なる作品からの原理をブレンドして1つの別個/個別のメタ楽曲にできるようにするよう機能する。オッカムの剃刀に基づく手法を適用すると、これらの楽曲原理は、続けて新しい生成系作品を作成することができるヒューリスティック/ルールのセットとして表現される。
Heresy生成系システムに関して、ブリーフにおける異なるキーワードが異なるユーザにとって異なる意味を有することが理解される。したがって、カテゴリに名詞を与えるために、なお、1人のユーザのみに何らかの意味があるメタタグのパーソナルセットに1つ又は複数のキーワードを加えられるようにしながら、タグ付けされる概念に意味論的意味がほとんどない一般名称が使用されることが好ましい。自然言語処理「NLP」を採用して、音楽セクションの使用可能な記述子の処理可能なデータを導出することができる。
効果的なカテゴリ化戦略は、Estilのボーカルトレーニングメソッドであり得る(Klimek,2005)。この抽象含意ラベリング法は、欠陥が(G.A.Wiggins,1998)において強調されている意味論的意味を有する言葉を音楽に添付しようとする試みへの実行可能な代替を提供する。
本発明及び好ましい実施形態のシステムは、作曲における相互作用をもたらすためのフレームワークを提供する。本システムは、ユーザが意図を言明し(解釈され、ヒューリスティック、したがってオーディブル的にシームレスな様式で一緒に連結することができる顕著な音楽セクションと相関付けられる、入力されたナラティブ又はブリーフ及びの形態で)、次いで実際にこのブリーフィング仕様からの出力を迅速に調整する方法を提供する。換言すれば、本発明のシステムは、元の意図をどの程度効果的に伝達するかに関して楽曲を聴きオーディションする前、楽曲アイディアのセットを定義する能力を提供する。それにもかかわらず、選択されるものは、形式が保護されながらシステムが新しい楽曲を生成するように求められる都度、変わることになる。本発明の手法は、どの生成系表現が潜在的に「誤っている」かを調べる能力を提供するという意味で、この原理を更に一歩進める。より具体的には、システム出力のクリティカル解析及び解説を通して、厳密にどのヒューリスティックが誤ったコード、音ピッチ、長さ、位置、ボイシング、ボイスリーディング、テクスチャ衝突又は感情含意を生成したかを識別する[元の意図/指示/ブリーフを考慮して]ことが可能である。次いで、この批判をヒューリスティック自体に反映し、ヒューリスティックが作曲意図によりよく合致するように決定の方法を変更し、元の概念のヒューリスティック表現を繰り返し改良することが可能である。代替的に、システムは、完全に妥当なマテリアルを生成することができるが、この結果が元の意図とよりよく繋がることができる場合がある。これにより2つのことが生じる:第1に、異なる概念として後合理的にメタタグ付けることができる新しい楽曲アイディア及び第2に、元の意図が他の楽曲アイディア及び実際に生成系作品に対してどの程度近いかの洞察。
本発明のシステムは、従来の映画音楽法から役割をシフトさせる。従来通り、作曲家は、プログラマ及びエンジニアによる技術ツール(ストリーマー及びクリックトラック等)に頼ると共に、マテリアルのデモ作成にシーケンシングソフトウェアに頼る一方、コミッショナーが、スティーブン・スピルバーグがインディジョーンズ(Laurent,2003)及び未知との遭遇の5音モチーフ(Meeker,1978)の両方のテーマで行ったように、提示されるマテリアルの選択において選択的役割を果たす場合、本発明のシステムはこれらの役割をシフトする;これは、図1A及び図1Bのコミッショナー/ユーザ/作曲家/プログラマの区切りに示される手法の比較に反映されている。
本発明を用いれば、作曲家自身がプログラマ及びユーザの両方になる。作曲家は、ここで、ツールを使用して、他のユーザが使用できるヒューリスティックプロセスを作成し、したがってプログラマの技術的役割を引き受ける一方、コミッショナー自身は、生成系ツールのユーザとして作曲家になることができる。
本発明の基礎となる手法は、作曲、特に作曲行為の概念的に異なる理解に基づき、即ち音が実際に何であるかではなく、オーディオ信号における次の音が先の音にどのように続くか(その生成と関連付けられたルール及び音楽セクションの基本的なオーディオ信号コンポーネントを表現する基本的な音楽コンポーネントの長さで表現される)を示す。このパラダイムでは、作曲の原理は解析のモデルを必要とし、生成されたヒューリスティックが繰り返し適用されて、作曲の概念を改良する。
本発明によれば、プロセッサベースのシステム及び関連する方法論は、本発明がプロセス、決定及び重み付け因子[楽曲に入れられる]の各々を、システムがこれらの新しい楽曲作品の生成の方法についての原理を抽象化することができるコアにするという点で、先の手法のシステムと異なる。特に、楽曲入力がほとんど完全であるコンポーネントを提示するパラメータ化された一連の生成系システムを使用するのではなく、本発明のシステムは、楽曲を一から分割し、特定の曲の生成系メカニズムを作成する。
明らかに、本発明は、以下を主張する:
1.同じ結果を達成することができるヒューリスティック数は少ないほうが望ましい。これはオッカムの剃刀であり、ヒューリスティックを理解しやすくすることで、この手法は、プロセッサ及び本発明の機能により適用される将来のルールへのヒューリスティックの適応をより容易にし、将来のルールを用いてのヒューリスティックの構築をより容易にする。
2.ヒューリスティックの線形増大は、作業数の指数的増大をもたらす。手短に言えば、新しい楽曲は好ましくは、過去の解析コンポーネントをますます組み込み、したがって、前の楽曲及び将来の楽曲を説明するヒューリスティックの普遍的なセットへの圧縮進行を増大させるべきである。
3.新しいヒューリスティックは、2つ以上の現象を説明しなければならない。新しいルールのセットが特定の曲からの1つのコア楽曲コンポーネントのみを説明する場合、これは、特注ルールであり、そのヒューリスティックが適切である更なる例をコーパスからのエビデンスにより提供することができるまで、省かれるべきである。これは、楽曲の解析へのルールの過剰当てはめを回避し、楽曲のより統合された理解の追求に慢心及びノイズを生じさせる。実際には、(少なくとも)同じ作曲家による新しい楽曲を説明するための又はジャンル若しくは時間の類似性を通して結び付けられた楽曲の場合、必要とされるルール数は、少なくなる。
曲が解析され、そこから生成系ヒューリスティックが作成される場合、これらは特定の趣を有することになり、「パック」と見なすことができる。ヒューリスティックパックは、バッハスタイルのピアノ前奏曲又はジョン・パウエルスタイルのアクション映画音楽を生成することができる。次いでこれらのパックには、内容の意図及びその感情含意についての情報をメタタグ付けることができる。
このようにして、本発明の生成系フレームワークにより作曲された音楽は、それ自体に一般的で識別可能なサウンドを決して有しず、ヒューリスティックパックが略確実に有することになる。したがって、機能ツールは、よりシンプル性及び多様性が高い出力に向けた改良を可能にする測定可能な出力を有する楽曲の一般表現を反映する。これは本質的に、特に良好な形態を有する自動生成系作曲の場合、作曲プロセスにとって重要である。
本発明は、自動生成系作曲をサポートする種々の反復的コンポーネントについての以下及びここでのより詳細な説明から明らかになるように、特定のポイントにおける新しい楽曲の直近パスを予測することが可能であり、それにより、実践に反映するため及び感情含意のカテゴリ化を改善するために、作曲の分野に新しいメカニズムを提供する。
セクションA
I.メタ作曲:ブリーフィングメカニズム
音楽は、多様な理由で映画と同期される。「同期」された音楽、即ちナラティブ空間内の音楽は、典型的には、ナラティブの一環としてキャラクターによって聴かれるが、非ダイエジェティック音楽、即ちナラティブ及びナラティブへのコメント外の音楽は多様な方法で作用して、映画の特定の特性を浮き彫りにする。
同期されたトラック、即ちアーティストにより予め録音され、それから動作に付随するように重ねられたトラック(ポップ、ラップ等)の場合、これらのトラックは多くの場合、編集室における開始点であり、カットのペース及びスタイルの基礎をなす。これらは、サブカルチャー的アイデンティティを映画に生じさせるか、ジャンルでグループ化するか、又はある種のカルチャーを映画に含意させるのに役立つ。この典型的な例は、ビッグ・リボウスキにおけるジプシーキングによる「ホテルカルフォルニア」の使用である。ジーザス・キンタナ(ジョン・タトゥーロが演じた)のキャラクターを紹介するシーンにおいて、それ自体が歌詞及び音楽の印象の両方でゆったりした幾らか物憂げな表現方法を有するオリジナルソングの再解釈が視聴者に与えられる。この新しい解釈は、エネルギッシュで快活な品質を有し、ジーザスというキャラクターが、それまでナラティブ言説とは全く別に環境を見ているという含意を与える:これは、ペースの速い音楽が付随するスローモーションショットのモンタージュにより更に強調される対比である。
楽譜作成作曲家によりカスタムに記述された非ダイエジェティック音楽の場合、楽譜作成作曲家は、ジーザス・キンタナ例でのこの対比等の特定の効果を達成するために、テクスチャパレットを介した言説を選択し得るが、適切なテンポ及び時間シグネチャマッピングを通して映画のペース及びフローに役立つと共に、先のナラティブがある種の緊張のピークに達するまで、スクリーン上のナラティブを追おうとする。
したがって、本発明の実施形態は、上記要素のブリーフィングを可能にするインタフェース及び機能をユーザに提供する。限定されないが、
1.ディレクター/作曲家が合意した任意のヒットポイントを備えた、キューが開始及び停止する時間コード並びに各キューが有することになる含意を有する、スポッティングセッションからの書面でのブリーフ、
2.映画の完全な楽譜、
3.編曲家が使用する基本の作曲マテリアルを含む、限られた数のスタッフでの抜粋楽譜又は「スケッチ」、
4.作曲家又は作曲家が信頼する編曲家に、所望のサウンド、テクスチャ及びハーモニーについてのメモを与える、綿密に示されたタイムラインにわたりメモをとるために使用される部分的にグラフィックの楽譜
を含め、適切と見なすことができる幾つかの方法がある。この状況では、ダイレクションを解釈し理解する作曲家又は編曲家の能力は、結果を得るためにブリーフが頼るインテリジェントパーズメカニズムである。スケッチと最終楽譜との間のこの不一致は、図2A及び図2Bに見られるように、The High and the Mightyへの楽譜の再構築により強調表示される。
上記リストは、包括的ではないが、ブリーフィングを可能にするツールの要件の指標を提供する。しかしながら、ブリーフィングには、重要であり、以下の幾つか又は全てを含むコンポーネントがある:
1.時間にわたりペースをマッピングする能力;これは明らかに、標準の分、秒及びコマのルーラーではなく、音楽時間ルーラーの使用を指す。このルーラーは、マルチプレーヤインタラクティブであるか否かを問わず及びゲームがストリーミングされるか、それともリモートでアクセスされるかを問わず、例えば、映画又は冒険/クエストゲームの態様のペースを綿密に示すために、テンポ及び時間シグネチャ変更を通して適合可能であるべきである。
2.ヒットポイントを指定するシステム及びヒットポイントが有するべき関連付けられた含意。
3.異なる時点におけるテクスチャ要素及びそれらの含意を指定する方法。
4.サブカルチャー的特性「キューバモントゥーノ」、「LA都市」等を与える、選択することができる言説のリスト。これは、「ジョン・バリー」等のある種の作曲家の特有のサウンド又は映画「ボーンアイデンティティー」等の映画自体の特有のサウンドとして表れ得る。
5.以下の1つ又は複数を含む楽曲ペースを設定する方法:(a)時間[[.]]にわたるコード数、(b)調性の転調及びシフト、並びに(c)異なるコードスキーム特性と関連付けることができる感情含意キーワード:(i)コード変化としてのペダル音の使用;(ii)キーセンターを通して移動するための5度圏の使用、及び(iii)キューの開始又は終了等のコードスキームの機能的特性。
このリストの最後の項目、即ち楽曲ペースを設定する方法は、以下のセクションBにおいてより詳細に説明するように、本発明のシステムが生成系作曲するために使用する構造階層におけるヒントを与える。楽曲ペースを設定する方法は暗黙的に、全てのペース及び楽曲形態が、コードスキーム及び時間にわたるその機能を指定することに由来することを述べている。コードスキームの要件は、ブリーフを構築し、したがって出力を生成するための柱である。
II.コードスキーム要件
本発明の完全なシステムは、コードのハーモニックシーケンスとしてのテクスチャ及びメロディ出力の態様に基づく。したがって、本発明の完全なシステムは、そのようなシーケンスを使用して、曲のセクションを形成し、そのペースを設定する。
したがって、種々の実施形態及び態様の生成系システムの場合、コードスキームは2つの別個の特性を有する:(i)形態関数及び(ii)感情含意。
形態の観点から、システムは、このデータ:
1.現在のセクションがキューの開始、終了又は中央であるか。
2.曲の主音にフォーカスしているか、又はセクションの終わりまでに異なるキーセンターへの移動が必要か否か、
3.転調すべきであるセクションを表すか、即ち次の原子形態(以下を参照されたい)において局所主音が現在の原子形態の局所主音と異なる必要があるか(即ち周囲の状況、音楽的特性及び原子形態の遷移点によって決まる潜在的に可変長の音楽構築ブロック)、
4.所与のセクションのコード密度(音楽持続時間にわたるコード数)を規定しているか
であることを反映するように、任意の所与のセクションでの情報/記憶されたデータのアノテーションを可能にするように構成される。
特定のセクションの所望の形態関数のこのブリーフィングは、曲の主音に関連してコードがどのように記述されるべきか、曲を楽曲/映画の異なるサブセクションに移るために、新しいキーセンターに到達するポイントで、転調を介した動きがあるべきか否かについての情報をもたらす。
システムインテリジェンスにおける機能及びその解釈能力(以下を参照されたい)は、上記形態関数と組み合わされた場合、所与のセクション内のコード数を設定し、それにより、生成系作曲の形態及び方向の包括的な整形を可能にする能力を提供する。
新しい曲の形態及びコードの作成にどの生成系技法が使用されるかを問わず、プログラマ/作曲家が曲に取り込みたい感情含意要素をユーザがブリーフィングする必要性が残る。コンテキストを提供すると、映画楽曲内の含意を表現することに関して言えば、作曲家は、西洋文化内の大量の言説及びコードを利用しようとする。しかしながら、音楽の語彙的意味及びその説明という主題に対応する場合、同じサブカルチャー内の個人からであってもコンセンサスは存在しない。これは、各個人が文化的コーディングの異なる解釈を有するためである。
使用可能な音楽セクションの塊の形態の参照マテリアルに関して、システムは、再現を容易にするが、解釈をユーザのブリーフィング/ナラティブに開かれたままにするメタタグを有する異なる楽曲コンポーネントの含意を参照するように更に機能的に構成される。上述したように、ブリーフィングは、NLP技法を使用して処理されて、システムに入力されたナラティブで表現される同様又は同一の言語を有する符号化された音楽セクションを交差相関させ得る。NLP技法は周知である。このようにして、音楽セグメントに関連付けられるか又は添付されるメタタグが常に何に当てはまるべきかについてプログラマの視点により妨げられることなく、ユーザは、入力としてブリーフのみに基づき、符号化され、関連付けられた含意を有する音楽のセクションに相関付けられた生成系楽曲を記述するシステムの能力にユーザ自身の解釈を持ち込むことができる。明らかに、感情含意は、ユーザ固有の意味を有する一般的な可変キーワード(又は短いキーフレーズ)の形態をとる。これらは、まず、モード1、...、モードnと命名されるが、ユーザの好ましい語彙的意味に応じて変更することができる。作曲ヒューリスティック(特定のコードシーケンス、テクスチャ、メロディコンター、コード-スペーシングヒューリスティック、音符生成器及びリズム生成器等)には、これらのキーワードが添付される。生成系メカニズムは、ユーザにより要求されるタイムラインにおける各瞬間にこれらの含意を作成するのに適したヒューリスティックを選択するように動作する。
III.テクスチャ要件
含意を特定の音楽生成系ヒューリスティックにメタタグ付ける方法を確立した後、種々の実施形態のシステムは、音楽テクスチャを維持し、特に、7つのメロディを同時に又は3つのベースラインを求める等の衝突するであろう隣接する音楽コンポーネント(例えば、原子形態)を挿入する要求を制約するメカニズムを提供する。
しかしながら、3つのベースラインを同時に有することは完全に可能である。ボーンスプレマシーからのジョン・パウエルのキュー「To The Roof」は厳密にこれを有する:ストリングテクスチャの底部で持続した長音を演奏するダブルベースを伴うシンセベースでの激しいベースラインを聴き、その間、あらゆる小節の、小節の最後の3つの16分音符及び新しい小節の最初のビートにパーカッション効果があり、それにより、ベース演奏者は指をミュートストリングに指を渡す。孤立していれば、これらのベースラインのいかなる1つも実行可能なベースパートとして機能するが、ここでは、テクスチャにより、3つ全てが、ハーモニーにも矛盾せず、音波空間において衝突もせずに最終的な効果をなすように要求する。
システムのインテリジェンスは、まず、ヒューリスティックのセットを生成し、スティング(例えば、ビオラ)、オフセットホーン、ハープアルペジオ、ピチカートベース等の[楽器の]音楽コンポーネントのセットの識別及び使用に技術的手法を適用する。識別は、音楽検索技術を使用して原譜のMIDI表現を作成して又は単にMIDI形式で記憶された原譜自体を使用して達成することができる。1つ又は複数の音楽コンポーネントが存在することができ、音楽コンポーネントは、次いで、当業者であれば理解するように、[限定されないが]メロディ、カウンターメロディ、ハーモニー、低音部、ピッチリズム、非ピッチリズム、ドラム/ビーム及び他の音楽的特性等のテクスチャ分類子のセットの定義に寄与する。これに関して、図3を参照する。
これらの音楽楽器コンポーネントの各々は、楽曲の最終的な組み立てと関連付けられた本発明の一態様によれば、2つの属性の一方を有するように更に分類され、即ち、コンポーネントは、「特徴」又は「伴奏」のいずれかであり得る。[音楽的]特徴は、時間感覚、気付き及び重々しさ、即ち寄与重要性を音楽セクションに与える。したがって、音楽的特徴は、音楽セクションのテクスチャ空間における顕著な音波コンポーネントであり、即ちそれ自体が緊張及び解放についての情報を含み、その情報は、第2の特徴が共通テクスチャ分類子に共存する場合、その第2の特徴が全く異なる楽器により演奏されるときであっても、破壊される。伴奏は、重要ではないが、リッチさ及び調性をテクスチャ分類子に提供する相補的な音楽フラフである。
原子形態等の、各音楽セクションと関連付けられた1つ又は複数の意味論的記述子も存在する。記述子は概して、既存の音楽曲の音楽セクションを批評した音楽学者により導出されることになり、実際にライブラリ内の音楽人工産物の全体コーパス内にある。
各音楽セクション内において、音楽コンポーネント又は音楽コンポーネントの集まり(ハーモニー等の単一のテクスチャ分類子に複数の音楽コンポーネントを含む)は、一緒にグループ化することができ、「卑猥」、「暖かい」、「ざらざらする/安っぽい」、「ふんわりした」、「大敗」、「勝利」、「追憶」、「穏やか」、「滑らか及び追憶の両方が同時」等の意味論的記述子並びに「騒々しい」、「セクシー」、「わくわくする」等のより広義の意味論的記述子及び「明るい春の日」及び「きらめく木管楽器」を含むより多くの他の記述的含意と相関付け/タグ付けすることができる。当然ながら、無数の意味論記述が存在する。異なる音楽セクションは、幾らかの共通する記述的含意を有する同じ意味論的記述子又は同様の意味論的記述子を含むことができるとはいうものの、異なる音楽セクション内の同じ意味論的記述子は、異なる楽器コンポーネント及び/又は異なる数の楽器コンポーネントを有し得る。したがって、意味論的記述子は、メタデータ内等で各音楽セクションにリンク又は関連付けられる。したがって、意味論的記述子は、メタデータ等において、各音楽セクションにリンク又は関連付けることができる。したがって、意味論的記述子は、単一のみの楽器コンポーネントと関連付けることができるか、又は楽器コンポーネントのサブセット若しくは楽器コンポーネントのサブセットの群(相互に排他的若しくは重複する)から惜しくはテクスチャ分類子の群から組み立てることができる。粒度はユーザ選択可能である。
システムが各セクションと共に各セクションのテクスチャ分類子を記憶又は直接記録を提供することが可能であり得るが、システムインテリジェンスが、ヒューリスティックのセット、例えば、計算パラメータを適用して、各属性を生成する(楽器コンポーネントのいずれの組合せが特定の記述子にリンク又は密に関連付けられるかの過去の記録に関して)ことが好ましい。
自動生成系作曲を用いて、本発明者は、特定のテクスチャ分類子(例えば、メロディ)内の楽器コンポーネントが、特徴とカテゴリ分けされた2つ以上の楽器コンポーネントを含むことができないことを識別した。これが該当する場合、同じテクスチャ分類子における特徴は相互に破壊的である。しかしながら、これは、伴奏である音楽コンポーネントには該当しない。したがって、単一のテクスチャ分類子は、伴奏として作用するゼロ又は複数の楽器コンポーネントを含み得るが、特徴の役割を満たしている楽器コンポーネントは、2つ以上(存在する場合)を含み得ない。逆に、記述子内において、複数の特徴は、複数の特徴が(単一のテクスチャ分類子内ではなく、複数のテクスチャ分類子にわたって分布する限り存在し得る。
図3では、例えば、「曲1」の音楽セクション4における記述子「大敗」は、4つのテクスチャ分類子、即ち低音部、ピッチリズム、非ピッチリズム及びドラムから構成される。偶然に、「大敗」は、実際には、メロディ及びハーモニーを更に含むより全般的な記述子「勝利」のサブセットである。この例では、意味論的記述子「大敗」は実際に8つの個々の楽器コンポーネントを有し、1つが、低音部テクスチャ分類子にける特徴コンポーネント「F」であり、2つの個々の楽器コンポーネントは、テクスチャ分類子ピッチリズムにおいて伴奏であり、1つは特徴であり、2つは伴奏である3つの個々の楽器コンポーネントは非ピッチリズム内にあり、2つの個々の楽器コンポーネントはドラム(テクスチャ分類子)内にあり、そこで、1つは特徴(フロアタム等)であり、1つは伴奏(例えば、スネア)である。簡潔にするために、楽器コンポーネント数は、空白/何もない(不在)、特徴の場合には文字「F」又は楽器伴奏数を表すには1つ若しくは複数の文字「A」のいずれかとして各テクスチャ分類子において表現される。ここで「曲2」を見ると、セクション1に記述子がなく、セクション2、4、5及び6の各々に1つの記述子があり、セクション4におけるカウンターメロディには記述子が割り当てられておらず、したがって、含意「暖かい」の寄与はなく、曲2が、両方とも意味論的記述子「穏やか」に関連する、メロディ及びハーモニーの2つの、異なるが独立した特徴を有することが分かる。
本発明の処理システムにより楽器コンポーネントから導出することができる1つの更なる情報、即ち音楽強度がある。セクション間の比較に基づいて、記述子及び/又は音楽セクション全体と関連付けられた特徴及び伴奏のインスタンス数のカウントが解釈されて、そのセクションにおける強度指示を提供する。手短に言えば、コンポーネント数が多いほど、セクションの強度は高くリッチである。
システムインテリジェンスは、音楽セクション間の記述子の共通性及び重要なことに、それらの各記述子と関連付けられたコンポーネントの寄与性を探して、任意の将来の生成系楽曲における異なる音楽セクションにわたり互いを補完することができる使用可能な楽器コンポーネント(又は記述子全体)を識別するように機能する。
したがって、中間要約として、任意の音楽セクションで全体テクスチャに寄与することができる1つ又は複数の楽器コンポーネント及び/又はテクスチャ分類子があり得る。実際に、音楽セクション内において、テクスチャ分類子のセットがないこともあれば又は1つ若しくは複数のテクスチャ分類子のセットが存在することもあり、これらのテクスチャ分類子は、システムインテリジェンスにより相互に排他的又は相補的に扱われる音楽コンポーネントを有し、セットは、分離されうるか、部分的に重なり得るか、又はあるテクスチャ分類子が実際には別のテクスチャ分類子のサブセットであるように階層になり得る。
したがって、再び図3に戻り、音楽セクション3を見ると、システムインテリジェンスは、「ざらざらした」、「安っぽい」及び/又は「ふんわりした」の1つ又は組合せの感情含意を表現するために使用可能な低音部伴奏を識別する。連結(図3において点線で示される)は、単に、システムインテリジェンスが潜在的に、音楽コーパスの解析から導出された音楽テクスチャを、ブリーフィング音大敗、続けて暖かい及び滑らか、続けて勝利及び追憶に従う新しい楽曲にどのように挿入することができるかを示し、音楽セクション1の始まりと音楽セクション2の終わりとの間で降下し、次いで音楽セクション3中、平らになってから急上昇し、それから音楽セクション4では一定のままであり、それから音楽セクション5の始まりで再び急上昇し、それからゼロ強度に次第に下がる。
音楽セクションは離散時間尺度を表さず、実際には、各音楽セクション内に存在する複数の原子形態があり得ることに留意されたい。
図4を参照して、音楽49の第1の曲の音楽セクション40~48の連続及び音楽59の第1の曲の音楽セクション50~58の連続を示し、音楽の第1及び第2の曲が人工産物の[限られた]「コーパス」を形成する。説明のみを目的として、テクスチャ分類子60は、4つ、即ちメロディ、ハーモニー、低音部及びドラムに制限され、簡易化されたマクロ視点から提示される(下位分類及びより複雑な相互関係を有するテクスチャ記述子ではなく)。図4では、寄与派生の音楽コンポーネントは、システムにより解析され、コーパス内の個々の音楽セクションからパーズされた同様の記述子から生成系楽曲70に引き込まれ又は組み立てられる;関係は矢頭を有する線で示される。
ブリーフは、タッチスクリーン又は他のコンピュータインタフェース等を通して好ましい実施形態の処理システムに入力されている。ブリーフは、音楽セクション1、3及び4の強度パターン62~66を規定するが、音楽セクション2のナラティブは規定せず、したがってこれは、テクスチャ連続性を含め、本明細書に全体的に記載される本発明の全ての視点から埋められなければならない。
この時点でテクスチャ連続性の後者の問題のみに対処するために、好ましい実施形態のシステムインテリジェンスは、まず、「粗野及び暖かい」の両方である音楽セクションを組み立てようとする。その記述子を有する対応する全体テクスチャはなく、したがって、処理システムは、曲1からの「粗野」のコンポーネント及び曲2からの「暖かい」のコンポーネントを組み立てる。これらは、共通の特徴を有しないため、全体的に相補的である。テクスチャ分類子及び全体強度は高く、したがって、システムが伴奏数を減じる特定の必要性はない。したがってこれは以下を生成する。
続く音楽セクションにおける中間遷移を無視すると、3番目の音楽セクションは「わくわくする」というナラティブを有する。これに関して、曲2の音楽セクション3から採取することができる直接対応するテクスチャが存在する。生成系作品70の音楽セクション4には、曲1の音楽セクション3における対応する前に解析された「騒々しい」テクスチャも存在する。しかしながら、システムは、音楽セクション1と3との間の未指定スペース80を埋めると共に、「わくわくする」の反映から「騒々しい」の反映に生成系作品におけるテクスチャを変形するために、適合が必要であることを認識する。
音楽セクション5は、規定されたテクスチャを有しず、したがって、生成系楽曲70の終了点又は音楽セクション4を全体的に若しくは例えば伴奏を変形した状態で繰り返す機会のいずれかを表す。ヒューリスティックによる命令に基づいてシステムインテリジェンスにより実行可能な設計パラメータがある。
充填に対処するために、以下の1つ又は適切で論理的な組合せにより充填を達成できるようにする4つの代替プロセスがある:
1.開始テクスチャにおけるコンポーネントから、宛先セクションにおけるテクスチャの要求されるコンポーネントへの変形。これは単純な線形補間の行使であり得る。
2.ユーザにより規定された要求される強度ブリーフを満たす。
3.過去の最も近い楽曲のコーパスを解析して、テクスチャ分類子間の可能性が高い又は許容される遷移を識別することにより、マルコフ手法を適用する。
4.ハーモニー等の特定の所望のテクスチャ分類子に関して選択された強度に基づいて取り組む。
未指定音楽セクションを好むというユーザ入力に関して、好ましい実施形態は、1つ又は複数のユーザ選択可能なテクスチャ分類子のダイヤルダウン値を含むGUIを含む。したがって、ユーザ/プログラマは、複数のテクスチャ分類子間に相対強度レベルを設定することが可能であり、システムインテリジェンスは、比較解析を適用して、直接インフィル又は適合に適した候補を識別するように構成される。
再び生成系楽曲70及びそのテクスチャニーズを見ると、音楽セクション3は、曲2において「わくわくする」の前に解析されたテクスチャ分類を含まなければならず、このテクスチャ分類が適合するため、この厳密なテクスチャ構造を維持する以外の選択はない。第1の問題は、音楽セクション2における未指定中間希望に関連する。前のセクションからの特徴を維持することが一般に望ましく、「粗野及び暖かい」に提示されたテクスチャにおける強度レベルを評価することも妥当であり、全てのテクスチャ分類にわたる楽器コンポーネントの分布の特性を所与として及び粗野及び暖かいの生成されるテクスチャは3つの特徴を含むため、これは比較的高く見える。したがって、ヒューリスティックは一般に、「わくわくする」のテクスチャに向けて変換を開始するためにバリエーションが必要であると定めるが、連続性の視点から、曲2の「暖かい」からの強固に関連付けられたテクスチャを維持するが、純粋に粗野なテクスチャと関連付けられた伴奏を減らすことから恩恵を受ける。「粗野」記述子からの重要な音楽コンポーネントは、残るが、ここで減じられることが注目に値する。代替の方向に移るために、システムインテリジェンスは、粗野テクスチャからの低音部及びドラムからの寄与のいずれかの保持を考慮し - 又は少なくとも考慮することができ -、これは、粗野テクスチャからの伴奏又は特徴コンポーネントの一方又は両方の継続を含む。しかしながら、短い強度の低下に鑑みて、音楽セクション1からの伴奏のより完全なキャリーオーバーは好ましくない。しかしながら、連続した音楽セクションの各々を通したドラムからの特徴のフィードスルーは、ある程度のテクスチャ連続性をもたらす。手短に言えば、システムインテリジェンスは、強度変更を考慮し、同じテクスチャ分類に分類される特徴間の競合を回避しながら、寄与する同数の楽器コンポーネントを維持しようとする。
要約すると、ここでも、処理システム及び論理は、簡単な1つのルールを用いて音楽セクション内の特徴を扱う。単一のテクスチャ分類子内で特徴を実現する任意の楽器コンポーネントは、同じテクスチャ分類子における別の特徴と直接競合することになり、したがって、テクスチャ空間全体を保存するために音楽的状況を回避しなければならない。しかしながら、テクスチャ分類子は、望む数の伴奏を有し得る。これは、テクスチャに目立った特徴を提供する任意の特定のテクスチャ要素が他のテクスチャ要素により破損又は干渉されないことを保証しながら、複数のテクスチャ要素を有する能力を提供する。ジョン・パウエルの上記例では、シンセベースは特徴として分類され、パーカッシブエレキムーとベース及びダブルベースは、伴奏として分類される。これらの2つの補助項目は、メインベースパートと競合せず、特徴ベースラインを有する任意のそのようなテクスチャに実現可能に追加することができ、他方、特徴ベースは、特徴ベースパートを有する任意の他のテクスチャに適合しない。
ここで、テクスチャ分類子の説明は以下である:
メロディ
ヒューリスティック的により重要なのはメロディ又はハーモニーのいずれかのパラドックスは、数世紀にわたる議論のテーマであった。好ましい実施形態のシステムインテリジェンスは、形態がコードの流れ及びペースを通して生成されるというスタンスをとるが、メロディ経過音及びハーモニック置換 - これらの両方ともテクスチャコンポーネントとしてメタタグ付けることができる - を通してコード又はコードのストリングの含意を変えることが可能である。
主に、メロディは、典型的には、全て特徴として分類されるが、幾つかのまばらなメロディコンポーネントは伴奏メロディと見なすことができ、即ち所与のメロディに反せず、特徴メロディが消費するテクスチャスペースを消費しない。低音部メロディの場合、ヒューリスティックのカテゴリは、メロディ及び低音部並びに特徴の両方としてタグ付けされる。このように、低音部領域においてテクスチャの対立はなく、特定の伴奏低音部コンポーネントはなお、テクスチャに挿入することができる。
特徴としてもタグ付けられるメロディとして分類されたテクスチャコンポーネントは、所与のテクスチャのスケール又はモードにある種の代替をうまくもたらし得る。例示的なボーンスプレマシーの場合、頻繁にチェロで見られ、フラット2度を有する下行メロディマイナースケールの周りを回転するメインメロディ特徴が映画全体を通して存在する。このメロディコンポーネントは、ナチュラル2度を使用している任意の他のメロディコンポーネントとしっくりこず、したがって、テクスチャの所与のモード及び任意の付随するメロディを変更する。任意の所与の時間に提示することができるのは1つのみの特徴メロディコンポーネントのみであるため、他のメロディ特徴はオーバーライドすることができない。
カウンターメロディ
テクスチャ要素のこのカテゴリは、メロディにリンクし得るか、又は単にメロディが存在し得る時間空間の随所に存在するメロディ要素であり得る。これは、典型的には、ギターのリフ、オーケストラテクスチャにおけるメロディブリッジ特徴及びモード及び調整を強調するが、強いメロディパターンを呈さないメロディコンポーネントに当てはまる。
典型的には、カウンターメロディは他の多くのものと共に演奏することができ、したがって、伴奏と記される。しかしながら、特定のカウンターメロディは、メロディと協働するように設計される場合、メロディと相互作用している他のそのようなテクスチャ要素が邪魔にならないことを確実にするために、特徴として記され得る。
ハーモニー
ハーモニーの特徴としてタグ付けられたコンポーネントは、コードと共に(ジャズで知られるように)又は#11コードのように複数の拡張を有するコードと共に何かをすることを述べる。メロディコンポーネントと同様に、ハーモニー特徴と記されたコンポーネントは、互いと干渉すると思われるため、そのように記される。所与のスケールの変更を望むメロディコンポーネント及び所与のコード内の音を変更するハーモニーコンポーネントに対する潜在的に衝突する要求にどのように対処するかという問題については、後に考察する。
低音部
低音部特徴は、低音部範囲におけるテクスチャスペースを占め、これで典型なのはエレキ又はシンセベースラインである。特徴ではなく、伴奏として記される低音部コンポーネントは、単にコードの低音を占める。
ピッチリズム
これは、他のそのような調整されたコンポーネントと衝突する恐れのある調整されたコンポーネントを有するトリップホップループ等のピッチの付いた任意のパーカッションコンポーネントである。オーケストラの調整されたパーカッションも組み込む。
非ピッチリズム
このテクスチャコンポーネントは、シェイカー、ティンバレス、ハイハットパターン等の楽器に確保される。このスペースにおける特徴の例は、ローグワン(Edwards,2016)の1:17及びFuneral Pyre(Crowley&Greengrass,2004)全体を通して等の多くの現代映画の楽譜で聞かれるパワードラムパターンのタイプ又は任意の他のタイプの目立つ非ピッチ特徴であろう。これらのダイナミックなローリングパワードラムモチーフは、他のそのような非調整特徴によって割り込まれた場合、テクスチャ的に損なわれる。
ドラム
これは、ドラムキットからの全てのリズムパターンを包含する。特徴として記される場合、これらは、他の付随するパターンが従属する特定のグルーブの外にあるドラムパターンである。非特徴ドラムパターンは、軍のドラムパターン、即ちそれら自体が内包性を有するが、グルーブの主題に干渉しないパターン等の補助コンポーネントである。
テンポ及び時間シグネチャの変更に関して、本発明により提唱される手法は、タイムラインを不変にする。映画は秒単位及びフレーム単位で時間にわたり綿密に計画される。しかしながら、本発明の関連する態様内の実施形態は、音楽ルーラーでより複数又はより少数の小節を作成するようテンポを変えるように構成される。テンポが時間ルーラーに影響しない他のシーケンサソフトウェア(Cubase、Logic Pro、Pro Tools)と異なり、システムインテリジェンスの機能は、供給されたナラティブに関して、幾つの音楽マテリアルが所与の要件に適合するかを評価し、次いで、生成系作曲に最良に適合する解を生成する。タイムラインは複数のテンポ変更を有することができ、それにより、キュー全体を通して異なるペースを可能にすると共に、ヒットポイントに到達する時間調整を可能にする。
セクションB
I.Heresy生成系作曲システムの生成系機能
このために、本発明の生成系作曲システムを支えるアイディアを取り巻く概して哲学的な考察が存在してきた。
このために、実際に、好ましいシステムの階層ワークフローの概説が存在してきた。これより、この階層を詳細に調べると共に、各レベルで実行されるタスクを調べて、本発明の態様の生成系方法を紹介する。
これより、本発明の態様のHeresyシステムがどのように具現化され、機能するかの全体原理についての初期概説を提供する。この概説は、種々の作曲タスク - コードの記述からテクスチャの記述まで - がどのように扱われるかについての階層を説明する。第2に、論理タスクを処理するためのヒューリスティックメカニズム及び編成構造について説明する。最後に、好ましい特性、機能及びコンポーネント間の相互作用についての詳細を提供すると共に、楽曲の生成に関わる好ましいステップについての詳細も提供する。
II.Heresyシステム概説
図5は、複数の相補的であるが独立した本発明の態様を具現化したHeresyシステム内の異なる階層100の概要を与える。これらの層は上から下に流れる。
第1に、ブリーフィング要素102~106がユーザから要求される。第2に、これらの要素102~106は生成された要素108とインタレースされて、生成されようとしている音楽の曲のタイムラインを埋める要件の完全なセットを作成する。ここから、システムのヒューリスティックは、システムインテリジェンスにより解釈され適用されるようにコードスキーム110を生成することになり、これに対してテクスチャが動作し、一緒に一続きにする。
これは、「原子形態」を利用するメカニズムを通して達成される。原子形態は、メタコードスキームであり、したがって、コヒーレントなコードスキームが記述/生成され、最終的に楽曲が作成される原理及び出発点である。各々は、解析された音楽表現の特性に依存する長さを有する様々な持続時間の音楽のスニペット(即ち音楽セクション)であり、したがって、各々は、好ましい実施形態の生成系システム内の構築ブロックを表す。各原子形態は、既存の独立した楽曲のライブラリからの解釈解析から導出され - 手動で又はWHATを使用してコンピュータベースで -、将来の楽曲使用に向けてアクセス可能な索引付き感情記述記録として記憶される。したがって、原子形態はメタコードシンタックス記述子である。各々は、前に解析された作品からのコードの記憶された小さいスニペットと、ヒューリスティックの生成系セットとを有し、ヒューリスティックの生成系セットは、実行されると、記憶された同様の含意特性を有するスニペットのバリエーションを生成することができる。
参照番号120~124等の原子形態はヒューリスティックの生成系セットを含み、ヒューリスティックの生成系セットは、実行されると、記憶されたコードスニペット(先に解析された作品から抽出される)のバリエーションを生成して、良好に編成された形態、ナラティブ方向及び目的を有するコードスキーム128を作成する。原子形態は、特注のシンタックスメカニズムを通して選択され、一緒に一続きにされる。次いで、これらのシーケンシャルコードスキームを使用して、テクスチャ生成器130に、音楽を編曲するハーモニックパレットを与える。Heresy生成系作曲システムの最終出力は、テクスチャ生成器内のヒューリスティックから作成された音楽132である。
各原子形態は、内部及び互いに対して特定のシンタックスを有するが、特性的には自己内包的であり、各原子形態は以下の信号特性、生成系特性又は属性を具現化又は保有する:
1.ピッチ及び調性の両方を有し、したがって原子形態のキーセンターを有する局所主音に対するインターバル距離として表現される局所主音内のコードの特定のセット;
2.術部であって、
(a)疑問、応答又はステートメントの1つである音楽フレーズ間の論理的演算選択に基づき、任意選択的に、原子形態が、現在の主音から次の原子形態における新しい局所主音に変化できるようにする転調器として動作するか、前の原子形態が異なる主音を有することを示す転調された原子形態として動作するか、それとも転調する原子形態又は転調された原子形態の両方として動作又はそれらのいずれとしても動作しない(局所主音が前の原子形態及び後の原子形態に対して同じままであることを意味する)かに基づき、更に任意選択的に、原子形態が特定の音楽曲の始めに出現するか、終わりに出現するか、それとも始めでもなく終わりでもない場所で出現するかに基づく形態関数定義、及び
(b)隣接する原子形態間の(カデンツ)又はシーケンシャル進行の特性を確立する進行記述子、即ち時間にわたる原子形態スキームの通路
から形成される術部;
3.コードスキーム内のコードのセット又は同じ形態関数を達成し、したがって、同様の関連付けられた感情/音楽的含意を有する同じ若しくは異なる主音におけるコードの多くの異なるセットの生成及びブリーフィング空間を埋めるために任意の所与の長さの音楽時間に、生成された任意の数のコードを時間的に配置するヒューリスティックをサポートするヒューリスティック/ルールの生成系セット;
4.原子形態が本明細書に記載のヒューリスティックに従ってコードスキームで使用される場合、聴取者が経験する1つ又は複数の現実的で明白な感情応答を明確に述べる感情含意とのタグ付き記述関連付けであり、そのような記述関連付けは、音楽要素、例えば、コード、コードタイミング及び主音へのコード距離への関係を提供する。これらの記述関連付け又は「プレースホルダ」は、任意のナラティブブリーフで使用される用語との一貫性を呈するように、ライブラリからとることができるが、本発明のシステムの異なる部分で使用される異なる記述子間の関連付けが、同等、同様又はそれらのいずれでもないものとして意味論的空間で解決することができる場合、これは要件ではない;及び
5.音楽的意味をなし、近隣の原子形態と記述可能な関係を有する最小音楽フレーズ;及び任意選択的に、
6.(例えば)一連の特定の前奏曲又は一連の映画の名称を含む具体的な詳細の中でも特に、例として、作曲家の名前、楽器及び/又はジャンル等のメタタグ。これにより、ブリーフィング考慮事項が識別されるとき、作曲の生成系フェーズにおいてスタイルを見つけるための参照をより容易にすることができる。このリストは、ブリーフィングメカニズムからの更なる原子形態改良を可能にする。
7.原子形態は、それ自体の中央に主音を含むことができない。
原子形態は、ハーモニック構造と、楽曲的に良好な形態に従うハーモニック構造を生成する能力とを提供し、テクスチャを定義し、生成系楽曲においてテクスチャ連続性を維持できるようにする分類された状態でテクスチャコンポーネントリストを記憶する。
したがって、システムは全体として、人工産物のコーパスから、音楽的に良好な形態で機能した前の遷移を識別するマルコフ連鎖関連付けを通して、先行又は後続する原子形態のリストにリンクされる原子形態のリストを生成し記憶するように機能する。
述部の問題並びに疑問、応答及びステートメントが何を意味するのかに戻る。
疑問とは、音であって、ハーモニー又はメロディ内に出現しており、且つそれらが原子形態の前記局所主音のキーセンター外であるために疑わしく存在する音によって示される、心の落ち着きを必要とする緊張を示唆するコードスキームである。複数の連続した疑問は、音楽的に尋ねられ得る。
応答とは、局所主音又は応答原子形態の任意の新しい主音のいずれかのキーセンターを補強することにより、精神の視点からの疑いのあるトーン(即ちピッチ)又は音(即ち持続時間を有するピッチ)の存在を解決するように作用する疑問の解決である。この一例は、ジョン・ウィリアムズによるスーパーマンからの「愛のテーマ」のオープニングの2フレーズである。
ステートメントとは、音楽的疑問から全体的に独立しており、且つ解決を通した解放を必要とするいかなる有意味な音楽的緊張も暗示又は誘導もしない。ステートメントは、疑問でも応答でもない。
したがって、原子形態に関連する本発明の態様は、コードスキーム内の全てのコードが局所主音、例えば、C又はCのメジャー及びマイナースケールのCに関連することを分かっている。更に、コードのシーケンスは、コード間の関係の理解よりも価値が低い。音度内のMIDI分離(即ちコードIIマイナー=>Cm及びGのコードV)に関して、Cの局所主音を有する、例えばDmとGとの間の関係が分かる場合、コードのこのシーケンスは任意の異なるキーセンターで繰り返すことができる(例えば、コードIVマイナー=>Gの局所主音におけるI)。
述部も、上述したように、(排他的OR関数、即ちXORにより論理的に扱われる疑問、応答又はステートメントの指示の他に、最低限として)4つの(カデンツ)進行(コードのシーケンス/変位が数学的に表現可能ではない)又は2のシーケンス進行のいずれか一方を含まなければならない。
(カデンツ)進行は、4つの代替形態及び主音を変更する表現方法の1つをとる。したがって、(カデンツ)進行は、処理中に論理的にXOR演算されて、以下の1つを識別する:
1.原子形態の始め(C)に出現する主音;
2.原子形態の終わり(C)に出現する主音;
3.原子形態の始め及び終わりの両方(C)に出現する主音;又は
4.原子形態内の主音の不在ヌル外観(C)。
ここで、2つの代替のシーケンス進行により、終端を可能にし、これらは、
1.インターバルベースのシーケンシャル進行Sであって、コードの後には、別のコードとの数学的表現可能な距離が置かれた関係が続く、S及び
2.調性ベースのシーケンシャル進行Sであって、局所主音のスケールと、永遠に繰り返すことができる数学的に表現可能な関係を有するコードシーケンスとに関連し、局所主音の調性に基づく、S
のXOR演算された形態で現れる。
したがって、(カデンツ)進行は、原子形態の主音のキーセンターに関連して一連のコードとして一緒に一続きにされる。コードを互いから選択することができる選択肢は、前の曲の記憶された全ての解析から抽出される。これは基本的に、マルコフ連鎖を使用して見つけられるが、所与のキーセンターに関連して見つけられるコードの範囲である。この簡単な例は、Cのキーにおいて、Dmin又はFがG7の前に来ることができると観測し、したがって、調性がCである場合、G7に先行するコードとしてそれらのいずれかを選択することができることであり得る。次いで、Dmin又はFの選択されたこのコードに先行して、同様の動作を実行することができる。
シーケンス進行は、バッハのCマイナー前奏曲の第5から14小節(セクションDを参照されたい)の2番目のセクション等の原子形態の主音の調性に基づき得るか、又は調性を全体的に無視し、単に5度圏等の所与のインターバルシーケンス又はマイナーサードで離間されたメジャートライアドの立ち上がりシーケンスに進み得る。
(カデンツ)パターンの場合、主音が原子形態内に存在する場合、転心であると言え、転心から、ある原子形態から次の原子形態に到達し、ある原子形態から次の原子形態に離れることができる。原子形態はそれ自体の中央に主音を含むことができないが、これは、周知の文化的に受け入れられた、トニック進行への - ドミナントへの - 第2転回主音で頂点に達するフレーズのコードスキームの原理を除外しない。したがって、正確に言えば、原子形態は、(カデンツ)進行リストにおいて、先に強調した4つの方法の1つで出現する主音を有する。
(カデンツ)シーケンスの考慮事項は、キーを変更する能力である。キー変更の場合、新しい主音がコード鎖の終わりにあるとき、単に、それは次の原子まで主音と見なされないと述べる。これは、新しい主音のシーケンスにより転調がもたらされることを意味する。原子形態と異なり、これらの主音の関係は外部データと相対せず、代わりに、感情タグを通してカテゴリ化され、感情ブリーフィングメカニズムのコンポーネントを提供する。新しい主音は音楽曲の任意のポイントに出現し得るが、このメカニズム内では、変わることができる前、少なくとも1つの原子形態シーケンスを有することになる。このシーケンスは、局所主音の1コードのみであることが可能であり、その場合、ブリーフィングメカニズムにおいて、そのような変更が頻繁すぎないよう確実にするように注意を払わなければならず、さもなければ、一連のランダムコードが不適切に生成される恐れがある。
シーケンス進行の場合、2つの可能性がある:i)コードスキームが主音に関連する又はii)コードスキームは、主音を無視するコードの通常シーケンスである。両方の状況で、シーケンスはある時点で分解される必要がある。これはエスケープコードにより達成される。エスケープコードは、局所主音を問わず、直前のコードに関連する。エスケープコードは、シーケンスを分解し、次の原子形態へのブリッジを確立するために使用される。したがって、エスケープコードは、典型的には、キーセンターの変更をもたらす。
一連の音楽曲から原子形態が解析(したがって導出)され、進行記述子がラベリングされると、原子形態は、ジグソーパズルのように一緒に一続きにすることができる。別の原子形態と同じ進行記述子を有する任意の原子形態は、交換可能に置換することができる。したがって、マルコフ連鎖の原理を使用して、一連の原子形態相互関係を生成することができる:任意の原子形態と、その原子形態に先行又は後続する原子形態との間の関係は、進行記述子及び述部を見ることにより確立される。これは図6に反映されており、図6は、原子形態間の関係と、識別された感情含意のコード遷移をサポート可能な形態実行可能な連結された原子形態の識別から生じる許容されるコードスキーム構築を有する、結果として得られるマルコフ連鎖602とを示す。例えば、図6における連鎖を生成した限られたコーパスにおいて、コードVからコードI又はコードIVのいずれかは許容されるが、コードIImへの遷移は許容されず、その理由は、(a)コーパスに確立されたパスがなく、(b)コードVとIImの感情含意間に共通の記述子がない(暗黙的に)ためである。図6の場合、実際には、コードIImへの確立/認識された関係は、存在しない(図6は高度に簡易化された図であることを理解した場合)。宛先としてのコードIVからの原子形態遷移は、図6では、コードIIIm及びVから並びにコードI又はコードVのいずれかへの前方への許容される遷移として示されている。これらの全ての遷移は、音楽情報検索(MIR)技法の自動使用により又は音楽学者による手動符号化により、音楽の過去のコーパスのクリティカル解析により実行されている。
したがって、原子形態xが、原子形態yが続くというコーパス内の一例を有する場合、yと同じ記述子を有する任意の原子形態はxに続くことができる。これは時間的に任意の方向に機能することができ、したがって、同じ技法を使用して原子形態に先行することもできる。最後に、使用されている任意の原子形態の重みは、コーパスで見つけられる発生回数に基づき、これは、新しい楽曲内に特定の原子形態を選択し使用する確率を提供する。
転調は、2つのキーセンター間にコントラストを提供し、時間を跨ぐ構造を提供するために必要である。これにより、生成系楽曲をその音楽の行程に沿って移動させるためのブリーフと同調したヒューリスティックの適用が可能になる。原子形態内に存在する変調器Morは、原子形態の終わりに新しいキーセンターへの明白な遷移が存在することを確実にする。原子形態、即ちMed原子形態が転調される場合、過去解析により、転調原子形態のインスタンス生成時、キーが変更されたことが識別されている。したがって、転調された原子形態は、ペースが変更された場合又は映画シーンのナラティブを変更しなければならない場合等、感情的に重要な知覚可能な周囲及び状況における変化を強調する。したがって、転調器Mor及び転調されたMed原子形態は、排他的、即ちOR演算論理関数である。
任意の所与の原子形態が、疑問、応答及びステートメントのタグを除き、複数の形態のタグを同時に有することが可能であり、それにより、原子は、一度に疑問、応答及びステートメントの1つのみを有することができる。
したがって、潜在的に、6×3×4×3=216個の別個のリストが述部組合せに存在する。リスト数は、リストを組み合わせることにより又は任意選択的な形態関数述部の1つ若しくは複数を無視することにより縮小し得る。各述部リストは、上から、システムインテリジェンスへのブリーフィングナラティブ入力(例えば、ユーザインタフェースを通した)及び更に各テクスチャとリンクされた意味論的記述子の両方に結び付けることができる現実世界の感情経験、フィーリング又は感情含意を定義する各内容にリンクされた状況記述子を含む原子形態で埋められることになる。
図7は、種々の態様及び実施形態の組合せにより達成される生成系作曲のメカニズムの全体像を提供し、任意の組合せの範囲及び深さは、単に洗練性、実装複雑性及び/又は最終的に出力される生成系信号の取得のレベルを変える。より具体的には、図7は、ヒューリスティックが論理的にどのように編成され、処理されるかの概略全体像である。
ヒューリスティックが本発明の概念に従って実行するタスクから独立して、図7は、それらを編成するヒューリスティックメカニズムに必要なアフォーダンスを示し、これらを以下として見なす:
1.ヒューリスティックがどのように処理されるかの順序付き方法が存在する。これは、タスクに付された番号を辿り、次いで続くサブタスクを辿ることにより図7に示されている。
2.タスクが実行される可能性の全体割合が存在する。これは、タスクボックスの前方の割合によって表されている。
3.サブタスクへの分岐メカニズムが存在する。サブタスクが処理される可能性の割合は、各分岐をとる確率の重み付けメカニズムとして使用される。
4.サブタスクの全て又は1つのみを処理できるようにする論理演算子が分岐メカニズムに存在する。論理演算子(AND又はXOR)に応じて、サブタスクの1つ又は全てを処理する。図7では、タスク7はタスク6からのXOR分岐に依存し、したがって、タスク7は、タスク6に付されたサブタスクのいずれか1つにより実行される。これらのサブサブタスクの1つが処理される可能性は25%であり、他が処理される可能性は75%である。
5.タスクがヌルである能力が存在し、更なるサブタスクのみへの分岐を提供し、この一例は図7内のプロセス6に見ることができる。
本発明の生成系作曲システムは主に、コードを実行する特注エキスパートシステムに基づくソフトウェア実装システムである。したがって、システムは、理解されるように、1つ又は複数のプロセッサを含む。このシステムインテリジェンスは、メモリに記憶されたコードを要求し、データベース又は他のメモリストレージ等のストレージからデータを検索し、データを操作し、ストレージにデータを返す。データベースは、エキスパートシステムにローカルであり得る一方、リモートに配置され、ワイドエリア若しくはローカルエリアネットワーク及び適切なネットワーク接続を介してアクセス可能であり得る。同時に、ユーザインタフェースは、限定されないが、インタラクティブゲームの特注ユーザ中心及び/又はユーザ選択可能なサウンドトラックを含む再生可能メディア製品として、記憶(1つ又は複数のデータベースへの)、操作及び/又は出力(ストリーミングされるか、ダウンロードされるか、それともインプリントされるかを問わず)を理由として、データ及びメディアコンテンツをシステムの任意の論理的に適切な部分にアップロード、ダウンロード及び/又はストリーミングする能力を提供するコンピュータ又は他のクライアントデバイスであり得る。手短に言えば、基礎となるシステムアーキテクチャは周知であるが、処理及び生成系作曲の手法は、特性及び品質を改善した、操作されたオーディオ信号データ(それ自体のため及びそれ自体の目的のために映画ブリーフと同調するか否かを問わず)を効率的に生成する。システムは、オーディオ信号処理の分野、特にオーディオ作曲の状況で大きい進歩を提供する。
Heresyの作曲出力は、生成系メカニズムの2つの要件を抽出することができる(例えば、NLPにより又は選択的に定義可能なタイムラインに関連して呈された特定の疑問に対するより構造化された応答により)このブリーフィングメカニズムから導出される。2つの要件は、
1.メカニズムが、音楽技能のない個人によりブリーフィング可能であり、
2.ブリーフが、コミッショナーが楽曲の任意の所与の時点で望む含意についての情報を含むことができること
である。
これらの要件を満たすために、システム、特にシステムインテリジェンスは、感情含意に関する入力に応答しながら、いかなる熟練した音楽入力もなしで音楽出力を生成可能である必要がある。これは、階層生成系メカニズム100を通して達成され、階層生成系メカニズム100では、コードスキーム、テクスチャ及びメロディが、ブリーフィング要件に関して作成される。このメカニズムは図8に表されており、図8は、所与のブリーフから楽曲を作成するための3つの主要な方法ステップ(並びにデータ管理及びデータ処理を含む内部処理)を示している。ステップは以下である:
1.原子形態の生成102、
2.コードスキームの生成104 - このコンポーネントは、ブリーフィング要件に関連し、ブリーフィング要件を満たすコード列を作成する。これは、コードスキームが関連する原子形態の生成系ヒューリスティックから作られるためである。
3.テクスチャの生成106 - このコンポーネントは、生成されたコードスキーム及びブリーフィング要件に基づいて楽器の音楽マテリアルを生成する。
システムは、データベース110に記憶された音楽コーパス(又はその少なくとも一部分)に対して解析を実行する。これにより、過去に記憶された音楽は原子形態に分割され、各原子形態は、上記述部(又はそのサブセット)及びその原子形態の関連付けられた感情含意を反映するために各原子形態にリンクされた感情記述子の両方に関して分類される。原子形態は、(2つの例示的なカテゴリを挙げると)ジャンル情報及び作曲家等の補助メタデータを有することができる。解析及び分類/カテゴリ化は手動であり得、音楽学者が情報を得た上で音楽のパーズを行って、例えば、各原子形態の開始点及び終了点並びに原子形態の他の特性及び特性(述部に関して本明細書で考察したように)を識別することにより行うことができるか、又は分類及び評価は全体的に若しくは部分的に、述部を表す抽出されたファイル特性にコンテンツの意味をインポートすることができるトレーニングされたAI/ニューラルネットワークの使用に基づき得る。そのようなAIシステムは、例えば、米国特許出願公開第2020-0320398号明細書「Method of Training a Neural Network to Reflect Emotional Perception and Related System and Method for Categorizing and Finding Associated Content」及び関連するAI技術における他のそのような特許に記載されている。
図8内のフロープロセスは、ユーザブリーフ114も曲ファイルに影響を及ぼすことができることを示す。この程度まで、曲ファイルは、単にデータベース全体であり得るが、特定のジャンルの作品、例えばジャズ又は特定の作曲家、例えばバッハ及びアーティスト、例えばピンクフロイドが曲ファイルの生成に使用されるべきであるという要件を反映したサブセットであろう。これは、単に後続及び先行のコードツリー又は原子形態ツリーを生成する際の複雑性を減じる。
マルコフ連鎖手法を使用して、曲ファイルに引き込まれる、各原子形態から前方向及び後公報の両方の延びる接続が、確立されマッピングされる(112)。基本的に、このツリーは、先に解析された音楽曲における原子形態間に存在する許容されるパス/遷移を識別する。このプロセスは、次いで、ブリーフと同調した特定の原子形態の生成において改良され、各原子形態と関連付けられた感情含意は、ブリーフィング要件と突き合わせてシステムインテリジェンスにより解決され、それにより、音楽的及び感情的の両方で関連があると共に、基礎となる音楽的特性の点で密接な関係のある関連する原子形態を選択する。ツリーの形成及び実際に原子形態における参照と規定されたユーザブリーフにおける参照との間の感情含意の同調は概して図6に反映されている。手短に言えば、実行可能な関係間遷移がツリーにおいて識別され、これらの識別された関係間遷移は、続く作曲目的で使用するために記憶される。ここでも、ブリーフの要件、例えば、指定された開始時間及び停止時間を有する小節内のシーンの下品なヘビーロックの必要性がマルコフ連鎖に関連付けられ、それにより、関連する原子形態間の関係は、ブリーフと同調し、作曲パスに沿った遷移への作曲選択肢を提供する。
システムに入力されたブリーフ114に基づいて、システムインテリジェンスは、曲ファイル(又はより広範囲のデータベース)内の原子形態117からオープニング原子形態118を選択し(116)、この原子形態は、ブリーフのシステム解釈された要件に対応する。ここでもブリーフを参照して、原子形態列の作成が行われ(118)、原子形態列は、オーディオに中断を含まないエンドツーエンドの作曲を提供するために自動的に埋められなければならないブランク期間を含み得る。プロセスは、次いで、コードスキーム生成104に移る。
作業可能な入力を許容するブリーフィングツールに関して、そのようなツールのこの一般要件は、時間にわたりペースをマッピングする能力、即ち音楽時間ルーラーである。好ましくは、テンポ及び時間シグネチャ変更を通して適合可能であるべきであると共に、以下の識別を可能にするように十分に受容的であるべきである:
1.ヒットポイント、
2.持続した特徴、
3.言説の選択、
4.コードスキーム要件であって、
(a)楽曲ペース:時間にわたるコード、転調、調性シフト、
(b)感情含意(ベースペダル、5度圏、ムードタグ)、及び
(c)形態関数
を含む、コードスキーム要件、並びに
5.テクスチャ要件。
ブリーフ充填は、制約を満たすメカニズムであり、一般的なアルゴリズムにより又は考慮事項及び推奨を含むより骨の折れる作業で達成し得る。充填挿入プロセスは、ブリーフィングメカニズムにより、原子形態要件リストの使用を通してタイムラインの任意のポイントで原子形態を指定できるため、生じる。このリストは、必ずしも互いにぴったりとくっつく必要はなく、原子形態間にギャップを残す一連の原子形態を含む可能性がより高い。制約を満たすメカニズムは、リスト内のギャップを埋めるように動作し、これは好ましくはヒューリスティックを通して行われる。これは、原子形態に要求された最も人気のあるパラメータの局所的処理を与える。次いでシステムは、これらのパラメータを有する原子でギャップを埋める。したがって、このシステム中心の修正又は解釈の要件は、供給されるブリーフの広さに依存する。ギャップの充填は、典型的には、以下を考慮し、説明又は補償する:
1.キューの各テンポ変化内の1小節当たりのコードの平均長及び平均数。
2.値を有する要求パラメータを有するギャップ。
3.最終原子のトランケーション及びフィットを達成するために適した調整パラメータ。
4.特に、所与のテンポセクション内の1小節当たりの平均コード数に最も近い数を反映するようにコード密度が各原子で設定されるような、所与のテンポセクション内の1小節当たりの平均コード密度。
ブリーフィングされたセクションは、典型的には、感情含意、形態関数及びメタタグの形態のユーザにより要求された特性を有することになる。選択肢のリストを改善するために、形態関数、次いで感情関数、次いでメタタグの順に優先順位を付ける。まず、リストが要求された形態関数を有する任意の1つ又は複数の項目を含む場合、適切な形態関数タグを有しないリスト内の全ての他の項目を除去する。これは、次いで、感情含意及び最後にメタデータに対して繰り返される。次いで、一般に最大数のタグを満たす選択肢を選択する。
なお抽象レベルであるが、コードスキーム鎖は、コード間の位置タイミングを含め、作曲のハーモニックマップに必要な全ての情報を含む。この情報から、関連する音を任意の所与の時点で作成し、それらをハーモニック及びメロディ部分等のテクスチャ要素に適用することが可能である。
ブリーフ114から、主音が選択され(120)、これは、プライマリ/プライオリティトーン及び利用可能なコードを提供する(主音ピッチ及び調性1220は、IとVIIとの間の音変位に関して表現される(音度の全音からのマイナーオフセットを含む)。ブリーフに関して、コードスキームが継いで作成され(124)、コードスキーム列126が記憶される。
ここでも、ブリーフ及び記述子対応性又は組み立てられたコードスキーム鎖における原子形態の感情含意間の類似性に関した関連するテクスチャグループファイルの抽出132に続き、ブリーフを参照してテクスチャ生成が適用される(130)。したがって、テクスチャコードスキームを記述すること134は楽曲の生成に繋がり、楽曲は、場合により、オーディオブロードキャスト又は記憶のためにシーケンサに送信することができる(138)。
原子形態の問題に戻り、それに関連する恩益をより深く見て、本発明者らは、ハーモニック状況が、作曲でなされる選択の原動力であることを認識した。これから、別のコードが後に続く任意の所与のコードの受容性は、近隣コードにより作られるハーモニック状況及び共通主要とのそれらの関係に依存し、これは心の認識及び物理的満足感に現れる。階層的に、コードは近隣に依存するが、コードの隣接シーケンスも、互いに関連する自己内方式実体である必要がある。したがって、この発覚に従って、当然、シーケンスは、主音への認識可能なカデンツで終わるか、始めに主音を有するかそれとも終わりに有し得るか等の共通するハーモニック特性に応じて代替シーケンスに代入することができることになる。本発明内において、特定のコードスキームを逐語的に繰り返すことは、任意の所与の解析されたシーケンスを生成することができるのみならず、同様又は異なる長さのコードシーケンスの異なるバラエティをその場所で生成する論理を有するヒューリスティックの作成を通して回避される - シーケンスがある種の特定のコードを通してどのように接続するかの任意のルールが、システムのコード選択を制限し得るが、それにより、シーケンスにわたる楽曲サウンドフローが保証されることになる。
シーケンスは、主音の発生に関してルールを通して区切られカテゴリ化される。知覚的に、シーケンスは音楽フレーズと同様の長さであるように見えるが、これは当てはまらないことがある。これらの小さいシーケンスは上記原子形態である。原子形態は、なお聴取者にとって音楽的に意味をなしながら、独立したシーケンスとして作用することができる可能な限り小さい構築ブロックである。原子形態はある種の特性を有し、同様の特性を有する原子形態は互いと置換することができる。したがって、本発明の一態様は、原子形態の特性及び構成部並びに原子形態を組合せ得るメカニズムを定義する。
進行記述子が、潜在的なコードシーケンスの生成を完全に思い通りにした場合、結果として、曲は、基準に合うが、コードが完全に流れている可能性がある曲の中央に由来するヒューリスティックにより生成された進行で開始し終わることになるであろう。これは一般に、自己内法的なナラティブを時間的に届けようとしている音楽曲に良好な終わりと始まりを与えることになる。開始又は終了タグを有する原子形態は、それらのヒューリスティックがそのような設定に適切であることを意味する。
先に示したように、疑問タグ及び応答タグは別の重要な考慮事項に由来する:現在のローカル原子形態キーセンター外からのコードを含むコードシーケンスの問題。一例は、スーパーマン(Spengler&Donner,1978)へのジョン・ウィリアムズの楽譜からの愛のテーマであり、それにより、テーマの提示部には以下のコードシーケンスが付随する。
Eb=>F/Eb(又はEb#11 13)=>Ab/Eb=>Eb
この例を見て、このコードスキームを自己内方式ユニットとして保つ又は疑問及び応答である2つの原子形態に分解することの結果を調べることができる。
コードスキームがそのまま保たれる場合、得られる情報は以下の通りである。
1.Ebコードの後、F/Ebコードが続くことができ、
2.F/Ebコードの後、Ab/Ebコードが続くことができ、
3.Ab/Ebコードの後、Ebコードが続くことができ、
4.このコードスキームは、局所主音で始まり終わる任意の他のコードスキームに代入することができる。
しかしながら、これとは対照的に、好ましい実施形態の手法は、このコードスキームが疑問及び応答であると考え、それは、上記ポイント1から3におけるコード情報の全てを取り込むことが可能で実行可能であることを意味する。本明細書に記載の本発明の手法から、始めに主音を有するが終わりには主音を有さない疑問フレーズは、終わりに主音を有する応答フレーズと結合することができる。これは、このコードシーケンスをより小さい置換可能な個片に分解し、これらの個片を変更して興味を導入する能力を与える。このスーパーマンの例を2つの原子形態に分割することで、この粒度により、{a,b,a,c}を呈する一連の原子形態の連結が可能になる。これは、実際には、原曲が行うことである。次の2つの原子形態を見るようにこの例を拡張する場合、原譜では疑問が繰り返されるが、応答は異なり、新しい興味をもたらす。
Eb=>F/Eb=>Ab/Eb=>Eb=>Eb=>F/Eb=>Abm=>Bb7sus4
要約すると、明らかにこの最初の4小節フレーズは、始まり及び終わりで主音とカデンツするコードスキームとして表現することができるが、これは生成の一連の機会を逃す。これは、コードが所与の局所主音キーセンターからのものでなければならないというルールをもたらす。所与のスケールで根音を変更するコードの場合、この新しいコード又はコード列を終わり又は始まりに置くサイズに原子形態を分割する。次いでこれにより、新たに暗示されたキーにこのコードでピボットする能力又は進行において残りのコードを介して局所主音に戻る能力が与えられる。最初の原子形態を形態関数疑問タグでタグ付けし、2番目の原子形態を応答タグでタグ付けする。この分類プロセスは、良好な形態を満たす楽曲構造のバリエーションへのより大きい機会をもたらすため、生成系作曲にとって重要である。
原子形態内において、好ましい実施形態は、2つのコード情報、即ちコードタイプ及びコードの低音部を記憶する。一例はFm7/Bbである。それらの特定のタイミングは無関係であり、その理由は、ブリーフィング要件に応じて原子のヒューリスティックにより生成されるコード数がより多いこともあればより少ないこともあるためである。これらのコードを原子形態内に記憶する2つの理由が存在する。第1に、原子のコード生成ヒューリスティックをデバッグするため(どのヒューリスティックに基づいたかを知ることが重要であるため)。第2に、したがって、コードスキーム生成器は、互いに先行又は後続するコードのコードツリーのセットを取得することができる。
原子形態ヒューリスティック
原子形態により使用されるヒューリスティックの2つのセットがある。第1に、要求された数のコードを生成するセットがある。第2に、任意の所与の時間フレームにわたり任意の所与の数のコードを配置するセットがある。最初のセットの場合、これは、例えば、5度圏又はマイナーサード離れた立ち上がりトライアドのシーケンスを生成するヒューリスティックを見つけ得る場合である。前に解析された作品から導出されたコードのマルコフ連鎖、III-VI-II-V-I進行若しくはVI-VII-III-VI-II-V-I進行等のセカンダリドミナントからドミナントへのジャズ進行又は全てメジャーサード離れた一連の立ち下がりメジャートライアド等の単一の整数差で隔てられた一連のコードを含め、音楽学者により理解されるであろうその他多くのものがある。2番目のセットの場合、コードがどのように離間されるかからもたらされる特定の効果があり得る。例えば、映画アルマゲドン(Bruckheimer&Bay,1998)で使用されたZZ Topによる歌「La Grange」への中央コードには、主音を可能な限り長く保ち、次いでそれらをフレーズの最終小節の第3及び4小節にそれぞれ置くことにより、進行における2つの他のコードを強調する明白な意図がある。この一般的なI=>vIII=>IV原子形態は、それを有する他の歌における大量の代替のタイミングを有する:ほんの数例を挙げれば、ジギー・マーリーによる「Dragonfly」、デヴィッド・ボウイによる「Starman」又はビートルズによる「Back In The USSR」。これらの代替タイミングは全て、異なる感情含意を有する。これは、コードスペーシングヒューリスティックの重要性、感情含意の適切で関連性のある記述子を原子形態に適用する重要性及び任意の所与の原子形態のパーソナリティにもたらされるタイミングの独自性を強調する。
原子形態の生成において、ここでも、2つのサブタスク、即ち解析された楽曲を見て、前方向及び後方向を向いて原子形態ツリーを作成するオードツリーの生成並びに意思決定プロセスに影響を及ぼすブリーフィング要件を考慮に入れて、所与のコードツリーから原子形態の実行可能パスが選択される原子形態の作成があることが指摘される。原子形態ツリーは前方向パス及び後方向パスの両方に関して形成されて、ブリーフィングナラティブで提供される様々なレベルの入力詳細に対処する。あるツリーは、生成中の原子形態の後に続くことができる原子形態の選択肢を含む一方、別のツリーは、それに先行することができる原子形態の選択肢を含む。両方とも典型的には複数の分岐を有し、両方とも、例えば、カデンツのシーケンスが意味をなすか否かに関して識別された音楽進行を反映する。これは、定量的評価に基づく定量的判断である。
解析された作品の全ての原子形態を通して繰り返す場合、形態関数及び進行記述子に同一のメタタグを有する原子形態は同じリストに置かれる。これから先行する原子及び後続する原子は各々、そのリストの前方向及び後方向の各選択肢リストに入る。次いで、原子形態が生成される場合、これらのリストからの選択により近隣原子が作成される。これにより、音楽的に一貫した意味をなす楽曲のコードスキームのメタ構造を生成することができる。
図9は、単一の楽曲がツリーのセットにどのようにパーズされるか並びにリストから生成された任意の所与の原子に選択することができる先行及び後続選択肢を示す。終了及び開始形態関数は原子形態のリストに影響を及ぼさないが、他の全てのカテゴリは考慮される。6つの異なる進行記述子及び形態関数の3つの異なるセットを所与として、これにより、あらゆる組合せを反映した例示的な数である216個の可能なリストが与えられる。
コードスキーム
原子形態のリポジトリを持つことで、生成系作曲プロセスは、コードスキーム生成フェーズに移る。コードスキームは、その名が示唆するように、本明細書に記載のように、述部に基づく音楽的特性を有する、原子形態から形成されたコードのグループ/連結である。
コードスキームを一緒に繋げることで、生成系作曲のハーモニックマップが提供される。このハーモニックマップが手に入ってからのみ、作曲フェーズに移ることができ、作曲フェーズでは、第3段階の音が実際に生成され、ブリーフィング要件を反映するようにテクスチャが適用される。
各コードスキームの要件は、要件リストに由来する。要件リスト内のあらゆる項目の原子形態が生成されると、原子形態のヒューリスティックを要件リストの特性と併せて使用されて、コードスキームを作成する。コードスキームは、以下の特性からなる:
1.主音 - これは、コードスキームのローカルコンテキストの主音である。前のコードスキームの新しい主音特性から設定され又はこれが最初のコードスキームである場合、曲の主音である。
2.新しい主音 - コードスキーム転調の場合、これは、設定される新しいキーであり、次のコードスキームの局所主音になる。
3.コードのリスト - これは、以下の特性を通して表現されるコードのリストである:
(a)ピッチ - これは、コードのルートである。
(b)低音部 - これは、コードにわたる低音である。
(c)コードタイプ - これは、コードのタイプを与える。タイプは、後に、音が選択されるピッチのセットを作成するとき、使用される。タイプは、アナリスト自身の音楽生成ヒューリスティックを目的としてアナリストにより定義される。例には、maj、min7、dom7 b9、myWeirdChordType1、myWeirdChordType2があり得る。
(d)位置 - 各コードは、それ自体がエポックとして扱われるコードスキームの始まりから測定される、コードスキーム内の局所相対位置を有する。絶対位置(コードの位置を曲の始まりから測定する)ではなく、これにより、要件が移動又は順序変更される場合、ユーザはコードスキームを時間的に前後に移動させることができる。
コードスキームの生成
コードスキームが含む情報のタイプについて概説したが、ブリーフィング要件及び関連付けられた原子形態のセットを所与として、新しい楽曲の任意の所与のコードスキームの生成は、以下の因子の組合せである:
1.調性及びキー - これらは、ブリーフで規定される全体感情要件により影響される。
2.位置 - 各コードスキームは、小節単位で測定される特定の位置で開始される。
3.長さ - 各原子形態は、曲のタイムライン上で特定の長さを有する。
4.コード密度 - これは、コードスキーム内のコード数である。
5.原子形態 - これは、要件リストからの要件と関連付けられた原子形態である。この原子形態は、コードスキームの生成に必要なヒューリスティック情報を含み、要件の感情含意、形態要件及びメタタグに基づいて選択される。
再び図8及びその概説されたプロセスを参照すると、楽曲の初期キーセンターがまず選択される。これは主音と呼ばれるが、初期原子形態にのみ関連する。楽曲は、ブリーフィング要件を反映するためにどの原子形態が選択されたかに応じて、このキーセンターから自由に逸脱することができる。第2に、原子形態と、それに関連付けられたブリーフ要件との各ペアリングを通した反復プロセスを通して、システムは、各コード生成ヒューリスティックを処理し、その後、コードスペーシングヒューリスティックを処理する。コード生成ヒューリスティックは、要件がそれに関連付けられた特性に有する数のコードを生成する。次いで、コード鎖は、存在するコードの数及び原子形態がそのコードスペーシングから生成したい効果に応じてヒューリスティックにより離間される。
コードスキームの作成を開始するために、楽曲のキー及び調性が開始点として選択される。これは、コードスキーム生成の直前に行われる。手短に言えば、主音の音は生成系システムによりランダム化することができる。曲のメジャー/マイナー調性は、これらの感情含意を最も有する、解析された曲と相互参照されブリーフにおける感情含意要求の全体評価に基づいて決定される。したがって、最も関連する含意を含む/を有する解析された楽曲は、調性に最も大きく影響を及ぼす。
ヒューリスティック
システムにより実行されるヒューリスティックは、音楽学者等による解析により生成されるが、技術的手法は代替的又は相補的でもあり、例えば、遺伝アルゴリズムを使用して、オッカムの剃刀(明らかに少ないほうが良好である)及びヒューリスティックが元の人工産物の音のピッチ、長さ及び位置よりも多くを説明することができる正確性の両方をテストする適合関数に基づいて、より少数のより正確なヒューリスティックを進化させることである。これらのヒューリスティックは、オーディオコンポーネント及び音楽構造におけるパターン認識及び異変を探して、所与のコードから少なくとも1つの後のコード又は後のコードの連続を生成して、元の音楽人工産物における元の解析されたコードスキームを再現することが可能な最小数のルールを有するルールを生成する。手短に言えば、ヒューリスティックは数学的説明である。これは、開始点としての原子形態データベース及び同様であり、好ましくは原子形態にリンクされたものと同調する、同調した感情含意を有するテクスチャのセットを所与として、作曲を達成できるようにするベースである。
任意の楽譜は、音のピッチ、位置及び持続時間により説明することができる。他の寸法特性、例えば、スタッカート等の幾つかの形態をそれ自体がとることができる演奏スタイルの音の大きさ又は音の柔らかさに関連する「音量」も一般に関連する。したがって、あらゆる楽譜は、MIDIプロトコルに類似するもの、即ち時間の経過に伴う一連のオンオフ切り替えを使用して記述又は表すことができる。実際に、実施する実施形態の状況を提供するに当たり、実質的に、各8ビットMIDIエンベロープがパルスに結び付けられ、複数のそのようなパルスを逐次通って楽譜の演奏を生成する。チューリング等価音楽プログラミング言語で実現された一連の数学関数は、正しいパラメータと組み合わせられ、順序付けられ、プログラムされると、これらの関数が導出された原譜を生成することができる。更に、同じ関数は、代替及び許容可能であるが異なる楽譜を生成することができる。例えば、ルールは、高音部の特定の小節内のコードから低音部の音を生成し、次いでそこでルールに適用された場合、原譜の解析された元の音符を用いた実現を達成する選択されたパラメータが識別される方法を説明する必要があり得る。更に、このルールは、ここで、他の状況で使用されて、異なるコードを所与とする場合でも許容可能な低音を生成することができる。識別及び再使用を目的として、この特定のルールには適切な記述的名前、例えば、「メジャーキーにおけるトライアドの非常に基本的な低音生成」が割り当てられ得る。要件は、例えば、高音部のコードを見ることであり得、低音部は同じピッチであるが、より低いオクターブ(ベースギターの可能な限り低いピッチに最も近い)であることが望まれる。正しい数学的関数の言語学的説明は、「次の低音を選択するに当たり、関心のあるコード内の全ての音を見て、それらの音のうち、前の小節内の低音に最も近い(MIDI分離に関して)音を選択することであり得る。この場合、正しいパラメータは、度、例えばI、III、IVで表現される高音部における元のコードにおけるMIDI音分離距離に関連し得る。
本発明の種々の実施形態及び態様の生成系作曲システムが機能する方法では、解析された曲の過去情報及びある種のヒューリスティックファイルを互いにプラグインする方法を記憶するために、ヒューリスティックを使用して、コードスキーム、テクスチャ、充填ブリーフィング要件を作成する必要がある。したがって、システムは、抽象タスクの順序付き処理を生成可能な一般的なメカニズムを開発する。
このセクションは、リズム、ピッチ、記憶された解析、コード及びコードスペーシングの作成を可能にする、システム内の異なるプリミティブヒューリスティックを考慮する前に、この処理及びモデルメカニズムについて説明する。プリミティブヒューリスティックは、コードを記述する必要なく解析を入力する能力をアナリストに与える。
これらの処理及びモデルメカニズムは、ヒューリスティックの順序付き処理を可能にすると共に、処理フロー内でコピー及び移動することができるグループへのヒューリスティックの入れ子を可能にする。条件付き及び無条件の両方で分岐する能力及びある種のヒューリスティック又はヒューリスティックの分岐を処理し得る確率を設定する能力も提供する。これは全て、ハイパーノードの原理を使用して達成される。
プリミティブヒューリスティックは、コードを記述する必要なく解析を入力する能力をアナリストに与え、チューリング等価音楽プログラミング言語で予め定義された数学関数を有する結果として、使用又は解析のために、リズム、ピッチ、コード及びコードスペーシングの作成を可能にするように機能的に構成される。
ヒューリスティックフレームワーク - ハイパーノード
ハイパーノードとは、ヒューリスティックの階層的処理及び記憶を可能にする構築ブロックである。以下の特性を有する。
1.ハイパーノードの順序付きリスト(再帰的入れ子をサポートする)。
2.リストがどのように処理されるべきかを記述する論理演算子。
3.確率 - これは、ハイパーノードが処理される機会を表す数である。
4.名前 - これは、列記された場合、ハイパーノードを追跡できるようにするようにハイパーノードに名前を付けられるようにする。
5.音楽要素。
ヒューリスティックのセットは、1つの単一のハイパーノードから始まる。したがって、このノードは、音楽要素を付すことができるハイパーノードのリストを含む。音楽要素は、特定のヒューリスティック及びヒューリスティックと共に記憶する必要がある任意の他のデータを含む。あらゆるハイパーノードには、XOR又はANDのいずれかの論理演算子が付される。ANDの場合、リスト内の各ハイパーノードは、リスト順に処理され、ハイパーノードの確率が1未満の場合、乱数生成器を使用して、項目が処理されるか、それともスキップされるかを評価する。XORリストの場合、1つのみのハイパーノードがリストから、処理されるものとして選択され、その尤度は、リスト内の各項目の相対確率に依存する。
ハイパーノード処理
ハイパーノードに付される音楽要素のタイプは、ハイパーノードがどのように処理されるかに影響を及ぼすことになる。プロセッサがこの情報に応じてとることになる異なる反復ステップが存在する。これらは、本発明の生成系音楽作曲システム内に存在する音楽要素のタイプである。
1.ドラム - これは、リズム生成ヒューリスティックであり、必ずしもドラムと関連付けられるわけではなく、全てのリズム全般と関連付けられる。
2.原子形態 - これは、解析されシステムに入力されたレパートリーからのコードについての情報を含む。原子形態は、詳細に上述したように、曲のコードスキームのメタマップの作成に使用される。
3.ヒューリスティック - これは、ピッチタイプヒューリスティックとして特に定義されない任意のヒューリスティックのキャッチオールである。これは、コード及びコードスペーシングヒューリスティック並びに所与のブリーフの省略された部分を埋めて完成させるためのヒューリスティックを含む。
4.ピッチ - これは、所与のコードスキームに基づいてピッチ情報を作成することと関連付けられた特定のタイプのヒューリスティックである。
5.テクスチャアダプタ - テクスチャアダプタは、テクスチャグループと特に関連付けられる。テクスチャアダプタは、ピッチ、リズム及びMIDIルーティング情報を一緒に束ねる。
6.テクスチャグループ - テクスチャグループは、ユーザが使用することができるメタタグへのテクスチャアダプタを一緒に束ねる。
ハイパーノード構造内の上記音楽要素の全てはあらゆる原子形態で処理されることになるが、ピッチヒューリスティックは、原子形態のコードスキーム内のあらゆるコードで処理されることになる。これは、テクスチャは1回のみ処理されるが、コード変化と関連付けられたピッチ情報はあらゆるコードで処理されることを意味する。
ヒューリスティックコンポーネント
ヒューリスティックは、内部に記憶される3つのみの要素を有する:名前、記述(アナリストが、ヒューリスティックが何を行うかを見ることができるように)又はヒューリスティックが予備される/インスタンス生成されるときに実行されるプロシージャ若しくはメソッド。これは、ヒューリスティックが予めプログラムされたデータをいずれも含まないことを意味する。ヒューリスティックにデータを記憶する必要がある場合、これは、ヒューリスティックを含む音楽要素に保持される。しかしながら、ヒューリスティックは、それに作成されたデータに頼らない。これは、他の全てのデータが動的に作成され、処理の時点で利用可能であることに頼ることができないためである。これは、分岐又は予期されるマテリアルが生成されない確率からの統計的機会に起因し得る。したがって、一連のデータマップには異なるヒューリスティックが関連付けられる。これらは、任意の所与のヒューリスティックがその主要機能を実行するために頼り得る任意の動的に生成されるデータを含む。
ヒューリスティックマップは以下の特性を有する:
1.作曲 - 以下についての情報を含む作曲自体:
(a)要件リスト - ユーザからのブリーフィング情報を含む。
(b)時間シグネチャ - 作曲のもの。
(c)コードスキーム - 各原子形態に付される。
(d)スタッフ - 作成され、シーケンサへの準備ができた音楽情報。

2.情報を他のヒューリスティックに又は再度処理される場合にはそれ自体に時間的に前方向に送る能力をヒューリスティックに提供するスペアHeresyマップ。
3.ドラムヒューリスティック固有の情報:
(a)ブラックリスト - このヒューリスティックが処理された場合、処理されるべきではないドラム。これは、既に記述されたキックドラムパターンをキックドラムパターンで上書きするようなことを止めるために有用である。
(b)ドラム - 処理されているドラム。ドラムは、以下考察する大量の特性を有する。
(c)処理済みドラムリスト - これは、処理済みのドラムのリストである。これらの幾つかは、問題となっているヒューリスティックについて処理された音に影響を及ぼし得る。
4.生成されたピッチ情報のリスト - これは、Heresyが、特定のドラムがトリガーされるときに使用したい音のコード固有のピッチ情報である。
5.処理されている現在の原子形態を表す番号 - これは、周囲原子を局所主音及びコードスキームのようなことに考慮できるようにする。
6.所与の原子形態内の特定のコードを表す番号。
7.フラグリスト - これは、このヒューリスティック及び将来のヒューリスティックのイエス/ノートリガーとして使用することができる。
プリミティブピッチヒューリスティック
ここでヒューリスティックが処理されるメカニズム及びヒューリスティックがデータを互いの間でどのように伝達するかを確立した上で、ここで、異なるタイプのプリミティブヒューリスティック及びそれらが音楽出力をどのように作成するかを考慮することが可能である。
2つの異なるタイプのプリミティブヒューリスティック、即ちピッチと関連付けられた可変パラメータを有する予め定義された数学関数が存在する:
1.コアヒューリスティック - これらは、特にピッチ情報に対処し、3つのサブカテゴリに更に分けられる:
(a)ピッチ生成器 - これらは、好ましくは、MIDI表現形態で表されるピッチ/周波数情報を生成する。
(b)ピッチ変換器 - これらのヒューリスティックは、音及びコードのピッチを変え、即ちMIDIスケールでは整数であるが、連続オクターブにおける各主音が2倍の周波数である周波数スケールではないオフセットを提供する。
(c)ピッチストーラ - これらのヒューリスティックは、音及びフラグのストレージエリアをメモリに作成する。これらは、単にデータの物理的記憶場所と見なすことができる。
2.論理演算子 - これらのヒューリスティックは、「If Then Else」型メカニズム及び音ピッチ、フラグ及びコードタイプが特定の値である等の特定の条件が真であるか否かのチェックを通して、条件付きフロー制御を可能にする。論理演算子は、音ピッチが特定の範囲内にあるか否かをチェックすることもできる。基本的に、これらはサブルーチンの分岐関数である。
ピッチ生成ヒューリスティックは、3つの異なるソースからピッチ情報を収集することができる:アナリストにより抽象的に述べられた数字から;コードスキームからのコード内の特定の転回位置から;又はアイディアスタッフから。アイディアスタッフとは、ピッチロケーションの名前付きリストであり、ハイパーノード構造内の別個のヒューリスティックリストにおいてアナリストによりセットアップされる。ピッチ情報は述べた3つのソースのいずれからも収集され得るが、生成された全てのピッチ情報は、アイディアスタッフピッチロケーションに記憶される。
2つの異なるピッチ生成器ヒューリスティックが存在する。第1のピッチ生成器ヒューリスティックはノートピッカーと呼ばれる。このヒューリスティックは、単にソース音が何であるか及びその音の宛先がどこかを尋ねる。コード又はアイディアスタッフが選択された場合、ソースからの選択をランダム化する選択肢が存在する。ランダム化が可能ではない場合、ノートピッカーは、ピッチロケーションのリスト内の位置0にある識別されたアイディアスタッフ値から厳密な値をとるであろう。しかしながら、ランダム化が指定されている状態では、ノートピッカーは「高音部」アイディアスタッフに記憶された音のいずれかから値をとることになる。これらのリテラル音値は、コードが変化する都度、変化することになるが、このピッカーは常にこのロケーションを指すことになる。アイディアスタッフ又はコードのいずれかから供給された音の小節オフセットも存在する。これは、近隣及び近傍のコード及びアイディアスタッフから及びそれらと関連付けられたピッチ値からピッチ情報を取得することが可能であることを意味する。この例では、小節オフセットは指定されず、したがって、ピッチ情報は、コードスキーム内の現在のコード番号と関連付けられたアイディアスタッフ音に由来することになる。
ソースがコードであると選択される場合、ノートナンバーは、例えばメジャーコードにおける低音からのコード内の値を選択し、「1」はメジャーコードを与え、「2」は完全5度を与え、「3」は、そのときに生成されたコードに応じて、メジャー7度を与え得るか、又は巻き返して1オクターブ高い主音を与え得る。整数は、指定された番号が何であれ、その番号のリテラル値を与える。
代替のピッチ生成プリミティブヒューリスティックは、ボイスリーダーと呼ばれる。この生成系ヒューリスティックでは、そこからボイスリードに参照ピッチが選択される。このリードノートは、予め定義された3つのソース(アイディアスタッフ、コード、番号)の1つからの音への参照を与える。次いで、作成されるべき音が、第2の参照ソース、典型的にはコード又はアイディアスタッフから選択される。アナリストは、次いで、その音を第1の参照音から上、下、それとも両方向にリードしたいかを指定することができる。アナリストが両方を選択する場合、最も近い音が見つけられることになる。音が第2の参照コードに出現する場合、音にピッチを変えることを余儀なくさせるべきであることを指定することが可能である;これは(多くのルールのうちの)別のルールの一例である。アナリストが、このヒューリスティックを使用して選択された音の初期ピッチから外れないことを望む場合、これは範囲として指定することができる。この範囲は、次いで、データマップに記憶され、次に記述されるとき、ヒューリスティックに渡される。そもそも、範囲外の音の生成を試みる場合、初期ピッチが何であったか及びこの値からボイスリードする方法の記録を代わりに有する。これは、ボイスリーダーヒューリスティックが、それらが記述された楽器のイディオマティックな範囲から外れたメロディ及びスケールを作成することを止める。
ノートピッカー及びボイスリーダー生成系ヒューリスティックが、整数選択肢が選択されるまで、決して予め記述された音を選択さないことに留意することが重要である。これは、選択されたピッチが、作成時の楽曲のハーモニーに依存することになることを意味する。
2つのタイプのストレージヒューリスティックが存在する。一方は、記憶位置の設定番号を有する名前付きアイディアスタッフを作成し、他方は、処理反復中にオンオフすることができるフラグである。アナリストは、任意の情報を記憶したい場合、アイディアスタッフ又はフラグの機能によりこれを行うために、アイディアスタッフ又はフラグを作成する必要がある。
分岐及び論理演算子は、論理演算子ヒューリスティックのセットにより達成される。IfThenElseヒューリスティックは、3つのハイパーノードのセットを提示する。第1の「if」ハイパーノードは、等式ヒューリスティックを介して所与の条件をチェックする。4つの異なる等式ヒューリスティックが存在する。それらは、特定の音が特定のピッチであるか否か、音がピッチ範囲内にあるか否か、オードが特定のタイプであるか否か、又はフラグが存在しているか否か及びオンになっているかそれともオフになっているかをチェックすることができる。条件が満たされる場合、「then」ハイパーノードが使用され、満たされない場合、「else」ハイパーノードが使用される。
最後に、プリミティブ生成系ヒューリスティックの最後のセットは、変換器である。3つの特定の変換器が存在する。最初の2つはノート及びコード移調器である。これらは、上記3つのソース:アブストラクト番号、転回位置又はアイディアスタッフの1つからのソース値により音又はピッチにおけるコード全体を移調することが可能である。3番目の変換器は、代替レトロスペクティブボイスリーダーである。代替レトロスペクティブボイスリーダーは、所与のピッチを有する所与の位置における音をとり、それを、宛先参照音の1オクターブ以内になるまで、オクターブで上又は下に移動させる。これは、作成されたピッチマテリアルにおける複音程を除去する効果的な方法である。
プリミティブリズムヒューリスティック - ドラム
ピッチ情報からメロディ及びテクスチャのリズミカルな品質をもたらすための潜在的に多くの代替のメカニズムが存在するが、好ましい実施形態は単一のプリミティブリズムヒューリスティックを使用する。このヒューリスティックは、前のセクションで述べたピッチヒューリスティックを使用して作成されたアイディアスタッフで見つけられたピッチ値にリズムトリガーメカニズムを適用する。
ヒューリスティックの特性は、ドラムと呼ばれるものに記憶される。ドラム情報は、このプリミティブリズム処理ヒューリスティックと共に音楽要素に記憶される。ドラムデータが付されたこれらの音楽要素は、他の音楽要素と全く同じようにハイパーノード構造で存在し、階層順で処理されることを意味する。これは、ドラムが潜在的に、生成され観測された出力を通してどのようにトリガーされるかについて互いに影響することを意味する。ドラムは、実際には、ドラムパターンの作成に使用されるが、アイディアスタッフのピッチ音をトリガーするドラムの能力は、ドラムが、単に未調整のパーカッションパターンを作成するよりもはるかに強力な用途を有することを意味する。
ドラムは、処理メカニズムのコンテキスト内で将来参照するために名前を有する。このドラムの名前は、同じハイパーノード構造内の他のドラムにより参照されて、それらのトリガー確率に影響を及ぼす。ドラムに定義される解決が存在する。したがって、これは、2つのグリッドで解決を設定する:第1に、ドラムがトリガーされるか否かの確率及び第2にドラムがトリガーされる場合の速度値。各確率は、0%~100%で設定することができる値を有することができ、速度は1~127のMIDI範囲を有する。音がトリガーする場合、関連付けられた速度が使用される。速度は、設定範囲によりこの値の周囲でランダム化することができる。
特定のグリッド位置における確率は、既に処理されトリガーされた他のドラムにより影響され得る。この場合、最終的にトリガーされた場合、音に設定可能な速度が存在する。これらの前処理されたドラムは、2つのリストの一方に出現し得る。第1に、グリッド確率に否定的に影響するドラムのノットリストが存在する。所与の位置でトリガーされた場合、これらの前処理されたドラムは、確率が100%であっても、現在のドラムがトリガーされるべきではないことを意味する。これは、閉ハイハット及び開ハイハットの非イディオマティックな同時トリガー等の状況で有用である。この例では、アナリストは、開ハイハットがトリガーされない限り、全ての8分音符ビートで演奏に閉ハイハットを設定し得る。開ハイハットがまず、ハイパーノード構造で処理され、閉ハイハットはその後、開ハイハットがノットリストにない状態で処理される。次に、トリガーされた場合、現在のドラムの局所確率グリッドエリアを広げるドラムのアトラクタリストが存在する。アトラクションがこの確率数をトリガーされたグリッド位置の「左」、グリッド位置「上」、それとも「右」のグリッド位置に追加するかは、ドラムプロパティで設定される。これは、ユーザが特定の音を他の音の隣で音を鳴らしたい場合、有用である。例えば、16分音符スネアゴーストの場合、アナリストは、キックドラム又はスネアドラムが近隣の8分音符でトリガーされるとき、周囲の2度及び4度の16分音符で生じるゴーストノートの機会を上げたいことがある。キックドラム及びスネアドラムは各々、ゴースト発生確率に30%寄与し得、したがって、トリガーの尤度を実質的に上げる。
ドラムはピッチ値を有する。このピッチ値は、リテラルMIDIピッチ又はアイディアスタッフにおける記憶位置に相当することができる。アナリストが、ドラムピッチパラメータが特定のMIDI音又はアイディアスタッフピッチ位置の値をトリガーすることを望むか否かに応じて、異なるリズムアダプタが、リズム及びピッチヒューリスティックが互いにプラグインされたとき(テクスチャを提供するために必要である等)、後の段階で使用される。
ドラムに、設定された数の音又はある範囲の音を生成するように強いることができ、したがって、まばらすぎる又は忙しすぎるリズムパターンになる統計学的まぐれを回避することができることを意味する。ドラムが、アトラクタ及びノットリストを通して他のドラムを引き付ける又は静める方法としてのみ使用されている場合、ミュートに設定することができる。これは、それ自体の出力音を有さないが、それでもなお処理メカニズムで使用されることを意味する。
所与の確率グリッドが広がる時間長は、ループ長パラメータにより設定される。このように、4ビートにわたり広がる16のグリッドが効率的に16分音符であるが、8ビートに広がるのは8分音符である。何回パターンが生じるか若しくはループするか及びパターンが原子形態の始まりで生じるかそれとも終わりで生じるか又はコードの始まり若しくは終わりが原子形態内で変わるか否かを示すことも可能である。これは、コード及び原子形態が変わるときに複雑なテクスチャを作成する強力な方法を与える。
最後に、関連付けられた長さ特性を介して、トリガーされたピッチ音に小節、ビート及びビートの割合単位の長さが与えられる。
テクスチャ
特に図3及び図4に関連してテクスチャの構造及び効果について既にかなり考察してきた。再びテクスチャを拡張するに当たり先に行ったポイントに戻ると、ユーザは、感情含意を指定することを通してテクスチャを達成する。これらの含意は、一実施形態では、テクスチャグループのファイルとして知られるものと突き合わせてチェックされる。これより、テクスチャグループがどのように作られるかを考慮する。この情報を含むテクスチャグループファイルを作成するワークフローは図10に表されている。テクスチャ記述子は最終的に、関連する原子形態の対応する記述子と同調することになる。
テクスチャオーバーレイ前には単にコードスキーム鎖が存在するのみであるため、テクスチャコンポーネントの作成は、好ましい実施形態の生成系システムの物理的な出力である。テクスチャコンポーネントをどのように分類しブリーフ、ピッチ及びリズムのヒューリスティックにどのようにリンクするか並びに原子形態及び組み立てられたコードスキームを使用して楽曲のハーモニックマップをどのように形成するかを考慮して、図10は、テクスチャがどのように指定、構築、ユーザにより要求及びシステムにより実現されるかを理解するために、全てのこの情報及び技法を組み合わせることに関わる処理の全体像を提供する。
テクスチャの任意の所与の解析のプログラミングに関わるワークフローは、典型的には、以下の構造に従う:
1.コアヒューリスティックを通してピッチデータを作成する(上述)。
2.ドラムヒューリスティックを通してリズムデータを作成する(上述)。
3.リズムプロセッサを作成して所望のキットを集約する。
4.オーケストレータを作成して、内部ストレージ及び外部MIDIマッピングをリズムプロセッサに適用する。
5.テクスチャアダプタを通して、リズム及びマッピングデータを含むオーケストレータにピッチデータを含むコアファイルを付すテクスチャグループを作成する。
6.メタタグをテクスチャグループに付す。
プロセスステップをより詳細に説明する:
1.アナリスト(又は場合によりプログラム論理及びシステムインテリジェンス)は、アイディアスタッフに配置されるピッチを作り出すヒューリスティックのセットを作成することで開始する。これらのヒューリスティックは、コアファイルに記憶されるハイパーノード構造にプログラムされる。
2.次に、アナリストは一連のドラムヒューリスティックを作成する。これらのハイパーノードはキットファイルに記憶される。
3.アナリストが、所望のリズムを作成するために使用したいことがある異なる複数のキットにわたり種々の異なるドラムが存在する可能性がありそうである。したがって、キットファイルは、キットプロセッサとして知られるものにおいて処理される。これは、キットファイル及びそのファイル内からの関連付けられたキットを処理できるようにする特定のヒューリスティックを使用する。このキット処理ヒューリスティックはプロセッサファイルに存在する。
4.生成系システムの内部構造及びストレージ並びに取り付けられたVST楽器用の外部MIDIマッピングの両方の点で、最終的な音情報が行くことになるマップが作成される。テクスチャ適用前、システムは、主に、コードスキーム鎖を提供するための関連処理を有する原子形態の形態で、音楽マテリアルの抽象スニペットのみを作成している。テクスチャオーバーレイは、特定の範囲、特定の楽器及び楽譜における特定のポイントにおけるスタッフへの配置のためにオーケストレーションが行われる場所である。オーケストレータが異なる楽器で、種々のトリガーされた音を何度も使用したいことがありそうである(音楽用語で「ダブリング」として知られているもの)。これはオーケストレータファイルで指定され、オーケストレータファイルは、MIDI情報の記憶のために、リズムプロセッサを外部MIDIマッピング及び内部スタッフと一緒に結び付けるハイパーノードを含む。
オーケストレータを作成するときに関与する2つの主要ヒューリスティックが存在する。第1に、生成される情報を内部に記憶する場所を定義する必要がある。これは、スタッフ-クリエータヒューリスティックを用いて達成される。スタッフ-クリエータヒューリスティックは、生成されたマテリアルを幾つかのスタッフに配置する。2つ以上のスタッフを有する能力は重要ではないが、このマテリアルを他のスタッフから差別化してマテリアルをユーザに表示するため及びマテリアルを作成するヒューリスティックをデバッグする場合、有用である。作成されたスタッフは、名前特性、小節単位の長さ、拍及び拍の割合、記述されているマテリアルに適切な時間シグネチャ並びに小節、拍及び拍の割合単位で測定されるオフセットを有する。オフセットは、任意の試料の絶対位置に適用される。このようにして、ポジティブ及びネガティブアウフタクトを作成するために、隣接する小節線にわたりピックアップをフレーズの始めに移動させ、ドラムフィルを終わりに移動させることができる。第2に、プロセッサファイルからリズミカルに生成されたマテリアルをスタッフ、MIDIチャネル、コア音及びアイディアスタッフにマッピングするために、リズムアダプタヒューリスティックが必要とされる。
一例として、「ピアノ」と呼ばれるリズムプロセッサは、「私のバッハピアノ右手」と呼ばれるハイパーノードプロセッサと共に、記憶位置「3」におけるアイディアスタッフ「高音部」からピッチ値を要求する音のトリガーを提供することになる。アイディアスタッフから生成された全てのピッチをとり、「ピアノ(右手)」という名前のこのMIDI情報の全ての内部宛先スタッフと共に、チャネル「11」でそれらのMIDIノートを作成する。内部宛先スタッフは、リズムオフセットについてのあらゆる情報を提供することになる。ピッチ位置が指定されない場合、ドラムがリテラルMIDIピッチを要求していると仮定される。これが、パーカッションパターンがどのように作成されるかである。アイディアスタッフが指定されない場合、全てのピッチが同じMIDI及びスタッフルーティングを有することになると仮定される。
これらのオーケストレータは、上記ステップ1において生成された任意の所与のピッチ情報に対して働くが、これらのトリガーが、多様な異なるコアファイルにより生成されたピッチに対して働くことが望まれることがある。したがって、ここで、ピッチデータをオーケストレータデータと結び付けるために、テクスチャ-アダプタヒューリスティックを作成する。テクスチャアダプタには2つのコンポーネントが与えられる:コアファイルからの特定のコアピッチハイパーノード生成器及びオーケストレータファイルからのオーケストレータハイパーノード。このテクスチャ-アダプタヒューリスティックは、テクスチャグループの一部であるハイパーノード構造に置かれる。
5.テクスチャグループは、テクスチャアダプタと、アナリストがテクスチャアダプタの出力と関連付けたいメタデータとを含むハイパーノードを有する。このデータは、ユーザが指定し得るブリーフィングコンポーネントを含み、以下を含む:
(a)要素タイプ - これらは、本明細書に列記し考察されたテクスチャ関数である。
(b)テクスチャ含意 - これらは、本明細書で考察したように、感情含意を関連付ける抽象キーワードである。
(c)言説関連付け - これは、本明細書で考察された作曲家及び言説に関するメタデータ含意である。
(d)目的 - これは、要素コンポーネントが特徴であるかそれとも伴奏であるかを示すためのものである。
テクスチャ生成器
従来、音楽テクスチャを生成系システムに入力するシステムが記載されてきた。上述した原子形態要件リストのように、システムはテクスチャ要件リストも有する。実際に、システムは、同時に、テクスチャ要件リスト内にテクスチャ要件が存在し、原子形態要件リスト内にコードスキーム要件が存在する音楽のみを作ることになる。これらは、ブリーフの全体に適合する原子形態の選択から音楽的にリンクすることができる同一、意味的に均等又は意味的に満足のいく程度に近い感情含意間に必要な連結を提供するために必要とされる。
初期には、原子形態要件リスト内の任意のギャップがファイリングされるメカニズムが記載されていた。好ましい実施形態では、システムは、ブリーフに関連性方向がないことに鑑みて、時間の矢を有する新しいテクスチャメタタグ要求が生じるまで、現在のテクスチャメタタグ要求を続けるように構成される。これはテクスチャ要件リストにフィードバックされ、それにより、ユーザは、セクション間に適合性があると見なすとき、テクスチャを削除又は変更することができる。これは、ブリーフにおける変化するテクスチャのポイント間でテクスチャ要件を繰り返す必要がないことを意味する。
テクスチャを計算するために、好ましい実施形態の生成系システムは、全てのコード要件を循環し、テクスチャ要件がそれと重なるか否かをチェックする。重なる場合、関連付けられた原子形態に作成されたコードスキームを使用しながら、テクスチャ要件を処理する。原子形態がテクスチャよりも早期に開始又はテクスチャよりも長い場合、これは問題なく、その理由は、プロセッサが、早期の場合には既にマテリアルを組み立てており、遅い場合には残りのマテリアルを次のサイクルに組み立てるように構成されるためである。
本発明の生成系システムは、好ましくは、特徴テクスチャ要素(ハーモニー、メロディ、カウンターメロディ等)への要求を伴奏要素への要求よりも優先する。生成系システムは、特徴である要求された全ての要素のリストを作成し、次いでこれらの要件の1つを満たす利用可能な全てのテクスチャグループをチェックする。次いで、このテクスチャグループリストは、テクスチャグループが満たすことができる他のメタタグ数に応じてスコア付けられる。
説明したように、テクスチャグループ内に複数の要素が存在し得る。これらの要素によっては、ブリーフ要件に合うものもあれば、合わないものもある。テクスチャグループには、これもブリーフに関連する含意に関するメタタグが付され得る。スコアは、累積性である。選択プロセスを提供するために、システムインテリジェンスは、特徴ではなく、要求されたテクスチャ要素を+1とスコア付けし、特徴である要求された要素を+2とスコア付けし、適切なメタタグを有するグループを+4とスコア付けし得る。これは、最も厳しい基準を満たしたテクスチャグループ、即ちブリーフにより要求された特徴要素を有するテクスチャグループに向けた重み付けを考慮に入れる。一般に、システムは、最高スコアのテクスチャグループを選択するように構成され、その後、ブリーフから満たされた要素が一時的に除去され、プロセスを繰り返して次に適切なテクスチャグループを見つける。これは最終的に、特徴を有する及び特徴を有さない、要求された全ての要素並びに言説及び含意の正しいメタタグを有する有望なテクスチャグループを満たす。
適切なテクスチャを選択すると、2つのタスクを実行する。第1に、テクスチャグループを要件リストに追加し、要件リストは、将来のテクスチャ生成サイクルでチェックされ、スコアが一致する場合、優先される。このように、同様の要件に直面する都度いつもテクスチャアイディアを変えるのではなく、可能な場合、楽曲全体を通して繰り返されるテクスチャアイディアを使用する。第2に、選択されたテクスチャグループは、システムインテリジェンスにより処理される。
テクスチャグループを処理するために、これらは、処理に向けてハイパーノードリストに追加される。しかしながら、処理前、システムは、原子形態及びテクスチャの両方の形態要件を含むデータマップを作成する。これらの索引は記録され、楽曲もデータマップに追加される。これは、テクスチャアダプタがテクスチャグループを処理するために必要とする情報の全てである。
セクションC:解析方法
作曲判断の背後にある論拠について上述した。システムのフレームワークへの入力を作成するために使用される好ましい解析方法に関する考察もなされた。音楽の曲の完全な解析は、解析が基づく概念の説明を邪魔するが、以下のセクションDは、バッハのCマイナー前奏曲の詳細な解析を与えて、包括的な実例を通して好ましいシステムに採用される本発明の手法の概念を強調する。
このセクションは、まず、解析を実行するために経るステップの全体像を提供する。次いで、エントロピー及び冗長性の概念がどのように利用されるかを説明し、それから、例を使用して、解析がどのように実行されるかの詳細に続く。この章は、所与の楽曲から原子形態の解析に入力するためのHeresyフレームワークの一部である有用な解析ツール - 曲アノテーションとして知られる - も提供する。
解析ステップの全体像
メタ作曲の説明を可能にするメカニズムを詳細に考慮する前に、このセクションは、アナリスト又は解析的に構成されたスマートシステムが、所望の音楽結果及び生成系楽曲を届けるヒューリスティックのセットを取得するためにとらなければならないステップを概説する。任意の所与の楽曲を、システムが音楽を生成するために必要とするヒューリスティックに分割するために、システムは以下のタスクを実行する:
1.形態全体像 - このプロセスは、曲の全体コードスキームを構成原子形態に分解するために使用される。
2.原子形態解析 - これは、ステップ1で識別された原子形態の特性を通したカテゴリ化を可能にすると共に、関連付けられたコードスペーサヒューリスティックと共にコードスキームを作成するために必要なあらゆるヒューリスティックを記述できるようにする。
3.テクスチャ解析 - ヒューリスティックの自己内包式セットにより説明することができる音楽ノートのグループは、テクスチャと呼ばれる。テクスチャ解析は、テクスチャ内に現れるエントロピー及び冗長性(直後の「エントロピー及び冗長性というタイトルのセクション」を参照されたい)の強調並びにDeliege(2001)がキューと呼ぶものの識別及びその生成方法の説明を含む。
これらの3つのタスクでは、チューリング等価数学的プログラミング言語を使用して、プログラマブルパラメータを有する、提供されたプリミティブヒューリスティックのセットが、コード生成の出力及び定義された原子形態の原理を通して論理的に順序付けられる空間/時間ヒューリスティックに基づいて、音楽テクスチャを生成する。
エントロピー及び冗長性
システム及び手法は、所与の曲における最大量の音楽を最小数のヒューリスティックで説明するという前提で機能する。これは、新しい概念は新しいヒューリスティックの開発を必要とし得るが、古いヒューリスティックは、可能な場合、更に一般化されることを意味する。コミュニケーション理論の本発明者らの理解で提示されるエントロピー及び冗長性の原理は、ルールセットの圧縮に向けて働くためにツールを提示する。
図全体を通して、赤(グレースケールプリントでのより濃い色調)、緑(グレースケールでの中間色調)及び黄(最も明るい色調)の予め定義された配色を使用してエントロピー及び冗長性を強調表示する。これらの色は、解析全体を通してヒューリスティックセットをどのように再使用し適合することができるか及び説明がないマテリアルに対処するために新しいヒューリスティックを考案する必要がある場合を示すのに役立つ。このカラーメカニズムをテクスチャ解析で使用するが、原子形態解析が、この手法から恩益を受けることができるパターンを有する場合、この配色技法は原子形態解析にも適用することができる。これらの色は以下を象徴する:
1.緑は、ヒューリスティックが考案された情報の直接反復を表す。
2.赤は、説明がなく、ヒューリスティックを作成する必要がある解析のコンポーネントを強調表示する。
3.黄色は、既に作成されたヒューリスティックの適合が必要な場合又は異なる結果を与えるためにパラメータの変更が必要な場合を象徴する。
原子形態解析
前書き
このセクションは、原子形態をコードスキームの特性(上述)に応じて進行記述子の限られたセットに分類する方法を示す。このプロセスにより、原子形態の特性に応じて原子形態を相互交換することが可能になる。
Phillip Ballは、優先トーンを有するものとして調性音楽を定義し(Ball,2011)、フレーズは、優先トーンに基づいて時間的マップを聴取者に与える機能を有する。聴取者は、フレーズが曲を優先トーンにどのように戻すかを予測しようとし、それにはカテゴリ化のプロセスが含まれる(Deliege,2001)。
解析された曲の入力を達成するために、本明細書に記載の生成系システムは曲アノテーションシステムを提供する。説明のための例を目的として、この曲アノテーションの一実装形態例を図11に示す。
曲アノテーション
曲にアノテーションを付けるために、曲は定性的に、記述子が関連付けられた進行に分解される。これは、先に概説したように、解釈を記述子のセットに制限する。
これより理解されるように、原子形態は、操作及び使用の少なくとも一方を含む処理を理由として、ハイパーノード構造で存在する音楽要素である。これは、曲の入力を階層的に構造化する能力をアナリストに与え、曲内の分岐を互いの隣に論理的に表せるようにする。これは、コーダ及びリピート等の音楽内の異なる場所にある原子形態間の関係を可視化するのに有用であり得、種々の実施形態のシステム及び方法がそのような原子形態ツリーを作成する場合に有用である(上述のように)。
解析中の楽曲からの各原子と関連付けられたコードリストが存在する。各コードは、ピッチ、タイプ及び低音分(例えば、ピッチ=C、タイプ=マイナー、低音部=C)の特性を有する。このコード列は順序付きリストを与え、順序付きリストは分岐構造に変えられて、(カデンツ)シーケンス内の他のコードから及び他のコードへ異なるコードの選択肢を与えることができる。各原子は、メジャー、マイナー又はモードの1つ等の主音ピッチ及び関連付けられた調性を有する。この主音は、コード分岐にコンテキストを与えるために必要である。局所主音の説明で考慮した前例、即ち主音Cを有してDからGを更に調べる場合、これは基本的に、最終的にシステム内で主音+2から主音+7として半音単位で表現することができる関係である。主音のモードは、特定のコードシーケンスを生成する場合に使用することができるため及び一連の分岐内の特定の選択の調性を分類するに当たり重要な因子であるため、関連する。例えば、Cメジャーの主音では、Cメジャーコードに、FマイナーではなくFメジャーが先行するのが見えると予期する。Cマイナーの並行調性では、Fコードの調性の予想はFマイナーである。
進行記述子には3つの選択肢が存在する:(カデンツ)、シーケンスインターバル又はシーケンス調性。(カデンツ)の場合、システムインテリジェンスは、入力されたコードから、主音の位置が始まりにあるか、終わりにあるか、両方にあるか、又はいずれにもないことに基づいて記述子を更に分類する方法を推測することができる。これは、生成系メカニズムに、将来のコードスキームを構築するのに必要なジグソーパズルの1構成要素を与える。複数のエントリを有することができる2つの原子形態特性が存在する:感情関数リスト及び形態関数リスト。
第1に、感情関数を考える。ここで述べたFからCへの例では、Fマイナーコードのより希なモードは、アナリストにより解釈され、感情含意「驚き」をラベリングすることができる。後に、ユーザがブリーフ要件において「驚き」を要求する場合、この原子形態が潜在的な可能性になり、その原子のヒューリスティックが、この驚き品質を包含するコードシーケンスを作成するであろう。
第2に、アナリストは形態関数情報を追加する。先のように、形態関数は、相互交換性の選択肢を制限する。ステートメント、疑問及び応答の違いを本明細書で詳述したが、解析において、原子形態が、
1.ループ可能であるように感じられる場合、それはステートメントであり、
2.転調しているように感じられる場合又は異なるキーセンターに行くことができるように感じられる場合、それは疑問であり、必然的に後に応答が続くことになる
ことが一般ルールである。
ここで、各原子形態には生成系ヒューリスティックが付されている。これらのヒューリスティックは、再使用される前に記述されたヒューリスティックからであり得るか、又は新しいコードスキーム生成系メカニズムを記述する新たなヒューリスティックであり得る。これらのヒューリスティックは、ここでも既に上述したように、2つのコンポーネントからなる。第1に、ピッチ及び調性コードシーケンス生成器を含むハイパーノード。第2に、所与の音楽時間フレームにわたり生成されたコードをスペーシングするコード-スペーサアルゴリズム。このようにして、生成されるコード数は、最終的にコードが存在することになる時間フレームから独立したままであり得る。映画キューが延長及び短縮される場合、時間フレーム自体は、かなり変更可能であり得るため、これは、重要である。
標準コードヒューリスティック
このセクションは、標準の(カデンツ)ヒューリスティック及びコードスペーシングヒューリスティックについて説明する。これらは、コード-原子ヒューリスティックを作成するための基礎であり、かなりの頻度で逐語的に使用されることができる。
標準(カデンツ)ヒューリスティック
全ての(カデンツ)シーケンスの開始点として、進行記述子からの主音位置を所与として、標準手法を使用して、任意の解析された曲に記録された全てのコードからコードツリーを作成することができる(Nierhaus,2009)。本発明に関連してこれを行うため、進行コンテキストを与えるために原子形態の局所主音を考慮に入れなければならない。生成すべきコード数がnであり、主音が現れない間又は主音が原子の中央を除くどこにも現れないことを確実にするに当たり、4つの(カデンツ)進行記述子が生成される:
1.始まりに主音を有する所望のコードスキームの場合、主音間に長さがn+1のコード鎖を生成する。次いで、最後の主音を除去する。
2.終わりに主音を有する所望のコードスキームの場合、プロセスを繰り返すが、代わりに最初の主音を削除する。
3.主音-主音コードスキームの場合、単に長さnのコード鎖を生成する。
4.始まりにも終わりにも主音がないコードスキームの場合、長さn+2のコードスキームを作成し、両主音を削除する。最後のコードが、解析される曲のコーパス内の最初にカデンツすることができる、例えば、Dmin=>F=>G7であることの確認もする。
コード-スペーサヒューリスティック
コード-スペーサヒューリスティックは、CSHと略され、利用可能なコードを所与の数の小節に拡散させる。基礎ヒューリスティックは、任意の所与のCSHハイパーノードシステムを必要とし、CSH標準メソッドと呼ばれる。このメソッドは、新しいコードを許容する各小節の優先度によりバランスされた、所与のCSHが割り振った1小節当たりのコード数に応じてコードを拡散させる。メソッドは、所与のコードシーケンス、原子形態の時間シグネチャ、小節数及びコードの配置についての各小節の優先度を表す数字配列を必要とする。メソッドは、最高優先度の小節を見つけ、それにコードを割り当て、それにより、その小節の優先度を1だけ下げる。このプロセスは、利用可能なコード数に対して繰り返される。各小節でのコードの優先度は、進行記述子に特有の他のCSHによりこのヒューリスティックに与えられる。全ての小節の優先度は、最初に0に設定される。
始まり及び終わりにおけるCSH(カデンツ)主音
このCSHは、コード数をチェックして、コードが偶数であるか否かを見る。偶数の場合、最初の小節及び最後の小節の優先度をそれぞれ-1に下げる。これが同じ小節である場合、全てのコードをとる。2つの小節が存在する場合、それらは等しく扱われる。3つ以上の小節が存在する場合、この優先度付けは、最初の小節及び最後の小節がコードを有する機会を下げる。このタイプのコードスキームでは、最初のコード及び最後のコードは両方とも主音であるため、これは、呼吸するため及びコードスキーム内の他のコードよりも前に出すために主音により大きい音楽的スペースを与える方法である。
奇数のコードが存在する場合、最初又は最後の主音に呼吸するためのスペースが与えられ、他方の主音にはより短い時間が与えられる。これは、最初又は最後の小節のいずれかをランダムに選択し、その優先度を-1に設定し、他方に優先度2を与えることにより達成される。これは、主音小節の一方のコード配置においてスペースを促進するが、他方にはスペースを与え、それにより、非偶数の小節の普通ではない感じを埋め合わせる。コードスペーシングのこの技法は、マーラー(例えば、交響曲第6番のアンダンテ第3楽章、第3小節から第5小節の弱起、第3拍)及びバート・バカラック(例えば、「愛のハーモニー(That’s What Friends Are For)」、第13から18小節)等の非偶数の小節から構成されるフレーズで有名な作曲家による作品で観測される。
終わりでのCSH(カデンツ)主音
これは、主音が呼吸できるように最後の小節に優先度-1が与えられることを除き、全ての小節に偶数優先度0を与える。
主音がないCSH(カデンツ)
これは偶数の小節優先度を有する:全ての小節は、単に0に設定される。
始まりでのCSH(カデンツ)主音
このヒューリスティックは、始まり及び終わりでのCSH(カデンツ)主音のコピーであるが、小節数が奇数の場合、優先度付けは、ランダムではなく、最初の小節の優先度は、-1に下げられ、最後の小節の優先度は、2に上げられる点が例外的である。
次いで、実際のコードスペーシングが、CSH標準の背後にあるスペーシングヒューリスティックにより実行される。このヒューリスティックはCHSプレーサと呼ばれ、小節に出現するコード数に基づいてコードをビート上に置く。この配置は図12に表されている。
限られた標準ヒューリスティックのこのセットから、生成系システムの好ましいコード生成器又は略してHCGenの形を見ることができる。これは、標準コードスキーム生成器、スペーサ及びプレーサハイパーノードからなる一連のハイパーノードである。ルートハイパーノードが作成され、そこに4つの項目を置く:
1.標準(カデンツ)ヒューリスティック。
2.小節を優先度付けるためのCSH進行固有ヒューリスティック。これは、進行記述子に応じて変化する。
3.CSH標準コード-スペーサヒューリスティック。
4.CSHプレーサヒューリスティック。
これは、コードを作成するための典型的なハイパーノード構造を表す。
シーケンシャル原子形態表記
シーケンシャル原子形態は2つの種類で来ることができる:インターバルベース及び調性ベース(上記を参照されたい)。
インターバル原子形態は、局所主音のキーセンター外からのコードを含む一連のコードを通して移動し、したがって、定義上、それらの形態関数は疑問である。シーケンスは、シーケンスを破る必要があり、破らなければ永遠に続くことになり、シーケンスから変わるための最初のコードをエスケープコードと呼ぶ。エスケープコードは、定義上、後続する原子形態に存在し、この原子形態の形態関数は応答として分類される。
シーケンス及びそのエスケープコードを表現するために使用する標準インターバルテンプレートが存在する。これは図13に見ることができる。シーケンスの始まりのピッチをどのように取得し、コードが有し得る調性及び任意の拡張を指定するかについて述べる。次いで、このコードから2つの可能な矢印を有する:一方は、8分音符単位でコードのピッチを変える関数への矢印であり、他方は、エスケープコードへの矢印である。ピッチ関数は再びコードを指す矢印を有し、フローループを示す。エスケープコードは、ピッチ、調性及び拡張情報を有することになる。
図13のシーケンシャル原子形態テンプレートは、初期コードのピッチ、コードが反復を通してどのように変わるか、並びにエスケープコード及び関連付けられた関係及び特性をレイアウトする。
インターバルテンプレートがテンプレート1に対してどのように機能するかの音楽の一例は、以下の原子形態4というタイトルのセクションで見ることができる。
原子形態解析例
このセクションでは、一例として、精密なコードブリーフが、ハリーポッターと賢者の石(Heyman&Columbus,2001)でのジョン・ウィリアムズによる「The Quidditch Match」からの映画楽譜のセクションに指定され、その楽譜並びに還元及び解析を図14に示す。
これは、予め定義された進行記述子に適合する適切な原子形態に楽曲をどのように分割することができるかを実証する。異なる映画フォーマットではフレームレートが異なることに起因して、音楽のこのセクションはサウンドトラックの商用リリースの6:39において最良に見られる。ハリーポッターが飲み込み、次いで第27小節で吐き出すスニッチの最終捕捉に向かう緊張の高まりに関与する。解析は高水準であり、コーディング言語から独立している。二重の小節線は各原子形態を示す。
原子形態1((カデンツ)):第1から4小節
この原子形態は、Cマイナーのキーにおける完全なカデンツとして機能する。その最初の主音(第2転回にあるにもかかわらず)及び最後のドミナントGコードに起因して、明らかにループ可能に感じられ、したがって、ステートメントとして分類される。低音部の動きは、低音部の動きが音階的にどのように生成することができるかに関して更に解析する価値があるが、この動きはコードスキームの目下の研究には関連性がない。
このフレーズを生成するために、始まりの小節に(カデンツ)主音を有するHCGenプライオリタイザヒューリスティックを使用する。主音に与えられるスペース及びこのフレーズ内でのこのフレーズを通したコード全般の配置(最後の小節内の2つのコード)は、本発明において標準コードスペーサがどのように機能するかを反映している。
原子形態2((カデンツ)):第5及び6小節
このフレーズは、主音マイナーコード及びそれに続くAbmを含む。このAbは、Cマイナーのキーセンターを維持すべき場合、応答を必要とする音楽的疑問を呈するように見える。このフレーズを切り離し、このフレーズがループ可能であるか否かを問う場合、AbmからCマイナーに行くのは完全に不快なカデンツではないであろうが、Abmは、Cbに起因してキーセンターにない。したがって、これを疑問原子形態として分類するほうがより適切である。楽譜におけるこの疑問の扱いは、これら2つのコードを荒々しいアクセントで強調することである。これは、感情含意タグ「チェイス開始」又は恐らく「パワー総奏」を保証する。これらのステートメントは明らかに、アナリストにとって個人的なものであり、異なるアナリストが反論する可能性がある個人的な美意識の独特のセットを明らかにする。アナリストが出力で自身を試し、自らの作業から予期するものとして生成系結果を待つ限り、これはOKである。感情含意の言葉は一貫して使用されるべきでもある。アナリストが望む場合、言葉はモード1等の非感情的記述であり得、それにより、ユーザは、アナリストのモードと独自に関連性を築くことができる。
このフレーズを生成するために、始まり及び終わりに適合されたCSH(カデンツ)主音を有するHCGenを使用する。適応版では、主音小節の優先度が上げられ、疑問コードを含む最後の小節(即ちこのキーセンターからのものではないもの)の優先度が下げられて、外部コードの時間を長くすることを通して緊張を高めることを指定する。これは、最初の小節の優先度を2に設定し、最後の小節の優先度を-1に設定することを意味する。
原子形態3((カデンツ)):第7及び8小節
このセクションは、ジョン・ウィリアムズの作品を知っている誰にとっても馴染みがあるように聞こえる:スターウォーズ(Kurtz&Lucas,1977)の楽譜での緊張の高まりとして繰り返される同じ減音程シーケンスである。このために及び疑問の後に続くことを考慮して、これが応答フレーズであると予期することができる。これを確認するために、これが、実際には、Cマイナーの現在キーにおけるセカンダリドミナントからドミナントへの進行(IIからV)であることを見ることができる。これは自動的に、HeresyにbVIマイナーコードから減音程IIコードへのリンクを与え、したがって、これらのいずれか一方で終わるか又は始まる任意のセクションは、他方ではリンクと見なされる。同様に、これらのコードは、(カデンツ)セクション内で一緒に一続きにすることができる。標準HCGenをこの原子形態に付し、(カデンツ)主音なしを進行記述子として選択する。
原子形態4(シーケンシャル):第9から12小節
これは、曲中のこれまでで最初のシーケンシャルフレーズでありそのインターバルテンプレートは図15に見ることができ、図15は、The Quidditch Matchにおける、エスケープ原子形態4とのシーケンス原子形態3のループを表している。8分音符で上がるドミナント7b9コードに基づく。これは、定義上、疑問フレーズであり、その理由は、それに答え、それにより停止させるためためにエスケープフレーズを必要とするためである。このコードセクションが、概ね-4から+1の半音の範囲(Eb7 b9からAb7 b9)内からの任意のコードで開始するのと全く同じように簡単に開始することができ、それでもなお効果的であるが、前音フレーズのG7 b9の繰り返しが、この高まりでの半音階上げの開始をグラウンドさせ、開始コンテキストを与えるのに役立つことに留意する価値がある。前のGは当然ながら、異なって生成することができ、したがって、作成するヒューリスティックにおいて、このコードの開始が、前の原子形態と関連付けられた、前に生成されたコードスキーム内の最後のコードの繰り返しであるべきであると言う傾向がある。
原子形態5(シーケンシャル):第13及び14小節
これは原子形態4のエスケープコードを含み、したがって、これは応答フェーズである。このエスケープフレーズのコードはマイナーであり、そのピッチは、最後のシーケンスコードから半音+5である。第14小節中の9 #11 13コードは、エスケープフレーズのクライマックスポイントとして機能する。これは、現在のコードの装飾音に基づいてコード関数をどのように構築するかの有用な一例である。本発明によるヒューリスティックには感情含意「装飾音」がラベリングされ、これは、要求される場合、続くコード作成及びスペーシングヒューリスティックを呼び出す。
ヒューリスティック的に、このコードシーケンスを幾つかの局所主音として記述する。最初の主音は単純なトライアドであり、最後の主音は、低音部においてコードの3度にわたり#11度及び13度を有する完全に繋留されたコードであり、第1転回を作り出す。これら2つのポイント間の任意の主音は、最終状態に向けて適応するように1音を変える。主音数は小節数に依存する。最後の規定コードを有する最後の小節まで、1小節当たり2つのコードを使用する。変更が切れたが、なお埋めるべきコードスペースがある場合、1小節の半分ではなく1小節を占めるように、シーケンス中の後のほうのコードを変更する。
原子形態6((カデンツ)):第15から18小節
第15小節において、ハリーポッターが箒の柄から落ちて首を折った場合、ウィリアムズがそれまで伝えてきた自己完結的高まりに幸せに甘んじたであろう:エスケープ関数は、Abmコードに解決され、キューを効果的に終わらせることができる。しかしながら、ハリーは、急勾配の飛行から脱して、単独飛行者になるためのレースで敵を打ち負かすため、成功への期待及び勝利への高まりが与えられる。
緊張を高め続けるために、ウィリアムズはEm#11 13をEb/Gに上げることを選択する。これは、結論とは逆を行う方法で応答フレーズから解決する新しい方法を与える。Ebは、新しいキーとして確立される。それもなお、ここで、曲は、リディアメロディで終わり、繰り返される最後のコードEbに静かにフェードすることができた。しかしながら、第17小節において、コードスキームは、Emの到来と共に更にもう一度、第2転回Bコードを強める。
これは、即時エスケープを有する現在の1サイクルを越えて拡張することができる新しいタイプのシーケンシャルムーブメント、即ちコードペアを半音上げるタイプのシーケンシャルムーブメントを明らかにする。これは図16に示される - The Quidditch Matchからの原子形態6シーケンシャルカデンツ。これは、前の原子形態における最後のコードからコードをとり、その調性、即ちメジャー又はマイナーを見る。メジャーの場合、この新しい小節の最初のコードは、ルートが半音高いマイナー第1転回1コードである。マイナーの場合、これは同じルートの第1転回メジャーコードである。このパターンは、次いで、エスケープコードが必要になるまで繰り返される。エスケープコードは、+7半音としてマイナー解決に関連すると共に、+8半音としてメジャーに関連する。エスケープコードは第2転回にあり、メジャーコードである。(カデンツ)主音なしの標準コードスペーサは、所望のスペーシングを与える。
原子形態7(シーケンシャル):第19から22小節
この2コードフレーズは、最初の反復後にエスケープするシーケンスとして解釈することができる。しかしながら、延長して、高まり全体を通してかかる時間を延長することができる。このパターンは図17に表されている - The Quidditch Matchからのシーケンス及びエスケープフレーズ7及び8。
原子形態8及び9((カデンツ)):第23から26小節
低音部23及び24における原子形態8(並びに第25及び26小節中の原子形態9としてのその繰り返し)は、原子形態7へのエスケープコードとして機能し、Bbという新しい主音を与える。ジョン・ウィリアムズが第2転回コードをエスケープコードとして使用し、調性が独特の趣を与えることは明らかである。これは、第2転回及びシーケンス中の最後のコードへの関係に基づいて適切なエスケープコードを予測するためのより一般的なメカニズムを調べるために十分な証拠の収集の始まりであるが、パターンがあることを確かめるために他の作品においてこのより多くの例を見る必要があろう。
テクスチャ解析例
種々のプリミティブピッチ及びリズムヒューリスティックを見てきた(上記の「プリミティブピッチヒューリスティック」というタイトルのサブセクション)。このセクションでは、それらを使用してテクスチャをどのように作成することができるかを示す。バッハのCマイナー前奏曲のより詳細な解析については、この詳細な解析は考察を妨げないように配置された以下のセクションDを参照されたい。「テクスチャ」というタイトルの上記サブセクションで概説したプロセスに手続き的に歩み入る。
このセクションでは、図18の楽譜に見られるデタシェストリングライティングの生成系版を作成するものとする。この図は、赤(高音部の音符E、第1小節)、緑(赤及び黄色を除く他の全ての音符)及び黄色(ベース音及び第1小節の最初のコードのトライアドにおける他の音符)の配色系を通してヒューリスティックのエントロピー、冗長性及び発展を示す。
図18の楽譜は、音ピッチにカラーラベルが関連付けられたデタシェストリングライティングの4小節セクションである。これは、バイオリン1及び2、ビオラ、チェロ及びチェロをダブリングし、1オクターブ下の音を出すダブルベースにわたって編曲される。
このライティングスタイルは、ボーンスプレマシー(Crowley&Greengrass,2004)及びアルマゲドン(Bruckheimer&Bay,1998)等の多くのハリウッドのスリラー及びスパイ楽譜で典型的である。解析の視点から、この技法がなぜ、この技法を用いる映画において特定の半音と関連付けられるのか - 人気すぎて陳腐化した - 調べる価値がある。典型的には、アクションシーンにざらざらした緊張を加えるために使用される。アクションがフルスイングで開始される、アドレナリンを刺激するチェイスを支える。このため、手元にある楽器で可能な限り低い範囲で編曲される傾向があり、これは、通常、本質的にテクスチャにおいてリズムパターンが主要特徴であるようにリズムパターンに余地が与えられ、このリズム又はピッチエリア内の他の楽器により不明瞭化されないことを意味する。
ストリングが可能な限り低いというこの要件は、有用な開始点を与える。コードはバイオリンとビオラで近いため、ピッチ深さ制限は第2バイオリンにかかる。これを行うヒューリスティックは、前のヒューリスティックに基づくことなく第2バイオリンに向けて作成されることになり、結果として、第2バイオリンの最初の音ピッチは赤で色分けされる。この場合、これは、テクスチャの上から2番目の音を、下のGを下回ることなく下のGに可能な限り近づけるように制限することを意味する。その場合、第1バイオリンはこの上の転回を演奏し、ビオラは下の転回を演奏する。第1バイオリン及びビオラの最初の音のピッチは両方とも、第2バイオリンのために作成されたヒューリスティックの発展版であり、したがって、黄色で色分けされる。
低音部及びチェロは、単に可能な限り低いユニゾンで演奏している。したがってそれらは、第2バイオリンと同様の手順に従うが、それらの最低音はMIDI C1(36)である。したがって、第2バイオリンに向けて作成されたものと同じであるが、それらの最低音に異なるパラメータを有するヒューリスティックを使用することができる。したがって、低音部及びチェロのピッチは、最初の音符では黄色である。例における音符の残りの全てのピッチは、最初の音ピッチと全く同じヒューリスティックを使用して作成され、したがって、それらの音符の符頭は緑色である。
コードがコード変化の8分音符1つ分前で現れる場合、新しいコードが予期又はプッシュされて、先制的なアップビートになることに留意する価値がある。これは、コードが第2小節のコードに8分音符1つ分早く変わるとき、第1小節の終わりで見られ得る。このため、任意の所与のコードに必要なピッチのみならず、直後のコードに必要なピッチも計算する必要がある。次いで、リズム生成器がコードの配置を作成する場合、コードがコード変化から8分音符1つ分離れているとき、後続コードのピッチを適用することができる。このプッシュはリズムアダプタで計算され、それにより、リズムアダプタは、コード変更が8分音符1つ分の時間以内に生じるか否かを判断することができ、生じる場合、現在のコード位置のピッチから次のコードの位置のピッチへの選択をどのように変更するかを判断することができる。
ステップ1:ピッチ
解析のピッチコンポーネントのハイパーノード構造は以下の通りである:
第1のハイパーノードはANDハイパーノードであり、100%の確率が与えられたリスト内の全ての要素を処理することになる。
1.100%-コア:アイディアスタッフのセットアップ
これは、現在のコード用の5つのピッチ記憶位置と、次のコード用の5つのピッチ記憶位置とを有し、合計で10個の位置を与える、Stringsという名前を有するアイディアスタッフを準備する。テクスチャアダプタは、現在のトリガーの8分音符1つ分後にコードが存在することを検出した場合、5を配列位置サーチに追加し、したがって、来るコードのピッチを選択する。
2.100%-ANDハイパーノード:「バイオリン2」
2.1 100%-コア:ボイスリーダー
(a)このボイスは固定数のMIDI G2(55)から導かれる。
(b)方向は上であり、G2から変わる必要はない。
(c)参照するコードは、この小節内のコードスキームである。
(d)ピッチデータの宛先はStrings位置2である。
2.2 100%-コア:音ピッカー
次のヒューリスティックは、2.1における第1のヒューリスティックを繰り返すが、参照するコードにおいて1小節分のオフセットを有し、したがって、後続するコードからピッチを選択することになる。しかしながら、現在のコードがコードスキームにおける最後のコードである場合、探すべきいかなるデータもないことになる。原子形態の終わりでトリガーされた8分音符がある場合、リズムアダプタはそれでもなお、この配列位置における音符を探すことになる。したがって、これは、この状況に対処するための先制的ヒューリスティックである。これは、単に2からコピーされた値でStrings配列の位置6を初期化する。
2.3 100%-コア:ボイスリーダー
述べたように、このヒューリスティックは2.1におけるヒューリスティックと同一であるが、参照するコードにおいて1小節分のオフセットを有し、したがって、後続するコードからピッチを選択する。
3.100%-ANDハイパーノード:「バイオリン1」
3.1 100%-コア:ボイスリーダー
(a)このボイスは、現在の小節におけるバイオリン2から上方に、コード内で利用可能な次の音符に通じる。
(b)方向は上であり、バイオリン2参照からの変更が強いられる。
(c)参照するコードは、この小節内のコードスキームである。
(d)ピッチデータの宛先はStrings位置1である。
3.2 100%-コア:音ピッカー
バイオリン2での先制的ヒューリスティックと同様に、これは、1からコピーされた値でStrings配列の位置5を初期化する。
3.3 100%-コア:ボイスリーダー
このヒューリスティックは3.1におけるヒューリスティックと同一であるが、参照するコードにおいて1小節分のオフセットを有し、したがって、後続するコードからピッチを選択する。
4.100%-ANDハイパーノード:「ビオラ」 4.1 100%-コア:ボイスリーダー
(a)このボイスは、現在の小節におけるバイオリン2から下方に、コード内で利用可能な次の音符に通じる。
(b)方向は下であり、バイオリン2参照からの変更が強いられる。
(c)参照するコードは、この小節内のコードスキームである。
(d)ピッチデータの宛先はStrings位置3である。
4.2 100%-コア:音ピッカー
先制的ヒューリスティック:3からコピーされた値でStrings配列の位置7を初期化する。
4.3 100%-コア:ボイスリーダー
このヒューリスティックは4.1におけるヒューリスティックと同一であるが、参照するコードにおいて1小節分のオフセットを有し、したがって、後続するコードからピッチを選択する。
5.100%-ANDハイパーノード:「低音部」
5.1 100%-コア:ボイスリーダー
(a)このボイスは、固定数のMIDI C1(36)から導かれる。
(b)方向は上であり、参照からの変更は強いられない。
(c)参照するコードは、この小節内のコードスキームである。
(d)ピッチデータの宛先はStrings位置5である。
5.2 100%-コア:音ピッカー
先制的ヒューリスティック:5からコピーされた値でStrings配列の位置10を初期化する。
5.3 100%-コア:ボイスリーダー
このヒューリスティックは5.1におけるヒューリスティックと同一であるが、参照するコードにおいて1小節分のオフセットを有し、したがって、後続するコードからピッチを選択する。
6.100%-ANDハイパーノード:「チェロ」
6.1 100%-コア:音ピッカー
この音符は位置5における低音部をコピーする。(チェロで演奏されるとき、1オクターブ高い音が出る)。
6.2 100%-コア:音ピッカー
この音符は位置10における低音部をコピーする。これは、テクスチャを作成するために必要な全てのピッチ情報を与える。
ステップ2 - リズム
ここで、リズムを考慮する必要がある。各小節には2つのコードが存在する。最初のコードは、第1拍の1度又は2度の8分音符のいずれかで出現する。第2のアタックポイント又はスタブは、第2又は4拍のいずれかの+に出現する。キットのファイル内のリズムハイパーノードはこのように見える:
1.100%-XORハイパーノード:「1又は1+」
このノードは、小節中の最初のスタブが第1拍の最初の8分音符で来るか、それとも第1拍の2度の8分音符で来るかを選択する。
1.1 50%-ANDハイパーノード:「l」
1.1.1 100%-DRUM:1バイオリン1
(a)これは、他の全てのドラムにコピーされることになるドラムテンプレートである。
(b)グリッド解決=8。122の速度で第1泊においてトリガーする100%のチャンス。速度は、10によりランダム化される(122は、117~127の範囲を与える)。ループ長は、4拍である。長さは、8分音符1つ分である。ピッチは、位置1に設定される(これは、Stringsアイディアスタッフ内の位置である)。
1.1.2 100%-DRUM:1バイオリン2
ドラムバイオリン1のコピー。ピッチは、位置2に設定される。
1.1.3 100%-DRUM:1ビオラ
ドラムバイオリン1のコピー。ピッチは位置3に設定される。
1.1.4 100%-DRUM:1チェロ
ドラムバイオリン1のコピー。ピッチは位置4に設定される。
1.1.5 100%-DRUM:1ダブルベース
ドラムバイオリン1のコピー。ピッチは位置5に設定される。
1.2 50%-ANDハイパーノード:「1+」
1.2.1 100%-DRUM:1+バイオリン1
手短に言えば、このノードは、ヒューリスティック1.1における全てのドラムのコピーを含むが、確率グリッドは、小節の最初ではなく2度の8分音符で100%である。ドラムの名前が異なり(+符号を組み込む)、したがって、ノットリスト及びアトラクタリストは、必要な場合、これらの名前が類似するドラム間での差別化を示すことができることに留意する価値がある。
1.2.2 100%-DRUM:1+バイオリン2
1.2.3 100%-DRUM:1+ビオラ
1.2.4 100%-DRUM:1+チェロ
1.2.5 100%-DRUM:1+ダブルベース
2.100% XORハイパーノード:「1又は1+」
このノードは、小節中の2度のスタブが2+で来るか、それとも4+で来るかを選択する。
2.1 50%-ANDハイパーノード:「2+」
2.1.1 100%-DRUM:2+バイオリン1
これらのヒューリスティックは、ヒューリスティック1.1における全てのドラムのコピーであるが、確率グリッドは2+で100%である。
2.1.2 100%-DRUM:2+バイオリン2
2.1.3 100%-DRUM:2+ビオラ
2.1.4 100%-DRUM:2+チェロ
2.1.5 100%-DRUM:2+ダブルベース
2.2 50%-ANDハイパーノード:「4+」
2.2.1 100%-DRUM:4+バイオリン1
これらのヒューリスティックは、ヒューリスティック1.1における全てのドラムのコピーであるが、確率グリッドは4+で100%である。
2.2.2 100%-DRUM:4+バイオリン2
2.2.3 100%-DRUM:4+ビオラ
2.2.4 100%-DRUM:4+チェロ
2.2.5 100%-DRUM:4+ダブルベース
これらのヒューリスティックはカスタムリズムアダプタにより処理される。このアダプタは、次のコード又はフレーズの終わりが、任意の所与のトリガーされた8分音符から8分音符1つ分離れているか否かをチェックする。離れている場合、5をピッチ位置に加える。これは、Stringsアイディアスタッフから次の小節の音符を選択する。
セクションD
I.本発明の実施形態及び態様の生成系システムのヒューリスティックを生成するためのバッハCマイナー前奏曲のコンテキスト解析
DC.1 要約
この研究の目的は、解析された作品及び他の多くの作品を再現可能な例示的なヒューリスティックのセットを作成することを目的として、バッハ前奏曲を解析することである。
コンテキスト的に、この解析は、定性的音楽データを定量的経験データに変える方法を提供し、コード転位/操作、コード構築及び音生成の処理に関して有効性及び上記手法を実証する。
アルゴリズムの抽象化は基本的に、専門家の定性的意見に基づく。これらのアルゴリズムは、観測可能な結果に伴って変更することができる複数のパラメータ及び基準を有する。これは、各アサーションの有効性を測定し、一貫した音楽結果を与え、全てのコンテキストで機能する一揃いのヒューリスティックを作成する方法を与える。
D.2 前置き
曲を全体的に再現するヒューリスティックの簡単なセットを識別し作成しながら、これらのアルゴリズムプロセスは、広範囲の良質なマテリアルを生成することも可能である。
他と同様に、この解析方法の適用も主観的で反復的である。しかしながら、その発見は、解析の有効性の試験に使用することができるヒューリスティックの経験的に測定可能なセットのロードマップを提供する。この方法を通して、定性的解析を行い、それを、定量的に判断することができるヒューリスティックのセットに変えるためのロードマップが識別される。
考慮される曲は、平均律クラヴィーア曲集第1巻(1722年)からのバッハのCマイナー前奏曲の最初の24小節である。これは、最初の24小節のデータから取得可能な3つのアルゴリズムのデータを含む。これらの小節は曲の初版の大部分を構成し、その後、第25小節から第35小節に飛び、Cメジャーの1小節で終わり、総じて27の小節がある(Ledbetter,2002、第152頁)。
以下の研究は4つのエリアに分けられた:テクスチャヒューリスティックに3つ及びフレーズ解析に1つ。
D.3 解析方法
解析全体を通して、構文構造及び音ピッチが強調される。その目的は、純粋にエントロピーで冗長的なものは何か及び作成されるマテリアルは何かを確立することである。図19は、赤は「エントロピー」を示し(最も濃い陰影、第1小節中の第1から3音符の位置及び第2小節中の高音部の位置2から4における音符の位置)、緑は「冗長性」を示し(中間色の陰影、第1小節中の第4音符の位置並びに赤又は黄色として明らかに示される音符以外の第1及び第2小節中の残りの全ての音符)、黄色は「作成された」ことを示す(最も薄い陰影であり、第2小節中の高音部及び低音部の両方における最初の音符)予め定義された配色を使用して、最初の2小節におけるエントロピー、冗長性の典型的な構造及び作成されたマテリアルを示す。
D.4 形態全体像
手元の曲に関して、(Bruhn,1993)はそれを4つの構造セクションに分解する:
1.第1~4小節(Cマイナーでの完全なカデンツ)、
2.第5~14小節(Ebメジャーへの転調)、
3.第15~18小節(Cマイナーに戻る転調)、
4.第18~38小節(Cでの複雑で拡張されたカデンツ)。
解析は、任意の所与のセクションの機能のより動的な流動性を利用する。このセクションは、曲が同じアルゴリズムプロセスの3つの異なる変形に分けられることを示す。セクション1は、第1から8小節までのこのプロセスの第1の変形である。セクション2は、第19及び20小節に存在する第2の変形である。セクション3は、第21から24小節まで続く第3の変形である。これらのセクションは各々、マテリアルを生成する異なるアルゴリズムプロセスを有し、バッハ前奏曲の構造への洞察を提供する。形式の視点から、これらのセクションの各々はよりモジュール式のコンポーネントに分解可能である。
本発明の生成系作曲システム全体を用いる場合、形態は弾性であり、作曲がなされた映画等のマルチメディア製品の構造に基づいてブリーフ要件のセットを改善することにより決定付けられる。記載されるのは、異なるブリーフィング要件の使用を通してコードセクションをどのように伸長及び短縮することができるかを詳述するプロセスである。
D.5 フレーズ解析
このフレーズ解析の目的は、コードスキーム及び形態曲を生成するヒューリスティックの3つの別個の異なるセットを定義することである。
D.5.1 フレーズ1(カデンツ):第1から4小節
このフレーズは、Cマイナーのキーセンターを強調するループ可能なステートメントとして機能する。IV dimが局所主音へのカデンツコードとして使用することができることを実証する。
D.5.2 フレーズ2(シーケンス):第5から12小節
従来の解析は、このセクションを、6-3から6-4-2としての数字付き低音である第3転回ドミナントセブンスへの第1転回メジャーコードを使用した下行スケールのハーモニゼーションによるものと見なす(Ledbetter,2002)。第5及び6小節におけるAbからDコードが厳密な5度圏パターンに従わないことを除き、これを5度圏と見なすことが可能であろう。
したがって、以下は、メジャー又はマイナーハーモニーの選択及び厳密な5度圏外にあるこれらのコードのルートの選択の両方を説明するために、従来の解析が提供することができるものを越える手法、即ち論理的ヒューリスティックのセットを適用する。この手法は、システムがメロディをハーモナイズするために単に即興で任意のコードを生成できないようにし、それにより、優先度の高い全音又はキーセンターが失われる、調性音楽の領域外に追いやれないようにするため、必要であると見なされる。
しかしながら、評価は、新しいコードスキームが本明細書に記載の作曲原理に基づいて生成された場合、特定のコードスキームをカテゴリ化することが可能である必要がある。
第5小節と第14小節との間のコードスキームに可能な幾つかの解釈がある。コードスキームがAbに戻る(所与のスケール内の下行5度圏と等しい)まで、新しい各コードの上行3スケールステップのメロディマイナースケールにおけるインターバル関係に従う。これはシーケンスフレーズとして解釈することができるが、これは、依然として、D7コードを生成する生成系構造を提供しない。より興味深い解釈は、全三音置換の原理の解釈である。ジャズで知られるが、これは、ドミナントセブンスの代わりに、ドミナントセブンスから全三音(又は増四度)離れたドミナントセブンスを使用することができる場合である。これは、Ab=>D7=>Gmからの遷移をサポートする。しかしながら、AbがD7を引き伸ばすための全三音置換として機能している場合、これらのコード間の入れ替わりにより、まるでGmへの長いカデンツが存在するかのように、なおかなり自然に聞こえる曲が生成される。試験中のアルゴリズムにより演奏される場合、これは全く当てはまらず、野暮に聞こえる。
好ましい解釈は、マイナーキーにおける曲の任意の発展セクションに適用することができるシーケンスフレーズ法を使用することである。下行メロディマイナースケール内のランダムな場所を選択し、次いでその音から下行スケールを作成することにより、コード変更のあらゆる音を繰り返す。例えば、Ab、G、G、F、F、Eb;又はD、C、C、Bb、Bb、Ab、Ab。スケール内で半音に直面する場合には常に、三全音置換がドミナントに対して行われて、パターンをハーモナイズし、全音に直面する場合には常に、単純なII V7進行が使用される。スケールはコードシーケンスの生成のみに使用されるため、次いでスケールは破棄される。
これは、以下の疑似コードで表現することができる。
D.5.3 フレーズ3(カデンツ):第13から14小節
フレーズ2シーケンスはエスケープフレーズを必要とし、これは相対メジャーEbへの完全なカデンツとして第13及び14小節で生じる。このシーケンスは、相対マイナーからのスケールから生成される。したがって、エスケープフレーズは、前のシーケンスで何が起こっていたかについて心配することなく、相対メジャーの特定のキーに集中することができる。これは、生成系メカニズムが上記疑似コードを使用してCのキーにおいてDのスケール位置で終わる場合等、かなり興味深いがそれでもなお実行可能なエスケープ関係を作り出す。
これは、「chordList」内の最後の2つのコードがBbm及びEb7であることを意味するであろう。提案されたエスケープメカニズムを使用して、Bbm=>Eb7=>Bb7=>Ebを取得する。
D.5.4 フレーズ4(カデンツ):第15から16小節
このフレーズは、Ebメジャーの相対マイナー、即ちCマイナーの元のキーセンターにおける疑問として作用する。これは、ルートをEbとして解釈する場合、相対メジャー9#11 13として分類することもできる相対メジャーの上主音dom7thの使用を通して相対メジャーから転調する方法を与える。その場合、このコードはBb7b9と見なされ(このコード分類の理由についてはセクションD.6.2を参照されたい)、これは、続く応答フレーズに接続される。
D.5.5 フレーズ5(カデンツ):第17から18小節
これは、疑問フレーズ4に対する応答フレーズである。上主音ディミニッシュからの主音マイナーへのカデンツとして機能する(このコード分類の理由についてはセクションD.6.2を参照されたい)。
D.5.6 フレーズ6(シーケンス):第19から20小節
このフレーズは、ヒューリスティックの第1のセットの適応であるヒューリスティックの第2のセットを明らかにする。これは、定義上、第21小節におけるエスケープフレーズへの高まりとして作用するため、自己内包式セクションであることを意味する。フレーズは現在、サブドミナントマイナーから上行ディミニッシュコードを介して第2転回主音に移るコードスキームを有する。これらのコードは、ボイシングの上に重ねられた主音Cマイナーコードを有する。これを扱う2つの方法が存在する。第1に、この時点で2つのコードを作成し、それらのボイシングにルールを与える。第2に、Cマイナー音に既存のコード内のコンテキストを与える。この2番目の手法は、第19小節ではFm7として、第20小節ではF#dimとして表されるものを生成するが、3度の16分音符でのBの使用は、これらのコードをそれらの小節のテクスチャには可能性が低い候補にする。テクスチャの装飾に使用されるヒューリスティックは、Cマイナーに基づくように見え、フレーズ全体を通して明らかに持続する。したがって、2つの重ねられたコードの最初の解釈がより道理にかなう。Fm及びF#dimのこの特定の例は、カデンツ6-4に辿り付く従来の方法であるが、この共同発明はヒューリスティックの形での説明を必要とする。
セクション2(D.7)は、この2小節フレーズが、主音トライアドの最初の2音、ここではC及びEbが、コード内のより高い音 - 又は拡張 - としてこれらを有する多くの他のコードの拡張であり得ることを訴えているように見えることを考慮する。コードのこのシーケンスパターンを作成するために、以下の疑似コードを使用することができる。
ここで、findChordWith()は、任意の度の拡張(7度、9度等)を有するメジャー又はマイナーコードを返す関数であり、ディミニッシュコードを返すこともできる。(この場合、AdimとしてAb5を潜在的に返すことができる)。
この解析方法を通して生成される全てのヒューリスティックと同様に、音楽的に許容可能な状態に留まることを保証しながら、可能な限り多様な音楽アイディアを生成することができる方法を定義しようとする試みにおけるアナリストの最初の試みをもたらす、アナリストにより行われるコア定性的判断が存在する。したがって、これらのヒューリスティックは、ルールが生成する音楽的アイディアのリターンに対する判断をアナリストが下すことにより、定性的に改良される。これは、予行演習又は実際の計算を通すことができる。これらの改良の目的は、予め定義された聴取者により知覚される音楽的に許容可能な結果を指すことである。したがって、アナリストが聴取者をどのように定義すると決定するかは、下される作曲判断に影響を及ぼす。異なる意見は、返される出力の異なる真理をコンテキスト的に述べることが可能であり得る。この特定のフレーズの場合、ジャズの深い経験があるアナリストは、返された特定のコードを代替と知覚し得、したがって、異なるアナリストは与えないであろう実行可能なコンテキストを無意識のうちにそれらに与え得る。よい作曲家は、周囲シンタックスを通して所与のコードを編曲し準備する十分な範囲を所与として、複数のインターバルの任意の組合せを正当化するためのコンテキストを提供可能であると考えられる。任意の特定の時代からの曲の十分に大きいサンプルセットを所与として、ヒューリスティックの進化は、音楽の歴史におけるある時点から別の時点へのコード及び慣例の発展への洞察の増大を提供する。
この解析の場合、とられるスタンスは、問題となっている曲にとって結果がイディオマティックに聞こえることである。返された値を聞き、知覚を通してそれらを評価するこの定性的手法は、「音楽が実際にどのように聴かれるかを考慮しない抽象的推論を使用することは、...自身の実験への「理論的」正当化を探し求める音楽的因習打破主義者に共通した傾向である」ことを示唆するBall(2011年、第69頁)により明確に述べられた等の批評に対する防波堤を提供することができる。
ここで、Ballは、音楽を聴くときに精神が辿る聴覚認知過程を参照している。認知過程のモデルを考慮に入れずに音楽の科学的理論を作成することの落とし穴は、Wigginsら(2010年、第237頁)により強調されている。彼らは、「音楽、特に音楽構造は、精神にのみ存在するため、精神と異なる音楽の科学的理論の概念ですら疑わしい」及び「物事自体[音楽]を研究するために、音楽アナリストが使用する暗黙的又は言葉に表されない知識 - 聴取者及び他の現在活動中の音楽家により推測され経験される構造 - 及びそれらを構築するプロセスにアクセスする必要がある」と議論している。本明細書で表される例示的な研究は、これらの暗黙のプロセスの定義の基礎を提供し、それらの背後にある認知理論を説明する。
このフレーズ6の場合、2つのコードにより掛け合わせられる2つの音を有し、4つの可能性が与えられる。2つのコードは常に、ハーモニーを強調するために3度のスケールを有し、このセクションの要点は、下のEbからビルドダウンしているコード内の最も低い拡張を使用することである。したがって、この方法が5度を変更する任意のコードを返すのは無意味である。これが当てはまった場合、ルートのない3度及び5度が、既に使用可能なリスト内のコードになる。ルート及び5度の代替のボイシングは、問題となっているコードの調性に関して曖昧さを残す。これは、拡張がコードのトップで探し求められるフレーズ3では当てはまらないが、この状況では、ボイシング又はボイスリーディングをサポートする他の証拠はない。自然7度からフラット9度等の何らかの種類の3度関係をもたらさないインターバルを組み合わせることも非イディオマティックに見える。したがって、本発明の手法は、以下を通してのみメジャー及びマイナーサードを必ず可能にする拡張を返す:
(a)7度はメジャー又はマイナーであり、
(b)9度は半音下げられる(7度がマイナーの場合)か又は自然であり、
(c)11度は自然又は半音上げられ(9度が自然の場合)、
(d)13度は自然である。
方法は、方法が返すことになるコードのトップ拡張を作る音符の配列もとる。方法は整数をとり、これらの音符の下に、コードを作るために含まれることになる拡張の数を述べる。方法はブールをとり、この整数よりも少ない拡張を有するコードを使用することができるか否かを決定する。方法は、生成したコードが存在するか否かがチェックされるコード配列を受け入れる。
D.5.7 フレーズ7(シーケンス):第21から24小節
このフレーズは、繰り返される2つのフレーズとして解釈される。最初のフレーズは、第21及び22小節を通してシーケンスフレーズ6へのエスケープフレーズとして作用する。これらの2つの小節をループすることが可能であるが、まるで反復全体を通して上行拡張を用いた装飾を必要とする(実際に曲が第23及び24小節で行うように)ように感じられる。繰り返されるフレーズを装飾する必要性は、応答フレーズ:繰り返される場合、カデンス解決のクライマックス解放に向かって構築中であるように見えるものがどのように記述されるかである。
このフレーズは、初期主音-コードテクスチャを作成し、メインテクスチャの上に最も近い実行可能な選択肢であるメロディ音を選択することにより上行メロディを与えるように、主音への全てのカデンツである一連のコードを作成することにより生成される。(この実行可能性は、後述するように、音が、キューになるのに十分、メインテクスチャから離れていることに基づく(Deliege,2001))。サブシーケンス選択は、主音へのカデンツコード及び主音テクスチャの反復である一方、小節の高音部の最初の音は、カデンツコードの種々の可能性からの前小節の最高音よりも上の次に利用可能な音であると選択される。主音コードに戻る都度、高音部の最初の音(前のカデンツコードの小節内)への次の上行拡張が使用される。これにより、メロディ最高音からのテクスチャの次に低い音を、高音部の位置1におけるメロディ音から1オクターブを越えてずり下がることになり得る。しかしながら、テクスチャをより高くリボイシングすることにより、テクスチャは、位置1における右手の最高音のオクターブ境界内に収まる。数字付き低音は、高音部テクスチャと同じインターバルで開始されることにならない限り、同じままであり、同じインターバルで開始されることになる場合、1つの転回を高くして、ハーモニック変更を提供する。これは、テクスチャのボイシングがメロディに依存することを述べている。これは、オクターブスパンがその楽器にとってイディオマティックであるという点で、従来の考えから外れていない。
D.5.8 フレーズ8(カデンツ):35から終わりまで
本解析は、この曲のドミナントエンディングの装飾に関心がない。あえて言うなら、前のシーケンスフレーズはエスケープフレーズを必要とする。この状況でのエスケープフレーズは2つの小節の主音コードである。これは、途中を飛ばして第35小節に行く曲のオリジナル版と一致する(Ledbetter,2002)。
D.6 セクション1:第1~18小節
D.6.1 初期観測
1.自己内包式シンタグム(又は少なくとも符号)の証拠は、各小節が、後半に前半の完全なコピーを含むことからである。これは第18小節のみで変わり、第18小節では、低音部がCからBbを通ってAbまで下方ステップで移動する。この例外は、解析において後に局所化コンテキスト内で考慮することができる。更なる冗長性が、各第2拍の最後の3つのピッチが、第1拍の最後の3つの音ピッチと同じであることに見出すことができる。加えて、各小節の第1拍内の4度の各16分音符は2vのコピーである。これは、第3及び4拍が各々最初の2拍のコピーであることと組み合わせて、各小節内の4つの音の間の関係をアルゴリズムにより説明するのみでよいことを意味する。小節の残りの部分は、このマテリアルから生成することができる。
2.各小節内の問題となっている4つの音符から、16分音符1、2及び5はその小節のコードの音符である(1つの例外は第14小節)。
3.最初の16分音符での低音音符は、曲の大半全体を通してペダルを表すように見える;これらの低音音符は、特定の小節では変化するが、他の小節では変化しない。従来の解釈は、このペダル音符を、大半の解析が承認の域を出ない小節内で半音下げる(Bruhn,1993;Ledbettler,2002)。基礎をなすアルゴリズムが有効であるべき場合、そのような楽曲ステートメントをこのまま調べずにおくのは適切ではないであろう。むしろ、この音がどのように同じままであるか、この音を変えると何が起こるか、及びその音が変わる場合、何がその音のピッチに影響するかを確立する必要がある。
4.16分音符3で現れる非コード音が存在する。これらの音は必ずしも、Cマイナーの所与のキーのスケールノートに行き当たるわけではない。第2小節は、(右)手最高音におけるEナチュラルでこれを実証する。実際に、Fマイナーの小節のコードの導音として見える。Ledbetter(2002)は、バッハが、このフィギュレーションに到達するために、NiedtのHandleitung zur Variation(Niedt,1989)の第VI章を使用したことを示唆している。
しかしながら、Niedtの本は、音の自然化について何らの説明も提供していない。この章は、ボイスリーディング時、「より強いハーモニー」を得るためのルールを含んでいる。第2章は、協和音程及び不協和音程の両方の定義を含め、協和音程及び不協和音程のセットアップ及び問題のない解決のためのルールについて述べているが、これらのルールは、行われた選択の事後合理化から抽出することができるように音を適切に選択するためのヒューリスティックのセットを提供していない。これらのルールの特性は、単にバッハのライティング(それらを破る能力を含め)で示唆されているのみであるが、問題となっている音のピッチ選択についての説明は与えられていない。したがって、ヒューリスティックのシステムは、ピッチをどのように生成するかを決めるために、解析を通して得る必要がある。ヒューリスティックのこのセットには、人間的風合いを維持しながら、音楽の感情刺激を変えるために、パラメータを与えることが可能であるべきである。
5.フィギュレーションの小節内の方向パターンは、所々変わる。種々の小節において、バッハは、左手でのフィギュレーションの機能パターンを変えることを選んでいる。パターン変更がいつ必要か及びどの変形が適切かを計算するために、これは説明を必要とする。
6.バッハの暗黙的メロディは、他の音がフィギュレーションを形成するメインテクスチャ外にある。Deliege(2001)は、キュー抽象化の原理を通してこの現象を説明している。ゲシュタルト心理学内のグループ化の概念に基づいて、精神はこれらの音をメインテクスチャから分離し、メロディ機能との継続の意味をそれらに与える。以下、これをアルゴリズムによりどのように再現するかを考える。
D.6.2 テクスチャ
初期観測のポイント3から、第2小節のEナチュラルをその小節のコードであるFへの局所導音として解釈すると、その音のピッチの説明が導き出される。これは、その音がFマイナーコード、Cメジャーのドミナントから導出されると主張する。この小節においてEナチュラルの下にも現れるGを考慮する場合、これはCメジャーコードと一致する。したがって、あらゆる小節でこの3度の16分音符位置にある全ての音がその小節のコードのドミナント又はドミナントセブンスからのものであると述べることにより、興味深いパターンが曲の小節の残りの部分から現れる(ディミニッシュコードを含まず、これについては別々に考慮する)。各ドミナントコードは、5度音程を有することが保証される。他の音は、3度でドミナントコードを与えるか、又はフラット7度でドミナントセブンスを与える。更に、この5度には常に、その小節の現在コードの3度が先行すると共に後続する。このパターンは低音部又は高音部のいずれかで発生することができる。この5度は小節の局所ドミナントコードからの3度又は7度の音によりハーモナイズされるが、3度には、その小節の現在コードのルートが先行すると共に後続し、7度には5度が先行すると共に後続する。これは基本的に、ボイスリーディングを見る異なる方法である:小節のメインコードは、モードを与えるために3度を有さなければならない。パターンがこの曲でどのように機能するかのこの観測は、単に、3度が常に局所ドミナントの5度に下がって戻り(解析では3-5-3として下線が付される)、1度-3度-1度及び5度-7度-5度の関係でも同様であることを述べている。図20は、所与の小節のルートに関連するドミナントコード内の低音及び高音を示す。
以下の解析は、関連する最初の5つの16分音符位置における各音の動き及び音度の簡易版を示す。3度の16分音符の音は小節の局所ドミナントに関連する。別個のコードへの矢印は階層フローを示す。Cm=>G7は、CmはG7を要求することを意味する。アルゴリズムの用語では、これは実際に逆である:G7が、あるべきドミナントコードが何であるかを知るためにCmコードを「見る」必要がある。これは、単にG7のピッチがCmに依存すると言える。
赤色(最も濃い陰影)の音符は、新たに観測されたパターンのエントロピー性を示す。例えば、第2小節において、3-5-3構造は、ここで、冗長であり、1-3-1は、エントロピーであり、第1小節の5-7-5への発展として非関連である。したがって、これは、赤である(C.3を参照されたい)。加えて、第3小節において、両方とも冗長になり、b3は発展であり、したがって、黄色(最も薄い陰影)で示されている。本質的に、見つけられた初期パターンに対処するヒューリスティックを確立する。曲を通しての進行は、直面した新しいエントロピーマテリアル及びヒューリスティックによりそのままでは説明することができない(この例示的な解析のこの時点で)マテリアルと対処するためにヒューリスティックの適応又は新たなヒューリスティックの生成を見込む。
第2小節は、コードのルートに関してエントロピー的低音を含むが、コードは変更されているため、これは明らかに、第1小節からのペダルの発展である。16分音符5に現れる音は、前音よりも低いコード音である。これは第1小節に既に見られるため、冗長である。第2小節により、解析におけるピッチ方向矢印は完全に冗長的な特性になり、したがって、適用された方法論を証明する。
第3小節は、考慮されるセクション内の2つのコードの最初のディミニッシュコードである。このコードは、インターバル位置の表現方法の基本的特性を変える。最初に、これらのディミニッシュ小節は、ドミナントとして機能するように見え、メジャーの代わりにリラティブマイナーを16分音符3におけるディミニッシュコードのルート音に対して呼ぶ。これは冗長ではなく、元の楽曲概念の新しい発展であり、したがって、図において黄色の配色を有する(最も薄い陰影)。これらのディミニッシュコードを、ローカルドミナントが3度の16分音符に現れるドミナントとして扱うことは、セカンダリドミナントの原理と一致している。
しかしながら、スケールの5度をフラット5度として分類すると共に、6度をシックススと呼ぶことは、ディミニッシュコード等の均等インターバルコードについて話す場合、意味をなさない。それ自体のローカルルールを用いて、ディミニッシュコードを有する任意の小節を例外とすることが可能であるが、これは場当たり的なルールの作成に繋がる。新しいルールは、単に手元にある厄介な統計データを覆う絆創膏として作用するのみであるため、これは、望ましくない。しかしながら、コード内の音の位置の解釈を単に音の所与の配列内の位置に簡易化することにより、コードは配列として表現し直すことができる。したがって、Cマイナーコードのルート、3度及び5度は、単に配列の[0]、[1]及び[2]になる。配列の位置に含まれる実際の値は、整数表記{0,3,7}などでピッチを返すマイナーコード関数により埋められる。したがって、6度及び7度を同じこと:コード配列の位置[3]の占有者と見なすことができる。(これにより、ハーモニー等のこの解析から開発されたアルゴリズムプロセスに基づいて生成する異なるハーモニックシステムの使用も可能になる)。したがって、第1、2及び3小節は、図21に示されるように、配列位置として表現される。
ルールセットへのこの簡易化は、単に拡張を所与の配列位置に置くことにより、難しい拡張に容易に対処することができることを意味するが、それにより、解析の音楽解釈がわずかに抽象的で難しくなる。したがって、3度、5度等のコード内の音符位置に関して解析を表現するほうがよい。(これが最終的に当てはめられる計算配列構造を念頭に置いて)。図22を参照されたい。
この適合は、それでもなお、導音メカニズムを通して低音部が得るハーモニック独立性に対処するのに役立たず、より多くのディミニッシュコードを調べることでパターンが確立される。この解析で見られるように、低音部は、メインコードの配列ではなくそれ自体の配列に従う。これは一般に、作曲の多くのスタイル全体を通して広く行き渡っており、フォワードスラッシュを使用して、コード内に現れる音から独立して見え得る低音部よりもコードが優先されることを示すことにより、リードシートで表される。したがって、これは場当たり的なルールではなく、単に、音楽が、着想とは言わないまでも記号でどのように表されるかという事実である。ディミニッシュコードの低音部で機能する任意の音を想像することが実現可能である。その場合、初期仮定は、ディミニッシュコードが、後続小節の低音をそれらの低音としてとり、したがって、ペダルを作成又は継続することである。
Fdimである第3小節の解釈は、単に、ドミナントのマイナー版であるにもかかわらず、3度の16分音符位置においてドミナントの3度及び5度又は5度及び7度を有するパターンにコードを合わせることである。単にコードをFdimとして解釈すると、特別なルールで2度、3度及び4度の16分音符音に対処する必要はない。コードスキームがペダルベースを用いずにルートバスを用いて演奏される場合、従来の解釈では、この音をこの小節においてB又はGにするであろう。しかしながら、Fdimの選択された再解釈では、低音部をFにする。これは完全に許容可能に聞こえる。これは、データ内の複雑さへのコストなしでモデルを簡易化するという理由のみで楽譜の再解釈に向かう計算解析の簡単な例である。
図23を参照すると、第4小節は、第1小節におけるメロディ音の繰り返しで始まる。このピッチの繰り返しは、メロディ音の繰り返しが作曲で見られる初めてのときである。この新しい、したがって、エントロピー的概念を、メロディの流れが解析全体を通してどのように明らかになるかの更なる証拠として見なすものとする。
第4小節は、最初の3小節に見られるフィギュレーションパターンへの第1の変更を与える。実際的に、これは、単に、低音部における1度から2度の16分音符への選択されたインターバルジャンプにより、下行パターンが続いた場合、16分音符1における低音が16分音符位置5で繰り返されることが意味されるためである。したがって、この音が上がるための要件は、手元でマテリアルを作成することであり、黄色の配色を有する。これは、解析された24小節のうちの10小節で生じる。図24の表は、低音部における5度の16分音符及びそれが着地するコードコンポーネントを示す。低音部又は高音部にあるコードの局所ドミナントフィフス(16分音符位置3における)と5度低音部16分音符の上行又は下行ムーブメントとの間には相関がないように見える。
パターンは、以下の理由で以下に列記する小節に続く。
4:1度の16分音符の繰り返しを避ける。
10:低音部における7度が、新しいキューに繋がる1度の16分音符と、これらの2つの音のスケールステップ振動を通して耳により識別されるボイスリーディング関係を有すると混同されないことを確実にする(Deliege,2001)
11:先行小節及び後続小節がムーブメントパターンを変えるという事実以外に何らの理由もない。これは、バッハからの選択であり、ヒューリスティック考慮事項に関してエントロピーである。
12:1度の16分音符の繰り返しを避ける。
14:1度の16分音符の繰り返しを避ける(これは、後に考慮するこの位置における音を生成する新しい方法におけるヒントである)。
17:第10小節と同様に、1度と5度の16分音符間のみにスケールステップがあり、これは聴取者により解釈されている低音部メロディに繋がることができる。
19:1度の16分音符の繰り返しを避ける。
21:この位置にそのような音を生成する第14小節の方法により生成される。
23:第14小節の方法により生成される。
24:第14小節の方法により生成される。
したがって、パターンを変更せずに16分音符5における音を生成し、それが16分音符1における低音の全音内になるか否かをチェックして調べる簡単なヒューリスティックを導出することができる。全音内にある場合、パターン変更がトリガーされる。これに対する唯一の例外は、第11小節においてバッハが行う美意識的選択である。
第6小節は、ドミナントセブンスDコードが単に、ベースペダルを維持するために単にドミナントであるか否かという問題を生じさせる。Ledbetter(2002)は、この曲における第1転回メジャーコードから第3転回ドミナントセブンス(数字付き:6-3から6-4-2)を、下行スケールをハーモナイズする標準的な方法として説明している。この問題がここで重要である理由は、低音ムーブメントに起因してコードが作成されるか否か又はコードの選択に起因してペダルが作成されるか否かを突き止めるためである。現在、低音部を作成するコードとしてこれを解釈することを選択し、その理由は、それによりヒューリスティックが簡易化されるためである。コードが下行低音スケールから場当たり的に生成されるのではなく、低音はここで、選択されたか又は生成されたコード内に入る。
図25を参照すると、第7、8及び9小節は、16分音符1におけるメロディから離れた新しい情報を提供せず、あまりに新しい情報を提供しないため、第8及び9小節が第6及び7小節の完全(但し転位された)コピーであることに留意することが興味深い。本明細書で定義されるヒューリスティックは、そのような状況で複数の異なるバージョン及びボイシングを作成可能であるため、これは重要な美意識的観測である。バッハが完全な冗長性を使用し、ボイシング及びテクスチャ決定を繰り返して、形態を聴取者の時間的予測に与えるかに留意することが重要である。
第11小節には2つの可能な解釈がある:Ebコードのもの又はCm7コードのもの。マイナーセブンスコードは、実際には、バッハの作品全体を通して広く行き渡っている(Bbマイナーにおけるこの曲集内の22番目の前奏曲の第3拍等)。Cm7バージョンを使用することで、最初のセクションのヒューリスティックにおける低音部での1-3-1関係に直面する必要がなく、予測可能な3-5-3及び5-7-5関係のみに直面する。しかしながら、マイナーセブンスコードは、単に任意の他の小節においてメインコードとして出現しないため、この曲の言説において特徴となっていない。この解析から生成された、解読されたヒューリスティックに、この曲のコードスキームの、Cm7及びEbコードの両方をこの小節内に有するバージョンが供給される場合、Ebコードにより演奏されるボイシング及びアレンジメントは、はるかにより自然で適切に聞こえる。したがって、アルゴリズム的理由でこの小節をバージョン11bとして解釈することを選択するが、実際にはバージョン11aであることを理解する。実際にこれは、コードスキームへのEbコードの供給を可能にしながら、ヒューリスティックの好ましい構築を簡易化する。唯一の結果として、この特定の小節のボイシングは可能にならない。これは、より多くのパターンが発見され、よりよい一般化がなされるにつれて、ヒューリスティックの任意の後のバージョンで作成することができるが、本明細書に記載の方法論に基づいて解析及び生成系作曲を行う基本手法をこの解析が証明する限りにおいて無関係である。
上述したように、16分音符位置5における低音部が第11小節において上がる機能的要件は存在しない。バッハによるこの決定は、特定の段階中、エントロピー的問題のままである。
図27を参照すると、第12小節は精神の解釈をCmb6コード及びAbmaj7/Cコードとに分ける。これをAbmaj7/Cパターンと見なす場合、3-5-3関係が初めて分解されて、高音部において7-5-7及び低音部において5-3-5を与える。このコードをCmb6と呼ぶ場合、右手の最初のb6は、セブンスと全く同じように、それを4度要素として扱うことにより調整することができる。しかしながら、16分音符5における低音部のb6は、利用可能な5度を飛ばし(16分音符4における3度から16分音符5におけるb6まで行くため)、曲の残りの部分でこの挙動を見ないことを考えると、これは問題である。低音部における顕著なキューの作成を避けるために、この位置の低音部を落とすのではなく上げるパターンブレークの他のバージョンでは、16分音符5におけるアルペジオが、16分音符4の上である小節コードから次の音を有することが見られる。ここで、[2]配列位置から[4]まで上がる。繰り返されるb6ジャンプアウトがまるでキューであるかのように感じられるため、この曖昧さは明らかにバッハにより望まれている。これは、曲のリズムがこの特定の小節において駆け足で進行するように聞こえる効果をもたらす。新しい可聴キューのこの必要性は、転調のポイント:この時点で、第14小節におけるEbに向かうムーブメント:で生じる特定の事例として扱うことができる。これは、このピボットコードの重要な位置に関して許容されるように見えるが、アルゴリズムが転調のポイントに敏感である必要があることを意味する。この小節は、完全4度のジャンプを通してベースペダルを再び主音にリセットもする。これは、これまでの曲における低音部の下行ムーブメントを考えると、エントロピー的である。
第14小節は、小節コードの4度まで段階的に上がることにより、低音部に完全に新しいアイディアを導入する。これは完全に、この位置における所与のコードからのインターバルを使用するそれまでの曲の特徴から外れており、この曲の後のセクションにおいて作成されるアルゴリズムを示唆している。
このコードが16分音符5にAbの代わりにBbを有した場合、ここにエントロピーはなかったであろう。
余談であるが、この曲の近代的解釈を行う楽譜バージョンは、ワーグナー・フォルクマンの自筆譜(The Wagner-Volkmann Autograph)として知られていることに留意する価値がある。この写譜は、曲が1722年に作曲されてから10年後の1732年になされた。原譜は失われたと考えられており、これがバッハ自身の手書きの初稿の知られている唯一の写譜となっている(Palmer,1994)。しかしながら、バッハの息子であるヴィルヘルム・フリーデマンは、バッハの手でなされた種々の細かな修正を有する最初の11の前奏曲のより早期の形態の写譜を行っており、このバージョンはクラヴィーア小曲集(The Clavier-Buchlein)バージョンとして知られている。このバージョンは、イェール大学所有であり、バッハが、最初に、この5度16分音符位置にAbの代わりにBbを有していたことを明らかに示してる。これは図28に見られる。
上記は、バッハが、曲中で後に採用するプロセスを反映するために、後の改訂で曲中のこのポイントにおける音を変えたことを示唆している。(これらのプロセスは、単にドミナントが位置3で使用されるのと同じようにして、位置5でサブドミナントを使用する)。ヒューリスティック的には、これは、この特定のAbの発生を解析下の最初のセクションから分離することができ、このフィギュレーションがより広く行き渡るフレーズ3から得られるヒューリスティックを使用してこれを考慮することを意味する。
図29を参照すると、第16小節は、興味深いジレンマを3-5-3関係に導入する。この小節がDdimコードとして解釈される場合、位置3におけるC及びEbは、DのドミナントAと関連しない。
Bbは実際に小節において全く現れないにもかかわらず、3-5-3関係が維持されるべき場合、C及びEbは、2つの可能性のみを残す:ドミナントは、F7又はAbのいずれかでなければならない。Abは、小節がDbのコードであることを暗示するため、音楽的意味をなさない。F7は、Bb7b9へのドミナントとして音楽的意味をなしながら、3-5-3のパターンを持続させる。Bbコードは、前小節内のF7にリンクすることにより、コードスキーム内で完璧に機能する。(聞き取れるように、この小節及び次の小節は高度にクロマチックのままである)。最初の配列位置がb9を保持することができることを示唆するために、第16小節内で1度がないことを使用することができるが、b9を含む5度位置を組み込むように配列を拡張するほうがより一貫している。
第17小節は、これまでの曲内で経験した2番目のディミニッシュコードを含む(第17小節の解釈を受け入れる)。353関係は、第3小節の最初のディミニッシュコードで経験したように、16分音符3における更に別のセカンダリドミナント(マイナードミナント)に向かう。これは従来、ディミニッシュコードのドミナント機能を示す。この低音が曲内で有する、見ることができる唯一の関係は、次の小節における低音の関係である。しかしながら、これは、ディミニッシュコードに関して単純なヒューリスティックに繋がる:後続小節のコードの低音を含む。
図30を参照すると、第18小節は、自筆譜であるキルンベルガー譜、ゲルバー譜及びヴァルター譜に書き留められた低音部におけるムーブメントを含む(Palmer,1994)。クロール版のみがこのBb音をCとして残している(Ledbetter,2002)。当初は写譜の誤りであると考えられたが、これは後に一貫性の名の下で十分に正当化されていない。これは明らかに、セクションを終わらせ、第19小節におけるFマイナーへのムーブを強調するためにバッハにより確立されているキューである。このコードは、該当セクションを終わらせる。
低音部におけるこのリンクムーブメントは、このキューがどのように利用されるかの例の欠如に起因して、第1~18小節で作成される現ヒューリスティックに関しては無視される。16分音符9にBbを作る任意のヒューリスティックは、更なる補強証拠がない場当たり的なルールである。16分音符5における低音の第4音度は、第14小節と全く同じように、後続セクションのアルゴリズムによるプロセスに向けたシフトの更なる証拠である。任意の解釈を混乱させる更なる証拠は、クラヴィーア小曲集版において、16分音符5におけるFが、Cの反復として記述されており、したがって、低音部ムーブメントで生じているキューを強調していることである。
D.6.3 セクション1のヒューリスティック:第1から18小節
以下のコメントは、配列位置[0]から[15]の配列により低音部及び高音部の音に付番して、小節内の16の16分音符位置を示す。
D.6.3.1 H1.0:[0]における低音部を計算する
ペダル音:各小説の最初の位置における低音部の音のエントロピー性は、これらの可能性をもたらすために生成系ヒューリスティックが必要であることを意味する。小節のコード内の現在のペダル音及びその音がとるピッチ値の利用可能性を見ることにより、前小節の低音が現小節のコード内に入るか否かをチェックすることでこの低音部を計算することが可能である。音が入らない場合、次に最も近い利用可能な音が、前小節の低音の上又は下のコードから選択される。(上又は下のピッチのこの方向は任意であり、監督形態生成器により処理されるブリーフィング要素を通して含意要求から初期化することができることを意味する)。セクションを終わらせるために使用されるディミニッシュコードに例外が存在する:単に、カデンツしている小節の低音部における音を使用する。これは、曲を作成しながら、2つのパスが存在する必要があることを意味する。第1のパスは、ディミニッシュ節なしで記述される低音を確立することである。第2のパスは、次いで、1つ前の小節ではなく後続小節のものを見るようにディミニッシュコードの低音を変えることである。このダブルパスなしでは、ディミニッシュコードに達したとき、ヒューリスティックはヌルポインタを有する。
このパターンは、低音部がその原点から半オクターブを越えるまで続く。この曲の場合、主音Cが原点であり、このCの6半音下のF#がリセット位置であることを意味する。これよりも低い低音が生成される場合、パターンはリセットされ、現コード内の、主音上の初期開始低音に最も近い音が使用される。これは、第12小節において、音が第11小節の低音GからCの元の主音に飛ぶ場合、見られる。手元の曲では、ペダルが切り替わる;常に下がるのではなく、より高いか又はより低い最も近い音を選択する。第6小節から第7小節へとCからBbに下がる一方、第12小節から第13小節へとCからDに上がる。
D.6.3.2 H1.1:[1]における低音部を計算する
18の事例のうち、この音がコードの3度にある13の事例が存在する:この音がコードの3度にない場合、コードの5度にある。ヒューリスティックがどのように聞こえるかの初期調査中(選択を管理する美意識ヒューリスティックのオーバーライドを導入する前)、趣向を変えて、単にこれを50/50のシナリオにすることができる。これによりヒューリスティックは簡便になる:低音部[1]を[0]における低音部よりも上の3度又は5度にランダムにする。
D.6.3.3 H1.2:[2]における低音部を計算する
[1]における低音部ハンド音が5度である場合、これをドミナントセブンスの7度にする。これが当てはまらない場合、低音部[1]は3度でなければならない:したがって、[2]をドミナントの5度にする。いずれでも、[2]を[1]における低音部よりも下に転位する。
D.6.3.4 H1.3:[4]における低音部を計算する
図24の説明に示されたように、この音は、位置[0]における値の全音内に入り、低音部にキューを作るリスクがない限り、[3]における値([1]のコピーである)よりも下のコード位置であろうとする。この場合、次に利用可能なコード位置まで上がる。
D.6.3.5 H1.4:[1]における高音部を計算する
[1]における低音部が5度である場合、高音部[1]は、位置[1]における低音部の5度よりも上にするボイシングにない3度コードに等しい。他の場合、これが低音部よりも上のルート、即ち1度である50/50の機会がある。他の場合、これは5度である。
5度の場合、この値を第4、10、11及び12小節に見られる現在のピッチから1オクターブ上に転位することが可能か否かをチェックして調べる。[1]における前小節の高音部が、現小節の高音部[1]における新しい値から全音以下離れる場合、現在のピッチから1オクターブ上の転位を実行する。(これは、美意識ヒューリスティックが後に導入されるとき、より普遍的で完全なリファクタリングを必要とする簡易で初期的なボイスリーディングの場当たり的なルールである)。
D.6.3.6 H1.5:[2]における高音部を計算する
[1]における高音部が1度であり、コードがディミニッシュである場合、これをローカルドミナントのマイナーサードにする。他の場合、[1]における高音部が1度であり、コードがディミニッシュではないとき、これをローカルドミナントの3度にする。他の場合、[1]における高音部が3度であるとき、これをローカルドミナントの5度にする。他の場合、[1]における高音部が5度であるとき、これをローカルドミナントセブンスの7度にする。
D.6.3.7 H1.6:[4]における高音部を計算する
これを高音部[1]における値よりも下のコード内の次の拡張にする。この値が低音部[4]以下の場合、[4]よりも上の次の拡張を取得する。これは、耳がうまく処理しないカウンターポイントラインの交差を回避するためである。これは、平均律クラヴィーア曲集第2巻におけるEメジャー前奏曲からの一例を用いてBall(2011年、第148頁)により指摘された、バッハが敏感であったものである。これは、バッハが、ボイスがパスを横断しないことを確実にすることによりゲシュタルトスタイル連続性の音波での均等物をどのように回避するかを示す。
D.6.3.8 H1.7:[0]における高音部を計算する
メロディ音は決して、小節の高音部における最低音よりも1オクターブ上を越えず、また前小節における最後の音以下でもない(前小節の高音部[1]と同じ)。したがって、両要件を満たす小節のコード内の利用可能な音からランダム音を選択する。
D.6.3.9 H1.8:低音部及び高音部をコピーして位置を埋める
位置[3]、[5]及び[7]における値は[1]における値に等しい。位置[6]における値は[2]における値に等しい。小節の後半は前半のコピーである。
D.6.3.10 説明されないエントロピー考慮事項
図31における楽譜は、色分けの使用を通して動作の異なるヒューリスティックを示す。実線の矢印は、問題となっている音の最終ピッチについての情報を提供する他のノードへのポインタである。破線の矢印は、値が評価されるが、ヒューリスティック考慮事項に起因して使用されない音へのポインタを示す。
この最終的な全体像は、手元のセクションの階層の明確な印象を与える。略全ての音は、第1小節における初期低音に流れて戻る。各高音部位置[0]におけるメロディは前小節上に構築され、それら自体を高音部位置[15]における値から区別しようとし、それらの選択肢は、現小節における最低音よりも1オクターブ上の音の範囲に制限される。第1のパスを第2のパスで上書きする前、低音、第1のパス上に作成されたディミニッシュコードを見ることができる。最初のパスの矢印は破線であり、第2のパスの矢印は実線である。この可視化は、エントロピー的な赤(より濃い陰影)の内容を現在理解されている階層にどうしてリンクすることができないかを厳密に示している。ヒューリスティックが現在、正常に機能しないのはここである。
これが深刻な問題である2つの主なポイントは、ヒューリスティックは、低音部の位置[4]において公表されているAbではなく、Bbを選択する第14小節及び特殊な事例の低音部パターン - 小節の前半及び後半が異なるマテリアルを含む曲中の唯一のポイント - が生じる第18小節にある。これらの音の3つ全ては特に、現代版の元である自筆写譜と比べて、クラヴィーア小曲集版で異なるたった3つの音である。楽譜におけるこれらの2つの顕著なポイントと同様に、規模はより小さいが、現ヒューリスティックは、コードのAb/Cバージョンを使用する場合、第12小節における5-3-5のボイシングを説明せず、3-5-3パターンの生じ得る唯一のブレークダウンポイントである。
同様に、この小節をCmb6として表現する場合、低音部位置[5]におけるダブル位置ジャンプをもたらすことは、不可能である。これらの事例は別として、エントロピーコンポーネントは主に、ヒューリスティックの意思決定プロセスにおける美意識による判断の欠如を強調する。第11小節における16分音符5における低音部の上昇は、周囲の小節でなされた判断を見る美意識ヒューリスティックをオーバーライドせずに記述することができない。これらのより些細な両事例では、これらの値を生成可能なヒューリスティックのファイアリング(Firing)をランダム化した場合、両方とも可能になる。しかしながら、単に25回のうちの1回のみ、これらの例が発生するため、そうすることは、賢明であるように思われない。
メロディにおけるボイスリーディングも同様に、美意識ヒューリスティックを必要とし得る。ある小節から次の小節への判断における反復可能性の欠如は、出力を不必要に、人間が聞くには過度に無秩序なものにする。これは、純粋に美意識的な意思決定ヒューリスティックの欠如の更なる一例である。そのようなヒューリスティックは、単に2小節1組等のより予測可能なパターンで決定を繰り返すのみであるが、これは現在のシステムの出力可能性を制限する。
D.7 セクション2:第19~20小節
以下の2つのセクションは、主音マイナーフィギュレーションのコアテクスチャの作成に基づく。
セクション2では、バッハは、高音部の初期16分音符を反転させて、別個のコード及び顕著なキューとして低音と共にある[0]以外の他の位置における高音部及び低音部フィギュレーションの下に現れるようにすることによりこれを達成する。バッハがFm7からF#へのディミニッシュを使用することにより行った選択は、カデンツ64への一般的な準備として認識可能である。しかしながら、そのような選択をどのように選択するかをアルゴリズムにより及び多様な生成系結果に十分な範囲を与える方法で表現する必要がある。したがって、問題は、どの音のペアリングが、そのようなテクスチャの下に存在し、興味深い方法で追加することができるかである。音はランダムであり、それでもなお、第21小節の主音又はその首位に向かうハーモニームーブメントの意味を与えることができるか。簡単な鍵盤実験により、これが該当しないことが分かった。ランダムインターバルの使用は、ハーモニーの意味をなさない(形式的なハーモニーのまぐれ当たりでない限り)。しかしながら、F7コードが続くAbコード等のテクスチャの上にC及びEbを有する任意のコードの使用はハーモニーの意味をなす。
C及びEbをトップ拡張としてとることで、これらの2つの音をセクション2及び3におけるテクスチャのコードの上に組み込むことができるCマイナーの下で多様なコードを構築することが可能になる。図32の楽譜は、降順のピッチでコードを生成するメジャー及びマイナーサードの可能な組合せを示す。
特に、図32の楽譜は、トップ拡張としてC及びEbを有するメジャー及びマイナーサードの可能な全ての組合せ(1オクターブにわたる)を示している。ルールは特定の小節を除外している:赤のXコードはD5.6疑似コードを通して利用可能ではなく、紫のXコードはテクスチャ制限に起因して除外される。
このポイントでのよい疑問は、コードが何故トライアド形態なのかである。第21小節において向かう第2転回Cマイナーコード等のコードを作成するのに何故4度又は5度を組み込まないのか。これらの組合せの多くは、既に与えたコード又は形式的意味をなさないコードのいずれかをもたらす。4度を下に加えると、上のコードの多くは、単に所与のコードの異なる転回を生成するのみである。同様に、5度を組み込むと、換言すれば特定の音を除去してコードボイシングに穴を作ると、メジャー及びマイナーサードがなく、ハーモニー的により中味のないボイシングを生成するか、又は完全5度と2つのメジャー若しくは2つのマイナーサードで作られた任意のコードとの衝突に起因して不協和音を生成する。この一例は、Bの完全5度をF#ディミニッシュコードの下に加えることである。基本的に、西洋ハーモニーの「12音からの7音」系が現在進化したダイアトニックスケールは、メジャー及びマイナーサードのランダムな選択から作ることができるより鈍いコードの使用を排除している。これは、4度及び5度の導入の考慮以前のことでさえあり、コードの抽象性を指数的に上げるか、又は運のみで組み込まれたサードを用いて既に思い付いていたコードを単に承認するのみである。ダイアトニックスケール内に適合する図32の楽譜内の任意のコードが意味をなすように見える。Eオグメントコード(E#5 maj7)は、ロクリアン自然マイナーモードに基づいて変更されたコードとして考慮することができる(Levine、1995年、第70頁)が、トップEb(又はメジャーセブンス)は、モードに現れず、したがって、このコードは、実行可能な選択肢のように聞こえない。下にDbコードを有するCマイナーコンポーネントのサウンドを曖昧にするには近すぎるため、Dbオグメントコードをより曖昧にもしない。
Balzano(1980)は以前に、ダイアトニック系がスケール内に固有の数のあらゆるタイプのインターバルを提供することを示している。インターバル関係は直接転位を通してマッピングできないが、脳はこれに気付くように思え、これは、バッハがセクション2で使用しているように見えるトリックである。次いで、拡張を通してコードを見つけるこの方法は、セクション3で反転され、それにより、初期コードがペダルGから上方に装飾するように見える。フレーズ解析内の疑似コード(セクションD.5.6)は、可能性の配列から適切なコードを選択する実行可能な方法を提供する。この手法を所与として、図32の楽譜に赤で強調表示されるように、特定のコードをなくすことができる。空いているスペースをこの新しい認知キューが存在するためのものと考える場合、第19及び20小節のテクスチャ内で可能な音を示す図33の鍵盤表現におけるC及びEbの2つの代替ボイシングを通して示されるように、これらのキューの配置する限られた可能性が提供される。
全ての事例で、キュー音は、メインテクスチャ内の任意の他の音から少なくともマイナーサード離れて現れなければならず、そうでなければメロディキューが確立される。位置[4]における16分音符がメインテクスチャから外れる(高音部が上がり、低音部が下がる)場合、位置[0]及び[8]における高音の最大の利用可能性が与えられる。しかしながら、低音部における音は、高音部位置[0]のピッチを繰り返すことはできず、フィギュレーションの残りの部分全体を通して低音部における最高音のピッチよりも1オクターブ下よりも下がることもできない(最終要件は、所与の曲全体を通してのボイシング範囲のスタイル観測である)。これは低音部におけるトレードオフを与える:ピッチが位置[4]において上がる場合、低音部により大きい余地が存在するが、高音部には余地が少なくなる。
このジレンマは、システムが採用しなければならない最初の反復的再作曲の1つを明らかにする。所望のコードスキームが求められる場合、コードテクスチャはそれを組み込むように書き換えられる必要があり得る。コードテクスチャの書き換えが所望のコードスキームに適応することができない場合、コードスキームを書き換えなければならない。ネゴシエーションのこの反復プロセスは、作曲プロセスへの潜在的に記述的な洞察を提供する。所与の例のテクスチャでは、利用可能ではない図32の楽譜におけるコードは、紫色の×印が付されている。
これは、全て(C及びEbの下に最大で2拡張のみができるF#dimを除く)ランダム順に使用することができる6つの可能なコードを残す。これらのコードは繰り返すことができず、したがって、このセクションは潜在的に、現在利用可能なテクスチャを用いて6小節にわたり装飾することができる。
D.7.1 セクション2の初期観測
1.このセクションでは、続くセクションと同様に、16分音符[1]及び[3]のメインテクスチャが主音トライアドの最初の2つの音:C及びEbに基づく。このセクションでは、Cが低音部に現れ、Ebが高音部に現れる機会が50%であり、逆も同様である。
2.16分音符位置[4]はもはや、小節コードからの近隣拡張を伴わず、位置[0]又は[2]で使用されるコードの代替のボイシングを伴う。位置[4]が位置[2]におけるコードをコピーしている場合、このコードは必然的にフィギュレーションにおける特徴コードのドミナントである:Cマイナーグローバル主音。位置[4]が位置[2]をコピーしていない場合、[2]に現れる3度及び5度の代わりに5度及び7度が使用され得。位置[4]におけるコードが位置[0]におけるものである場合、コードの最初のインスタンスから代替の音を選択し、アルペジオムーブメントの方向をランダム化する。代替音を有することは、この事例ではディミニッシュ等の所与のコードに4つの音が存在する場合、2つの位置でのみ生じることができ、そうでなければ、通常のトライアドからの音を不可避的に繰り返すことが必要になる。これらの主張をサポートする統計情報は限られるが、この解釈は大きい生成系潜在性を与える。
3.このタイプのフィギュレーションは新しく、セクション1でヒューリスティックに有したものから位置[4]における近隣の音の移動方向を逆にする。第1から18章でのアルゴリズムの第1のセットでのように位置[2]において下降するのではなく、位置[2]において上昇し、次いで位置[4]において下降する選択肢が存在する。これは、第1のセクションの幾らか硬直したパターンと比べて膨大な生成系の可能性を提供する。これは、システム及びその方法論が、それまで存在しているテクスチャのいかなる証拠もなく、元のテクスチャを生成しているアルゴリズムによりコンポーネントを作成していることを意味する。
4.このセクションが、これらの作成されたルールに基づいて、このビルドアップの長さをのばすように更に拡張することはできないと述べているのではない。位置[0]に選択されるコードが決して繰り返されない場合、フィギュレーションは決して、このセッションが作成している緊張の全体的な高まりから異なるキューになるべきではなく、したがって、拡張可能であるべきである。全範囲の利用可能なコードは、C及びEbの下に拡張するのが1、2、それとも3つの拡張によるかに応じて、等しく効果的であるわけではない。
D.7.2 セクション2のヒューリスティック:第19から20小節
D.7.2.1 H2.0:[1]における低音部を計算する
これは、まず、50%ランダムに、C3よりも低い主音及びC3よりも低い主音コードの3度である。(これは、現在のボイシングに適切な範囲を優先して、前のあらゆるボイスリーディングも無視する)。
D.7.2.2 H2.1:[2]における低音部を計算する
このヒューリスティックはH1.2を拡張する。[1]における低音部が5度の場合、これを[1]における低音部よりも下の(メインフィギュレーションにおける特徴コードの)ドミナントセブンスの7度にする。[1]における低音部が3度の場合、これを[1]における低音部よりも下のドミナントセブンスの5度にする。加えて、[1]における低音部が1度の場合、これを[1]における低音部よりも下のドミナントセブンスの3度にする。
D.7.2.3 H2.2:H2.3の準備
このヒューリスティックは、位置[1]における低音部よりも下の1又は2(50%/50%)コード-コンポーネント位置のいずれかである位置[0]に値を置く。この値は、ここで、H2.3の所与の確率ツリー分岐をランダム化する。
D.7.2.4 H2.3:[4]における低音部を計算する
50%の時間、これはH1.3(H2.2により生成された音を必要とする)に従う。残りの50%、[4]を[2]におけるドミナントセブンスの関連音よりも上のドミナントセブンスの次のコード-コンポーネント位置にする。
D.7.2.5 H2.4:[1]における高音部を計算する
[1]における低音部が優勢コードのルートである場合、[1]における高音部を3度+1オクターブにする。他の場合、[1]における高音部をルートにするが、[1]における低音部よりも上のピッチを与えるオクターブ内にする。
D.7.2.6 H.2.5:[2]における高音部を計算する
H1.5のコピー。
D.7.2.7 H2.6:[4]における高音部を計算する
50%の時間、これを高音部位置[1]における値よりも上のコードにおける次の拡張にする。残りの50%、[4]を[2]におけるドミナントセブンスの関連音よりも上のドミナントセブンスの次のコード-コンポーネント位置にする。
D.7.2.8 H2.7:拡張コードからの音のピッチの利用可能性をチェックする
このヒューリスティックは、高音部及び低音部の両方での位置[0]における音に利用可能なピッチ範囲をチェックし、図32の楽譜にあるコードからのコード音を配置することを意図する。このプロセスは、図33の鍵盤表現で強調表示されている。高音部の最低音の下のマイナーサード及び低音部の最高音の上のマイナーサードから整数範囲を得る。
所望の第2コードの1度又は3度がこの範囲内に出現することをチェックする(コード要素は、ここで、それぞれ「1」及び「2」と呼ばれる)。低音部の最低音の下のマイナーサード及び低音部の最高音の1オクターブ下から整数範囲を得る。「1」及び「2」の一方の音が中間範囲内で利用可能な場合、他方の音もこの範囲で利用可能であることをチェックする。「1」及び「2」の両方が中間範囲内で利用可能な場合、それらの少なくとも一方がこの範囲で利用可能であることをチェックする。全ての音が配置可能な場合、それらを高音部及び低音部位置[0]に適宜分散させる。(これは低音部[0]における一時的な値を上書きすることになる)。他の場合、H2.0に戻り、それまでに全てのH2.xヒューリスティックに作成された値の配列を保持しながら再び開始する。値が変更された場合のみ、値を記憶する。これは、4つの異なるバージョンの出力を有する場合、H2.7が依然として満たされていないとき、コードスキームへの変更を要求する必要があり、次いで、記憶配列をリセットし、H2.0から再び開始することを意味する。
(分散論理は、以下を反映すべきである:
「1」及び「2」の一方の音が中間範囲で利用可能な場合、それをここに配置し、他方を低音部よりも下の、取得されたより低い範囲に配置する。
「1」及び「2」の一方の音が下範囲で利用可能な場合、それをここに配置し、他方を低音部と高音部との間の、取得された中間範囲に配置する。
両方が利用可能な場合、一方を各範囲にランダムに割り当てる。)
D.7.2.9 H2.8:低音部及び高音部をコピーして位置を埋める
H1.8のコピー。
D.8 セクション3:第21から24小節
セクション2は、コードを下に拡張するためにC及びEbを使用したが、このセクションは、拡張を終止又は上に延長するためのベースとしてC及びEbテクスチャを使用する。セクションC.5.7におけるフレーズ解析は、カデンツの高まりを提供するコードスキームを生成することが可能である。
D.8.1 初期観測
1.このセクションは、H2セットと同様に反復テクスチャを含む。位置[4]における高音部及び低音部が、ピッチを得るために、小節のコードのドミナントセブンスを使用する確率がより高い。
2.第22小節の位置[4]にGペダルではなくディミニッシュコードを使用することは、フレーズ解析ルールにより生成されたカデンツコードが単にドミナントである必要があるのみではないことを示す。実際には、慣例的に主音から離れた1つのカデンツ位置である任意のコードであり得る。この曲全般及びその時の他の作品から証拠を集めることにより、コード候補を発見することができる。ここにあるカデンツコードは、Fシャープディミニッシュセブンス及びドミナントb9である。ドミナントセブンスb9は、第25小節から終わりまでクライマックスの残りの部分(この解析から除外される)全体を通して高い。
D.8.2 セクション3のヒューリスティック:第21から24小節
D.8.2.1 H3.0:[0]における低音部を計算する
これは、第1小節における初期低音部主音、即ち曲の低音部位置[1]よりも上のドミナントである(これは、本研究では転調の確率を無視する)。
D.8.2.2 H3.1:[1]における低音部を計算する
これがセクションの第2小節である場合、H2.0を拡張し、単に、前小節においてこのヒューリスティックにより計算されたピッチをコピーする。
D.8.2.3 H3.2:[2]における低音部を計算する
H2.1のコピー。
D.8.2.4 H3.3:[4]における低音部を計算する
H2.3のコピー。
D.8.2.5 H3.4:[1]における高音部を計算する
これがセクションの第2小節である場合、H2.4を拡張し、単に、前小節においてこのヒューリスティックにより計算されたピッチをコピーする。
D.8.2.6 H.3.5:[2]における高音部を計算する
H1.5のコピー。
D.8.2.7 H3.6:[4]における高音部を計算する
H2.6のコピー。
D.8.2.8 H3.7:[0]における高音部を計算する
これは、この位置における前小節のピッチに最も近い小節のコードから次に利用可能な音の任意のオクターブ内でピッチを見つける。第1小節の初期ピッチの場合、その小節の高音部テクスチャ内の最高音の次に高いピッチ位置をとる。
D.8.2.9 H3.8:低音部及び高音部をコピーして位置を埋める
H1.8のコピー。
D.9 結果
バッハの選択が1音のみに制限されたと主張していないことに留意することが重要である。本明細書では真逆のことを言っている:バッハは多くの選択に直面したが、本明細書では、バッハが選んだもののこのアルゴリズムによる解析を用いてそれらの大半を一般化している。解析に反映された有効性が認められた手法は、この多様な選択に頼り、抽象化した原理に基づいて生成系作曲の柔軟性を与える。
第14小節における依然として説明されていないAbは、セクション2及び3での後のヒューリスティックを考慮した場合、容易に説明することができる。これらのヒューリスティックを先のものに代えてランダムに導入することで、これらの音を説明する能力が与えられる。近隣小節からのランダムな選択を観測しコピーすると共に、他のセクションからのヒューリスティックをランダムに相互交換する能力を有する美意識ヒューリスティックのセットは、原譜を生成する。
ヒューリスティックの後のセット全体を通して、前のセットがますます頻繁に再使用及び拡張されていることが顕著である。これは、ヒューリスティックデータ表現のオブジェクト指向手法を指している。H2.1へのH1.2の拡張は、任意の前の論理のスーパータイプメソッドを呼び出して、機能を追加するためにメソッドをオーバーライドすることが可能であるべきことを示している。
D.10 結び
ヒューリスティックを生成するときを示すと共に、それらの機能目的を与える、エントロピーマテリアル、冗長マテリアル及び作成されたマテリアルを色分けするシステムを実施した。解析でのエントロピー(赤/暗い色調)マークは、新鮮なマテリアルを作成する生成系ヒューリスティックを必要とし、冗長(緑/中間色調)マークは、生成系マテリアルを埋めるためにコピーヒューリスティックを必要とし、作成された(黄色 - 最も明るい色調)マテリアルは、生成系ヒューリスティックの出力を変更する関数ヒューリスティックの必要性を示す。本発明は、原曲の2音を除く全ての音を説明することができるヒューリスティックの3セット及び多くの代替を有する。
バッハのクラヴィーア小曲集の楽譜内の前奏曲の最も初期のバージョンが、第1セクションから本明細書で導出された一般的なヒューリスティックと一致し、第14及び18小節のオープニングセクションの解析側のエントロピーの苦痛の種をなくすことを示してきた。これは、この曲に対するバッハの当初の作曲手法と密に適合するルールセットを作成したことを示す。
特定の構成が互いと相互に排他的でない限り、本明細書に記載の種々の実施形態は組み合わせられて、システム機能を強化及び/又はユーザ知覚可能な類似性及び相違性の効果的な識別をサポートする相補的な機能又はシステムを生成することができる。そのような組合せは、上記説明全体を所与として、当業者により容易に理解されるであろう。同様に、好ましい実施形態の態様は、より限られた機能構成が適切な独立した構成で実施することも可能である。実際に、特定の好ましい実施形態における特徴が、互いと適合不可能であるとして明確に識別される場合又は周囲の状況から、相互に排他的であり、相補的及び/又はサポート的な意味で容易に組み合わせることができないことが暗示される場合を除き、本開示全体は、それらの相補的な実施形態の特定の特徴を選択的に組み合わせて、1つ又は複数の包括的であるがわずかに異なる技術的解決策を提供することができることを企図し想定することが理解されるであろう。添付図面の示唆されるプロセスの流れに関して、これらは、全体効果又は並び替えが同じ客観的最終結果又は次の論理ステップに進めるようにする重要な中間結果を達成する限り、プロセス内のステップの精密な実行時点に関して可変であり得る。したがって、フロープロセスは絶対的な特性のものではなく論理的な特性のものである。図面の機能アーキテクチャは、理解されるように、互いから独立して実施し得、したがって、生成されるシステムは、インターネット等のワイドエリアネットワークを介して潜在的に拡散した分散システムである。アーキテクチャ的に、[最終的な自動音楽作曲のためのベースとしての]本明細書に記載のテクスチャ分類等であるがこれに限定されないシステムの態様の実現は、Javaエキスパートシステムシェル「JESS」、より典型的には特注のエキスパートシステム等の技術を使用して実施することができる。
本発明の態様は、ダウンロード可能な形態で又はインスタンス生成されると、ウェブサーバ等に機能的に組み込まれたリンクを実行するプログラムを含む、CD-ROM等のコンピュータ可読媒体で提供し得る。
School of Electronic Engineering and Computer Science,Queen Mary,University of Londonにより2021年3月31日に同時期に初めて公表された「Meta Creation for Film Scores」という名称のJoseph Michael William Lyskeの博士論文が全体的に、参照により本明細書に援用される。
本明細書に開示される発明は、例示的なフォーマットとして使用してきた西洋音楽のみならず、任意の音楽スケール及び任意の文化前提条件に適用可能である。
本明細書に開示されるように、原子形態は、生成系作曲が基づくことができる例示的で重要な構築ブロックを提供するが、本開示は全体的に、ハイパーノードフレームワークの使用を含め、かなりの詳細を有する包括的な実装形態を一緒になって提供する複数の独立した(しかし、関連する)態様を含む。例えば、作曲の視点から、テクスチャの分類及び操作はかなり重要である。例えば、複数の独立した技術的解決策が、コードスペーシングが決定されるプロセス及びプリミティブが生成系システムを構築する状況内でどのように作成され、採用されるかに関連する。当然ながら、上記説明が単に例として与えられており、細部の変更を本発明の範囲内で行うことが可能なことが理解されるであろう。例えば、生成系システムは特定の音度を有する西洋音楽の状況で表されてきたが、本技法は他のスタイル及び拍子と交換可能である。
解析技法は、生成系フレームワークと結合されて、有効出力に繋がるように音楽を階層的に見るための土台を与える。これは、実際には、インタフェース並びに個人的に好きなアーティスト及び歌にメタタグ付けられた原子形態を含むデータベースを介してシステムへのアクセスが与えられた場合、ユーザにより個人的に編曲することができる美意識的に機能する生成系映画楽曲及びゲームの楽譜を作成する有用な方法であるだけではない。
完全に自律的な解決策が、コンピュータが作品を解析し、解析に基づいて音楽を作曲する所与の階層に基づいて実現可能である。例えば、深層学習ニューラルネットワーク及び適合関数が関連付けられた生成系アルゴリズム等のトレーニングされた人工知能メカニズムは、楽譜に基づいて適切なプリミティブをどのように選択するかを学習することができる。この手法は、解析された楽曲の同じセットから同じ基準の出力を生成することができるヒューリスティックの更に小さいセットを作成するより効率的な方法に繋がる[オッカムの剃刀]。人間が潜在的に行うために残された唯一のことは、感情概念にメタタグを付すことであるが、このタスクさえも、意味論的ギャップを閉じ、NLP又はファイルプロパティを利用して感情知覚へと相関付けるAIネットワーク(米国特許出願公開第2020-0320398号明細書及び関連する著作に記載のもの等)の対象になり得る。したがって、当業者は、システムインテリジェンスのどの態様が異なる形態のプロセッサで恩恵を受け得るかを理解するであろう。

Claims (29)

  1. 生成系作曲システムであって、
    音楽の行程に沿った複数の音楽セクションの複数の感情記述を参照して前記音楽の行程を記述するブリーフィングナラティブを受信するために結合された入力と、
    インスタンス生成時にそれぞれ原譜を生成する複数の音楽データファイルを含むデータベースであって、各原譜は、自己内包的構造特性を有する複数の識別可能な連結された原子形態に分割され、各原子形態は、
    そのそれぞれの原子形態の楽曲性を記述するタグ、
    局所主音におけるコードのセット、及び
    疑問、応答及びステートメントの1つを音楽的に表現する形態関数と組み合わされた進行記述子
    を有し、原子形態間の音楽的遷移は、複数の原譜における原子形態間の確立された遷移を識別し、且つその後、記録し、及びそれにより前記システム内において、原子形態が、同様のタグを有するが、異なる構造特性を有するものとして識別されるグループが存在するようにマッピングされる、データベースと、
    前記ブリーフィングナラティブに応答し、且つ前記データベースに結合された処理インテリジェンスと
    を含み、前記処理インテリジェンスは、
    前記複数の音楽セクションのそれぞれの1つによって求められる感情記述と時間的に同調するタグを有する原子形態の選択及び連結を通して、前記ブリーフィングナラティブに関する生成系楽曲を組み立てることと、
    異なる原譜から原子形態を選択し、且つ前記生成系楽曲に代入することであって、前記代入原子形態は、
    任意の原譜から導出され、且つ
    前記感情記述と同調されたその楽曲性を有する、選択及び代入することと
    を行うように構成される、生成系作曲システム。
  2. 前記データベースは、オリジナルの音楽人工産物及びそれに対する代替物をどのように再構築するかを説明する情報を含むメタデータの形態のヒューリスティックを含む、請求項1に記載の生成系作曲システム。
  3. 前記原子形態は、関連付けられたタイミングを有するコードスキームの列を生成する原子形態の列に組み立てられる、請求項1又は2に記載の生成系作曲システム。
  4. 規定された時間窓にわたってコードを分布させるように構成されたコードスペーサヒューリスティックを含む、請求項1~3のいずれか一項に記載の生成系作曲システム。
  5. 前記システムインテリジェンスは、コードスキームを処理して、テクスチャ音がコード及びそれらの関連付けられたタイミングから導出されるテクスチャをインスタンス生成するように構成される、請求項1~4のいずれか一項に記載の生成系作曲システム。
  6. 各原子形態は、最小長を有し、異なる原子形態は、異なる音楽持続時間を具現化する、請求項1~5のいずれか一項に記載の生成系作曲システム。
  7. 前記タグのサブセットは、意味的に同一である、請求項1~6のいずれか一項に記載の生成系作曲システム。
  8. 各原子形態は、前記原子形態の中央セクションに主音を決して含まない、請求項1~7のいずれか一項に記載の生成系作曲システム。
  9. 各原子形態は、ピッチ及び調性の両方を有する局所主音に対する音程距離として表現される、前記局所主音におけるコードの特定のセットを有する、請求項1~8のいずれか一項に記載の生成系作曲システム。
  10. 各原子形態は、
    現在の局所主音から、次の原子形態における新しい局所主音への変更を可能にする転調形態関数、
    先行する原子形態が異なる主音を有することを示す転調原子形態
    の1つを更に含むか、
    転調形態関数若しくは転調原子形態の両方を更に含むか、又は転調形態関数若しくは転調原子形態のいずれも含まない、請求項1~9のいずれか一項に記載の生成系作曲システム。
  11. 前記原子形態は、コードタイプ及びコードの低音部を記憶する、請求項1~10のいずれか一項に記載の生成系作曲システム。
  12. 前記データベースは、人工産物のコーパスから、良好な形態で音楽的に機能している以前の遷移を識別するマルコフ連鎖関連付けを通して、先行又は後続する原子形態のリストにリンクされる原子形態のリストを記憶する、請求項1~11のいずれか一項に記載の生成系作曲システム。
  13. 原子形態は、ハーモニック構造と、楽曲的に良好な形態に従うハーモニック構造を生成する能力とを提供する、請求項1~12のいずれか一項に記載の生成系作曲システム。
  14. 原子形態は、前記楽曲のためのテクスチャを定義し、及び選択的に選択され、且つコードスキーム鎖を用いて記述される場合、前記生成系楽曲におけるテクスチャ連続性の維持を可能にするマッピングされたテクスチャコンポーネントのリストへの関連付けを有する、請求項1~13のいずれか一項に記載の生成系作曲システム。
  15. 生成系作曲の方法であって、
    音楽の行程に沿った複数の音楽セクションの複数の感情記述を参照して前記音楽の行程を記述するブリーフィングナラティブを受信することと、
    前記複数の音楽セクションのそれぞれの1つによって求められる感情記述と時間的に同調するタグを有する原子形態の選択及び連結を通して、前記ブリーフィングナラティブに関する生成系楽曲を組み立てることと、
    異なる原譜から原子形態を選択し、且つ前記生成系楽曲に代入することであって、前記代入原子形態は、
    任意の原譜から導出され、且つ
    前記感情記述と同調されたその楽曲性を有する、選択及び代入することと
    を含み、各原譜は、自己内包的構造特性を有する複数の識別可能な連結された原子形態であって、各々は、
    そのそれぞれの原子形態の楽曲性を記述するタグ、
    局所主音におけるコードのセット、及び
    疑問、応答及びステートメントの1つを音楽的に表現する形態関数と組み合わされた進行記述子
    を有する、複数の識別可能な連結された原子形態に分割され、及び前記方法は、
    複数の原譜における原子形態間の確立された遷移を識別し、且つその後、記録し、及びそれにより、原子形態が、同様のタグを有するが、異なる構造特性を有するものとして識別される原子形態のグループが存在するように、原子形態間の音楽的遷移をマッピングすること
    を更に含む、方法。
  16. 楽曲の複数の原子形態を含むデータベースであって、各原子形態は、音楽的に関連する原子形態間のその関係及びそれらの感情含意を定義するシンタックスを有する、データベース。
  17. 各原子形態は、各原子形態内のコード間の音楽的関係及び音楽的関連性に関するそれらの感情含意を記述するシンタックスを更に有する、請求項16に記載のデータベース。
  18. 各原子形態は、前記シンタックスを明確に示す少なくとも1つのタグを含む、請求項16又は17に記載のデータベース。
  19. タグ付き原子形態のデータベースであって、各原子形態は、
    そのそれぞれの原子形態の楽曲性を記述するタグ、
    局所主音におけるコードのセット、及び
    疑問、応答及びステートメントの1つを音楽的に表現する形態関数と組み合わされた進行記述子
    を含む、データベース。
  20. 疑問は、音であって、ハーモニー又はメロディ内に出現しており、且つそれらが前記原子形態の前記局所主音のキーセンター外であるために疑わしく存在する音によって示される、心の落ち着きを必要とする緊張を示唆するコードスキームであり、
    応答は、前記局所主音又は応答原子形態の任意の新しい主音のいずれかのキーセンターを補強することにより、精神の視点からの前記疑いのある音調又は音の存在を解決するように作用する前記疑問の解決であり、及び
    ステートメントは、音楽的疑問から全体的に独立しており、且つ解決を通した解放を必要とするいかなる有意味な音楽的緊張も暗示又は誘導せず、及びステートメントは、疑問でも応答でもない、請求項19に記載のデータベース。
  21. 各原子形態は、ハーモニック構造と、楽曲的に良好な形態に従うハーモニック構造を生成する能力とを提供する、請求項19又は20に記載のデータベース。
  22. 複数の選択可能な原子形態を含むデータベース内の音楽的原子形態であって、配置された各原子形態は、ハーモニック構造と、楽曲的に良好な形態に従うハーモニック構造を生成する能力とを提供する、音楽的原子形態。
  23. 複数の音楽セクションを含む楽譜を解析する方法であって、前記複数のセクションにおける音楽テクスチャと関連付けられた感情含意の存在を識別することを含み、前記音楽テクスチャは、複数の識別可能に異なる楽曲特性によって表され、
    i)前記音楽テクスチャは、感情含意を有し、及び
    ii)任意の音楽セクションの各音楽テクスチャは、複数の予め定義された音楽テクスチャ分類子を含むセットから選択される音楽テクスチャ分類子の存在に関して音楽的に表現され、及びそれにより、
    a.異なる音楽セクションは、予め定義された音楽テクスチャ分類子の異なるサブセットを含み得、
    b.所与の音楽セクションについて、それぞれの予め定義された音楽テクスチャ分類子は、前記テクスチャ分類子に対するゼロ又は少なくとも1つのいずれかのコンポーネントを有し、存在する各コンポーネントは、伴奏又は音楽的特徴のいずれかとして更にタグ付けされ、存在するコンポーネントを有する各音楽テクスチャ分類子は、
    i.音楽的特徴を保有しないか又は単一の音楽的特徴を保有するかのいずれかであり、且つ
    ii.1つ又は複数の伴奏を保有し、及び
    c.異なる音楽セクションは、共通の記述子又は前記共通の記述子との関連付けを有する同様の記述子を有し得るが、同時に、異なる音楽セクションは、音楽テクスチャ分類子の異なるサブセット又は前記音楽テクスチャ分類子におけるコンポーネントの異なるサブセットを保有する、方法。
  24. 前記テクスチャ分類子は、メロディ、カウンターメロディ、ハーモニー、低音部、ピッチリズム、非ピッチリズム及びドラムの少なくとも幾つかを含む群から選択される、請求項23に記載の方法。
  25. 音楽的特徴は、
    音楽テクスチャにおける顕著な音楽コンポーネントであり、且つ
    前記音楽セクション内の音楽的緊張及び解放についての情報を含み、前記緊張及び解放は、前記音楽的特徴が前記音楽セクション内及び同じ予め定義された音楽テクスチャ分類子内の別の音楽的特徴と組み合わされた場合、音楽的文脈に関して破壊されることになる、請求項23又は24に記載の方法。
  26. 伴奏は、音楽セクションのいかなる特定のテクスチャ分類子における別の伴奏又は特徴にも干渉せず、且つ前記音楽セクションの前記テクスチャを厚くするか又は薄くするために選択的に追加又は除去され得る、請求項23~25のいずれか一項に記載の方法。
  27. 計算手順を適用して、前記生成系楽曲のためのテクスチャ機能を生成することを更に含む、請求項15又は23~26のいずれか一項に記載の方法。
  28. 自動生成系作曲プロセスにおいてテクスチャを提供する方法であって、
    ナラティブブリーフに対する少なくとも1つのコードスキームを生成することであって、前記コードスキームは、原子形態に基づき、及び前記ナラティブブリーフは、一連の事象に対する感情含意を提供する、生成することと、
    請求項16~20のいずれか一項に記載の方法から導出されたテクスチャを前記少なくとも1つのコードスキームに適用して、前記ナラティブブリーフを反映する楽曲を生成することと
    を含む方法。
  29. テクスチャプロファイルを有する第2の音楽セクションと連結された第1の音楽セクション内にテクスチャナラティブがないことを識別することと、
    伴奏又は音楽的特徴である少なくとも1つのコンポーネントを有する前記第1の音楽セクションをファイリングすることであって、前記少なくとも1つのコンポーネントの選択は、
    先行するテクスチャ分類子の履歴及び前記テクスチャ分類子のうちの主要なものの連続性、さもなければ
    それぞれのサブセットの強度に基づく、予め定義された音楽テクスチャ分類子の宛先サブセット間の論理的ブリッジ
    の一方に基づく、ファイリングすることと
    を更に含む、請求項28に記載の方法。
JP2023560980A 2021-03-31 2022-03-30 聴覚的に正しい形態を有する楽曲を自動的に生成するためのシステム及び方法 Pending JP2024513865A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
GB2104696.6 2021-03-31
US17/219,610 US11978426B2 (en) 2021-03-31 2021-03-31 System and methods for automatically generating a musical composition having audibly correct form
US17/219,610 2021-03-31
GB2104696.6A GB2605440A (en) 2021-03-31 2021-03-31 System and methods for automatically generating a muscial composition having audibly correct form
US17/707,923 2022-03-29
US17/707,923 US11514877B2 (en) 2021-03-31 2022-03-29 System and methods for automatically generating a musical composition having audibly correct form
PCT/EP2022/058509 WO2022207765A2 (en) 2021-03-31 2022-03-30 System and methods for automatically generating a musical composition having audibly correct form

Publications (1)

Publication Number Publication Date
JP2024513865A true JP2024513865A (ja) 2024-03-27

Family

ID=81074029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023560980A Pending JP2024513865A (ja) 2021-03-31 2022-03-30 聴覚的に正しい形態を有する楽曲を自動的に生成するためのシステム及び方法

Country Status (7)

Country Link
EP (1) EP4068273A3 (ja)
JP (1) JP2024513865A (ja)
KR (1) KR20240021753A (ja)
AU (1) AU2022250856A1 (ja)
BR (1) BR112023020059A2 (ja)
CA (1) CA3214004A1 (ja)
WO (1) WO2022207765A2 (ja)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5693902A (en) * 1995-09-22 1997-12-02 Sonic Desktop Software Audio block sequence compiler for generating prescribed duration audio sequences
US20050144016A1 (en) * 2003-12-03 2005-06-30 Christopher Hewitt Method, software and apparatus for creating audio compositions
EP1666967B1 (en) * 2004-12-03 2013-05-08 Magix AG System and method of creating an emotional controlled soundtrack
WO2009107137A1 (en) * 2008-02-28 2009-09-03 Technion Research & Development Foundation Ltd. Interactive music composition method and apparatus
US9280313B2 (en) * 2013-09-19 2016-03-08 Microsoft Technology Licensing, Llc Automatically expanding sets of audio samples
WO2015154159A1 (en) * 2014-04-10 2015-10-15 Vesprini Mark Systems and methods for musical analysis and determining compatibility in audio production
US11580941B2 (en) * 2018-04-24 2023-02-14 Dial House, LLC Music compilation systems and related methods
US11969656B2 (en) * 2018-11-15 2024-04-30 Sony Interactive Entertainment LLC Dynamic music creation in gaming
US11068782B2 (en) 2019-04-03 2021-07-20 Mashtraxx Limited Method of training a neural network to reflect emotional perception and related system and method for categorizing and finding associated content

Also Published As

Publication number Publication date
WO2022207765A8 (en) 2023-11-02
KR20240021753A (ko) 2024-02-19
EP4068273A2 (en) 2022-10-05
CA3214004A1 (en) 2022-10-06
EP4068273A3 (en) 2022-11-09
WO2022207765A3 (en) 2022-11-10
WO2022207765A9 (en) 2023-01-26
WO2022207765A2 (en) 2022-10-06
BR112023020059A2 (pt) 2023-11-14
AU2022250856A1 (en) 2023-11-16

Similar Documents

Publication Publication Date Title
Ji et al. A comprehensive survey on deep music generation: Multi-level representations, algorithms, evaluations, and future directions
Johnson-Laird How jazz musicians improvise
Nobile Form as Harmony in Rock Music
Brinner Knowing music, making music: Javanese gamelan and the theory of musical competence and interaction
Kirke et al. A survey of computer systems for expressive music performance
US11887568B2 (en) Generative composition with defined form atom heuristics
Kirke et al. An overview of computer systems for expressive music performance
Michaelsen Analyzing musical interaction in jazz improvisations of the 1960s
Osborn Beyond verse and chorus:* Experimental formal structure in post-millennial rock music
Mazzola Semiotics of music
Williams Strategy in contemporary jazz improvisation: theory and practice
US11978426B2 (en) System and methods for automatically generating a musical composition having audibly correct form
JP2024513865A (ja) 聴覚的に正しい形態を有する楽曲を自動的に生成するためのシステム及び方法
GB2605440A (en) System and methods for automatically generating a muscial composition having audibly correct form
GB2615223A (en) System and methods for automatically generating a musical composition having audibly correct form
GB2615221A (en) System and methods for automatically generating a musical composition having audibly correct form
GB2615222A (en) System and methods for automatically generating a musical composition having audibly correct form
Barna Examining Contrast in Popular and Rock Music
GB2615224A (en) System and methods for automatically generating a musical composition having audibly correct form
Wolf et al. Thought and Play in Musical Rhythm
Lehmann The Syntax of'clave'--perception and Analysis of Meter in Cuban and African Music
Kolek " Finding the proper sequence": Form and narrative in the collage music of John Zorn
Cook A Schenkerian-Schoenbergian Analysis of David Maslanka's Concerto for Clarinet and Wind Ensemble and Implications for Performance
Bortoletto Vaz Algorithmic authority in music creation: the beauty of losing control= De l’autorité algorithmique dans la création musicale: la beauté de la perte de contrôle
Hutton-DeWys " Toccatas and Arias": Analysis and Historical Context of Vivian Fine's Last Work for Solo Piano