KR20240021753A - 청각적으로 올바른 형태를 가지는 음악 작품을 자동으로 생성하는 시스템 및 방법 - Google Patents

청각적으로 올바른 형태를 가지는 음악 작품을 자동으로 생성하는 시스템 및 방법 Download PDF

Info

Publication number
KR20240021753A
KR20240021753A KR1020237037568A KR20237037568A KR20240021753A KR 20240021753 A KR20240021753 A KR 20240021753A KR 1020237037568 A KR1020237037568 A KR 1020237037568A KR 20237037568 A KR20237037568 A KR 20237037568A KR 20240021753 A KR20240021753 A KR 20240021753A
Authority
KR
South Korea
Prior art keywords
musical
texture
chord
atom
atoms
Prior art date
Application number
KR1020237037568A
Other languages
English (en)
Inventor
조셉 마이클 윌리암 리스케
Original Assignee
다치 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US17/219,610 external-priority patent/US11978426B2/en
Priority claimed from GB2104696.6A external-priority patent/GB2605440A/en
Priority claimed from US17/707,923 external-priority patent/US11514877B2/en
Application filed by 다치 리미티드 filed Critical 다치 리미티드
Publication of KR20240021753A publication Critical patent/KR20240021753A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • G10H1/0025Automatic or semi-automatic music composition, e.g. producing random music, applying rules from music theory or modifying a musical piece
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/061Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of musical phrases, isolation of musically relevant segments, e.g. musical thumbnail generation, or for temporal structure analysis of a musical piece, e.g. determination of the movement sequence of a musical work
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/101Music Composition or musical creation; Tools or processes therefor
    • G10H2210/125Medley, i.e. linking parts of different musical pieces in one single piece, e.g. sound collage, DJ mix
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/075Musical metadata derived from musical analysis or for use in electrophonic musical instruments
    • G10H2240/085Mood, i.e. generation, detection or selection of a particular emotional content or atmosphere in a musical piece

Abstract

생성형 작곡 시스템은 기존의 음악적 작품들을 "폼 아톰(Form Atoms)"이라고 불리는 구성 요소들로 변환시킨다. 이러한 폼 아톰들 각각은 길이가 다양할 수 있으며, Markov 체인을 통해 서로 링크되는 음악적 특성들과 연관성을 가질 수 있다. 무수히 많은 새로운 작곡을 제공하기 위해, 일련의 휴리스틱들은 연결된 음악 섹션들 간의 음악적 텍스처들이 새로운 작곡에 대한 제공되고 정의된 브리핑 내러티브를 따르도록 하는 동시에 연속적으로 연결된 폼 아톰들이 또한 자동으로 선택되어 해당 음악 섹션들에 대한 음악적 텍스처들의 각각의 식별된 속성들의 유사성이 유지되어 음악적 형식의 유지를 지원하는지를 확인한다. 본 개시의 독립적인 양태들은 미디어 제품 또는 실시간 오디오 스트림과 같은 작곡 작업 내에서, 코드 간격 결정 및 제어가 새로운 작곡에서 음악적 감각을 유지하기 위해 실행되는 것을 추가로 보장한다. 또한 프리미티브 휴리스틱들의 구조화가 음조를 유지하고 키 변환을 허용하도록 작동한다. 본 시스템 및 그 기능은 상호 참조된 폼 아톰들로부터 감정적 의미들이 지정되고 재현될 수 있도록 하여 신호 분석 및 음악 생성을 제공한다.

Description

청각적으로 올바른 형태를 가지는 음악 작품을 자동으로 생성하는 시스템 및 방법
본 발명은 일반적으로, 신호를 기본 구성 데이터 요소들로 분할하기 위한 오디오 입력 신호의 신호 처리[장치에 의한], 및 이 신호뿐만 아니라 매핑 및/또는 텍스처 분류를 통해 상이한 내부 구조적 특성들 및 상이한 경계 조건들을 갖는 수많은 새로운 신호들을 재생하는 데 필요한 수학적 함수들, 구성 데이터 요소들 사이의 허용 가능한 링크들과 식별된 수학 함수들의 후속 생성 출력을 모두 식별하고, 상이한 구조를 가진 상이한 신호로의 연결 재어셈블리에 관한 것이다.
보다 구체적으로, 본 발명은 특히 음악의 컨텍스트에서 기존 자료의 재조합뿐만 아니라 원본 생성형 작곡을 지원하는 시스템과 영화 대본에서 설명된 장면과 같이 감정적으로 설명된 내러티브와 일치하고 이를 반영하기 위해 원본 작곡이 생성될 수 있는 방법에 관한 것이다.
보다 구체적으로, 이에 한정되지는 않지만, 본 발명은 기존의 음조(및 비음조) 음악에서 다양한 길이의 Form Atom들을 식별하고 분석하기 위한 프로세스에 관한 것이며, 여기서 각각의 Form Atom은 다수의 Form Atom들을 좋은 음악 형식을 갖지만 적어도 수용 가능한 새로운 음악 형식을 갖는 새로운 음악 작곡으로 자동화된 연결을 허용하는 경계 조건들 및 작곡 특성들 둘 다를 갖는 음악 콘텐츠의 컨텍스트적으로 가장 작은 의미있는 스니펫 또는 요소를 정의한다.
음악은 과학으로 감지할 수 없기 때문에 그 자체로 존재하지 않는다. 오히려, 음악은 뇌에 반응을 제공하는 마음의 관찰을 반영한다. 심오한 몇 가지 진술이지만 음악, 특히 음악 감상은 청취자의 마음 속에서 각각 해결되는 "긴장"과 "해소"의 개념들을 활용하는 주관적으로 구성된 사운드 여정의 해석과 관련된 신호 처리 및 정신적 자극으로 축소된다는 사실을 반영한다. 어떤 음악이든지 그리고 음악이 서양, 부족 또는 동양 구조들에 기반을 두고 있든지 여부에 관계없이 음악과 관련된 바람직한 생리학적 효과들이 있으며 이러한 효과들은 감정적 반응과 태도에 더 많은 영향을 미친다.
음악 이론은 전통적으로 악절이나 곡의 다음 음 또는 코드의 효과를 예측할 수 있는 과학적 의미의 이론이라기 보다는 음악을 명명하고 분류하는 데 사용되는 민속 심리학에 가깝다.
'좋은' 음악은 예술적으로 높이 평가되는 구조화된 작곡이라는 의미에서 마음(즉, 관련 신경 경로들 및 뇌 중추들)이 음악적 여정 내에서 긴장의 증가와 그 후에 이어지는 해당 긴장의 해소를 예측할 수 있는 것에 의하여 성공적으로 모델링하는 음악이다.
대안적으로, 이것은 음악적 프레이징이나 음악 구조에 반영된 질문을 하는 작곡 작품으로 생각될 수 있으며, 그런 다음[질문이 제기된 직후] 해당 질문에 대답하는 작곡 작품으로 작곡의 음악적 여정인 전체 내에서 특정 부분을 염두에 두고 종료할 수 있도록 한다.
따라서 질문은 음악에서 긴장 구조이며, 구조의 해소는 음조의 변화에 관점을 두는 적절한 음악적 답변과 상관 관계가 있다. 이러한 의미론적 용어들이 보다 기술적인 의미에서 무엇을 의미하는지에 대한 독자의 이해를 향상시키기 위해 이러한 용어들에 대한 보다 완전한 정의가 아래에 제공된다.
위의 내용을 심리학적 관점에서 보면, "좋은 음악"은 음악적 여정에 의해 전달될 것이라고 생각하는 것이 무엇인지를 먼저 예측하는 자기 만족 프로세스를 통해서 인식되고, "내가 옳았다"는 예측이 확인되면 뇌의 보상 시스템이 트리거되어 보상을 완성한다.
이론에 얽매이는 것을 의도함 없이, 보상 시스템은 자극을 보상하거나 강화함으로써 활성화되는 구조들의 그룹을 의미하는 것으로 이해된다. 보상 자극(rewarding stimulus)(예를 들어, 좋은 음악)들에 노출되면 뇌는 신경 전달 물질인 도파민의 방출을 증가시켜 반응한다.
보상 시스템과 관련된 구조들은 복부 선조체의 복부 피개 영역(VTA, ventral tegmental area)과 측좌핵을 포함하여 뇌의 주요 도파민 경로들을 따라 발견된다. 또 다른 주요 도파민 경로인 중피질 경로는 VTA에서 대뇌 피질로 이동하며 보상 시스템의 일부로 간주된다.
반대로, "나쁜 음악", 나쁜 작곡 또는 "나쁜 형식"은 겉보기에/표면적으로 무의미해 보이는 무작위 [음악적] 사건들로부터 아무것도 예측할 수 없는 뇌의 무능력에서 발생하는 감소된 보상/만족에 해당하며, 따라서 뇌의 무능력은 뇌가 자극에서 발생하는 보상으로 스스로를 축하할 수 없음에 해당한다.
"좋은" 음악의 효과적인 자동 생성을 방해하는 중요하고 해결되지 않은 문제는 "형식(form)"이다. 문제는 무작위성을 생성하지 않는 프로세스를 기술적으로 구현하는 방법과 근본적으로 호환되는 음악 섹션들을 분류하기 위해 처음에 신호 구성 요소들에 대한 일관된 평가를 제공한 다음 이러한 음악 섹션들이 자동으로 선택되고 원활하게 연결되어 새로운 생성형 작곡을 제공하는 기술 메커니즘으로 채워진 기술 시스템이라는 것이며; 이것은 결코 간단하지 않다.
사실, "형식"과 관련하여 작곡가들은 "형식"을 식별하기 위해 경험이 필요하며, 심지어 뛰어난 작곡가들조차도 발전적 작곡 생활의 후반부까지 수용 가능한 형식을 인식하지 못하는 경우가 많다. 형식에 대한 이해가 높아졌음에도 불구하고 작곡가들은 그들의 모든 작곡들에서의 템플릿들로 돌아가는 경우가 많다. 템플릿들은 원하는 내러티브가 담긴 사전 구조화된 구조를 제공한다.
템플릿은 예를 들어, 소나타 형식 또는 론도 및 기타 형식들이 될 수 있으며, 이해될 것이다. 구체적인 예로, 교향곡이나 협주곡의 첫 번째 악장은 동일한 형식을 공유하지만 다른 내러티브를 공유한다(예를 들어, A-B-A-B-C 다음 D, 여기서 A는 장조음/딸림음의 첫 번째 주제이고, B는 장조음/딸림음의 대조적인 키 중심이며 A와 B는 함께 "설명"을 형성하고, C는 A와 B 사이의 갈등("전개"라고도 함)이며 D는 A와 B의 "요약" 또는 해결임).
"형식"은 "내러티브"[후자는 음악적으로 표현하려는 것, 즉 강렬함의 부풀음들 및 절정들과 같은 일련의 감정적 아이콘들로 표현되는 시작점과 끝점 사이의 이야기]와 대조적으로 음악적 요소들을 불연속성이나 무작위성(음악적 용어들로)을 피하는 음악적으로 감각적인 방식으로 함께 연결하여 복합 요소들의 구문간에 원활한 전환이 이루어지도록 하는 구조이다.
"형식"을 보다 가시적이지만 여전히 주관적으로 표현하는 "좋은 형식"은 허용되는 음악 작곡들의 코드들과 관습들에 반영된 구문일 수 있는 반면, "나쁜 형식"은 연속적인 음악적 요소들/프레이즈들 사이에 식별 가능한 음악적 의미를 만드는 명백하거나 알려진 연결이 없으며, 실제로 [음악에서] "나쁜 형식"은 사운드 신호들이 뇌에 의해 논리적으로 처리될 수 없기 때문에 구조를 전달하지 못한다.
문제는 어떤 생성형 작곡이 인간에 의한 것이든 기계에 기반한 것이든 상관없이 초기 형식 템플릿에 의해 설정될 수 있는 것과는 다른 내러티브를 따르기 위해 적응해야 하는 경우, 시스템들은 지속적으로 "좋은 형식"을 달성하고 따라서 뇌의 보상 센터에서 상대적으로 높은 수준의 도파민을 생성하는 생성 메커니즘을 실현하기 위해 고군분투한다는 것이다.
그리고 "좋은 형식"을 달성하지 못하면, 정의에 따라 작곡은 "나쁜 형식"을 획득하고 그에 따라 특히 보상 센터들과 관련된 뇌 자극의 식별 가능한 질적 및/또는 측정 가능한 감소들을 얻는다. 따라서 효과적인 생성형 작곡은 관련 기술 평가 프로세스와 함께 가시적인 기술적 효과를 가져온다. 실제로, 더 나은 생성형 작곡은 감지 가능한 자극/뇌 활동 수준들을 증가시킨다.
실제로, 스플라이스 호환 가능한 음악 요소들에서 공통된 음악적 특성들을 식별하는 것은 비디오 출력과 함께 음악적 강도(절대적인 오디오 전력 출력 수준의 컨텍스트에서 반드시 필요한 것은 아니지만 드라마와 긴박감을 개발하는 감각이 증가하는 컨텍스트에서)를 증가시키는 것과 같은 관련 음악 테마들을 조정하는 적절한 멀티미디어 제품을 신속하게 만들어야 하는 임무를 맡은 게임 개발자들 및/또는 광고 또는 영화 예고편 제작자들/편집자들에게 바람직하고 유용하다.
상업적 환경에서 작곡 문제에 대한 컨텍스트를 제공하기 위해 적절한 영화 악보를 생성하는 것이 첫 번째 예이다. 현재 영화 감독은 장면에서 액션의 전개를 반영하는 내러티브를 쓴 다음 적절한 작곡을 위해 작곡가에게 접근한다. 작곡가는 내러티브를 검토하고 영화 감독이나 게임 디자이너와 같은 고객에게 "데모"를 제공하면서 내러티브에 맞게 작곡을 조정하려고 시도한다.
특히 영화들, TV, 광고들의 음악은 유사한 의뢰 및 제작 패턴을 따른다. 작곡가는 일반적으로 감독 또는 프로듀서들에 의해 의뢰를 받는다. 작곡가에 대한 그들의 선택은 뮤지컬 쇼릴을 기반으로 하거나 커미셔너가 작곡가의 특정 담론(discourse)을 알고 그들의 프로젝트에 그것을 원한다는 사실을 통해 이루어진다.
작곡가가 영화를 보기 전에, 임시 트랙이 일반적으로 편집 프로세스를 돕고 커미셔너가 특정 지점들에서 영화가 갖기를 바라는 속도와 무드 유형에 대한 아이디어를 제공하는 데 사용된다. 그런 다음 작곡가와 커미셔너는 "스포팅 세션(spotting session)"으로 알려진 것을 위해 만난다. 이 회의에서, 당사자들은 임시 트랙을 보고 나서 음악이 어디에서 시작되고 중지되어야 하는지의 관점에서 프로젝트에 대해 논의하는데, 이 프로세스를 스포팅(spotting)이라고 한다.
영화에서 독립된 음악 또는 음악 큐의 각각의 섹션에 대한 다른 모든 매개변수들이 또한 고려된다. 이 프로세스는 각각의 큐의 시작 및 종료 타이밍들, 큐 내의 히트 포인트들, 큐들의 무드, 오케스트레이션 및 페이스로 구성된 브리핑을 완성한다. [히트 포인트들은 예를 들어 제리가 프라이팬으로 톰의 머리를 때리는 것처럼 음악이 액션을 "때려야" 하는 타임라인의 포인트들이다.]
이를 통해 작곡가는 각각의 큐에 대해 원하는 트랙들의 데모를 제작한다. 그런 다음 이 트랙들은 커미셔너들에 의해 오디션이 진행되고 큐의 미세 조정을 위한 피드백이 제공된다. 트랙들이 모든 당사자들에 의해 만족스러운 상태에 있다고 간주되면 알려진 대로 녹음되거나 구워진다.
흥미롭게도, 영화 작곡가들은 다양한 브리핑들을 만족시키기 위해 과거 작품들과 다른 현대 작곡가들의 작품들에서 아이디어들을 빌리고 훔치는 경향이 있는데 즉, John Williams가 영화 Star Wars(Kurtz & Lucas, 1977)의 오프닝 크레딧에서 Holst의 The Planets 슈트로부터 Mars의 클로징 전체 오케스트라 부분을 들어올릴 때 그랬던 것처럼 말이다.
실제로, 이 점들은 John Williams가 BFI의 DaviDmeerker(Meeker, 1978)와의 인터뷰에서 공개적으로 언급하고 있다. 실제로 작곡가들은 Bach가 그랬던 것(Ledbetter, 2002)처럼 악보들을 재검토하고 수정할 뿐만 아니라, Rachmaninoff 의 피아노 협주곡 4번(Norris, 2001)의 경우처럼 더 나은 시간적 내러티브를 만들기 위해 악보들을 완전히 개선시키는 것은 분명하다.
이것은 또한 현재 인식되고 있는 예술적 작곡 프로세스에 대한 질문으로 이어지지만, 생성형 작곡의 경우 필연적으로 기술적으로 "형식"을 평가해야 하며, 그러한 "형식"이 생성적 작업을 어셈블링하는 시스템 인텔리전스의 통제 하에 충분히 유지되어야 한다.
영화 악보 멀티미디어 작곡의 이러한 반복적인 프로세스는 "좋은 형식"을 가진 작곡으로 이어질 수도 있고 - 그렇지 않을 수도 있으며 - 원격으로 작곡된 악보가 "좋은 형식"의 필수 수준으로 허용되는지 여부에 대한 결정을 내리는 데 영화 감독이 다시 관여할 것이다.
위에서 언급한 바와 같이, 작곡가는 자신의 이전 작곡들에 의해 영향을 받을 가능성이 높으며 "새로운" 음악 작품을 작곡할 때 이러한 개인 템플릿들을 자주 활용할 것이다. 일반적으로 형식 품질들을 수용했음을 의미하는 이러한 개인 템플릿들의 사용은 항상 "비슷한" 악보로 이어진다; 이것은 반드시 좋은 것은 아니다. 예를 들어, 영화 Superman®과 Star Wars®의 주요 테마들 작곡들은 둘 다 John Williams가 썼기 때문에 눈에 띄는 공통점들이 있다.
검토를 위해 적어도 하나의 결과 "데모"를 제공하는 데 있어 개발자 또는 편집자는 잠재적으로 적합한 음악을 식별한 다음 선택한 음악을 비디오에 맞추거나 정렬하는 데 이미 상당한 시간을 소비했다. 상업적으로 사용 가능한 오디오 트랙을 식별하는 시간을 지연시키기 위해, 콘텐츠 개발자들은 현재 쉽게 얻을 수 없는 권리들을 가졌다고 잘 알려진 트랙인 소위 "임시 트랙들"을 사용할 수 있지만, 이는 사용권을 얻을 수 있는 적절한 상업적으로 실행 가능한 트랙을 식별하기 위해 검색이 필요하기 때문에 임시방편일 뿐이다.
그런 다음 지시하는 고객이 편집 내용들이 원래의 브리핑에 맞는지 평가해야 하기 때문에 추가 지연 시간들이 발생한다. 그러므로, "형식"의 의미에서 서로 컨텍스트적으로 관련되어 있는 상호 참조된 음악적 요소들의 효과적인 뱅크는 예를 들어, 시각적 시퀀스 또는 음악 프로그램의 구축(예를 들어, 영화 악보 개발, TV 또는 스트리밍 광고 및 작업 속도를 높이기 위해 음악에 맞춰 사이클링 운동을 안무하는 "스핀" 수업들)과의 정렬을 위한 효과적인 생성형 작곡을 유익하게 촉진할 것이다.
흥미롭게도, 작곡 결정들에 들어간 제작에 대한 기록은 거의 없지만, 일부는 존재하고 작곡 프로세스에 대한 훌륭한 통찰력을 제공한다 (Ledbetter, 2002) (Norris, 2001) (Cooper, 1992). 대부분 우리는 하나의 악보나 연주만 남겨두고, 선택된 음들 - 즉 완벽주의적 관점에서 선택된 것으로 보이는 최종 원고에 포함된 음들 - 을 우상화하는 태도를 취하게 된다;
작곡가가 취했을 수 있는 대안들에 대한 증거는 필연적으로 자의적인 성격의 특정 결정들로 이어지는 작곡 기술과 선택의 그림을 그린다. (Meeker, 1978)에서, John Williams는 Close Encounters (Phillips & Spielberg, 1977)이 5음 테마가 된 것에 대해 97개의 다른 버전들을 가지고 있다고 말한다.
이들은 처음에 4 개의 변주곡 그룹들로 분류되었으며, Steven Spielberg 감독과의 논의들을 통해 축소되고 더 다듬어져 알려진 유명한 5음 멜로디에 도달했다. 그러나 William 자신의 발언들은 그럼에도 불구하고 특정 타이밍과 음 지속 시간을 가진 특정 코드의 5개 음조들에 대한 그와 감독의 최종 선택의 명백한 수학 및 물리학 관련 완벽함에 대해 개인들이 글을 쓰는 것을 막지 못했다.
윌리엄스에게 이 일련의 음들이 다른 많은 음들보다 나을 것이 없다는 것이 분명했다; 그러나 그것들은 다른 사람들이 어떤 의미에서 미리 정해져 있다고 믿게 된 선택된 음들이었고, 틀림없이 최고의 "좋은 형식"을 가진 음들이었다.
또 다른 예로서, 인터랙티브 게임은 동반되는 악보와 관련하여 맞춤화된 사용자 경험을 제공하지 않는다. 현재, 게임 또는 게임 장면의 특정 측면에 대한 "있는 그대로"는 기본 프로그래밍을 반영한다. 효과적인 생성 프로세스가 있다면, 음악적 텍스처들 측면에서 경험되는 사운드는 화면상 아바타의 감정적 관점에서 볼 때 사용자에게 향상된 지표를 제공할 수 있다.
예를 들어, 게임 내 아바타의 증가하는 감정적 또는 신체적 상태들을 반영하는 사용자 전용 특정 음악 세그먼트에 플레이어가 노출되는 것은 몰입형 경험이 될 것이다. 현재 게임 시스템들은 아바타가 직면하거나 경험하고 있는 게임 내 문제들에 대한 청각적 제안을 제공하지 않으며 이는 실제 플레이어 경험에 해를 끼친다.
그러나 문제는 각각의 플레이어의 여정이 고유한데 어떻게 관련성 있고 의미 있는 맞춤형 사운드 경험을 즉석에서 생성할 수 있는가? 그리고 실제로 이러한 사운드 경험이 특정 사용자에게 특정한 의미와 관련성을 가진 음악에 맞게 맞춰질 수 있는가? 이다.
현재 동반되는 게임 관련 악보는 플레이어와 감정적으로 연결되어 있지 않을 수 있는 일반적인 경로일 뿐이며, 실제로 악보는 실제로 플레이어에게 감정적으로 반향을 일으키지 않거나 실제로 플레이어가 싫어할 수 있다.
생성 음악 컴파일러들이 존재한다. 이러한 기존 시스템들은 일반적으로 코드들을 생성하기 위해 일종의 Markov 프로세스의 일부 형식을 사용하지만 모두 다른 악기들에서 다른 음들을 생성하는 일련의 알고리즘들을 가지고 있다. 종래 기술 접근 방식들의 문제점은 창의성을 거의 지원하지 않으며 작곡 콘텐츠를 조작할 수 있는 능력도 거의 없다는 것이다.
실제로, 종래 기술 접근 방식들은 모두 일반적으로 동일하게 들리는 작곡들을 생성하는데, 그 이유는 생성된 모든 작곡이 고정된 수의 미리 정의된 악기 템플릿들에 기초하기 때문이다. 이러한 스트레이트-자켓팅(straight-jacketing) 접근 방식의 결과는 음악적 텍스처의 손실이다. 이것은 결과적 동일성으로 인해 유용성을 감소시키는 중요한 문제이다.
수년에 걸쳐 구현된 코드 스킴들을 작성하는 다양한 방법들이 있다(C. Johnson, Carballal, & Correia, 2015; Lerdahl & Jackendoff, 1996; Nierhaus, 2009). 주어진 방법에 대한 미적 평가는 개발자의 예술적 요구 사항들, 정당성들, 사후 합리화들 또는 간단한 허용 오차들을 기반으로 한다.
실제로 경험에 따르면 주변 코드 스킴에서 충분한 컨텍스트가 주어지면 어떤 코드라도 다른 코드를 따르는 것이 허용되는 것으로 간주될 수 있다. 다른 코드를 따를 코드를 선택할 때, 이 컨텍스트를 무시하고 예제에서 시퀀스의 증거만 찾는다면, 코드 스킴들이 단순히 무작위 시퀀스가 되는 위치에 있는 것을 발견하게 된다.
본 발명은 특히 생성적 의미에서의 사용을 위한 사운드 신호의 신호 처리에 관한 것이지만, 추가적인 컨텍스트를 제공하기 위해, 음악가들에 의해 사용되고 본 발명의 특정 실시예들 및 구현예들에 관련된 용어에 대한 작업 기초를 제공하는 것이 적절하다. 이와 관련하여:
- 서양 음악 이론에서, 종지는 특히 모든 종지는 강조가 감소하기 때문에 해결[종결 또는 일시 중지]을 생성하는 멜로디 또는 코드 구성이다. 하모니 종지는 음악의 프레이즈, 섹션 또는 작품을 마무리하는 (적어도) 두 개의 코드들의 진행이다. 그리고 리듬 종지는 프레이즈의 끝을 나타내는 특징적인 리듬 패턴이다.
종지는 완결성에 따라 약하거나 강할 수 있다. 종지들은 일반적으로 특정 코드 또는 멜로디 진행들에 의해 분류되지만, 이러한 진행들의 사용이 반드시 종지를 구성하는 것은 아니다; 음악적 프레이즈의 끝에서와 같이 종결감이 있어야 한다. 일반적으로 하모니 리듬은 종지가 발생하는 위치를 결정하는 데 중요한 역할을 한다. 종지들은 또한 악절이나 음악 작품의 으뜸음 또는 중심 음조를 나타내는 강력한 지표들이다.
- 음악에서 으뜸음(tonic)은 온음계(음계의 첫 번째 음)의 첫 번째 음계이며 클래식 음악의 작곡(음악 키 기반), 대중 음악 및 전통 음악의 최종 종지에 일반적으로 사용되는 조성 중심 또는 최종 해결 음색이다. do solfege 시스템에서, 으뜸음 음표는 도(do)와 같이 불려진다.
보다 일반적으로, 으뜸음은 곡의 다른 모든 음들이 계층적으로 참조되는 음이다. 음계들은 으뜸음들의 이름을 따서 명명된다: 예를 들어, C 장음계의 으뜸음은 C음이다. 으뜸음이라는 용어는 키 중심(keycentre)으로 지칭될 수도 있다. 예를 들어, Cm 또는 Bb와 같은 로컬 으뜸음은 음계의 첫 번째 음표와 마지막 음표 모두를 제공한다.
- 으뜸음 음표에 형성된 3화음, 즉 으뜸음 코드는 따라서 가장 중요한 코드이다.
- 코드는 서로 평행하게 연주되고 키 중심에 연결된 일련의 음조들이다. 기능적인 측면에서, 마음은 코드를 사용하여 작곡에서 그것이 어디에 있는지 예측한다. 코드는 그 자체로 사전적 의미를 갖지 않는데, 그 이유는 음악적 의미가 구문, 즉 코드들의 시퀀스에서 파생되기 때문이다.
- 코드 스킴은 코드들의 연결이다.
- 메타코드 스킴은 코드 스킴이 작성되는 방법의 원리들이다.
- 장음계와 단음계들은 서양 음악에서 가장 인기 있고 일반적으로 사용되는 두 가지 음계들로, 각각 고유한 음조를 가진 음들의 세트로 음계를 형성한다. 장음계와 단음계들은 온음계의 변형들로, 5개의 온음들과 2 개의 반음들의 음조 음정들이 있으며, 세 번째 음표의 상대적 음조/물리적 변위가 음계가 장조 또는 단조인지 여부를 결정한다.
이 세 번째 음표는 장음계를 더 밝고 명랑하게 들리게 하는 동시에 단음계에 특유의 슬픔, 우울, 어둠을 부여한다. 장음계에서 세 번째 음표는 단조 세 번째 음표보다 한 음 더 높다. 장음계의 음들의 패턴은 음 간격 WWHWWWH(여기서 W는 온음표의 전환을 나타내고 H는 2분 음표의 전환을 나타냄)를 갖는 반면, 단조 온음계의 패턴은 음표 간격 WHWWHWW를 갖는다. 관습적인 서양 음악에서 모든 장조 또는 단조 건반은 해당 음계에서 7도/음표, 즉 A에서 G까지를 갖는다.
본 발명의 개념들 - 그 중 다수가 있음 - 이 이제 상당히 상세하게 설명되겠지만, 추가적인 음악 용어에 대한 다음의 설명이 더 도움이 될 수 있다.
특히 서양 음악에서 코드들의 관계는 음도에 의해 정의된다. 음도는 으뜸음에 대한 음계에서 특정 음표(특정 음조를 가짐)의 위치, 즉 각각의 옥타브가 시작된다고 가정되는 음계의 첫 번째 및 주요 음표를 나타낸다. 음악 이론에서, 온음계는 각각의 옥타브에 5개의 온음(whole tone)들과 2개의 반음(semitone)들 포함하는 7음 음계이며, 두 개의 반음은 음계의 위치에 따라 2개 또는 3개의 온음만큼 서로 분리된다. 이 패턴은 1 옥타브 이상에 걸친 온음계에서 모든 반음들이 서로 최대한 분리되도록 한다(즉, 최소 두 개의 온음들로 분리됨).
옥타브는 한 음표가 다른 음표의 주파수의 두 배인 두 음표들 사이의 음조 차이다. 한 옥타브 떨어져 있는 두 개의 음표들은 항상 비슷하게 들리고 같은 음표 이름(예를 들어, C)을 갖는 반면, 그 사이의 모든 음표들은 뚜렷하게 다르게 들리고 D, E, F 등과 같은 다른 음표 이름들을 갖는다. 음표들은 자연스럽게 12개의 그룹들로 나뉘며, 모두 서로 한 옥타브 떨어져 있다. 따라서 한 옥타브는 12개의 동일한 반음들로 구성되며, 각각의 반음은 이전 주파수에 대해 21/12의 비율로 주파수 음을 갖는다.
또한, 코드 내에서 음표의 선택이 코드의 분류로 이어진다는 점도 이해될 것이다. 예를 들어, 3음 코드["3화음"]는 다음과 같은 3개 음표 사이의 상이한 음표 간격을 가질 수 있다:
단3화음의 경우, 3개의 반음들에 이어서 4개의 반음들이 뒤따르고;
장3화음의 경우, 4개의 반음에 이어서 3개의 반음이 뒤따르고;
증3화음의 경우, 4개의 반음에 이어서 4개의 반음이 뒤따르며; 그리고
감3화음의 경우, 3개의 반음에 이어서 3개의 반음이 뒤따른다.
공자 앞에서 문자를 쓰고 싶지는 않지만, 딸림7화음은 [피아노] 코드가 8도/음계에서 한 단계 낮은 음표(즉, 다음 옥타브에서 반복되는 음)인 4분음을 포함하는 반면, 장7화음은 코드에 8분음에서 반음 아래인 4분음이 포함된 음표이다.
명백히, 이해되는 바와 같이, 여러 악기에 대한 전체 오케스트레이션은 각 악기에 대해 다른 악보를 가지며, 서로 다른 악기는 MIDI(Musical Instrument Digital Interface Protocol) 음계에서 서로 다른 숫자 표현을 갖는다. 예를 들어, 중간 C의 값은 60이다(A=440Hz의 최신 튜닝을 사용하여 261.63Hz의 실제 주파수를 나타냄).
악기들에는 관용적 제한들이 있다. 예를 들어, 일반적으로 튜닝된 4현 베이스 기타에서 가장 낮은 MIDI 값은 위치 28이다. 반대로, 바이올린은 일반적으로 MIDI 값이 55인 가장 낮은 음을 가진 두 개의 음만 동시에 연주할 수 있다.
효과적인 자동 생성형 작곡과 관련된 근본적인 기술적 문제들로 돌아가서, 음악 산업이 직면한 또 다른 문제는 특히 개인/각각의 수준에서 청취자/사용자 경험을 가장 잘 향상시키는 방법이다. 실제로, 음악과 사건 사이의 컨텍스트적 관련성 또는 관계가 인식을 유발하거나 상호 보완적인 감정적 반응(예를 들어, 영화 중 공포감이나 긴장감, TV 광고에서 발생하는 제품 연상)을 유발한다는 것이 오랫동안 인식되어 왔다.
작곡에 대한 자격이 없는 최종 사용자가 표현한 내러티브에 생성 사운드 경험을 맞추는 것은 작곡이 빠르게 생성되고 식별 가능한 표준이 있는 경우 유리할 것이다. 그러나 요컨대, 자동화된 생성형 작곡의 경우, 일반적으로 마디들로 표현되는 선택적으로 연결된 음악 프레이즈들로 구성된 사운드 신호에서 "형식"을 평가하는 효과적인 방법이나, 실제로 "나쁜 형식"을 피하기 위해 생성형 작곡 절차를 자동화하여 인간의 생리학 및 정신 상태에 관련 결과들을 부과할 수 있는 방법이 없다.
개요에서 생성형 작곡 시스템은 기존 음악 작품들을 "Form Atoms"라는 구성 요소들로 축소한다. 이러한 Form Atom들은 각각 길이가 다양할 수 있으며 Markov 체인들을 통해 서로 연결되는 음악적 특성들과 연관성을 가질 수 있다.
무수히 많은 새로운 작곡을 제공하기 위해, 일련의 휴리스틱들이 연결된 음악 섹션들 간의 음악적 텍스처들이 새로운 작곡에 대해 제공되고 정의된 브리핑 내러티브를 따르도록 하는 반면, Form Atoms와 같은 연속적인 연결된 섹션들도 자동으로 선택되어 해당 음악 섹션들에 대한 음악적 텍스처들의 식별된 특성들의 개개의 유사성들이 유지되어 음악 형식의 유지를 지원하는지 확인한다.
본 개시의 독립적인 양태들은 미디어 제품 또는 실시간 오디오 스트림과 같은 작곡 태스크들 내에서, 코드 간격 결정 및 제어가 새로운 작곡에서 음악적 감각을 유지하기 위해 실행된다는 것을 추가로 보장한다. 또한 새롭고 보완적이지만 독립적인 기술 접근 방식들은 음조를 유지하고 키 변환을 허용하기 위해 프리미티브 휴리스틱을 구조화한다.
본 발명의 제 1 양태에 따르면, 생성형 작곡 시스템은 음악적 여정을 따라 복수의 음악 섹션들에 대한 복수의 감정적 묘사들을 참조하여 음악적 여정을 설명하는 브리핑 내러티브를 수신하기 위해 커플링된 입력부를 포함하며;
인스턴스화될 때, 각각 원본 악보를 생성하는 다수의 음악 데이터 파일들을 포함하는 데이터베이스로서, 각각의 원본 악보는 독립된 구조적 특성들을 갖는 다수의 식별 가능한 연결된 Form Atom들로 분할되며 각각은
개개의 Form Atom의 작곡 성질을 설명하는 태그; 로컬 으뜸음의 코드들의 세트, 및 질문, 답변 및 진술 중 하나를 음악적으로 표현하는 형식 기능과 결합된 프로그레션 디스크립터 - 그리고 여기서 Form Atom들 간의 음악적 전환들이 매핑되어 여러 개의 원본 악보들에서 Form Atom들간의 확립된 전환들을 식별하고 기록하는 것, 시스템 내에는 Form Atom들이 유사한 태그들을 갖지만 구조적 특성들이 다른 것으로 식별되는 그룹들이 존재함 -;
및 브리핑 내러티브에 응답하고 데이터베이스에 커플링되는 처리 인텔리전스를 가지고, 여기서 처리 인텔리전스는 복수의 음악 섹션들 개개에 의해 적시에 요구되는 감정적 묘사들과 일치하는 태그들을 갖는 Form Atom들의 선택 및 연결을 통해 브리핑 내러티브와 관련된 생성형 작곡을 어셈블링하도록 배열되며; 그리고 다른 원본 악보들에서 Form Atom들을 선택하여 생성형 작곡으로 대체하고, 대체 Form Atom은 원래 악보에서 파생되고; 그리고 그 작곡 성격이 감정적 묘사들과 일치한다.
데이터베이스는 본래의 음악 작품들뿐만 아니라 이에 대한 대안들을 재구성하는 방법을 설명하는 정보를 포함하는 메타데이터 형식의 휴리스틱(heuristic)을 포함할 수 있다.
Form Atom은 연관된 타이밍을 갖는 일련의 코드 스킴들을 생성하는 일련의 Form Atom들로 어셈블링될 수 있다.
시스템은 규정된 시간 창에 걸쳐 코드들을 분산하도록 배열된 코드 간격 휴리스틱을 포함할 수 있다.
시스템 인텔리전스는 코드들 및 연관 타이밍들에서 텍스처 음들이 파생되는 텍스처들을 인스턴스화하기 위해 코드 스킴들을 처리하도록 배열될 수 있다.
각각의 Form Atom은 최소 길이를 가지며 다양한 Form Atom들은 다양한 음악 지속 시간들을 구현할 수 있다.
일 실시예에서, 태그들의 서브 세트는 의미상 동일할 수 있다.
또 다른 실시예에서, 각각의 Form Atom은 Form Atom의 중간 섹션에 으뜸음을 결코 포함하지 않는다.
각각의 Form Atom은 음조와 작곡을 모두 갖는 로컬 으뜸음에 상대적인 인터벌 거리로 표현되는 로컬 으뜸음의 특정 코드들의 세트를 갖는다.
일 실시예에서, Form Atom은 코드 타입과 코드의 베이스를 저장한다.
일 실시예에서, 데이터베이스는 작품들의 코퍼스로부터, 좋은 형식으로 음악적으로 작업했던 이전의 전환들을 식별하는 Markov-체인 연관들을 통해 이전 또는 후행하는 Form Atom들의 리스트들에 연결된 Form Atom들의 리스트들을 저장한다.
Form Atom들은 하모니 구조와 작곡적으로 좋은 음악 형식을 따르는 하모니 구조들을 생성하는 능력을 제공한다.
Form Atom들은 작곡에 대한 텍스처를 정의하고 코드 스킴 체인들로 선택적으로 선택하여 작성될 때 생성형 작곡에서 텍스처 연속성을 유지하는 것을 허용하는 매핑된 텍스처 구성 요소들의 목록과 연관될 수 있다.
본 발명의 다른 양태에는 생성형 작곡의 방법이 제공되는데, 이 방법은, 음악적 여정을 따라 복수의 음악적 섹션들에 대한 복수의 감정적 묘사들을 참조하여 음악적 여정을 설명하는 브리핑 내러티브를 수신하는 단계;
복수의 음악 섹션들 중 개개의 적시에 요구되는 감정적 묘사들과 일치하는 태그들을 갖는 Form Atom들의 선택 및 연결을 통해 브리핑 내러티브와 관련하여 생성형 작곡을 어셈블링하는 단계;
및 다른 원본 악보들에서 Form Atom들을 선택하여 생성형 작곡으로 대체하는 단계를 포함하며, 대체 Form Atom은 임의의 원본 악보에서 파생되고;
그리고 감정적 묘사들과 일치하는 작곡 성격을 가지며; 그리고 각각의 원본 악보는 독립된 구조적 특성들을 갖는 식별 가능한 연결된 Form Atom들의 다중성으로 분할되고 각각은
개개의 Form Atom의 작곡 성격을 묘사하는 태그; 로컬 으뜸음의 코드들의 세트, 질문, 답변 및 진술 중 하나를 음악적으로 표현하는 형식 기능과 결합된 프로그레션 디스크립터를 가지며;
그리고 Form Atom들 사이의 음악적 전환들을 매핑하여 여러 원본 악보들에서 Form Atom들 사이에 확립된 전환들을 식별하고 기록하며, Form Atom들이 유사한 태그들을 갖지만 구조적 특성들이 다른 것으로 식별되는 Form Atom들의 그룹들이 존재한다.
본 발명의 또 다른 양태에서, 복수의 음악 섹션들을 포함하는 악보를 분석하는 방법이 제공되고, 이 방법은, 이 복수의 섹션들에서 음악적 텍스처와 연관된 감정적 의미의 존재를 식별하는 단계를 포함하고, 여기서 음악적 텍스처는 복수의 식별 가능하게 상이한 작곡적 특성들에 의해 표현되고, 그리고 여기서
i) 음악적 텍스처는 감정적 의미를 가지며; 그리고 ii) 임의의 음악 섹션의 각각의 음악적 텍스처는 다수의 미리 정의된 음악 텍스처 분류기들을 포함하는 세트로부터 선택된 음악 텍스처 분류기들의 존재의 관점에서 음악적으로 표현되고, 다음과 같은 경우:
a) 서로 다른 음악 섹션들은 미리 정의된 음악 텍스처 분류기들의 상이한 서브세트를 포함할 수 있고; b) 주어진 음악 섹션에 대하여, 각각의 미리 정의된 음악적 텍스처 분류기는 그 텍스처 분류기에 대한 0개 또는 적어도 하나의 구성 요소를 가지며, 존재하는 각각의 구성 요소는 음악 반주 또는 음악적 특징으로서 추가로 태그되고, 존재하는 구성 요소를 갖는 각각의 음악적 텍스처 분류기는
i) 음악적 특징이 없거나 단일 음악적 특징, 및 ii) 하나 이상의 음악 반주들; 및 c) 상이한 음악 섹션들은 공통 디스크립터 또는 공통 디스크립터와 연관을 갖는 유사한 디스크립터를 가질 수 있지만, 동시에 다른 음악 섹션들은 음악 텍스처 분류기들의 상이한 서브세트들 또는 음악적 텍스처 분류기 내의 구성 요소의 상이한 서브세트를 갖는다.
텍스처 분류기는 멜로디, 카운터 멜로디, 화음, 베이스, 음조 리듬, 비음조 리듬 및 드럼들 중 적어도 일부를 포함하는 그룹으로부터 선택될 수 있다.
음악적 특징은 음악적 텍스처의 두드러진 음악적 구성 요소이다. 음악 섹션 내의 음악적 긴장감 및 해방감에 대한 정보와 음악적 특징이 음악 섹션의 다른 음악적 특징 및 동일한 사전 정의된 음악 텍스처 분류기에서 결합되는 경우 음악적 컨텍스트에서 파괴될 긴장감과 해방감에 대한 정보를 포함한다. 반주는 다른 반주나 음악 섹션의 특정 텍스처 분류기의 기능을 방해하지 않으며 음악 섹션의 텍스처를 두껍게 또는 얇게 하기 위해 선택적으로 추가되거나 제거될 수 있다.
본 발명의 또 다른 양태에 있어서, 자동화된 생성형 작곡 프로세스에서 텍스처를 제공하는 방법이 제공되는데, 이 방법은, 내러티브 브리핑에 적어도 하나의 코드 스킴을 생성하는 단계를 포함하며, 여기서 코드 스킴은 Form Atom들에 기초하고, 내러티브 브리핑은 일련의 사건들에 대한 감정적 의미를 제공하고; 그리고 파생된 텍스처를 적어도 하나의 코드 스킴에 적용하여 내러티브 브리핑을 반영하는 작곡을 생성한다.
이 방법은 텍스처 프로파일을 갖는 제2 음악 섹션과 연결된 제 1 음악 섹션에서 텍스처 내러티브의 부재를 식별하는 단계; 및 음악 반주 또는 음악적 특징 선택인 적어도 하나의 구성 요소로 제 1 음악 섹션을 채우는 단계를 포함하며, 적어도 하나의 구성 요소는 선행 텍스처 분류기들의 이력 및 텍스처 분류기들 중 지배적인 것의 연속 중 하나에 기초하고, 그렇지 않으면 개개의 서브세트들의 강도에 기초하여 미리 정의된 음악적 텍스처 분류기들의 대상 서브세트 사이의 논리적 연결이다.
따라서 본 개시의 다양한 구성 요소 양태들에 따른 효과적인 생성형 작곡은, 특히 "좋은 형식"을 갖는 생성 작품의 생산을 통해 가시적인 기술적 효과를 가져온다. 실시예들은 비표준적으로 변하는 기간의 Form Atom들에 연결된 기술적 특성들이 각각의 Form Atom의 표현 품질들의 디스크립터에 상대적으로 추출되고 저장되는 범주화 과정을 통해 이를 달성한다.
서로 다른 Form Atom들 사이에 관계 맵이 설정되어, 하나의 Form Atom에 의해 나타나는 기술적 특성들이 인접한 Form Atom 사이의 음악적 용어들에서의 전환이 지각할 수 있을 정도로 좋은 형식을 갖는 방식으로 인접한 Form Atom의 특성과 연결될 수 있다. 이 접근 방식은 자동화된 생성형 작곡을 생산하는 기능을 뒷받침한다.
본 발명의 또 다른 양태에는 태그된 Form Atom의 데이터베이스가 제공되는데, 여기서 각각의 Form Atom은 그 개개의 Form Atom의 작곡적 성질을 설명하는 태그; 로컬 으뜸음의 코드들의 세트와 질문, 답변 및 진술 중 하나를 음악적으로 표현하는 형식 기능과 결합된 프로그레션 디스크립터를 포함한다.
다양한 실시예들에서, 질문은 하모니 또는 멜로디 내에 나타난 음들에 의해 지시된 바와 같이 정신적 안정을 요구하는 긴장을 암시하는 코드 스킴이고, 그것들은 Form Atom의 로컬 으뜸음의 키 중심 밖에 있기 때문에 의심스럽게 존재하고;
답변은 로컬 으뜸음이든 응답하는 Form Atom의 어떤 새로운 으뜸음이든 키 중심을 강화함으로써 마음의 관점에서 의심스러운 음조들 또는 음들의 존재를 해결하도록 작동하는 질문의 해결이다; 그리고 진술은 음악적 질문으로부터 완전히 독립적이며, 해결을 통해 해소되어야 하는 의미 있는 음악적 긴장을 암시하거나 유도하지 않으며, 진술은 질문도 답변도 아니다.
각각의 Form Atom은 하모니 구조들과 작곡적으로 좋은 형식을 따르는 하모니 구조를 생성하는 능력을 제공한다.
또 다른 양태에서, 선택 가능한 Form Atom들의 다양성을 포함하는 데이터베이스에 음악적 Form Atom이 제공되고, 배열된 각각의 Form Atom은 하모니 구조 및 작곡적으로 좋은 형식을 따르는 하모니 구조를 생성하는 능력을 제공한다.
본 발명은, 다른 것들 중에서도, 코드들을 베이스 으뜸음에 대한 그들의 관계적 위치로 환원시키는 기능을 하는 한편, 상이한 키들/으뜸음들 사이의 임의의 조옮김에서 발생하는 음조 관계들을 유지한다. 그런 다음 전환들의 체인이 유지된다. 이것을 다르게 표현하면, 선호하는 구현의 모든 음악 키에서 코드들 간의 관계는 음계의 정도에 의해 표현된다.
따라서 옥타브에 관계없이 F의 키 중심에서 음계의 F 음은 값 I, Bb는 IV, C는 V로 표현된다. 따라서 이러한 접근 방식은 선택된 으뜸음에 관계없이 코드 스킴들 간의 동등성을 이끌어 내며, 장음계와 단음계(또는 본 명세서에서 사용되는 7음 서양 음계의 예시적인 컨텍스트에서 출발하는 임의의 선택된 음계의 정도)에 걸쳐 유지될 수 있다.
결과적으로, 코드들 내의 음들을 기본 으뜸음에 상대적인 관계적 위치로 환원함으로써 다른 으뜸음으로의 조옮김에 관계없이 모든 코드의 상대적인 구조적 컨텍스트가 유지됨을 의미한다. 따라서 피아노의 C 장조의 예시적인 키에서
피아노의 중간 C는 MIDI 값 60과 위치 I를 갖는다.
피아노의 Db는 MIDI 값 61과 위치 IIb를 갖는다.
피아노의 D는 MIDI 값 62와 위치 II를 갖고
피아노의 Eb는 MIDI 값 63과 위치 IIIb를 가지며,
피아노의 E는 MIDI 값 64와 위치 III를 갖고,
피아노의 F는 MIDI 값 65와 위치 IV를 가지며,
피아노의 Gb는 MIDI 값 66과 위치 Vb를 갖고,
피아노의 G는 MIDI 값 67과 위치 V를 가지며,
피아노의 Ab는 MIDI 값 68과 위치 VIb를 갖고,
피아노의 A는 MIDI 값 69와 위치 VI를 가지며,
피아노의 Bb는 MIDI 값 70과 위치 VIIb를 갖고,
피아노의 B는 MIDI 값 71과 위치 VII를 가지며, 그리고
피아노의 C(다음 옥타브에서 으뜸음으로 돌아가기)는 MIDI 값 72와 위치 I를(다시) 갖는다.
그러므로, 바람직한 실시예들은 모든 코드가 그 로컬 으뜸음/키 중심의 컨텍스트에서 정수에 의해 측정될 수 있고, 관계들이 단지 특정 코드들의 시퀀싱이 아니라 코드들 사이에 확립될 수 있다는 전제 하에서 작동한다.
유리하게는, 본 발명의 양태들은 음악을 분석한 다음, 구문 분석하여 음악적 텍스처들뿐만 아니라 성능 매개변수들 및 프로세서에서 발생하는 생성 작품의 최종 어셈블리/성능의 품질을 보장하기 위해 요구되는 빌딩 블록들의 생성을 허용하는 다양한 휴리스틱을 추론한다.
분류 메커니즘은 다양한 작곡 컨텍스트들에서 다양한 악기 구성 요소들이 사용될 수 있도록 하여 다양한 작곡들의 원리들을 결합하여 완전히 새로운 텍스처들이 만들어질 수 있도록 한다.
유익한 결과는 브리핑, 즉 고객이 제공하는 내러티브를 따르는 생성형 작곡이며, 결과적으로 음악적으로 관련성이 있고 형식적으로 가변적이며(종래 기술 접근 방식들과 달리 형식적으로 템플릿에 연결되어 있지 않기 때문에) 청각적으로 - 그러므로 보상 중추에 보상하는 - 좋은 음악적 형식을 가진다.
유익하게, 맞춤형 전문가 시스템과 같은 프로세서 기반 시스템 인텔리전스에 의해 지원되는 음악 정보 검색 기술들 및 분석 처리에 기초하여, 본 개시은 보완적이면서도 독창적으로 상이한 기술적 솔루션들의 다양성을 제공한다.
처리 메커니즘들은 원본 작곡/악보의 재현뿐만 아니라 도파민 방출을 촉진하기 위해 뇌의 보상 중추를 자극하는 예측 긴장 및 방출에 대한 인간의 요구 사항들을 충족하는 무수한 다른 대체 생성형 작곡을 모두 지원하는 일련의 수학적 함수들[올바르게 적용된 매개변수를 가진]을 통해 원본 음악 작곡을 압축하는 기능을 한다.
이러한 점에서, 올바른 매개변수들은 개발된 핵심 휴리스틱, 즉 규칙들과 이러한 핵심 휴리스틱의 순차적 실행 순서를 기반으로 하는 수학적 선택들의 적용에 해당한다. 본 발명은 오캄의 면도날(Occam's Razor) 접근 방식을 적용하는데, 즉, 생성 수학 함수들은 (a) 음조 생성, (b) 새로운 으뜸음으로의 음조 변환, (c) 생성형 작곡에서 생성 코드들의 연주 속도를 유지하는 코드 간격 및 (d) 생성형 작곡에서의 텍스처 유지와 같은 접근 방식의 다양한 생성적 양태들에서의 휴리스틱의 선택에 원래의 음악적 의도의 객관적인 재생을 지원하기 위해 가장 간단해야 한다.
본 명세서에 상세히 개시된 많은 수학적 함수들의 예들은 조옮김 중인 베이스 음이 베이스 기타의 가장 낮은 음보다 낮을 수 없다거나, 조옮김된 바이올린 구성 요소의 악보가 두 개의 음들을 동시에 연주하는 것에만 최대로 관련될 수 있다는 공리들을 포함할 수 있다.
본 개시의 실시예들 및 양태들의 기술들의 적용들은 영화 악보, 광고 제작 및 게임(특히 플레이어의 감정(들)에 대한 직접적인 플레이어의 의미를 갖는 플레이어-선택된 음악을 반영하기 위해 생성되는 사용자 특정 음악 반주를 제작하는 컨텍스트에서)을 포함하는 임의의 음악 대 비디오 어플리케이션에 채용될 수 있다. 또한 생성 작품은 '좋은 형식'과 독창성을 구현하기 때문에 이 기술의 적용은 가사를 쓸 수 있는 새로운 작곡을 만들 수 있다.
본 발명은 다양한 음악적 소스들/악보들로부터 호환 가능한 음악적 요소들을 식별하고, 상보적인 생성적 휴리스틱/수학적 함수들을 연결하는 프로세스로부터 정신에 동등하게 만족할 수 있는 대안적인 생성적 음악 작품들을 생산한다.
출원된 특허 또는 출원에는 컬러로 실행된 도면이 하나 이상 포함되어 있다. 컬러 도면(들)이 포함된 이 특허 또는 특허 출원 간행물의 사본들은 요청 및 필요한 수수료 지불 시 관청에서 제공된다.
본 발명의 예시적인 실시예들은 이제 다음과 같은 첨부된 도면들을 참조하여 설명될 것이다:
도 1a는 종래 기술에서의 작곡 접근 방식을 예시하는 도면이고;
도 1b는 본 발명의 작곡 접근 방식을 예시하는 도면이고;
도 2a는 The High and the Mighty의 최종 악보에 대한 선행 기술 스케치를 도시하고;
도 2b는 The High and the Mighty에 대한 종래 기술의 공식 최종 악보를 도시하고;
도 3은 본 발명의 일 양태의 일 실시예에 따른 텍스처 분류 및 생성 어셈블링을 나타내고;
도 4는 중간 음악 섹션이 지정되지 않고 본 발명의 일 양태의 일 실시예에 따른 텍스처 연속성을 제공하기 위해 "채워진" 텍스처 분류 및 생성 어셈블링의 표현이고;
도 5는 바람직한 실시예의 생성형 작곡 시스템에 대한 계층적 태스크 흐름이고;
도 6은 일 실시예에 따르면, 허용 가능한 Form Atom 내 매핑 관계들의 집합체를 나타내고;
도 7은 본 발명의 실시예들의 접근 방식에 의해 실행되는 계층적 및 논리적 흐름을 갖는 휴리스틱 메커니즘의 어포던스(Affordances)를 도시하고;
도 8은 생성형 작곡을 위한 바람직한 작곡 아키텍처 및 방법론의 개략도이고;
도 9는 바람직한 실시예에 따르면, 단일 작곡이 실행 가능한 Form Atom 가지들을 갖는 나무들의 세트로 구문 분석되는 방법을 도시하고;
도 10은 본 발명의 바람직한 실시예에 따른 텍스처 생성의 개략적인 표현이고;
도 11은 본 발명의 일 실시예에 따른 작품 주석 시스템을 위한 그래픽 사용자 인터페이스의 스크린샷이고;
도 12는 본 발명의 일 실시예에서 사용하기 위한 간격 휴리스틱을 나타내는 코드 배치 차트이고;
도 13은 본 발명의 일 실시예에서 사용하기 위한 순차적인 Form Atom 템플릿이고;
도 14는 본 발명의 실시에 따른 축소 및 분석을 위해 주석이 달린 존 윌리엄스(John Williams)에 의한 퀴디치 매치(The Quidditch Match) 악보의 일부이고;
도 15는 본 발명의 구현예에 따른 퀴디치 매치 작곡으로부터 유도된 이스케이프 Form Atom 4를 갖는 시퀀스 Form Atom 3의 루프를 나타내는 인터벌 템플릿이고;
도 16은 본 발명의 구현예에 따른 퀴디치 매치 작곡으로부터 파생된 Form Atom 6 순차 종지를 나타내는 템플릿이고;
도 17은 본 발명의 구현예에 따른 퀴디치 매치 작곡으로부터 유래된 시퀀스 및 이스케이프 프레이즈 7 및 8을 나타내는 템플릿이고;
도 18은 음의 음조를 나타내는 관련 컬러 라벨들을 갖는 본 발명의 일 구현예에 따라 강화된 분리형 현 작법의 4마디 섹션의 악보이고;
도 19는 사전 정의된 컬러 스킴에 따라 구문 구조들 및 음정 음조를 강조함으로써 본 발명의 일 구현예에 따라 수정된 Johann Sebastian Bach의 전주곡 C단조의 처음 두 마디들의 악보이고;
도 20은 본 발명에 따른 텍스처 분석에서, 해당 마디의 로컬 딸림음과 관련된 16분음표 3의 음계의 정도를 나타내는 표이고;
도 21은 Bach 전주곡의 마디 1 내지 3 내의 음들을 수치 배열로 표현하는 본 발명의 구현예에 따른 예시적인 도면이고;
도 22는 Bach 전주곡의 마디 1 내지 마디 3 내의 음들을 수치 배열로 표현하는 본 발명의 구현예에 따른 대안적인 예시 도면이고;
도 23은 Bach 전주곡의 마디 4 내지 6 내의 음들을 수치 배열로 표현하는 본 발명의 구현예에 따른 또 다른 예시적인 도면이고;
도 24는 패턴의 방향, 베이스의 제 5 16분음표가 도달하는 코드 구성 요소, 고음 T 또는 베이스 B에서의 제 5의 위치를 포함하여, 16분음표 5에서 베이스의 패턴 변화를 예시하는 표이고;
도 25는 Bach 전주곡의 마디 7 내지 9 내의 음들을 수치 배열로 표현하는 본 발명의 구현예에 따른 또 다른 예시적인 다이어그램이고;
도 26은 Bach 전주곡의 마디 10 내지 11 내의 음들을 수치 배열로 표현하는 본 발명의 구현예에 따른 또 다른 예시적인 다이어그램이고;
도 27은 Bach 전주곡의 마디 12 내지 14 내의 음들을 수치 배열로 표현하는 본 발명의 구현예에 따른 또 다른 예시적인 다이어그램이고;
도 28은 "Clavier-Buchlein version"에 있는 Johann Sebastian Bach의 마디 14, C 단조 전주곡 1의 Wilhelm Friedemann Bach 원고 사본 이미지이고;
도 29는 Bach 전주곡의 마디 15 내지 17 내의 음들을 수치 배열로 표현하는 본 발명의 구현예에 따른 예시적인 다이어그램이고;
도 30은 Bach 전주곡의 마디 18 내의 음들을 수치 배열로 표현하는 본 발명의 구현예에 따른 예시적인 다이어그램이고;
도 31은 계층적 흐름 및 엔트로피의 강조 포인트들을 보여주는 색상으로 코딩된 휴리스틱을 사용하는 본 발명의 구현예에 따른 Bach 전주곡의 악보 표현이고;
도 32는 C 및 Eb를 최상위 확장들로 하는 장3화음 및 단3화음의 모든 가능한 조합(옥타브에 걸쳐)의 본 발명의 구현예에 따른 악보 표현이고;
도 33은 본 발명의 구현예에 따른 Bach 전주곡의 마디 19 및 20의 텍스처들 내에서 가능한 음들을 보여주는 건반 표현의 이미지이다.
본 출원 및 발명의 광범위한 특성은 개요로 분류되고, 그 다음에는 설명 섹션들이 이어지고, 그 다음에는 신호 처리 접근 방식의 적용과 특정 예에 대한 기능들의 적용에 대한 작업 예가 뒤따른다. 이 출원 내에서, 시스템은 "Heresy 생성형 시스템", "생성형 작곡 시스템", 또는 향상된 기술 출력 결과를 가져오는 튜링 등가를 적용하는 응용 기술 프로세스 내에서 새로운 수학적 분석 및 재어셈블링 접근 방식의 실제 적용을 감독하는 컴퓨터 구현 시스템에 대한 기타 적절한 설명 태그로 지칭될 수 있다.
"Heresy 생성형 시스템"의 이면에 있는 원리들은 우리가 전통적으로 작곡들과 작곡 프로세스를 바라보는 방식에서 변화를 중심으로 이루어지며, 음악(및 오디오 신호들의 관련 신호 처리)을 변경할 수 없는 최종 고정 상태를 갖지 않는 유동적이고 비정적인 실체로 취급한다.
바람직한 실시예들의 생성형 시스템의 각각의 양태가 기존의 [분석된] 작품들로부터 새로운 악보를 생성하기 위해 어떻게 상호 작용하는지를 고려하기 전에 "브리핑"를 생성하는 것과 관련된 요구 사항들을 이해하는 것이 중요하다. 브리핑 자체는 생성형 시스템의 중추인 작곡 요구 사항들의 세트이다. 그 다음, 설명은 다양한 실시예들 및 양태들의 생성적 접근을 고려할 것이다.
본 발명은, 코퍼스로서, 잠재적으로 모든 작곡들을 분석, 참조 및 생성형 시스템으로의 입력을 위한 소스로 간주한다. 이러한 프로세스를 통해, 본 발명은 주어진 작곡 또는 다수의 작곡들로부터 특정 작곡 원리들을 추출하는 기능들(AI 또는 프로세서 기반 인텔리전스에 의한 신호 처리을 통한 디지털 분석을 통해, 또는 음악 전문가에 의해)을 추출하여, 본 발명이 상이한 작품들의 원리들을 하나의 독특한/이산적인 메타 작곡으로 혼합할 수 있도록 한다. 오컴의 면도날(Occam's Razor) 기반 접근 방식을 적용하면, 이러한 작곡 원리들은 새로운 생성 작품들을 생성할 수 있는 일련의 휴리스틱/규칙들로 표현된다.
Heresy 생성형 시스템과 관련하여 브리핑의 다른 키워드들은 잠재적으로 다른 사용자들에게 다른 의미들을 가질 수 있음이 이해된다. 그러므로, 범주에 명사를 부여하기 위해 태그를 지정하는 개념에 의미론적 의미가 거의 없는 일반 용어들을 사용하는 것이 바람직하며, 사용자에게만 의미가 있는 개인 메타 태그들의 세트에 하나 이상의 키워드를 첨부할 수 있다. 자연어 프로세싱(NLP, Natural Language Processing)을 사용하여 음악 섹션의 사용 가능한 디스크립터에 대한 처리 가능한 데이터를 도출할 수 있다.
효과적인 범주화 전략은 발성 훈련의 Estil 방법일 수 있다(Klimek, 2005). 이 추상적 의미-라벨링 방법은 의미론적 의미를 가진 단어들을 음악에 붙이려는 시도에 대한 실행 가능한 대안을 제공하며, 그 위험들은 (G. A. Wiggins, 1998)에서 강조된다.
본 발명의 시스템 및 바람직한 실시예들은 작곡에서의 반복들을 만들기 위한 프레임워크를 제공한다. 사용자들이 의도를 진술할 수 있는 방법(휴리스틱과 해석 및 상관 관계가 있는 입력된 내러티브 또는 브리핑의 형식으로, 따라서 청각적으로 원활한 방식으로 함께 연결할 수 있는 두드러진 음악 섹션들)을 제공한 다음 실제로 이 브리핑 사양의 출력을 신속하게 조정할 수 있다.
다시 말해, 본 발명의 시스템은 오디션을 실시하기 전에 일련의 작곡 아이디어들을 정의하고 그들이 원래의 의도를 얼마나 효과적으로 전달하는지 경청할 수 있는 능력을 제공한다. 그럼에도 불구하고 선택된 것들은 형식이 보호되는 동안 시스템이 새로운 작곡을 생성하도록 요청받을 때마다 변경된다.
독창적인 접근 방식은 어떤 생성적 표현이 잠재적으로 "잘못된" 것인지 볼 수 있는 기능을 제공한다는 점에서 이 원리를 한 단계 더 발전시킨다. 보다 구체적으로, 시스템 출력에 대한 비판적 분석과 논평을 통해 어떤 휴리스틱이 잘못된 코드, 음정 음조, 길이, 위치, 보이싱, 보이스 리딩, 텍스처 충돌 또는 감정적 의미를 생성했는지 정확히 식별[원래 의도/지침/요약을 고려하여]할 수 있다.
그런 다음 이러한 비판을 휴리스틱 자체에 반영하여 작곡 의도에 더 잘 맞도록 결정들을 내리는 방법을 변경하고 원래 개념의 휴리스틱 표현을 반복적으로 개선할 수 있다. 또는 시스템이 완벽하게 합리적인 자료를 생성할 수 있지만 이 결과가 원래 의도와 더 잘 일치할 수 있는 경우가 있다.
이것은 첫째, 다른 개념으로 사후 합리적으로 메타 태그될 수 있는 새로운 작곡 아이디어; 둘째, 자신의 원래 의도가 다른 작곡 아이디어들 및 실제로 생성 작품과 얼마나 가까운지에 대한 통찰력의 두 가지를 제공한다.
본 발명의 시스템은 전통적인 영화-악보 방법들로부터 역할들을 전환한다. 작곡가들이 전통적으로 프로그래머들과 엔지니어들의 기술 도구들(예를 들어, 스트리머들 및 클릭-트랙들)과 자료를 시연하기 위한 시퀀싱 소프트웨어에 의존해 왔으며; 그리고 스티븐 스필버그(Steven Spielberg)가 인디아나 존스(Indiana Jones, Laurent, 2003) 와 클로즈 인카운터스(Close Encounters) 5음 모티프(Meeker, 1978)의 주제들로 한 것처럼 커미셔너들이 제시된 자료를 선택하는 데 선택적인 역할을 하는 반면, 본 발명의 시스템은 이러한 역할들을 전환하고; 이는 도 1a와 1b의 커미셔너/사용자/작곡가/프로그래머 묘사들에 나타난 접근 방식들의 비교에 반영되어 있다.
본 발명에 의해, 작곡가 자신들은 프로그래머들이자 사용자들이 된다. 작곡가들은 이제 이 도구를 사용하여 다른 사용자들이 사용할 수 있는 휴리스틱 프로세스들을 생성하므로 프로그래머들의 기술적 역할을 수행하는 반면, 커미셔너들 자신은 생성 도구의 사용자들로서 작곡가가 될 수 있다.
본 발명의 기초가 되는 접근 방식은 개념적으로 상이한 방식으로, 작곡의 이해, 특히 작곡의 행위에 대한 이해를 기반으로 하며 즉, 음이 실제로 무엇 인지가 아니라 오디오 신호들의 다음 음이 어떻게 이전 음(음악 섹션의 기본 오디오 신호 구성 요소의 길이 및 생성과 관련된 규칙들로 표현된 것과 같이)을 어떻게 따르는지를 보여주는 것에 기초한다. 이 패러다임에서 작곡의 원리는 작곡의 개념을 구체화하기 위해 생성된 휴리스틱의 반복들을 적용하는 분석 방법을 필요로 한다.
본 발명에 따르면, 프로세서 기반 시스템 및 관련 방법론은 본 발명이 각각의 프로세스들, 결정들 및 가중치 요소들[작곡에 들어가는] 시스템이 이러한 새로운 작곡 저작물들을 생성하는 방법에 대한 원리들을 추상화할 수 있는 핵심으로 만든다는 점에서 이전 접근 방식들의 시스템들과는 다르다.
특히, 작곡 입력이 거의 완전하게 이루어지는 구성 요소들을 제시하는 일련의 매개변수화된 생성형 시스템들을 사용하는 대신, 본 발명의 시스템은 처음부터 작곡을 분해하고 특정 작품에 대한 생성 메커니즘들을 생성한다.
공리적으로, 본 발명은 다음과 같이 주장한다:
1. 동일한 결과를 얻을 수 있는 휴리스틱이 적을수록 더 바람직하다. 이것이 오컴의 면도날(Occam's Razor)이며, 휴리스틱을 이해하기 쉽게 만듦으로써, 이 접근 방식은 본 발명의 프로세서들 및 기능에 의해 적용되는 미래의 규칙들과 함께 더 쉽게 구축할 수 있게 한다.
2. 휴리스틱의 선형 증가는 기하급수적으로 증가하는 작업들의 수를 포함한다. 요컨대, 새로운 작곡들은 바람직하게는 과거의 분석 구성 요소들을 점점 더 많이 통합해야 하며, 따라서 이전 및 미래의 작곡들을 설명하는 보편적인 휴리스틱 세트에 더 많은 압축 진행을 제공해야 한다.
3. 새로운 휴리스틱은 하나 초과의 현상을 설명해야 한다. 새로운 규칙들의 세트가 특정 작품의 핵심 작곡 구성 요소 하나만 설명하는 경우 이는 맞춤형 규칙 세트이며 코퍼스의 증거는 휴리스틱이 적절한 위치에 대한 추가 예를 제공할 수 있을 때까지 생략되어야 한다. 이는 작곡 분석에 규칙들을 과도하게 적용하고 작곡에 대한 보다 통일된 이해를 추구하기 위해 부풀림과 노이즈를 유발하는 것을 방지한다. 실질적으로 (적어도) 같은 작곡가에 의한 새로운 작곡들을 설명하거나 장르 또는 시간의 유사성을 통해 연결된 작곡들을 설명하는 데 필요한 규칙들은 더 적다.
작품이 분석되고 그로부터 생성적 휴리스틱이 생성될 때, 이것들은 특정한 특징을 갖게될 것이며, "팩"으로 간주될 수 있다. 휴리스틱 팩은 Bach 스타일의 피아노 전주곡들이나 John Powell 스타일의 액션 영화 음악을 제작할 수 있다. 그런 다음 이러한 팩들에 콘텐츠의 의도와 감정적 의미(들)에 대한 정보가 메타 태그로 지정될 수 있다.
이러한 방식으로, 본 발명의 생성적 틀에 의해 작곡된 음악은 그 자체로는 일반적이고 식별 가능한 사운드를 결코 갖지 않지만, 그 휴리스틱 팩들은 가장 확실하게 갖게 될 것이다. 따라서 기능적 도구는 더 큰 단순성과 더 높은 출력의 다양성을 향한 개선을 허용하는 측정 가능한 출력으로 작곡의 일반적인 표현을 반영한다. 이것은 그 자체로 작곡 프로세스에 중요하며, 특히 좋은 형식을 갖는 자동화된 생성형 작곡의 컨텍스트에서 중요하다.
본 발명은, 자동화된 생성형 작곡을 지원하는 다양한 상호 작용 구성 요소들에 대한 본 명세서의 보다 상세한 설명으로부터 명백해질 바와 같이, 특정 지점에서 새로운 작곡에 대한 즉각적인 경로를 예측할 수 있으며, 이에 따라 실천에 대한 성찰을 위한 작곡 분야의 새로운 메커니즘을 제공하고, 감정적 의미들의 범주화를 정교화할 수 있다.
섹션 A
I. 메타 작곡: 브리핑 메커니즘
음악은 다양한 이유로 영화와 동기화된다. "동기화된" 음악, 즉 diegesis 안에 있는 음악은 일반적으로 등장인물들이 이야기의 일부로 듣는 반면, non-diegetic 음악, 즉 이야기 외부에 위치하여 그것에 대해 논평하는 음악은 영화의 특정 특성들을 끌어내기 위해 다양한 방식으로 작용한다.
동기화된 트랙들, 즉 아티스트가 미리 녹음한 다음 액션(팝, 랩 등)을 수반하기 위해 겹쳐진 트랙들의 경우 이러한 트랙들은 종종 편집실에서 시작점이 되어 컷의 속도와 스타일의 기초를 형성한다.
이는 영화에 하위 문화적 정체성을 부여하거나, 장르에 기반을 두거나, 특정 문화의 의미를 영화에 부여한다. 이것의 전형적인 예는 The Big Lebowski에서 Gipsy Kings가 "Hotel California"를 사용한 것이다. Jesus Quintana(John Turturro분)의 캐릭터를 소개하는 장면에서 관객은 가사와 음악적 느낌 모두에서 느긋하고 다소 우울한 대우를 받는 원곡을 재해석하게 된다.
이 새로운 해석은 활기차고 생동감 넘치는 특성을 가지고 있으며, 예수 캐릭터가 지금까지의 내러티브의 담론과 완전히 다르게 환경을 바라보고 있음을 암시한다: 이는 빠르게 진행되는 음악과 함께 슬로우 모션 샷의 몽타주로 더욱 강조되는 병치이다.
악보 작곡가가 맞춤형으로 작곡한 non-diegetic 음악의 경우, 예수 Quintana의 예에서와 같은 병치와 같은 특정 효과를 얻기 위해 텍스처 팔레트를 통해 담론을 선택할 수 있지만 적절한 템포와 박자표(Time signature) 매핑을 통해 영화의 속도와 흐름을 돕고자 하며, 뿐만 아니라 긴장감을 만들어내기 위해 앞선 내러티브가 최고조에 달할 때까지 화면의 이야기를 따라간다.
그러므로, 본 발명의 실시예들은 위의 요소들의 브리핑을 가능하게 하는 인터페이스 및 기능을 사용자에게 제공한다. 다음을 포함하되 이에 국한되지 않는 적절한 것으로 간주할 수 있는 몇 가지 방법들이 있다:
1. 큐들이 시작되고 끝나는 위치에 대한 타임 코드들과 각각의 큐가 가질 의미들이 포함된 스포팅 세션의 서면 개요와 감독/작곡가가 동의한 히트 포인트들로 완성된다.
2. 영화의 전체 악보.
3. 오케스트레이터들이 사용할 수 있는 기본 작곡 자료가 포함된 제한된 수의 보표들에 대한 짧은 악보 또는 "스케치".
4. 작곡가 또는 그/그녀가 신뢰하는 오케스트레이터들이 원하는 사운드, 텍스처 및 하모니에 대한 음들을 제공하는 매핑된 타임라인에 걸쳐 음들을 만드는 데 사용되는 부분 그래픽 악보인다. 이 경우 지침들을 해석하고 이해하는 작곡가 또는 오케스트레이터의 능력은 브리핑이 결과를 얻기 위해 의존하는 인텔리전스형 구문 분석 메커니즘이다. 스케치와 최종 악보 사이의 이러한 불일치는 도 2a와 2b에서 볼 수 있듯이 The High and the Mighty에 대한 악보의 재구성에 의해 강조된다.
위의 목록이 포괄적이지는 않지만 브리핑을 허용하는 도구에 대한 요구 사항들의 지표를 제공한다. 그러나 브리핑에는 중요한 구성 요소들이 있으며 다음 중 일부 또는 전부를 포함한다.
1. 시간에 따라 속도를 매핑하는 능력. 이것은 표준 분, 초 및 프레임 눈금자가 아닌 음악 시간 눈금자를 사용한다는 것을 분명히 나타낸다. 이 눈금자는 템포 및 박자표 변경들을 통해 조정할 수 있어야 하며, 예를 들어 멀티플레이어, 상호 작용 및 스트리밍 또는 원격 액세스되는 게임에 관계없이 영화 또는 어드벤처/퀘스트 게임의 양태를 매핑할 수 있어야 한다.
2. 히트 포인트들과 히트 포인트가 가져야 하는 관련 의미를 지정하는 시스템.
3. 다른 시점들에서 텍스처 요소들과 그 의미들을 지정하는 방법.
4. 하위 문화 특성들을 가져올 수 있는 선택할 수 있는 담론 목록: "Cuban Montunos", "LA Urban" 등. 이것은 또한 "John Barry"와 같은 특정 작곡가들의 독특한 사운드나 "The Bourne Identity" 영화들과 같은 영화 자체의 독특한 사운드로 나타날 수 있다.
5. 다음 중 하나 이상을 포함하는 작곡 속도를 설정하는 방법:
(a) 시간에 따른 코드들의 수[[.]]; (b) 전조들 및 조성의 변화들; (c) 다양한 코드 스킴 특성들과 관련될 수 있는 감정적 의미 키워드들: (i) 코드들 변경에 따른 페달 음들의 사용; (ii) 키 중심들을 통과하기 위해 5도 사이클을 사용 (iii) 큐의 시작 또는 끝과 같은 코드 스킴의 기능적 특성들
이 목록의 마지막 항목, 즉 작곡 속도를 설정하는 방법은 아래의 섹션 B에서 보다 상세히 설명되는 것처럼 본 발명의 시스템이 생성적으로 작곡하기 위해 사용하는 구조적 계층에 대한 힌트를 제공한다. 그것은 모든 속도와 작곡 형식이 코드 스킴과 시간에 따른 기능을 지정하는 데서 비롯된다는 것을 암시적으로 말하고 있다. 코드 스킴의 요구 사항들은 우리가 개요를 만들어 결과를 생성하는 기둥이다.
II. 코드 스킴 요구 사항
본 발명의 완전한 시스템은 코드들의 하모니 시퀀스들로서의 텍스처 및 멜로디 출력의 양태들에 기초한다. 따라서 이러한 시퀀스들을 사용하여 작품의 섹션들을 형성하고 속도를 설정한다.
따라서 다양한 실시예와 양태들의 생성형 시스템의 경우 코드 스킴들은 두 가지 독특한 특성들, 즉 (i) 형식 기능 및 (ii) 감정적 의미를 갖는다.
형식 관점에서 시스템은 주어진 섹션에 대한 정보/저장된 데이터의 주석을 허용하여 이 데이터를 반영하도록 배열된다:
1. 현재 섹션이 큐의 시작, 끝 또는 중간에 있는가?
2. 작품의 으뜸음에 초점을 맞춰야 하는가 아니면 섹션이 끝날 때까지 다른 키 중심으로 이동해야 하는가?
3. 전조되어야 하는 섹션을 나타낸다, 즉, 다음 Form Atom(아래 참조)의 로컬 으뜸음이 현재 Form Atom의 로컬 으뜸음(즉, Form Atom의 주변 컨텍스트와 음악적 특성들 및 전환점들에 의해 결정되는 잠재적으로 가변적인 길이의 음악적 빌딩 블록)과 다를 필요가 있는가?
4. 주어진 섹션에 대한 코드 밀도(음악 지속 시간 동안의 코드들의 수)를 규정하는가?
특정 섹션의 원하는 형식 기능에 대한 이 브리핑은 작품의 으뜸음과 관련하여 코드들을 어떻게 작성해야 하는지, 곡을 작곡/영화의 다른 하위 섹션으로 이동하기 위해 해당 지점에서 새로운 키 중심에 도달하기 위해 전조를 통해 움직임이 있어야 하는지에 대한 정보를 제공한다.
시스템 인텔리전스의 기능과 해석 기능들(아래 참조)은 위의 형식 기능과 결합되는 경우 주어진 섹션 내에서 코드들의 수를 설정할 수 있는 기능을 제공하여 생성형 작곡의 형식과 방향을 포괄적으로 형성할 수 있다.
새로운 작품의 형식과 코드들을 만들기 위해 어떤 생성 기법이 사용되든 간에, 사용자는 프로그래머/작곡가가 작품이 취하기를 원하는 감정적 의미적 요소들을 간략하게 설명할 필요가 있다. 컨텍스트를 제공하자면, 영화 작곡 내에서 의미된 의미를 표현할 때 작곡가들은 서구 문화 내에 있는 수많은 담론들과 코드들을 끌어내려고 노력한다.
그러나 어휘적 의미와 음악에 대한 설명이라는 주제를 다룰 때 동일한 하위 문화 내의 개인들로부터도 합의가 거의 이루어지지 않는다. 이는 개인들마다 그들의 문화적 코딩에 대한 해석이 다르기 때문이다.
사용 가능한 음악 섹션들의 덩어리들의 형식의 참조 자료들과 관련하여 시스템은 쉽게 재현할 수 있지만 해석을 사용자의 브리핑/내러티브에 열어두는 메타 태그들을 사용하여 다양한 작곡 구성 요소들의 의미들을 참조하도록 기능적으로 배열된다.
앞서 지적한 바와 같이, 브리핑은 시스템에 입력되는 내러티브에서 표현된 유사하거나 동일한 언어와 코딩된 음악 섹션들을 상호 연관시키기 위해 NLP 기술들을 사용하여 처리될 수 있다. NLP 기술들은 잘 알려져 있다.
이러한 방식으로, 사용자는 음악 세그먼트들과 연관되거나 첨부된 메타 태그들이 항상 적용되어야 하는 것에 대한 프로그래머의 관점에 의해 방해받지 않고, 입력으로서의 브리핑만을 기반으로 독립적으로 생성형 작곡을 작성할 수 있는 시스템의 능력에 대한 자신의 해석을 가져올 수 있다. 분명히, 감정적 의미들은 사용자별 의미를 갖는 일반적인 변수 키워드들(또는 짧은 핵심 문구들)의 형식을 취한다.
이들은 처음에는 모드 1... 모드 n으로 명명되지만 사용자가 선호하는 어휘 의미에 따라 변경될 수 있다. 작곡 휴리스틱(예를 들어, 특정 코드 시퀀스들, 텍스처들, 멜로디 윤곽들, 코드 간격 휴리스틱, 음 생성기들 및 리듬 생성기들을 만드는 방법들)에는 이러한 키워드들이 첨부되어 있다. 생성 메커니즘은 사용자가 요청하는 타임라인의 각각의 인스턴스에서 이러한 의미들을 생성하기 위해 적절한 휴리스틱을 선택하도록 작동한다.
3. 텍스처 요구 사항들
특정 음악적 생성 휴리스틱에 의미들을 메타-태그하는 방법을 확립한 다양한 실시예들의 시스템은 음악적 텍스처를 유지하고, 특히 충돌할 인접하는 음악적 구성 요소들(예를 들어, Foam Atom들)의 삽입에 대한 요청들, 예를 들어 동시에 7개의 멜로디 또는 3개의 베이스 라인들을 요청하는 것을 제한하는 메커니즘을 제공한다.
그러나 동시에 3개의 베이스 라인들을 갖는 것은 전적으로 가능하다. The Bourne Supremacy의 John Powell의 큐 "To The Roof"는 신디 베이스에서 드라이빙 베이스 라인이 들리고, 더블 베이스들이 현 텍스처의 하단에서 긴 음을 지속적으로 연주하는 반면, 마디의 마지막 세 세미퀘이버들과 새로운 마디의 첫 번째 비트마다 타악기 효과가 있어 베이스 연주자가 음소거된 현들을 가로질러 손가락들을 드래그한다. 단독으로 이 베이스 라인들 중 하나라도 실행 가능한 베이스 파트로 작동하지만, 여기서 텍스처는 세 가지 모두를 요구하여 음향 공간에서 조화나 충돌과 모순되지 않는 최종 효과를 만든다.
시스템 인텔리전스는 먼저 일련의 휴리스틱을 생성하고 스팅(예를 들어, 비올라), 오프셋 호른, 하프 아르페지오, 피치카토 베이스와 같은 일련의 음악 구성 요소들(악기들용)의 식별 및 사용에 기술적 접근 방식을 적용한다. 음악 검색 기술들을 사용하여 원본 악보의 MIDI 표현을 생성하거나 단순히 MIDI 형식으로 저장된 원본 악보 자체를 식별할 수 있다.
그런 다음 멜로디, 카운터 멜로디, 하모니, 베이스, 음조 리듬, 비음조 리듬 및 드럼/비트 등[그러나 이에 국한되지 않음] 숙련된 수신인이 이해할 수 있는 다른 음악적 특성들과 같은 일련의 텍스처 분류기들을 정의하는 데 기여하는 하나 이상의 음악적 구성 요소가 있을 수 있다. 이와 관련하여 도 3을 참조한다.
이들 악기 구성 요소들 각각은 작곡의 최종 어셈블리와 관련된 본 발명의 양태에 따라 두 가지 특성들 중 하나를 갖는 것으로 더 분류되는데 즉, 구성 요소는 "특징" 또는 "반주"일 수 있다. [음악적] 기능은 음악 섹션에 시간적 감각, 인식 및 중력, 즉 의미를 부여하는 것으로 간주될 수 있다.
따라서 음악적 특징은 음악 섹션의 텍스처 공간에서 두드러진 음향 구성 요소이며 즉, 그 자체로 긴장과 방출에 대한 정보를 포함하며, 두 번째 특징이 완전히 다른 악기에 의해 연주되더라도 두 번째 특징이 공통 텍스처 분류기에 공존하는 경우 정보는 파괴된다. 반주는 필수적이지 않지만 텍스처 분류기에 풍부함과 조성을 제공하는 보완적인 음악적 보풀이다.
또한 Form Atom과 같은 각각의 음악 섹션과 관련된 하나 이상의 의미 디스크립터들이 있다. 디스크립터들은 일반적으로 기존 음악 작품의 음악 섹션을 비평한 음악 전문가에 의해 파생되며, 실제로 도서관에 있는 음악 작품 전체 코퍼스 내에서 파생된다.
각각의 음악 섹션 내에서, 음악적 구성 요소 또는 음악적 구성 요소의 코퍼스(하모니와 같은 단일 텍스처 분류기의 여러 음악적 구성 요소 포함)는 함께 그룹화될 수 있으며, "야한", "따뜻한", "껄끄러운/매끈한", "떠다니는", "두근대는", "승리적인", "회상적인", "차분한", "동시에 매끄럽고 연상되는"과 같은 시맨틱 디스크립터뿐만 아니라 "시끄러운", "섹시한", "흥미로운" 및 "가벼운 봄날"과 "반짝이는 목관악기"를 포함한 더 많은 다른 설명적 의미와 같은 더 넓은 시맨틱 디스크립터와 상관/태그를 지정할 수 있다.
물론 무수히 많은 의미론적 설명들이 있다. 상이한 음악 섹션들은 동일한 시맨틱 디스크립터 또는 몇 가지 공통된 서술적 의미들을 갖는 유사한 의미론적 디스크립터를 포함할 수 있지만, 다시 상이한 음악 섹션에서의 동일한 시맨틱 디스크립터는 상이한 악기 구성 요소 및/또는 상이한 수의 악기 구성 요소를 가질 수 있다.
따라서 시맨틱 디스크립터들은 메타데이터 내에서와 같이 개개의 음악 섹션에 연결되거나 연관된다. 따라서 시맨틱 디스크립터들은 단일 악기 구성 요소와 관련되거나 악기 구성 요소의 서브 세트들 또는 악기 구성 요소들의 서브 세트 그룹들(상호 배타적이거나 중첩됨) 또는 텍스처 분류기 그룹에서 어셈블링될 수 있다. 세분성은 사용자가 선택할 수 있다.
시스템이 각각의 섹션과 함께 각각의 섹션에 대한 텍스처 분류기를 저장하거나 직접 기록을 제공할 수 있지만, 시스템 인텔리전스가 일련의 휴리스틱(예를 들어, 컴퓨테이션 매개변수들)을 적용하여 개개의 특성들을 생성하는 것이 바람직하다(특정 디스크립터들과 연결되거나 밀접하게 연관된 악기 구성 요소들의 조합에 대한 과거 기록들과 관련하여).
자동화된 생성형 작곡을 통해, 본 발명자는 특정 텍스처 분류기(예를 들어, 멜로디) 내의 악기 구성 요소들이 특징으로서 분류되는 두 개 이상의 악기 구성 요소를 포함할 수 없다는 것을 확인하였다. 만약 그렇다면, 동일한 텍스처 분류기의 특징들은 상호 파괴적일 것이다.
그러나 반주들인 음악 구성 요소들의 경우에는 그렇지 않다. 결과적으로, 단일 텍스처 분류기는 반주들 역할을 하는 악기 구성 요소들의 0개 또는 다수를 포함할 수 있지만 기능의 역할을 수행하는 악기 구성 요소들은 두 개(있는 경우) 이상은 포함할 수 없다. 반대로, 디스크립터 내에서 여러 기능들이 텍스처 분류기들 전체에 분산되어 있는 한 여러 기능들이 존재할 수 있다(단일 텍스처 분류기 내에는 없음).
예를 들어, 도 3에서, "Piece 1"의 음악 섹션 4에 있는 "두드리기" 디스크립터는 4개의 텍스처 분류기들, 즉 베이스, 음조 리듬, 비음조 리듬 및 드럼들로 구성된다. "두드리기"는 실제로 하모니뿐만 아니라 멜로디도 포함하는 보다 일반적인 디스크립터 "승리한"의 서브 세트이다.
이 예에서 의미 방식 디스크립터 "두드리기"에는 실제로 8개의 개별 악기 구성 요소들이 있으며, 하나는 베이스 텍스처 분류기의 기능 구성 요소 "F"이고, 두 개의 개별 악기 구성 요소들은 텍스처 분류기 음조 리듬의 반주들이며, 3개의 개별 악기 구성 요소들은 비음조 리듬에 있고 하나는 특징이며 둘은 반주들이고, 두 개의 개별 악기 구성 요소들은 드럼들 (텍스처 분류기)에 있으며 하나는 기능(예를 들어, 플로어 톰)이고 하나는 반주(예를 들어, 스네어)이다.
단순화를 위해 악기 구성 요소들의 수는 각각의 텍스처 분류기에서 공백/없음(부재) 또는 기능에 대한 문자 "F" 또는 악기 반주들의 수를 나타내는 하나 이상의 문자 "As"로 표시된다. 이제 "소품 2번곡"을 보면, 섹션 1에 대한 디스크립터가 없고, 섹션 2, 4, 5, 6 각각에 하나의 디스크립터가 있는데, 섹션 4의 카운터 멜로디에는 할당된 디스크립터가 없어 "따뜻한"이라는 의미의 보탬이 없으며, 소품 2번곡은 멜로디와 하모니에 대해 서로 다르지만 독립적인 두 가지 특징들이 있는데, 둘 다 시맨틱 디스크립터 "차분한"과 관련이 있다.
본 발명의 처리 시스템에 의해, 악기 구성 요소들로부터 도출될 수 있는 하나의 추가 정보, 즉 음악 강도가 있다. 섹션들 간의 비교를 기반으로 디스크립터 및/또는 전체 음악 섹션과 관련된 기능 및 반주들의 인스턴스들 수는 해당 섹션의 강도를 나타내는 것으로 해석된다. 요컨대, 구성 요소들의 수가 많을수록 섹션이 더 강렬하고 풍부해진다.
시스템 인텔리전스는 음악 섹션들 간의 디스크립터들에서 공통성을 찾고, 중요하게는 각각의 디스크립터들과 관련된 구성 요소들의 기여 특성을 찾아 향후 생성형 작곡에서 서로 다른 음악 섹션들에서 서로를 보완할 수 있는 사용 가능한 악기 구성 요소들(또는 전체 디스크립터들)을 식별하는 기능을 한다.
중간 요약으로서, 모든 음악 섹션에 대한 전체 텍스처에 기여할 수 있는 악기 구성 요소들 및/또는 텍스처 분류기들이 하나 또는 여러 개가 있을 수 있다. 실제로, 음악 섹션 내에서, 실제로 0개, 하나 이상의 텍스처 분류기들의 세트들이 존재할 수 있으며, 이들은 시스템 인텔리전스에 의해 상호 배타적이거나 보완적인 것으로 취급되는 음악적 구성 요소들을 가지며, 실제로 하나의 텍스처 분류기가 다른 텍스처 분류기의 서브 세트가 되도록 분리, 부분적으로 중첩 또는 계층화될 수 있다.
다시 도 3으로 돌아가서, 음악 섹션 3을 살펴보면, 시스템 인텔리전스는 "껄끄러운", "매끈한" 및/또는 "부유한" 중 하나 또는 그 조합의 감정적 의미를 표현하는 데 사용할 수 있는 베이스 반주를 식별한다. 연결들(도 3에서 점선으로 표시)은 잠재적으로, 시스템 인텔리전스가 음악 코퍼스의 분석에서 파생된 음악적 텍스처를 브리핑 음 두드리기에 이어 따뜻하고 부드러움, 승리와 회상으로 이어지는 새로운 작곡에 삽입할 수 있는 방법을 보여주며, 음악 섹션 1의 시작과 음악 섹션 2의 끝 사이에 떨어지는 시간에 따라 변하는 강도를 제공한 다음 음악 섹션 3에서 안정되다가 급격히 상승한 다음 음악 섹션 4에서 일정하게 유지하다가 음악 섹션5가 시작될 때 다시 급격히 상승하여 강도가 0으로 점진적으로 떨어진다.
음악 섹션은 개별 시간 척도를 대표하지 않으며 실제로 각각의 음악 섹션 내에 존재하는 다양한 Form Atom들이 있을 수 있다는 점에 유의해야 한다.
도 4를 보면, 제 1 음악(49)에 대한 음악 섹션들(40-48)과 제 1 음악(59)에 대한 음악 섹션들(50-58)의 연속이 나타나며, 음악의 첫 번째와 두 번째 작품들은 작품들의 [제한된] "코퍼스"를 형성한다. 단지 설명을 위해서, 텍스처 분류기들(60)은 4개, 즉 멜로디, 하모니, 베이스 및 드럼들로 제한되었으며, 단순화된 거시적 관점의 관점으로부터 제시된다(하위-분류들 및 보다 복잡한 상호-관계들을 갖는 텍스처 디스크립터들보다는). 도 4에서, 기여 파생 음악 구성 요소들은 시스템에 의해 분석되고 코퍼스 내의 개별 음악 섹션으로부터 분석된 유사한 디스크립터들로부터 생성형 작곡(70)으로 도출 또는 어셈블링되고, 그 관계는 화살표들이 있는 선으로 표시된다.
예를 들어, 터치스크린 또는 다른 컴퓨터 인터페이스를 통해 브리핑은 바람직한 실시예들의 처리 시스템에 입력되었다. 브리핑은 음악 섹션 1, 3 및 4에 대한 강도 패턴(62-66)을 규정하지만, 텍스처 연속성을 포함하여 본 명세서에 전체적으로 설명된 바와 같은 본 발명의 모든 관점들로부터 채워져야 하는 음악 섹션 2에 대한 내러티브는 없다.
이 시점에서 텍스처 연속성이라는 후자의 문제만을 다루면서, 바람직한 실시예들의 시스템 인텔리전스는 먼저 "거칠고 따뜻한" 음악 섹션을 어셈블링하는 것을 고려한다. 디스크립터가 있는 해당 전체 텍스처가 없으므로 처리 시스템은 소품 1번곡의 "거친"과 소품 2번곡의 "따뜻한" 구성 요소들을 어셈블링한다. 이것들은 공통된 특징이 없기 때문에 완전히 보완적이다. 텍스처 분류기와 전체 강도가 높기 때문에 특별히 반주들의 수를 줄이는 시스템이 필요 없다. 따라서 다음이 생성된다:
이어지는 음악 섹션의 중간 전환을 무시하고 세 번째 음악 섹션은 "흥미진진하다"고 서술된다. 이 점에서, 소품 2번곡의 음악 섹션 3에서 들어 올릴 수 있는 직접적으로 대응하는 텍스처가 있다. 생성 작품(70)의 음악 섹션 4에서, 소품 1번곡의 음악 섹션 3에서도 대응하는 사전 분석된 "시끄러운" 텍스처가 존재한다. 그러나, 시스템은 음악 섹션들 1과 3 사이의 불특정 공간(80)을 채우고, 생성 작품의 텍스처에 "흥미진진함"을 반영하는 것에서 "시끄러운" 것을 반영하는 것으로 변형하기 위해 적응이 필요하다는 것을 인식한다.
음악 섹션 5는 규정된 텍스처를 갖지 않으며, 따라서 생성형 작곡(70)에 대한 종결점을 나타내거나, 음악 섹션 4를 전체적으로 반복하거나 또는 예를 들어 반주에 변형을 가하여 반복할 수 있는 기회를 나타낸다. 이는 휴리스틱 명령어를 기반으로 하는 시스템 인텔리전스에 의해 실행 가능한 설계 매개변수들이다.
채우기를 다룰 때, 다음 중 하나 또는 적절하고 논리적인 조합을 통해 채우기를 수행할 수 있는 네 가지 대체 프로세스들이 있다:
1. 시작 텍스처의 구성 요소들에서 대상 섹션에 있는 텍스처의 요구되는 구성 요소들로 바뀐다. 이것은 간단한 선형 보간 연습일 수 있으며;
2. 사용자가 규정한 요청된 강도 브리핑을 이행하고;
3. 역사적으로 가장 가까운 작곡들의 코퍼스를 분석하여 Markov 접근 방식을 적용하여 텍스처 분류기들 간의 가능성 또는 허용 가능한 전환들을 식별하며; 그리고
4. 하모니와 같은 특정 원하는 텍스처 분류기 측면에서 선택한 강도를 기준으로 작업한다.
특정되지 않은 음악 섹션들에 대한 선호도들의 사용자 입력의 관점에서, 바람직한 실시예는 하나 이상의 사용자-선택 가능한 텍스처 분류기들에 대한 다이얼-다운 값들을 포함하는 GUI를 포함한다. 따라서 사용자/프로그래머는 직접 충진 또는 적응에 적합한 후보들을 식별하기 위해 비교 분석을 적용하도록 구성된 시스템 인텔리전스를 사용하여 다양한 텍스처 분류기들 간에 상대적 강도 수준들을 설정할 수 있다.
생성형 작곡(70)과 그 텍스처의 요구들을 다시 살펴보면, 음악 섹션3은 소품 2번곡에서 "흥미진진함"에 대한 사전 분석된 텍스트 분류가 포함되어야 하므로, 텍스처 분류가 적합하기 때문에 이러한 정확한 텍스처 구조를 유지하는 것 외에는 선택의 여지가 없다. 첫 번째 문제는 음악 섹션 2의 불특정 중간 희망에 관한 것이다.
일반적으로 이전 섹션의 특징들을 유지하는 것이 바람직하며, "거칠고 따뜻한"에 대해 제시된 텍스처의 강도 수준을 평가하는 것도 관련이 있으며; 이는 모든 텍스처 분류에 걸쳐 악기 구성 요소들의 분포 특성을 감안할 때 거칠고 따뜻한 텍스처에 세 가지 특징들이 포함되어 있기 때문에 상대적으로 높아 보인다.
결과적으로, 휴리스틱은 일반적으로 "흥미진진함" 텍스처로의 변환을 시작하기 위해 변형이 필요하다고 지시하지만, 연속성 관점에서는 소품 2번곡의 "따뜻한"에서 견고하게 연관된 텍스처를 유지하되 순전히 거친 텍스처와 관련된 반주를 줄이는 것이 좋다. 비록 지금은 줄었지만 "거친" 디스크립터의 중요한 음악적 구성 요소들이 남아 있다는 것이 눈에 띈다.
다른 방향으로 이동하기 위해 시스템 인텔리전스는 거친 텍스처에서 베이스와 드럼들의 기여를 유지하거나 최소한 고려할 수 있으며, 여기에는 거친 텍스처의 반주 또는 기능 구성 요소들 중 하나 또는 둘 다를 계속하는 것이 포함된다. 그러나 강도가 잠깐 떨어지는 것을 감안할 때 음악 섹션 1의 반주들을 완전히 이어받는 것은 바람직하지 않다.
그러나 연속적인 각각의 음악 섹션들을 통한 드럼들에서의 기능의 피드-스루는 어느 정도의 텍스처 연속성을 만들어낸다. 요컨대, 시스템 인텔리전스는 강도 변화들을 고려하고 동일한 텍스처 분류에서 분류되는 기능들 간의 충돌을 피하면서 기여하는 악기 구성 요소들을 최대한 많이 유지하는 것으로 보인다.
요약하자면, 다시 말하지만, 처리 시스템과 논리는 음악 섹션 내의 기능들을 간단한 단일 규칙으로 처리한다. 단일 텍스처 분류기 내에서 기능을 실현하는 모든 악기 구성 요소는 동일한 텍스처 분류기의 다른 기능과 직접적으로 충돌하므로 전체 텍스처 공간을 보존하기 위해 음악적 상황을 피해야 한다.
그러나 텍스처 분류기는 원하는 만큼 많은 반주들을 가질 수 있다. 이는 여러 텍스처 요소들을 가질 수 있는 기능을 제공하는 동시에 텍스처에 두드러진 특징을 제공하는 특정 요소가 다른 요소들에 의해 손상되거나 간섭되지 않도록 보장한다. 앞서 언급한 John Powell의 예에서 신디 베이스는 특징으로 분류되고 타악기 일렉트릭 뮤트 베이스와 더블 베이스는 반주로 분류된다.
이 두 가지 보조 항목들은 메인 베이스 부분과 충돌하지 않으며 피처링된 베이스 라인이 있는 이러한 텍스처에 실행 가능 할 수 있게 추가될 수 있으나; 반면에 피처링된 베이스는 피처링된 베이스 파트가 있는 다른 텍스처에 맞지 않다.
텍스처 분류기들에 대한 설명은 다음과 같다:
멜로디
멜로디와 하모니 중 계층적으로 어느 쪽이 더 중요한가에 대한 역설은 수세기 동안 논쟁의 대상이 되어 왔다. 바람직한 실시예의 시스템 인텔리전스는 형식이 코드들의 흐름 및 속도를 통해 생성된다는 입장을 취하지만, 코드, 또는 일련의 코드들의 의미를 멜로디 전달 음들, 및 하모니 대체들을 통해 변경할 수 있으며, 이들 모두는 텍스처 구성 요소들로서 메타-태그될 수 있다.
대부분, 멜로디들은 일반적으로 모두 특징들로 분류되지만, 일부 희소한 멜로디 구성 요소들은 반주 멜로디들로 간주될 수 있다: 즉, 주어진 멜로디에 반대하지 않으며 피처링된 멜로디가 갖는 텍스처 공간을 소비하지 않는다. 베이스 멜로디의 경우 휴리스틱의 범주는 멜로디베이스, 그리고 특징으로 태그가 지정된다. 이렇게 하면 베이스 영역에서 텍스처 충돌이 발생하지 않지만 특정 반주 베이스 구성 요소들이 여전히 텍스처에 삽입될 수 있다.
멜로디로 분류되고 특징으로도 태그가 지정된 텍스처 구성 요소는 주어진 텍스처의 음계나 모드에 특정 변경들을 가져올 수 있다. 예시적인 The Bourne Supremacy의 경우, 영화 전반에 걸쳐 첼로에서 흔히 볼 수 있는 주요 멜로디 특징이 있으며, 평평한 2도의 떨어지는 멜로디 단음계를 중심으로 전개된다.
이 멜로디 구성 요소는 자연 2도를 사용하는 다른 멜로디 구성 요소와 잘 어울리지 않으므로 텍스처와 수반되는 멜로디에 대해 주어진 모드를 변경한다. 주어진 시간에 하나의 피처링된 멜로디 구성 요소만 존재할 수 있기 때문에 다른 어떤 멜로디 기능도 이를 무시할 수 없다.
카운터 멜로디
이 범주의 텍스처 요소는 멜로디와 연결되거나 단순히 멜로디가 놓일 수 있는 시간적 공간 주위에 있는 멜로디 요소일 수 있다. 이는 일반적으로 기타 리프들, 오케스트라 텍스처들의 멜로디 브리징 기능들, 모드와 조성을 강조하지만 강한 멜로디 패턴을 나타내지 않는 멜로디 구성 요소들에 적용된다.
일반적으로 카운터 멜로디는 다른 많은 멜로디들과 함께 연주할 수 있으므로 반주로 표시된다. 그러나 특정 카운터 멜로디가 멜로디와 함께 작동하도록 설계된 경우 멜로디와 상호 작용하는 다른 텍스처 요소들이 방해가 되지 않도록 하는 기능으로 표시될 수 있다.
하모니
하모니 상태들을 위한 기능으로 태그가 지정된 구성 요소는 코드(재즈에서 알려짐) 또는 #11 코드와 같이 여러 확장들이 있는 코드로 작업을 수행한다고 명시한다. 멜로디 구성 요소들과 마찬가지로 하모니 기능들로 표시된 구성 요소들은 서로 간섭하는 것으로 간주되기 때문에 그렇게 표시된다. 주어진 음계를 변경하려는 멜로디 구성 요소와 주어진 코드 내에서 음들을 변경하는 하모니 구성 요소들에 대한 잠재적으로 충돌하는 요청들에 대처하는 방법에 대한 문제는 나중에 논의된다.
베이스
베이스 기능은 베이스 범위의 텍스처 공간을 차지하며, 이는 일렉트릭 또는 신디 베이스 라인의 전형이다. 기능들은 아니지만 반주로 표시된 베이스 구성 요소들은 단순히 코드의 베이스 음들을 차지한다.
음조 리듬
이것은 다른 튜닝된 구성 요소들과 충돌할 수 있는 튜닝된 구성 요소들이 있는 트립 홉 루프와 같이 음조되는 모든 타악기 구성 요소이다. 또한 오케스트라 튜닝된 타악기도 통합한다.
비음조 리듬
이 텍스처 구성 요소는 셰이커, 팀베일, HiHat 패턴 등과 같은 악기들용으로 예약되어 있다. 이 공간의 특징의 예들로는 Rogue One(Edwards, 2016)의 1:17 및 Funeral Pyre(Crowley & Greengrass, 2004) 큐를 통해 많은 현대 영화 음악들에서 들을 수 있는 파워 드럼 패턴들의 유형 또는 다른 유형의 눈에 띄는 비음조 기능이 있다. 이러한 롤링 다이내믹 파워 드럼 모티프들은 튜닝 되지 않은 다른 기능들에 의해 중단되면 텍스처적으로 어려움을 겪을 것이다.
드럼
이는 드럼 키트들에서 나오는 모든 리듬 패턴들을 다룬다. 특징들로 표시된 경우, 다른 동반 패턴들이 종속되는 특정 그루브를 나타내는 드럼 패턴들이다. 특징이 없는 드럼 패턴들은 군용 드럼 패턴들과 같은 보조 구성 요소들로, 그 자체로 의미적인 특성들을 갖지만 그루브의 주요 추력을 방해하지 않는 패턴들이다.
템포 및 박자표의 변화들과 관련하여, 본 발명에 의해 옹호된 접근 방식은 타임라인을 불변으로 만든다. 영화는 초 단위들과 프레임 단위들로 시간에 걸쳐 매핑된다. 그러나, 본 발명의 관련 양태들 내의 실시예들은 악자 상에 더 많거나 더 적은 마디들을 생성하기 위해 템포를 변경하도록 배열된다. 템포가 박자기에 영향을 미치지 않는 다른 시퀀서 소프트웨어(Cubase, Logic Pro, Pro Tools)와 달리, 시스템 인텔리전스의 기능은 제공된 내러티브를 고려하여 주어진 요구 사항에 얼마나 많은 음악 자료가 맞는지 평가한 다음 생성형 작곡에 가장 적합한 솔루션을 생성한다. 타임라인에는 큐 전체에서 다양한 속도들을 허용하고 히트 포인트들에 도달하는 타이밍을 활성화하기 위해 여러 템포 변경들이 있을 수 있다.
섹션 B
I. Heresy 생성형 작곡 시스템의 생성 기능
현재까지 본 발명의 생성형 작곡 시스템을 뒷받침하는 아이디어들을 둘러싼 일반적인 철학적 논의가 있어왔다.
실제로 지금까지는 선호되는 시스템의 계층적 태스크 흐름에 대한 일반적인 설명이 있어왔다. 이제 우리는 본 발명의 양태들의 생성 방법을 드러내기 위해 각각의 수준에서 수행되는 작업들뿐만 아니라 이러한 계층 구조를 상세히 검토한다.
이제 본 발명의 양태들의 Heresy 시스템이 어떻게 구현되고 기능하는지에 대한 포괄적인 원리에 대한 초기 개요가 제공된다. 이 개요는 코드들 작성에서 텍스처들 작성에 이르기까지 다양한 작곡 태스크들이 처리되는 방식에 대한 계층 구조를 설명한다. 둘째, 논리적 태스크들을 처리하기 위한 휴리스틱 메커니즘과 조직 구조가 설명된다. 마지막으로, 구성 요소들 간의 선호 특성들, 기능들 및 상호 작용들과 작곡 생성과 관련된 선호 단계들에 대한 세부 정보가 제공된다.
II. Heresy 시스템 개요
도 5는 Heresy 시스템 내의 다양한 계층적 층위들(100)에 대한 개요를 제시하며, 다수의 상호 보완적이지만 독립적인 발명 양태들을 구현한다. 이러한 층위들은 위에서 아래로 흐른다.
첫째로, 브리핑 요소들(102-106)이 사용자로부터 요청된다. 둘째로, 이 요소들(102-106)은 생성된 요소들(108)과 얽혀서, 생성되려고 하는 음악 작품의 타임라인을 채우는 완전한 요구 사항들의 세트를 생성한다. 여기서부터, 시스템 인텔리전스에 의해 해석되고 적용되는 시스템의 휴리스틱은 텍스처들이 동작하고 함께 연결될 코드 스킴들(110)을 생성할 것이다.
이것은 "Form Atoms"를 사용하는 메커니즘을 통해 달성된다. Form Atom들은 메타 코드 스킴이므로 일관된 코드 스킴이 작성/생성되고 궁극적으로 작곡이 생성되는 원리들이자 시작점이다. 각각은 분석된 음악적 표현의 성질에 의존하는 길이를 갖는 다양한 지속 시간의 음악의 작은 부분(즉, 음악 섹션)이며, 이와 같이 각각은 바람직한 실시예들의 생성형 시스템 내의 빌딩 블록을 나타낸다.
각각의 Form Atom은 기존의 독립적인 작곡들의 라이브러리에서 수동 또는 WHAT을 사용한 컴퓨터 기반의 해석 분석에서 파생되며 향후 작곡 사용을 위해 접근이 가능하고 지표가 주어진 감정적으로 설명된 기록으로 저장된다. 따라서 Form Atom들은 메타 코드 구문 기술어들이다. 각각에는 이전에 분석된 작업에서 저장된 코드들의 작은 부분과 실행 시 저장된 것과 유사한 의미 특성들을 가진 작은 부분들의 변형들을 생성할 수 있는 생성적 휴리스틱의 세트가 있다.
참조 번호들(120-124)과 같은 Form Atom들은, 실행될 때 저장된 코드의 작은 부분(이전에 분석된 작업으로부터 추출된)의 변형들을 생성하여 잘 조직된 형식을 갖는 내러티브 방향 및 목적을 갖는 코드 스킴들(128)을 생성하기 위해 휴리스틱의 생성적 세트를 포함한다. Form Atom들은 맞춤형 구문 메커니즘을 통해 선택되고 함께 연결된다. 이어서 이러한 순차적 코드 스킴들은 텍스처 생성기(130)에 음악을 편성하는 데 사용되는 하모닉 팔레트를 제공하는데 사용된다. Heresy 생성형 작곡 시스템의 최종 출력은 텍스처 생성기 내의 휴리스틱으로부터 생성된 음악(132)이다.
각각의 Form Atom은 내부적으로 그리고 서로에 대해 특정 구문을 갖지만 본질적으로 독립되어 있으며 각각의 Form Atom은 다음과 같은 신호 특성들, 생성 특징들 또는 속성들을 구현하거나 소유한다:
1. 음조와 조성을 모두 갖고 Form Atom의 키 중심인 로컬 으뜸음에 대한 인터벌 거리로 표현되는 로컬 으뜸음의 특정 코드들의 세트;
2. 다음으로 형성된 서술어들:
(a) 질문, 답변 또는 진술 중 하나인 음악적 프레이징 사이의 논리적 작동 선택에 기초한 형식 기능 정의와, 선택적으로, Form Atom이 현재 로컬 으뜸음으로부터 다음 Form Atom에서 새로운 로컬 으뜸음으로의 변경을 허용하는 전조기로서 작동하는지 여부, 전조된 Form Atom 앞의 Form Atom은 다른 으뜸음을 가지며, 전조 또는 전조된 Form Atom (로컬 으뜸음이 Form Atom들의 앞과 뒤에 오는 것과 관련하여 동일하게 유지됨을 의미함) 및 추가 선택적으로 Form Atom이 특정 음악 작품의 시작, 끝에 나타나는지 또는 시작이나 끝에 나타나지 않는지 여부; 및
(b) 시간에 따른 Form Atom 스킴의 악절인 인접한 Form Atom들 사이의 종지적 또는 순차적 진행의 성격을 설정하는 프로그레션 디스크립터;
3. 코드 스킴에서 코드들의 세트 또는 동일한 형식 기능들을 달성하여 유사한 관련 감정적/음악적 의미들을 갖는 동일하거나 다른 으뜸음들의 많은 상이한 코드들의 세트들의 생성을 지원하는 휴리스틱/규칙들의 생성적 세트 및 브리핑 공간을 채우기 위해 주어진 음악 시간 동안 생성된 코드들의 수에 따라 일시적으로 간격을 두는 휴리스틱;
4. Form Atom이 본 명세서에 설명된 휴리스틱에 따라 코드 스킴에서 사용되는 경우 청취자가 경험하는 하나 이상의 현실적으로 감지할 수 있는 감정적 반응(들)을 표현하는 감정적 의미를 지닌 태그된 서술적 연관성으로서, 이러한 서술적 연관성은 음악 요소들에, 예를 들어, 코드들, 코드 타이밍들 및 그들의 으뜸음에 대한 코드 거리들과의 관계들을 제공한다.
이러한 서술적 연관들 또는 "플레이스홀더들"은 임의의 내러티브 브리핑에서 사용되는 용어와의 일관성을 나타내기 위해 라이브러리로부터 취해질 수 있지만, 이는 본 발명의 시스템의 상이한 부분들에서 사용되는 상이한 디스크립터들 사이의 제공되는 연관이 의미론적 공간에서 동등하거나 유사하거나 또는 둘 다 아닌 것으로 해결될 수 있는 경우 이는 요구사항은 아니며; 그리고
5. 음악적 의미가 있고 이웃 Form Atom들과 설명 가능한 관계가 있는 가장 작은 음악 프레이즈; 및 선택적으로
6. 예를 들어, 특정 전주곡들 모음곡 또는 일련의 영화들의 이름을 포함한 보다 구체적인 세부 정보 중에서 예시들로서의 작곡가 이름, 악기 및/또는 장르와 같은 메타 태그들. 이는 브리핑 고려 사항들이 식별되는 경우 작곡의 생성 단계에서 스타일들을 찾기 위해 더 쉽게 참조하게 한다. 이 목록은 브리핑 메커니즘에서 Form Atom을 추가로 개선할 수 있게 한다.
7. Form Atom는 그 중간에 으뜸음을 포함할 수 없다.
Form Atom들은 하모니 구조와 작곡적으로 좋은 형식을 따르는 하모니 구조들을 생성하는 능력을 제공하며, 텍스처를 정의하고 생성형 작곡에서 텍스처 연속성을 유지할 수 있도록 하는 분류된 상태에서 텍스처 구성 요소들의 목록을 저장한다.
따라서 시스템 전체는 작품들의 코퍼스에서 좋은 형식을 음악적으로 작동한 이전 전환들을 식별하는 Markov 체인 연관들을 통해 이전 또는 이후의 Form Atom들의 목록들에 연결된 Form Atom들의 목록들을 생성하고 저장하는 기능들이다.
문제 서술어들로 돌아가서, 질문, 답변 및 진술이라는 용어들의 의미.
질문은 하모니나 멜로디 안에 나타난 음들로 나타난 정신적 안정이 필요한 긴장을 제안하는 코드 스킴이며, Form Atom의 로컬 으뜸음의 키 중심 밖에 있기 때문에 의심스럽게 존재한다. 음악적으로 여러 개의 연속적인 질문들을 할 수 있다.
답변은 로컬 으뜸음 또는 답변하는 Form Atom의 새로운 으뜸음의 키 중심을 강화함으로써 마음의 관점에서 의심스러운 음색(즉, 음조) 또는 음들(즉, 지속 시간이 있는 음조)의 존재를 해결하기 위해 작동하는 질문의 해결이다. 이에 대한 예는 John Williams의 슈퍼맨에 나오는 "The Love Theme"의 오프닝 두 프레이즈들이다.
진술은 음악적 질문으로부터 완전히 독립적이며 해결을 통해 풀어주어야 할 의미 있는 음악적 긴장을 암시하거나 유도하지 않는다. 진술은 질문도 답변도 아니다.
따라서 Form Atom들에 관한 본 발명의 양태들은 코드 스킴 내의 모든 코드들이 로컬 으뜸음, 예를 들어, C의 장음계 및 단음계에 대한 C 또는 Cm에 관계된다는 것을 인식하였다. 더욱이, 코드들의 시퀀스는 코드들 간의 관계들에 대한 이해보다 덜 중요하다. 음계 범위 내에서 MIDI 분리들(즉, 코드 II 단조 = Dm 및 G의 경우 코드 V)의 측면에서 C의 로컬 으뜸음을 가진 Dm과 G 사이의 관계를 알고 있는 경우 이 코드들의 시퀀스는 다른 키 중심에서 반복될 수 있다(예를 들어, 코드 IV 단조 => G의 로컬 으뜸음에서 I).
서술어들은 위에서 언급했듯이 (배타적 OR 함수 XOR에 의해 논리적으로 처리되는 질문, 답변 또는 진술의 표시 외에 최소한으로) 4개의 종지적 진행들(코드들의 시퀀스/변위가 수학적으로 표현할 수 없는 경우) 중 하나 또는 2개의 시퀀스 진행들을 포함해야 한다.
종지적 진행들은 네 가지 대체 형식들 중 하나를 취하며 으뜸음을 변경하는 방법들을 표현한다. 따라서 종지적 진행은 다음 중 하나를 식별하기 위해 처리 중에 논리적으로 XOR될 수 있다.
1. Form Atom의 시작 부분 (Cb)에 나타나는 으뜸음;
2. Form Atom의 끝 (Ce)에 나타나는 으뜸음;
3. Form Atom의 시작과 끝(Ct) 모두에 나타나는 으뜸음; 또는
4. Form Atom에서 으뜸음의 부재 null 외관(Cn).
두 가지 대체 시퀀스 진행들은 종료를 허용하며, 이들은 XOR된 형식들로 제공된다.
1. 인터벌 기반 순차적 진행인 Si, 여기서 코드는 다른 코드와 수학적으로 표현할 수 있는 거리 관계가 뒤따르며; 그리고
2. 조성 기반 순차적 진행인 St는 로컬 으뜸음의 음계와 영원히 반복될 수 있고 로컬 으뜸음의 조성을 기반으로 하는 수학적으로 표현 가능한 관계들을 갖는 코드들의 시퀀스와 관련이 있다.
따라서 종지적 진행들은 Form Atom의 으뜸음의 키 중심과 관련하여 일련의 코드들과 함께 연결된다. 코드들이 서로 선택될 수 있는 옵션들은 이전 작품들의 저장된 모든 분석에서 추출된다. 이것은 본질적으로 Markov 체인을 사용하여 찾은 선택들의 범위이지만 주어진 키 중심과 관련이 있다. 이에 대한 간단한 예는 C 키에서 Dmin 또는 F가 G 7 앞에 올 수 있으므로 으뜸음이 C인 경우 G7의 선행 코드들로 둘 중 하나를 선택할 수 있다는 것이다. 그런 다음 선택된 Dmin 또는 F 코드 앞에 유사한 작업을 수행할 수 있다.
시퀀스 진행들은 Bach의 C 단조 전주곡의 두 번째 섹션, 5에서 14 마디들 (섹션 D 참조)와 같은 Form Atom의 으뜸음의 조성을 기반으로 할 수도 있고, 으뜸음을 완전히 무시하고 단순히 5도권(cycle of 5ths) 또는 단3도 간격으로 장3 화음들의 상승 시퀀스와 같은 주어진 인터벌 시퀀스로 진행될 수 있다.
종지적 패턴의 경우, 으뜸음이 Form Atom 내에 존재한다면, 그것은 우리가 하나의 Form Atom에서 다음 Form Atom에 도달하고 출발할 수 있는 피벗점(pivot point)이라고 할 수 있다. Form Atom은 그 자체의 중간에 으뜸음을 포함할 수 없지만, 이것은 잘 알려진 문화적으로 받아들여지는 프레이즈의 코드 스킴이 두 번째 전위 으뜸음(딸림음으로)에서 으뜸음 진행으로 끝나게 하지 않는다. 오히려, Form Atom들은 위의 종지적 진행 목록에서 강조 표시된 네 가지 방법들 중 하나로 나타나는 으뜸음을 갖는다.
종지적 시퀀스들에 대한 고려 사항은 키를 변경하는 기능이다. 키 변경의 경우, 새로운 으뜸음이 코드들의 체인의 끝에 있으면 다음 아톰까지 으뜸음으로 간주되지 않는 것으로 간단히 명시한다. 이것은 전조(modulation)들이 새로운 으뜸음들의 시퀀스들에 의해 생성된다는 것을 의미한다. Form Atom들과 달리 이러한 으뜸음들의 관계들은 외부 데이터에 상대적이지 않으며; 대신, 감정 태그들을 통해 분류되고 감정 브리핑 메커니즘의 구성 요소를 제공한다. 새로운 으뜸음들은 음악 작품의 어느 지점에서나 나타날 수 있다. 그러나 이 메커니즘 내에서 변경되기 전에 적어도 하나의 Form Atom 시퀀스를 갖게 된다. 이 시퀀스는 로컬 으뜸음의 코드인 하나의 코드일 수 있으며, 이 경우 브리핑 메커니즘에서 이러한 변경들이 너무 빈번하지 않도록 주의를 기울여야 하며, 그렇지 않으면 일련의 무작위 코드들이 부적절하게 생성될 수 있다.
시퀀스 진행들의 경우, 두 가지 가능성들이 있다: i) 코드 스킴이 으뜸음과 관련이 있거나, ii) 이를 무시하는 규칙적인 코드들의 시퀀스이다. 두 경우들 모두 어느 시점에서 시퀀스를 끊어야 한다. 이것은 이스케이프 코드에 의해 수행된다. 이스케이프 코드들은 로컬 으뜸음과는 관계없이 바로 앞에 오는 코드들과 관련이 있다. 그것들은 시퀀스를 중단하고 다음 Form Atom에 대한 연결을 설정하는 데 사용된다. 결과적으로, 이스케이프 코드들은 일반적으로 키 중심에 변화를 일으킨다.
Form Atoms가 일련의 음악 작품들로부터 분석되고(이에 따라 도출되고) 프로그레션 디스크립터들에 의해서 레이블이 지정되면, Form Atoms는 직스 피스(jigsaw piece)처럼 스트링될 수 있다. 다른 것과 동일한 프로그레션 디스크립터를 가진 모든 Form Atom은 상호 교환적으로 대체될 수 있다. 따라서 마르코프 체인의 원리를 사용하여 일련의 Form Atom 상호 관계들을 생성할 수 있다: 임의의 Form Atom과 그 앞이나 뒤에 오는 것들 사이의 관계는 서술어들뿐만 아니라 프로그레션 디스크립터들을 살펴봄으로써 설정된다. 이것이 도 6에 반영되어 있으며, 이 도면에서는 Form Atom 간의 관계 및 그 결과로 생성된 마르코프 체인(602)이 식별된 감정적 의미에 대한 코드 전환을 지원할 수 있는 형식-실행 가능한 연결 Form Atom들의 식별로부터 발생하는 허용 가능한 코드 스킴 구성을 갖는다. 예를 들어, 도 6의 체인들을 생성한 제한된 코퍼스에서는, 코드 V로부터 코드 I 또는 코드 IV로의 전환은 허용되지만, 코드 IIm으로의 전환은 (a) 코퍼스에 확립된 경로가 없고 (b) 코드 V와 IIm의 감정적 의미들 사이에 [암시적으로] 공통된 디스크립터가 없기 때문에 허용되지 않다. 도 6의 경우, 실제로 코드 IIm에 대한 확립/인식된 관계가 없다(도 6이 매우 단순화된 도면임을 인식할 때). 코드 IV를 목적지로 한 Form Atom 전환은 코드 IIIm 및 V에서 이루어지며 이후 코드 I 또는 코드 V로의 허용 가능한 전환들이 도 6에 나와 있다. 이러한 모든 전환들은 자동화된 MIR(music information retrieval) 기술들을 사용하거나 음악 전문가가 수동으로 코딩하는 것에 의해 음악의 과거 코퍼스에 대한 비판적 분석을 통해 추출되었다.
결과적으로, Form Atom x가 그 뒤에 Form Atom y가 뒤따르게 되는 코퍼스 내의 예를 가지고 있다면, y와 동일한 디스크립터를 가진 임의의 Form Atom이 x 뒤에 올 수 있다. 이것은 일시적으로 임의의 방향으로 작동할 수 있으며, 따라서 동일한 기술을 사용하여 Form Atom들 앞에 올 수도 있다. 마지막으로, 사용되고 있는 임의의 Form Atom의 가중치들은 코퍼스에서 발견되는 발생 횟수를 기반으로 하며; 이것은 새로운 작곡 내에서 특정 Form Atom을 선택하고 사용할 확률을 제공한다.
전조는 두 개의 키 중심들 사이의 대비를 제공하여 시간에 따른 구조를 제공하는 데 필요하다. 이를 통해 브리핑과 일치하는 휴리스틱을 적용하여 음색 여정을 따라 생성형 작곡을 이동할 수 있다. Form Atom 내에 존재하는 전조기 Mor은 Form Atom의 끝에서 새로운 키 중심으로의 명확한 전환이 있음을 확인한다. Form Atom이 전조된 Med, Form Atom인 경우, 과거 분석(historical analysis)은 전조된 Form Atom의 인스턴스화시에, 키가 변경되었음을 확인했다. 따라서 전조된 Form Atom은 페이스에 변화가 있거나 영화 장면의 내러티브가 변경되어야 하는 경우와 같이, 주변 환경과 컨텍스트에서 감정적으로 중요한 지각 가능한 변화를 강조한다. 전조기 Mor 또는 전조된 Med Form Atom은 따라서 배타적이며, 즉 OR형 논리 함수이다.
임의의 주어진 Form Atom은 질문, 답변 및 진술의 것들을 제외하고는 동시에 다수의 형식 태그들을 가질 수 있으며, 이 아톰은 한 번에 이들 중 하나만 가질 수 있다.
결과적으로 그리고 잠재적으로 서술어 조합들에 대한 6x3x4x3=216개의 별도 목록들이 존재한다. 목록들의 수는 목록들을 조합하거나 하나 이상의 선택적 형식 함수 서술어들을 무시하는 것에 의해 줄일 수 있다. 각 서술어 목록은, 위에서로부터, 시스템 인텔리전스에 대한 브리핑 내러티브 입력(예를 들어, 사용자 인터페이스를 통해) 및 더 나아가 각 텍스처와 링크된 시맨틱 디스크립터(들)에 연결될 수 있는 실제 감정적 경험, 느낌 또는 감정적 의미를 정의하는 이들 각각의 콘텐츠에 링크된 컨텍스추얼 디스크립터(contextual descriptor)들을 포함하는 Form Atom들로 채워진다.
도 7은 실시예들의 다양한 양태들 및 조합들에 의해 달성되는 생성형 작곡을 위한 메커니즘의 개요를 제공하며, 임의의 조합의 범위 및 깊이는 단지 정교성, 구현 복잡성 및/또는 최종적으로 출력되는 생성 신호의 달성에 대한 수준만을 변화시킨다. 보다 구체적으로, 도 7은 휴리스틱이 논리적으로 구성되고 처리되는 방식을 개략적으로 보여준다.
휴리스틱이 본 발명의 개념들에 따라 수행하는 태스크와는 별개로, 도 7은 이들을 조직화하는 휴리스틱 메커니즘에 필요한 어포던스를 나타내며; 다음과 같은 사항들을 차례로 고려해 보도록 한다:
1. 휴리스틱을 처리하는 방식에 대한 순서가 지정된 방법이 존재한다. 도 7에는 태스크 및 그 후의 후속 서브-태스크들에 첨부된 번호들에 따르는 것에 의하는 것이 나와 있다.
2. 태스크가 수행될 전체 백분율 가능성이 존재한다. 이것은 태스크 박스의 맨 앞에 백분율로 표시된다.
3. 서브태스크들에 대한 분기 메커니즘이 존재한다. 서브-태스크들이 처리될 백분율 가능성이 각 분기를 수행할 확률에 대한 가중치 메커니즘으로서 사용된다.
4. 분기 메커니즘에는 모든 서브 태스크 또는 하나의 서브태스크만 처리할 수 있는 논리 연산자가 존재한다. 논리 연산자(AND 또는 XOR)에 따라, 서브태스크들 중 하나 또는 전부를 처리한다. 도 7에서, 태스크 7은 태스크 6에서 분기되는 XOR에 종속되므로, 태스크 7은 태스크 6에 부착된 서브-태스크들 중 하나에 의해 수행된다. 이러한 서브-서브태스크들 중 하나는 처리될 가능성이 25%이고, 다른 것은 처리될 가능성이 75%이다.
5. 태스크가 null로 되어, 추가 서브태스크들에 대해서만 분기를 제공할 수 있는 능력이 존재하며; 이에 대한 일 예를 도 7의 프로세스 6에서 볼 수 있다.
본 발명의 생성형 작곡 시스템은, 주로, 코드를 실행하는 맞춤형 전문가 시스템에 기초한 소프트웨어 구현 시스템이다. 따라서, 이해될 시스템은, 하나 이상의 프로세서들을 포함한다. 이 시스템 인텔리전스는 메모리에 저장된 코드를 호출하고, 데이터베이스 또는 다른 메모리 스토리지와 같은 스토리지에서 데이터를 검색, 조작 및 반환한다. 데이터베이스는 전문가 시스템에 로컬일 수 있지만, 동등하게는 넓은 영역 또는 로컬 영역 네트워크 및 적절한 네트워크 연결을 통해 원격으로 위치되고 액세스될 수도 있다. 동등하게는, 사용자 인터페이스는 재생 가능한 미디어 제품으로서의 저장(하나 이상의 데이터베이스에), 조작 및/또는 출력(스트리밍되는 것이든, 다운로딩되는 것이든, 임프린팅되는 것이든 상관없이)을 이유로 시스템의 임의의 논리적으로 적절한 부분에 데이터 및 미디어 콘텐츠를 업로드, 다운로드 및/또는 스트리밍할 수 있는 능력을 제공하는 컴퓨터 또는 다른 클라이언트 장치일 수 있으며, 인터랙티브 게임을 위한 맞춤형 사용자 중심 및/또는 사용자 선택 사운드트랙을 포함하되 이에 한정되지 않는다. 요컨대, 기초가 되는 시스템 아키텍처가 잘 알려져 있지만, 처리 및 생성형 작곡 효율성에 대한 접근 방식은 특성 및 품질을 개선한 조작된 오디오 신호 데이터(그 자체의 목적과 용도를 위해 영화 브리핑과 일치되는 여부)를 생성한다. 이 시스템은 특히 오디오 작곡의 컨텍스트에서 오디오 신호 처리 분야에서 상당한 발전을 제공한다.
Heresy의 작곡 결과물은 생성형 메커니즘에 대한 두 가지 요구 사항을 추출할 수 있는 이 브리핑 메커니즘으로부터 도출된다(예를 들어, NLP 또는 선택적으로 정의 가능한 타임라인과 관련하여 제기된 특정 질문에 대한 보다 구조화된 응답들에 의해). 두 가지 요구 사항은 다음과 같다:
1. 메커니즘은 음악적으로 숙련되지 않은 개인에 의해 브리핑될 수 있어야 하며;
2. 이 브리핑에는 커미셔너가 작곡의 특정 지점에서 원하는 의미들에 대한 정보가 포함될 수 있어야 한다.
이러한 요구 사항들을 충족하기 위해 시스템, 특히 시스템 인텔리전스는 숙련된 음악적 입력 없이도 음악적 결과물을 생성할 수 있어야 하며, 동시에 감정적 의미들과 관련된 입력에 응답할 수 있어야 한다. 이것은 계층적 생성형 메커니즘(100)을 통해 달성되며, 여기서 코드 스킴들, 텍스처들 및 멜로디들은 브리핑 요구 사항들과 관련하여 생성된다. 이 메커니즘이 도 8에 나와 있으며, 주어진 브리핑으로부터 작곡을 생성하기 위한 세 가지 주요 방법 단계들(그리고 데이터 관리 및 데이터 처리를 포함하는 내부 처리)을 보여준다. 단계들은 다음과 같다:
1. 102개의 Form Atom들을 생성하는 단계,
2. 104개의 코드 스킴들을 생성하는 단계 - 이 구성 요소는 관련이 있고 브리핑 요구 사항들을 충족하는 코드들의 스트링들을 생성한다. 그 이유는 이들이 관련된 Form Atom들의 생성 휴리스틱으로 만들어지기 때문이다.
3. 106개의 텍스처들을 생성하는 단계 - 이 구성 요소는 생성된 코드 스킴들 및 브리핑 요구 사항들을 기반으로 악기용 음악 자료들을 생성한다.
본 시스템은 데이터베이스(110)에 저장된 음악 코퍼스(또는 적어도 그 일부)에 대한 분석을 수행한다. 이로 인해 과거에 저장된 음악이 Form Atom들로 분해되며, 각각 Form Atom에 링크된 전술한 서술어들(또는 그 서브세트)과 감정 디스크립터들의 관점에서 분류되어 해당 Form Atom의 관련 감정적 의미를 반영한다. Form Atom들은 장르 정보 및 작곡가(두 가지 예시적인 범주의 명칭)와 같은, 보조 메타데이터를 가질 수 있다. 분석 및 분류/범주화는 수동적일 수 있고, 예를 들어, 각 Form Atom의 시작점 및 끝점 뿐만 아니라 Form Atom의 다른 특성들 및 특징들(서술어의 관점에서 본 명세서에서 논의된 바와 같이)을 식별하기 위해 음악의 정보에 입각한 구문 분석을 수행하는 음악 전문가에 의해 수행될 수 있거나, 그렇지 않으면 분류 및 평가는 서술어들을 대표하는 추출된 파일 특성들에 의미가 있는 콘텐츠를 가져올 수 있는 트레이닝된 AI/신경망의 사용을 기반으로 하여 전체적으로 또는 부분적으로 이루어질 수 있다. 이러한 AI 시스템들은, 예를 들어, 미국 2020-0320398 "Method of Training a Neural Network to Reflect Emotional Perception and Related System anDmethod for Categorizing and Finding Associated Content" 및 관련 AI 기술에 대한 다른 특허들에 설명되어 있다.
도 8 내에 있는 흐름 프로세스는 사용자 브리핑(114)이 또한 작품 파일에 영향을 미칠 수 있음을 나타낸다. 여기까지는, 작품 파일이 단순히 전체 데이터베이스일 수 있지만, 특정 장르의 작품(예를 들어, 재즈) 또는 특정 작곡가(예를 들어, 바흐) 및 아티스트(예를 들어, 핑크 플로이드)에 대한 요구 사항들을 반영하는 서브세트로 됨으로써, 작품 파일 생성에 사용될 수 있다. 이렇게 하면 후행 및 선행 코드 트리들 또는 Form Atom 트리들을 생성하는 복잡성이 줄어든다.
마르코프 체인 접근 방식을 사용하여, 작품 파일로 도시된 각 Form Atom으로부터 앞뒤로 확장되는 연결들이 확립되고 매핑된다(112). 본질적으로, 이 트리는 이전에 분석된 음악 작품들에서 Form Atom들 사이의 기존 허용 경로들/전환들을 식별하게 한다. 그 후에 이 프로세스는 브리핑과 일치하는 특정 Form Atom들의 생성으로 정제되며, 여기서는 각 Form Atom과 관련된 감정적 의미들이 브리핑 요구 사항들에 대해 시스템 인텔리전스에 의해 해결됨으로써 음악적으로 감정적으로 관련성이 있고 기초가 되는 음악적 특성들의 관점에서 밀접한 관련이 있는 관련 Form Atom들을 선택한다. 트리들의 형성과, 실제, Form Atom의 레퍼런스와 규정된 사용자 브리핑 사이의 감정적 의미의 정렬이 일반적으로 도 6에 반영되어 있다. 요컨대, 실행 가능한 상호 관계 전환들이 이 트리들 및 후속 작곡 프로세스에서 사용하기 위해 저장된 것들에서 식별된다. 다시 말하지만, 마르코프 체인들은 브리핑의 요구 사항들(예를 들어 시작 및 중지 시간이 규정된 마디(bar)의 장면에 대한 울퉁불통하고 육중한 바위의 필요성)과 관련되어 있으므로, 관련 Form Atom들 간의 관계들이 브리핑과 일치되고 작곡 경로를 따라 전환들을 위한 작곡 옵션들을 제공한다.
시스템에 입력되는 브리핑(114)에 기초하여, 시스템 인텔리전스는 작품 파일(또는 보다 광범위한 데이터베이스)에 있는 Form Atom들(117)로부터 개방 Form Atom(118)을 선택하게 되며, 이 Form Atom은 브리핑의 시스템 해석된 요구 사항들에 대응한다. 브리핑을 다시 참조하면, Form Atom 스트링의 생성이 수행되며(118), 이 스트링은 오디오의 중단을 포함하지 않는 엔드-투-엔드 작곡을 제공하기 위해 자동으로 채워져야 하는 공백 피리어드(blank period)들을 포함할 수 있다. 그 후에, 이 프로세스는 코드 스킴 생성(104)으로 이동한다.
실행 가능한 입력을 허용하는 브리핑 도구의 관점에서, 이러한 도구에 대한 일반적인 요구 사항은 시간에 따라 페이스를 매핑하는 능력, 즉 박자기(musical time ruler)이다. 바람직하게는, 이것은 템포 및 박자표 변경들을 통해 적응할 수 있어야 하며, 다음을 식별할 수 있을 만큼 충분히 수용 가능해야 한다:
1. 히트 포인트들;
2. 지속되는 특징들;
3. 담론 선택;
4. 다음을 포함하는 코드 스킴 요구 사항들
(a) 작곡 페이스: 시간 경과에 따른 코드들, 전조들, 조성 변화들,
(b) 감정적 의미들(베이스 페달, 5도권, 무드 태그들) 및
(c) 형식 기능; 및
5. 텍스처 요구 사항들.
브리핑 채움은 제약 조건 만족 메커니즘이며, 일반 알고리즘 또는 고려 및 권장 사항을 포함하는 보다 수고스러운 기반으로 달성될 수 있다. 채움 삽입 프로세스는 브리핑 메커니즘을 통해 Form Atom 요구 사항 목록을 사용하여 타임라인의 어느 지점에서나 Form Atom을 지정할 수 있기 때문에 발생한다. 이 목록에는 반드시 테셀레이션되지는 않으며, 이에 따라 그들 사이에 갭을 남기게 되는 일련의 Form Atom들이 포함될 가능성이 높다. 제약 조건-만족 메커니즘이 동작하여 목록 내의 갭들을 채우게 되며, 이것은 휴리스틱을 통해 실행되는 것이 바람직하다. 이를 통해 Form Atom들에 요청되는 가장 인기 있는 매개변수들을 국부적으로 처리할 수 있다. 그 후에 본 시스템은 이러한 매개변수들을 가진 아톰들로 갭들을 채우게 된다. 따라서 이러한 시스템 중심의 수정 또는 해석에 대한 요구 사항은 공급되는 브리핑의 확장성에 따라 달라진다. 갭 채움은 일반적으로 다음을 고려하여 처리하거나 보상한다:
1. 큐의 각 템포 변경 내에서 마디당 평균 길이 및 평균 코드 수.
2. 값들을 가진 요청 매개변수들과의 갭들.
3. 최종 아톰의 절단 및 적합성을 달성하기 위한 적절한 조정 매개변수들.
4. 주어진 템포 섹션 내에서 마디당 평균 코드 밀도, 특히 주어진 템포 섹션 내에서 마디당 평균 코드 수에 가장 가까운 수를 반영하기 위해 각 아톰에 코드 밀도가 설정되도록 한다.
브리핑된 섹션들에는 일반적으로 사용자가 감정적 의미들, 형식 기능들 및 메타-태그들의 형식으로 요청한 특성들이 있다. 옵션들의 목록을 개선하기 위해, 형식 기능들, 감정 기능들, 메타-태그들의 순서로 우선 순위를 지정한다. 먼저, 목록에 필요한 형식 기능이 있는 항목 또는 항목들이 포함된 경우, 적절한 형식 기능 태그들이 없는 목록 내 다른 모든 항목들을 제거한다. 그 다음 감정적 의미들에 대해, 그리고 마지막으로 메타-데이터에 대해 이것을 반복한다. 그 다음 일반적으로 가장 많은 수의 태그들을 충족하는 옵션을 선택한다.
아직 추상화 수준에 있지만, 코드 스킴들의 체인에는 코드들 사이의 위치 타이밍을 포함하는, 작곡의 하모닉 맵에 필요한 모든 정보가 포함되어 있다. 이 정보로부터, 임의의 주어진 시점에서 관련 음표들을 생성하고, 하모닉 부분 및 멜로디 부분과 같은 텍스처 요소들에 이들을 적용할 수가 있다.
브리핑(114)로부터, 으뜸음(120)이 선택되며, 이것은 일차/우선 음색 및 이용 가능한 코드들을 제공한다(으뜸음 음조 및 조성(1220)이 I와 VII 사이의 음표 변위로 표현된다(그리고 이것은 음도에 대한 전체 음표들로부터의 작은 오프셋들을 포함한다)). 브리핑과 관련하여, 코드 스킴이 생성되며(124), 코드 스킴 트레인(126)이 저장된다.
다시, 브리핑을 참조하면, 텍스처 생성이, 어셈블링된 코드 스킴 체인들에서 Form Atom들의 감정적 의미들 사이의 브리핑 및 디스크립터 대응성 또는 유사성에 관한 관련 텍스처 그룹 파일들의 추출(132)에 따라 적용된다. 따라서 텍스처 코드 스킴의 기록(134)을 통해 경우에 따라 오디오 방송 또는 저장을 위해 시퀀서로 전송될 수 있는(138) 작곡의 생성을 유도하게 된다.
Form Atom들의 문제로 돌아가서 이와 관련된 이점들을 자세히 살펴본 후에 본 발명자는 하모닉 컨텍스트가 작곡적으로 이루어지는 선택들의 원동력(driving force)이라는 것을 깨달았다. 이로부터, 주어진 코드와 이를 뒤따르는 다른 코드의 수용 가능성은 이웃하는 코드들에 의해 생성된 하모닉 컨텍스트와 이들의 공통 으뜸음과의 관계에 따라 달라지며, 이것은 마음의 인식과 신체적 만족으로 나타난다. 계층적으로, 코드들은 이웃들에 종속되어 있지만, 인접한 코드들의 시퀀스들도 서로 관련된 독립적인 엔티티들일 필요가 있다. 따라서, 이러한 사실에 따라, 해당 시퀀스들은 예를 들면 다음과 같은 그들의 공통된 하모닉 특성들에 따라 대안적인 시퀀스들로 대체될 수 있다: 이들이 으뜸음에 대한 인식 가능한 종지로 끝나는가?, 그들이 처음에 으뜸음을 특징으로 하는가, 아니면 어쩌면 마지막에 으뜸음을 특징으로 하는가? 본 발명의 컨텍스트 내에서, 특정 코드 스킴들을 요약하는 것은 임의의 주어진 분석 시퀀스에 대한 코드들을 생성할 수 있을 뿐만 아니라, 그 자리에 유사하거나 상이한 길이의 다양한 코드 시퀀스들을 생성하는 로직을 갖는 휴리스틱의 생성을 통해 회피되며 - 시퀀스들이 몇몇 특정 코드들을 통해 연결되는 방식에 대한 임의의 규칙들이 시스템의 코드 선택들을 제한할 수 있는 반면, 이것은 시퀀스들 전반에 걸친 사운드 작곡의 흐름을 보장한다.
시퀀스들은 으뜸음의 생성과 관련된 규칙들을 통해 기술되고 분류된다. 지각적으로, 이들은 음악적 프레이즈와 유사한 길이로 보이지만, 그렇지 않을 수도 있다. 이 작은 시퀀스들이 앞서 설명한 Form Atom들이다. 이들은 청취자에게 여전히 음악적 의미를 부여하면서 독립적인 시퀀스로 작동할 수 있는 가능한 가장 작은 빌딩 블록이다. Form Atom들은 특정한 특성들을 가지고 있으며, 유사한 특성들을 가진 Form Atom들은 서로 대체될 수 있다. 따라서 본 발명의 일 양태는 Form Atom의 특성들 및 구성 부분들뿐만 아니라 Form Atom들이 결합될 수 있는 메커니즘을 정의한다.
프로그레션 디스크립터들이 잠재적인 코드 시퀀스들의 생성에 대한 완전한 자유를 갖게 된다면, 이로 인해 작품들은 기준에 맞지만 코드들이 완전히 이어질 수 있는 작품들의 중간에서 나오는 휴리스틱에 의해 생성되는 진행들로 시작하고 끝나게 된다. 이것은 일반적으로 독립적인 내러티브를 일시적으로 전달하려는 음악 작품의 좋은 결말이나 시작이 되게 하지 않는다. 시작 또는 끝 태그가 있는 Form Atom들은 이들의 휴리스틱이 이러한 설정에 적합하다는 것을 의미한다.
앞서 언급한 바와 같이, 질문 및 답변 태그들은 다른 중요한 고려 사항, 즉 현재 로컬 Form Atom 키 중심 외부의 코드들을 포함하는 코드 시퀀스들의 문제로부터 나온다. 예를 들어 John William의 슈퍼맨(Spengler & Donner, 1978) 악보에 나오는 사랑 테마가 있는데, 이 테마의 설명(exposition)에는 다음과 같은 코드 시퀀스가 수반된다:
Eb => F/Eb (또는 Eb #11 13) => Ab/Eb => Eb
이 예를 살펴보면, 이 코드 스킴을 독립적인 단위로 유지하거나, 또는 질문과 답변인 두 개의 Form Atom으로 나눈 결과들을 조사할 수 있다.
코드 스킴이 그대로 유지될 경우, 수집되는 정보는 다음과 같다.
1. Eb 코드 다음에는 F/Eb 코드가 뒤따를 수 있고,
2. F/Eb 코드 다음에는 Ab/Eb 코드가 뒤따를 수 있고,
3. Ab/Eb 코드 다음에는 Eb 코드가 뒤따를 수 있으며, 또한
4. 이 코드 스킴은 로컬 으뜸음에서 시작하고 끝나는 임의의 다른 코드 스킴을 위해 대체될 수 있다.
그러나, 이와 대조적으로, 본 바람직한 실시예의 접근 방식은 이러한 코드 스킴이 질문 및 답변인 것을 고려하며, 이것은 위의 1 내지 3 포인트들에 있는 모든 코드 정보를 완전히 이해하는 것이 가능하고 실행 가능하다는 것을 의미한다. 본 명세서에 기술된 발명적 접근 방식으로부터, 시작에 으뜸음이 있지만 끝에는 으뜸음이 없는 질문 프레이즈가 끝에 으뜸음을 갖는 답변 프레이즈에 결합될 수 있다. 이를 통해 이 코드 시퀀스를 더 작은 대체 가능한 조각들로 나누고, 이러한 조각들을 변경함으로써 흥미를 유발할 수 있다. 이 슈퍼맨 예를 두 개의 Form Atom들로 나누는 것을 통해, 이 그래뉼래러티는 {a, b, a, c}를 나타내는 일련의 Form Atom들의 구성을 허용할 수 있다. 이것은 실제로 원본 작품이 수행하는 것이다. 이 예를 다음 두 개의 Form Atom들을 보는 것으로 확장하면, 질문이 원래 악보에서 반복되지만, 답변은 다른 새로운 관심을 불러일으킨다:
Eb => F/Eb => Ab/Eb => Eb => Eb => F/Eb => Abm => Bb7sus4
요약하자면, 이 초기 4마디 프레이즈는 분명히 시작과 끝에서 으뜸음과 함께 종지적 코드 스킴으로 표현될 수 있지만, 이것은 생성을 위한 일련의 기회들을 놓치게 될 것이다. 이렇게 하면 코드들이 주어진 로컬 으뜸음 키 중심에서 나와야 한다는 규칙이 만들어진다. 코드가 주어진 음계에서 기본 음표를 변경하는 경우, Form Atom을 이 새로운 코드 또는 코드들의 스트링을 끝이나 시작에 넣는 크기로 나눈다. 그러면 이를 통해 이 코드에서 새로 암시된 키로 피벗하거나 또는 진행 중인 나머지 코드들을 통해 로컬 으뜸음으로 돌아갈 수 있는 능력을 제공한다. 제 1 Form Atom에는 형식 함수 질문 태그를 지정하고, 제 2 Form Atom에는 답변 태그를 지정한다. 이러한 분류 프로세스는 양호한 형식을 만족하는 작곡 구조의 변화에 대한 더 큰 기회들을 열어주기 때문에 생성형 작곡에 중요하다.
Form Atom 내에서, 바람직한 실시예는 코드 정보의 두 조각들, 즉 코드 타입 및 코드의 베이스를 저장한다. 일 예로는 Fm7/Bb가 될 수 있다. 이들의 구체적인 타이밍은 브리핑 요구 사항에 따라 아톰의 휴리스틱에 의해 생성되는 코드가 더 많거나 적을 수 있기 때문에, 관련이 없다. Form Atom 내에 이러한 코드들을 저장하는 데에는 두 가지 이유가 있다. 첫째, 아톰의 코드 생성 휴리스틱을 디버깅하기 위한 것이다(휴리스틱이 무엇을 기반으로 하는지 아는 것이 중요하기 때문이다). 둘째, 코드 스킴 생성기가 코드들이 서로 앞서거나 뒤에 오는 코드 트리들의 세트를 얻을 수 있다.
Form Atom 휴리스틱
Form Atom에 의해 사용되는 두 가지 세트의 휴리스틱이 존재한다. 첫째, 요청된 수의 코드들을 생성하는 세트가 있다. 둘째, 임의의 주어진 시간 프레임에 걸쳐 임의의 주어진 수의 코드들의 간격을 두는 세트가 있다. 제 1 세트의 경우, 예를 들어 5도권(cycle of 5ths), 또는 단3도 간격으로 상승 3화음의 시퀀스를 생성하게 된다. 이전에 분석된 작품들로부터 도출된 마르코프 코드 체인들, III-VI-II-V-I 진행 또는 VI-VII-III-VI-II-V-I 진행과 같은 이차적 딸림음 재즈 진행, 또는 모두 장3도 떨어져 있는 일련의 하강 장3화음과 같이 단일 정수 차이로 분리된 일련의 코드들을 포함하는, 음악 전문가가 이해할 수 있는 다른 많은 것들이 존재한다. 제 2 세트의 경우, 코드들이 간격을 두는 방식으로부터 생성된 특정 효과가 있을 수 있다. 예를 들어, 영화 아마겟돈(Bruckheimer & Bay, 1998)에서 사용된 ZZ Top의 노래 "La Grange"의 중앙 코드 스킴에서는, 가능한 한 오랫동안 으뜸음을 유지한 다음 진행중인 다른 두 코드를 프레이즈의 마지막 마디의 세 번째와 네 번째 비트에 각각 배치하여 강조하려는 분명한 의도가 있다. 이 공통된 I => bIII => IV Form Atom은 Ziggy Marley의 "Dragonfly", David Bowie의 "Starman", 비틀즈의 "Back In The USSR"과 같은 다른 노래에서도 많은 대체 타이밍들을 가지고 있다. 이러한 모든 대체 타이밍들은 서로 다른 감정적 의미를 가지고 있다. 이것은 코드-간격 휴리스틱의 중요성, Form Atom에 감정적 의미의 적절하고 관련성 있는 디스크립터를 적용하는 것의 중요성 및 이들이 주어진 Form Atom의 퍼스널리티에 가져오는 타이밍의 고유성을 강조한다.
Form Atom들의 생성에는, 두 가지 서브-태스크, 즉 분석된 작곡들을 살펴보고 나서 앞뒤로 가리키는 Form Atom 트리들을 생성하는 코드 트리들의 생성과, 의사 결정 프로세스에 영향을 미치는 브리핑 요구 사항들을 고려하여 주어진 코드 트리들로부터 Form Atom들의 실행 가능한 경로를 선택하는 Form Atom들의 생성이 있다는 점을 다시 한 번 강조한다. Form Atom 트리들은 브리핑 내러티브에서 제공되는 다양한 수준의 입력 세부 정보를 처리하기 위해 앞뒤 경로들 모두의 측면에서 형성된다. 하나의 트리에는 생성 중인 것을 따를 수 있는 Form Atom들에 대한 옵션들이 포함되어 있는 반면, 다른 트리에는 그 앞에 올 수 있는 Form Atom들에 대한 옵션들이 포함되어 있다. 둘 다 일반적으로 다수의 분기를 가지며, 둘 다 예를 들어 일련의 종지들이 의미가 있는지 여부와 같은 측면에서 식별된 음악적 진행을 반영한다. 이것은 정량적 평가에 기반한 정성적 결정이다.
분석된 작품의 모든 Form Atom들을 반복할 경우, 형식 함수들 및 프로그레션 디스크립터들에 대해 동일한 메타-태그를 가진 Form Atom들이 동일한 목록에 배치된다. 이 아톰의 앞과 뒤의 각각의 아톰은 해당 목록의 앞뒤에 대한 각각의 옵션 목록으로 이동한다. 그 후에, Form Atom이 생성되면, 이러한 목록들로부터의 선택에 의해서 이웃하는 아톰이 생성된다. 이를 통해 코히어런트한 음악적 의미를 만들 수 있는 작곡의 코드 스킴에 대한 메타 구조를 생성할 수 있다.
도 9는 단일 작곡이 일련의 트리들로 구문 분석되는 방식과 목록들에서 생성된 주어진 아톰에 대해 선택될 수 있는 선행 및 후행 옵션들을 보여준다. 끝 및 시작 형식 함수들이 Form Atom들의 목록에 영향을 미치지 않지만, 다른 모든 범주들이 고려된다. 6개의 서로 다른 프로그레션 디스크립터와 3개의 서로 다른 세트의 형식 함수들이 주어지면, 모든 조합을 반영할 수 있는 예시적인 216개의 가능한 목록들의 수가 제공된다.
코드 스킴들
Form Atom들의 저장소를 구비한, 생성형 작곡 프로세스는 코드 스킴 생성 단계로 이동한다. 코드 스킴들은, 이름에서 알 수 있듯이, 본 명세서에서 설명된 바와 같은, 서술어들을 기반으로 하는 음악적 특성들을 갖는 Form Atom들로부터 형성되는 코드들의 그룹핑/연결이다.
코드 스킴들을 함께 체이닝(chaining)하여 생성형 작곡에 대한 하모닉 맵을 제공한다. 이러한 하모닉 맵이 사용 가능한 경우에만 작곡 단계로 넘어갈 수 있으며, 이 제 3 단계에서 음표들이 실제로 생성되고 브리핑 요구 사항들을 반영하기 위해 텍스처가 적용된다.
각 코드 스킴에 대한 요구 사항들은 요구 사항 목록에서 가져온다. 요구 사항 목록의 모든 항목에 대해 Form Atom을 생성한 후에는, 요구 사항 목록의 특성들과 함께 Form Atom들의 휴리스틱을 사용하여 코드 스킴들을 생성한다. 코드 스킴은 다음과 같은 특성들로 구성된다:
1. 으뜸음 - 이것은 코드 스킴의 로컬 컨텍스트에 대한 으뜸음이다. 이것은 이전 코드 스킴의 새로운 으뜸음 특성으로부터 설정되거나, 또는 이것이 첫 번째 코드 스킴인 경우, 작품의 으뜸음으로부터 설정된다.
2. 새로운 으뜸음 - 코드 스킴이 전조되는 경우, 이것은 설정된 새로운 키이며, 다음 코드 스킴의 로컬 으뜸음으로 된다.
3. 코드 목록 - 이것은 다음 특성들을 통해 표현되는 코드 목록이다:
(a) 음조 - 이것은 코드의 근이다.
(b) 베이스 - 이것은 코드가 끝났음을 나타내는 베이스 음표이다.
(c) 코드 타입 - 이것은 코드 타입을 제공한다. 타입들은 나중에 음표들을 선택할 음조들의 세트들을 생성할 때 사용된다. 타입들은 분석자가 자신의 음악 생성 휴리스틱을 위해 정의한다. 예들로서 maj, min 7, dom7 b9, myWeirdChordType1, myWeirdChordType2를 포함할 수 있다.
(d) 위치 - 각 코드는 그 자체가 epoch로 처리되는 코드 스킴의 시작으로부터 측정되는 코드 스킴 내에서 로컬 상대적 위치를 갖는다. 절대적 위치(곡의 시작부터 코드의 위치를 측정함)가 아니라 요구 사항이 이동되거나 재정렬되는 경우 사용자가 코드 스킴를 앞뒤로 이동할 수 있다.
코드 스킴 생성
코드 스킴에 포함된 정보에 대한 타입을 간략하게 설명한 후, 일련의 브리핑 요구 사항들 및 관련 Form Atom들이 주어지면 새로운 작곡에 대해 주어진 코드 스킴의 생성은 다음과 같은 팩터들의 조합이다:
1. 조성과 키 - 이들은 브리핑에 명시된 전반적인 감정적 요구 사항들에 의한 영향을 받는다.
2. 위치 - 각 코드 스킴은 마디들에서 측정되는, 특정 위치에서 시작한다.
3. 길이 - 각 Form Atom은 작품의 타임라인에 대한 특정 길이를 갖는다.
4. 코드 밀도 - 코드 스킴 내의 코드들의 수이다.
5. Form Atom - 이것은 요구 사항 목록의 요구 사항과 관련된 Form Atom이다. 이 Form Atom에는 코드 스킴을 생성하는 데 필요한 휴리스틱 정보가 포함되어 있으며, 요구 사항의 감정적 의미, 형식 요구 사항들, 및 메타-태그들을 기반으로 선택된다.
도 8 및 이것의 개략적인 프로세스를 다시 참조하면, 먼저 작곡의 초기 키 중심이 선택된다. 이것을 으뜸음이라고 하며, 초기 Form Atom에만 관련이 있다. 작곡 작품은 브리핑 요구 사항들을 반영하기 위해 어떤 Form Atom들이 선택되었는지에 따라 이 키 중심에서 자유롭게 벗어날 수 있다. 둘째, Form Atom 및 이것과 관련된 브리핑 요구 사항의 각 페어링(pairing)을 통한 반복 프로세스를 통해, 시스템은 각각의 코드 생성 휴리스틱을 처리한 다음, 코드 간격 휴리스틱을 처리한다. 코드 생성 휴리스틱을 통해 요구 사항이 관련 특성에 있는 코드들의 수를 생성한다. 그 후에 코드 수 및 Form Atom이 코드 간격에서 생성하려는 효과에 따라 코드들의 체인이 휴리스틱에 의해 간격을 두게 된다.
코드 스킴들의 생성을 개시하기 위해, 작곡의 키와 조성이 시작점으로서 선택된다. 이것은 코드 스킴이 생성되기 직전에 수행된다. 요컨대, 으뜸음 음표는 생성형 시스템에 의해 무작위화될 수 있다. 작품의 장조/단조 조성은 이러한 감정적 의미들을 가장 많이 특징으로 하는 분석된 작품들을 상호 참조하는, 브리핑의 감정적 의미 요청들에 대한 전반적인 평가를 기반으로 결정된다. 따라서, 가장 관련성이 높은 의미들을 포함하는/특징으로 하는 분석된 작곡들이 조성에 가장 큰 영향을 미치게 된다.
휴리스틱
시스템에 의해 수행되는 휴리스틱은 음악 전문가에 의하는 등과 같은 분석에 의해 생성되지만, 기술적 접근 방식들이 또한 대안적이거나 보완적이며(예를 들어, 오컴의 면도날(Occam's Razor)(더 적은 것이 공리적으로 더 나음)과 휴리스틱이 원본 작품의 음표 음조, 길이 및 위치를 더 많이 설명할 수 있는 정확성 모두를 테스트하는 적합성 함수(fitness function)들을 기반으로 더 적은 수의 더 정확한 휴리스틱을 발전시키기 위한 유전 알고리즘의 사용). 이러한 휴리스틱은 오디오 구성 요소들 및 음악 구조들에서 패턴 인식 및 특이성을 찾아내어 주어진 코드에서 적어도 하나의 이후 코드 또는 이후 코드들의 연속을 생성함으로써 원래 음악 작품에서 원래 분석된 코드 스킴을 재현할 수 있는 규칙 수가 가장 적은 규칙을 생성한다. 간단히 말해서, 휴리스틱은 수학적 설명이다. 이것은 Form Atom 데이터베이스를 시작점으로 삼은 다음 Form Atom들에 링크된 것들과 유사하고 바람직하게는 이들과 일치하는 일치된 감정적 의미를 갖는 일련의 텍스처들이 주어지면 작곡을 달성할 수 있게 되는 기초가 된다.
모든 음악 악보는 음표들의 음조, 위치 및 지속 시간에 의해 설명될 수 있다. 다른 차원적 특성들이 또한 일반적으로 관련된다(예를 들어, 스타카토 등과 같은 여러 형식들을 취할 수 있는 연주 스타일의 음량 또는 부드러움과 관련된 "볼륨"). 따라서 모든 음악 악보는 MIDI 프로토콜과 유사한 것, 즉 시간 경과에 따른 일련의 온-오프 스위치들을 사용하여 설명되거나 표현될 수 있다. 실제로, 구현 실시예를 위한 컨텍스트를 제공함에 있어서, 실제적인 용어로 각각의 8 비트 MIDI 엔벨로프가 펄스에 연결되고, 이러한 펄스들의 다중성을 통해 순차적으로 실행하면 음악 악보의 연주가 생성된다. 튜링에 상응하는 음악 프로그래밍 언어로 구현되는 일련의 수학 함수들이 올바른 매개변수들로 조합, 정렬 및 프로그래밍될 때, 이러한 함수들이 도출된 원래의 악보를 생성할 수 있다. 또한, 동일한 함수들이 대안들 및 허용 가능하지만 상이한 악보들을 생성할 수 있다. 예를 들어, 규칙은 고음의 특정 마디에 있는 코드로부터 저음의 음표를 생성하는 방식을 설명해야 할 수 있으며, 이 규칙에 적용될 때 원래 악보에서 원래 분석된 음표들로 구현을 달성하는 선택된 매개변수들이 식별되어야 할 수 있다. 또한, 이 규칙은 이제 다른 컨텍스트들에서 다른 코드들이 주어지더라도 허용 가능한 저음 음표들을 생성하는 데 사용될 수 있다. 이 특정 규칙에는 식별 및 재사용 목적을 위해 적절하게 설명적인 명칭, 예를 들어 "장조 키의 3화음을 위한 매우 기본적인 저음 생성"과 같은 이름이 할당될 수 있다. 이러한 요구 사항은, 예를 들어, 고음의 코드를 보고나서, 동일한 음조이지만 더 낮은 옥타브에 있는 저음(베이스 기타의 가능한 최저 음조에 가장 가까운)을 원하는 것일 수 있다. 올바른 수학 함수에 대한 언어학적 설명은 "다음 저음 음표를 선택할 때, 관심 코드 내의 모든 음표를 보고나서 해당 음표들 중 이전 마디의 저음 음표에 가장 가까운 음표들(MIDI 분리 측면에서)를 선택하시오"일 수 있다. 이 경우, 올바른 매개변수들은 음도(예를 들어, I, III, IV)의 관점에서 표현된 고음의 원래 코드에서의 MIDI 음표 분리 거리들과 관련이 있을 수 있다.
본 발명의 다양한 실시예들 및 양태들의 생성형 작곡 시스템이 작동하는 방식은 코드 스킴들, 텍스처들, 채움 브리핑 요구 사항들을 생성하고, 분석된 작품들에 대한 이력 정보의 저장, 및 특정 휴리스틱 파일들을 서로 플러깅하는 방식을 위해 휴리스틱이 사용될 것을 요구한다. 따라서 본 시스템은 추상적인 태스크들의 순서가 정해진 처리를 생성할 수 있는 일반적인 메커니즘을 개발한다.
이 섹션에서는 리듬, 음조, 저장된 분석, 코드 및 코드 간격을 생성할 수 있는 시스템 내의 다양한 프리미티브 휴리스틱을 고려하기 전에, 이러한 처리 및 모델 메커니즘에 대해 설명한다. 프리미티브 휴리스틱은 분석자가 코드를 작성해야 할 필요 없이 분석을 입력할 수 있는 능력을 제공한다.
이러한 처리 및 모델 메커니즘들을 사용하면 휴리스틱의 순서가 정해진 처리를 수행할 수 있을 뿐만 아니라, 처리 흐름 내에서 카피 및 이동될 수 있는 그룹들로 휴리스틱을 네스팅(nesting)할 수 있다. 또한 이것은 조건부 및 무조건부로 분기할 수 있을 뿐만 아니라 특정 휴리스틱 또는 휴리스틱의 분기들이 처리될 수 있는 확률을 설정 가능한 능력을 제공한다. 이 모든 것은 하이퍼노드들의 원리를 사용하여 달성된다.
프리미티브 휴리스틱은 분석자가 코드를 작성하지 않고도 분석을 입력할 수 있는 능력을 제공하며, 튜링에 상응하는 음악 프로그래밍 언어로 미리 정의된 수학 함수들을 갖는 이들의 결과로서 분석 또는 사용을 위한 리듬, 음조, 코드 및 코드 간격을 생성할 수 있도록 기능적으로 구성된다.
휴리스틱 프레임워크 - 하이퍼노드들
하이퍼노드는 휴리스틱의 계층적 처리 및 저장을 허용하는 빌딩 블록이다. 이것은 다음과 같은 특성들을 갖는다:
1. 정렬된 하이퍼노드 목록(재귀적 네스팅 지원).
2. 목록을 처리하는 방식을 설명하는 논리 연산자.
3. 확률 - 이것은 하이퍼노드가 처리될 수 있는 가능성을 나타내는 숫자이다.
4. 명칭 - 이를 통해 하이퍼노드들의 명칭을 지정할 수 있으므로 나열될 시에 이들을 추적할 수 있다.
5. 음악적 요소.
휴리스틱 세트는 하나의 단일 하이퍼노드로 시작한다. 이 노드에는 음악 요소들이 첨부될 수 있는 하이퍼노드 목록이 포함되어 있다. 음악 요소에는 특정 휴리스틱 및 함께 저장해야 하는 임의의 다른 데이터가 포함되어 있다. 모든 하이퍼노드에는 XOR 또는 AND와 같은 논리 연산자가 첨부되어 있다. AND인 경우, 목록의 각 하이퍼노드는 목록 순서대로 처리되고; 하이퍼노드의 확률이 1미만인 경우, 난수 생성기를 사용하여 항목을 처리할지 또는 스킵할지 여부를 평가한다. XOR 목록의 이벤트 시에, 처리될 목록에서 하나의 하이퍼노드만 선택되며, 그 가능성은 목록에 있는 각 항목의 상대적 확률에 따라 달라진다.
하이퍼노드 처리
하이퍼노드에 첨부된 음악 요소의 타입은 하이퍼노드가 처리되는 방식에 영향을 미치게 된다. 프로세서가 이 정보에 따라 수행하는 다양한 반복 단계들이 존재한다. 다음은 본 발명의 생성적 음악 작곡 시스템 내에 존재하는 음악적 요소들의 타입들이다:
1. 드럼 - 이것은 리듬 생성 휴리스틱이며, 반드시 드럼들과 관련된 것은 아니지만 일반적으로 모든 리듬과 관련이 있다.
2. Form Atom - 이것은 분석되어 시스템에 입력된 레퍼토리의 코드들에 대한 정보를 포함한다. Form Atom들은 위에서 상세히 설명한 바와 같은, 작품의 코드 스킴들에 대한 메타-맵을 생성하는 데 사용된다.
3. 휴리스틱 - 이것은 음조-타입 휴리스틱으로 구체적으로 정의되지 않은 모든 휴리스틱에 대해 포괄적인 것이다. 이것은 코드 및 코드 간격 휴리스틱뿐만 아니라, 주어진 브리핑에서 생략된 부분들을 채우고 완료하기 위한 휴리스틱을 포함한다.
4. 음조 - 이것은 주어진 코드 스킴을 기반으로 음조 정보를 생성하는 것과 관련된 특정 타입의 휴리스틱이다.
5. 텍스처 어댑터 - 텍스처 어댑터는 특히 텍스처 그룹과 관련된다. 텍스처 어댑터들은 음조, 리듬 및 MIDI 라우팅 정보를 함께 연결한다.
6. 텍스처 그룹 - 텍스처 그룹은 텍스처 어댑터들을 사용자가 사용할 수 있는 메타-태그들에 연결한다.
하이퍼노드 구조에서는 위의 모든 음악적 요소들이 모든 Form Atom에 대해 처리되는 반면, 음조 휴리스틱은 Form Atom의 코드 스킴 내의 모든 코드에 대해 처리된다. 이것은 텍스처들이 한 번만 처리되지만, 코드 변경과 관련된 음조 정보는 모든 코드에 대해 처리된다는 것을 의미한다.
휴리스틱 구성 요소들
휴리스틱은 명칭, 설명(분석자가 휴리스틱이 수행하는 것을 볼 수 있도록 하기 위해), 및 휴리스틱이 호출/인스턴스화될 때 실행되는 절차 또는 방법의 세 가지 요소만 저장한다. 이것은 휴리스틱이 사전 프로그래밍된 데이터를 포함하지 않는다는 것을 의미한다. 휴리스틱이 데이터를 저장해야 하는 경우, 이 데이터는 휴리스틱을 포함하는 음악 요소에 유지된다. 그러나, 휴리스틱은 생성되는 데이터에 의존하지 않는다. 그 이유는 다른 모든 데이터가 동적으로 생성되며 처리 시점에는 사용 가능한 것으로 신뢰할 수 없기 때문이다. 이것은 분기, 또는 예상대로 자료를 생성하지 않을 확률로 인한 통계적 가능성 때문일 수 있다. 따라서, 일련의 데이터 맵들이 서로 다른 휴리스틱들과 연관된다. 이들은 주어진 휴리스틱이 기본 기능을 실행하는 데 의존할 수 있는 동적 생성된 데이터를 포함한다.
휴리스틱 맵은 다음과 같은 특성들을 갖는다:
1. 작곡 - 작곡 자체, 이것은 다음에 대한 대한 정보를 포함한다:
(a) 요구 사항 목록 - 사용자로부터의 브리핑 정보를 포함.
(b) 박자표(Time signature) - 작곡의.
(c) 코드 스킴들 - 각 Form Atom에 첨부된다.
(d) 보표들 - 시퀀서를 위해 생성되어 준비된 음악 정보.
2. 휴리스틱에게 적절한 시점에 정보를 다른 휴리스틱들로 보내거나 다시 처리될 때 자신에게 정보를 보낼 수 있는 능력을 제공하는 예비 Heresy 맵.
3. 드럼-휴리스틱 특정 정보:
(a) 블랙 리스트 - 이 휴리스틱이 처리되었을 경우 처리되서는 안 되는 드럼럼들에 대한. 이것은 킥-드럼 패턴들이 이미 쓰여진 킥-드럼 패턴들을 덮어쓰는 것과 같은 것을 막는 데 유용하다.
(b) 드럼 - 처리 중인 드럼. 드럼들은 아래에서 설명되는 많은 특성들을 갖는다.
(c) 처리 드럼 목록 - 이것은 처리된 드럼 목록이다. 이들 중 일부는 해당 휴리스틱에 대해 처리되는 음표들에 영향을 줄 수 있다.
4. 생성된 음조 정보 목록 - 이것은 특정 드럼들이 트리거될 때 Heresy가 사용하고자 하는 음표들의 코드별 음조 정보이다.
5. 처리 중인 현재 Form Atom을 나타내는 숫자 - 이를 통해 주변 아톰들이 로컬 으뜸음 및 코드 스킴들과 같은 것들을 고려할 수 있다.
6. 주어진 Form Atom 내의 특정 코드를 나타내는 숫자.
7. 플래그 목록 - 이것은 이 휴리스틱 및 향후의 휴리스틱에 대한 예/아니오 트리거들로서 사용될 수 있다.
프리미티브 음조 휴리스틱(Primitive Pitch Heuristics)
이제 휴리스틱이 처리되는 메커니즘과 서로 간에 데이터를 전달하는 방식을 확립했으므로, 이제는 다양한 타입의 프리미티브 휴리스틱들과 음악적 결과물을 생성하는 방식을 고려할 수 있다.
프리미티브 휴리스틱에는 두 가지 타입이 존재한다(즉, 음조와 관련된 가변 매개변수들이 있는 미리 정의된 수학 함수들).
1. 핵심 휴리스틱 - 특히 이들은 음조 정보를 다루며, 다음과 같은 세 가지 하위 범주로 더 나뉜다:
(a) 음조 생성기들 - 이들은 음조/주파수 정보를 생성하며, 바람직하게는 MIDI 표현 형식으로 표시된다.
(b) 음조 트랜스포머들 - 이러한 휴리스틱들은 음표들과 코드들의 음조를 변경한다(즉, MIDI 음계에서는 정수이지만 연속 옥타브들의 각 으뜸음의 주파수가 두 배가 되는 주파수 음계에서는 제공하지 않는 오프셋을 제공한다).
(c) 음조 저장기들 - 이러한 휴리스틱들은 음표들 및 플래그들에 대한 메모 내 저장 영역을 생성한다. 이들은 단순히 데이터의 물리적 저장 위치들인 것으로 간주될 수 있다.
2. 논리 연산자들 - 이러한 휴리스틱들은 "If Then Else" 타입 메커니즘들을 통한 조건부 흐름 제어를 허용할 뿐만 아니라, 음표 음조들, 플래그들 및 코드 타입들이 특정 값인 것과 같은, 특정 조건들이 참인지의 여부를 확인할 수 있다. 또한 이들은 음표의 음조들이 특정 범위 내에 있는지 확인할 수 있다. 본질적으로, 이들은 서브-루틴들을 위한 분기 함수들이다.
음조 생성 휴리스틱은 세 가지 상이한 소스들로부터 음조 정보를 수집할 수 있다: 분석자가 추상적으로 명시한 숫자로부터; 코드 스킴의 코드에 있는 특정 반전 위치로부터; 또는 아이디어 보표로부터. 아이디어 보표는 명명된 음조 위치들의 목록이며, 분석자가 하이퍼노드 구조 내의 별도 휴리스틱 목록에 셋업한다. 음조 정보가 언급된 세 가지 소스 중 하나에서 수집될 수 있지만, 생성된 모든 음조 정보는 아이디어 보표 음조 위치들에 저장된다.
두 가지 상이한 음조 생성기 휴리스틱들이 존재한다. 첫 번째 것은 음표 선택기(note picker)라고 불린다. 이 휴리스틱은 단순히 소스 음표가 무엇인지, 음표의 목적지가 어디에 있는지 질의한다. 코드 또는 아이디어 보표가 선택된 경우 소스에서 선택을 무작위화하는 옵션이 존재한다. 무작위화가 불가능한 경우, 음표 선택기는 음조 위치 목록의 위치 0에 있는 식별된 아이디어 보표 값으로부터 정확한 값을 취하게 된다. 그러나, 무작위화가 지정되면, "고음(treble)" 아이디어 보표에 저장된 음표들 중 임의의 것으로부터의 값을 취하게 된다. 이러한 리터럴 음표 값들은 코드가 바뀔 때마다 변경되지만, 이 선택기는 항상 이 위치를 가리키게 된다. 또한 아이디어 보표들 또는 코드들로부터 공급되는 음표들에 대한 마디 오프셋이 존재한다. 이것은 이웃 및 근처의 코드들 및 아이디어 보표들로부터, 그리고 이들과 관련된 음조 값들로부터 음조 정보를 얻을 수 있다는 것을 의미한다. 이 예에서는, 마디 오프셋이 지정되지 않았으므로, 음조 정보를 코드 스킴 내의 현재 코드 번호와 관련된 아이디어 보표 음표들로부터 가져오게 된다.
소스가 코드인 것으로 선택되면, 음표 번호는 베이스로부터 코드에서 하나의 값을 선택하게 되며, 예를 들어, 장조 코드에서 "1"은 장3도를 제공하고, "2"는 완전5도를 제공하며, "3"은 장7도를 제공하거나 또는 그 시점에 생성되는 코드에 따라, 으뜸음을 한 옥타브 더 높게 해주기 위해 다시 랩 어라운드할 수 있다. 정수는 어떤 숫자가 지정되든 리터럴 값을 제공한다.
대체 음조 생성 프리미티브 휴리스틱을 보이스 리더(Voice Leader)라고 한다. 이러한 생성 휴리스틱에서는, 보이스 리드할 참조 음조가 선택된다. 이러한 리드할 음표는 미리 정의된 세 가지 소스(아이디어 보표, 코드, 숫자) 중 하나의 음표에 대한 참조를 제공한다. 그 후에 생성될 음표가 제 2 참조 소스(일반적으로 코드 또는 아이디어 보표)로부터 선택된다. 그 후에 분석자는 음표가 제 1 참조 음표로부터 위쪽, 아래쪽 또는 양쪽 모두의 방향으로 리드할 것인지를 지정할 수 있다. 양쪽 모두를 선택하는 경우, 가장 가까운 음표가 탐색된다. 음표가 제 2 참조 코드에 나타나는 경우 음표가 음조를 변경하도록 지정할 수 있으며; 이것은 (다수의 규칙 중의) 또 다른 규칙의 일 예이다. 분석자가 이 휴리스틱을 사용하여 선택된 음표의 초기 음조로부터 너무 멀리 벗어나지 않기를 원하는 경우, 이것은 범위로 지정될 수 있다. 그 후에 이 범위는 데이터 맵에 저장되며 다음 번에 기록될 때 휴리스틱으로 전달된다. 범위를 벗어난 음표를 생성하려고 시도하는 경우, 초기 음조가 무엇이었는지 및 대신에 이 값으로부터 보이스 리드를 행하는 방식에 대한 기록을 갖는다. 이렇게 하면 보이스 리더 휴리스틱이 그들이 작성 중인 악기의 관용적 범위를 벗어나는 멜로디와 음계를 생성하는 휴리스틱을 중지할 수 있다.
음표 선택기 및 보이스 리더 생성 휴리스틱은 정수 옵션을 선택하지 않는 한 미리 작성된 음표들을 선택하지 않는다는 점에 유의해야 한다. 이것은 선택되는 음조들이 생성 시점의 작곡의 하모니에 따라 달라진다는 것을 의미한다.
저장 휴리스틱에는 두 가지 타입이 존재한다. 하나는 설정된 수의 저장 위치들을 가진 명명된 아이디어 보표를 생성하는 것이고; 다른 하나는 처리 반복 중에 턴 온 및 턴 오프할 수 있는 플래그이다. 분석자가 임의의 정보를 저장하고자 하는 경우, 이러한 기능들을 통해 이것을 수행하기 위해 아이디어 보표들 또는 플래그들을 생성해야 한다.
분기 및 논리 연산들이 논리 연산자 휴리스틱들의 세트에 의해 수행된다. IfThenElse 휴리스틱은 세 개의 하이퍼노드들의 세트를 제공한다. 제 1 "if"' 하이퍼노드는 동등 휴리스틱을 통해 주어진 조건을 확인한다. 네 개의 상이한 동등 휴리스틱이 존재한다. 이들은 특정 음표가 소정 음조인지, 또는 음표가 음조들의 범위 내에 있는지, 또는 코드가 소정 타입인지, 또는 플래그가 존재하며 턴 온 또는 턴 오프되어 있는지를 확인할 수 있다. 조건이 충족된 경우, "then" 하이퍼노드가 사용되며; 그렇지 않은 경우, "else" 하이퍼노드가 사용된다.
마지막으로, 프리미티브 생성 휴리스틱들의 마지막 세트는 트랜스포머들이다. 세 가지 특정한 것들이 존재한다. 처음 두 개는 음표 및 코드 트랜스포저들이다. 이들은 언급된 세 가지 소스(추상적 숫자, 전위 위치 또는 아이디어 보표) 중 하나의 소스 값으로 음표 또는 전체 코드의 음조를 조옮김할 수 있다. 세 번째 것은 대안적인 회고적 보이스 리더이다. 이것은 주어진 음조로 주어진 위치에서 음표를 취하고, 대상 참고 음표의 옥타브 내에 있게 될 때까지 옥타브들만큼 위 또는 아래로 이것을 이동시킨다. 이것은 생성된 음조 자료에서 복합 인터벌들을 제거하는 효과적인 방법이다.
프리미티브 리듬 휴리스틱 - 드럼
음조 정보로부터 멜로디들과 텍스처들의 리듬적 품질들을 생성하기 위한 잠재적으로 많은 대안적 메커니즘들이 존재하지만, 바람직한 실시예는 단일의 프리미티브 리듬 휴리스틱을 사용한다. 이 휴리스틱은 이전 섹션에서 언급한 음조 휴리스틱을 사용하여 생성된 아이디어 보표들에서 탐색되는 음조 값들에 대해 리듬 트리거 메커니즘을 적용한다.
휴리스틱의 특성들은 드럼으로 지칭되는 것에 저장된다. 드럼 정보는 이 프리미티브 리듬 처리 휴리스틱과 함께 음악적 요소에 저장된다. 드럼 데이터가 첨부된 이러한 음악 요소들은 다른 음악 요소들과 마찬가지로 하이퍼노드 구조체들에 위치하며, 이것은 이들이 계층적 순서로 처리됨을 의미한다. 이것은 드럼들이 생성 및 관찰된 출력을 통해 트리거되는 방식에 대해 잠재적으로 서로 영향을 미칠 수 있음을 의미한다. 드럼들은 실제로 드럼 패턴들을 생성하는 데 사용되지만, 아이디어 보표들의 음조 음표들을 트리거하는 이들의 능력은 튜닝되지 않은 타악기 패턴들을 생성하는 것보다 훨씬 더 강력하게 사용된다는 것을 의미한다.
드럼은 처리 메커니즘의 컨텍스트 내에서 나중에 참조하기 위한 명칭을 갖는다. 이 드럼의 명칭은 동일한 하이퍼노드 구조의 다른 드럼들에서 참조되며 이에 따라 트리거 확률들에 영향을 미치게 된다. 드럼에 대해 정의되는 해결책이 존재한다. 이것은 궁극적으로 두 그리드에 대한 해결책을 설정한다: 첫째, 드럼이 트리거되는지 여부에 대한 확률들; 둘째, 드럼이 트리거되는 경우의 속도 값. 각 확률은 0% 내지 100% 사이로 설정될 수 있는 값을 가질 수 있으며; 속도들은 1 내지 127 사이의 MIDI 범위를 갖는다. 음표가 트리거되는 경우, 연관된 속도가 사용된다. 이 속도들은 설정된 범위만큼 이 값을 중심으로 무작위화될 수 있다.
특정 그리드 위치들의 확률은 이미 처리되어 트리거된 다른 드럼들에 의해 영향을 받을 수 있다. 이 경우, 음표가 궁극적으로 트리거될 경우 음표에 대해 설정할 수 있는 속도들이 존재한다. 이러한 전처리된 드럼들은 두 목록들 중 하나에 나타날 수 있다. 첫째, 그리드 확률들에 부정적인 영향을 미치는 드럼 목록은 존재하지 않는다. 주어진 위치에서 트리거되는 경우, 이러한 전처리된 드럼들은, 확률이 100%이더라도, 현재 드럼이 트리거되지 않아야 함을 의미한다. 이것은 폐쇄형 Hi-Hat와 개방형 Hi-Hat을 동시에 단구적으로 트리거(unidiomatic triggering)하는 것과 같은 상황들에서 유용하다. 이 예에서, 분석자는 개방형 Hi-Hat이 트리거되지 않는 한, 모든 퀘이버 비트들에서 재생되도록 폐쇄형 Hi-Hat을 설정할 수 있다. 개방형 Hi-Hat은 하이퍼노드 구조체에서 먼저 처리되고, 폐쇄형 Hi-Hat은 나중에 비(not) 목록에서 개방형 Hi-Hat으로 처리된다. 둘째, 드럼들의 어트랙터 목록이 존재하며, 트리거되는 경우, 현재 드럼의 로컬 확률 그리드 영역을 증가시킨다. 어트랙션이 트리거된 그리드 위치의 "왼쪽", "위" 또는 "오른쪽"에 있는 그리드 위치에 이 확률 숫자를 추가할지 여부는 드럼 특성들에서 설정된다. 이 것은 사용자가 특정 음표들을 다른 음표들 옆에 표시하려는 경우에 유용하다. 예를 들어, 세미퀘이버 스네어 고스팅의 경우, 분석자는 킥 드럼 또는 스네어 드럼이 이웃한 퀘이버에서 트리거될 경우 주변 두번째 또는 네번째 세미퀘이버에서 고스트 음표가 발생할 가능성을 높이고자 할 수 있다. 킥 드럼과 스네어 드럼은 고스트가 발생할 확률에 각각 30%씩 기여할 수 있으므로, 트리거의 가능성이 크게 증가하게 된다.
드럼들은 음조 값을 갖고 있다. 이 음조 값은 리터럴 MIDI 음조, 또는 아이디어 보표의 저장 위치와 동일할 수 있다. 드럼 음조 매개변수가 특정 MIDI 음표 또는 아이디어 보표 음조 위치의 값을 트리거하는 것을 분석자가 원하는지 여부에 따라, 리듬 및 음조 휴리스틱들이 서로 플러깅될 때(예를 들어, 제공된 텍스처에 필요함) 이후 단계에서 다른 리듬 어댑터들이 사용된다.
드럼은 설정된 수의 음표들, 음표들의 범위를 생성하도록 강제될 수 있으며, 따라서 이것은 희박하거나 너무 많은 리듬 패턴들을 초래하는 통계적 우연을 피할 수 있음을 의미한다. 드럼이 목록이 아닌 어트랙터를 통해 다른 드럼들을 어트랙션하거나 무음으로 만드는 방법으로만 사용되는 경우, 음소거로 설정될 수 있다. 이것은 드럼이 자체 출력 음조를 갖지 않지만, 처리 메커니즘에서 계속 사용된다는 것을 의미한다.
주어진 확률 그리드가 확장되는 시간은 루프-길이 매개변수에 의해 설정된다.
이러한 방식으로, 4 비트에 걸쳐 퍼져있는 16 개의 그리드는 사실상 세미퀘이버이지만 8 비트에 걸쳐 퍼져있는 것은 퀘이버들이다. 이것은 패턴이 몇 번이나 발생하는지 또는 반복되는지, 그리고 패턴이 Form Atom의 시작 또는 끝에서 발생하는지 또는 Form Atom 내 코드 변경의 시작 또는 끝에서 발생하는지 여부를 말할 수도 있다. 이것은 코드들과 Form Atom들이 변경됨에 따라 복잡한 텍스처들을 생성하는 강력한 방법을 제공한다.
마지막으로, 트리거된 음조 음표들에는 연관된 길이 특성들을 통해 마디들, 비트들 및 비트의 일부들로 길이가 주어진다.
텍스처들
특히 도 3 및 4와 관련하여, 텍스처의 구조 및/또는 효과에 대한 상당한 논의가 이미 있었다. 다시 확장에 대한 이전 요점으로 돌아가서, 사용자들은 감정적 의미들을 지정하는 것을 통해 텍스처들을 얻게 된다. 이러한 의미들은, 일 실시예에서, 텍스처 그룹들의 파일로서 알려진 것에 대해 확인된다. 이제 텍스처 그룹들을 생성하는 방식에 대해 살펴보도록 한다. 이 정보가 포함된 텍스처 그룹 파일을 생성하는 워크플로우가 도 10에 나와 있다. 텍스처 디스크립터들은 궁극적으로 관련 Form Atom들에 대응하는 디스크립터들과 정렬된다.
텍스처 구성 요소들의 생성은 바람직한 실시예의 생성형 시스템의 물리적 출력인데, 텍스처 오버레이 이전에, 단순히 코드 스킴 체인이 존재하기 때문이다. 텍스처 구성 요소들을 분류하고 이들을 브리핑에 링크하는 방식, 음조 및 리듬에 대한 휴리스틱, 및 Form Atom들 및 어셈블링된 코드 스킴들을 사용하여 작곡에 대한 하모닉 맵을 형성하는 방식을 고려한, 도 10은 사용자가 텍스처들을 지정, 구성, 요청하고, 시스템에서 구현하는 방식을 이해하도록 하기 위해 이러한 모든 정보와 기술들을 결합하는 것과 관련된 처리에 대한 개요를 제공한다.
주어진 텍스처 분석의 프로그래밍과 관련된 워크플로우는 일반적으로 다음 구조에 따른다:
1. 핵심 휴리스틱을 통해 음조 데이터를 생성한다(위에서 설명됨).
2. 드럼 휴리스틱을 통해 리듬 데이터를 생성한다(위에서 설명됨).
3. 원하는 키트(kit)를 어그리게이션하기 위해 리듬 프로세서를 생성한다.
4. 리듬 프로세서에 내부 스토리지 및 외부 MIDI 매핑을 적용하기 위해 오케스트레이터를 생성한다.
5. 텍스처 어댑터를 통해 리듬 및 매핑 데이터가 포함된 오케스트레이터들에, 음조 데이터가 포함된 코어 파일들을 첨부하는 텍스처 그룹을 생성한다.
6. 텍스처 그룹에 메타-태그를 첨부한다.
프로세스 단계들을 더 자세히 살펴보면 다음과 같다:
1. 분석자(또는 경우에 따라 프로그램 로직 및 시스템 인텔리전스)는 아이디어 보표들에 배치되는 음조들을 생성할 일련의 휴리스틱들을 생성하는 것으로 시작한다. 이러한 휴리스틱은 코어 파일에 저장되는 하이퍼노드 구조로 프로그래밍된다.
2. 다음으로, 분석자는 일련의 드럼 휴리스틱들을 생성한다. 이 하이퍼노드들은 키트 파일에 저장된다.
3. 분석자가 원하는 리듬을 생성하기 위해 사용하고자 할 수 있는 다양한 키트들에 걸쳐 다양한 드럼들이 존재할 수 있다. 따라서, 키트 파일들은 키트 프로세서로 알려진 것에서 처리된다. 이것은 키트 파일 및 해당 파일 내의 관련 키트가 처리될 수 있는 특정 휴리스틱을 사용한다. 이 키트 처리 휴리스틱은 프로세서 파일에 있다.
4. 생성형 시스템의 내부 구조 및 저장, 그리고 연결된 VST 악기들에 대한 외부 MIDI 매핑들의 측면에서 최종 음표 정보가 어디로 이동할지에 대한 맵이 생성된다. 텍스처를 적용하기 전에, 시스템은 주로 코드 스킴 체인들을 제공하기 위한 관련 처리를 갖는 Form Atom들의 형식으로, 음악 자료의 추상적인 스니펫들만 생성하였다. 텍스처 오버레이는 특정 범위, 악기 및 악보의 특정 지점에 있는 보표들에의 배치를 위한 오케스트레이션이 발생하는 곳이다. 오케스트레이터가 서로 다른 악기들에 대해, 다양한 트리거된 음표들을 여러 번 사용하기를 원할 수 있다(음악 용어로, "더블링(doubling)"으로 알고 있는 것). 이것은 리듬 프로세서들, 외부 MIDI 매핑들 및 MIDI 정보 저장을 위한 내부 보표를 연결하는 하이퍼노드들을 포함하는 오케스트레이터 파일에 지정된다.
오케스트레이터를 생성할 때 수행되는 두 가지 주요 휴리스틱이 존재한다. 첫째, 생성된 정보를 내부적으로 저장할 위치를 정의해야 한다. 이것은 보표 생성기 휴리스틱을 통해 달성된다. 보표 생성기 휴리스틱은 생성된 자료를 다수의 보표들에 배치한다. 두 개 이상의 보표를 보유하는 능력이 반드시 필요한 것은 아니지만, 이 자료를 다른 보표들과 차별화하는 방식으로 사용자에게 자료를 표시할 경우와, 자료를 생성하는 휴리스틱을 디버깅할 경우에 이것은 유용하다. 생성된 보표들은 명칭 특성들; 마디들, 비트들 및 비트의 일부들의 길이; 그것을 위해 쓰여질 자료에 적합한 박자표; 및 마디들, 비트들 및 비트의 일부들에서 측정된 오프셋을 갖는다. 오프셋은 임의의 자료의 절대 위치에 적용된다. 이러한 방식으로 인접한 마디 라인들에 걸쳐, 프레이즈들의 시작 부분에서 픽업들을 이동하고, 끝 부분에서 드럼 필들을 이동함으로써 포지티브 및 네거티브 아나크루스들을 만들 수 있다. 둘째, 리듬 어댑터 휴리스틱은 프로세서 파일로부터 보표들, MIDI 채널, 코어 음표 및 아이디어 보표로 리드미컬하게 생성된 자료를 매핑하는 데 필요하다.
일 예로서, "pianos"라는 리듬 프로세서는, "my Bach piano right hand"라는 하이퍼노드 프로세서와 함께, 저장 위치 "3"에서 아이디어 보표 "고음"으로부터의 음조 값을 요청하는 음표들에 대한 트리거를 제공한다. 이것은 아이디어 보표로부터 생성된 모든 음조들을 취하여, "Piano (right hand)"라는 명칭이 지정된 이 모든 MIDI 정보에 대한 내부 대상 보표와 함께, 채널 "11"에서 이들에 대한 MIDI 음표들을 생성한다. 내부 대상 보표는 리듬 오프셋에 대한 정보를 제공한다. 음조 위치가 지정되지 않은 경우, 드럼이 리터럴 MIDI 음조를 요청하고 있다고 가정한다. 이것이 타악기 패턴들이 생성되는 방식이다. 아이디어 보표가 지정되지 않은 경우, 모든 음조들이 동일한 MIDI 및 보표 라우팅을 갖는다고 가정한다.
이러한 오케스트레이터들은 위의 단계 1에서 생성되는 임의의 주어진 음조 정보에 대해 작동하지만; 이 트리거들이 다양한 코어 파일들에 의해 생성되는 음조들에서 작동하기를 원할 수 있다. 따라서, 이제 음조 데이터를 오케스트레이터 데이터에 연결하기 위해 텍스처-어댑터 휴리스틱을 생성한다. 텍스처 어댑터에는 다음과 같은 두 가지 구성 요소가 제공된다: 코어 파일로부터의 특정 코어 음조 하이퍼노드 생성기, 및 오케스트레이터 파일로부터의 오케스트레이터 하이퍼노드. 이 텍스처-어댑터 휴리스틱은 텍스처 그룹의 일부인 하이퍼노드 구조에 배치된다.
5. 텍스처 그룹에는 분석자가 텍스처 어댑터의 출력과 연관시키고자 하는 메타-데이터 및 텍스처 어댑터들이 포함된 하이퍼노드가 있다. 이 데이터에는 사용자가 지정할 수 있는 브리핑 구성 요소들이 포함되어 있으며, 다음을 포함한다:
(a) 요소 타입들 - 이들은 본 명세서에서 나열되고 논의된 텍스처 기능들이다.
(b) 텍스처 의미들 - 이들은 본 명세서에서 논의된, 감정적 의미와 연돤된 추상적인 키워드들이다.
(c) 담론 연관성들 - 이것은 본 명세서에서 논의된 작곡가와 담론에 관한 메타 데이터 의미들이다.
(d) 목적 - 이것은 요소 구성 요소들이 특징들인지 반주인지를 나타내기 위한 것이다.
텍스처 생성기
앞에서는, 생성형 시스템에 음악적 텍스처들을 입력하는 시스템에 대해 설명하였다. 위에서 설명한 Form Atom 요구 사항 목록과 마찬가지로, 이 시스템도 또한 텍스처 요구 사항 목록을 갖고 있다. 실제로, 이 시스템은 텍스처 요구 사항 목록에 텍스처 요구 사항이 있고 Form Atom 요구 사항 목록에 코드 스킴 요구 사항이 동시에 있는 경우에만 음악을 작곡한다. 이들은 브리핑 전체에 맞는 Form Atom들의 선택으로부터 음악적으로 링크될 수 있는 동일하거나, 의미론적으로 동등하거나 의미론적으로 만족스럽게 가까운 감정적 의미들 사이에 필요한 링크를 제공하는 데 필요하다.
앞에서는, Form Atom 요구 사항 목록 내의 갭들을 정리하는 메커니즘에 대해 설명하였다. 바람직한 실시예에서, 시스템은, 브리핑에서의 관련 방향 부족을 고려하여, 시간의 화살표와 함께 새로운 것이 발생할 때까지 현재의 텍스처 메타-태그 요청들을 계속하도록 구성된다. 이것은 텍스처 요구 사항 목록에 다시 피드백되므로 사용자는 섹션들 사이에 적합한 것으로 판단되는 텍스처를 삭제하거나 변경할 수 있다. 이것은 브리핑에서 텍스처를 변경하는 지점들 사이에서의 텍스처 요구 사항을 반복할 필요가 없음을 의미한다.
텍스처들을 계산하기 위해, 바람직한 실시예의 생성형 시스템은 모든 코드 요구 사항들을 순환하고, 텍스처 요구 사항이 그것과 중첩되는지 확인한다. 긍정인 경우, 생성형 시스템은 연관된 Form Atom에 대해 생성된 코드 스킴을 사용하는 동안 텍스처 요구 사항을 처리한다. Form Atom이 일찍 시작되거나, 텍스처보다 길게 연장되는 경우, 프로세서가 이른 경우에는 이미 작곡된 자료를 가지고 있고, 늦은 경우에는 다음 사이클에 나머지 자료를 작곡하도록 구성되어 있기 때문에 문제가 되지 않는다.
본 발명의 생성형 시스템은 바람직하게는 반주 요소들보다 특징 텍스처 요소들(예컨대, 하모니, 멜로디, 카운터 멜로디 등)에 대한 요청을 우선시한다. 특징들인 모든 필수 요소들의 목록을 생성한 다음, 이러한 요구 사항들 중 하나를 충족하는 모든 가용 텍스처 그룹들을 확인한다. 이 텍스처 그룹 목록은 텍스처 그룹이 수행할 수 있는 다른 메타-태그들의 수에 따라 악보가 구성된다.
설명한 바와 같이, 텍스처 그룹 내에는 여러 요소가 있을 수 있다. 이러한 요소들 중 일부는 브리핑 요구 사항에 맞을 수 있지만 다른 요소는 그렇지 않을 수 있다. 텍스처 그룹은 브리핑과도 관련된 그것에 첨부된 의미들에 관한 메타태그들을 가지고 있을 수도 있다. 악보들은 누적된다. 선택 프로세스를 제공하기 위해, 시스템 인텔리전스는 특징들은 아니지만 요청된 텍스처 요소를 +1로, 특징들인 요청된 요소들을 +2로, 적절한 메타태그들을 가진 그룹들을 +4로 하여 악보를 구성할 있다. 이것은 가장 엄격한 기준을 만족하는, 즉 브리핑에 의해 요청된 특징적 요소를 갖는 텍스처 그룹들에 대한 가중치를 고려한다. 일반적으로, 이 시스템은 가장 높은 악보로 구성된 텍스처 그룹을 선택하도록 구성되며, 그 후에 브리핑으로부터 만족된 요소들을 일시적으로 제거하고, 다음 적절한 텍스처 그룹들을 탐색하기 위한 프로세스를 반복한다. 이것은 결국 특징들이 있거나 없는 모든 요청된 요소들을 충족할 뿐만 아니라, 담론과 의미를 위한 올바른 메타-태그가 있는 텍스처 그룹을 장려한다.
적절한 텍스처들을 선택하고 나면, 두 가지 태스크를 수행한다. 먼저, 악보들이 매칭될 경우 향후 텍스처 생성 사이클들에서 확인하고 우선시하게 되는 요구 사항 목록에 텍스처 그룹들을 추가한다. 이러한 방식으로 유사한 요구 사항이 발생할 때마다 텍스처 아이디어들 각각을 변경하는 대신에, 가능한 경우 작곡 전체에서 반복되는 텍스처 아이디어들을 사용한다. 둘째, 선택된 텍스처 그룹들이 시스템 인텔리전스에 의해 처리된다.
텍스처 그룹들을 처리하기 위해, 처리를 위한 하이퍼노드 목록에 이들이 추가된다. 그러나, 진행 이전에, 시스템은 Form Atom 및 텍스처 모두에 대한 형식 요구 사항 항목들이 포함된 데이터 맵을 생성한다. 이들의 인덱스가 기록되고, 이 작곡도 데이터 맵에 추가된다. 이것이 텍스처 어댑터들이 텍스처 그룹을 처리하는 데 필요한 모든 정보이다.
섹션 C: 분석 방법
앞에서는, 작곡 결정들의 이유에 대해 설명하였다. 또한 시스템의 프레임워크에 대한 입력을 생성하는 데 사용되는 바람직한 분석 방법에 대한 논의가 있었다. 음악 작품에 대한 완전한 분석이 분석의 기반이 되는 개념들에 대한 설명을 방해할 수 있지만, 아래의 섹션 D는 Bach의 C 단조 전주곡에 대한 자세한 분석을 제공함으로써 포괄적이고 실용적인 예를 통해 바람직한 시스템에 사용된 독창적인 접근 방식의 개념들을 강조한다.
이 섹션에서는 먼저 분석을 수행하기 위해 거쳐야 하는 단계들에 대한 개요를 제공한다. 그 후에 엔트로피와 중복성의 개념들이 어떻게 활용되는지 설명한 다음 예들을 사용하여 분석이 어떻게 수행되는지에 대해 자세히 설명한다. 이 챕터는 또한 주어진 작곡으로부터 Form Atom들의 분석을 입력하기 위한 Heresy 프레임워크의 일부인 유용한 분석 도구를 제공한다 - 작품 주석(piece annotation)으로 알려짐.
분석 단계들에 대한 개요
메타-작곡들의 표현을 가능하게 하는 메커니즘을 심층적으로 고려하기 전에, 이 섹션에서는 분석자 또는 분석적으로 구성된 스마트 시스템이 원하는 음악적 결과와 생성형 작곡을 제공하는 일련의 휴리스틱들을 얻기 위해 수행해야 하는 단계들에 대해 간략하게 설명한다. 주어진 작곡을 시스템에서 음악을 생성하는 데 필요한 휴리스틱들로 분해하기 위해, 시스템은 다음 태스크들을 수행한다:
1. 형식 개요 - 이 프로세스는 작품의 전체 코드 스킴을 구성 Form Atom들로 분해하는 데 사용된다.
2. Form Atom 분석 - 이것은 이들의 특성들을 통해 단계 1에서 식별된 Form Atom들을 분류하고, 이들과 연관된 코드 간격 휴리스틱들과 함께 코드 스킴들을 생성하는 데 필요한 휴리스틱을 설명할 수 있게 한다.
3. 텍스처 분석 - 독립적인 휴리스틱 세트에 의해 설명될 수 있는 음악 음표들의 그룹핑들을 텍스처라고 한다. 텍스처 분석은 텍스처 내에 나타나는 엔트로피와 중복성(바로 아래의 "엔트로피 및 중복성" 섹션 참조), 그리고 Deliege(2001)가 큐라고 부르는 것을 생성하는 방식에 대한 식별 및 설명을 강조하는 것을 포함한다.
이 세 가지 태스크를 위해, 튜링에 상응하는 수학적 프로그래밍 언어를 사용하여, 프로그래밍 가능한 매개변수가 있는 제공된 프리미티브 휴리스틱 세트는, 정의된 Form Atom들의 원리를 통해 논리적으로 시퀀싱되는 코드 생성 및 공간/시간 휴리스틱의 출력을 기반으로 음악적 텍스처들을 생성한다.
엔트로피와 중복성
이 시스템과 접근 방식은 가장 적은 수의 휴리스틱으로 주어진 작품에서 가장 많은 양의 음악을 설명한다는 전제 하에 작동한다. 이것은, 새로운 개념은 새로운 휴리스틱의 개발을 필요로 할 수 있지만, 이전 개념들은 가능한 경우 더 일반화됨을 의미한다. 엔트로피와 중복성의 원리들은, 통신 이론에 대한 이해에서 제시되며, 규칙 세트의 압축을 위해 작동하는 도구들을 제공한다.
도면 전체에서 적색(그레이 스케일 인쇄의 어두운 톤), 녹색(그레이 스케일의 중간 톤) 및 황색(가장 밝은 톤)의 사전 정의된 컬러 방식을 사용하여 엔트로피와 중복성을 강조한다. 이러한 컬러들은 분석 전반에 걸쳐 휴리스틱 세트를 재사용하고 조정할 수 있는 방법과, 설명할 수 없는 자료에 대처하기 위해 새로운 휴리스틱 세트를 고안해야 하는 경우를 보여주는 데 도움이 된다. 텍스처 분석에서 이 컬러링 메커니즘을 사용하는 동안, Form Atom 분석에 이 접근 방식의 이점을 얻을 수 있는 패턴들이 있는 경우, 이 컬러 코딩 기술이 또한 적용될 수 있다. 이러한 컬러들은 다음을 상징한다:
1. 녹색은 고안된 휴리스틱이 있는 정보의 직접적인 반복을 나타낸다.
2. 적색은 설명이 없고 휴리스틱을 생성해야 하는 분석의 구성 요소들을 강조 표시한다.
3. 황색은 이미 생성된 휴리스틱의 조정이 필요하거나, 다른 결과를 제공하기 위해 매개변수를 변경해야 하는 경우를 상징한다.
Form Atom 분석
도입
이 섹션에서는 Form Atom들을 코드 스킴의 특성들(앞에서 설명됨)에 따라 제한된 프로그레션 디스크립터 세트로 분류하는 방식에 대해 보여준다. 이 프로세스는 그 특성들에 따라 상호 교환 가능한 Form Atom들을 생성한다.
Phillip Ball은 음조 음악을 우선 순위 톤이 있는 음악으로 정의하며(Ball, 2011), 프레이즈들은 청취자에게 우선 순위 톤에 따라 시간 맵을 제공하는 기능을 가지고 있다. 청취자는 프레이즈들이 어떻게 작품을 우선 순위 톤으로 되돌려 놓을지 예측하려고 시도하며, 이것은 분류 프로세스를 포함한다(Deliege, 2001).
분석된 작품의 입력을 달성하기 위해, 본 명세서에 설명된 생성형 시스템은 작품 주석 시스템(piece annotation system)을 제공한다. 설명을 위해, 이 작품 주석 시스템의 구현예가 도 11에 나와 있다.
작품 주석
작품에 주석을 달기 위해, 이것은 관련 디스크립터들을 포함하는 프로그레션들로 정성적으로 분해된다. 이에 따라 앞에서 설명한 디스크립터들의 세트로 해석이 제한된다.
이제 알게 되겠지만, Form Atom들은 조작과 사용 중 적어도 하나를 포함하는, 처리의 이유들로 하이퍼노드 구조에 있는 음악적 요소들이다. 이를 통해 분석자는 작품의 입력을 계층적으로 구조화할 수 있으며, 작품 내의 분기들을 논리적인 방식으로 서로 나란히 표현할 수 있다. 이것은 코다들 및 반복들과 같이 음악 내 상이한 위치들에 있는 Form Atom들 간의 관계를 시각화하는데 유용할 수 있으며, 다양한 실시예들의 시스템 및 방법이 (상술한 바와 같이) 이러한 Form Atom 트리들을 생성할 때 유용하다.
분석 중인 작곡의 각 아톰과 연관된 코드 목록이 존재한다. 각 코드에는 음조, 타입 및 베이스의 특성들이 있다(예를 들어, 음조=C, 타입=단조, 베이스=C). 이 코드들의 스트링은 분기 구조로 전환하여 다른 코드들에 대한 옵션들을 제공하기 위해 종지적 시퀀스에서 다른 코드들로부터 및 다른 코드들로의 상이한 코드들에 대한 옵션들을 제공할 수 있는 정렬된 목록을 제공한다. 각 아톰에는 으뜸음 음조와 장조, 단조 또는 모드들 중 하나와 같은 관련 조성이 있다. 이 으뜸음은 코드 분기들에 컨텍스트를 제공하는 데 필요하다. 로컬 으뜸음에 대한 설명에서 고려된 이전 예, 즉 C의 으뜸음을 사용하여 D에서 G로 확장하면, 이것은 본질적으로 시스템 내에서 으뜸음+2에서 으뜸음+7로의 반음들로 궁극적으로 표현될 수 있는 관계이다. 으뜸음의 모드는 특정 코드 시퀀스들을 생성할 때 사용될 수 있을 뿐만 아니라 일련의 분기들 내에서 특정 선택의 조성들을 분류하는 데 중요한 팩터이기 때문에 관련이 있다. 예를 들어, C 장조의 으뜸음에서는, 레어러 F 단조가 아닌 C 장조 코드 앞에 F 장조가 오는 것을 볼 수 있다. C 단조의 평행 조성에서, F 코드의 조성에 대한 기대는 F 단조에 대한 것이다.
프로그레션 디스크립터들에는 다음과 같은 세 가지 옵션이 존재한다: 종지적(cadential), 시퀀스-인터벌(sequence-intervallic), 또는 시퀀스-음조(sequence-tonal). 종지적인 경우, 시스템 인텔리전스는 으뜸음의 위치가 시작, 끝, 둘 다 또는 둘 다에 있지 않은 것에 기초하여 입력된 코드들로부터 디스크립터를 추가로 분류하는 방식을 추론할 수 있다. 이것은 미래의 코드 스킴들을 구성하는 데 필요한 직소 퍼즐(jigsaw puzzle)의 한 구성 요소를 생성 메커니즘에게 제공한다. 여러 항목을 가질 수 있는 2 개의 Form Atom 특성들이 존재한다: 감정 함수들 및 형식 함수 목록들.
첫째, 감정 함수를 고려한다. 방금 논의한 F-to-C 예에서, F 단조 코드의 레어러 모드는 분석자에 의해 "놀라움"이라는 감정적 의미로 해석 및 라벨링될 수 있다. 나중에, 사용자가 브리핑 요구 사항들에서 "놀라움"을 요청하는 경우, 이 Form Atom이 잠재적 가능성으로 되고, 아톰의 휴리스틱이 이 놀라움의 품질을 캡슐화하는 코드 시퀀스를 생성한다.
둘째, 분석자가 형식 함수 정보를 추가한다. 앞서와 마찬가지로, 형식 함수들은 상호 교환 가능성에 대한 옵션들을 제한한다. 진술, 질문 및 답변의 차이점을 자세히 설명했지만, 분석 중인 Form Atom이 다음과 같은 경우, 일반적인 규칙이다:
1. Form Atom이 반복 가능한 것처럼 느껴지면, 이것은 진술이고;
2. Form Atom이 전조되는 것처럼 느껴지거나, 다른 키 중심으로 갈 수 있다고 느껴지면, 이것은 질문이며, 필연적으로 답변이 뒤따르게 된다.
각 Form Atom은 이제 그것에 첨부된 생성형 휴리스틱을 갖고 있다. 이러한 휴리스틱들은 재사용되는 이전에 작성된 것들로부터의 것이거나, 또는 새로운 코드 스킴 생성 메커니즘을 설명하는 새로운 것들로부터의 것일 수 있다. 이러한 휴리스틱들은 위에서 이미 설명한 바와 같이, 두 가지 구성 요소로 구성된다. 첫째, 음조 및 조성 코드 시퀀스 생성기를 포함하는 하이퍼노드. 둘째, 주어진 음악 시간프레임 동안 생성되는 코드들의 간격을 지정하는 코드-간격 알고리즘. 이러한 방식으로, 생성될 코드들의 수는 최종적으로 배치될 시간프레임과 무관하게 유지될 수 있다. 이것은 중요한데, 그 이유는 영화 큐들이 길어지거나 짧아질 때 시간프레임 자체가 상당히 바뀔 수 있기 때문이다.
표준 코드 휴리스틱
이 섹션에서는 표준 종지적 휴리스틱 및 코드-간격 휴리스틱 대해 설명한다. 이들은 코드-아톰 휴리스틱을 생성하기 위한 기초들이며, 종종 그대로 사용될 수 있다.
표준 종지적 휴리스틱
모든 종지적 시퀀스의 시작점으로서, 프로그레션 디스크립터의 으뜸음 위치가 주어지면, 임의의 분석된 작품들에 기록된 모든 코드들로부터 코드 트리를 생성하기 위한 표준 접근 방식이 사용될 수 있다(Nierhaus, 2009). 본 발명의 컨텍스트에서 이것을 수행하기 위해서는, 프로그레션 컨텍스트를 제공하기 위해 Form Atom의 로컬 으뜸음을 고려해야 한다. 생성될 코드들의 수는 n이며, 으뜸음이 아톰의 중간을 제외한 다른 곳에서는 나타나지 않거나 달리 나타나도록 할 때, 4개의 종지적 프로그레션 디스크립터들이 생성된다:
1. 시작 부분에 으뜸음이 있는 원하는 코드 스킴의 경우, 길이 n + 1을 갖는 으뜸음으로부터 으뜸음으로의 코드 체인을 생성한다. 그 후에 마지막 으뜸음을 제거한다.
2. 끝 부분에 으뜸음이 있는 원하는 코드 스킴의 경우, 프로세스를 반복하되 대신에 첫 번째 으뜸음을 삭제한다.
3. 으뜸음-으뜸음 코드 스킴의 경우, 길이 n을 가진 코드 체인을 생성하기만 하면 된다.
4. 시작 부분이나 끝 부분에 으뜸음이 없는 코드 스킴의 경우, 길이 n + 2를 가진 코드 스킴을 생성하고 두 으뜸음을 모두 삭제한다. 또한 분석된 작품의 코퍼스에서 마지막 코드가 첫 번째 코드에 종지할 수 있는 증거가 있음을 확인한다(예를 들어, Dmin => F => G7).
코드-간격 휴리스틱
CSH로 약칭되는 코드 간격 휴리스틱(chord-spacer heuristics)은 사용 가능한 코드들을 주어진 수의 마디들로 분산시킨다. 주어진 CSH 하이퍼노드 시스템에 대한 기본 휴리스틱 호출을 CSH 표준 방법이라고 한다. 이 방법은 새로운 코드를 수락하기 위한 각 마디의 우선 순위에 따라 밸런싱되는, 주어진 CSH가 할당한 마디당 코드 수에 따라 코드들을 분산시킨다. 이 방법은 주어진 코드 시퀀스, Form Atom의 박자표, 마디 수 및 코드들을 배치하기 위한 각 마디의 우선 순위를 나타내는 숫자 어레이를 필요로 한다. 이 방법은 우선 순위가 가장 높은 마디를 찾아내어 그것에 코드를 할당하며, 이에 따라 마디의 우선 순위 번호를 1만큼 감소시킨다. 이 프로세스는 사용 가능한 코드들의 수에 대해 반복된다.
각 마디에 대한 코드들의 우선 순위는 프로그레션 디스크립터들에 특정한 다른 CSH들에 의해 이 휴리스틱에 부여된다. 모든 마디의 우선 순위들은 0으로 설정되어 시작된다.
시작 부분과 끝 부분에서의 CSH 종지적 으뜸음
이 CSH는 코드들의 수가 짝수인지 확인한다. 긍정인 경우, 첫 번째 마디와 마지막 마디의 우선 순위를 각각 -1로 낮춘다. 이것이 동일한 마디인 경우, 모든 코드들을 취하게 된다. 두 개의 마디가 있는 경우, 이들은 동일하게 처리된다. 마디가 세 개 이상인 경우, 이러한 우선 순위 지정은 첫 번째 마디와 마지막 마디에 코드가 있을 가능성을 줄이게 된다. 이러한 타입의 코드 스킴에서는 첫 번째 코드와 마지막 코드가 모두 으뜸음들이기 때문에, 이것은 으뜸음들이 숨을 쉴 수 있는 더 많은 음악적 공간을 제공하고 코드 스킴의 다른 코드들보다 자신을 주장할 수 있는 방식이다.
홀수의 코드들이 존재하는 경우, 첫 번째 또는 마지막 으뜸음에 숨을 쉴 수 있는 공간이 주어지고, 반대편 으뜸음에는 더 적은 시간이 주어진다. 이것은 첫 번째 마디 또는 마지막 마디를 무작위로 선택하여 우선 순위를 -1로 설정하고, 반대편 끝 부분에 우선 순위 2를 할당하는 것에 의해 달성된다. 이것은 으뜸음 마디들 중 하나의 코드 배치에 공간을 장려하지만, 다른 마디에 공간을 제공하여, 고르지 않은 수의 마디들의 특이한 느낌을 보완한다. 이러한 코드들에 간격을 두는 기술은 Mahler(예를 들어, 교향곡 6번 안단테 3악장, 3번 마디에서 5번 마디까지의 아나크루시스, 3분의 1 비트)와 Burt Bacharach(예를 들어, "That's What Friends Are For", 13-18번 마디)와 같이 고르지 않은 수의 마디로 작곡된 프레이즈로 유명한 작곡가의 작품에서 관찰된다.
끝 부분에서의 CSH 종지적 으뜸음
이렇게 하면 으뜸음이 숨을 쉴 수 있도록 -1의 우선 순위가 부여된 마지막 마디를 제외한, 모든 마디에 대해 균일한 0의 우선 순위가 생성된다.
CSH 종지적 비(No) 으뜸음
이것은 짝수의 마디 우선 순위들을 가지고 있다: 모두 단순히 0으로 설정된다.
시작 부분에서의 CSH 종지적 으뜸음
이 휴리스틱은 시작 부분과 끝 부분에 있는 CSH 종지적 으뜸음의 카피본이지만, 마디 수가 홀수이면 우선 순위가 무작위가 아니다: 첫 번째 마디의 우선 순위는 -1로 낮아지고, 마지막 마디의 우선 순위는 2로 증가한다.
그 다음 실제 코드 간격은 CSH 표준 뒤에 있는 간격 휴리스틱에 의해 수행된다. 이 휴리스틱을 CHS 플레이서(CHS placer)라고 하며 마디에 나타나는 코드 수에 따라 비트들에 코드들을 배치한다. 이 배치가 도 12에 나와 있다.
이 제한된 표준 휴리스틱 세트로부터, 생성형 시스템의 선호 코드 생성기(또는 줄여서 HCGen)의 모양을 볼 수 있다. 이것은 표준 코드 스킴 생성기, 스페이서 및 플레이서 하이퍼노드로 구성된 일련의 하이퍼노드들이다. 루트 하이퍼노드가 생성되고, 그 안에 네 개의 항목이 배치된다:
1. 표준 종지적 휴리스틱.
2. 마디들의 우선 순위를 지정하기 위한 CSH 프로그레션 특정 휴리스틱. 이것은 프로그레션 디스크립터에 따라 달라진다.
3. CSH 표준 코드-간격 휴리스틱.
4. CSH 플레이서 휴리스틱.
이것은 코드들을 생성하기 위한 일반적인 하이퍼노드 구조를 나타낸다.
순차적 Form Atom 노테이션
순차적 Form Atom들은 인터벌 및 조성 기반의 두 가지 종류로 이루어질 수 있다(위 참조).
인터벌 Form Atom은 로컬 으뜸음의 키 중심의 외부로부터의 코드들을 포함하는 일련의 코드들을 통해 이동하므로, 정의에 따라 이들의 형식 기능은 질문이다. 시퀀스들은 자신들의 시퀀스를 깨뜨려야 하고, 그렇지 않으면 영원히 계속되며; 첫 번째 코드를 시퀀스와 다른 이스케이프 코드라고 부른다. 이스케이프 코드들은 정의에 따라, 다음과 같은 Form Atom에 있으며, 이 Form Atom의 형식 기능은 답변으로 분류된다.
시퀀스와 이스케이프 코드를 표현하는 데 사용하는 표준 인터벌 템플릿이 존재한다. 이것을 도 13에서 볼 수 있다. 시퀀스의 시작 음조를 얻는 방법을 설명하고, 코드가 가질 수 있는 조성과 확장을 지정하도록 한다. 이 코드로부터 가능한 두 개의 화살표가 있으며, 하나는 코드의 음조를 반음으로 변경하는 함수이고 다른 하나는 이스케이프 코드이다. 음조 함수에는 흐름 루프를 표시하기 위해 코드를 다시 가리키는 화살표가 있다. 이스케이프 코드에는 음조, 조성 및 확장 정보가 있다.
도 13의 순차적 Form Atom 템플릿은 초기 코드의 음조, 반복을 통해 코드가 변경되는 방식, 이스케이프 코드 및 관련 관계 및 특성을 제시한다.
인터벌 템플릿이 템플릿 1에서 어떻게 작동하는지에 대한 음악적 예가 Form Atom 4라는 제목의 섹션에서 볼 수 있다.
Form Atom 분석 예
이 섹션에서는, 예를 들어, John Williams의 Harry Potter and the Philosopher's Stone(Heyman & Columbus, 2001)에 대한 "The Quidditch Match"의 영화 악보 섹션에 대한 정확한 코드 브리핑이 지정되어 있으며, 이 악보와 축소 및 분석이 도 14에 나와 있다.
이것은 작곡을 사전 정의된 프로그레션 디스크립터들에 맞는 적절한 Form Atom으로 분해하는 방법을 보여준다. 영화 포맷마다 프레임 속도가 다르기 때문에, 이 음악 섹션은 사운드트랙의 상업 릴리스의 6분 39초에 가장 잘 찾을 수 있다. 그것은 해리 포터가 스니치를 삼킨다음 27번 마디에서 뱉어내는 마지막 포획을 향한 긴장 고조와 관련이 있다. 분석은 높은 수준이며 코딩 언어에 독립적이다. 이중 마디 라인들은 각 Form Atom을 나타낸다.
Form Atom 1(종지적): 마디 1 - 4
이 Form Atom은 C 단조 키의 완벽한 종지 역할을 한다. 초기 으뜸음(두 번째 전위임에도 불구하고)과 마지막 딸림음 G 코드로 인해, 명백히 반복할 수 있는 느낌이 들기 때문에 진술로 분류된다. 베이스 움직임은 베이스 움지임이 음계 방식으로 생성될 수 있는 방법과 관련하여 향후 분석할 가치가 있으며; 그러나 이 움직임은 코드 스킴에 대한 즉각적인 연구와 관련이 없다.
이 프레이즈를 생성하기 위해 시작 마디 우선 순위 지정 휴리스틱에서 종지적 으뜸음과 함께 HCGen을 사용한다. 으뜸음에 주어진 공간과, 이 프레이즈에서 이 프레이즈를 통해 일반적으로 이루어지는 코드들의 배치(마지막 마디에 있는 두 개의 코드)는 표준 코드 스페이서가 작동하는 방식을 반영한다.
Form Atom 2(종지적): 마디 5 및 6
이 프레이즈에는 으뜸음 단조 코드와 그 뒤에 오는 Abm이 포함되어 있다. 이 Abm은 C 단조의 키 중심이 유지되려면 응답이 필요한 음악적 질문을 제기하는 것 같다. 이 프레이즈를 따로 떼어놓고 반복할 수 있는지 묻는다면, Abm에서 C 단조로 가는 것이 완전히 공격적인 종지는 아닐 것이다; 그러나, Abm은 Cb로 인해 키 중심에 있지 않다. 따라서 이것은 질문 Form Atom으로 분류하는 것이 더 적절하다. 악보에서 이 질문을 다루는 것은 이 두 코드를 거친 악센트로 강조하는 것이다. 이것은 "Chase Starts" 또는 "Power Tutti"와 같은 감정적 의미 태그를 보증한다. 이러한 진술들은 분석자에게 명백히 개인적이며, 다른 분석자들이 주장할 수 있는 독특한 개인적 미학을 드러낸다. 이것은, 분석자가 결과물에 도전하고 생성적 결과를 자신의 작업으로부터 기대하는 것으로 유지할 수 있는 한 괜찮다. 또한 감정을 의미하는 단어를 일관되게 사용해야 한다. 분석자가 원하는 경우, 단어는 모드 1과 같이 감정적으로 설명되지 않을 수 있으며, 이에 따라 사용자가 분석자의 모드들과 자신의 연관들을 만들 수 있다.
이 프레이즈를 생성하기 위해, 시작 부분과 끝 부분에 조정된 CSH 종지적 으뜸음과 함께 HCGen을 사용한다. 조정된 버전에서는, 으뜸음 마디가 우선시되고 질문 코드들(즉, 이 키 중심에서 오지 않은 코드들)이 포함된 마지막 마디는 외래 코드에 더 많은 시간을 할애하여 긴장감을 작곡하기 위해 우선 순위를 낮추도록 지정한다. 이것은, 첫 번째 마디의 우선 순위를 2로 설정하고, 마지막 마디의 우선 순위를 -1로 설정함을 의미한다.
Form Atom 3(종지적): 마디 7 및 8
이 섹션은 John Williams의 작품을 아는 사람이라면 누구에게나 친숙하게 들릴 것이다: 이것은 스타워즈(Star Wars, Kurtz & Lucas, 1977) 악보에서 긴장감을 고조시키면서 반복되는 것과 같은 축소된 시퀀스이다. 이를 위해, 질문을 따랐다는 점을 고려하면 이것이 답변 프레이즈가 될 것으로 예상할 수 있다. 이를 확인하면, 현재 C 단조 키에서 사실상 부딸림음에서 딸림음 진행(II에서 V로)임을 알 수 있다. 이렇게 하면 Heresy에게 bVI 단조 코드에서 감소된 II 코드로의 링크가 자동으로 제공되므로, 이들 중 하나에서 끝나거나 시작하는 임의의 섹션은 다른 섹션을 링크로 호출할 수 있다.
마찬가지로, 이러한 코드들은 종지적 섹션 내에서 함께 스트링될 수 있다.
표준 HCGen을 이 Form Atom에 첨부하고, 종지적 비 으뜸음을 프로그레션 디스크립터로 선택한다.
Form Atom 4(순차적): 마디 9 - 12
이것은 지금까지 작품에서 첫 번째 순차적 프레이즈이고, 인터벌 템플릿을 도 15에서 볼 수 있으며, 이것은 퀴디치 경기에서 이스케이프 Form Atom 4와 함께 시퀀스 Form Atom 3의 루프를 나타낸다. 이것은 반음으로 상승하는 딸림음 7 b9 코드를 기반으로 한다. 이것은 정의에 의해, 그것에 답변하고, 이에 따라 그것을 멈추게 하기 위해 이스케이프 프레이즈가 필요하기 때문에 질문 프레이즈이다. 이 코드 섹션은 약 -4 내지 +1 반음(Eb 7 b9에서 Ab 7 b9) 범위 내로부터 임의의 코드에서 쉽게 시작할 수 있으며 여전히 효과적이라는 점은 주목할 가치가 있다; 그러나, 이전 프레이즈의 G 7 b9의 반복은 이 빌드업에서 반음계 상승의 시작을 접지하고 시작 컨텍스트를 제공하는 데 도움이 된다. 물론 이전 G는 다르게 생성될 수 있으므로, 본 발명에 의해 생성되는 휴리스틱에서 이 코드의 시작은 이전 Form Atom과 관련된 이전에 생성된 코드 스킴의 마지막 코드 반복이어야 한다는 경향이 있다.
Form Atom 5(순차적): 마디 13 및 14
이것은 Form Atom 4에 대한 이스케이프 코드를 포함하며, 따라서 이것은 답변 프레이즈이다. 이 이스케이프 프레이즈의 코드는 단조이며, 음조는 마지막 시퀀스 코드로부터 +5 반음이다. 마디 14의 9 #11 13 코드는 이스케이프 프레이즈의 클라이맥스 포인트 역할을 한다. 이것은 현재 코드의 엠벨리시(embellishment)를 기반으로 코드 기능을 구축하는 방법에 대한 유용한 예이다. 본 발명의 휴리스틱은 "엠벨리시"라는 감정적 의미로 라벨링되며, 요청 시에 코드 생성 및 간격 휴리스틱이라고 부른다.
경험적으로, 이 코드 시퀀스를 다수의 로컬 으뜸음으로 설명할 수 있다. 첫 번째 으뜸음은 일반 3화음이고, 마지막 으뜸음은 베이스에서 코드의 세 번째 위 #11번째 및 13번째로 있는 완전히 중단된 코드이며, 이에 따라 첫 번째 전위를 생성한다. 이 두 지점 사이에 있는 모든 으뜸음들은 최종 상태에 적응하기 위해 하나의 음표를 변경한다. 으뜸음의 수는 마디의 수에 따라 달라진다. 본 발명에서는 최종 규정된 코드가 있는 마지막 마디까지 마디당 두 개의 코드를 사용한다. 변경 사항들이 부족하지만 여전히 채울 코드 공간이 있는 경우, 시퀀스에서 후자의 코드들을 변경하여 반 마디가 아닌 한 마디를 차지하도록 한다.
Form Atom 6(종지적): 마디 15-18
마디 15에서, Harry Potter가 빗자루에서 떨어져 목이 부러졌다면, 우리는 Williams가 지금까지 보여준 독립적인 빌드업에 만족했을 것이다: 이스케이프 기능은 Abm 코드로 해석되어 효과적으로 큐를 완료할 수 있다. 그러나, Harry가 가파른 급강하에서 빠져나와 유일한 비행자가 되기 위한 경쟁에서 적을 잃게 되므로, 우리는 성공에 대한 기대와 승리를 위한 빌드업을 받게 된다.
긴장감을 계속 돋우기 위해, Williams는 Em #11 13에서 Eb/G로 들어 올리는 것을 선택한다. 이것은 결론과 반대되는 방식으로 답변 프레이즈에서 해결하는 새로운 방법을 제공한다. Eb가 새로운 키로 설정된다. 그럼에도 불구하고, 이 작품은 리디안 멜로디로 끝나고 Eb의 마지막 반복되는 코드로 차분하게 사라질 수 있다. 그러나, 마디 17에서, 코드 스킴은 Em에서 2nd 전위 B 코드가 도착하면서 다시 한 번 강화된다.
이것은 즉각적인 탈출로 현재의 한 사이클을 넘어 확장될 수 있는 새로운 타입의 순차적 움직임, 즉 반음의 상승 코드 쌍을 드러낸다. 이것이 도 16 - 퀴디치 경기의 Form Atom 6 순차 종지에 나와 있다. 이것은 이전 Form Atom의 마지막 코드에서 코드를 가져와 장조 또는 단조의 조성을 검토한다. 장조인 경우, 이 새로운 마디의 첫 번째 코드는 루트가 반음 더 높은 단조 첫 번째 전위 1 코드이다. 단조인 경우, 이것은 같은 루트의 첫 번째 전위 장조 코드이다. 그 다음 이 패턴은 이스케이프 코드가 필요할 때까지 반복된다.
이스케이프 코드는 +7 반음의 단조 해결 및 +8 반음의 장조 해결과 관련이 있다. 이스케이프 코드는 두 번째 전위에 있으며 장조 코드이다.
종지적 비 으뜸음의 표준 코드 스페이서는 원하는 간격을 제공한다.
Form Atom 7(순차적): 마디 19 - 22
이 두 개의 코드 프레이즈는 첫 번째 반복 후 이스케이프하는 시퀀스로 해석될 수 있다. 그러나, 이것은 빌드업 전반에 걸쳐 걸리는 시간을 늘리기 위해 길어질 수 있다. 이 패턴이 도 17 - 퀴디치 경기의 시퀀스 및 이스케이프 프레이즈 7과 8에 나와 있다.
Form Atom 8 및 9(종지적): 마디 23-26
마디 23과 마디 24에서 Form Atom 8(그리고 마디 25와 마디 26에서 Form Atom 9로 반복됨)은 Form Atom 7로의 이스케이프 코드로서 기능하며, Bb의 새로운 으뜸음을 제공한다. 명백한 바와 같이 John Williams는 두 번째 전위 코드를 이스케이프 코드로서 사용하였고, 조성은 독특한 풍미를 제공한다. 이것은 두 번째 전위와 시퀀스의 마지막 코드와의 관계를 기반으로 적절한 이스케이프 코드를 예측하는 보다 일반적인 메커니즘을 연구하기에 충분한 증거를 수집하는 시작이지만, 패턴이 있는지 확인하기 위해서는 다른 태스크들에서 이에 대한 더 많은 예를 볼 필요가 있다.
텍스처 분석 예
다양한 프리미티브 음조 및 리듬 휴리스틱을 살펴보았다(위의 "프리미티브 음조 휴리스틱"이라는 제목의 하위 섹션). 이 섹션에서는 이들을 사용하여 텍스처를 생성하는 방법에 대해 설명한다. 논의를 방해하지 않도록 Bach의 C 단조 전주곡에 대한 훨씬 더 심층적인 분석을 아래 섹션 D에서 참조하도록 한다. 본 발명은 "텍스처"라는 제목의 이전 하위 섹션에 설명된 프로세스를 통해 절차적으로 단계를 진행할 것이다.
이 섹션에서는 도 18의 악보에서 볼 수 있는 디태치 스트링 쓰기의 생성 버전을 생성할 것이다. 이 도면은 적색(고음, 첫 번째 마디의 음표 E), 녹색(다른 모든 음표 제외) 및 황색(기본 음표 및 첫 번째 마디의 첫 번째 코드 3화음의 기타 음표) 컬러링 시스템을 통한 휴리스틱의 엔트로피, 중복성 및 전개를 보여준다.
도 18의 악보는 음표 음조에 대한 연관된 컬러 라벨들이 있는 디태치 스트링 쓰기의 4 마디 섹션이다. 이것은 바이올린 1번과 2번, 비올라, 첼로, 더블베이스에 걸쳐 첼로를 두 배로 늘리고 한 옥타브 아래로 울리는 오케스트라이다.
이러한 작곡 스타일은 Bourne Supremacy(Crowley & Greengrass, 2004)와 Armageddon(Bruckheimer & Bay, 1998)과 같은 많은 할리우드 스릴러와 스파이 음악에서 전형적으로 나타난다. 분석적 관점에서 볼 때, 이 기술이 등장하는 영화의 특정 기호들과 연관되어 있는지 연구할 가치가 있다 - 너무 유명해서 진부한 표현이 되었다. 이것은 일반적으로 액션 장면에 거친 긴장감을 더하는 데 사용된다. 이것은 아드레날린이 솟구치는 추격전을 본격적으로 시작하는 액션으로 뒷받침한다. 이러한 이유로, 이것은 악기에 대해 가능한 가장 낮은 범위에서 오케스트레이션되는 경향이 있으며, 이는 일반적으로 리듬 패턴이 이 리듬 또는 음조 영역의 다른 악기에 의해 난독화되지 않고 주요 특징이 될 수 있는 텍스처의 공간을 제공한다는 것을 의미한다.
스트링들을 가능한 한 낮춰야 한다는 이 요구 사항은 유용한 시작점을 제공한다. 바이올린과 비올라에서는 코드들이 닫혀 있기 때문에, 음조-심도 제한이 제 2 바이올린에 적용된다. 이를 위한 휴리스틱은 이전 휴리스틱을 기반으로 하지 않고 제 2 바이올린을 위해 생성되며, 결과적으로 제 2 바이올린의 첫 번째 음표 음조는 적색으로 표시된다. 이 경우, 이것은 텍스처 상단으로부터의 두 번째 음표가 아래로 내려가지 않고 하단 G에 최대한 가까워지는 것으로 제한하는 것을 의미한다. 그 다음 제 1 바이올린은 그 위에서 전위를 연주하고, 비올라는 아래에서 전위를 연주한다. 제 1 바이올린과 비올라의 첫 번째 음표들의 음조는 모두 제 2 바이올린을 위해 만들어진 휴리스틱의 전개들이며, 결과적으로 황색으로 표시된다.
베이스와 첼로는 가능한 한 낮게 조화를 이루며 연주한다. 따라서 이들은 제 2 바이올린과 유사한 절차를 따르지만 가장 낮은 음은 MIDI C1(36)이다. 결과적으로, 이들은 제 2 바이올린을 위해 개발된 것과 동일한 휴리스틱을 사용할 수 있지만 가장 낮은 음조에 대해 다른 매개변수를 사용할 수 있다. 따라서 첫 번째 음표에 대해 음조를 황색으로 표시한다. 본 예의 나머지 음표들에 대한 모든 음조는 첫 번째 음표 음조와 정확히 동일한 휴리스틱을 사용하여 생성되므로, 음표 헤드들이 녹색으로 표시된다.
코드가 바뀌기 전에 코드가 하나의 퀘이버이면, 새로운 코드가 예상되거나 푸시되어 선제적인(pre-emptive) 업비트가 발생한다는 점은 주목할 가치가 있다. 이것은 마디 1의 끝 부분에서 볼 수 있으며, 코드가 마디 2의 것으로 바뀔 때 조기 퀘이버이다. 이러한 이유로, 주어진 코드뿐만 아니라 바로 다음 코드에 필요한 음조도 계산해야 한다. 그 후에, 리듬 생성기가 코드들의 배치를 생성했을 때, 코드가 코드 변경에서 멀리 떨어진 퀘이버이면, 다음 코드의 음조를 적용할 수 있다. 이 푸시는 리듬 어댑터에서 계산되며, 이를 통해 후자는 퀘이버의 시간에 코드 변경이 이루어지는지를 알 수 있으며, 긍정인 경우, 현재 코드 위치의 음조에서 다음 코드 위치의 음조로 선택을 변경하는 방법을 알 수 있다.
단계 1: 음조들
분석의 음조 구성 요소에 대한 하이퍼노드 구조는 다음과 같다:
제 1 하이퍼노드는 AND 하이퍼노드이며, 100%의 확률로 목록의 모든 요소를 처리한다.
1. 100% - 코어: 셋업 아이디어 보표
이를 통해 현재 코드에 대해 5개의 음조 저장 위치가 있는 스트링이라는 명칭의 아이디어 보표가 셋업되고 다음 코드에 대해 5개의 음조 저장 위치가 있어, 총 10개의 위치가 제공된다. 텍스처 어댑터가 전류 트리거 후 코드 변경 퀘이버의 존재를 감지하면, 어레이 위치 검색에 5를 추가하여, 코드의 음조들을 선택한다.
2. 100% - 앤드 하이퍼노드: "바이올린 2"
2.1 100% - 코어: 보이스 리더
(a) 이 보이스는 고정된 수의 MIDI G2(55)로부터 이어진다.
(b) 방향은 위쪽이며, G2로부터 변경할 필요가 없다.
(c) 참조할 코드는 이 마디의 코드 스킴이다.
(d) 음조 데이터의 대상은 스트링 위치 2이다.
2.2 100% - 코어: 음표 선택기
다음 휴리스틱은 2.1의 제 1 휴리스틱 프로세스를 반복하지만, 코드에 참조할 1-마디 오프셋이 있으므로, 코드에서 따를 음조를 선택한다. 그러나, 현재 코드가 코드 스킴의 마지막 코드인 경우, 찾을 데이터는 없다. 리듬 어댑터는 Form Atom의 끝 부분에서 트리거된 퀘이버가 존재하는 경우 이 어레이 위치에서 음표를 탐색한다. 따라서, 이것은 이러한 상황에 대처하기 위한 선제적 휴리스틱이다. 이것은 단순히 2에서 카피된 값으로 스트링 어레이의 위치 6을 초기화한다.
2.3 100% - 코어: 보이스 리더
앞서 언급한 바와 같이, 이 휴리스틱은 2.1의 휴리스틱과 동일하지만 코드에 참조할 1-마디 오프셋이 있으므로, 코드에서 따를 음조를 선택할 수 있다.
3. 100% - 앤드 하이퍼노드: "바이올린 1"
3.1 100% - 코어: 보이스 리더
(a) 이 보이스는 현재 마디의 바이올린 2로부터 코드에서 사용할 수 있는 다음 음표로 이어진다.
(b) 방향은 위쪽이며, 바이올린 2 참조로부터 강제로 변경된다.
(c) 참조할 코드는 이 마디의 코드 스킴이다.
(d) 음조 데이터의 대상은 스트링 위치 1이다.
3.2 100% - 코어: 음표 선택기
바이올린 2의 선점형 휴리스틱과 마찬가지로, 스트링 어레이의 위치 5를 1에서 카피한 값으로 초기화한다.
3.3 100% - 코어: 보이스 리더
이 휴리스틱은 3.1의 휴리스틱과 동일하지만, 참조할 코드에 1-마디 오프셋이 있으므로, 다음 코드에서 음조를 선택한다.
4. 100% - 앤드 하이퍼노드: "비올라" 4.1. 100% - 코어: 보이스 리더
(a) 이 보이스는 현재 마디의 바이올린 2로부터 코드에서 사용할 수 있는 다음 음표로 하향 이어진다.
(b) 방향은 아래쪽이며, 바이올린 2 참조로부터 강제로 변경된다.
(c) 참조할 코드는 이 마디의 코드 스킴이다.
(d) 음조 데이터의 대상은 스트링 위치 3이다.
4.2 100% - 코어: 음표 선택기
선점형 휴리스틱: 3에서 카피된 값으로 스트링 어레이의 위치 7을 초기화한다.
4.3. 100% - 코어: 보이스 리더
이 휴리스틱은 4.1의 휴리스틱과 동일하지만 참조할 코드에 1-마디 오프셋이 있으므로, 다음 코드에서 음조를 선택한다.
5.100% - 앤드 하이퍼노드: "베이스"
5.1 100% - 코어: 보이스 리더
(a) 이 보이스는 고정된 수의 MIDI C1(36)로부터 이어진다.
(b) 방향은 위쪽이며, 참조로부터 강제로 변경되지 않는다.
(c) 참조할 코드는 이 마디의 코드 스킴이다.
(d) 음조 데이터의 대상은 스트링 위치 5이다.
5.2 100% - 코어: 음표 선택기
선점형 휴리스틱: 5에서 카피된 값으로 스트링 어레이의 위치 10을 초기화한다.
5.3 100% - 코어: 보이스 리더
이 휴리스틱은 5.1의 휴리스틱과 동일하지만, 참조할 코드에 1-마디 오프셋이 있으므로, 다음 코드에서 음조를 선택한다.
6. 100% - 앤드 하이퍼노드: "첼로"
6.1 100% - 코어: 음표 선택기
이 음표는 위치 5의 베이스를 카피한다(첼로로 오케스트레이션될 때 한 옥타브 더 높게 들림).
6.2 100% - 코어: 음표 선택기
이 음표는 위치 10의 베이스를 카피한다.
이렇게 하면 텍스처들을 생성하는 데 필요한 모든 음조 정보를 얻을 수 있다.
단계 2 - 리듬
이제 리듬을 고려해야 한다. 각 마디에는 두 개의 코드가 있다. 제 1 코드는 비트 1, 제 1 또는 제 2 퀘이버에서 나타난다. 제 2 코드는 포인트, 또는 스태브를 공격하며, 비트 2 또는 4의 +에 나타난다. 키트 파일의 리드미컬한 하이퍼노드는 다음과 같다:
1. 100% - XOR 하이퍼노드: "1 또는 1+"
이 노드는 마디의 제 1 스태브가 제 1 비트의 제 1 퀘이버에서 나오는지 또는 제 1 비트의 제 2 퀘이버에서 나오는지 여부를 선택한다.
1.1 50% - 앤드 하이퍼노드: "1"
1.1.1 100% - 드럼: 1바이올린 1
(a) 이것은 다른 모든 드럼을 카피할 드럼 템플릿이다.
(b) 그리드 해결 = 8. 100% 확률로 122의 속도를 가지고 제 1 비트에서 트리거된다. 속도는 10씩 무작위화된다(122는 117 내지 127 사이의 범위를 제공한다). 루프 길이는 4 비트이다. 길이는 1개의 퀘이버이다. 음조는 위치 1로 설정된다(스트링 아이디어 보표의 위치).
1.1.2 100% - 드럼: 1바이올린 2
드럼 바이올린 1의 카피본. 음조가 위치 2로 설정된다.
1.1.3 100% - 드럼: 1비올라
드럼 바이올린 1의 카피본. 음조가 위치 3으로 설정된다.
1.1.4 100% - 드럼: 1첼로
드럼 바이올린 1의 카피본. 음조는 위치 4로 설정된다.
1.1.5 100% - 드럼: 1더블베이스
드럼 바이올린 1의 카피본. 음조는 위치 5로 설정된다.
1.2 50% - 앤드 하이퍼노드: "1+"
1.2.1 100% - 드럼: 1+바이올린 1
간단히 말해서, 이 노드에는 휴리스틱 1.1의 모든 드럼 카피본이 포함되어 있지만, 확률 그리드는 제 1 퀘이버가 아닌, 마디의 제 2 퀘이버에서 100%이다. 드럼의 명칭이 다르기 때문에(+ 부호 포함) NOT 및 어트랙터 목록들을 필요로 하는 경우 유사한 명칭의 드럼들 간에 차이점을 표시할 수 있다는 점은 주목할 가치가 있다.
1.2.2 100% - 드럼: 1+바이올린 2
1.2.3 100% - 드럼: 1+비올라
1.2.4 100% - 드럼: 1+첼로
1.2.5 100% - 드럼: 1+더블베이스
2. 100% - XOR 하이퍼노드: "1 또는 1+"
이 노드는 마디의 제 2 스태브가 2+ 또는 4+에서 나오는지 여부를 선택한다.
2.1 50% - 앤드 하이퍼노드: "2+"
2.1.1 100% - 드럼: 2+바이올린 1
이러한 휴리스틱은 휴리스틱 1.1의 모든 드럼들의 카피본이지만, 확률 그리드는 2+에서 100%이다.
2.1.2 100% - 드럼: 2+바이올린 2
2.1.3 100% - 드럼: 2+비올라
2.1.4 100% - 드럼: 2+첼로
2.1.5 100% - 드럼: 2+더블베이스
2.2 50% - 앤드 하이퍼노드: "4+"
2.2.1 100% - 드럼: 4+바이올린 1
이러한 휴리스틱들은 휴리스틱 1.1의 모든 드럼들의 카피본이지만, 확률 그리드는 4+에서 100%이다.
2.2.2 100% - 드럼: 4+바이올린 2
2.2.2 100% - 드럼: 4+바이올린 2
2.2.4 100% - 드럼: 4+첼로
2.2.5 100% - 드럼: 4+더블베이스
이러한 휴리스틱들은 사용자 지정 리듬 어댑터에 의해 처리된다. 이 어댑터는 다음 코드 또는 프레이즈의 끝 부분이 주어진 트리거된 퀘이버에서 멀리 떨어져 있는지 확인한다. 긍정인 경우, 음조 위치에 5를 더한다. 이것은 스트링 아이디어 보표에서 다음 마디의 음표들을 선택한다.
섹션 D
I. 본 발명의 실시예들의 생성 시스템 및 양태들을 위한 휴리스틱을 생성하기 위한 Bach C 단조 전주곡의 컨텍스트 분석
DC.1 요약
이 연구의 목적은 분석된 작품과 다른 많은 작품들을 재현할 수 있는 일련의 모범적인 휴리스틱들을 만들기 위해 Bach 전주곡을 분석하는 것이다.
컨텍스트적으로 이 분석은 정성적 음악 데이터를 정량적 경험적 데이터로 전환하는 방법을 제공하고 코드 조옮김/조작, 코드 구성 및 음표 생성 처리 측면에서 위에서 설명한 타당성과 접근 방식을 보여준다.
알고리즘들의 추상화는 기본적으로 전문가의 정성적 의견을 기반으로 한다. 이러한 알고리즘들에는 관찰 가능한 결과들로 변경될 수 있는 다양한 매개변수들과 기준들이 있다. 이는 각각의 주장의 효과를 측정하고 모든 컨텍스트들에서 일관된 음악적 결과들과 작업을 제공하는 휴리스틱들의 뱅크를 만들 수 있다.
D.2 도입
작품 전체를 재현하는 간단한 일련의 휴리스틱들을 식별하고 개발하는 동시에 이러한 알고리즘 프로세스들은 다양한 고품질 자료도 만들 수 있다.
다른 분석 방법과 마찬가지로 이 분석 방법의 적용은 주관적이고 반복적이다. 그러나 그 결과들은 분석의 타당성을 테스트하는 데 사용할 수 있는 경험적으로 측정 가능한 일련의 휴리스틱들에 대한 로드맵을 제공한다. 이 방법을 통해 로드맵을 식별하여 정성적 분석을 수행하고 이를 정성적으로 판단할 수 있는 일련의 휴리스틱으로 변환한다.
고려 중인 작품은 Well Tempered Clavier(1722)의 첫 번째 책에 나오는 Bach의 C단조 전주곡 중 처음 24 마디들이다. 여기에는 처음 24 마디들의 데이터에서 얻을 수 있는 세 가지 알고리즘들에 대한 데이터가 포함된다. 이 마디들은 작품의 첫 번째 버전의 대부분을 구성하며, 그 후 마디 25에서 마디 35로 점프하고 C 장조의 한 마디로 끝나 총 27 마디가 된다(Ledbetter, 2002, p.152).
다음 연구는 4개의 영역들로 나뉘는데, 3개는 텍스처 휴리스틱들이고 1개는 프레이즈 분석이다.
D.3 분석 방법
분석 전반에 걸쳐 프레이즈 구조들과 음표 음조들이 강조된다. 목적은 순전히 무엇이 엔트로피적이고 중복적이며 개발된 자료인지를 확립하는 것이다. 도 19는 "엔트로피적"(가장 어두운 음영, 마디 1의 음표들 1에서 3까지의 위치 및 마디 2의 고음에서 위치들 2에서 4까지의 음표들의 위치)을 나타내기 위해 미리 정의된 적색의 컬러 스킴을 사용하여 처음 두 마디에서 엔트로피, 중복 및 개발된 자료의 일반적인 구조를 도시하고, 녹색은 "중복적"(중간 색상 음영, 마디 1의 음표 4의 위치, 마디 1과 마디 2의 나머지 모든 음표들의 위치, 적색 또는 황색으로 명시적으로 식별된 음을 제외하고)을 나타내고 황색은 "개발된"(가장 밝음 음영 및 마디 2의 고음과 베이스 모두에서 첫 번째 음표)을 나타낸다.
D.4 형식 개요
손에 있는 작품과 관련하여, (Bruhn, 1993)는 그것을 네 가지 구조적 섹션들로 나눈다.
1. 마디 1-4(C 단조의 완벽한 종지)
2. 마디 5-14(Eb 장조로 전조)
3. 마디 15-18(C 단조로 다시 전조)
4. 마디 18-38(C에서의 복잡하고 확장된 종지)
분석은 주어진 섹션의 기능에서 보다 역동적인 유동성을 사용한다. 이 섹션에서는 작품이 동일한 알고리즘 프로세스의 세 가지 다른 변형들로 나뉜다는 것을 보여준다. 섹션 1은 마디 1에서 마디 18까지 이 프로세스의 첫 번째 변형이다. 섹션 2는 마디들 19 및 20에 있는 두 번째 변형이다. 섹션 3은 마디 21에서 마디 24까지 지속되는 세 번째 변형이다. 이 섹션들은 각각 다른 알고리즘 프로세스를 통해 자료를 제작하고 Bach 전주곡의 구조에 대한 통찰력을 제공한다. 형식적인 관점에서 이러한 각각의 섹션은 더 많은 모듈식 구성 요소들로 나눌 수 있다.
본 발명의 생성형 작곡 시스템 전체에서, 형식은 탄력적이고, 그것이 구성되고 있는 영화와 같은 멀티미디어 제품의 구조에 기초한 일련의 간단한 요구 사항들을 개선함으로써 지시된다. 다양한 브리핑 요구 사항들을 사용하여 코드 섹션들을 늘리거나 줄이는 방법을 자세히 설명하는 프로세스들이 설명되어 있다.
D.5 프레이즈 분석
이 프레이즈 분석의 목적은 코드 스킴들을 생성하고 작품들을 형성하는 세 가지 별개의 상이한 일련의 휴리스틱들을 정의하는 것이다.
D.5.1 프레이즈 1 (cadential): 마디 1 내지 4
이 프레이즈는 C 단조의 키 중심을 강조하는 반복 가능한 진술로서 기능한다.
IV 딤이 로컬 으뜸음의 종지 코드로서 사용될 수 있음을 보여준다.
D.5.2 프레이즈 2(시퀀스): 마디 5 내지 12
기존 분석에서는 이 섹션을 첫 번째 전위 장조 코드를 세 번째 전위 딸림음 9도, 도시된 베이스를 6-3 에서 6-4-2로 사용하는 하강 음계의 조화로 간주한다(Ledbetter, 2002). 마디들 5와 6의 Ab 내지 D7 코드들이 엄격한 5도권 패턴을 따르지 않는다는 점을 제외하고는 이것을 5도권으로 간주할 수 있다.
따라서 다음은 기존 분석이 제공할 수 있는 것보다 더 많은 접근 방식, 즉 장조 또는 단조 하모니의 선택과 엄격한 5도권 외 주기에 있는 이러한 근음들의 선택을 설명하기 위한 일련의 논리적 휴리스틱들을 적용한다. 이 접근 방식은 시스템이 멜로디를 조화시키기 위해 임시로 코드를 생성하는 것을 허용하지 않고 우선 순위 음 또는 키 중심이 손실되는 음색 음악의 영역 밖으로 밀려나는 것을 방지하기 때문에 필요한 것으로 간주된다.
그러나 평가는 본 명세서에 설명된 작곡 원리들에 기초하여 새로운 코드 스킴들이 생성되는 경우 특정 코드 스킴들을 분류할 수 있어야 한다.
마디 5 내지 14 사이의 코드 스킴에 대해 가능한 몇 가지 가능한 판독들이 있다. 그들은 멜로디 단음계의 인터벌 관계, 즉 코드 스킴이 Ab로 돌아올 때까지 각각의 새로운 코드에 대해 3음계 음정들을 상승시키는 관계를 따른다(주어진 음계 내에서 하강 5도권과 동등함). 이것은 시퀀스 프레이즈로 해석될 수 있지만, 여전히 D7 코드를 생성하는 생성 구조를 제공하지 않는다. 더 흥미로운 판독은 3전음 대체의 원리에 관한 것이다. 재즈에서 알려진 이 방식은 딸림7화음에서 떨어진 3전음(또는 증4도)인 딸림7화음이 딸림7화음 대신 사용할 수 있는 것이다. 이것은 Ab = > D 7 = > Gm로의 조옮김을 지원한다. 그러나 Ab가 D7을 늘리기 위한 3전음 대체로 기능하는 경우 이러한 코드들을 조옮김하면 마치 Gm에 확장된 종지가 있는 것처럼 작품이 여전히 매우 자연스럽게 들릴 것이다. 이것은 단순히 사실이 아니며 테스트들에서 알고리즘에 의해 재생될 때 어색하게 들린다.
선호되는 판독은 단조에서 작품의 모든 개발된 섹션에 적용할 수 있는 시퀀스 프레이즈 방법을 사용하는 것이다. 하행 멜로디 단음계 내에서 임의의 위치를 선택한 다음 해당 음표에서 하행 음계를 만들고 코드 변경을 위해 모든 음을 반복한다. 예를 들어, Ab, G, G, F, F, Eb; 또는 D, C, C, Bb, Bb, Ab, Ab. 음계 내에서 반음이 나타날 때마다 패턴을 조화시키기 위해 딸림음이 3전음으로 대체되며, 음이 나타날 때마다 간단한 II V7 진행이 사용된다. 그런 다음 음계는 코드 시퀀스를 생성하는 데만 사용되므로 삭제된다.
D.5.3 프레이즈 3(종지적): 마디 13 내지 14
프레이즈 2 시퀀스에는 이스케이프 프레이즈가 필요하며, 이는 마디들 13내지 14에서 상대 장조 Eb에 대한 완벽한 종지로 발생한다. 이 시퀀스는 상대 단조의 음계에서 생성된다. 따라서 이스케이프 프레이즈는 시퀀스에서 무슨 일이 일어나고 있는지에 대해 미리 걱정할 필요 없이 상대 장조의 특정 키에 집중할 수 있다. 이것은 생성 메커니즘이 위의 의사 코드를 사용하여 C 키에서 D의 음계 위치에서 끝나는 경우와 같이 다소 흥미롭지만 실행 가능한 이스케이프 관계들을 만든다.
이것은 "chordList"의 마지막 두 코드들이 Bbm 및 Eb7이 됨을 의미한다. 제안된 이스케이프 메커니즘을 사용하면 Bbm = > Eb 7 => Bb7 => Eb를 얻을 수 있다.
D.5.4 프레이즈 4(종지적): 마디 15 내지 16
이 프레이즈는 C 단조의 원래 키 중심인 Eb 장조의 상대 단조에서 질문 역할을 한다. 이것은 상대 장조의 윗으뜸음 dom7화음을 사용하여 상대 장조에서 전조하는 방법을 제공하는데, 근음을 Eb로 해석하면 상대 장조 9 #11 13으로 분류될 수도 있다. 그런 다음 이 코드는 다음 답변 프레이즈에 연결된 Bb 7b9(이 코드 분류의 이유는 섹션 D.6.2 참조)를 호출한다.
D.5.5 프레이즈 5(종지적): 마디 17 내지 18
질문 프레이즈 4에 대한 답변 프레이즈이다. 그것은 윗으뜸 감소에서 으뜸음 단조에 대한 종지로 기능한다(이 코드 분류에 대한 이유는 섹션 D.6.2 참조).
D.5.6 프레이즈 6(순차적): 마디 19 내지 20
이 프레이즈는 첫 번째 휴리스틱을 적용한 두 번째 일련의 휴리스틱들을 나타낸다. 이것은 정의에 따라 마디 21의 이스케이프 프레이즈에 대한 빌드업 역할을 하기 때문에 독립적인 섹션임을 의미한다. 이 프레이즈는 현재 상승하는 감화음을 통해 서브 딸림음 단조에서 두 번째 전위 으뜸음으로 이동하는 코드 스킴을 특징으로 한다. 이 코드들에는 으뜸음 C 단조 코드가 보이싱 상단에 겹쳐져 있다. 이를 처리하는 방법에는 두 가지가 있다. 첫째, 이 시점에서 두 개의 코드들을 만들고 보이싱에 대한 규칙들을 제공한다. 둘째, C 단조 음표들에 기존 코드들 내의 컨텍스트를 제공한다. 이 두 번째 접근 방식을 사용하면 마디 19는 Fm7로, 마디 20은 F#dim으로 표현되지만 세 번째 세미퀘이버에서 B를 사용하면 이러한 코드들이 마디들의 텍스처에 적합하지 않게 된다. 텍스처를 장식하는 데 사용되는 휴리스틱은 C 단조를 기반으로 하는 것으로 보이며 프레이즈 전체에서 명확하게 지속된다. 따라서 두 개의 겹쳐진 코드들을 처음 판독하는 것이 더 의미가 있다. Fm 및 F# dim의 이 특정 예는 종지적 6-4에 도달하는 일반적인 방법이다. 그러나 이 일반적인 발명은 휴리스틱의 형식으로 설명할 필요가 있다.
섹션 2 (D.7)는 이 두 마디 프레이즈가 으뜸음 3화음의 처음 두 음표들인 C와 Eb가 코드 내에서 더 높은 음으로 가질 수 있는 다른 많은 코드의 확장이 될 수 있다는 사실에 따라 연주되는 것으로 보인다고 생각한다. 코드 내에서 또는 확장에서 이 코드들의 시퀀스 패턴을 만들기 위해서는 다음 의사 코드를 사용할 수 있다:
여기서 findChordWith()는 확장들(7도, 9도, 등)의 수에 관계없이 장조 또는 단조 코드를 반환하는 함수이다. 또한 감화음을 반환할 수도 있다.(이 경우 Ab5는 잠재적으로 Adim으로 반환될 수 있다.)
이 분석 방법을 통해 생성된 모든 휴리스틱들과 마찬가지로, 음악적으로 수용 가능한 상태를 유지하면서 가능한 한 다양한 음악적 아이디어들을 생성할 수 있는 방법들을 정의하려는 분석가의 첫 번째 시도를 생성하는 분석가의 핵심 정성적 판단이 있다. 따라서 이러한 휴리스틱은 규칙이 생성하는 음악적 아이디어들의 반환에 대한 판단을 내리는 분석가에 의해 정성적으로 개선된다. 이는 시험 실행 또는 실제 컴퓨테이션을 통해 수행될 수 있다. 이러한 개선들의 목적은 미리 정의된 청중이 인식하는 음악적으로 수용 가능한 결과를 가리키는 것이다. 따라서 분석가가 청중을 정의하기로 결정하는 방법은 작곡적 판단에 영향을 미친다. 서로 다른 의견들은 반환된 출력의 서로 다른 진실을 컨텍스트화할 수 있다. 이 특정 프레이즈의 경우, 재즈에 대한 심층적인 경험을 가진 분석가는 반환된 특정 코드들을 대체 코드들로 인식할 수 있으므로 무의식적으로 다른 분석가가 제공하지 않는 실행 가능한 컨텍스트를 제공할 수 있다. 좋은 작곡가는 주변 신택스를 통해 주어진 코드를 조율하고 준비할 수 있는 충분한 범위가 주어지면 인터벌들의 조합을 정당화하는 컨텍스트를 제공할 수 있다고 생각할 수 있다. 특정 시기의 작품들의 샘플 세트가 충분히 많다면 휴리스틱의 진화는 음악 역사의 한 지점에서 다른 지점으로의 코드들과 관습의 발전에 대한 통찰력을 높여준다.
이 분석의 경우, 취해진 입장은 결과들이 문제의 작품에 대해 관용적으로 들린다는 것이다. 반환된 가치들에 귀를 기울이고 인식을 통해 평가하는 이러한 정성적 접근은 Ball(2011, p. 69)이 표현한 것 ― "음악이 실제로 어떻게 들리는지 고려하지 않은 추상적인 추론을 사용하는 것은 실험들에 대한 '이론적' 정당화들을 추구하는 음악적 우상 파괴자들의 일반적인 습관이다." ―과 같은 비판들에 대한 보루를 제공할 수 있다.
여기서 Ball은 음악을 들을 때 마음이 겪는 청각-인지 프로세스들을 언급하고 있다. 인지적 프로세스의 모델을 고려하지 않고 음악에 대한 과학적 이론을 만드는 따르는 함정들은 Wiggins et al., (2010, p. 237)에 의해 강조된다. 그들은 "음악, 특히 음악적 구조는 마음 속에서만 존재하기 때문에 마음과 구별되는 과학적 이론이라는 개념 자체가 의심스럽다"고 주장하며, "[음악] 자체를 연구하기 위해서는 음악 분석가가 사용하는 암묵적 또는 암묵적 지식 ― 청취자들과 다른 활동적인 음악가들이 추론하고 경험하는 구조들 ― 과 이를 구축하는 프로세스들에 접근할 필요가 있다"고 주장한다.
본 명세서에 표현된 예시적인 연구는 이러한 암묵적 프로세스들의 정의들에 대한 기초를 제공하고, 그 이면에 있는 인지적 이론을 설명한다.
이 프레이즈 6의 경우, 두 개의 음표들에 두 개의 코드들을 곱하여 네 가지 가능성들을 제공한다. 두 코드들은 항상 하모니를 강조하기 위해 세 번째 음도를 특징으로 하며 이 섹션의 요점은 Eb에서 아래로 구축되는 코드에서 가장 낮은 확장들을 사용하는 것이다. 따라서 이 방법이 5도를 변경하는 코드를 반환하는 것과는 관련이 없다. 이 경우 근음이 없는 3도와 5도의 코드는 이미 사용 가능한 목록의 코드가 된다. 근음과 5도 코드의 대체 보이싱은 해당 코드의 조성에 대해 모호함을 남길 것이다. 이것은 코드의 상단에서 확장들을 추구하는 프레이즈 3의 경우는 아니지만, 이 컨텍스트에서는 보이싱 또는 보이스 리딩에 대한 다른 지원 증거가 없다. 또한 내추럴 7도에서 평평한 9도와 같은 종류의 3도의 관계를 생성하지 않는 인터벌들을 결합하는 것은 단일한 것처럼 보일 것이다. 결과적으로, 본 발명의 접근 방식은 다음을 통해서만 장조 및 단조 3도를 허용하도록 제한된 확장들을 반환한다.
(a) 7번째가 장조이거나 단조
(b) 9번째가 평평하거나 (7번째가 단조인 경우)또는 내추럴
(c) 11번째가 내추럴이거나 날카로워짐(9번째가 내추럴인 경우)
(d) 13번째가 내추럴
이 방법은 또한 반환할 코드의 상단 확장들을 만드는 음표들의 어레이를 사용한다. 코드를 만들기 위해 이 음표들 아래에 포함할 확장들의 수를 나타내려면 정수가 필요하다. 이 정수보다 확장들이 적은 코드들을 사용할 수 있는지 여부를 결정하는 데 부울이 필요하다. 생성된 코드가 존재하는지 여부를 확인하는 코드들의 배열을 허용한다.
D.5.7 프레이즈 7(순차적): 마디 21 내지 24
이 프레이즈는 두 개의 프레이즈들이 반복되는 것으로 해석된다. 첫 번째는 프레이즈 6부터 마디들 21 및 22까지 순차적으로 이스케이프 프레이즈 역할을 한다. 이 두 마디들을 반복하는 것이 가능하지만 상승 확장들로 반복 전체에 걸쳐 장식이 필요한 것처럼 느껴진다(실제로 이 작품이 마디 23과 24에서 하는 것처럼). 반복되는 프레이즈를 꾸밀 필요가 있는 것은 답변 프레이즈가 설명되는 방식이다: 즉, 반복되는 경우 종지 해결 절정의 방출로 구축되는 것처럼 보인다.
이 프레이즈는 초기 으뜸음-코드 텍스처를 만들고 메인 텍스처의 상단에 가장 가까운 실행 가능한 옵션인 멜로디 음표를 선택하여 상승하는 멜로디를 제공하는 방식으로 으뜸음에 대한 모든 종지들인 일련의 코드들을 만듦으로써 생성된다. (이 실행 가능성은 음표가 나중에 논의되는 것처럼 신호가 될 수 있을 만큼 주요 텍스처에서 충분히 멀리 떨어져 있는 것을 기반으로 한다(Deliege, 2001)). 후속 선택은 으뜸음에 대한 종지 코드와 으뜸음 텍스처의 반복이며, 종지 코드의 다양한 가능성들에서 이전 마디의 최고 음표 위에 있는 고음의 첫 번째 음표를 다음으로 사용 가능한 음표로 선택한다. 으뜸음 코드로 돌아갈 때마다 고음의 첫 번째 음(이전 종지 코드의 마디)에 대한 다음 확장이 위쪽으로 사용된다. 이로 인해 상단 멜로디 음표에서 텍스처의 다음 내려간 음이 고음의 위치 1에 있는 멜로디 음에서 두 옥타브 이상 떨어질 수 있다. 그러나 텍스처를 더 높게 다시 보이싱하면 텍스처는 위치 1에서 오른손 상단 음표의 옥타브 경계 내로 가져온다. 베이스 피규레이션은 고음 텍스처와 동일한 인터벌에서 시작하지 않는 한 동일하게 유지되며, 이 경우 하모닉 대안을 제공하기 위해 한 전위 더 높게 이동한다.
이것은 텍스처의 보이싱이 멜로디에 따라 달라진다는 것을 나타낸다. 이것은 옥타브 범위가 악기에 관용적이라는 점에서 전통적인 생각에서 벗어나지 않는다.
D.5.8 프레이즈 8(종지적): 35 끝까지
현재의 분석은 이 작품의 딸림음 결말의 장식에 관심이 없다. 이전 시퀀스 프레이즈는 이스케이프 프레이즈가 필요하다고만 말하면 충분하다. 이 컨텍스트에서 이스케이프 프레이즈는 두 마디들에 대한 으뜸음 코드이다. 이것은 마디 35(Ledbetter, 2002)로 잘린 작품의 원래 버전과 일치한다.
D.6 섹션 1: 마디 1 내지 18
D.6.1 초기 관찰들
1. 독립적 신태그마(또는 최소한 기호)의 증거는 각각의 마디가 후반부의 전반부의 완전한 카피를 포함하고 있다는 사실에서 비롯된다. 이것은 베이스가 C에서 Bb를 거쳐 Ab로 내려가는 마디 18에서만 변경된다. 이 예외는 나중에 분석에서 로컬화된 컨텍스트 내에서 고려될 수 있다. 각각의 두 번째 비트의 마지막 세 음조들이 첫 번째 비트의 마지막 세 음표 음조들과 동일하다는 사실에서 더 많은 중복성을 찾을 수 있다. 이 외에도 각각의 마디의 첫 번째 비트 내의 각각의 4번째 세미퀘이버는 두 번째의 카피본이다. 이것은 각각의 세 번째와 네 번째 비트가 처음 두 비트들의 카피본이라는 사실과 결합되어 각각의 마디의 4개 음표들 사이의 관계들을 알고리즘으로 설명하기만 하면 된다는 것을 의미한다. 마디의 나머지 부분은 이 자료에서 생성될 수 있다.
2. 각각의 마디에서 문제가 되는 4개의 음표들 중에서 세미퀘이버 1, 2, 및 5는 마디의 코드의 음표들이다(마디 14의 한 음표는 예외).
3. 첫 번째 세미퀘이버의 베이스 음표들은 작품의 대부분에서 페달을 나타내는 것처럼 보인다. 이 베이스 음표들은 특정 마디들에서는 변하지만 다른 마디들에서는 변하지 않는다. 종래의 판독들은 이 페달 음표를 마디 내의 반음계 음표로 분류했는데, 대부분의 판독들은 이를 인정하는 것 이상을 제공했다(Bruhn, 1993; Ledbetter, 2002). 기본 알고리즘이 효과적이려면 이와 같은 작곡 진술을 검토하지 않은 상태로 두는 것은 적절하지 않다. 오히려, 이 음표가 어떻게 동일하게 유지되는지, 음이 변경되면 어떤 일이 발생하는지, 음이 변경될 때 음표의 음조에 영향을 미치는 것이 무엇인지 입증해야 한다.
4. 3번째 세미퀘이버에 나타나는 비-코드 음표들이 있다. 이 음표들이 반드시 C 단조의 주어진 키에 대한 음계 음표들에 속하는 것은 아니다. 2번째 마디는 상단(오른쪽) 손에 E 내추럴로 이를 보여준다. 사실, 그것은 마디의 F 단조 코드의 이끔음으로 나타난다. Ledbetter(2002)는 Bach가 이 피규레이션에 도달하기 위해 Niedt의 Handleitung zur Variation(Niedt, 1989)의 VI장을 사용했다고 제안한다.
그러나 Niedt의 책은 음표의 도입에 대한 설명을 제공하지 않는다. 이 장에는 보이스를 이끌 때 "더 강한 하모니"를 얻기 위한 규칙들이 포함되어 있다. 두 번째 장에서는 자음과 불협코드 인터벌들의 설정 및 성공적인 해결을 위한 규칙들과 둘 다의 정의들을 명시하고 있지만, 이러한 규칙들은 이미 이루어진 선택의 사후 합리화에서 추상화될 수 있는 방식으로 음표들의 적절한 선택을 하기 위한 일련의 휴리스틱을 제공하지 않는다. 이 규칙들의 본질은 단지 Bach의 글에서 암시될 뿐(그것들을 깨뜨리는 그의 능력을 포함하여), 그것들은 우리에게 문제의 음표들의 음정 선택들에 대한 설명을 제공하지 않는다. 따라서 음조들을 생성하는 방법을 결정하기 위해 분석을 통해 휴리스틱 시스템을 얻어야 한다. 이 일련의 휴리스틱들은 인간의 미적 특성들을 유지하면서 음악의 정서적 자극들을 변경할 수 있는 매개변수들을 제공할 수 있어야 한다.
5. 피규레이션의 마디들 내에서 방향의 패턴이 장소에 따라 바뀐다. 다양한 마디들에서 Bach는 왼손의 피규레이션이 작동하는 방식의 패턴을 변경하기로 선택한다. 이를 위해서는 패턴 변경들이 필요한 시기와 적절한 변형들을 계산하기 위한 설명이 필요하다.
6. Bach의 함축된 멜로디는 다른 음표들이 피규레이션을 형성하는 주요 텍스처 밖에 있다. Deliege(2001)는 신호 추상화의 원리를 통해 이 현상을 설명한다. 형태 심리학 내의 그룹화 개념에 기초하여 마음은 이러한 음표들을 주요 텍스처에서 분리하여 멜로디 기능이 지속되는 느낌을 준다. 다음은 이를 알고리즘적으로 재현하는 방법을 고려하는 것이다.
D.6.2 텍스처
초기 관찰들의 3 지점에서, 2 마디의 E 내추럴을 마디의 F 코드에 대한 로컬 이끔음으로 취하여 음표의 음조에 대한 설명이 도출된다. 이것은 해당 음표가 F단조 코드의 딸림음인 C장조에서 파생되었음을 주장한다. 이 마디에서 E 내추럴 아래에 나타나는 G를 고려하면 이는 C장조 코드와 일치한다. 따라서 모든 마디에서 이 3번째 세미퀘이버 위치에 있는 모든 음표들이 마디 코드의 딸림음 또는 딸림7화음에서 온 것이라고 명시함으로써 작품의 나머지 마디들에서 흥미로운 패턴이 나타난다(감화음들은 포함하지 않고, 별도로 고려할 것). 각각의 딸림화음은 음계의 5도를 갖도록 보장된다. 다른 음표는 딸림화음을 제공하는 3도이거나 딸림7화음을 제공하는 평평한 7도이다. 더욱이, 이 5도는 항상 마디의 현재 코드 중 3도 코드 앞과 뒤에 온다. 이 패턴은 베이스 또는 고음에서 발생할 수 있다. 이 5도 음은 마디의 로컬 딸림음 코드의 3도 또는 7도 음표와 조화를 이루는 반면, 3도 음은 마디의 현재 코드의 근음 앞에 오고 7도는 5도에 의해 뒤따른다. 이것은 본질적으로 보이스 리딩을 보는 다른 방식이다: 마디의 메인 코드는 모드를 제공하기 위해 3도를 특징으로 해야 한다. 이 작품에서 패턴이 어떻게 작동하는지에 대한 관찰은 단순히 3도가 항상 로컬 딸림음의 5도까지 아래로 이동하고 다시(분석에서 3-5-3으로 밑줄 그어짐) 1도-3도-1도 및 5도-7도-5도 관계들에 대해서도 마찬가지라는 것을 나타낸다. 도 20은 주어진 마디의 근음과 관련된 딸림화음 내의 베이스와 고음 음표들을 보여준다.
다음 분석은 관련된 처음 5개의 세미퀘이버 위치들에서 각각의 음표의 움직임과 정도의 단순화된 버전을 보여준다. 세 번째 세미퀘이버의 음표들은 마디의 로컬 딸림음과 관련이 있다. 코드들을 구분하는 화살표들은 계층적 흐름을 나타낸다. Cm => G7은 Cm이 G7을 요구한다는 것을 의미한다. 알고리즘 측면에서 말하자면, 이것은 실제로 그 반대이다: G7은 Cm 코드가 어떤 딸림화음이어야 하는지 알기 위해 Cm 코드를 "볼" 필요가 있다. 이것은 단순히 G7의 음조가 Cm에 의존한다는 것을 의미한다.
적색(가장 어두운 음영) 음은 새로 관찰된 패턴의 엔트로피 특성을 보여준다. 예를 들어, 마디 2에서 3-5-3 구조는 이제 중복되고 1-3-1은 엔트로피이며 마디 1의 5-7-5에 대한 개발와 관련이 없다. 따라서 이것은 적색이다(C.3 참조). 또한 마디 3에서는 둘 다 중복되고 b3은 개발이므로 황색(가장 밝은 음영)으로 표시된다. 본질적으로, 우리는 발견된 초기 패턴들에 대처하기 위해 휴리스틱들을 설정한다. 이 작품을 통해 진행됨에 따라 발견되는 새로운 엔트로피 자료와 휴리스틱으로 설명할 수 없는 자료에 대처하기 위한 휴리스틱의 적응 또는 새로운 휴리스틱의 생성을 본다(이 예시적인 분석의 이 시점에서).
마디 2에는 코드의 근음과 관련된 엔트로피 베이스 음표가 포함되어 있다. 그러나 이것은 코드가 변경되었기 때문에 마디 1에서 페달을 개발한 것이 분명하다. 세미퀘이버 5에 나타나는 음표들은 이전 음표 아래의 코드 음표이다. 이것은 이미 마디 1에서 보았기 때문에 중복된다. 마디 2에 의하면, 분석의 음조 방향 화살표들이 본질적으로 완전히 중복되어 적용된 방법론을 입증한다.
마디 3은 고려된 섹션에서 두 개의 코드들 중 첫 번째 감화음이다. 이 코드는 인터벌 위치들을 표현하는 방법의 근본적인 특성을 변화시킨다. 처음에는 이러한 감소된 마디들이 딸림음들의 기능을 하는 것처럼 보이며, 장조 대신 3번째 세미퀘이버에서 감화음의 근음에 상대적인 단조를 호출한다. 이것은 중복되지 않으며 원래 작곡 개념의 새로운 개발이므로 다이어그램에서 황색(가장 밝은 음영)으로 표시된다. 이러한 감화음들을 3번째 세미퀘이버에 나타나는 로컬 딸림음으로 취급하는 것은 이차적 딸림음들의 원칙과 일치한다.
그러나 음계의 5도를 평평한 5도라고 분류하고 6도를 6도라고 부르는 것은 감화음와 같은 짝수 인터벌 코드에 대해 이야기하는 동안 의미가 없다. 감화음을 특징으로 하는 모든 마디를 자체 로컬 규칙들로 예외로 만드는 것이 가능하지만 이는 임시 규칙들을 만드는 것으로 이어질 것이다.
새로운 규칙은 문제가 되는 통계 데이터에 대해 단순히 반창고 역할을 할 뿐 이므로 이는 바람직하지 않다. 그러나 코드들 내의 음표 위치들의 해석을 단순히 주어진 음표들의 어레이 내의 위치들로 단순화함으로써 코드들을 어레이로 다시 표현할 수 있다. 따라서 C 단조 코드의 근음, 3도, 5도는 단순히 어레이의 [0], [1] 및 [2]가 된다.
어레이의 위치들에 포함된 실제 값들은 정수 표기법 {0,3,7}과 같이 음조를 반환하는 단조 코드 함수로 채워진다. 따라서 6도와 7도를 같은 것으로 간주할 수 있다. 즉, 코드 어레이의 위치[3]의 위치를 차지하는 음들이다. (또한 이 분석에서 개발되는 알고리즘 프로세스들을 기반으로 생성을 위해 쿼털 하모니와 같은 다양한 하모닉 시스템을 사용할 수 있다. 결과적으로, 마디들 1, 2 및 3은 도 21과 같이 어레이 위치들로 표현된다.
규칙 세트에 대한 이러한 단순화는 단순히 주어진 어레이 위치에 배치하여 어려운 확장을 쉽게 처리할 수 있음을 의미하지만 분석의 음악적 해석을 너무 추상적이고 어렵게 만든다. 따라서 3도, 5도 등과 같이 코드 내의 음표 위치들로 분석을 표현하는 것이 더 좋다(이것이 결국 적합한 컴퓨테이셔널 어레이 구조를 염두에 두어야 함). 도 22를 참조한다.
이 적응은 여전히 베이스가 이끔음 메커니즘을 통해 얻는 하모닉 독립성에 대처하는 데 도움이 되지 않지만 더 감화음들을 조사하면 패턴이 설정된다. 이 분석에서 볼 수 있듯이 베이스는 메인 코드의 어레이가 아닌 자체 어레이를 따른다.
이것은 일반적으로 많은 작곡 스타일에 걸쳐 널리 퍼져 있으며 코드가 코드 내에 나타나는 음표들과 독립적으로 보일 수 있는 베이스 위에 있음을 나타내기 위해 슬래시를 사용하여 리드 시트에 표시된다. 결과적으로, 이것은 임시적인 규칙이 아니라, 단지 음악이 어떻게 표기되는지에 대한 사실이다.
감화음의 베이스에서 작동하는 모든 음표를 상상하는 것이 가능하다. 초기 가정은 감화음들이 다음 마디의 베이스 음표를 베이스로 취하여 페달을 생성하거나 계속한다는 것이다.
마디 3이 Fdim이라는 해석은 단순히 딸림음의 단조 버전이긴 하지만 코드가 딸림음의 3도와 5도 또는 딸림음의 5도와 7도를 3번째 세미퀘이버 위치에 갖는 패턴에 적합하게 한다는 것이다. 단순히 코드들을 Fdim으로 해석하면 2도, 3도, 4도 세미퀘이버들에 대처하기 위한 임시 규칙이 필요하지 않다.
코드 스킴이 페달 베이스 없이 근음 베이스만 사용하여 연주되는 경우 기존 판독은 이 음표를 이 마디에서 B 또는 G로 만든다. 그러나 Fdim의 선택된 재해석은 베이스를 F로 만들 것이다. 이것은 완벽하게 받아 들일 수 있다. 이것은 데이터 내의 복잡성들에 대한 비용 없이 모델을 단순화하는 것 외에 다른 이유 없이 악보의 재해석을 가리키는 컴퓨테이셔널 분석의 간단한 예이다.
도 23을 참조하면, 마디 4는 마디 1의 멜로디 음표의 반복으로 시작한다. 이 음조의 반복은 작곡에서 멜로디 음표의 반복이 처음으로 나타나는 것이다. 우리는 이 새로운, 결과적으로 엔트로피적인 개념을 분석 전반에 걸쳐 멜로디 흐름이 어떻게 명백해지는지에 대한 더 많은 증거로 고려할 것이다.
마디 4는 처음 세 마디들에서 볼 수 있는 피규레이션 패턴에 대한 첫 번째 변경을 제공한다. 실질적으로, 이것은 단순히 베이스에서 1번째 세미퀘이버부터 2번째 세미퀘이버로 선택된 인터벌 점프가 하향 패턴이 계속되면 1번째 세미퀘이버의 베이스 음표가 세미퀘이버 위치 5에서 반복된다는 것을 의미하기 때문이다. 따라서 이 음표가 상승하기 위한 요구 사항은 손에 잡히는 자료와 황색의 개발이다.
이는 분석된 24 마디들 중 10 마디들에서 발생한다. 도 24의 표는 베이스의 다섯 번째 세미퀘이버와 그것이 착지하는 코드 구성 요소를 보여준다. 베이스 또는 고음에 있는 로컬 딸림5화음(세미퀘이버 위치3)들과 5번째 베이스 세미퀘이버의 상향 또는 하향 움직임 사이에는 상관 관계가 없는 것으로 보인다.
패턴은 다음과 같은 이유들로 아래 나열된 마디들에서 위로 올라간다.
4: 1 번째 세미퀘이버의 반복을 피함.
10: 베이스의 7도가 이 두 음표들의 음도 진동을 통해 귀에 의해 식별되는 새로운 신호(Deliege, 2001)로 이어지는 1번째 세미퀘이버와 보이스 리딩 관계를 갖는 것으로 혼동되지 않도록 함.
11: 앞과 뒤의 마디들이 이동 패턴을 변경한다는 사실 외에는 이유가 없다. 이것은 휴리스틱 고려 사항들과 관련하여 Bach와 엔트로피의 선택이다.
12: 1번째 세미퀘이버를 반복을 피함.
14: 1번째 세미퀘이버를 반복을 피함(이것은 나중에 고려할 이 위치에서 음표들을 생성하는 새로운 방법에 대한 힌트이다).
17: 마디 10과 유사하게, 1번째 세미퀘이버와 5번째 세미퀘이버들 사이에는 음도만 있을 것이며, 이는 청취자에 의해 베이스 멜로디가 해석되도록 유도할 수 있다.
19: 1번째 세미퀘이버를 반복을 피함.
21: 마디 14 방법에 의해 생성되며, 이 위치에서 이러한 음표들이 생성됨.
23: 마디 14 방법에 의해 생성됨.
24: 마디 14 방법에 의해 생성됨.
따라서 패턴 변경 없이 5번째 세미퀘이버에서 음표를 생성한 다음 1번째 세미퀘이버에서 베이스 음표의 음 내에 있는지 확인하는 간단한 휴리스틱을 도출할 수 있다. 이 경우 패턴 변경이 트리거된다. 이에 대한 유일한 예외는 Bach가 마디 11에서 내린 미학적 선택이다.
마디 6은 딸림7화음 D 코드가 단순히 베이스 페달을 보존하기 위한 딸림화음인지에 대한 질문을 제기한다. Ledbetter(2002)는 이 작품에서 첫 번째 전위 장조 코드에서 세 번째 전위 딸림7화음(6-3에서 6-4-2로 수치화됨)을 하행 음계를 조화시키는 표준 방법으로 설명한다. 여기서 이 질문이 중요한 이유는 코드가 베이스의 움직임으로 인해 생성되는지 아니면 코드들의 선택으로 인해 페달이 생성되는지 확인하기 위해서이다. 우리는 현재 이것을 베이스를 만드는 코드들로 판독하기로 선택했는데, 이는 휴리스틱들을 단순화하기 때문이다. 베이스 음표는 이제 하행 베이스 음계에서 임시로 생성되는 코드가 아니라 선택되거나 생성된 코드 내에 속한다.
도 25를 참조하면, 마디들 7, 8,및 9는 1번째 세미퀘이버의 멜로디를 제외하고는 새로운 정보를 제공하지 않기 때문에, 마디들 8과 9가 마디들 6과 7의 완전한(이미 조옮김된) 카피들이라는 점에 주목하는 것은 흥미롭다. 이것은 우리가 정의하는 휴리스틱들이 그러한 상황들에서 여러 가지 다른 버전들과 보이싱들을 만들 수 있기 때문에 중요한 미적 관찰이다. Bach가 어떻게 완전한 중복을 사용하고 자신의 보이싱과 텍스처의 결정들을 반복하여 청취자의 시간적 예측들에 형식을 부여하기 위해 주목하는 것이 중요하다.
마디 11에는 Eb 코드 또는 Cm7 코드의 두 가지 가능한 판독들이 있다. 단7화음들은 실제로 Bach의 작품 전반에 걸쳐 널리 퍼져 있다(예를 들어, 이 모음곡 Bb 단조의 22번째 전주곡의 3번째 비트에서). Cm7 버전을 사용하면 첫 번째 섹션의 휴리스틱들의 베이스에서 1-3-1 관계를 만날 필요가 없고 예측 가능한 3-5-3 및 5-7-5 관계들만 만나면 된다. 그러나 단7화음들은 다른 마디에서 메인 코드로 나타나지 않기 때문에 이 작품의 담론에 나타나지 않는다.
이 분석에서 생성된 해독된 휴리스틱들에 이 마디에 Cm 7과 Eb 코드 모두 있는 이 작품의 코드 스킴의 버전들이 제공되면 Eb 코드로 연주되는 보이싱들과 편곡들이 훨씬 더 자연스럽고 적절하게 들린다. 따라서 알고리즘상의 이유들로 이 마디를 버전 11b로 판독하기로 선택했지만 실제로는 버전 11a이라는 것을 인식한다. 사실, 이것은 휴리스틱들의 선호되는 구성을 단순화하는 동시에 Eb 코드를 코드 스킴에 공급할 수 있도록 한다.
유일한 결과는 이 특정 마디의 보이싱이 불가능하다는 것이다. 이것은 더 많은 패턴들이 발견되고 더 나은 일반화들이 이루어짐에 따라 휴리스틱들의 이후 버전들에서 개발될 수 있지만, 이 분석이 본 명세서에 설명된 방법론을 기초하여 분석 및 생성형 작곡에 대한 기본 접근 방식을 증명하는 정도와는 관련이 없다.
앞서 언급했듯이 세미퀘이버 위치 5의 베이스가 마디 11에서 상승하기 위한 기능적 요구 사항은 없다. Bach의 이러한 결정은 특정 단계들 동안 엔트로피 문제로 남아 있다.
도 27을 참조하여, 마디 12는 Cmb6 코드와 Abmaj7/C 코드 사이에서 마음의 해석을 나눈다. 이것을 Abmaj7/C 패턴으로 간주하면 3-5-3 관계가 처음으로 분해되어 고음에서 7-5-7, 베이스에서 5-3-5를 제공한다. 이 코드를 Cmb6이라고 부르면 오른쪽의 초기 b6은 7도와 마찬가지로 어레이의 4번째 요소로 처리하여 수용될 수 있다. 그러나 5번째 세미퀘이버의 베이스에 있는 b6은 사용 가능한 5도(4번째 세미퀘이버의 3도에서 5번째 세미퀘이버 b6으로 이동)를 통해 점프하는데, 이는 작품의 나머지 부분에서 이러한 동작을 볼 수 없다는 점을 고려하면 문제가 된다.
베이스에 주요 큐를 만드는 것을 피하기 위해 이 위치의 베이스가 떨어지는 대신 상승하도록 하는 패턴 브레이크의 다른 버전들에서는 5번째 세미퀘이버의 아르페지오가 4번째 세미퀘이버위에 있는 마디의 코드 다음 음표를 특징으로 하는 것을 볼 수 있다. 여기서 [2] 어레이 위치로부터 [4]까지 올라간다. 이 모호함은 Bach가 분명히 원했던 것인데, 반복되는 b6가 마치 신호인 것처럼 튀어나오는 것을 느낄 수 있기 때문이다. 이렇게 하면 이 특정 마디에서 작품의 리듬이 두 배로 조정된 것처럼 들리는 효과가 생성된다.
새로운 가청 신호에 대한 이러한 필요성은 전조 지점에서 발생하는 특정 경로 처리될 수 있다: 이 시점에서는, 마디 14에서 Eb를 향한 움직임. 이것은 이 공통 화음의 중요한 위치와 관련하여 수용 가능한 것처럼 보이지만 알고리즘이 전조 지점에 민감해야 함을 의미한다. 이 마디는 또한 완벽한 4도 점프를 통해 베이스 페달을 다시 으뜸음으로 재설정한다. 이것은 지금까지 곡에서 베이스의 떨어지는 움직임을 고려하면 엔트로피적이다.
마디 14는 마디 코드의 4도까지 단계적으로 움직여 베이스에 완전히 새로운 아이디어를 도입한다. 이것은 이 위치에서 주어진 코드의 인터벌들을 사용하는 지금까지의 작품과는 완전히 다른 것이며, 작품의 후반 섹션들에서 개발되는 알고리즘을 암시한다.
만약 이 코드가 5번째 세미퀘이버에서 Ab 대신 Bb를 가진다면, 여기에는 엔트로피가 존재하지 않을 것이다.
여담이지만, 이 작품을 현대적으로 해석한 악보 버전이 Wagner-Volkmann의 자필로 알려져 있다는 점은 주목할 가치가 있다. 이 사본은 1722년에 작곡된 지 10년 후인 1732년에 만들어졌다. 원본 원고는 분실된 것으로 추정되며, 이 원고는 Bach 자신의 필체로 된 첫 번째 원고 중 유일하게 알려진 사본으로 남아 있다(Palmer, 1994).
그러나 Bach의 아들인 Wilhelm Friedemann은 Bach의 손으로 여러 가지 작은 수정들을 가하여 처음 11개의 전주곡들의 초기 형식들을 카피했는데, 이 버전은 Clavier-Buchlein버전으로 알려져 있다. 예일 대학이 소유한 이 버전은 Bach가 처음에 이 5번째 세미퀘이버 위치에 Ab 대신 Bb를 사용했었음을 분명히 보여준다. 이는 도 28에서 볼 수 있다.
위의 내용은 Bach가 나중에 작품에서 사용하는 프로세스들을 반영하기 위해 이후 개정판의 이 시점에서 음표를 변경했음을 시사한다. (이 프로세스들은 단순히 위치 3에서 딸림음이 사용되는 것과 유사한 방식으로 위치 5의 버금 딸림음을 사용한다.) 경험적으로, 이것은 분석 중인 첫 번째 섹션에서 이 특정 Ab 발생을 분리하고 이 피규레이션이 더 널리 퍼지는 프레이즈 3에서 얻은 휴리스틱들을 사용하여 고려할 수 있음을 의미한다.
도 29를 참조하면, 마디 16은 3-5-3 관계에 대한 흥미로운 딜레마를 도입한다. 이 마디가 Ddim 코드로 해석되면 위치 3의 C와 Eb는 D의 딸림음 A와 관련이 없다.
Bb가 실제로 마디에 전혀 나타나지 않음에도 불구하고, 3-5-3 관계가 유지되려면 C와 Eb는 두 가지 가능성들만 남는다: 딸림음은 F7 또는 Ab여야 한다. Ab는 마디가 Db의 코드라는 것을 암시하기 때문에 음악적 의미가 없다. F7은 3-5-3의 패턴을 유지하면서 Bb7b9에 대한 딸림음으로서 음악적 의미를 만든다.
Bb 코드는 이전 마디의 F7에 연결하여 코드 스킴 내에서 완벽하게 작동한다. (청각적으로 이 마디와 다음 마디는 매우 반음계로 유지된다.) 마디 16에 1도가 없다는 것을 이용해 첫 번째 어레이 위치가 b9를 보유할 수 있음을 제안할 수 있지만 b9를 포함하는 5번째 위치를 통합하도록 어레이를 확장하는 것이 더 일관성이 있다.
마디 17은 우리가 지금까지 작품 내에서 경험한 두 번째 감화음을 포함한다(마디 17의 판독을 받아들임). 3 5 3 관계는 마디 3의 첫 번째 감화음에서 경험된 바와 같이 3번째 세미퀘이버에서 또 다른 2차 딸림음(단조 딸림음)을 가리킨다. 이것은 일반적으로 감화음에 대한 딸림음 기능을 의미한다. 이 베이스 음표가 작품들에서 갖는 유일한 관계는 다음 마디에 있는 베이스 음표의 관계이다. 그러나 이것은 감화음과 관련하여 간단한 휴리스틱으로 이어진다: 다음 마디의 코드의 베이스 음표를 포함한다는 것이다.
도 30을 참조하면, 마디 18은 Autograph, Kirnberger, Gerber 및 Walther 원고(Palmer, 1994)에 기록된 베이스의 움직임을 포함한다. kroll 판만이 이 Bb 음표를 C로 남겨둔다(Ledbetter, 2002). 원래는 카피 오류로 여겨졌지만 나중에 일관성이라는 이름으로 정당화되지 않았다. 이것은 분명히 Bach가 섹션을 끝내고 마디 19에서 F단조로의 이동을 강조하기 위해 설정한 신호이다. 이 코드는 해당 문제의 섹션을 끝낸다.
베이스의 이러한 연결 움직임은 이 신호가 어떻게 활용되는지에 대한 예들이 부족하기 때문에 마디들 1 내지 18에 대해 개발할 현재 휴리스틱들과 관련하여 무시된다. 9번째 세미퀘이버에서 Bb를 생성하는 휴리스틱은 더 이상의 증거가 없는 임시 규칙이다. 5번째 세미퀘이버에서 베이스의 4도는 마디 14에서와 같이 다음 섹션들의 알고리즘 프로세스들로의 전환에 대한 추가 증거이다. 해석을 혼란스럽게 하는 또 다른 증거는 5번째 세미퀘이버의 이 F가 Clavier-Buchlein 버전에서 반복되는 C로 쓰여져 베이스 움직임에서 발생하는 신호를 강조한다.
D.6.3 섹션 1의 휴리스틱들: 마디 1 내지 18
다음 해설은 베이스와 고음의 음표들에 [0]에서 [15]까지의 어레이 위치들로 번호를 매겨 마디 내의 16개의 세미퀘이버 위치들을 나타낸다.
D.6.3.1 H1.0: [0]에서 베이스 계산
페달 음표: 각각의 마디의 첫 번째 위치에 있는 베이스에서 음표들의 엔트로피 특성은 이러한 가능성들을 만들기 위해 생성적 휴리스틱이 필요하다는 것을 의미한다. 마디의 코드 내에서 현재 페달 음표의 가용성과 음이 취하는 음조 값을 살펴보면 이전 마디의 베이스 음표가 현재 마디의 코드에 속하는지 확인하여 이 베이스를 계산할 수 있다.
음표가 그렇지 않은 경우, 이전 마디의 베이스 음표 아래 또는 위에 있는 코드에서 다음으로 사용 가능한 가장 가까운 음표가 선택된다. (음조의 이 방향은 위 또는 아래로 임의적이며 감독 형식 생성기에서 처리된 브리핑 요소들을 통해 암시 요청들에서 초기화할 수 있음을 의미한다.) 섹션들을 끝내는 데 사용되는 감화음들에는 예외가 있다: 그들은 단순히 끝나는 마디의 베이스에 있는 음표를 사용한다.
이는 작품을 만드는 동안 두 번의 패스들이 있어야 한다는 것을 의미한다. 첫 번째 패스는 감소절 없이 설명된 대로 베이스 음표들을 설정하는 것이다. 두 번째 패스는 감화음들의 베이스 음표들을 변경하여 이전 마디의 베이스 음표들이 아닌 다음 마디의 베이스 음표들을 보는 것이다. 이 더블 패스가 없으면 휴리스틱은 감화음에 도달할 때 널 포인터를 갖게 된다.
이 패턴은 베이스가 원점에서 반 옥타브 이상 떨어질 때까지 계속된다. 이 작품의 경우 으뜸음 C가 원점이며, 이는 이 C 아래 6 반음들인 F#이 리셋 위치임을 의미한다. 이보다 낮은 베이스 음표가 생성되면 패턴이 재설정되고 현재 코드 내에서 으뜸음의 초기 시작 베이스 음표에 가장 가까운 음표가 사용된다.
이것은 마디 12에서 음표가 마디 11의 베이스 G에서 원래 으뜸음 C로 점프하는 경우에 볼 수 있다. 손에 쥔 작품에서 페달이 전환된다: 항상 떨어지는 것이 아니라 더 높거나 낮은 가장 가까운 음표를 선택한다. 마디 6에서 7까지는 C에서 Bb로 떨어지고, 마디 12에서 13까지는 C에서 D로 올라간다.
D.6.3.2 H1.1: [1]에서 베이스 계산
18개 중 13개가 이 음표가 코드의 3도인 경우이다. 그렇지 않은 경우 코드의 5도이다. 휴리스틱들이 어떻게 들리는지에 대한 초기 조사 중에 다양성을 위해(선택들을 관리하는 우선적인 미적 휴리스틱들을 도입하기 전에) 간단히 50/50 시나리오로 만들 수 있다. 이것은 휴리스틱을 단순하게 만든다: 베이스 [1]을 [0]의 베이스 위의 3번째 또는 5번째 베이스로 무작위로 만든다.
D.6.3.3 H1.2: [2]에서 베이스 계산
[1]의 베이스 핸드 음표가 5도라면 이것을 딸림7화음의 7도로 만든다. 만약 그렇지 않다면, 베이스 [1]은 3도가 되어야 한다: 따라서 우리는 [2]를 딸림음 5도로 한다.
어느 쪽이든, [1]의 베이스 아래에 [2]를 조옮김한다.
D.6.3.4 H1.3: [4]에서 베이스 계산
도 24에 대한 설명에서 볼 수 있듯이 이 음표는 위치 [0] 값의 음 내에 들어오지 않는 한 [3]의 값([1]의 카피)보다 낮은 코드 위치가 되려고 하며 베이스에 신호를 만들 위험이 있다. 이 경우 사용 가능한 다음 코드 위치로 올라간다.
D.6.3.5 H1.4: [1]에서 고음 계산
[1]의 베이스가 5도인 경우 고음 [1]은 위치 [1]에서 베이스의 5도 위에 놓이는 보이싱이 아닌 3도 코드와 같다.
그렇지 않으면 이것이 베이스 위의 근음 또는 1도일 확률이 50/50이다.
그렇지 않으면 이것은 5도이다.
5도일 경우 마디들 4, 10, 11 및 12에서 볼 수 있듯이 이 값을 현재 음조에서 한 옥타브 위로 조옮김할 수 있는지 확인한다. 이전 마디의 [1]에서 고음이 현음인 경우 또는 현재 마디의 고음 [1]의 새 값에서 한 음 이하인 경우 현재 음조에서 한 옥타브 위로 조옮김을 수행한다. (이것은 나중에 미적 휴리스틱들이 도입될 때 보다 보편적이고 철저한 리팩토링이 필요한 간단하고 초기의 보이스 리딩 임시 규칙이다.)
D.6.3.6 H1.5: [2]에서 고음 계산
[1]의 고음이 1도이고 코드가 감소하면 이것을 로컬 딸림음의 단3도로 만든다.
그렇지 않고 [1]의 고음이 1도이고 코드가 감소하지 않으면 이것을 로컬 딸림음의 3도로 만든다.
그렇지 않고 [1]의 고음이 3도이면 이것을 로컬 딸림음 5도로 만든다.
그렇지 않고 [1]의 고음이 5도이면 이것을 로컬 딸림음 7도의 7도로 만든다.
D.6.3.7 H1.6: [4]에서 고음 계산
우리는 이것을 고음 [1]의 값 아래 코드에서 다음 확장으로 만든다. 이 값이 bass [4] 이하인 경우 bass [4] 위의 다음 확장을 얻는다. 이것은 귀가 잘 대처하지 못하는 대위법 선을 넘지 않기 위한 것이다. 이것은 Ball(2011, p. 148)이 Well Tempered Clavier 2권의 E장조 전주곡을 예로 들면서 지적한 바와 같이 Bach에게 민감한 부분이다. 이것은 보이스들이 경로들을 교차하지 않도록 하여Bach가 게슈탈트 스타일의 연속과 같은 음향적 등가물을 어떻게 피하는지를 보여준다.
D.6.3.8 H1.7: [0]에서 고음 계산
멜로디 음표는 마디의 고음에서 가장 낮은 음보다 두 옥타브 이상 높지 않으며 이전 마디의 마지막 음표와 같거나 낮지 않다(이전 마디의 고음 [1]과 동일). 결과적으로, 우리는 두 가지 요구 사항들을 모두 충족하는 마디의 코드에서 사용 가능한 음표들에서 임의의 음을 선택한다.
D.6.3.9 H1.8: 베이스와 고음을 카피하여 위치 채우기
위치 [3], [5], 및 [7]의 값들은 [1]의 값들과 같다.
위치 [6]의 값들은 [2]의 값들과 같다.
마디의 두 번째 절반은 첫 번째 마디의 카피이다.
D.6.3.10 설명할 수 없는 엔트로피 고려사항들
도 31의 악보는 색상 코딩을 사용하여 작동하는 다양한 휴리스틱들을 보여준다. 실선 화살표들은 해당 음표들의 최종 음조에 대한 정보를 제공하는 다른 음표들에 대한 포인터들이다. 점선 화살표들은 값들이 평가되지만 휴리스틱 고려 사항들로 인해 사용되지 않는 음표들에 대한 포인터들을 나타낸다.
이 최종 개요는 현재 섹션의 계층 구조에 대한 명확한 인상을 준다. 거의 모든 음표들의 흐름은 마디 1의 초기 베이스 음표로 돌아간다. 각각의 고음 위치 [0]의 멜로디는 이전 마디를 기반으로 하여 고음 위치 [15]의 값과 구별하려고 시도하며, 옵션들은 현재 마디에서 가장 낮은 음표보다 한 옥타브 높은 음표들의 범위로 제한된다.
두 번째 패스에서 덮어쓰기 전에 첫 번째 패스에서 생성된 감화음들의 베이스 음표들을 볼 수 있다: 첫 번째 패스의 화살표들은 점선이고 두 번째 패스의 화살표들은 실선이다. 이 시각화는 엔트로피 적색(더 어두운 음영) 콘텐츠가 현재 이해되는 계층 구조에 어떻게 연결될 수 없는지 정확하게 보여준다. 이것이 현재 휴리스틱들이 무너지는 곳이다.
이것이 심각한 문제가 되는 두 가지 주요 지점들은 휴리스틱들이 베이스의 위치 [4]에서 게시된 Ab보다 Bb를 선택하는 마디 14와 특별한 경우 베이스 패턴이 발생하는 마디 18(마디의 첫 번째 및 두 번째 절반들이 다른 자료를 포함하는 유일한 지점)이다. 이 세 음표들은 모두 현대 판본들이 있는 자필 카피와 비교하여 Clavier-Buchlein 버전에서 다른 유일한 세 가지이다. 악보에서 이 두 가지 주요 점들과 더불어, 3-5-3 패턴의 유일한 분석 지점인 코드의 Ab/C 버전을 사용하는 경우 현재의 휴리스틱은 마디 12에서 5-3-5의 보이싱을 설명하지 못한다.
마찬가지로, 이 마디를 Cmb6으로 표현하면 베이스 위치 [5]에서 이중 위치 점프를 생성할 수 없다. 이러한 경우들을 제외하고, 엔트로피 구성 요소들은 주로 휴리스틱들의 의사 결정 프로세스들에서 미적 판단의 부족을 강조한다. 마디 11의 5번째 세미퀘이버에서 상승하는 베이스는 주변 마디들에서 내린 결정들을 살펴보는 최우선적인 미적 휴리스틱 없이는 만들 수 없다. 이 두 가지 보다 더 사소한 경우들 모두에서 이러한 값들을 생성할 수 있는 휴리스틱의 실행을 무작위화하면 둘 다 가능해진다. 그러나 이러한 예들이 25번 중 1번 발생하기 때문에 그렇게 하는 것은 합리적이지 않은 것 같다.
멜로디를 이끄는 보이스 리딩도 마찬가지로 미적 휴리스틱들이 필요할 수 있다. 한 마디에서 다음 마디로의 결정들에서 반복성이 부족하면 출력이 사람이 듣기에 불필요하게 과도하게 엔트로피가 된다. 이것은 순전히 미학적인 의사 결정 휴리스틱이 부족하다는 또 다른 예이다. 이러한 휴리스틱은 두 개의 마디들의 그룹들과 같이 보다 예측 가능한 패턴으로 결정들을 반복할 뿐이지만 현재 시스템의 출력 가능성들을 제한한다.
D.7 섹션 2: 마디 19 내지 20
다음 두 섹션들은 으뜸음 단조 피규레이션의 핵심 텍스처를 개발하는 것을 기반으로 한다.
섹션 2에서 Bach는 고음의 초기 세미퀘이버를 전위시켜 고음 아래에 나타나도록 하고 [0]을 제외한 다른 위치들에서는 베이스 피규레이션들을 사용하여 베이스 음표를 독특한 코드와 주요 큐로 배치함으로써 이를 달성한다. Bach가 Fm7에서 F#으로 감소한 음조들을 사용하여 내린 선택은 종지적 6 4를 위한 일반적인 준비로 인식할 수 있다.
그러나 우리는 이러한 선택들을 알고리즘적으로 선택하고 다양한 생성 결과들에 대한 충분한 범위를 제공하는 방식으로 표현해야 한다. 따라서 문제는 그러한 텍스처 아래에 어떤 음표 페어링들이 있고 흥미로운 방식으로 추가할 수 있느냐는 것이다. 음표들이 무작위적이면서도 여전히 마디 21의 으뜸음을 향해 또는 그 주변에서 조화로운 움직임의 느낌을 줄 수 있을까?
간단한 키보드 실험들은 이것이 사실이 아님을 보여준다. 무작위 인터벌들의 사용은 하모니의 의미가 없다(기존의 하모닉 우연이 아닌 한). 그러나 텍스처 상단에 C와 Eb가 있는 코드(예를 들어, Ab 코드 다음에 F7 코드가 오는 것처럼)를 사용하면 된다.
C와 Eb를 상위 확장들로 사용하면 아래에 다양한 코드들을 만들 수 있다.
C 단조는 섹션 2와 3의 텍스처를 위해 코드 상단에 이 두 음표들을 통합할 수 있다. 도 32의 악보는 음조의 하행으로 코드들을 생성하는 장조와 단조의 가능한 조합들을 보여준다.
특히, 도 32의 악보는 C와 Eb를 상위 확장들로 하는 장3화음과 단3화음의 가능한 모든 조합(옥타브에 걸쳐)들을 보여준다. 규칙들은 특정 마디들을 제외한다: 적색 X 코드들은 D5.6 의사 코드를 통해 사용할 수 없으며, 보라색 X 코드는 텍스처 제한으로 인해 제외된다.
이 시점에서 물어볼 수 있는 좋은 질문은 왜 코드들아 3화음 형식인가 하는 것이다. 4도들이나 5도들을 통합하여 마디 21에서 우리가 나아가고 있는 두 번째 전위 C 단조 코드와 같은 코드들을 만드는 것은 어떨까? 이러한 조합들 중 다수는 우리가 이미 부여한 코드들 또는 관습적으로 의미가 없는 코드들을 생성한다. 위의 많은 코드들 아래에 4도들을 추가하면 주어진 코드의 다른 전위가 생성된다.
마찬가지로, 5도들을 통합하는 것, 즉 코드 보이싱에 구멍들을 만들기 위해 특정 음표들을 제거하는 것은 더 조화롭게 순수한 보이싱을 생성하기 위해 장3도와 단3도를 놓치거나 완벽한 5도와 두 개의 장조 또는 두 개의 단조 3도들로 작곡된 코드 사이의 충돌로 인해 불협화음을 생성한다. 이에 대한 예는 F# 감화음 아래에 B 완벽한 5도를 추가하는 것이다.
본질적으로, 서양 하모니의 "7에서 12"시스템이 현재 진화한 온음계는 장3도와 단3도의 무작위 선택들로 만들 수 있는 더 둔한 코드들의 사용을 배제한다. 이것은 코드의 추상성을 기하급수적으로 증가시키는 4도들과 5도들을 도입하는 것을 고려하기 전에, 또는 단순히 운을 통해 통합된 3도들에 이미 도달한 코드를 승인하기 전의 일이다. 도 32의 악보에서 온음계에 맞는 코드들은 모두 의미가 있는 것 같다.
E 어그먼트 코드(E #5 maj7)는 Locrian 내추럴 단조 모드(Levine, 1995, p. 70)를 기반으로 변경된 코드로 간주될 수 있지만, 상위 Eb(또는 장조 7도)는 모드에 나타나지 않으므로 결과적으로 이 코드는 실행 가능한 옵션처럼 들리지 않는다. 더 모호한 Db 어그먼트 코드들도 마찬가지인데, 그 아래에 Db 코드가 있는 C 단조 구성 요소들의 사운드를 모호하게 하는 데 너무 가깝기 때문이다.
Balzano (1980)는 이전에 온음계 시스템이 음계 내의 모든 유형의 인터벌에 대해 고유한 수를 제공한다는 것을 보여주었다. 인터벌 관계들은 직접 조옮김을 통해 매핑할 수 없으며; 그러나 뇌는 이것을 깨닫는 것 같고, 이것이 바로 Bach가 섹션 2에서 사용하는 것으로 보이는 속임수이다.
확장을 통해 코드들을 찾는 이 방법은 섹션 3에서 전위되어 초기 코드가 페달 G에서 위쪽으로 장식되는 것처럼 보인다. 프레이즈 분석(섹션 D.5.6) 내의 의사 코드는 가능성들의 어레이에서 적절한 코드들을 선택할 수 있는 실행 가능한 방법을 제공한다. 이 접근 방식을 사용하면, 도 32의 악보에서 적색으로 강조 표시된 특정 코드들을 제거할 수 있다.
이 새로운 인지 단서가 존재할 수 있는 공간을 고려한다면, 마디 19와 20의 텍스처 내에서 가능한 음표들을 보여주는 도 33의 키보드 표현에서 C 및 Eb 텍스처의 두 가지 대체 보이싱들을 통해 볼 수 있듯이 이러한 단서들의 배치에 대한 제한된 가능성들이 제공된다.
모든 경우들에서 신호 음표들은 메인 텍스처에 있는 다른 음표들에서 단3도 이상 떨어져 나타나야 하며, 그렇지 않으면 멜로디 신호가 설정되어야 한다. 위치 [4]의 세미퀘이버들이 메인 텍스처에서 바깥쪽으로 이동하면(고음 상승 및 베이스 하강) 위치들 [0] 및 [8]에서 고음 음표들에 대한 최대 가용성이 제공된다.
그러나 베이스의 음표들은 고음 위치 [0]의 음조를 반복할 수 없으며 나머지 피규레이션에서 베이스에서 가장 높은 음표의 음조보다 두 옥타브 이상 떨어질 수 없다(최종 요구 사항은 주어진 작품 전체에 걸쳐 보이싱들 범위에 대한 문체적 관찰). 이것은 베이스에 절충안을 제공한다: 음조가 위치 [4]에서 상승하면 베이스를 위한 공간이 더 많아지고 고음을 위한 공간은 더 줄어든다.
이 딜레마는 시스템이 사용해야 하는 반복 재구성의 첫 번째 사례들 중 하나를 보여준다. 원하는 코드 스킴이 필요한 경우, 이를 통합하기 위해 코드 텍스처를 다시 작성해야 할 수도 있다. 이 반복적인 협상 프로세스는 작곡 프로세스에 대한 잠재적으로 설명적인 통찰력을 제공한다. 주어진 예제의 텍스처들에 대해, 도 32의 악보에서 사용할 수 없는 코드들은 보라색으로 줄이 그어져 있다.
이렇게 하면 모두 임의의 순서로 사용할 수 있는 6개의 가능한 코드들이 남는다(C 및 Eb 아래에서 최대 2개의 확장들만 가능한 F#dim 제외). 이러한 코드들은 반복될 수 없으므로 이 섹션은 현재 사용 가능한 텍스처들로 6개의 마디들로 장식될 수 있다.
D.7.1 섹션 2의 초기 관찰
1. 이 섹션에서는 다음 섹션에서와 같이 세미퀘이버들 [1] 및 [3]의 주요 텍스처는 으뜸음 3화음의 처음 두 음표들인 C와 Eb를 기반으로 한다. 이 섹션에서는 베이스에 C가 나타나고 고음에 Eb가 나타날 확률이 50%이며 그 반대의 경우도 마찬가지이다.
2. 세미퀘이버들 위치 [4]는 더 이상 마디의 코드에서 인접한 확장을 포함하지 않지만 위치 [0] 또는 [2]에서 사용되는 코드의 대체 보이싱을 포함한다. 위치 [4]가 위치 [2]의 코드를 카피하는 경우 이 코드는 필연적으로 피규레이션에서 주요 코드인 C 단조 글로벌 으뜸음의 딸림음이다. 위치 [4]가 위치 [2]를 카피하지 않는 경우 위치 [2]에 나타나는 3도와 5도 대신 5도와 7도가 사용된다.
위치 [4]의 코드가 위치 [0]의 코드인 경우 코드의 첫 번째 인스턴스에서 대체 음표들을 선택하고 아르페지오 움직임의 방향을 무작위로 지정한다. 대체 음표들을 갖는 것은 주어진 코드에 4개의 음표들이 있는 경우(이 경우 감소된 음과 같은) 두 위치들에 대해서만 발생할 수 있으며, 그렇지 않으면 일반 3화음의 음표가 필요에 따라 반복되어야 한다. 이러한 주장들을 뒷받침하는 통계 정보는 제한적이지만 이 해석은 큰 생성 잠재력을 제공한다.
3. 이러한 유형의 피규레이션은 새로운 것으로, 섹션 1의 휴리스틱들에 있는 것과 위치 [4]에 있는 이웃 음표들의 이동 방향을 전위시킨다. 마디 1에서 18까지의 첫 번째 알고리즘들의 세트에서와 같이 위치 [2]에서 떨어지는 대신 위치 [2]에서 상승한 다음 위치 [4]에서 떨어지는 옵션이 있다. 이것은 첫 번째 섹션의 다소 경직된 패턴에 비해 방대한 생성 가능성들을 제공한다. 즉, 시스템과 그 방법론은 텍스처들이 존재했다는 증거 없이 원본 텍스처들을 생성하는 알고리즘 구성 요소들을 만들고 있다는 뜻이다.
4. 이러한 개발된 규칙들에 기초하여 이 섹션을 구축 기간을 늘리기 위해 더 확장할 수 없다는 언급은 없다. 위치 [0]에 대해 선택한 코드가 반복되지 않는 경우, 피규레이션은 이 섹션이 생성하는 전체 장력 축적과 다른 단서가 되어서는 안되므로 확장 가능해야 한다. 사용 가능한 코드들의 전체 범위는 C 및 Eb 아래로 1개, 2개 또는 3개의 확장들로 확장되는지 여부에 따라 동일하게 효과적이지 않다.
D.7.2 섹션 2의 휴리스틱들: 마디 19 내지 20
D.7.2.1 H2.0: [1]에서 베이스 계산
이것은 처음에 C3 아래 으뜸음 또는 C3 아래 으뜸음의 3도가 무작위로 50%로 이다. (이것은 현재 보이싱들에 적합한 범위를 선호하여 이전 프레이즈에서 모든 보이스 리딩을 무시한다.)
D.7.2.2 H2.1: [2]에서 베이스 계산
이 휴리스틱은 H1.2를 확장한다:
[1]의 베이스가 5도이면 이것을 [1]의 베이스 아래에 있는 딸림7화음(메인 피규레이션의 주요 코드)의 7도로 만든다.
[1]의 베이스가 3도면, [1]의 베이스 아래 딸림7화음의 5도로 만든다.
여기에 추가:
[1]의 베이스가 1도면 [1]의 베이스 아래 딸림7화음의 3도로 만든다.
D.7.2.3 H2.2: H2.3 준비
이 휴리스틱은 위치 [1]의 베이스 아래 1 또는 2(50%/50%) 코드 구성 요소 위치들인 위치 [0]에 베이스 값을 배치한다. 이 값은 이제 H2.3에 대해 주어진 확률 트리 분기를 무작위로 지정한다.
D.7.2.4 H2.3: [4]에서 베이스 계산
시간의 50%는 H1.3을 따른다(H2.2에 의해 생성된 음표가 필요함).
나머지 50%는 [4]를 [2]의 딸림7화음 관련 음표보다 위의 딸림7화음의 다음 코드 구성 요소 위치로 만든다.
D.7.2.5 H2.4: [1]에서 고음 계산
[1]의 베이스가 우세한 코드의 근음인 경우 [1]의 3도에 옥타브를 더한 고음을 만든다.
그렇지 않으면 [1]의 근음에서 고음을 만들지만 [1]에서 베이스보다 높은 음조를 제공하는 옥타브에서 고음을 만든다.
D.7.2.6 H2.5: [2]에서 고음 계산
H1.5 카피.
D.7.2.7 H2.6: [4]에서 고음 계산
시간의 50%는 이것을 고음 위치 [1]의 값 위에 있는 코드의 다음 확장으로 만든다.
나머지 50%는 [4]를 [2]에서 딸림7화음과 관련 음표보다 위의 딸림7화음의 다음 코드 구성 요소 위치를 만든다.
D.7.2.8 H2.7: 확장 코드의 음표들에 대한 음조들의 가용성을 확인한다.
이 휴리스틱은 고음과 베이스 모두에서 위치 [0]에 있는 음표들에 사용할 수 있는 음조 범위를 확인하며, 도 32의 악보에 포함된 코드들의 코드 음표들을 배치하려고 한다. 이 프로세스는 도 33의 키보드 표현에서 강조 표시되어 있다. 고음의 가장 낮은 음표의 단3도와 베이스의 가장 높은 음표의 단3도에서 정수 범위를 얻는다.
원하는 두 번째 코드의 1도 또는 3도가 이 범위에 나타나는지 확인한다(코드 요소들은 여기에서 각각 "1" 및 "2"라고 함).
베이스의 가장 낮은 음표의 단3도와 베이스의 가장 높은 음표의 옥타브 아래에서 정수 범위를 구한다.
"1"과 "2" 중 하나의 음표를 중간 범위에서 사용할 수 있는 경우 다른 음표표가 이 범위에서 사용 가능한지 확인한다.
중간 범위에서 "1"과 "2"를 모두 사용할 수 있는 경우 이 범위에서 최소 하나를 사용할 수 있는지 확인한다.
모든 음표들을 배치할 수 있는 경우, 고음과 베이스 위치들 [0]에 적절하게 분배한다. (이렇게 하면 베이스 [0]의 임시 값을 덮어쓴다.)
그렇지 않으면 H2.0으로 돌아가서 지금까지 모든 H2.x 휴리스틱들에 대해 생성 된 값들의 어레이를 유지하면서 다시 시작한다. 값들이 변경되는 경우에만 저장한다.
즉, 4가지 버전들의 출력이 있을 때 H2.7이 여전히 충족되지 않으면, 코드 스킴에 대한 변경을 요청한 다음 저장 어레이를 재설정하고 H2.0에서 다시 시작해야 한다.
(배포 논리는 다음을 반영해야 한다:
"1"과 "2" 중 한 음표가 중간 범위에서 사용 가능한 경우 여기에 배치하고 다른 음표는 베이스 아래의 낮은 범위에 배치한다.
"1"과 "2" 중 한 음표가 하단 범위에서 사용 가능한 경우 여기에 배치하고 다른 음표는 베이스와 고음 사이의 중간 범위에 배치한다.
둘 다 사용할 수 있는 경우 각각의 범위에 하나씩 무작위로 할당한다.)
D.7.2.9 H2.8: 베이스와 고음을 카피하여 위치들을 채운다.
H1.8 카피.
D.8 섹션 3: 마디들 21 내지 24
섹션 2에서 코드들을 아래쪽으로 확장하기 위해 C와 Eb를 사용한 반면, 이 섹션에서는 위쪽으로 확장하고 종지를 위한 기초로 C와 Eb 텍스처를 사용한다. 섹션 C.5.7의 프레이즈 분석은 종지적, 빌드업을 제공하는 코드 스킴을 생성할 수 있다.
D.8.1 초기 관찰들
1. 이 섹션에는 H2 세트와 유사한 방식으로 반복되는 텍스처가 포함되어 있다. 위치 [4]의 고음과 베이스가 음조들을 얻기 위해 마디의 코드의 딸림7화음을 사용할 가능성이 더 높다.
2. 위치 [4]의 마디 22에서 G 페달 위에 감화음을 사용하는 것은 프레이즈 분석 규칙들에 의해 생성된 종지 코드들이 딸림음만 있는 것은 아니라는 것을보여준다. 그들은 실제로 일반적으로 으뜸음에서 한 종지 위치에 있는 모든 코드가 될 수 있다. 우리는 이 작품 전반과 당시의 다른 작품들에서 증거를 수집함으로써 후보 코드들을 발견할 수 있다. 여기서 특징적인 종지 코드들은 F 샵 감7화음과 딸림음 db9이다. 딸림7화음 b9는 마디 25에서 끝까지 클라이맥스의 나머지 부분(이 분석에서 제외됨)에 걸쳐 매우 특징적이다.
D.8.2 섹션 3의 휴리스틱들: 마디들 21 내지 24
D.8.2.1 H3.0: [0]에서 베이스 계산
이것은 마디 1의 초기 베이스 으뜸음, 작품의 베이스 위치 [1] 위의 딸림음이다.
(이것은 현재 연구에 대한 전조 가능성을 무시한다.)
D.8.2.2 H3.1: [1]에서 베이스 계산
H2.0을 확장한다. 이 마디가 섹션의 두 번째 마디인 경우 이전 마디에서 이 휴리스틱으로 계산된 음조를 카피하기만 하면 된다.
D.8.2.3 H3.2: [2]에서 베이스 계산
H2.1 카피
D.8.2.4 H3.3: [4]에서 베이스 계산
H2.3 카피
D.8.2.5 H3.4: [1]에서 고음 계산
H2.4를 확장한다. 이 마디가 섹션의 두 번째 마디인 경우 이전 마디에서 이 휴리스틱으로 계산된 음조를 카피하기만 하면 된다.
D.8.2.6 H3.5: [2]에서 고음 계산
H1.5 카피.
D.8.2.7 H3.6: [4]에서 고음 계산
H2.6 카피
D.8.2.8 H3.7: [0]에서 고음 계산
이것은 이 위치에서 이전 마디의 음조에 가장 가까운 마디의 코드에서 사용 가능한 다음 음표의 음조를 임의의 옥타브에서 찾는다. 첫 번째 마디의 초기 음조의 경우 마디의 고음 텍스처에서 가장 높은 음표 위의 다음 음조 위치를 취한다.
D.8.2.9 H3.8: 베이스와 고음을 카피하여 위치들을 채운다.
H1.8 카피.
D.9 결과들
Bach의 선택들이 한 음표로만 제한되었다고 주장하는 것이 아니라는 점에 유의하는 것이 중요하다. 우리는 정반대의 말을 하고 있다: 그는 여러 가지 선택을에 직면했지만, 우리는 그가 선택한 것에 대한 알고리즘 분석을 통해 그 중 대부분을 일반화한다. 분석에 반영된 검증된 접근 방식은 우리가 추상화한 원리들을 기반으로 생성형 작곡의 유연성을 제공하기 위해 이러한 선택들의 다양성에 의존한다.
마디 14에서 이전에 설명되지 않은 Ab는 섹션 2와 3에 대한 후자의 휴리스틱들을 고려하면 쉽게 설명될 수 있다. 이전 휴리스틱 대신 이러한 휴리스틱을 무작위로 도입하면 이러한 음표들을 설명할 수 있다. 인접 마디들에서 무작위 선택들을 관찰하고 카피하는 일련의 미적 휴리스틱 및 다른 섹션의 휴리스틱을 무작위로 교환할 수 있는 기능을 갖추면 원본 악보를 생성할 수 있다.
후자의 일련의 휴리스틱에서 이전 일련의 휴리스틱들이 점점 더 자주 재사용되고 확장되고 있음을 알 수 있다. 이는 휴리스틱 데이터 표현을 위한 객체 지향 접근 방식을 가리킨다. H2.1에 대한 H1.2의 확장은 이전 논리에 대해 수퍼 유형 메서드를 호출하여 기능을 추가하기 위해 메서드를 재정의할 수 있어야 함을 보여준다.
D.10 결론들
우리는 엔트로피, 중복 및 개발된 자료를 채색하는 시스템을 구현하여 휴리스틱들을 생성할 때를 보여주고 기능적 목적을 제공한다. 분석에서 엔트로피(적색/어두운 톤) 표시들에는 새로운 자료를 생성하는 생성적 휴리스틱이 필요하다. 중복(녹색/중간 톤) 표시들은 생성 자료를 채우기 위해 카피 휴리스틱이 필요하며 개발된(황색-가장 밝은 톤) 자료는 생성 휴리스틱의 출력을 변경하는 함수 휴리스틱의 필요성을 보여준다. 우리는 원본 작품에서 두 개의 음표들을 제외한 모든 음표들과 많은 대안들을 설명할 수 있는 세 가지 일련의 휴리스틱을 가지고 있다.
우리는 Clavier-Buchlein 원고에 있는 Bach의 가장 초기 버전의 전주곡이 첫 번째 섹션에서 파생된 일반적인 휴리스틱들과 일치한다는 것을 보여주었으며, 마디들 14와 18에서 첫 섹션의 분석 측면에 있는 엔트로피 가시들을 제거했다. 이것은 우리가 이 작품에 대한 Bach의 독창적인 작곡 접근 방식과 밀접하게 호환할 수 있는 일련의 규칙들을 만들었다는 것을 보여준다.
특정 배치들이 서로 상호 배타적이지 않는 한, 본 명세서에서 설명되는 다양한 실시예들은 시스템 기능을 향상시키기 위해 및/또는 사용자가 인지할 수 있는 유사성 및 비유사성의 효과적인 식별을 지원하는 보완적인 기능들 또는 시스템을 생성하기 위해 조합될 수 있다. 이러한 조합들은 전술한 설명의 전체성을 감안할 때 숙련된 기술자들에 의해 쉽게 이해될 수 있을 것이다.
마찬가지로, 바람직한 실시예들의 양태들은 보다 제한된 기능적 배치들이 적절한 독립형 배치들로 구현될 수 있다. 실제로, 특정 바람직한 실시예들 내의 특징들이 서로 호환할 수 없는 것으로 명백하게 식별되지 않는 한, 또는 주위의 컨텍스트가 이들이 상호 배타적이고 보완적 및/또는 지원적인 의미에서 용이하게 조합될 수 없다는 것을 의미하지 않는 한, 본 개시의 전체성은 이러한 상보적인 실시예들의 특정 특징들이 하나 이상의 포괄적이지만 약간 다른 기술적인 솔루션들을 제공하기 위해 선택적으로 조합될 수 있음을 고려하고 상정하는 것으로 이해될 것이다.
첨부된 도면들의 제안된 프로세스 흐름들의 관점에서, 전체 효과 또는 재정렬이 동일한 객관적인 최종 결과들 또는 다음 논리적 단계로 진행할 수 있는 중요한 중간 결과들을 달성하는 한, 프로세스 내의 단계들에 대한 정확한 실행 지점들의 관점에서 달라질 수 있다. 따라서 흐름 프로세스들은 절대적이라기보다는 본질적으로 논리적이다.
도면들의 기능적 아키텍처들은 이해되는 바와 같이, 서로 독립적으로 구현될 수 있으며, 따라서 결과적인 시스템은 인터넷과 같은 광역 네트워크를 통해 잠재적으로 분산되는 분산 시스템이다. 구조학적으로, 본 명세서에 기술된 바와 같은 텍스처 분류와 같은, 그러나 이에 제한되지 않는 시스템의 양태들의 실현은, [최종 자동화된 음악 작곡을 위한 기초로서] Java Expert System Shell "JESS"와 같은 기술들, 및 보다 전형적으로, 맞춤형 전문가 시스템을 사용하여 구현될 수 있다.
본 발명의 양태들은 다운로드 가능한 형식으로 제공될 수 있거나, 그렇지 않으면 CD-ROM과 같은 컴퓨터 판독 가능 매체 상에 제공될 수 있으며, 이 매체는 인스턴스화될 때, 웹 서버 등에서 링크 임베딩 기능을 실행하는 프로그램 코드를 포함한다.
2021년 3월 31일 런던 대학교 퀸 메리 전자공학 및 컴퓨터 과학 대학(School of Electronic Engineering and Computer Science, Queen Mary, Queen Mary, University of London)에서 최초로 출판한 Joseph Michael William Lyske 박사 학위 논문 "Meta Creation for Film Scores"는 본 명세서에 참조로 포함시킨다.
본 명세서에 개시된 본 발명은 예시적인 형식으로서 사용되어 온 서양 음악뿐만 아니라 모든 음계 및 임의의 문화적 전제 조건에 적용 가능하다.
본 명세서에 개시된 바와 같이, Form Atom은 생성형 작곡이 기반이 될 수 있는 매우 중요한 빌딩 블록을 제공하지만, 개시의 전체성은 하이퍼노드 프레임워크의 사용을 포함하여, 상당한 세부사항을 갖는 포괄적인 구현을 함께 제공하는 다수의 독립적인(그러나 관련된) 양태들을 포함한다. 예를 들어, 작곡 관점에서 텍스처의 분류 및 조작은 매우 중요하다. 예를 들어, 독립형 기술 솔루션은 코드 간격이 결정되는 프로세스뿐만 아니라 생성 시스템 구축의 컨텍스트에서 프리미티브들을 개발하고 사용하는 방법과 관련이 있다.
물론, 상기 설명은 단지 예의 방법에 의해 주어진 것이며, 상세한 변경은 본 발명의 범위 내에서 이루어질 수 있다는 것을 이해할 수 있을 것이다. 예를 들어, 생성 시스템은 특정 음도를 가진 서양 음악의 컨텍스트에서 표현되었지만 기술들은 다른 스타일들과 미터들로 변경될 수 있다.
생성 프레임워크와 커플링된 분석 기법은 효과적인 출력으로 이어지는 방식으로 음악을 계층적으로 볼 수 있는 기반을 제공한다. 이것은 미학적으로 기능하는 생성 영화 음악 작곡 및 게임 악보들을 생성하는 유용한 방법일 뿐만 아니라, 실제로 사용자가 개인적으로 좋아하는 아티스트들과 노래들에 메타 태그가 지정된 Form Atom들이 포함된 인터페이스 및 데이터베이스를 통해 시스템에 액세스할 수 있는 경우 사용자가 개인적으로 조정할 수 있다.
주어진 계층 구조를 기반으로 컴퓨터들이 작업을 분석하고 분석을 기반으로 음악을 작곡하는 완전히 자율적인 솔루션들이 가능하다. 예를 들어, 딥러닝 신경망들 및 관련 피트니스 함수들이 있는 생성 알고리즘들과 같은 훈련된 인공 인텔리전스 메커니즘은 악보를 기반으로 적절한 프리미티브들을 선택하는 방법을 학습할 수 있다. 이 접근 방식은 동일한 분석된 일련의 작곡들에서 동일한 출력 표준을 생성할 수 있는 더 작은 일련의 휴리스틱들[Occam's Razor]을 생성하는 보다 효율적인 방법들로 이어진다.
인간들이 잠재적으로 할 수 있는 유일한 일은 감정 개념들에 메타 태그를 지정하는 것이지만, 이 작업조차도 시맨틱 격차를 좁히고 감정 인식과 상관 관계를 맺기 위해 NLP 또는 파일 특성들을 사용하는 AI 네트워크들(예를 들어, US 2020-0320398 및 관련 연구들에 설명된 것과 같은)의 주제로 삼을 수 있다. 따라서 숙련된 사람은 시스템 인텔리전스의 어떤 양태들이 다양한 형식들의 프로세서에 도움이 될 수 있는지 이해할 수 있다.

Claims (29)

  1. 생성형 작곡 시스템으로서,
    음악적 여정(musical journey)을 따라 복수의 음악 섹션들에 대한 복수의 감정 디스크립션들을 참조하여 상기 음악적 여정을 설명하는 브리핑 내러티브(briefing narrative)를 수신하기 위해 커플링된 입력부;
    다수의 음악 데이터 파일들을 포함하는 데이터베이스로서, 상기 음악 데이터 파일들 각각은, 인스턴스화될 때, 원본 음악 악보를 생성하고, 각각의 원본 악보는 독립적인 구조적 특성들을 갖는 다수의 식별 가능한 연결된(concatenated) 폼 아톰(Form Atom)들로 분할되며, 각각의 폼 아톰은,
    각각의 폼 아톰의 작곡적 특질을 설명하는 태그;
    로컬 으뜸음(local tonic)의 코드들의 세트, 및
    질문, 답변 및 진술 중 하나를 음악적으로 표현하는 형식 함수(form function)와 결합된 프로그레션 디스크립터(progression descriptor)를 포함하며, 그리고
    폼 아톰들 간의 음악적 전환들이 매핑되어 다수의 원본 악보들에서 폼 아톰들 간의 확립된 전환들을 식별한 다음 기록하며, 이에 따라 상기 시스템 내에는, 폼 아톰들이 유사한 태그들을 갖지만 상이한 구조적 특성들을 갖는 것으로 식별되는 그룹들이 존재하게 되도록 하는, 상기 데이터베이스; 및
    상기 브리핑 내러티브에 응답하며 상기 데이터베이스에 커플링되는 처리 인텔리전스(processing intelligence)를 포함하며, 상기 처리 인텐리전스는,
    상기 복수의 음악 섹션들 각각에 의해 적시에 요청되는 감정 디스크립션들과 일치하는 태그들을 갖는 폼 아톰들의 선택 및 연결을 통해 상기 브리핑 내러티브와 관련된 생성형 작곡(generative composition)을 어셈블링(assembling)하고; 그리고
    상이한 원본 악보들 중에서 폼 아톰들을 선택하고 이들을 상기 생성형 작곡으로 대체하도록 구성되고, 상기 대체되는 폼 아톰은,
    임의의 원본 악보로부터 도출되고; 그리고
    상기 감정 디스크립션들과 일치하는 작곡적 특질을 갖는, 생성형 작곡 시스템.
  2. 제 1 항에 있어서,
    상기 데이터베이스는 원래의 음악 작품을 재구성하는 방법 및 이에 대한 대안들을 설명하는 정보를 포함하는 메타-데이터 형식의 휴리스틱(heuristic)을 포함하는 생성형 작곡 시스템.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 폼 아톰은 연관된 타이밍을 갖는 코드 스킴(chord scheme)들의 스트링을 생성하는 폼 아톰들의 스트링으로 어셈블링되는, 생성형 작곡 시스템.
  4. 제 1 항, 제 2 항 또는 제 3 항 중 어느 한 항에 있어서,
    상기 시스템은 규정된 시간 윈도우에 걸쳐 코드들을 분배하도록 구성된 코드 간격(chord spacer) 휴리스틱들을 포함하는, 생성형 작곡 시스템.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    상기 시스템 인텔리전스는 코드 스킴들을 처리하여 텍스처(texture)들을 인스턴스화하도록 구성되며, 여기서 코드들 및 이들과 연관된 타이밍들로부터 텍스처 음표(texture note)들이 도출되는, 생성형 작곡 시스템.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
    각각의 폼 아톰은 최소 길이를 가지며, 여기서 상이한 폼 아톰들은 상이한 음악적 지속 시간들을 구현하는, 생성형 작곡 시스템.
  7. 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
    상기 태그들의 서브세트는 의미론적으로 동일한, 생성형 작곡 시스템.
  8. 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
    각각의 폼 아톰은 상기 폼 아톰의 중간 섹션에 으뜸음을 포함하지 않는, 생성형 작곡 시스템.
  9. 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
    각각의 폼 아톰은 음조(pitch)와 조성(tonality)을 모두 갖는 로컬 으뜸음에 대한 인터벌 거리로 표현되는 상기 로컬 으뜸음에서 특정 코드들의 세트를 가지는, 생성형 작곡 시스템.
  10. 제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
    각각의 폼 아톰은,
    현재 로컬 으뜸음으로부터 다음 폼 아톰의 새로운 로컬 으뜸음으로의 변경을 허용하는 전조 형식 함수(modulating form function),
    선행의 폼 아톰이 상이한 으뜸음을 가지고 있음을 나타내는 전조된 폼 아톰,
    전조 형식 함수 또는 전조된 폼 아톰 둘 다 갖거나 둘 다 갖지 않는 것
    중 하나를 더 포함하는, 생성형 작곡 시스템.
  11. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 폼 아톰은 상기 코드의 코드 타입과 베이스(bass)를 저장하는, 생성형 작곡 시스템.
  12. 제 1 항 내지 제 11 항 중 어느 한 항에 있어서,
    상기 데이터베이스는 작품들의 코퍼스(corpus)로부터, 음악적으로 좋은 형식으로 작동한 이전의 전환들을 식별하는 마르코프 체인(Markov-chain) 연관들을 통해 선행의 또는 후행의 폼 아톰들의 목록들에 링크된 폼 아톰들의 목록들을 저장하는, 생성형 작곡 시스템.
  13. 제 1 항 내지 제 12 항 중 어느 한 항에 있어서,
    폼 아톰들은 하모닉 구조 및 작곡적으로 좋은 형식을 따르는 하모닉 구조를 생성하는 능력을 제공하는, 생성형 작곡 시스템.
  14. 제 1 항 내지 제 13 항 중 어느 한 항에 있어서,
    폼 아톰들은 상기 작곡에 대한 텍스처를 정의하며 또한 코드 스킴 체인들로 선택적으로 선택되고 기록될 때, 상기 생성형 작곡에서 텍스처 연속성(textural continuity)의 유지를 허용하는 매핑된 텍스처 구성 요소들의 목록과 연관들을 가지는, 생성형 작곡 시스템.
  15. 생성형 작곡 방법으로서,
    음악적 여정을 따라 복수의 음악 섹션들에 대한 복수의 감정 디스크립션들을 참조하여 상기 음악적 여정을 설명하는 브리핑 내러티브를 수신하는 단계;
    상기 복수의 음악 섹션들 각각에 의해 적시에 요청되는 감정 디스크립션들과 일치하는 태그들을 갖는 폼 아톰들의 선택 및 연결을 통해 상기 브리핑 내러티브와 관련된 생성형 작곡을 어셈블링하는 단계; 및
    상이한 원본 악보들 중에서 폼 아톰들을 선택하고 이들을 상기 생성형 작곡으로 대체하는 단계를 포함하며, 상기 대체되는 폼 아톰은,
    임의의 원본 악보로부터 도출되고; 그리고
    상기 감정 디스크립션들과 일치하는 작곡적 특질을 가지며, 여기서 각각의 원본 악보는 독립적인 구조적 특성들을 갖는 다수의 식별 가능한 연결된 폼 아톰들로 분할되며, 각각의 폼 아톰은,
    각각의 폼 아톰의 작곡적 특질을 설명하는 태그;
    로컬 으뜸음(local tonic)의 코드들의 세트, 및
    질문, 답변 및 진술 중 하나를 음악적으로 표현하는 형식 함수와 결합된 프로그레션 디스크립터를 포함하며, 그리고
    상기 방법은,
    폼 아톰들 간의 음악적 전환들을 매핑하여 다수의 원본 악보들에서 폼 아톰들 간의 확립된 전환들을 식별한 다음 기록하며, 이에 따라 폼 아톰들이 유사한 태그들을 갖지만 상이한 구조적 특성들을 갖는 것으로 식별되는 폼 아톰들의 그룹들이 존재하게 되도록 하는 단계를 더 포함하는, 생성형 작곡 방법.
  16. 음악 작곡을 위한 다수의 폼 아톰들을 포함하는 데이터베이스로서,
    각각의 폼 아톰은 음악적으로 관련된 폼 아톰들과 이들의 감정적 의미(emotional connotation) 간의 관계를 정의하는 신택스(syntax)를 가지는, 데이터베이스.
  17. 제 16 항에 있어서,
    각각의 폼 아톰은 각각의 폼 아톰 내의 코드들과 이들의 감정적 의미 간의 음악적 관계를 음악적 링크(musical linkage)의 관점에서 설명하는 신택스를 더 가지는, 데이터베이스.
  18. 제 16 항 또는 제 17 항에 있어서,
    각각의 폼 아톰은 상기 신택스를 명료화하는 적어도 하나의 태그를 포함하는, 데이터베이스.
  19. 태그가 지정된 폼 아톰들의 데이터베이스로,
    각각의 폼 아톰은,
    각각의 폼 아톰의 작곡적 특질을 설명하는 태그;
    로컬 으뜸음(local tonic)의 코드들의 세트, 및
    질문, 답변 및 진술 중 하나를 음악적으로 표현하는 형식 함수와 결합된 프로그레션 디스크립터를 포함하는, 데이터베이스.
  20. 제 19 항에 있어서,
    질문은 하모니 또는 멜로디 내에 나타난 음표들에 의해 표시되는 정신적 안정이 필요한 긴장을 암시하는 코드 스킴이며, 상기 음표들이 상기 폼 아톰의 상기 로컬 으뜸음의 키 중심(key centre) 밖에 있기 때문에 상기 긴장이 의심스러울 정도로 존재하는 것으로 되고;
    답변은 마음의 관점에서 의심스러운 톤(tone)들나 음표들의 존재를 해결하기 위해, 상기 로컬 으뜸음 또는 답변하는 폼 아톰의 새로운 으뜸음의 키 중심을 강화하는 것에 의해 작동하는 상기 질문에 대한 해결이며; 그리고
    진술은 음악적 질문으로부터 완전히 독립적인 것으로서, 해결을 통해 해소되어야 하는 유의미한 음악적 긴장을 암시하거나 유도하지 않으며, 상기 진술은 질문도 아니고 답도 아닌, 데이터베이스.
  21. 제 19 항 또는 제 20 항에 있어서,
    각각의 폼 아톰은 하모닉 구조 및 작곡적으로 좋은 형식을 따르는 하모닉 구조들을 생성하는 능력을 제공하는, 데이터베이스.
  22. 다수의 선택 가능한 폼 아톰들을 포함하는 데이터베이스의 음악적 폼 아톰으로서,
    각각의 폼 아톰은 하모닉 구조 및 작곡적으로 좋은 형식을 따르는 하모닉 구조들을 생성하는 능력을 제공하는, 음악적 폼 아톰.
  23. 복수의 음악 섹션들을 포함하는 음악 악보를 분석하는 방법으로서,
    상기 복수의 섹션에서 음악적 텍스처와 연관된 감정적 의미의 존재를 식별하는 단계를 포함하며, 상기 음악적 텍스처는 복수의 식별 가능하게 상이한 작곡적 특성들에 의해 표현되고, 여기서
    i) 상기 음악적 텍스처는 감정적 의미를 가지고; 그리고
    ii) 임의의 음악 섹션의 각 음악적 텍스처는 다수의 미리 정의된 음악 텍스처 분류기를 포함하는 세트로부터 선택되는 음악 텍스처 분류기들의 존재의 관점에서 음악적으로 표현되며, 이에 따라,
    a. 상이한 음악 섹션들은 미리 정의된 음악 텍스처 분류기들의 상이한 서브세트를 포함할 수 있고;
    b. 주어진 음악 섹션에 대하여, 각각의 미리 정의된 음악 텍스처 분류기는 해당 텍스처 분류기에 대한 0개 또는 적어도 하나의 구성 요소를 가지며, 존재하는 각 구성 요소는 음악 반주 또는 음악적 특징(musical feature)으로서 추가로 태그가 지정되고, 구성 요소가 존재하는 각각의 음악적 텍스처 분류기는,
    i. 미(no) 음악적 특징 또는 단일 음악적 특징, 및
    ii. 하나 이상의 음악 반주를 가지며; 그리고
    c. 상이한 음악 섹션들은 공통 디스크립터 또는 상기 공통 디스크립터와 연관을 갖는 유사한 디스크립터를 가질 수 있지만, 동시에 상이한 음악 섹션은 음악 텍스처 분류기들의 상이한 서브세트들 또는 상기 음악 텍스처 분류기에 있는 구성 요소들의 상이한 서브세트들을 가지는, 방법.
  24. 제 23 항에 있어서,
    상기 텍스처 분류기는 멜로디, 카운터-멜로디, 하모니, 베이스, 음조가 있는 리듬(pitched rhythm), 음조가 없는 리듬(non-pitched rhythm) 및 드럼(drum)들 중 적어도 일부를 포함하는 그룹으로부터 선택되는, 방법.
  25. 제 23 항 또는 제 24 항에 있어서,
    음악적 특징은,
    음악적 텍스처의 현저한 음악적 구성 요소이고; 그리고
    상기 음악적 특징이 상기 음악 섹션 내의 그리고 상기 미리 정의된 음악 텍스처 분류기 내의 다른 음악적 특징과 결합되었을 경우에 긴장 및 해소가 음악적 컨텍스트적으로 없어지게 되는, 상기 음악 섹션 내의 음악적 긴장 및 해소에 대한 정보를 포함하는, 방법.
  26. 제 23 항, 제 24 항 또는 제 25 항 중 어느 한 항에 있어서,
    반주는 음악 섹션의 임의의 특정 텍스처 분류기에서의 다른 반주 또는 특징을 방해하지 않으며, 또한 상기 음악 섹션의 상기 텍스처를 두텁게 하거나 얇게 하기 위해 선택적으로 추가 또는 제거될 수 있는, 방법.
  27. 제 15 항 또는 제 23 항 내지 제 26 중 어느 한 항에 있어서,
    계산 절차를 적용하여 상기 생성형 작곡에 대한 텍스처 함수들을 생성하는 단계를 더 포함하는, 방법.
  28. 자동화된 생성형 작곡 프로세스에서 텍스처를 제공하는 방법으로서,
    내러티브 브리핑에 대한 적어도 하나의 코드 스킴을 생성하는 단계 - 상기 코드 스킴은 폼 아톰들에 기초하며, 상기 내러티브 브리핑은 일련의 이벤트들에 대한 감정적 의미들을 제공함 -; 및
    제 16 항 내지 제 20 항 중 어느 한 항의 방법으로부터 도출되는 텍스처를 상기 적어도 하나의 코드 스킴에 적용함으로써 상기 내러티브 브리핑을 반영하는 작곡을 생성하는 단계
    를 포함하는, 방법.
  29. 제 28 항에 있어서,
    텍스처 프로파일을 갖는 제 2 음악 섹션과 연결된 제 1 음악 섹션에서 텍스처 내러티브의 부존재를 식별하는 단계; 및
    음악 반주이거나 음악적 특징인 적어도 하나의 구성 요소로 상기 제 1 음악 섹션을 채우는 단계를 더 포함하며, 상기 적어도 하나의 구성 요소의 상기 음악 반주 또는 상기 음악적 특징의 선택은,
    선행의 텍스처 분류기들의 이력 및 상기 텍스처 분류기들 중 지배적인 것의 지속성, 또는
    각각의 서브세트들의 강도를 기반으로 하는 미리 정의된 음악 텍스처 분류기들의 대상 서브세트 사이의 논리적 브리지
    중 하나에 기초하는, 방법.
KR1020237037568A 2021-03-31 2022-03-30 청각적으로 올바른 형태를 가지는 음악 작품을 자동으로 생성하는 시스템 및 방법 KR20240021753A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US17/219,610 2021-03-31
US17/219,610 US11978426B2 (en) 2021-03-31 2021-03-31 System and methods for automatically generating a musical composition having audibly correct form
GB2104696.6A GB2605440A (en) 2021-03-31 2021-03-31 System and methods for automatically generating a muscial composition having audibly correct form
GB2104696.6 2021-03-31
US17/707,923 2022-03-29
US17/707,923 US11514877B2 (en) 2021-03-31 2022-03-29 System and methods for automatically generating a musical composition having audibly correct form
PCT/EP2022/058509 WO2022207765A2 (en) 2021-03-31 2022-03-30 System and methods for automatically generating a musical composition having audibly correct form

Publications (1)

Publication Number Publication Date
KR20240021753A true KR20240021753A (ko) 2024-02-19

Family

ID=81074029

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237037568A KR20240021753A (ko) 2021-03-31 2022-03-30 청각적으로 올바른 형태를 가지는 음악 작품을 자동으로 생성하는 시스템 및 방법

Country Status (7)

Country Link
EP (1) EP4068273A3 (ko)
JP (1) JP2024513865A (ko)
KR (1) KR20240021753A (ko)
AU (1) AU2022250856A1 (ko)
BR (1) BR112023020059A2 (ko)
CA (1) CA3214004A1 (ko)
WO (1) WO2022207765A2 (ko)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5693902A (en) * 1995-09-22 1997-12-02 Sonic Desktop Software Audio block sequence compiler for generating prescribed duration audio sequences
US20050144016A1 (en) * 2003-12-03 2005-06-30 Christopher Hewitt Method, software and apparatus for creating audio compositions
EP1666967B1 (en) * 2004-12-03 2013-05-08 Magix AG System and method of creating an emotional controlled soundtrack
WO2009107137A1 (en) * 2008-02-28 2009-09-03 Technion Research & Development Foundation Ltd. Interactive music composition method and apparatus
US9280313B2 (en) * 2013-09-19 2016-03-08 Microsoft Technology Licensing, Llc Automatically expanding sets of audio samples
WO2015154159A1 (en) * 2014-04-10 2015-10-15 Vesprini Mark Systems and methods for musical analysis and determining compatibility in audio production
US11580941B2 (en) * 2018-04-24 2023-02-14 Dial House, LLC Music compilation systems and related methods
CN113038998A (zh) * 2018-11-15 2021-06-25 索尼互动娱乐有限责任公司 游戏中的动态音乐创建
US11068782B2 (en) 2019-04-03 2021-07-20 Mashtraxx Limited Method of training a neural network to reflect emotional perception and related system and method for categorizing and finding associated content

Also Published As

Publication number Publication date
WO2022207765A3 (en) 2022-11-10
CA3214004A1 (en) 2022-10-06
JP2024513865A (ja) 2024-03-27
EP4068273A3 (en) 2022-11-09
BR112023020059A2 (pt) 2023-11-14
WO2022207765A8 (en) 2023-11-02
EP4068273A2 (en) 2022-10-05
WO2022207765A2 (en) 2022-10-06
WO2022207765A9 (en) 2023-01-26
AU2022250856A1 (en) 2023-11-16

Similar Documents

Publication Publication Date Title
Ji et al. A comprehensive survey on deep music generation: Multi-level representations, algorithms, evaluations, and future directions
Herremans et al. A functional taxonomy of music generation systems
CN108369799B (zh) 采用基于语言学和/或基于图形图标的音乐体验描述符的自动音乐合成和生成的机器、系统和过程
US11037538B2 (en) Method of and system for automated musical arrangement and musical instrument performance style transformation supported within an automated music performance system
US10964299B1 (en) Method of and system for automatically generating digital performances of music compositions using notes selected from virtual musical instruments based on the music-theoretic states of the music compositions
US11842710B2 (en) Generative composition using form atom heuristics
US20210110801A1 (en) Method of digitally performing a music composition using virtual musical instruments having performance logic executing within a virtual musical instrument (vmi) library management system
Panda Emotion-based analysis and classification of audio music
Mazzola Semiotics of music
Frisk Improvisation, computers, and interaction: Rethinking human-computer interaction through music
US11978426B2 (en) System and methods for automatically generating a musical composition having audibly correct form
EP4068273A2 (en) System and methods for automatically generating a musical composition having audibly correct form
de Mantaras Making music with AI: Some examples
Winter Interactive music: Compositional techniques for communicating different emotional qualities
GB2615223A (en) System and methods for automatically generating a musical composition having audibly correct form
GB2615222A (en) System and methods for automatically generating a musical composition having audibly correct form
GB2615221A (en) System and methods for automatically generating a musical composition having audibly correct form
GB2615224A (en) System and methods for automatically generating a musical composition having audibly correct form
GB2605440A (en) System and methods for automatically generating a muscial composition having audibly correct form
US20240038205A1 (en) Systems, apparatuses, and/or methods for real-time adaptive music generation
Holbrow Fluid Music
Weinberg et al. “Play Like A Machine”—Generative Musical Models for Robots
Love Collective conceptualization: a methodology for contemporary film score composers: a portfolio of compositions (disposed as a film score) and exegesis.
Bortoletto Vaz Algorithmic authority in music creation: the beauty of losing control= De l’autorité algorithmique dans la création musicale: la beauté de la perte de contrôle
Britton Towards hypertextual music: digital audio, deconstruction and computer music creation