JP2007041226A - 音階生成装置および音階生成プログラム - Google Patents
音階生成装置および音階生成プログラム Download PDFInfo
- Publication number
- JP2007041226A JP2007041226A JP2005224461A JP2005224461A JP2007041226A JP 2007041226 A JP2007041226 A JP 2007041226A JP 2005224461 A JP2005224461 A JP 2005224461A JP 2005224461 A JP2005224461 A JP 2005224461A JP 2007041226 A JP2007041226 A JP 2007041226A
- Authority
- JP
- Japan
- Prior art keywords
- agent
- sound
- scale
- frequency
- agents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Auxiliary Devices For Music (AREA)
Abstract
【課題】 自動的に音階を生成する音階生成装置および音階生成プログラムを提供する。
【解決手段】 音階生成装置1000は、エージェントのうち、発音を行なう発音エージェントと、受音を行なう受音エージェントとを選択し、発音エージェントからの音の倍音の周波数成分と受音エージェントの基本周波数の倍音の周波数成分との近さに応じて、報償値を算出するステップと(S106,S108)、報償値に応じて、各エージェントの属性情報である評価値を更新するステップ(S110)と、評価値の値が分裂しきい値となるに応じて、エージェントの分裂処理を行い、評価値の値が消滅しきい値となるに応じて、エージェントの消滅処理を行うステップ(S112)と、複数のエージェントの遺伝情報が対応する基本周波数についてのエージェント個体数分布に基づいて、音階を導出するステップ(S128)とを含む。
【選択図】 図8
【解決手段】 音階生成装置1000は、エージェントのうち、発音を行なう発音エージェントと、受音を行なう受音エージェントとを選択し、発音エージェントからの音の倍音の周波数成分と受音エージェントの基本周波数の倍音の周波数成分との近さに応じて、報償値を算出するステップと(S106,S108)、報償値に応じて、各エージェントの属性情報である評価値を更新するステップ(S110)と、評価値の値が分裂しきい値となるに応じて、エージェントの分裂処理を行い、評価値の値が消滅しきい値となるに応じて、エージェントの消滅処理を行うステップ(S112)と、複数のエージェントの遺伝情報が対応する基本周波数についてのエージェント個体数分布に基づいて、音階を導出するステップ(S128)とを含む。
【選択図】 図8
Description
本発明は、自動的に音階を生成する音階生成装置および音階生成プログラムに関する。
現代音楽の多くでは、1オクターブがほぼ対数的に12半音に分けられた純正律(Pure Temperament)または平均律(Equal Temperament)が用いられる。一部地域の民族音楽では、1オクターブを5等分や7等分した音階が用いられており、日本でも非12音平均律による作曲がこころみられている(たとえば、非特許文献1を参照)。しかし、一般的に人が心地よいと感じるのは12半音に分けられた音階(12音階)であるといわれている。歴史上、ピタゴラス音階から純正律、そして平均律へと使用される音階は変化してきたことは知られている。
古代ギリシャにおいて音の協和性を数学的に探求したピタゴラスは、弦楽器を用いた実験から、二つの弦の長さの比が単純な整数比となるときに、二つの音の響きが心地よいことを発見したと言われている。弦楽器では倍音成分を多く含むため、二つの弦の長さの比が単純な整数比となる場合、二つの弦から発する音に同一周波数成分が多く含まれる。一方、人は、同一周波数成分を多く含む複数の音を聞くと心地よいと感じる。このため、人は弦の長さの比が単純な整数比となるときに音の響きが心地よいと感じると考えられている。これらのように、音階を科学的・解析的に理解する研究はなされているのに対し、工学的・構成論的な方法論による研究、すなわち、音階の創発的な生成にむけた研究は、あまり検討されていない。
また、人が身体的に同一周波数成分を多く含む音を快適と感じる感性(身体性)を共有し、弦楽器のように音を発生させる機器(環境)が倍音を多く含むという特徴を持つ場合、この身体性と環境との相互作用により現在の12音階が成立した可能性があるものの、このような可能性についても、工学的に研究された例はみられない。
一方で、マルチエージェントシステム(以下、MASと記す)の研究として、たとえば、エージェントが知覚できる範囲の情報である利得や報酬、評価などを個体最適性と定義し、システムの大域的目的として、すべてのエージェントがそれぞれの行動から得る利得の総和をシステム最適性とそれぞれ定義したときに、エージェント学習によるシステム最適性の向上をシミュレート可能な「動的離隔型遺伝的アルゴリズム(Dynamically Separating Genetic Algorithms、以下、DS−GAと記す)」(たとえば、非特許文献2、非特許文献3を参照)の提案がなされている。
このDS−GAは、個体数に応じて個体を「コロニー」と呼ぶグループに動的に離隔する遺伝的アルゴリズム(以下、GA)である。個体を離隔する遺伝的アルゴリズムとしては、他に島モデルGAなどがあるが、DS−GAは離隔状態が個体数に応じて動的に変化する点で異なる。
小方 厚:「非12音平均律音楽のこころみ」情報処理学会研究報告、2004−MUS−54、pp.47−50(2004) 中山 功一、松井博和、野村由司彦著:動的離隔型GA(DS−GA)の提案、情報処理学会誌:数理モデル化と応用、Vol.43, No.SIG10(TOM7), pp.95-109, Nov.2002. K.Nakayama、K.Shimohara、and O.Katai: Dynamically Separating GA:A New Method Of Achieving the System-level Optimality in MAS, The journal of the three dimensional images、Vol.16, No.4、PP.177−183(2002)
小方 厚:「非12音平均律音楽のこころみ」情報処理学会研究報告、2004−MUS−54、pp.47−50(2004) 中山 功一、松井博和、野村由司彦著:動的離隔型GA(DS−GA)の提案、情報処理学会誌:数理モデル化と応用、Vol.43, No.SIG10(TOM7), pp.95-109, Nov.2002. K.Nakayama、K.Shimohara、and O.Katai: Dynamically Separating GA:A New Method Of Achieving the System-level Optimality in MAS, The journal of the three dimensional images、Vol.16, No.4、PP.177−183(2002)
しかしながら、従来は、現在用いられる音階以外の可能性を探るにあたり、工学的にどのように音階生成を実現すればよいかが明確でなく、まして、上述したようなMASを音階生成にどのように応用すればよいかが必ずしも明らかでない、という問題があった。
本発明は、上記のような問題を解決するためになされたものであって、その目的は、与えられたパラーメータに従って自動的に音階を生成する音階生成装置および音階生成プログラムを提供することである。
本発明の音階生成装置では、発音機器としての楽器の特徴と、受音機器としての身体性の特徴、および心地よいと感じられる音ほどより多くの頻度で発せられるようになるメカニズムを、MASを用いてモデル化する。このモデルを用いたシミュレーションにより、音階が創発的に生成される。
このような目的を達成するために、本発明の音階生成装置は、遺伝情報で規定される基本周波数での発音と受音とを行なう複数のエージェントを特定するための属性情報と、発音および受音の基本周波数の倍音の周波数成分の強度分布を格納する記憶装置と、記憶装置に格納された情報を参照して音階生成処理を行なうための演算装置とを備え、演算装置は、エージェントのうち、発音を行なう発音エージェントと、受音を行なう受音エージェントとを選択し、発音エージェントからの音の倍音の周波数成分と受音エージェントの基本周波数の倍音の周波数成分との近さに応じて、報償値を算出する共鳴演算手段と、報償値に応じて、各エージェントの属性情報である評価値を更新する評価値更新演算手段と、評価値の高いエージェントを優先的に残存させる処理を行なうエージェント選別手段と、共鳴演算手段と、評価値更新演算手段と、エージェント選別手段の処理を、所定の条件を満たす回数だけ反復させる反復処理手段と、複数のエージェントの遺伝情報が対応する基本周波数についてのエージェント個体数分布に基づいて、音階を導出する音階構成手段とを含む。
好ましくは、エージェント選別手段は、評価値の値が分裂しきい値となるに応じて、エージェントの分裂処理を行なう分裂処理手段と、評価値の値が消滅しきい値となるに応じて、エージェントの消滅処理を行なうエージェント消滅処理手段とを含む。
好ましくは、各エージェントは、属性情報として、複数のコロニーのうち所属するコロニーを識別するためのコロニー識別情報を有し、演算装置は、各コロニー内のエージェントの個体数が所定のしきい値を超えることに応じて、コロニー内のエージェントを2つのコロニーに離隔する動的離隔処理手段と、各コロニー内のエージェントの個体数が所定のしきい値を下回ることに応じて、当該コロニーを消滅させる処理を行なうコロニー消滅処理手段とを含む。
好ましくは、受音の基本周波数の倍音の周波数成分の強度分布と発音の基本周波数の倍音の周波数成分の強度分布とは異なる。
好ましくは、発音の基本周波数の倍音の周波数成分の強度分布は、入力された音の音色をモデル化したものである。
好ましくは、受音の基本周波数の倍音の周波数成分の強度分布は、ユーザの聴取可能な周波数帯域をモデル化したものである。
好ましくは、共鳴演算手段の算出する報償値は、発音エージェントからの音の倍音の周波数成分と受音エージェントの基本周波数の倍音の周波数成分について、事前に決定したユーザの好む組合せに対してより大きくなるように重み付けされている。
この発明の他の局面に従うと、演算装置を有するコンピュータに音階生成処理を実行させるための音階生成プログラムであって、遺伝情報で規定される基本周波数での発音と受音とを行なう複数のエージェントを特定するための属性情報と、発音および受音の基本周波数の倍音の周波数成分の強度分布を記憶装置に格納するステップと、記憶装置に格納された情報を参照して演算装置が音階生成処理の演算を行なうステップとを備え、音階生成処理の演算を行なうステップは、エージェントのうち、発音を行なう発音エージェントと、受音を行なう受音エージェントとを選択し、発音エージェントからの音の倍音の周波数成分と受音エージェントの基本周波数の倍音の周波数成分との近さに応じて、共鳴に対応する報償値を算出するステップと、報償値に応じて、各エージェントの属性情報である評価値を更新するステップと、評価値の高いエージェントを優先的に残存させるようにエージェントの選別処理を行なうステップと、共鳴に対応する報償値を算出するステップと、評価値を更新するステップと、選別処理を行なうステップの処理を、所定の条件を満たす回数だけ反復させるステップと、複数のエージェントの遺伝情報が対応する基本周波数についてのエージェント個体数分布に基づいて、音階を導出するステップと含む処理を、コンピュータに実行させる。
以下、図面を参照して本発明の実施の形態について説明する。
(本発明の概要)
以下にも説明するとおり、本発明では、音階を自動生成する手法として、MASの学習手法、好ましくは、上述したMASの学習手法の一つであるDS−GAを用いる。
(本発明の概要)
以下にも説明するとおり、本発明では、音階を自動生成する手法として、MASの学習手法、好ましくは、上述したMASの学習手法の一つであるDS−GAを用いる。
本発明では、音階の創発的な生成過程を、MASを用いてモデル化する。人が発音や受音に用いる身体や機器類を単弦楽器モデルとして、発音用楽器および受音用楽器を用いた発音行為、および受音行為をエージェントとしてモデル化する。また、人がより心地よいと感じる音をより多くの頻度で発音するようになるメカニズムを、エージェントの学習アルゴリズムとしてモデル化する。
[ハードウェア構成]
図1は、本発明の音階生成装置1000の外観の一例を示す概念図である。
図1は、本発明の音階生成装置1000の外観の一例を示す概念図である。
図1を参照して、音階生成装置1000を構成するコンピュータ100は、CD−ROM(Compact Disc Read-Only Memory )等のディスク118上の情報を読込むためのディスクドライブ108およびフレキシブルディスク(Flexible Disk、以下FD)116に情報を読み書きするためのFDドライブ106を備えたコンピュータ本体102と、コンピュータ本体102に接続された表示装置としてのディスプレイ104と、同じくコンピュータ本体102に接続され、ユーザ2からの入力を受けるための入力装置としてのキーボード110およびマウス112と、コンピュータ本体102に接続されたマイク132およびスピーカ134とを含む。
音階生成装置1000は、ユーザ2の指示に応じて、マイク132から入力された音声を録音可能なものとする。
図2は、コンピュータ100の構成をブロック図形式で示す図である。
図2に示されるように、このコンピュータ100を構成するコンピュータ本体102は、ディスクドライブ108およびFDドライブ106に加えて、それぞれバスBSに接続されたCPU(Central Processing Unit )120と、ROM(Read Only Memory) およびRAM (Random Access Memory)を含むメモリ122と、直接アクセスメモリ装置、たとえば、ハードディスク124と、マイク132およびスピーカ134とデータの授受を行なうためのインタフェース128とを含んでいる。ディスクドライブ108にはディスク118が装着される。FDドライブ106にはFD116が装着される。
図2に示されるように、このコンピュータ100を構成するコンピュータ本体102は、ディスクドライブ108およびFDドライブ106に加えて、それぞれバスBSに接続されたCPU(Central Processing Unit )120と、ROM(Read Only Memory) およびRAM (Random Access Memory)を含むメモリ122と、直接アクセスメモリ装置、たとえば、ハードディスク124と、マイク132およびスピーカ134とデータの授受を行なうためのインタフェース128とを含んでいる。ディスクドライブ108にはディスク118が装着される。FDドライブ106にはFD116が装着される。
なお、インタフェース128は、マイク132からの音声信号をサンプリングしてデジタル信号に変換する機能、CPU120がハードディスク124からの情報に基づいて生成したデジタルデータを対応する音声信号に変換してスピーカ134に出力する機能を有する。
なお、ディスク118は、コンピュータ本体に対してインストールされるプログラム等の情報を記録可能な媒体であれば、CD−ROM以外の他の媒体、たとえば、DVD−ROM(Digital Versatile Disc)やメモリカードなどでもよく、その場合は、コンピュータ本体102には、これらの媒体を読取ることが可能なドライブ装置が設けられる。
本発明の音階生成装置1000の主要部は、コンピュータハードウェアと、CPU120により実行されるソフトウェアとにより構成される。一般的にこうしたソフトウェアはディスク118、FD116等の記憶媒体に格納されて流通し、ディスクドライブ108またはFDドライブ106等により記憶媒体から読取られてハードディスク124に一旦格納される。または、当該装置がネットワークに接続されている場合には、ネットワーク上のサーバから一旦ハードディスク124にコピーされる。そうしてさらにハードディスク124からメモリ122中のRAMに読出されてCPU120により実行される。なお、ネットワーク接続されている場合には、ハードディスク124に格納することなくRAMに直接ロードして実行するようにしてもよい。
図1および図2に示したコンピュータのハードウェア自体およびその動作原理は一般的なものである。したがって、本発明の最も本質的な部分は、FD116、ディスク118、ハードディスク124等の記憶媒体に記憶されたソフトウェアである。
なお、一般的傾向として、コンピュータのオペレーティングシステムの一部として様々なプログラムモジュールを用意しておき、アプリケーションプログラムはこれらモジュールを所定の配列で必要な時に呼び出して処理を進める方式が一般的である。そうした場合、当該音声生成装置を実現するためのソフトウェア自体にはそうしたモジュールは含まれず、当該コンピュータでオペレーティングシステムと協働してはじめて音声生成装置が実現することになる。しかし、一般的なプラットフォームを使用する限り、そうしたモジュールを含ませたソフトウェアを流通させる必要はなく、それらモジュールを含まないソフトウェア自体およびそれらソフトウェアを記録した記録媒体(およびそれらソフトウェアがネットワーク上を流通する場合のデータ信号)が実施の形態を構成すると考えることができる。
(音階生成アルゴリズム)
以下の説明では、説明の簡単のために、1つのエージェントについて、発音と受音について共通な単弦楽器を想定するものとしている。ただし、録音されたある楽器の音色をモデル化するなどして、たとえば、発音についての倍音の周波数成分の強度分布を、受音についての倍音の周波数成分の強度分布とは異ならせることとしてもよい。
以下の説明では、説明の簡単のために、1つのエージェントについて、発音と受音について共通な単弦楽器を想定するものとしている。ただし、録音されたある楽器の音色をモデル化するなどして、たとえば、発音についての倍音の周波数成分の強度分布を、受音についての倍音の周波数成分の強度分布とは異ならせることとしてもよい。
以下では、本発明において使用する基本的な構成要素、用語について説明する。
・エージェント:楽器などを用いた発音行為(音の発生)、および聴覚などを用いた受音行為(音の知覚)を、それぞれエージェントとしてモデル化する。エージェントは、発音および受音に関係する遺伝子を持つ。
・エージェント:楽器などを用いた発音行為(音の発生)、および聴覚などを用いた受音行為(音の知覚)を、それぞれエージェントとしてモデル化する。エージェントは、発音および受音に関係する遺伝子を持つ。
各エージェントは、単位時間ごとに自らの遺伝子に応じて発音する。このとき、ランダムに選択された他のエージェントが、発せられた音を受音する。
・発音・受音用単弦楽器:図3は、発音・受音用単弦楽器を示す概念図である。エージェントが発音および受音に用いる機器として、それぞれ図3に示す所定の長さ、たとえば、長さ2の1本の弦からなる単弦楽器を想定する。発音用楽器と受音用楽器が平行においてあり、エージェントは、それぞれの楽器を用いて発音および受音する。
発音用の楽器には弦を弾くピックが、受音用の楽器には弦の振動を感知するセンサがそれぞれ駒の右寄りにあり、それぞれの弦を押さえる駒が弦の左寄りにある。駒は、それぞれ左からLOut∈{0〜1},LIn∈{0〜1}の範囲で移動可能であり、駒の位置は、各エージェントが持つ遺伝子により決定される。この弦は、駒の位置により決定される基本周波数(固有振動数)を持つ。
楽器の出す音の基本周波数は、弦の持つ固有振動数と等しいものとする。ここでは、400Hzから800Hzまでの1オクターブの音を出すモデルとして、基本周波数F1(L)は、LOut,LInに応じて、たとえば、式(1)で示される値とする。なお、Lは、発声の基本周波数または受音の基本周波数のいずれを表すかに応じて、それぞれLOutまたはLInのいずれかを示すものとする。
なお、このような1オクターブの音を出すモデルの基本周波数の関数形について、たとえば、ハードディスク124に格納しておき、その都度計算してもよいし、あるいは、Lに対するテーブルとして予め作成したものをハードディスク124に格納しておいてもよい。
言い換えると、発音モデルまたは受音モデルとしては、遺伝情報の値を決定すれば、事前に設定したパラメータまたは事前に計算したテーブルに基づいて、基本周波数を与えるものであればよい。
ピックにより弾かれた発音用楽器の弦は、基本周波数F1(LOut)と、その倍音の周波数成分Fn(LOut){=n×F1(LOut)}(nは自然数)を含む音を発する。
・共鳴:弦は、弦の固有振動数と同一周波数成分を多く含む音を受けると共鳴する。受音用楽器の弦は、発音用楽器から発せられた音の周波数成分Fn(LOut)と、受音用楽器の持つ基本周波数F1(LIn)のm倍(mは自然数)の周波数成分Fm(LIn)が近い場合、式(2)に従い共鳴する。この式(2)の関数R(LOut,LIn)が、共鳴した場合のエージェントへの報償値を与える。
ただし、まずは、音階生成の観点から、除外条件として、発音エージェントと受音エージェントの基本周波数がほぼ等しく同一音と判断できる場合{|F1(LOut)―F1(LIn)|<10}は除くものとする。
なお、後に説明するように、この除外条件とそれに対する評価の与え方は、適宜、ユーザ2の指示により変更可能である。
また、共鳴の度合いを表す値の関数R(LOut,LIn)は、遺伝情報LOut,LInにより規定される発音と受音の基本周波数の倍音の周波数成分が、発音エージェントと受音エージェントの基本周波数がほぼ等しく同一音と判断できる場合を除いて、発音エージェント側と受音エージェント側で相互に近いことに応じて増加する関数形であれば、他の関数でもよい。
・学習アルゴリズム:エージェントは、より心地よい音をより多くの頻度で発音するように駒の位置を学習する。本発明では、同一周波数成分を多く含む音を心地よいと感じるという前提に基づき、時刻tにおけるエージェントaの評価値E(a,t)を、式(2)で示された共鳴の度合いに応じて、式(3)に従い決定する。より高い評価を得たエージェントが分裂し、低い評価を得たエージェントが消滅する。
なお、より高い評価を得たエージェントの個体を優先的に残すためには、上述したような評価値に応じて、「より高い評価を得たエージェントが分裂し、低い評価を得たエージェントが消滅する」との処理以外にも、たとえば、より高い評価のエージェントほど選択される確率が高くなるように設定したルーレット選択などにより、選択されたエージェントが残存するとの処理を行なってもよい。
さらに、関数R(LOut,LIn)については、上述したように「発音と受音の基本周波数の倍音の周波数成分が、発音エージェント側と受音エージェント側で相互に近い」ことに応じて単純に増加するのではなく、事前に実験的に求めておいた、対象となるユーザが好む個別の音の組み合わせについては、より大きな値を与える重み付けを付けておくように、その関数形を定めておいてもよい。このときは、単なる物理的な共鳴による心地よさだけでなく、ユーザの好みという主観的な要素も、音階生成に取り込むことができる。
エージェント間相互作用のモデルとして、局所性を考慮できる「動的離隔モデル」を用いる。実空間では、より近くの個体間ほどより多くの頻度で相互作用が発生する。動的離隔モデルは、そのような相互作用の局所性や密度依存性をモデル化したものである。
図4は、このような「動的離隔モデル」の構成を説明するための概念図である。
図4に示すとおり、動的離隔モデルでは、各エージェントはコロニーと呼ぶグループごとに離隔される。異なるコロニーに存在するエージェントとは相互作用しない。
図4に示すとおり、動的離隔モデルでは、各エージェントはコロニーと呼ぶグループごとに離隔される。異なるコロニーに存在するエージェントとは相互作用しない。
図5は、動的離隔の処理を説明するための概念図である。
まず、特定のコロニー内では、各エージェントは、評価値Eに応じて、分裂または消滅する。さらに、同一コロニー内に存在するエージェント数が増加し限界数以上になる場合、そのコロニーに存在するエージェントは、さらに半数ずつのコロニーに離隔され、エージェント数が0になる場合、そのコロニーを消滅させる。
まず、特定のコロニー内では、各エージェントは、評価値Eに応じて、分裂または消滅する。さらに、同一コロニー内に存在するエージェント数が増加し限界数以上になる場合、そのコロニーに存在するエージェントは、さらに半数ずつのコロニーに離隔され、エージェント数が0になる場合、そのコロニーを消滅させる。
[シミュレーション実験に用いるDS−GAのアルゴリズム]
図6は、音階生成装置1000で用いる音階生成のための処理の概要をNassi-Shneidermanチャート(以下、「NSチャート」と呼ぶ)を示す図である。
図6は、音階生成装置1000で用いる音階生成のための処理の概要をNassi-Shneidermanチャート(以下、「NSチャート」と呼ぶ)を示す図である。
また、図7は、たとえば、ハードディスク124内に格納される(a)各エージェントの属性変数の管理テーブルと、(b)音階生成装置1000のシステム全体で使用される変数の管理テーブルを示す図である。
各エージェントの属性変数としては、a番目のエージェントについては、所属するコロニーの番号nc(a)、遺伝子L(a)=(LOut,LIn)と、タイムステップ(時刻)tにおける評価値E(a,t)とが格納される。以下では、1つのエージェントについては、L(a)=LOut=LInとする。すなわち、基本周波数については、発音も受音も1つのエージェントについては共通とする。
また、システムの管理テーブルには、現在存在する各コロニーncに含まれるエージェントの個数や、基本周波数のn倍の倍音成分の強度分布(基本周波数の強度を1としたときの相対値)が格納される。ここでは、上述のとおり、発音も受音も倍音の周波数成分の強度分布は、共通としている。しかし、発音と受音で、倍音成分の強度分布は個別に規定してもよい。また、強度分布については、テーブルではなく、関数形として規定してもよい。
図8は、図6に示したNSチャートをフローチャートで表現したものである。以下、音階生成のための処理を図8のフローチャートに基づいて説明する。
(1)初期設定:まず、CPU120は、仮想環境内に、所定数、たとえば、1000個のコロニーを作成する。さらに、CPU120は、各コロニー内に、これも所定数、たとえば100個のエージェントaを作成する。CPU120は、各エージェントaの初期属性として、初期評価値10と、無作為に決定された駒の位置を示す遺伝子L(a)=(LOut,LIn)を生成して、ハードディスク124に格納する(ステップS100)。
(1)初期設定:まず、CPU120は、仮想環境内に、所定数、たとえば、1000個のコロニーを作成する。さらに、CPU120は、各コロニー内に、これも所定数、たとえば100個のエージェントaを作成する。CPU120は、各エージェントaの初期属性として、初期評価値10と、無作為に決定された駒の位置を示す遺伝子L(a)=(LOut,LIn)を生成して、ハードディスク124に格納する(ステップS100)。
タイムステップを表す変数t、コロニーを識別するための変数ncの値が初期値として1に設定される(ステップS102,S104)。
(2)行動:続いて、CPU120は、処理対象となる識別番号ncのコロニー内の全エージェントについて、それぞれの遺伝子に従い駒の位置を決定し、式(1)の基本周波数と図7(b)の倍音成分の強度分布に基づいて発音の強度周波数分布を算出する(ステップS106)。さらに、CPU120の処理により、各エージェントの発音ごとに、同一コロニー内からランダムに選択された他のエージェントがその音を受音することに相当する処理が行なわれる。すなわち、CPU120は、発音および受音エージェントに、式(2)で示される共鳴の程度に応じて報償値を割り当てる(ステップS108)。
(2)行動:続いて、CPU120は、処理対象となる識別番号ncのコロニー内の全エージェントについて、それぞれの遺伝子に従い駒の位置を決定し、式(1)の基本周波数と図7(b)の倍音成分の強度分布に基づいて発音の強度周波数分布を算出する(ステップS106)。さらに、CPU120の処理により、各エージェントの発音ごとに、同一コロニー内からランダムに選択された他のエージェントがその音を受音することに相当する処理が行なわれる。すなわち、CPU120は、発音および受音エージェントに、式(2)で示される共鳴の程度に応じて報償値を割り当てる(ステップS108)。
さらに、CPU120は、このとき得た報償値により、評価値Eを式(3)に従い各エージェントに累積させて、図7(a)の管理テーブルを更新する(ステップS110)。
(3)エージェントの分裂と消滅:CPU120は、つづいて、エージェントの評価値が初期値の倍以上になると、エージェントを分裂する処理を行なう。このとき、エージェントは、分裂前のエージェントの評価値を半分ずつ持つ2つのエージェントに分裂し、それぞれ遺伝子を引き継ぐ。ただし、遺伝子は突然変異確率Pmut(たとえば、0.01)で変異する。また、エージェントは、エージェントの評価値が所定値、たとえば0以下になると消滅する(ステップS112)。
(3)エージェントの分裂と消滅:CPU120は、つづいて、エージェントの評価値が初期値の倍以上になると、エージェントを分裂する処理を行なう。このとき、エージェントは、分裂前のエージェントの評価値を半分ずつ持つ2つのエージェントに分裂し、それぞれ遺伝子を引き継ぐ。ただし、遺伝子は突然変異確率Pmut(たとえば、0.01)で変異する。また、エージェントは、エージェントの評価値が所定値、たとえば0以下になると消滅する(ステップS112)。
CPU120は、変数ncの値を1だけインクリメントさせ(ステップS114)、変数ncが所定のコロニー数の上限値Nccを比較し、変数ncが上限値Ncc以下の場合は処理をステップ106に復帰させる一方、変数ncが上限値Nccを超える場合は、処理をステップS118に進める。
(4)エージェントの移動:ステップS118において、CPU120は、全エージェントについて、移動確率Pmig(たとえば、0.01)に従い、現在所属するコロニーからランダムに選択された他のコロニーに移動させる(ステップS118)。
(5)コロニーへの動的離隔:CPU120は、コロニー内のエージェント数がコロニーの限界エージェント数Ncmax、たとえば、100を超えると、コロニーへの動的離隔の処理を行なう。このとき、1個のコロニー内に存在するエージェントは、2個のコロニーに離隔される。ただし、2個のコロニーに存在するエージェント数の差は1以下とする。また、コロニー内のエージェント数が所定値、たとえば1以下になるとコロニーは消滅する(ステップS120)。
(6)ランダム消去:次に、CPU120は、コロニー数が初期コロニー数より増えた場合、コロニー数が初期コロニー数と同数になるまでコロニーを無作為に消去する(ステップS122)。
(7)CPU120は、タイムステップt(時刻)の値を1だけインクリメントさせた後、変数tが所定の処理時間Tmax以下の場合は処理をステップS104に復帰させる。
(4)エージェントの移動:ステップS118において、CPU120は、全エージェントについて、移動確率Pmig(たとえば、0.01)に従い、現在所属するコロニーからランダムに選択された他のコロニーに移動させる(ステップS118)。
(5)コロニーへの動的離隔:CPU120は、コロニー内のエージェント数がコロニーの限界エージェント数Ncmax、たとえば、100を超えると、コロニーへの動的離隔の処理を行なう。このとき、1個のコロニー内に存在するエージェントは、2個のコロニーに離隔される。ただし、2個のコロニーに存在するエージェント数の差は1以下とする。また、コロニー内のエージェント数が所定値、たとえば1以下になるとコロニーは消滅する(ステップS120)。
(6)ランダム消去:次に、CPU120は、コロニー数が初期コロニー数より増えた場合、コロニー数が初期コロニー数と同数になるまでコロニーを無作為に消去する(ステップS122)。
(7)CPU120は、タイムステップt(時刻)の値を1だけインクリメントさせた後、変数tが所定の処理時間Tmax以下の場合は処理をステップS104に復帰させる。
一方、変数tが処理時間Tmaxを超えると、続いて、CPU120は、エージェントの遺伝子(駒の位置)の値を所定の値、たとえば、0.01ごとに分類した個体数比率を求める。この場合、分類された駒の位置が、複数の値に収束しているときには、各収束した駒の位置に対応する音の集合が音階を構成する(ステップS128)。
なお、以上の説明では、ステップS120で「動的離隔処理」を行なうものとしたが、コロニーを動的に離隔することなく、その他の処理について実行することでも、音階の生成を行なうことは可能である。
[シミュレーション実験]
(実験例1:単純なモデルによる音階の生成)
以下では、まず、本発明の実験モデルにおける音階の生成過程を明らかにするため、単純なモデルを用いた音階の生成について考える。発音用楽器が発する音には、n∈{2,3,4,5}倍の倍音成分を均等に含むものとする。
(実験例1:単純なモデルによる音階の生成)
以下では、まず、本発明の実験モデルにおける音階の生成過程を明らかにするため、単純なモデルを用いた音階の生成について考える。発音用楽器が発する音には、n∈{2,3,4,5}倍の倍音成分を均等に含むものとする。
(実験例1の実験結果)
図9は、実験例1の実験結果として、エージェントの遺伝子(駒の位置)の値を0.01ごとに分類した個体数比率を示す図であり、図10は、実験例1においてエージェントの単位時間ごとの獲得した評価値の平均を示す図である。
図9は、実験例1の実験結果として、エージェントの遺伝子(駒の位置)の値を0.01ごとに分類した個体数比率を示す図であり、図10は、実験例1においてエージェントの単位時間ごとの獲得した評価値の平均を示す図である。
図10から、進化的学習の結果、エージェントはより多く共鳴する音を獲得し、高い評価値を得たことが分かる。一方、図9から、エージェントの遺伝子が3つの値に収束したことが分かる。これら3つの値が示す音の周波数比は、452Hzを基準としたとき、ほぼ3:4:5となり、452Hzをドとすると、それぞれド・ファ・ラに相当する。また、このときのファとラの周波数は、平均律におけるファ・ラより絶対律におけるフア・ラに近い値となった。
実験例1では、いずれも事前に明示的な音階は与えていないが、エージェントの自律的な学習から、音階生成装置1000は、現在の12音階においてド・ファ・ラに相当する音からなる音階を生成した。
これは見方を変えると、人類が用いてきた楽器などの発音機器が「発せられる音に倍音成分が含まれる」という条件を満たし、人の聴覚などの受音機器が「同一周波数成分を含む音を心地よいと感じる」という条件を満たす場合には、「より心地よいと感じる音の発生頻度を増加させる」という学習メカニズムにより、元始の音階が創発的に生成されることに対応する。
実験例1のモデルでは、3つの音からなる音階は現れたが、それ以上の音からなる音階は現れなかった。これは、本モデルに組み込んだ5倍音までしか用いない条件は、現在の12音階の生成には十分ではないためであると考えられる。
(実験例2:実際の環境により近いモデルによる音階の生成)
実験例1では、発音用楽器は、基本周波数のn∈{2,3,4,5}倍の周波数成分を均等に含む音を発するものとした。また、受音用楽器は、基本周波数のn∈{2,3,4,5}倍の周波数成分を含む音に対して均等に共鳴するものとした。実際の弦では、基本周波数に比べて倍音成分の音量は高倍音ほど減衰して小さくなる。また、必ずしも5倍音までを含むわけではなく、それ以上の倍音成分を含む場合がある。
実験例1では、発音用楽器は、基本周波数のn∈{2,3,4,5}倍の周波数成分を均等に含む音を発するものとした。また、受音用楽器は、基本周波数のn∈{2,3,4,5}倍の周波数成分を含む音に対して均等に共鳴するものとした。実際の弦では、基本周波数に比べて倍音成分の音量は高倍音ほど減衰して小さくなる。また、必ずしも5倍音までを含むわけではなく、それ以上の倍音成分を含む場合がある。
そこで、実験例2では、現在の音階が生成されたと考えられる環境により近いモデルにより、より複雑な音階の生成について、試行した結果を説明する。
発音用楽器が含む倍音成分を基本周波数のn∈{2,3,…,10}倍とし、n倍音の音量を基本周波数における音の0.9n倍とする。さらに、音階生成の観点から、発音エージェントと受音エージェントの基本周波数がほぼ等しく同一音と判断できる場合{|F1(LOut)―F1(LIn)|<10}、負の評価として−10を与えるものとする。すなわち、式(4)に従い共鳴する。
(実験例2の実験結果)
図11は、実験例2の実験結果として、エージェントの遺伝子(駒の位置)の値を0.01ごとに分類した個体数比率を示し、図12は、実験例2においてエージェントの単位時間ごとの平均評価値を示す図である。
図11は、実験例2の実験結果として、エージェントの遺伝子(駒の位置)の値を0.01ごとに分類した個体数比率を示し、図12は、実験例2においてエージェントの単位時間ごとの平均評価値を示す図である。
図12から、進化的学習の結果、エージェントはより多く共鳴する音を獲得し、高い評価値を得たことが分かる。図11から、エージェントの遺伝子が6つの値に収束したことが分かる。これら6つの値が示す音の周波数比は、408Hzを基準としたとき、ほぼ36:40:45:48:54:60となり、408Hzをソとすると、それぞれソ・ラ・シ・ド・レ・ミに相当する。また、このときそれぞれの音の周波数は、平均律における値より絶対律における値に近いものであった。
実験例2では、より現実に近いと考えられる環境のモデルとして、10倍音までを含み、高倍音ほど音量が減衰し、同一音を心地よいと感じない場合に、音階生成装置1000は、現在の12音階により近いソ・ラ・シ・ド・レ・ミに相当する6つの音からなる音階を生成した。これは、「発音用楽器が10倍音までを含む」、「高倍音の音量が減衰して小さくなる」、「同一音を発音した場合に不快と感じる」といった条件が満たされる場合には、現在の12音階に近いより多くの音からなる音階が生成されることを示すものである。また、この結果は、どのような成分の音を発するかという楽器(発音機器)の特徴や、どのような音を心地よいと感じるかという人の身体性(受音機器)に応じて、生成される音階は異なることも示している。
言い換えると、音階生成装置1000において、特定の楽器の音色を録音したものを発音エージェントの発音の倍音の周波数成分の強度分布としてモデル化すると、楽器の特徴に応じたその楽器のための音階を生成したり、あるいは、聞き手が聞き取りやすい音域での受音感度をモデル化する、たとえば、所定の周波数帯域についてのみ強度を有するようにモデル化することで、聴覚などの個人が持つ身体性の特徴に応じた音階など、カスタムメイドな音階生成を行なうことが可能であることを示している。
(実験例3:現実の環境とは異なるモデルによる音階の生成)
実験例2では、現実により近いと考えられるモデルにより、現在の12音階に含まれる6音からなる音階を獲得した。以下の実験例3では、現実の環境とは異なると考えられるモデルを用いて、新しい音階の生成について述べる。
実験例2では、現実により近いと考えられるモデルにより、現在の12音階に含まれる6音からなる音階を獲得した。以下の実験例3では、現実の環境とは異なると考えられるモデルを用いて、新しい音階の生成について述べる。
実験例3では、20倍音(n∈{2,3,…,20},約4.3オクターブ上)まで減衰なく含む音を発生する発音機器と、それらの全ての音を知覚可能な受音機器をモデル化する。また、前節と同様に、発音エージェントと受音エージェントの基本周波数がほぼ等しく同一音と判断できる場合{|F1(LOut)―F1(LIn)|<10}には、負の評価として−10を与えるものとする。すなわち、式(5)に従い共鳴する。
(実験例3の実験結果)
図13は、実験例3の実験結果として、エージェントの遺伝子(駒の位置)の値を0.01ごとに分類した個体数比率を示し、図14は、実験例3においてエージェントの単位時間ごとの平均評価値を示す図である。
図13は、実験例3の実験結果として、エージェントの遺伝子(駒の位置)の値を0.01ごとに分類した個体数比率を示し、図14は、実験例3においてエージェントの単位時間ごとの平均評価値を示す図である。
図14から、進化的学習の結果、エージェントはより多く共鳴する音を獲得し、高い評価値を得たことが分かる。
また、図13から、エージェントの遺伝子が9つの値に収束したことが分かる。これら9つの値が示す音の周波数比は、10等分平均律に近い値となり、現在の12音階や、主に用いられている他の音階とは異なる音階が生成された。
以上説明したように、本発明では、「楽器など音を発する機器に倍音成分を含む」という特徴と「人が身体的に同一周波数成分を多く含む音を心地よいと感じる」という特徴がある場合、より心地よい音をより多くの頻度で発生させることにより、マルチエージェント・シミュレーションにより音階を生成できる。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
100 コンピュータ、102 コンピュータ本体、104 ディスプレイ、106 FDドライブ、108 ディスクドライブ、110 キーボード、112 マウス、132 マイク、134 スピーカ、118 CD−ROM、120 CPU、 122 メモリ、124 ハードディスク、128 インタフェース、1000 システム。
Claims (8)
- 遺伝情報で規定される基本周波数での発音と受音とを行なう複数のエージェントを特定するための属性情報と、前記発音および前記受音の基本周波数の倍音の周波数成分の強度分布を格納する記憶装置と、
前記記憶装置に格納された情報を参照して音階生成処理を行なうための演算装置とを備え、
前記演算装置は、
前記エージェントのうち、発音を行なう発音エージェントと、受音を行なう受音エージェントとを選択し、前記発音エージェントからの音の倍音の周波数成分と前記受音エージェントの前記基本周波数の倍音の周波数成分との近さに応じて、報償値を算出する共鳴演算手段と、
前記報償値に応じて、各前記エージェントの前記属性情報である評価値を更新する評価値更新演算手段と、
前記評価値の高いエージェントを優先的に残存させる処理を行なうエージェント選別手段と、
前記共鳴演算手段と、前記評価値更新演算手段と、前記エージェント選別手段の処理を、所定の条件を満たす回数だけ反復させる反復処理手段と、
前記複数のエージェントの前記遺伝情報が対応する基本周波数についての前記エージェント個体数分布に基づいて、音階を導出する音階構成手段とを含む、音階生成装置。 - 前記エージェント選別手段は、
前記評価値の値が分裂しきい値となるに応じて、前記エージェントの分裂処理を行う分裂処理手段と、
前記評価値の値が消滅しきい値となるに応じて、前記エージェントの消滅処理を行うエージェント消滅処理手段とを含む、請求項1記載の音階生成装置。 - 各前記エージェントは、前記属性情報として、複数のコロニーのうち所属するコロニーを識別するためのコロニー識別情報を有し、
前記演算装置は、
各前記コロニー内のエージェントの個体数が所定のしきい値を超えることに応じて、前記コロニー内の前記エージェントを2つのコロニーに離隔する動的離隔処理手段と、
各前記コロニー内のエージェントの個体数が所定のしきい値を下回ることに応じて、当該コロニーを消滅させる処理を行なうコロニー消滅処理手段とを含む、請求項1記載の音階生成装置。 - 前記受音の基本周波数の倍音の周波数成分の強度分布と前記発音の基本周波数の倍音の周波数成分の強度分布とは異なる、請求項1記載の音階生成装置。
- 前記発音の基本周波数の倍音の周波数成分の強度分布は、入力された音の音色をモデル化したものである、請求項4記載の音階生成装置。
- 前記受音の基本周波数の倍音の周波数成分の強度分布は、ユーザの聴取可能な周波数帯域をモデル化したものである、請求項4記載の音階生成装置。
- 前記共鳴演算手段の算出する前記報償値は、前記発音エージェントからの音の前記倍音の周波数成分と前記受音エージェントの前記基本周波数の前記倍音の周波数成分について、事前に決定したユーザの好む組合せに対してより大きくなるように重み付けされている、請求項1記載の音階生成装置。
- 演算装置を有するコンピュータに音階生成処理を実行させるための音階生成プログラムであって、
遺伝情報で規定される基本周波数での発音と受音とを行なう複数のエージェントを特定するための属性情報と、前記発音および前記受音の基本周波数の倍音の周波数成分の強度分布を記憶装置に格納するステップと、
前記記憶装置に格納された情報を参照して前記演算装置が前記音階生成処理の演算を行なうステップとを備え、
前記音階生成処理の演算を行なうステップは、
前記エージェントのうち、発音を行なう発音エージェントと、受音を行なう受音エージェントとを選択し、前記発音エージェントからの音の倍音の周波数成分と前記受音エージェントの前記基本周波数の倍音の周波数成分との近さに応じて、共鳴に対応する報償値を算出するステップと、
前記報償値に応じて、各前記エージェントの前記属性情報である評価値を更新するステップと、
前記評価値の高いエージェントを優先的に残存させるようにエージェントの選別処理を行うステップと、
前記共鳴に対応する報償値を算出するステップと、前記評価値を更新するステップと、前記選別処理を行うステップの処理を、所定の条件を満たす回数だけ反復させるステップと、
前記複数のエージェントの前記遺伝情報が対応する基本周波数についての前記エージェント個体数分布に基づいて、音階を導出するステップと含む処理を、コンピュータに実行させる、音階生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005224461A JP2007041226A (ja) | 2005-08-02 | 2005-08-02 | 音階生成装置および音階生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005224461A JP2007041226A (ja) | 2005-08-02 | 2005-08-02 | 音階生成装置および音階生成プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007041226A true JP2007041226A (ja) | 2007-02-15 |
Family
ID=37799275
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005224461A Withdrawn JP2007041226A (ja) | 2005-08-02 | 2005-08-02 | 音階生成装置および音階生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007041226A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009043152A (ja) * | 2007-08-10 | 2009-02-26 | Univ Of Electro-Communications | プログラムの維持・改良システム、及びコンピュータ読み取り可能なプログラム |
JP2020086785A (ja) * | 2018-11-21 | 2020-06-04 | 国立大学法人佐賀大学 | 情報処理システム、推薦システム及び情報処理プログラム |
-
2005
- 2005-08-02 JP JP2005224461A patent/JP2007041226A/ja not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009043152A (ja) * | 2007-08-10 | 2009-02-26 | Univ Of Electro-Communications | プログラムの維持・改良システム、及びコンピュータ読み取り可能なプログラム |
JP2020086785A (ja) * | 2018-11-21 | 2020-06-04 | 国立大学法人佐賀大学 | 情報処理システム、推薦システム及び情報処理プログラム |
JP7126700B2 (ja) | 2018-11-21 | 2022-08-29 | 国立大学法人佐賀大学 | 情報処理システム、推薦システム及び情報処理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Johnson-Laird et al. | On musical dissonance | |
Roederer | Introduction to the Physics and Psychophysics of Music | |
Villanueva-Rivera et al. | A primer of acoustic analysis for landscape ecologists | |
KR20070059102A (ko) | 콘텐츠 생성 장치 및 콘텐츠 생성 방법 | |
US20210055796A1 (en) | Tactile audio enhancement | |
KR20220115157A (ko) | 사용자의 발성을 분석하는 방법 및 이를 수행하는 장치 | |
JP7140221B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
WO2011122522A1 (ja) | 感性表現語選択システム、感性表現語選択方法及びプログラム | |
Palacio et al. | Piano&Dancer: Interaction Between a Dancer and an Acoustic Instrument | |
EP3699751A1 (en) | Virtual scene | |
JP2007041226A (ja) | 音階生成装置および音階生成プログラム | |
JP6701478B2 (ja) | 映像生成装置、映像生成モデル学習装置、その方法、及びプログラム | |
JP6708180B2 (ja) | 演奏解析方法、演奏解析装置およびプログラム | |
JP5961048B2 (ja) | 聴覚印象量推定装置及びそのプログラム | |
Williams et al. | Design and evaluation of a digitally active drum | |
Vawter | Ambient addition: How to turn urban noise into music | |
JP5941350B2 (ja) | 聴覚印象量推定装置及びそのプログラム | |
WO2023139849A1 (ja) | 感情推定方法、コンテンツ決定方法、プログラム、感情推定システム、及びコンテンツ決定システム | |
KR102576606B1 (ko) | 음색 임베딩 모델 학습 장치 및 방법 | |
Bauer et al. | Constructing gender in audio: exploring how the curation of the voice in music and speech influences our conception of gender identity | |
US20240134459A1 (en) | Haptic feedback method, system and related device for matching split-track music to vibration | |
Moore | The futures of music | |
WO2023062865A1 (ja) | 情報処理装置および方法、並びにプログラム | |
Nikalaou | Music emotion classification | |
Bisig et al. | Piano&Dancer-Interaction Between a Dancer and an AcousticInstrument |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20081007 |