JP5055556B2

JP5055556B2 - ハイブリッドｇａによる複数パラメータの最適化方法、パターンマッチングによるデータ解析方法、放射線回折データに基づく物質構造の推定方法、ならびに関連するプログラム、記録媒体および各種装置

Info

Publication number: JP5055556B2
Application number: JP2007549201A
Authority: JP
Inventors: 誠坂田; 英治西堀
Original assignee: Nagoya University NUC; Tokai National Higher Education and Research System NUC
Current assignee: Nagoya University NUC; Tokai National Higher Education and Research System NUC
Priority date: 2005-12-05
Filing date: 2006-12-04
Publication date: 2012-10-24
Anticipated expiration: 2026-12-04
Also published as: JPWO2007066787A1; US20090210366A1; EP1962234A1; WO2007066787A1; EP1962234A4

Description

（１）物質構造決定
本出願は、粉末試料にＸ線を照射して得られた回折環がもつ強度分布のピーク位置データに基づいて、この試料を形成する物質の構造を同定しようという、発明者らの研究から生まれた一連の発明を特許出願するものである。
それゆえ本発明は、放射線回折により試料の物質構造を特定する「物質構造決定技術」の分野に属する。より詳しくは、例えば粉末試料に照射されたＸ線等の回折パターンを解析してて同試料の物質構造を推定する「放射線回折データの解析技術」の分野に属する。
ふつう「物質構造」とは、その物質の結晶構造と、それに含まれる格子構造および分子構造との三者のうち、少なくともいずれかを指す言葉である。さらに物質の「結晶構造」とは、「格子構造」（当該結晶の格子定数）と、「分子構造」（同結晶内における分子の配列）との両者を含む技術用語である。ただし、「物質構造」とは、このような分子構造パラメータだけに限定されるものではなく、電子密度分布パラメータや結晶学的構造パラメータなどを指すこともある。また、ここで言う「構造決定」とは、このような物質構造のうちいずれかを可能な限り正しく精密に推定することである。
すなわち本発明は、単結晶試料ばかりではなく、多数の微細な結晶粒からなる粉末試料など、その放射線回折パターンが回折環の強度分布データとしてしか得られない試料物質についても、その物質の結晶構造や分子構造を高精度で決定することを可能にする技術である。それゆえ本発明によれば、ある程度以上の大きさを持つ単結晶を作ることが難しい物質の構造決定ができるようになるから、未知の分子構造をもつ医薬品や新素材などの構造決定に好適である。
（２）ハイブリッドＧＡ
本発明はまた、ハイブリッドＧＡによって多数のパラメータを最適化する「パラメータ最適化」ないし「最適パラメータ探索」の技術分野や「パターンマッチングによるデータ解析」の技術分野にも属する。
そして、これら一連の本願発明の中核となる発明概念は、遺伝的アルゴリズム（略称「ＧＡ」）に特定の方式で局所最適化操作を組み込んでハイブリッド化することにより、収束性を向上させたハイブリッドＧＡそれ自体である。
なお、局所最適化操作が組み込まれたＧＡについては、いくつかのバリエーションがすでに公知であり、それらについては、以下の背景技術の項で公知文献を挙げて説明する。そして英語圏では、このようなアルゴリズムを、用不用説を唱えた先達の名を冠して「ラマルキアンＧＡ」と呼ぶことが多い。一方、日本では同じものを「ハイブリッドＧＡ」と呼ぶことが多いので、本明細書でもハイブリッドＧＡの名称を使うことにした。また、必要に応じてこれを「ＨＧＡ」と略称してもよいものとする。

１．Ｘ線回折による物質構造決定技術の概況
（１）直接法による構造決定
材料や医薬品などの研究開発において最も重要で基盤となる情報は、その材料の原子配列に関する情報である。すなわち、当該物質の分子内における立体的な原子配列がどうなっているかが分かれば、その物質の機能をある程度は予測することができるようになり、種々の応用研究を進めていくことができる。
このような状況は、その分野にかかわらず、分子性の物質の研究開発においてもほとんど変わるところがない。すなわち、分子を設計し、新たに創生した時、最初に求められるのは目的の分子ができたかどうかを判別する原子配列の決定である。ここで、原子配列が決定されてしまえば、目的としていた分子ができたかどうかが確認されるだけでなく、他にも重要な情報が得られる。たとえば、互いに隣り合う二つの原子を隔てる原子間距離から、両原子の結合形態（炭素原子ならその結合状態が２重結合か１重結合か）や、各原子のイオン価数など、分子の特性決定づける多くの情報を得ることができる。
さて、このような原子配列を決定する方法として、最も有力で直接な証拠を与えられるのがＸ線回折法である。すなわち、他の構造測定手法には、たとえば核磁気共鳴（ＮＭＲ）法などがあるが、これらの手法ではふつう状況証拠しか与えることができない。しかし、これに比べて、Ｘ線回折法によれば、当該分子中のすべての原子の立体的な配列を十分な精度（おおよそ０．０１ｎｍ以下）で決定することができる。一方、無機材料に対しては原子を観測する手法として電子顕微鏡観察があるが、分子性の結晶は電子線に弱いので、このような材料に対しては、電子顕微鏡による原子配列の観測は不可能である。
現在、一般的なＸ線回折分野の常識として、分子性結晶の原子配列決定には、単結晶試料が必要である。なぜならば、単結晶試料を生成することさえできれば、タンパク質などの巨大分子を除いて、大半の材料についてほぼ自動的に原子配列（構造）を決定することができるからである。このように結晶試料のＸ線回折による構造決定方法は、１９８５年にノーベル賞を受賞したＪ．Ｋａｒｌｅ，Ｈ．Ａ．Ｈａｕｐｔｍａｎによって開発された結晶構造を直接決定する方法であり、直接法と呼ばれている。
そして、Ｘ線装置技術の進歩と解析に用いるコンピュータの計算能力の進歩により、現在では回折装置とＰＣ（パーソナルコンピュータ）１台があれば構造が決定できるシステムが構築され広く普及している。国内外の大学では理工系学科に少なくとも１台は、単結晶Ｘ線回折装置が設置されているのが普通である。また、このような回折装置は、医薬品関連企業や材料開発を行っている企業関係にも広く普及している。
（２）単結晶の生成という難関
ところで、このような単結晶Ｘ線回折による原子配列決定方法を実行するうえで、避けて通れない最大の難関ないし隘路（ボトルネック）は、単結晶試料を得ることにある。なぜならば、単結晶試料として使用できるほどの大きさをもつ結晶の生成は、なかなか容易ではないことが多いからである。
すなわち、自然界に存在する物質のなかで単結晶で存在するものは、たいへんに稀であり、ほとんど存在しないと言って良い。仮に大きな単結晶が例外的に存在したとしても、それは自然界ではごく稀であるがゆえに高価な宝石であったりする。また、人工的に大型単結晶の作成が可能で実用化されている材料も、半導体材料（たとえばシリコン）くらいしかない。このように、単結晶の作成とは、通常では存在する状態ではない物質の状態を作り出すプロセスであるともいえる。一般に、単結晶を作成するためには、様々な結晶化条件で試料物質の結晶化を試みる必要がある。そして、このプロセスにはかなりの年月と大量の試料とが必要とされ、膨大な労苦を費やすことになる。例えば、仮にある物質の構造決定に十年間を要したという場合に、そのうち八年間はＸ線回折に十分な大きさの単結晶を作ることに費やされていたということも珍しくなかった。
このような事情から、単結晶の生成に成功して実際に原子配列を決定することができるのは、創生される多数の物質のうちほんの数％程度にしか過ぎない。
こうして、単結晶試料が生成できないために原子配列が決定できないことは、分子性材料を用いた開発研究の大きな足かせとなっている。たとえば医薬品などでは、所望の分子ができているかどうかが分からないせいで、せっかく新物質を開発しても結局は薬として使うことができないことも少なくない。また、機能性材料の場合にも、電気伝導度などで興味深い特性を持った物質が創成できたとしても、その特性なり機能なりが、どういった物質構造に起因しているかを知ることができない。
以上のように、単結晶の試料物質を作れないのでＸ線回折パターンによる直接法で構造決定ができず、物質設計のための情報が不足してしまっていた。その結果、結局のところ場当たり的で試行錯誤が無駄に多い物質開発に終始せざるを得なかったというのが、今までの状況であった。
２．代表分野での現状
以上のような理由で、粉末試料からその物質構造を決定する技術の開発は、分子性の材料を研究開発の対象とした極めて広い分野で切望されている。このことを具体的に理解していただけるように、以下では医薬品開発の分野とナノテクノロジー材料開発の分野とを例にとって、背景技術の現状を説明する。
（１）医薬品開発
一般的に言って、医薬品（ないし薬物）は粉末として用いられることが多いから、医薬品の研究開発において本来必要とされるのは、粉末状態での物質構造である。
ところが、一般に有機分子から構成される薬の場合、前述のように粉末では構造を決められないため、長期間をかけ苦労して単結晶を作成して構造を決定している。最近では、安全性などの観点から、物質構造を確認してからでなければ医薬品として認可されない場合が多い。すると、せっかく薬効のある物質が発見されても、その物質で大きな単結晶を作ることができないがために、その立体的な分子構造が解明できず、それが故に医薬品として用いられていないという状況に至ることも物質も少なくない。
そこで、もしも粉末試料からその薬品の分子構造が決定できるようになれば、新薬開発を飛躍的に進められることになる。そればかりではなく、医薬品開発の分野では次のような利点も生じる可能性がある。
すなわち、医薬品に用いられる有機分子は、たとえ分子式や構造式の表記は同じであっても、分子中の原子の立体配列が異なっていたり、結晶としては異なる構造で存在したりするものが多い。このように、構造式の表記などは同じであっても結晶構造が異なることがある分子を、医薬品の分野では「結晶多形」をもつ分子と呼んでいる。
そして、ある医薬品の分子が結晶多形である場合には、同じ構造式をもつ分子からなる粉末であっても、結晶構造が異なっているために、融点や密度、熱力学的安定性、溶媒に対する溶解度などが異なることがある。それゆえ、結晶多形のうち目的の相とは別の相を用いてしまうと、意に反して水に溶けず薬効を示さなかったりするなど、不都合を生じる可能性がある。それゆえ、この結晶多形という性質は、医薬品開発の分野では重大な問題である。
そればかりではなく、錠剤の作成など、医薬品を製品化するプロセスでも、粉末試料が圧縮されたり、熱処理されたりことがあるので、分子性の結晶は、これらのプロセスでも構造が変わる可能性がある。これらのプロセス中での構造の変化を追跡するには粉末試料からの構造決定が必要であるが、現状では粉末試料から構造を決定できる手法がないため行われていない。
以上のように、粉末試料から医薬品の構造を決定することができるようになれば、医薬品開発が飛躍的に加速され、最終的には世のすべて人々の健康の増進に繋がるのだが、その手段として今までは実用に耐えるものがなかった。
（２）ナノテク材料開発
有機伝導体やフラーレン関連物質など分子性材料は、十年先程度の近未来であってもナノテクノロジーの基幹物質として期待されており、国内外の多数の研究者によって研究が進められている。そして、これらの研究でもＸ線回折による構造情報は、材料開発の初期段階で最も重要である。
たとえば、現在ではボーリングのボール、テニスラケット、ゴルフクラブのヘッド、化粧品など１０品目を超える製品に利用されるようになった炭素のサッカーボール型分子フラーレンも、発見当初の研究では、構造の決定が最も重要なテーマであった。すなわち、構造が決定された後に、ようやく超伝導体や磁性体など機能性材料の生成過程や様々な特性が、構造に基づき理解され、応用研究が進められていった。そして現在では、すでに年産数十トン程度の生産能力を持つフラーレン生成用の商用プラントが整備されており、さらに多くの製品への利用が始まっている。
さて、フラーレンに限らず、分子性の材料であれば結晶の構成単位が分子であるので、シリコンなどの無機材料と比較して生成可能な物質の種類は膨大な数に上る。それゆえ、研究者らによりおびただしい数の新物質が合成されているが、その構造決定には単結晶試料が必要とされていたがゆえに、未だに構造が明らかにされていない物質が多い。そして前述のように、構造が明らかにならないこと自体が、新物質生成の研究を推進するうえでの足かせになっている。
たとえば、新物質の物性測定などを先に進め、苦労の末ようやく単結晶ができた時点でその物質構造が決定されてみれば、予測していた分子とは違っていたとか、別の方法で生成された分子と同じだったとかということは、よくあることである。しかし、そういうことがあると、それまでの研究に投下された資源は、ほとんどが無駄になってしまうわけである。
したがって、物質生成の初期であって単結晶が作れない段階であっても、その粉末試料から構造決定ができる技術があれば、これらの研究を飛躍的に加速することができる。それゆえ、粉末試料からの構造決定技術は、分子材料を用いたナノテクノロジーの分野においても、その基盤技術となる可能性を持っているのだが、残念ながらその手段がなかったという実情が本発明の背景にある。
３．粉末試料による構造決定が難しい理由
（１）概要
以上の説明では、もし粉末試料からの物質構造の決定技術があれば、医薬品や材料の開発に決定的な役割を果たすであろうことは明白でありながら、それが実現されていないということを述べてきた。では、粉末試料の構造決定がこれだけ切望されている技術でありながら今まで実用化されていなかったのは何故であるか、その理由の一端をここで説明しておく。
その理由を簡明に言うならば、あまりにも少ない情報量に基づいて、あまりにも多くの自由度を持つ物理量をしかも精密に求めることが要求されたので、今までの最適パラメータ探索技術の手に余ったからである。
（２）回折環の情報量
先ず、粉末試料から得られたＸ線回折環に含まれる情報量は、極めてわずかでしかないことから説明する。
仮に、当該物質からある程度大きな（例えばサブミリメートル程度の）結晶を生成することができたものとし、この結晶を試料としてＸ線回折試験装置にかけた場合を考えてみよう。すると、図１（ａ）に示すように、その結晶に入射したＸ線は回折し、回折強度が格子状（ないし碁盤目状）に分布した回折パターンを生じる。
逆に、当該物質で回折試験に必要な大きさの結晶を作ることができず、仕方なしに当該物質の粉末試料をＸ線回折試験装置にかけた場合を考えてみよう。すると、図１（ｂ）に示すように、その粉末試料に入射したＸ線は同軸の円錐状に回折し、回折強度が同心円状に分布した回折パターン（回折環）を生じる。
ここで、図１（ａ）の二次元的な回折パターンと図１（ｂ）の回折環とを比較してみると、回折環の方は回折角の大きさに応じ半径方向に沿って回折強度が一次元的に分布した強度分布データしか得られないことがわかる。それゆえ、粉末試料のＸ線回折である回折環からもたらされる情報量は、単結晶試料から得られた二次元的な回折パターンがもつ情報量に比べてずっと少ない。
そればかりではなく、試料結晶の格子面（ｈｋｌ）の向きによってＸ線回折の方向および回折角が異なってくるから、粉末試料から得られた回折環では、その粉末試料に含まれている多数の微細な結晶が生じる回折ピークが互いに重複していることが多い。すると、互いに重なったピークを分離することができなくなり、回折環に含まれる情報はいよいよ少なくなってしまう。そして、粉末試料の回折強度分布では、あまりに広い角度範囲に小数のピークが分散しているので、多くの場合、回折データは結局のところ、ピーク位置とピーク強度との対を示す数値データに落とし込まれる。
また、定量的に説明すると、現行のＸ線回折装置ないしそのＸ線検出器から求めることができる精度は、回折角度２θにしておおよそ０．１〜０．０１°程度の桁にある。一方、回折角度２０の範囲は１５０°くらいまでだから、その解像度ないし分解能は、階調数にして１０の３〜４乗程度でしかない。なお、回折環におけるＸ線強度の階調数（つまり明暗の段階数）は、１０の３〜６乗程度である。
（３）格子定数を決定したい場合
一方、試料物質の結晶が持つ格子定数を決定したい場合には、以上のように回折環に含まれる情報が極めて少ないのに対し、格子定数の決定に要求される精度は極めて高く、その解空間が極めて広いことが困難さの原因となっていた。
すなわち、粉末試料の回折環から１次元の強度分布データに基づいて、六つ一組の格子定数（ａ，ｂ，ｃ，α，β，γ）と原点移動パラメータ（ｔ）とを決定する際には、格子定数のそれぞれの決定に要求される精度が非常に高いことが問題になる。それに比べ、多くの場合、格子定数を決めるべき試料物質の標準的なａ，ｂ，ｃの値は１０〜３０Å程度であるのに対し、これらの決定に要求される精度は０．０１〜０．００１Å程度とかなり細かい。それゆえ、当該パラメータ（ａ，ｂ，ｃ）の探索空間での決定精度は、階調（値の取りうる幅に対する分解能）にして、各パラメータにつき１０の５〜６乗程度の桁で要求される。
したがって、決定すべき構造パラメータが格子定数の場合に、その要求精度を階調で表すと、ａ，ｂ，ｃがそれぞれ１０の５〜６乗程度の桁に、α，β，γがそれぞれ１０の４〜５程度の桁になり、いずれにしろ非常に大きいことになる。それに加えて、原点の位置ずれに関するパラメータｔも、１０の２〜３乗程度の桁をもつ階調で決定しなければならない。
その結果、探索すべき複数パラメータが解空間で取りうる場合の数は１０の２９〜３６乗程度と、極めて大きいものになっているにもかかわらず、前述のように回折環のもつわずかな情報量からこれを決定しなければならない。格子定数の決定においては決定したいパラメータ数がわずか６個であっても、回折環に基づいてこれを決定することの難しさは実にここにある。
（４）分子の結晶構造を決定したい場合
この場合には、分子を構成する原子の数が多くなり、分子内での回転可能な結合部分が増えていくにつれて、分子内回転の自由度が増していく。このことから、複雑な分子であれば、その分子内で各原子がどのように三次元配置されているかを示す結晶構造を決定することは、多くの自由度をもつ多次元の解空間内で解を探索することになる。それゆえ、分子構造の自由度が増えるだけ（つまり決定すべきパラメータの数が増えるだけ）、指数関数的に構造決定が困難になっていくことは明らかである。
（５）遺伝的アルゴリズム（ＧＡ）の適用
先ほど、解空間の取りうる場合の数は極めて大きいことを説明したが、その数を控えめに見積もって１０の２０乗程度とし、使用可能なコンピュータで毎秒１万回の試行演算ができたと仮定してみよう。すると、絨毯爆撃方式の全探索を行うには３億年間程度かかることになり、これは明らかに受け入れがたい計算時間である。
そこで、もう少し賢明に最適パラメータの探索を行い、物質構造の決定に要する計算時間を短縮することができるように、様々な試みがなされている。その中で、人工知能の分野で研究が盛んにされていたＧＡ（遺伝的アルゴリズム）を用いる試みもなされており、本発明はこのような背景の中で行われた研究から生まれてきたものである。
次項には、発明者らが調査できた範囲で本発明に関連があろうかと思われる公知文献を列挙し、ごく簡単に解説した。これらの中には、物質構造の決定方法に関する文献ばかりではなく、ＧＡを改良したハイブリッドＧＡに関する文献もある。
４．公知文献の簡単な説明
（１）特許文献
・特許文献１
この文献には、所定の空間群に属する斜方晶系のタンパク結晶の一種について、液滴蒸気拡散法によって所定の大きさの結晶を成長させ、単結晶試料のＸ線回折により複合同位体置換法を用いて三次元構造決定を行った旨が記載されている（第００１０段落〜第００１１段落）。この技術では、Ｘ線回折試験に供することができるだけの大きさに単結晶試料を成長させており、回折環データの解析による物質構造決定は行われていない。
・特許文献２
この文献には、Ｘ線などを試料に照射して、薄膜構造解析、単結晶構造解析や粉末構造解析などの物質構造解析を行う技術が開示されている。この技術の特徴は、構造パラメータの決定を高精度で短時間に行えるように、普通のＧＡ（遺伝的アルゴリズム）またはその改良版であるμＧＡで最良解を探索した後、その最良解（適応度最高の個体に相当）に局所最適化を施していることである（同文献の図１参照）。なお、この技術で用いるＧＡやμＧＡでは、適応度が高いエリート個体は次世代にそのまま残し、他の個体を親にして交叉を行っている（同文献の第００１８段落および図２参照）。
この技術では、ＧＡないしμＧＡによる最適パラメータ探索が、その最良解を正解の近傍に収束させるまで待たなければならないが、そこまで待てば構造パラメータの決定を高精度化することができる。それゆえ、この技術によれば、単なるＧＡやμＧＡに比べて構造パラメータの決定に要する計算時間を短縮することに、ある程度の効果を見込むことができる。
しかし、ＧＡ探索によってその最良解が正解の近傍に至るまでは局所最適化をかけても無駄であるから、最良解が正解の近傍に至ったと確信できるまでは待たなければならず、計算時間の短縮効果は限定的でしかない。
すなわち、基本的に言ってこの技術は、ＧＡやμＧＡで行う広域探索の最終段階でしか局所最適化をかけることができず、個体の進化に方向性を与えるものではない。そうではなく、この技術は、ＧＡやμＧＡによる確率的な広域探索では難しい最後の詰めを、確定的な操作である局所最適化によって加速するに過ぎない。そういう意味で、この技術は英語圏でいう″ＬａｍａｒｃｋｉａｎＧＡ″（日本語表記では「ラマルキアンＧＡ」）とは、いくぶん主旨が異なるようである。
・特許文献３
この文献には、試料ホルダとその周辺部とに工夫を加えて、散乱Ｘ線による影響を低減したＸ線回折計測装置が開示されている。
・特許文献４
この文献には、Ｘ線や放射光による粉末回折データの測定において空間分解能を上げるために、検出器をそのピクセル間隔よりも細かく移動させ、ピクセル間を補間するデータを測定する技術が開示されている。この技術は、一次元の検出器にも二次元の検出器にも適用可能である。
・特許文献５
この文献には、Ｘ線回折試験装置において、粉末試料を収容したキャピラリーが細かったり、試料自体が細い線状であったりする場合にも、小さな試料を取り付ける際の作業が容易なる工夫がされた試料ホルダが開示されている。
・特許文献６
この文献には、プロテインキナーゼの突然変異体を結晶化させてその構造を決定する方法とその結果とが開示されている。
・特許文献７
この文献には、最適化問題に遺伝的アルゴリズムを適用するにあたって、ポピュレーションの多様性を維持する工夫が提案されている。その工夫の特徴は、ポピュレーションをいくつかの「島」と呼ばれる集団に分けて島の間で個体を交換したり、「タワー」と呼ばれる島の階層構造を導入したりすることのようである。
そして、同文献の「発明の名称」には、その冒頭に「ハイブリッド型遺伝的アルゴリズム」という文言があるが、そのハイブリッド型遺伝的アルゴリズムとはどのようなものであるのかは明記されていないようである。すなわち、「既存型アルゴリズムと組み合わされた遺伝的アルゴリズム」（同文献の請求項１および第００６３段落）という程度の説明はあるが、これでは具体性を欠いている。さらに、「この最適化問題を解くために高速な既存型アルゴリズムがあると仮定する。ここで，既存型アルゴリズムとは，ヒューリスティックな解法に基づくアルゴリズムである。」（第０００６段落）とあっては、同文献の記載は仮定の話なのかと読者は思わずにいられない。そればかりではなく、同文献では具体的な数値例は一例も開示されておらず、「実施例」の項にある記載内容はむしろ「産業上の利用可能性」の項に記載すべき内容である。
それゆえ、同文献では所期の課題を解決することができているのかという疑問と、同文献は発明として完成されているのかという疑問とが払拭されない。また、単に適応度の高い解を探すことが目的である場合ではなく、Ｘ線回折による物質構造推定のように単一の正解が存在するデータ解析に適用することが目的である場合には、実用性があるのか否かも疑問である。
・特許文献８
この文献には、遺伝的アルゴリズムを用いてパラメータの最適化ないし最適パラメータの探索を行うにあたり、遺伝的アルゴリズムの交叉過程にパラメータの連続性を考慮した工夫を取り入れた技術が開示されている。
すなわち、同文献では、その第００４１段落に記載されているように、交叉の際に両親として選択された二つの親個体について、先ずそのパラメータ空間における中点を求め、次にその中点を中心とする正規分布などの連続的な確率分布に従って二つの子個体を生成する。この際、同文献の図８を参照して第００４４段落に記載があるように、正規分布の標準偏差は、両親となる親個体１，２間の距離や、両親を結ぶ直線と第三の親個体３との距離に比例して設定される。その結果、パラメータ空間で互いに近傍にある両親の個体は遺伝子空間でも互いに近傍にあることが認識されて交叉されるから、要するに親個体に似た子個体が生まれるようになる。すると、探索所期にはふつう両親の間の距離が互いに遠いので比較的広い範囲で探索が行われ、探索の終盤では両親が互いに近接していることが多いので局所的な探索が行われる。
また、同文献の第００４６段落には、突然変異は子個体の遺伝子に正規乱数を加算する操作として、突然変異に局所的な探索を担当させることにより、探索終盤を効率よくすることができる旨の記載がある。さらに、同文献の第００５８段落には、探索の終盤で局所ピークに効率よく到達するために最急降下法などの局所的探索手法を組み合わせても良い旨の記載がある。
しかしながら、同文献ではその第００１０段落で初期収束を問題視していながら、十分に広域的な探索が行われうるのかは疑問である。なぜならば、交叉では親個体に似た子個体しか生まれず、突然変異で生成される新たな個体の範囲も正規分布で規制されるわけだから、初期世代において親個体の分布が偏っていれば、そのまま初期収束してしまうように推定されるからである。
また、前述のようにその第００５８段落には局所的探索手法を組み合わせる旨の記載があるが、その組合せ方は「遺伝的アルゴリズムによってパラメータを最適化した後に」ということなので、前述の特許文献２とおおむね同様であろうと想像される。これに関しては、その「発明の効果」の項のうち第０１４３段落にも、「前記遺伝的アルゴリズムを用いて最適化したパラメータに対して、局所的探索手法による最適化を行うことにより」との記載がある。
なお、同文献では実施例１の変形例として「地域的な小集団」という概念を導入し、その小集団内で遺伝子操作を行う旨が、第００６２段落および第００６３段落に記載されている。しかし、これは一つの村の中で結婚を繰り返すようなものだから、遺伝子の多様性を求める方向とは全く逆であり、同文献で問題視していた初期収束を解決する作用があるものとは考え難い。
（２）非特許文献
非特許文献の紹介にあたっては、ＧＡを用いて広域的探索を行う技術に関する文献から先ず解説する。
・非特許文献１
この文献には、多峰性の著しい（つまり落とし穴の多い）大域的最適化の問題である板取り問題の解法として、ＧＡに局所最適化を組み合わせたハイブリッドＧＡの一種が開示されている（１節末尾）。このハイブリッドＧＡは、準ニュートン法による局所最適化操作をＧＡの評価過程に組み込んだものである（同文献の４節冒頭および図４参照）。
そして、この組み込み方の特徴は、同文献の図９および４．８節を参照する限り、各個体に対して（あるいは交叉や突然変異で生じた新生個体の全てに対して）局所最適化操作を施すもののようである。
なお、そのＧＡの選択過程（淘汰過程）の前処理として、σ−切り捨て（適応度による足切り）処理と、個体の多様性を維持するために適応度に対する線形スケーリング処理とが施されている。そして、選択過程では、適応度の高さに応じた数の個体が親個体に選択される期待値戦略と、最も高い適応度を持つ個体が生き残るエリート保存戦略とが採られている。
その結果、対象がかなり複雑な問題であるにも拘わらず、この解法でわずか３０〜４０世代程度の間に収束をみるという成果を出している（同文献の図７参照）。しかしながら、その４０世代にかかる計算時間は、２８．５ＭＩＰＳ，４．２Ｍｆｌｏｐｓのワークステーションを用いても、約９０時間すなわち４日間近くとなっている（同文献の５節末尾参照）。
・非特許文献２
この文献で開示されている技術内容は、一読したところ前述の非特許文献１とおおむね同一のようである。
・非特許文献３
この文献には、タンパク質立体構造予測問題を含む大規模な広域探索（ないし広域最適化）問題に適用するために、ＧＡを用いた探索手法（広域最適化手法）を分散して並列処理する方法が開示されている。その方法としては、分散ＧＡ，拡張分散ＧＡ，分散確率モデルＧＡ，近傍培養型ＧＡ及び適応的重み付けＧＡと、これらを互いに組み合わせたハイブリッド手法とが紹介されている。ただし、ここでいうハイブリッド手法とは、上記の各種ＧＡをどう組み合わせるかといったことであり、局所最適化操作をＧＡに組み込むことではないようである。
・非特許文献４
この文献には、粉末試料のＸ線回折データを解析して同試料の物質構造を決定する方法について、ＧＡ適用の実際を含めて実に良くまとめられており、同文献を読めばその執筆当時（１９９７年）までの背景技術がよく分かる。
この文献の導入部には、細かな粉末状の試料にＸ線を照射して得られた回折環データに基づいて、その資料物質の結晶構造を求めようとしても、強度ピークの重なり（ピーク・オーバーラップ）が大きいので、伝統的な方法によっては難しい旨が明記されている。そして同文献の主旨は、それがゆえに回折環のデータ解析にＧＡを用いることが研究されており、著者らはＧＡの適用にあたって何某かの工夫を加え、すでに構造が決定されている物質の粉末試料Ｘ線回折データに適用してみたということである。
しかし、同文献には局所最適化操作をＧＡに導入したハイブリッドＧＡについては特に言及はないので、結晶構造の特定にあたり決定すべきパラメータの自由度や精密さが増していくと、計算時間が爆発的に増大してしまう可能性が高い。
・非特許文献５
この文献では、粉末試料のＸ線回折データを解析して物質構造を決定する新手法としてラマルキアンＧＡ（すなわちハイブリッドＧＡ）が提案され、ごく少ない世代交代の間に構造決定がなされる演算例も提示されている。しかし、同文献で提案されている技術では交叉で生じた子個体と突然変異で生じた新個体との全てに局所最適化を施しているので、世代交代の数は少なくても各世代での演算量が膨大なものとなる。その結果、同文献の技術を用いても、物質構造決定に要する計算時間の短縮効果は限定されたものにしかならないであろう。
・非特許文献６
この文献では、粉末試料のＸ線回折データから、前述のように物質構造（すなわち分子内の原子配置）を決定するのではなく、試料物質の結晶格子定数を求める手法にＧＡを用いることが提案されており、実際の回折環データを解析例が開示されている。同文献には格子定数決定の困難さとその原因とが整理されて説明されているが、広域的なパラメータ探索に使用されているＧＡはおおむね公知のものである。
・非特許文献７
この文献は、ＧＡの交叉におけるＢＬＸ−α法を説明するための資料として参照した。すなわち、ＧＡにおける交差過程では、両親となる二つの個体がもつ遺伝子パラメータに対して最適化すべきパラメータ空間中で適度な範囲で拡がりを持たせる手法がある。この手法は、ブレンド・クロスオーバー″ｂｌｅｎｄｃｒｏｓｓｏｖｅｒ″と呼ばれ、適正な拡がりを設定するために新たなパラメータαを導入するので「ＢＬＸ−α」と簡素に記されることが多い。なお、パラメータαの値が例えば０．５に設定されている場合には、ＢＬＸ−０．５と表現される。
・非特許文献８〜非特許文献１０
結晶構造を直接的に決定する技術に関する研究の歴史は古く、このような方法に関する文献としては、代表的なところで非特許文献８〜非特許文献１０などを挙げることができる。すなわち、非特許文献８には原理的な数式の導出が開示されており、非特許文献９には数式を解く際の有力な関係式が開示されている。また、非特許文献１０には、数式の結晶学的取り扱いがまとめられている。
（３）直近の従来技術
何らかの形で局所最適化をＧＡに組み込んだハイブリッドＧＡに関する記載があるものは、以上の公知文献のうち特許文献２および非特許文献１，２，５くらいなものである。それゆえ、これら４本の文献が本発明に対して直近の従来技術に当たるものと、発明者らは認識している。
そこで、本明細書中では、ＧＡに局所最適化を組み合わせた広域最適化に関する従来技術を、特許文献２と非特許文献１，２，５との二つの系統に分類して論ずることにする。すなわち、特許文献２に開示されているように、ＧＡによるパラメータ空間の広域的探索を行った後、最終世代に属するポピュレーションのうち適応度最高の個体にだけ局所最適化を施す広域最適化技術をもって、「従来技術１」（図２（ａ）参照）と称することにする。一方、非特許文献１，２，５に開示されているように、ＧＡで生じた新生個体の全てに局所最適化をかけて広域探索を行おうとする所謂ラマルキアンＧＡのことを、「従来技術２」（図２（ｂ）参照）と称することにする。
（４）公知文献リスト
特開２０００−８６６９６号公報梶昭、アンダース・リルジャス「・・・タンパクの結晶及び該結晶から得られる三次元構造情報に基づくラショナルドラグデザインへの応用」特開２００１−８３１０６号公報アレキサンダー・ウリヤネンコフ、原田仁平「物質構造解析方法およびその装置」特開２００２−７１５８９号公報西堀英治、高田昌樹「Ｘ線回折計測装置」特開２００３−１４９１８０号公報高田昌樹、西堀英治、坂田誠、原田仁平「・・・粉末Ｘ線回折データ測定方法」特開２００４−３７３４５号公報原田仁平、西堀英治、涌井義一、熊澤克芳、鷲見高雄、小塚基樹、高田昌樹、坂田誠「試料ホルダ及びＸ線装置」特表２００５−５００８４４号公報ノバルティス・・・バイオメディカル・リサーチ社（スイス）出願「キナーゼ結晶構造ならびにキナーゼ活性化のための・・・」特開２００１−１１７９０１号公報笹川文義、品川明雄（出願人：富士通株式会社）「ハイブリッド型遺伝的アルゴリズムの島モデルによる最適化問題処理方法およびその処理プログラム」特開２００３−２８８５７９号公報村川正宏、樋口哲也（出願人：産業技術総合研究所）「最適フィッティングパラメータ決定方法および・・・」藤田喜久雄、赤木新介、廣川敬康「遺伝的アルゴリズムと極小探索アルゴリズムとのハイブリッド化による板取り問題の一解法」″ＡｐｐｒｏａｃｈｆｏｒＯｐｔｉｍａｌＮｅｓｔｉｎｇＵｓｉｎｇＧｅｎｅｒｉｃＡｌｇｏｒｉｔｈｍａｎｄＬｏｃａｌＭｉｎｉｍｉｚａｔｉｏｎＡｌｇｏｒｉｔｈｍ″ 日本機械学会論文集（Ｃ編）第５９巻第５６４号（１９９３年）２５７６−２５８３頁論文Ｎｏ．９２−１８７５ＫｉｋｕｏＦｕｊｉｔａ，ＳｈｉｎｓｕｋｅＡｋａｇｉａｎｄＮｏｒｉｙａｓｕＨｉｒｏｋａｗａ″ＨｙｂｒｉｄＡｐｐｒｏａｃｈｆｏｒＯｐｔｉｍａｌＮｅｓｔｉｎｇＵｓｉｎｇａＧｅｎｅｒｉｃＡｌｇｏｒｉｔｈｍａｎｄａＬｏｃａｌＭｉｎｉｍｉｚａｔｉｏｎＡｌｇｏｒｉｔｈｍ″，Ｐｒｏｃｅｅｄｉｎｇｓｔｈｅ１９９３ＡＳＭＥＤｅｓｉｇｎＡｕｔｏｍａｔｉｏｎＣｏｎｆｅｒｅｎｃｅ，ＤＥ−Ｖｏｌ．６５−１，（Ｓｅｐｔ．１９９３），ｐｐ．４７７−４８４，Ａｌｂｕｑｕｅｒｑｕｅ，ＮｅｗＭｅｘｉｃｏ，Ｕ．Ｓ．Ａ．廣安知之「進化的手法による知的最適化とその並列化」″ＤｅｖｅｌｏｐｍｅｎｔａｎｄＰａｒａｌｌｉｚａｔｉｏｎｏｆＩｎｔｅｌｉｇｅｎｔＯｐｔｉｍｉｚａｔｉｏｎｂｙＥｖｏｌｕｔｉｏｎａｒｙＣｏｍｐｕｔａｔｉｏｎ″ 同志社大学学術フロンティア「知能科学とその応用」に関するシンポジウム−ＡＦＩＩＳＳＹＭＰＯＳＩＵＭ２００１（２００２年）Ｋ．ＨＡＲＲＩＳ，Ｒ．ＪＨＯＮＳＴＯＮａｎｄＢ．ＫＡＲＩＵＫＩ：ＡｃｔｒａＣｒｒｙｓｔ．（１９９８）．Ａ５４，６３２−６４５，″ＴｈｅＧｅｎｅｒｉｃＡｌｇｏｒｉｔｈｍ：ＦｏｕｎｄａｔｉｏｎａｎｄＡｐｐｌｉｃａｔｉｏｎｓｉｎＳｔｒｕｎｔｕｒｅＳｏｌｕｔｉｏｎｆｒｏｍＰｏｗｄｅｒＤｉｆｆｒａｃｔｉｏｎＤａｔａ″ Ｇ．Ｔｕｒｎｅｒ，Ｅ．Ｔｅｄｅｓｃｏ，Ｋ．Ｈａｒｒｉｓ，Ｒ．ＪｈｏｎｓｔｏｎａｎｄＢ．Ｋａｒｉｕｋｉ：ＣｈｅｍｉｃａｌＰｈｙｓｉｃｓＬｅｔｔｅｒｓ３２１（２０００）１８３−１９０，″ＩｍｐｌｅｍｅｎｔａｔｉｏｎｏｆＬａｍａｒｃｋｉａｎｃｏｎｃｅｐｔｓｉｎａＧｅｎｅｔｉｃＡｌｇｏｒｉｔｈｍｆｏｒｓｔｒｕｎｔｕｒｅｓｏｌｕｔｉｏｎｆｒｏｍｐｏｗｄｅｒｄｉｆｆｒａｃｔｉｏｎｄａｔａ″ Ｂ．Ｋｕｒｉｕｋｉ，Ｓ．Ｂｅｌｍｏｎｔｅ，Ｍ．ＭｃＭａｈｏｎ，Ｒ．Ｊｈｏｎｓｔｏｎ，Ｋ．ＨａｒｒｉｓａｎｄＲ．Ｎｅｌｍｅｓ：ＪｏｕｒｎａｌｏｆＳｙｎｃｒｏｔｒｏｎＲａｄｉａｔｉｏｎ（１９９９）６，８７−９２，″Ａｎｅｗａｐｐｒｏａｃｈｆｏｒｉｎｄｅｘｉｎｇｐｏｗｄｅｒｄｉｆｆｒａｃｔｉｏｎｄａｔａｂａｓｅｄｏｎｗｈｏｌｅ−ｐｒｏｆｉｌｅｆｉｔｔｉｎｇａｎｄｇｌｏｂａｌｏｐｔｉｍｉｚａｔｉｏｎｕｓｉｎｇａｇｅｎｅｒｉｃａｌｇｏｒｉｔｈｍ″ Ｌ．Ｊ．ＥｓｈｅｌｍａｎａｎｄＪ．Ｄ．Ｓｃｈａｆｆｅｒ：″Ｒｅａｌ−ＣｏｄｅｄＧｅｎｅｔｉｃＡｌｇｏｒｉｔｈｍａｎｄＩｎｔｅｒｖａｌＳｃｈｅｍａｔａ″，ＦｏｕｎｄａｔｉｏｎｏｆＧｅｎｅｒｉｃＡｌｇｏｒｉｔｈｍ２，ｐｐ１８７−２０２（１９９３）Ｄ．ＨａｒｋｅｒａｎｄＪ．Ｓ．Ｋａｓｐｅｒ：ＡｃｔａＣｒｉｓｔ．１（１９４８）７０．，″ＰｈａｓｅｓｏｆＦｏｕｒｉｅｒＣｏｅｆｆｉｃｉｅｎｔｓｄｉｒｅｃｔｌｙｆｒｏｍＣｒｉｓｔａｌＤｉｆｆｒａｃｔｉｏｎＤａｔａ″ Ｄ．Ｓａｙｒｅ：ＡｃｔａＣｒｙｓｔ．５（１９５２）６０．，″ＴｈｅＳｑｕａｒｉｎｇＭｅｔｈｏｄ：ａＮｅｗＭｅｔｈｏｄｆｏｒＰｈａｓｅＤｅｔｅｒｍｉｎａｔｉｏｎ″ Ｗ．ＣＯＣＨＲＡＮ：Ａｃｔａ．Ｃｒｙｓｔ．８（１９５５）４７３．，″ＲａｒａｔｉｏｎｂｅｔｗｅｅｎｔｈｅＰｈａｓｅｓｏｆＳｔｒｕｃｔｕｒｅｓ″

（背景技術の不都合）
前述のように、従来のＸ線回折による直接法では、ある程度の大きさ（例えば直径０．数ｍｍ程度）にまで単結晶を成長させることができない限り、実質的に言って物質構造を決定することができなかった。
しかしながら、単結晶が得られない段階の新物質であっても、粉末なら得られるという場合は非常に多い。表現を変えて言うと、物質の創生間もない初期段階では、当該物質の粉末しか得られない場合がほとんどである。それゆえ、もしもこの時点で物質の構造を決定することができれば、目的とした物質ができているか否かが迅速に判断できるようになる。そして、物質構造が明らかになればその機能特性の理解も進むため、構造に基づく物質設計が推し進められることとなる。
（本発明の課題）
そこで本発明は、単結晶ではなく粉末状等の試料物質に放射線を照射して得た回折環の実測データからでも、現実的な範囲の計算負荷で当該試料の物質構造を高精度で決定できるようにする手段を提供することを解決すべき課題とする。すなわち本発明の課題は、多くの新物質のように、ある程度大きな単結晶を作ることが難しい物質であっても、例えばその粉末試料から得たＸ線回折環の強度分布データから、その結晶構造や分子配置などの構造パラメータを決定することができるようにすることである。
このような課題の解決手段として、より具体的には、方法発明としての「放射線回折データに基づく物質構造の推定方法」と、そのソフトウェア関連発明としての「物質構造推定プログラム」及びその「記録媒体」と、それらに関連した各種の装置発明とを、本発明は提供するものである。
そしてこの中核技術として、ＧＡの探索速度を加速して収束時間を短縮し、従来よりも多数のパラメータを精密かつ効率良く最適化または特定ないし推定することを、現実的なコスト範囲で可能にする手段を提供することをも、本発明は解決すべき課題としている。そして、より高速なパターンマッチングを行い、情報量が少ない実測データに基づきながら、従来よりも多数のパラメータを精密かつ効率良く最適化ないし推定することができる手段を提供することも、本発明の解決すべき課題である。
より具体的には、方法発明としての「ハイブリッドＧＡによる複数パラメータの最適化方法」及び「パターンマッチングによるデータ解析方法」を本発明は提供する。併せて、そのソフトウェア関連発明である「最適パラメータ探索プログラム」やその「記録媒体」をも提供する。

［発明の経緯］
本願発明の発明者らは、シンクロトロン放射光設備「ＳＰｒｉｎｇ−８」（固有名詞）などのＸ線回折測定装置を用いて、Ｘ線を始めとする各種放射線を試料物質に照射してその回折パターンを測定し、当該物質の構造解析を行ってきた（例：特許文献３，４，５）。そして、すでに背景技術の項や課題の項でも述べたように、粉末試料の放射線回折データ（回折環の実測データ）に基づく物質構造決定の必要性を痛感していた。
そこで、結晶の格子定数や分子の立体構造などの構造パラメータの決定に適した強力な広域最適化方法（大域的最適化方法ともいう）と、それを実現するソフトウェアとを開発し、回折環から物質構造を決定できるようにすべく努力を続けてきた。その結果、僥倖にも恵まれて、以下のような発明に一応の完成をみたので、ここにその一部を出願するに至った。
なお、本発明の適用は、ＳＰｒｉｎｇ−８（固有名詞）など巨大設備での測定データに限られるものではなく、企業や大学の研究室にあるような小規模なＸ線回折測定装置等で得られた測定データに対しても可能である。
［出願の単一性］
本願発明の中核となる部分は、技術分野の項で触れたように、ＧＡ（遺伝的アルゴリズム）に特定の方式で局所最適化操作を組み込んだ「ハイブリッドＧＡ」それ自体である。すなわち、本願発明は、このハイブリッドＧＡを実行して複数パラメータを最適化する方法とそのプログラムとを提供し、これを利用して構造パラメータを多峰性の多次元パラメータ空間中で広域的に十分に最適化し、もって回折環などの放射線回折データから物質構造を十分な確度で推定（すなわち決定）する技術を提供する。
したがって、本項で解決手段として列挙される本願の各発明は、以下の名称で呼ばれるが、いずれもこの中核的な単一の発明概念（すなわち「ハイブリッドＧＡ」の利用）をもって貫かれており、同一の特別な技術的特徴を共通に有している。
（１）方法発明
・「ハイブリッドＧＡによる複数パラメータの最適化方法」
・「パターンマッチングによるデータ解析方法」
・「放射線回折データに基づく物質構造の推定方法」
（２）ソフトウェア関連発明
・「最適パラメータ探索プログラム」
・「物質構造推定プログラム」
・「記録媒体」
（３）装置発明
・「ハイブリッドＧＡ搭載コンピュータ」
・「ハイブリッドＧＡを搭載した解析装置」
・「放射線回折パターンによる物質構造推定装置」
それゆえ、本願発明たる以下の各手段の間では、単一性の要件が満たされているものと考え、一つの出願にまとめた。なお、この項に記載された各解決手段の番号は、本願の出願時点では特許請求の範囲に記載された各請求項の番号に対応している。また本項では、各手段の構成上の特徴に併せて、その構成がもたらす作用効果についても簡潔に説明する。
［方法発明のカテゴリー］
１．ハイブリッドＧＡによる複数パラメータの最適化方法
（１）第１手段
（第１手段の枠組み）
本発明の第１手段は、以下に示す「ハイブリッドＧＡによる複数パラメータの最適化方法」である。なお、局所最適化過程が組み込まれた遺伝的アルゴリズム″ＧｅｎｅｔｉｃＡｌｇｏｒｉｔｈｍ″（略してＧＡ）のことを、ここでは「ハイブリッドＧＡ」、略記すれば「ＨＧＡ」（英語表記では″ＨｙｂｒｉｄＧＡ″または″ＨＧＡ″）と呼ぶことにする。
なお、「ハイブリッドＧＡ」なる名称は、前述のように日本での用語を踏襲したものであり、対応する用語として英語圏では「ラマルキアンＧＡ」（″ＬａｍａｒｃｋｉａｎＧＡ″）の名称が広く使われている。ただし、日本での「ハイブリッドＧＡ」という用語と、英語圏での「ラマルキアンＧＡ」という用語とが、互いに厳密に等価であるとまでは断言することができない。なぜならば、特許文献２の解説で触れたように、日本でいう「ハイブリッドＧＡ」が最後の詰めを局所最適化で加速しようとするものが多いのに対し、英語圏でいう「ラマルキアンＧＡ」は全ての段階で新生個体の全てを局所最適化して進化を加速しようとする傾向があるからである。
すなわち本手段は、各個体を構成する記号列のうち少なくとも一部は所定の物理量に対応した複数のパラメータであり、これらのパラメータの適正な組合せを探索することを目的としたＧＡによって、複数パラメータを広域最適化する方法の一種である。
（第１手段の定義）
本発明の第１手段は、各個体を構成する記号列のうち少なくとも一部は、所定の物理量に対応した複数のパラメータであり、これらのパラメータの適正な組合せを探索することを目的として、これらのパラメータがそれぞれ適度に分布した複数の前記個体を初期世代のポピュレーションとし、各世代において、当該世代のポピュレーションのうち少なくとも新たに生成された前記個体である新生個体の適応度を評価する評価過程と、このポピュレーションのうち複数の前記個体を親個体としてこれら親個体の間で行う交叉により新しい子個体を生成する交叉過程と、次世代に残すべき複数の前記個体を選択して他の前記個体を淘汰する淘汰過程とを繰り返すうちに、これらの個体のうち一部に変更を加える突然変異過程を適宜交えながら、世代交代を重ねて前記適応度がより良好な前記個体の発生を待ち、もって前記複数のパラメータの最適な組合せを探索するＧＡ（遺伝的アルゴリズム）による複数パラメータの最適化方法において、全世代のうち一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち少なくとも一部にあたる特定個体を対象に、局所最適化操作が行われることと、全世代のうち少なくとも一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち一部にあたる特定個体を対象に、局所最適化操作が行われることとのうち、少なくとも一方である局所最適化過程を有することを特徴とするハイブリッドＧＡによる複数パラメータの最適化方法である。
なお、第１手段を定義する記載がこのままでは一読して理解することは難しいので、読者に理解が容易になるよう、本手段の構成を前提部分と特徴部分とに分けて以下で説明する。
（第１手段の前提）
本手段の前提構成は、簡単に言ってしまえばＧＡを有することである。
すなわち本手段は、たとえば、これらのパラメータがそれぞれ適度に分布した複数の前記個体を初期世代のポピュレーションとし、各世代において、当該世代のポピュレーションのうち少なくとも新たに生成された前記個体である新生個体の適応度を評価する評価過程と、このポピュレーションのうち複数の前記個体を親個体としてこれら親個体の間で行う交叉により新しい子個体を生成する交叉過程と、次世代に残すべき複数の前記個体を選択して他の前記個体を淘汰する淘汰過程とを繰り返すうちに、これらの個体のうち一部に変更を加える突然変異過程を適宜交えながら、世代交代を重ねて前記適応度がより良好な前記個体の発生を待ち、もって前記複数のパラメータの最適な組合せを探索するＧＡによる複数パラメータの最適化方法であることを、構成上の前提とする。
言い換えると、本手段が構成上の前提としてもつＧＡは、これらのパラメータがそれぞれ適度に分布した複数の前記個体を初期世代のポピュレーションとし、世代交代を重ねて前記適応度がより良好な前記個体の発生を待つアルゴリズムである。このＧＡは、各世代において評価過程、交叉過程および淘汰過程とを繰り返すうちに、突然変異過程を適宜交えながら世代交代を進めていく。ここで、評価過程は、当該世代のポピュレーションのうち少なくとも新たに生成された前記個体である新生個体の適応度を評価する過程である。また、交叉過程は、このポピュレーションのうち複数の前記個体を親個体として、これら親個体の間で行う交叉により新しい子個体を生成する過程である。さらに、淘汰過程は、次世代に残すべき複数の前記個体を選択して他の前記個体を淘汰する過程である。そして突然変異過程は、これらの個体のうち一部に変更を加える過程である。本手段は、このように世代交代を重ねるＧＡにより、前記複数のパラメータの最適な組合せを探索することを目的とした複数パラメータの最適化方法である。
ここで、「世代交代を重ねて前記適応度がより良好な前記個体の発生を待ち」とあるうちの「前記個体」は、ふつう局所最適化操作または交叉ないし突然変異の結果、新たに生じた個体のうち適応度が最良のものといった意味合いである。ここに「前記」とあるは、既に記載された要件を満たしているといった程度の意味であり、けっして以前の世代から生き残っている個体であるという限定を意味するわけでない。
なお、ＧＡの構成については種々のヴァリエーションがあるので、少なくとも交叉過程と突然変異過程とを有し、世代交代を重ねて適応度の高い個体の発生を待つＧＡでさえあれば、前提構成が異なっていても構わない。
すなわち本手段は、上記の前提構成のうち各処理過程を列挙している部分が、たとえば「各世代において、当該世代のポピュレーションのうち少なくとも一部の前記個体について当該個体の適応度を評価する評価過程と、このポピュレーションから複数の前記個体を選択して親個体とする淘汰過程と、これらの親個体の間で交叉を行って新しい子個体を生成する交叉過程とを繰り返すうちに、…」などとなっていても構わない。
（第１手段の特徴）
本手段の特徴は、前述のＧＡにおいて、全世代のうち一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち少なくとも一部にあたる特定個体に対して局所最適化操作が行われることと、全世代のうち少なくとも一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち一部にあたる特定個体に対して局所最適化操作が行われることとのうち、少なくとも一方である局所最適化過程を有するハイブリッドＧＡによる複数パラメータの最適化方法であることである。
これは要するに、局所最適化操作の対象は、全ての世代の全ての個体ではなく、全世代のうち一部の複数世代であったり、逆に全世代であっても一部の個体であったり、あるいは一部の複数世代のポピュレーションのうち一部個体であったりということである。換言すれば、局所最適化操作の対象は、全世代のうち一部の複数世代での一部個体であるか、全世代での一部個体であるか、一部の複数世代での全個体であるかのうちいずれかであるということである。
なお、特定世代の分布には色々な場合がありうる。すなわち、特定世代が飛び飛びに散在する場合にも、必ずしも所定世代毎に周期的に特定世代が出現しなければいけないわけではなく、特定世代の出現頻度ないし出現周期が世代交代の間に変動しても良い。また、特定世代の出現が初期世代にもあるようにしても良いし、逆に初期世代は特定世代にはなり得ないようにしておいても良い。
また、各特定世代で選定される特定個体の数も、全ての特定世代の間で一定していても良いし、あるいは世代交代の間に変わっていっても良い。ここで、特定個体がポピュレーションのうち一部である場合には、特定個体の数を絶対的な個数で決めても良いし、ポピュレーションのうち所定パーセンテージ（例えば１％とか０．１％とか）が特定個体に選定されるようにしても良い。両者はポピュレーションが一定であれば等価であるが、世代交代によってポピュレーションが変動する場合には両者の間に違いが出る。あるいは、特定個体の数は、交叉や突然変異によって生じた新生個体の数に対して所定パーセンテージを占めるように設定されていても良い。もちろん、このようなパーセンテージも一定である必要はなく、世代が代われば変動するようにしても良い。
例えば、ＧＡにより１０００個の個体からなるポピュレーションが世代交代を繰り返す場合を想定してみよう。
まず、一方の極端な実施形態では、世代交代毎に各世代のポピュレーションのうち一つが特定個体に選ばれて局所最適化操作を施される。そして、これが最も好ましい実施形態であることも少なくない。
なぜならば、仮に各世代のポピュレーション（個体数１０００個）のうち半分（５００個）程度が新生個体であるとすれば、各世代での局所最適化操作の回数が、ラマルキアンＧＡに比べてこの実施形態では約５００分の１に減っているからである。これは劇的な演算量の低減を意味しているとともに、ラマルキアンＧＡとは違って当該世代のポピュレーションのうちほとんどの個体は局所最適化操作を受けないから、個体の多様性はほとんど失われずに済む。それでありながら、初期世代を入れるか入れないかにかかわらず、世代交代毎に全ての世代で進化に幾分かの方向性が与えられて、継続的に進化が加速され続けるから、広域的な最適値にごく小さな演算量で到達する可能性が高まる。
次に、中間的な実施形態では、例えば二三世代毎ないし十世代毎に特定世代があり、当該世代のポピュレーションのうち一つないし数個程度の特定個体が最適化操作される。
そして、他方の極端な実施形態では、例えば百世代毎に一度、当該世代のポピュレーションを形成する個体の全てに対して局所最適化操作が施される。
ところで、複数の個体に局所最適化を施した結果、同一世代のポピュレーションに属する個体のうち幾つかが、パラメータ空間中で同じ局所最適値に相当する位置にまとまってしまうことがありうる。そこで、実質的に同一点または等価と言えるほど近傍に集合した複数の個体は、一つの個体と見なしてしまい、こうして個体数が減った分については、交叉や突然変異で新生個体を補充するようにしても良い。
また、世代交代を重ねるうちには、以前の世代ですでに局所最適化されている個体が再び特定個体に選ばれ、局所最適化操作をかけられる可能性が生じる。そこで、この可能性を封じるために局所最適化済みかそうでないかを示す印（フラッグなど）を個体に付けておくようにしても良い。ただし、このようなことをしなくても、局所最適化操作が施される特定個体の数がポピュレーションに対してごく僅かなものであれば、同一の個体が重複して特定個体として選ばれることはごく稀であるから、実質上問題になることはない。そして、仮に同一個体に対して重ねて局所最適化操作が行われた場合にも、二回目以降の同操作では即座に完了してしまうので、ほとんど演算処理の負担が生じることはない。
さて話を本筋に戻すと、このように、本手段においては、特定世代の分布と当該世代のポピュレーションから選び出される特定個体の個数とに、かなり広いヴァリエーションがある。
ただし、前述の公知文献のうち特許文献２に開示されているように、個体に局所最適化が施されることがある特定世代は、最終世代にあたる一世代だけである場合は、本手段に含まれていない。また、非特許文献１，２，５に開示されている″ＬａｍａｒｃｋｉａｎＧＡ″のように、全ての世代で全ての新生個体に局所最適化を施す（すなわち全世代が特定世代でその全個体が特定個体である）場合も、本手段には含まれない。
そして、本手段では、前提となるＧＡ自体の構成にも、そのＧＡに組み合わされる局所最適化操作の手法自体にも、特段の限定はない。すなわち、局所最適化操作をＧＡの中にどのように組合せてハイブリッド化するかという点に、本手段の特徴がある。
それゆえ、本手段が前提として有するＧＡの構成は、単に「各世代で評価過程、淘汰過程（選択過程）および交叉過程を繰り返しつつ、突然変異過程が適宜交えられて世代交代を重ねるうちに、適応度が良好な個体の生成を待つＧＡ」としても良い。あるいは、評価過程を選択過程に含めてしまい、もっと簡単に「選択過程（淘汰過程）、交叉過程、突然変異過程をもつＧＡ」としても良い。
ここで、一部の用語に定義を加えておく。先ず、放射線としては、Ｘ線が代表的であるが、中性子線や電子線などの粒子線も含まれる。Ｘ線の中には、放射光（シンクロトロン軌道放射）のような高エネルギーＸ線や、Ｘ線領域でのコヒーレント光なども、もちろん含まれるものとする。次に、回折とは、透過回折が主流ではあるが、反射現象によるものも含まれるものとする。そして、各個体の適応度が探索範囲の全域で連続量であることは、適応度に関する局所最適化操作を個体に施すための十分条件である。
（第１手段の作用効果）
本手段では、従来技術１（図２（ａ）参照）ように、方向性が与えられず確率的に進化する単純なＧＡによって広域的な探索を行い、そのＧＡによって最適解近傍への収束が確信されるに至るのを待つというわけではない。あるいは、従来技術２（図２（ｂ）参照）のように、各世代の全ての個体（または新生個体の全て）に対して局所最適化操作が行われることはない。
そうではなく、本手段の好ましい実施形態を挙げれば、本手段での局所最適化操作の対象となる「特定個体」は、全世代のうち一部にあたる分散した複数世代（「特定世代」）に散在しており、当該世代のポピュレーションに属するごく一部の個体である。ただし極端な例としては、全世代において各世代のポピュレーションのうちごく一部の個体であるとか、逆に、全世代のうち分散したごく一部の複数世代の全個体であるかのうちいずれかであるとかいう場合も、本手段の実施形態に含まれる。
それゆえ本手段では、特定世代の出現頻度の設定如何とその世代での特定個体の選定方法の如何とによって、局所最適化操作の回数を従来技術２よりも劇的に減らすことが可能になる。
ここで留意すべきことは、局所最適化を行うには、特定個体の近傍において適応度の勾配を算出する微分処理か、あるいはそれに類する演算処理が繰り返し必要であり、なかなか大きな演算処理が必要となることである。そして、最適化すべきパラメータの個数ないし自由度が増え、探索すべきパラメータ空間の次元数が増えるにつれて、このような微分操作に要する演算負荷も大きくなるから、局所最適化操作の回数を減らすことができれば、それがもたらす演算負荷の低減効果は大きくなる。
したがって、本手段の実施によって局所最適化操作の回数を従来技術２よりも劇的に減らすことができれば、最適化すべきパラメータの数が多い場合には演算負荷を大幅に減らすことができる。それゆえ本手段によれば、最適化すべきパラメータの数が多ければ多いほど、従来技術２よりも計算時間を大幅に短縮することができるという効果が見込める。その結果、計算時間が長くかかることがネックになって今まで実用にならなかったようなパラメータの数が多い問題であっても、本手段によってその問題を解くことができるようになる可能性がある。
そればかりではなく、本手段では、従来技術２のように各世代のポピュレーションがもつ多様性が急速に失われるような不都合は生じることがない。それゆえ、本手段は漏れの少ない広域的な探索能力を強力に発揮することができ、結果的に短い演算時間のうちに広域的な最適値に達することができる。
一方、本手段では、従来技術１とは違って、ＧＡの進化に方向性をなんら与えることなく、ＧＡの最良解が正解の近傍にまで収束したことが確信できるまで待っていることは、必要ではない。より正確に言うと、本手段では、世代交代の間に適宜その進化に方向性が与えられるので世代交代の回数が少なくて済むうえに、広域的な最適値に至る最後の詰めも局所最適化でなされることがほとんどである。
すなわち本手段では、世代交代の途中であっても、幾つもの世代で何れかの個体に局所最適化操作を施すことにより進化に方向性を与えることができるから、広域的な最適値に収束するまでの世代交代の回数自体をも劇的に減らすことができる。それでいながら、交叉や突然変異で生じる全ての新生個体の数に比べて局所最適化操作の回数がずっと少ないようにしておけば、前提構成として持つＧＡに比べて、世代交代毎の平均的な演算負荷はそれほど増えないで済む。
したがって本手段によれば、世代交代の間に進化の方向性が適度に与えられるようになるにもかかわらず、単純なＧＡで広域探索を行う従来技術１に比べても世代交代毎の平均的な演算負荷があまり増えないで済む。すなわち本手段では、世代交代の間に進化の方向性が適度に与えられながら、単純なＧＡに比べてもあまり演算負荷が増えることがないので、広域的な最適値に達するまでの世代交代の回数が、従来技術１に比べて劇的に低減される。特に、広域的な最適値（正解）が形成している峰の一部（たとえ裾野であっても）に個体が達し、その個体に局所最適化がかけられたならば、一気にその正解に達しうる。それゆえに本手段では、従来技術２ばかりではなく従来技術１に比べても、広域的な最適値に達するまでの演算時間を短縮することができる。
すなわち本手段によれば、従来技術１および従来技術２のいずれに比べても、広域的な探索能力が劇的に向上しており、多数のパラメータの広域最適化にかかる計算時間を大幅に短縮することができるという効果がある。その結果、広域的に探索すべき多峰性空間があまりに複雑で、従来技術１でも従来技術２でも現実的には今まで解けなかった複数パラメータの最適化問題であっても、本手段によってその問題を解くことができるようになる可能性がある。
（第１手段に関する考察）
・ポイント
さて、本手段のように、局所最適化を適正に組み合わせることによってＧＡの収束特性が改善され、多数のパラメータを広域的に最適化するのに要する時間が大幅に短縮する理由は、局所最適化とＧＡとが互いにその欠点を補完し合うためであると考えられる。
すなわち、ＧＡによる複数パラメータの広域探索というのは、確率的（ｓｔｏｃｈａｓｔｉｃ）な探索方法である。それゆえＧＡは、多峰性の（すなわち落とし穴の多い）多次元パラメータ空間を、たとえ粗くであっても素早く（つまり小さな演算負荷で）広域的に探索し、そこそこ良い適応度をもつパラメータの組合せを見つけ出すことを得意としている。逆に、広域的な最適点（つまり求める「正解」）の近傍まで肉薄していても、そのことを認識することはできないので、ピンポイントでその最適点に達することは不得手である。つまり、局所最適化すれば最適点にたどり着けるような最適点の近傍に個体が生じても、その個体は適応度がそれほど良くはないという理由などで淘汰されてしまい、次世代に生き残れないと行ったことが、世代交代の過程で少なからず起きているものと考えられる。
一方、局所最適化操作による探索は、確定的（ｄｅｔｅｒｍｉｎｉｓｔｉｃ）な探索方法である。それゆえ局所最適化は、多次元パラメータ空間の中であっても、多峰性のない領域に限ってしまえば、速やかかつ容易に最適点に到達することが得意であるが、逆に、強い多峰性を持つ多次元空間中を広域的に探索することは不得手である。
そこで、ＧＡと局所最適化とを上手に組み合わせれば、互いの長所が互いの短所を補って補完し合い、多峰性の多次元空間中を広域的に探索して回り、ピンポイントで最適点に達するという困難な課題であっても、達成することができるようになる可能性が生じる。本手段は、このような考えに基づいて開発された技術であるから、本手段でこのような効果がどの程度大きく得られるかは、主として局所最適化とＧＡとを如何に巧妙に組み合わせるかという点に大きく依存する。
ここで、局所最適化とＧＡとの組み合わせる上での重要なポイントには、次の二つがある。第一のポイントは、世代交代の間における特定世代の出現頻度と、当該世代のポピュレーションに対する特定個体の個数ないしパーセンテージとである。第二のポイントは、特定世代のポピュレーションの中から所定数の特定個体を選び出す際に、どのような選定基準を採用するかである。なお、局所最適化とＧＡとの組合せ効果を十全に発揮するためには、淘汰過程で生き残り個体を選択するルールや、交叉過程で交叉させる親個体の選定や交叉の仕方などのルールなど、ＧＡ自体の設計にも留意した方がよい。
したがって、本手段に従属している解決手段には、ＧＡと局所最適化との組合せ方に関する限定か、あるいは組み合わせる際にＧＡ自体をどう設計するかといったことに関する限定を含むものが多い。このことには、以下の記載を読み進める上で留意されたい。
・両従来技術の組合せに対する阻害要因
前述のように、局所最適化操作をＧＡに組み合わせたハイブリッドＧＡには、従来から大きく分けて二通りがある。この二通りとは、前述のように、ずっとＧＡで世代交代を繰り返して広域を探索したうえで最後の詰めだけを局所最適化操作で行う従来技術１と、ＧＡの世代交代毎に全ての新生個体を局所最適化する従来技術２とである。
すなわち従来技術１では、単純なＧＡによってダーウィン的な進化を行う世代交代が繰り返され、確率的に広域的な探索が行われた後に、最終的に残った世代のポピュレーションのうち適応度が最高の個体にだけ局所最適化が施される。この技術では、淘汰過程での選択戦略や交叉過程での親個体の選択はあるものの、最終世代に至るまでは通常のＧＡと変わるところは基本的にない。それゆえ、最終世代に至るまでＧＡに進化の方向性が与えられることは全くないから、ＧＡによる進化が加速されることはない。そして、たまたま最終世代の最優秀個体が広域的な最適解の近傍にあればよいが、そうでなければ広域的な最適解には到達できないままに探索が終了する。
いっぽう従来技術２では、ＧＡの世代交代毎に全ての新生個体が局所最適化されるので、進化の方向付けが全ての世代で強烈に行われ、ごく初期の数世代程度では確かに急速に適応度が向上し、特に各世代のポピュレーションの平均適応度の向上は著しい。しかしながら、その間にポピュレーションを形成する個体から多様性が失われてしまうらしく、その後は適応度があまり向上しないところをみると、むしろ狙いとは逆に、多峰性空間における広域的な探索能力が損なわれてしまっている可能性さえある。しかも、計算量が大変に多い局所最適化操作を全ての新生個体に施すので、一回の世代交代にかかる演算量は膨大となり、多数のパラメータを広域的に最適化するのにかかる計算時間を短縮する効果は小さいものと考えられる。
端的に言ってしまうと、従来技術１は、世代交代の途中で進化に方向性を与えず、徹底してダーウィン的な適者生存の進化を繰り返した後、最後の詰めで最優秀個体にだけ方向性をあたえる広域探索方法である。逆に従来技術２は、全ての新生個体を局所最適化してその進化に方向性を強要するあまり、そのポピュレーションから多様性を奪ってしまい、多峰性の強い多次元パラメータ空間では簡単に落とし穴に陥って捉えられてしまう傾向がある。
さて、それでは本発明の第１手段のように局所最適化をＧＡの一部にだけに組み込むというコンセプトを発想することが、なぜ専門家にとっても難しかったか、何がその阻害要因になっていたかを考察してみよう。
それは、一言で言うと、世代交代を重ねてもポピュレーションから多様性が失われないようにすることと、進化に方向性を付与することとは、両立することが今まではできなかったのではないかと思われる。そもそも、多様性の確保と進化の方向付けとの両者をバランスをとって両立させることの必要性は、認識されていなかったようであり、その必要性が認識されていたという証拠を発明者らは寡聞にして知らない。
すなわち、従来技術１では、ＧＡで行われる進化に方向性を与えようという試みが、最終世代に至るまで全く行われていない。一方、従来技術２では、広域的な探索を効率よく行うために必要な個体の多様性が確保されておらず、最初の数世代を経るだけで速やかにポピュレーションから多様性が失われてしまっている。本願発明者らの見るところ、本発明以前には、このような両従来技術の欠点がしっかりと認識されていたとは考え難い。ましてや、世代を重ねてもポピュレーションに属する個体の多様性が失われないようにしながら、進化の過程で適度な方向性が与えられるようにしたＧＡを開発することが、当該技術分野で課題として認識されていたとは、いっそう考え難い。
そして、ダーウィン的な適者生存の進化論は、不作為な確率重視であるから、各個体で行った努力が子孫にまで継承されるとするラマルクの要不要論とは、思想的に相容れない傾向が強い。この傾向は、従来技術１と従来技術２とを組み合わせることに対する阻害要因であると考えるべきである。したがって、基本的な発想の過程から考えても、従来技術１と従来技術２とを組み合わせれば容易に本願発明に達することができるとするのは、妥当ではない。
それ故に、遺伝的アルゴリズムやその改良としてのハイブリッドＧＡやラマルキアンＧＡの分野の専門家が本願発明のような技術を完成させるには、小さからぬ阻害要因があったものと考えるのが自然である。
・まとめ
なお、第１手段を発明するに至るためには、世代交代を繰り返すうちに散在する飛び飛びの世代で、ごく少数の個体に局所最適化操作を施すだけでも、進化に方向性を与えることができるということに気づくことが必要である。そして、本手段での局所最適化とＧＡとの組合せ方の良いところは、このように進化に方向性を与えることができながら、世代が下っていっても広域的な探索能力に必要な多様性がポピュレーションから失われないで済むことである。
その結果、本手段によれば、多峰性が強い多次元パラメータ空間であっても落とし穴に囚われることなく、両従来技術のいずれにも勝って強力な広域的探索能力を発揮することができるという効果がある。しかも、世代交代の間に広域的な最適値の近傍に達した個体があり、たとえ偶然であってもその個体に局所最適化が施されたならば、それで複数パラメータの広域的最適化という目的は即時に達成される。そして、このような偶然は少なくともほとんどの場合に於いて両従来技術のいずれよりも少ない計算時間で起こるから、結果的に本手段によればずっと短い計算時間のうちに広域的な最適値（ないし「正解」）に達しうる。
（２）局所最適化操作の頻度に関する限定
以下では先ず、局所最適化操作の頻度に関する限定を、前述の第１手段に対して加えた解決手段から説明する。
ここで、先ずこのような限定を加えるのは何故かというと、局所最適化操作を行うには多大な演算量を要するので、局所最適化操作を行う頻度を減らしたいからである。そしてその一方で、ＧＡの進化に方向性を持たせる局所最適化の作用が失われないようにすることが、多峰性パラメータ空間における広域的な最適値の探索過程全体の演算負荷を減らす上で大切であるからである。
（第２手段）
本発明の第２手段は、前述の第１手段の「ハイブリッドＧＡによる複数パラメータの最適化方法」において、前記局所最適化過程は、前記全世代のうち一部にあたる前記複数の特定世代において、当該世代の前記ポピュレーションのうち一部にあたる前記特定個体を対象に、前記局所最適化操作を行う過程であることを特徴とする。すなわち、本手段では、局所最適化操作の対象は、全世代のうち一部の複数世代での一部個体である。
ここで、特定世代の出現頻度と特定個体の個数との組合せを具体的に例示しておこう。例えば、特定世代の出現頻度は二〜三世代毎ないし数世代毎に一回で、その世代における特定個体の数は一つだけという場合があり得る。また、特定世代の出現頻度は十世代毎ないし数十世代毎に一回で、その世代における特定個体の数は一つないし十個程度とかでもよい。さらに、特定世代は、世代交代の度に連続した世代で出現するが、初期の幾つかの世代では出現しなかったり、または初期の幾つかの世代でだけ飛び飛びであったり、あるいは飛び飛びに出現しない世代があったりしてもよい。
本手段では、前述の第１手段の範囲では局所最適化操作の頻度が比較的低い方に属し、設定の仕方如何では、進化の方向性が適度に与えられながら、局所最適化操作の頻度を大きく減らすことができる。すなわち、ＧＡの作用により広域的な探索を確率的に行いながら、たまたま広域的な最適値の周辺にある個体が局所最適化されることがあれば、一気に求める最適値に達することが可能である。
したがって本手段によれば、前述の第１手段の中でも広域的な最適値に達するまでの演算負荷が低減される効果が大きくなり、特に最適化すべきパラメータの数が多い場合には計算時間の短縮効果が著しい。
（第３手段）
本発明の第３手段は、前述の第１手段の「ハイブリッドＧＡによる複数パラメータの最適化方法」において、前記局所最適化操作の対象たる前記特定個体は、当該世代の前記ポピュレーションのうち一つの前記個体であることを特徴とする。
本手段では、局所最適化操作が行われる特定世代（全ての世代でも良い）に属するポピュレーションのうち、たった一つの個体に対してのみ局所最適化操作が行われるので、前述の第１手段の範囲では局所最適化操作の頻度が特に低い方に属する。それゆえ、本手段によれば、計算時間の短縮効果が大きくなるという効果があり、この効果は特に最適化すべきパラメータの数が多い場合に顕著になる。
（第４手段）
本発明の第４手段は、前述の第１手段の「ハイブリッドＧＡによる複数パラメータの最適化方法」において、前記局所最適化過程が行われる前記特定世代は、前記全世代のうち少なくとも一部に散在していることを特徴とする。
本手段では、局所最適化操作が行われる世代が全世代に全般的に散在している必要はなく、全世代のうち一部区間では全く局所最適化操作が行われないことがあっても構わない。例えば、世代交代の浅いうちには局所最適化が全く行われない世代があったり、局所最適化が行われない世代がしばらく続いたりしても構わない。
したがって本手段によれば、全世代における特定世代の分布を設定する自由度が増しているので、その設定次第ではより効率的に広域的な最適化を進めることができる可能性があるという効果がある。
実は、実際に回折環に基づいて物質構造決定を行ったケースのうち幾つかで、世代交代のうち始めの幾つかの世代までは局所最適化を行わないでいた方が、ハイブリッドＧＡの収束が速く、計算時間が短縮されたということがあった。そこで、その特徴のうち一部を本手段で定義しておいた。
なお、次の第５手段および第６手段も、その特徴を部分的に表現を変えて記載したものである。
（第５手段）
本発明の第５手段は、前述の第１手段の「ハイブリッドＧＡによる複数パラメータの最適化方法」において、前記特定世代が各前記世代のうちに出現する頻度は、前記全世代のうち前記世代が下る方が高く設定されていることを特徴とする。
本手段では、その世代のポピュレーションのうちどれかの特定個体に局所最適化操作が行われる特定世代は、その出現頻度を世代交代の途中で変え、しかも増えるという設定がなされている。ただし、特定世代の出現頻度の増え方に限定はないから、世代交代の途中から一度だけステップ状に出現頻度が増えても良いし、世代交代の一部区間または全区間で徐々に出現頻度が増えても良い。
本手段によっても、ハイブリッドＧＡの収束がいっそう速くなり、計算時間がさらに短縮されるという効果が発揮される場合がある。
（第６手段）
本発明の第６手段は、前述の第１手段の「ハイブリッドＧＡによる複数パラメータの最適化方法」において、前記特定世代は、前記全世代のうち少なくとも後半部で、所定の複数世代毎に周期的に出現することを特徴とする。
実際に回折環に基づいて物質構造決定を行った際に、初期世代から所定世代までは局所最適化を行わないでおき、所定世代以降ではどれかの個体に局所最適化を施す特定世代を周期的に出現させるようにしたところ、ハイブリッドＧＡの収束が速くなり、計算時間が短縮されたということがあった。そこで、本手段でその特徴を定式化しておくことにした。
本手段によっても、ハイブリッドＧＡの収束がいっそう速くなり、計算時間がさらに短縮されるという効果が発揮される場合がある。
（３）局所最適化対象の指定方法に関する限定
（当該限定の意義）
・「正解」の必要性
次に、局所最適化の行われる特定世代のポピュレーションから、その対象となる特定個体を選び出す方法について限定を加えた解決手段を開示する。
ここでのポイントは、意外なことに、適応度の高い個体に局所最適化操作を施した場合よりも、むしろ逆に適応度の低い個体に局所最適化操作を施した方が、その局所最適化の結果、正解にたどり着く確率が高くなるということである。発明者らがこのことを発見したのは、プログラムミスが切っ掛けになって、不思議に収束が速いケースがあったという僥倖（セレンディピティー）にも恵まれたせいもある。
さて、先ほど「正解」という言葉を使ったが、これは発明者らが放射線回折による物質構造の決定という技術分野における研究者であるからである。
すなわち、この技術分野においては、最適設計などの分野とは違って、単にデータマッチングの適応度が比較的高いというだけでは不足であり、広域的に最適な（つまり適応度が最高の）正解であることが必要である。なぜならば、物質構造を決定するうえで、実測データとよく似た回折パターンを形成するのでデータマッチングの適応度は高いのだけれど、実は正解とは異なる構造を持つ物質でしたというのでは、ほとんど全く意味がないからである。
・思考実験
そして、適応度の低い個体に局所最適化操作を施した方が正解にたどり着く確率が高くなるということは、例えば世界地図の中から世界最高峰を探索する問題を想定しみると、理解しやすい。これは一種の思考実験である。
すなわち、世界地図は緯度経度という二次元のパラメータ空間であり、その陸地の部分は所定の拘束条件を満たす範囲であって、各個体が位置する地点の標高は当該個体の適応度に相当する。そして、陸地のうちなるべく広範な範囲に多数の個体を散在させ、本発明のハイブリッドＧＡによって、世界最高峰の山頂を極めることを目的とした探索を行うことを想像してみよう。
すると、適応度が高い個体は、すでに標高が高い山岳部なり山麓なり高地なりにいるわけだが、それがアルプス山脈やウラル山脈、ロッキー山脈あるいはアンデス山脈に連なる部分にいるのでは、局所最適化をかけて上り坂を登らせ山頂に至ったところで、世界最高峰には達し得ない。そうではなく、局所最適化をかければ世界最高峰のエベレスト（チョモランマまたはサガルマータともいう）山頂に至る可能性があるのは、むしろガンジス川北岸の低地に佇む個体である。
このように考えれば、比較的適応度が低い個体も局所最適化操作の対象に選ぶことがある方が、より速く正解にたどり着くことになるということは、思考実験によって妥当な説明が付くことではある。
しかしながら、局所最適化操作する個体を選ぶうえでこのような方法を採ることは、適応度の高い個体を優遇するエリート戦略やルーレット戦略などを重宝してきたＧＡの世界では、全く常識の逆を行く発想であった。なぜならば、このような概念は、適者生存として自然淘汰が行われるダーウィン的進化論を模して誕生したＧＡとは相容れない性格を持つものだからである。
以下の各手段は、一連の本願発明のうち、このような発想に基づいて設けられた限定を色々に規定したものである。
（第７手段）
本発明の第７手段は、前述の第１手段の「ハイブリッドＧＡによる複数パラメータの最適化方法」において、前記特定個体は、当該特定世代の前記ポピュレーションのうち前記適応度が比較的低い前記個体の中からも指定される可能性があることを特徴とする。
本手段では、前述のような作用が得られる。その結果、本手段によれば、ふつうに適応度が高い個体の中ばかりから局所最適化操作の対象を選ぶようにした場合よりも、正解への収束が速くなり、計算時間がさらに短縮されるという効果が発揮される。
（第８手段）
本発明の第８手段は、前述の第７手段の「ハイブリッドＧＡによる複数パラメータの最適化方法」において、前記特定世代の前記ポピュレーションのうち、前記適応度が比較的低い複数個の前記個体からなるグループをもって、劣等グループと呼ぶことにし、前記特定個体は、この劣等グループの中から指定されることを特徴とする。
本手段では、前述の第７手段よりも限定が狭くなされているので、前述の作用がいっそう強くなる。その結果、本手段によれば、ハイブリッドＧＡがいっそう速く正解へ収束する可能性が高まり、計算時間がさらに短縮されるという効果がある。
（第９手段）
本発明の第９手段は、前述の第８手段の「ハイブリッドＧＡによる複数パラメータの最適化方法」において、前記劣等グループは、前記ポピュレーションのうち前記適応度が低い方の所定数および所定割合のうち少なくとも一方に属する複数の前記個体からなるグループであることを特徴とする。
本手段では、前述の第８手段よりもさらに狭く限定されているので、前述の作用がよりいっそう強くなる。その結果、本手段によれば、ハイブリッドＧＡによる探索がいっそう速やかになり、正解に至るまでの計算時間がよりいっそう短縮されるという効果がある。
（第１０手段）
本発明の第１０手段は、前述の第８手段の「ハイブリッドＧＡによる複数パラメータの最適化方法」において、前記特定個体は、当該世代の前記劣等グループの中からルーレット選択法およびランダム選択法のうち一方により選択されることを特徴とする。
本手段でも、前述の第８手段よりもさらに狭く限定されているので、前述の作用がよりいっそう強くなる。その結果、本手段によっても、ハイブリッドＧＡがいっそう速く正解へ収束し、計算時間がよりいっそう短縮されるという効果がある。
（第１１手段）
本発明の第１１手段は、前述の第１手段の「ハイブリッドＧＡによる複数パラメータの最適化方法」において、前記局所最適化過程は、前記特定世代の前記ポピュレーションの一部を前記特定個体として選び出して前記局所最適化操作を施す過程であり、前記特定個体の選定に当たっては、前記適応度がより低い前記個体の方がより高い確率で選定されるという弱者優先の傾向を持つことを特徴とする。
ただし本手段では、「弱者優先」の傾向を持つとはいえ、前述の第８手段および第９手段とは異なり、劣等グループには属さないエリート集団の中からも特定個体が選ばれる可能性が残っている。
本手段でも、前述のように適応度が低い個体の中にこそ局所最適化操作の結果、正解に至るものが多いという考えから、適応度がより低い個体の方がより高い確率で選定されるようになっている。その結果、本手段によっても、ハイブリッドＧＡがいっそう速く正解へ収束し、計算時間がいっそう短縮されるという効果が得られる。
（４）淘汰過程の選択戦略に関する限定
ここでは、次世代に生き残る個体を選択する選択戦略において、適者生存という自然淘汰の思想（ダーウィニズム）とは逆行し、言うなれば「不適者生存」ともいうべき逆転の発想を採り入れた解決手段を幾つか開示する。
したがって、以下の幾つかの解決手段が持つ特徴は、淘汰過程で生き残る個体の選択に関するものであり、局所最適化操作の対象となる特定個体の選択に関するものではないことに留意されたい。
（第１２手段）
本発明の第１２手段は、前述の第１手段の「ハイブリッドＧＡによる複数パラメータの最適化方法」において、前記淘汰過程では、当該世代のポピュレーションのうち前記適応度が比較的低い前記個体であっても次世代に生き残る可能性がある選択戦略が採られることを特徴とする。
前述の第１手段では、交叉なり突然変異なりで新たに生成された個体の全てに局所最適化操作を施すわけではないので、局所最適化が施されれば正解に至る個体が、局所最適化を施されず適応度が低いままに放置されている可能性がある。そこで本手段では、このような個体が世代交代の折に全滅してしまうことを、なるべく回避することができるようにした。
すなわち、本手段の淘汰過程では、適応度の高い個体だけが生き残るエリート戦略を採らず、適応度が比較的低い個体であっても次世代に生き残る可能性がある選択戦略を取っている。その結果、局所最適化が施されれば正解に至る個体は、その世代では局所最適化が施されずに放置されていても、次世代に生き残る可能性があるから、世代を下ったところで局所最適化されて正解に至る可能性を持つ。
したがって本手段によれば、このような可能性がある分だけ、ハイブリッドＧＡが速く正解へ収束する可能性が高まり、計算時間が短縮される可能性が高まるという効果が得られる。
（第１３手段）
本発明の第１３手段は、前述の第１手段の「ハイブリッドＧＡによる複数パラメータの最適化方法」において、前記淘汰過程で前記選択の際に採られるルールのことを選択戦略と呼ぶことにし、この選択戦略は、この適応度とは関わりなく無作為に前記個体が選択されるランダム戦略と、この適応度が比較的低い前記個体が優先的に選択される逆エリート戦略と、この適応度が比較的低い前記個体の方が選択される確率が高くなる逆ルーレット戦略と、この適応度が比較的低い前記個体の方が優先的に選択されるようにした逆期待値方式、逆ランク方式および逆トーナメント方式とのうち何れかとのうちいずれかであることを特徴とする。
前述の第１２手段では、適応度が比較的低い個体であっても次世代に生き残る可能性が否定されなかっただけであるが、本手段では、適応度とは関わりなく無作為に生き残り個体が選択されるか、むしろ積極的に適応度が低い個体の生存が優先される。すなわち、本手段は、不適者の生存を優先する選択戦略を提案するものである。
その結果、仮に局所最適化が施されたとすれば正解に至るであろう個体が、局所最適化さらないままで放置されていても、この個体は、次世代に生き残る可能性が高まるので、世代を下ったところで局所最適化されて正解に至る可能性を持つ。したがって本手段によれば、このような可能性が高まる分だけ、ハイブリッドＧＡが速く正解へ収束する可能性が高まり、計算時間が短縮される可能性が高まるという効果が得られる。
（第１４手段）
本発明の第１４手段は、前述の第１２手段または第１３手段の「ハイブリッドＧＡによる複数パラメータの最適化方法」において、当該世代の前記ポピュレーションのうち前記適応度が最高である前記個体をトップ個体と呼ぶことにし、当該世代からその次世代に世代交代する際にこのトップ個体は必ず生き残るというトップ保存戦略が併用されることを特徴とする。
本手段では、トップ個体の生存が保証されているので、仮に探索が正解に至っていた場合には、世代交代の際にその正解に至った個体が淘汰されてしまうような不都合は防止される。その結果、いったん正解に収束してしまえば、そこから外れてしまうことがなくなり、しかも世代交代を重ねてもトップ個体が交代することはなくなるから、収束判定が容易になる。
したがって本手段によれば、正解に収束したらもはや動かず、収束判定が容易になるという効果がある。
（５）代替手段（第１手段の別表現）
（第１５手段）
本発明の第１５手段は、前述の第１手段とおおむね同様の「ハイブリッドＧＡによる複数パラメータの最適化方法」である。
本手段は、各世代のポピュレーションを形成する個体のそれぞれは、所定の物理量に対応した複数のパラメータを含む記号列からなり、これらのパラメータがある程度の多様性をもって分布した初期世代から所定のルールで世代交代を重ねるうちに、より高い適応度をもつ前記個体が生成されることをもって、前記複数のパラメータの最適化を図るＧＡによる複数パラメータの最適化方法であることを前提とする。本手段の特徴は、全世代のうち一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち少なくとも一部にあたる特定個体を対象に、局所最適化操作が行われることと、全世代のうち少なくとも一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち一部にあたる特定個体を対象に、局所最適化操作が行われることとのうち、少なくとも一方であることである。
本手段の作用効果は、第１手段の作用効果とおおむね同様である。
なお、前述の第１手段に従属した上記の各解決手段に相当する限定を設けたヴァリエーションを、本手段に対しても同様に従属して設定することができ、それぞれ対応する上記解決手段とおおむね同様の作用効果が得られる。
２．パターンマッチングによるデータ解析方法
（第１６手段）
本発明の第１６手段は、前述の第１手段〜第１５手段のうちいずれかに記載された「ハイブリッドＧＡによる複数パラメータの最適化方法」において、各前記個体がもつ前記適応度は、当該個体の前記記号列に含まれる前記複数のパラメータに対応する前記物理量を仮定すると数値演算により決まる仮想データのパターンが、実測データのパターンとどの程度一致しているかを示す指標であり、この適応度が高い前記個体を生成することによって、当該個体の前記仮想データと前記実測データとの間でパターンマッチングを行い、前記物理量を推定することを目的として前記実測データの解析を行うことを特徴とする「パターンマッチングによるデータ解析方法」である。
ここでいう適応度は、普通はパターンマッチングないしデータマッチングの程度を示す指標であるから、逆に二乗誤差などマッチング不足の程度（ずれの大きさ）を示す指標を利用しても良い。
本手段では、その中核となるハイブリッドＧＡが、前述の第１手段〜第１５手段のうちいずれかに記載された特徴を有しているので、それぞれに特有の作用効果が得られる。その結果、本手段によれば、パターンマッチングの正解に対して、ハイブリッドＧＡがより速やかに収束するようになり、データ解析方法に要する計算時間が短縮されるという効果がある。
３．ＨＧＡの応用たる物質構造の推定方法
（第１７手段）
本発明の第１７手段は、以下の特徴を持つ「放射線回折データに基づく物質構造の推定方法」である。ここでは控えめに「推定」という言葉を用いたが、本手段は、かなりの（少なくとも両従来技術を大幅に凌駕する）確度をもって推定することができ、しかもその推定精度もかなり高いので、実質的には物質構造の「決定」を行う方法である。
本手段の特徴は、前述の第１手段〜第１５手段のうちいずれかに記載された「ハイブリッドＧＡによる複数パラメータの最適化方法」を、所定の試料物質に照射された放射線が形成する回折パターンに基づいてこの試料物質の構造を推定する物質構造の推定方法（ないし決定方法）に応用したことである。そして、本手段では、前記物理量のうち少なくとも一部は、この試料物質の物質構造を決定する構造パラメータである。また、各前記個体の前記適応度は、この試料物質が当該個体に相当するこれらの構造パラメータをもつと仮定すると生じる回折パターンが、実測された前記回折パターンに対してどの程度一致しているかを示す指標である。
本手段では、その中核となるハイブリッドＧＡが、前述の第１手段〜第１５手段のうちいずれかであり、当該手段の項に記載された特徴を有しているので、その特徴に起因してそれぞれに特有の作用効果が得られる。すなわち、放射線回折パターンのパターンマッチングが行われる際に、本手段が用いるハイブリッドＧＡの特徴によって構造パラメータの正解に対する収束が、従来技術１や従来技術２に比べて格段に速やかになる。
したがって本手段によれば、より多数のパラメータ空間を広域に探索してより精密に最適化することができるようになり、物質構造の推定ないし決定に要する計算時間が著しく短縮されるという効果がある。その結果、両従来技術によっては実際的に構造決定ができなかった物質まで、費用および時間の許容範囲内でその構造決定をすることが可能になるという効果がある。
（第１８手段）
本発明の第１８手段の「放射線回折データに基づく物質構造の推定方法」は、前述の第１７手段において、前記構造パラメータとは、前記試料物質の結晶構造を規定する格子定数と、この試料物質を構成する分子内における三次元的な原子配列を規定する分子構造パラメータと、この分子内での確率的な電子密度分布を規定する電子密度分布パラメータと、この試料物質の結晶内での三次元的な原子配列を規定する結晶学的構造パラメータとのうち、少なくとも一つであることを特徴とする。
すなわち本手段は、前述の第１８手段における「構造パラメータ」という用語の内容を具体的に限定するものである。
なお、ここでいう「試料物質の結晶内での三次元的な原子配列を規定する結晶学的構造パラメータとは、結晶の各軸方向の長さａ，ｂ，ｃをそれぞれ単位長さ１として規格化した分極座標（ｘ，ｙ，ｚ）である。また、結晶内での分子全体の向き（姿勢）を定義する角度パラメータも含まれる。ここで、ｘ，ｙ，ｚはそれぞれ０〜１の範囲の値で表すのが普通である。
（第１９手段）
本発明の第１９手段は、前述の第１７手段の「放射線回折データに基づく物質構造の推定方法」において、前記回折パターンは、その回折強度が同心円状に拡がって分布する回折環であることを特徴とする。
本手段によれば、試料物質から形成される放射線の回折パターンが回折環であっても、その試料物質の構造を決める構造パラメータを決定することができるようになるという効果がある。ここで、回折環ではピーク重複が大きく、回折データに含まれる情報量は単結晶が作る格子状の回折パターンに比べて格段に少なくなってしまうから、ある程度複雑な物質構造を決定することは困難であったことを付言しておく。
換言すれば、構造を決定したい物質で試料に適当な大きさの結晶を作ることが未だできなくても、その物質が形成している微細な結晶の格子定数や当該物質を構成している分子中の原子の立体配置構造などを決定することが、本手段によりできようになる。その結果、結晶を成長させる技術が未だ確立されないほど生成間もない新物質の構造決定が可能になるから、医薬品や新材料の開発や物質設計の分野に大きな貢献をすることが、本手段には期待できる。
それは、本手段で使用されるハイブリッドＧＡが、極めて強力な広域での最適値探索能力と精密な局所最適化との両方を併せ持っているからである。すなわち、前述のように本手段の中核技術は本発明の「ハイブリッドＧＡ」であり、それによって多数のパラメータを広域で探索して精密に最適化するのに要する計算時間が大幅に短縮されていることが、本手段の実用化の最大要因である。
（第２０手段）
本発明の第２０手段は、前述の第１９手段において、前記適応度は、前記回折環がもつ半径方向への強度分布の実測データと、仮定された前記構造パラメータに基づいて生成される仮定データとが、どの程度一致しているかを示す評価関数であることを特徴とする、「放射線回折データに基づく物質構造の推定方法」である。
本手段は、前述の第１９手段において、その限定をより具体的にしたものである。本手段では、適応度として、例えば実測データと仮定データとの間にある誤差の二乗和などの評価関数を用いることができ、適応度の算出が容易になる。そうすれば、局所最適化操作には、最小二乗誤差法による多種多様な局所最小化手法の中から選択することができるようになる。
したがって本手段によれば、適応度の算出に関する演算負荷が低減されるので、計算時間がいっそう短縮されるという効果がある。
（第２１手段）
本発明の第２１手段は、前述の第１７手段などによく似た「放射線回折データに基づく物質構造の推定方法」である。
本手段では、複数の結晶を含む粉末試料、多結晶集合体である多結晶試料、非晶質（アモルファス）試料および溶液試料のうち少なくとも一つである試料物質の構造を特定するために、この試料物質に照射された放射線の回折によってもたらされる回折環の強度分布を示す回折データを解析する。すなわち、この回折データに基づき、この試料物質がもつ物質構造を示すいずれかの構造パラメータを、データマッチングにより推定する。
その推定アルゴリズムとしては、遺伝的アルゴリズム（ＧＡ）に局所最適化操作を組み込んだハイブリッドＧＡ（ＨＧＡ）を使用し、このＨＧＡの構成に本手段の特徴がある。
ここで、前提となるＧＡとは、初期世代のポピュレーションを生成する発生過程と、交叉、複製、選択を繰り返して突然変異を交える世代交代過程とをもつ。すなわちＧＡでは、先ず発生過程で、前記構造パラメータがコーディングされた個体を、ある程度の多様性を持たせて複数個発生させ、初期世代のポピュレーションとする。この発生過程の後に、これらの個体の交叉および複製と、前記データマッチングの程度を示す適応度を評価してこれらの個体を淘汰する選択と、確率的に起こる突然変異とを繰り返す世代交代過程を行う。
そして、本手段の特徴には二つあり、第一の特徴は、このＧＡが、世代交代過程の間に複数の世代において、当該ポピュレーションの一部個体に対して局所最適化操作を行うＨＧＡであることである。第二の特徴は、この局所最適化操作の対象には、当該ポピュレーションのうち適応度が比較的低い個体もなる可能性があることである。
本手段では、ＧＡの世代交代のうち、複数世代で当該ポピュレーションのうち適応度が比較的低い個体も局所最適化操作の対象になるから、第７手段とほぼ同様の作用効果が得られる。その結果、本手段によれば、推定すべき構造パラメータの正解に収束するまでの計算時間が大幅に短縮され、今までは計算時間が膨大になるなどして実現できなかった物質構造の決定が可能になるという効果がある。
（第２２手段）
本発明の第２２手段は、以下のような解析手順を構成要素とした「放射線回折データに基づく物質構造の推定方法」である。
すなわち本手段は、放射線を試料物質に照射して得られた回折環の強度分布データに基づき、この強度分布データに適合する物質構造を特定するために、格子定数決定プロセスと背景散乱除去プロセスと空間群絞り込みプロセスと基本構造決定プロセスと構造精密化プロセスとのうち、少なくとも格子定数決定プロセスと空間群絞り込みプロセスと基本構造決定プロセスとを有する。そして本手段では、格子定数決定プロセスおよび基本構造決定プロセスのうち少なくとも一方で、ＧＡ（遺伝的アルゴリズム）に局所最適化操作を組み合わせたハイブリッドＧＡを利用した物質構造決定が行われることを特徴とする。
第一に、格子定数決定プロセスとは、この試料物質に含まれる結晶の格子定数を決定するプロセスである。すなわち、このプロセスでは、当該結晶の単位格子を定義する格子定数、例えば格子定数（ａ，ｂ，ｃ，α，β，γ）などが決定される。
第二に、背景散乱除去プロセスとは、この強度分布データに含まれているバックグラウンド散乱の影響を、除去ないし低減するプロセスである。ここで、バックグラウンド散乱の原因には種々のものがあるが、いずれも有用な情報ないし信号を埋もれさせるノイズとして作用するので、その影響をできるだけ減らすことが必要である。
第三に、空間群絞り込みプロセスとは、この結晶が属する空間群の候補を絞り込むプロセスである。このプロセスでは、回折パターンのピークないし反射の出現位置に基づき、結晶が取りうる２３０種類の空間群のうちから可能性の低いものを除き、可能性が高い空間群を数種類程度に絞り込むことが行われる。
第四に、基本構造決定プロセスとは、この結晶の基本構造を初期的に決定して、この空間群を一つに特定するプロセスである。すなわち、このプロセスでは、前述の空間群絞り込みプロセスで絞り込まれた空間群の候補の中から、最も確からしい空間群が決定され、単位格子内での分子の位置及び姿勢と三次元的な原子配列とが、やや粗めの精度で決定される。
第五に、構造精密化プロセスとは、この基本構造を精密化して、この結晶を構成する物質の構造をより精密に決定するプロセスである。さらに、この構造精密化プロセスでは、分子内での電子密度の分布をも推定ないし決定することがある。
本手段の最大の特徴は、前記ハイブリッドＧＡでは、世代交代の間に複数の特定世代で、当該世代のポピュレーションのうち一部の個体である特定個体を対象にして前記局所最適化操作が行われることと、この特定個体には、当該世代のポピュレーションのうちでは実測データとの一致度を示す適応度が比較的低い劣等グループからも選定される可能性があることである。
本手段では、放射線回折データに基づいて物質構造を段階的に推定ないし決定していく手順が明らかにされており、さらにその手順の中でハイブリッドＧＡを用いるべきプロセスはどれであるかも明らかにされている。そればかりではなく、そのハイブリッドＧＡがもつ特徴も限定されており、これによって構造パラメータが正解に速やかに収束し、計算時間が大幅に短縮される。
したがって本手段によれば、粉末試料が形成する回折環に基づく物質構造の決定など、今までは計算時間が膨大になって実現できなかった新物質の構造決定も、所定の手順を踏んで実現することが可能になるという効果がある。
［物の発明のカテゴリー］
１．ソフトウェア関連発明
（１）最適パラメータ探索プログラム
（第２３手段）
本発明の第２３手段は、コンピュータに実行可能な「最適パラメータ探索プログラム」であり、所定の物理量に対応した複数のパラメータの適正な組合せを探索する機能を、所定のコンピュータに発揮させるべきコンピュータ・プログラムであることを前提にする。本手段の特徴は、第１手段〜第１４手段のうちいずれかに記載された「ハイブリッドＧＡによる複数パラメータの最適化方法」を実行するために、前記初期世代の前記ポピュレーションの生成および読込のうち一方を行う初期世代設定ステップと、前記評価過程、前記淘汰過程、前記交叉過程、前記突然変異過程および前記局所最適化過程のそれぞれに対応する各演算ステップ（すなわち、評価ステップ、淘汰ステップ、交叉ステップ、突然変異ステップおよび局所最適化ステップ）とを有することである。
換言するならば、本手段の「最適パラメータ探索プログラム」を所定のコンピュータに実行させることにより、前述の第１手段〜第１４手段の「ハイブリッドＧＡによる複数パラメータの最適化方法」は実現される。
（第２４手段）
本発明の第２４手段は、コンピュータにより実行可能な「最適パラメータ探索プログラム」であり、所定の物理量に対応した複数のパラメータの適正な組合せを探索する機能を、所定のコンピュータに発揮させるべきコンピュータ・プログラムであることを前提とする。
本手段の特徴は、先ず、各世代のポピュレーションを形成する個体のそれぞれは、前記所定の物理量に対応した前記複数のパラメータを含む記号列からなり、これらのパラメータがある程度の多様性をもって分布した初期世代から所定のルールで世代交代を重ねるうちに、より高い適応度をもつ前記個体が生成されることをもって、前記複数のパラメータの最適化を図るＧＡ（遺伝的アルゴリズム）の中に、前記適応度に関する局所最適化操作を所定の前記個体に対して行う局所最適化ステップが組み込まれていることである。
本手段はさらに、この局所最適化ステップが、前記ＧＡで生成される全世代のうち一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち少なくとも一部にあたる特定個体を対象にする演算ステップであることと、前記ＧＡで生成される全世代のうち少なくとも一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち一部にあたる特定個体を対象にする演算ステップであることとのうち、少なくとも一方であることを特徴としている。
本手段では、ＧＡが世代交代を重ねるうちに、複数の特定世代で、適応度に関する局所最適化操作を特定個体に対して行う局所最適化ステップが組み込まれているから、最適パラメータ探索の収束が速くなり、計算時間が大幅に短縮される。その結果、本手段によれば、従来は計算時間が膨大にかかって実際上不可能であった複雑な複数パラメータの広域探索問題が、実用的な計算時間内に解けるようになるという効果がある。
なお、本手段についても、前述の第１手段に従属した第２手段〜第１４手段のうちいずれかに相当する限定を付けた各種ヴァリエーションが実施可能であり、それぞれに相当する作用効果が得られる。
（第２５手段）
本発明の第２５手段は、コンピュータにより実行可能な「最適パラメータ探索プログラム」であり、複数のパラメータの適正な組合せを探索する機能を、所定のコンピュータに発揮させるべきコンピュータ・プログラムであることを前提にしている。
本手段の特徴は、各世代のポピュレーションを形成する個体のそれぞれは、前記複数のパラメータに対応した記号列を含んでおり、これらのパラメータがある程度の多様性をもって分布した初期世代のポピュレーションから始めて、所定のルールで世代交代を重ねるうちに、より高い適応度をもつ前記個体が生成されることによって前記複数のパラメータの最適化を図るＧＡ（遺伝的アルゴリズム）の中に、前記適応度に関する局所最適化操作を所定の前記個体に対して行う局所最適化ステップが組み込まれていることである。
本手段はさらに、この局所最適化ステップが、前記ＧＡで生成される全世代のうち一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち少なくとも一部にあたる特定個体を対象にする演算ステップであることと、前記ＧＡで生成される全世代のうち少なくとも一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち一部にあたる特定個体を対象にする演算ステップであることとのうち、少なくとも一方であることをも特徴としている。
すなわち本手段は、前述の第２４手段から、最適な組合せを探索すべき複数のパラメータが物理量に関するものであるとの限定を外したものであり、その結果、物理量以外を探索対象とする多数のパラメータの最適な組合せを探索する問題にも適用することができるようになる。したがって本手段によれば、前述の第２３手段や第２４手段とほぼ同様の作用効果が得られながら、その適用範囲が、政治決定や経営問題などの社会的な問題やテーブルゲームなどを含むより広い分野にまで拡がるという効果がある。
なお、本手段についても、前述の第１手段に従属した第２手段〜第１４手段のうちいずれかに相当する限定を付けた各種ヴァリエーションが実施可能であり、それぞれに相当する作用効果が得られる。
（２）物質構造推定プログラム
（第２６手段）
本発明の第２６手段は、コンピュータにより実行可能な「放射線回折データに基づく物質構造推定プログラム」であり、所定の試料に照射された放射線が形成する回折パターンに基づいて当該試料を構成する物質の構造を推定する機能を、所定のコンピュータに発揮させるべきコンピュータ・プログラムであることを前提にしている。
本手段の特徴は、前記回折パターンの実測データを数値的に読み込む実測データ読込ステップと、第２３手段記載の「最適パラメータ探索プログラム」が有する前記初期世代設定ステップ、前記評価ステップ、前記淘汰ステップ、前記交叉ステップ、前記突然変異ステップおよび前記局所最適化ステップとを有し、前記適応度は、前記各個体の前記記号列に相当する仮定された前記構造パラメータから算出される前記回折パターンの予想値が、前記回折パターンの実測値に対してどの程度一致するかを示す指数であることである。
本手段では、放射線回折パターンに基づく物質構造の推定が、前述の第２３手段に相当する強力な探索能力を持つプログラムによって行われる。その結果、本手段によれば、従来は計算時間が膨大にかかって実際上不可能であった複雑な複数パラメータの広域探索問題が、実用的な計算時間内に解けるようになるという効果がある。
（第２７手段）
本発明の第２７手段は、コンピュータにより実行可能な「放射線回折データに基づく物質構造推定プログラム」である。本手段は、所定の試料に照射された放射線が形成する回折パターンに基づいて、当該試料を構成している物質の構造を規定する構造パラメータを推定する機能を、所定のコンピュータに発揮させるべきコンピュータ・プログラムであることを前提にしている。
本手段の特徴は、各世代のポピュレーションを形成する複数個の個体のそれぞれは、前記構造パラメータに対応する記号列を含んでおり、これらの個体のそれぞれがもつ適応度は、当該個体に対応したこの構造パラメータから算出される回折パターンの予想値が、前記回折パターンの実測値とどの程度一致するかを示す指標であって、この構造パラメータの各要素がある程度の多様性をもって分布するように、これらの個体を生成して初期世代ポピュレーションとする生成ステップをもち、この初期世代ポピュレーションから淘汰ステップ、交叉ステップおよび突然変異ステップを含む所定の手順に従って世代交代を重ねるうちに、当該世代ポピュレーションの中にこの適応度がより高い前記個体が生成されることを待ち、もって前記構造パラメータの最適化を図るＧＡ（遺伝的アルゴリズム）の中に、前記適応度に関する局所最適化操作を所定の前記個体に対して行う局所最適化ステップが組み込まれていることである。本手段はさらに、この局所最適化ステップが、前記ＧＡで生成される全世代のうち一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち少なくとも一部にあたる特定個体を対象にする演算ステップであることと、前記ＧＡで生成される全世代のうち少なくとも一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち一部にあたる特定個体を対象にする演算ステップであることとのうち、少なくとも一方であることを特徴とする。
本手段では、放射線回折パターンに基づく物質構造の推定が強力な探索能力を持つハイブリッドＧＡを利用して行われる。その結果、本手段によれば、従来は計算時間が膨大にかかって実際上不可能であった複雑な複数パラメータの広域探索問題が、実用的な計算時間内に解けるようになるという効果がある。
なお、本手段についても、前述の第１手段に従属した第２手段〜第１４手段のうちいずれかに相当する限定を付けた各種ヴァリエーションが実施可能であり、それぞれに相当する作用効果が得られる。
（３）記録媒体
（第２８手段）
本発明の第２８手段は、コンピュータ読み取り可能な記録媒体である。そして本手段の特徴は、前述の第２３手段〜第２５手段のうちいずれかである「最適パラメータ探索プログラム」と、前述の第２６手段〜第２７手段のうち一方である「放射線回折データに基づく物質構造推定プログラム」とのうち、少なくとも一方が記録されていることである。
本手段によれば、これらのプログラムの保存および流通が容易になる。
２．装置発明
（第２９手段）
本発明の第２９手段は、「ハイブリッドＧＡ搭載コンピュータ」である。本手段の特徴は、前述の第２３手段〜第２５手段のうちいずれかである「最適パラメータ探索プログラム」と、前述の第２６手段〜第２７手段のうち一方である「放射線回折データに基づく物質構造推定プログラム」とのうち、少なくとも一方がインストールされたコンピュータであることである。
本手段のコンピュータにより、これらのプログラムの実行が可能になり、その結果、多次元の広域で最適パラメータを精密に探索することや、今まではできなかった物質構造の決定ができるようになる。
（第３０手段）
本発明の第３０手段は、「ハイブリッドＧＡを搭載した解析装置」であり、前述の第２３手段〜第２５手段のうちいずれかである「最適パラメータ探索プログラム」と、前述の第２６手段〜第２７手段のうち一方である「放射線回折データに基づく物質構造推定プログラム」とのうち、少なくとも一方を実行可能な解析装置であることを特徴とする。
本手段の解析装置により、当該装置がコンピュータに属するか否かの判断に関わりなく、これらのプログラムの実行が可能になる。
（第３１手段）
本発明の第３１手段は、「放射線回折パターンによる物質構造推定装置」であり、所定の試料物質に放射線を照射してこの試料物質から生じる回折パターンを測定する測定装置と、この回折パターンから得られた実測データに基づいた解析を行うことにより当該試料物質の構造を推定する第２９手段のコンピュータおよび第３０手段の解析装置のうち一方とを有することを特徴とする。
ここで、上記測定装置と上記コンピュータまたは解析装置とが同じ敷地にあるか否かとか、両者の間で行われる回折データの移送がオンラインかオフラインかとか、両者の所有権ないし使用権の帰属先が同一か否かとかは、本質的な問題とはならない。
本手段によれば、試料物質に放射線を照射して回折パターンを測定し、この回折パターンに基づいて当該試料の物質構造を決定するまでの一連の操作手順を一貫して行うことができる。しかも、前述のように、従来は現実的なコストや期間の範囲内ではできなかった物質の構造決定までが可能になるという効果がある。

図１は、単結晶試料と粉末試料とでＸ線回折パターンを比較して示す組図である。同図のうち、図１（ａ）は、単結晶試料で生じるＸ線回折とその回折パターンとを示す模式図であり、図１（ｂ）粉末試料で生じるＸ線回折とその回折環とを示す模式図である。
図２は、本発明の中核をなすＨＧＡの第一特徴を従来技術と比較して示す組図である。同図のうち、図２（ａ）は従来技術１としてのＨＧＡの概要構成を示す流れ図であり、図２（ｂ）は従来技術２としてのＨＧＡの概要構成を示す流れ図であり、図２（ｃ）は本発明の実施形態でのＨＧＡの概要構成を示す流れ図である。
図３は、本発明の中核をなすＨＧＡの第二特徴とその作用とを示す概念図である。
図４は、Ｘ線回折の比較試験に供された各種粉体試料の物質構造を示す組図である。同図のうち、図４（ａ）はＰｄ（ｔｍｄｔ）_２の、図４（ｂ）はＡｕ（ｔｍｄｔ）_２の、図４（ｃ）はシチジンの、図４（ｄ）はタウリンの、図４（ｅ）は１−ＦｃＡｑＨ（ＣｌＯ_４）の、図４（ｆ）はコハク酸プレドニゾロンの、それぞれ立体分子構造および結晶構造を示す斜視図である。
図５は、本発明の一実施例でのＨＧＡ収束速度を両従来技術と比較して示すグラフである。
図６は、本発明によって決定された１−ＦｃＡｑＨ（ＣｌＯ_４）の物質構造を示す斜視図である。
図７は、本発明の実施形態としての物質構造の決定方法の手順を示す流れ図である。
図８は、粉末試料から得た回折環の強度分布を例示する実測データのグラフである。
図９は、分子中の三次元的な原子配列と結晶構造とを模式的に示す斜視図である。
図１０は、単位格子とその格子定数とを例示する模式図である。
図１１は、本実施形態がもつ格子定数決定プロセスの手順概要を示す流れ図である。
図１２は、回折環のＸ線強度分布データにおけるピーク位置を例示するグラフである。
図１３は、強度分布の実測データに含まれるバックグラウンド散乱を例示するグラフである。
図１４は、本実施形態がもつ背景散乱除去プロセスの作用を示す組図である。同図のうち、図１４（ａ）は粉末試料ＣｓＰｂＣｌ３からのＸ線強度分布実測データのグラフであり、図１４（ｂ）はガラスキャピラリーから生じるハローパターンを示すグラフである。また、図１４（ｃ）は空気散乱の強度分布を示すグラフであり、図１４（ｄ）は粉末試料からの温度散漫散乱が示す強度分布のグラフであり、図１４は（ｅ）実測データに各背景散乱をフィッティングさせた結果を示すグラフである。
図１５は、基本構造決定プロセスで決定される構造パラメータの種類を示す組図である。同図のうち、図１５（ａ）は構造パラメータのうち分子の位置（ｘ，ｙ，ｚ）を示す斜視図であり、図１５（ｂ）は構造パラメータのうち分子の姿勢（θ，φ，ψ）を示す斜視図である。また、図１５（ｃ）は構造パラメータのうち複数の分子内回転角τｉを示す斜視図である。
図１６は、構造精密化プロセスにより調整されるサイズパラメータを示す模式図である。
図１７は、構造精密化プロセスによるフィッティング結果例１を示す強度分布グラフである。
図１８は、構造精密化プロセスによるフィッティング結果例２を示す強度分布グラフである。
図１９は、本実施形態で使用するハイブリッドＧＡの処理手順を示す流れ図である。
図２０は、格子定数決定プロセスでＨＧＡが行う格子定数のグループ化を示す模式図である。
図２１は、パラメータのグループ化をしないと生じる不都合を例示する組図である。同図のうち、図２１（ａ）は親個体の記号列に相当する格子定数をもつ単位格子を示す模式図であり、図２１（ｂ）は子個体の記号列に相当する格子定数をもつ単位格子を示す模式図である。
図２２は、格子定数決定プロセスのＨＧＡでの三斜晶系の交叉パターンを示す組図である。同図のうち、図２２（ａ）は交叉パターン１の、図２２（ｂ）は交叉パターン２の、図２２（ｃ）は交叉パターン３の、それぞれ親個体と子個体とを比較して示す模式図である。
図２３は、格子定数決定プロセスのＨＧＡでの単斜晶系の交叉パターンを示す組図である。同図のうち、図２３（ａ）は交叉パターン１の、図２３（ｂ）は交叉パターン２の、図２３（ｃ）は交叉パターン３の、それぞれ親個体と子個体とを比較して示す模式図である。
なお、上記各図中で使用されている符号のうち主たるものは、以下のようなものである。
Ｐ１：格子定数決定プロセス（ハイブリッドＧＡで最適パラメータ探索）
Ｐ２：背景散乱除去プロセス
Ｐ３：空間群絞り込みプロセス
Ｐ４：基本構造決定プロセス（ハイブリッドＧＡで最適パラメータ探索）
Ｐ５：構造精密化プロセス
Ｄ：読込ステップ（回折環のＸ線強度分布データの読み込み）
Ｓ０：前処理ステップ（回折角２θ軸上で強度ピーク位置を抽出）
Ｓ１：ハイブリッドＧＡステップ
Ｓ１１：初期世代設定ステップ（第１世代ポピュレーションを生成）
Ｓ１０２：記録ステップ（当該世代ポピュレーションの各個体を記録）
Ｓ１０３：交叉ステップ（親個体を選択して交叉させ新生個体を生成）
Ｓ１０４：複製ステップ（生き残る個体を選定し複製して次世代に保存）
Ｓ１０５：淘汰ステップ（新生個体および複製個体から選択して淘汰）
Ｓ１０６：判定ステップ（突然変異を起こすか確率的に判定）
Ｓ１０７：突然変異ステップ（特定個体の記号列の一部を強制的に変更）
Ｓ１０８：判定ステップ（特定世代の判定および特定個体の選定）
Ｓ１０９：局所最適化ステップ（特定個体に対し局所最適化操作）
Ｓ１１０：収束判定ステップ（解の収束判定等による終了判定）
Ｓ１１１：インクリメントステップ（世代番号のインクリメント）
Ｓ１２：結果出力ステップ（決定された構造パラメータ等を出力）
Ｌ：世代交代ループ
ＬＣ：格子定数
・三斜晶系の格子定数（ａ，ｂ，ｃ，α，β，γ）
・単斜晶系の格子定数（ａ，ｂ，ｃ，β）
ｄ：結晶中の格子面間隔（数２参照）
ｔ：Ｘ線検出器原点の位置ずれ（探索すべきパラメータの一つ）
Ｒ：一致度（格子定数から算出されたピーク位置とその実測データとの差異、数３参照）
Ｒｗｐ：信頼度因子（数１で定義される数値であり、低いほど適応度としての信頼度が高い。）

本項は記載内容が大量でありその構成も複雑であるから、読者が本項の全体像を把握しやすいように、先ず目次（項目のみ）を設けておく。
この目次をご覧になってお判りのように、本実施形態の説明の順番としては、先ず物質構造の決定技術の分野において本発明が発揮する効果を理解していただくために、本発明の実施によって得られた研究成果を先に提示する。しかる後、そのような研究成果を得るには、具体的にどのような構成の実施形態で本発明が実施されていたのかを説明する。
［目次］
１．本実施形態の意義
（１）巨大設備での先端的研究
（２）実験室レベルへの簡易化
２．本発明の実施例
（１）本発明の実施形態がもつ二大特徴
（２）本発明の実施例１，２と比較例との対比
（３）実施例で実施された解決手段
３．データ解析方法の全体構成
（０）解析手順の概要
（１）格子定数決定プロセス
（２）背景散乱除去プロセス
（３）空間群絞り込みプロセス
（４）基本構造決定プロセス
（５）格子定数決定プロセス
４．格子定数決定プロセスでのＨＧＡ
（１）ＨＧＡの概要
（２）ＨＧＡの詳細
５．基本構造決定プロセスでのＨＧＡ
（１）ＨＧＡの概要
（２）ＨＧＡの詳細
６．その他の実施例
１．本実施形態の意義
この項では、本発明の「放射線回折データに基づく物質構造の推定方法」及びその関連発明の実施形態と、これらの中核技術たるハイブリッドＧＡの実施形態とについて、この分野の他の研究者等にも実施可能な理解が得られるように、明確かつ十分に説明する。ここに記載されていることは、おおよそ発明者らが実際にＸ線回折環の測定試験およびそのデータ解析を行って好結果を得たという実績に基づいている。
（１）巨大設備での先端的研究
前述のように、発明者らはＳＰｒｉｎｇ−８（大規模設備の固有名詞：本註以下略）で生成される世界最高クラスのエネルギー強度ないし輝度を持つ放射光Ｘ線を用い、各種の試料物質を対象にその構造解析ないし構造決定に取り組んできた。そしてＳＰｒｉｎｇ−８によれば、前述のようにそのＸ線の強度ないし輝度が抜群に高いので、ほんの数ｍｇ程度の粉末試料からでも、他の設備では得られないほど極端に鋭く立ち上がったピークを多数含む世界最高精度の回折環データが得られる。
ところが、これだけ高い精度で回折環の実測データが得られるようになると、逆にこの計測精度に対し、有効にデータ解析を行って物質構造を決定することができるほどの強力なデータ解析方法がなかった。それ故、今まではＳＰｒｉｎｇ−８で回折環が測定されても、そのデータに基づいて構造決定を行うことができず、せっかくのＳＰｒｉｎｇ−８の測定能力を生かし切れていないという皮肉な状態が続いていた。
そこで発明者らは、前述の発明を完成させ、以下に記載する形態で本願発明を実施することにより、ＳＰｒｉｎｇ−８で粉末試料に高エネルギーＸ線を照射して得た回折環の実測データに基づいて、各種の物質の構造を決定することができるようにした。
その結果、従来は構造決定の信頼性も精度も低く、間違いも多かったために、医薬品業界では構造決定とは呼ばず「構造予測」と位置づけていたものを、十分な確度と精度とを持って「構造決定」できるようになった。すなわち、医薬品に使われる有機低分子の構造決定が、極めて高い実測データとの一致度（例えば９８％，信頼度因子Ｒｗｐ＝２％）をもってできるようになっており、その際の誤差は、単位格子の各辺でわずか０．０００１ｎｍ程度、原子の配列でも同じく０．０００１ｎｍ程度と推定される。
このようにして世界で初めて決定した物質構造の数々については、これまでにも発明者らが学会の講演会や論文で発表してきた。しかし、本願発明の物質構造の決定技術それ自体と、その中核技術たるハイブリッドＧＡとについては、本願の出願までに具体的に公開したことがない。
（２）実験室レベルへの簡易化
本願発明者らは、前述のように世界最高クラスの大規模設備による先端的な研究を進める一方で、このような物質構造の決定方法を大学や企業に普及している実験室レベルの普及型設備でも実施することを試みた。
その結果、大学や企業の実験室に普及しているようなＸ線回折装置で測定した回折環のデータを解析しても、前述のＳＰｒｉｎｇ−８での測定データを用いて行った物質構造の決定に準ずる成果を上げられるようになった。しかも、そのデータ解析に使用したのは、上級機とはいえ市販のＰＣであった。
ここで、ＳＰｒｉｎｇ−８のような大規模設備と実験室レベルの普及型設備との間に、Ｘ線回折装置としてどのような違いがあるかというと、本質的にはＸ線強度とエネルギー分解能、そしてＸ線の平行度において大規模設備の方が優れているということである。すなわち、Ｘ線強度の違いは、短時間測定が可能か否かの違いにつながり、ひいてはごく微量の試料による測定の可否につながる。また、エネルギー分解能の違いとＸ線の平行度の違いとは、そのままＳ／Ｎ比の違いとなって現れる。要するに、Ｘ線回折環データではピーク重複などによってただでさえ情報量が少ないというのに、大規模設備に比べて普及型設備ではいっそう少ない情報量しか与えられないというわけである。それゆえに、普及型設備で測定された回折データに基づいての構造決定は、大規模設備に比べていっそう難しくなるわけである。
また、このように世界最高レベルの大規模設備から実験室レベルの普及型設備に簡易化して本願発明を実施できるようにするにあたり、データ解析手法には特筆すべき変更点はない。すなわち、本願発明の中核となるハイブリッドＧＡについては基本的に同一のものを同一手法で使用しており、データ解析プログラムも基本的に同一なら、それを走らせるＰＣも同一である。
したがって、本実施形態のように、本発明は、どこの大学や企業であっても自前で用意できる程度の普及型設備でも、物質構造の決定を進められるという広範な普及性をもつ。その結果、本発明によれば、大規模設備がなくてもそれに準ずる結晶構造ないし物質構造の決定ができるようになるから、構造決定を要する研究の費用対効果およびペースが劇的に向上することが期待できる。
２．本発明の実施例
（１）本発明の実施形態がもつ二大特徴
本発明の実施形態たる「放射線回折データに基づく物質構造の推定方法」では、格子定数決定プロセスと基本構造決定プロセスとで、本願発明の中核となるハイブリッドＧＡが使用されている。物質構造の決定方法としての本実施形態の詳細については後に譲り、ここでは、このハイブリッドＧＡ（「本ＨＧＡ」と呼ぶ）がもつ特徴点のうち二つだけについて、概念的に説明するものとする。
・第一特徴：局所最適化操作が散在
本ＨＧＡがもつ第一の特徴は、図２（ｃ）に示すように、ＧＡの世代交代を重ねるうちに分布した複数の世代（特定世代）において局所最適化操作が行われ、しかもその対象となる個体（特定個体）は例えば一つというようにごく少数であることである。
ここで、特定世代は「分布した複数の世代」である旨の表現は、全世代のうちに特定世代が飛び飛びに広く散在する場合だけではなく、世代交代する毎に特定世代があり特定世代が連続する場合をも含む。それゆえ、本ＨＧＡを示す図２（ｃ）では、ラマルキアンＧＡを示す図２（ｂ）との差異をより際だたせるために、隔世で（つまり飛び飛びに）しか局所最適化が行われないように描いたが、世代交代毎に局所最適化が行われるように描いても良い。
すなわち、本実施形態で使用されているハイブリッドＧＡでは、局所最適化操作が行われるのは時折でしかなく、その対象となる個体はポピュレーションのうちごく少数でしかない。具体的には、特定世代は世代交代のうち所定周期（例えば毎世代とか、あるいは二三世代毎ないし十世代毎とか）で現れる。そして、当該世代のポピュレーション（例えば個体数で千個とか五百個とか、あるいは絞り込んでもっと少数個とか）のうち特定個体の数は、例えば一個だけとかせいぜい二三個ないし数個とかの程度である。そのうち本実施形態で最も多用した設定は、特定世代は毎世代（つまり全世代）であり、各世代のポピュレーションのうち特定個体は一個だけであった。それゆえ、本実施形態では、演算量の大きい局所最適化操作が行われる回数が新生個体の発生個数に比べて極めて少なく抑制されている。
ここで、特定世代の分布を、飛び飛びにではあっても全世代のうちほぼ全域に散在するように設定しているのは、単に局所最適化操作の回数を減らして演算負荷を軽減したいというだけではない。それだけではなく、進化に対する方向性が与えられる程度が、世代交代の全域でほぼ均等になるようにという意図もあってのことである。
また、特定個体の数が当該ポピュレーションのうち一つとかというように極めて少ない数に限定されているのは、局所最適化操作の回数を減らして演算負荷を軽減したいというだけではない。それだけではなく、なるべく特定世代の数を増やして頻繁に進化の方向性を与える操作をしたいという意図もあってのことである。
それゆえ、世代交代する毎に全ての新しい世代が特定世代となり、その特定世代での特定個体の数は極めて少数（例えば一つだけ）であるという実施形態が、おそらく最良の実施形態である。なぜならば、局所最適化操作の行われる回数が新生個体数に対して極めて小さいので、ラマルキアンＧＡに比べて演算負荷が劇的に低減されておりながら、継続的して方向性が適度に与えられて進化が加速されるからである。しかも、ラマルキアンＧＡとは違い、局所最適化される個体の数に比べて新生個体の数の方が圧倒的に多いので、ポピュレーションを構成する個体の多様性が損なわれることなく世代交代が進められる。
さて、このように所定世代あたりの局所最適化操作の回数が、図２（ｂ）に示す従来技術２に比べてごく少数であるから、本ＨＧＡでは遺伝的アルゴリズムが本来持っている高速性が損なわれることがない。それでいながら本ＨＧＡでは、時折行われる局所最適化操作によってＧＡに進化の方向性ないし指向性が導入されているので、進化に方向性が与えられていない通常のＧＡに比べ、広域的な最適解に対する収束性が格段に向上している。すなわち、図２（ａ）に示す従来技術１のように、確率的な探索しかできないＧＡが最適値の近傍に収束するまで、かなり長い時間を待っていなければならないということはなくなる。
その結果、多峰性のきつい多次元パラメータ空間を探索する場合であっても、従来技術１および従来技術２のいずれに比べても広域的な最適解に達するまでの演算量が桁違いに小さくなっている。すなわち、探索すべきパラメータ空間の次元数（つまり自由度）が高くその多峰性も強い場合であっても、局所最適の陥穽に捉えられることが避けられ、極めて効率よく広域的な探索を進めることが可能になる。
したがって、本ＨＧＡによれば、パラメータの数が多すぎたりパラメータ空間の多峰性がきつかったりして従来は解けなかったような最適化問題を、実用的な演算時間で精密に解くことができるようになる。つまり、本ＨＧＡによれば、演算負荷が小さく高速であるばかりでなく、極めて効率的に広域探索を進められるから、いずれの従来技術でも実際上できなかった多数パラメータの広域最適化ができるようになる。
・第二特徴：局所最適化操作の対象選択
さて、ポピュレーションの多様性を確保する上でも、演算負荷の都合上でも、新生個体全てを局所最適化できず、上記のように局所最適化操作が稀にしか行われないとするならば、次にはその個体をどう選ぶかを工夫しなければならない。
そこで本ＨＧＡは、その第二の特徴として、特定世代のポピュレーションのうちから局所最適化の対象個体（特定個体）を選ぶにあたり、ＧＡの淘汰過程でいうエリート戦略のように適応度の高い個体を選ばず、むしろ適応度の低い個体を選んでいる。
本ＨＧＡでは何故このような選択志向を取っているかというと、図３に示すように、当該ポピュレーションのうちで適応度の低い個体の中にこそ、局所最適化を施せば広域的な最適解（「正解」と呼ぶ）に至る個体が紛れている可能性が高いからである。
さて本ＨＧＡでは、当該世代のポピュレーションの中で適応度が比較的低い劣等グループから特定個体を選定するにあたって、具体的には「逆ルーレット選択」（より詳しくは「値の制限付き逆ルーレット選択」）と名付けた選定方法を採っている。
この方法では、先ず当該世代（つまり特定世代）のポピュレーションに属する個体のうち、予め設定した割合に相当する適応度の高い個体（例えば上位１０％）をエリートグループとして除いておく。次に、残りの（この例では下位９０％の）個体に適応度で序列を付け、適応度が最悪の個体（０に該当）から最良の個体（１に該当）までを実数０〜１の範囲に等間隔で割り振る。しかる後、一様乱数αを発生させ、０〜αの範囲に収まる個体で「劣等グループ」を構成する。そして、この劣等グループに属する個体を改めて適応度の序列に従って実数０〜１の範囲に割り振ったうえで、一様乱数βを発生させ、このβに相当する個体をこの劣等グループから選択する。こうして選択された個体を特定個体とし、当該ポピュレーションのうちこの個体にだけ局所最適化を施す。ここで、特定個体の数が複数に設定されている場合には、この処理を複数回繰り返すようにするか、あるいは一様乱数βをその回数だけ発生させて劣等グループから指定個数の特定個体を選び出すようにする。
この「逆ルーレット選択」を本ＨＧＡに導入して特定個体の選択を行うと、適応度の高い個体を優先的に特定個体に選ぶ通常のルーレット選択に比べて、どの程度の効果があるかを次の表１に示す。
すなわち本ＨＧＡで、特定個体の平均的な適応度が０．２５付近になるように設定した「逆ルーレット選択」をもって局所最適化操作の対象個体を選択するようにした場合には、同０．２５付近のルーレット選択を採用した場合に比べ、広域的探索能力が飛躍的に向上している。同表にあるように、本願発明者らが行った数値解析例では、自由度１２〜１４の多峰性パラメータ空間を広域的に探索する時間が、おおむね１／１００〜１／２００程度に短縮されている。
それゆえ、特定個体の選定方式に逆ルーレット選択を導入すれば、通常のルーレット選択方式に比べて二桁以上も本ＨＧＡの探索能力が向上することが分かる。その結果、本ＨＧＡによって自由度の数が２０を超える物質構造モデルについても、回折環データを解析して構造決定ができるようになっている。
余談ながら、発明者らは仲間内で、ある世代のポピュレーションのうち適応度の低い個体のことを「オチコボレ」（劣等生や落ち穂の意）と呼んでいる。また、このような志向で特定個体の選択をすることを「オチコボレ拾い」（落ち穂拾い″ｇｌｅａｎｉｎｇ″に日本語では発音も意味も似た言葉）と、呼び習わしている。
表１の基になった複数の実施例では、分子が百個程度の原子からなり決定すべき自由度が１２〜１４程度の物質構造を決定するために、本発明のプログラムを１，０００ポピュレーションで走らせて回折環データを解析している。この際の特定世代の出現頻度は毎世代毎にであり、各世代での特定個体の個数は一つである。また、表１の各実施例で物質構造決定の対象とした粉体試料の物質は、後述の実施例１や実施例２で構造決定されたものと同じである。
そして、まさにこれらの実施例で計算時間が異様に短くなる現象が発現し、その原因を追及したところ、発明者らは「逆ルーレット選択」に該当するプログラムミスを発見した。すなわち、異様に収束が速かった実施例では、プログラム中のバグにより意図せずに「逆ルーレット選択」方式で特定個体が選ばれていることが分かった。その僥倖の結果、適応度の低い個体を優先的に選択して局所最適化した方が、最適パラメータの広域探索に要する計算時間が劇的に短縮されることを発明者らは発見することができた。
ただし、表１のデータはこのような発見をしたときのものであり、ＨＧＡを用いた本発明のプログラムでは、ポピュレーションの個体数など設定パラメータに未だ調整の余地を残していた。それゆえ、本プログラムの設定パラメータを適正にチューニングすれば、表１中に記載された計算時間をさらに短縮できる可能性がある。
・まとめ
さて、以上を簡単にまとめると、ＧＡと局所最適化とが互いに補完し合って多峰性のパラメータ空間であっても効率的に広域探索を行うことができるように、本ＨＧＡは第一特徴および第二特徴の二つの特徴を有する。すなわち、第一特徴は、ＧＡと局所最適化とをどのように組み合わせるかを工夫して、局所最適化操作の頻度を減らすことである。そして第二特徴は、ポピュレーションから局所最適化する個体をどう選ぶかを工夫して、その個体が局所最適化によって正解（すなわち広域的最適解）に至るものである確率をなるべく増すことである。
なんとなれば、ふつう局所最適化をＧＡに導入する狙いは、ＧＡのもつ広域的な探索を高速で（つまり小さい演算量で）行う能力を、局所最適化のもつ局所的な精密さで補うことにあるからである。
すなわちＧＡには、広域的な探索を高速で行うことができるという長所がある一方、遺漏が生じやすく、しかも詰めが甘いという短所がある。逆に局所最適化には、広域的な最適値の近傍からスタートすれば、遺漏なく精密にその最適値に到達することができるという長所がある一方、広域的な探索には向かないという短所がある。そこで本ＨＧＡでは、前述の第一特徴および第二特徴を併せ持つことにより、ＧＡと局所最適化とが極めて巧妙に組み合わされて、それぞれの長所が最大限に生かされるようになった。
（２）本発明の実施例１，２と比較例との対比
本実施形態の効果は、次の表２を参照すれば一目瞭然である。
この表は、本実施形態の「放射線回折データに基づく物質構造の推定方法」によって決定された構造が決定された６種類の物質（ａ〜ｆ）を、その立体分子モデルの自由度と併せて一覧表にして示したものである。この表には、二種類の実施例（実施例１および実施例２）と比較例とで、その物質の構造決定にかかった解析時間とその結果の一致度とが、互いに比較できるように提示されている。
（実施例の概要）
ここで、実施例１というのは、前述のＳＰｒｉｎｇ−８で測定した世界最高レベルの精度をもつ回折環データに基づき、本実施形態の方法により粉末試料の物質構造を決定した本発明の実施例である。
一方、実施例２では、実施例１と同じ６種類の粉末試料についてＸ線回折環データを測定する装置として、実施例１のＳＰｒｉｎｇ−８とは異なり、発明者らの属する大学の実験室に設置したＸ線回折測定装置を使用している。この測定装置は、発明者らの出した要求仕様に基づき、株式会社リガク（固有組織名）によって制作されたものである。そして、この測定装置の取得費用は五千万円程度（おおむね四十万米ドルに相当）で済んでおり、この額はＳＰｒｉｎｇ−８の建設に要した設備投資に比べてわずか千分の一ほどである。なお、同装置のスペックは、おおむね以下の通りである。
・Ｘ線の波長：０．７［Å］（ＳＰｒｉｎｇ−８と同程度）
・Ｘ線のエネルギー密度：正確には分からないが、おそらく１０^７〜８［光子数／秒ｍｍ^２（ｍｒａｄ）^２０．１％バンド幅］程度（ＳＰｒｉｎｇ−８の千分の一程度）
・センサの解像度：５０［μｍ］×５０［μｍ］（ＳＰｒｉｎｇ−８と同程度）
そして比較例というのは、実施例１と同じＳＰｒｉｎｇ−８で測定したデータを解析するのに、従来技術１の手法を採用してみたものである。ここで、比較例に従来技術１を採用して従来技術２の手法による記載を省いた理由は、従来技術２ではあまりに計算時間が長くなってしまうからである。たとえば試料（ｅ）の場合でも従来技術２の手法を適用すると、計算時間に数日間以上を要してしまった。
（試料物質）
また、実施例１および実施例２と比較例とは、前述のようにそれぞれ６種類の物質の構造決定を試みており、実施例１で決定された物質構造は、図４（ａ）〜（ｆ）に示されている。したがって実施例１とは、より正確には実施例１（ａ）〜実施例１（ｆ）からなる一連の実施例シリーズであり、実施例２および比較例についても同様である。
ここで、図４（ａ）は、Ｐｄ（ｔｍｄｔ）_２の分子内での原子の立体配置とその分子が作る結晶構造とを示す斜視図である。同様に、図４（ｂ）はＡｕ（ｔｍｄｔ）_２の、図４（ｃ）はシチジンの、図４（ｄ）はタウリンの、図４（ｅ）は１−ＦｃＡｑＨ（ＣｌＯ_４）の、図４（ｆ）はコハク酸プレドニゾロンの物質構造をそれぞれ示す斜視図である。
参考のため、これら６種類の試料物質を次に列挙する。
（ａ）Ｐｄ（ｔｍｄｔ）_２：Ｐｄ−ｔｒｉｍｅｔｈｙｌｅｎｅｔｅｔｒａｔｈｉａｆｕｌｖａｌｅｎｅｄｉｔｈｉｏｌａｔｅ
（ｂ）Ａｕ（ｔｍｄｔ）_２：Ａｕ−ｔｒｉｍｅｔｈｙｌｅｎｅｔｅｔｒａｔｈｉａｆｕｌｖａｌｅｎｅｄｉｔｈｉｏｌａｔｅ
（ｃ）シチジン：ピリミジンヌクレオシドの一種
（ｄ）タウリン：アミノエチルスルホン酸
（ｅ）１−ＦｃＡｑ（ＣｌＯ_４）：１−ｆｅｒｒｏｃｅｎｙｌｅｔｈｙｎｙｌ−ａｎｔｈｒａｑｕｉｎｏｎｅ，ＣｌＯ_４
（ｆ）コハク酸プレドニゾロン：合成副腎皮質ホルモン剤の一種
（比較検討）
先ず、自由度６の試料物質（ａ）〜（ｃ）については、決定すべき自由度の数が少ないので、比較例であってもデータ解析に数十秒程度の演算時間をかければ概ね構造決定をすることができ、同じデータを解析した実施例１に準ずる一致度を得ることができる。
しかし、同じデータを本実施形態の方法により解析した本発明の実施例１によれば、解析時間は数十分の一〜百数十分の一で済み、試料物質三つのうち二つまでは一致度（すなわち適応度）も向上している。ここで、一致度は二乗誤差に基づく実測データと仮想データとのミスマッチの程度であるから、一致度がゼロに近づくほど評価は高い（つまり適応度が高い）。
したがって、計算時間と一致度との両方から見て、ＳＰｒｉｎｇ−８での高精度測定データに基づいて広域的最適値を探索する構造決定能力は、本発明の実施例１の方が従来技術による比較例よりも二桁程度は向上しているものと推定される。
一方、実施例２では、ＳＰｒｉｎｇ−８からではなく実験室レベルのＸ線回折測定装置で測定をしているので、実測データの精度が低くなっている。それにもかかわらず、実施例２でもおおむね実施例１と同等の解析時間で構造決定をするに至っており、求められた最適解も実施例１のそれに近い。このようにして、本実施形態によれば、実験室レベルの測定装置での測定データからであっても、世界最高レベルの精度をもつ測定データからと比肩しうる内容で物質構造決定ができるという効果が確認された。なお、一致度に関する比較は、実施例１と実施例２とでは互いに異なる測定データに基づいて物質構造の決定がなされているから、あまり意味をなさない。
次に、決定すべき自由度がそれぞれ８，１２，２６である試料物質（ｄ）〜（ｆ）については、比較例ではＳＰｒｉｎｇ−８での測定データに基づいても構造決定をすることができなかった。しかし、本発明の実施例１によれば、自由度２６の試料物質（ｆ）に至るまで、構造決定することができる。
そして、本発明の実施例２（ｄ）では、このタウリンの物質構造が、大学の実験室で測定したデータを解析して僅か０．４秒で構造決定するに至っている。
また、自由度１２の試料物質（ｅ）についての構造決定は、実施例１（ｅ）で７秒程度、実施例２（ｅ）では２９秒程度でなされている。同物質の構造決定にかかった演算時間は、基になる測定データの精度が違うので、実施例２（ｅ）では実施例１（ｅ）の数倍になっているが、その絶対値は問題にならない程度の短さである。
ここで、現況では実施例１（ｄ）が未実施となっている理由は、ひとえにタウリンの粉末試料についてＳＰｒｉｎｇ−８の利用時間（マシンタイム）を確保することができなかったせいである。しかし、タウリンの自由度は８に過ぎず、しかも前述のように、実施例２（ｄ）では実験室レベルの装置による測定データによっても構造決定ができている。それゆえ、ＳＰｒｉｎｇ−８の利用時間を割いてタウリンの測定データさえ取ることができれば、実施例１（ｄ）でも実施例２（ｄ）とおおむね同等の解析結果が得られるものと推察される。
また、実施例２（ｆ）が未実施になっている理由も、本発明によるデータ解析に供するための実験データを用意することができなかったからである。つまり、実験室レベルのＸ線回折装置では、測定に一週間から十日間程度の時間が必要であるが、この実施例については、本出願までに同装置の利用時間の配分を受けることができなかった。
（表１との差異）
なお、実施例１（ｅ）では１２自由度でありながら７秒間で最適解に達しており、前述の表１中に記載がある逆ルーレット選択では自由度１２〜１４で約１時間を要するという実施例よりも、二〜三桁ほど解析時間が短くて済んでいる。これは何故かというと、その理由は大きく分けて次の二つである。
第一に、表１中の実施例では解析対象物質の一分子中の原子数が百個程度であったのに対し、実施例１（ｅ）ではその数が半数以下に減っていて物質構造が簡素であるからである。すなわち、各個体に相当して仮定された物質構造が簡素であれば、その粉末試料が形成するであろうＸ線回折像を算出する演算負荷も小さくなるからである。
第二に、表１中の実施例では、本発明のプログラムを実行するに当たりＨＧＡのポピュレーションの個体数を１０００個としていたのに対し、実施例１（ｅ）では、ポピュレーションの個体数も最適化されていて、わずか１０〜５０個体程度に抑えているからである。すなわち実施例１（ｅ）は、本発明のプログラムを実行するに当たって、ポピュレーション中の個体数など幾つかの設定パラメータを適正に設定した最速値だからである。
さらに、自由度２６の試料物質（ｆ）については、比較例では全く構造決定をすることができず、本発明の実施例１によってのみ約８時間の解析時間をかけて物質構造の決定を行うことができた。この解析時間は、コンピュータを一晩だけ放置すれば済む程度のものであるから、十分に実用に耐えるものである。
ここで、前述のように、ＳＰｒｉｎｇ−８によらず実験室レベルの測定データに基づいてであっても、本発明の実施例２では自由度１２の試料物質（ｅ）までは短時間のうちに構造決定を行うことができ、本発明の有効性を実証することができた。
以上のように、本実施形態によれば、ＳＰｒｉｎｇ−８による高精度の回折環データに基づいて試料物質の構造決定を行う場合、その決定すべき自由度が６程度までであれば、従来技術よりもずっと短時間のうちにデータ解析を終えることができた。また、試料物質（ｄ）以降のように自由度が８を超えてしまうと、従来技術では構造決定が困難になるが、本実施形態では可能である。そして、例えば試料物質（ｆ）のように自由度が２６もあっても、ＳＰｒｉｎｇ−８の測定データを数時間で解析してその物質構造を決定することができることを実証した。
なお、試料物質のうち（ｆ）にあたるコハク酸プレドロニゾンの構造は、本発明の実施例１によって初めて決定されたものである。
そして、本願発明者らを含む研究グループは、本発明の本実施形態によって決定された物質構造をすでに幾つかの学会に報告しており、参考までに学会発表および論文のうち主要なものを次に列挙する。
［学会発表］
・「中性単一分子金属Ｎｉ（ｔｍｄｔ）_２とＡｕ（ｔｍｄｔ）_２のＭＥＭ電子密度分布」藤城雄一^１、西堀英治^１、高田昌樹^１、坂田誠^１、鈴木和佳子^２、藤原絵美子^２、小林昭子^２、藤原秀紀^３、小林速男^３，４（名大院工^１、東大院理^２、分子研^３、ＣＲＥＳＴ^４）日本結晶学会平成１５年年会平成１５年１２月１〜２日熊本産業文化会館
・「ベンゼンを加えた大型フェロセン−アントラキノン共役結合錯体の結晶構造」吉田雅則、青柳忍、西堀英治、坂田誠、近藤美欧、村田昌樹、西原寛（名大院工、東大院理）日本結晶学会２００５年平成１７年１２月６日、７日イーグレひめじ
［論文］
・「放射光粉末Ｘ線回折法による精密結晶構造解析法の開発と展開」西堀英治，日本結晶学会誌，Ｖｏｌｕｍｅ４８（３），２００６．ｐ２１６−２２３
・″Ｒｅｃｅｎｔｐｒｏｇｒｅｓｓｉｎｄｅｖｅｌｏｐｍｅｎｔｏｆｓｉｎｇｌｅ−ｃｏｍｐｏｎｅｎｔｍｏｌｅｃｕｌａｒｍｅｔａｌｓ．″，ＫｏｂａｙａｓｈｉＡ，ＦｕｊｉｗａｒａＥ，ＳｕｚｕｋｉＷ，ＳａｓａＭ，ＦｕｊｉｓｈｉｒｏＹ，ＥｉｊｉＮｉｓｈｉｂｏｒｉ，ＭａｓａｋｉＴａｋａｔａ，ＭａｋｏｔｏＳａｋａｔａ，ＯｋａｎｏＹ，ＦｕｊｉｗａｒａＨ，ＫｏｂａｙａｈｉＨ．，ＪｏｕｒｎａｌＤｅＰｈｙｓｉｑｕｅＩＶ１１４（２００４）４１９−４２４
・″Ｓｔｒｕｃｔｕｒｅｓｏｆａｓｉｎｇｌｅ−ｃｏｍｐｏｎｅｎｔｐａｌｌａｄｉｕｍｃｏｍｐｌｅｘｗｉｔｈｅｘｔｅｎｄｅｄＴＴＦ−ｔｙｐｅｄｉｔｈｉｏｌａｔｅｌｉｇａｎｄｓ，ｂｉｓ−（ｔｅｔｒａｔｈｉａｆｕｌｖａｌｅｎｅｄｉｔｈｉｏｌａｔｏ）ｐａｌｌａｄｉｕｍｄｅｔｅｒｍｉｎｅｄｂｙｐｏｗｄｅｒＸ−ｒａｙｄｉｆｆｒａｃｔｉｏｎ．″，Ｓｕｚｕｋｉ，Ｗ．，Ｆｕｊｉｗａｒａ，Ｅ．，Ｋｏｂａｙａｓｈｉ，Ａ．，Ｆｕｊｉｓｈｉｒｏ，Ｙ．，ＥｉｊｉＮｉｓｈｉｂｏｒｉ．，ＭａｓａｋｉＴａｋａｔａ．，ＭａｋｏｔｏＳａｋａｔａ．，Ｏｋａｎｏ，Ｙ．，Ｋｏｂａｙａｓｈｉ，Ｈ．，ＣｈｅｍｉｓｔｒｙＬｅｔｔｅｒｓ３２（２００３）１１０６−１１０７．
（従来技術１，２との比較）
図５のグラフに、本実施形態と従来技術１，２とで一致度Ｒの時間変化を比較して示す。すなわち同図は、回折環データに基づいて物質構造を決定するにあたり、各世代のポピュレーションのうち適応度が最も良い最優秀個体の一致度Ｒが収束していく様子を、前述の実施例２（ｅ）に相当する本実施形態と従来技術１，２とで比較して示したグラフである。ここで、本実施形態と従来技術１，２とで共通して解析に供された回折環データは、１−ＦｃＡｑＨ（Ｃｌ_４Ｏ）の粉末試料を実験室レベルのＸ線回折装置にかけて測定したデータであり、前述の実施例２で使用したものである。
同図に明らかなように、従来技術１では、進化の方向性がＧＡに与えられていないので、最優秀個体の一致度Ｒがなかなか収束しようとはしない。逆に従来技術２では、全ての新生個体が局所最適化されるので、最優秀個体の一致度Ｒは演算の初期段階では急速に向上する。しかし、その際に個体の多様性も急速に失われてしまうらしく、ほんの数十秒間から先では一致度Ｒの収束は遅々として進まなくなってしまう。
一方、本実施形態での一実施例（実施例２（ｅ）に相当）は、進化の方向性が適宜与えられていながら、ポピュレーション中の個体の多様性も失われないようになっている。それゆえ本実施例では、最優秀個体の一致度Ｒがほんの百秒間ほどで従来技術２のそれを追い越し、その後も収束を続ける。そして、千秒間（十数分間）程度が経過した頃には、一致度Ｒがおおむね収束しきっており、その段階での一致度は従来技術１や従来技術２よりもずっと改善されている。
（３）実施例で実施された解決手段
以上の実施例１および実施例２で実施された本願発明の解決手段を、なるべく前述の解決手段の項の記載に沿って表現すれば、以下のようなものである。
［方法発明］
・パラメータ最適化方法
実施例１および実施例２は、いずれも本発明のうち「ハイブリッドＧＡによる複数パラメータの最適化方法」の好ましい実施形態である。そう解釈すると、実施例１（ａ）〜（ｆ）および実施例２（ａ）〜（ｆ）のうち未実施の２ケースを除く１０ケースの大半は、本発明の複数パラメータの最適化方法にあたる第１手段〜第１５手段のうち、第２手段および第４手段〜第６手段を除くいずれにも該当する。
ここで、これら大半のケースが第２手段に該当しない理由は、これらのケースでは、ＨＧＡの設定が、世代交代の毎に各世代で一つの個体だけを局所最適化するようになっているからである。すなわち、初期世代を除く全ての世代がいずれも特定世代であるようでは、第２手段のように特定世代は全世代のうち一部であるとは、言い難いからである。
さて、両実施例の最適化方法は、各個体を構成する記号列のうち少なくとも一部は、所定の物理量に対応した複数のパラメータであり、これらのパラメータの適正な組合せを探索することを目的としている。この方法は、前提として、評価過程と交叉過程と淘汰過程とを繰り返すうちに突然変異過程を適宜交えながら世代交代を重ねるＧＡ（遺伝的アルゴリズム）を使用する。
そして、この方法にはいくつかの特徴がある。
先ず、第一の特徴は、初期世代を除く全世代で、各世代のポピュレーションのうちそれぞれ一個体ずつに局所最適化が施されることである。
すなわち、両実施例では、原則として特定世代の出現頻度は世代交代のある毎に（つまり連続した各世代毎に）であり、当該ポピュレーションのうち特定個体の数は一個だけということである。それゆえ両実施例の全ケースは、いずれも第３手段に該当している。ただし、実施例１の系統と実施例２の系統とでは、特定世代の分布に若干の違いがある。すなわち、実施例１の各ケースでは、初めから特定世代が連続しているが、一方、実施例２の各ケースでは、第１０世代までは特定世代が出現せず、第１１世代から特定世代が連続して出現している。それゆえ実施例２の各ケースは、第２手段および第５手段にも該当している。
このような第一の特徴は、特定世代の出現頻度と当該世代のポピュレーションでの特定個体の個数とに関する特徴であり、両者の積によって、一世代当たりに局所最適化操作を行う平均的な回数がおおむね決まる。そして、両者のバランスを適正に取りながら、両者の積を適度に低減することができれば、計算負荷の大きな局所最適化操作の回数を減らすことにより、高速で世代交代を重ねながら、多様性を保ちつつ進化に適度の方向性を与えることができる。
次に、この方法の第二の特徴は、最適化過程で局所最適化操作の対象となる特定個体を選ぶ際に、適応度が比較的低い個体の中からも特定個体が選ばれる可能性があるということである。
すなわち、両実施例のいずれのケースでも、特定世代のポピュレーションのうち適応度が低い方の所定割合（この割合もランダムに設定される）に属する個体からなる劣等グループの中から、ランダム選択法によって特定個体が選ばれるようになっている。特定個体の選定に際してこのような方法を採ると、実質的には適応度の低い個体の方が適応度が高い個体よりも高い確率で選ばれるような弱者優先の傾向を持つルーレット選択法によって特定個体が選ばれる。そして、このような特定個体の選択方法のことを、発明者らは前述のように「逆ルーレット選択」と呼んでいる。それゆえ、両実施例の全ケースは第７手段〜第１１手段のいずれにも該当している。
そして、この方法の第三の特徴は、ＨＧＡの淘汰過程では、当該世代のポピュレーションのうち適応度が比較的低い個体の方が選択される確率が高くなる逆ルーレット戦略を取っていることである。
その結果、適応度が比較的低い個体であっても（むしろその方が）、次世代に生き残る可能性が高くなっている。ただし、せっかく広域的な最適値にまで達した個体が生き残れないのでは困るから、当該世代の前記ポピュレーションのうち適応度が最高のトップ個体だけは世代交代の際に必ず生き残るというトップ保存戦略も併用されている。それゆえ、両実施例の全ケースは第１２手段〜第１４手段のいずれにも該当している。
・データ解析方法
次に両実施例は、本発明の「パターンマッチングによるデータ解析方法」の実施形態でもあり、前述の解決手段のうち第１６手段に該当する。
すなわち両実施例ではさらに、前述の「ハイブリッドＧＡによる複数パラメータの最適化方法」において、次のような特徴を持つ。先ず、各前記個体がもつ前記適応度は、当該個体の前記記号列に含まれる前記複数のパラメータに対応する前記物理量を仮定すると数値演算により決まる仮想データのパターンが、実測データのパターンとどの程度一致しているかを示す指標である。そして、この適応度が高い前記個体を生成することによって、当該個体の前記仮想データと前記実測データとの間でパターンマッチングを行い、前記物理量を推定することを目的として前記実測データの解析を行う。
・構造決定方法
両実施例はまた、本発明の「放射線回折データに基づく物質構造の推定方法」の実施形態でもあり、前述の解決手段のうち第１７手段〜第２０手段ならびに第２１手段および第２２手段に該当する。
すなわち、両実施例では前述の「ハイブリッドＧＡによる複数パラメータの最適化方法」を、所定の試料物質に照射された放射線が形成する回折パターンに基づいてこの試料物質の構造を推定する物質構造の推定方法に応用している。そして、前述の物理量は主に、この試料物質の物質構造を決定する構造パラメータである。また、各前記個体の前記適応度は、この試料物質が当該個体に相当するこれらの構造パラメータをもつと仮定すると生じる回折パターンが、実測された回折パターンに対してどの程度一致しているかを示す指標である。
ここで、両実施例で決定している構造パラメータは、試料物質の結晶構造を規定する格子定数と、この試料物質を構成する分子内における三次元的な原子配列を規定する分子構造パラメータと、この試料物質の結晶内での三次元的な原子配列を規定する結晶学的構造パラメータとである。また、その回折パターンとは、その回折強度が同心円状に拡がって分布するＸ線回折環である。さらに、適応度とは、この回折環がもつ半径方向への強度分布の実測データと、仮定された構造パラメータに基づいて生成される仮定データとが、どの程度一致しているかを示す評価関数である。
この物質構造の推定方法を、第２１手段の記載に準拠して表現すると次のようになる。
すなわち、この方法は、多数の細かい結晶を含む粉末試料の物質構造を特定するために、この試料物質に照射されたＸ線回折環がもつ強度分布の回折データに基づいて、その構造パラメータをデータマッチングにより推定する方法である。その際に用いられるアルゴリズムは、前記構造パラメータがコーディングされた個体を、ある程度の多様性を持たせて複数個発生させ、初期世代のポピュレーションとする発生過程の後に、これらの個体の交叉および複製と、前記データマッチングの程度を示す適応度を評価してこれらの個体を淘汰する選択と、確率的に起こる突然変異とを繰り返す世代交代過程を行うＧＡ（遺伝的アルゴリズム）を基礎としている。そして、前記ＧＡでは、前記世代交代過程の間に複数の世代において、当該ポピュレーションの一部である前記個体に対して局所最適化操作が行われ、この局所最適化操作の対象には、当該ポピュレーションのうち前記適応度が比較的低い前記個体もなる可能性があることを特徴としている。
あるいは、この物質構造の推定方法を、第２２手段の記載に準拠してプロセスに分けて表現すれば次のようになる。
すなわち、両実施例の「放射線回折データに基づく物質構造の推定方法」は、放射線としてのＸ線を試料物質に照射して得られた回折環の強度分布データに基づき、この強度分布データに適合する物質構造を特定することを目的とする。そしてこの目的を果たすために、背景散乱除去プロセスと、基本構造決定プロセスと、空間群絞り込みプロセスと、基本構造決定プロセスと、構造精密化プロセスとが、順に行われる。
先ず、格子定数決定プロセスでは、この試料物質に含まれる結晶の格子定数が決定され、次に背景散乱除去プロセスでは、この強度分布データに含まれているバックグラウンド散乱の影響が除去ないし低減される。そして、空間群絞り込みプロセスでは、この結晶が属する空間群の候補が絞り込まれ、そのうえで基本構造決定プロセスでは、この結晶の基本構造が初期的に決定されてこの空間群が一つに特定される。最後に、構造精密化プロセスでは、この基本構造が精密化されてこの結晶を構成する物質の構造がより精密に決定される。
この格子定数決定プロセスおよびこの基本構造決定プロセスでは、それぞれＧＡ（遺伝的アルゴリズム）に局所最適化操作を組み合わせたハイブリッドＧＡを利用した物質構造決定が行われる。このハイブリッドＧＡでは、世代交代の間に複数の特定世代で、当該世代のポピュレーションのうち一部の個体である特定個体を対象にして前記局所最適化操作が行われ、この特定個体には、当該世代のポピュレーションのうちでは実測データとの一致度を示す適応度が比較的低い劣等グループからも選定される可能性がある。
［ソフトウェア関連発明］
・最適パラメータ探索プログラム
両実施例では、「最適パラメータ探索プログラム」が使用されており、このプログラムは本発明の第２３手段〜第２５手段の一実施形態である。すなわち両実施例では、Ｘ線回折環のデータ解析に同プログラムが実施されており、同プログラムの広域探索機能により求められた最適パラメータとして、物質構造が決定されている。
・物質構造推定プログラム
同様に両実施例では、「物質構造推定プログラム」が使用されているとも捉えることができ、そうすると同プログラムは第２６手段および第２７手段の一実施形態にも該当する。
・記録媒体
両実施例で使用されている前述の「最適パラメータ探索プログラム」および「放射線回折データに基づく物質構造推定プログラム」のうち少なくとも一方をコンピュータ読み取り可能な記録媒体に記録したとしよう。すると、その記録媒体は、本発明の第２８手段の一実施形態に該当する。なお、具体的な記録媒体の種類としては、発明者らは主として広く市販されているＣＤ−ＲＯＭやＵＳＢメモリを使用している。
［装置発明］
・ＨＧＡ搭載のコンピュータ
両実施例のデータ解析にあたっては、前述のように市販ＰＣの上級機ないしワークステーションで上記プログラムを実行している。このＰＣは、３［ＧＦＬＯＰＳ］程度の演算能力をもつもので、より具体的には、ＨＰＣシステムズ株式会社（固有組織名：旧株式会社ＨＩＴが他社と合併して社名変更した）製の型式名Ｓｉｌｅｎｔ−ＳＣＣ（商品名）である。そしてその構成は、ＰＣクラスタ（２０ＣＰＵおよび８ＣＰＵ）と呼ばれるものである。なお、このようなＰＣクラスタを単にＰＣやワークステーションと呼んでしまうことに抵抗のある向きもあろうが、その議論は本発明の本質とは関わりがないので、単に強力な市販ＰＣということでお許しをいただきたい。
そして、このＰＣには前述の「最適パラメータ探索プログラム」がインストールされており、このプログラムは「放射線回折データに基づく物質構造推定プログラム」でもある。それゆえ、このＰＣは本発明の第２９手段「ハイブリッドＧＡ搭載コンピュータ」の一実施形態に該当する。
・ＨＧＡ搭載の解析装置
さらにこのＰＣを解析装置として捉えれば、このＰＣはやはり前述の「最適パラメータ探索プログラム」ないし「放射線回折データに基づく物質構造推定プログラム」を実行可能な解析装置である。それゆえこのＰＣは、第３０手段たる「ハイブリッドＧＡを搭載した解析装置」の一実施形態にも該当する。
・物質構造推定装置
両実施例の物質構造決定結果を得るに当たって用いた設備全体は、当該試料物質に放射線を照射して生じる回折パターンを測定する測定装置と、この回折パターンから得られた実測データに基づいた解析を行うことにより当該試料物質の構造を推定する解析装置とを有する。ここで、この測定装置として使用されているのは、実施例１ではＳＰｒｉｎｇ−８であり、実施例２では前述の実験室レベルのＸ線回折装置である。一方、解析装置としては、両実施例で共通して前述のＰＣを使用している。
それゆえ、両実施例のうちいずれで使用した「放射線回折パターンによる物質構造推定装置」も、本発明の第３１手段の一実施形態に該当する。
３．物質構造決定の手順
（０）全体像
本発明の実施形態たる「放射線回折データに基づく物質構造の推定方法」は、図７に示す解析手順（プロセスＰ１〜Ｐ５）を踏んで、粉末試料の物質構造を十分な確度および精度をもって推定（すなわち決定）する方法である。本実施形態は、格子定数決定プロセスＰ１と、背景散乱除去プロセスＰ２と、空間群絞り込みプロセスＰ３と、基本構造決定プロセスＰ４と、構造精密化プロセスＰ５とを有する。
第一に、格子定数決定プロセスＰ１は、この粉末試料に含まれる多数の微細な結晶の格子定数を決定するプロセスである。すなわち、このプロセスでは、当該結晶の単位格子を定義する格子定数、例えば三斜晶系の結晶と特定されればその格子定数（ａ，ｂ，ｃ，α，β，γ）が決定される。
第二に、背景散乱除去プロセスＰ２は、本実施形態の入力データＩＮたるＸ線回折の強度分布データに含まれているバックグラウンド散乱の影響を、除去ないし低減するプロセスである。
第三に、空間群絞り込みプロセスＰ３は、この粉末試料に含まれる微細な結晶が属する可能性がある空間群を、ある程度少ない候補に絞り込むプロセスである。このプロセスでは、入力データＩＮたる回折強度のピークないし反射の出現位置に基づき、結晶が取りうる２３０種類の空間群のうちから可能性の低いものを除き、可能性が高い空間群を数種類程度に絞り込むことが行われる。
第四に、基本構造決定プロセスＰ４は、この結晶の基本構造を初期的に決定して、この空間群を一つに特定するプロセスである。すなわち、このプロセスでは、前述の空間群絞り込みプロセスで絞り込まれた空間群の候補の中から、最も確からしい空間群が決定され、単位格子内での分子の位置及び姿勢と三次元的な原子配列とが、やや粗めの精度で決定される。
第五に、構造精密化プロセスＰ５は、この基本構造を精密化して、この結晶を構成する物質の構造をより精密に決定するプロセスである。さらに、この構造精密化プロセスでは、分子内での電子密度の分布をも推定ないし決定することがある。
さて本実施形態は、粉末試料をガラスキャピラリーに封入し、ＳＰｒｉｎｇ−８（固有名詞）の高エネルギー放射光Ｘ線をこの試料物質に照射して実測された回折環の強度分布データを入力データＩＮとする。入力データＩＮは、再び図１（ｂ）に示すように、粉末試料で回折したＸ線が形成する回折環がもつ強度分布の実測データであるから、図８に示すように、回折角２θに沿って一次元的に展開した回折Ｘ線の強度分布データである。そして、本実施形態では所定のプロセスＰ１〜Ｐ５を順に経て、入力データＩＮに適合する物質構造が特定され、出力結果ＯＵＴとして出力される。出力結果ＯＵＴは、図９に示すように、粉末試料に含まれる多数の微細な結晶の格子定数と、その微細な結晶を構成する物質の分子が当該結晶内にもつ三次元的な原子配列とである。
そして本実施形態では、格子定数決定プロセスＰ１と基本構造決定プロセスＰ４との両方で、ＧＡ（遺伝的アルゴリズム）に局所最適化操作を組み合わせたハイブリッドＧＡを利用した試料物質の構造決定が行われている。
このハイブリッドＧＡでは、ＧＡの世代交代過程の間に、複数の特定世代において、当該世代のポピュレーションのうち一部の個体である特定個体を対象にして、前記局所最適化操作が行われている。また、この特定個体には、当該世代のポピュレーションの中で、実測データとの一致度を示す適応度が比較的低い劣等グループからも選定される可能性がある。
前述のように、本実施形態の「放射線回折データに基づく物質構造の推定方法」では、格子定数決定プロセスＰ１と基本構造決定プロセスＰ４との両方で、ＧＡに局所最適化操作を組み合わせたハイブリッドＧＡを利用した試料物質の構造決定が行われている。そして、これらの両プロセスＰ１，Ｐ５自体も、本願発明の中核をなすハイブリッドＧＡを用いて処理されていることを条件に、本発明の「放射線回折データに基づく物質構造の推定方法」の一実施形態である。
以上で、本実施形態のうち「放射線回折データに基づく物質構造の推定方法」についてその手順構成の概要を明らかにすることができたので、次に各プロセスＰ１〜Ｐ５について具体的に説明する。
（１）格子定数決定プロセス
格子定数決定プロセスＰ１は、前述のように、格子定数を決定するプロセスであり、例えば三斜晶系の結晶であれば、図１０に示すように、単位格子ＵＣの各辺長ａ，ｂ，ｃと各辺がなす角度α，β，γとの六つのパラメータからなる格子定数ＬＣが決定される。
その手順は、図１１に示すように、先ず読込ステップＤで、ＳＰｒｉｎｇ−８（固有名詞）で粉末試料から得たＸ線回折環の実測データをコンピュータ（図略）に読み込んでから、前処理ステップＳ０でピーク位置を抽出して回折ピーク位置表を作成する。ただし、実施例２（ａ）〜（ｆ）では、前述のように実験室レベルのＸ線回折装置で測定した回折環データに基づいたピーク位置表を用いている。
ここで、回折ピーク位置表とは、回折環の強度分布データが図１２に示すようなものである場合には、その各ピークに回折角２θの小さい方から順に番号を振ったものである。すなわち、次の表３に示すように各ピークの回折角２０を列挙したピークデータの一覧表が、回折ピーク位置表である。
そして、再び図１１に示すように、ハイブリッドＧＡステップＳ１で、そのピークデータに対するデータマッチングを行って最適な（つまり正解の）格子定数を探索し、格子定数（ａ，ｂ，ｃ，α，β，γ）を決定するに至る。なお、ハイブリッドＧＡステップＳ１で行われる格子定数決定の具体的な処理内容については、後ほど「ハイブリッドＧＡ」の節を立てて詳しく説明する。
なお、このプロセスで用いるピークデータに含まれているのは、ピーク位置に関する情報だけであって、ピーク強度に関する情報は含まれていない。
なぜならば、回折線の各ピークの位置だけの情報から、Ｘ線の回折が起こる条件式（２ｄ・ｓｉｎθ＝λ）に基づいて、各ピークの面間隔ｄの大きさを求めることができるからである。このとき、各ピークの面間隔ｄは、面を示す単位格子の軸の整数分の１のベクトルの組み合わせであらわされるミラー指数（ｈｋｌ）と格子定数（ａ，ｂ，ｃ，α，β，γ）とを用いて、所定の関係式から算出される。すなわち、実測データに含まれる全ての（場合によってはほとんどの）ピーク位置に対応するｄを実現できる格子定数（ａ，ｂ，ｃ，α，β，γ）の組合せを探り出すことができれば、それをもって正しい格子定数であると決定することができる。このプロセスでは、この格子定数の探索にハイブリッドＧＡを使用している。
（２）背景散乱除去プロセス
背景散乱除去プロセスＰ２は、前述のように、Ｘ線回折の強度分布データに含まれている背景（バックグラウンド）散乱の影響を除去ないし低減するプロセスである。
すなわち、図１３に模式的に示すように、回折環のＸ線強度の実測データには、本当に観測したい粉末試料自体からの回折Ｘ線の他に、様々な原因で生じるバックグラウンド散乱によるＸ線が混じっている。そして、構造決定を行う試料からの回折強度を正確に見積もるためにはバックグラウンドの強度を取り除く必要がある。最近の粉末Ｘ線回折においては、必要とされる粉末試料がごく微量であることと、実験の簡便さから頻繁にデバイシェラー法によるデータ測定が行われることとから、粉末試料をガラス製のキャピラリーに封入して実験を行うため、ガラスのハローパターンのためにバックグラウンドが複雑な形状になりがちである。
さて、このようなバックグラウンドを構成する散乱の因子のうち、主たるものは次の四つである。
・Ｘ線の発生源から粉末試料を経て検出器に至るまでに存在する空気による散乱
・ガラスキャピラリーおよび粉末試料から発生する蛍光Ｘ線の等方的な散乱
・ガラスキャピラリーからのハローパターンを作る散乱
・粉末試料からの温度散漫散乱
たとえば、Ｘ線回折試料がＣｓＰｂＣｌ_３の粉末からなる場合には、図１４（ａ）に示すようなＸ線強度の実測データが得られるが、この実測データにもこれら四つの因子による散乱が含まれている。すなわち、ガラスのハローパターンは図１４（ｂ）に示すように、空気散乱は図１４（ｃ）に示すように、温度散漫散乱は図１４（ｄ）に示すように、それぞれ分布している。一方、蛍光Ｘ線は、等方的に散乱することが予め分かっているから、その分布パターンも明らかである。そこで、図１４（ｅ）に示すように、これら四つの因子によるバックグラウンド散乱を取り除けば、ほぼ純粋に粉末試料からの回折Ｘ線だけの強度分布を割り出すことができる。
（３）空間群絞り込みプロセス
空間群絞り込みプロセスＰ３は、前述のように、Ｘ線回折環の実測データに基づいて、結晶が取りうる２３０種類の空間群のうちから可能性の低いものを除き、可能性が高い空間群の候補を絞り込むプロセスである。
このプロセスでは、先ほど構造精密化プロセスＰ５で求められている格子定数（ａ，ｂ，ｃ，α，β，γ）から、粉末試料に含まれる結晶が七つの結晶系（三斜晶、単斜晶、斜方晶、正方晶、三方晶、六方晶、立方晶）のうちどれに属するかを決定する。なぜならば、Ｘ線回折により構造を決定するためには、結晶系から空間群を決定する必要があるからである。
ここで、空間群とは、結晶の原子配列の対称性を記述した群であり、全ての結晶は２３０個の空間群のどれかに属している。ちなみに各結晶系に含まれる空間群の数は、三斜晶で２個、単斜晶で１３個、斜方晶で５９個、正方晶で６８個、三方晶で２５個、六方晶で２７個、立方晶で３６個である。これらのうち同一の結晶系に属する空間群の違いは、Ｘ線回折データで見ると、消滅する反射を決定する消滅則にあり、消滅則とは、結晶系からは出現するはずの反射が、空間群の対称操作で周期的に消滅する規則を示す。例えばｂ軸方向に軸の１／２の大きさの並進操作がある場合には、ミラー指数（ｈｋｌ）が０ｋ０で表される反射のうち、ｋ＝２ｎ＋１（奇数）の反射は消滅する。
発明者らは、空間群を粉末回折データから、結晶系に含まれる全ての空間群に対してＬｅＢａｉｌ解析（Ａ．ＬｅＢａｉｌｅｔａｌ，Ｍａｔ．Ｒｅｓ．Ｂｕｌｌ．２３，４４７，（１９８８））を適用し、ＬｅＢａｉｌ解析の信頼度因子の値Ｒｗｐから可能性のある空間群を絞り込む方法を開発した。ここで、信頼度因子Ｒｗｐは次の数１で定義される数値である。
この数１中で、Ｎは観測点の数、ｗ_ｉは第ｉ番目の観測点に対する荷重であり、観測強度の逆数ｗ_ｉ＝Ｙ（２θ_ｉ）_{ｏｂｓ−１}を用いる。また、Ｙ（２θ_ｉ）_ｃａｌｃは計算プロファイル強度、Ｙ（２θ_ｉ）_ｏｂｓは観測プロファイル強度である。この方法では、最初に各結晶系で消滅側を持たない空間群によりＬｅＢａｉｌ解析を行う。この解析から回折反射の形状を決める回折プロファイルパラメータを求める。その後、このプロファイルパラメータを用いて、可能性のある空間群全てに対するＬｅＢａｉｌ解析を自動で行う。
そして、ＬｅＢａｉｌ解析の結果として得られた信頼度因子Ｒｗｐの数値が低い空間群が、すなわち現実の状態に該当する可能性の高い空間群であって、正しい空間群の候補となる。（そういう意味では、Ｒｗｐには「信頼度因子」という呼称よりも、むしろ逆に「不信度因子」ないし「過誤確率指数」といった呼称の方が相応しい。）
ここで、空間群を決定するうえで従来取られていた方法では、複数の空間群に対して一つずつ消滅側を確認しようとすると、多大な手間と時間を必要としていた。なぜならば、実測データと反射位置とから消滅側を決定し、空間群を絞り込んでいこうとすると、粉末回折データは単結晶回折データと比較して回折強度が弱いため、目視できない反射が実際に消滅しているか判明することが難しかったからである。その結果、従来法では、強度データに反射が見られなければ、正解であっても候補から外れてしまうことがあり、正解の空間群が絞り込んだ空間群から漏れる可能性があった。
一方、発明者らが開発した方法では、前述のように、ＬｅＢａｉｌ解析空間群を変化させながら自動で繰り返すので、結晶系から対象となる全ての空間群を網羅的に探索することができる。その結果、可能性のある全ての空間群を、正解の候補として漏れなく抽出できるようになった。
その実例として、１−ＦｃＡｑＨ（ＣｌＯ_４）つまり「１−フェロセンアントラキノン接合錯体プロトン付加体（ＣｌＯ_４）」の解析例を次の表４に示す。
この表に示すように、単斜晶の空間群に対して軸の及び原点の取替えを含めて行った３８４例に試したところ、可能性のある空間群をわずか数分（実際には１分間程度）で８種類にまで絞り込むことができた。ここで、可能性のある空間群の条件としては、信頼度因子Ｒｗｐが５％未満のものであることを採用し、同表ではそのパーセンテージの前に○印を付けて示してある。なお、この際にＸ線回折環のデータ解析に用いたコンピュータは、前述の市販ＰＣである。
（４）基本構造決定プロセス
基本構造決定プロセスＰ４は、前述のように、絞り込まれている空間群の候補の中から最も確からしい空間群を正解として決定し、単位格子内での分子の位置及び姿勢と三次元的な原子配列とを大まかに決定するプロセスである。すなわち、結晶系、空間群が決定されたうえで、単位格子内の大まかな原子または分子の配列を決定することを基本構造の決定という。Ｘ線回折データの回折ピークの強度は、結晶内の原子の配列を反映しているため、回折データの強度関係を満足する大まかな原子配列を決定することで、基本構造の決定となるわけである。
さて、一般に単結晶Ｘ線回折の場合には、各回折ピークの強度を独立に求めることが容易であるため、この強度を用いて１９８５年にノーベル賞に輝いた直接的に結晶構造を決定する方法により基本構造が決定できる。しかし、粉末試料の回折データの場合には、前述のように回折環の強度ピークが重なり合ってしまうので、各回折ピークの強度を求めることができない。このため、従来の直接的に結晶構造を決定する方法では、本実施形態のように粉末試料から得られたＸ線回折環データに基づいて構造決定を行うことはできない。
そこで、本実施形態の基本構造決定プロセスＰ４では、単位格子の実空間中における分子の位置姿勢およびその形状を求める実空間法にハイブリッドＧＡを適用して、粉末回折データから基本構造を決定することができるようにした。
ここで用いた「実空間法」とは、原子もしくは幾つかの原子を集めた剛体（つまり分子）が単位格子中で取る位置および向き（つまり姿勢）を決定し、その剛体（分子）の内部にある回転自由度について解を与えて剛体の形状をも決定する方法である。すなわち、図１５（ａ）〜（ｃ）に示すように、単位格子中の原子の配列を原子、剛体（分子）の位置（ｘ，ｙ，ｚ）および向きないし姿勢（θ，φ，ψ）と、内部回転（τ_１，τ_２，τ_３，・・・・）のパラメータで表すものとする。そして、基本構造決定プロセスＰ４では、これらのパラメータをハイブリッドＧＡによる実空間法で決定する。ふつう、決定すべきパラメータの個数は、分子が単位格子内で取る位置姿勢の６自由度分と内部回転の箇所数との和ということになる。
基本構造決定プロセスＰ４で使用するハイブリッドＧＡは、前述の構造精密化プロセスＰ５で使用するものと基本的には同じものであり、最適化すべきパラメータと適応度の定義と各種の設定などとが異なるだけである。発明者らが開発したハイブリッドＧＡの詳細については、後に節を立てて説明する。
（５）構造精密化プロセス
前述のように、本実施形態での構造精密化プロセスＰ５は、前述の基本構造決定プロセスＰ４で決定された基本構造の精度を増して精密化するプロセスである。このプロセスでは、さらに分子内での電子密度の分布をも決定することも、やろうと思えばできる。
ここで、構造精密化とは、基本構造決定で求められた構造をもとに個々の原子の位置を最小自乗最適化により求めることである。粉末回折の構造最適化の手法としては、Ｒｉｅｔｖｅｌｄ法（Ｈ．Ｍ．Ｒｉｅｔｖｅｌｄ，Ｊ．Ａｐｐｌ．Ｃｒｙｓｔ．２（１９６９），６５）が用いられており、ふつう原子の位置が０．００１ｎｍ程度の精度で求められる。発明者らはさらに、基本構造決定とＲｉｅｔｖｅｌｄ法の精密化の流れを円滑にし、最終の構造精密化には、Ｒｉｅｔｖｅｌｄ法だけでなく、マキシマムエントロピー法（Ｍ．Ｓａｋａｔａｅｔａｌ，ＡｃｔａＣｒｙｓｔ．Ａ４６，２６３，（１９９０））を組み合わせ構造の精度を高める方法を開発した。その結果、粉末回折データから決定した物質構造と回折環データとの一致度は９８％程度にも達し、原子配列の誤差も０．０００１ｎｍ程度と、極めて精密な構造決定が可能になった。そして、これだけの精度をもって物質構造を決定することができれば、新物質の機能予測や医薬品の開発にも十分に利用可能である。
すなわち、構造精密化プロセスＰ５では、前述の基本構造決定プロセスと同様に、分子を剛体として取り扱い、基本構造決定と同様の位置・向き・内部回転のパラメータを精密化する。また、図１６に示すように、剛体全体の大きさを示す三軸方向のサイズパラメータ（ｘ−ｓｉｚｅ，ｙ−ｓｉｚｅ，ｚ−ｓｉｚｅ）をも最適化すべきパラメータに採り入れて、最小二乗最適化により精密化する。そしてさらに、有限温度における結晶中の原子は熱振動を起こしており、このような熱振動の影響は回折パターンに比較的大きく寄与するから、剛体全体の熱振動をも精密化した。その結果、分子を剛体として取り扱ったままで、回折パターンとの一致度を基本構造決定の場合よりも高めることができる。
構造精密化プロセスＰ５の結果として、Ｐｄ（ｄｔ）_２の決定された構造によるＸ線回折の実測データとの一致度を示すフィッティンググラフを図１７に示し、同様にＡｕ（ｔｍｄｔ）_２の一致度を示すフィッティンググラフを図１８に示す。ちなみに、実測データとの一致度としての信頼度因子Ｒｗｐの値は、Ｐｄ（ｄｔ）_２では３．６％であり、Ａｕ（ｔｍｄｔ）_２では１．１％であり、どちらも原子間の距離、角度まで含めた高精度な解析がなされていることが分かる。
さらに、Ｐｄ（ｄｔ）_２の構造からバンド計算により電子状態を計算したところ、この物質が半導体であることが導き出されたので、その予測を確認すべく実際にその電気伝導度を測定したところ、やはり半導体的であった。このことからも、このようにして精密化した構造は、物質の機能を予測するのに十分な精度を持つことが分かった。
なお、Ｐｄ（ｄｔ）_２の正式名称はＰｄ−ｔｅｔｒａｔｈｉａｆｕｌｖａｌｅｎｅｄｉｔｈｉｏｌａｔｏであり、本実施例によるこの物質の構造決定の結果については、前述の文献のうち後者で報告されている。読者の便宜のために、同文献を重ねて次に記載しておく。″Ｓｔｒｕｃｔｕｒｅｓｏｆａｓｉｎｇｌｅ−ｃｏｍｐｏｎｅｎｔｐａｌｌａｄｉｕｍｃｏｍｐｌｅｘｗｉｔｈｅｘｔｅｎｄｅｄＴＴＦ−ｔｙｐｅｄｉｔｈｉｏｌａｔｅｌｉｇａｎｄｓ，ｂｉｓ−（ｔｅｔｒａｔｈｉａｆｕｌｖａｌｅｎｅｄｉｔｈｉｏｌａｔｏ）ｐａｌｌａｄｉｕｍｄｅｔｅｒｍｉｎｅｄｂｙｐｏｗｄｅｒＸ−ｒａｙｄｉｆｆｒａｃｔｉｏｎ．″，Ｓｕｚｕｋｉ，Ｗ．，Ｆｕｊｉｗａｒａ，Ｅ．，Ｋｏｂａｙａｓｈｉ，Ａ．，Ｆｕｊｉｓｈｉｒｏ，Ｙ．，ＥｉｊｉＮｉｓｈｉｂｏｒｉ．，ＭａｓａｋｉＴａｋａｔａ．，ＭａｋｏｔｏＳａｋａｔａ．，Ｏｋａｎｏ，Ｙ．，Ｋｏｂａｙａｓｈｉ，Ｈ．，ＣｈｅｍｉｓｔｒｙＬｅｔｔｅｒｓ３２（２００３）１１０６−１１０７．
４．格子定数決定プロセスでのＨＧＡ
（１）ＨＧＡの概要
いよいよ、以上の各プロセスＰ１〜Ｐ５のうち、格子定数決定プロセスＰ１と基本構造決定プロセスＰ４とで使用されるハイブリッドＧＡ（ＨＧＡと略記することもある）の構成について説明する。なお、両プロセスＰ１，Ｐ４は、本願発明のうち「ハイブリッドＧＡによる複数パラメータの最適化方法」及び「パターンマッチングによるデータ解析方法」並びに「最適パラメータ探索プログラム」及び「物質構造推定プログラム」の一実施形態でもある。
先ずこの節では、格子定数決定プロセスＰ１で用いられるＨＧＡについて、具体的に説明する。
すなわち、本実施形態の「ハイブリッドＧＡによる複数パラメータの最適化方法」及び「最適パラメータ探索プログラム」等の中核をなすハイブリッドＧＡは、図１９に示すように、初期世代設定ステップＳ１１の後、交叉ステップＳ１０３，淘汰ステップＳ１０５，突然変異ステップＳ１０７，局所最適化ステップ１０９などを繰り返す世代交代ループＬとを有する。なお、各処理手順については、本願発明を方法発明として捉えた場合には「過程」と呼び、プログラムとして捉えた場合には「ステップ」と呼んでいるが、処理する内容は実質的に同じであるから、以後、過程とステップとの呼称の区別には拘らないことにする。
このＨＧＡでは、各個体を構成する記号列は一組の物理量パラメータである格子定数［例えば（ａ，ｂ，ｃ，α，β，γ）］であり、格子定数の適正な組合せを広域的に探索することが目的である。
先ず、初期世代設定ステップＳ１１では、格子定数がそれぞれ適度に分布した所定数の個体からなる初期世代（第１世代ともいう）のポピュレーションが生成される。そして、各世代において、当該世代のポピュレーションを記録しておく記録ステップＳ１０２と、評価ステップ（図略）と交叉ステップＳ１０３と淘汰ステップＳ１０５と、確率的に起こる突然変異ステップＳ１０７及び局所最適化ステップＳ１０９とを含む世代交代ループＬが構成されている。
ここで、評価ステップ（図略）は、当該世代のポピュレーションのうち新たに生成された前記個体である新生個体の適応度を評価する過程である。評価ステップでは、初期世代設定ステップＳ１１と交叉ステップＳ１０３と突然変異ステップＳ１０７とで生成された新生個体の全てについて、各々の適応度が算出される。また、交叉ステップＳ１０３は、このポピュレーションのうち複数の個体を親個体として選び、これら親個体の間で所定の仕方で交叉を行って、新しい子個体を生成する過程である。そして、淘汰ステップＳ１０５は、交叉ステップＳ１０３による新生個体と、複製ステップＳ１０４で第Ｎ世代のポピュレーションから複製された個体との中から、次世代に残すべき個体を選択して他の個体を淘汰する過程である。
そして、突然変異ステップＳ１０７は、それに先立つ判定ステップＳ１０６により所定の確率で実行され、やはり確率的に選ばれた個体を構成する記号列に対し、強制的な変更を加える過程である。
さらに、局所最適化ステップＳ１０９は、やはりこれに先立つ判定ステップＳ１０８によって、確率的なルールに則って選ばれた一部の世代（特定世代）において、やはり所定の確率的なルールで選ばれた個体（特定個体）に対してだけ、その適応度に関して格子定数のパラメータを局所的に最適化する過程である。判定ステップＳ１０６の判定ロジックは調整可能であるが、特定世代の出現頻度は例えば１０世代毎に一回程度であり、特定個体の指定は、その特定世代のポピュレーションを構成する所定数の個体のうちで一つか、せいぜい数個程度に抑えている。
最後に、収束判定ステップＳ１１０で解の収束判定をした結果、収束していなければ指定の制限回数の範囲で、インクリメントステップＳ１１１で世代番号を改めた後、ステップＳ１０２へ戻り、第Ｎ世代のポピュレーションとして、再び世代交代ループＬが繰り返される。こうして世代交代ループＬを幾度も繰り返しつつ、世代交代を重ねるうちにポピュレーションの中に適応度が十分に良好な個体が発生することを待ち、それが正解ないし最良解に収束する至った判定をもって格子定数の最適な組合せが探索される。
そして、収束判定ステップＳ１１０で最良の適応度をもつ個体が生成されたことが判定されれば（あるいは世代交代が制限値に達したら）、世代交代ループＬを終え、結果出力ステップＳ１２で、最適の個体がもつ決定された構造パラメータ一式とその適応度等とが出力される。併せて、最終世代のポピュレーションを構成する個体全部の情報も、記録ステップＳ１０２と同様に記録される。
（２）ＨＧＡの詳細
本実施形態のＨＧＡ、すなわち格子定数決定プロセスＰ１でのハイブリッドＧＡは、以上のようにして格子定数（ａ，ｂ，ｃ，α，β，γ）の組み合わせを決定するが、その詳細を以下に記す。
（位置ずれパラメータｔ）
本実施形態のＨＧＡ（図１９参照）において、初期世代設定ステップＳ１１、交叉ステップＳ１０３、突然変異ステップＳ１０７及び局所最適化ステップＳ１０９には、新たに生成された個体の適応度を算出する評価ステップ（図略）が内包されている。この評価ステップで、適応度算出のために基準として参照される実測データは、前述のように、測定された粉末回折データからピーク位置を回折角２θで求めたピークデータである（図１１、図１２、表３参照）。
ここで、元になる粉末Ｘ線回折データは、回折角２θについて等間隔もしくは非等間隔ステップを持った離散点での強度データとして得られる。それゆえ、その回折角２θの測定値には、原点（回折環の中心点）付近でＸ線検出器がもつ空間分解能の範囲で、微細な原点の位置ずれ（ｔ）が生じており、この原点ずれ（ｔ）の値は、Ｘ線検出器からの実測データからだけでは不明である。
そして、本実施形態のＨＧＡで最適解を求めて探索する複数パラメータには、格子定数（ａ，ｂ，ｃ，α，β，γ）の他にも、この位置ずれｔが加えられており、探索パラメータは（ａ，ｂ，ｃ，α，β，γ，ｔ）の七つである。すなわち、位置ずれｔを含んだこれら七つのパラメータを探索し、位置ずれｔをも正しく決定してこそ、初めてピークデータとの正確なデータマッチングが行えるようになる。
（初期世代の発生過程）
先ず初期世代設定ステップＳ１１（図１９参照）では、初期世代のポピュレーションを形成する第一世代個体は、最初に使用者が設定した個体数Ｎｐ組の格子定数（ａ，ｂ，ｃ，α，β，γ）と原点ずれ（ｔ）とが、適正な乱数で発生させられる。
その際、格子定数（ａ，ｂ，ｃ，α，β，γ）には、必ず平行６面体を形成しなければならないことと、その単位格子の軸ａ，ｂ，ｃの大きささの最小値は、原子の大きさから０．２５ｎｍよりも小さいことなどの制約条件が課せられている。ここで、平行六面体の条件は、α＋β＋γ＜３６０°，α≦β＋γ，β≦α＋γ，γ≦α＋βである。この条件を満たさない場合、例えばα＋β＋γ＝３６０°といった場合には、単一の平面状に軸ａ，ｂ，ｃの方向が入ってしまい、単位格子が平面に収まってしまって平行６面体ではなくなってしまう。また、格子は原子のサイズより大きいという制限から、ａ，ｂ，ｃ＞０．２５ｎｍの範囲で発生させる。これらの制限により、乱数により必ず平行６面体を現す格子定数（ａ，ｂ，ｃ，α，β，γ）の組を発生させることができる。
一方、原点ずれ（ｔ）に関しては、データ点のステップ幅（つまり空間解像度）に相当するずれの範囲を設定し、その範囲でパラメータｔをランダムに発生させる。典型的な原点ずれ（ｔ）の値は０．００１°のオーダーである。さらに、（ａ，ｂ，ｃ，α，β，γ）に関しては、発生させるパラメータに、以下に示す多数の制約条件を付加することができる。
さらに、探索範囲を制限して効率的に解を探索するために、パラメータ（ａ，ｂ，ｃ，α，β，γ）の各値に上限、下限を設定することができる。また、必要に応じて、ａ＞ｂ＞ｃ、ａ＞ｃ，ｂ＞ｃ，ｃ＞ａ等の制約も与えることができる。そして、構成原子や分子からおよその単位格子の体積が予測できる場合には、体積の上限値（Ｖｍａｘ）と下限値（Ｖｍｉｎ）を入力することにより、上限（Ｖｍａｘ）と下限（Ｖｍｉｎ）の範囲内の体積（Ｖ）をもつ平行六面体を形成する格子定数（ａ，ｂ，ｃ，α，β，γ）の組を発生させることができる。
（評価過程）
各個体には、このような格子定数（ａ，ｂ，ｃ，α，β，γ）と原点ずれ（ｔ）とがその記号列にコーディングされており、各個体は、評価ステップ（図略）でその格子定数が実験で得られた回折ピークを満足するかどうかで評価される。
すなわち、適応度の評価は、その個体が表す格子定数の平行６面体から次の数２により得られるｄを回折条件式（２ｄ・ｓｉｎθ＝λ）に代入して計算される回折ピーク位置の仮定データ（２θ_ｃａｌ）と、実験データから抽出した回折ピーク位置の実測データ（２θ_ｏｂｓ）との一致度を用いて行う。
なお、一致度を示す評価関数は、次の数３から算出される。
ここで、Ｎは入力した反射の本数である。そして、２θ_ｏｂｓを中心とした±ｄｅｌｔａ値の範囲を設定し、その範囲内に含まれる２θ_ｃａｌとの間で一致度Ｒを計算する。ｄｅｌｔａの値は、おおむね回折ピークの半値幅の半分から半値幅の全体まで程度の値とする。この数式を用いるにあたり、もしも２θ_ｏｂｓ±ｄｅｌｔａの範囲に２θ_ｃａｌが存在しない場合には、上記数３の分子（｜２θ_ｏｂｓ−２θ_ｃａｌ｜／２θ_ｏｂｓ）の値を１とする。逆に範囲内に存在する場合には、（｜２θ_ｏｂｓ−２θ_ｃａｌ｜／２θ_ｏｂｓ）の値は０．００５前後の値のため、１となるピークが存在した場合には、一致度Ｒの値は著しく大きくなる。
さて、説明が前後するが、前述の初期世代設定ステップＳ１１では、生成される個体の表すパラメータの範囲に、一致度Ｒの値によって制限を加えることもできる。すなわち、一致度Ｒが設定した値より大きいパラメータに相当する個体が生成された場合には、その個体を破棄して、改めて別のパラメータに相当する個体を発生させる。そして、使用者が設定した各種の制約条件を満足するＮｐ個の個体が得られたら、第一世代人口の発生は終了する。
（交叉過程）
交叉とは、生物の交配を模した操作である。交叉ステップＳ１０３で行われる交叉の操作では、以下の数４から求められたｉ番目の個体の適応度ρを用いて、交叉を行う親個体（格子定数パラメータ及び原点ずれの組）を選択する。
ここで、Ｒｍａｘ，Ｒｍｉｎは、それぞれ第Ｎ世代のポピュレーションに属する個体の中で、前述の数３により算出される評価関数Ｒの最大値と最小値とである。
そして、交叉ステップＳ１０３では、親個体の選択にはルーレット選択を用いる。ルーレット選択とは、特定世代のポピュレーションからランダムに選ばれた個体がもつ適応度ρが、０〜１の範囲で生成される一様乱数の値より大きければ、親個体として採用するという選択法である。逆に、各個体の適応度ρの値が上記一様乱数よりも小さければ、他の個体を選んで同じ操作を繰り返し、選択された親個体が所定数になるまでこのような操作が続けられる。
さて、交叉ステップＳ１０３で行う交叉方法には幾つかの種類があり、交叉のために選択される親個体の数は交叉方法によって異なる。すなわち、パラメータを交換するタイプの１点交叉タイプ、２点交叉タイプ及び一様交叉タイプの三つのうちいずれかと、実数値のＧＡで使用されるブレンドタイプの交叉とのうち、どれかを行うことができる。この際、親個体の選択数は、１点・２点・一様交叉タイプの方式で交叉を行う場合には、２個体１組なので、使用者が設定した２Ｎｍ個でＮｍ組となが、一方、ブレンド交叉タイプの場合には、２個〜Ｎｂ個となる。
交叉ステップＳ１０３では、有機物の分子性結晶の良く見られる単斜晶系と三斜晶系とに対するパラメータ探索効率を改善するために、特殊な工夫がなされている。すなわち、格子定数パラメータ（ａ，ｂ，ｃ，α，β，γ）をそのまま交叉させるのではなく、図２０に示すように、パラメータの性質に応じた遺伝を考慮して、パラメータのグループ化を行っている。
たとえば、三斜晶系のグループ化では、平行６面体の１つの面を保存する。すなわち、単位格子のうち互いに並行ではない三つの面は、それぞれ２つの軸と一つの角度であらわすことができるから、この３つのパラメータを（ａ，ｂ，γ），（ｂ，ｃ，α），（ａ，ｃ，β）というふうに三つのグループに分ける。あるいは、単斜晶系であれば、四つ一組の格子定数（ａ，ｂ，ｃ，β）を、（ｂ，ｃ），（ａ，ｂ），（ａ，ｃ，β）というふうに三つのグループに分ける。
このようなグループ化の結果、親個体の平行六面体の３種類の面のうち１種類は子に遺伝することになる。
逆に、もしもこのようなグループ化を行わないと、どうなるかを思考実験してみれば、このグループ化のもつ意義が理解できる。たとえば、粉末試料に含まれる物質が三斜晶系であれば、（ａ，ｂ，ｃ，α，β，γ）の６パラメータのうち、図２１（ａ）〜（ｂ）に示すように、α，β，γを抽出してこれらの値を変更してしまうと、元の親個体とは全く形状の異なった平行６面体に相当する子個体となってしまう。そして、この平行６面体から計算される回折ピーク位置は、親個体のそれとは全く異なってしまい、たいへん不都合である。
なぜならば、一般的に言ってＧＡ（遺伝的アルゴリズム）では、親個体の遺伝子を子個体に伝えることによって解の探索性能を向上させているからである。したがって、この例のように、形状も回折ピーク位置も、親個体とは全く異なる平行６面体に相当する子個体が生成されてしまっては、ＧＡがもつ長所である探索効率の良さがすっかり損なわれてしまう。格子定数決定プロセスＰ１では、このような理由で交叉過程ではパラメータのグループ化が行われている。
したがって、交叉方式が１点・２点・一様タイプのうちいずれかである場合には、交叉ではグループ化されたパラメータのうち一つのグループは保存され、それ以外グループに属するパラメータだけが、両親（２つの親個体）の間で交換される。このようなグループ化が交叉過程で行われた場合には、三斜晶系の場合に可能な交叉の仕方は、図２２（ａ）〜（ｃ）に示す三つのパターンに限られ、単斜晶系の場合にも同様に、図２３（ａ）〜（ｃ）に示す三つのパターンに限られる。このような交叉が行われた結果、Ｎｍ組の親個体から２Ｎｍ個の子個体が生成される。
一方、交叉の仕方にブレンド交叉タイプを選んだ場合には、交叉はグループ化したパラメータを保存し、それ以外のパラメータを２〜Ｎｂ個の個体の平均値周りに一様乱数／正規乱数で発生させることにより行う。すなわち、子個体のパラメータＰｃは、次の数５に基づいて、親個体のパラメータＰｐとαと乱数とから算出される。
さて、ブレンド方式の交叉過程では、上記数５の操作が２Ｎｍ回繰り返され、２Ｎｍ個の子個体が生成される。
そして、交叉の方式に拘わらず、交叉過程で生成された全ての個体は、前述の一致度を示す評価関数Ｒ（数３参照）により評価される（評価ステップが行われる）。
（淘汰過程）
突然変異ステップＳ１０７では、当該第Ｎ世代のＮｐ個のパラメータと交叉過程により新たに生成された２Ｎｍ個の子個体とを合計したＮｐ＋２Ｎｍ個の個体から、次世代に残すＮｐ個の個体を選択する。その際の選択戦略としては、大きく分けて以下の２種類がある。
先ず一つめの選択戦略は、各個体の適応度ρを計算し、適応度の高い順にＮｐ個を選択するエリート戦略である。
一方、もう１つの選択戦略は、第Ｎ世代のＮｐ個のうち（Ｎｐ−２）個の個体を残し、残りの２個を、交叉で生成された２Ｎｍ個と交叉の親として選択した個体のうちの２個体とを合わせた２Ｎｍ＋２個体の中から選択する。その際、１個体を（２Ｎｍ＋２）個の個体の中で適応度が最も高い個体（最良個体）とし、もう１個体は最良個体を除いた２Ｎｍ＋１個体からルーレット選択により選択するという選択戦略である。
以上の二つの選択法のうちどちらを使用するかについては、本実施形態の「最適パラメータ探索プログラム」を使用する使用者が選択する。
（突然変異過程）
突然変異過程とは、生物の進化の過程で起こる突然変異を模した操作をＧＡに取り入れたものである。
本実施形態における格子定数決定プロセスＰ１では、Ｎｐ個の個体の中から、一様乱数によりＮｘ個の個体を変位対象として選択し、それらの個体に対して突然変異の操作を行う。選択された個体の格子定数と原点のずれパラメータを乱数で変化させる。
その際に、格子定数決定プロセスＰ１で前述したように、パラメータの遺伝を考慮して、三斜晶系では（ａ，ｂ，ｃ，α，β，γ）のうち１つのパラメータ、単斜晶系では（ａ，ｂ，ｃ，β）のうち１つのパラメータを選択し、その値を乱数と置き換える。また、原点のずれパラメータ（ｔ）は、常に乱数と置き換える。
そして、このような操作をＮｘ個の個体について繰り返し、突然変異によって作成された個体は、当該世代のポピュレーションのうち変異前の個体と置換される。したがって、この操作では世代の個体数Ｎｐは変化しない。
なお、突然変異の対象個体の個数Ｎｘの設定は、使用者が予め行っておく。
（複製過程）
複製ステップＳ１０４では、第Ｎ世代のポピュレーションについて、そのＮｐ個の個体がもつ全てのパラメータと評価関数値Ｒとを保存し、次の淘汰ステップＳ１０５（つまり淘汰過程ないし選択過程）の操作に送る。
（局所最適化過程）
局所最適化ステップＳ１０９は、７つのパラメータ（ａ，ｂ，ｃ，α，β，γ，ｔ）の値を非線形制約条件つきの最小自乗法により局所的に最適化する処理ステップである。すなわち、Ｎｐ個体のうちＮｎ個の個体を選択し、適応度ρについて局所最適化を行うのだが、これに伴う制約条件は、前述の第一世代発生時の制約に従う。
この際、局所最適化操作の対象とするＮｎ個の個体を選択する方法が特徴的であって、ルーレット選択により、常識とは逆に適応度の低い個体から選択する。その理由には二つあって、うち一つは、前述のように、既に適応度が高い個体は多峰性の多次元パラメータ空間中の落とし穴に陥っている可能性が小さくないことであり、今ひとつは適応度の低い個体の方が、以前に局所最適化されていない可能性が高く、局所最適化の効果が期待できることである。
もう一つ、局所最適化を行う個数Ｎｎには限定があって、ポピュレーションに含まれる個体数の１／１００以下とする。なぜならば、一回の局所最適化操作にかかる計算時間は、１回の評価関数計算と比較して、ふつう１０〜１００倍程度かかるので、それ以上に局所最適化の対象とする個体の数Ｎｎを増やしてしまうと、演算負荷が軽いというＧＡ本来の良さが損なわれてしまうからである。
局所最適化操作によって新たに作成された個体は、元の個体と入れ替られる。したがって、この操作でも当該世代のポピュレーションに含まれる個体数Ｎｐは変化しない。
なお、局所最適化操作を行う特定世代の頻度と、局所最適化操作の対象とする特定個体の個数Ｎｎとは、使用者が予め設定しておく。
（収束判定）
ハイブリッドＧＡの収束判定は、適応度としての評価関数の値が、使用者により入力された値を下回った場合に収束したもの判定とする。ただし、もし何時までも収束に至らなかった場合には、使用者が予め設定しておいた世代交代のサイクル回数で計算は終了し、その旨のメッセージが出力される。
５．基本構造決定プロセスでのＨＧＡ
（１）ＨＧＡの概要
次にこの節では、基本構造決定プロセスＰ４で用いられるＨＧＡについて、具体的に説明する。
すなわち、本実施形態の「ハイブリッドＧＡによる複数パラメータの最適化方法」は、再び図１９に示すように、大筋においては前述の格子定数決定プロセスＰ１で使用されるＨＧＡのプログラムを利用するものである。
ただし、大きく違う点としては、正解となる組合せを探索すべき複数パラメータは、前述のように（図１５（ａ）〜（ｃ）参照）、分子の位置（ｘ、ｙ、ｚ）および姿勢（θ，φ，ψ）ならびに当該分子内部の回転角（τｉ）である。また、各個体の適応度ρには、前述の数４中のＲをＲｗｐに置き換えた式をもって充てる。一方、細部の違いについては、次の項で明らかにする。
（２）ＨＧＡの詳細
本項では、再び図１９を参照しつつ、基本構造決定プロセスＰ４で用いられるＨＧＡについて、具体的に説明する。
（初期世代生成過程）
先ず初期世代設定ステップＳ１１では、初期世代のポピュレーションが、予め使用者が設定した個体数Ｎｐ個について、その記号列に相当する構造パラメータ一式を乱数を用いて発生させる。そして、発生された構造パラメータから個体数Ｎｐ個相当の構造モデルが作成されると、作成された構造モデルと、格子定数、空間群及び先に求められたプロファイルパラメータとを用いて、計算回折パターンが計算される。この計算回折パターンは、実験で得られた回折パターンとの信頼度因子Ｒｗｐ（数１参照）により評価される。すなわち、初期世代設定ステップＳ１１では、生成された個体数Ｎｐ個分の構造パラメータとそれらに対する信頼度因子Ｒｗｐとが計算される。
（交叉過程および評価過程）
交叉ステップＳ１０３では、前述のように、数４の右辺のうち一致度Ｒを信頼度因子Ｒｗｐに置き換えた式から求められた適応度ρを用いて、交叉を行う親個体を選択する。ここで、Ｒｍａｘ，Ｒｍｉｎはそれぞれ、Ｎ世代の個体の中で評価関数の最大と最小の値である。
親個体の選択戦略には、前述の格子定数決定プロセスＰ１と同様のルーレット選択法を用いている。一方、交叉の方式は、前述の１点交叉と一様交叉と、実数値のＧＡで使用されるブレンドタイプの交叉とのうちから、使用者によって予め指定されている。これらの交叉方式のそれぞれについては、格子定数決定プロセスＰ１の項で説明したものと同様である。
（淘汰過程、突然変異過程、局所最適化過程および収束判定）
淘汰ステップＳ１０５、淘汰ステップＳ１０５、局所最適化ステップＳ１０９および収束判定ステップＳ１１０は、それぞれ前述の格子定数決定プロセスＰ１の各ステップと同様のやり方で処理を行うステップである。
６．その他の実施例
本発明のその他の実施例として、本実施形態の「放射線回折データに基づく物質構造の推定方法」の格子定数決定プロセスＰ１によって、Ｐｄ（ｔｍｄｔ）_２の粉末試料からその格子定数（ａ，ｂ，ｃ，α，β，γ）を決定した。その結果、次の表５に例示するように、局所最適化がない普通のＧＡによる格子定数決定方法に比べて、本発明の中核となるＨＧＡを用いた格子定数決定プロセスＰ１では、格子定数決定の成功確率とそれに要した平均サイクル数（世代交代数）とにおいて、顕著な効果が確認された。
この表のうち左端近くの項目に「Ｎｎ＝１００（１０％）の場合」とあるは、本実施例による解析結果を示す。ただし、本実施例では前述の逆ルーレット選択はしておらず、特定世代のポピュレーションから特定個体を選択するには、ランダム方式で選択している。
本実施例での解析は、ＨＧＡでのサイクル数の制限値＝５０００回、ポピュレーションの個体数Ｎｐ＝１０００、交叉の数Ｎｍ＝５００、突然変異の数Ｎｘ＝５００（つまり十世代毎に一回の突然変異）、特定世代の出現頻度は世代交代毎に各世代で、局所最適化数（つまり特定個体の数）Ｎｎ＝１００（すなわちポピュレーションのうち１０％に局所最適化をかける）の条件下で行った。このようなＨＧＡによる格子定数の決定用プログラムにおいては、その成否が初期乱数、ＤＥＬＴＡの値に依存するために、その値を変化させてそれぞれの実測データに対して１０例の解析を行った。
その右隣に「Ｎｎ＝０場合（最小二乗なし）」とあるは、上記設定のＨＧＡから局所最適化操作をなくしてしまった単純なＧＡではどうなるか計算してみた比較例である。ＧＡによるこの比較例では、前述のＨＧＡによる実施例よりも二倍半ほど多いサイクル数（世代交代回数）で最適値への収束を見た。
さらにその右隣に「ＤＩＣＶＯＬ成否」とあるは、物質構造決定用の定番とも言えるフリープログラムによる解析結果を、先ほどとは別の比較例として提示したものである。すなわち、三斜晶でも適用可能なＬｏｕｅｒ＆Ｌｏｕｅｒ（固有人名）により開発されて公開されているプログラムＤＩＣＶＯＬ０４（固有のプログラム名）を用いて同じデータを解析した結果、格子定数を決定することはできなかった。なお、このフリープログラムによる回折データの解析方法は、いわゆる一定体積内での絨毯爆撃方式である。
その結果、本実施形態での格子定数決定プロセスＰ１によれば、全ての場合で解析に成功しているだけでなく、Ｐｄ（ｔｍｄｔ）_２の例のように、既存のＤＩＣＶＯＬプログラムでは得られない場合にも解が得られている。また、この二つの例では、パラメータのグループ化を行わない場合には、ＨＧＡでも解が得られなかった。さらに、局所最適化操作を行わなかった場合には、成功確率が落ちていたり収束に要したサイクル数（つまり世代交代数）が倍以上に増えていたりする。
このような比較から、本実施例の「物質構造推定プログラム」によれば、格子定数決定プロセスＰ１においても、只のＧＡや定番のフリープログラムに比べて明瞭に良好な計算結果が得られていることが分かる。
［発明の効果］
本発明の「放射線回折データに基づく物質構造の推定方法」や「物質構造推定プログラム」等によれば、単結晶を作ることが難しい物質であっても、その粉末試料にＸ線を照射して得た回折環の強度分布データから、その物質構造を決定することができるという効果がある。その結果、この方法によって医薬や素材などの新物質の構造が速やかに特定できるようになり、新物質の開発が飛躍的に加速されるので、各種産業や医療に関する研究開発に大きな福音がもたらされるものと期待される。
また、本発明の「ハイブリッドＧＡによる複数パラメータの最適化方法」や「パターンマッチングによるデータ解析方法」及び「最適パラメータ探索プログラム」等によれば、多峰性の多次元空間に於いて極めて強力な広域探索能力と精密な最適化能力とが発揮される。すなわち、本発明の各種プログラムやその搭載コンピュータ等によれば、実測データに対するパターンマッチングによって、従来よりも多数のパラメータをより精密かつ効率良く最適化または特定ないし推定することができるようになる。その結果、実測データに含まれる情報量が少なすぎたり、推定すべきパラメータの数が多すぎたり、複数パラメータの最適化に要求される精度が高すぎたりして、従来は実際上できなかった最適値決定やデータ解析に基づく判定までが可能になるという効果がある。

（新物質の研究開発）
本発明の「放射線回折データに基づく物質構造の推定方法」等は、前述のように放射線回折環から物質構造を決定する能力が大幅に向上しているので、物質設計、医薬品開発、ナノテクノロジー、液晶技術などの多くの産業分野で利用可能である。しかしながら、本願発明の中核的な技術的特徴をもつ「ハイブリッドＧＡ」は、以下に例示するように、さらに広い産業分野で利用可能である。
（データ解析）
すなわち、本発明の「ハイブリッドＧＡによる複数パラメータの最適化方法」や「最適パラメータ探索プログラム」および「パターンマッチングによるデータ解析方法」等は、前述のように実測データを解析する技術だけではなく、逆に最適設計を行う設計技術にも利用が可能である。
先ず、データマッチングによる実測データの解析技術としては、前述の実施形態のように、多数の物理量を精密に推定ないし決定することが代表的である。そして、その応用分野は、ソナーの音響解析、レーダーの反射像解析、地震波の伝搬による地殻構造解析や鉱脈探査など、極めて広いものと考えられる。
（最適設計）
逆に、これらの本発明を逆問題を解くレゾルバとして利用し、極めて多数の設計パラメータについて最適ないし適正な組合せを探索する設計技術（設計パラメータの最適化）に適用することも可能である。このような最適設計の技術分野としては、例えば航空機の翼型設計および主翼を含む機体の構造設計や、多段ロケットの最適設計問題、通信ネットワークの最適設計、打上ロケットや人工衛星などの宇宙機の軌道設計、空港騒音問題に考慮した航空機の最適経路問題などがある。
ここで、逆問題やそのレゾルバとはどういうものであるか具体的なイメージが湧くように、翼型設計を例にとって説明しよう。翼型設計における逆問題とは、所与の形状の翼型が二次元流中に置かれた場合に周囲の空気流を求めてその翼型の特性を求めるという順方向の問題ではなく、逆に希望する空力特性を発揮するためには翼型の形状をどう設計すれば良いかという問題である。これを解くためには、先ず適当な形状の翼型を初期形状として与えておき、その翼型の周囲の流れ場を算出したうえで、望みの空力特性に近づくように翼型の形状を変えていくという試行錯誤を繰り返して、徐々に翼型の形状を修正していく。そして、このような演算を行って解を求める演算手段のことを、逆問題のレゾルバという。
こうして、最終的に最も望ましい形状の翼型が得られるまで、何度でも翼型の形状を修正しては改めてその空力特性を求めるので、その演算量は膨大になる。それゆえ、このような逆問題においては、問題の設定が適当でなかったりそのレゾルバの能力が十分でないと、要求を満たす解としての翼型は現実的なコストや時間では求まらない。そこで、本発明の「最適パラメータ探索プログラム」をこのような逆問題のレゾルバに利用すれば、レゾルバの大幅な能力向上が見込めるので、従来は現実的な範囲で解けなかった逆問題を解くことができるようになる可能性がある。その結果、本発明の技術によって、最適設計の技術分野にも発展をもたらすことができるであろう。
（最適経営問題など）
さらに、本発明の中核をなすハイブリッドＧＡは、物理量に対応するか否かに拘わらず多数のパラメータを最適化に調整するうえで、計算負荷を劇的に低減することができるという効果がある。
それゆえ、現象のモデル化や適応度設定など克服すべき難しさは多いが、調整すべきパラメータが極めて多い最適経営問題にも、本発明の「最適パラメータ探索プログラム」などを適用することができる可能性がある。なお、ここでいう最適経営問題とは、たとえば会社が持つ各種の経営資源を如何に配分すると良いかとか、あるいは国家の各種資源をどう配分したら良いかといった一種の最適設計問題である。
（人工知能）
また、本発明の技術によれば、同様の理由で人工知能（ＡＩ）の一分野としてのＧＡが発揮する処理速度を加速し、その収束時間ないし学習時間を短縮することができるから、人工知能としてのＧＡにも新たな実用範囲が開ける可能性が生じる。
たとえば、幾つかの惑星をかすめて探査機を飛行（フライバイまたはスウィングバイ）させ、その惑星の重力を利用して軌道エネルギーを稼ぎ、併せて軌道要素を変えながら、次々に幾つもの惑星やその衛星の観測するという宇宙探査ミッションがある。しかし、その軌道設計には極めて多くの試行錯誤を要し、研究者に非人間的な努力を強いる場合が少なくない。そこで、ＧＡを使った人工知能によって最適パラメータ探索を行い、自動的に軌道設計させようというアイディアは既にあるが、本発明によればその探索時間を節約してミッション設計を容易にすることができる可能性がある。特に、惑星の衛星をも次々に観測していくミッションでは、衛星重力の影響をも受けるうえに、さらに制約条件が多くなって軌道設計の困難が予想されるので、本発明を利用して初めて設計可能になるミッションもあるものと想像される。
あるいは、理論的にはＧＡで解くことが可能でありながら、事象を表現するモデルが複雑になりパラメータが増えるなどして、その計算時間の制約から実用にならなかった問題に対しては、本発明のＨＧＡが有効な解決手段になる可能性がある。このような利用分野としては、例えば天気予報や株価予測などがある。すなわち、一週間後のことを予測するのに一ヶ月間の計算時間がかかっていては用をなさないが、１時間で解けるようになってしまえば有用だという場合があるからである。
（結論）
本発明のハイブリッドＧＡ技術を応用すれば、多峰性の強い広大なパラメータ空間内でも強力な広域探索能力を発揮することができるので、従来技術１や従来技術２などでは解けなかった問題をも解くことができるようになる。その結果、本発明は前述の実施形態で詳述した粉末試料のＸ線回折による物質構造の決定ばかりではなく、極めて広い産業分野でも利用可能であり、様々な分野で強力な最適値探索ツールとなりうる。

Claims

各個体を構成する記号列のうち少なくとも一部は、所定の物理量に対応した複数のパラメータであり、これらのパラメータの適正な組合せを探索することを目的として、
これらのパラメータがそれぞれ適度に分布した複数の前記個体を初期世代のポピュレーションとし、
各世代において、当該世代のポピュレーションのうち少なくとも新たに生成された前記個体である新生個体の適応度を評価する評価過程と、このポピュレーションのうち複数の前記個体を親個体としてこれら親個体の間で行う交叉により新しい子個体を生成する交叉過程と、次世代に残すべき複数の前記個体を選択して他の前記個体を淘汰する淘汰過程とを繰り返すうちに、
これらの個体のうち一部に変更を加える突然変異過程を適宜交えながら、世代交代を重ねて前記適応度がより良好な前記個体の発生を待ち、もって前記複数のパラメータの最適な組合せを探索する、
ＧＡ（遺伝的アルゴリズム）による複数パラメータの最適化方法において、
全世代のうち少なくとも一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち一部にあたる特定個体を対象に、局所最適化操作が行われる局所最適化過程を有することと、
前記特定個体には、当該特定世代の前記ポピュレーションのうち前記適応度が比較的低い前記個体の中からも指定される可能性があり、前記適応度がより低い個体の方が、より高い確率で前記特定個体に選定されることと、
を特徴とする、
ハイブリッドＧＡによる複数パラメータの最適化方法。
前記局所最適化過程は、前記全世代のうち一部にあたる前記複数の特定世代において、前記特定個体を対象に前記局所最適化操作を行う過程である、
請求項１に記載されたハイブリッドＧＡによる複数パラメータの最適化方法。
前記局所最適化操作の対象たる前記特定個体は、当該世代の前記ポピュレーションのうち一つの前記個体である、
請求項１に記載されたハイブリッドＧＡによる複数パラメータの最適化方法。
前記局所最適化過程が行われる前記特定世代は、前記全世代のうち少なくとも一部に散在している、
請求項１に記載されたハイブリッドＧＡによる複数パラメータの最適化方法。
前記特定世代が各前記世代のうちに出現する頻度は、前記全世代のうち前記世代が下る方が高く設定されている、
請求項１に記載されたハイブリッドＧＡによる複数パラメータの最適化方法。
前記特定世代は、前記全世代のうち少なくとも後半部で、所定の複数世代毎に周期的に出現する、
請求項１に記載されたハイブリッドＧＡによる複数パラメータの最適化方法。
前記特定世代の前記ポピュレーションのうち、前記適応度が比較的低い複数個の前記個体からなるグループをもって、劣等グループと呼ぶことにし、
前記特定個体は、この劣等グループの中から指定される、
請求項１に記載されたハイブリッドＧＡによる複数パラメータの最適化方法。
前記劣等グループは、前記ポピュレーションのうち前記適応度が低い方の所定数および所定割合のうち少なくとも一方に属する複数の前記個体からなるグループである、
請求項７に記載されたハイブリッドＧＡによる複数パラメータの最適化方法。
前記特定個体は、当該世代の前記劣等グループの中からルーレット選択法およびランダム選択法のうち一方により選択される、
請求項７に記載されたハイブリッドＧＡによる複数パラメータの最適化方法。
前記局所最適化過程は、前記特定世代の前記ポピュレーションの一部を前記特定個体として選び出して前記局所最適化操作を施す過程であり、
前記特定個体の選定に当たっては、前記適応度がより低い前記個体の方がより高い確率で選定されるという弱者優先の傾向を持つ、
請求項１に記載されたハイブリッドＧＡによる複数パラメータの最適化方法。
前記淘汰過程では、当該世代のポピュレーションのうち前記適応度が比較的低い前記個体であっても次世代に生き残る可能性がある選択戦略が採られる、
請求項１に記載されたハイブリッドＧＡによる複数パラメータの最適化方法。
前記淘汰過程で前記選択の際に採られるルールのことを選択戦略と呼ぶことにし、
この選択戦略は、
この適応度とは関わりなく無作為に前記個体が選択されるランダム戦略と、
この適応度が比較的低い前記個体が優先的に選択される逆エリート戦略と、
この適応度が比較的低い前記個体の方が選択される確率が高くなる逆ルーレット戦略と、
この適応度が比較的低い前記個体の方が優先的に選択されるようにした逆期待値方式、逆ランク方式および逆トーナメント方式とのうち何れかと、
のうちいずれかである、
請求項１に記載されたハイブリッドＧＡによる複数パラメータの最適化方法。
当該世代の前記ポピュレーションのうち前記適応度が最高である前記個体をトップ個体と呼ぶことにし、
当該世代からその次世代に世代交代する際に、このトップ個体は必ず生き残るというトップ保存戦略が併用される、
請求項１１および請求項１２のうち少なくとも一方に記載されたハイブリッドＧＡによる複数パラメータの最適化方法。
各世代のポピュレーションを形成する個体のそれぞれは、所定の物理量に対応した複数のパラメータを含む記号列からなり、これらのパラメータがある程度の多様性をもって分布した初期世代から所定のルールで世代交代を重ねるうちに、より高い適応度をもつ前記個体が生成されることをもって、前記複数のパラメータの最適化を図るＧＡ（遺伝的アルゴリズム）による複数パラメータの最適化方法において、
全世代のうち少なくとも一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち一部にあたる特定個体を対象に、局所最適化操作が行われることと、
前記特定個体には、当該特定世代の前記ポピュレーションのうち前記適応度が比較的低い前記個体の中からも指定される可能性があり、前記適応度がより低い個体の方が、より高い確率で前記特定個体に選定されることと、
を特徴とする、
ハイブリッドＧＡによる複数パラメータの最適化方法。
請求項１〜請求項１４のうちいずれかに記載された「ハイブリッドＧＡによる複数パラメータの最適化方法」において、
各前記個体がもつ前記適応度は、当該個体の前記記号列に含まれる前記複数のパラメータに対応する前記物理量を仮定すると数値演算により決まる仮想データのパターンが、実測データのパターンとどの程度一致しているかを示す指標であり、
この適応度が高い前記個体を生成することによって、当該個体の前記仮想データと前記実測データとの間でパターンマッチングを行い、前記物理量を推定することを目的として前記実測データの解析を行うことを特徴とする、
パターンマッチングによるデータ解析方法。
請求項１〜請求項１４のうちいずれかに記載された「ハイブリッドＧＡによる複数パラメータの最適化方法」を、所定の試料物質に照射された放射線が形成する回折パターンに基づいてこの試料物質の構造を推定する物質構造の推定方法に応用し、
前記物理量のうち少なくとも一部は、この試料物質の物質構造を決定する構造パラメータであって、
各前記個体の前記適応度は、この試料物質が当該個体に相当するこれらの構造パラメータをもつと仮定すると生じる回折パターンが、実測された前記回折パターンに対してどの程度一致しているかを示す指標であることを特徴とする、
放射線回折データに基づく物質構造の推定方法。
前記構造パラメータとは、
前記試料物質の結晶構造を規定する格子定数と、
この試料物質を構成する分子内における三次元的な原子配列を規定する分子構造パラメータと、
この分子内での確率的な電子密度分布を規定する電子密度分布パラメータと、
この試料物質の結晶内での三次元的な原子配列を規定する結晶学的構造パラメータと、
のうち少なくとも一つである、
請求項１６に記載された放射線回折データに基づく物質構造の推定方法。
前記回折パターンは、その回折強度が同心円状に拡がって分布する回折環である、
請求項１６に記載された放射線回折データに基づく物質構造の推定方法。
前記適応度は、前記回折環がもつ半径方向への強度分布の実測データと、仮定された前記構造パラメータに基づいて生成される仮定データとが、どの程度一致しているかを示す評価関数である、
請求項１８に記載された放射線回折データに基づく物質構造の推定方法。
複数の結晶を含む粉末試料、多結晶集合体である多結晶試料、非晶質（アモルファス）試料および溶液試料のうち少なくとも一つである試料物質の構造を特定するために、
この試料物質に照射された放射線の回折によってもたらされる回折環の強度分布を示す回折データに基づき、この試料物質がもつ物質構造を示すいずれかの構造パラメータをデータマッチングにより推定するアルゴリズムとして、
前記構造パラメータがコーディングされた個体を、ある程度の多様性を持たせて複数個発生させ、初期世代のポピュレーションとする発生過程の後に、これらの個体の交叉および複製と、前記データマッチングの程度を示す適応度を評価してこれらの個体を淘汰する選択と、確率的に起こる突然変異とを繰り返す世代交代過程を行うＧＡ（遺伝的アルゴリズム）を使用する、
放射線回折データに基づく物質構造の推定方法において、
前記ＧＡでは、
前記世代交代過程の間に複数の世代において、当該ポピュレーションの一部である前記個体に対して局所最適化操作が行われることと、
この局所最適化操作の対象には、当該ポピュレーションのうち前記適応度が比較的低い前記個体もなる可能性があり、むしろ前記適応度がより低い個体の方が、より高い確率で当該操作対象に選定されることとを特徴とする、
放射線回折データに基づく物質構造の推定方法。
放射線を試料物質に照射して得られた回折環の強度分布データに基づき、この強度分布データに適合する物質構造を特定するために、
この試料物質に含まれる結晶の格子定数を決定する格子定数決定プロセスと、
この強度分布データに含まれているバックグラウンド散乱の影響を除去ないし低減する背景散乱除去プロセスと、
この結晶が属する空間群の候補を絞り込む空間群絞り込みプロセスと、
この結晶の基本構造を初期的に決定して、この空間群を一つに特定する基本構造決定プロセスと、
この基本構造を精密化して、この結晶を構成する物質の構造をより精密に決定する構造精密化プロセスとのうち、
少なくとも、この格子定数決定プロセスと、この空間群絞り込みプロセスと、この基本構造決定プロセスとを有し、
この格子定数決定プロセスおよびこの基本構造決定プロセスのうち少なくとも一方で、ＧＡ（遺伝的アルゴリズム）に局所最適化操作を組み合わせたハイブリッドＧＡを利用した物質構造決定が行われる、
放射線回折データに基づく物質構造の推定方法であることを特徴とし、
前記ハイブリッドＧＡでは、世代交代の間に複数の特定世代で、当該世代のポピュレーションのうち一部の個体である特定個体を対象にして前記局所最適化操作が行われ、
この特定個体には、当該世代のポピュレーションのうちでは実測データとの一致度を示す適応度が比較的低い劣等グループからも選定される可能性があることを、さらに特徴とする、
放射線回折データに基づく物質構造の推定方法。
所定の物理量に対応した複数のパラメータの適正な組合せを探索する機能を、所定のコンピュータに発揮させるべきコンピュータ・プログラムにおいて、
請求項１〜請求項１３のうちいずれかの請求項に記載された「ハイブリッドＧＡによる複数パラメータの最適化方法」を実行するために、
当該請求項に記載された前記初期世代の前記ポピュレーションの生成および読込のうち一方を行う初期世代設定ステップと、
当該請求項に記載された前記評価過程、前記淘汰過程、前記交叉過程、前記突然変異過程および前記局所最適化過程のそれぞれに対応する各演算ステップ（すなわち、評価ステップ、淘汰ステップ、交叉ステップ、突然変異ステップおよび局所最適化ステップ）とを有することを特徴とする、
コンピュータにより実行可能な最適パラメータ探索プログラム。
所定の物理量に対応した複数のパラメータの適正な組合せを探索する機能を、所定のコンピュータに発揮させるべきコンピュータ・プログラムにおいて、
各世代のポピュレーションを形成する個体のそれぞれは、前記所定の物理量に対応した前記複数のパラメータを含む記号列からなり、これらのパラメータがある程度の多様性をもって分布した初期世代から所定のルールで世代交代を重ねるうちに、より高い適応度をもつ前記個体が生成されることをもって、前記複数のパラメータの最適化を図るＧＡ（遺伝的アルゴリズム）の中に、
前記適応度に関する局所最適化操作を所定の前記個体に対して行う局所最適化ステップが組み込まれており、
この局所最適化ステップは、前記ＧＡで生成される全世代のうち少なくとも一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち一部にあたる特定個体を対象にする演算ステップであることと、
この局所最適化ステップにおいて、前記特定個体には、当該特定世代の前記ポピュレーションのうち前記適応度が比較的低い前記個体の中からも指定される可能性があり、前記適応度がより低い個体の方がより高い確率で前記特定個体に選定されることとを特徴とする、
コンピュータにより実行可能な最適パラメータ探索プログラム。
複数のパラメータの適正な組合せを探索する機能を、所定のコンピュータに発揮させるべきコンピュータ・プログラムにおいて、
各世代のポピュレーションを形成する個体のそれぞれは、前記複数のパラメータに対応した記号列を含んでおり、これらのパラメータがある程度の多様性をもって分布した初期世代のポピュレーションから始めて、所定のルールで世代交代を重ねるうちに、より高い適応度をもつ前記個体が生成されることによって前記複数のパラメータの最適化を図るＧＡ（遺伝的アルゴリズム）の中に、
前記適応度に関する局所最適化操作を所定の前記個体に対して行う局所最適化ステップが組み込まれており、
この局所最適化ステップは、前記ＧＡで生成される全世代のうち少なくとも一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち一部にあたる特定個体を対象にする演算ステップであることと、
この局所最適化ステップにおいて、前記特定個体は、当該特定世代の前記ポピュレーションのうち前記適応度が比較的低い前記個体の中からも指定される可能性があり、前記適応度がより低い個体の方が、より高い確率で前記特定個体に選定されることとを特徴とする、
コンピュータにより実行可能な最適パラメータ探索プログラム。
所定の試料に照射された放射線が形成する回折パターンに基づいて当該試料を構成する物質の構造を規定する構造パラメータを推定する機能を、所定のコンピュータに発揮させるべきコンピュータ・プログラムにおいて、
前記回折パターンの実測データを数値的に読み込む実測データ読込ステップと、
請求項２２に記載された「最適パラメータ探索プログラム」が有する前記初期世代設定ステップ、前記評価ステップ、前記淘汰ステップ、前記交叉ステップ、前記突然変異ステップおよび前記局所最適化ステップを有し、
前記適応度は、前記各個体の前記記号列に相当する仮定された前記構造パラメータから算出される前記回折パターンの予想値が、前記回折パターンの実測値に対してどの程度一致するかを示す指数であることを特徴とする、
コンピュータにより実行可能な放射線回折データに基づく物質構造推定プログラム。
所定の試料に照射された放射線が形成する回折パターンに基づいて、当該試料を構成している物質の構造を規定する構造パラメータを推定する機能を、所定のコンピュータに発揮させるべきコンピュータ・プログラムにおいて、
各世代のポピュレーションを形成する複数個の個体のそれぞれは、前記構造パラメータに対応する記号列を含んでおり、
これらの個体のそれぞれがもつ適応度は、当該個体に対応したこの構造パラメータから算出される回折パターンの予想値が、前記回折パターンの実測値とどの程度一致するかを示す指標であって、
この構造パラメータの各要素がある程度の多様性をもって分布するように、これらの個体を生成して初期世代ポピュレーションとする生成ステップをもち、
この初期世代ポピュレーションから淘汰ステップ、交叉ステップおよび突然変異ステップを含む所定の手順に従って世代交代を重ねるうちに、当該世代ポピュレーションの中にこの適応度がより高い前記個体が生成されることを待ち、もって前記構造パラメータの最適化を図るＧＡ（遺伝的アルゴリズム）の中に、
前記適応度に関する局所最適化操作を所定の前記個体に対して行う局所最適化ステップが組み込まれており、
この局所最適化ステップは、前記ＧＡで生成される全世代のうち少なくとも一部にあたる複数の特定世代において、当該世代の前記ポピュレーションのうち一部にあたる特定個体を対象にする演算ステップであることと、
この局所最適化ステップにおいて、前記特定個体には、当該特定世代の前記ポピュレーションのうち前記適応度が比較的低い前記個体の中からも指定される可能性があり、前記適応度がより低い個体の方が、より高い確率で前記特定個体に選定されることとを特徴とする、
コンピュータにより実行可能な放射線回折データに基づく物質構造推定プログラム。
請求項２２〜請求項２４のうちいずれかに記載された「最適パラメータ探索プログラム」と、
請求項２５および請求項２６のうち一方に記載された「放射線回折データに基づく物質構造推定プログラム」とのうち、
少なくとも一方が記録されていることを特徴とする、
コンピュータ読み取り可能な記録媒体。
請求項２２〜請求項２４のうちいずれかに記載された「最適パラメータ探索プログラム」と、
請求項２５および請求項２６のうち一方に記載された「放射線回折データに基づく物質構造推定プログラム」とのうち、
少なくとも一方がインストールされていることを特徴とする、
ハイブリッドＧＡ搭載コンピュータ。
請求項２２〜請求項２４のうちいずれかに記載された「最適パラメータ探索プログラム」と、
請求項２５および請求項２６のうち一方に記載された「放射線回折データに基づく物質構造推定プログラム」とのうち、
少なくとも一方を実行可能なことを特徴とする、
ハイブリッドＧＡを搭載した解析装置。
所定の試料物質に放射線を照射して、この試料物質から生じる回折パターンを測定する測定装置と、
この回折パターンから得られた実測データに基づいた解析を行うことにより、当該試料物質の構造を推定する請求項２８記載のコンピュータおよび請求項２９記載の解析装置のうち一方と、
を有することを特徴とする、
放射線回折パターンによる物質構造推定装置。