JP2014071742A - 生物濃縮倍率の予測装置、予測方法及びプログラム - Google Patents

生物濃縮倍率の予測装置、予測方法及びプログラム Download PDF

Info

Publication number
JP2014071742A
JP2014071742A JP2012218314A JP2012218314A JP2014071742A JP 2014071742 A JP2014071742 A JP 2014071742A JP 2012218314 A JP2012218314 A JP 2012218314A JP 2012218314 A JP2012218314 A JP 2012218314A JP 2014071742 A JP2014071742 A JP 2014071742A
Authority
JP
Japan
Prior art keywords
bioconcentration
parameter
magnification
value
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012218314A
Other languages
English (en)
Inventor
Yasuhei Mori
保平 茂理
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2012218314A priority Critical patent/JP2014071742A/ja
Publication of JP2014071742A publication Critical patent/JP2014071742A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】LogPに依存せずに高精度で生物濃縮倍率を予測することができる生物濃縮倍率の予測方法、予測装置及びプログラムを提供する。
【解決手段】生物濃縮倍率(BCF)と、分子サイズパラメータ、分子表面積と分子表面電子密度との組合せによる複合パラメータ及びカルボニル基の電荷パラメータを含む複数のパラメータと、を含む判別式を設定する設定手段と、BCFが既知の複数の既知化学物質の構造式情報に基づいて、BCF値と複数のパラメータ値との組を複数組含むトレーニングセットを生成する生成手段と、トレーニングセットを用いた重回帰解析により判別式に基づいて相関式を決定する決定手段と、BCFが未知の未知化学物質の構造式情報に基づいて複数のパラメータ値を取得し、取得されたパラメータ値を決定された相関式に代入してBCFの予測値を算出する算出手段と、を有する生物濃縮倍率の予測装置とする。
【選択図】なし

Description

本発明は、生物濃縮倍率の予測装置、予測方法及びプログラムに関する。
日本において事業者は新規化学物質の製造または輸入の際に、化学物質の審査および製造等の規制に関する法律(化審法)により事前の届出が必要である。現行の化審法では、まず生分解性試験を行い、生分解性試験の結果、難分解性および部分分解性のものについては濃縮度試験を行う必要がある。
一般的な濃縮度試験法においては魚類を試験水槽内に飼育し、試験水槽へ化学物質の原液を28日間以上連続的に送液し、魚類を化学物質に暴露する。暴露期間中に魚体内に蓄積された化学物質を定量し、化学物質の魚体内濃度を水槽中濃度で除することにより生物濃縮倍率が求められる。
濃縮度試験の結果得られる生物濃縮倍率は化学物質の魚体内への蓄積性の指標である。環境中に蓄積性の高い化学物質が放出された場合、河川等に生息する魚体内に蓄積し、さらに食物連鎖を通してヒトを含む高次の生物の体内にも蓄積することとなる。そのため蓄積性は化学物質の環境への影響を評価する上で重要な特性であり、蓄積性が高い化学物質については製造または輸入が認められない。
また、化審法施行以前に製造または輸入が行われていた物質(約2万物質)は、既存化学物質と称され国が有害性試験を実施しているが、既存化学物質の数は膨大であり、また濃縮度試験の実施には多くの時間と労力を要する。したがって構造活性相関の手法を用いて化学物質の化学構造から生物濃縮倍率が予測することができれば、事業者にとっては新規化学物質開発の効率化が図れ、国にとっては既存化学物質点検の加速化が期待できる。更に、近年の動物愛護の意識の高まりから、不要な試験の実施を削減するため、構造活性相関により生物濃縮倍率を予測する手法が注目されている。
これまで化学物質の生物濃縮倍率を予測するための予測手法がいくつか開発されており、一部の予測システムはホームページで無料公開されている。代表的な予測システムとしては、EPA-USのBCFWIN(非特許文献1参照)、化学物質評価研究機構の濃縮性予測システム(非特許文献2参照)が挙げられる。また、市販のソフトウェアとして、富士通九州システムズ社のADMEWORKS Predictor(非特許文献3参照)が提供されている。
これら従来の予測方法では、化学物質のLogP(オクタノール−水分配係数)を指標として生物濃縮倍率を予測している。例えば、非特許文献1に記載の手法では、予測対象の化学物質によりLogPとの比例相関式、反比例相関式等、複数の相関式を使い分け、さらに化学物質が持つ官能基により、経験的に定めた補正値を加えることで生物濃縮倍率を予測している。非特許文献2に記載の手法でも、同様に、LogPとの比例相関式により生物濃縮倍率を予測している。また、非特許文献3に記載の手法では、LogPとハロゲン原子に関するパラメータ等を使用し重回帰式により生物濃縮倍率を予測している。
一方、特許文献1には、分子表面積、分子容積、分子形状パラメータ、分子軌道法パラメータ、電子情報パラメータ等を使用し、化学物質の物性予測をする方法が開示されている。生物濃縮倍率の予測に関しては開示されていない。特許文献2には、重回帰分析とアウトライヤーサンプルを識別する判別関数による2クラス分類により多様な化学物質の物性予測方法が開示されている。しかしながら、生物濃縮倍率の予測を主目的とするものではなく、生物濃縮倍率の予測を左右するパラメータの種類及び相関式については言及されていない。
WO2009/025045号公報 WO2008/126209号公報 特開2007−257084号公報 特開2003−036412号公報
W. M. Meylan, P. H. Howard, R. S. Boethling, D. Aronson, H. Printup, S, Gouchie ‘Improved Method for Estimating Bioconcentration/Bioaccumulation Factor from Octanol/Water Partition Coefficient’, Environmental Toxicology and Chemistry. 1999, Vol.18, No.4, 664-672 財団法人化学物質評価研究機構 濃縮性予測システム 株式会社富士通九州システムズ ADMEWORKS Predictor
LogPを指標とする従来の予測方法は、予測精度が約5割から約7割にとどまる。LogPの計算方法としてはフラグメント法、Moriguchi法等いくつかの計算方法があるが、特に分子が大きく複雑な構造の化学物質ほど正確に計算することは難しく、異なる計算方法では全く異なる計算結果となることがある。また、脂溶性の高い化学物質のLogPを実測することは極めて困難である。これらLogP値の不正確さに起因して従来の予測方法の予測精度が制限されると考えられる。
本発明は上記事情に鑑みなされたものであり、本発明の目的は、LogPに依存せずに高精度で生物濃縮倍率を予測することができる生物濃縮倍率の予測装置、予測方法及びプログラムを提供することにある。
上記目的を達成するために請求項1に記載の発明は、生物濃縮倍率と、分子サイズパラメータ、分子表面積と分子表面電子密度との組合せによる複合パラメータ及びカルボニル基の電荷パラメータを含む複数のパラメータと、を含む判別式を設定する設定手段と、生物濃縮倍率が既知の複数の既知化学物質の構造式情報に基づいて、生物濃縮倍率値と複数のパラメータ値との組を複数組含むトレーニングセットを生成する生成手段と、前記トレーニングセットを用いた重回帰解析により前記判別式に基づいて相関式を決定する決定手段と、生物濃縮倍率が未知の未知化学物質の構造式情報に基づいて複数のパラメータ値を取得し、取得されたパラメータ値を決定された相関式に代入して生物濃縮倍率の予測値を算出する算出手段と、を有する生物濃縮倍率の予測装置である。
請求項10に記載の発明は、生物濃縮倍率と、分子サイズパラメータ、分子表面積と分子表面電子密度との組合せによる複合パラメータ及びカルボニル基の電荷パラメータを含む複数のパラメータと、を含む判別式を設定し、生物濃縮倍率が既知の複数の既知化学物質の構造式情報に基づいて、生物濃縮倍率値と複数のパラメータ値との組を複数組含むトレーニングセットを生成し、前記トレーニングセットを用いた重回帰解析により前記判別式に基づいて相関式を決定し、生物濃縮倍率が未知の未知化学物質の構造式情報に基づいて複数のパラメータ値を取得し、取得されたパラメータ値を決定された相関式に代入して生物濃縮倍率の予測値を算出する、生物濃縮倍率の予測方法である。
請求項11に記載の発明は、生物濃縮倍率を予測するためのプログラムであって、コンピュータを、生物濃縮倍率と、分子サイズパラメータ、分子表面積と分子表面電子密度との組合せによる複合パラメータ及びカルボニル基の電荷パラメータを含む複数のパラメータと、を含む判別式を設定する設定手段と、生物濃縮倍率が既知の複数の既知化学物質の構造式情報に基づいて、生物濃縮倍率値と複数のパラメータ値との組を複数組含むトレーニングセットを生成する生成手段と、前記トレーニングセットを用いた重回帰解析により前記判別式に基づいて相関式を決定する決定手段と、生物濃縮倍率が未知の未知化学物質の構造式情報に基づいて複数のパラメータ値を取得し、取得されたパラメータ値を決定された相関式に代入して生物濃縮倍率の予測値を算出する算出手段と、して機能させるためのプログラムである。
生物濃縮倍率の予測装置、予測方法及びプログラムは、更に下記の要件を備えていてもよい。前記複数のパラメータが2以上の複合パラメータを含んでいてもよい。前記複数のパラメータが水素結合パラメータを更に含んでいてもよい。前記分子サイズパラメータがモル屈折率であることが好ましい。
生物濃縮倍率値の信頼性を示す予め定めた基準に基づいて、生物濃縮倍率が既知の複数の既知化学物質から前記トレーニングセットの生成に使用する複数の既知化学物質を抽出する抽出手段を更に有し、前記生成手段が、抽出された複数の既知化学物質の構造式情報に基づいてトレーニングセットを生成するようにしてもよい。
この場合の前記基準が下記(1)〜(7)の少なくとも1つを要件とする。
(1) 生物濃縮倍率値が定量的に取得されていること
(2) 既知化学物質が水中で安定であること
(3) 生物濃縮倍率値を取得したときの暴露濃度の実測値が設定値に対して70%以上であること
(4) 生物濃縮倍率値を取得したときの暴露期間が4週間以上であること
(5) 既知化学物質の化学構造が明確であること
(6) 既知化学物質の分子量が600以下であること
(7) 生物濃縮倍率値が暴露期間中に連続して取得された3つ以上の実測値の平均値であること
前記生物濃縮倍率の予測値を算出する前に、前記決定手段で決定された相関式が予測性能を有するか否かの検定を行う検定手段を更に有し、相関式が予測性能を有しない場合には、前記設定手段が前記判別式を再設定するようにしてもよい。
前記判別式が、生物濃縮倍率の対数を目的変数とし且つ複数のパラメータを説明変数とするようしてもよい。前記判別式を下記式(1)としてもよい。


上記式(1)において、LogBCFは生物濃縮倍率(BCF)の10を底とする対数を表す。Cは定数を表し、a〜aの各々は係数を表す。X〜Xの各々は分子サイズパラメータ、分子表面積と分子表面電子密度との組合せによる複合パラメータ、カルボニル基の電荷パラメータ及び水素結合パラメータのいずれかを表す。x1bar〜xnbarの各々は複数の既知化学物質内でのパラメータ値の平均値を表す。S〜Sの各々は複数の既知化学物質のパラメータ値の標準偏差を表す。
本発明によれば、LogPに依存せずに高精度で生物濃縮倍率を予測することができる。
本発明の実施の形態に係る予測装置を含む生物濃縮倍率の予測システムの構成を示す概略図である。 本発明の実施の形態に係る予測装置の制御系の構成を示すブロック図である。 本発明の実施の形態に係る生物濃縮倍率の予測プログラムの処理ルーチンを示すフローチャートである。 「相関式の決定処理」の処理ルーチンを示すフローチャートである。 「パラメータ種Xの設定処理」の処理ルーチンを示すフローチャートである。 (A)及び(B)はパラメータの設定画面を示す模式図である。 「相関式の検定処理」の処理ルーチンを示すフローチャートである。
以下、図面を参照して本発明の実施の形態の一例を詳細に説明する。
<生物濃縮倍率の予測装置>
(予測システム)
まず、本実施の形態に係る予測システムの一例について説明する。
図1は本発明の実施の形態に係る予測装置を含む生物濃縮倍率の予測システムの構成を示す概略図である。図1に示すように、生物濃縮倍率(BCF:Bio-Concentration Factor)予測システム10は、BCF予測装置20及び化学物質DBサーバ40を備えている。BCF予測装置20及び化学物質DBサーバ40は、通信回線50により互いに接続されている。
BCF予測装置20は、生物濃縮倍率の予測装置として機能する端末装置である。BCF予測装置20は、コンピュータ等の情報処理装置及び周辺装置で構成されている。なお、詳細な構成については後述する。化学物質DBサーバ40は、化学物質のデータを管理するデータベースサーバである。化学物質DBサーバ40は、コンピュータ等の情報処理装置で構成されている。通信回線50は、LANやインターネット等の有線または無線で通信を行うことが可能な通信回線である。なお、BCF予測システムの構成は一例であり、これに限定されるものではない。
上記のBCF予測システム10では、BCF予測装置20は、化学物質DBサーバ40からBCFが既知の複数の化学物質の構造式情報を取得して、取得された構造式情報に基づいてトレーニングセットを生成する。後述する通り、予測精度を高めるためには、BCF(実測値)の信頼性が高い化学物質を抽出して、抽出された化学物質の構造式情報に基づいてトレーニングセットを生成することが好ましい。BCF予測装置20は、生物濃縮倍率と特定パラメータとを含む判別式を設定し、トレーニングセットを用いた重回帰解析により判別式から相関式を決定する。次に、BCF予測装置20は、BCFが未知の化学物質の構造式情報からパラメータ値を取得し、取得されたパラメータ値を決定された相関式に代入して生物濃縮倍率(BCF)の予測値を算出する。
(予測装置)
次に、BCF予測装置20の構成について説明する。
図2は本発明の実施の形態に係る予測装置の制御系の構成を示すブロック図である。図2に示すように、BCF予測装置20は、制御部22、マウスやキーボード等の情報取得部24、ディスプレイ等の情報出力部26、外部装置と通信を行うためのインターフェースとして機能する通信部28、及びハードディスク等の記憶部30を備えている。
制御部22は、CPU(中央処理装置; Central Processing Unit)22A、各種プログラムを記憶したROM(Read Only Memory)22B、プログラムの実行時にワークエリアとして使用されるRAM(Random Access Memory)22C、各種情報を記憶する不揮発性メモリ22D、及び入出力インターフェース(I/O)22Eを備えている。CPU22A、ROM22B、RAM22C、不揮発性メモリ22D、及びI/O22Eの各々は、バス22Eを介して互いに接続されている。
情報取得部24、情報出力部26、通信部28及び記憶部30の各部は、制御部22のI/O22Eに接続されている。制御部22は、情報取得部24、情報出力部26、通信部28及び記憶部30の各部を制御すると共に、各種の演算を行う。本実施の形態では、後述する「BCF予測処理」を実行するためのBCF予測プログラム32が、記憶部30に予め記憶されている。また、本実施の形態では、化学物質の構造式情報から各種パラメータ値を生成するパラメータ生成プログラム34も、記憶部30に予め記憶されている。パラメータ生成プログラム34としては、例えば、株式会社富士通九州システムズ社製の「ADMEWORKS ModelBuilder Version 4.5.22(以下、「ModelBuilder」と略称する場合がある。)」等、パラメータ生成機能を有する市販のソフトウェア(アプリケーション・プログラム)を使用することができる。
予め記憶されたプログラムは、CPU22Aにより記憶部30から読み出されて実行される。なお、各プログラムは、ROM22D等の他の記憶装置に記憶されていてもよい。また、各プログラムは、通信部28を介して外部装置から通信により取得されてもよい。
また、BCF予測装置20は、情報取得部24として各種ドライブを備えていてもよい。各種ドライブは、フレキシブルディスク、光磁気ディスク、CD−ROMなどのコンピュータ読み取り可能な可搬性の記録媒体からデータを読み込んだり、記録媒体に対してデータを書き込んだりする装置である。各種ドライブを備える場合には、可搬性の記録媒体にプログラムを記録しておいて、これを対応するドライブで読み込んで実行してもよい。
<生物濃縮倍率の予測方法/プログラム>
(予測プログラム)
次に、BCF予測プログラムについて説明する。BCF予測プログラムが実行されることで、BCF予測装置20において予測処理動作が実施される。図3は本発明の実施の形態に係る生物濃縮倍率の予測プログラムの処理ルーチンを示すフローチャートである。図2を参照して説明した通り、BCF予測プログラム32は、BCF予測装置20のCPU22Aにより記憶部30から読み出されて実行される。また、BCF予測プログラム32は、情報取得部24を介してユーザにより「予測開始」が指示されると開始される。
まず、ステップ100で「相関式の決定処理」を実行する。「相関式の決定処理」により、生物濃縮倍率と特定パラメータとの相関関係を記述した相関式が決定される。予測精度の高い相関式を得るためには、生物濃縮倍率に特に影響を与える特定パラメータを使用することが極めて重要である。本実施の形態では、特定パラメータとして、分子サイズパラメータ、分子表面積と分子表面電子密度との組合せによる複合パラメータ、及びカルボニル基の電荷パラメータを用いる。また、水素結合パラメータを、特定パラメータに含めてもよい。なお、「相関式の決定処理」及び「特定パラメータ」の詳細については後述する。
相関式は、例えば下記式(1)で表される。本実施の形態では、下記式(1)を相関式として用いる場合について説明する。なお、下記式(1)は、重回帰解析に用いる場合は「判別式」と称される。

詳細は後述するが、上記式(1)において、Cは定数を表し、a〜aの各々は係数を表す。X〜Xの各々は、分子サイズパラメータ、分子表面積と分子表面電子密度との組合せによる複合パラメータ、カルボニル基の電荷パラメータ及び水素結合パラメータのいずれかのパラメータを表す。X〜Xの各々は独立変数である。パラメータX〜Xの各々に対応するパラメータ値はx〜xと小文字で表す。
なお、上記式(1)において、x1bar〜xnbarの各々は複数の既知化学物質内でのパラメータ値の平均値を表す。S〜Sの各々は複数の既知化学物質内でのパラメータ値の標準偏差を表す。なお、n個のX〜Xの各々を区別する必要が無い場合は、パラメータXと総称する。x〜x、a〜a、x1bar〜xnbar、S〜Sについても同様に、パラメータ値x、係数a、平均値xbar、標準偏差Sと総称する。なお、「xbar」は下記に示すように、xに上線を付した平均値の表記と同じものである。

上記式(1)では、生物濃縮倍率を求める際に、パラメータ値xから平均値xbarを引き、標準偏差Sで除することにより標準化を行っている。各パラメータは数値の大きさにおいて異なる規模を有する。標準化を行うことにより、各パラメータが生物濃縮倍率の決定に与える影響が正規化される。
次に、ステップ102で、BCFが未知の化学物質(以下、「予測対象物質」という。)の構造式情報を取得する。化学物質の構造式情報は、2次元情報及び3次元情報のいずれでもよい。また、化学物質の構造式情報は、描画入力により取得されてもよく、ファイル入力により取得されてもよい。また、BCFが未知の既存化学物質については、CAS番号等の識別番号で構造式情報を特定することもできる。
次に、ステップ104で、図2に示したパラメータ生成プログラム34により、取得された構造式情報から予測対象物質についてパラメータ値xを生成する。例えば、分子サイズパラメータとして「モル屈折率(Molar refractivity:Mref)」、複合パラメータとして「Weighted positive charged partial surface area3:WPSA」、カルボニル基の電荷パラメータとして「Average charge on carbonyl carbons:Carb」を用いた場合には、Mref、WPSA、Carbの各パラメータについて具体的な数値が生成される。
次に、ステップ106で、取得されたパラメータ値xを決定された相関式(上記式(1))に代入して、生物濃縮倍率(BCF)を算出する。LogBCFを算出してからBCFに換算してもよく、BCFを直接算出してもよい。次に、ステップ108で、予測対象物質の生物濃縮倍率(BCF)を予測値として出力し、予測処理のルーチンを終了する。
従来の予測方法では、LogPを指標として生物濃縮倍率を予測するために、分子が大きく複雑な構造の化学物質、脂溶性の高い化学物質等、LogPが正確に求められず、生物濃縮倍率を予測することが困難な化合物があった。これに対し、本実施の形態では、LogPを使用せずに生物濃縮倍率を予測する。従って、LogPが正確に求められない化学物質についても、生物濃縮倍率を予測することができる。
(相関式の決定処理)
次に、「相関式の決定処理」について説明する。
図4は「相関式の決定処理」の処理ルーチンを示すフローチャートである。
まず、ステップ200で、BCFが既知の複数の化学物質(以下、「既知化学物質」という。)の構造式情報等を取得する。本実施の形態では、化学物質DBサーバ等の化学物質のデータを管理する外部のデータベースサーバから、複数の既知化学物質の構造式情報等を取得する。
本実施の形態では、外部のデータベースサーバは、既存の化学物質について化学物質の構造式情報、BCF値、及びBCF値の信頼性を表す情報を提供する。BCF値の信頼性を表す情報とは、例えば、BCF値の取得条件、水中での安定性、分子量に関する情報である。これらの情報は、検索可能なデータベースとして取得される。例えば、独立行政法人製品評価技術基盤機構のホームページの化学物質総合情報提供システム(http://www.safe.nite.go.jp/japan/db.html)により提供される情報等、既存の化学物質情報に基づいて、検索可能なデータベースを構築して使用することができる。
次に、ステップ201で、トレーニングセットの生成に使用する既知化学物質を抽出する。上述した通り、外部のデータベースサーバから検索可能なデータベースが取得される。しかしながら、取得されたデータベースには、化審法のガイドラインに従って取得されていないBCF値を有する化学物質等、BCF値の信頼性が低い既知化学物質が含まれている。
そこで、本実施の形態では、BCF値の信頼性を示す基準を設定して、設定された基準に基づいてデータベースを検索し、BCF値の信頼性が高い既知化学物質を抽出する。換言すれば、BCF値の信頼性を示す基準を設定して、BCF値の信頼性が低い既知化学物質を除外するのである。そして、抽出された既知化学物質をトレーニングセットの生成に使用する。これにより、BCFの予測精度が向上する。なお、BCF値の信頼性を示す基準については後述する。
次に、ステップ202で「パラメータ種Xの設定処理」を実行する。上記の通り、本実施の形態では、生物濃縮倍率と特定パラメータとの相関関係を記述した相関式を使用する。「パラメータ種Xの設定処理」では、相関式に使用する特定パラメータの種類及び個数を設定する。なお、「パラメータ種Xの設定処理」の詳細については後述する。
次に、ステップ204で、ステップ201で抽出された複数の既知化学物質について、これらの化学物質の構造式情報からパラメータ値xを生成する。ステップ202で設定されたパラメータ種Xの各々について、パラメータ値xが生成される。例えば、パラメータ種Xとして「Mref、WPSA、Carb」が設定されると、「Mref、WPSA、Carb」の各パラメータについて具体的な数値xが生成される。
次に、ステップ206で、抽出された複数の既知化学物質について取得された複数のパラメータ値xの平均値xbar及び標準偏差Sが取得される。
次に、ステップ208で、抽出された複数の既知化学物質の各々について、LogBCFと複数のパラメータ値xとの組合せを求めて、重回帰分析に用いるトレーニングセットを生成する。トレーニングセットは、LogBCFと複数のパラメータ値xとの組を複数組含む。
次に、ステップ210で、トレーニングセットを用いて重回帰解析により相関式を決定する。上記式(1)を判別式として重回帰解析を行うと、定数C及び係数a〜aの各々が求められる。重回帰解析の手法としては、一般に使用されているStepwise Regression法、Partial Least Square法、Leaps and bounds法等を用いることができる。また、ステップ206で、平均値x1bar〜xnbar、標準偏差S〜Sの各々が取得されている。従って、生物濃縮倍率と特定パラメータとの相関関係を記述した相関式が決定される。
なお、重回帰解析により得られた係数a〜aは、対応するパラメータの生物濃縮倍率への影響を表す。例えば、Xが「分子サイズパラメータ」であり、係数aが正の符号を有する場合には、分子サイズパラメータに対応する数値が大きいほど生物濃縮倍率は大きな値となる。
次に、ステップ212で、「相関式の検定処理」を実行する。検定処理により相関式が適切な予測式となっているか否かが検証される。なお、「相関式の検定処理」については後述する。次に、ステップ214で、検定処理の結果に基づいて相関式に予測性能が有るか否かを判断する。相関式に予測性能が無い場合は、ステップ202に戻って「パラメータ種Xの設定処理」からやり直す。例えば、分子サイズパラメータ、複合パラメータ及びカルボニル基の電荷パラメータを設定しても相関式に予測性能が得られない場合には、水素結合パラメータを追加する。一方、相関式に予測性能が有る場合は、処理ルーチンを終了する。
(BCF値の信頼性を示す基準)
ここで、BCF値の信頼性を示す基準について説明する。
BCF値の信頼性を示す基準は、下記(1)〜(7)の少なくとも1つを要件として含む。基準に含まれる要件が多いほどBCF値の信頼が高い既知化学物質に絞り込まれ、有効なトレーニングセットが生成されて、BCF値の予測精度が向上する。
(1) 生物濃縮倍率値が定量的に取得されていること
(2) 既知化学物質が水中で安定であること
(3) 生物濃縮倍率値を取得したときの暴露濃度の実測値が設定値に対して70%以上であること
(4) 生物濃縮倍率値を取得したときの暴露期間が4週間以上であること
(5) 既知化学物質の化学構造が明確であること
(6) 既知化学物質の分子量が600以下であること
(7) 生物濃縮倍率値が暴露期間中に連続して取得された3つ以上の実測値の平均値であること
要件(1)によれば、BCFが検出限界以下の既知化学物質が除外される。要件(2)によれば、水中で容易に変化し、BCFを正確に測定できない既知化学物質が除外される。要件(4)及び(7)によれば、化審法のガイドラインに従って取得されていないBCF値を有する化学物質が除外される。要件(3)によれば、化学物質が水中に安定して溶解または分散していないと考えられる既知化学物質が除外される。なお、要件(3)の「設定値」とは化審法のガイドラインに従って化学物質毎に適宜設定される値である。
要件(5)によれば、構造活性相関の適用対象とならず、パラメータ値の生成ができない既知化学物質が除外される。要件(6)によれば、魚体内に蓄積されることがない化学物質が除外される。後述する通り、BCF値が測定可能な化学物質の範囲では、分子サイズパラメータはBCFへの影響が大きく、パラメータ値が大きいほどBCF値が大きくなる。しかしながら、経験則として、分子量が600を超える化学物質は魚体内に取り込まれないことが知られている。従って、分子量が600を超える化学物質をトレーニングセットの生成に使用する既知化学物質から除外することで、BCF値の予測精度が顕著に向上する。
(パラメータ種Xの設定処理)
ここで、図4のステップ202で実行される「パラメータ種Xの設定処理」について更に詳しく説明する。図5は「パラメータ種Xの設定処理」の処理ルーチンの一例を示すフローチャートである。図6(A)及び(B)はパラメータの設定画面の一例を示す模式図である。これらはパラメータ種の設定方法の一例を示すものであり、パラメータ種の設定方法はこれに限定される訳ではない。例えば、上記の「Mref、WPSA、Carb」等のパラメータをデフォルトとして予め設定しておいてもよい。また、ユーザインターフェイスも設定画面等に限定される訳ではない。例えば、音声ガイドに従って設定するようにしてもよく、音声入力により設定できるようにしてもよい。
まず、ステップ300で、設定画面を表示するように情報出力部に指示する。図6(A)に示すように、情報出力部として用意されたディスプレイ上にパラメータの設定画面60が表示される。本実施の形態では、特定パラメータとして、分子サイズパラメータ、分子表面積と分子表面電子密度との組合せによる複合パラメータ(Charged Partial Surface Area:CPSA)、カルボニル基の電荷パラメータ、及び水素結合パラメータを設定することができる。
これに応じて、設定画面60には、分子サイズパラメータ選択ボタン62、複合パラメータ(CPSA)選択ボタン64、カルボニル基の電荷パラメータ選択ボタン66、及び水素結合パラメータ選択ボタン68が配置されている。また、設定画面60には、「設定終了」を指示するための指示ボタン69が配置されている。
設定画面60において複合パラメータ(CPSA)選択ボタン64を押下すると、図6(B)に示すように、ディスプレイ上に選択肢画面70が表示される。選択肢画面70上で、所望の複合パラメータを選択すると、選択した複合パラメータが設定される。例えば、複合パラメータ(CPSA)としては、演算による組み合わせ方により25種のCPSAがある。これらのCPSAが選択肢として表示される。図示したように、下線を付した「15)Relative negative charge」と「22)Weighted positive charged partial surface area3」とを併用する等、複数のCPSAを複合パラメータとして設定してもよい。
次に、ステップ302で、情報入力部を介して「設定終了」が指示されたか否かを判断する。「設定終了」が指示されていない場合は、ステップ302に戻る。「設定終了」が指示された場合は、ステップ304に進む。
ステップ304で、分子サイズパラメータが設定されたか否かを判断する。分子サイズパラメータが設定されていない場合は、ステップ300に戻って設定画面を再度表示する。分子サイズパラメータが設定されている場合は、ステップ306に進む。ステップ306で、複合パラメータが設定されたか否かを判断する。複合パラメータが設定されていない場合は、ステップ300に戻って設定画面を再度表示する。複合パラメータが設定されている場合は、ステップ308に進む。
ステップ308で、カルボニル基の電荷パラメータが設定されたか否かを判断する。カルボニル基の電荷パラメータが設定されていない場合は、ステップ300に戻って設定画面を再度表示する。カルボニル基の電荷パラメータが設定されている場合は、必須のパラメータが設定されたものとして、ステップ310に進む。ステップ310では、設定されたパラメータの種類及び個数を記憶して、ルーチンを終了する。
(相関式の検定処理)
ここで、図4のステップ212で実行される「相関式の検定処理」について更に詳しく説明する。図7は「相関式の検定処理」の処理ルーチンを示すフローチャートである。
まず、ステップ400で、相関の指標である「決定係数R」を算出する。トレーニングセットに含まれるすべての既知化学物質について、各パラメータに対応するパラメータ値を決定された相関式に代入して、既知化学物質の各々について生物濃縮倍率(計算値)を求めて、生物濃縮倍率(計算値)と生物濃縮倍率(実測値)との相関を表す「決定係数R」を最小二乗法により算出する。決定係数Rは、横軸を実測値とし縦軸を計算値として、トレーニングセットに含まれるすべての化学物質をプロットし算出した場合の決定係数である。決定係数Rの値が1に近いほど、実測値と計算値との相関性が良く、相関式の精度が高いことを示す。
次に、ステップ402で、leave-one-out法を用いて「決定係数R CV」を算出する。leave-one-out法とは、トレーニングセットから1つのサンプル(化学物質)を除き、残りのサンプルで相関式を作成したときに、あらかじめ除いていたサンプルを正確に計算することができるかを検定する方法である。これをトレーニングセットに含まれるすべての既知化学物質について行い、生物濃縮倍率(計算値)と生物濃縮倍率(実測値)との相関を表す「決定係数R CV」を最小二乗法により算出する。決定係数R CVは、横軸を実測値とし縦軸を計算値として、トレーニングセットに含まれるすべての化学物質をプロットし算出した場合の決定係数である。
次に、ステップ404で、「決定係数R」と「決定係数R CV」との差(R−R CV)が閾値以上か否かを判断する。差(R−R CV)が小さいほど、相関式の予測性能がよい。「決定係数R CV」が「決定係数R」よりも極端に小さく、差(R−R CV)が大きい場合には、決定された相関式の予測性能が損なわれる。
従って、所望の予測性能に応じて閾値を設定し、差(R−R CV)が閾値以上である場合には、ステップ406で「相関式の予測性能なし」と判定してルーチンを終了する。一方、差(R−R CV)が閾値未満である場合には、ステップ408で「相関式の予測性能あり」と判定してルーチンを終了する。
なお、上記では相関の指標として「決定係数R」を用いる例について説明したが、生物濃縮倍率(計算値)と生物濃縮倍率(実測値)との差の大きさを示す「二乗平均平方根誤差RMSE」を相関の指標としてもよい。RMSEの値が小さいほど、実測値と計算値との相関性が良く、相関式の精度が高いことを示す。この場合は、leave-one-out法により「二乗平均平方根誤差RMSECV」を求めて、差(RMSE−RMSECV)から相関式の予測性能の有無を判定する。
<特定パラメータ>
次に、特定パラメータの各々について説明する。
上記の通り、予測精度の高い相関式を得るためには、生物濃縮倍率に特に影響を与える特定パラメータを使用することが極めて重要である。本実施の形態では、特定パラメータとして、分子サイズパラメータ、分子表面積と分子表面電子密度との組合せによる複合パラメータ、及びカルボニル基の電荷パラメータを用いる。また、水素結合パラメータを、特定パラメータに含めてもよい。
一般に、構造活性の相関を調査する場合に使用されるパラメータとしては、例えば、分子量、原子種とその数、結合種とその数、部分構造等、分子の構成に関するパラメータ、分子結合インデックス、ウィーナーインデックス、バラバンインデックス等の分子のトポロジーに関するパラメータ、分子シャドウパラメータ、分子モーメントパラメータ、分子体積パラメータ、分子表面積パラメータ、対称性パラメータ等、分子の幾何学に関するパラメータ、LogPやLogS等の物性パラメータ、部分電荷やHOMO/LUMO等に関する分子軌道法パラメータ、結合反発エネルギーパラメータ等の分子動力学パラメータ等がある。更に、これらの2種以上を組み合わせた複合パラメータがある。
分子サイズパラメータとして用いられる「モル屈折率Mref」は、物性パラメータである。「複合パラメータCPSA」は、幾何学に関するパラメータである分子表面積パラメータと、部分電荷に関する分子軌道法パラメータとを組み合わせたものである。「カルボニル基の電荷パラメータCarb」は、部分電荷に関する分子軌道法パラメータである。「水素結合パラメータHBPUREは」は、幾何学に関するパラメータと部分電荷に関する分子軌道法パラメータとを組み合わせたものである。
(分子サイズパラメータ)
分子サイズパラメータとは、分子の大きさを表すパラメータである。分子サイズは水への溶解性や魚体内への取り込みを決定するパラメータであると推測される。化学物質が魚体内に取り込まれる際、主要な取り込み部位として鰓の脂質二重膜がある。一般的に化学物質は分子のサイズが大きいほど水中での溶解性は減少する。濃縮度試験においては分子サイズの大きな化学物質ほど水中での溶解性が減少し、相反して魚体の鰓部分の脂質二重膜との親和性が高まることが考えられる。このため分子サイズの大きな化学物質ほど、生物濃縮倍率が高くなることが予想される。
分子サイズパラメータとしては、モル屈折率(Molar refractivity:Mref)、分極率(Molecular polarizability:Mpol)を用いることができる。モル屈折率は、分子と光の相互作用を示す指標であるが、分子サイズの指標としても利用される。分極率は電場とそれにより誘起された分極(誘起双極子μ)とにより次式で表され、一般的に分子の体積と比例する。μ=αE(α:分極率、E電場)。これらの中でも、モル屈折率を使用することが好ましい。なお、これらは好適なパラメータの例示したものであり、分子サイズパラメータはこれらに限定される訳ではない。
屈折率やモル屈折率は物質の分子と光の相互作用を示す。物質内においては光の速度は真空中より遅くなり、光が真空中から物質内に進むとき入射角により境界で進行方向が曲げられる。この現象は屈折と呼ばれる。屈折率(n)は真空中の光の速さ(C)と物質中の光の速さ(V)の比により、次式により表され、物質はそれぞれ異なる屈折率を持つ。n=C/V。「モル屈折率(Mref)」は、物質の密度(ρ)とモル質量(M)の関数であり、分極率(α)との関係とともにローレンツ−ローレンツ式により次のように定義される。ここで、NAはアボガドロ数である。
Mref=((n2-1)/(n2+2))M/ρ=(4π/3)NAα
一般に分子が多数の電子を持つほど分極率(Mpol)とモル屈折率(Mref)は大きくなり、これらは分子の体積の指標として利用される。また、モル屈折率はロンドン分散力とも関係する。ロンドン分散力は分子中の電子の分布に一時的な偏りが生じることにより起きる自発的な双極子による弱い分子間力である。分子が大きくなるに従い電子の分布に偏りが発生する確率が高くなるため、分子が大きいほどロンドン分散力は強くなる。ロンドン分散力が重要な役割を果たしていると考えられる生体分子間の相互作用においては、脂溶性の指標であるLogPに代わり、モル屈折率がその説明や予測に使用される。(J.A.Padron, R. Carrasco, R.F.Pellon ‘Molecular descriptor based on a molar refractivity partition using Randic-type graph-theoretical invariant’ Journal of Pharmacy & Pharmaceutical Sciences. 2002, Vol.5, No.3, 258-265)。
蓄積性においては、化学物質は魚体内で主に脂肪組織や細胞膜に蓄積するが、蓄積性は化学物質が溶解している水と魚体の脂肪組織や細胞膜との間の分配と考えられ、主に受動的な拡散により魚体内に侵入することが考えられることから、特に非極性の分子においてロンドン分散力が重要な役割を果たしていることが考えられる。
化学物質のモル屈折率を推算する方法として、例えばVogelらの原子団寄与法がある。原子団寄与法では原子や結合や官能基に割り当てられた定数を合算することで、物質の特性を推算する。(A.I.Vogel, W.T.Cresswell, G.H.Jeffery, J.Leicester, ‘Calculation of the refractive indices of liquid organic compounds: Bond molecular refraction coefficients’ Chemistry and Industry. 1951, Vol.19, 376)。
(分子表面積と分子表面電子密度との組合せによる複合パラメータ)
分子表面積と分子表面電子密度との組合せによる複合パラメータ(Charged Partial Surface Area:CPSA)とは、StantonとJursによって提案されたパラメータであり、分子間の極性相互作用の指標である。(David T. Stanton and Peter C. Jurs, ‘Development and Use of Charged Partial Surface Area Structural Descriptors in Computer-Assisted Quantitative Structure-Property Relationship Studies’, Anal. Chem. 1990, 62, 2323-2329)。
CPSAは分子間の極性相互作用の記述に用いられ、化学物質の極性の指標とも言えることから、化学物質と極性分子である水分子との結び付きの強さを示すことが考えられる。化学物質は水分子と強く結び付くほど魚体内への取り込みが抑制されることから、CPSAが増加すると生物濃縮倍率は低くなると考えられる。また、化学物質が魚体内に取り込まれる際に鰓の脂質二重膜を通過するが、化学物質と脂質分子との相互作用を記述することも考えられる。分子間の極性相互作用の大きさは、分子内の電荷分布と接触面積により決定されると考えられ、CPSAは分子間の極性相互作用を記述する上で有用であると考えられる。
分子表面積と分子表面電子密度とを演算により組み合わせCPSAが計算される。演算による組み合わせ方によりCPSAには以下の25種がある。
1)Atomic charge weighted partial positive surface area、
2)Atomic charge weighted partial negative surface area、
3)Difference in charged partial surface area1、
4)Difference in charged partial surface area2、
5)Difference in charged partial surface area3、
6)Fractional positive charged partial surface area1、
7)Fractional positive charged partial surface area2、
8)Fractional positive charged partial surface area3、
9)Fractional negative charged partial surface area1、
10)Fractional negative charged partial surface area2、
11)Fractional negative charged partial surface area3、
12)Partial positive surface area、
13)Partial negative surface area、
14)Relative positive charge、
15)Relative negative charge、
16)Relative positive charged surface area、
17)Relative negative charged surface area、
18)Total charge weighted partial positive surface area、
19)Total charge weighted partial negative surface area、
20)Weighted positive charged partial surface area1、
21)Weighted positive charged partial surface area2、
22)Weighted positive charged partial surface area3、
23)Weighted negative charged partial surface area1、
24)Weighted negative charged partial surface area2、
25)Weighted negative charged partial surface area3、
この中でも、22)Weighted positive charged partial surface area3が好ましい。22)Weighted positive charged partial surface area3に加えて、15)Relative negative chargeを併用して使用する態様がさらに好ましい。22)Weighted positive charged partial surface area3は、分子の正の部分電荷を記述するものであるが、分子内の正の原子部分電荷とその表面積の積の総和に対し、分子の全表面積を掛けることで、分子全体の大きさを加重する。一方、15)Relative negative chargeは、分子内の最も大きい負の原子部分電荷を分子内の負の部分電荷全体で割ったものであり、最も大きい負の原子部分電荷の部分電荷全体への寄与率を記述する。なお、これらは好適なパラメータの例示したものであり、複合パラメータはこれらに限定される訳ではない。
なお、分子表面積としてPearlmanのアルゴリズムにより算出した溶媒露出面積が使用される。(非特許文献R. S. Pearlman, ‘Physical Chemical Properties of Drugs’, ed. S. H. Yalkowsky, A. A. Sikula, and S. C. Valvani, Marcel Dekker, New York, 1980)。Pearlmanによる分子表面積の推算法では原子を球体として、分子を結合によりオーバーラップした球体の集合と見なす。オーバーラップ部分を除いた各原子の表面積の合算により分子全体の表面積が求められる。分子表面積及び分子表面電子密度とを組み合わせた複合パラメータや水素結合パラメータ等、他の分子との相互作用を記述するパラメータにおいては他の分子と接触可能な表面積として溶媒露出面積を使用することが重要である。
分子間の相互作用では分子が他の分子と接触できる表面積を求めることが重要である。例えば分子が折りたたまれている状態であれば、折りたたまれた分子の内側の表面は他の分子と接触できず、分子間の相互作用に関与しない。このためPearlmanの方法では溶媒露出面積を計算する。Pearlmanの溶媒露出面積では前述の通り分子をオーバーラップする球体の集合と見なすが、各原子のファンデルワールス半径に水分子の半径1.5Åを足して各原子の表面積を求める。これはファンデルワールス半径により求めた分子表面上を1.5Åの半径を持つ球体と見なす水分子が転がる状態として想像できる。分子の折りたたみ部分等、分子の内側にあり水分子が接触できない部分の表面積は溶媒露出面積には加味されない。
また、分子表面電子密度はAbrahamとSmithのアルゴリズムにより算出する。AbrahamとSmithのアルゴリズムは、分子の双極子モーメントの実測値を再現するようσ電子とπ電子により部分電荷を求める経験的な方法である(非特許文献 R. J. Abraham and P. E. Smith , J. Comput. Chem. 1988, 9, 288-297)。
部分電荷は分子内における電子密度の不均一な分布により起きる。分子が電気的に中性であっても、結合に関わる原子の電気陰性度に違いがある場合、結合電子はより陰性な原子に偏って分布する。結合電子がより引き付けられる原子側は負の部分電荷を持ち、逆側の原子は正の部分電荷を持つ。この分子内の電荷の偏りにより分子は分極した状態になり、この分極の状態は双極子モーメントで表すことができる。双極子モーメントは方向性を持ち、負電荷から正電荷に向かう長さと電荷の積で示される。
分子内の各原子の部分電荷を推算する方法のひとつにAbrahamとSmithの原子団寄与法がある。AbrahamとSmithの原子団寄与法は、分子の双極子モーメントの実測値を再現するよう分子内のσ電子とπ電子の電子密度を推定し、分子内の各原子の部分電荷を求める方法である。σ電子の影響は結合に関わる2つの原子の電気陰性度の違いとして表され、π電子による影響は分子軌道法のひとつであるヒュッケル法により推算される。(非特許文献 R. J. Abraham and P. E. Smith , J. Comput. Chem. 1988, 9, 288-297)
(カルボニル基の電荷パラメータ)
カルボニル基の電荷パラメータ(Carb)とは、カルボニル炭素の正の電荷の大きさである。複数のカルボニル基を有する化学物質の場合は、複数のカルボニル基についての平均値として表される。カルボニル基は、有機化合物が持つ官能基のひとつであり、炭素原子と酸素原子が二重結合により結合したもので次のように表される。−C(=O)−。カルボニル基の炭素原子はカルボニル炭素と呼ばれるが、結合する酸素原子の電気陰性度によりカルボニル炭素は正の電荷を持ち、分極した状態となり高い反応性を持つ。
カルボニル基にはケトン、アルデヒド、エステル、アミドがあるが、これらは生体内の代謝において重要であり、様々な代謝酵素により代謝を受ける。本実施の形態では、カルボニル炭素の電荷が生物濃縮倍率の決定に重要であることを見出し、カルボニル基の電荷パラメータを特定パラメータとして使用することとした。
相関式では、カルボニル炭素の電荷パラメータは負の符号を有し、この値が高いほど生物濃縮倍率が低くなることを示す。カルボニル基を有する化学物質が魚体内で代謝を受け、その結果、生物濃縮倍率が下がるものと推測される。また、カルボニル基の電荷は、化学物質の極性の指標のひとつと考えられ、化学物質と水分子、または脂質分子との相互作用を記述することも考えられる。
カルボニル基の電荷を計算する方法としては、AbrahamとSmithの方法がある。AbrahamとSmithのアルゴリズムは、分子の双極子モーメントの実測値を再現するようσ電子とπ電子により部分電荷を求める経験的な方法である(非特許文献 R. J. Abraham and P. E. Smith , J. Comput. Chem. 1988, 9, 288-297)。
(水素結合パラメータ)
水素結合パラメータとは、分子間及び分子内の水素結合を表すパラメータである。
水素結合は2つの陰性の原子A、B間で水素原子Hを共有することによる比較的弱い結合であり、分子間また分子内で起き、次のように表わされる A−H---B。水素原子を供与するグループA−Hはドナーと呼ばれ、例えばO−H(アルコール、フェノール)、N−H(アミン、ピロール)、S−H(チオール、チオフェノール)などがある。水素原子を受容するグループBはアクセプターと呼ばれ、例えばアルコール、フェノール、エステル、エーテル、アミン、ピロール、ピリジン等、孤立電子対や多重結合におけるπ電子を持つ原子であり、電子密度の高い部分が水素原子Hを受容する。例えばアルコールやフェノールは一分子あたり、ひとつのドナーとふたつのアクセプター部位を持ち、水分子はドナーとアクセプターをふたつずつ持つ(Pimentel, G.; McClellan, A. The Hydrogen Bond; Reinhold Pub. Corp.: New York, 1960, Vinogradov, S.; Linnell, R. Hydrogen Bonding; Van Nostrand Reinhold: New York, 1971)。
水素結合は生体において非常に重要であり、例えばDNAやタンパク質などの生体高分子が高次構造を形成し、機能を発現するために重要な役割を持つ。化学物質の蓄積性の決定においても水素結合が関与することが考えられ、水分子や脂質二重膜との親和性を記述することが考えられる。化学物質の持つ水素結合能は水素結合パラメータにより記述できる。化学物質は水分子との水素結合による結び付きが強いほど魚体内への取り込みが抑制され、生物濃縮倍率は低くなると考えられる。
水素結合パラメータとしては、例えば、上記の株式会社富士通九州システムズの「ModelBuilder」で使用できるHBPURE等のパラメータがある。HBPUREは、分子表面積、分子表面電子密度、アクセプター原子数、ドナー原子数を演算により組み合わせることで計算され、組み合わせ方により下記の23種類のパラメータが存在する。なお、これらは好適なパラメータの例示したものであり、水素結合パラメータはこれらに限定される訳ではない。
HBP: Ave. chg. diff. between donor and acceptor
HBP: Count of acceptor atoms
HBP: Count of donatable hydrogen atoms
HBP: Max. chg. diff. between donor and acceptor
HBP: Ratio of number donors to number acceptors
HBP: Sum of (surface area*charge) acc. atoms(PSAAA1)
HBP: Sum of (surface area*charge) acc. atoms / Number of acc. atoms
HBP: Sum of (surface area*charge) acc. atoms / Total mol. surf. area
HBP: Sum of (surface area*charge) don. hydr. / Number of donatable hydr.
HBP: Sum of (surface area*charge) don. hydr. / Total mol. surf. area
HBP: Sum of (surface area*charge) don. hydrogens
HBP: Sum of charge on acc. atoms / Number of acc. atoms
HBP: Sum of charge on acc. atoms / Total mol. surface area
HBP: Sum of charge on acceptor atoms
HBP: Sum of charge on all donatable hydr. / Number of donatable hydr.
HBP: Sum of charge on all donatable hydr. / Total mol. surface area
HBP: Sum of charge on all donatable hydrogens
HBP: Sum of surf. area of donatable hydr. / Number of donatable hydr.
HBP: Sum of surf. area of donatable hydr. / Total mol. surface area
HBP: Sum of surface area of acc. atoms / Number of acc. atoms(PSCAA2)
HBP: Sum of surface area of acc. atoms / Total mol. surface area
HBP: Sum of surface area of acceptor atoms
HBP: Sum of surface area of donatable hydrogens
本実施の形態では、HBPUREパラメータのひとつであるHBP: Sum of surface area of acceptor atoms/Number of acceptor atoms(以下、「PSAAA2」と称する。)、HBP: Sum of (surface area * charge)acceptor atoms(以下、「PSCAA1」と称する。)が好適に使用される。「PSAAA2」は、分子が持つアクセプター原子の表面積の合計をアクセプター原子の数で除することで求められる。また、「PSCAA1」は、分子が持つアクセプター原子の表面積と電子密度の積の合計である。なお、複合パラメータと同様に、分子表面積はPearlmanのアルゴリズムによって計算され、分子表面電子密度はAbrahamとSmithのアルゴリズムによって計算される。
なお、上記の実施の形態で説明した構成は一例であり、本発明の主旨を逸脱しない範囲内においてその構成を変更してもよいことは言うまでもない。例えば、コンピュータにより実行されるプログラムの手順の一部又は全部を人が実行するようにしてもよい。
以下、実施例により本発明をより具体的に説明する。但し、本発明は実施例に限定されるものではない。
[実施例1]
独立行政法人製品評価技術基盤機構のホームページの化学物質総合情報提供システム(http://www.safe.nite.go.jp/japan/db.html)より得た生物濃縮倍率既知の181種の化学物質をトレーニングセットとして利用した。これら181種の化学物質は炭素原子と水素原子からなる有機化合物であり、さらに酸素原子、窒素原子、硫黄原子のいずれかを1つ以上有する化学物質である。これらの化学物質は、上記のBCF値の信頼性を示す基準の要件(1)〜(7)を全て満たすように選定されている。
これら181種の化学物質の生物濃縮倍率の決定には魚類としてコイ(Cyprinus carpio)が使用されている。コイを飼育する試験水槽に28日間以上化学物質の原液を連続的に送液する流水式試験法による結果であり、暴露期間中に化学物質の魚体内濃度を定量し、それを水槽中濃度で除することで生物濃縮倍率が求められる。流水式の濃縮度試験では、通常、化学物質の魚体内濃度は暴露期間中に徐々に上昇し、一定期間後に定常状態に達する。正確な生物濃縮倍率の決定を行うために、化学物質の魚体内濃度と水槽濃度は暴露期間中に複数回定量され、定常状態に達したと見なされるまで暴露が続けられる必要がある。本実施例で使用した181種の化学物質については、28日間以上暴露が行われ、十分に定常状態に達したと見なされ、暴露期間中に決定された最後の連続した3回の生物濃縮倍率の平均値を使用した。
相関式の作成には株式会社富士通九州システムズ社製の「ModelBuilder」を使用した。ModelBuilderは有償で得られ、コンピュータ上で動作するアプリケーションである。ModelBuilderは入力した化学構造に対する複数種のパラメータ値の計算やPartial Least Square法やLeaps and bounds法等の回帰法やleave-one-out法等の検定を行い、相関式の作成に使用される。
まず、生物濃縮倍率既知の181種の化学物質について、底を10として対数変換した生物濃縮倍率の実測値とそれぞれの構造式情報をModelBuilderに入力した。相関式による生物濃縮倍率の予測においては、底を10として対数変換した生物濃縮倍率の値(LogBCF)を用いることが通常である。
次に、特定パラメータを有する判別式を設定して、重回帰解析により係数a、平均値xbar、標準偏差S及び定数Cの値を計算して相関式を作成した。相関式はLeaps and Bounds法により作成した。作成した相関式-1を以下に記す。
LogBCFは対数変換した生物濃縮倍率を示す。Mref、WPSA、Carbはそれぞれモル屈折率パラメータ(Molar refractivity)、分子表面積と分子表面電子密度を組み合わせた複合パラメータ(Weighted positive charged partial surface area3)、カルボニル基の電荷パラメータ(Average charge on carbonyl carbons)である。
分子サイズを記述するモル屈折率Mrefは、相関式において正の符号を持ち、分子サイズが大きいほど生物濃縮倍率が上がることを示す。分子表面積と分子表面電子密度を組み合わせた複合パラメータWPSAは、相関式において負の符号を持ち、この値が大きいほど生物濃縮倍率が下がることを示す。カルボニル基の電荷パラメータCarbは、カルボニル基の電荷を記述し、相関式において負の符号を持つことからこの値が大きいほど生物濃縮倍率が下がることを示す。
トレーニングセットの181種の化学物質についてMref、WPSA、Carbに対応する数値を相関式−1に代入し、生物濃縮倍率を計算して、生物濃縮倍率の実測値との相関を見たところ表−1に示す結果が得られた。
R2は横軸を実測値とし縦軸を計算値として181種の化学物質をプロットし算出した決定係数を表す。RMSEは二乗平均平方根誤差であり、実測値と計算値との差の大きさを示す。R2は0.751であり、RMSEは0.503であった。
次に、leave-one-out法によって検定を行った。
181種の化学物質から1つサンプルを除き、残りのサンプルで相関式を作成した。この相関式を用いて、あらかじめ除いていたサンプルの生物濃縮倍率を計算した。これを181種の化学物質全てについて行い、生物濃縮倍率の実測値と相関を見たところ表−1に示す結果が得られた。R2 CVはleave-one-out法による計算値と実測値との決定係数である。RMSECVはleave-one-out法による計算値と実測値との差の大きさを示す。R2 CVは0.739であり、RMSECVは0.516であり、検定の結果、相関式−1は十分な予測精度があることが分かった。
次に、LogPを指標とする従来の予測モデルとの精度比較を行った。従来の予測モデルとして非特許文献1〜3により示された予測式により同様にして181種の化学物質の生物濃縮倍率を計算し、生物濃縮倍率の実測値との相関性をみたところ表−1に示す結果が得られた。表−1を見る限り、本発明による相関式−1(実施例1)は非特許文献1〜3により示された予測式(比較例A,B、C)よりも、計算値と実測値の相関が良く、より精度が高いことが分かった。
[実施例2]
次に、実施例1で使用した181種の化学物質からなるトレーニングセットに新たに67種の化学物質を追加し、合計248種の化学物質からなるトレーニングセットとして予測する化学物質の対象範囲を広げ相関式を作成した。67種の化学物質は独立行政法人製品評価技術基盤機構のホームページの化学物質総合情報提供システム(http://www.safe.nite.go. jp/ japan/db.html)より得た生物濃縮倍率既知の化学物質であり、炭素原子と水素原子のみからなる炭化水素化合物と炭素原子と水素原子に加え、フッ素原子、塩素原子、臭素原子をひとつ以上有する有機ハロゲン化合物である。これらの化学物質は、上記のBCF値の信頼性を示す基準の要件(1)〜(7)を全て満たすように選定されている。
実施例1で使用した181種の化学物質と同様に、これら67種の化学物質の生物濃縮倍率の決定には魚類としてコイ(Cyprinus carpio)が使用されており、流水式試験法によるものであり、十分に定常状態に達したと見なされるまで28日間以上暴露が行われている。暴露期間中に決定された最後の連続した3回の生物濃縮倍率の平均値を使用した。
実施例1と同様に、特定パラメータを有する判別式を設定して、重回帰解析により係数a、平均値xbar、標準偏差S及び定数Cの値を計算して相関式を作成した。作成した相関式−2を以下に記す。
Mrefはモル屈折率パラメータ、Carbはカルボニル基の電荷パラメータである。WPSAとRNCGは分子表面積と分子表面電子密度を組み合わせた複合パラメータであり、それぞれ22)Weighted positive charged partial surface area3、15)Relative negative chargeの略称である。相関式−2では分子表面積と分子表面電子密度を組み合わせた複合パラメータを2種使用している。
トレーニングセットの248種の化学物質についてMref、Carb、WPSA及びRNCGに対応する数値を相関式−2に代入し、実施例1と同様にして生物濃縮倍率を計算し、生物濃縮倍率の実測値との相関を見たところ表−2に示す結果が得られた。R2は0.772であり、RMSEは0.493であった。
次に、leave-one-out法によって検定を行った。
248種の化学物質から1つサンプルを除き、残りのサンプルで相関式を作成した。この相関式を用いて、あらかじめ除いていたサンプルの生物濃縮倍率を計算した。これを248種の化学物質全てについて行い、生物濃縮倍率の実測値と相関を見たところ表−2に示す結果が得られた。R2 CVは0.762であり、RMSECVは0.504であり、検定の結果、相関式−2は十分に予測精度があることが分かった。
次に、LogPを指標とする従来の予測モデルとの精度比較を行った。従来の予測モデルとして非特許文献1〜3により示された予測式により同様にして248種の化学物質のR2とRMSEを計算し、結果を表−2に示した。表−2を見る限り、本発明による相関式−2(実施例2)は非特許文献1〜3により示された予測式(比較例D,E,F)よりも、計算値と実測値の相関が良いことが分かった。このように分子表面積と分子表面電子密度を組み合わせた複合パラメータを2種以上使用することにより、化学構造の多様性に富んだ幅広い化学物質種に対応する精度の高い相関式を作成することができる。
[実施例3]
更に、水素結合パラメータを使用した実施例を示す。実施例2において用いた248種の化学物質を用いて、実施例1と同様に、4種類の特定パラメータを有する判別式を設定して、重回帰解析により係数a、平均値xbar、標準偏差S及び定数Cの値を計算して相関式を作成した。作成した相関式−3を下に記す。
PSAAA2(HBP: Sum of surface area of acceptor atoms/Number of acceptor atoms)とPSCAA1(HBP: Sum of (surface area * charge)acceptor atoms)は、水素結合パラメータを表す。
トレーニングセットの248種の化学物質について、Mref、Carb、WPSA、RNCG、PSAAA2及びPSCAA1に対応する数値を相関式−3に代入し、実施例1と同様にして生物濃縮倍率を計算し、生物濃縮倍率の実測値との相関を見たところ表−3に示す結果が得られた。R2は0.791であり、RMSEは0.472であった。
次に、leave-one-out法によって検定を行った。
248種の化学物質から1つサンプルを除き、残りのサンプルで相関式を作成した。この相関式を用いて、あらかじめ除いていたサンプルの生物濃縮倍率を計算した。これを248種の化学物質全てについて行い、生物濃縮倍率の実測値と相関を見たところ表−3に示す結果が得られた。R2 CVは0.777であり、RMSECVは0.488であり、検定の結果、相関式−3は十分に予測精度があることが分かった。
次に、作成した相関式−3と水素結合パラメータを使用しない相関式−2との精度比較を行った。表3を見る限り、相関式−3(実施例3)は相関式−2(実施例2)よりも計算値と実測値の相関が良い。このように水素結合パラメータを追加することにより、精度を上げることができることが分かった。

[比較例1]
次に、カルボニル基の電荷パラメータが生物濃縮倍率の決定に重要であることを示す。実施例2及び実施例3で用いた248種の化学物質を使用して、分子サイズパラメータと分子表面積及び分子表面電子密度とを組み合わせた複合パラメータのみを使用して作成した相関式−4を下に記す。
トレーニングセットの248種の化学物質についてMref、WPSA及びRNCGに対応する数値を相関式−4に代入し、実施例1と同様にして生物濃縮倍率を計算し、生物濃縮倍率の実測値との相関を見たところ表−4に示す結果が得られた。相関式−4におけるR2は0.675であり、RMSEは0.589であった。
次に、leave-one-out法によって検定を行った。
248種の化学物質から1つサンプルを除き、残りのサンプルで相関式を作成した。この相関式-4を用いて、あらかじめ除いていたサンプルの生物濃縮倍率を計算した。これを248種の化学物質全てについて行い、生物濃縮倍率の実測値と相関を見たところ表−4に示す結果が得られた。R2 CVは0.665であり、RMSECVは0.598であり、相関式-4(比較例1)では、カルボニル基の電荷パラメータを使用する相関式−2(実施例2)と比較して精度が著しく低下することが分かった。このように、カルボニル基の電荷パラメータは生物濃縮倍率の決定に非常に重要である。
10 予測システム
20 予測装置
22 制御部
24 情報取得部
26 情報出力部
28 通信部
30 記憶部
32 予測プログラム
34 パラメータ生成プログラム
40 化学物質DBサーバ
50 通信回線
60 設定画面
62 分子サイズパラメータ選択ボタン
64 選択ボタン
66 電荷パラメータ選択ボタン
68 水素結合パラメータ選択ボタン
69 指示ボタン
70 選択肢画面

Claims (11)

  1. 生物濃縮倍率と、分子サイズパラメータ、分子表面積と分子表面電子密度との組合せによる複合パラメータ及びカルボニル基の電荷パラメータを含む複数のパラメータと、を含む判別式を設定する設定手段と、
    生物濃縮倍率が既知の複数の既知化学物質の構造式情報に基づいて、生物濃縮倍率値と複数のパラメータ値との組を複数組含むトレーニングセットを生成する生成手段と、
    前記トレーニングセットを用いた重回帰解析により前記判別式に基づいて相関式を決定する決定手段と、
    生物濃縮倍率が未知の未知化学物質の構造式情報に基づいて複数のパラメータ値を取得し、取得されたパラメータ値を決定された相関式に代入して生物濃縮倍率の予測値を算出する算出手段と、
    を有する生物濃縮倍率の予測装置。
  2. 前記複数のパラメータが2以上の複合パラメータを含む、請求項1に記載の生物濃縮倍率の予測装置。
  3. 前記複数のパラメータが水素結合パラメータを更に含む、請求項1または請求項2に記載の生物濃縮倍率の予測装置。
  4. 前記分子サイズパラメータがモル屈折率である、請求項1から請求項3までのいずれか1項に記載の生物濃縮倍率の予測装置。
  5. 生物濃縮倍率値の信頼性を示す予め定めた基準に基づいて、生物濃縮倍率が既知の複数の既知化学物質から前記トレーニングセットの生成に使用する複数の既知化学物質を抽出する抽出手段を更に有し、
    前記生成手段が、抽出された複数の既知化学物質の構造式情報に基づいてトレーニングセットを生成する、
    請求項1から請求項4までのいずれか1項に記載の生物濃縮倍率の予測装置。
  6. 前記基準が、下記(1)〜(7)の少なくとも1つを要件とする請求項5に記載の生物濃縮倍率の予測装置。
    (1) 生物濃縮倍率値が定量的に取得されていること
    (2) 既知化学物質が水中で安定であること
    (3) 生物濃縮倍率値を取得したときの暴露濃度の実測値が設定値に対して70%以上であること
    (4) 生物濃縮倍率値を取得したときの暴露期間が4週間以上であること
    (5) 既知化学物質の化学構造が明確であること
    (6) 既知化学物質の分子量が600以下であること
    (7) 生物濃縮倍率値が暴露期間中に連続して取得された3つ以上の実測値の平均値であること
  7. 前記生物濃縮倍率の予測値を算出する前に、前記決定手段で決定された相関式が予測性能を有するか否かの検定を行う検定手段を更に有し、
    相関式が予測性能を有しない場合には、前記設定手段が前記判別式を再設定する、
    請求項1から請求項6までのいずれか1項に記載の生物濃縮倍率の予測装置。
  8. 前記判別式が、生物濃縮倍率の対数を目的変数とし且つ複数のパラメータを説明変数とする、請求項1から請求項7までのいずれか1項に記載の生物濃縮倍率の予測装置。
  9. 前記判別式が下記式(1)である、請求項1から請求項8までのいずれか1項に記載の生物濃縮倍率の予測装置。

    上記式(1)において、LogBCFは生物濃縮倍率(BCF)の10を底とする対数を表す。Cは定数を表し、a〜aの各々は係数を表す。X〜Xの各々は分子サイズパラメータ、分子表面積と分子表面電子密度との組合せによる複合パラメータ、カルボニル基の電荷パラメータ及び水素結合パラメータのいずれかを表す。x1bar〜xnbarの各々は複数の既知化学物質内でのパラメータ値の平均値を表す。S〜Sの各々は複数の既知化学物質のパラメータ値の標準偏差を表す。
  10. 生物濃縮倍率と、分子サイズパラメータ、分子表面積と分子表面電子密度との組合せによる複合パラメータ及びカルボニル基の電荷パラメータを含む複数のパラメータと、を含む判別式を設定し、
    生物濃縮倍率が既知の複数の既知化学物質の構造式情報に基づいて、生物濃縮倍率値と複数のパラメータ値との組を複数組含むトレーニングセットを生成し、
    前記トレーニングセットを用いた重回帰解析により前記判別式に基づいて相関式を決定し、
    生物濃縮倍率が未知の未知化学物質の構造式情報に基づいて複数のパラメータ値を取得し、取得されたパラメータ値を決定された相関式に代入して生物濃縮倍率の予測値を算出する、
    生物濃縮倍率の予測方法。
  11. 生物濃縮倍率を予測するためのプログラムであって、
    コンピュータを、
    生物濃縮倍率と、分子サイズパラメータ、分子表面積と分子表面電子密度との組合せによる複合パラメータ及びカルボニル基の電荷パラメータを含む複数のパラメータと、を含む判別式を設定する設定手段と、
    生物濃縮倍率が既知の複数の既知化学物質の構造式情報に基づいて、生物濃縮倍率値と複数のパラメータ値との組を複数組含むトレーニングセットを生成する生成手段と、
    前記トレーニングセットを用いた重回帰解析により前記判別式に基づいて相関式を決定する決定手段と、
    生物濃縮倍率が未知の未知化学物質の構造式情報に基づいて複数のパラメータ値を取得し、取得されたパラメータ値を決定された相関式に代入して生物濃縮倍率の予測値を算出する算出手段と、
    して機能させるためのプログラム。
JP2012218314A 2012-09-28 2012-09-28 生物濃縮倍率の予測装置、予測方法及びプログラム Pending JP2014071742A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012218314A JP2014071742A (ja) 2012-09-28 2012-09-28 生物濃縮倍率の予測装置、予測方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012218314A JP2014071742A (ja) 2012-09-28 2012-09-28 生物濃縮倍率の予測装置、予測方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2014071742A true JP2014071742A (ja) 2014-04-21

Family

ID=50746863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012218314A Pending JP2014071742A (ja) 2012-09-28 2012-09-28 生物濃縮倍率の予測装置、予測方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2014071742A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110993019A (zh) * 2019-10-25 2020-04-10 北京师范大学 用于制定水质基准及风险评估的生物富集因子预测方法
CN113707229A (zh) * 2021-08-13 2021-11-26 湖北工业大学 一种基于电子定域化函数的六氟化硫缓冲气体挑选方法
CN116316609A (zh) * 2023-04-17 2023-06-23 刘泓利 基于损耗应用的电量分配系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110993019A (zh) * 2019-10-25 2020-04-10 北京师范大学 用于制定水质基准及风险评估的生物富集因子预测方法
CN110993019B (zh) * 2019-10-25 2020-11-27 北京师范大学 用于制定水质基准及风险评估的生物富集因子预测方法
CN113707229A (zh) * 2021-08-13 2021-11-26 湖北工业大学 一种基于电子定域化函数的六氟化硫缓冲气体挑选方法
CN113707229B (zh) * 2021-08-13 2023-06-09 湖北工业大学 一种基于电子定域化函数的六氟化硫缓冲气体挑选方法
CN116316609A (zh) * 2023-04-17 2023-06-23 刘泓利 基于损耗应用的电量分配系统
CN116316609B (zh) * 2023-04-17 2024-04-09 泰州开泰电力设计有限公司 基于损耗应用的电量分配系统

Similar Documents

Publication Publication Date Title
Shi et al. Probing the differential tissue distribution and bioaccumulation behavior of per-and polyfluoroalkyl substances of varying chain-lengths, isomeric structures and functional groups in crucian carp
Armitage et al. Application of mass balance models and the chemical activity concept to facilitate the use of in vitro toxicity data for risk assessment
Cao et al. Screening of potential PFOS alternatives to decrease liver bioaccumulation: experimental and computational approaches
Gomis et al. Comparing the toxic potency in vivo of long-chain perfluoroalkyl acids and fluorinated alternatives
Armitage et al. Development and evaluation of a mechanistic bioconcentration model for ionogenic organic chemicals in fish
Endo et al. General model for estimating partition coefficients to organisms and their tissues using the biological compositions and polyparameter linear free energy relationships
De Silva et al. Phosphorus-containing fluorinated organics: polyfluoroalkyl phosphoric acid diesters (diPAPs), perfluorophosphonates (PFPAs), and perfluorophosphinates (PFPIAs) in residential indoor dust
Hussain et al. High-affinity olfactory receptor for the death-associated odor cadaverine
Papa et al. Metabolic biotransformation half-lives in fish: QSAR modeling and consensus analysis
Grisoni et al. QSAR models for bioconcentration: is the increase in the complexity justified by more accurate predictions?
Ross et al. Isomer-specific biotransformation of perfluorooctane sulfonamide in Sprague–Dawley rats
Gissi et al. Evaluation and comparison of benchmark QSAR models to predict a relevant REACH endpoint: the bioconcentration factor (BCF)
Patlewicz et al. Building scientific confidence in the development and evaluation of read-across
Khazaee et al. Perfluoroalkyl acid binding with peroxisome proliferator-activated receptors α, γ, and δ, and fatty acid binding proteins by equilibrium dialysis with a comparison of methods
Huang et al. Trophic magnification of short-chain per-and polyfluoroalkyl substances in a terrestrial food chain from the Tibetan Plateau
Arnot et al. Development and evaluation of a database of dietary bioaccumulation test data for organic chemicals in fish
Madden et al. Strategies for the optimisation of in vivo experiments in accordance with the 3Rs philosophy
Kabadi et al. Characterizing biopersistence potential of the metabolite 5: 3 fluorotelomer carboxylic acid after repeated oral exposure to the 6: 2 fluorotelomer alcohol
Li et al. Quantitative structure–activity relationship for prediction of the toxicity of phenols on Photobacterium phosphoreum
Miranda et al. A worldwide evaluation of trophic magnification of per‐and polyfluoroalkyl substances in aquatic ecosystems
Wang et al. Comparison of toxicities to Vibrio fischeri and fish based on discrimination of excess toxicity from baseline level
Wen et al. Linear and non-linear relationships between bioconcentration and hydrophobicity: Theoretical consideration
Sjöström et al. Estimation of human blood LC50 values for use in modeling of in vitro–in vivo data of the ACuteTox project
Wilson et al. Hierarchical dose–response modeling for high-throughput toxicity screening of environmental chemicals
JP2014071742A (ja) 生物濃縮倍率の予測装置、予測方法及びプログラム