WO2021100597A1

WO2021100597A1 - 人工知能システムの安全性検証システム、安全性検証方法、および安全性検証プログラム

Info

Publication number: WO2021100597A1
Application number: PCT/JP2020/042229
Authority: WO
Inventors: 秀樹野本; 康貴道浦; 翔太飯野
Original assignee: 有人宇宙システム株式会社
Priority date: 2019-11-22
Filing date: 2020-11-12
Publication date: 2021-05-27
Also published as: EP4002127A4; JPWO2021100597A1; US11593253B2; EP4002127A1; US20220269588A1; CN114270323A; JP7007529B2; KR20220034246A; CN114270323B; KR102442416B1

Abstract

人工知能システムの安全性を検証する有効なシステムを提供する。　人工知能システムの安全性検証を行うためのテストに用いられる複数の第１のテストデータのそれぞれにおける、当該人工知能システムにおいて用いられていると予測される複数の特徴量の値を含む特徴量情報を受け付ける特徴量情報受付部１４と、複数の特徴量が取りうる値の組み合わせのうちの複数の第１のテストデータに含まれない組み合わせである第１の組み合わせ、または、複数の特徴量が取りうる値の組み合わせのうちの人工知能によって導き出されるべき正しい解析結果が複数関連付けられる組み合わせである第２の組み合わせを判断する判断部１６と、を備える安全性検証システム。

Description

人工知能システムの安全性検証システム、安全性検証方法、および安全性検証プログラム

　本発明は、人工知能システムの安全性検証のための方法に関する。

　近年においてディープニューラルネットワーク（ＤＮＮ）等の内部論理構造を知ることができないブラックボックス型人工知能の有効性が高まっており、これを様々な分野で利用したいという需要が高まっている。人工知能システムを利用する際には、その安全性が問題となる場合がある。人工知能システムの安全性を担保する上では、確率論的に高い正解率を実現しているとしても、学習の結果獲得された内部論理構造の妥当性が判断できることが重要となる。なお、同様の問題は、ホワイトボックス型人工知能においても存在する。

　しかしながら、従来、人工知能システムの安全性を検証する有効なシステムが存在しなかった。
　本発明は、このような課題に鑑みてなされたものである。

　上記課題を解決するために、本発明の一態様は、人工知能システムの安全性検証を行うためのテストに用いられる複数の第１のテストデータのそれぞれにおける、前記人工知能システムにおいて用いられていると予測される複数の特徴量の値を含む特徴量情報を受け付ける特徴量情報受付部と、前記複数の特徴量が取りうる値の組み合わせのうちの前記複数の第１のテストデータに含まれない組み合わせである第１の組み合わせ、または、前記複数の特徴量が取りうる値の組み合わせのうちの前記人工知能によって導き出されるべき正しい解析結果が複数関連付けられる組み合わせである第２の組み合わせを判断する判断部と、を備える安全性検証システムである。

　また、本発明の他の態様は、コンピュータシステムによって実行される方法であって、人工知能システムの安全性検証を行うためのテストに用いられる複数の第１のテストデータのそれぞれにおける、前記人工知能システムにおいて用いられていると予測される複数の特徴量の値を含む特徴量情報を受け付けるステップと、前記複数の特徴量が取りうる値の組み合わせのうちの前記複数の第１のテストデータに含まれない組み合わせである第１の組み合わせ、または、前記複数の特徴量が取りうる値の組み合わせのうちの前記人工知能によって導き出されるべき正しい解析結果が複数関連付けられる組み合わせである第２の組み合わせを判断するステップと、を備える方法である。

　また、本発明の他の態様は、上記の方法をコンピュータシステムに実行させるためのプログラムである。

本発明の一実施形態に係る安全性検証システムの構成例を示す図である。本発明の一実施形態に係る安全性検証システムのハードウェア構成の一例を示す図である。ＦＲＡＭモデリングの一例を示す図である。ＦＲＡＭモデリングにおける機能の６要素を説明する図である。本発明の一実施形態に係る安全性検証システムにおける機能の６要素を示す図である。本発明の一実施形態に係る安全性検証システムにおける機能の６要素をＦＲＡＭモデルによって表した図である。本発明の一実施形態に係る安全性検証システムにおいてＦＲＡＭ分析によって識別された条件を示す図である。本発明の一実施形態に係る安全性検証システムにおいて識別された条件についてＴｒｕｅ／Ｆａｌｓｅのラベル付けを行った結果を示す図である。本発明の一実施形態に係る安全性検証システムにおいてＦＲＡＭ分析によって新たに識別された条件を示す図である。人工知能システムのテスト結果をＳｐｅｃＴＲＭ－ＲＬ言語に書き起こしたものに対して、完全性解析と一貫性解析とを行った結果を示す図である。本発明の一実施形態に係る安全性検証システムにおける完全性解析の結果を示す図である。本発明の一実施形態に係る安全性検証システムにおける一貫性解析の結果を示す図である。追加された制御パラメータを示す図である。制御パラメータを追加した後の本発明の一実施形態に係る安全性検証システムにおける一貫性解析の結果を示す図である。制御パラメータを追加した後の本発明の一実施形態に係る安全性検証システムにおける一貫性解析の結果を示す図である。制御パラメータを追加した後の本発明の一実施形態に係る安全性検証システムにおける一貫性解析の結果を示す図である。制御パラメータを追加した後の本発明の一実施形態に係る安全性検証システムにおける一貫性解析の結果を示す図である。本発明の一実施形態に係る安全性検証システムにおけるＬＩＭＥの出力結果を示す図である。本発明の一実施形態に係る安全性検証システムにおける処理の一例を示すフロー図である。本発明の一実施形態に係る安全性検証システムにおけるＡＣＥの出力の一例を示す図である。

（第１の実施形態）
　以下、図面を参照しながら本発明の実施形態について詳しく説明する。本実施形態に係る安全性検証システムは、あるタスクが課された人工知能システムの安全性検証を行うシステムである。本実施形態においては、一例として、人工知能システムは、車両が載っている画像データを入力データとし、当該画像上の車両がトラックであるか乗用車であるかを判定するための人工知能システムであることとする。ただし、これはあくまで一例であって、他のタスクを課される人工知能システムであっても、本実施形態に係る安全性検証システムは、当該人工知能システムの安全性検証を行うことが可能である。

（安全性検証システムの構成）
　図１は、本実施形態に係る安全性検証システムの構成例を示す図である。図１に示されるように、本実施形態に係る安全性検証システム１は、特徴量情報受付部１４と、判断部１６と、変更部１８と、出力部２０と、を備える。安全性検証システム１は、人工知能システム（図示されない）の安全性の検証を行うためのシステムである。

　特徴量情報受付部１４は、人工知能システムの安全性検証を行うためのテストに用いられる複数の第１のテストデータのそれぞれにおける、当該人工知能システムにおいて用いられていると予測される複数（Ｎ次元）の特徴量の値を含む特徴量情報を受け付ける。特徴量情報は、第１の各テストデータについての、人工知能によって導き出されるべき正しい解析結果と、第１の各テストデータにおける複数の特徴量の値と、を関連付けた情報であってよい。例えば、本実施形態においては、トラックまたは乗用車の車両が写っている画像データが人工知能システムのテスト対象である第１のテストデータである。また、「人工知能によって導き出されるべき正しい解析結果」とは、本実施形態の場合、各テストデータについての“トラック”または“乗用車”である。また、「特徴量の値」とは、人工知能システムの処理対象であるテストデータにおける、特徴量であるパラメータの値などが該当する。本実施形態においては、車両が写っている画像データにおいて、荷台、車輪数、タンク、等の各特徴量が存在するか、または条件を満たすか、を示すＴｒｕｅ／Ｆａｌｓｅ（または両方の値を取りうる。以下同様。）が「特徴量の値」に該当する。なお、特徴量情報を受け付ける処理は、例えば安全性検証システム１のユーザのキーボードやマウス等の入力装置の操作に従って実行されてもよい。なお、人工知能システムにおいて用いられていると予測される特徴量は、ＦＲＡＭ（Functional Resonance Analysis Method：機能共鳴分析手法）を用いて決定されうる。

　より具体的には、例えば、安全性検証システム１のユーザが、テストデータであるトラックまたは乗用車の車両が写っている画像を目視して当該画像について各パラメータ（例えば、荷台、車輪数、タンク、等の各特徴量）の値と、当該画像上の車両がトラックであるか乗用車であるかを示すデータ（人工知能によって導き出されるべき正しい解析結果）とを、キーボード等を使用して安全性検証システム１に入力する。この作業を全ての画像について実行する。安全性検証システム１は、入力された各パラメータの値およびトラックであるか乗用車であるかを示すデータを、各画像に関連付けてメモリ等に記憶する。なお、特徴量情報は、入力装置を用いて直接、安全性検証システム１に入力されなくてもよい。例えば外部のコンピュータ装置において特徴量情報が記録されたリムーバブルメモリ等の記録媒体から特徴量情報を読み出すことによって、または当該外部のコンピュータ装置から有線または無線のネットワークを介して送信されること等によって、安全性検証システム１に入力されてもよい。また、特徴量情報の決定および安全性検証システム１への入力は、その一部または全てがコンピュータプログラムによって自動化されてもよい。その場合には特徴量情報受付部１４は、当該コンピュータプログラムから特徴量情報を受け付けてもよい。

　判断部１６は、複数の特徴量が取りうる値の組み合わせのうちの複数の第１のテストデータに含まれない組み合わせである第１の組み合わせ、または、複数の特徴量が取りうる値の組み合わせのうちの人工知能によって導き出されるべき正しい解析結果が複数関連付けられる組み合わせである第２の組み合わせを判断する。第１の組み合わせは、人工知能システムにおいてテストされていない特徴量の値の組み合わせを示す。すなわち、人工知能システムがテストしていないが故に、将来にそのような特徴量の値の組み合わせを有するデータが当該人工知能システムに入力された場合（処理させられた場合）には人工知能システムが適切に判断できないであろう組み合わせであり、テストデータの不完全性を示す組み合わせである。

　また、第２の組み合わせは、各特徴量の値は同じであるのにも関わらず答え（トラックまたは乗用車）が複数存在するような場合が該当する。例えば本実施形態においては、画像中の車両がトラックである画像と乗用車である画像とにおいて、荷台、車輪数、タンク、等の各特徴量のＴｒｕｅ／Ｆａｌｓｅの組み合わせが同じになる組み合わせが第２の組み合わせに該当する。このようなテストデータを人工知能システムがテストしていた場合、将来の当該各特徴量の値の組み合わせを有する車両の画像データが人工知能システムに入力された場合には、当該人工知能システムは、当該画像データ上の車両がトラックであるか乗用車であるかを適切に判断できない可能性がある。このような特徴量の値の組み合わせである第２の組み合わせは、人工知能システムが、一貫性が欠如している可能性を示す組み合わせである。また、安全性検証システム１は、判断部１６が、このような一貫性の欠如を示す特徴量の値の第２の組み合わせが第１のテストデータに存在すると判断した場合には、特徴量情報受付部１４は、さらに採用すべき新たな別の特徴量の値を含む特徴量情報を受け付ける。

　変更部１８は、複数の第１のテストデータについて、特徴量の値の組み合わせであって第１のテストデータには含まれない第１の組み合わせが存在する場合には、当該第１の組み合わせを有する新たな第２のテストデータを複数の第１のテストデータに追加する。この追加の処理は、例えば安全性検証システム１のユーザのキーボードやマウス等の入力装置の操作に従って実行されてもよいし、一部または全てがコンピュータプログラムによって行われてもよい。さらに、第２のテストデータが記録された記録媒体から第２のテストデータを読み取ることによって追加されてもよい。そして、人工知能システムがこの第２のテストデータが追加されたテストデータのセットをテストすることにより、複数の特徴量が取りうる値の全ての組み合わせを有するテストデータを人工知能システムがテストすることになる。すなわち、これにより人工知能システムの完全性が担保される。

　また、第２のテストデータが追加された後にさらに一貫性が担保されているかの確認が行われ、一貫性が欠如していると判断された場合には、新たな特徴量を採用するようになっていてもよい。同様に、一貫性が欠如していると判断されて新たな特徴量が採用された後にテストデータの完全性が担保されているかの確認が行われ、完全性が欠如していると判断された場合には、新たなテストデータが追加されるようになっていてもよい。

　出力部２０は、変更部１８によって追加された第２のテストデータを含む人工知能システムのテストデータを人工知能システムに出力する。人工知能システムは、出力部２０によって出力された第２のテストデータを含む新たなテストデータのセットを用いてテストを実行することで、完全性が担保される。なお、出力部２０を有するコンピュータ装置と、人工知能システムが動作するコンピュータ装置とが異なる装置である場合には、出力部２０は、人工知能システムが動作するコンピュータ装置に対して、有線または無線のネットワークを介してテストデータを出力してもよいし、リムーバブルメモリ等の記録媒体を介して出力してもよい（出力部２０は記録媒体へ出力してもよい）。また、両コンピュータ装置が同一の装置であった場合には、コンピュータ装置の内部において、テストデータを生成するプログラムから人工知能システムを実現するプログラムに対して当該テストデータを渡す処理などが出力部２０の機能に該当しうる。

　なお、以上説明した安全性検証システム１の構成はあくまで一例であって、これに限定されるものではない。

（ハードウェア構成）
　上記説明された安全性検証システム１は、一般的なコンピュータ装置と同様のハードウェア構成によって実現可能である。図２は、安全性検証システム１のハードウェア構成の一例を示す図である。図２に示されるコンピュータ装置４０は、一例として、プロセッサ４１と、ＲＡＭ（Random Access Memory）４２と、ＲＯＭ（Read Only Memory）４３と、内蔵のハードディスク装置４４と、外付けハードディスク装置、ＣＤ、ＤＶＤ、ＵＳＢメモリ、メモリスティック、ＳＤカード等のリムーバブルメモリ４５と、ユーザがコンピュータ装置４０と各種のデータのやり取りを行うための入出力ユーザインタフェース４６（キーボード、マウス、タッチパネル、スピーカ、マイク、ランプ等）と、他のコンピュータ装置と通信可能な有線／無線の通信インタフェース４７と、ディスプレイ４８と、を備える。本実施形態に係る安全性検証システム１の各機能は、例えば、プロセッサ４１が、ハードディスク装置４４やＲＯＭ４３、リムーバブルメモリ４５等にあらかじめ格納されたプログラムをＲＡＭ４２等のメモリに読み出し、処理に必要な上述された各データを、ハードディスク装置４４やＲＯＭ４３、リムーバブルメモリ４５等から適宜読み出しながらプログラムを実行することで実現されうる。

　なお、本実施形態の安全性検証システム１は単一のコンピュータ装置として構成されていてもよいし、複数のコンピュータ装置によって構成されていてもよい。後者である場合には、上述した安全性検証システム１の各機能が複数のコンピュータ装置によって分散的に実現されており、それぞれのコンピュータ装置が図２に示されるコンピュータ装置４０の構成と同一又は類似の構成を備えていてもよい。

　なお、図２に示されるハードウェア構成はあくまで一例であって、これに限定されるものではない。

（具体例）
　以下、本実施形態に係る安全性検証システム１による人工知能システムの安全性検証方法の具体例が示される。本実施形態においては、一例として、人工知能システムは車両が載っている画像データを入力データとし、画像上の車両がトラックであるか乗用車であるかを判断するタスクが与えられているものとする。

　本具体例においては、ＦＲＡＭ（Functional Resonance Analysis Method）と、ＳｐｅｃＴＲＭ（Specification Tools and Requirement Methodology）という２つの技術を利用する。ＦＲＡＭは、人工知能システムが獲得していると想定される論理構造をモデリングするために使用される。また、ＳｐｅｃＴＲＭは、人工知能システムのテスト結果を分析し、ＦＲＡＭモデルの修正、および、安全性の立証に使用される。

　本具体例では、まず、ブラックボックス型人工知能システムの内部論理構造を明らかにしうる手法が開示される。また、得られた内部論理構造に照らし合わせ、安全性を形式手法によって網羅的に立証しうる手法が開示される。また、この２つの手法の組み合わせにより、以下の３点が達成されうる：
（１）ブラックボックス型人工知能システムがＦＲＡＭ手法によりホワイトボックス化される。
（２）ホワイトボックス化に利用されたＦＲＡＭモデルの妥当性がＳｐｅｃＴＲＭの一貫性解析アルゴリズムにより立証される。
（３）妥当性が立証された人工知能モデルの全論理パス検証達成がＳｐｅｃＴＲＭの完全性解析アルゴリズムにより立証される。

　本具体例においては、学習データおよびテストデータとして、ＣＩＦＡＲ－１０（https://www.cs.toronto.edu/~kriz/cifar.html）のデータセットから抜粋した自動車とトラックの画像を使用した（学習データとして５０００枚、テストデータ２０００枚）。また、人工知能の実装に関しては、ＣＮＮ（Convolutional Neural Network）を用い、ライブラリはＫｅｒａｓ（Ｔｅｎｓｏｒｆｌｏｗをバックエンド）を利用した。最適化手法としてＲＭＳｐｒｏｐ、活性化関数にシグモイド、さらにドロップアウト（ドロップアウト率０．２）を含めたものを構築した。

（人工知能システムのモデル化）
　本実施形態に係る安全性検証システム１では、まず、ＦＲＡＭ（Functional Resonance Analysis Method：機能共鳴分析手法）を用いて特徴量を決定して、人工知能システムをモデル化する。ＦＲＡＭによるモデリングにおいては、図３に示されるように機能間のカップリングがどのような形で行われているかが図示化される。機能間のカップリングにおいては、図３に示される６種類のいずれかを選ぶことが可能であり、これにより、機能と機能とが単に「関連している」ことを示すだけでなく、「ＡはＢの前提条件となっている」「ＡはＢに資源を供給する」「ＡはＢに動作トリガーを与える」「ＡはＢの制御パラメータを提供する」「ＡはＢに時間制約を与える」など、豊富な意味を与えることができる。これら６つを「機能の６要素」と呼ぶ。これら６要素には図４に示されるように、網羅性があり、機能と機能とのカップリングを漏れなくモデリングすることが可能となっている。図３において、各機能が記述される六角形の各頂点には、Ｉ、Ｐ、Ｃ、Ｒ、Ｔ、Ｏ、の英字が付されており、これらの英字はそれぞれ、図４における、トリガー（Ｉ）、前提条件（Ｐ）、制御パラメータ（Ｃ）、資源（Ｒ）、時間制約（Ｔ）、出力（Ｏ）、を示している。例えば、機能３１の出力（Ｏ）は機能３２の時間制約（Ｔ）になり、機能３３の出力（Ｏ）は機能３２のトリガー（Ｉ）になり、機能３４の出力（Ｏ）は機能３２の制御パラメータ（Ｃ）になる、という具合である。

　例えば、本実施形態のように画像上の車両が乗用車であるかトラックであるかを判定する人工知能を分析しようとする場合、同じことを自然知能がどのような内部論理構造に基づき判定しているのかを想像して人工知能のモデル化を行う。その際、判定に関わる機能がどのようなものであるかをやみくもに考えていては、漏れや間違いが発生しやすい。そこで、ＦＲＡＭのモデリング手法に従い人工知能システムのモデリングを行うと、網羅的に関連機能が識別されうる。

　例えば、「乗用車／トラックを判定する」という機能に「トリガー」を与える入力は何か、同様に、それに「時間制約」を与える機能は何か、というように、インタラクションを分けて考えることにより、漏れを防止することが可能である。図５は、判定機能の６つの要素、それらが受け取るデータ、および、そのデータを出力する機能を列挙した表である。本実施形態においては、人間がＦＲＡＭのモデリング手法に従って、トラックおよび乗用車について図５のような６要素に対応する特徴量を決定する。また、図６は、図５の情報をＦＲＡＭモデルによって表した図である。なお、図５の表は、図６の「トラックと判定」機能の６要素について記述されたものであり、同様に図６の「乗用車と判定」機能の６要素についてもデータが存在し、当該データは、図６に示される通りである。

　図５の表についてさらに説明する。「前提条件」は、機能が動作開始するための十分条件である。ここでは、トラックと乗用車とを判別する機能にとって、決定的な特徴量が該当する。例えば、車輪数＞４であることはトラックとして決定的な特徴量である。一方、「資源」は、必要条件である。枯渇すると機能が停止するが、前提条件のような決定的なものではなく、その存在が無くなると、機能が停止するという消極的なものである。例えば、車輪数＝４であるということは、乗用車であることにとって、決定的な特徴ではない（車輪数＝４のトラックも存在する）が、車輪数が４よりも多いことは、絶対に乗用車には当てはまらないことである。つまり、車輪数＞４という特徴量は、トラックにとっては十分条件であり、車輪数＝４という特徴量は、乗用車にとっては必要条件となる。

　また、ここでは、「時間制約」については、連続画像を前提としたシステムは想定しないとし、１枚の画像で認識が可能であることとした。手法として、単純なニューラルネットワークを使用することを前提とする。複数の画像の履歴から、より動的な認識技術を用いないことを前提としている。また、「制御パラメータ」については、それぞれのパラメータは、それら単独では車種を識別することはできないが、複数のパラメータ値の組み合わせにより総合的に判定に使用される重要な特徴量を制御パラメータとした。例えば、フロントガラスが傾斜しているのは、乗用車によく見られる特徴であるが、傾斜しているフロントガラスを有するトラックも存在する。また、フロントガラスが傾斜していない乗用車も存在する。あくまでも傾向として乗用車にはフロントガラスが傾斜しているものが多く、トラックには少ないというものである。人工知能の学習としては、確率論的に、フロントガラスが傾斜している方が乗用車と判定される度合いが高まるであろう。これらの入出力をＦＲＡＭ　Ｍｏｄｅｌ　Ｖｉｓｕａｌｉｚｅｒ（http://functionalresonance.com/FMV/index.html）を使って可視化したものが、図６である。

　図６に示された判別機能の相関は、人工知能システムへの入力データの変動によって様々な形態に変動しうる。例えば、入力データである画像データに車体の前側が写っていない場合は、ノーズ部の有無に関する情報は人工知能システムに検出されない。逆に車体の後ろ側が写っていない場合は、荷台の有無に関する情報は検出されない。ＦＲＡＭのモデルは、機能の相関の最大変動範囲を示しており、実際の人工知能システムの挙動では、その全部または一部が使われる。一部分のみが使われる場合に、存在可能なバリエーションを列挙することを「インスタンシエーション」と呼ぶ。これについては、後に、フォーマルメソッドを使った網羅的な立証技術がさらに詳述される。ＦＲＡＭモデルから得られる全てのパラメータの組み合わせを網羅するインスタンシエーションを実施し、試験結果に完全性と一貫性があるか否かを検証するという手法である。ここでは、インスタンシエーションの一例について、以下説明する。

　インスタンシエーションでは、人工知能システムの実行結果（テスト結果）である安全性検証システム１への入力データに対して、ＦＲＡＭで識別された各パラメータに対するＴｒｕｅ／Ｆａｌｓｅをラベル付けする。

　当初ＦＲＡＭ分析によって識別された条件は、図７に示される条件であった。また、図８は、これらの条件（特徴量）についてＴｒｕｅ／Ｆａｌｓｅのラベル付けを行った結果を示す表である。

　図８の表の第１列目は、テストに使用された画像である。第２列は、ＸＡＩ（eXplainableAI）ツールであるＬＩＭＥ（Local Interpretable Model-agnostic Explanations）により得られた、ニューラルネットワークが着目している箇所に網掛けまたは塗りつぶしが付された画像である。ＸＡＩは、人工知能が画像の中で着目している点を可視化する技術であり、人工知能の意思決定の論理的根拠を視覚化する技術である。画像中、斜線網掛け部分が、ニューラルネットワークが当該画像を「トラックである」と評価した際に着目した箇所であり、黒塗りつぶし部分が、「トラックではない」と評価した際に着目した箇所である（実際のＬＩＭＥによって示された画像は、図８の斜線網掛け部分は緑色に着色されており、黒塗りつぶし部分は赤に着色されているが、図８においてはそれぞれが斜線網掛けと黒塗りつぶしとによって示されている。図１８も同様。）。ラベル付け作業は、ＬＩＭＥのこれらの出力結果を参考にしながら、ＦＲＡＭモデルで当初識別された図７のパラメータを修正しつつ人間の目視にて行った。この作業の過程で、新たに識別されたパラメータを含む十分条件、必要条件は図９に示された通りであった（この結果が出力されるまでの過程については後に詳述する）。

　トラックにおける縦長ドア形状への着目は、件数的にも非常に多く、当初人間は思いつくことができなかったが、人工知能がとらえたトラックの特徴である。また、「屋根がない＝乗用車の十分条件」という新たに識別されたパラメータ（図９）に対して、その逆である「屋根がある＝トラックの必要条件」（図７）というパラメータのように、当初は論理的な対称性がＦＲＡＭモデルに作りこまれたが、人工知能は、そのような論理的対称性を学習したわけではなく、あくまでも、乗用車の特徴量とトラックの特徴量とを独立に獲得していることが分かった。これは、２値識別タスクに限らず、３値、４値であっても、この学習システムが同じように各カテゴリに独立の特徴量パラメータを識別できることを示しており、安全上好ましい結果であると考えることができる。

　以上の過程を経て、修正されたＦＲＡＭモデルと、当初のＦＲＡＭモデルに、安全上懸念となるような、人工知能側の認識漏れが無いことが判明した。レジリエンス・エンジニアリングでは、当初想定されたＦＲＡＭモデルは、Ｗｏｒｋ　Ａｓ　Ｉｍａｇｉｎｅｄ（ＷＡＩ）、学習結果の実際のモデルは、Ｗｏｒｋ　Ａｓ　Ｄｏｎｅ（ＷＡＤ）と呼ばれ、両者の間に有意な差がある場合は、そこが、人工知能システムの適応によって発生した変化であり、安全性を生み出すレジリエンスの根源であると同時に、意図しないＷＡＤの変化がある場合は、これを、意図しない挙動の原因となるリスク要因ともみなされる。今回のケースでは、ＷＡＤにおいて現れた差は縦長ドア形状という、納得できる人工知能側の発見であったため、これをポジティブにとらえ、安全上の成功要因と識別することができる。

　以下、ラベル付けされた試験データの網羅的な検証を形式手法の一つであるＳｐｅｃＴＲＭを利用して実施した結果についてさらに詳述する。
（ＳｐｅｃＴＲＭ－ＲＬによる安全検証）
　図７に示された当初識別されたパラメータによるＦＲＡＭモデル案を使用して、フォーマルメソッドによる安全検証を行った。フォーマルメソッドで使用した言語は、ＳｐｅｃＴＲＭ－ＲＬ（SpecTRM Requirement Language）である。この言語は、図１０に示されるように、状態遷移に関わる条件分岐の全組み合わせを極めてコンパクトに定義し、定義されていない条件の組み合わせが存在していることを示す完全性の欠如と、同じ条件の組み合わせが複数の状態遷移条件となっていることを示す一貫性の欠如とを識別することを可能にする。

　完全性解析の結果、定義が不足している条件の組み合わせが、図１０の表の“***INCOMPLETE****”の行に、同様に、一貫性解析の結果、複数の状態に同一の条件から遷移可能となっており、システムの挙動に一貫性が無い条件の組み合わせが“***INCONSISTENT****”の行に、出力されている。

　各条件定義には、Tｒｕｅ／Ｆａｌｓｅの２値が定義され、条件には、四則演算などの論理式も含めることができる。また、Ｔｒｕｅを示す“T”、Ｆａｌｓｅを示す“F”のどちらでもよい場合、“*”を利用することによって定義をコンパクトにまとめることができる。

　図１０は、人工知能システムのテスト結果をＳｐｅｃＴＲＭ－ＲＬ言語に書き起こしたものに対して、完全性解析と一貫性解析とを行った結果を示す表である。より具体的には、図１０の表は、テストデータ２０００枚について、各画像上の車両がトラックであるか乗用車であるかを人間の目視で確認するとともに、画像上の車両の各特徴量についてＴｒｕｅ／Ｆａｌｓｅを目視で確認した結果データ（特徴量情報）を特徴量情報受付部１４にて受け付けた後に、判断部１６において当該結果データを集約した結果を示す。この集約の処理は集約用ソフトウェアを使用して行った。ただし、完全性解析と一貫性解析の方法はこれに限定されるものではない。例えば、本例においては人間の目視によってテストデータ２０００枚の全てを確認したが、例えば上記の処理の一部をコンピュータシステムに実行させて作業の効率化を図ってもよい。

　完全性解析アルゴリズムおよび一貫性解析アルゴリズムは、それぞれ以下に示される、式（１）と式（２）で表される。

　ただし、
A：ベクトル“F,F,F,F…F”から“T,T,T,T…T”までを２進数として数値化した全集合
B：人工知能の全テストデータについてベクトル値を、Aと同様に２進数として数値化したもの
n：集合Bの要素数
とする。

　ＳｐｅｃＴＲＭ分析では、テストケースの完全性が完全性解析で確認される。完全性解析の結果、図１１に示される特徴量の値の組み合わせがテストされていないことが判明した。

　人工知能の正解率に関わらず、上記のようにテストされていないケースがある場合は、システムの安全性を示す論拠が不十分となる。このテストが行われるよう、テストデータを改修する必要がある。図１１で示されている不足テストデータは、屋根が無く、リアウィンドウがあるデータ（タルガ（登録商標）トップ型オープンカーなど）、および、荷台が無く、燃料タンクも無いデータなどである。

　次に、テストケースの一貫性を一貫性解析で確認した。一貫性解析の結果、図１２に示されるパラメータ値の組み合わせにおいて、同一条件から異なる判定（“TRUCK”と“AUTOMOBILE”のどちらにも判定された）が出力された。

　図１２に示される一貫性の無いデータは、すべての必須パラメータについて“False”つまり、画像上の車両においていずれの特徴量が一つも存在しないデータであった。この全てのパラメータが“False”であるデータ群に対しては、人工知能システムのみが見出すことのできた、まだ明らかとなっていないパラメータの存在が第一に疑われる。そこで、ＦＲＡＭ分析で抽出された他のパラメータ（「制御」パラメータ群）を使って一貫性が生まれるか否かを検証した。図１４～図１７は、当初のパラメータ（図１２）に、図１３に示される制御パラメータを上から順に一つずつ追加していき、追加された制御パラメータについても２０００枚のテストデータを目視で確認した。

　図１４～図１７に示されるように、大フロントグリル、後席の有無、ノーズ部の有無、およびフロントガラス傾斜に関しては、いずれの値も“*”であり、すなわちいずれのパラメータもトラックと乗用車とに共通にある特徴量であった。そのため、単純に一貫性の欠如が、加えたパラメータによって一つ追加される結果となった。すなわち、これらの特徴量に関しては、学習結果の一貫性を改善する効果が認められなかった。

　そこで、ＦＲＡＭで識別された全てのパラメータのどれにも該当しないパラメータ、つまり、人間には見出されず、人工知能だけが見出し得た特徴量とはどのようなパラメータであったのかを知るために、人間の目視にてすべての特徴量が“Ｆａｌｓｅ”となった画像をつぶさに確認した。その結果、図１８に示すような特徴が見出された。図１８は、ＬＩＭＥの出力結果を示す。

　図１８では、乗用車、トラックともに、フロントバンパー部に斜線網掛けの着目点（人工知能が画像上の車両を「トラックである」と評価した際に着目した箇所）がマークされている。図１８に示される画像（ａ）および（ｂ）の乗用車のフロントバンパーは車体と同色であり、画像（ｃ）および（ｄ）のトラックのフロントバンパーは、車体と異なる色である。

　この特徴量に関しては、１８９件の非一貫性データを４２件に減らすほど、大きな意味を持っていることが分かった。すなわち、この人工知能は、トラックと乗用車とを、フロントバンパーの色によって識別していることが判明した。

　以上のように、ＦＲＡＭにより作成された人工知能システムの内部論理構造モデルの妥当性を評価するために、形式手法の一つであるＳｐｅｃＴＲＭの一貫性解析アルゴリズムを使用した。モデルの一貫性が確保されるまでモデルの修正を行うことにより、人工知能の内部論理構造を人間にとって説明可能な、かつ、出力結果との一貫性を有する形で明らかにすることができる。

　なお、本具体例においては、一貫性が無い場合の例として、すべてのパラメータが“False”であって新たなパラメータを追加する場合について説明したが、他にも、特徴量パラメータを削除または修正するというようなケースもありうる。すなわち、「床下に燃料タンクがある」というパラメータは当初トラックを識別する重要なパラメータと考えられＦＲＡＭモデルに入れられていたが（図７）、検証の結果、人工知能が全く当該特徴量には注目していないことが判明した。よって、当該パラメータが削除され、代わりに、「床下に広い空間がある」という特徴量が新たに採用された（図９）。この「床下に広い空間がある」という特徴量は、図１３～図１７を用いて説明した方法と同様の方法で決定された。

（処理フロー）
　図１９を用いて、本実施形態に係る安全性検証システムにおける処理の一例を説明する。図１９は、ＦＲＡＭを用いて人工知能システムにおいて用いられていると予測される複数の特徴量が決定（人工知能システムの最初のモデル化）された後のＳｐｅｃＴＲＭによる完全性解析および一貫性解析の処理フローの一例を示す。

　ステップＳ１４において、特徴量情報受付部１４において、テストデータである画像上の車両について人工知能システムによって導き出されるべき正しい解析結果（トラック／乗用車）と、画像上の車両についての各特徴量の値（Ｔｒｕｅ／Ｆａｌｓｅ）を示すデータとを含む特徴量情報を受け付ける。採用される特徴量および各特徴量の値は、上述したようにＬＩＭＥツールを利用して決定されうる。なお、当該処理は、後述するようにＡＣＥ（Automated　Concept-based　Explanation)などのツールによって一部または全てが自動化されてもよい。

　次に、ステップＳ１６において、全テストデータの特徴量ベクトルの探索処理を行う。当該処理は、ＳｐｅｃＴＲＭツールなどを用いて処理されうる。本ステップは、主に判断部１６によって実行される。ここで、特徴量ベクトルとは、特徴量の値の組み合わせを示すベクトル値である。例えば、特徴量のセット（荷台、車輪数＞４、タンク、リアウィンドウ、屋根無、テール有）についての値がそれぞれ（F,F,F,T,T,*）であれば、これはベクトル“F,F,F,T,T,*”と表すことができる。本例の場合、特徴量ベクトルは、“F,F,F,F,F,F”～“T,T,T,T,T,T”の値を取りうる。

　ステップＳ１８において、判断部１６は、全てのテストデータにおいて存在しない特徴量ベクトル（特徴量の値の組み合わせ）が存在するか判断する。当該特徴量ベクトルが存在する場合は（ステップＳ１８：Ｙｅｓ）、テストデータが不完全である旨の完全性解析結果を出力する（ステップＳ２０）。

　次にステップＳ２２において、判断部１６は、トラックと乗用車の両方のテストデータにおいて同一の特徴量ベクトルが存在するか判断する。当該特徴量ベクトルが存在する場合は（ステップＳ２２：Ｙｅｓ）、一貫性が無い旨の一貫性解析結果を出力して（ステップＳ２４）、処理を終了する。

　なお、ステップＳ２０において出力された完全性解析結果が、テストデータが不完全である旨の結果である場合には、この後に、テストデータ（第１のテストデータ）中に存在しなかった特徴量ベクトルを有するようなテストデータ（第２のテストデータ）が新たに追加されることで、テストの完全性が担保される。

　また、ステップＳ２４において出力された一貫性解析結果が、人工知能モデルが一貫性が無い旨の結果である場合には、この後に、新たな別の特徴量が追加されて一貫性が担保されるか確認される処理が繰り返されてもよい。より具体的には、例えば、新たな特徴量を加えた特徴量情報についてステップＳ１４からの処理が繰り返される。

　以上の実施形態においては、ブラックボックス型人工知能のテスト結果から、人間が解釈可能なモデルを生成し（ＦＲＡＭ分析）、当該モデルの妥当性をフォーマルメソッドによって確認および改善する方法（ＳｐｅｃＴＲＭ一貫性解析）、および、人工知能のテスト結果の完全性を検証する方法（ＳｐｅｃＴＲＭ完全性解析）が示された。本手法に基づき、人工知能システムの安全検証を行うことにより、ブラックボックスをホワイトボックス化したうえで評価できるだけでなく、人間が思い付くことができなかった新しい論理を人工知能が学習の結果獲得したことを安全検証の結果知ることができるようになる。

　人工知能の安全性検証を考察するに際して、以下の２つの方向性を有することが、本手法の最大の特徴である：
（１）人工知能のテストの不完全性およびモデルの非一貫性を是正する。
（２）人工知能のみが獲得し得た論理に気づき、人間の認知モデルを是正する

　なお、本手法は、ブラックボックス型人工知能のみならず、ホワイトボックス型人工知能にも適用可能である。ホワイトボックス型人工知能の場合であっても、一貫性解析の結果から、人工知能が隠れた条件を獲得していることを発見することが可能であり、その結果、ホワイトボックス・モデルの改善が可能となる。例えば、ＣＮＮの特徴マップの結果を説明する手法を使用して人工知能が獲得した特徴量をできる限り識別したうえでＦＲＡＭモデルを作成することにより、さらに精度の高い説明モデルを作成できる。また、ＳｐｅｃＴＲＭによるフォーマルな検証は、アンサンブルツリーのように説明可能なモデルの組み合わせを利用する仕組みの検証に適用することができる。

　このように、上記実施形態において使用された技術は、既存の人工知能の論理構造の説明技術に代わるものではなく、それらを統合し、より確実に安全性を立証するための方法を提供するものと位置付けることができる。

（第２の実施形態）
　一貫性解析において、前述した式（２）に代えて以下の式（２－１）を採用することができる。

　第１の実施形態に係る発明をコンピュータプログラムで実現する際には、テストデータのベクトル値を、“T”と“F”で表す形式から“0”と“1”の２進数で表す形式に変換したうえで（例えば、“FFFFTTTT”を“00001111”に変換）、値の小さい順に並び替えを行い、最初から順番に隣同士のベクトル値を比較することによって処理していた。これにより、処理速度を高めることが可能であった。

　本実施形態においては、要素ｂ_ｉと要素ｂ_ｊのベクトル値をそれぞれ表す“T”と“F”の文字列データを２進数に変換せず比較することができる。これにより、コンピュータプログラムの実行の際にメモリ消費量を抑えることが可能となり、テストデータ量の増加による極端な性能低下を抑えることが可能である。

（第３の実施形態）
　第１の実施形態においては、ＸＡＩツールとしてＬＩＭＥを用いたが、ＬＩＭＥに代えてＡＣＥ（https://papers.nips.cc/paper/9126-towards-automatic-concept-based-explanations参照）等を用いることが可能である。

　ＡＣＥは、ＸＡＩ技術の１つである。ＡＣＥは、パッチ画像のセットによって理論的根拠を出力する。各セットは、クラスター化された画像の特定の「概念」を表す。例えば、学習したニューラルネットワークが特定の画像から「救急車」を分類すると、ＡＣＥは学習したモデルを分析し、分類タスクの特定の特徴を表す「概念」画像のセットを生成する。

　図２０は、学習済みの人工知能が救急車を識別した際のＡＣＥの出力の一例を示す。本例では、ＩｍａｇｅＮｅｔ（http://www.image-net.org）から抽出されたジープと救急車の画像データを学習済みモデルのGoogLeNet(https://arxiv.org/abs/1409.4842)に学習させた後、「ジープ」と「救急車」の画像（それぞれ２００枚の画像）を使用して人工知能に分類タスクを実行させた際のＡＣＥの出力である。（ａ）と（ｂ）は、それぞれコンセプトごとに出力された画像のセットである。（ａ）の画像セット（ｃｏｎｃｅｐｔ１５）では救急車のオレンジのラインの一部が認識されている。（ｂ）の画像セット（ｃｏｎｃｅｐｔ５）では救急車の白いボディの一部が認識されている。（オレンジのラインと白いボディは、米国における救急車の標準的な外観要件として必須である。）人間がこれらの画像セットを目視することで、人工知能がオレンジのラインと白いボディに着目して救急車であると判断していることを容易に推測することができる。

　前述したように、ＬＩＭＥツールを用いる場合には、図８や図１８に示されるように、各画像において人工知能が着目した画像の一部がピクセル単位で色分けして出力される。そして、これを人間の目視によって確認して、人工知能が着目していると思われる部分を、荷台、タンク、リアウィンドウ、屋根、などのように部品として特定していく。ＬＩＭＥツールが着色した部分をどのような部品として特定するかは、目視した人間が判断する。ＡＣＥは、画像をいくつかの部品に区分けし、注目度の高い部品を類似の部品と同じグループにまとめることにより、ＸＡＩツール自体が各部品の「意味」を示す。これにより、各テストデータについて人工知能がどの特徴を注目しているかの判断がほぼ自動化される。ＡＣＥツールを採用することにより、以下のようなメリットを享受しうる。
（１）ＡＣＥは同様の特徴部分に着目した画像をセットとして出力するため、特徴量を決定する際に人間の主観が入り込む余地をより少なくすることが可能となる。
（２）ＡＣＥは同様の特徴部分に着目した画像をセットとして出力し、人間は出力されたセットから特徴量を決定するため、特徴量決定のための作業時間が大幅に低減される。
（３）ＡＣＥは学習済みのニューラルネットワークモデルを使用してコンセプトを抽出することができる。

　ここまで、本発明の実施形態について説明したが、本発明は上述の実施形態に限定されず、その技術的思想の範囲内において種々異なる形態にて実施されてよいことは言うまでもない。

　また、本発明の範囲は、図示され記載された例示的な実施形態に限定されるものではなく、本発明が目的とするものと均等な効果をもたらすすべての実施形態をも含む。さらに、本発明の範囲は、各請求項により画される発明の特徴の組み合わせに限定されるものではなく、すべての開示されたそれぞれの特徴のうち特定の特徴のあらゆる所望する組み合わせによって画されうる。

１　安全性検証システム
１４　特徴量情報受付部
１６　判断部
１８　変更部
２０　出力部
４０　コンピュータ装置
４１　プロセッサ
４２　ＲＡＭ
４３　ＲＯＭ
４４　ハードディスク装置
４５　リムーバブルメモリ
４６　入出力ユーザインタフェース
４７　通信インタフェース
４８　ディスプレイ

Claims

　人工知能システムの安全性検証を行うためのテストに用いられる複数の第１のテストデータのそれぞれにおける、前記人工知能システムにおいて用いられていると予測される複数の特徴量の値を含む特徴量情報を受け付ける特徴量情報受付部と、
　前記複数の特徴量が取りうる値の組み合わせのうちの前記複数の第１のテストデータに含まれない組み合わせである第１の組み合わせ、または、前記複数の特徴量が取りうる値の組み合わせのうちの前記人工知能によって導き出されるべき正しい解析結果が複数関連付けられる組み合わせである第２の組み合わせを判断する判断部と、
を備える安全性検証システム。
　前記特徴量情報は、前記第１の各テストデータについての、前記人工知能によって導き出されるべき正しい解析結果と、前記第１の各テストデータにおける前記複数の特徴量の値と、を関連付けた情報である、請求項１に記載の安全性検証システム。
　前記複数の特徴量は、ＦＲＡＭ（Functional Resonance Analysis Method：機能共鳴分析手法）を用いて決定される、請求項１または２に記載の安全性検証システム。
　前記複数の第１のテストデータについて前記特徴量の値の前記第１の組み合わせが存在する場合には、前記特徴量の値の前記第１の組み合わせを有する第２のテストデータを前記第１のテストデータに追加する変更部をさらに有する、請求項１から３のいずれか一項に記載の安全性検証システム。
　前記第２のテストデータを含むテストデータを前記人工知能システムに出力する出力部をさらに有する、請求項４に記載の安全性検証システム。
　前記複数の第１のテストデータにおいて前記特徴量の値の前記第２の組み合わせが存在する場合には、前記特徴量情報受付部は、前記複数の特徴量以外の新たな特徴量の値を含む特徴量情報を受け付ける、請求項１から５のいずれか一項に記載の安全性検証システム。
　コンピュータシステムによって実行される方法であって、
　人工知能システムの安全性検証を行うためのテストに用いられる複数の第１のテストデータのそれぞれにおける、前記人工知能システムにおいて用いられていると予測される複数の特徴量の値を含む特徴量情報を受け付けるステップと、
　前記複数の特徴量が取りうる値の組み合わせのうちの前記複数の第１のテストデータに含まれない組み合わせである第１の組み合わせ、または、前記複数の特徴量が取りうる値の組み合わせのうちの前記人工知能によって導き出されるべき正しい解析結果が複数関連付けられる組み合わせである第２の組み合わせを判断するステップと、
を備える方法。
　請求項７に記載の方法をコンピュータシステムに実行させるためのプログラム。