WO2021090890A1

WO2021090890A1 - ソフトウェア作成装置、ソフトウェア作成方法、およびプログラム

Info

Publication number: WO2021090890A1
Application number: PCT/JP2020/041384
Authority: WO
Inventors: 落合　俊彦
Original assignee: 大日本印刷株式会社
Priority date: 2019-11-08
Filing date: 2020-11-05
Publication date: 2021-05-14
Also published as: CN113767363B; JP7231056B2; US11733976B2; US20220236956A1; CN113767363A; JPWO2021090890A1

Abstract

本発明は、ソフトウェアの作成を省力化できるソフトウェア作成装置等を提供するものである。本発明に係るソフトウェア作成装置１は、証明写真機等の機器を制御するソフトウェアを作成する。ソフトウェア作成装置１は、複数の処理のそれぞれを実行する複数の基本モジュールを記憶する記憶手段１０１、基本モジュールを用いて深層強化学習を行うことで、証明写真機等の機器における複数の処理を続けて行うソフトウェアを基本モジュールの組合せにより作成するソフトウェア作成手段１０４等を有する。

Description

ソフトウェア作成装置、ソフトウェア作成方法、およびプログラム

　本発明は、ソフトウェアを作成するためのソフトウェア作成装置、ソフトウェア作成方法およびそのプログラムに関する。

　証明写真機では、履歴書やパスポートなどの写真種の選択、ユーザの撮影、撮影画像の調整、課金、プリントといった一連の処理により証明写真等のプリント物を出力する（例えば、特許文献１参照）。

　この際、証明写真機中の制御装置はこれら一連の処理に係るソフトウェアを実行し、証明写真機の機器制御を行う。通常、このソフトウェアは人であるプログラマーが予め作成している。

特開2019-008169号公報

　しかしながら、従来このようなソフトウェアの作成は人が行っていたので時間がかかっていた。また人によってどのようなプログラミングを行うかは異なるので、完成したソフトウェアの品質が異なってしまう場合もあった。

　本発明は上記の問題に鑑みてなされたものであり、ソフトウェアの作成を省力化できるソフトウェア作成装置等を提供することを目的とする。

　前述した課題を解決するための第１の発明は、複数の処理のそれぞれを実行する複数の基本モジュールを保持する記憶手段と、前記基本モジュールを用いて強化学習を行うことで、前記複数の処理を続けて行うソフトウェアを前記基本モジュールの組合せにより作成するソフトウェア作成手段と、を有することを特徴とするソフトウェア作成装置である。

　本発明のソフトウェア作成装置は、AI（Artificial
Intelligence）の一手法である強化学習を用い、既存の基本モジュールを組み合わせて一連の処理を実行するソフトウェアを作成することができる。これによりソフトウェア作成の省力化が可能になり、また一定の品質のソフトウェアを作成できる。

　前記ソフトウェアの作成に用いる強化学習は、深層強化学習であることが望ましい。
　強化学習における行動価値関数等の表現にディープラーニングの手法を利用した深層強化学習を用いることで、高い品質のソフトウェアを多数の基本モジュールから効率良く作成することが可能になる。

　前記ソフトウェア作成装置は、前記ソフトウェアの作成に際し前記ソフトウェアの要求仕様の入力を受け付ける入力受付手段を更に有することが望ましい。例えば、前記要求仕様は、前記ソフトウェアにおけるインプットおよびアウトプット、前記ソフトウェアにおいて使用されるデバイスドライバ、前記ソフトウェアにおいて使用される演算処理モジュールのいずれかを含む。
　これにより、要求仕様に従ったソフトウェアの作成が可能になる。要求仕様は上記のインプットおよびアウトプット、デバイスドライバ、演算処理モジュールなどであり、これらの指定に従ったソフトウェアを作成できる。

　前記入力受付手段は、前記ソフトウェアの作成を行うことができなかった場合に、前記要求仕様の再入力の受付を行うことも望ましい。
　当初入力した要求仕様が不十分であった場合、学習結果が発散方向に向かってソフトウェアの作成を行うことのできない場合がある。本発明ではそのようなケースで要求仕様の再入力を行い、改めてソフトウェアの作成を行うことができる。

　前記ソフトウェアの作成に際しプログラミング言語または開発環境の設定を受け付ける設定受付手段を更に有し、前記ソフトウェア作成手段は、設定された前記プログラミング言語または開発環境に対応する前記基本モジュールを用いて前記ソフトウェアの作成を行うことも望ましい。
　これにより、設定されたプログラミング言語や開発環境に従ったソフトウェアの作成を行うことができる。

　前記ソフトウェアは例えば機器制御を行うものであり、機器中のデバイスについて予め定められた制御プログラムを動作させる。
　これにより、証明写真機などの機器制御を行うソフトウェアの作成が可能になり、ソフトウェアによりデバイスの制御プログラムを動作させて所定の機能を実現することが可能になる。この場合、制御プログラムはそのデバイスについて定められた既存のものであり、ソフトウェア作成装置は制御プログラムの作成は行わない。

　前記ソフトウェア作成装置は、複数の命令を用いて強化学習を行うことで、前記基本モジュールを前記命令の組合せにより作成する基本モジュール作成手段を更に有してもよい。前記基本モジュールの作成に用いる強化学習は、深層強化学習であることが望ましい。
　ソフトウェアの作成に用いる基本モジュールは例えばプログラマーが予め作成したものであるが、簡単なものであれば強化学習により命令を組み合わせて作成することもでき、ソフトウェアの作成をさらに省力化できる。この場合も深層強化学習を用いることで、高い品質の基本モジュールを効率良く作成することが可能になる。

　強化学習における報酬が、コード量、処理時間、バグ数のいずれかを含むことが望ましい。
　これにより、コード量、処理時間、バグ数等の少ないソフトウェアや基本モジュールを作成できる。

　ソフトウェア作成時の強化学習における報酬が、前記基本モジュールの組合せに対してデバッグを行った際のバグ数とバグの重要度に基づく評価値を含むことも望ましい。
　これにより、重大なバグのないソフトウェアを作成できる。また従来はプログラミング段階でバグが無いかどうか人がデバッグを行うが、デバッグに必要な時間も削減できる。

　また、強化学習において報酬を求めるために前記基本モジュールの組合せを動作させるメモリ領域が仮想メモリ上に構築され、前記メモリ領域がプロテクトされることが望ましい。
　これにより、報酬算出時に基本モジュールの組合せが誤動作しても、ソフトウェアの作成に係る他のメモリ領域を壊すことが無くなる。

　前記記憶手段は、異なるプログラミング言語で記述されるが機械語に変換すると同一のものとなる複数の基本モジュールを保持することも望ましい。
　これにより、ソフトウェア作成処理を多様なプログラミング言語に対応させることができる。

　前記ソフトウェア作成手段は、前記ソフトウェアのプログラムをプログラミング言語で記述したソースコードを作成することも望ましい。また、前記ソフトウェア作成手段は、機械語による前記ソフトウェアのプログラムと、前記ソースコードとを作成することも望ましい。
　ソフトウェア作成処理の結果として、人が読めるプログラミング言語で記述したソースコードを作成することにより、ソフトウェアの内容を人が確認できるようになりセキュリティや信頼性の観点から好ましい。このソースコードは、例えば実行形式の機械語によるプログラムとともに提供される。

　第２の発明は、複数の処理のそれぞれを実行する複数の基本モジュールを保持する記憶手段を有するコンピュータが、前記基本モジュールを用いて強化学習を行うことで、前記複数の処理を続けて行うソフトウェアを前記基本モジュールの組合せにより作成することを特徴とするソフトウェア作成方法である。

　第３の発明は、複数の処理のそれぞれを実行する複数の基本モジュールを保持する記憶手段を有するコンピュータを、前記基本モジュールを用いて強化学習を行うことで、前記複数の処理を続けて行うソフトウェアを前記基本モジュールの組合せにより作成するソフトウェア作成手段を有するソフトウェア作成装置として機能させるためのプログラムである。

　また、第１～第３の発明において、前記ソフトウェアで制御する機器が、証明写真機又はボックス型の写真撮影装置であることが望ましい。

　本発明により、ソフトウェアの作成を省力化できるソフトウェア作成装置等を提供できる。

ソフトウェア作成装置１のハードウェア構成を示す図。ソフトウェア作成装置１の機能構成を示す図。基本モジュールについて示す図。ソフトウェア作成方法を示すフローチャート。演算処理モジュール指定画面１００の例。ソフトウェア作成方法について説明する図。証明写真機２を示す図。証明写真機２のハードウェア構成を示す図。証明写真機２の処理を示すフローチャート。基本モジュールについて示す図。

　以下、図面に基づいて本発明の好適な実施形態について詳細に説明する。

（１．ソフトウェア作成装置１）
　図１は本発明の実施形態に係るソフトウェア作成装置１のハードウェア構成を示す図である。ソフトウェア作成装置１は、ソフトウェアの作成を行うためのものであり、制御部１１、記憶部１２、入力部１３、表示部１４、通信制御部１５をバス１６により接続して構成されたコンピュータによって実現できる。但し、ソフトウェア作成装置１はこれに限ることなく適宜様々な構成をとることができる。

　制御部１１はCPU、ROM、RAMなどから構成される。CPUは、記憶部１２、ROMなどの記憶媒体に格納されたソフトウェア作成装置１の処理に係るプログラムをRAM上のワークエリアに呼び出して実行する。ROMは不揮発性メモリであり、ブートプログラムやBIOSなどのプログラム、データなどを恒久的に保持している。RAMは揮発性メモリであり、記憶部１２、ROMなどからロードしたプログラムやデータを一時的に保持するとともに、制御部１１が各種処理を行うために使用するワークエリアを備える。

　記憶部１２はハードディスクドライブやソリッドステートドライブ、フラッシュメモリ等であり、制御部１１が実行するプログラム、プログラム実行に必要なデータ、OSなどが格納される。これらのプログラムやデータは、制御部１１により必要に応じて読み出され実行される。

　入力部１３はソフトウェア作成装置１に各種の設定入力を行うものである。
　表示部１４は例えば液晶ディスプレイ等である。
　通信制御部１５はネットワーク等を介した通信を媒介する通信インタフェースである。
　バス１６は、ソフトウェア作成装置１の各部間の制御信号、データ信号等の授受を媒介する経路である。

　図２はソフトウェア作成装置１の機能構成を示す図である。図２に示すように、ソフトウェア作成装置１は、記憶手段１０１、入力受付手段１０２、設定受付手段１０３、ソフトウェア作成手段１０４、基本モジュール作成手段１０５等を有する。

　記憶手段１０１は、前記の記憶部１２に対応し、ソフトウェアを作成する元となる複数の基本モジュールを独自のライブラリとして保持する。基本モジュールについては後述する。

　入力受付手段１０２は、ソフトウェア作成装置１の制御部１１が、ソフトウェアの作成に際しソフトウェアの要求仕様のユーザによる入力を受け付けるものである。ソフトウェア作成装置１は、入力された要求仕様を用いてソフトウェアの作成を行う。また、入力された要求仕様が不十分でソフトウェアの作成を行うことができなかった場合に、要求仕様の再入力の受付を行う。要求仕様については後述する。

　設定受付手段１０３は、ソフトウェア作成装置１の制御部１１が、ソフトウェアの作成に際しプログラミング言語や開発環境についてのユーザによる設定を受け付けるものである。ソフトウェア作成装置１は、設定されたプログラミング言語や開発環境に対応する基本モジュールを用いてソフトウェアの作成を行う。

　ソフトウェア作成手段１０４は、ソフトウェア作成装置１の制御部１１が、前記の基本モジュールを用いて強化学習を行うことでソフトウェアを作成するものである。本実施形態では特に、強化学習における行動価値関数等の表現にディープラーニングの手法を利用した深層強化学習を用いる。

　基本モジュール作成手段１０５は、ソフトウェア作成装置１の制御部１１が、前記の基本モジュールを、複数の命令を用いて強化学習を行うことで自ら作成するものである。本実施形態では、基本モジュールの作成時にも上記の深層強化学習を行うことができる。

（２．基本モジュール）
　本実施形態のソフトウェア作成装置１は機器制御を行うソフトウェアを作成するものとし、ソフトウェア作成装置１の記憶部１２には、図３に示すようにその機器における複数の処理Ａ～Ｅのそれぞれを実行する複数の基本モジュールがライブラリとして予め保持されているものとする。これら複数の処理Ａ～Ｅはその機器において続けて実行されるものであり、機器の一例として後述する証明写真機が挙げられる。

　これらの基本モジュールは、個々の処理を実行すべく事前にプログラマーが作成していた既存のものであり、作成時に使用したプログラミング言語と開発環境に紐付けて記憶部１２に保持される。例えば基本モジュールＡ１、Ａ２、Ａ３、Ａ４、Ａ５は［処理Ａ］という同じ処理を実現する複数の基本モジュールであるが、誰が作成したか、どのようなプログラミング言語や開発環境を用いたか、等によりその内容は異なっている。

　ソフトウェア作成装置１への基本モジュールの入力方法は特に限定されず、それぞれの基本モジュールを個別に入力してもよいし、プログラマーの作成した一連の処理Ａ～Ｅを行うソフトウェアをソフトウェア作成装置１に入力し、ソフトウェア作成装置１が、入力されたソフトウェアからそれぞれの処理を行う基本モジュールを抽出してもよい。

（３．ソフトウェア作成方法）
　次に、ソフトウェア作成装置１が行うソフトウェア作成方法について図４等を参照して説明する。図４はソフトウェア作成方法を示すフローチャートであり、図４の各ステップはソフトウェア作成装置１の制御部１１が実行する。

　本実施形態ではまずソフトウェア作成装置１が表示部１４に入力画面（不図示）を表示し、ユーザは当該入力画面上で要求仕様を入力する。ソフトウェア作成装置１は、要求仕様の入力を受け付ける（Ｓ１）。

　要求仕様は作成するソフトウェアに応じたものであり、例えばソフトウェアのインプットおよびアウトプット、ソフトウェアで使用されるデバイスドライバ、ソフトウェアで使用される演算処理モジュールの少なくともいずれかの指定を含む。これらはソフトウェア作成装置１が自身でプログラミングを行わないものである。

　本実施形態において、インプットおよびアウトプットは、ソフトウェアが行う一連の処理における入力と出力の定義に関する情報である。

　デバイスドライバは、機器中のデバイスのドライバソフトであり、Ｓ１で要求仕様として入力されたドライバソフトによりデバイスの制御プログラムが実行される。本実施形態のソフトウェア作成装置１はこの制御プログラムの作成は行わず、ソフトウェアは機器中のデバイスについて予め定められた制御プログラムを動作させる。

　演算処理モジュールは、ソフトウェアが使用する演算処理用のプログラムモジュールであり、例えば縦横のインチ単位の長さを入力するとミリメートル単位の面積が出力されるような加減乗除の計算プログラムや、２つの顔画像を入力するとそれらが同一人物かどうかの判定結果を出力するような画像処理プログラムなどを含む。演算処理モジュールは、DLL(Dynamic Link Library)等のライブラリやSDK(Software Development Kit)として、またはそのままモジュールとして提供され、指定された演算処理モジュールはソフトウェアによりそのまま改変せずに使用される。

　演算処理モジュールの指定については、演算処理モジュールおよびその入力と出力を定義した設定ファイルを予め登録しておき、設定ファイルの指定を行うようにしてもよいし、例えば図５のような演算処理モジュール指定画面１００を表示部１４に表示し、モジュール指定欄１１０、入力項目指定欄１２０、出力項目指定欄１３０にて演算処理モジュールおよびその入力と出力を指定できるようにしてもよい。図５の例ではこれらの指定を行った後登録ボタン１４０を押下する。

　次に、ソフトウェア作成装置１は、表示部１４に設定画面（不図示）を表示し、ユーザは当該設定画面上でプログラミング言語と開発環境の設定を行う。ソフトウェア作成装置１は、プログラミング言語と開発環境の設定を受け付ける（Ｓ２）。

　プログラミング言語は、ソフトウェアの作成に用いる基本モジュールで使用されるプログラミング言語である。開発環境は、当該基本モジュールの作成時に使用されている開発環境である。開発環境は、ソースコードの入力、デバッグ、コンパイラ等の処理を行うためのソフトウェアであり、IDE(Integrated Development Environment)などとも呼ばれる。開発環境の例として、例えばVisual Studio等がある。

　これらの入力および設定を行うと、ソフトウェア作成装置１は、記憶部１２に保持された基本モジュールを用いて強化学習を行うことで、前記した複数の処理を続けて行うソフトウェアを基本モジュールの組合せにより作成する（Ｓ３）。

　Ｓ３において、ソフトウェア作成装置１は、例えば記憶部１２に保持された基本モジュールの中から、Ｓ２で設定されたプログラミング言語と開発環境に対応する基本モジュールを抽出し、抽出した基本モジュールを用いて強化学習、特に深層強化学習を行う。深層強化学習では、強化学習における行動価値関数等の表現にディープラーニングの手法が用いられる。

　強化学習および深層強化学習は既知の手法であるので説明を省略するが、本実施形態では、例えばソフトウェア作成装置１が個々の処理Ａ～Ｅについてどの基本モジュールを実行するかや、処理Ａ～Ｅをどの順で実行するかについて選択を行い、これら一連の処理を行う基本モジュールの組合せを作成する。

　図６（ａ）は基本モジュールＡ５、Ｂ１、Ｃ１、Ｄ２、Ｅ４をこの順で実行する組合せが作成された例であり、図６（ｂ）は図６（ａ）において［処理Ｄ］を［処理Ａ］の直後に行うものとし、基本モジュールＡ５、Ｄ２、Ｂ１、Ｃ１、Ｅ４をこの順で実行する組合せが作成された例である。なお、図６の例ではＳ１で要求仕様として入力された演算処理モジュール（図の例では演算処理モジュールＡ）を処理Ｃの後で動作させ、デバイスドライバ（図の例ではドライバＡ）を［処理Ｅ］の後で一連の処理の最後に動作させるものとしているが、これに限ることはない。

　ソフトウェア作成装置１は、上記のように作成した基本モジュールの組合せを動作させ、その結果などから強化学習（深層強化学習）における報酬を求める。報酬は、作成した基本モジュールの組合せのコード量、処理時間、バグ数の少なくともいずれかを含むものとするが、これに限らない。例えば一連の処理が問題なく完了するか、等を報酬に含めてもよい。またコード量は例えばプログラムの行数とするが、これに限ることもない。

　なお、報酬を求める際に基本モジュールの組合せを動作させるメモリ領域は、ソフトウェア作成装置１が管理する仮想メモリ上に構築されるものとし、その誤動作によってソフトウェアの作成に係る他のメモリ領域が壊されることが無いようにプロテクトされることが望ましい。

　強化学習（深層強化学習）では、以上の試行を多数回繰り返し、報酬を最大化できる基本モジュールの選択ルールを作成・更新し、そのルールに従って報酬を最大化できるように基本モジュールを組合せ、ソフトウェアとして出力する。こうしてＳ３におけるソフトウェアの作成が行われる。

　Ｓ１で入力された要求仕様は、強化学習（深層強化学習）で使用する諸関数の設定、基本モジュールの組合せの作成や実行等に用いられる。ただし、入力された要求仕様が不十分で学習結果が発散方向に向かいソフトウェアが作成できないことも考えられる。ソフトウェア作成装置１は、このようなケースにおいて、要求仕様の再入力画面（不図示）を表示し、ユーザに要求仕様の訂正、拡充、整備を行うことを促して要求仕様の再入力を受付けるようにしてもよい。これにより、当初入力した要求仕様が不十分であった場合に、その再入力を行い、改めてソフトウェアの作成を行うことができる。

　また、簡単な処理であればソフトウェア作成装置１が基本モジュールを作成するようにしてもよく、ソフトウェアの作成をさらに省力化できる。この場合も前記と同様強化学習により基本モジュールを作成でき、例えば予め設定した複数の命令を用い、前記と同様の手順で報酬が最大となる命令の組合せを基本モジュールとして出力できる。強化学習としては前記と同様深層強化学習を用いることができ、報酬は前記と同様、コード量、処理時間、バグ数の少なくともいずれかを含むものとできる。ソフトウェア作成装置１は、作成した基本モジュールをプログラマーの作成した基本モジュールとともに記憶部１２にライブラリとして保持し、Ｓ３においてこれらの基本モジュールを用いてソフトウェアの作成を行うことができる。以上は前記した演算処理モジュールにおいても同様であり、ソフトウェア作成装置１は自身で演算処理モジュールを作成することも可能であり、ソフトウェアの中で当該演算処理モジュールの使用を行うことも可能である。

（４．証明写真機２）
　図７は、ソフトウェア作成装置１で作成されたソフトウェアで制御する機器の一例である証明写真機２を示す図であり、図８は証明写真機２のハードウェア構成を示す図である。

　証明写真機２は例えば街頭に設置されたボックス型の写真撮影装置であり、ユーザを撮影してその画像を証明写真などとしてプリントする。証明写真機２は制御装置２０、表示部２１、課金部２２、撮影部２３、照明２４、プリンタ２５等を有する。

　制御装置２０は証明写真機２の内部に設けられ、ソフトウェア作成装置１で作成したソフトウェアを実行することで、証明写真機２の後述する処理を行う。制御装置２０としては例えば制御部、記憶部、入力部、通信部等を備えたコンピュータが用いられる。

　表示部２１は、証明写真機２の入力部を兼ねたタッチパネル付ディスプレイ等により実現される。表示部２１は、ユーザの操作、選択に係る各種の画面を表示し、画面上のタッチパネル操作によるユーザの指示入力等を受付ける。

　課金部２２は、硬貨や紙幣の投入口、つり銭返却口、レシート取出口、レシートプリンタ等（不図示）を備え、ユーザからの課金やレシートの発行を管理する。

　撮影部２３は、撮影窓の内側にカメラ等を設けたものである。カメラには例えば高解像度のデジタルカメラが用いられるが、これに限ることはない。

　照明２４は、証明写真機２のボックス内の全体を照らす照明である。照明２４は例えば白色の光を照射する面光源であり、撮影部２３の上部に設けられるが、これに限ることはない。なお、証明写真機２のボックス内には撮影時のフラッシュ用にストロボ光源も設けられる。

　プリンタ２５は、画像を用紙にプリントするものであり、証明写真機２の内部に設けられる。画像をプリントしたプリント物はプリント物取出口（不図示）に排出される。プリンタ２５の方式や設置台数等は特に問わない。

　図９は証明写真機２の処理の概略を示すフローチャートである。図９の各ステップは制御装置２０が証明写真機２の各部を制御して実行される。

　図９を参照して証明写真機２の処理について簡単に説明すると、証明写真機２は表示部２１に表示される選択画面（不図示）で写真種を選択可能に表示し、ユーザによる写真種の選択を受付けた（Ｓ２１）後、ユーザの撮影を開始する（Ｓ２２）。写真種は用途に応じた写真の種類のことであり、例えば履歴書やパスポートなどである。

　証明写真機２は、ユーザの撮影画像をＳ１で選択された写真種に応じて調整（画像処理）し（Ｓ２３）、ユーザに課金を促すための課金画面を表示部２１に表示する。証明写真機２は、課金部２２によりユーザの課金を受付ける（Ｓ２４）と、調整後の画像を写真種に応じてプリントする（Ｓ２５）。

　証明写真機２の機器制御を行うソフトウェアを作成する場合、記憶部１２には、図１０に示すように例えば［Ａ；写真種の選択］、［Ｂ；ユーザの撮影］、［Ｃ：撮影画像の調整］、［Ｄ；課金］、［Ｅ；プリント］の複数の処理のそれぞれを実行する複数の基本モジュールが保持される。

　なお、基本モジュールＡ１、Ａ２、Ａ３、Ａ４、Ａ５はそれぞれ［Ａ；写真種の選択］を実行するための部分的なプログラムであり、例えば証明写真機２の表示部２１に写真種の選択画面を表示し、当該選択画面上でのユーザのタッチ操作等に応じて写真種の選択を受付ける。

　基本モジュールＢ１、Ｂ２、Ｂ３、Ｂ４、Ｂ５はそれぞれ［Ｂ；ユーザの撮影］を実行するための部分的なプログラムであり、例えば証明写真機２の表示部２１に撮影のためのガイダンス画面を表示し、撮影部２３や照明２４の制御によりユーザの撮影を行う。

　基本モジュールＣ１、Ｃ２、Ｃ３、Ｃ４、Ｃ５はそれぞれ［Ｃ；撮影画像の調整］を実行するための部分的なプログラムであり、例えばユーザの撮影画像に対する画像処理を選択された写真種に応じて行う。すなわち、履歴書やパスポートなどの写真種に応じて証明写真の画像サイズ等は異なり、基本モジュールＣ１、Ｃ２、Ｃ３、Ｃ４、Ｃ５はこれら写真種の違いに応じて画像サイズの変更等の画像処理を行う。

　基本モジュールＤ１、Ｄ２、Ｄ３、Ｄ４、Ｄ５はそれぞれ［Ｄ；課金］を実行するための部分的なプログラムであり、例えば証明写真機２の表示部２１に課金を促すための課金画面を表示させ、課金部２２の制御により正しく課金が行われたことを検出する。

　基本モジュールＥ１、Ｅ２、Ｅ３、Ｅ４、Ｅ５はそれぞれ［Ｅ；プリント］を実行するための部分的なプログラムであり、例えば証明写真機２のプリンタ２５を制御し、選択された写真種に従った用紙への印刷動作や用紙のカット動作を行うことで、撮影画像のプリントを行いプリント物として排出する。

　証明写真機２の機器制御を行うソフトウェアは、これらの基本モジュールを用いて図４等で説明したように作成できる。ここで、ソフトウェア作成装置１は、図１０の実線矢印に例示するように、図１０の処理Ａ～Ｅについて基本モジュールの選択を行い、選択された基本モジュールの組み合わせについての報酬（評価）を前記したように求める。報酬はシンプルなもので例えば前記のコード量やバグ数であり、コード量の合計やバグ数が少ない方が高い報酬となる。ソフトウェア作成装置１は、上記のような基本モジュールの選択と報酬の算出を、例えば各処理Ａ～Ｅについて選択する基本モジュールを変えながら繰り返し（一例を図１０の鎖線矢印に示す）、試行錯誤を行うことで報酬が最大化される基本モジュールの選択ルール（例えば基本モジュールＡ１の後に基本モジュールＢ２を選択する等。強化学習では「政策」とも呼ばれる）を求める。この選択ルールに従って選択を行うことで、処理Ａ～Ｅを続けて行うソフトウェアを作成することができる。以上の方法は、具体的な選択ルールの作成方法も含め強化学習として既知である。

　なおこの場合、Ｓ１で要求仕様として入力されるインプットの例としては「写真種の選択を受け付ける」、「ユーザを撮影した撮影画像を調整する」のような条件定義が挙げられ、アウトプットの例として「プリンタに画像を転送してプリントする」、「料金を徴収する」といった証明写真機２の動作についての定義が挙げられる。その他、インプットやアウトプットはソフトウェアの動作前後に実行されるプログラムなどであってもよい。

　また、Ｓ１で要求仕様として入力されるデバイスドライバは、例えば表示部２１や撮影部２３、プリンタ２５等で使用されるドライバソフトとなり、これらは前記のようにソフトウェアによる処理の最後だけでなく処理の途中でも用いられる。

　以上説明したように、本実施形態のソフトウェア作成装置１は、AIの一手法である強化学習を用い、既存の基本モジュールを組み合わせて一連の処理を実行するソフトウェアを作成することができる。これによりソフトウェア作成の省力化が可能になり、また一定の品質のソフトウェアを作成できる。本実施形態では特に深層強化学習を用いることで、高い品質のソフトウェアを多数の基本モジュールから効率良く作成することが可能になる。

　また本実施形態では、Ｓ１で要求仕様の入力を行うことで、要求仕様に従ったソフトウェアの作成が可能になる。前記したように、要求仕様はソフトウェアにおけるインプットおよびアウトプット、ソフトウェアにおいて使用されるデバイスドライバ、演算処理モジュールなどであり、本実施形態ではこれらの指定に従ったソフトウェアを作成できる。また、当初入力した要求仕様が不十分であり、学習結果が発散方向に向かってソフトウェアの作成を行うことのできない場合、要求仕様の再入力を受付けることで、改めてソフトウェアの作成を行うことができる。

　本実施形態では、さらに、Ｓ２でプログラミング言語や開発環境の設定を行うことで、設定されたプログラミング言語や開発環境に従ったソフトウェアの作成を行うことができる。

　また本実施形態において作成されるソフトウェアは証明写真機２等の機器制御を行うものであり、機器中のデバイスの制御プログラムを動作させて所定の機能を実現することが可能になる。この場合、制御プログラムはデバイスについて定められた既存のものであり、ソフトウェア作成装置１はその制御プログラムの作成は行わない。なお、機器制御を行わないソフトウェア（例えば演算のみ行うソフトウェア）を本実施形態の手法で作成することも可能であり、その場合はデバイスの制御プログラムの動作も不要でソフトウェアの作成処理がより簡単になる。

　また本実施形態では、簡単な処理であれば強化学習により基本モジュールを作成することも可能であり、ソフトウェアの作成をさらに省力化できる。この場合も深層強化学習を用いることで、高い品質の基本モジュールを効率良く作成することが可能になる。

　ソフトウェアや基本モジュールの作成時には、強化学習における報酬としてコード量、処理時間、バグ数の少なさを考慮することで、コード量、処理時間、バグ数等の少ないソフトウェアや基本モジュールを作成できる。

　また、報酬を求める際に基本モジュールの組合せを動作させるメモリ領域を、仮想メモリ上に構築してプロテクトすることで、その誤動作によりソフトウェアの作成に係る他のメモリ領域が壊されることがない。

　しかしながら、本発明はこれに限らない。例えば強化学習における報酬は前記に限らず、ソフトウェアの作成時であれば、基本モジュールの組合せに対し所定の評価プログラムを用いて様々な条件下でデバッグを実行し、その際検出されたバグ数と個々のバグの重要度（深刻度）に基づく評価値を報酬とすることもできる。評価値は、例えば検出されたバグごとの重要度を加算することで得られるが、これに限ることはない。バグの重要度はバグの影響の深刻さの度合い（例えばバグにより処理の実行自体が不可能になる、処理はできるがバグにより誤った処理結果になる等）や発生頻度などに基づいて定めることができ、これにより重大なバグのないソフトウェアを作成できる。また従来はプログラミング段階でバグが無いかどうか人がデバッグを行うが、デバッグに必要な時間も削減できる。

　また、基本モジュールの組合せを動作させる際、ソフトウェア作成装置１はＳ２で設定されたプログラミング言語で記述されている基本モジュールを機械語に変換して実行し、Ｓ３で作成されるソフトウェアは、そのプログラムが機械語で記述されたものとなる可能性がある。この場合、その機械語をＳ２で設定されたプログラミング言語に逆変換し、人が読んで理解できるソースコードを作成することも可能であり、ソフトウェアの内容を人が確認できるようになりセキュリティや信頼性の観点から望ましい。また、実行形式の機械語によるソフトウェアのプログラムと、上記のソースコードとをＳ３において作成することも可能である。

　また、ソフトウェア作成装置１は、あるプログラミング言語で記述された基本モジュールを機械語に変換し、それを様々なプログラミング言語に逆変換することで、異なるプログラミング言語で記述されるが機械語に変換すると同一のものとなる複数の基本モジュールを作成することも可能である。これらをライブラリとして記憶部１２に保持することで、ソフトウェア作成処理を多様なプログラミング言語に対応させることができる。

　以上、添付図面を参照して、本発明の好適な実施形態について説明したが、本発明は係る例に限定されない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。

１：ソフトウェア作成装置
２：証明写真機
１０１：記憶手段
１０２：入力受付手段
１０３：設定受付手段
１０４：ソフトウェア作成手段
１０５：基本モジュール作成手段
Ａ１～Ａ５、Ｂ１～Ｂ５、Ｃ１～Ｃ５、Ｄ１～Ｄ５、Ｅ１～Ｅ５：基本モジュール

Claims

　複数の処理のそれぞれを実行する複数の基本モジュールを保持する記憶手段と、
　前記基本モジュールを用いて強化学習を行うことで、前記複数の処理を続けて行うソフトウェアを前記基本モジュールの組合せにより作成するソフトウェア作成手段と、
　を有することを特徴とするソフトウェア作成装置。
　前記ソフトウェアの作成に用いる強化学習は、深層強化学習であることを特徴とする請求項１記載のソフトウェア作成装置。
　前記ソフトウェアの作成に際し前記ソフトウェアの要求仕様の入力を受け付ける入力受付手段を更に有することを特徴とする請求項１または請求項２記載のソフトウェア作成装置。
　前記要求仕様は、前記ソフトウェアにおけるインプットおよびアウトプット、前記ソフトウェアにおいて使用されるデバイスドライバ、前記ソフトウェアにおいて使用される演算処理モジュールのいずれかを含むことを特徴とする請求項３記載のソフトウェア作成装置。
　前記入力受付手段は、前記ソフトウェアの作成を行うことができなかった場合に、前記要求仕様の再入力の受付を行うことを特徴とする請求項３または請求項４記載のソフトウェア作成装置。
　前記ソフトウェアの作成に際しプログラミング言語または開発環境の設定を受け付ける設定受付手段を更に有し、
　前記ソフトウェア作成手段は、設定された前記プログラミング言語または開発環境に対応する前記基本モジュールを用いて前記ソフトウェアの作成を行うことを特徴とする請求項１から請求項５のいずれかに記載のソフトウェア作成装置。
　前記ソフトウェアは機器制御を行うものであり、機器中のデバイスについて予め定められた制御プログラムを動作させることを特徴とする請求項１から請求項６のいずれかに記載のソフトウェア作成装置。
　複数の命令を用いて強化学習を行うことで、前記基本モジュールを前記命令の組合せにより作成する基本モジュール作成手段を更に有することを特徴とする請求項１から請求項７のいずれかに記載のソフトウェア作成装置。
　前記基本モジュールの作成に用いる強化学習は、深層強化学習であることを特徴とする請求項８に記載のソフトウェア作成装置。
　強化学習における報酬が、コード量、処理時間、バグ数のいずれかを含むことを特徴とする請求項１から請求項９のいずれかに記載のソフトウェア作成装置。
　ソフトウェア作成時の強化学習における報酬が、前記基本モジュールの組合せに対してデバッグを行った際のバグ数とバグの重要度に基づく評価値を含むことを特徴とする請求項１から請求項１０のいずれかに記載のソフトウェア作成装置。
　強化学習において報酬を求めるために前記基本モジュールの組合せを動作させるメモリ領域が仮想メモリ上に構築され、前記メモリ領域がプロテクトされることを特徴とする請求項１から請求項１１のいずれかに記載のソフトウェア作成装置。
　前記記憶手段は、異なるプログラミング言語で記述されるが機械語に変換すると同一のものとなる複数の基本モジュールを保持することを特徴とする請求項１から請求項１２のいずれかに記載のソフトウェア作成装置。
　前記ソフトウェア作成手段は、前記ソフトウェアのプログラムをプログラミング言語で記述したソースコードを作成することを特徴とする請求項１から請求項１３のいずれかに記載のソフトウェア作成装置。
　前記ソフトウェア作成手段は、機械語による前記ソフトウェアのプログラムと、前記ソースコードとを作成することを特徴とする請求項１４に記載のソフトウェア作成装置。
　複数の処理のそれぞれを実行する複数の基本モジュールを保持する記憶手段を有するコンピュータが、
　前記基本モジュールを用いて強化学習を行うことで、前記複数の処理を続けて行うソフトウェアを前記基本モジュールの組合せにより作成することを特徴とするソフトウェア作成方法。
　複数の処理のそれぞれを実行する複数の基本モジュールを保持する記憶手段を有するコンピュータを、
　前記基本モジュールを用いて強化学習を行うことで、前記複数の処理を続けて行うソフトウェアを前記基本モジュールの組合せにより作成するソフトウェア作成手段を有するソフトウェア作成装置として機能させるためのプログラム。
　前記ソフトウェアで制御する機器が、証明写真機又はボックス型の写真撮影装置であることを特徴とする請求項１から請求項１５のいずれかに記載のソフトウェア作成装置。
　前記ソフトウェアで制御する機器が、証明写真機又はボックス型の写真撮影装置であることを特徴とする請求項１６に記載のソフトウェア作成方法。
　前記ソフトウェアで制御する機器が、証明写真機又はボックス型の写真撮影装置であることを特徴とする請求項１７に記載のプログラム。