JP6943458B2 - パラメータ最適化装置、パラメータ最適化方法及びコンピュータプログラム - Google Patents

パラメータ最適化装置、パラメータ最適化方法及びコンピュータプログラム Download PDF

Info

Publication number
JP6943458B2
JP6943458B2 JP2019077997A JP2019077997A JP6943458B2 JP 6943458 B2 JP6943458 B2 JP 6943458B2 JP 2019077997 A JP2019077997 A JP 2019077997A JP 2019077997 A JP2019077997 A JP 2019077997A JP 6943458 B2 JP6943458 B2 JP 6943458B2
Authority
JP
Japan
Prior art keywords
dopamine
reward
game
parameter
notice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019077997A
Other languages
English (en)
Other versions
JP2020174792A (ja
Inventor
菊紀 篠原
菊紀 篠原
哲朗 櫻井
哲朗 櫻井
克彦 岡林
克彦 岡林
Original Assignee
一般財団法人パチンコ・パチスロKai総合研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 一般財団法人パチンコ・パチスロKai総合研究所 filed Critical 一般財団法人パチンコ・パチスロKai総合研究所
Priority to JP2019077997A priority Critical patent/JP6943458B2/ja
Publication of JP2020174792A publication Critical patent/JP2020174792A/ja
Application granted granted Critical
Publication of JP6943458B2 publication Critical patent/JP6943458B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Pinball Game Machines (AREA)

Description

この発明は、パラメータ最適化装置、パラメータ最適化方法及びコンピュータプログラムに関する。
パチンコ、スロットマシンに代表される遊技機は、この遊技機を遊技する遊技者が、遊技の結果としていわゆる当たりを獲得し、この結果、遊技者が興趣を感じて遊技を繰り返すことによりその稼働率が上昇する。稼働率の高い遊技機を多数保有し、さらに、パチンコホール等の店舗内に設置される遊技機の稼働率を維持・向上させることが、この店舗の運営者にとっての経営課題であるので、店舗運営者は、遊技機の稼働率を日常的に把握することで、遊技者が感じている興趣を間接的に把握している。
また、遊技機の製造会社にとっても、遊技機の売れ行き向上のために、遊技機の稼働率を日常的に把握して、興趣性の高い遊技機製造に結びつけている。
かかる観点から、本発明者らは、遊技機を遊技者が遊技する際に実際に発生するイベントの発生頻度に基づいてこのイベントの発生頻度をシミュレーションにより取得し、取得したイベントの発生頻度に基づいて、遊技者の脳内に発生すると推定されるドーパミン量を算出することで遊技者の興趣を推定するパラメータ最適化装置を提案した(特許文献1参照)。
特開2018−197968号公報
上述した特許文献1に開示した技術では、遊技機において実際に発生するイベントの発生頻度に基づいてドーパミン量を算出していた。かかる技術を前提として、遊技者の製造会社を含むゲームの製造・制作会社では、ドーパミン量を最大化するゲームのパラメータを最適化する手法の実現が要望されていた。
本発明は上記の課題に鑑みてなされたもので、ゲームのパラメータを最適化することが可能なパラメータ最適化装置、パラメータ最適化方法及びコンピュータプログラムを提供することにある。
上記課題を解決すべく、本発明の一つの観点に従うパラメータ最適化装置は、予告を伴うゲームのイベントの発生確率、予告が演出された際のイベントの期待確率、及びイベントによる報酬の価値を含むゲームのパラメータの初期値が格納された記憶部と、予告及び報酬を報酬系における予告と報酬との組み合わせとみなした際の予告と報酬との関係に基づくドーパミン比の動物実験の結果を用いて定められた評価関数により、ゲームのパラメータに基づいてゲームのプレーヤがゲームをプレイした際にこのプレーヤの脳内に発生されると推定されるドーパミン量を推定するドーパミン量推定部と、パラメータのうち少なくとも発生確率を初期値から予め定めた変動範囲の間で変化させることでドーパミン量推定部により推定されるドーパミン量が最大値となるパラメータの最適値を算出するパラメータ最適化部とを有する。
本発明によれば、ゲームのパラメータを最適化することができる。
実施例のパラメータ最適化装置の概略構成を示すブロック図である。 実施例のパラメータ最適化装置の動作の一例を説明するフローチャートである。 本発明のパラメータ最適化装置に用いられる原理の一例を説明するための図である。 本発明のパラメータ最適化装置に用いられる原理の一例を説明するための図である。 本発明のパラメータ最適化装置に用いられる原理の一例を説明するための図である。 信頼度とドーパミン量との関係の一例を示す図である。 実験例における発生確率と評価関数の値との関係の一例を示す図である。
<本発明に用いられる原理>
本発明の実施の形態を説明する前に、本発明のパラメータ最適化装置に用いられる原理について、図3〜図5を参照して説明する。
近年の脳科学の進展により、ドーパミンと呼ばれる物質が脳内で生成され、このドーパミンを特定の神経系が受容することでヒトに快感が生起されることが判明してきた。
具体的には、ヒト・動物の脳において、欲求が満たされたとき、あるいは満たされることが分かったときに活性化し、その個体に快の感覚を与える、報酬系と呼ばれる神経系の存在が知られている。哺乳類の場合、報酬系は中脳の腹側被蓋野から大脳皮質に投射するドーパミン神経系(別名A10神経系)であると言われている。
報酬系が活性化するのは、必ずしも欲求が満たされたときだけではなく、報酬を得ることを期待して行動をしている時にも活性化する。例えば、喉が渇いているヒトが水を飲んだときには、脳内で報酬系が活性化し快の感覚を感じる。しかし、ヒトであれば歩いている途中に自動販売機を見つけた場合、その時点で水分が飲めることが当然推測できるので、見つけた時点で報酬系が活性化している(以上、"報酬系",[online]、Wikipedia,[平成29年5月18日検索],インターネット<URL: https://ja.wikipedia.org/wiki/%E5%A0%B1%E9%85%AC%E7%B3%BB)。
このような報酬系において実際にヒトの脳内でどの程度のドーパミンが分泌されているかを推定するために、本発明者は、猿を使った動物実験の結果を使用することにした。
この実験では、猿の脳に電極を挿して、報酬となるジュースを与えたときのドーパミン量を計測した。また、報酬を与える前に予告を与え、その後に報酬を与える実験も行った。このとき、確率的に報酬を与えた場合でのドーパミン量の変化も計測した。
具体的には、報酬を与える前にランプの光や音などの報酬の予告を発生させ、その後ある一定の確率のもと報酬を与えるという行為を繰り返す学習をさせ、報酬の予告と報酬の関係性が学習されたもとでのドーパミン量を計測した。このとき、図3に示すような結果となった(Wolfram Schultz," The Reward Signal of Midbrain Dopamine Neurons",News Physiol. Sci.,(米),1999,Vol.14,No. 6,p.249-255、Wolfram Schultz,他6名,"Explicit neural signals reflecting reward uncertainty",Phil. Trans. R. Soc. B,(英),2008, No.363,p.3801-3811)。
上記論文に開示された結果によれば、予告なしに報酬を与えた際のドーパミン値を1とすると、予告の信頼度、つまり確率が25%、50%、75%、100%のときのドーパミン値は図3のような結果となった。予告があった際には、予告時における前倒しのドーパミン値と実際に報酬が得られたときのドーパミン値の2つが発生し、またその際のドーパミンの分泌量の比もわかった。
図3において、1番上のグラフが信頼度0%の場合、2番目のグラフが信頼度25%の場合、3番目のグラフが信頼度50%の場合、4番目のグラフが信頼度75%の場合、5番目のグラフが信頼度100%の場合にあたる。そして、それぞれのグラフの山の高さおよび山頂付近に書かれている数値が計測されたドーパミン値である。
図3に示す実験結果では、例えばパチンコ等の遊技機において単一の予告があった後に大当たり=報酬が得られる場合、つまり単一演出の場合であり、しかも、信頼度=確率が0%、25%、50%、75%及び100%である場合についてのドーパミン量の計測値が開示されている。一方、遊技機で遊技される内容を含むゲームはより複雑なものがあり、しかも、確率も様々な数値を取りうる。
一例として、一般的なパチンコにおいて行われている演出について説明する。
パチンコを遊技して、スタートチャッカーにパチンコ玉が入賞すると所定の確率で抽選が開始されるが、この抽選動作中にさらにスタートチャッカーにパチンコ玉が入賞すると、この入賞についても抽選動作が行われる。しかしながら、抽選動作は順次行われるので、抽選動作中の入賞についても、遊技機は一定回数だけ記憶(保留)する。スタートチャッカーにパチンコ玉が入賞して、保留された入賞について一連の抽選動作が終了して抽選結果が判明する(通常は、遊技機が備える(メイン)デジタルと呼ばれるディスプレイの演出動作により判明する)までの一連の経過は、上述した報酬系における予告と報酬との組み合わせと考えることができる。
次に、抽選の結果、大当たりに至るまでの演出動作が所定の確率で生起する。多くの遊技機では、デジタルにスロットを表示し、このスロットに表示される図柄(例えば3×3の図柄)がいずれかの方向(3×3の図柄であれば横方向及び斜め方向×2)で揃えば大当たり判定への移行動作が行われる。
そして、これも多くの遊技機では、いずれかの方向に図柄が2つ揃った状態(これをリーチと称する)の演出表示をデジタルに表示させ、大当たり判定への期待度を高めるとともに、リーチ状態に突入してから最終的に大当たり判定を行うまでの予告演出動作(リーチ中フローと称する)をデジタルに表示させ、大当たり判定への期待度を高めている。
また、リーチ演出動作に至る前に、このリーチ演出動作が行われることを予告(リーチ前予告と称する)する演出動作が行われることがある。
リーチ演出動作に移行するか、さらに、リーチ後に大当たり演出動作に移行するかについても、やはり所定の確率に基づく抽選が行われる。従って、これらリーチ前予告演出、リーチ中フローの予告演出も、やはり上述した報酬系における予告と報酬との組み合わせと考えることができる。
従って、図3に示す実験結果を用いて、より複雑な予告演出及び大当たり演出に基づくドーパミン量を推定する手法を本発明者らは考案した。その詳細については後述する。
<パラメータ最適化装置の概略構成>
図1は、本実施例のパラメータ最適化装置を構成する情報処理装置10の概略構成を示すブロック図である。
本実施例の情報処理装置10は、例えばパーソナルコンピュータ等であり、制御部11、記憶部12、入力インタフェース(I/F)13及び出力インタフェース(I/F)14を備える。なお、以下の説明において、情報処理装置10に代えてパラメータ最適化装置10としても説明する。
制御部11はCPU等の演算素子を備える。記憶部12内に格納されている図略の制御用プログラムが情報処理装置10の起動時に実行され、この制御用プログラムに基づいて、制御部11は記憶部12等を含む情報処理装置10全体の制御を行うとともに、ドーパミン量推定部20、パラメータ最適化部21、データ取得部22、確率推定部23、及びシミュレーション部24としての機能を実行する。これら各機能部の動作については後述する。
記憶部12はハードディスクドライブ等の大容量記憶媒体、及びROM、RAM等の半導体記憶媒体を備える。この記憶部12には上述の制御用プログラムが格納されているとともに、制御部11の制御動作時に必要とされる各種データが一時的に格納される。また、この記憶部12には、本実施例のパラメータ最適化装置(情報処理装置10)によりパラメータの最適化動作が図られるゲームに関するパラメータ30、及び試技データ31が格納されている。
なお、本実施例のパラメータ最適化装置が適用される(最適化動作が図られる)ゲームの種類に大きな限定はなく、パチンコ等の遊技機、スマートフォン等でプレイされるいわゆるガチャを伴うソーシャルゲーム、スロットマシン(ビデオスロット)等が挙げられる。但し、上述したように、本発明のパラメータ最適化装置は、予告と報酬とからなる報酬系を前提とした実験結果に基づくものであるので、報酬に先立って何らかの予告が伴うものであることが好ましい。加えて、予告が提示されたときの報酬の信頼度=確率を伴うものであることが好ましい。
パラメータ30は、予告を伴うゲームのイベントの発生確率、予告が演出された際のイベントの期待確率、及びイベントによる報酬の価値を表す数値を含む。
パラメータ30がこれらの数値を含むことについて以下説明する。単純化して考えると、個々の予告とイベント(報酬)との組み合わせにおけるドーパミン量は

ドーパミン量=f(期待の大きさ、報酬の有無、報酬の価値)

として定式化される。ここに、f()は括弧内をパラメータとする関数を示す。報酬が得られる条件が整うと期待しワクワクする。報酬が得られれば気分は高揚し、得られなければ残念と落ち込む。また得られた報酬の価値が高ければ高いほど、これらの喜びは増幅される。期待は予告として読み替えることができる。上述したゲームの例では、これらの項目は次のように対応する。

パチンコ・パチスロの場合
・期待の大きさ:特定演出における信頼度
・報酬の有無:当りを引いたか引いていないか
・報酬の価値:得られる球の個数またはコインの個数

ソーシャルゲームの場合
・期待の大きさ:特定演出における信頼度
・報酬の有無:当りを引いたか引いていないか
・報酬の価値:得られるアイテムのレアリティなど

スロットマシン(ビデオスロット)の場合
・期待の大きさ:特定演出における信頼度
・報酬の有無:当りを引いたか引いていないか
・報酬の価値:得られるコインの個数
そして、ゲーム全体のドーパミン量は、個々のドーパミン量がどの程度の割合で出現(発生)するかによって決定する。

ゲームのドーパミン量=f(発生確率、ドーパミン量)
つまり、先ほどの3つの項目を使えば

ゲームのドーパミン量 =f(発生確率、期待の大きさ、報酬の有無、報酬の価値)

として表すことができる。
このときに注意が必要なのが、発生確率は高い方がドーパミン量は出やすくなるのだが安易に高く設定することはできないということである。例えば、パチンコ・パチスロやカジノのスロットマシン(ビデオスロット)では大当りを出せば出すほどユーザーに還元しなければいけなくなり運営を圧迫することになる。またソーシャルゲームでは報酬の価値をレアリティとして捉えるのであるならばレアリティとは手に入れにくさに関連するため発生確率をあげればその分レアリティが下がってしまう。そのため、これら発生確率、期待の大きさ、報酬の有無、報酬の価値に関する調整がゲームの面白くするためにはとても重要となってくる。
さらに、ゲームのドーパミン量はプレイヤー(ユーザーまたは遊技者)の遊び方にも依存する。つまり、個々人によってドーパミン量は異なり、また確率を伴ってゲームが進行するため1回の遊戯中のドーパミン量も異なる。これらを用いると

1人または1回の遊戯におけるゲームのドーパミン量
=f(遊び方、発生確率、期待の大きさ、報酬の有無、報酬の価値)

として定式化される。
期待の大きさは、信頼度=確率で表すことができる。従って、本実施例では、上述したように、パラメータ30は、予告を伴うゲームのイベントの発生確率、予告が演出された際のイベントの期待確率、及びイベントによる報酬の価値を表す数値を含む。
本実施例のパラメータ最適化装置(情報処理装置10)によりパラメータの最適化動作が図られるゲームは複数のイベントを有することができる。そして、ゲームが複数のイベントを有する場合、記憶部12には、各々のイベントの発生確率、各々のイベントの期待確率、及び各々のイベントによる報酬の価値を含むパラメータ30がイベント毎に格納されている。
後に詳述するように、パラメータ最適化部21はこのパラメータ30の最適化を図る。従って、記憶部12には、パラメータ30の初期値と、パラメータ最適化部21による最適化動作の途中経過である経過値と、そしてパラメータ最適化部21により最適化がされた最適値とが格納されうる。
試技データ31は、パラメータ最適化部21によるパラメータ最適化の対象となる遊技機を実際に試技した結果得られるデータである。
本実施例のパラメータ最適化装置10では、保留演出、リーチ前予告演出、リーチ中フローの予告演出を、遊技機で発生するイベントと考え、遊技機において3000回の大当たりの予告が発生する状況を実際に遊技機で試技を行うことで発生させ、この試技の結果から試技毎に発生したイベントを記録して、これを試技データ31として記憶部12に格納している。
試技データ31は、3000回の大当たりの予告が発生した試技において発生したイベントを保留演出、リーチ前予告演出、リーチ中フローの予告演出の3つに大別し、さらに、リーチ前予告については、遊技機からセリフが発せられたかどうか、遊技機に設けられた役物が動作するか否かについてもイベントとして記録している。また、リーチ中フローについては、リーチ後の予告動作の有無、疑似連と呼ばれる、図柄を複数回回転させる動作の有無、特別なリーチ状態に突入することを示す演出動作であるリーチ発展動作の有無についてもイベントとして記録している。
どのようなイベントが存在するかは遊技機に依存するので、上述した例はあくまでも一例であり、パラメータ最適化の対象となる遊技機により適宜修正可能であることは言うまでもない。
特に、本実施例では、複数のイベントの発生頻度に関する複数の試技データ31が格納されており、さらには、単一のイベントの終了頻度及び複数の異なるイベントの終了頻度を合計した終了頻度に基づくイベントの発生頻度に関する複数のイベント発生情報が格納されている。
つまり、本実施例の試技データ31は、試技毎に発生したイベントを記録しており、かつ、上述したとおり、抽選結果により次のイベントに移行したかどうかについても記録しているので、結果として、単一のイベントの終了頻度及び複数の異なるイベントの終了頻度を合計した終了頻度に基づくイベントの発生頻度に関する複数の試技データ31となっている。
入力インタフェース13は、情報処理装置10に接続された入力装置15からの各種入力を受け入れ、これを制御部11に出力する。本実施例の入力装置15は例えばキーボードやマウス等であり、後述する表示装置16の表示画面に対して座標指定入力を行いうるものである。
出力インタフェース14は、制御部11から出力された出力信号を受け入れ、これを表示装置16及び印刷装置17に出力する。本実施例の表示装置16は例えば液晶ディスプレイ装置であり、出力インタフェース14を介して出力された表示制御信号に基づいて図略の表示面に表示画面を表示する。また、本実施例の印刷装置17は例えばプリンターであり、出力インタフェース14を介して出力された印字制御信号に基づいて所定の文字や画像の印字動作を行う。
次に、制御部11に構成される各機能部の説明をする。
ドーパミン量推定部20は、予告及び報酬を報酬系における予告と報酬との組み合わせとみなした際の予告と前記報酬との関係に基づくドーパミン比の動物実験の結果を用いて、記憶部12に格納されているパラメータ30に基づいてゲームのプレーヤがゲームをプレイした際にこのプレーヤの脳内に発生されると推定されるドーパミン量を推定する。
特に、ゲームが複数のイベントを有する場合、本実施例のドーパミン量推定部20は、各々のイベントのパラメータ30に基づいてドーパミン量を推定する。
パラメータ最適化部21は、パラメータ30を初期値から変化させることでドーパミン量推定部20により推定されるドーパミン量が最大値となる前記パラメータの最適値を算出する。
ここで、本実施例のパラメータ最適化部21は、ドーパミン量推定部20により推定されるドーパミン量を関数に持つ評価関数を定め、評価関数の値が最大値となるドーパミン量に基づいてパラメータの最適値を算出する。
データ取得部22は、記憶部12に格納されている試技データ31を読み取り、これを確率推定部23に提供する。特に、本実施例の試技データ31は複数のイベントに関する試技データ31であるので、データ取得部22は、これら複数の試技データ31を読み取って確率推定部23に提供する。
確率推定部23は、記憶部12に格納され、データ取得部22から提供された試技データ31に基づいてイベントの発生確率を推定する。特に、本実施例の確率推定部23は、複数の試技データ31に基づいて複数のイベントのそれぞれの発生確率を推定する。
シミュレーション部24は、確率推定部23が推定したイベントの発生確率に基づいて、遊技機による遊技のシミュレーションを行うことで、イベントの発生頻度を取得する。
特に、本実施例のシミュレーション部24は、確率推定部23が推定した複数のイベントのそれぞれの発生確率に基づいて、複数のイベントのそれぞれの発生頻度を取得する。さらに、シミュレーション部24は、複数のイベントのそれぞれの発生頻度に基づく期待出玉数を取得する。
そして、ドーパミン量推定部20は、シミュレーション部24がイベントの発生頻度を取得した場合、シミュレーション部24が取得した発生頻度を、パラメータ30に含まれるイベントの発生確率であるとしてドーパミン量を推定する。但し、データ取得部22、確率推定部23及びシミュレーション部24は本実施例に必須の構成ではない。
これらドーパミン量推定部20、パラメータ最適化部21、データ取得部22、確率推定部23、及びシミュレーション部24の動作の詳細については後述する。
<パラメータ最適化装置の動作>
次に、図2のフローチャートを参照して、本実施例のパラメータ最適化装置10の動作について説明する。
パラメータ最適化装置10の動作が開始されると、まず、ステップS10では、制御部11のドーパミン量推定部20が、記憶部12に格納されているパラメータ30の初期値を読み取る。ステップS11では、制御部11のパラメータ最適化部21が、後述するパラメータ最適化動作においてパラメータ30を変動させる範囲を設定する。
次に、ステップS12では、ドーパミン量推定部20が、上述した原理の欄で説明した動物実験の結果を用いて、ステップS10で読み取ったパラメータ30に基づいてゲームのプレーヤがゲームをプレイした際にこのプレーヤの脳内に発生されると推定されるドーパミン量を推定する。
本実施例のドーパミン量推定部20は、図3に示す実験結果の結果を用いて、以下に説明する手順によりドーパミン量を推定する。
図3に示す実験結果は、単一の予告演出及びこの予告に連なる大当たり=報酬におけるドーパミン量の計測値であると考えることができる。このとき、図4に示すように、図3に示す実験結果に3つの領域A1〜A3を設定する。領域A1、A2にそれぞれ含まれるドーパミンは予告演出に伴って発生するドーパミンであり、領域A3に含まれるドーパミンは大当たりに伴って発生するドーパミンである。
そして、領域A1における信頼度=確率が0%、25%、50%、75%、100%のときのドーパミン値を折れ線で結び、線形補間したものを予告におけるドーパミン量の関数prDA1とする。同様に、領域A2における信頼度=確率が0%、25%、50%、75%、100%のときのドーパミン値を折れ線で結び、線形補間したものを予告におけるドーパミン量の関数prDA2とする。そして、領域A3における信頼度=確率が0%、25%、50%、75%、100%のときのドーパミン値を折れ線で結び、線形補間したものを、大当たりにおけるドーパミン量のDAの関数bbDAとする。それぞれの関数prDA1、prDA2、bbDAの具体的な式は次式のようになる。このとき、関数の引数pは、その演出の信頼度=確率である。
Figure 0006943458
Figure 0006943458
従って、大当たりしたときのドーパミン量の総量を表す関数DAは次式のようになる。
Figure 0006943458

同様に、外れたときのドーパミン量の総量を表す関数は次式のようになる。
Figure 0006943458
以上の検討を基にして、図5を参照して、複数の予告演出がある場合のドーパミン量の総量を表す関数DA(p)を導く。なお、以下の説明で予告演出を3つにしているのは、一般的に脳が覚えていられる期待の塊は3つであるという脳科学の知見に基づくものである。
3つの演出、演出A、演出B、演出Cがあったとき、演出Aから演出Bに発展する確率をp1、演出Bから演出Cに発展する確率をp2、演出Cから当たりに発展する確率をp3とする。図5に示す例では、図の左から演出A、演出B、演出Cとなり、p1が0.25、p2が0.25、p3が0.5である。
Figure 0006943458
演出Aで止まった(演出Bまで移行しない)ときの関数DAは次式のようになる。
Figure 0006943458
演出Bで止まった(演出Aから演出Bに移行したものの演出Cまで移行しない)ときの関数DAは次式のようになる。
Figure 0006943458
演出Cで止まった(演出Bから演出Cに移行したものの当たりまで移行しない)ときの関数DAは次式のようになる。
Figure 0006943458
そして、当たりまで行ったときの関数DAは次式のようになる。
Figure 0006943458
以上の式で、I(x)は1以上で1となり、1未満でxの値を返す閾値関数である。
図2に戻って、ステップS13では、パラメータ最適化部21が、ステップS12でドーパミン量推定部20が算出したドーパミン量に基づいて、このドーパミン量を関数とする評価関数の値を算出する。
本実施例のパラメータ最適化部21は、評価関数を用いてパラメータの最適化動作を行う。但し、評価関数を用いたパラメータの最適化動作はその一例であり、別の手法によりパラメータの最適化動作を行うこともできる。
一例として、単一の予告演出が行われるゲームにおいて、全てのプレーヤの遊び方が等しく、発生確率と報酬の価値とが一通りであるとして、上述した単一の予告演出におけるドーパミン量の関数DAを、発生確率が0〜1.0まで変化させて算出した例を図6に示す。
図6の横軸は発生確率、縦軸はDAの値である。グラフ中、破線で示したものは図3の領域A1におけるDAの値、一点鎖線で示したものは図3の領域A2におけるDAの値、実線で示したものは図3の領域A3におけるDAの値である。
図6のグラフから、次のことがわかる。
・予告演出のみのDAの最大値:2.9、その時の信頼度=確率:0.75
・大当たりのみのDAの最大値:1.6、その時の信頼度=0.25
・予告演出+大当たりのDAの最大値3.43、その時の信頼度=0.75
このように、ドーパミン量の関数DAによっては、信頼度=発生確率の最大値(最適値)を簡易に求めることができる。
他に、パラメータ最適化部21がパラメータ30の最適値を算出する手法としては、グリッドサーチ、確率的勾配降下法などにより評価関数の最適化(最適値を探索する)を図る手法が挙げられる。図3に示す例では、パラメータ最適化部21はグリッドサーチにより評価関数の最適化を図り、これによりパラメータ30の最適値を求める。評価関数はドーパミン量の関数DAの最大値を適切に求められる関数であり、一例として、信頼度=確率を変数とするドーパミン量の関数DAの期待値である。
ステップS14では、ステップS12、S13における算出動作に用いたパラメータの値が、ステップS11で定めた変動範囲の最終値に至ったかどうかがパラメータ最適化部21により判定される。そして、最終値に至ったと判定されたら(ステップS14においてYES)、プログラムはステップS16に進む。一方、まだ最終値に至っていないと判定されたら(ステップS14においてNO)、プログラムはステップS15に進む。
ステップS15では、パラメータ最適化部21がパラメータの値を更新する。グリッドサーチを用いる場合、パラメータ最適化部21はパラメータの値を予め定めた微小値だけ増分させる。
ステップS16では、パラメータ最適化部21が、ステップS13で繰り返し算出した評価関数の値に基づいてドーパミン量の最大値を求め、そして、ステップS17では、ドーパミン量が最大値となるときのパラメータ30の最適値を検出する。
<本実施例の効果>
このように構成される本実施例によれば、ドーパミン量推定部20が、予告及び報酬を報酬系における予告と報酬との組み合わせとみなした際の予告と報酬との関係に基づくドーパミン比の動物実験の結果を用いて、記憶部12に格納されたパラメータ30に基づいて、ゲームのプレーヤがゲームをプレイした際にこのプレーヤの脳内に発生されると推定されるドーパミン量を推定し、パラメータ最適化部21が、パラメータ30を初期値から変化させることでドーパミン量推定部20により推定されるドーパミン量が最大値となるパラメータの最適値を算出している。
従って、本実施例によれば、ゲームのパラメータを最適化することが可能となる。
加えて、本実施例のパラメータ最適化装置によれば、発売前のゲームに対して、実際にこのゲームがホール等に設置されてプレーヤによりプレイされた際に、このプレーヤに発生するであろうドーパミン量を推定することでパラメータ30の最適値を求めている。これにより、ゲーム製造会社は、ゲームのパラメータ30を最適値に調整することで、より興趣をプレーヤに感じさせるであろうゲームに調整することができる。
加えて、パラメータ30を最適値に調整できることにより、ゲーム製造会社がゲームの開発コストを適切なものに収めることができる。
一方、本実施例のパラメータ最適化装置10では、実際の稼働データに影響を与えるであろうゲームのブランド力、コンテンツ力、さらには市場全体の状況や季節の変動性については推定の対象としていない。つまり、本実施例のパラメータ最適化装置10により求められたパラメータ30の最適値に基づいてパラメータ30の値を調整したゲームが市場に提供されたとき、他のゲームとの間で実際の稼働データに差が生じるとするならば、その傾向は上述したゲームのブランド力等であると推測することができる。つまり、本実施例のパラメータ最適化装置10による算出結果を出発点として、ゲームのブランド力等を数値化する可能性を広げることができる。
ここで、上述した説明では、ゲームのイベントの発生確率等を含むパラメータ30(少なくとも初期値)が既に記憶部12に格納されているものとして説明した。
一方、遊技機製造会社により、各イベントの発生確率は予め設定されていることが多く、本実施例のパラメータ最適化装置10においても、遊技機製造会社が設定した各イベントの発生確率を知ることができれば、ドーパミン量推定部20が推定するドーパミン量はより正確なものとなり得る。しかしながら、遊技機製造会社が設定した各イベントの発生確率を必ず知りうるとは限らないので、本実施例のパラメータ最適化装置10では、実際に遊技機で試技を行った結果得られた試技データ31に基づいて複数のイベントのそれぞれの発生確率を推定できる構成を採用している。以下この手順を説明する。
ここで、「推定」としているのは、上述のように遊技機製造会社が設定した各イベントの発生確率が真の発生確率であり、試技データ31から得られる各イベントの発生確率は、あくまでも推定された発生確率であることを示している。
まず、制御部11のデータ取得部22が、記憶部12に格納されている試技データ31を読み取り、これを確率推定部23に提供する。
次に、制御部11の確率推定部23が、データ取得部22から提供された試技データ31に基づいてイベントの発生確率を推定する。
そして、確率推定部23が推定したイベントの発生確率に基づいて、制御部11のシミュレーション部24が遊技機による遊技のシミュレーションを行うことで、イベントの発生頻度を取得する。
試技データ31は300回の大当たりの予告が発生する状況における、各イベントの発生頻度であり、確率推定部23は、この試技データ31に基づいて各イベントの発生確率を推定している。しかしながら、より正確な発生確率を求める観点から、本実施例のパラメータ最適化装置10では、より多数の試技を擬似的に行うために、シミュレーション部24により遊技のシミュレーションを行っている。
ドーパミン量推定部20により推定されるドーパミン量は確率変数となり、その値はある確率分布に従っている。また、この値はスタート回数といわれる大当たりの予告が発生する状況が起こった回数に依存する。
そこで、本実施例のパラメータ最適化装置10では、一般的な遊技時間や遊技金額において導かれるスタート回数150回を今回のスタート回数として、100万回のシミュレーションをシミュレーション部24により行い、それぞれのシミュレーションにおける遊技機のドーパミン量の確率分布をドーパミン量推定部20により推定することで数値的に求めた。
一例として、シミュレーション部24により行うシミュレーション動作では、当たりの確率を1/320に統一している。これは、遊技機毎に当たりの確率が異なる可能性があり、この当たりの確率が異なった状態でドーパミン量推定部20によるドーパミン量推定動作を行うと、遊技機毎の客観的な比較がしづらいためである。
この後、ドーパミン量推定部20は、シミュレーション部24により得られたイベントの発生頻度をイベントの発生確率であるとして、ドーパミン量の推定動作を行えばよい。
実験例
ゲームの一例として、大当り確率が1/200のくじを100回引くことを考える。ただし、大当り確率1/200は何回くじを引いても変わらないものとする。このとき、くじを引く際に鐘をならすことを考える。鐘が鳴ったときは確率p1で当りとなっている。この時、鐘を何%の確率でならしたら、期待値的に最も高いドーパミンがでるかを求める。つまり、鐘をならす確率が発生確率であり、この鐘をならす確率(パラメータ)を最適化する。
このとき、一例としてドーパミン量の関数を次のように仮定する。なお、ここに示すドーパミン量の関数は単なる計算例であり、上述した動物実験の結果に基づくものとは限らない。
まず、鐘が鳴らなかったときのドーパミン量の関数f1(p1)を次式のように仮定する。ここに、p1は鐘をならす確率を示す。
Figure 0006943458
次に、鐘が鳴って当たったときのドーパミン量の関数f2(p1)を次式のように仮定する。
Figure 0006943458
また、期待値である評価関数を次のように定義する。
Figure 0006943458
ここに、E()は期待値の関数である。X0、X1は確率変数であり、それぞれ確率p0、p1のベルヌーイ分布に従う。X0は鐘が鳴ったとき1をとり、ならなかったとき0をとる。また、X1は当ったとき1をとり、当らなかったとき0をとる。
この評価関数Q(p1)を最大にするp1を見つける。ここではグリッドサーチを用いる。まず、発生確率p1の初期値x0を0.01として評価関数Q(x0)を算出する。
次に、発生確率p1の値を0.01だけ増分させた値x1を作り、その時の評価関数Q(x1)を算出する。そして、Q(x0)とQ(x1)とを比較し、Q(x0)≧Q(x1)であればQ(x0)を保持し、Q(x0)<Q(x1)であればQ(x1)を保持する。以上の動作を、x1=0.99になるまで繰り返す。
動作が終了したときに保持されている評価関数Q()の最大値をもたらす発生確率p1が発生確率p1の最適値である。
図7は、横軸を発生確率p1、縦軸を評価関数の値とするグラフである。このグラフに示すように、発生確率p1の最適値はp1=0.67であった。
(その他)
本発明のパラメータ最適化装置は、その細部が上述の実施例に限定されず、本発明の要旨を変更しない範囲で適宜変更が可能である。一例として、本発明のパラメータ最適化装置が適用されるゲームはパチンコのみならずパチスロやスロットマシン、さらにはカードゲーム、ソーシャルゲーム等まで適用可能である。
また、実施例のパラメータ最適化装置ではドーパミン量を推定していたが、報酬系として他の物質、例えばGABA(γ−アミノ酪酸:γ(gamma)-amino butyric acid)等の物質についても推定可能である。
また、上述の実施例において、原理で紹介した動物実験において実際に実験を行った信頼度以外の信頼度(つまり確率)については線形補間を用いて求めたが、これ以外の補間法、例えば多項式補間やスプライン補間により信頼度を求めてもよい。また、動物実験の結果をそのまま流用せずに微調整を行ってもよい。
さらに、ドーパミン量の推定に使った計算は一例であり、他の計算手法についても好適に適用可能である。一例として、上述の実施例ではイベント毎のドーパミン比の合計値を用いたが、他にも加重平均や、または線形モデル・非線形モデル、ニューラルネットワークなど様々な方法が適用可能である。
そして、上述の実施例において、パラメータ最適化装置10を動作させるプログラムは記憶部12に格納されて提供されていたが、不図示の光学ディスクドライブ等を用いて、プログラムが格納されたDVD(Digital Versatile Disc)、USB外部記憶装置、メモリーカード等を接続し、このDVD等からプログラムをパラメータ最適化装置10に読み込んで動作させてもよい。また、インターネット上のサーバ装置内にプログラムを格納しておき、パラメータ最適化装置10に通信部を設けてこのプログラムをパラメータ最適化装置10に読み込んで動作させてもよい。さらに、上述の実施例において、パラメータ最適化装置10は複数のハードウェア要素により構成されていたが、これらハードウェア要素の一部の動作を制御部11がプログラムの動作により実現することも可能である。
10 情報処理装置(パラメータ最適化装置)
11 制御部
12 記憶部
20 ドーパミン量推定部
21 パラメータ最適化部
23 データ取得部
24 確率推定部
25 シミュレーション部
30 パラメータ

Claims (5)

  1. 予告を伴うゲームのイベントの発生確率、前記予告が演出された際の前記イベントの期待確率、及び前記イベントによる報酬の価値を含む前記ゲームのパラメータの初期値が格納された記憶部と、
    前記予告及び前記報酬を報酬系における予告と報酬との組み合わせとみなした際の前記予告と前記報酬との関係に基づくドーパミン比の動物実験の結果を用いて定められた評価関数により、前記ゲームの前記パラメータに基づいて前記ゲームのプレーヤが前記ゲームをプレイした際にこのプレーヤの脳内に発生されると推定されるドーパミン量を推定するドーパミン量推定部と、
    前記パラメータのうち少なくとも前記発生確率を前記初期値から予め定めた変動範囲の間で変化させることで前記ドーパミン量推定部により推定される前記ドーパミン量が最大値となる前記パラメータの最適値を算出するパラメータ最適化部と
    を有することを特徴とするパラメータ最適化装置。
  2. 前記パラメータ最適化部は、前記ドーパミン量推定部により推定される前記ドーパミン量を関数の期待値を前記評価関数として定め、前記評価関数の値が最大値となる前記ドーパミン量に基づいて前記パラメータの最適値を算出することを特徴とする請求項1に記載のパラメータ最適化装置。
  3. 前記ゲームは複数の前記イベントを有し、
    前記記憶部には、各々の前記イベントの発生確率、各々の前記イベントの期待確率、及び各々の前記イベントによる報酬の価値を含む前記パラメータの前記初期値が前記イベント毎に格納され、
    前記ドーパミン量推定部は、各々の前記イベントの前記パラメータに基づいて前記ドーパミン量を推定することを特徴とする請求項1または2に記載のパラメータ最適化装置。
  4. 予告を伴うゲームのイベントの発生確率、前記予告が演出された際の前記イベントの期待確率、及び前記イベントによる報酬の価値を含む前記ゲームのパラメータの初期値が格納された記憶部を有する情報処理装置により実行されるパラメータ最適化方法であって、
    前記予告及び前記報酬を報酬系における予告と報酬との組み合わせとみなした際の前記予告と前記報酬との関係に基づくドーパミン比の動物実験の結果を用いて定められた評価関数により、前記ゲームの前記パラメータに基づいて前記ゲームのプレーヤが前記ゲームをプレイした際にこのプレーヤの脳内に発生されると推定されるドーパミン量を推定し、
    前記パラメータのうち少なくとも前記発生確率を前記初期値から予め定めた変動範囲の間で変化させることで推定される前記ドーパミン量が最大値となる前記パラメータの最適値を算出する
    ことを特徴とするパラメータ最適化方法。
  5. 予告を伴うゲームのイベントの発生確率、前記予告が演出された際の前記イベントの期待確率、及び前記イベントによる報酬の価値を含む前記ゲームのパラメータの初期値が格納された記憶部を有するコンピュータにより実行されるコンピュータプログラムであって、
    前記予告及び前記報酬を報酬系における予告と報酬との組み合わせとみなした際の前記予告と前記報酬との関係に基づくドーパミン比の動物実験の結果を用いて定められた評価関数により、前記ゲームの前記パラメータに基づいて前記ゲームのプレーヤが前記ゲームをプレイした際にこのプレーヤの脳内に発生されると推定されるドーパミン量を推定するドーパミン量推定機能と、
    前記パラメータのうち少なくとも前記発生確率を前記初期値から予め定めた変動範囲の間で変化させることで前記ドーパミン量推定機能により推定される前記ドーパミン量が最大値となる前記パラメータの最適値を算出するパラメータ最適化機能と
    を実現させるコンピュータプログラム。
JP2019077997A 2019-04-16 2019-04-16 パラメータ最適化装置、パラメータ最適化方法及びコンピュータプログラム Active JP6943458B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019077997A JP6943458B2 (ja) 2019-04-16 2019-04-16 パラメータ最適化装置、パラメータ最適化方法及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019077997A JP6943458B2 (ja) 2019-04-16 2019-04-16 パラメータ最適化装置、パラメータ最適化方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2020174792A JP2020174792A (ja) 2020-10-29
JP6943458B2 true JP6943458B2 (ja) 2021-09-29

Family

ID=72937100

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019077997A Active JP6943458B2 (ja) 2019-04-16 2019-04-16 パラメータ最適化装置、パラメータ最適化方法及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP6943458B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6681076B2 (ja) * 2017-05-24 2020-04-15 一般財団法人パチンコ・パチスロKai総合研究所 興趣推定装置、興趣推定方法及びプログラム
JP6254318B1 (ja) * 2017-06-01 2017-12-27 フィールズ株式会社 演出制御装置及び演出制御プログラム

Also Published As

Publication number Publication date
JP2020174792A (ja) 2020-10-29

Similar Documents

Publication Publication Date Title
US10706674B2 (en) Electronic gaming machines and related methods with player emotional state prediction
JP4491256B2 (ja) 遊技機
US20060058100A1 (en) Wagering game with 3D rendering of a mechanical device
US20150262450A1 (en) Methods and systems for facilitating a game which allows a player to select available wagering opportunities
US11263871B2 (en) Triggering special mode with final outcome satisfying threshold condition
JP6681076B2 (ja) 興趣推定装置、興趣推定方法及びプログラム
JP2008245764A (ja) 予想ゲームシステム
US11562617B2 (en) Linked reel strip mechanism for re-spin series
TWI683692B (zh) 遊戲系統及記錄有使用於遊戲系統的電腦程式之記錄媒體
JP6943458B2 (ja) パラメータ最適化装置、パラメータ最適化方法及びコンピュータプログラム
US11450178B2 (en) Low-complexity reel symbol replacement strategy with clustering
JP2009045350A (ja) 複数の競争対象によるレースを実行するゲーム装置及びゲーム制御方法
KR102093527B1 (ko) 당첨 게임 시스템
JP6561282B2 (ja) ゲームシステム及びそれに用いるコンピュータプログラム
JP2006198134A (ja) ゲーム装置及びプログラム
JP3681708B2 (ja) パチンコシミュレーションゲーム装置およびパチンコシミュレーションゲームプログラム
TWI634928B (zh) A game system for judging whether a player makes an extra bet
JP7231997B2 (ja) 遊技機評価装置及び遊技機評価プログラム
JP4350763B2 (ja) ゲーム機及びそのコンピュータプログラム
JP7328428B2 (ja) 遊技機評価装置及び遊技機評価プログラム
JP7111487B2 (ja) コンピュータシステム、ゲームシステム、プログラム、及び抽選処理実行制御方法
JP2009045357A (ja) 複数の競争対象によるレースを実行するゲーム装置及びゲーム制御方法
US20150087412A1 (en) Gaming system having eligibility routine for group play
JP7204827B2 (ja) ゲーム制御方法、および、ゲームプログラム
US8974286B2 (en) Combined behavior schedules of reinforcement system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210902

R150 Certificate of patent or registration of utility model

Ref document number: 6943458

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250