WO2024090065A1

WO2024090065A1 - 情報処理装置、方法及びプログラム

Info

Publication number: WO2024090065A1
Application number: PCT/JP2023/033648
Authority: WO
Inventors: 宗之大島
Original assignee: 富士フイルム株式会社
Priority date: 2022-10-26
Filing date: 2023-09-15
Publication date: 2024-05-02

Abstract

興趣性に優れた複合空間又は仮想空間を提供できる情報処理装置、方法及びプログラムを提供する。オブジェクトを出現させる空間の環境に関する第１情報を取得する。ユーザの行動履歴に関する第２情報を取得する。第１情報に基づいて、オブジェクトに関する第１要素を決定する。第２情報に基づいて、オブジェクトに関する第２要素を決定する。第１要素及び第２要素に基づいて、空間に出現させるオブジェクトを決定する。

Description

情報処理装置、方法及びプログラム

　本発明は、情報処理装置、方法及びプログラムに係り、特に、現実世界と仮想世界を融合した複合空間又は仮想空間を提供する情報処理装置、方法及びプログラムに関する。

　現実世界（Real world）に仮想世界（Virtual world）を重ね合わせて表示する技術として、拡張現実（Augmented Reality；ＡＲ）が知られている。ＡＲは、現実の風景の中にコンピュータグラフィックス（Computer Graphics；ＣＧ）で作られたキャラクタなどのデジタルコンテンツを重ねて表示することで現実世界を拡張する。

　特許文献１には、キャラクタを重畳させた拡張現実画像を作成する技術に関して、キャラクタの使用状況（親密度）、及び、使用環境（季節、場所等）に応じて、重畳させるキャラクタの装飾を変える技術が記載されている。

　また、特許文献２には、キャラクタを重畳させた拡張現実画像を作成する技術に関して、撮影画像から周囲環境を特定し、特定した周囲環境に合ったキャラクタを出現させる技術が記載されている。

　また、特許文献３には、ユーザの行動履歴からユーザの属性を推定し、推定した属性に基づいて、キャラクタの属性を選択する技術が記載されている。

特開2018-36869号公報特開2019-212062号公報国際公開第2016/111067号

　本開示の技術にかかる一つの実施形態は、興趣性に優れた複合空間又は仮想空間を提供できる情報処理装置、方法及びプログラムを提供する。

　（１）プロセッサを備え、プロセッサは、オブジェクトを出現させる空間の環境に関する第１情報を取得し、ユーザの行動履歴に関する第２情報を取得し、第１情報に基づいて、オブジェクトに関する第１要素を決定し、第２情報に基づいて、オブジェクトに関する第２要素を決定し、第１要素及び第２要素に基づいて、空間に出現させるオブジェクトを決定する、情報処理装置。

　（２）プロセッサは、オブジェクトを出現させる空間を撮影した第１画像を取得し、第１画像にオブジェクトを重畳させた第２画像を生成する、（１）の情報処理装置。

　（３）プロセッサは、第１画像を処理して、第１画像内の物体、又は、第１画像のシーンを認識し、第１情報を取得する、（２）の情報処理装置。

　（４）プロセッサは、ユーザの位置の情報を取得し、ユーザが特定の地域に存在している場合に、第１画像内の物体、又は、第１画像のシーンを認識し、第１情報を取得する、（３）の情報処理装置。

　（５）第２情報は、ユーザの移動の履歴の情報、又は、出現させたオブジェクトに関する履歴の情報を含む、（１）から（４）のいずれか一の情報処理装置。

　（６）第１要素は、出現させるオブジェクトの種類であり、第２要素は、出現させるオブジェクトの表示形態又は属性である、（１）から（５）のいずれか一の情報処理装置。

　（７）プロセッサは、オブジェクトを出現させる空間を撮影した画像を処理して、主被写体を認識し、空間内での主被写体の位置に基づいて、空間に出現させるオブジェクトの配置領域を決定する、（１）から（６）のいずれか一の情報処理装置。

　（８）プロセッサは、配置領域での第１情報に基づいて、出現させるオブジェクトの種類を決定する、（７）の情報処理装置。

　（９）プロセッサは、ユーザの行動履歴が特定の条件を満たす場合、オブジェクトの表示形態をランダムに決定する、（６）から（８）のいずれか一の情報処理装置。

　（１０）プロセッサは、第２画像の出力の指示に応じて、オブジェクトの表示形態又は属性を変更する、（２）から（４）のいずれか一の情報処理装置。

　（１１）オブジェクトを出現させる空間の環境に関する第１情報を取得するステップと、ユーザの行動履歴に関する第２情報を取得するステップと、第１情報に基づいて、オブジェクトに関する第１要素を決定するステップと、第２情報に基づいて、オブジェクトに関する第２要素を決定するステップと、第１要素及び第２要素に基づいて、空間に出現させるオブジェクトを決定するステップと、を含む情報処理方法。

　（１２）オブジェクトを出現させる空間の環境に関する第１情報を取得する機能と、ユーザの行動履歴に関する第２情報を取得する機能と、第１情報に基づいて、オブジェクトに関する第１要素を決定する機能と、第２情報に基づいて、オブジェクトに関する第２要素を決定する機能と、第１要素及び第２要素に基づいて、空間に出現させるオブジェクトを決定する機能と、をコンピュータに実現させる情報処理プログラム。

情報処理の概要を示す図携帯端末のハードウェア構成の一例を示す図ＡＲ表示に関して携帯端末が有する主な機能のブロック図環境情報取得部が有する主な機能のブロック図物体の認識の一例を示す図ＡＲオブジェクト決定部が有する主な機能のブロック図ＡＲオブジェクトの配置領域の決定の概念図ＡＲオブジェクトデータベースに記録される情報の一例を示す図ＡＲオブジェクトの表示形態の一例を示す図ＡＲ画像の一例を示す図ＡＲ表示を行う場合の携帯端末の動作手順を示すフローチャートＡＲオブジェクトの表示形態の決定処理の手順を示すフローチャートＡＲ画像の生成の概念図クジ引きを実施してＡＲオブジェクトの表示形態を決定する場合の処理手順の一例を示すフローチャートクジ引きの画面の一例を示す図ＡＲオブジェクト決定部が有する主な機能のブロック図ＡＲオブジェクトデータベースに記録される情報の一例を示す図キャラクタの外観の一例を示す図キャラクタの外観の決定処理の手順を示すフローチャートＡＲ表示の一例を示す図撮影によりキャラクタが特定の動作を行う場合の一例を示す図プリントした場合の表示の一例を示す図キャラクタの属性変化の履歴データの一例を示す図キャラクタの配置の一例を示す概念図画像認識を利用したキャラクタの配置の一例を示す概念図プリントの概念図

　以下、添付図面に従って本発明の好ましい実施の形態について説明する。

　［第１の実施の形態］
　図１は、本実施の形態の情報処理の概要を示す図である。

　同図に示すように、本実施の形態の情報処理は、カメラ及びディスプレイを備えた携帯端末１０を使用して、現実世界と仮想世界を融合した複合空間を提供する。具体的には、携帯端末１０のカメラで撮影された実空間（現実の空間、実在する空間）の画像にＣＧで作られた拡張現実オブジェクト（ＡＲオブジェクト）ＡＲＯを重畳して拡張現実画像（ＡＲ画像）を生成し、携帯端末１０のディスプレイ１５に表示する。ＡＲオブジェクトＡＲＯは、ユーザの位置をトリガとして出現させる。その際、出現させる空間の環境（カメラで撮影している空間の環境）及びユーザの行動履歴に基づいて、その種類、表示形態又は属性を決定する。これにより、興趣性に優れた複合空間を提供できる。

　［携帯端末の構成］
　図２は、携帯端末のハードウェア構成の一例を示す図である。

　同図に示す携帯端末１０は、いわゆるスマートフォンである。携帯端末１０は、全体の動作を制御するＣＰＵ（Central Processing Unit）１１、基本入出力プログラム等を記憶したＲＯＭ（Read Only Memory）１２、ＣＰＵ１１のワークエリアとして使用されるＲＡＭ（Random Access Memory）１３、内蔵メモリ１４、ディスプレイ１５、ディスプレイ画面へのタッチ操作（位置入力）を検出するタッチパッド１６、ＧＰＳ（Global Positioning Systems）衛星又は屋内ＧＰＳとしてのＩＭＥＳ（Indoor MEssaging System）によって携帯端末１０の位置情報（緯度、経度及び高度）を含んだＧＰＳ信号を受信するＧＰＳ受信部１７、画像を電子的に撮影するカメラ部１８、マイクロフォンを介して音声を入力するマイク部１９、スピーカを介して音声を出力するスピーカ部２０、アンテナを介して最寄りの基地局等と無線で通信する無線通信部２１、アンテナを介して外部機器と近距離無線通信する近距離無線通信部２２、各種センシングを行うセンサ部２３等を備える。内蔵メモリ１４は、ＥＥＰＲＯＭ（Electrically Erasable Programmable Read-only Memory）等の不揮発性メモリで構成される。

　内蔵メモリ１４には、オペレーティングシステムを含む各種プログラム（たとえば、情報処理プログラム等）の他、各種制御及び処理に必要なデータ、インカメラ部１８Ａ及びアウトカメラ部１８Ｂで撮影した画像データ等が記憶される。

　ディスプレイ１５は、たとえば、ＬＣＤ（Liquid Crystal Display／液晶ディスプレイ）、ＯＬＥＤ（Organic Light Emitting Diode／有機発光ダイオード）ディスプレイ等で構成される。ディスプレイ１５は、タッチパッド１６と共にタッチパネル３０を構成する。タッチパネル３０は、携帯端末１０の操作部を構成する。

　カメラ部１８は、インカメラ部１８Ａ及びアウトカメラ部１８Ｂで構成される。インカメラ部１８Ａは、携帯端末１０の筐体の正面側に搭載されるカメラである（図１参照）。アウトカメラ部１８Ｂは、携帯端末１０の筐体の背面側に搭載されるカメラである。なお、携帯端末１０の筐体の正面とは、携帯端末１０の筐体において、ディスプレイ１５が備えられている面をいう。したがって、インカメラ部１８Ａは、ディスプレイ１５側に搭載されるカメラである。インカメラ部１８Ａ及びアウトカメラ部１８Ｂは、デジタルカメラであり、光学系及びイメージセンサを有する。イメージセンサは、たとえば、ＣＭＯＳ（Complementary Metal Oxide Semiconductor）イメージセンサ、ＣＣＤ（Charge Coupled Device）イメージセンサ等で構成される。なお、以下においては、特に区別する場合を除いて、カメラ部１８で撮影される画像とは、インカメラ部１８Ａ及びアウトカメラ部１８Ｂのいずれかで撮影される画像を意味する。

　無線通信部２１は、たとえば、５Ｇ（5th Generation Mobile Communication System／第５世代移動通信システム）、４Ｇ（4th Generation Mobile Communication System／第４世代移動通信システム）、ＬＴＥ（Long Term Evolution）等のセルラー方式により基地局と無線通信する。

　近距離無線通信部２２は、たとえば、Ｗｉ－Ｆｉ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）等の近距離無線通信方式により外部機器と無線通信する。

　センサ部２３は、加速度センサ、角速度センサ（ジャイロセンサ）、地磁気センサ、環境光センサ、近接センサ、ＬｉＤＡＲ（Light Detection And Ranging）、生体認証センサ等の各種センサを含む。

　図３は、ＡＲ表示に関して携帯端末が有する主な機能のブロック図である。

　同図に示すように、携帯端末１０は、ＡＲ表示に関して、環境情報取得部１１１、行動履歴情報取得部１１２、行動履歴データベース管理部１１３（データベース／Data Base；ＤＢ）、ＡＲオブジェクト決定部１１４、ＡＲ画像生成部１１５、表示制御部１１６、記録制御部１１７等の機能を有する。これらの機能は、ＣＰＵ１１が、所定のプログラム（情報処理プログラム）を実行することで実現される。

　環境情報取得部１１１は、ＡＲオブジェクトを出現させる空間の環境に関する情報を取得する。空間の環境に関する情報には、空間の地理的な情報、空間を構成する物体ないし空間内に存在する物体の情報等、空間をなす又は空間を特徴づける種々の情報が含まれる。ＡＲオブジェクトを出現させる空間の環境に関する情報は、第１情報の一例である。本実施の形態では、撮影画像にＡＲオブジェクトを重畳してＡＲ画像を生成することから、撮影中の画像に含まれる物体を認識して、ＡＲオブジェクトを出現させる空間の環境に関する情報を取得する。また、ユーザの現在位置（撮影している位置）の情報を取得して、ＡＲオブジェクトを出現させる空間の環境の情報を取得する。

　図４は、環境情報取得部が有する主な機能のブロック図である。

　同図に示すように、本実施の形態の環境情報取得部１１１は、位置判定部１１１Ａ及び物体認識部１１１Ｂ等の機能を有する。

　位置判定部１１１Ａは、携帯端末１０の現在位置を判定する。携帯端末１０の現在位置は、ユーザの現在位置（撮影している位置）とされる。位置判定部１１１Ａは、ＧＰＳ受信部１７で受信されるＧＰＳ信号、及び、地図データベース１２１に基づいて、携帯端末１０の現在位置を判定する。

　地図データベース１２１には、地図上の特定のポイント（Point of Interest；ＰＯＩ）が、その位置情報（緯度、経度及び高度）に関連付けられて記録される。ポイントは、領域ないし地域を含む概念である。また、ポイントは、公園、遊園地、水族館、美術館等の施設、百貨店、飲食店等の店舗、神社、仏閣等の名所、観光地等で特定することもできる。

　位置判定部１１１Ａは、ＧＰＳ信号に含まれる位置情報（緯度、経度及び高度）の情報を取得し、その位置情報に対応するポイントの情報を地図データベース１２１から検索して、携帯端末１０の現在位置の情報を取得する。取得した位置情報に対応するポイントの情報が地図データベース１２１に存在しない場合、位置判定部１１１Ａは、位置不明と判定する。判定結果は、携帯端末１０の現在位置情報として出力される。

　物体認識部１１１Ｂは、カメラ部１８で撮影された画像を解析して、画像内に含まれる物体（オブジェクト）を認識する。より具体的には、物体の検出と、その領域の検出を行う。ここでの物体には、空、地面（道を含む）等が含まれる。物体の認識には、公知の技術が採用される。たとえば、人工知能（Artificial Intelligence；ＡＩ）を活用した、物体認識（オブジェクト認識）の技術を利用できる。一例として、物体認識を行うように機械学習された学習済みモデルを用いて、物体の認識を行う構成を採用できる。この場合、学習済みモデルには、たとえば、セマンティックセグメンテーション（semantic segmentation）、インスタンスセグメンテーション（instance segmentation）、パノプティックセグメンテーション（panoptic segmentation）等を用いたモデルを採用できる。

　図５は、物体の認識の一例を示す図である。

　同図（Ａ）は、撮影画像Ｉ（カメラ部１８で撮影された画像）を示している。同図（Ｂ）は、撮影画像Ｉに対する物体の認識結果の一例を示している。図５（Ｂ）に示すように、画像の中にある物体の領域を特定し、個体ごとに領域分割して物体の種類を認識する。図５に示す例では、撮影画像Ｉから人物（Human）、草地（Grass）、土（Ground）、木（Tree）、空（Sky）が物体として認識されている。

　物体認識部１１１Ｂは、あらかじめ定めた特定の物体のみを認識する構成としてもよい。たとえば、人物及び地面（草地、土、人工地盤等）のみを認識する構成としてもよい。

　物体認識部１１１Ｂは、携帯端末１０の現在位置が、地図データベース１２１に記録された特定のポイントである場合に、物体の認識処理を実行する。

　行動履歴情報取得部１１２は、ユーザの行動履歴に関する情報を取得する。ユーザの行動履歴に関する情報は、第２情報の一例である。本実施の形態では、ユーザの行動履歴として、ロケーション履歴の情報を取得する。ロケーション履歴とは、ユーザが携帯端末１０を携帯して訪れた場所、経路等を履歴として記録したものである。行動履歴情報取得部１１２は、行動履歴データベース１２２からユーザの行動履歴に関する情報を取得する。本実施の形態では、ロケーション履歴の情報を取得する。行動履歴データベース１２２には、ユーザの行動履歴に関する情報が記録される。本実施の形態では、ロケーション履歴の情報が記録される。

　行動履歴データベース管理部１１３は、行動履歴データベース１２２を管理する。本実施の形態では、行動履歴データベース１２２にロケーション履歴の情報が記録される。したがって、行動履歴データベース管理部１１３は、ロケーション履歴の情報を管理する。行動履歴データベース管理部１１３は、ＧＰＳ受信部１７を介して携帯端末１０の位置情報を取得し、ユーザのロケーション履歴を管理する。すなわち、ユーザが、訪れた場所、経路等の履歴を管理する。

　ＡＲオブジェクト決定部１１４は、出現させる拡張現実オブジェクト（ＡＲオブジェクト）を決定する。ＡＲオブジェクト決定部１１４は、環境情報取得部１１１で取得される情報、及び、行動履歴情報取得部１１２で取得される情報に基づいて、ＡＲオブジェクトを決定する。本実施の形態では、環境情報取得部１１１で取得される撮影画像Ｉ内の物体の情報（物体情報）、及び、行動履歴情報取得部１１２で取得されるロケーション履歴の情報（ロケーション履歴情報）に基づいて、ＡＲオブジェクトを決定する。

　図６は、ＡＲオブジェクト決定部が有する主な機能のブロック図である。

　同図に示すように、ＡＲオブジェクト決定部１１４は、主被写体判定部１１４Ａ、配置領域決定部１１４Ｂ、第１要素決定部１１４Ｃ及び第２要素決定部１１４Ｄ等の機能を有する。

　主被写体判定部１１４Ａは、撮影画像Ｉ内の物体の情報（物体情報）に基づいて、主被写体を判定する。本実施の形態では、撮影画像Ｉ内の人物を主被写体とする。撮影画像Ｉ内に複数の人物が含まれる場合、主被写体判定部１１４Ａは、画像内での位置、大きさ等に基づいて、主被写体を判定する。たとえば、より中央に近い人物を主被写体と認定する。また、よりサイズの大きい人物を主被写体と認定する。

　配置領域決定部１１４Ｂは、主被写体判定部１１４Ａによる主被写体の判定結果に基づいて、ＡＲオブジェクトの配置領域を決定する。

　図７は、ＡＲオブジェクトの配置領域の決定の概念図である。

　同図において、斜線で示す領域がＡＲオブジェクトの配置領域Ｒである。本実施の形態では、主被写体ＭＯの周囲、かつ、地面の領域が、ＡＲオブジェクトの配置領域Ｒとされる。図７は、主被写体ＭＯを中心とした半径ｒの円内の領域をＡＲオブジェクトの配置領域Ｒとした場合の例である。半径ｒは、一定としてもよいし、撮影画像Ｉ内での主被写体ＭＯのサイズ及び／又は主被写体ＭＯまでの距離に応じて設定してもよい。

　第１要素決定部１１４Ｃは、出現させるＡＲオブジェクトの第１要素として、その種類を決定する。本実施の形態では、配置領域Ｒの環境の情報に基づいて、ＡＲオブジェクトの種類を決定する。より具体的には、配置領域Ｒで認識された物体の情報に基づいて、ＡＲオブジェクトの種類を決定する。

　第１要素決定部１１４Ｃは、ＡＲオブジェクトデータベース１２３に記録された情報を参照して、ＡＲオブジェクトの種類を決定する。

　図８は、ＡＲオブジェクトデータベースに記録される情報の一例を示す図である。

　同図に示すように、配置領域の環境ごとに表示するＡＲオブジェクトの種類、及び、表示形態の情報が記録される。表示形態の情報は、表示に必要なＡＲオブジェクトのデータを含む。各ＡＲオブジェクトは、たとえば、３次元ＣＧ（three-dimensional computer graphics；３ＤＣＧ）で構成される。したがって、ＡＲオブジェクトのデータは、３次元ＣＧのデータで構成される。

　第１要素決定部１１４Ｃは、ＡＲオブジェクトデータベース１２３に記録された複数のＡＲオブジェクトの種類の中から配置領域Ｒの環境（認識された物体）に対応したものを選択する。たとえば、図８の例によれば、配置領域Ｒの環境が「土」の場合、出現させるＡＲオブジェクトの種類は「ネコ」となる。

　配置領域Ｒに複数の環境（認識された物体）が含まれる場合、占有率の最も高い環境が、配置領域Ｒの環境とされる。図７の例では、配置領域Ｒに「土」と「草地」が含まれているが、占有率は「土」の方が高い。このため、図７の例の場合、配置領域Ｒの環境は、「土」と判定される。

　第２要素決定部１１４Ｄは、出現させるＡＲオブジェクトの第２要素として、その表示形態を決定する。第２要素決定部１１４Ｄは、行動履歴情報取得部１１２で取得したユーザの行動履歴に関する情報に基づいて、ＡＲオブジェクトの表示形態を決定する。本実施の形態では、ロケーション履歴の情報に基づいて、ＡＲオブジェクトの表示形態を決定する。本実施の形態では、ユーザが初めて訪れた場所か否かによって、表示形態を決定する。すなわち、携帯端末１０の現在位置（ユーザの現在位置）が、ロケーション履歴に存在する場所か否かによって、表示形態を決定する。ユーザが初めて訪れた場所の場合（未訪問地の場合）、第２要素決定部１１４Ｄは、ＡＲオブジェクトの表示形態を第１表示形態に設定する。この場合、現在位置が、ロケーション履歴に存在しない場合である。一方、ユーザが初めて訪れた場所でない場合（既訪問地の場合）、第２要素決定部１１４Ｄは、ＡＲオブジェクトの表示形態を第２表示形態に設定する。この場合、現在位置が、ロケーション履歴に存在する場合である。

　図９は、ＡＲオブジェクトの表示形態の一例を示す図である。

　本実施の形態では、ＡＲオブジェクトの表示形態として、出現させるＡＲオブジェクトＡＲＯの数が設定される。第２表示形態は、第１表示形態よりも表示されるＡＲオブジェクトＡＲＯの多く設定される。

　なお、図９では、便宜上、各ＡＲオブジェクトＡＲＯを二次元表示しているが、各ＡＲオブジェクトＡＲＯは、３ＤＣＧで構成される。また、図９では、静止状態で表示しているが、各ＡＲオブジェクトＡＲＯは、動く構成とすることもできる。

　ＡＲ画像生成部１１５は、カメラ部１８で撮影された画像（撮影画像）にＡＲオブジェクトを重畳させた拡張現実画像（ＡＲ画像）を生成する。ＡＲ画像生成部１１５は、ＡＲオブジェクト決定部１１４で決定したＡＲオブジェクトを撮影画像Ｉに重畳させて、ＡＲ画像を生成する。この際、ＡＲ画像生成部１１５は、配置領域決定部１１４Ｂで決定した配置領域にＡＲオブジェクトを配置して、ＡＲ画像を生成する。また、ＡＲ画像生成部１１５は、第１要素決定部１１４Ｃで決定したＡＲオブジェクトを、第２要素決定部１１４Ｄで決定した表示形態で表示させて、ＡＲ画像を生成する（第２要素決定部１１４Ｄで決定した表示形態の３次元ＣＧを重畳させて、ＡＲ画像を生成する。）。本実施の形態において、撮影画像は、第１画像の一例であり、ＡＲ画像は、第２画像の一例である。また、ＡＲオブジェクトは、オブジェクトの一例である。

　図１０は、ＡＲ画像の一例を示す図である。同図（Ａ）は、第１表示形態で表示する場合の一例を示している。同図（Ｂ）は、第２表示形態で表示する場合の一例を示している。

　図１０（Ａ）及び（Ｂ）に示すように、本実施の形態では、主被写体ＭＯの周囲、かつ、地面の領域にＡＲオブジェクトＡＲＯが重畳されたＡＲ画像ＡＲＩが生成される。

　表示制御部１１６は、ディスプレイ１５への画像の表示を制御する。表示制御部１１６は、ＡＲ画像生成部１１５で生成されたＡＲ画像ＡＲＩをディスプレイ１５に表示させる（図１参照）。

　記録制御部１１７は、内蔵メモリ１４への画像の記録を制御する。記録制御部１１７は、ユーザからの記録指示（静止画ないし動画の撮影指示）に応じて、ディスプレイ１５に表示中の画像を内蔵メモリ１４に記録する。記録指示は、たとえば、ディスプレイ１５上に表示したシャッタボタンＳＳＢ（図１参照）へのタッチ操作で行う。

　［携帯端末の動作（情報処理方法）］
　図１１は、ＡＲ表示を行う場合の携帯端末の動作手順を示すフローチャートである。

　まず、ディスプレイ１５にライブビューの画像が表示される（ステップＳ１０）。ライブビューとは、カメラ部１８のイメージセンサで捉えた画像をリアルタイム（即時）に表示することである。

　次に、携帯端末１０の現在位置（ユーザの現在位置）の情報が取得される（ステップＳ１１）。携帯端末１０は、ＧＰＳ受信部１７で受信されるＧＰＳ信号に基づいて、携帯端末１０の現在位置の情報を取得する。

　次に、取得した現在位置の情報に基づいて、現在位置が、地図データベース１２１で定められた特定の地域か否かが判定される（ステップＳ１２）。より具体的には、現在位置が、地図データベース１２１に存在する場所か否かが判定される。

　現在位置が、地図データベース１２１で定められた特定の地域である場合、ディスプレイ１５に表示中のライブビューの画像にＡＲオブジェクトが表示されているか否か判定される（ステップＳ１３）。

　ＡＲオブジェクトが表示されていない場合、撮影画像から物体を認識する処理が行われる（ステップＳ１４）。ここでの「撮影画像」とは、ライブビューとして表示させる画像である。

　物体の認識結果に基づいて、撮影画像から主被写体が判定される（ステップＳ１５）。本実施の形態では、人物が主被写体とされる。したがって、認識した物体から人物を主被写体として特定する。画像中に複数の人物が含まれる場合、所定の判定基準に従って主被写体が特定される。

　主被写体の判定処理の結果に基づき、主被写体の有無が判定される（ステップＳ１６）。すなわち、撮影画像中に主被写体が存在するか否かが判定される。

　撮影画像中に主被写体が存在する場合、画像内での主被写体の位置に基づいて、ＡＲオブジェクトの配置領域が決定される（ステップＳ１７）。本実施の形態では、主被写体の周囲、かつ、地面の領域がＡＲオブジェクトの配置領域として設定される。

　ＡＲオブジェクトの配置領域を決定後、その配置領域の環境情報が取得される（ステップＳ１８）。本実施の形態では、物体の認識結果に基づき、ＡＲオブジェクトの配置領域の物体の情報が取得される。

　取得された配置領域の物体の情報に基づいて、画像中に出現させるＡＲオブジェクトが選択される（ステップＳ１９）。すなわち、どのような種類のＡＲオブジェクトを出現させるか決定される。ＡＲオブジェクトは、ＡＲオブジェクトデータベース１２３から選択される。

　出現させるＡＲオブジェクトが決定すると、ユーザの行動履歴の情報が取得される（ステップＳ２０）。本実施の形態では、ロケーション履歴の情報が取得される。

　取得されたロケーション履歴の情報に基づいて、ＡＲオブジェクトの表示形態が決定される（ステップＳ２１）。本実施の形態では、携帯端末１０の現在位置（ユーザの現在位置）が、未訪問地か否かによって、ＡＲオブジェクトの表示形態が決定される。

　図１２は、ＡＲオブジェクトの表示形態の決定処理の手順を示すフローチャートである。

　まず、現在位置が、未訪問地か否かが判定される（ステップＳ２１＿１）。すなわち、現在位置が、ロケーション履歴に存在するか否かが判定される。

　現在位置が、未訪問地の場合、ＡＲオブジェクトの表示形態が、第１表示形態に設定される（ステップＳ２１＿２）。未訪問地の場合とは、現在位置が、ロケーション履歴に存在しない場合である。

　一方、現在位置が、未訪問地でない場合、すなわち、既訪問地の場合、ＡＲオブジェクトの表示形態が、第２表示形態に設定される（ステップＳ２１＿３）。既訪問地の場合とは、現在位置が、ロケーション履歴に存在する場合である。

　このように、現在位置が、未訪問地か否かによって、ＡＲオブジェクトの表示形態が決定される。

　以上一連の処理でライブビューの画像に出現させるＡＲオブジェクトの種類、配置領域及び表示形態が決定される。決定した事項に従って、ライブビューの画像にＡＲオブジェクトが合成され、ＡＲ画像が生成される。

　図１３は、ＡＲ画像の生成の概念図である。

　同図に示すように、撮影画像Ｉ（ライブビューの画像）の所定の領域にＡＲオブジェクトＡＲＯを重畳させて、ＡＲ画像ＡＲＩが生成される。所定の領域とは、本実施の形態では、主被写体ＭＯの周囲、かつ、地面の領域である。

　生成されたＡＲ画像が、ディスプレイ１５に表示される。すなわち、ＡＲオブジェクトが重畳された画像がディスプレイ１５に表示される（ステップＳ２２）。これにより、ＡＲ画像ＡＲＩの鑑賞が可能になる。

　この後、ユーザからＡＲ表示のオフが指示されたか否かが判定される（ステップＳ２３）。ステップＳ１３において、ＡＲオブジェクトの表示中と判定された場合も同様にユーザからＡＲ表示のオフが指示されたか否かが判定される（ステップＳ２３）。

　ＡＲ表示のオフが指示されると、ＡＲ表示の処理が終了される。ＡＲ表示のオフの指示は、所定の操作で行われる。

　ステップＳ１２において、現在位置が、地図データベース１２１で定められた特定の地域でないと判定された場合、ＡＲオブジェクトが表示中か否か判定される（ステップＳ２４）。すなわち、ディスプレイ１５に表示中のライブビューの画像にＡＲオブジェクトが表示されているか否か判定される。ＡＲオブジェクトが表示中と判定されると、ＡＲオブジェクトの表示が終了される（ステップＳ２５）。すなわち、この場合、ユーザは、特定の地域から移動しているので、ＡＲオブジェクトの表示は消される。この後、ユーザからＡＲ表示のオフが指示されたか否かが判定され（ステップＳ２３）、ＡＲ表示のオフが指示されると、ＡＲ表示の処理が終了される。

　ステップＳ１６において、撮影画像中に主被写体が存在しないと判定された場合ある場合も同様に、ＡＲオブジェクトが表示中か否か判定される（ステップＳ２４）。ＡＲオブジェクトが表示中と判定されると、ＡＲオブジェクトの表示が終了される（ステップＳ２５）。すなわち、この場合、撮影画像内から主被写体が消えているので、ＡＲオブジェクトの表示も消される。この後、ユーザからＡＲ表示のオフが指示されたか否かが判定され（ステップＳ２３）、ＡＲ表示のオフが指示されると、ＡＲ表示の処理が終了される。

　なお、一度表示させたＡＲオブジェクトは、一定時間経過後に自動的に消去する構成としてもよい。

　以上説明したように、本実施の形態によれば、ＡＲオブジェクトを配置する空間の環境に関する情報及びユーザの行動履歴の情報に基づいて、出現させるＡＲオブジェクトの種類、表示形態が決定される。これにより、興趣性に優れたＡＲ空間を提供できる。

　［変形例］
　［ＡＲオブジェクトの種類の決定方法］
　上記実施の形態では、ＡＲオブジェクトの配置領域における物体の認識結果に基づいて、出現させるＡＲオブジェクトの種類を決定する構成としているが、出現させるＡＲオブジェクトの種類を決定する方法は、これに限定されるものではない。携帯端末１０で取得可能な種々の情報に基づいて、出現させるＡＲオブジェクトの種類を決定できる。

　たとえば、携帯端末１０の現在位置（ユーザの現在位置）の情報に基づいて、出現させるＡＲオブジェクトの種類を決定する構成とすることができる。この場合、ＡＲオブジェクトデータベース１２３には、地域ないし場所の情報に関連付けて、各ＡＲオブジェクトの情報が記録される。

　また、携帯端末１０の現在位置（ユーザの現在位置）、及び、撮影画像から認識した物体の情報に基づいて、出現させるＡＲオブジェクトの種類を決定する構成とすることもできる。この場合、たとえば、携帯端末１０の現在位置の情報に基づいて、出現させるＡＲオブジェクトの第１の分類が決定し、撮影画像から認識した物体の情報に基づいて、出現させるＡＲオブジェクトの第２の分類が決定する構成とすることができる。第１の分類は、いわゆる大分類であり、第２の分類は、第１の分類を細分化した分類（いわゆる小分類）である。

　また、物体の認識に代えて、あすいは、物体の認識ともに、シーンの認識を行い、認識したシーンに基づいて、あるいは、認識したシーン及び物体に基づいて、出現させるＡＲオブジェクトの種類を決定する構成とすることもできる。なお、シーン認識自体は公知の技術であるので、その詳細についての説明は省略する。たとえば、画像からシーン認識を行うように機械学習された学習済みモデルを用いて、撮影画像のシーン認識を行う構成を採用できる。

　更に、携帯端末１０が、現在日時、気温、湿度、音声等の情報を取得できる場合は、これらの情報を環境情報として取得し、取得した情報に基づいて、出現させるＡＲオブジェクトの種類を決定してもよい。

　また、ユーザの行動履歴の情報も加味して、出現させるＡＲオブジェクトの種類を決定してもよい。すなわち、環境情報とユーザの行動履歴の情報の双方を利用して、出現させるＡＲオブジェクトの種類を決定してもよい。

　［ＡＲオブジェクトの表示形態の決定方法］
　上記実施の形態では、ユーザの行動履歴の情報として、ロケーション履歴の情報を利用して、ＡＲオブジェクトの表示形態を決定する構成としているが、ＡＲオブジェクトの表示形態を決定する際に用いる行動履歴の情報は、これに限定されるものではない。携帯端末１０で取得可能な種々の情報を利用できる。たとえば、携帯端末１０での本機能（ＡＲ表示の機能）の使用履歴の情報、本機能でのユーザの操作履歴の情報等を利用できる。使用履歴には、総使用回数の情報、総使用時間の情報、一日当たりの使用回数の情報、一日当たりの使用時間の情報、使用時間帯の情報、各ＡＲオブジェクトの表示回数の情報等、使用に関する種々の情報が含まれる。各ＡＲオブジェクトの表示回数の情報は、各ＡＲオブジェクトについての出現回数（何回出現させたか）の情報である。また、操作履歴の情報には、静止画及び動画の撮影履歴、プリント履歴の情報等が含まれる。撮影履歴には、カメラ部１８の使用履歴の情報も含まれる。すなわち、インカメラ部１８Ａとアウトカメラ部１８Ｂのいずれのカメラ部を使用したかの情報が含まれる。プリント履歴は、撮影した画像に対するプリント（フィルム、紙、メディア等の有体物へのプリント）の履歴である。プリントの形態については、特に限定されない。また、携帯端末自体の使用履歴、操作履歴の情報等を利用することもできる。携帯端末自体の使用履歴の情報には、たとえば、携帯端末１０を用いた撮影履歴の情報が含まれる。また、撮影履歴には、撮影した画像についての解析結果の情報を含めることができる。撮影した画像についての解析結果には、撮影した画像について行った画像認識の結果（たとえば、被写体の認識結果、シーンの認識結果等）の情報を含めることができる。

　また、使用する行動履歴の情報は、特定の事象に関連する情報に限定してもよい。たとえば、現在位置に関連する情報にのみ限定することができる。たとえば、撮影回数については、特定の地域での撮影回数（現在の地域での撮影回数）に限定できる。また、プリント回数については、特定の地域でのプリント回数（たとえば、現在の地域でのプリント回数）、あるいは、特定の被写体（たとえば、現在の地域に関連した被写体）をプリントした回数に限定できる。

　また、ユーザの行動履歴には、商品の購入履歴、ソーシャルネットワーキングサービス（Social networking service；ＳＮＳ）での投稿履歴等も含めることができる。商品の購入履歴については、たとえば、現在位置と関連して、当該地域で特定の商品（たとえば、当該地域の特産品、当該地域でのみ販売されている限定商品等）を購入したか否かの情報、購入回数の情報等を使用できる。また、ＳＮＳの投稿履歴については、現在位置に関連する情報の投稿の有無、投稿回数の情報等を使用できる。

　これらのユーザの行動に関する履歴の情報を複合的に利用し、出現させるＡＲオブジェクトの表示形態を決定できる。

　更に、環境情報も加味して、出現させるＡＲオブジェクトの表示形態を決定してもよい。すなわち、環境情報とユーザの行動履歴の情報の双方を利用して、出現させるＡＲオブジェクトの表示形態を決定してもよい。

　また、行動履歴が一定の条件を満たす場合にクジ引き、ゲーム等を実施し、その結果に応じてＡＲオブジェクトの表示形態を決定する構成としてもよい。

　図１４は、クジ引きを実施してＡＲオブジェクトの表示形態を決定する場合の処理手順の一例を示すフローチャートである。

　まず、現在位置が、未訪問地か否かが判定される（ステップＳ２１＿１１）。現在位置が、未訪問地の場合、ＡＲオブジェクトの表示形態が、第１表示形態に設定される（ステップＳ２１＿２）。

　現在位置が、未訪問地でない場合（既訪問地の場合）、３回以上訪問しているか否かが判定される（ステップＳ２１＿１３）。すなわち、今回の訪問が、３回目以上か否かが判定される。

　３回目以上の訪問でない場合（２回目の訪問の場合）、ＡＲオブジェクトの表示形態が、第２表示形態に設定される（ステップＳ２１＿１４）。

　一方、３回目以上の訪問の場合、クジ引きが実施される（ステップＳ２１＿１５）。

　図１５は、クジ引きの画面の一例を示す図である。

　同図は、サイコロを用いたクジ引きの例である。２つのサイコロを振り、両方とも１の目が出た場合に「アタリ」とされる。

　同図に示すように、ライブビューの画像に重ねて、円板状のステージの画像ＳＴＡが表示され、かつ、そのステージの画像ＳＴＡの上に２つのサイコロの画像ＤＡ１、ＤＡ２が表示される。また、スタートボタンＳＴＢが画面上に表示される。

　ユーザは、スタートボタンＳＴＢをタッチして、クジ引きの実行を指示する。クジ引きの実行が指示されると、サイコロが回転するアニメーション画像が表示される。また、これと同時にスタートボタンＳＴＢの表示が、ストップボタンの表示に切り替わる（図示せず）。ユーザは、ストップボタンをタッチして、サイコロの回転の停止を指示する。回転停止が指示されると、サイコロが停止した画像に切り替わり、出目が確定する。各サイコロの目は、ランダムに決定される。たとえば、１から６の数値の範囲で乱数を取得して、各サイコロの出目を決定する。

　上記のように、２つのサイコロの目が両方とも１の場合、「アタリ」とされ、それ以外は「ハズレ」とされる。

　クジ引きが行われると、そのクジ引きの結果が、アタリか否かが判定される（ステップＳ２１＿１６）。クジ引きの結果が、「アタリ」の場合、ＡＲオブジェクトの表示形態が、第３表示形態に設定される（ステップＳ２１＿１７）。一方、クジ引きの結果が、「はずれ」の場合、ＡＲオブジェクトの表示形態が、第２表示形態に設定される（ステップＳ２１＿１７）。

　ここで、第２表示形態は、第１表示形態よりも表示されるＡＲオブジェクトの数が多く設定され、第３表示形態は、第２表示形態よりも表示されるＡＲオブジェクトの数が多く設定される。

　このように、表示形態の決定に際して、ランダム要素を取り入れることにより、より興趣性を高めることができる。

　なお、ランダム性については、完全にランダムにする他、偏りを持たせてランダムにすることもできる。たとえば、特定の条件を満たすと、有利な結果が得られるように、ランダム性をコントロールしてもよい。たとえば、ユーザの利用状況（たとえば、課金の有無）、出現させるＡＲオブジェクトについての過去の出現回数、撮影回数、プリント回数等によって、結果に差が出るようにしてもよい。

　［ＡＲオブジェクトの表示形態］
　上記実施の形態では、ユーザの行動履歴に応じて、出現させるＡＲオブジェクトの数を変える構成としているが、変更する要素は、これに限定されるものではない。いわゆる華やかさ、豪華さ等を変える構成とすることができる。すなわち、見た目のグレードを変える構成とすることができる。たとえば、ロケーション履歴に基づいて、ＡＲオブジェクトの表示形態を変える場合、訪問回数が増えるほど見た目のグレードが上がる表示（たとえば、より華やかな表示、より豪華な表示等）にすることができる。また、たとえば、静止画の撮影回数に基づいて、ＡＲオブジェクトの表示形態を変える場合、撮影回数が増えるほど見た目のグレードが上がる表示にすることができる。また、たとえば、表示回数（出現回数）に基づいて、ＡＲオブジェクトの表示形態を変える場合、表示回数が増えるほど見た目のグレードが上がる表示にすることができる。

　また、上記実施の形態では、２つの表示形態を切り替える構成としているが、更に複数の表示形態を用意し、ユーザの行動履歴に応じて、より詳細に表示形態を切り替えてもよい。

　［特定の行動に基づく表示形態の変化］
　ユーザが、特定の行動を行った場合に、ＡＲオブジェクトの表示形態を更に変化させてもよい。たとえば、ＡＲオブジェクトが表示された画像をユーザが撮影した場合に、ＡＲオブジェクトの表示形態を更に変化させてもよい。撮影には、静止画の撮影及び動画の撮影の双方を含む。また、撮影した画像をプリントした場合には、更にＡＲオブジェクトの表示形態を変化させてもよい。この場合、変化の態様として、ＡＲオブジェクトの数を更に増やす、見た目のグレードを更に上げる等を採用できる。静止画ないし動画の撮影の指示、及び、撮影した画像のプリントの指示は、第２画像の出力の指示の一例である。なお、撮影には、ディスプレイ１５の画面に表示されている内容を、そのまま画像データとして取得すること（いわゆるスクリーンショット、スクリーンキャプチャ）が含まれる。

　［ＡＲオブジェクトの配置領域］
　上記実施の形態では、主被写体（人物）を認識し、その周囲、かつ、地面の領域をＡＲオブジェクトの配置領域としているが、ＡＲオブジェクトの配置領域を決定する方法は、これに限定されるものではない。出現させるＡＲオブジェクトの種類等に応じて配置領域を設定することが好ましい。たとえば、空中に浮遊していることが不自然ではないＡＲオブジェクトについては、必ずしも地面に配置する必要はない。ＡＲオブジェクトの種類等に応じて、空中、水面等に配置する構成とすることもできる。同様に、演出としてのＡＲオブジェクト（紙吹雪、星のきらめき等）につていては、必ずしも地面に配置する必要はない。

　また、必ずしも主被写体の周囲に配置する必要はなく、画面内の特定の場所に配置する構成としてもよい。たとえば、画面中央に配置する構成としてもよい。この場合、主被写体の認識は不要である。

　また、携帯端末１０が、空間認識機能を有している場合、その認識結果を利用して、配置領域を決定することが好ましい。たとえば、携帯端末１０が、ＬｉＤＡＲ等の測域センサを有している場合、その測域結果を利用して、配置領域を決定することができる。

　［第２の実施の形態］
　本実施の形態では、ＣＧで作られたキャラクタ（小説、映画、演劇、漫画、コンピュータゲームなどに登場する人物、動物、人形、ロボット等）を撮影画像に重畳させて、ＡＲ画像を生成する場合について説明する。

　本実施の形態では、環境情報及び行動履歴情報に基づいて、画像中に出現させるキャラクタの種類及び属性を決定する。より具体的には、環境情報に基づいてキャラクタの種類を決定し、行動履歴情報に基づいてキャラクタの属性を決定する。属性には、キャラクタの容姿、服装、装飾、装備、成長度合い、進化度合い等の外観的要素（いわゆる見た目）の他、親密度、性格、ステータス等の外観以外の要素が含まれる。たとえば、会話するキャラクタの場合、親密度、性格等により会話内容、動作等が変化する。

　本実施の形態においても、携帯端末を使用してＡＲ表示を行う場合を例に説明する。携帯端末の基本構成は、上記第１の実施の形態と同じである。よって、ここでは、相違点、すなわち、出現させるＡＲオブジェクト（キャラクタ）、及び、その決定方法についてのみ説明する。

　なお、本実施の形態では、キャラクタの属性として、その外観的要素を変更する場合を例に説明する。

　［ＡＲオブジェクト及びその決定方法］
　上記のように、本実施の形態では、キャラクタを出現させたＡＲ画像を生成する。出現させるキャラクタ（ＡＲオブジェクト）は、たとえば、３ＤＣＧで構成され、そのデータは、ＡＲオブジェクトデータベース１２３に記録される。キャラクタ（ＡＲオブジェクト）の選定は、ＡＲオブジェクト決定部１１４で行われる。

　図１６は、ＡＲオブジェクト決定部が有する主な機能のブロック図である。

　ＡＲオブジェクト決定部１１４は、主被写体判定部１１４Ａ、配置領域決定部１１４Ｂ、第１要素決定部１１４Ｃ及び第２要素決定部１１４Ｄ等の機能を有する。

　主被写体判定部１１４Ａ及び配置領域決定部１１４Ｂの機能は、上記第１の実施の形態と同じである。主被写体判定部１１４Ａは、物体認識部１１１Ｂの認識結果（物体情報）に基づいて、主被写体を判定する。配置領域決定部１１４Ｂは、主被写体判定部１１４Ａによる主被写体の判定結果に基づいて、キャラクタの配置領域を決定する。

　第１要素決定部１１４Ｃは、携帯端末１０の現在位置の情報（現在位置情報）に基づいて、第１要素であるキャラクタの種類を決定する。携帯端末１０の現在位置は、位置判定部１１１Ａで判定される。第１要素決定部１１４Ｃは、ＡＲオブジェクトデータベース１２３に記録された情報を参照して、キャラクタの種類を決定する。

　図１７は、ＡＲオブジェクトデータベースに記録される情報の一例を示す図である。

　同図に示すように、ＡＲオブジェクトデータベース１２３には、地図上の特定のポイントごとに出現させるキャラクタの情報が記録される。地図上のポイントは、地図データベース１２１に登録されたポイントが用いられる。

　各キャラクタには、識別情報として、キャラクタＩＤ（Identification）が付与され、そのキャラクタＩＤに関連付けられて、外観の情報（３ＤＣＧのデータ）が記録される。

　第１要素決定部１１４Ｃは、ＡＲオブジェクトデータベース１２３に記録された複数のキャラクタの中から携帯端末１０の現在位置（ユーザの現在位置）に対応したキャラクタを選択する。たとえば、図１７の例によれば、現在位置が、ポイントＡの場合、キャラクタＩＤ：1000000Aのキャラクタが選択される。

　第２要素決定部１１４Ｄは、行動履歴情報取得部１１２で取得したユーザの行動履歴に関する情報に基づいて、キャラクタの外観を決定する。第１の実施の形態と同様に、第２要素決定部１１４Ｄは、ユーザのロケーション履歴の情報に基づいて、キャラクタの外観を決定する。したがって、ユーザが初めて訪れた場所か否かによって、外観が定まる。ユーザが初めて訪れた場所の場合（未訪問地の場合）、第２要素決定部１１４Ｄは、キャラクタの外観を第１外観に設定する。一方、ユーザが初めて訪れた場所でない場合（既訪問地の場合）、第２要素決定部１１４Ｄは、キャラクタの外観を第２外観に設定する。

　図１８は、キャラクタの外観の一例を示す図である。

　同図に示すように、第１外観と第２外観で異なる外観を呈する。第２外観は、第１外観よりも、見た目のグレードが高い設定とされる。すなわち、より華やか、より豪華に見た目となる。図１８の例では、服装（衣服）、装飾及び装備が変わる例である。この他、装飾、装備、成長度合い、進化度合い等が変わる設定とすることもできる。

　［携帯端末の動作］
　ＡＲ表示を行う場合の処理手順は、おおよそ第１の実施の形態と同じである。したがって、ここでは、図１１を参照して、ＡＲ表示を行う場合の処理手順について説明する。

　まず、ディスプレイ１５にライブビューの画像が表示される（ステップＳ１０）。次に、現在位置の情報が取得される（ステップＳ１１）。携帯端末１０は、ＧＰＳ受信部１７で受信されるＧＰＳ信号に基づいて、携帯端末１０の現在位置（ユーザの現在位置）の情報を取得する。次に、取得した現在位置の情報に基づいて、現在位置が、地図データベース１２１で定められた特定の地域か否かが判定される（ステップＳ１２）。現在位置が、地図データベース１２１で定められた特定の地域である場合、ディスプレイ１５に表示中のライブビューの画像にＡＲオブジェクトが表示されているか否か判定される（ステップＳ１３）。ＡＲオブジェクトが表示されていない場合、撮影画像から物体を認識する処理が行われる（ステップＳ１４）。物体の認識結果に基づいて、撮影画像から主被写体が判定される（ステップＳ１５）。本実施の形態においても、人物が主被写体とされる。主被写体の判定処理の結果に基づき、主被写体の有無が判定される（ステップＳ１６）。すなわち、撮影画像中に主被写体が存在するか否かが判定される。撮影画像中に主被写体が存在する場合、画像内での主被写体の位置に基づいて、キャラクタ（ＡＲオブジェクト）の配置領域が決定される（ステップＳ１７）。本実施の形態においても、主被写体の周囲、かつ、地面の領域が、キャラクタの配置領域として設定される。

　ＡＲオブジェクトの配置領域を決定後、環境情報が取得される（ステップＳ１８）。本実施の形態では、携帯端末１０の現在位置（ユーザの現在位置）の情報が、環境情報として取得される。携帯端末１０の現在位置は、ＧＰＳ受信部１７で受信されるＧＰＳ信号に基づいて、位置判定部１１１Ａで判定される。

　取得された現在位置の情報に基づいて、出現させるキャラクタ（ＡＲオブジェクト）の種類が選択される（ステップＳ１９）。出現させるキャラクタの種類は、ＡＲオブジェクトデータベース１２３から選択される。

　出現させるキャラクタが決定すると、ユーザの行動履歴の情報が取得される（ステップＳ２０）。本実施の形態においても、行動履歴の情報として、ロケーション履歴の情報が取得される。取得されたロケーション履歴の情報に基づいて、キャラクタ（ＡＲオブジェクト）の表示形態が決定される（ステップＳ２１）。本実施の形態においても、現在位置が、未訪問地か否かによって、出現させるキャラクタの表示形態が決定される。

　図１９は、キャラクタの外観の決定処理の手順を示すフローチャートである。

　まず、現在位置が未訪問地か否かが判定される（ステップＳ２１＿１１）。すなわち、現在位置が、ロケーション履歴に存在するか否かが判定される。

　現在位置が未訪問地の場合、出現させるキャラクタの外観が、第１外観に設定される（ステップＳ２１＿１２）。

　一方、現在位置が未訪問地でない場合、すなわち、既訪問地の場合、出現させるキャラクタの外観が、第２外観に設定される（ステップＳ２１＿１３）。

　このように、現在位置が、未訪問地か否かによって、出現させるキャラクタの外観が決定される。

　以上一連の処理で画像中に出現させるキャラクタ（ＡＲオブジェクト）の種類、配置領域及び外観が決定される。決定した事項に従って、ライブビューの画像にキャラクタが合成され、ＡＲ画像が生成される。すなわち、撮影画像（ライブビューの画像）の所定の領域にキャラクタが重畳して表示されて、ＡＲ画像が生成される。所定の領域とは、本実施の形態では、主被写体の周囲、かつ、地面の領域である。

　生成されたＡＲ画像が、ディスプレイ１５に表示される。すなわち、キャラクタ（ＡＲオブジェクト）が出現した画像がディスプレイ１５に表示される（ステップＳ２２）。これにより、ＡＲ画像の鑑賞が可能になる。

　図２０は、ＡＲ表示の一例を示す図である。

　同図に示すように、撮影画像Ｉ（ライブビューの画像）の所定の領域に３ＤＣＧで構成されたキャラクタ（ＡＲオブジェクト）ＡＲＯが重畳して表示される。

　以上説明したように、本実施の形態によれば、キャラクタを出現させたＡＲ画像を生成する場合において、キャラクタを配置する空間の環境の情報、及び、ユーザの行動履歴の情報に基づいて、出現させるキャラクタの種類及び属性が決定される。これにより、興趣性に優れたＡＲ空間を提供できる。

　［変形例］
　［キャラクタの種類の決定方法］
　上記実施の形態では、環境情報として、携帯端末１０の現在位置（ユーザの現在位置）の情報を使用して、出現させるキャラクタ（ＡＲオブジェクト）の種類を決定しているが、その他の情報を利用して、キャラクタの種類を決定してもよい。たとえば、上記第１の実施の形態と同様に、キャラクタの配置領域における物体の認識結果の情報に基づいて、キャラクタの種類を決定してもよい。また、撮影シーンの認識を行い、認識したシーンに基づいて、出現させるキャラクタの種類を決定してもよい。更に、行動履歴の情報を加味して、出現させるキャラクタの種類を決定してもよい。

　［キャラクタの外観の決定方法］
　上記実施の形態では、ユーザの行動履歴の情報として、ロケーション履歴の情報を利用して、キャラクタの外観を決定しているが、その他の情報を利用して、キャラクタの外観を決定してもよい。携帯端末１０で取得可能な種々の情報を利用できる。したがって、環境認識の結果（環境情報）を利用することもできる。この点は、種々の情報を利用して、ＡＲオブジェクトの表示形態を決定できる点と同じである。したがって、行動履歴が一定の条件を満たす場合にクジ引き、ゲーム等を実施し、その結果に応じてキャラクタの外観を決定する構成としてもよい。

　［特定の行動に基づく外観の変化］
　ユーザが、特定の行動を行った場合に、キャラクタの外観を更に変化させてもよい。たとえば、キャラクタが表示された画像をユーザが撮影（動画の撮影を含む）した場合に、キャラクタの外観を更に変化させてもよい。また、撮影した画像をプリントした場合に、キャラクタの外観を更に変化させてもよい。この場合、ランダムに選択された外観に変化させてもよい。これにより、より興趣性を向上できる。

　また、ユーザが、特定の行動を行った場合に、キャラクタが特定の動作を行うようにしてもよい。たとえば、キャラクタが表示された画像をユーザが撮影（動画の撮影を含む）した場合に、キャラクタが特定の動作を行うようにしてもよい。また、撮影した画像をプリントした場合に、キャラクタが特定の動作を行うようにしてもよい。

　図２１は、撮影によりキャラクタが特定の動作を行う場合の一例を示す図である。

　同図（Ａ）は、撮影前の表示を示し、同図（Ｂ）は、撮影後の表示を示している。同図に示すように、静止画を撮影することにより、キャラクタ（ＡＲオブジェクト）ＡＲＯが、喜びを示す動作を行う。このように、特定の動作としては、たとえば、喜びを示す動作を例示できる。この他、プリントを促す動作（プリントをお願いする動作）を行うようにしてもよい。また、ランダムに選択された動作を行うようにしてもよい。これにより、より興趣性を向上できる。

　このような動作は、所定時間継続して行われる。所定時間経過後、通常の表示に復帰する。

　図２２は、プリントした場合の表示の一例を示す図である。

　同図は、いわゆるモバイルプリンタでプリントする場合の例を示している。特に、インスタントフィルム１１０に画像をプリントするプリンタ１００（いわゆるインスタントプリンタ）を使用する場合の例を示している。プリンタ１００及び携帯端末１０は、Ｗｉｆｉ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）等で無線通信し、データを送受信する。なお、この種のプリンタ１００及びプリント方式は自体は公知なので、その詳細についての説明は省略する。

　図２２に示すように、プリントを行うと、プリントしたキャラクタの画像がディスプレイ１５に表示され、所定の動作を行う。この動作は、所定時間継続して行われる。たとえば、プリンタに対し、プリント用のデータの転送が完了するまで行われる。

　［キャラクタの属性］
　上記実施の形態では、ユーザの行動履歴に応じてキャラクタの外観を変更しているが、変更する要素は、これに限定されるものではない。上記のように、属性には、キャラクタの容姿、服装、装飾、装備、成長度合い、進化度合い等の外観的要素の他、親密度、性格、ステータス等の外観以外の要素が含まれる。たとえば、行動履歴に応じて親密度を向上させる構成とすることができる。

　キャラクタの属性については、変化の履歴を記録することが好ましい。これにより、属性を段階的に変化させることができる。たとえば、ロケーション履歴に基づいて属性を変化させる場合、最初の訪問で第１の属性、２回目の訪問で第２の属性、３回目の訪問で第３の属性というように、同じ場所に訪問する場合であっても、訪問回数によって、属性を段階的に変化させることができる。

　図２３は、キャラクタの属性変化の履歴データの一例を示す図である。

　同図に示すように、各キャラクタをキャラクタＩＤで管理し、その出現回数、撮影回数、プリント回数、種別、外観変更回数、親密度等を個別に記録する。出現回数は、当該キャラクタを出現させた回数（出現させた回数）である。撮影回数は、当該キャラクタが出現したＡＲ画像を撮影した回数である。プリント回数は、当該キャラクタが出現したＡＲ画像をプリントした回数である。種別は、当該キャラクタの種別（種類）である。外観変更回数は、当該キャラクタの外観を変更した回数である。親密度は、当該キャラクタの親密度である。親密度は、たとえば、出現回数、出現頻度（所定期間内での出現回数）、前回出現させてからの期間等に応じて変化する。

　なお、キャラクタの属性は、ユーザの行動履歴に基づいて変化する。したがって、キャラクタの属性変化の履歴は、ユーザの行動履歴でもある。したがって、キャラクタの属性変化の履歴の情報を利用して、キャラクタの属性を変化させることもできる。キャラクタの属性変化の履歴の情報は、出現させたオブジェクトに関する履歴の情報の一例である。キャラクタの属性変化の履歴の情報は、たとえば、ユーザデータとして、ユーザデータベースに記録される。あるいは、行動履歴データベースに記録される。

　キャラクタの属性は、ユーザとの関わり方又はインタラクションに応じて変化するので、当該キャラクタへの思い入れが一層強くなり、より興趣性を向上できる。すなわち、出現回数や撮影回数、プリント回数が増えるほど、外観のグレードが上がったり、成長又は進化したり、親密度が向上したりするので、より愛着が湧くようになる。

　［キャラクタの配置領域］
　上記実施の形態では、主被写体の周囲、かつ、地面の領域をキャラクタの配置領域としているが、キャラクタの配置領域を決定する方法は、これに限定されるものではない。上記第１の実施の形態の変形例で説明したように、キャラクタの種類等に応じて配置領域を設定することが好ましい。この他、ユーザの行動履歴の情報に基づいて、キャラクタの配置領域を決定してもよい。たとえば、ユーザのロケーション履歴の情報に基づいて、キャラクタの配置領域を決定する場合、次のように、配置領域を決定する。

　図２４は、キャラクタの配置の一例を示す概念図である。

　同図（Ａ）は、現在位置が未訪問地の場合に生成されるＡＲ画像の一例を示している。また、同図（Ｂ）は、現在の訪問地が既訪問地の場合に生成されるＡＲ画像の一例を示している。

　図２４（Ａ）に示すように、現在位置が既訪問地の場合、主被写体ＭＯから距離Ｄ１以上、距離Ｄ２未満の領域にキャラクタ（ＡＲオブジェクト）ＡＲＯを配置する（距離Ｄ１＜距離Ｄ２）。

　一方、現在位置が、未訪問地の場合、図２４（Ｂ）に示すように、主被写体ＭＯから距離Ｄ２以上、距離Ｄ３未満の領域にキャラクタＡＲＯを配置する（距離Ｄ２＜距離Ｄ３）。

　このように、現在位置が、既訪問地の場合、未訪問地の場合よりも主被写体ＭＯの近くにキャラクタＡＲＯを配置する。

　キャラクタの配置領域の決定には、この他、出現させるキャラクタについての出現回数、撮影回数、プリント回数、親密度等の情報を利用することもできる。この場合、たとえば、出現回数が増えるほど、撮影回数が増えるほど、プリント回数が増えるほど、親密度が上がるほど、主被写体の近くにキャラクタを配置する。これらの情報は複合的に利用してもよいし、各項目に重みを付けて判定し、配置位置を決定してもよい。

　また、キャラクタを出現させる画像に対し、画像認識（物体認識を含む）を行い、その結果を利用して、キャラクタの配置領域ないし配置位置を決定してもよい。たとえば、画像から特定の被写体（たとえば、ランドマーク、モニュメント等）が認識された場合、その特定の被写体と並んでキャラクタが配置されるように、キャラクタの配置位置を決定することができる。また、たとえば、画像から特定の被写体が認識され、かつ、人物が認識された場合、人物のキャラクタとの間に特定の被写体が配置されるように、キャラクタの配置位置を決定することができる。

　図２５は、画像認識を利用したキャラクタの配置の一例を示す概念図である。

　同図は、特定の被写体、ここでは、モニュメントＭを画面内に収めて自分撮りする場合の例を示している。自分撮りとは、撮影者自身を被写体とする撮影方法をいう（セルフィ／Selfie）。この場合、主被写体である撮影者（ユーザ）ＭＯと、キャラクタ（ＡＲオブジェクト）ＡＲＯとの間にモニュメントＭが配置されるように、キャラクタＡＲＯの配置位置を決定する。

　特定の被写体の認識については、公知の画像認識の技術を採用できる。また、一般に自分撮りは、インカメラ部１８Ａを使用して行われることから、自分撮りか否かについての判定は、インカメラ部１８Ａでの撮影か否かによって行ってもよい。

　［その他の実施の形態］
　［ランダムプリント］
　キャラクタ等のＡＲオブジェクトが表示された画像をプリントする際、ＡＲオブジェクトの表示を変化させて、プリントしてもよい。また、その変化をランダムに行ってもよい。たとえば、キャラクタが表示された画像をプリントする際、キャラクタの表情、姿勢、服装などをランダムに変化させて、プリントすることができる。これにより、プリントの興趣性をより高めることができる。

　図２６は、プリントの概念図である。

　図２６は、インスタントフィルム１１０に画像をプリントする場合の例を示している。図２６（Ａ）は、プリントを指示した画像を示している。同図において、携帯端末１０のディスプレイ１５に表示されている画像がプリントを指示した画像である。図２６（Ｂ）は、プリントの結果物を示している。プリントを指示した画像に対し、キャラクタの表情、姿勢及び装飾が変化してプリントされている。

　単なるディスプレイへの表示と異なり、プリントは、修正不可能な唯一性のある画像が得られるという楽しみがある。よって、プリントの際、ＡＲオブジェクトの表示を変更することで、ユーザが予測不可能な唯一性のある画像を得ることができ、より興趣性を向上できる。また、その変化にランダム性を持たせることにより、更に興趣性を向上できる。ランダム要素は、たとえば、プリントを指示した時分等に基づいて決定する構成とすることができる。

　［クロスリアリティ（Cross reality；ＸＲ）への拡張］
　上記実施の形態では、本発明を拡張現実（ＡＲ）での処理に適用した場合を例に説明したが、本発明の適用は、これに限定されるものではない。複合現実（Mixed Reality；ＭＲ）、仮想現実（virtual reality；ＶＲ）等での処理にも適用できる。

　ＭＲは、ＡＲをより発展させた技術であり、空間的な広がりを持った仮想物（オブジェクト）を現実空間の特定の位置にリアルタイムに合成し、手で触れるといった物理的な働きかけにより操作したり介入したりできる技術である。ＭＲは、３次元の空間認識力を有しており、現実世界に空間情報を持つ仮想世界を融合できる。ＭＲでは、デバイスが複数のカメラ、センサ等を駆使して空間情報を認識し、現実世界の形状、位置情報などを把握するので、現実世界に空間情報を持った仮想世界を表出できる。ＭＲは、通常、専用のヘッドマウントディスプレイ（Head Mounted Display ；ＨＭＤ）を用いて提供される。ＭＲにおいても、デバイス（たとえば、ＨＭＤ）に備えられたカメラ、各種センサを使用して、キャラクタを配置する空間の環境の情報を取得できる。

　ＶＲの場合、すべてがＣＧで提供される。したがって、この場合、携帯端末も仮想物としてＣＧで仮想空間に表示される。ユーザは、仮想空間内での分身であるアバタを介して、仮想物である携帯端末の操作を行う。仮想空間において、ユーザの位置は、アバタの位置として認識される。オブジェクトを出現させる空間は、仮想空間内でアバタが使用する携帯端末で撮影した空間として認識される。

　近年、実空間を仮想空間で再現する、デジタルツイン（Digital Twin）が現実のものになりつつある。よって、実空間を再現した仮想空間でも本発明を実施できる。

　この他、ＶＲの場合、アバタの視界領域を構成する空間をオブジェクトの配置空間とし、その空間の環境に関する情報、及び、ユーザの行動履歴に関する情報に基づいて、仮想空間に出現させるオブジェクトを決定してもよい。この場合、アバタの視界領域を構成する画像から環境に関する情報を取得する。たとえば、アバタの視界領域を構成する画像中の物体の情報を取得する。また、仮想空間内でのアバタの位置（座標位置）の情報を取得して、ユーザの位置の情報を取得する。

　このように、本発明は、実空間に限らず、仮想空間（たとえば、メタバース等）にオブジェクトを出現させる場合にも適用できる。

　［システム構成］
　上記実施の形態では、携帯端末がすべての処理を行う構成としているが、一部の処理を他の装置が行う構成としてもよい。たとえば、一部の処理をサーバが行う構成としてもよい。たとえば、携帯端末は、撮影、各種センシング、及び、ＡＲ画像の表示のみを行い、各種データベースの管理、ＡＲ画像の生成等は、サーバが行う構成としてもよい。この場合、携帯端末とサーバとの間の通信の形態は特に限定されない。

　また、上記実施の形態では、画像の撮影、各種センシング、及び、画像の表示をすべて携帯端末で行う構成としているが、各処理を別々の装置で行う構成としてもよい。たとえば、画像の表示は、ＨＭＤを用いて行う構成としてもよい。

　［ハードウェア構成］
　情報処理装置が実現する機能は、各種のプロセッサ（Processor）で実現される。各種のプロセッサには、プログラムを実行して各種の処理部として機能する汎用的なプロセッサであるＣＰＵ及び／又はＧＰＵ（Graphic Processing Unit）、ＦＰＧＡ（Field Programmable Gate Array）などの製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス（Programmable Logic Device，ＰＬＤ）、ＡＳＩＣ（Application Specific Integrated Circuit）などの特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路などが含まれる。プログラムは、ソフトウェアと同義である。

　１つの処理部は、これら各種のプロセッサのうちの１つで構成されていてもよいし、同種又は異種の２つ以上のプロセッサで構成されてもよい。たとえば、１つの処理部は、複数のＦＰＧＡ、或いは、ＣＰＵとＦＰＧＡの組み合わせによって構成されてもよい。また、複数の処理部を１つのプロセッサで構成してもよい。複数の処理部を１つのプロセッサで構成する例としては、第１に、クライアントやサーバなどに用いられるコンピュータに代表されるように、１つ以上のＣＰＵとソフトウェアの組合せで１つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第２に、システムオンチップ（System on Chip，ＳｏＣ）などに代表されるように、複数の処理部を含むシステム全体の機能を１つのＩＣ（Integrated Circuit）チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサを１つ以上用いて構成される。

１０　携帯端末
１１　ＣＰＵ
１４　内蔵メモリ
１５　ディスプレイ
１６　タッチパッド
１７　ＧＰＳ受信部
１８　カメラ部
１８Ａ　インカメラ部
１８Ｂ　アウトカメラ部
１９　マイク部
２０スピーカ部
２１　無線通信部
２２　近距離無線通信部
２３　センサ部
３０　タッチパネル
１００　プリンタ
１１０　インスタントフィルム
１１１　環境情報取得部
１１１Ａ　位置判定部
１１１Ｂ　物体認識部
１１２　行動履歴情報取得部
１１３　行動履歴データベース管理部
１１４　ＡＲオブジェクト決定部
１１４Ａ　主被写体判定部
１１４Ｂ　配置領域決定部
１１４Ｃ　第１要素決定部
１１４Ｄ　第２要素決定部
１１５　ＡＲ画像生成部
１１６　表示制御部
１１７　記録制御部
１２１　地図データベース
１２２　行動履歴データベース
１２３　ＡＲオブジェクトデータベース
ＡＲＩ　ＡＲ画像
ＡＲＯ　ＡＲオブジェクト
ＤＡ１　サイコロの画像
ＤＡ２　サイコロの画像
Ｉ　撮影画像
Ｍ　モニュメント
ＭＯ　主被写体
Ｒ　配置領域
ＳＳＢ　シャッタボタン
ＳＴＡ　ステージの画像
ＳＴＢ　スタートボタン
Ｓ１０～Ｓ２５　ＡＲ表示を行う場合の携帯端末の動作手順
Ｓ２１＿１～Ｓ２１＿３　ＡＲオブジェクトの表示形態の決定処理の手順
Ｓ２１＿１１～Ｓ２１＿１７　クジ引きを実施してＡＲオブジェクトの表示形態を決定する場合の処理手順

Claims

　プロセッサを備え、
　前記プロセッサは、
　オブジェクトを出現させる空間の環境に関する第１情報を取得し、
　ユーザの行動履歴に関する第２情報を取得し、
　前記第１情報に基づいて、前記オブジェクトに関する第１要素を決定し、
　前記第２情報に基づいて、前記オブジェクトに関する第２要素を決定し、
　前記第１要素及び前記第２要素に基づいて、前記空間に出現させる前記オブジェクトを決定する、
　情報処理装置。
　前記プロセッサは、
　前記オブジェクトを出現させる前記空間を撮影した第１画像を取得し、
　前記第１画像に前記オブジェクトを重畳させた第２画像を生成する、
　請求項１に記載の情報処理装置。
　前記プロセッサは、前記第１画像を処理して、前記第１画像内の物体、又は、前記第１画像のシーンを認識し、前記第１情報を取得する、
　請求項２に記載の情報処理装置。
　前記プロセッサは、
　前記ユーザの位置の情報を取得し、
　前記ユーザが特定の地域に存在している場合に、前記第１画像内の物体、又は、前記第１画像のシーンを認識し、前記第１情報を取得する、
　請求項３に記載の情報処理装置。
　前記第２情報は、前記ユーザの移動の履歴の情報、又は、出現させた前記オブジェクトに関する履歴の情報を含む、
　請求項１に記載の情報処理装置。
　前記第１要素は、出現させる前記オブジェクトの種類であり、
　前記第２要素は、出現させる前記オブジェクトの表示形態又は属性である、
　請求項１から５のいずれか１項に記載の情報処理装置。
　前記プロセッサは、
　前記オブジェクトを出現させる前記空間を撮影した画像を処理して、主被写体を認識し、
　前記空間内での前記主被写体の位置に基づいて、前記空間に出現させる前記オブジェクトの配置領域を決定する、
　請求項６に記載の情報処理装置。
　前記プロセッサは、前記配置領域での前記第１情報に基づいて、出現させる前記オブジェクトの種類を決定する、
　請求項７に記載の情報処理装置。
　前記プロセッサは、前記ユーザの行動履歴が特定の条件を満たす場合、前記オブジェクトの表示形態をランダムに決定する、
　請求項６に記載の情報処理装置。
　前記プロセッサは、前記第２画像の出力の指示に応じて、前記オブジェクトの表示形態又は属性を変更する、
　請求項２から４のいずれか１項に記載の情報処理装置。
　オブジェクトを出現させる空間の環境に関する第１情報を取得するステップと、
　ユーザの行動履歴に関する第２情報を取得するステップと、
　前記第１情報に基づいて、前記オブジェクトに関する第１要素を決定するステップと、
　前記第２情報に基づいて、前記オブジェクトに関する第２要素を決定するステップと、
　前記第１要素及び前記第２要素に基づいて、前記空間に出現させる前記オブジェクトを決定するステップと、
　を含む情報処理方法。
　オブジェクトを出現させる空間の環境に関する第１情報を取得する機能と、
　ユーザの行動履歴に関する第２情報を取得する機能と、
　前記第１情報に基づいて、前記オブジェクトに関する第１要素を決定する機能と、
　前記第２情報に基づいて、前記オブジェクトに関する第２要素を決定する機能と、
　前記第１要素及び前記第２要素に基づいて、前記空間に出現させる前記オブジェクトを決定する機能と、
　をコンピュータに実現させる情報処理プログラム。
　非一時的かつコンピュータ読取可能な記録媒体であって、請求項１２に記載のプログラムが記録された記録媒体。