WO2020066825A1

WO2020066825A1 - 音声メッセージシステム、サーバ装置、サーバ装置の情報処理方法、プログラム、および音声メッセージのデータ構造

Info

Publication number: WO2020066825A1
Application number: PCT/JP2019/036724
Authority: WO
Inventors: 郷柴田
Original assignee: 日本電気株式会社
Priority date: 2018-09-28
Filing date: 2019-09-19
Publication date: 2020-04-02
Also published as: JP2022133354A; JP7099534B2; US20220007134A1; JP7294506B2; JPWO2020066825A1

Abstract

サーバ装置（１００）は、個人が保持又は個人の周囲に位置している端末の位置情報、又は個人の位置情報を取得する位置情報取得部（１０２）と、取得した位置情報を用いてジングルを選択する選択部（１０４）と、取得した位置情報を用いて再生音声情報を決定する決定部（１０６）と、ジングルおよび再生音声情報の順に再生させるように音声情報を生成し、生成した音声情報を端末に再生させる音声再生制御部（１０８）と、を備える。

Description

音声メッセージシステム、サーバ装置、サーバ装置の情報処理方法、プログラム、および音声メッセージのデータ構造

　本発明は、音声メッセージシステム、サーバ装置、サーバ装置の情報処理方法、プログラム、および音声メッセージのデータ構造に関し、特に、意欲前領域における音声ガイダンスの音声メッセージシステム、サーバ装置、サーバ装置の情報処理方法、プログラム、および音声メッセージのデータ構造に関する。

　昨今、パーソナルコンピュータ、スマートフォン、及びタブレットなどの個人向けの端末が普及している。情報配信者は、この個人向けの端末に、広告などの情報を配信している。

　特許文献１には、広告の内容を音声出力する技術が開示されている。

特開２０１８－２８５３３号公報

　上記したように、端末に音声情報が配信されることがある。しかし、端末の保持者は、当該情報を認識しても、その情報に対して意欲を示さないことがある。

　本発明は上記事情に鑑みてなされたものであり、その目的とするところは、端末に音声情報を配信した場合において、端末の保持者にその情報に対する意欲を持たせることにある。

　本発明の各側面では、上述した課題を解決するために、それぞれ以下の構成を採用する。

　第一の側面は、音声メッセージシステムに関する。
　第一の側面に係る音声メッセージシステムは、
　サーバ装置と、
　端末と、を有し、
　前記サーバ装置は、
　　前記端末の位置情報、又は個人の位置情報を取得する位置情報取得手段と、
　　取得した前記位置情報を用いてジングルを選択する選択手段と、
　　取得した前記位置情報を用いて再生音声情報を決定する決定手段と、
　　前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に送信する送信手段と、を有し、
　前記端末は、
　　前記サーバ装置に位置情報を送信する手段と、
　　前記サーバ装置から前記音声情報を受信する手段と、
　　前記音声情報を受信すると、当該音声情報を出力する出力手段と、を有する。

　第二の側面は、サーバ装置に関する。
　第二の側面に係るサーバ装置は、
　端末の位置情報、又は個人の位置情報を取得する位置情報取得手段と、
　取得した前記位置情報を用いてジングルを選択する選択手段と、
　取得した前記位置情報を用いて再生音声情報を決定する決定手段と、
　前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる音声再生制御手段と、を有する。

　第三の側面は、少なくとも１つのコンピュータにより実行される情報処理方法に関する。
　第三の側面に係る情報処理方法は、
　サーバ装置が、
　端末の位置情報、又は個人の位置情報を取得し、
　取得した前記位置情報を用いてジングルを選択し、
　取得した前記位置情報を用いて再生音声情報を決定し、
　前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる、ことを含む。

　第四の側面は、音声メッセージのデータ構造に関する。
　第四の側面に係る音声メッセージのデータ構造は、
　　端末で再生されるように生成される音声メッセージのデータ構造であって、
　前記音声メッセージは、
　　前記端末の位置情報、又は個人の位置情報を用いて選択されたジングルと、
　　前記位置情報を用いて決定された再生音声情報と、をこの順に含み、かつ、この順に再生され、
　前記再生音声情報は、さらに、
　　前記位置情報に関連して個人が体験できる内容に関する情報と、
　　その位置情報が示す施設を特定する情報と、をこの順に含み、かつ、この順に再生される。

　なお、本発明の他の側面としては、上記第三の側面の方法を少なくとも１つのコンピュータに実行させるプログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記録媒体であってもよい。この記録媒体は、非一時的な有形の媒体を含む。
　このコンピュータプログラムは、コンピュータにより実行されたとき、コンピュータに、サーバ装置上で、その情報処理方法を実施させるコンピュータプログラムコードを含む。

　なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。

　また、本発明の各種の構成要素は、必ずしも個々に独立した存在である必要はなく、複数の構成要素が一個の部材として形成されていること、一つの構成要素が複数の部材で形成されていること、ある構成要素が他の構成要素の一部であること、ある構成要素の一部と他の構成要素の一部とが重複していること、等でもよい。

　また、本発明の方法およびコンピュータプログラムには複数の手順を順番に記載してあるが、その記載の順番は複数の手順を実行する順番を限定するものではない。このため、本発明の方法およびコンピュータプログラムを実施するときには、その複数の手順の順番は内容的に支障のない範囲で変更することができる。

　さらに、本発明の方法およびコンピュータプログラムの複数の手順は個々に相違するタイミングで実行されることに限定されない。このため、ある手順の実行中に他の手順が発生すること、ある手順の実行タイミングと他の手順の実行タイミングとの一部ないし全部が重複していること、等でもよい。

　上記各側面によれば、端末に音声情報を配信した場合において、端末の保持者にその情報に対する意欲を持たせる音声メッセージシステム、サーバ装置、サーバ装置の情報処理方法、プログラム、および音声メッセージのデータ構造を提供することができる。

　上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。

本発明の実施の形態に係る音声メッセージシステムの構成を概念的に示す図である。位置情報記憶部のデータ構造の例を示す図である。音声データのデータ構造を示す図である。サーバ装置の論理的な構成を示す機能ブロック図である。ジングル記憶部のデータ構造の例を示す図である。端末の構成を論理的に示す機能ブロック図である。サーバ装置又は端末を実現するコンピュータの構成の一例を示すブロック図である。サーバ装置の動作の一例を示すフローチャートである。端末の動作の一例を示すフローチャートである。サーバ装置の構成を論理的に示す機能ブロック図である。行動履歴記憶部と再生音声情報記憶部のデータ構造の一例を示す図である。行動履歴記憶部のデータ構造の他の例を示す図である。実施例１の論理的な構成を示す機能ブロック図である。

　以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。

（第１の実施の形態）
　図１は、本発明の実施の形態に係る音声メッセージシステム１の構成を概念的に示す図である。
　音声メッセージシステム１は、サーバ装置１００と、端末２００と、を備える。サーバ装置１００は、例えば、ビーコン発信機５０の通信圏５２内に進入した端末２００に状況に応じた音声メッセージを再生出力させる。ビーコン発信機５０は、例えば、ブルートゥース（登録商標）規格に準拠した通信によりビーコンを発信するものでもよいし、無線ＬＡＮ（Local Area Network）通信、所謂Ｗｉ－Ｆｉ（Wireless Fidelity）通信のアクセスポイント（不図示）に含まれ、ビーコンを発信するものでもよい。

　ビーコンは位置情報を含み、端末２００がビーコンから位置情報を取得してサーバ装置１００に送信してもよい。あるいは、ビーコンは位置情報の代わりにＩＰ（Internet Protocol）アドレス等の識別情報を含む構成でもよい。図２（ａ）に示すように、サーバ装置１００は、識別情報と位置情報を対応付けて位置情報記憶部１１４に記憶しておく。端末２００はビーコンから取得した識別情報をサーバ装置１００に送信し、サーバ装置１００は識別情報から位置情報を特定してもよい。言い換えれば、ビーコン発信機５０は、その周辺の位置情報を特定できる情報を含むビーコンを発信する。

　さらに、位置情報記憶部１１４は、図２（ｂ）のように、識別情報に施設または区域を示す情報を対応付けて記憶してもよい。

　本明細書において、「取得」とは、自装置が他の装置や記憶媒体に格納されているデータまたは情報を取りに行くこと（能動的な取得）、たとえば、他の装置にリクエストまたは問い合わせして受信すること、他の装置や記憶媒体にアクセスして読み出すこと等、および、自装置に他の装置から出力されるデータまたは情報を入力すること（受動的な取得）、たとえば、配信（または、送信、プッシュ通知等）されるデータまたは情報を受信すること等、の少なくともいずれか一方を含む。また、受信したデータまたは情報の中から選択して取得すること、または、配信されたデータまたは情報を選択して受信することも含む。

　また、ビーコンは位置情報および識別情報のいずれも含まなくてもよい。端末２００はビーコンを受信したことをトリガとして、端末２００のＧＰＳ（Global Positioning System）受信機能を用いて位置情報を取得し、端末２００の位置情報をサーバ装置１００に送信してもよい。あるいは、端末２００はビーコンを受信したことをトリガとして、ビーコンを受信したことをサーバ装置１００に通知し、通知を受けて、サーバ装置１００が、例えば、携帯電話回線網（不図示）への端末２００の位置登録の情報に基づいて端末２００の位置情報を特定してもよい。

　端末２００は、個人（利用者Ｕ１）に保持されている、又は、個人の周囲に位置している端末である。端末２００は、個人の所有物であってもよいし、個人に貸与されるものであってもよい。

　端末２００は、例えば、スマートフォン、タブレット端末、ノート型パーソナルコンピュータ、携帯電話機、ＰＨＳ（Personal Handyphone System）、ＰＤＡ（Personal Digital Assistants）、ウェアラブル端末、ポータブルデジタル音楽プレーヤ、ポータブルビデオプレーヤ、ポータブルゲーム機、ポータブルテレビ受像機等を含み、音声出力する機能を有するポータブル又はウェアラブルな端末であれば特に限定されない。また、端末２００は、音声メッセージの出力に特化したイヤホンデバイス、所謂ガイド端末や、本システム専用の音声出力端末であってもよい。また、端末２００は、利用者Ｕ１が利用する輸送用装置（一例として、車両、自動車、二輪自動車、自転車、列車、バス、リヤカー、人力車、船舶（ship and other watercraft）、飛行機、ロケット、人工衛星、ドローン、気球など）のアイテムであっても良い。

　また、複数の端末、例えば、ウェアラブル端末とスマートフォンが協働して、端末２００の各機能を分担して実行し、端末２００の機能全体を実現してもよい。例えば、利用者Ｕ１の位置情報、利用者Ｕ１の動作（移動速度、歩幅、移動方向、顔や体の向き等）、利用者Ｕ１の状態（心拍数、消費エネルギ、体温等）、または周辺の気候情報（気温、気圧等）等をウェアラブル端末が検出し、検出した情報をスマートフォンに送信し、スマートフォンが取得した情報をサーバ装置１００に送信してもよい。また、他の例では、音声メッセージの出力をウェアラブル端末から行い、その他の処理はスマートフォンで行うなどでもよい。

　本発明は音声メッセージによって個人の意欲を喚起することを目的とする。そのためには、意欲後に即特定の行為（動詞）選択を行うように働きかけることが必要である。しかし、本発明では音声メッセージの配信のみによって意欲喚起を達成させるために、配信されるメッセージは、対象の説明をする情報というよりも、そこでの「体験」が想起される具体的な情報が含まれていることが重要である。

　メッセージ内容には、対象を説明する情報ではなく、そこでの「体験」が想起される具体的な情報が含まれている。メッセージ内容は、簡潔であることがより好ましい。意欲喚起または行為誘発を目的とした本発明では、メッセージの設計に関して、広告主である配信者の視座に立脚せずに、受信者の視座に定位する。これは、従来のマーケティングで言われてきた「消費者目線」でのアプローチとは、以下の点で意味が異なる。
（ａ１）メッセージ内容ではなく、その「形式」が消費者目線であること。
（ａ２）他との比較を可能にする内容が含まれ「ない」こと。

　上記の２点の具体例を以下に示す。
　まず、意欲喚起または行為誘発を行うには、対象の説明情報を伝達することが第一の目的とはならいない。そのため、メッセージは個人に特定の行為を促すために提示される情報、謂わば、「釣り針」であると考えられる。

　例えば、観光サービスにおいて観光地や施設などに関する情報を提供するメッセージ「ＡＡ寺は、ＢＢ時代にＣＣが建てた日本最古のお寺です」は、それを聞いた後にそこで何をどうするかを受信者が考えねばならない情報である。この類の情報は、認知および心理の観点から言えば意欲喚起または行為誘発までの距離が長い。意欲喚起または行為誘発に関わるメッセージは、より受信者にとって自分自身の行為選択（そこで何をするのか）が直接的および直感的に理解される方が好ましい。

　本発明のメッセージは、「この先で、座禅体験ができます／ＢＢＢが描いた美人画が御覧頂けます／」等のように、そこで何が可能になるかについて記述する形式とすることで、「体験」が想起されるメッセージとなる。これが、上記（ａ１）の意味である。

　また本発明のメッセージは、可能であれば、想起される「体験」が、「そこでだけ」可能であるという趣旨が強調されるメッセージであることが望ましい。これが、上記（ａ２）の意味である。

　過去に施設を訪れた際の体験や感想はブログ、ツイッター（登録商標）等のＳＮＳ（Social Networking Service）でインターネット上に多数公開されている。したがって、音声メッセージシステム１では、例えば、これら公開情報を蓄積および加工し、体験を想起するメッセージテキストを作ることができる。

　メッセージの生成は、人が作成してもよいし、ＡＩ（Artificial Intelligence）技術を用いて装置により自動的に生成されてもよいし、それらの組み合わせでもよい。生成されたメッセージは施設に対応付けて、後述する再生音声情報記憶部１１２に記憶される。

　また、個人が類似体験を経験している場合は、重複しないような体験メッセージテキストを配信することで、個人の意欲喚起または行為誘発をより促すことができる。類似体験を経験しているか否かは個人の行動履歴を参照することで判断できる。この行動履歴については後述する実施形態で詳細に説明する。

　個人にとって、メッセージ再生は個人の動作や会話に割り込む形で発生することになる。よって、唐突に音声が発せられることは混乱を招き、不快さを感じさせる可能性もある。本発明では、こうした問題点を解決するための手段として、ジングルの利用を採用する。ジングルはラジオなどの聴覚のみのメディアにおいて一般的に用いられる注意喚起手法で、コマーシャルや番組などのコンテキストの移り変わりを明示的にするために、特定のパターンの音要素を用いるものである。

　本発明では、ジングルとは、気付き、および所定のイメージを想起させる効果を持つ、短いメロディ（曲、音楽、歌を含む）、短い音（自然音、合成音、楽器音、音声、合成音声を含む）、または、これらの組み合わせとする。「短い」とは、ジングルの出力時間が、少なくとも１～３秒程度の長さであり、利用者Ｕ１が少なくともジングルを認識できる長さとする。

　図３は、本実施形態の音声データ３００のデータ構造を示す図である。
　音声データ３００は、ジングル３０２と、再生音声情報３１０とがこの順に再生されるように構成される。また、再生音声情報３１０は、メッセージ３１２と、対象名３１４と、がこの順に再生されるように構成される。

　このように、まずメッセージの冒頭でジングルを発音させることでメッセージの再生を予告し個人の受容度を上げる。つまり、ジングル機能は「自然に個人に割り込める音要素であること」となる。

　正弦波形を利用したブザーやアラート音は、一般に倍音成分が少なく認識しやすい反面、脳に直接的なサウンドとなる傾向があるため、危険や注意を促す点においては有用であるが心地よいサウンドとならないことが多い。また、イヤホンなどの音声デバイスは耳の至近距離で試聴することを前提としているため、サウンドのアタック部分（音の始まり）に鋭角な音を使用すると、ストレスを感じやすい。そのため、本発明では倍音構成の豊かなサウンドかつ、複数の音色を時間差で組み合わせることで受容しやすい聴覚体験をもたらすジングルとする。

　例えば、川であれば川のせせらぎ、滝であれば滝の音など場所を想起させる自然音を使用すると、物質的な理解度を上げることは可能であるが、自然音の場合、聴取時間を長くしないと認識しにくいという欠点がある。

　次に同じ生音でもピアノやバイオリンといったリアルな楽器音を使用した場合、一聴して楽器の形状や、聞いた人が今までに体験したそれぞれの楽器に対するイメージが明確となり、ジングルの印象度が増しすぎる危険性も含んでいる。

　一方、電子音の場合は具体的なイメージを想像しにくい反面、万人に対して一定の印象を与えることが可能である。また、リアルな楽器音の場合では、その楽器の特性上、演奏困難または著しく特異な奏法となってしまう音列を使用しても違和感が無いため、音程や和音の自由度が増し、音としての機能性をまとめやすい。結果として電子音でかつブザー音にならない程度のリアルさ（一般的に耳にする機会の多いサウンド）というバランス感が重要となる。

　このようにして設計されたジングルは、後述するジングル記憶部１１０に施設または体験内容等と対応付けて記憶される。

　再生音声情報３１０は、位置情報に関連して個人が体験できる内容に関する情報を示すメッセージ３１２と、その位置情報が示す施設等を特定する情報を示す対象名３１４を、図３に示したように、この順に含んでいる。

　メッセージ３１２に含まれる体験内容に関する情報とは、例えば、「舞妓さんの衣装に着替えて、舞妓さんになりきって京都の町を散策しよう。本物の舞妓さんと一緒に記念撮影もできるよ。」等である。このメッセージ３１２の後に続く対象名３１４は、例えば、「ＸＹＺ写真館」等である。

　図４は、本実施形態のサーバ装置１００の論理的な構成を示す機能ブロック図である。
　サーバ装置１００は、位置情報取得部１０２と、選択部１０４と、決定部１０６と、音声再生制御部１０８と、を備える。

　位置情報取得部１０２は、端末２００の位置情報、又は個人（利用者Ｕ１）の位置情報を取得する。選択部１０４は、取得した位置情報を用いてジングルを選択する。決定部１０６は、取得した位置情報を用いて再生音声情報を決定する。音声再生制御部１０８は、ジングルおよび再生音声情報の順に再生させるように音声情報を生成し、生成した音声情報を端末２００に再生させる。

　端末２００の位置情報の取得方法は、以下に例示されるがこれらに限定されない。
（ｂ１）端末２００から受信する。
（ｂ２）端末２００の位置登録により取得した情報を基地局７０から取得する。
（ｂ３）端末２００がアクセスしたアクセスポイントから取得する。

　サーバ装置１００は、ジングル記憶部１１０および再生音声情報記憶部１１２に接続される。ジングル記憶部１１０および再生音声情報記憶部１１２は、サーバ装置１００の内部の記憶装置でもよいし、外部の記憶装置でもよいし、それらの組み合わせでもよい。

　位置情報を取得するタイミングは、端末２００から送信された位置情報、位置情報を特定するための識別情報、または、ビーコンを受信したことの通知を受信したとき、あるいは、一定期間毎に定期的となる。また、サーバ装置１００が情報を能動的に取得してもよいし、外部から送信された情報を受動的に取得してもよい。

　なお、ビーコン発信機５０から発信されたビーコンを受信した端末２００が送信した位置情報を受信した場合は、端末２００に再生音声情報（以後、「音声メッセージ」とも呼ぶ）を送信するタイミングであるため、サーバ装置１００は、受信したタイミングで端末２００に音声メッセージを送信してよい。

　一方、端末２００の位置情報が定期的に受信したものである場合は、サーバ装置１００の位置情報取得部１０２は、その位置情報に基づいて、音声メッセージを配信する条件を満たしているか否かを判定する処理をさらに行う。

　図２（ｃ）に示すように、サーバ装置１００は、音声メッセージを配信する対象施設または対象区域と、その位置情報を対応付けて位置情報記憶部１１４に記憶しておく。位置情報取得部１０２は、位置情報記憶部１１４を参照して、取得した位置情報が対象施設または対象区域に対応するか否かを判定することができる。対象施設または対象区域であると判定された場合に、その位置情報に基づいて、音声メッセージを配信する処理を行う。

　ジングル記憶部１１０には、複数のジングルが記憶される。
　選択部１０４は、位置情報取得部１０２が取得した位置情報の位置の属性を特定し、さらに、特定した属性に基づいて、ジングルを選択する。

　選択部１０４は、位置情報を用いて施設を特定し、その施設のカテゴリを位置の属性とする。選択部１０４は、位置情報が示す位置で体験できる内容の属性を、その位置の属性としてもよい。選択部１０４は、施設のカテゴリと位置情報が示す位置で体験できる内容の属性とを組み合わせて、位置の属性としてもよい。

　例えば、図２（ｄ）に示すように、位置情報記憶部１１４は、対象施設または対象区域を示す情報と位置情報に、カテゴリと体験内容の少なくともいずれか一方を対応付けて記憶する。

　例えば、施設のカテゴリは、観光、グルメ、自然、文化、レジャー、商業、イベント、教育、政治、交通等を含む。例えば、図５（ａ）に示すように、施設のカテゴリ毎にジングルを対応付けてジングル記憶部１１０に記憶してもよい。また、図５（ｂ）に示すように、施設毎に、その施設特有のジングルを対応付けてジングル記憶部１１０に記憶してもよい。

　図５（ａ）と図５（ｂ）の両方のテーブルを用いてジングルを選択する場合について、説明する。選択部１０４は、図２の位置情報記憶部１１４を参照して位置情報から施設を特定した後、まず、図５（ｂ）のテーブルを参照し、施設に対応付けられた施設特有のジングルがあれば、そのジングルを選択する。もし、施設に対応付けられた施設特有のジングルがなければ、次に図２（ｄ）の位置情報記憶部１１４を参照して、その施設のカテゴリを特定する。そして、図５（ａ）のテーブルを参照して特定されたカテゴリに対応付けられたジングルを選択する。

　図５（ｃ）の例では、体験できる内容の属性にジングルを対応付けてジングル記憶部１１０に記憶している。ジングル記憶部１１０は、図５（ａ）、図５（ｂ）、および図５（ｃ）のうち少なくともいずれか１つを含むのが好ましい。また、ジングル記憶部１１０は、位置情報または施設または区域を示す情報にジングルを対応付ける構成でもよい。

　再生音声情報記憶部１１２には、複数の再生音声情報が記憶され、音声データおよびテキストデータの少なくともいずれか一方のファイル形式で記憶される。
　再生音声情報記憶部１１２には、再生音声情報のファイル名やパスの情報と、位置情報、あるいは、施設または区域を示す情報とを対応付けたテーブルと、再生音声情報のデータファイルが記憶される。

　図５（ａ）～図５（ｃ）の例では、１つの位置の属性に対して１つのジングルが対応付けられている例を示した。しかし、１種類の位置の属性に対して複数のジングルが対応付けられていてもよい。この場合、選択部１０４は、後述する行動履歴に基づいて、所定期間中に複数回同じ端末２００または利用者Ｕ１の位置情報を取得したときに、毎回異なるジングルを選択してもよい。

　ファイル形式がテキストデータの場合は、サーバ装置１００又は端末２００がテキスト読み上げ手段を備え、テキスト読み上げ手段により音声データを生成して出力することができる。端末２００がテキスト読み上げ手段を有している場合は、音声再生制御部１０８は端末２００にテキストデータの再生音声情報を送信してもよい。テキスト読み上げ手段は、例えば、テキスト読み上げ機能を有するアプリケーションで実現できる。

　音声データファイルの形式は特に限定されず、ＷＡＶ，ＡＩＦＦ，ｍｐ３，ＡＣＣ，ＷＭＡ，ＡＴＲＡＣ，ｍｐ４等様々な形式が考えられるが、再生出力する端末２００が再生可能な形式とする。

　例えば、端末２００は、利用者が再生可能なファイル形式を選択設定できる機能を有しているのが好ましい。例えば、アプリケーションの設定メニュー等で設定を受け付けてもよいし、予めユーザ登録した利用者が端末２００から音声メッセージシステム１にログインし、設定画面等で設定を受け付けてもよい。設定情報は、利用者毎に利用者情報に含めて登録することができる。

　サーバ装置１００は設定情報を取得し、設定されたファイル形式で端末２００に音声データを送信することができる。また、本発明の音声メッセージシステム１専用のイヤホンデバイスであれば、所定のファイル形式に予め定めておくこともできる。

　また、端末２００がジングル記憶部１１０からジングルおよび再生音声情報記憶部１１２から再生音声情報の少なくともいずれか一方を読み出して音声を再生出力してもよい。その場合は、サーバ装置１００の音声再生制御部１０８は、端末２００に、音声出力すべきジングルおよび再生音声情報の少なくともいずれか一方を特定できる情報を送信すればよい。

　図６は、本実施形態の端末２００の構成を論理的に示す機能ブロック図である。
　端末２００は、位置情報取得部２０２と、位置情報送信部２０４と、再生音声情報受信部２０６と、音声再生出力部２０８と、を備える。

　位置情報取得部２０２は、端末２００、または端末２００周辺の位置情報を取得する。
　端末２００が位置情報を取得する方法は、以下に例示されるがこれらに限定されない。
（ｃ１）ＧＰＳ（Global Positioning System）衛星６０又は準天頂衛星から位置情報を受信する。
（ｃ２）ビーコン発信機５０から受信したビーコン信号から位置情報を取得する。

　例えば、上記（ｃ１）は、屋外または広域を対象として位置情報を取得するのに適している。上記（ｃ２）は、屋内または比較的狭い範囲を対象として位置情報を取得するのに適している。

　端末２００は、例えば、地磁気センサを用いて屋内か屋外かを検知して上記（ｃ１）と（ｃ２）の位置情報の取得方法を切り替えてもよい。

　位置情報送信部２０４は、取得した位置情報をサーバ装置１００に送信する。
　また、上記したように、位置情報取得部２０２は、ビーコン発信機５０から発信されるビーコンを受信し、位置情報送信部２０４は、ビーコンを受信したことを通知する情報をサーバ装置１００に送信してもよい。その構成では、サーバ装置１００側で端末２００の位置情報を特定する。

　再生音声情報受信部２０６は、サーバ装置１００から再生音声情報を受信する。
　音声再生出力部２０８は、再生音声情報受信部２０６が受信した再生音声情報を作成してスピーカ（不図示）から出力する。

　音声再生出力部２０８が再生音声情報を出力するタイミングは、再生音声情報を受信したときが好ましい。また、再生音声情報はサーバ装置１００からストリーミング配信され、端末２００は再生音声情報を再生音声情報受信部２０６により受信しながら音声再生出力部２０８により再生してもよい。

　また、他の構成では、端末２００再生音声情報を複数予め格納しておき、サーバ装置１００から出力すべきジングル３０２および再生音声情報３１０の情報を受信し、受信した情報に従って音声データ３００を構成して再生出力してもよい。

　図７は、図４のサーバ装置１００又は図６の端末２００を実現するコンピュータ８０の構成の一例を示すブロック図である。
　本実施形態のコンピュータ８０は、ＣＰＵ（Central Processing Unit）８２、メモリ８４、メモリ８４にロードされた後述する図４又は図６の機能ブロック図の構成要素を実現するプログラム９０、そのプログラム９０を格納するストレージ８５、Ｉ／Ｏ（Input/Output）８６、および通信用インタフェース（通信Ｉ／Ｆ８７）を備える。

　ＣＰＵ８２、メモリ８４、ストレージ８５、Ｉ／Ｏ８６、通信Ｉ／Ｆ８７は、バス８９を介して互いに接続され、ＣＰＵ８２によりサーバ装置１００又は端末２００が制御される。ただし、ＣＰＵ８２などを互いに接続する方法は、バス接続に限定されない。
　メモリ８４は、ＲＡＭ（Random Access Memory）やＲＯＭ（Read Only Memory）などのメモリである。ストレージ８５は、ハードディスク、ＳＳＤ（Solid State Drive）、またはメモリカードなどの記憶装置である。また、ストレージ８５は、ＲＡＭやＲＯＭなどのメモリであってもよい。
　ＣＰＵ８２が、ストレージ８５に記憶されるプログラム９０をメモリ８４に読み出して実行することにより、サーバ装置１００又は端末２００の各機能を実現することができる。

　Ｉ／Ｏ８６は、コンピュータ８０と他の入出力装置間のデータおよび制御信号の入出力制御を行う。他の入出力装置とは、たとえば、コンピュータ８０に接続されるキーボード、タッチパネル、マウス、操作スイッチ、操作ボタン、およびマイクロフォン等の入力装置（不図示）と、ディスプレイ、プリンタ、およびスピーカ等の出力装置（不図示）と、これらの入出力装置とコンピュータ８０のインタフェースとを含む。さらに、Ｉ／Ｏ８６は、他の記録媒体の読み取りまたは書き込み装置（不図示）とのデータの入出力制御を行ってもよい。

　通信Ｉ／Ｆ８７は、コンピュータ８０と外部の装置との通信を行うための各種の通信用インタフェースを含む。サーバ装置１００または端末２００の通信機能は、以下に例示されるが、これらに限定されない。
（ｄ１）近距離無線通信機能
　近距離無線通信は、例えば、ブルートゥース通信、赤外線通信、ＲＦＩＤ（Radio Frequency Identification）システムを用いた無線通信、ＮＦＣ(Near Field Communication)規格に従った無線通信等を含む。端末２００は近距離無線通信機能によりビーコン発信機５０から発信されるビーコンを受信できる。
（ｄ２）無線ＬＡＮ（Local Area Network）（以下、Ｗｉ－Ｆｉと呼ぶ）通信機能
　サーバ装置１００はＷｉ－Ｆｉ通信機能を用いてルータ等のアクセスポイント経由でインターネット等のネットワーク４０に接続する。
　端末２００はＷｉ－Ｆｉ通信機能を用いてアクセスポイントからビーコンを受信できる。また、端末２００はＷｉ－Ｆｉ通信機能を用いてアクセスポイント経由でインターネット等のネットワーク４０に接続する。
（ｄ３）移動体データ通信機能（例えば、３Ｇ（3rd Generation）、４Ｇ(4th Generation)、ＬＴＥ（Long Term Evolution）等）
　端末２００は移動体データ通信機能を用いて基地局７０を経由して携帯電話回線網（不図示）に接続してサーバ装置１００と通信してもよい。
　サーバ装置１００と端末２００は、ネットワーク４０または他のネットワークを介して通信できる。
（ｄ４）ＧＰＳ受信機能
　端末２００はＧＰＳ受信機能を用いてＧＰＳ衛星６０から位置情報を受信する。

　図４のサーバ装置１００または図６の端末２００の各構成要素は、図７のコンピュータ８０のハードウェアとソフトウェアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。以下説明する各実施形態のサーバ装置１００または端末２００を示す機能ブロック図は、ハードウェア単位の構成ではなく、論理的な機能単位のブロックを示している。
　なお、各図において、本発明の本質に関わらない部分の構成については省略してあり、図示されていない。

　図７のコンピュータ８０のＣＰＵ８２が、ストレージ８５に記憶されるプログラム９０をメモリ８４に読み出して実行することにより、サーバ装置１００の図４の各ユニット、または端末２００の図６の各ユニットの各機能を実現することができる。

　本実施形態のコンピュータプログラムは、コンピュータで読み取り可能な記録媒体に記録されてもよい。記録媒体は特に限定されず、様々な形態のものが考えられる。また、プログラムは、記録媒体からコンピュータのメモリにロードされてもよいし、ネットワークを通じてコンピュータにダウンロードされ、メモリにロードされてもよい。

　コンピュータプログラム９０を記録する記録媒体は、非一時的な有形のコンピュータ８０が使用可能な媒体を含み、その媒体に、コンピュータ８０が読み取り可能なプログラムコードが埋め込まれる。コンピュータプログラム９０が、コンピュータ８０上で実行されたとき、コンピュータ８０に、サーバ装置１００または端末２００を実現する以下の情報処理方法を実行させる。

　端末２００が、例えば、ガイド端末等でその場で利用者Ｕ１に貸与されるデバイスの場合、予め端末２００に図６の各ユニットの各機能を実現するプログラムがインストールされていてもよい。端末２００がスマートフォン等の利用者の所有物の場合、図６の各ユニットの各機能を実現するアプリケーションプログラムをインストールして実行することで、本発明の端末２００を実現してもよい。

　本実施形態のコンピュータプログラムは、サーバ装置１００を実現させるためのコンピュータに、端末２００の位置情報、又は個人の位置情報を取得する手順、取得した位置情報を用いてジングルを選択する手順、取得した位置情報を用いて再生音声情報を決定する手順、ジングルおよび再生音声情報の順に再生させるように音声情報を生成し、生成した音声情報（音声データ３００）を端末２００に再生させる手順、を実行させるように記述されている。

　このように構成されたサーバ装置１００の動作について以下説明する。
　図８は、サーバ装置１００の動作の一例を示すフローチャートである。
　まず、サーバ装置１００において、位置情報取得部１０２が、端末２００の位置情報を取得する（ステップＳ１０１）。そして、選択部１０４が、取得した位置情報を用いてジングルを選択する（ステップＳ１０３）。そして、決定部１０６が、取得した位置情報を用いて再生音声情報を決定する（ステップＳ１０５）。そして、音声再生制御部１０８が、ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し（ステップＳ１０７）、生成した音声情報を端末２００に再生させる（ステップＳ１０９）。

　次に、端末２００の動作について説明する。
　図９は、端末２００の動作の一例を示すフローチャートである。
　まず、端末２００において、位置情報取得部２０２が位置情報を取得して（ステップＳ２０１）、取得した位置情報を位置情報送信部２０４がサーバ装置１００に送信する（ステップＳ２０３）。そして、再生音声情報受信部２０６は、サーバ装置１００から受信した再生音声情報を再生してスピーカから出力する（ステップＳ２０５）。

　以下、各図を用いてサーバ装置１００と端末２００の一連の動作を説明する。
　はじめに、利用者Ｕ１は端末２００を携行して行動を開始する。このとき、端末２００の本音声メッセージシステム１のアプリケーションを起動する。そして、利用者Ｕ１が移動して図１のビーコン発信機５０の通信圏５２内に進入すると、ビーコン発信機５０から発信されているビーコンを位置情報取得部２０２が受信する。そして、位置情報取得部１０２は受信したビーコンに含まれる位置情報を取得して（図９のステップＳ２０１）、位置情報送信部２０４はその位置情報を端末２００に送信する（図９のステップＳ２０３）。

　そして、サーバ装置１００の位置情報取得部１０２は端末２００から位置情報を受信する（図８のステップＳ１０１）。選択部１０４は、図２（ｄ）の位置情報記憶部１１４を参照し、位置情報から施設、施設のカテゴリ、および体験内容を位置の属性として特定し、さらに、図５のジングル記憶部１１０を参照して、施設の属性に対応するジングル３０２を選択する（図８のステップＳ１０３）。

　さらに、決定部１０６は、位置情報または特定した位置の属性に対応するメッセージ３１２および対象名３１４を決定する（図８のステップＳ１０５）。そして、音声再生制御部１０８は、ジングル３０２、メッセージ３１２、対象名３１４の順に音声データ３００を生成し（図８のステップＳ１０７）、生成した音声データ３００を端末２００に送信する（図８のステップＳ１０９）。

　端末２００では、サーバ装置１００から送信された音声データ３００を再生音声情報受信部２０６が受信する（図９のステップＳ２０３）。そして、音声再生出力部２０８は、受信した音声データ３００を再生し、スピーカから出力する（図９のステップＳ２０５）。

　以上説明したように、本実施形態において、サーバ装置１００は、個人の位置情報を取得し、取得した位置情報に基づいてジングル３０２を選択し、位置情報に対応する再生音声情報３１０を決定し、ジングル３０２、再生音声情報３１０の順に音声データ３００を生成して端末２００に再生出力させる。位置情報に基づいて、端末２００に音声データ３００を出力させる際に、はじめにジングル３０２を出力することで、まず利用者に気付きと体験を想起させることができる。適切なジングル３０２を選択することで利用者に不快感を与えたりストレスを感じさせたりすることを防ぐことができる。そして、ジングル３０２に続いて再生音声情報３１０を出力することで、利用者に意欲喚起又は行為誘発を促すことができる。

　また、上記したように、再生音声情報３１０は、メッセージ３１２と対象名３１４とがこの順に再生される構成となっていて、メッセージ３１２には、その場所で体験できる内容を想起させる情報を含み、かつ、他との比較を可能にする内容が含まれないため、メッセージ３１２の受信者が、受け入れやすく、直ぐに行動を起こす判断ができる。

　対象名３１４、メッセージ３１２の順に再生音声情報３１０が出力される場合、メッセージ３１２を聴いて興味を持ったとしても、対象名３１４を聞きそびれてしまっているとそこに行く行動が起こせなくなってしまう。しかし、本実施形態のように、メッセージ３１２、対象名３１４の順な、対象名３１４が最後に出力されると、利用者は、メッセージ３１２の内容に興味を持った後で、注意して対象名３１４を聴くことができ、行動を起こすことが可能となる。

（第２の実施の形態）
　図１０は、本実施形態のサーバ装置１００の構成を論理的に示す機能ブロック図である。
　サーバ装置１００は、さらに、行動履歴にと組まれる再生を用いてジングルを選択し、または再生音声情報の内容を選択する点以外は、図４の上記実施形態と同じである。

　サーバ装置１００は、行動履歴記憶部１２０に接続される。行動履歴記憶部１２０は、サーバ装置１００の内部の記憶装置でもよいし、外部の記憶装置でもよし、それらの組み合わせでもよい。

　行動を起こした属性を含む行動履歴を行動履歴記憶部１２０に記憶しておき、この行動履歴に含まれる属性を用いて、再生音声情報の内容を選択する。

　図１１（ａ）に示すように、行動履歴記憶部１２０には、利用者の識別情報（利用者ＩＤ：Identifier）に、位置情報あるいは、施設または区域の情報と、音声データ３００を出力した後に行動を起こしたか否かを示す情報が対応付けて記憶されている。

　利用者の識別情報は、端末２００を特定できる情報（例えば、ＩＰアドレス、メールアドレス、電話番号、端末識別番号等）、または、音声メッセージシステム１の利用登録時に発行されるユーザＩＤなどの識別情報である。また、行動を起こしたか否かを示す情報とは、フラグであり、例えば、行動を起こした場合、フラグは１にセットされ、行動をおこさなかった場合、フラグは０にセットされる。

　なお、他の構成では、行動履歴記憶部１２０は、利用者が行動を起こした施設または区域の情報あるいは、位置情報を利用者ＩＤに対応付けて記憶してもよい。逆に利用者が行動を起こさなかった施設または区域の情報あるいは、位置情報を利用者ＩＤに対応付けて記憶してもよい。

　また、図１１（ｂ）に示すように、再生音声情報記憶部１１２には、位置情報あるいは、施設または区域の情報に、行動有りの場合のメッセージ３１２と、行動無しの場合のメッセージ３１２とが対応付けて記憶される。

　決定部１０６は、位置情報を取得したとき、図１１（ａ）の行動履歴記憶部１２０を参照し、位置情報に対応する行動の有無を示す情報を取得する。さらに、決定部１０６は、図１１（ｂ）の再生音声情報記憶部１１２を参照し、その位置情報における行動の有無に対応するメッセージ３１２を取得する。

　また、行動履歴記憶部１２０は、その利用者に音声データ３００が出力された日時をさらに含んでもよい。例えば、前回当該位置情報に利用者が来たことがあるか否かを行動履歴記憶部１２０から判断し、来たことがあるかないかに応じてメッセージ３１２を変えてもよい。あるいは、所定期間内に訪れているか否かを行動履歴記憶部１２０から判断し、所定期間内に訪れているか否かに応じてメッセージ３１２を変えてもよい。メッセージ３１２の変更方法は、複数のメッセージ３１２の中から選択する方法と、メッセージ３１２を出力するかしないかの切り替える方法でもよい。

　選択部１０４または決定部１０６は、行動履歴の情報を用いてジングル３０２またはメッセージ３１２を選択するが、そのタイミングは様々考えられる。例えば、直前の履歴情報を用いる場合と、以前の履歴情報を用いる場合と、ある特定の期間の履歴情報を用いる場合が考えられる。

　また、以前に同じ施設を訪れている場合、再度、その施設の訪問を促すメッセージ３１２とするパターン、その施設で可能な他の体験を勧めるメッセージ３１２とするパターン、その施設と同じジャンルの別の施設の訪問を促すパターン、およびその施設とは異なるジャンル（カテゴリ）の別の施設の訪問を促すパターン等が考えられる。

　いずれのパターンにするかは、利用者毎または施設毎等で予め定めておくこともできるし、切替条件を予め設定しておいてもよい。あるいは、ＡＩ技術を用いて機械学習させて利用者に適したパターンを決定してもよい。

　また、行動の有無については、音声メッセージの出力後所定時間以内（例えば、５分以内等）について検知してよい。つまり、音声メッセージによって行動を起こしたと考えられる場合のみ記録する。あるいは、行動を起こした場合に、音声メッセージの出力時刻から行動を起こした時刻までの時間間隔を記録してもよい。

　本実施形態によれば、上記実施形態と同様な効果を奏するとともに、さらに、行動を起こした属性を含む行動履歴の情報を用いてジングルまたは音声メッセージを選択することができるので、利用者の行動の有無に応じて適切な音声メッセージを配信でき、効果的に利用者の意欲を喚起して行動を誘発することができる。

　第二の実施形態の変形態様について以下に説明する。
＜他の行動履歴を用いる形態＞
　上記実施形態では、行動履歴として、位置情報と、行動の有無の情報を用いていた。本変形態様では、利用者の移動速度、移動方向、顔の向き等の情報を行動履歴として用いる。
　図１２に示すように、行動履歴記憶部１２０には、利用者毎に、時刻情報（日時）、位置情報とともに、移動速度、移動方向、および顔の向き等のうち少なくともいずれか１つの情報とが記憶されている。

　位置情報あるいは、施設または区域の情報は、上記したいずれかの方法で位置情報取得部１０２が取得した情報であり、位置情報を取得した日時情報に関連付けて記憶される。

　移動速度や移動方向は、端末２００に含まれる加速度センサやモーションセンサで計測される値をサーバ装置１００が受信してもよいし、位置情報と時刻情報の履歴情報からサーバ装置１００が算出した値でもよい。顔の向きの情報は、端末２００に含まれるモーションセンサで計測される値をサーバ装置１００が受信してよい。

　選択部１０４または決定部１０６は、これらの情報を用いてジングル３０２またはメッセージ３１２を選択する。選択のタイミングは上記したように、直前の履歴情報を用いる場合と、所定時間前から現在までの間の履歴情報を用いる場合と、以前の履歴情報を用いる場合と、ある特定の期間の履歴情報を用いる場合とが考えられる。

　例えば、直前の履歴情報の顔の向きの情報を用いて、利用者が顔を向けている方向が、誘導しようとしている施設と反対の方向に向いていれると判定された場合、選択部１０４は注意喚起レベルの高いジングル３０２を選択する。そして、決定部１０６は、再生音声情報３１０を「いま向かっている方向とは反対の方向に行くと、ＡＡＡが体験できるＢＢＢがあります。」と決定する。

　あるいは、現在利用者が顔を向けている方向にある施設を選択して、対応するジングル３０２およびメッセージ３１２を選択および決定してもよい。

　また、所定時間前から現在までの間の履歴情報の移動速度の情報を用いて、利用者が徒歩で移動中か、乗り物に乗って移動中かを判定してもよい。そして、判定結果に基づいて、再生音声情報３１０を決定してもよい。例えば、徒歩で移動中の利用者には、「食べ歩きのできるお団子がこの角を右に曲がった左手にあります。店の名前はＡＢＣ店です。」等の再生音声情報３１０とすることができる。乗り物で移動中の利用者には、「お土産にピッタリな煎餅が次のバス停の目の前にあります。店の名前はＸＹＺ店です。」等の再生音声情報３１０とすることができる。

　また、徒歩での移動が一定時間以上継続しているか否かを判定し、判定結果に基づいて、例えば、休憩できる施設の利用を促したり、乗り物利用を促したり、最寄り駅やバス停の行き方や出発時刻の案内等の情報を含む再生音声情報３１０を決定してもよい。

＜購買履歴を用いる形態＞
　利用者の行動履歴記憶部１２０に、当該利用者の購買履歴情報、および属性情報の少なくともいずれか一方を組み合わせて、機械学習することで、利用者のその場所での趣味嗜好、行動パターンを分析し、場所（所定の区域内）毎に、利用者に推奨される施設、施設のカテゴリ、体験内容等の情報を登録する。

　選択部１０４および決定部１０６は、位置情報から場所を特定し、利用者に推奨される施設等の情報を取得し、対応するジングル３０２および再生音声情報３１０を設定および決定する。

　以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
　上記第１の実施形態では、再生音声情報記憶部１１２は、位置情報にメッセージ３１２を対応付けて記憶されていて、決定部１０６は位置情報に基づいて、メッセージ３１２を決定していた。さらに、上記第２の実施形態では、さらに行動履歴に基づいて、メッセージ３１２を決定していた。他の実施形態では、位置情報に加え、別の条件に基づいて、メッセージ３１２を決定してもよい。

　例えば、利用者個人の属性を条件としてもよい。利用者の属性とは、性別、年齢層を含む。また、予めユーザ登録時に、趣味、嗜好、興味などの情報も利用者に登録させ、利用者の属性として記憶しておいてもよい。また、専用端末２００を貸し出す場合などに、団体、グループ、個人等の利用単位の情報、あるいは、グループの場合は家族、友達、恋人等の種別の情報を利用者に登録させ、利用者の属性として記憶してもよい。

　また、利用者の属性として、ウェアラブル端末で計測された心拍数、消費エネルギ、体温等の情報を含んでもよい。あるいは、所定の位置に設けられた赤外線センサを用いて、利用者の表面温度を計測し、人の緊張状態等を判定し、利用者の属性としてもよい。
　また、季節、月、日付、曜日、特定の期間（特定の店舗のセール開催期間等）、または気象（気温、気圧等）などの情報を条件としてもよい。

　上記実施形態では、端末２００が受信するビーコンには、施設情報は含まれていなかった。他の実施形態では、ビーコン発信機５０は、ビーコンを受信した端末２００からの応答に呼応して、ビーコン発信機５０の周辺の施設の情報を端末２００に送信してもよい。端末２００の位置情報送信部２０４は、受信した施設の情報をサーバ装置１００に送信してもよい。

　あるいは、端末２００が位置情報記憶部１１４を備えてもよい。端末２００の位置情報取得部２０２が位置情報を取得した後、位置情報送信部２０４が、位置情報記憶部１１４を参照し、取得した位置情報に対応する施設または区域の情報を取得し、サーバ装置１００に送信してもよい。

　また、本発明は、音声出力を主なユーザインターフェースとしているが、表示手段および操作手段を用いた他のユーザインターフェースと組み合わせることもできる。音声データ３００が出力された後、その音声メッセージの内容そのもの、またはその内容に関する情報を端末２００のディスプレイに表示させてもよい。表示内容は、例えば、施設のウェブサイトのＵＲＬ（Uniform Resource Locator）アドレス、連絡先、所在地の地図、経路情報等を含む。また、出力済みの音声データ３００をリスト表示し、選択することで再度再生できる構成としてもよい。この場合は、ジングル３０２は再生出力しない構成とすることもできる。

（実施例１）
　実施例１では、利用者のスマートフォンに音声メッセージシステム１のサービスを提供するアプリケーションをインストールして利用する。
　図１３は、実施例１の論理的な構成を示す機能ブロック図である。
　サーバ装置１００は、履歴管理部４０２と、名称特定部４０４と、ジングル選択部４０６と、メッセージ生成部４０８と、メッセージ構築部４１０と、を備える。

　履歴管理部４０２は、個人の位置情報または端末２００の位置情報を例えば、ＧＰＳ衛星６０から端末２００が受信した情報を取得し、行動履歴記憶部１２０に蓄積する。

　名称特定部４０４は、取得した位置情報から、位置情報記憶部１１４を参照して、施設の施設名と、その施設のカテゴリを特定する。特定した施設名３０４をジングル選択部４０６とメッセージ構築部４１０に受け渡すとともに、特定した施設の情報をメッセージ生成部４０８に受け渡す。

　ジングル選択部４０６は、名称特定部４０４から受け取った施設のカテゴリと、履歴管理部４０２から受け取った行動履歴の情報を用いてジングルを選択する。そして、ジングル選択部４０６は、選択されたジングル３０２をメッセージ構築部４１０に受け渡す。

　メッセージ生成部４０８は、インターネット等を検索して、各施設で得た体験に関する情報を収集して蓄積し、再生音声情報３１０を再生音声情報記憶部１１２に記憶する。さらに、メッセージ生成部４０８は、名称特定部４０４で特定された施設の情報、または履歴管理部４０２から受け取った行動履歴の情報に応じて再生音声情報記憶部１１２から選別された施設の体験内容を含むメッセージ３１２を生成し、メッセージ構築部４１０に受け渡す。

　メッセージ構築部４１０は、ジングル選択部４０６、メッセージ生成部４０８、および名称特定部４０４から受け取った、ジングル３０２、メッセージ３１２、および対象名３１４をこの順に再生させる音声データ３００を生成して出力する。この音声データ３００は、端末２００に送信され、再生出力される。

（実施例２）
　実施例２では、工事現場で音声メッセージシステム１を利用する。
　端末２００は、各作業員が携行する。ビーコン発信機５０は危険箇所等に設置する。
　危険箇所に作業員が接近すると、端末２００の位置情報取得部２０２が、ビーコン発信機５０から発信されるビーコン信号を受信し、位置情報送信部２０４がサーバ装置１００にビーコン信号に含まれる位置情報を送信する。

　ジングル記憶部１１０には、危険箇所の警戒レベルに応じて複数のジングルが記憶されている。さらに、ジングル記憶部１１０には、工事現場内の各危険箇所の位置情報と、当該危険箇所の警戒レベルとが対応付けて記憶されている。選択部１０４は、受信した位置情報から危険箇所の警戒レベルを特定し、特定された警戒レベルに対応するジングルを選択する。警戒レベルが高い程、緊急性が伝わるジングルにすることができる。

　さらに、行動履歴記憶部１２０には、危険箇所の属性に応じて複数のメッセージの音声情報が記憶されている。さらに、行動履歴記憶部１２０には、位置情報と危険箇所の属性が対応付けて記憶されている。危険箇所の属性とは、例えば、頭上注意、足もと注意、重量制限、火気厳禁等を含む。あるいは、作業内容の属性を含んでもよく、高所作業注意、一人作業禁止、要換気等を含む。そして、決定部１０６は、位置情報から危険箇所の属性を特定し、特定した属性に対応するメッセージを選択する。あるいは、選択部１０４は、危険箇所の上記属性に応じてジングルを選択してもよい。例えば、注意すべき場所が頭上なのか足もとなのかを異なるジングルで知らせてもよい。

（実施例３）
　実施例３では、外国人観光客の観光ガイドとして音声メッセージシステム１を利用する。
　例えば、空港や観光地等で外国人観光客に端末２００を貸し出す。あるいは、利用者の所持しているスマートフォンにアプリケーションをダウンロードさせるＱＲコード（登録商標）を配布し、ユーザ登録してももらい、サービスを提供してもよい。

　メッセージ３１２の言語（日本語、英語、中国語、韓国語、フランス語等）の選択を設定メニューで受け付け、選択された言語で出力してもよい。

　（実施例４）
　実施例４では、店舗等の情報を音声メッセージで出力することで、従来の広告や宣伝とは異なる手法で利用者の店舗利用を促す。
　昨今、各広告主は、パーソナルコンピュータ、スマートフォン、及びタブレットなどの個人向けの端末に、よりパーソナライズ化した効果的な情報を配信しようと躍起になっている。

　一方で、情報を受けた個人は端末を取り出す煩わしさから、その情報が自分の欲している情報であったとしても端末をわざわざ取り出すことはせず取りこぼし、広告主にとっては思うように個人に情報をリーチできていないという課題があった。

　そこで、端末取り出しを克服する手段として、音をユーザインターフェース（ＵＩ：User Interface）とした本発明の音声メッセージを利用する。

　なお、一般的な音声メッセージは、対象の説明をする情報が主体であり、意欲喚起又は行為誘発までには至っていない課題があった。また、個人の動作や会話に割り込んで再生される音声メッセージは不快感を生み、ストレスとなる課題があった。
　本発明の音声メッセージシステム１を採用することで、これらの課題を解決することができる。

　まず、広告を配信したい店舗や施設の位置情報を位置情報記憶部１１４に登録する。例えば、アウトレットモール等のような一定の区域内に複数の店舗が存在しているような場所で音声メッセージシステム１を利用する。各店舗や設備（授乳設備、おむつ替え用ベッド、ベンチ、喫煙所、トイレ、エレベータ、非常口等）の位置情報を登録することができる。

　ジングル記憶部１１０には、利用者にストレスを与えずに、気付きと体験を想起させるジングル３０２を店舗や設備毎、あるいは、それらのカテゴリ毎に格納する。そして、再生音声情報記憶部１１２には、その店舗や設備で体験または実行できる内容を含むメッセージ３１２を格納する。

　各店舗は、利用者を呼び込むためのメッセージ３１２をそれぞれ登録する。例えば、「甘くて冷たい北海道の夕張メロンのソフトクリームが食べられます。」、「１５時から３０分間のタイムセールを実施します。この秋流行のラインナップを豊富に取りそろえました。どうぞお見逃しなく。」等のメッセージを店舗毎に登録する。

　後者のメッセージのように、配信時間を特定できてもよい。指定した時間にのみ選択されるように配信対象時間（例えば、１４時～１５時）とともに登録すればよい。

　例えば、利用者は、アプリケーションをダウンロードして起動し、本音声メッセージシステム１の利用を開始することができる。アプリケーションは、あるアウトレットモール専用のものでもよいし、複数の商業施設で共通して利用できるものであってもよく、様々な形態が考えられる。

　また、利用者が得たいと考える設備情報を予め指定できる設定画面を設けてもよい。あるいは、利用者の属性として、喫煙者か、乳児を連れているか、老人か等の情報を予め登録できてもよい。喫煙者には喫煙所の位置情報を用いたメッセージを、乳児を連れている利用者には授乳室の位置情報を用いたメッセージを、老人にはエレベータ、エスカレータ、またはベンチ等の位置情報を用いたメッセージを配信してもよい。

　また、上記の喫煙、授乳、休憩等に関連する位置情報に対応するメッセージは、その場所に近づいた場合に都度配信されると情報過多になる可能性もある。そこで、これらのメッセージを配信した時刻を記録しておき、前回メッセージを配信した時刻から一定期間は同じ位置情報に対応するメッセージの配信を行わないようにするのがよい。

　また、行動履歴の情報を用いて利用者の行動周期を推定し、利用者にあった周期でメッセージ配信する構成としてもよい。

　以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
　なお、本発明において利用者に関する情報を取得、利用する場合は、これを適法に行うものとする。

　以下、参考形態の例を付記する。
１．　端末の位置情報、又は個人の位置情報を取得する位置情報取得手段と、
　取得した前記位置情報を用いてジングルを選択する選択手段と、
　取得した前記位置情報を用いて再生音声情報を決定する決定手段と、
　前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる音声再生制御手段と、を備えるサーバ装置。
２．　１．に記載のサーバ装置において、
　前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、サーバ装置。
３．　１．または２．に記載のサーバ装置において、
　前記選択手段は、前記位置情報取得手段が取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する、サーバ装置。
４．　３．に記載のサーバ装置において、
　前記選択手段は、前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする、サーバ装置。
５．　３．又は４．に記載のサーバ装置において、
　前記選択手段は、前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする、サーバ装置。
６．　１．から５．のいずれか一つに記載のサーバ装置において、
　さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、前記決定手段は、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する、サーバ装置。

７．　端末で再生されるように生成される音声メッセージのデータ構造であって、
　前記音声メッセージは、
　　前記端末の位置情報、又は個人の位置情報を用いて選択されたジングルと、
　　前記位置情報を用いて決定された再生音声情報と、を含み、かつ、この順に再生され、
　前記再生音声情報は、さらに、
　　前記位置情報に関連して個人が体験できる内容に関する情報と、
　　その位置情報が示す施設を特定する情報と、を含み、かつ、この順に再生される、音声メッセージのデータ構造。
８．　７．に記載のデータ構造において、
　前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、データ構造。

９．　サーバ装置が、
　端末の位置情報、又は個人の位置情報を取得し、
　取得した前記位置情報を用いてジングルを選択し、
　取得した前記位置情報を用いて再生音声情報を決定し、
　前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる情報処理方法。
１０．　９．に記載の情報処理方法において、
　前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、情報処理方法。
１１．　９．または１０．に記載の情報処理方法において、
　前記サーバ装置が、
　取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する、情報処理方法。
１２．　１１．に記載の情報処理方法において、
　前記サーバ装置が、
　前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする、情報処理方法。
１３．　１１．又は１２．に記載の情報処理方法において、
　前記サーバ装置が、
　前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする、情報処理方法。
１４．　９．から１３．のいずれか一つに記載の情報処理方法において、
　さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、
　前記サーバ装置が、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する、情報処理方法。

１５．　コンピュータに、
　端末の位置情報、又は個人の位置情報を取得する手順、
　取得した前記位置情報を用いてジングルを選択する手順、
　取得した前記位置情報を用いて再生音声情報を決定する手順、
　前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる手順、を実行させるためのプログラム。
１６．　１５．に記載のプログラムにおいて、
　前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、プログラム。
１７．　１５．または１６．に記載のプログラムにおいて、
　コンピュータに、
　取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する手順を実行させるためのプログラム。
１８．　１７．に記載のプログラムにおいて、
　コンピュータに、
　前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする手順を実行させるためのプログラム。
１９．　１７．又は１８．に記載のプログラムにおいて、
　コンピュータに、
　前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする手順を実行させるためのプログラム。
２０．　１５．から１９．のいずれか一つに記載のプログラムにおいて、
　コンピュータに、
　さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する手順を実行させるためのプログラム。

２１．　サーバ装置と、
　端末と、を備え、
　前記サーバ装置は、
　　前記端末の位置情報、又は個人の位置情報を取得する位置情報取得手段と、
　　取得した前記位置情報を用いてジングルを選択する選択手段と、
　　取得した前記位置情報を用いて再生音声情報を決定する決定手段と、
　　前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に送信する送信手段と、を備え、
　前記端末は、
　　前記サーバ装置に位置情報を送信する手段と、
　　前記サーバ装置から前記音声情報を受信する手段と、
　　前記音声情報を受信すると、当該音声情報を出力する出力手段と、を備える、音声メッセージシステム。
２２．　２１．に記載の音声メッセージシステムにおいて、
　前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、音声メッセージシステム。
２３．　２１．または２２．に記載の音声メッセージシステムにおいて、
　前記選択手段は、前記位置情報取得手段が取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する、音声メッセージシステム。
２４．　２３．に記載の音声メッセージシステムにおいて、
　前記選択手段は、前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする、音声メッセージシステム。
２５．　２３．又は２４．に記載の音声メッセージシステムにおいて、
　前記選択手段は、前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする、音声メッセージシステム。
２６．　２１．から２５．のいずれか一つに記載の音声メッセージシステムにおいて、
　さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、前記決定手段は、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する、音声メッセージシステム。

　この出願は、２０１８年９月２８日に出願された日本出願特願２０１８－１８５７１６号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims

　端末の位置情報、又は個人の位置情報を取得する位置情報取得手段と、
　取得した前記位置情報を用いてジングルを選択する選択手段と、
　取得した前記位置情報を用いて再生音声情報を決定する決定手段と、
　前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる音声再生制御手段と、を備えるサーバ装置。
　請求項１に記載のサーバ装置において、
　前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、サーバ装置。
　請求項１または２に記載のサーバ装置において、
　前記選択手段は、前記位置情報取得手段が取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する、サーバ装置。
　請求項３に記載のサーバ装置において、
　前記選択手段は、前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする、サーバ装置。
　請求項３又は４に記載のサーバ装置において、
　前記選択手段は、前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする、サーバ装置。
　請求項１から５のいずれか一項に記載のサーバ装置において、
　さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、前記決定手段は、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する、サーバ装置。
　端末で再生されるように生成される音声メッセージのデータ構造であって、
　前記音声メッセージは、
　　前記端末の位置情報、又は個人の位置情報を用いて選択されたジングルと、
　　前記位置情報を用いて決定された再生音声情報と、を含み、かつ、この順に再生され、
　前記再生音声情報は、さらに、
　　前記位置情報に関連して個人が体験できる内容に関する情報と、
　　その位置情報が示す施設を特定する情報と、を含み、かつ、この順に再生される、音声メッセージのデータ構造。
　請求項７に記載のデータ構造において、
　前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、データ構造。
　サーバ装置が、
　端末の位置情報、又は個人の位置情報を取得し、
　取得した前記位置情報を用いてジングルを選択し、
　取得した前記位置情報を用いて再生音声情報を決定し、
　前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる情報処理方法。
　請求項９に記載の情報処理方法において、
　前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、情報処理方法。
　請求項９または１０に記載の情報処理方法において、
　前記サーバ装置が、
　取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する、情報処理方法。
　請求項１１に記載の情報処理方法において、
　前記サーバ装置が、
　前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする、情報処理方法。
　請求項１１又は１２に記載の情報処理方法において、
　前記サーバ装置が、
　前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする、情報処理方法。
　請求項９から１３のいずれか一項に記載の情報処理方法において、
　さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、
　前記サーバ装置が、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する、情報処理方法。
　コンピュータに、
　端末の位置情報、又は個人の位置情報を取得する手順、
　取得した前記位置情報を用いてジングルを選択する手順、
　取得した前記位置情報を用いて再生音声情報を決定する手順、
　前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる手順、を実行させるためのプログラム。
　請求項１５に記載のプログラムにおいて、
　前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、プログラム。
　請求項１５または１６に記載のプログラムにおいて、
　コンピュータに、
　取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する手順を実行させるためのプログラム。
　請求項１７に記載のプログラムにおいて、
　コンピュータに、
　前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする手順を実行させるためのプログラム。
　請求項１７又は１８に記載のプログラムにおいて、
　コンピュータに、
　前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする手順を実行させるためのプログラム。
　請求項１５から１９のいずれか一項に記載のプログラムにおいて、
　コンピュータに、
　さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する手順を実行させるためのプログラム。
　サーバ装置と、
　端末と、を備え、
　前記サーバ装置は、
　　前記端末の位置情報、又は個人の位置情報を取得する位置情報取得手段と、
　　取得した前記位置情報を用いてジングルを選択する選択手段と、
　　取得した前記位置情報を用いて再生音声情報を決定する決定手段と、
　　前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に送信する送信手段と、を備え、
　前記端末は、
　　前記サーバ装置に位置情報を送信する手段と、
　　前記サーバ装置から前記音声情報を受信する手段と、
　　前記音声情報を受信すると、当該音声情報を出力する出力手段と、を備える、音声メッセージシステム。
　請求項２１に記載の音声メッセージシステムにおいて、
　前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、音声メッセージシステム。
　請求項２１または２２に記載の音声メッセージシステムにおいて、
　前記選択手段は、前記位置情報取得手段が取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する、音声メッセージシステム。
　請求項２３に記載の音声メッセージシステムにおいて、
　前記選択手段は、前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする、音声メッセージシステム。
　請求項２３又は２４に記載の音声メッセージシステムにおいて、
　前記選択手段は、前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする、音声メッセージシステム。
　請求項２１から２５のいずれか一項に記載の音声メッセージシステムにおいて、
　さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、前記決定手段は、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する、音声メッセージシステム。