JP2016061698A - 音声案内装置、音声案内方法及び音声案内プログラム - Google Patents

音声案内装置、音声案内方法及び音声案内プログラム Download PDF

Info

Publication number
JP2016061698A
JP2016061698A JP2014190478A JP2014190478A JP2016061698A JP 2016061698 A JP2016061698 A JP 2016061698A JP 2014190478 A JP2014190478 A JP 2014190478A JP 2014190478 A JP2014190478 A JP 2014190478A JP 2016061698 A JP2016061698 A JP 2016061698A
Authority
JP
Japan
Prior art keywords
voice
voice guide
user
input
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014190478A
Other languages
English (en)
Inventor
正造 東
Shozo Azuma
正造 東
大地 並河
Daichi Namikawa
大地 並河
啓之 新井
Hiroyuki Arai
啓之 新井
直己 伊藤
Naoki Ito
直己 伊藤
直義 金丸
Naoyoshi Kanamaru
直義 金丸
亮治 松中
Ryoji Matsunaka
亮治 松中
大 中川
Masaru Nakagawa
大 中川
義康 鈴木
Yoshiyasu Suzuki
義康 鈴木
哲治 大庭
Tetsuji Oba
哲治 大庭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014190478A priority Critical patent/JP2016061698A/ja
Publication of JP2016061698A publication Critical patent/JP2016061698A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】移動体に乗った利用者の移動に合わせた音声ガイド案内を提供することを目的とする。【解決手段】音声案内装置1は、ランドマークが撮影された動画及び動画が撮影された撮影位置Pfを含む地図を表示部19に表示する地図情報管理部と13、地図情報管理部13によって動画及び地図が表示されているときに、音声ガイドを入力する音声ガイド入力部14と、音声ガイドが入力されたときに表示されている動画の撮影位置Pfを入力位置Piとして、入力位置Piを音声ガイド入力部によって入力された音声ガイドと関連付けて記憶する音声ガイド管理部15と、を有することを特徴とする。【選択図】図1

Description

本発明は、音声案内装置、音声案内方法及び音声案内プログラムに関する。
近年、携帯電話やスマートフォンのような携帯機器の位置を表す位置情報を利用したサービスが普及している。例えば、携帯機器がその位置情報をGPS衛星から取得し、その携帯機器を携行している利用者の目的地までの経路を表示したり、目的地までの経路を案内するために音声を出力したりする技術が知られている。
また、位置情報を利用して、その携帯機器の位置の周辺にある建物や風景等のランドマークに関する情報を携帯機器に通知する技術がある。例えば、特許文献1には、利用者の端末が撮影した画像に、地図情報管理手段によって管理されている建物等を対応付けて、その対応関係を利用者に知らせる技術が記載されている。この技術により利用者の眼前にある建物等が何であるかを理解するために地図中の表示と見比べる手間を省くことができる。
また、非特許文献1には、音声ガイド製作者が観光スポットについての説明を含む音声データを登録しておき、携帯機器を携行している観光客がその観光スポットに近づくと、その観光スポットを説明するための音声データが再生される技術が記載されている。
これらの技術によって、携帯機器が観光客等の利用者の位置情報を取得し、その位置情報に基づいてランドマークに関する情報を通知する。そのため、利用者はそれらの情報を得ることによってランドマークにおける観光等をより一層楽しむことができる。
特開平11−32250号公報
"位置情報を利用した音声ガイドサービス技術"、日本電信電話株式会社、 [online][平成26年6月26日検索]、インターネット<URL:http://www.fujixerox.co.jp/company/technical/main_technology/delivering/audio_guide.html>
しかしながら、特許文献1及び非特許文献1に記載されている技術は、比較的遅い速度で移動している歩行者によって用いられることを想定している。そのため、歩行者より速い速度で移動している歩行者以外の利用者、例えば、自動車、バス、電車等の移動体に乗っている利用者がこれらの技術を利用した場合、音声ガイドの再生が終了する前に利用者はその音声ガイドに係るランドマークの周辺を通り過ぎてしまうことがある。また、ランドマークの近辺にいるもののランドマークが利用者の視野に入らない状況で音声ガイドによるランドマークの説明が提供されてしまうことがある。すなわち、移動体に乗った利用者が移動する速度に合わせた音声ガイド案内が提供されず、そのため、移動体に乗った利用者は適切な情報を得ることができない。
上記の課題を解決するため、本発明に係る音声案内装置は、ランドマークに関する情報
を音声で案内する音声ガイドを利用者端末へ送信するための音声案内装置であって、前記ランドマークが撮影された動画を表示部に表示する動画再生管理部と、前記動画が撮影された撮影位置を含む地図を前記表示部に表示する地図情報管理部と、前記動画再生管理部によって前記動画が表示され、前記地図情報管理部によって前記地図が表示されているときに、前記音声ガイドを入力する音声ガイド入力部と、前記音声ガイドが入力されたときに表示されている前記動画の前記撮影位置を入力位置として、前記入力位置を前記音声ガイド入力部によって入力された前記音声ガイドと関連付けて記憶する音声ガイド管理部と、を有することを特徴とする。
また、本発明に係る音声案内方法は、ランドマークに関する情報を音声で案内する音声ガイドを利用者端末へ送信するための音声案内方法であって、前記ランドマークが撮影された動画を表示部に表示する動画再生管理ステップと、前記動画が撮影された撮影位置を含む地図を前記表示部に表示する地図情報管理ステップと、前記動画再生管理ステップによって前記動画が表示され、前記地図情報管理ステップによって前記地図が表示されているときに、前記音声ガイドを入力する音声ガイド入力ステップと、前記音声ガイドが入力されたときに表示されている前記動画の前記撮影位置を入力位置として、前記入力位置を前記音声ガイド入力ステップによって入力された前記音声ガイドと関連付けて記憶する音声ガイド管理ステップと、を含むことを特徴とする。
また、本発明に係る音声案内プログラムは、ランドマークに関する情報を音声で案内する音声ガイドを利用者端末へ送信するための音声案内装置を構成するコンピュータに、前記ランドマークが撮影された動画を表示部に表示する動画再生管理ステップと、前記動画が撮影された撮影位置を含む地図を前記表示部に表示する地図情報管理ステップと、前記動画再生管理ステップによって前記動画が表示され、前記地図情報管理ステップによって前記地図が表示されているときに、前記音声ガイドを入力する音声ガイド入力ステップと、前記音声ガイドが入力されたときに表示されている前記動画の前記撮影位置を入力位置として、前記入力位置を前記音声ガイド入力ステップによって入力された前記音声ガイドと関連付けて記憶する音声ガイド管理ステップと、を実行させることを特徴とする。
本発明によれば、移動体に乗った利用者の移動に合わせた音声ガイド案内が提供され、そのため、移動体に乗った利用者は適切な情報を得ることが可能となる。
本発明の一実施形態に係る音声案内装置の機能構成図である。 本発明の一実施形態に係るカメラ属性情報テーブルを示す概念図である。 本発明の一実施形態に係る動画撮影位置管理テーブルを示す概念図である。 本発明の一実施形態に係るランドマークテーブルを示す概念図である。 本発明の一実施形態に係る音声ガイドテーブルを示す概念図である。 本発明の一実施形態に係る利用者興味情報テーブルを示す概念図である。 本発明の一実施形態に係る音声ガイド入力操作画面を示す概念図である。 本発明の一実施形態に係る音声ガイド入力操作画面を示す概念図である。 本発明の一実施形態に係る案内対象エリアを示す概念図である。 本発明の一実施形態に係る音声案内装置及び利用者端末の動作を表すフロー図である。 本発明の一実施形態に係る音声ガイド出力部の動作を表すフロー図である。 本発明の一実施形態に係る候補検索部の動作を表すフロー図である。
以下、本発明の一実施形態について説明する。
<音声案内装置の機能構成>
まず、図1を用いて本発明の一実施形態に係る音声案内装置1の機能構成について説明する。図1は、本発明の一実施形態に係る音声案内装置1の機能構成図である。
図1に示される音声案内装置1の各機能は、これらの機能を実現する処理内容を記述したプログラム(音声案内プログラム)をコンピュータの記憶部に格納しておき、当該コンピュータのCPUによってこのプログラムを読み出して実行することで実現することもできる。
音声案内装置1は建物、地形、風景等であるランドマークに関する情報を音声で案内する音声ガイドを利用者が携行する利用者端末2に提供するものである。図1に示されるように、音声案内装置1は、制御部10、カメラ属性取得部11、動画再生管理部12、地図情報管理部13、音声ガイド入力部14、音声ガイド管理部15、利用者位置取得部16、利用者興味取得部17、音声ガイド出力部18を有する。また、カメラ属性取得部11はカメラ属性情報管理データベース(以下「カメラ属性情報管理DB」という)111を有し、動画再生管理部12は動画撮影位置管理データベース(以下「動画撮影位置管理DB」という)121を有し、地図情報管理部13はランドマークデータベース(以下「ランドマークDB」という)131を有し、音声ガイド管理部15は音声ガイドデータベース(以下「音声ガイドDB」という)151を有し、利用者興味取得部17は利用者興味情報データベース(以下「利用者興味情報DB」という)171を有する。
図2は、カメラ属性情報管理DB111に記憶されているカメラ属性情報管理テーブル112を示す概念図である。カメラ属性情報管理テーブル112では、移動体に搭載されたカメラにより撮影された動画を一意に識別するための識別子である動画ID、その動画を撮影したカメラの属性を表すカメラ属性情報に含まれる焦点距離、カメラ角、画像サイズが関連付けられて記憶される。たとえば、図2に示されるカメラ属性情報管理テーブル112において、動画ID「1」で表される動画を撮影したカメラは、焦点距離「35mm」、カメラ角「水平54°、垂直38°」、画像サイズ「720画素×480画素」であることが示されている。
図3は、動画撮影位置管理DB121に記憶されている動画撮影位置管理テーブル122を示す概念図である。動画撮影位置管理テーブル122では、動画を一意に識別するための識別子である動画ID、動画を構成するフレームを一意に識別するための識別子であるフレームID、動画の再生時間、動画を撮影した位置を表す撮影位置:緯度と撮影位置:経度、撮影日、撮影時刻、動画を撮影しているカメラが移動する速度、及び、加速度が関連付けられて記憶される。以下、撮影位置:緯度及び撮影位置:経度によって表される位置を「撮影位置Pf」という。また、カメラの速度及び加速度を含む情報を「移動情報」という。たとえば、図2に示される動画撮影位置管理テーブル122において、動画ID「1」、フレームID「2」で表される動画は、再生時間「0.01667」、撮影位置:緯度「N35.228311」、撮影位置:経度「E139.664243」、撮影日「2014/3/1」、撮影時刻「14:00:00.01667」であり、このフレームを撮影しているときカメラは速度「40km/h」、及び加速度「0(m/s)」で移動していたことが示されている。
図4は、ランドマークDB131に記憶されているランドマークテーブル132を示す概念図である。ランドマークテーブル132では、ランドマークを一意に識別するための識別子であるランドマークID、ランドマークの名前、ランドマークの位置を表す緯度と経度、及び、ランドマークの種別が関連付けられて記憶される。たとえば、図4に示されるランドマークテーブル132において、ランドマークID「1」で表されるランドマー
クは名前が「○×神社」であり、緯度「N35.235384」、経度「E139.702663」の位置にあり、種別が「神社」であることが示されている。なお、ランドマーク情報の種別には、例えば、市役所・神社・病院等の建物、崖・滝・川等の地形、桜の木・植物等の風景、等が含まれる。
図5は、音声ガイドDB151に記憶されている音声ガイドテーブル152を示す概念図である。音声ガイドテーブル152では、音声ガイドを一意に識別するための識別子である音声ガイドID、音声入力を行ったときに再生された動画の撮影位置:緯度と撮影位置:経度、撮影日、撮影時刻、その動画を撮影したカメラの速度と加速度、音声ガイドに係る音声ファイルの保存場所、及び、その音声ガイドに関連するランドマークを表すランドマークIDが関連付けられて記憶される。例えば、図5に示される音声ガイドテーブル152において、音声ガイドID「1」で識別される音声ガイドに係る音声入力が行われたときに再生された動画の撮影位置:緯度は「N35.228301」、撮影位置:経度は「E139.664241」、撮影日は「2014/3/1」、撮影時刻「14:00:00.00000」であり、その動画を撮影しているカメラが移動する速度は「20km/h」、加速度は「2.94m/s」であり、音声ファイルの保存場所は「/guide/voice1.mp3」、関連するランドマークIDは「11」であることが示されている。
図6は、利用者興味情報DB171に記憶されている利用者興味情報テーブル172を示す概念図である。利用者興味情報テーブル172では、利用者を一意に識別するための識別子である利用者ID、利用者ニックネーム、及び利用者の興味対象が関連付けられて記憶される。例えば、利用者ID「1」で表される利用者の利用者ニックネームは「aaa」であり、興味対象の種別は「寺、神社、博物館」であることが示されている。
制御部10は、音声案内装置1が起動されると、音声案内装置1が有する各機能を制御する。
カメラ属性取得部11は、動画を撮影したカメラの属性情報を制御部10の制御によって取得する。具体的には、カメラ属性取得部11は、制御部10から処理開始コマンド及び動画IDを受け取ると、カメラ属性情報管理テーブル112において、動画IDに関連付けて記憶されている焦点距離、カメラ角、画像サイズを取得する。
動画再生管理部12は、制御部10の制御によって再生されている動画について、その動画を撮影したカメラの進行方向、速度及び加速度を算出して、動画撮影位置管理テーブル122に記憶する。具体的には、動画再生管理部12はその動画に係る動画IDに関連付けて動画撮影位置管理テーブル122に記憶されている撮影位置:緯度、撮影位置:経度及び撮影時刻をフレームIDごとに取得し、取得された撮影位置:緯度、撮影位置:経度、及び撮影時刻に基づいて速度、加速度、及び進行方向を算出する。また、動画再生管理部12は算出された速度、加速度、及び進行方向を動画ID及びフレームIDに関連付けて動画撮影位置管理テーブル122に記憶する。また、動画再生管理部12は後述する表示部19に、再生された動画及び再生された動画の撮影日、撮影時刻及び再生時間を表示する。
地図情報管理部13は、後述する表示部19に表示する地図及び地図に関連する情報を管理する。具体的には、地図情報管理部13は、選択された動画の撮影位置Pfを含む地図を表示部19に表示する。また、地図情報管理部13は、動画の撮影位置Pfに印sigAを重畳した地図を表示部19に表示する。また、地図情報管理部13は、動画を撮影したカメラの進行方向を表す印sigBを重畳した地図を表示部19に表示する。さらに、地図情報管理部13は、カメラ属性情報に基づいて、カメラが認識できる範囲である視
野を表す印sigCを重畳した地図を表示部19に表示する。
音声ガイド入力部14は、管理者によって発せられる音声を記録した音声ファイルを音声ガイドとして音声案内装置1に入力する。具体的には、音声ガイド入力部14は、図7に示される音声ガイド入力ボタン191fが押下されると、管理者によって発せられる音声に基づいて音声ガイドとしての音声ファイルを保存し、その保存場所を音声ガイドテーブル152に入力する。このとき音声ファイルの保存場所は、その音声ガイドに係る音声ガイドIDに関連付けられて音声ガイドテーブル152に入力される。また、音声ガイド入力部14は、音声ガイドが入力されたときに再生されていた動画の撮影位置Pfを、音声ガイドの入力位置Piとして音声ガイドIDに関連付けて入力する。また音声ガイド入力部14は動画の撮影位置Pfを検索キーとして動画撮影位置管理テーブル122を検索し、その撮影位置Pfに関連付けて記憶されている撮影日、撮影時刻、速度、及び加速度を表す情報を抽出し、音声ガイドIDに関連付けて入力する。
また、音声ガイド入力部14は、管理者が地図上で選択したランドマークを表すランドマークIDを音声ガイドに関連付けて音声ガイドテーブル152に入力する。図7に示される例では、音声ガイダンスの「このあたりは、春は桜並木でアーケードになります。」という説明おける「桜並木でアーケード」がランドマークAに相当する。このとき、管理者が表示されている地図上のランドマークAを選択すると、音声ガイド入力部14はランドマークAのランドマークIDをこの音声ガイドIDに関連付けて入力する。
また、音声ガイド入力部14は、音声ガイドに含まれるランドマークを表す音声を音声認識によって抽出し、そのランドマークを識別するランドマークIDを音声ガイドIDに関連付けて音声ガイドテーブル152に入力してもよい。この場合、図8に示される例では、音声ガイダンスの「この先に映画で使われた有名な建物『ランドマークB』があります。」において、「ランドマークB」を音声認識し、音声ガイド入力部14はランドマークBのランドマークIDをこの音声ガイドIDに関連付けて入力する。
音声ガイド管理部15は、音声ガイド入力部14によって入力された音声ファイルの保存場所、入力位置Pi、音声ガイド入力部14によって抽出された撮影日、撮影時刻、速度、加速度、及び、管理者によって選択されたランドマークに係るランドマークIDを関連付けて音声ガイドテーブル152に記憶する。
利用者位置取得部16は、利用者端末2の位置、すなわち利用者位置P0を表す利用者位置情報を利用者端末2から取得する。なお、利用者端末2は利用者位置情報をGPS衛星から取得する。また、利用者位置取得部16は、自動車、バス、電車等の移動体に搭載された利用者端末2の速度及び加速度、すなわち、利用者が移動する速度、加速度である利用者速度V0及び利用者加速度aを含む情報を利用者端末2から取得する。なお、利用者位置取得部16は利用者位置情報に基づいて利用者速度V0及び利用者加速度aを算出してもよい。以下、利用者速度V0及び利用者加速度aを含む情報を利用者移動情報という。また、利用者位置取得部16は、第1の時刻に取得した利用者位置情報と、第2の時刻に取得した利用者位置情報に基づいて利用者の進行方向を算出する。なお、進行方向は、例えばtan−1(南北方向の速度/東西方向の速度)によって表されればよい。
利用者興味取得部17は、利用者が入力した利用者興味情報を取得して利用者端末2から利用者興味情報テーブル172に記憶したり、利用者興味情報テーブル172に記憶されている利用者興味情報を抽出したりする。利用者興味情報とは、利用者ID、利用者ニックネーム、及び、利用者の興味のあるランドマークの種別を表す興味対象を含む情報である。なお、利用者興味取得部17は、利用者興味情報に含まれるこれらの情報を関連付けて利用者興味情報テーブル172に記憶する。
音声ガイド出力部18は、利用者位置取得部16によって取得された利用者位置情報、利用者移動情報、利用者位置取得部16によって算出された進行方向、及び、利用者興味取得部17によって取得された利用者興味情報に基づいて、音声ガイドとしての音声ファイルを利用者端末2に送信する。音声ガイド出力部18は、候補検索部181、興味判定部182、送信部183を有する。
まず、候補検索部181について図9を用いて説明する。図9は本発明の一実施形態に係る案内対象エリアを示す概念図である。
表示部19は動画再生管理部12及び地図情報管理部13の制御に基づいて、管理者が音声ガイドを入力するときに参照するための動画、動画に関連する情報、地図、及び地図に関連する情報を表示する。図7は、表示部19が表示する音声ガイド入力操作画面191の例である。図7に示される例において、音声ガイド入力操作画面191は、再生される動画を表示するための動画再生領域191a、再生される動画の撮影位置Pfを含む地図及び関連する情報を表示するための地図領域191b、再生される動画の撮影日、撮影時刻及び再生時間を表示するための動画情報領域191c、動画の撮影位置Pf、及び動画を撮影したカメラの速度を表示するための移動情報領域191d、及び、音声ガイダンスの内容を表示するための音声ガイダンス領域191eを含んでいる。音声ガイダンス領域191eには音声ガイド入力ボタン191fが設けられ、この音声ガイド入力ボタン191fが押下されると管理者によって発せられる音声が音声案内装置1に入力される。
なお、表示部19は音声案内装置1が有しているものであってもよいし、音声案内装置1の外部にあり、音声案内装置に接続されているものであってもよい。
候補検索部181は、音声ガイドによる案内の対象となる案内対象エリアを判定する。本実施形態において、案内対象までの距離Sに、視認可能な距離である所定の距離αを加えた距離S+αを案内対象距離S+αとし、移動体の位置から案内対象距離S+α内にあるエリアのうち移動体の進行方向にあるエリアを案内対象エリアとする。ここで、距離Sは、利用者の移動における現在の速度を利用者速度V0、現在の加速度を利用者加速度aとしたときにt秒後に到達する距離であり、S=V0×t+(1/2)atと算出される。また、所定の距離αとは時間t秒後に移動体が到達すると予想される位置から、視認できる範囲にある位置までの距離をいう。
候補検索部181は、利用者位置取得部16によって取得された利用者位置P0、利用者速度V0、基底速度Vb、及び、音声ガイドに係る入力位置Piに基づいて利用者端末2へ送信する音声ガイドの候補である音声ガイド候補を検索する。また、候補検索部181は、利用者位置P0、利用者速度V0、所定の基底速度Vb、及び、ランドマークIDに係るランドマーク最接近道路位置Plに基づいて音声ガイド候補を検索する。ここで、ランドマーク最接近道路位置Plとは、図9に示されるように、移動体が走行している道路に向かって、ランドマークから引いた直線が道路と直交する関係にあるときの、道路と直線との交点に相当する位置をいう。なお、道路が曲線である場合には道路の接線と直交する関係にあるときの、道路と直線との交点に相当する位置をいう。
興味判定部182は、候補検索部181によって検索された音声ガイド候補が利用者の興味に合うか否かを判定する。具体的には、興味判定部182は、利用者端末2から受信した利用者IDに関連付けて、利用者興味情報テーブル172の利用者興味情報テーブル172に記憶されている興味対象を抽出する。また、興味判定部182は、音声ガイド候補に関連付けて音声ガイドテーブル152に記憶されているランドマークIDのうち、その種別が興味対象として抽出された種別に一致するものがあると判定された場合、その音
声ガイド候補を利用者に提供する音声ガイドとして抽出する。
送信部183は、興味判定部182によって抽出された音声ガイドに係る音声ファイルを利用者端末2に送信する。
<音声案内装置の動作>
次に、図10及び図11を用いて、本実施形態に係る音声案内装置1の動作を説明する。図10は、音声案内装置1の動作を表すフロー図である。まず、図10を用いて音声案内装置1の動作を説明する。
まず、音声案内装置1が起動され、移動体に搭載されたカメラにより撮影された動画が選択されると、制御部10が処理開始コマンド及び選択された動画に係る動画IDをカメラ属性取得部11及び動画再生管理部12に送信する。そして、図10に示されるように、カメラ属性取得部11は、制御部10によって送信された動画IDに関連付けてカメラ属性情報管理テーブル112に記憶されているカメラ属性情報を取得する(ステップS11)。次に、動画再生管理部12は制御部10によって送信された動画IDが表す動画を再生し、図7に示されるように、表示部19における音声ガイド入力操作画面191の動画再生領域191aに表示する(ステップS12)。
また、動画再生管理部12は、制御部10によって送信された動画IDに係る動画の撮影位置Pfを含む地図を、図7に示されるように、表示部19における音声ガイド入力操作画面191の地図領域191bに表示する(ステップS13)。さらに、動画再生管理部12は、動画IDに関連付けて動画撮影位置管理テーブル122に記憶されている撮影位置Pf、撮影時刻をフレームIDごとに取得し、第1のフレームIDに係る撮影位置Pf及び撮影時刻と、第1のフレームIDとは異なる第2のフレームIDに係る撮影位置Pf及び撮影時刻とからカメラの速度と加速度、及び進行方向を算出する。そして、地図情報管理部13が動画を再生して動画再生領域191aに表示し、再生されている動画の撮影位置Pfを含む地図を地図領域191bに表示する。同時に、地図情報管理部13は、動画の撮影日、撮影時刻を動画情報領域191cに表示し、動画の再生において表示されるフレームに係るフレームIDに対応する撮影位置:緯度と撮影位置:経度、及び、速度を移動情報領域191dに表示する。
このとき、地図情報管理部13は撮影位置Pfを示す印sigAを地図領域191bの地図に表示する。同時に、地図情報管理部13は、動画再生管理部12によって算出された進行方向を示す印sigBを地図に付して表示する(ステップS14)。同時に、地図情報管理部13は、カメラ属性取得部11によって取得されたカメラ情報に含まれるカメラ角、焦点距離、画像サイズに基づいてカメラの視野を表す印sigCを地図に付して表示する(ステップS15)。
続いて、音声ガイド入力部14が、音声ガイドを入力する処理について説明する。まず、ステップS13乃至ステップS15で音声ガイド入力操作画面191に動画、地図及び移動情報等が表示されている状態において、図7に示される音声ガイド入力ボタン191fが押下されると、音声ガイド入力部14は管理者によって発せられた音声を入力し、音声ガイドとして音声ファイルに保存する。ここで入力される音声は動画に含まれているランドマーク等を説明するものである。さらに、音声ガイド入力部14は、音声が入力されているときに音声ガイド入力操作画面191に表示されている動画の撮影位置Pfを入力位置Piとして入力位置:緯度と入力位置:経度を音声ガイドテーブル152に記憶する(ステップS16)。
また、音声ガイド入力部14は、音声ガイド入力操作画面191に表示されている動画
を表す動画IDを検索キーとして動画撮影位置管理テーブル122を検索し、この動画IDに関連付けて記憶されている撮影日、撮影時刻、速度、及び加速度を表す情報を抽出する。そして、抽出されたこれらの情報を音声ガイドに関連付けて音声ガイドテーブル152に記憶する。
次に、音声ガイド入力部14は、管理者が地図上で選択したランドマークを表すランドマークIDを音声ガイドと関連付ける(ステップS17)。この場合、図7に示される例では、管理者が地図上でランドマークAを選択すると、音声ガイド入力部14は、図5に示されるランドマークテーブル132に、音声ガイドID「1」に関連付けられてランドマークAを表すランドマークID「11」を入力し、音声ガイドテーブル152に記憶する。
また、音声ガイド入力部14は、音声認識によって音声ガイドに関連付けてランドマークIDを入力してもよい。この場合、図8に示される例では、音声ガイダンスに「この先に映画で使われた有名な建物『ランドマークB』があります。」という表現が含まれており、地図上に示されるランドマークBが音声認識される。そして、音声ガイド入力部14は、音声認識されたランドマークBを表すランドマークID「12」を音声ガイドID「2」に関連付けて入力し、音声ガイドテーブル152に記憶する。
なお、音声ガイド入力部14が音声ガイドに関連付けてランドマークIDを記憶するにあたって、音声認識に基づいてランドマークの名称と一致する固有名詞又は普通名詞のリストを表示部19に表示してもよい。この場合、表示されたリストの中から、動画の撮影位置Pfに最も近いランドマークを表すランドマークIDが音声ガイドに関連付けられて記憶される。
このように、音声ガイド入力操作画面191に動画、地図及び移動情報が表示されている状態で、音声ガイド入力部14はランドマークを説明するための音声を入力し、音声ガイドとして音声ファイルを保存する。このため、管理者はランドマークが撮影されている動画を参照しながら、そのランドマークについて説明をすることができるため、利用者の視野にランドマークが入っているタイミングでランドマークを説明することができる。また、管理者は移動体による移動に合わせてランドマークを説明することができる。すなわち、移動体に乗って移動する利用者がランドマークを見る状況に合った音声ガイドを音声案内装置1に記憶することが可能となり、このため、利用者は適切な音声ガイドを得ることが可能となる。
続いて、図11を用いて音声案内装置1が、音声案内装置1からのサービスを享受する利用者にサービスを提供するために音声ガイドを検索する動作について説明する。図11は、音声案内装置1が利用者に提供するために音声ガイドを検索する動作を表すフロー図である。
図11に示されるように、まず、利用者位置取得部16は、利用者位置P0を表す利用者位置情報を利用者端末2から取得する(ステップS31)。同様にして、利用者位置取得部16は、利用者速度V0及び利用者加速度aを含む利用者移動情報を取得する(ステップS31)。
続いて、音声ガイド出力部18の候補検索部181は、ステップS31で取得した利用者位置情報に含まれる利用者位置P0、利用者移動情報に含まれる速度V0、及び、基底速度Vbを用いて案内対象となる音声ガイドを検索する(ステップS32)。
ステップS32における具体的な処理について図12を用いて説明する。図12は、候
補検索部181の処理について詳細に説明するための図である。まず、候補検索部181は、基底速度Vb<利用者速度V0であるか否かを判定する(S321)。ステップS321で基底速度Vb<利用者速度V0であると判定された場合、候補検索部181は、距離L1と、案内対象距離S+αに利用者速度V0/基底速度Vbを乗じた値である(S+α)×V0/Vbとを比較し、L1≦(S+α)×V0/Vbとなる距離L1に係る入力位置Piに関連付けて音声ガイドテーブル152に記憶されている音声ガイドを検索し、音声ガイド候補とする(S322)。
ステップS321で基底速度Vb<利用者速度V0であると判定されなかった場合、候補検索部181は、所定の加速度βを用いて、利用者加速度aについて判定を行う。具体的には、候補検索部181は、a<−β又はa>β(β>0)であるか否かを判定する(S323)。ステップS323で、a<−β又はa>β(β>0)であると判定された場合、候補検索部181は、距離L1と、案内対象距離S+αに利用者速度V0/基底速度Vbを乗じた値である(S+α)×V0/Vbと、を比較し、L1≦(S+α)×V0/Vbとなる距離L1に係る入力位置Piに関連付けて音声ガイドテーブル152に記憶されている音声ガイドを検索する(S322)。
また、ステップS323でa<−β又はa>β(β>0)であると判定されなかった場合、候補検索部181は、距離L1と距離(S+α)とを比較し、時間L1≦(S+α)となる距離L1に係る入力位置Piに関連付けて音声ガイドテーブル152に記憶されている音声ガイドを検索し、音声ガイド候補とする(S324)。
また、ステップS31の処理を終えると、候補検索部181は、利用者位置P0、利用者速度V0、基底速度Vb、及び、ランドマーク最接近道路位置Pcに基づいて、ランドマークに関連する音声ガイドを検索し、検索された音声ガイドを音声ガイド候補とする(ステップS32’)。具体的な処理は、ステップS321乃至ステップS328における処理において距離L1を、利用者位置P0からランドマーク最接近道路位置Plまでの距離L2に置き換えたものとなる。
このようにして、案内対象エリアに関連する音声ガイドを利用者に提供する音声ガイド候補として抽出することにより、所定の時間内に利用者が到着しないと見込まれる位置の周辺にあるランドマークに関する音声ガイドを提供することを防ぐことが可能となる。すなわち、利用者が必要としない音声ガイドを提供することを防ぐことが可能となる。
図10に戻って、ステップS32又はステップS32’で候補検索部181によって音声ガイド候補が検索されると、興味判定部182が、検索された音声ガイド候補の中から利用者興味情報に基づいて音声ガイドを抽出する(ステップS33)。具体的には、まず、利用者興味取得部17が、利用者IDに関連付けて、利用者興味情報テーブル172に興味対象として記憶されている種別を抽出する。
次に、興味判定部182は、候補検索部181によって検索された音声ガイド候補を、その入力位置Piから利用者位置P0までの距離が短い順に保持する。そして、興味判定部182は、利用者位置P0から距離が最も短い入力位置Piに対応している音声ガイド候補に関連付けられているランドマークIDのうち、そのランドマークの種別が興味対象として記憶されている種別のいずれかに一致するか否かを判定する。
音声ガイド候補に関連付けられているランドマークIDに係る種別が、興味対象として抽出された種別のいずれかと一致すると判定された場合、その音声ガイド候補を利用者に提供する音声ガイドとして抽出する。音声ガイド候補に関連付けられているランドマークIDに係る種別が、興味対象として抽出された種別のいずれかと一致すると判定されなか
った場合、次に距離が短い入力位置Piに対応している音声ガイド候補について、同様の判定を行う。
音声ガイド候補が利用者に提供する音声ガイドとして抽出されると、興味判定部182によって抽出された音声ガイドに係る音声ファイル保存場所に保存されている音声ファイルを送信部183が、音声ファイルを、通信ネットワークを介して利用者端末2へ送信する。
このように利用者興味情報テーブル172を用いることによって、音声案内装置1は利用者の興味に合いそうな音声ガイドを利用者に送信することが可能となるため、利用者は自身にとってより有用な情報を得ることができる。
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。
1 音声案内装置
10 制御部
11 カメラ属性取得部
12 動画再生管理部
13 地図情報管理部
14 音声ガイド入力部
15 音声ガイド管理部
16 利用者位置取得部
17 利用者興味取得部
18 音声ガイド出力部
111 カメラ属性情報管理DB
112 カメラ属性情報管理テーブル
121 動画撮影位置管理DB
122 動画撮影位置管理テーブル
131 ランドマークDB
132 ランドマークテーブル
151 音声ガイドDB
152 音声ガイドテーブル
181 候補検索部
182 興味判定部
183 送信部
19 表示部
191 音声ガイド入力操作画面
191a 動画再生領域
191b 地図領域
191c 動画情報領域
191d 移動情報領域
191e 音声ガイダンス領域
191f 音声ガイド入力ボタン

Claims (8)

  1. ランドマークに関する情報を音声で案内する音声ガイドを利用者端末へ送信するための音声案内装置であって、
    前記ランドマークが撮影された動画を表示部に表示する動画再生管理部と、
    前記動画が撮影された撮影位置を含む地図を前記表示部に表示する地図情報管理部と、
    前記動画再生管理部によって前記動画が表示され、前記地図情報管理部によって前記地図が表示されているときに、前記音声ガイドを入力する音声ガイド入力部と、
    前記音声ガイドが入力されたときに表示されている前記動画の前記撮影位置を入力位置として、前記入力位置を前記音声ガイド入力部によって入力された前記音声ガイドと関連付けて記憶する音声ガイド管理部と、
    を有することを特徴とする音声案内装置。
  2. 請求項1に記載の音声案内装置であって、
    前記動画を撮影したカメラの属性情報を取得するカメラ属性取得部と、を有し、
    前記地図情報管理部は前記カメラ属性取得部によって取得された前記カメラの属性情報に基づいて、前記カメラからの視野を表す印を重畳した前記地図を前記表示部に表示することを特徴とする音声案内装置。
  3. 請求項2に記載の音声案内装置であって、
    前記動画再生管理部は、前記動画における第1のフレームを撮影した撮影位置、撮影時刻と前記第1のフレームとは異なる第2のフレームを撮影した撮影位置、撮影時刻に基づいて前記カメラの進行方向を判定し、
    前記地図情報管理部は前記動画再生管理部によって判定された前記進行方向を表す印を重畳した前記地図を前記表示部に表示することを特徴とする音声案内装置。
  4. 請求項1乃至3のいずれか1項に記載の音声案内装置であって、
    利用者の位置を表す利用者位置情報並びに、利用者の速度及び加速度を表す利用者移動情報を受信する利用者位置取得部と、
    前記利用者位置取得部によって取得された利用者位置情報及び利用者取得情報に基づいて前記音声ガイドを出力する音声ガイド出力部と、
    を有することを特徴とする音声案内装置。
  5. 請求項4に記載の音声案内装置であって、
    前記音声ガイド出力部は、
    前記利用者位置取得部によって取得された前記利用者位置情報に含まれる利用者の位置から前記音声ガイドが入力されたときに表示されている前記動画の前記撮影位置までの距離と、利用者位置から案内対象までの距離に所定の距離を加算した距離と、前記利用者の速度と、前記利用者の移動における速度の標準である基底速度と、に基づいて前記音声ガイドを出力することを特徴とする音声案内装置。
  6. 請求項4又は5に記載の音声案内装置であって、
    前記利用者の興味対象である種別を取得する利用者興味取得部を有し、
    前記音声ガイド出力部は、前記利用者興味取得部によって取得された前記種別に基づいて前記音声ガイドを出力することを特徴とする音声案内装置。
  7. ランドマークに関する情報を音声で案内する音声ガイドを利用者端末へ送信するための音声案内方法であって、
    前記ランドマークが撮影された動画を表示部に表示する動画再生管理ステップと、
    前記動画が撮影された撮影位置を含む地図を前記表示部に表示する地図情報管理ステッ
    プと、
    前記動画再生管理ステップによって前記動画が表示され、前記地図情報管理ステップによって前記地図が表示されているときに、前記音声ガイドを入力する音声ガイド入力ステップと、
    前記音声ガイドが入力されたときに表示されている前記動画の前記撮影位置を入力位置として、前記入力位置を前記音声ガイド入力ステップによって入力された前記音声ガイドと関連付けて記憶する音声ガイド管理ステップと、
    を含むことを特徴とする音声案内方法。
  8. ランドマークに関する情報を音声で案内する音声ガイドを利用者端末へ送信するための音声案内装置を構成するコンピュータに、
    前記ランドマークが撮影された動画を表示部に表示する動画再生管理ステップと、
    前記動画が撮影された撮影位置を含む地図を前記表示部に表示する地図情報管理ステップと、
    前記動画再生管理ステップによって前記動画が表示され、前記地図情報管理ステップによって前記地図が表示されているときに、前記音声ガイドを入力する音声ガイド入力ステップと、
    前記音声ガイドが入力されたときに表示されている前記動画の前記撮影位置を入力位置として、前記入力位置を前記音声ガイド入力ステップによって入力された前記音声ガイドと関連付けて記憶する音声ガイド管理ステップと、
    を実行させることを特徴とする音声案内プログラム。
JP2014190478A 2014-09-18 2014-09-18 音声案内装置、音声案内方法及び音声案内プログラム Pending JP2016061698A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014190478A JP2016061698A (ja) 2014-09-18 2014-09-18 音声案内装置、音声案内方法及び音声案内プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014190478A JP2016061698A (ja) 2014-09-18 2014-09-18 音声案内装置、音声案内方法及び音声案内プログラム

Publications (1)

Publication Number Publication Date
JP2016061698A true JP2016061698A (ja) 2016-04-25

Family

ID=55797479

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014190478A Pending JP2016061698A (ja) 2014-09-18 2014-09-18 音声案内装置、音声案内方法及び音声案内プログラム

Country Status (1)

Country Link
JP (1) JP2016061698A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020076683A (ja) * 2018-11-09 2020-05-21 トヨタ自動車株式会社 移動体および遠隔ガイドシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020076683A (ja) * 2018-11-09 2020-05-21 トヨタ自動車株式会社 移動体および遠隔ガイドシステム

Similar Documents

Publication Publication Date Title
KR101864814B1 (ko) 스트리트 뷰 목적지에 대한 안내를 제공하는 방법 및 장치
US10230779B2 (en) Content provision system, information processing apparatus and content reproduction method
US7474959B2 (en) Method for providing recommendations using image, location data, and annotations
KR101561628B1 (ko) 스마트 글래스의 영상 정보를 제공하는 검색 장치 및 검색 방법
US20100304720A1 (en) Method and apparatus for guiding media capture
JP6045354B2 (ja) 案内システム、サーバ、端末装置、案内方法およびプログラム
JP2013502593A (ja) モバイル機器及びモバイル機器と情報を送受信するサーバ
JP2018115980A (ja) ナビゲーションシステム、ナビゲーションプログラム、車載装置
CN109540122B (zh) 一种构建地图模型的方法及装置
CN105335396A (zh) 分享旅途经验的方法和设备
JP2014519606A (ja) 短距離において複数の曲がり角を曲がるための支援を備えるナビゲーションシステム
JP4004798B2 (ja) 配信装置及び表示装置及び配信方法及び情報配信・表示方式
US20170132843A1 (en) A Method and Technical Equipment for Determining a Pose of a Device
JP2005294893A (ja) 画像配信システム
JP2016061698A (ja) 音声案内装置、音声案内方法及び音声案内プログラム
JP2008014881A (ja) ナビゲーション装置
JP2012244509A (ja) 車載システム
JP2013134225A (ja) ナビゲーション装置、システム、方法及びコンピュータプログラム
WO2015107827A1 (ja) 番組受信装置、番組受信方法、および記録媒体
KR101486506B1 (ko) 위치 기반 멀티미디어 콘텐츠 생성 장치 및 그 방법
KR101762514B1 (ko) 지도 기반 촬상 위치 정보 제공 방법 및 장치
KR20170025732A (ko) 여행 기록을 제공하기 위한 장치, 이를 위한 방법 및 이 방법이 기록된 컴퓨터 판독 가능한 기록매체
CN114866682B (zh) 一种基于视频生成路书的方法以及一种生成个性化路书的方法
KR20180076769A (ko) 실시간 gps 정보를 이용한 동영상 길안내 방법 및 시스템
KR101936611B1 (ko) 사용자 장치를 통한 경로 정보 제공 방법 및 장치