JP2021117921A

JP2021117921A - 情報処理システムおよび電子機器

Info

Publication number: JP2021117921A
Application number: JP2020012842A
Authority: JP
Inventors: 弘継野嶽; Hirotsugu Nodake
Original assignee: Kyocera Corp
Current assignee: Kyocera Corp
Priority date: 2020-01-29
Filing date: 2020-01-29
Publication date: 2021-08-10
Anticipated expiration: 2040-01-29
Also published as: JP7408419B2

Abstract

【課題】児童誘拐等の犯罪行為を抑止する抑止力となり得るシステムの構築すること。【解決手段】情報処理システムにおいて、情報処理装置が備える危険度判定部は、音声解析部により取得された単語と危険ワードとの一致率、並びに、画像解析部により取得された年齢、性別、及び感情に対応付けられた危険人物該当率に基づいて、前記ユーザ端末のユーザである児童が犯罪に巻き込まれる可能性が高いか否かを示す危険度を導出する。【選択図】図５

Description

本出願は、情報処理システムおよび電子機器に関する。

近年、小児、児童等が誘拐等の犯罪に巻き込まれることを防ぐ目的で各種のセキュリティー機能（防犯機能）が実装された子供向けの携帯電話機やシステムが提案されている。

特開２００９−５３８５５号公報特開２００８−１０２７５１号公報

児童誘拐等の犯罪行為を撲滅するため、かかる犯罪行為を抑止する抑止力となり得るシステムの構築が求められる。

態様の１つに係る情報処理システムは、ユーザ端末と、前記ユーザ端末により取得されたデータを処理する情報処理装置と含む情報処理システムである。前記ユーザ端末は、前記情報処理装置との間で各種情報を送受信する通信部と、前記ユーザ端末の周囲の音声を入力可能に配置された音声入力部と、前記ユーザ端末の周囲の画像を撮像可能に配置された撮像部と、前記音声入力部により入力された入力音声を取得する音声取得部と、前記撮像部により撮像された画像を取得する画像取得部と、前記入力音声との比較を行うための比較音声の情報を予め記憶する記憶部と、前記入力音声の周波数と前記比較音声の周波数とが一致するか否かを判定し、前記入力音声の周波数と前記比較音声の周波数とが一致しないと判定した場合、前記通信部を介して、前記入力音声の音声データ及び前記画像取得部により取得された画像の画像データを、それぞれ端末取得音声データ及び端末取得画像データとして前記情報処理装置に送信する判定部とを備える。前記情報処理装置は、前記ユーザ端末から前記端末取得音声データ及び前記端末取得画像データを受信する通信部と、前記端末取得画像データとの比較を行うための比較画像データを記憶する比較画像データ格納部と、危険ワードの情報を記憶する危険ワード格納部と、年齢、性別、及び感情に対応付けられた危険度を記憶する危険度格納部と、前記端末取得音声データを解析し、当該端末取得音声データに対応するテキストデータを形態素に分割して取得する音声解析部と、前記端末取得画像データを解析し、端末取得画像に映し出された人物の年齢、性別、及び感情を取得する画像解析部と、前記端末取得画像データと前記比較画像データとが一致しない場合、前記音声解析部により取得された形態素と前記危険ワードとの一致率、並びに、前記画像解析部により取得された年齢、性別、及び感情に対応付けられた危険度に基づいて、前記ユーザ端末のユーザである児童が犯罪に巻き込まれる可能性が高いか否かを示す危険度を導出する危険度判定部とを備える。

また、態様の１つに係る電子機器は、音声及び画像に基づく処理を実行する電子機器であって、前記電子機器の周囲の音声を入力可能に配置された音声入力部と、前記電子機器の周囲の画像を撮像可能に配置された撮像部と、前記音声入力部により入力された入力音声を取得する音声取得部と、前記撮像部により撮像された画像を取得する画像取得部と、前記入力音声との比較を行うための比較音声の情報を予め記憶する音声記憶部と、前記画像との比較を行うための比較画像の情報を予め記憶する画像記憶部と、危険ワードの情報を記憶する危険ワード格納部と、年齢、性別、及び感情に対応付けられた危険度を記憶する危険度格納部と、前記音声取得部により取得された入力音声のデータを解析し、当該入力音声のデータに対応するテキストデータを形態素に分類して取得する音声解析部と、前記画像取得部により取得された画像のデータを解析し、当該画像に映し出された人物の年齢、性別、及び感情を取得する画像解析部と、前記音声取得部により取得された入力音声の周波数と前記比較音声の周波数とが一致するか否かを判定する音声判定部と、前記画像取得部により取得された画像と、前記画像記憶部に記憶されている前記比較画像とが一致するか否かを判定する画像判定部と、前記音声判定部により前記入力音声の周波数と前記比較音声の周波数とが一致しないと判定された場合、及び／又は前記画像取得部により取得された画像と、前記画像記憶部に記憶されている前記比較画像とが一致しないと判定された場合、前記音声解析部により取得された形態素と前記危険ワードとの一致率、並びに、前記画像解析部により取得された前記年齢、性別、及び感情に対応付けられた危険度に基づいて、前記電子機器のユーザが犯罪に巻き込まれる可能性が高いか否かを示す危険度を導出する危険度判定部とを備える。

図１は、実施形態に係る情報処理システムの概要を示す模式図である。図２は、実施形態に係る情報処理システムの構成例を示す図である。図３は、実施形態に係るユーザ端末の構成例を示す図である。図４は、実施形態に係るユーザ端末が有するコントローラ内部の構成例を示す図である。図５は、実施形態に係る情報処理装置の構成例を示す図である。図６は、実施形態に係る危険ワード格納部に格納される情報の概要を示す図である。図７は、実施形態に係る危険度格納部に記憶される情報の概要を示す図である。図８は、実施形態に係る危険ワードの一致率の一例を示す図である。図９は、実施形態に係る情報処理システムの処理手順の一例を示すフローチャートである。図１０は、実施形態に係る情報処理システムの処理手順の一例を示すフローチャートである。図１１は、実施形態に係る情報処理システムの処理手順の一例を示すフローチャートである。

本出願に係る実施形態を、図面を参照しつつ詳細に説明する。以下の説明において、同様の構成要素について同一の符号を付すことがある。さらに、重複する説明は省略することがある。

＜＜１．はじめに＞＞
児童は、感情に流されやすく、客観的かつ論理的な判断が難しいので、誘拐等の犯罪行為の可能性がある状況に遭遇した場合、適切な行動をとれない可能性が高い。また、保護者が、児童のスケジュールや位置を把握していたとしても、児童の現在の状況を把握しているとは限らないので、児童が誘拐等の犯罪行為の可能性がある状況に遭遇しても即座に行動することは難しい。また、警察などの行政機関が、誘拐等の犯罪行為が発生しても、かかる犯罪行為に対して行動できるのは通報後であるので、犯罪行為が発生してからある程度の時間が経過しており、初動が遅れてしまう。このように、児童等が誘拐等の犯罪行為に遭遇することを回避するのは困難を極めるが、児童等が犯罪行為に遭遇することをできるだけ防止するとともに、犯罪行為に対してできるだけ迅速な行動をとることができる防犯体制の構築が望まれる。

そこで、本出願では、犯罪行為に対して捜査機関ができるだけ迅速な行動をとることを可能とするとともに、犯罪行為に巻き込まれる児童等の撲滅を図ることができる情報処理システム及び電子機器を提案する。

＜＜２．情報処理システムの概要＞＞
図１を用いて、実施形態に係る情報処理システムの概要を説明する。図１は、実施形態に係る情報処理システムの概要を示す模式図である。

図１に示す実施形態に係る情報処理システムは、児童Ｐ_１が携帯するユーザ端末１と、当該児童Ｐ_１が犯罪被害に遭う事を防止するための処理を実行する情報処理装置２００とを備える。

図１において、符号「Ｐ_１」は児童を示している。符号「Ｐ_２」は、児童及び児童の保護者以外の第三者を示し、不審者である場合と、不審者ではない場合とがある。符号「Ｐ_３」は児童の保護者を示している。また、図１において、符号「ＰＳ」は警察署を示している。

ユーザ端末１は、通信機能を備えたスマートフォン等の子供向けの通信装置である。ユーザ端末１は、携帯電話、スマートデバイス（スマートフォン、又はタブレット）、ウェアラブル端末、ＰＤＡ（Personal Digital Assistant）、ポータブル音楽プレーヤ、ゲーム端末、ラップトップ型のパーソナルコンピュータ等の種々の端末であってよい。

また、ユーザ端末１は、音声入力機能及び撮像機能を有する。ユーザ端末１は、音声入力機能により、児童Ｐ_１の周囲に存在する第三者Ｐ_２の音声を取得できる。また、ユーザ端末１は、撮像機能により、児童の周囲に存在する第三者Ｐ_２の画像を取得できる。また、ユーザ端末１は、警告音を出力する機能、及び警告音を出力中であることを表示する機能を有する。

また、ユーザ端末１は、インターネット等のネットワークに接続し、情報処理装置２００との間で各種情報を送受信する情報通信を行うことができる。

情報処理装置２００は、危険度判定処理を実行する情報処理装置であり、インターネット等のネットワーク上に配置されたサーバ装置やワークステーション等の汎用的な情報処理装置、複数の情報処理装置で構築されたクラウドシステム等により実現される。

このようなユーザ端末１及び情報処理装置２００を備える情報処理システムによる処理の一例について説明する。

ユーザ端末１は、入力音声（例えば、第三者Ｐ_２の音声）を取得し、取得した入力音声の周波数と、予め保持する比較音声の周波数とが一致するか否かを判定する（ステップＳ１）。ここで、比較音声は、例えば、予め収録してユーザ端末１に記録された保護者Ｐ_３や親族などの音声に相当する。

ユーザ端末１は、入力音声の周波数と比較音声の周波数とが一致しないと判定した場合、カメラ（図示略）を起動し、カメラにより撮像された画像（例えば、第三者Ｐ_２の顔画像を含む画像）を取得する（ステップＳ２）。そして、ユーザ端末１は、ステップＳ１で取得した入力音声の音声データと、ステップＳ２で取得した画像の画像データを情報処理装置２００に送信する（ステップＳ３）。また、ユーザ端末１は、児童Ｐ_１の現在位置の情報やユーザ端末１を特定する端末情報を情報処理装置２００に送信できる（ステップＳ３）。児童Ｐ_１の現在位置の情報やユーザ端末１を特定する端末情報は、警察管理装置４００に対する通報を行う際に同封される。端末情報として、ユーザ端末１に付与された電話番号や個体識別番号などを例示できる。

情報処理装置２００は、ユーザ端末１から受信した音声データ（端末取得音声データ）に基づいて音声解析処理を実行する（ステップＳ４）。情報処理装置２００は、例えば、音声データを解析し、音声データに対応するテキストデータを形態素に分割する。

また、情報処理装置２００は、画像データ（端末取得画像データ）に基づいて画像解析処理を実行する（ステップＳ５）。例えば、情報処理装置２００は、画像データを解析し、画像に映し出されている人物の年齢、性別、及び感情を取得する。

情報処理装置２００は、音声解析処理結果及び画像解析処理結果に基づいて、ユーザ端末１のユーザである児童Ｐ_１が犯罪に巻き込まれる可能性が高いか否かを示す危険度を導出する危険度判定処理を実行する（ステップＳ６）。情報処理装置２００は、音声解析処理により取得された形態素と危険ワードとの一致率、並びに、画像解析処理により取得された年齢、性別、及び感情に対応付けられた危険度に基づいて、ユーザ端末１のユーザである児童Ｐ_１が犯罪に巻き込まれる可能性が高いか否かを示す危険度を導出する。情報処理装置２００は、危険ワードを記憶する危険ワード格納部と、年齢、性別、及び感情に対応付けられた危険度を記憶する危険度格納部とを備える。

情報処理装置２００は、危険度判定処理により導出した児童Ｐ_１の危険度に応じて、児童Ｐ_１、保護者Ｐ_３、及び警察署ＰＳのうちの少なくともいずれかに対して実施する処理を決定する。例えば、情報処理装置２００は、第三者Ｐ_２の危険度が９０％を超える場合、保護者装置３００に対して、児童Ｐ_１の状況を通知するためのメッセージを送信し、保護者Ｐ_３に児童Ｐ_１の現在の状況を通知する（ステップＳ７）。さらに、情報処理装置２００は、警察管理装置４００に対して、例えば、緊急出動を要請する通報するためのメッセージを送信し、児童Ｐ１が危険な状況にあることを警察署ＰＳに通報する（ステップＳ８）。この通報には、ユーザ端末１から受信した音声データ及び画像データの他、ユーザ端末１の現在位置の情報やユーザ端末１を特定する端末情報を含めることができる。さらに、情報処理装置２００は、ユーザ端末１から警告音を出力させるための指令信号をユーザ端末１に送信する（ステップＳ９）。

ユーザ端末１は、情報処理装置２００から受信する指令信号に従って、警告音を出力すると共に（ステップＳ１０）、警告音を出力中であることを示す画像を表示する（ステップＳ１１）。

このように、実施形態に係る情報処理システムにおいて、情報処理装置２００は、客観的かつ論理的な判断が難しい児童Ｐ_１の代わりに、児童Ｐ_１の現在の状況の危険度を判定する。そして、情報処理装置２００は、判定した危険度に応じて、児童Ｐ_１の現在の状況を保護者Ｐ_３へ通達するとともに、行政機関である警察署ＰＳへの通報を実施する。そして、情報処理装置２００は、警察署ＰＳへの通報に際して、ユーザ端末１において取得された音声データ及び画像データを送信する。このため、実施形態に係る情報処理システムによれば、例えば児童Ｐ_１の危険を保護者Ｐ_３に把握させることができ、また、児童Ｐ_１が犯罪に巻き込まれた際に事件解決に必要となる情報を捜査機関となる警察署ＰＳに提供できる。これにより、捜査機関である警察署ＰＳは、犯罪行為に対する迅速な行動が可能となる。

また、情報処理装置２００が警察署ＰＳへの通報に際して同封する音声データ及び画像データは、犯罪立証のための情報となり得る。このため、実施形態に係る情報処理システムが広く社会的に認知されることにより、児童誘拐等の犯罪行為を抑止する抑止力となり得る。この結果、犯罪行為に巻き込まれる児童等の撲滅を図ることができる。

＜＜３．機能構成等＞＞
＜３−１．システム構成＞
図２を用いて、実施形態に係る情報処理システムの構成を説明する。図２は、実施形態に係る情報処理システムの構成例を示す図である。

図２に示すように、実施形態に係る情報処理システムＳＹＳは、ユーザ端末１と、情報処理装置２００と、保護者装置３００と、警察管理装置４００と、ＧＰＳ衛星５００を備える。情報処理システムＳＹＳは、ユーザ端末１と情報処理装置２００とが連携して動作することにより、ユーザ端末１のユーザ（例えば、児童Ｐ_１）の代わりに、かかるユーザの現在の状況の危険度に応じた処理を実現する。

情報処理システムＳＹＳは、複数のユーザ端末１と、保護者装置３００とを含むことができる。図２に示す例では、情報処理システムＳＹＳは、ユーザ端末１として、ユーザ端末１_ａ〜１_ｎ等を備えている。また、情報処理システムＳＹＳは、保護者装置３００として、保護者装置３００_ａ〜３００_ｎ等を備えている。また、情報処理システムＳＹＳは、ＧＰＳ衛星５００として、ＧＰＳ衛星５００_ａ〜５００_ｎ等を備えている。なお、情報処理システムＳＹＳは、複数の情報処理装置２００を備えてもよく、複数の警察管理装置４００を備えてもよい。

ユーザ端末１は、通信機能を備えた子供向けの通信装置である。ユーザ端末１は、携帯電話、スマートデバイス（スマートフォン、又はタブレット）、ウェアラブル端末、ＰＤＡ（Personal Digital Assistant）、ポータブル音楽プレーヤ、ゲーム端末、ラップトップ型のパーソナルコンピュータ等のモバイル端末であってよい。また、ユーザ端末１は、Ｍ２Ｍ（Machine to Machine）デバイス、又はＩｏＴ（Internet of Things）デバイスであってもよい。ユーザ端末１は、ネットワークＮＷに接続し、ネットワークＮＷを介して、他の装置と通信できる。

情報処理装置２００は、危険度判定処理を実行する情報処理装置である。情報処理装置２００は、インターネット等のネットワークＮＷ上に配置されたサーバ装置やワークステーション等の汎用的な情報処理装置、複数の情報処理装置で構築されたクラウドシステム等により実現される。情報処理装置２００は、ネットワークＮＷに接続し、ネットワークＮＷを介して、他の装置と通信できる。

保護者装置３００は、児童Ｐ_１（図１参照）の保護者Ｐ_３（図１参照）により保持される通信装置である。保護者装置３００は、携帯電話、スマートデバイス（スマートフォン、又はタブレット）、ウェアラブル端末、ＰＤＡ（Personal Digital Assistant）、ポータブル音楽プレーヤ、ゲーム端末、パーソナルコンピュータ等の装置であってよい。実施形態において、保護者装置３００は、情報処理装置２００からのメッセージを受信し、受信したメッセージを表示することができる。保護者装置３００は、ネットワークＮＷに接続し、ネットワークＮＷを介して、他の装置と通信できる。

警察管理装置４００は、警察署ＰＳにより管理及び運営されるシステムである。警察管理装置４００は、例えば、住民からの緊急通報に迅速かつ正確に対応し、現場にパトカーや交番の警察官を急行させることで、人命救助や事件・事故への対処などを支援するシステムなどを含む。警察管理装置４００は、ポインティングデバイス機能などを備え、専用のペンを使った高い操作性と効率的な入力により、通報者からの情報を正確に受理したり、地図情報システムと連携し、豊富で効果的な検索機能により発生場所の早期特定を支援したりできる。実施形態において、警察管理装置４００は、情報処理装置２００からの通報を受信し、受信した通報に含まれる音声データ及び画像データを記録できる。警察管理装置４００は、ネットワークＮＷに接続し、ネットワークＮＷを介して、他の装置と通信できる。

ネットワークＮＷは、ユーザ端末１と、情報処理装置２００と、保護者装置３００と、警察管理装置４００とを相互に接続する。ネットワークＮＷは、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ｅｔｈｅｒｎｅｔ（登録商標）を含む各種のＬＡＮ（Local Area Network）、ＷＡＮ（Wide Area Network）などを含んでもよい。また、ネットワークＮＷは、ＩＰ−ＶＰＮ（Internet Protocol-Virtual Private Network）などの専用回線網を含んでもよい。また、ネットワークＮＷは、Ｗｉ−Ｆｉ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）など無線通信網を含んでもよい。

ＧＰＳ衛星５００は、ＧＰＳ（Global Positioning System、全地球測位システム）の通信機能を備える通信装置に、通信装置の地理位置を特定可能な情報を送信（提供）する衛星である。通信装置（例えば、ユーザ端末１）は、ＧＰＳ衛星５００から出力される情報を取得し、解析することで、自身（ユーザ端末１）の位置情報（座標情報）を取得する。なお、位置情報は、ＧＰＳの他、Ｂｅｉｄｏｕ、ＱＺＳＳ（Quasi-Zenith Satellite System）、ＧａｌｉｌｅｏやＡ−ＧＰＳ（Assisted Global Positioning System）に代表される位置測位機能によって取得される座標情報であってもよい。典型的には、緯度、経度、高度、測位誤差に係る情報が含まれうる。または、例えば、ＮＲＡ（National Regulatory Authority）またはその委託機関によって管理される情報管理装置に登録される位置情報であってよい。または、例えば、特定の地理位置を原点とするX軸、Y軸、Z軸の座標であってもよい。また、このような座標情報と一緒に屋外／屋内を示す識別子が付与されうる。

＜３−２．ユーザ端末＞
図３は、実施形態に係るユーザ端末の構成例を示す図である。図３に示すように、ユーザ端末１は、タッチスクリーンディスプレイ２と、ボタン３と、照度センサ４と、近接センサ５と、通信ユニット６と、レシーバ７と、マイク８と、ストレージ９と、コントローラ１０と、スピーカ１１と、カメラ１２と、カメラ１３と、コネクタ１４と、加速度センサ１５と、方位センサ１６と、ジャイロスコープ１７と、ＧＰＳレシーバ１８とを有する。

タッチスクリーンディスプレイ２は、ディスプレイ２Ａと、タッチスクリーン２Ｂとを有する。

ディスプレイ２Ａは、液晶ディスプレイ（ＬＣＤ：ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）、有機ＥＬディスプレイ（ＯＥＬＤ：ＯｒｇａｎｉｃＥｌｅｃｔｒｏ−ＬｕｍｉｎｅｓｃｅｎｃｅＤｉｓｐｌａｙ）、又は無機ＥＬディスプレイ（ＩＥＬＤ：ＩｎｏｒｇａｎｉｃＥｌｅｃｔｒｏ−ＬｕｍｉｎｅｓｃｅｎｃｅＤｉｓｐｌａｙ）等の表示デバイスを含む。ディスプレイ２Ａは、文字、画像、記号、及び図形等のオブジェクトを画面内に表示する。

タッチスクリーン２Ｂは、タッチスクリーン２Ｂに対する指、ペン、又はスタイラスペン等の接触又は近接を検出する。タッチスクリーン２Ｂは、複数の指、ペン、又はスタイラスペン等がタッチスクリーン２Ｂに接触又は近接したときのタッチスクリーン２Ｂ上の位置を検出することができる。タッチスクリーン２Ｂは、タッチスクリーン２Ｂに対する指の接触又は近接を、検出位置とともにコントローラ１０に通知する。

コントローラ１０は、タッチスクリーン２Ｂにより検出された接触又は近接、検出位置、検出位置の変化、接触又は近接が継続した時間、接触又は近接が検出された間隔、及び接触が検出された回数の少なくとも１つに基づいて、ジェスチャの種別を判別できる。コントローラ１０が、タッチスクリーン２Ｂを介して判別するジェスチャには、例えば、タッチ、ロングタッチ、リリース、スワイプ、タップ、ダブルタップ、ロングタップ、ドラッグ、フリック、ピンチイン、及びピンチアウトが含まれるが、これらに限定されない。

タッチスクリーン２Ｂの検出方式は、静電容量方式、抵抗膜方式、表面弾性波方式、赤外線方式、及び荷重検出方式等の任意の方式でよい。以下の説明では、説明を簡単にするため、利用者はユーザ端末１を操作するために指を用いてタッチスクリーン２Ｂに接触するものと想定する。

ボタン３は、ユーザからの操作入力を受け付ける。ボタン３の数は、任意の数であってよい。コントローラ１０はボタン３と協働することによってボタン３に対する操作を検出する。ボタン３に対する操作は、例えば、クリック、ダブルクリック、トリプルクリック、プッシュ、及びマルチプッシュを含むが、これらに限定されない。ボタン３は、例えばメニューボタン、パワーオンボタン、パワーオフボタン（電源ボタン）、リセットボタンなどの各種機能が割り当てられてよい。ボタン３は、音声入力の処理を実行させる機能が割り当てられてよい。

照度センサ４は、照度を検出する。照度は、照度センサ４の測定面の単位面積に入射する光束の値である。照度センサ４は、例えば、ディスプレイ２Ａの輝度の調整に用いられる。

近接センサ５は、近隣の物体の存在を非接触で検出する。近接センサ５は、赤外線を照射する発光素子と、発光素子から照射された赤外線の反射光を受光する受光素子を有する。照度センサ４及び近接センサ５は、１つのセンサとして構成されていてもよい。

通信ユニット６は、無線により通信する。通信ユニット６によってサポートされる無線通信規格には、例えば、２Ｇ、３Ｇ、４Ｇ、５Ｇ等のセルラーフォンの通信規格と、近距離無線の通信規格とが含まれる。セルラーフォンの通信規格としては、例えば、ＬＴＥ（Long Term Evolution）、Ｗ−ＣＤＭＡ（登録商標）（Wideband Code Division Multiple Access）、ＣＤＭＡ２０００、ＰＤＣ（Personal Digital Cellular）、ＧＳＭ（登録商標）（Global System for Mobile communications）、ＰＨＳ（Personal Handy-phone System）等がある。

通信ユニット６によってサポートされる近距離無線の通信規格としては、例えば、ＷｉＭＡＸ（登録商標）（Worldwide interoperability for Microwave Access）、ＩＥＥＥ８０２．１１、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＩｒＤＡ（Infrared Data Association）、ＮＦＣ（登録商標）（Near Field Communication）、ＷＰＡＮ（Wireless Personal Area Network）等が含まれる。通信ユニット６は、上述した通信規格の１つ又は複数をサポートしていてもよい。

通信ユニット６は、ネットワークＮＷに接続して、情報処理装置２００との間で実行される情報通信を実現するための通信プロトコルをサポートできる。コントローラ１０は、通信ユニット６を介して、情報処理装置２００との間で各種情報を送受信する情報通信を行う。通信ユニット６は、コントローラ１０により取得された音声データと、画像データとを情報処理装置２００に送信する。

レシーバ７およびスピーカ１１は、音出力部である。レシーバ７およびスピーカ１１は、コントローラ１０から送信される音信号を音として出力する。レシーバ７は、例えば、通話時に相手の声を出力するために用いられる。スピーカ１１は、例えば、着信音および音楽を出力するために用いられる。また、スピーカ１１は、実施形態において、警告音を出力するために用いられる。レシーバ７およびスピーカ１１の一方が、他方の機能を兼ねてもよい。マイク８は、音入力部である。マイク８は、利用者の音声等を音信号へ変換してコントローラ１０へ送信する。

ストレージ９は、プログラムおよびデータを記憶する。ストレージ９は、コントローラ１０の処理結果を一時的に記憶する作業領域としても利用される。ストレージ９は、半導体記憶媒体、および磁気記憶媒体等の任意の非一過的（non-transitory）な記憶媒体を含んでよい。ストレージ９は、複数の種類の記憶媒体を含んでよい。ストレージ９は、メモリカード、光ディスク、または光磁気ディスク等の可搬の記憶媒体と、記憶媒体の読み取り装置との組み合わせを含んでよい。ストレージ９は、ＲＡＭ（Random Access Memory）等の一時的な記憶領域として利用される記憶デバイスを含んでよい。

ストレージ９が記憶するプログラムおよびデータの一部または全部は、通信ユニット６による無線通信でアクセス可能なクラウドストレージなどの他の装置からダウンロードされてもよい。ストレージ９が記憶するプログラムおよびデータの一部または全部は、ストレージ９に含まれる読み取り装置が読み取り可能な非一過的な記憶媒体に記憶されていてもよい。ストレージ９が記憶するプログラムおよびデータの一部または全部は、コネクタ１４に接続される読み取り装置が読み取り可能な非一過的な記憶媒体に記憶されていてもよい。非一過的な記憶媒体は、例えば、ＣＤ（登録商標）、ＤＶＤ（登録商標）、Ｂｌｕ−ｒａｙ（登録商標）等の光ディスク、光磁気ディスク、磁気記憶媒体、メモリカード、およびソリッドステート記憶媒体を含むが、これらに限定されない。

ストレージ９に記憶されるプログラムには、フォアグランドまたはバックグランドで実行されるアプリケーションと、アプリケーションの動作を支援する制御プログラムとが含まれる。アプリケーションは、例えば、ディスプレイ２Ａに画面を表示させ、タッチスクリーン２Ｂを介して検出されるジェスチャに応じた処理をコントローラ１０に実行させる。制御プログラムは、例えば、ＯＳである。アプリケーションおよび制御プログラムは、通信ユニット６による無線通信または非一過的な記憶媒体を介してストレージ９に導入されてもよい。

ストレージ９に記憶されるプログラムは、ユーザ端末１の各種動作に関する処理を実現するための機能をそれぞれ提供できる。ストレージ９に記憶されるプログラムが提供する機能は、照度センサ４の検出結果に基づいて、ディスプレイ２Ａの輝度を調整する機能を含む。ストレージ９に記憶されるプログラムが提供する機能は、近接センサ５の検出結果に基づいて、タッチスクリーン２Ｂに対する操作を無効とする機能を含む。ストレージ９に記憶されるプログラムが提供する機能は、コネクタ１４を介して接続される外部機器との間の通信を制御する機能を含む。ストレージ９に記憶されるプログラムが提供する機能は、タッチスクリーン２Ｂの検出結果に基づいて判別したジェスチャに応じて、ディスプレイ２Ａに表示されている情報を変更する等の各種制御を行う機能を含む。ユーザ端末１の各種動作に関する処理を実現するための機能は、後述する制御プログラム９Ａにより提供されてもよい。

ストレージ９は、たとえば制御プログラム９Ａ、防犯アプリケーション９Ｂ、音声データ９Ｘ、画像データ９Ｙ、比較音声データ９Ｚを記憶する。

制御プログラム９Ａは、ユーザ端末１を制御するための機能を提供する。コントローラ１０は、制御プログラム９Ａを実行することにより、例えば、検出される操作に応じて、アプリケーションを起動または終了させる。

防犯アプリケーション９Ｂは、ユーザ端末１の防犯に関わる動作を実現するための各種機能を提供する。コントローラ１０は、防犯アプリケーション９Ｂを実行することにより、後述するユーザ端末１の防犯に関わる動作を実行する。なお、防犯アプリケーション９Ｂにより提供される機能の一部を制御プログラム９Ａが担ってもよい。また、防犯アプリケーション９Ｂにより提供される機能の一部が、実施形態に特有の処理を実現するために専用に作成されたプログラム、あるいは既存プログラム又はアプリケーションに対するアドオンなどで実装されてもよい。

音声データ９Ｘは、マイク８が入力した音声のデータである。音声データ９Ｘは、例えば、ユーザ端末１のユーザである児童Ｐ_１に対して話しかけた第三者Ｐ_２の音声データに該当する。

画像データ９Ｙは、カメラ１２又はカメラ１３が撮像した画像のデータである。画像データ９Ｙは、例えば、ユーザ端末１のユーザである児童Ｐ_１に対して話しかけた第三者Ｐ_２の顔画像の画像データに該当する。

比較音声データ９Ｚは、入力音声（音声データ９Ｘ）との比較を行うための比較音声の情報である。比較音声データ９Ｚには、例えば比較音声の情報として、予め収録された音声の周波数が記録される。比較音声は、保護者Ｐ_３（図１参照）や親族などの児童Ｐ_１にとって安全な人物の音声に相当する。

図３に示すプログラム及びデータは、実施形態を説明するうえで必要と認めるものを例示するものであり、図３に示す例に特に限定される必要はない。例えば、電子メールの作成、送信、受信、および表示等のための電子メール機能を提供するメールアプリケーションや、ＷＥＢページを表示するためのＷＥＢブラウジング機能を提供するブラウザアプリケーションなどが必要に応じて記憶され得る。また、図３に示すデータは、実施形態を説明するうえで必要と認めるものを例示するものであり、図３に示す例に特に限定される必要はない。例えば、ユーザ端末１の動作に関する各種の設定に関する情報を含む設定データ（ファイル）が記憶され得る。

コントローラ１０は、例えば、ＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）等のプロセッサ（演算処理装置）によって実現される。例えば、コントローラ１０は、ユーザ端末１内部の記憶装置に記憶されている各種プログラムを、コントローラ１０が備えるプロセッサがＲＡＭ等を作業領域として実行することにより実現される。なお、コントローラ１０は、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現されてもよい。

コントローラ１０は、ユーザ端末１の動作を統括的に制御して各種処理を実現する。具体的には、コントローラ１０は、ストレージ９に記憶されているデータを必要に応じて参照しつつ、ストレージ９に記憶されているプログラムに含まれる命令を実行する。そして、コントローラ１０は、データ及び命令に応じて機能部を制御し、それによって各種機能を実現する。機能部は、例えば、ディスプレイ２Ａ、通信ユニット６、レシーバ７、およびスピーカ１１を含むが、これらに限定されない。コントローラ１０は、検出部の検出結果に応じて、制御を変更することがある。検出部は、例えば、タッチスクリーン２Ｂ、ボタン３、照度センサ４、近接センサ５、マイク８、カメラ１２、カメラ１３、加速度センサ１５、方位センサ１６、ジャイロスコープ１７、およびＧＰＳレシーバ１８を含むが、これらに限定されない。

コントローラ１０は、ストレージ９に記憶されるプログラムを実行することにより、ユーザ端末１の動作を制御する。コントローラ１０は、制御プログラム９Ａを実行することにより、例えば、照度センサ４の検出結果に基づいて、ディスプレイ２Ａの輝度を調整できる。コントローラ１０は、制御プログラム９Ａを実行することにより、例えば、近接センサ５の検出結果に基づいて、タッチスクリーン２Ｂに対する操作を無効にできる。コントローラ１０は、制御プログラム９Ａを実行することにより、例えば、コネクタ１４を介して接続される外部機器との間の通信を制御できる。コントローラ１０は、制御プログラム９Ａを実行することにより、例えば、タッチスクリーン２Ｂの検出結果に基づいて判別したジェスチャに応じて、ディスプレイ２Ａに表示されている情報を変更する等の各種制御を実行できる。

また、コントローラ１０は、防犯アプリケーション９Ｂを実行することにより、ユーザ端末１の防犯に関わる動作を実行する。図４は、実施形態に係るユーザ端末が有するコントローラ内部の構成例を示す図である。

図４に示すように、コントローラ１０は、音声取得部１０１と、画像取得部１０２と、判定部１０３と、報知部１０４とを有する。コントローラ１０が有する各ブロック、すなわち、音声取得部１０１、画像取得部１０２、判定部１０３、及び報知部１０４はそれぞれコントローラ１０が防犯アプリケーション９Ｂを実行することにより実現される機能を示す機能ブロックである。これら機能ブロックはソフトウェアブロックであってもよいし、ハードウェアブロックであってもよい。例えば、上述の機能ブロックが、それぞれ、ソフトウェア（マイクロプログラムを含む。）で実現される１つのソフトウェアモジュールであってもよいし、半導体チップ（ダイ）上の１つの回路ブロックであってもよい。勿論、各機能ブロックがそれぞれ１つのプロセッサ又は１つの集積回路であってもよい。機能ブロックの構成方法及び構成単位は任意である。

音声取得部１０１は、マイク８から取得した入力音声の音声データを、音声データ９Ｘとしてストレージ９に記録する。音声取得部１０１により音声データを記録する時間は、任意に設定できる。音声取得部１０１により取得される音声データには、不審者である第三者Ｐ_２が発した音声の音声データが含まれ得る。音声取得部１０１は、所定のタイミングでマイク８を起動し、音声入力が可能な状態にできる。所定のタイミングは任意に設定できる。例えば、児童Ｐ_１が外出するスケジュール（時間帯）をマイク８の起動時間として設定できる。あるいは、音声取得部１０１は、加速度センサ１５の検出結果に応じてマイク８を起動したり、ＧＰＳレシーバ１８に基づく位置に基づいてマイク８を起動したりできる。また、音声取得部１０１により音声データを記録する時間についても、任意に設定できる。音声取得部１０１は、マイク８から取得した入力音声の音声データを判定部１０３に送出する。

画像取得部１０２は、判定部１０３からの信号に従って、カメラ１２（またはカメラ１３）により撮像された画像の画像データを取得する。画像取得部１０２は、例えば、第三者Ｐ_２が位置する方向に合わせて、カメラ１２（又はカメラ１３）の撮像方向を調整してもよい。例えば、マイク８が指向性を有する場合、画像取得部１０２は、マイク８の音声入力方向を第三者Ｐ_２の位置する方向と見做して、カメラ１２（またはカメラ１３）の撮像方向を調整可能である。画像取得部１０２は、カメラ１２（またはカメラ１３）から取得した画像の画像データを、画像データ９Ｙとしてストレージ９に記録する。画像取得部１０２により取得された画像データには、不審者である第三者Ｐ_２が撮像された画像（顔画像）の画像データが含まれ得る。

判定部１０３は、音声取得部１０１により取得された入力音声の周波数と、比較音声データ９Ｚに記録された比較音声の周波数とが一致するか否かを判定する。一致するか否かは、入力音声の周波数が、比較音声の周波数の±５％の範囲内にあるか否かで判定する。判定部１０３は、周波数が一致すると判定した場合、ストレージ９に記録した音声データ９Ｘを破棄する。一方、判定部１０３は、音声取得部１０１により取得された入力音声の周波数と、比較音声の周波数とが一致しないと判定した場合、カメラ１２（及び／又はカメラ１３）を起動し、撮像を指令する信号を出力する。判定部１０３は、カメラ１２及びカメラ１３を起動してもよいし、カメラ１２又はカメラ１３のいずれか一方を起動させてもよい。また、判定部１０３は、カメラ１２（及び／又はカメラ１３）する際、音声の入力方向に基づいて、カメラ１２又はカメラ１３のいずれか一方を起動させてもよい。また、判定部１０３は、音声の入力方向に基づいて、第三者Ｐ_２が位置する方向に合わせて、カメラ１２（及び／又はカメラ１３）の向きを変更してもよい。

判定部１０３は、画像取得部１０２により画像データが取得されると、画像取得部１０２により取得された画像データを取得するとともに、ストレージ９から音声データ９Ｘを取得する。判定部１０３は、ストレージ９から音声データ９Ｘを取得する場合、例えば、比較音声の周波数と一致しない音声データが記録された時点の前後１秒間に記録された音声データを取得する。判定部１０３は、音声データ９Ｘから取得した音声データ及び画像取得部１０２から取得した画像データを、端末取得音声及び端末取得画像として、通信ユニット６に送出する。

なお、判定部１０３は、ユーザ端末１のユーザである児童Ｐ_１の現在位置の情報やユーザ端末１を特定する端末情報などを、端末取得音声及び端末取得画像とともに情報処理装置２００に送信できる。判定部１０３は、ＧＰＳレシーバ１８により復調処理された処理後の信号に基づいて、ユーザ（児童Ｐ_１）の位置を算出し、算出した位置をユーザの現在位置として特定する。また、判定部１０３は、端末情報として、ストレージ９に記憶されている電話番号や個体識別番号などを取得できる。

報知部１０４は、通信ユニット６が情報処理装置２００から受信した指令信号に基づいて、報知処理を実行する。例えば、報知部１０４は、指令信号に基づく警告音をスピーカ１１から出力するとともに、警告音を出力中であることを示す画像をディスプレイ２Ａに表示する。

カメラ１２は、ユーザ端末１のフロントフェイスに面している物体を撮像するインカメラである。カメラ１３は、ユーザ端末１のバックフェイスに面している物体を撮像するアウトカメラである。カメラ１２及び／又はカメラ１３は、たとえば児童Ｐ_１の周囲に存在する第三者Ｐ_２の画像（顔画像）を撮像する。

コネクタ１４は、他の装置が接続される端子である。コネクタ１４は、ＵＳＢ（Universal Serial Bus）、ＨＤＭＩ（登録商標）（High-Difinition Multimedia Interface）、ＭＨＬ（Mobile High-Difinition Link）、ライトピーク（Light Peak）、サンダーボルト（登録商標）（Thunderbolt）、ＬＡＮコネクタ、イヤホンマイクコネクタのような汎用的な端子であってもよい。コネクタ１４は、Ｄｏｃｋコネクタのような専用に設計された端子でもよい。コネクタ１４に接続される装置は、例えば、飛行体、充電器、外部ストレージ、通信装置、及び情報処理装置を含むが、これらに限定されない。

加速度センサ１５は、ユーザ端末１に働く加速度の方向および大きさを検出する。加速度センサ１５の検出結果は、ユーザ端末１のユーザの歩数を検出するために利用することもできる。方位センサ１６は、地磁気の向きを検出する。ジャイロスコープ１７は、ユーザ端末１の角度および角速度を検出する。加速度センサ１５、方位センサ１６およびジャイロスコープ１７の検出結果は、ユーザ端末１の位置および姿勢の変化を検出するために、組み合わせて利用される。ＧＰＳレシーバ１８は、ＧＰＳ衛星５００からの所定の周波数帯の電波信号を受信できる。ＧＰＳレシーバ１８は、受信した電波信号の復調処理を行って、処理後の信号をコントローラ１０に送出する。

図３は、ユーザ端末１の構成の一例を示すものであり、本出願の要旨を損なわない範囲において適宜変更してよい。図３に例示するユーザ端末１は、カメラ１２およびカメラ１３を備えるが、たとえばインカメラ及びアウトカメラを切り換え可能な１つのカメラを備えてもよい。図３に例示するユーザ端末１は、ユーザ端末１の位置および姿勢を検出するために複数種類のセンサを備えるが、これらのうちいくつかのセンサを備えなくてもよい。あるいは、ユーザ端末１は、ユーザ端末１の位置および姿勢の少なくとも１つを検出するための他の種類のセンサを備えてもよい。

＜３−３．情報処理装置＞
図５は、実施形態に係る情報処理装置の構成例を示す図である。図５に示すように、情報処理装置２００は、通信部２１０と、記憶部２２０と、制御部２３０とを備える。

通信部２１０は、ネットワークＮＷに接続された他の装置との間で各種情報のやり取りを行うためのＮＩＣ（Network Interface Card）等のインターフェイスである。通信部２１０は、ユーザ端末１、保護者装置３００並びに警察管理装置４００との間で各種情報を送受信する情報通信を行うための通信プロトコルをサポートする。制御部２３０は、通信部２１０を介して、ユーザ端末１、保護者装置３００並びに警察管理装置４００との間でそれぞれ情報通信を行う。

記憶部２２０は、制御部２３０による各種処理等を実現するプログラム及びデータを記憶する。記憶部２４は、例えば、ＲＡＭ（Random Access Memory)、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部２２０は、制御部２３０の処理結果を一時的に記憶する作業領域としても利用され得る。

記憶部２２０は、図５に示すように、比較画像データ格納部２２１と、危険ワード格納部２２２と、危険度格納部２２３と、音声解析プログラム２２４と、画像解析プログラム２２５と、危険度判定プログラム２２６と、連絡先データベース２２７とを有する。

比較画像データ格納部２２１は、端末取得画像との比較を行うための画像データである。比較画像データ格納部２２１は、保護者Ｐ_３（図１参照）や親族などの児童Ｐ_１にとって安全な人物の顔画像の画像データを記憶する。

危険ワード格納部２２２は、危険ワードの情報を記憶する。危険ワードとは、児童の誘拐において犯罪者が用いる常套句などの情報に該当する。危険ワードは、過去の事件の情報などに基づいて設定できる。図６は、実施形態に係る危険ワード格納部２２２に格納される情報の概要を示す図である。危険ワードの情報の一例を示す図である。図６に示すように、危険ワード格納部２２２に記憶される危険ワードの情報は、危険ワードと、危険ワードの同義語とを対応付けて構成される。なお、図６は、危険ワードの情報の一例を示すものであり、図６に示す例には特に限定される必要はない。例えば、危険ワードの同義語は危険ワードに含めて、類義語などをさらに対応付けて、危険ワードの情報が構成されてもよい。

危険度格納部２２３は、後述する画像解析部２３２による解析結果として得られる年齢、性別、及び感情に対応付けられた危険度を記憶する。図７は、実施形態に係る危険度格納部２２３に記憶される情報の概要を示す図である。危険度格納部２２３に記憶される危険度は、過去の事件の情報に基づく犯罪者の傾向などに基づいて設定できる。例えば、図７では、例えば、性別の比較では、男性の危険度が高くなり、また、性別に関係なく、年齢層が高めで、感情が「ネガティブ」である場合の危険度が高くなる例を示している。なお、図７は、危険度の一例を示すものであり、図７に示す例には特に限定される必要はない。例えば、図７に示す年齢設定は、図７に示す範囲で設定される必要はなく、５歳刻みや１０歳刻みなどの任意の範囲で設定されてもよい。また、感情の分類として、ポジティブ（好意的、肯定的な感情）、ニュートラル（中立の感情）、ネガティブ（悲観的、否定的な感情）の３つに分類するが、ポジティブに対応する危険度の評価が不要の場合（例えば、犯罪の傾向からポジティブに対応する危険度がほとんど存在しない場合）、ニュートラルとネガティブの２つに分類してもよい。

音声解析プログラム２２４は、後述する音声解析部２３１の処理を実現するための機能を提供する。例えば、音声解析プログラム２２４は、入力された音声データ（端末取得音声データ）を解析して、テキストデータに変換し、当該端末取得音声データに対応するテキストデータを形態素に分割する機能を提供する。

画像解析プログラム２２５は、後述する画像解析部２３２の処理を実現するための機能を提供する。例えば、画像解析プログラム２２５は、入力された画像データ（端末取得画像データ）を解析して、画像データに映し出された人物の年齢、性別、及び感情（精神状態）を取得し、年齢、性別及び感情の情報を出力する機能を提供する。

危険度判定プログラム２２６は、後述する危険度判定部２３３の処理を実現するための機能を提供する。例えば、危険度判定プログラム２２６は、音声解析による危険ワードとの一致率、並びに、画像解析による年齢、性別、及び感情に対応付けられた危険度に基づいて、ユーザ端末１のユーザ（例えば、児童Ｐ_１）が犯罪に巻き込まれる可能性が高いか否かを示す危険度を導出するための機能を提供できる。

連絡先データベース２２７は、ユーザ端末１のユーザ（例えば、児童Ｐ_１）の状況を通知する際の連絡先の情報で構成される。例えば、連絡先の情報として、児童Ｐ_１の保護者Ｐ_３が使用する保護者装置３００（図１等参照）の電話番号やメールアドレスなどが該当する。

制御部２３０は、情報処理装置２００の各部を制御するコントローラである。制御部２３０は、たとえばＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）等のプロセッサ（演算処理装置）によって実現される。例えば、制御部２３０は、情報処理装置２００内部の記憶装置に記憶されている各種プログラムを、プロセッサがＲＡＭを作業領域として実行されることにより実現される。なお、制御部２３０は、たとえばＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。ＣＰＵ、ＭＰＵ、ＡＳＩＣ、及びＦＰＧＡは何れもコントローラとみなすことができる。

制御部２３０は、図５に示すように、音声解析部２３１と、画像解析部２３２と、危険度判定部２３３と、連絡処理部２３４とを有する。制御部２３０が有する各ブロック、すなわち、音声解析部２３１、画像解析部２３２、危険度判定部２３３、及び連絡処理部２３４はそれぞれ制御部２３０により実現される機能を示す機能ブロックである。これら機能ブロックはソフトウェアブロックであってもよいし、ハードウェアブロックであってもよい。例えば、上述の機能ブロックが、それぞれ、ソフトウェア（マイクロプログラムを含む。）で実現される１つのソフトウェアモジュールであってもよいし、半導体チップ（ダイ）上の１つの回路ブロックであってもよい。勿論、各機能ブロックがそれぞれ１つのプロセッサ又は１つの集積回路であってもよい。機能ブロックの構成方法及び構成単位は任意である。

音声解析部２３１は、ユーザ端末１から受信した音声データ（端末取得音声データ）を解析する。具体的には、音声解析部２３１は、入力された音声データ（端末取得音声データ）を解析して、テキストデータに変換し、当該端末取得音声データに対応するテキストデータを形態素に分割する。音声解析部２３１は、解析結果を危険度判定部２３３に出力する。音声解析部２３１は、形態素のうち、危険ワードとの比較を行うことが可能な所定の品詞（名詞や動詞など）に対応する形態素を出力してもよい。音声解析部２３１は、例えば、プロセッサが音声解析プログラム２２４を実行することにより実現される。

画像解析部２３２は、ユーザ端末１から受信した画像データ（端末取得画像データ）を解析する。具体的には、画像解析部２３２は、入力された画像データ（端末取得画像データ）を解析して、画像データに映し出された人物の年齢、性別、及び感情（精神状態）を取得する。画像解析部２３２は、解析結果を危険度判定部２３３に出力する。画像解析部２３２は、例えば、プロセッサが画像解析プログラム２２５を実行することにより実現される。

危険度判定部２３３は、音声解析部２３１による音声解析による危険ワードとの一致率、並びに、画像解析部２３２による画像解析による年齢、性別、及び感情に対応付けられた危険度に基づいて、ユーザ端末１のユーザ（例えば、児童Ｐ_１）が犯罪に巻き込まれる可能性が高いか否かを示す危険度を導出する。

具体的には、危険度判定部２３３は、比較画像データ格納部２２１に記憶されている比較画像データを取得し、ユーザ端末１から受信した画像（端末取得画像）と比較画像とが一致するか否かを判定する。一致するか否かは、端末取得画像と、比較画像との一致率が９５％を超えるか否かで判定する。危険度判定部２３３は、ユーザ端末１から受信した画像（端末取得画像）と比較画像とが一致しないと判定した場合、危険ワード格納部２２２に記憶される危険ワードの情報を参照して、音声解析部２３１から取得した音声解析結果に含まれる形態素と危険ワードとの一致率を算出する。図８は、実施形態に係る危険ワードの一致率の一例を示す図である。図８に示すように、例えば、危険度判定部２３３は、音声解析部２３１から取得した音声解析結果に含まれる形態素の全てが危険ワードに該当する場合、一致率を１００％と算出する。また、危険度判定部２３３は、音声解析部２３１から取得した音声解析結果に含まれる形態素の半数が危険ワードに該当する場合、一致率を５０％と算出する。また、危険度判定部２３３は、音声解析部２３１から取得した音声解析結果に含まれる形態素の４分の１が危険ワードに該当する場合、一致率を２５％と算出する。そして、危険度判定部２３３は、危険ワードとの一致率を所定の閾値と比較し、所定の閾値を超える場合、危険ワードとの一致率を音声解析結果に基づく危険度として導出する。

また、危険度判定部２３３は、危険度格納部２２３に記憶されている危険度の情報に基づいて、画像解析部２３２による画像解析結果に対応する危険度を取得する。例えば、危険度判定部２３３は、画像解析部２３２から画像解析結果として取得した年齢、性別、感情が、「１８歳、女性、ポジティブ」である場合、画像解析結果に対応する危険度として「０％」を取得する。そして、危険度判定部２３３は、危険度格納部２２３に記憶されている危険度の情報に基づいて取得した画像解析結果に対応する危険度を所定の閾値と比較し、所定の閾値を超える場合、取得した危険度を画像解析結果に基づく危険度として導出する。

危険度判定部２３３は、音声解析結果に基づく危険度と画像解析結果に基づく危険度を統合し、最終的な危険度を決定する。例えば、音声解析結果に基づく危険度が「２５％」で、画像解析結果に基づく危険度が「０％」である場合、危険度判定部２３３は、最終的な危険度を「２５％」に決定する。

危険度判定部２３３は、決定した危険度に応じて、ユーザ端末１（児童Ｐ_１）、保護者装置３００（保護者Ｐ_３）、及び警察管理装置４００（警察署ＰＳ）のうちの少なくともいずれかに対して実施する処理を決定する。例えば、情報処理装置２００は、第三者Ｐ_２の危険度が７５％を超える場合、警察管理装置４００に対して、例えば、緊急出動を要請するメッセージを送信することを決定する。このメッセージには、ユーザ端末１から受信した音声データ及び画像データの他、ユーザ端末１の現在位置の情報やユーザ端末１を特定する端末情報を含めることができる。さらに、危険度判定部２３３は、保護者装置３００に対して、児童Ｐ_１の現在の状況（危険）を通知するためのメッセージを送信することを決定する。さらに、危険度判定部２３３は、ユーザ端末１に対して、警告音を出力させるための指令信号をユーザ端末１に送信することを決定する。

連絡処理部２３４は、危険度判定部２３３の決定に従って、ユーザ端末１、保護者装置３００及び警察管理装置４００に対する連絡処理を実行する。

＜＜４．処理手順例＞＞
図９〜図１１を用いて、実施形態に係る情報処理システムの処理手順例について説明する。図９〜図１１は、実施形態に係る情報処理システムの処理手順の一例を示す図である。

＜４−１．システム全体の処理＞
まず、図９を用いて、情報処理システムＳＹＳの全体の処理の流れを説明する。図９に示すように、ユーザ端末１は、入力音声を取得し（ステップＳ１０１）、取得した音声データをストレージ９に格納する。ユーザ端末１は、入力音声の周波数と、比較音声（予め登録された保護者Ｐ_３（図１参照）等の音声）の周波数が一致するか否かを判定する（ステップＳ１０２）。一致するか否かは、入力音声の周波数が、比較音声の周波数の±５％の範囲内にあるか否かで判定する。

ユーザ端末１は、入力音声の周波数と、比較音声の周波数が一致すると判定した場合（ステップＳ１０２；Ｙｅｓ）、上記ステップＳ１０１の手順に戻る。このとき、ユーザ端末１は、入力音声の音声データをそのまま破棄してもよいし、一旦ストレージ９に記録して、事後的に破棄してもよい。

一方、ユーザ端末１は、入力音声の周波数と、比較音声の周波数が一致しないと判定した場合（ステップＳ１０２；Ｎｏ）、カメラ１２（及び／又はカメラ１３）を起動し、画像データを取得する（ステップＳ１０３）。

画像データの取得後、ユーザ端末１は、所定の音声データ及び画像データを情報処理装置２００に送信する（ステップＳ１０４）。ここで、ユーザ端末１は、所定の音声データとして、例えば、ストレージ９に格納した音声データの中から、比較音声の周波数と一致しない音声データが記録された時点の前後１秒間に記録された音声データを取得する。また、ユーザ端末１は、音声データ及び画像データとともに、ユーザ端末１の現在位置を示す位置情報及びユーザ端末１を特定するための端末情報を送信できる。

情報処理装置２００は、ユーザ端末１から音声データ及び画像データを受信すると、音声解析処理、及び画像解析処理をそれぞれ実施する（ステップＳ１０５，Ｓ１０６）。

情報処理装置２００は、音声解析結果及び画像解析結果に基づく危険度判定処理（図１０，１１参照）を実行して危険度を導出する（ステップＳ１０７）。そして、情報処理装置２００は、導出した危険度が７５％以下であるか否かを判定する（ステップＳ１０８）。

情報処理装置２００は、危険度が７５％以下ではないと判定した場合（ステップＳ１０８；Ｎｏ）、すなわち、危険度が７５％を超える場合、緊急出動を要請するメッセージを所轄の警察署ＰＳが管理する警察管理装置４００へ送信する（ステップＳ１０９）。

続いて、情報処理装置２００は、保護者（例えば、保護者Ｐ_３）が所有する保護者装置３００へ、ユーザ端末１のユーザである児童（例えば、児童Ｐ_１）の危険を通知するメッセージを送信する（ステップＳ１１０）。

続いて、情報処理装置２００は、警告音の出力を指令する指令信号をユーザ端末１に送信して（ステップＳ１１１）、図９に示す情報処理装置２００の処理を終了する。

上記ステップＳ１０８において、情報処理装置２００は、危険度が７５％以下であると判定した場合（ステップＳ１０８；Ｙｅｓ）、危険度が５０％以下であるか否かを判定する（ステップＳ１１２）。

情報処理装置２００は、危険度が５０％以下ではないと判定した場合（ステップＳ１１１２；Ｎｏ）、すなわち、危険度が５１％〜７５％の範囲にある場合、上記ステップＳ１１０及びステップＳ１１１の処理手順を実行する。すなわち、情報処理装置２００は、保護者装置３００へのメッセージ送信、及びユーザ端末１に警告音を出力させる指令信号の送信を実施して、図９に示す情報処理装置２００の処理を終了する。

一方、情報処理装置２００は、上記ステップＳ１１２において、危険度が５０％以下であると判定した場合（ステップＳ１１２；Ｙｅｓ）、危険度が３０％以下であるか否かを判定する（ステップＳ１１３）。

情報処理装置２００は、危険度が３０％以下ではないと判定した場合（ステップＳ１１３；Ｎｏ）、すなわち、危険度が３１％〜５０％の範囲にある場合、上記ステップＳ１１１の処理手順を実行する。すなわち、情報処理装置２００は、ユーザ端末１に警告音を出力させる指令信号の送信を実施して、図９に示す情報処理装置２００の処理を終了する。

一方、情報処理装置２００は、上記ステップＳ１１３において、危険度が３０％以下であると判定した場合（ステップＳ１１３；Ｙｅｓ）、ユーザ端末１から受信した音声データ及び画像データを消去し（ステップＳ１１４）、図９に示す情報処理装置２００の処理を終了する。なお、情報処理装置２００は、図１０を用いて後述する音声解析結果による危険度判定処理において音声データが消去されていれば、ステップＳ１１４における音声データ消去の手順を省略する。また、情報処理装置２００は、図１１を用いて後述する画像解析結果による危険度判定処理において画像データが消去されていれば、ステップＳ１１４における画像データ消去の手順を省略する。

ユーザ端末１は、情報処理装置２００から警告音の出力を指令する指令信号を受信すると（ステップＳ１１５）、スピーカ１１から警告音を出力する（ステップＳ１１６）。

そして、ユーザ端末１は、警告音を出力中であることを示す画像をディスプレイ２Ａに表示させて（ステップＳ１１７）、図９に示すユーザ端末１の処理を終了する。

上記図９に示す処理手順において、ステップＳ１０５の音声解析処理及びステップＳ１０６の画像解析処理は、どちらの処理が先に行われてもよい。

＜４−２．音声による危険度判定処理＞
図１０を用いて、情報処理装置２００による音声解析結果に基づく危険度判定処理の流れを説明する。図１０に示すように、危険度判定部２３３は、音声解析部２３１による音声解析結果を取得する（ステップＳ２０１）。

続いて、危険度判定部２３３は、音声解析結果と危険ワードとの一致率を算出する（ステップＳ２０２）。

そして、危険度判定部２３３は、ステップＳ２０２で算出した一致率が１０％以下であるか否かを判定する（ステップＳ２０３）。

危険度判定部２３３は、ステップＳ２０２で算出した一致率が１０％以下であると判定した場合（ステップＳ２０３；Ｙｅｓ）、ユーザ端末１から受信し、ストレージ９に格納した音声データ（端末取得音声データ）を消去し（ステップＳ２０４）、図１０に示す音声解析結果に基づく危険度判定処理を終了する。

一方、危険度判定部２３３は、ステップＳ２０２で算出した一致率が１０％以下ではないと判定した場合（ステップＳ２０３；Ｎｏ）、一致率を危険度として出力して（ステップＳ２０５）、図１０に示す音声解析結果に基づく危険度判定処理を終了する。

＜４−３．画像による危険度判定処理＞
図１１を用いて、情報処理装置２００による画像解析結果に基づく危険度判定処理の流れを説明する。図１１に示すように、危険度判定部２３３は、ユーザ端末１から受信した画像である端末取得画像と、比較画像データ格納部２２１に予め登録されている比較画像とが一致するか否かを判定する（ステップＳ３０１）。

危険度判定部２３３は、端末取得画像と比較画像とが一致しないと判定した場合（ステップＳ３０１；Ｎｏ）、画像解析結果に基づく危険度を危険度格納部２２３から取得する（ステップＳ３０２）。

危険度判定部２３３は、ステップＳ３０２で取得した危険度が１０％以下であるか否かを判定する（ステップＳ３０３）。

危険度判定部２３３は、ステップＳ３０２で取得した危険度が１０％以下であると判定した場合（ステップＳ３０３；Ｙｅｓ）、ユーザ端末１から受信し、ストレージ９に格納した画像データ（端末取得画像データ）を消去し（ステップＳ３０４）、図１１に示す画像解析結果に基づく危険度判定処理を終了する。

一方、危険度判定部２３３は、危険度が１０％以下ではないと判定した場合（ステップＳ３０３；Ｎｏ）、ステップＳ３０２で取得した危険度を出力して（ステップＳ３０５）、図１１に示す画像解析結果に基づく危険度判定処理を終了する。

図１０を用いて上述した音声解析結果に基づく危険度判定処理、及び図１１を用いて上述した音声解析結果に基づく危険度判定処理は、統合して実施されてもよい。すなわち、危険度判定部２３３は、音声解析結果に基づく危険度が１０％を超える場合に、一致率を危険度として出力するとともに、図１１に示す画像解析結果に基づく危険度判定処理を実行するようにしてもよい。

上述してきたように、実施形態に係る情報処理システムＳＹＳにおいて、情報処理装置２００は、客観的かつ論理的な判断が難しいユーザ端末１のユーザ（例えば、児童Ｐ_１）に代わって、ユーザ（児童Ｐ_１）の現在の状況の危険度を判定する。そして、情報処理装置２００は、判定した危険度に応じて、ユーザ（児童Ｐ_１）の現在の状況を所定の連絡先（例えば、保護者Ｐ_３）に通達するとともに、捜査機関である警察署ＰＳへの通報を実施する。そして、情報処理装置２００は、警察署ＰＳへの通報に際して、ユーザ端末１において取得された音声データ及び画像データを送信する。これにより、情報処理装置２００は、ユーザ端末１からの音声及び画像に基づいて、音声解析処理及び画像解析処理を行い、ユーザ端末１のユーザに危険度として判定できる。このため、実施形態に係る情報処理システムＳＹＳによれば、例えば児童Ｐ_１の危険を保護者Ｐ_３に把握させることができ、また、児童Ｐ_１が犯罪に巻き込まれた際に事件解決に必要となる情報を捜査機関となる警察署ＰＳに提供できる。これにより、捜査機関は、犯罪行為に対する迅速な行動が可能となる。

また、情報処理装置２００が警察署ＰＳへの通報に際して同封する音声データ及び画像データは、犯罪立証のための情報となり得る。このため、実施形態に係る情報処理システムＳＹＳが広く社会的に認知されることにより、児童誘拐等の犯罪行為の抑止力となり得る。この結果、犯罪行為に巻き込まれる児童等の撲滅を図ることができる。

＜＜５．変形例＞＞

上記実施形態において、危険度判定部２３３による画像解析結果に基づく危険度判定処理は、端末取得画像データを解析して得られる周辺環境の情報をさらに加味して、危険度を導出してもよい。例えば、周辺環境がユーザ端末１のユーザである児童Ｐ_１の通常の行動範囲から逸脱している場合、危険度が大きくなるように、危険度格納部２２３から取得した画像解析結果に対応する危険度に重み付けを行ってもよい。このような処理は、画像解析プログラム２２５に対して、画像データの周辺環境を解析し、周辺環境を示す情報を出力する機能を追加することにより実現できる。

また、上記実施形態において、危険度判定部２３３による画像解析結果に基づく危険度判定処理は、端末取得画像データを解析して得られる画像のぶれ具合をさらに加味して、危険度を導出してもよい。例えば、画像のぶれ具合が、予め定められる閾値を超える場合、すなわち通常の使用状態にないと判断できる場合に、危険度が大きくなるように、危険度格納部２２３から取得した画像解析結果に対応する危険度に重み付けを行ってもよい。このような処理は、画像解析プログラム２２５に対して、画像のぶれを解析し、画像のぶれ具体を出力する機能を追加することにより実現できる。

また、上記実施形態において、情報処理装置２００において実行される音声解析結果及び画像解析結果に基づく危険度判定処理は、音声解析結果に基づく危険度判定処理又は画像解析結果に基づく危険度判定処理のいずれかが実施されてもよい。

例えば、情報処理装置２００が、音声解析結果に基づく危険度判定処理のみを実施する場合、音声解析結果に基づく危険度が閾値を超える場合、保護者装置３００及び警察管理装置４００へのメッセージの送信、ユーザ端末１への警告音の出力を指令する指令信号の送信を実施できる。

また、例えば、情報処理装置２００が、画像解析結果に基づく危険度判定処理のみを実施する場合、画像解析結果に対応する危険度が閾値を超える場合、保護者装置３００及び警察管理装置４００へのメッセージの送信、ユーザ端末１への警告音の出力を指令する指令信号の送信を実施できる。

また、上記の実施形態において、保護者等の音声（周波数）は、保護者の年齢とともに変化することが考えらえる。そこで、例えば、比較音声データ９Ｚとしてユーザ端末１のユーザ（例えば、児童Ｐ_１）の保護者の音声（周波数）が予め登録されている場合、ユーザ端末１は、保護者の音声を保護者の年齢に応じた音声の変化を予測し、予測結果に基づく音声を入力音声との比較に用いてもよい。年齢に応じた音声の変化予測は、例えば、機械学習によって、人間の音声の変化と年齢との関連性を学習し、年齢に応じた音声の変化を予測する学習済みモデルにより実行されてもよいし、予め獲得されたパラメータによる音声の加工により実行されてもよい。

また、上記の実施形態において、保護者等の顔画像についても、保護者の年齢とともに変化することが考えらえる。そこで、例えば、比較画像データ格納部２２１に、ユーザ端末１のユーザ（例えば、児童Ｐ_１）の保護者の顔画像が予め登録されている場合、情報処理装置２００は、保護者の音声を保護者の年齢に応じた顔画像の変化を予測し、予測結果に基づく顔画像を端末取得画像との比較に用いてもよい。年齢に応じた顔画像の変化予測は、例えば、機械学習によって、人間の顔画像の変化と年齢との関連性を学習し、年齢に応じた顔画像の変化を予測する学習済みモデルにより実行されてもよいし、予め獲得されたパラメータによる顔画像の加工により実行されてもよい。

また、情報処理装置２００において実行される音声解析結果及び画像解析結果に基づく危険度判定処理は、音声解析結果及び画像解析結果に基づく危険度判定処理のいずれか一方または双方が、ユーザ端末１において実施されてもよい。

例えば、ユーザ端末１において音声解析結果及び画像解析結果に基づく危険度判定処理を実施する場合、ユーザ端末１として機能する電子機器が、前記電子機器の周囲の音声を入力可能に配置された音声入力部と、前記電子機器の周囲の画像を撮像可能に配置された撮像部と、前記音声入力部により入力された入力音声を取得する音声取得部と、前記撮像部により撮像された画像を取得する画像取得部と、前記入力音声との比較を行うための比較音声の情報を予め記憶する音声記憶部と、前記画像との比較を行うための比較画像の情報を予め記憶する画像記憶部と、危険ワードの情報を記憶する危険ワード格納部と、年齢、性別、及び感情に対応付けられた危険度を記憶する危険度格納部と、前記音声取得部により取得された入力音声のデータを解析し、当該入力音声のデータに対応するテキストデータを形態素に分類して取得する音声解析部と、前記画像取得部により取得された画像のデータを解析し、当該画像に映し出された人物の年齢、性別、及び感情を取得する画像解析部と、前記音声取得部により取得された入力音声の周波数と前記比較音声の周波数とが一致するか否かを判定する音声判定部と、前記画像取得部により取得された画像と、前記画像記憶部に記憶されている前記比較画像とが一致するか否かを判定する画像判定部と、前記音声判定部により前記入力音声の周波数と前記比較音声の周波数とが一致しないと判定された場合、及び／又は前記画像取得部により取得された画像と、前記画像記憶部に記憶されている前記比較画像とが一致しないと判定された場合、前記音声解析部により取得された形態素と前記危険ワードとの一致率、並びに、前記画像解析部により取得された前記年齢、性別、及び感情に対応付けられた危険度に基づいて、前記電子機器のユーザが犯罪に巻き込まれる可能性が高いか否かを示す危険度を導出する危険度判定部とを備えればよい。

音声入力部は、ユーザ端末１が備えるマイク８により実現できる。撮像部は、ユーザ端末１が備えるカメラ１２，１３により実現できる。音声記憶部並びに画像記憶部は、ユーザ端末１が備えるストレージ９により実現できる。音声取得部、画像取得部、音声解析部、画像解析部、判定部、並びに危険度判定部は、ユーザ端末１が備えるコントローラ１０により実現できる。例えば、コントローラ１０が備えるプロセッサが、音声取得部、音声解析部、画像解析部、判定部、並びに危険度判定部の処理機能を実現するためのプログラムを実行することにより実現できる。

また、例えば、ユーザ端末１において音声解析結果に基づく危険度判定処理を実施する場合、ユーザ端末１として機能する電子機器が、上記音声入力部と、上記音声取得部と、上記音声記憶部と、上記危険ワード格納部と、上記音声解析部と、上記音声判定部と、上記危険度判定部とを備えればよい。なお、この場合、上記危険度判定部は、前記音声解析部により取得された形態素と前記危険ワードとの一致率と危険度として導出する。

また、例えば、ユーザ端末１において画像解析結果に基づく危険度判定処理を実施する場合、ユーザ端末１として機能する電子機器が、上記撮像部と、上記画像取得部と、上記画像記憶部と、上記危険度格納部と、上記画像判定部と、上記危険度判定部とを備えればよい。なお、この場合、上記危険度判定部は、画像解析部により取得された前記年齢、性別、及び感情に対応付けられた危険度を危険度格納部から取得し、導出する。

＜＜６．その他＞＞
実施形態に係る情報処理装置２００は、専用のコンピュータシステムで実現してもよいし、汎用のコンピュータシステムで実現してもよい。

情報処理装置２００において実行されるプログラムを、インターネット等のネットワーク上のサーバ装置が備えるディスク装置に格納しておき、情報処理装置２００がダウンロード等できるようにしてもよい。また、情報処理装置２００が実行する上述の処理機能を、ＯＳ（Operating System）とアプリケーションソフトとの協働により実現してもよい。この場合には、ＯＳ以外の部分を媒体に格納して配布してもよいし、ＯＳ以外の部分をサーバ装置に格納しておき、情報処理装置２００がダウンロード等できるようにしてもよい。

また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。

また、上記してきた実施形態は、処理内容を矛盾させない領域で適宜組み合わせることが可能である。また、実施形態に係る処理手順を示す各図に示された各ステップは、適宜順序を変更することが可能である。

以上、本開示の各実施形態について説明したが、本開示の技術的範囲は、上述の各実施形態そのままに限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、異なる実施形態及び変形例にわたる構成要素を適宜組み合わせてもよい。

また、本明細書に記載された各実施形態における効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。

１ユーザ端末
２タッチスクリーンディスプレイ
２Ａディスプレイ
２Ｂタッチスクリーン
３ボタン
４照度センサ
５近接センサ
６通信ユニット
７レシーバ
８マイク
９ストレージ
９Ａ制御プログラム
９Ｂ防犯アプリケーション
９Ｘ音声データ
９Ｙ画像データ
９Ｚ比較音声データ
１０コントローラ
１１スピーカ
１２，１３カメラ
１４コネクタ
１５加速度センサ
１６方位センサ
１７ジャイロスコープ
１８ＧＰＳレシーバ
２００情報処理装置
２１０通信部
２２０記憶部
２２１比較画像データ格納部
２２２危険ワード格納部
２２３危険度格納部
２２４音声解析プログラム
２２５画像解析プログラム
２２６危険度判定プログラム
２２７連絡先データベース
２３０制御部
２３１音声解析部
２３２画像解析部
２３３危険度判定部
２３４連絡処理部
３００保護者装置
４００警察管理装置

Claims

ユーザ端末と、前記ユーザ端末により取得されたデータを処理する情報処理装置と含む情報処理システムであって、
前記ユーザ端末は、
前記情報処理装置との間で各種情報を送受信する通信部と、
前記ユーザ端末の周囲の音声を入力可能に配置された音声入力部と、
前記ユーザ端末の周囲の画像を撮像可能に配置された撮像部と、
前記音声入力部により入力された入力音声を取得する音声取得部と、
前記撮像部により撮像された画像を取得する画像取得部と、
前記入力音声との比較を行うための比較音声の情報を予め記憶する記憶部と、
前記入力音声の周波数と前記比較音声の周波数とが一致するか否かを判定し、前記入力音声の周波数と前記比較音声の周波数とが一致しないと判定した場合、前記通信部を介して、前記入力音声の音声データ及び前記画像取得部により取得された画像の画像データを、それぞれ端末取得音声データ及び端末取得画像データとして前記情報処理装置に送信する判定部と
を備え、
前記情報処理装置は、
前記ユーザ端末から前記端末取得音声データ及び前記端末取得画像データを受信する通信部と、
前記端末取得画像データとの比較を行うための比較画像データを記憶する比較画像データ格納部と、
危険ワードの情報を記憶する危険ワード格納部と、
年齢、性別、及び感情に対応付けられた危険度を記憶する危険度格納部と、
前記端末取得音声データを解析し、当該端末取得音声データに対応するテキストデータを形態素に分割して取得する音声解析部と、
前記端末取得画像データを解析し、端末取得画像に映し出された人物の年齢、性別、及び感情を取得する画像解析部と、
前記端末取得画像データと前記比較画像データとが一致しない場合、前記音声解析部により取得された形態素と前記危険ワードとの一致率、並びに、前記画像解析部により取得された年齢、性別、及び感情に対応付けられた危険度に基づいて、前記ユーザ端末のユーザである児童が犯罪に巻き込まれる可能性が高いか否かを示す危険度を導出する危険度判定部と
を備える情報処理システム。
前記危険度判定部は、
前記危険度が予め定められる閾値を超えると判定した場合、前記通信部を介して、警告音の出力を指令する所定の信号を前記ユーザ端末に送信する
請求項１に記載の情報処理システム。
所定の連絡先を予め登録する連絡先データベースをさらに備え、
前記危険度判定部は、
前記危険度が予め定められる閾値を超えると判定した場合、前記通信部を介して、前記連絡先データベースに登録された連絡先に対して、前記ユーザ端末のユーザである児童の状況を示す通知を送信する
請求項２に記載の情報処理システム。
前記ユーザ端末は、
前記所定の信号の受信に応じて、警報音を出力する音出力部と、
前記所定の信号の受信に応じて、警報音を出力中であることを示す画像を表示する表示部と
をさらに備える請求項２または３に記載の情報処理システム。
音声及び画像に基づく処理を実行する電子機器であって、
前記電子機器の周囲の音声を入力可能に配置された音声入力部と、
前記電子機器の周囲の画像を撮像可能に配置された撮像部と、
前記音声入力部により入力された入力音声を取得する音声取得部と、
前記撮像部により撮像された画像を取得する画像取得部と、
前記入力音声との比較を行うための比較音声の情報を予め記憶する音声記憶部と、
前記画像との比較を行うための比較画像の情報を予め記憶する画像記憶部と、
危険ワードの情報を記憶する危険ワード格納部と、
年齢、性別、及び感情に対応付けられた危険度を記憶する危険度格納部と、
前記音声取得部により取得された入力音声のデータを解析し、当該入力音声のデータに対応するテキストデータを形態素に分類して取得する音声解析部と、
前記画像取得部により取得された画像のデータを解析し、当該画像に映し出された人物の年齢、性別、及び感情を取得する画像解析部と、
前記音声取得部により取得された入力音声の周波数と前記比較音声の周波数とが一致するか否かを判定する音声判定部と、
前記画像取得部により取得された画像と、前記画像記憶部に記憶されている前記比較画像とが一致するか否かを判定する画像判定部と、
前記音声判定部により前記入力音声の周波数と前記比較音声の周波数とが一致しないと判定された場合、及び／又は前記画像取得部により取得された画像と、前記画像記憶部に記憶されている前記比較画像とが一致しないと判定された場合、前記音声解析部により取得された形態素と前記危険ワードとの一致率、並びに、前記画像解析部により取得された前記年齢、性別、及び感情に対応付けられた危険度に基づいて、前記電子機器のユーザが犯罪に巻き込まれる可能性が高いか否かを示す危険度を導出する危険度判定部と
を備える電子機器。