JPWO2018155052A1 - 情報処理装置、情報処理方法および情報処理システム - Google Patents

情報処理装置、情報処理方法および情報処理システム Download PDF

Info

Publication number
JPWO2018155052A1
JPWO2018155052A1 JP2019501133A JP2019501133A JPWO2018155052A1 JP WO2018155052 A1 JPWO2018155052 A1 JP WO2018155052A1 JP 2019501133 A JP2019501133 A JP 2019501133A JP 2019501133 A JP2019501133 A JP 2019501133A JP WO2018155052 A1 JPWO2018155052 A1 JP WO2018155052A1
Authority
JP
Japan
Prior art keywords
information
user
voice
control unit
communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019501133A
Other languages
English (en)
Other versions
JP6786700B2 (ja
Inventor
知史 藤田
知史 藤田
裕昭 足立
裕昭 足立
洋二 廣瀬
洋二 廣瀬
文彬 徳久
文彬 徳久
龍 青山
龍 青山
泉 八木
泉 八木
明寛 石田
明寛 石田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Mobile Communications Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Mobile Communications Inc filed Critical Sony Mobile Communications Inc
Publication of JPWO2018155052A1 publication Critical patent/JPWO2018155052A1/ja
Application granted granted Critical
Publication of JP6786700B2 publication Critical patent/JP6786700B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/16Communication-related supplementary services, e.g. call-transfer or call-hold
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】ユーザ端末に関する環境情報に基づいて代理発話処理を制御する。【解決手段】ユーザ端末から取得した前記ユーザ端末に関する環境情報に基づいて音声通話処理における代理発話処理を制御する通話制御部を備える、情報処理装置が提供される。また、プロセッサが、ユーザ端末から前記ユーザ端末に関する環境情報を取得することと、取得した前記環境情報に基づいて音声通話処理における代理発話処理を制御することとを含む情報処理方法が提供される。また、ユーザ端末であって、前記ユーザ端末に関する環境情報を取得可能なユーザ端末と、前記ユーザ端末から取得した前記ユーザ端末に関する環境情報に基づいて音声通話処理における代理発話処理を制御する通話制御部を備えるサーバと、を有する情報処理システムが提供される。【選択図】図3

Description

本開示は、情報処理装置、情報処理方法および情報処理システムに関する。
近年、ユーザ間の通話のみならず、複数のユーザを含むグループにおける通話に関する技術が開発されている。このグループにおける通話を開始するにあたり、ユーザは通話対象とするユーザやグループを選択することが求められる
例えば、特許文献1には、ユーザが携帯電話のPTT(プッシュ・ツー・トーク)キーを押し続け、通話対象のユーザまたはグループの名前を話すことにより、通話対象を選択することができる技術について開示されている。
特開2012−16040号公報
しかし、上記特許文献1に開示された技術では、ユーザが携帯電話を操作してグループに加入させる他のユーザを選択し、当該グループを作成および編集することが求められる。そのため、このような携帯電話等のユーザ端末のグルーピングにおいて、ユーザに課せられる手続による負担が大きかった。
本開示では、ユーザ端末に関する環境情報に基づいて代理発話処理を制御することが可能な、新規かつ改良された情報処理装置、情報処理方法および情報処理システムを提案する。
本開示によれば、ユーザ端末から取得した前記ユーザ端末に関する環境情報に基づいて音声通話処理における代理発話処理を制御する通話制御部を備える、情報処理装置が提供される。
また、本開示によれば、プロセッサが、ユーザ端末から前記ユーザ端末に関する環境情報を取得することと、取得した前記環境情報に基づいて音声通話処理における代理発話処理を制御することとを含む情報処理方法が提供される。
また、本開示によれば、ユーザ端末であって、前記ユーザ端末に関する環境情報を取得可能なユーザ端末と、前記ユーザ端末から取得した前記ユーザ端末に関する環境情報に基づいて音声通話処理における代理発話処理を制御する通話制御部を備えるサーバと、を有する情報処理システムが提供される。
以上説明したように本開示によれば、ユーザ端末に関する環境情報に基づいて代理発話処理を制御することが可能である。
なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。
本開示の一実施形態に係る情報処理システムの概要を説明するための図である。 本開示の一実施形態に係る情報処理システムの概略構成を示す図である。 本開示の第1の実施形態に係る情報処理システムの構成を示すブロック図である。 同実施形態に係るサーバの処理の流れの一例を示すフローチャートである。 ジェスチャに基づくグルーピング処理の第1の例を示す概要図である。 ジェスチャに基づくグルーピング処理の第2の例を示す概要図である。 同実施形態に係るグルーピング処理部によるコンテキストに関する情報に基づくグルーピング処理の一例を示す概要図である。 同実施形態に係るサーバの処理の流れの他の例を示すフローチャートである。 本開示の第2の実施形態に係る音声通信の開始に係る処理の流れの一例を示すフローチャートである。 同実施形態に係る音声情報に含まれる内容の解析結果に基づく音声通信の開始に係る処理の一例を示す概要図である。 同実施形態に係るユーザの向きに基づく通話対象の選択処理の第1の例を示す概要図である。 同実施形態に係るユーザの向きに基づく通話対象の選択処理の第2の例を示す概要図である。 同実施形態に係る生体情報に基づく通話対象の選択処理の一例を示す概要図である。 同実施形態に係る他のデバイスから得られるセンサ情報に基づく通話対象の選択処理の一例を示す概要図である。 同実施形態に係るユーザの頭の動きに基づく代理発話処理の第1の例を示す概要図である。 同実施形態に係るユーザの頭の動きに基づく代理発話処理の第2の例を示す概要図である。 同実施形態に係るコンテキストに関する情報に基づく代理発話処理の一例を示す概要図である。 本開示の第3の実施形態に係る情報処理システムの構成を示すブロック図である。 本開示の第4の実施形態に係るアシスタント機能の一例を説明するための概要図である。 同実施形態に係るアシスタント機能の他の例を説明するための概要図である。 本開示の第5の実施形態に係る遅延抑制機能を説明するための模式図である。 本開示に係る情報処理装置のハードウェア構成を示す図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
なお、説明は以下の順序で行うものとする。
1.概要
2.第1の実施形態
2.1.構成例
2.2.サーバの処理例
2.3.グルーピング処理例
3.第2の実施形態
3.1.音声通信の開始処理
3.2.通話対象の選択処理
3.3.通話対象との音声通信における音声出力処理
4.第3の実施形態
5.第4の実施形態
6.第5の実施形態
7.ハードウェア構成
8.まとめ
<<1.概要>>
図1は、本開示の一実施形態に係る情報処理システムの概要を説明するための図である。図1に示すように、本実施形態に係る情報処理システムで、複数のユーザがクラウドサーバC0を介して音声により通話するためのシステムである。具体的には、図1に示すように、ユーザ1001、1002、1003は、各自の耳に装着した小型端末100A、100B、100C(以降、これらを特に区別しない限り、まとめて小型端末100とも称する)を用いて、クラウドサーバC0を介して音声により通話をすることができる。また、本実施形態に係る情報処理システムでは、耳に装着した小型端末100に対して各種操作を行うことにより、ユーザや、複数のユーザを含むグループ等の通話対象について様々な処理が可能である。
図2は、本開示の一実施形態に係る情報処理システム1の概略構成を示す図である。図2に示すように、本実施形態に係る情報処理システム1は、小型端末100(100A、100B、100C)、携帯端末200(200A、200B、200C)、通信ネットワーク300およびサーバ400を含む。
小型端末100は、音声入出力デバイスの一例である。具体的には、小型端末10は、イヤホンのような、ユーザの耳に装着可能なデバイスである。小型端末100は、例えば、スピーカおよびマイクロフォンを備え、ユーザによる通話が可能である。また、小型端末100は、各種センサ、およびボタン等の入力部等を備え、ユーザによる操作が可能である。また、小型端末100は、近距離無線通信により接続される。なお、小型端末100と携帯端末200とは、有線通信により接続されてもよい。かかる接続により、小型端末100に対するユーザの操作によって、携帯端末200の機能やアプリケーションに対する操作が可能である。
なお、他の実施形態において、小型端末100は、ユーザの耳に装着可能な端末でなくてもよい。例えば、小型端末100がスピーカおよびマイクロフォンを備え、ユーザによる通話を実現可能である端末であれば、その態様は限定されない。
携帯端末200は、例えば、携帯電話、スマートフォン、タブレット、ノートPC(Personal Computer)またはゲーム機等の情報処理端末により実現される。携帯端末200は、例えば、小型端末100および通信ネットワーク300と接続する。また、携帯端末200は、例えば、各種情報を表示する表示部、および携帯端末200に対する入力を受け付ける操作部を備える。表示部および操作部は、例えば、タッチパネルのように、一体に形成されていてもよい。
また、携帯端末200は、各種機能およびアプリケーションを有しており、これらは、ユーザによる操作(小型端末100を介した操作を含む)により実行され得る。なお、かかる機能およびアプリケーションは、サーバ400により実現されてもよい。携帯端末200が有する機能およびアプリケーションとしては、例えば、メール、ショートメッセージ、ソーシャルネットワーキングサービス、写真撮影、音楽再生、ブラウジング機能、地図表示、スケジューリング、コンテキスト解析機能等が含まれる。
サーバ400は、通信ネットワーク300を介して、携帯端末200と接続する。サーバ400は、携帯端末200が有する機能またはアプリケーションに対応する処理を行う。例えば、サーバ400は、携帯端末200Aから音声データを取得し、他の携帯端末200B、200Cに処理後の音声データを送信する。
なお、小型端末100、携帯端末200およびサーバ400は、情報処理装置の一例である。また、小型端末100および携帯端末200は、ユーザ端末またはデバイスの一例である。すなわち、情報処理装置、ユーザ端末およびデバイスは別体であってもよいし、一体であってもよい。例えば、以下の各実施形態では、サーバ400が情報処理装置であり、小型端末100がユーザ端末であり、携帯端末200がユーザ端末とは異なるデバイスであるものとして説明する。
また、他の実施形態に係る情報処理システム1は、携帯端末200およびサーバ400により構成されてもよい。すなわち、小型端末100を用いない範囲で以下の実施形態に係る情報処理システム1により実現される機能が発揮されれば、情報処理システム1は必ずしも小型端末100を備えていなくてもよい。この場合、携帯端末200がユーザ端末となる。
また、他の実施形態に係る情報処理システム1は、小型端末100およびサーバ400により構成されてもよい。すなわち、携帯端末200を用いない範囲で以下の実施形態に係る情報処理システム1により実現される機能が発揮されれば、情報処理システム1は必ずしも携帯端末200を備えていなくてもよい。この場合、小型端末100がユーザ端末となる。例えば、小型端末100が、通信ネットワーク300に直接接続されてもよい。
また、サーバ400は、クラウドサーバのように、複数の情報処理装置により実現されてもよい。また、サーバ400の代わりに、1または複数の携帯端末200が情報処理装置として実現されてもよい。この場合、通信ネットワーク300は、図2に示すようなクライアントサーバ型のネットワークを構成する代わりに、P2P(Peer to Peer)型のネットワークを構成してもよい。すなわち、情報処理システム1は、小型端末100および携帯端末200により構成されてもよい。また、サーバ400の代わりに、小型端末100が情報処理装置として実現されてもよい。この場合、情報処理システム1は、小型端末100により構成されていてもよい。
<<2.第1の実施形態>>
<2.1.構成例>
次に、本開示の第1の実施形態に係る情報処理システム1の詳細な構成について説明する。図3は、本開示の第1の実施形態に係る情報処理システム1の構成を示すブロック図である。各装置間の構成は上述したとおりであるので、以下では、各装置の構成について説明する。
まず、小型端末100は、制御部110、通信部120、センサ部130、スピーカ140、マイクロフォン150および操作部160を備える。
制御部110は、演算処理装置および制御装置として機能し、小型端末100の動作全般を制御する。制御部110は、例えば、CPU(Central Processing Unit)、マイクロプロセッサ等の電子回路によって実現される。また、制御部110は、使用するプログラムや演算パラメータ等を記憶するROM(Read Only Memory)、及び適宜変化するパラメータ等を一時記憶するRAM(Random Access Memory)を含んでいてもよい。
制御部110は、例えば、通信部120、センサ部130、マイクロフォン150および操作部160の少なくともいずれかから取得した情報を処理し、処理後の情報を通信部120およびスピーカ140の少なくともいずれかに出力する。
通信部120は、Bluetooth(登録商標)またはZigBee(登録商標)等の近距離無線通信インタフェースにより実現され得る。通信部120は、携帯端末200などの他の装置と通信を行う。小型端末100では、小容量のバッテリ(図示せず)が使用される。そのため、例えば、Bluetooth Low Energyなどの省電力である近距離無線通信インタフェースが使用されてもよい。
なお、小型端末100と携帯端末200とは、ペアリングによって相互に接続され得る。ペアリングは、電波の届く範囲にある機器を探索し、ユーザが検出された機器の中から接続したい機器を選択することによってなされる。ペアリングに関して、小型端末100と携帯端末200は、例えば、認証コード等を用いることによって相互に認証を行うように構成されてもよい。
センサ部130は、一または複数のセンサデバイスにより構成され、センサ情報を生成する。本実施形態に係るセンサ部130は、近接センサ131、加速度センサ132、ジャイロセンサ133および生体認証センサ134を備える。
近接センサ131は、赤外線センサ、接触センサ、超音波センサまたは電磁波センサ等により実現され、検出対象物の近接または接触を検出する機能を有する。具体的には、本実施形態に係る近接センサ131による検出信号に基づいて、制御部110は小型端末100がユーザの耳に装着されているか否かを判定する。
加速度センサ132は、小型端末100に付加される加速度を検出する機能を有する。加速度センサ132は、例えば、半導体方式または光学的方式等の、公知の加速度センサにより実現され得る。
ジャイロセンサ133は、小型端末100の姿勢、角速度または角加速度等を検出する機能を有する。ジャイロセンサ133は、例えば、静電容量型、圧電型、ピエゾ型等の、公知のジャイロスコープまたはジャイロセンサ等により実現され得る。
なお、近接センサ131、加速度センサ132およびジャイロセンサ133から得られるセンサ情報は、小型端末100の動きに関する情報を意味する。
生体認証センサ134は、小型端末100の所定の箇所に接触する生体の一部の特徴の情報(生体情報)を検出する機能を有する。生体認証センサ134は、例えば、公知の指紋センサや静脈センサ等により実現され得る。
地磁気センサ135は、小型端末100の方位を検出する機能を有する。
スピーカ140は、制御部110が処理した音声情報に基づいて音声を出力する機能を有する。例えば、スピーカ140は、携帯端末200から通信部120を介して取得した音声情報に基づいて音声を出力してもよい。なお、本明細書において、音声情報とは、ユーザが発した音声に限られず、あらゆる音に基づいて生成される情報(すなわち、音に関する情報)を意味する。また、音声情報は、センサ情報の一例である。
マイクロフォン150は、集音して音声情報を生成し、当該音声情報を制御部110に出力する機能を有する。例えば、マイクロフォン150は、ユーザが発した音声を集音して音声情報を生成し、当該音声情報を制御部110に出力する。この場合、制御部110は、音声情報を携帯端末200に送信し得る。
操作部160は、ユーザの小型端末100に対する操作により生成される信号を検出する機能を有する。操作部160は、例えば、機械的なボタンもしくはダイヤル、または静電式もしくは感圧式のタッチパネル等に実現され得る。操作部160としてボタンが設けられる場合、かかるボタンの設置数および配置位置等は特に限定されない。
なお、小型端末100は、さらに、カメラモジュール、GNSS(Global Navigation Satellite System)モジュールや、他のセンサ等を搭載してもよい。
次に、携帯端末200は、制御部210、通信部220、センサ部230、スピーカ240、マイクロフォン250、カメラモジュール260、GNSSモジュール270および表示操作部280を備える。また、携帯端末200は、不図示の記憶部を備え得る。
制御部210は、演算処理装置および制御装置として機能し、携帯端末200の動作全般を制御する。制御部210は、例えば、CPU、マイクロプロセッサ等の電子回路によって実現される。また、制御部210は、使用するプログラムや演算パラメータ等を記憶するROM、及び適宜変化するパラメータ等を一時記憶するRAMを含んでいてもよい。
また、制御部210は、通信部220、センサ部230、マイクロフォン250、カメラモジュール260、GNSSモジュール270および表示操作部280の少なくともいずれかから取得した情報(例えば環境情報)を処理し、処理後の情報を通信部220、スピーカ240および表示操作部280の少なくともいずれかに出力する。より具体的には、制御部210は、通信部220を介して小型端末100等から取得した情報(例えば環境情報)をサーバ400に送信するよう通信部220を制御する。また、制御部210は、取得または処理した情報を、適宜不図示の記憶部に記憶してもよい。なお、かかる記憶部は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等のストレージにより実現され得る。
通信部220は、小型端末100およびサーバ400と通信を行う機能を有する。例えば、通信部220は、Bluetooth(登録商標)またはZigBee(登録商標)等の近距離無線通信インタフェースにより実現されてもよい。この場合、通信部220は、小型端末100などの他の装置と、近距離無線により通信を行う。
また、通信部220は、例えば、有線/無線LAN(Local Area Network)、Wi−Fi(登録商標)、または携帯通信網(LTE(Long Term Evolution)、3G(第3世代の移動体通信方式))等の通信インタフェースにより実現されてもよい。この場合、通信部220は、サーバ400などの他の装置と、有線または無線により通信を行う。
センサ部230は、一または複数のセンサデバイスにより構成され、センサ情報を生成する。本実施形態に係るセンサ部230は、加速度センサ231およびジャイロセンサ232を備える。加速度センサ231およびジャイロセンサ232の有する機能は、上述した加速度センサ132およびジャイロセンサ133と同様であるので、説明を省略する。なお、加速度センサ231およびジャイロセンサ232から得られるセンサ情報は、携帯端末200の動きに関する情報を意味する。
スピーカ240は、制御部210が処理した音声情報に基づいて音声を出力する機能を有する。例えば、スピーカ240は、小型端末100またはサーバ400から通信部220を介して取得した音声情報に基づいて音声を出力してもよい。
マイクロフォン250は、集音して音声情報を生成し、当該音声情報を制御部110に出力する機能を有する。例えば、マイクロフォン250は、ユーザが発した音声を集音して生成される音声情報を制御部210に出力する。この場合、制御部210は、音声情報を小型端末100またはサーバ400に送信し得る。かかる音声情報は、センサ情報の一例である。
カメラモジュール260は、CCD(Charge Coupled Device)またはCMOS(Complementary Metal Oxide Semiconductor)などの撮像素子等により実現される。カメラモジュール260は、実空間を撮像し、静止画像、動画像またはタイムラプス画像等の画像情報を生成する機能を有する。
GNSSモジュール270は、携帯端末200の位置情報を生成する機能を有する。例えば、GNSSモジュール270は、GPS(Global Positioning System)等のシステムを利用して、携帯端末200を測位し、測位結果に基づいて携帯端末200の位置情報を生成する。かかる位置情報は、センサ情報の一例である。
表示操作部280は、情報を表示する表示機能およびユーザからの操作を受け付ける操作機能を有する。表示操作部280は、例えば、タッチパネル等により実現され得る。また、表示操作部280は、ディスプレイおよびボタンのように、表示機能と操作機能とが別体により実現されるものであってもよい。
次に、サーバ400は、制御部410および通信部420を備える。また、サーバ400は、不図示の記憶部を備え得る。
制御部410は、演算処理装置および制御装置として機能し、サーバ400の動作全般を制御する。制御部410は、例えば、CPU、マイクロプロセッサ等の電子回路によって実現される。また、制御部410は、使用するプログラムや演算パラメータ等を記憶するROM、及び適宜変化するパラメータ等を一時記憶するRAMを含んでいてもよい。
また、制御部410は、通信部420から取得した情報を処理し、処理後の情報を通信部420に出力する。制御部410は、取得または処理した情報を、適宜不図示の記憶部に記憶してもよい。なお、かかる記憶部は、例えば、HDD、SSD、フラッシュメモリ等のストレージにより実現され得る。制御部410の有する具体的な機能構成については後述する。
通信部420は、例えば、有線/無線LAN(Local Area Network)、Wi−Fi(登録商標)、または携帯通信網(LTE(Long Term Evolution)、3G(第3世代の移動体通信方式))等の通信インタフェースにより実現される。通信部420は、携帯端末200などの他の装置と、有線または無線により通信を行う。
小型端末100が、上述した有線または無線による通信が可能な通信インタフェースを備えている場合、通信部420は、小型端末100と通信を行うことも可能である。
本実施形態に係る制御部410は、情報解析部411、コンテキスト解析部412、グルーピング処理部413および通信制御部414を備える。
(情報解析部)
情報解析部411は、携帯端末200から取得したセンサ情報や画像情報を解析する機能を有する。例えば、情報解析部411は、センサ情報の一例である音声情報、ユーザ端末の動きに関する情報、または位置情報を解析し、解析結果を出力してもよい。
音声情報の解析結果としては、例えば、音声情報に含まれる音声の内容の類似度が挙げられる。かかる音声情報の解析には、公知の音声解析の技術が用いられ得る。ユーザ端末の動きに関する情報の解析結果としては、例えば、所定時間内における小型端末100または携帯端末200の動きの類似度が挙げられる。
また、情報解析部411は、画像情報を解析し、解析結果を出力してもよい。画像解析の解析には、公知の画像解析の技術が用いられ得る。
なお、かかるセンサ情報は、小型端末100により取得されたセンサ情報(音声情報を含む)であってもよいし、携帯端末200により取得されたセンサ情報(音声情報、位置情報を含む)であってもよい。この場合、携帯端末200はユーザ端末に相当し、携帯端末200から得られるセンサ情報は第1センサ情報に相当する。また、小型端末100はユーザ端末とは異なるデバイスに相当し、小型端末100から得られるセンサ情報は第2センサ情報に相当する。
また、情報解析部411は、小型端末100および携帯端末200以外のデバイスから取得されるセンサ情報を解析してもよい。かかるセンサ情報としては、例えば、所定の空間内に設置された環境センサにより生成されるセンサ情報であってもよい。かかる環境センサは、例えば、温度センサ、湿度センサ、照度センサ、音センサ、測距センサ、赤外線センサ、超音波センサ等であってもよい。この場合、小型端末100および携帯端末200のいずれかがユーザ端末に相当し、当該環境センサはユーザ端末とは異なるデバイスに相当する。
情報解析部411が解析して得られた解析結果は、グルーピング処理部413に出力される。なお、位置情報等、情報解析部411による解析が不要な情報については、必ずしも情報解析部411による解析処理が行われなくてもよい。この場合、通信部420が取得した位置情報等は、直接グルーピング処理部413に入力され得る。
(コンテキスト解析部)
コンテキスト解析部412は、ユーザ端末から得られた環境情報から、ユーザ端末を利用するユーザのコンテキストを解析し、当該コンテキストに関する情報を取得する機能を有する。ここで、コンテキストとは、ユーザ端末を利用するユーザの状況(すなわち、コンテキストアウェアネス)を意味する。具体的には、コンテキスト解析部412は、携帯端末200から得られた環境情報(情報解析部411において解析処理された情報を含む)から、携帯端末200を所持するユーザのコンテキストを解析する。そして、コンテキスト解析部412は、コンテキストの解析結果を、コンテキストに関する情報として出力する。なお、コンテキスト解析部412によるコンテキストの解析処理には、公知の技術が用いられ得る。
コンテキスト解析部412は、例えば、時刻情報、位置情報、センサ情報等の少なくともいずれかからコンテキストを解析する。具体的には、コンテキスト解析部412は、位置情報が時系列に変化し、センサ情報からユーザの動きが大きく、携帯端末200にインストールされているランニングに係るアプリが起動中であることから、ユーザがランニング中であると解析し得る。
また、コンテキスト解析部412は、過去の環境情報の履歴に基づいてコンテキストを解析してもよい。具体的には、コンテキスト解析部412は、過去の位置情報の履歴からユーザの行動を解析し、かかる解析結果からユーザのコンテキストを解析してもよい。
その他、例えば下記表1に示すように、環境情報から以下のようなコンテキストが解析され得る。なお、表1は、あくまでコンテキストの解析例を示しているにすぎない。また、コンテキスト解析部412は、環境情報のみならず、ユーザの直接的な入力情報に基づいて、コンテキストを解析してもよい。
Figure 2018155052
コンテキスト解析部412が解析して得られたコンテキストに関する情報は、グルーピング処理部413に出力される。なお、かかるコンテキスト解析部412による機能を、例えば、小型端末100または携帯端末200が有してもよい。この場合、例えば、小型端末100および携帯端末200が取得した環境情報から、小型端末100または携帯端末200のいずれかが、これらを利用するユーザのコンテキストを解析し、コンテキストに関する情報を取得してもよい。
(グルーピング処理部)
グルーピング処理部413は、ユーザ端末から取得したユーザ端末に関する環境情報に基づいて、ユーザ端末をグルーピングする機能を有する。具体的には、グルーピング処理部413は、携帯端末200から取得した携帯端末200に関する環境情報に基づいて、携帯端末200を通話対象としてグルーピングする。
ここでいうグルーピングとは、携帯端末200またはサーバ400により実行される機能やアプリケーションにおいて、当該機能またはアプリケーションを利用するユーザの利用する携帯端末200を通話対象としてグルーピングすることを意味する。このグルーピング処理は、複数のユーザの利用する携帯端末200を含むグループを生成し、または、既に生成されたグループにユーザの利用する携帯端末を加入させる処理を含む。
例えば、図2に示すように、サーバ400が、携帯端末200A〜200Cから環境情報を取得し、当該環境情報の解析の結果これらの環境情報が類似すると判定されれば、グルーピング処理部413は、携帯端末200A〜200Cを含むグループを生成する。また、既に携帯端末200A、200Bが一のグループに含まれている場合に、サーバ400が携帯端末200Cから取得した環境情報の解析の結果、携帯端末200Cが当該一のグループに関連すると判定されれば、グルーピング処理部413は、当該一のグループに携帯端末200Cを加入させる。
また、携帯端末200のグルーピング処理は、所定時間内に得られる環境情報に基づいて行われてもよい。例えば、グルーピング処理部413は、グルーピング処理において、一定時間内においてユーザの行動や動作をトリガーとして生成される環境情報のみに基づいてグルーピングを行ってもよい。一定時間内に生成された同様の環境情報を用いることで、ユーザの意図するグループを生成することが容易となる。
なお、例えば、グルーピング処理部413は、グルーピング処理を開始する前において、携帯端末200または小型端末100により、ユーザに対し、環境情報の生成タイミングを提示してもよい。より具体的には、グルーピング処理部413は、小型端末100から出力される音声や、携帯端末200の表示操作部280に表示される画像によって、環境情報を生成するタイミングをユーザに対し提示してもよい。これにより、より確実なグルーピングを行うことができる。
また、グルーピング処理部413は、任意の携帯端末200から適宜取得される環境情報に基づいて、当該携帯端末200を既存のグループに加入させる処理を行ってもよい。これにより、既存のグループに対して任意のタイミングで携帯端末200を加入させることが可能となる。
また、携帯端末200のグルーピング処理は、所定空間内に存在する携帯端末200について行われてもよい。例えば、グルーピング処理部413は、グルーピング処理において、同一の空間内に存在する携帯端末200から得られる環境情報のみに基づいてグルーピングを行ってもよい。これにより、ユーザの意図するグループを生成することが容易となる。
また、グルーピング処理部413は、携帯端末200の存在する位置や場所に関わらず、グルーピング処理を行ってもよい。これにより、既存のグループに対して任意のタイミングで携帯端末200を加入させることが可能となる。
なお、グルーピング処理部413は、携帯端末200を含むグループを生成し、または、携帯端末200を既存のグループに加入させる前に、当該グループの生成または当該グループへの加入の是非について、携帯端末200を利用するユーザに提示してもよい。これにより、意図しないグループの生成および加入を回避することができる。
また、グルーピング処理部413は、グルーピングの対象となる携帯端末200を予め制限してもよい。これにより、意図しないユーザに係る携帯端末200のグループへの加入を回避することができる。例えば、グルーピングの対象は、携帯端末200の有する連絡先データベースに含まれる連絡先に係る携帯端末200に限られてもよい。
また、グルーピング処理部413は、コンテキスト解析部412が解析して得られたコンテキストに関する情報に基づいて、グルーピング処理を行ってもよい。
なお、グルーピング処理の具体例については後述する。
また、ユーザ端末に関する環境情報は、上述したセンサ情報、画像情報および位置情報を含む。すなわち、ユーザ端末に関する環境情報とは、携帯端末200や小型端末100に備えられるセンサ、マイクロフォン、各種モジュール等により取得される空間的または時間的な情報を意味する。画像情報はユーザ端末(携帯端末200)が携帯端末200の周囲に存在する被写体を撮像することにより得られる画像情報であるから、ユーザ端末に関する環境情報に相当する。また、かかる環境情報には、時刻情報も含まれ得る。また、かかる環境情報には、小型端末100または携帯端末200にインストールされている機能またはアプリケーション等の情報も含まれ得る。かかる情報は、機能もしくはアプリケーションに含まれる内容、または当該機能もしくはアプリケーションの起動状態に係る情報を含む。
なお、ユーザ端末に関する環境情報には、ユーザにより表示操作部280に接触または近接して直接的に入力されることにより生成される情報(例えば、表示操作部280に対して直接的に入力される文字情報や、タッチ、スワイプ、スライド等による操作情報)は含まれない。
(通信制御部)
通信制御部414は、音声通信に係る処理を制御する機能を有する。具体的には、通信制御部414は、複数の携帯端末200の間における音声通信に係る処理を制御する。
例えば、通信制御部414は、グルーピング処理部413によりグルーピングされたグループにおける携帯端末200間の音声通信を構築する処理を行う。かかる処理により、同一グループに含まれる携帯端末200を利用するユーザ間での通話が可能となる。
なお、通信制御部414による具体的な処理例については、本開示の第2の実施形態において説明する。
<2.2.サーバの処理例>
次に、本開示の第1の実施形態に係るサーバ400の処理例について説明する。図4は、本実施形態に係るサーバ400の処理の流れの一例を示すフローチャートである。
図4に示すように、まず、サーバ400は、デバイスから環境情報を取得する(ステップS101)。具体的には、通信部420は、携帯端末200から、センサ情報等の環境情報を取得する。
次に、サーバ400は、取得した環境情報を解析する(ステップS103)。具体的には、情報解析部411は、携帯端末200から取得したセンサ情報等を解析し、解析結果をグルーピング処理部413に出力する。
次に、サーバ400は、解析結果に基づいてデバイスのグルーピング処理を行う(ステップS105)。具体的には、グルーピング処理部413は、情報解析部411によるセンサ情報等の解析結果に基づいて、携帯端末200をグルーピングする。また、通信制御部414は、グルーピング処理によって生成または編集されたグループに含まれる携帯端末200の間における音声通信を構築する。
<2.3.グルーピング処理例>
次に、グルーピング処理部413によるグルーピング処理の具体例について説明する。
(同様の音を検出することによるグルーピング処理)
例えば、グルーピング処理は、同様の音を検出することにより行われてもよい。具体的には、グルーピング処理部413は、複数の携帯端末200から取得した音に関する情報の解析結果が類似している(つまり同様の音が検出された)場合に、かかる音に関する情報を送信した携帯端末200を同一のグループにグルーピングしてもよい。
例えば、携帯端末200を有する複数のユーザが同一の空間(所定空間)内に存在する場合において、ユーザがそれぞれ略同時に同一の文言(例えば「乾杯!」等)を発声したとする。この場合、まず、携帯端末200(または小型端末100)が当該発声に基づく音声情報を取得し、サーバ400は、携帯端末200の各々から当該音声情報を取得する。そして、情報解析部411によりこれらの音声情報が解析された結果類似であると判定されれば、これらのユーザが有する携帯端末200の各々は、同一のグループにグルーピングされる。
なお、上述したユーザの発声の代わりに、例えば、合言葉、拍手、または特定の音楽を用いてもよい。同様の音を検出しやすい音声であれば、グルーピング処理に用いられる音の種類および内容は特に限定されない。
(同様の被写体を撮像することによるグルーピング処理)
また、例えば、グルーピング処理は、同様の被写体を撮像することにより行われてもよい。具体的には、グルーピング処理部413は、複数の携帯端末200から取得した画像情報の解析結果が類似している(つまり同様の被写体が撮像された)場合に、かかる画像情報を送信した携帯端末200を同一のグループにグルーピングしてもよい。
なお、上述した同様の被写体は、例えば、ユーザの顔や、ランドマークまたはシンボルマーク等であってもよい。また、同様の被写体は、必ずしも同一の被写体でなくてもよい。例えば、グルーピング処理部413は、所定の店舗において提供される料理を被写体とする画像情報に基づいてグルーピングを行ってもよい。これにより、当該料理についてのグループを生成することができる。
また、グルーピング処理において、環境情報として用いられる画像情報の生成タイミングは特に限定されない。例えば、グルーピング処理部413は、所定時間内において同様の被写体を撮像して得られる画像情報に基づいて、一のグループについてグルーピング処理を行ってもよい。また、グルーピング処理部413は、撮像タイミングに関わらず、同様の被写体を撮像して得られる画像情報に基づいて、一のグループについてグルーピング処理を行ってもよい。
(同様のジェスチャを検出することによるグルーピング処理)
また、例えば、グルーピング処理は、同様のジェスチャを検出することにより行われてもよい。具体的には、グルーピング処理部413は、複数の携帯端末200から取得した加速度センサ231またはジャイロセンサ232が検出して得られるセンサ情報の解析結果が類似している(つまり同様のジェスチャが検出された)場合に、かかるセンサ情報を送信した携帯端末200を同一のグループにグルーピングしてもよい。
図5および図6は、ジェスチャに基づくグルーピング処理の一例を示す概要図である。まず、図5を参照すると、一人のユーザ1004が、複数の携帯端末200A〜200Dを把持している。そして、ユーザ1004は、携帯端末200A〜200Dを把持したままこれらを振っている。この振っている動作がジェスチャとなる。
そうすると、携帯端末200A〜200Dはいずれも加速度センサ231等により同様の動きを検出する。この状態で、携帯端末200A〜200Dの各々がサーバ400に検出されたセンサ情報を送信すると、情報解析部411によりこれらのセンサ情報が同様であると解析される。すると、グルーピング処理部413は、携帯端末200A〜携帯端末200Dを同一のグループ1100(図5中の破線領域により示される)にグルーピングすることとなる。したがって、携帯端末200A〜200Dを振るだけで、これらを容易にグルーピングすることができる。
また、図6を参照すると、ユーザ1005〜1008は、互いに近接している状態で、それぞれ携帯端末200A〜200Dを把持している。そして、ユーザ1005〜1008は、携帯端末200A〜200Dを把持したままほぼ同時刻に(所定時間内に)これらを振っている。
そうすると、上述したのと同様に、携帯端末200A〜200Dはいずれも加速度センサ231等により同様の動きを検出する。この状態で、携帯端末200A〜200Dの各々がサーバ400に検出されたセンサ情報を送信すると、情報解析部411によりこれらのセンサ情報が同様であると解析される。すると、グルーピング処理部413は、携帯端末200A〜携帯端末200Dを同一のグループ1101(図6中の破線領域により示される)にグルーピングすることとなる。したがって、携帯端末200A〜200Dを振るだけで、これらを容易にグルーピングすることができる。
なお、上述した同様のジェスチャの動きについては特に限定されない。また、グルーピング処理において、環境情報として用いられるセンサ情報の生成タイミングは特に限定されない。例えば、グルーピング処理部413は、所定時間内において同様のジェスチャを検出して得られるセンサ情報に基づいて、一のグループについてグルーピング処理を行ってもよい。また、グルーピング処理部413は、ジェスチャのタイミングに関わらず、同様のジェスチャを検出して得られるセンサ情報に基づいて、一のグループについてグルーピング処理を行ってもよい。
(環境情報の履歴に基づくグルーピング処理)
また、例えば、グルーピング処理は、環境情報の履歴に基づいて行われてもよい。具体的には、グルーピング処理部413は、複数の携帯端末200から取得した環境情報の履歴の解析結果が類似している(つまり同様の環境情報の履歴が得られた)場合に、かかる環境情報を送信した携帯端末200を同一のグループにグルーピングしてもよい。
例えば、グルーピング処理部413は、複数の携帯端末200から取得した位置情報の履歴に基づいてグルーピング処理を行ってもよい。位置情報の履歴から、複数の携帯端末200がともに接近状態が継続していると判定されれば、グルーピング処理部413は、これらの携帯端末200を同一のグループにグルーピングしてもよい。また、グルーピング処理部413は、位置情報の他に、近距離無線通信により得られる接近情報の履歴に基づいてグルーピング処理を行ってもよい。これにより、ユーザによる発声やジェスチャ等を要せずに、互いに近接するユーザの携帯端末200をグルーピングすることができる。
また、グルーピング処理部413は、部屋等の所定空間に設置された環境センサから得られるセンサ情報の履歴に基づいてグルーピング処理を行ってもよい。これにより、ユーザによる発声やジェスチャ等を要せずに、同一の環境に存在するユーザの携帯端末200をグルーピングすることができる。
(コンテキストに関する情報に基づくグルーピング処理)
また、例えば、グルーピング処理は、コンテキストに関する情報に基づいて行われてもよい。図7は、本実施形態に係るグルーピング処理部413によるコンテキストに関する情報に基づくグルーピング処理の一例を示す概要図である。図7に示すように、例えば、小型端末100A〜100Cをそれぞれ装着するユーザ1009〜1011(各ユーザは不図示の携帯端末200A〜200Cを所持している)がランニングをしているとする。
このとき、まず、コンテキスト解析部412は、携帯端末200A〜200Cの各々から取得した環境情報(情報解析部411により解析された情報を含む)から、各ユーザのコンテキストを解析する。この場合、コンテキスト解析部412は、各ユーザがランニング中であることを解析する。かかる情報は、グルーピング処理部413に出力される。
そして、グルーピング処理部413は、ランニング中であると解析された各ユーザに係る携帯端末200A〜200Cを、同一のグループ1102にグルーピングする。これにより、図7に示すように、互いに遠隔な場所でランニングをするユーザ1009〜1011同士が、単にランニングをしているだけで互いに接続され、通話することが可能となる。
ここで、コンテキストに関する情報に基づくグルーピング処理を行う場合のサーバ400における処理の流れについて説明する。図8は、本実施形態に係るサーバ400の処理の流れの他の例を示すフローチャートである。
図8に示すように、まず、サーバ400は、デバイスから環境情報を取得する(ステップS201)。具体的には、通信部420は、携帯端末200から、センサ情報等の環境情報を取得する。
次に、サーバ400は、取得した環境情報を解析する(ステップS203)。具体的には、情報解析部411は、携帯端末200から取得したセンサ情報等を解析し、解析結果をコンテキスト解析部412およびグルーピング処理部413に出力する。
次に、サーバ400は、環境情報および環境情報の解析結果からコンテキストを解析する(ステップS205)。具体的には、コンテキスト解析部412は、情報解析部411から取得した解析結果、および携帯端末200から取得したセンサ情報等を解析し、携帯端末200を所持するユーザのコンテキストを解析する。そして、コンテキスト解析部412は、その解析結果であるコンテキストに関する情報をグルーピング処理部413に出力する。
次に、サーバ400は、コンテキストに関する情報に基づいてデバイスのグルーピング処理を行う(ステップS207)。具体的には、グルーピング処理部413は、コンテキスト解析部412によるコンテキストの解析結果に基づいて、携帯端末200をグルーピングする。また、通信制御部414は、グルーピング処理によって生成または編集されたグループに含まれる携帯端末200の間における音声通信を構築する。
(グループ名称の生成)
また、グルーピング処理部413は、環境情報に基づいて、グルーピング処理により生成されるグループの識別情報を生成してもよい。ここでいう識別情報とは、例えば、グループの名称が挙げられる。
グループの名称は、例えば、グルーピング処理に用いられる環境情報に関連するものであってもよい。具体的には、コンテキストに関する情報に基づいてグルーピング処理が行われる場合、グループの名称は、当該コンテキストに関するものであってもよい。例えば、ランニング中であるというコンテキストに基づいてグルーピング処理が行われた場合、当該グループの名称は、「ランニンググループ」等であってもよい。これにより、グルーピングされた携帯端末200を有するユーザは、自らグループの名称を設定しなくても、ユーザの所持する携帯端末200の属するグループの属性について把握することが容易となる。
このように、本実施形態に係る情報処理システム1では、環境情報に基づいて複数の携帯端末200のグルーピング処理が行われる。これにより、ユーザは文字等の入力により参加したい通話対象のグループを作成したり指定したりすることなく、容易にグループを生成し、またはグループに加入することができる。よって、通話対象のグルーピングに伴うユーザの負担を減らすことが可能となる。
また、本実施形態に係る情報処理システム1では、環境情報から得られるコンテキストに基づいてグルーピング処理が行われ得る。これにより、ユーザは自動的に通話対象となるグループに割り振られることとなる。よって、通話対象のグルーピングに伴うユーザの負担をさらに減らすことが可能となる。
なお、本実施形態に係るグループは、複数のユーザが情報処理システム1において行う音声通信に参加する通話対象のグループを意味するが、グルーピング処理部413によりグルーピングされるグループは、かかる複数のユーザ間の音声通信用に限定されない。例えば、ソーシャルネットワーキングサービス、文字によるチャット、メーリングリスト等に係るグループ等も、グルーピング処理部413によるグルーピング処理の対象となり得る。
以上、本開示の第1の実施形態について説明した。
<<3.第2の実施形態>>
次に、本開示の第2の実施形態について説明する。本実施形態では、上記実施形態に係るグルーピング処理に加え、通信制御部による音声通信に係る処理の例について説明する。ここでいう音声通信とは、一対一のユーザ間において構築される音声通信、および複数のユーザを含むグループ内において構築される音声通信を意味する。かかる音声通信において、複数のユーザは通話をすることができる。
なお、本実施形態に係る情報処理システム1の構成は上記実施形態に係る情報処理システム1の構成と同一であるので、かかる構成についての説明は省略する。また、情報解析部411およびコンテキスト解析部412により得られる解析結果は、通信制御部414に出力される。
本実施形態に係る通信制御部414は、ユーザ端末に関する環境情報に基づいて音声通信に係る処理を制御し得る。ここでいう環境情報は、上記実施形態で述べたように、センサ情報、画像情報、位置情報、時刻情報、機能もしくはアプリケーションに含まれる内容、または当該機能もしくはアプリケーションの起動状態に係る情報等を含む。また、ユーザが装着する小型端末100から得られるセンサ情報は、ユーザに付着または装着されるデバイスが検出して得られる第3センサ情報に相当する。また、本実施形態に係る通信制御部414は、当該環境情報から得られる、ユーザ端末を利用するユーザのコンテキストに関する情報に基づいて音声通信に係る処理を制御してもよい。
以下では、音声通信に係る処理の例として、音声通信の開始処理、通話対象の選択処理および通話対象との音声通信における音声出力処理について説明する。
<3.1.音声通信の開始処理>
本実施形態に係る通信制御部414は、例えば、音声通信の開始に係る処理を行う。音声通信の開始に係る処理とは、複数のユーザ間における音声通信を有効な状態に切り替える処理をいう。一般的に音声通信は、トラフィックの観点から、複数のユーザのいずれかが通話している際にのみ有効であることが好ましい。そこで、本実施形態に係る通信制御部414は、通話が行われていない場合は音声通信をアイドル状態とし、所定の情報がトリガーとして入力された場合に、かかる音声通信の開始に係る処理を行う。
例えば、通信制御部414は、音声通信において入力された音声の解析情報に基づいて、音声通信の開始に係る処理を制御してもよい。具体的には、まず、情報解析部411が、小型端末100または携帯端末200に入力された音声について声紋解析を行う。そして、通信制御部414は、解析の結果、入力された音声が小型端末100または携帯端末200を所持するユーザの音声である場合、音声通信を開始する処理を行う。かかる声紋解析として、公知の声紋解析に係る技術が適用可能である。
図9は、本実施形態に係る音声通信の開始に係る処理の流れの一例を示すフローチャートである。図9に示すように、まず、サーバ400は音声情報を取得する(ステップS301)。具体的には、通信部420は、携帯端末200から音声情報を取得する。
次に、サーバ400は、音声区間を検出する(ステップS303)。具体的には、情報解析部411は、音声情報に含まれる時系列の音声信号から、音声区間(音声として認識される区間)と、それ以外の区間に分別し、音声区間のみを抽出する。
次に、サーバ400は、抽出された音声区間について解析を行う(ステップS305)。具体的には、情報解析部411は、抽出された音声区間について声紋解析を行う。声紋解析の結果は、通信制御部414に出力される。
次に、サーバ400は、解析結果が所定条件を満たすか否かを判別する(ステップS307)。具体的には、通信制御部414は、入力された音声が、ユーザが発した音声であるか否かを判別する。入力された音声がユーザが発した音声であると判別された場合(ステップS307/YES)、通信制御部414は、音声通信を開始する処理を行う(ステップS309)。一方、入力された音声がユーザが発した音声でないと判別された場合(ステップS307/NO)、通信制御部414は、音声通信を開始する処理を行わず、音声通信はアイドル状態のままとなる。
このように、音声区間を抽出し、抽出された音声区間について声紋解析を行うことにより、ユーザの発話に基づいて音声通信を開始することができる。そうすると、例えば、小型端末100等のスピーカに騒音や他人の声等が入り込んだとしても、音声通信が自動的に開始してしまうことを回避することができる。
また、通信制御部414は、音源の位置の解析結果に基づいて音声通信の開始に係る処理を制御してもよい。具体的には、まず、情報解析部411が、小型端末100または携帯端末200に入力された音声の音源位置を解析する。かかる音源位置は、例えば、小型端末100等に複数設けられたスピーカにより得られる複数の音声情報に基づいて、公知の方法により解析することができる。そして、通信制御部414は、音源位置の解析の結果、入力された音声の音源が、小型端末100または携帯端末200を所持するユーザの口元であると判断された場合に、音声通信を開始する処理を行う。これにより、ユーザの発話に基づいて音声通信を開始することができる。
また、通信制御部414は、音声情報に含まれる内容の解析結果に基づいて音声通信の開始に係る処理を制御してもよい。具体的には、まず、情報解析部411が、小型端末100または携帯端末200に入力された音声の内容について解析する。そして、通信制御部414は、音声の内容についての解析の結果、入力された音声が所定の内容を含むと判断される場合に、音声通信を開始する処理を行う。
図10は、本実施形態に係る音声情報に含まれる内容の解析結果に基づく音声通信の開始に係る処理の一例を示す概要図である。図10に示すように、小型端末100を装着しているユーザ1013が「You Know What?Mr.XX」と発話したとする。この「You Know What?」が音声通信の開始に係るトリガーの文言である。そうすると、情報解析部411は、ユーザ1013の発話に基づく音声情報を解析し、かかる音声情報にトリガーとなる文言が含まれていると判定する。通信制御部414は、トリガーとなる文言が含まれているという判定結果から、音声通信を開始する処理を行う。これにより、ユーザは特定の言葉を発するだけで容易に音声通信を開始することができる。なお、かかるトリガーとなる文言については、特に限定されない。
また、通話対象となるユーザまたはグループ等に応じた文言が、トリガーとして予め設定されていてもよい。これにより、単に音声通信を開始するだけではなく、音声通信の通話対象も容易に選択することができる。
なお、上述した声紋解析や音源位置の解析に基づく処理は、音声通信の開始に係る処理に限定されない。例えば、小型端末100や携帯端末200を用いたサービスの利用における、セキュリティの解除または有効化にも用いることができる。
また、通信制御部414は、例えば、小型端末100に備えられる近接センサ131から得られる、小型端末100の装着状態に係る情報に基づいて、音声通信の開始に係る処理を行ってもよい。具体的には、小型端末100がユーザの耳に装着された際に、近接センサ131は、装着状態を検出する。そこで、通信制御部414は、小型端末100が装着されたことの検出情報に基づいて、音声通信を開始する処理を行う。これにより、小型端末100の装着とともにユーザは音声通信における通話をすぐに開始することができる。
また、通信制御部414は、例えば、携帯端末200を所持するユーザのコンテキストに関する情報に基づいて、音声通信の開始に係る処理を行ってもよい。具体的には、ユーザが通話可能な状況(例えば、会議が終了した場合等)になったというコンテキストに関する情報が得られた場合に、通信制御部414は音声通信を開始する処理を行う。これにより、ユーザが通話をすることが可能な状況になった際に、即時に通話を開始することができる。
<3.2.通話対象の選択処理>
また、本実施形態に係る通信制御部414は、例えば、音声通信の通話対象の選択に係る処理を行う。音声通信の通話対象の選択に係る処理とは、通話対象である一のユーザ、または複数のユーザを含むグループのいずれかを選択し、自ユーザの携帯端末200と、選択されたユーザまたはグループにおける携帯端末200との間の音声通信を構築する処理をいう。本実施形態に係る通信制御部414は、例えば、音声通信における音声情報、センサ情報等の環境情報、または環境情報から得られるコンテキストに関する情報等に基づいて、通話対象を選択する処理を行う。なお、音声情報に基づく通話対象の選択処理については上述したので、ここでは、環境情報、およびコンテキストに関する情報に基づく通話対象の選択処理について説明する。
(環境情報に基づく通話対象の選択処理)
例えば、通信制御部414は、小型端末100等から得られるセンサ情報に基づいて、通話対象を選択する処理を制御してもよい。具体的には、まず、情報解析部411が小型端末100等から得られるセンサ情報を解析する。そして、通信制御部414は、環境情報の解析結果に基づいて、通話対象を選択する。
ここでいう環境情報は、例えば、センサ情報である。かかるセンサ情報は、例えば、小型端末100に備えられる加速度センサ132、ジャイロセンサ133または地磁気センサ135等から得られる、小型端末100の動き、方位または姿勢に係る情報を含む。そうすると、通信制御部414は、かかる小型端末100の動き、方位または姿勢によって、通話対象を選択することとなる。すなわち、小型端末100を装着しているユーザは、頭や身体の向きに応じて、通話対象を選択することができる。
図11は、本実施形態に係るユーザの向きに基づく通話対象の選択処理の第1の例を示す概要図である。図11に示すように、ユーザ1014は小型端末100を装着している。このとき、小型端末100に備えられる加速度センサ132、ジャイロセンサ133または地磁気センサ135等により、ユーザ1014の頭の向きが検出される。例えば、ユーザ1014が前方D1を向いている場合、通信制御部414は、ユーザ1014の頭の向きが前方D1であることの検出情報に基づいて、ユーザ1015を通話対象として選択し得る。同様に、ユーザ1014が後方D2を向いている場合、グループ1103が通話対象として選択され得る。また、ユーザ1014が右方D3を向いている場合は、グループ1104が通話対象として選択され得る。また、ユーザ1014が左方D4を向いている場合は、ユーザ1016が通話対象として選択され得る。
例えば、ユーザ1014を基準とする方位D1〜D4に対応する通話対象を予め決定しておけば、ユーザ1014の頭の向きに応じて通話対象を選択することができる。したがって、ユーザ1014が所定の方向を向きながら発話することにより、所望の通話対象と通話を容易にすることができる。
また、図11に示すように、ユーザ1014の頭の向きが上方D5または下方D6である場合に対応する通話対象も選択することができる。
また、通話対象の位置と、ユーザの位置および向きとに応じて、通話対象が選択されてもよい。例えば、ユーザ1014が前方D1を向いており、前方D1にユーザ1015が存在する場合、通信制御部414は、ユーザ1015を通話対象として選択し得る。同様に、ユーザ1014が後方D2を向いており、後方D2にグループ1103が存在する場合、グループ1103が通話対象として選択され得る。また、ユーザ1014が右方D3を向いており、右方D3にグループ1104が存在する場合は、グループ1104が通話対象として選択され得る。また、ユーザ1014が左方D4を向いており、左方にユーザ1016が存在する場合は、ユーザ1016が通話対象として選択され得る。
また、ユーザ1014が上方D5または下方D6を向いており、上方D5または下方D6に他のユーザまたはグループが存在している場合、これらが通話対象として選択され得る。また、ユーザから見て、水平方向において同じ方位に複数のユーザまたはグループが存在している場合、通信制御部414は、ユーザの頭の仰角(上方または下方)に応じて、これらのユーザまたはグループのいずれかを通話対象として選択してもよい。
かかる選択処理は、近傍に存在するユーザまたはグループを通話対象とする処理に限定されない。図12は、本実施形態に係るユーザの向きに基づく通話対象の選択処理の第2の例を示す概要図である。図12に示すように、例えば、ユーザ1017がアメリカ合衆国の中西部に位置しており、グループ1105はアメリカ合衆国の北西部に位置しており、ユーザ1018がアメリカ合衆国の南部に位置しており、グループ1106がアメリカ合衆国の東部に位置しているとする。この場合、通信制御部414は、ユーザ1017、1018、グループ1105、1106の有する携帯端末200の位置情報、およびユーザ1017の装着する小型端末100のセンサ情報に基づいて、通話対象を選択する処理を行う。具体的には、ユーザ1017aが南を向いている場合は、ユーザ1018が通話対象として選択され得る。また、ユーザ1017bが西を向いている場合は、グループ1105が通話対象として選択され得る。また、ユーザ1017cが東を向いている場合は、グループ1106が通話対象として選択され得る。
このように、ユーザの向きに併せて、自ユーザおよび通話対象の携帯端末200等の位置情報を用いることにより、より直感的な通話対象の選択が可能となる。
また、かかるセンサ情報は、例えば、小型端末100に備えられる生体認証センサ134から得られる生体情報であってもよい。この場合、通信制御部414は、生体認証センサ134から得られた生体情報に基づいて、通話対象を選択してもよい。
図13は、本実施形態に係る生体情報に基づく通話対象の選択処理の一例を示す概要図である。図13に示すように、ユーザ1019は、耳に装着した小型端末100の生体認証センサ134(指紋センサ)に指F1を押し当てている。そうすると、生体認証センサ134が指F1の指紋を検出し、検出された情報は生体情報として小型端末100からサーバ400に送信される。ここで、生体情報は、ユーザ1019の右手の人差し指F1であるという情報を含むとする。そうすると、通信制御部414は、ユーザ1019の右手の人差し指F1に対応する通話対象を選択し、当該通話対象と音声通信を構築する。
例えば、ユーザ1014の各指に対応する通話対象を予め決定しておけば、ユーザ1014は、通話対象に応じた指を生体認証センサ134に押し当てるだけで、通話対象を選択することができる。したがって、ユーザ1014は、所望の通話対象を容易に選択することができる。
また、かかるセンサ情報は、例えば、小型端末100および携帯端末200以外のデバイス(他のデバイス)から得られるセンサ情報であってもよい。この場合、通信制御部414は、他のデバイスから得られたセンサ情報に基づいて、通話対象を選択してもよい。
図14は、本実施形態に係る他のデバイスから得られるセンサ情報に基づく通話対象の選択処理の一例を示す概要図である。図14に示すように、ユーザが指輪型デバイス500a〜500eを右手RHの各指に装着しているとする。このとき、ユーザの左手LHにより右手RHの人差し指に装着された指輪型デバイス500bが選択された(例えば、指輪型デバイス500bに設けられたボタンを押す等の操作により)とする。そうすると、指輪型デバイス500bが選択を検出し、検出された情報はセンサ情報として指輪型デバイス500bからサーバ400に送信される。当該送信に係る通信は、指輪型デバイス500bから小型端末100または携帯端末200を介した通信であってもよいし、指輪型デバイス500bとサーバ400との直接通信であってもよい。そうすると、通信制御部414は、指輪型デバイス500bに対応する通話対象を選択し、当該通話対象と音声通信を構築する。
例えば、ユーザの各指に装着された指輪型デバイス500に対応する通話対象を予め決定しておけば、ユーザは、通話対象に応じた指輪型デバイス500を選択するだけで、通話対象を選択することができる。したがって、ユーザ1014は、所望の通話対象を容易に選択することができる。
なお、図14に示した例では、ユーザの右手RHの各指に指輪型デバイス500が装着されているが、本技術はかかる例に限定されない。例えば、指輪型デバイス500はユーザの手の指のいずれか1つにのみ装着され、指輪型デバイス500が検出する情報(例えば指輪型デバイス500の動作や、指輪型デバイス500に対する操作)に基づいて、通話対象が選択されてもよい。
また、図14では指輪型デバイス500を他のデバイスとして用いた例が示されているが、本技術はかかる例に限定されない。例えば、指輪型デバイス500の他に、スマートウォッチ等の腕輪型デバイス、ネックレス型デバイス、体幹に装着するタイプのデバイス、または身体に埋め込められたデバイス等が、他のデバイスとして用いられてもよい。また、他のデバイスから得られるセンサ情報として、他のデバイスとして搭載可能な公知のセンサから得られるあらゆる情報が用いられ得る。また、これらのセンサ情報の他に、時刻情報や位置情報等が複合的に用いられてもよい。
(コンテキストに関する情報に基づく通話対象の選択処理)
また、例えば、通信制御部414は、コンテキストに関する情報に基づいて、通話対象を選択する処理を制御してもよい。具体的には、まず、コンテキスト解析部412が環境情報等から携帯端末200を使用するユーザのコンテキストを解析し、コンテキストに関する情報を出力する。そして、通信制御部414は、コンテキストに関する情報に基づいて、通話対象を選択する。
例えば、平日の昼間であるという時刻情報、およびオフィスに位置するという位置情報から、コンテキスト解析部412が、携帯端末200を使用するユーザが仕事中であるというコンテキストを解析したとする。この場合、通信制御部414は、通話対象として、仕事に関連のあるユーザまたはグループを選択してもよい。一方で、当該コンテキスト以外のコンテキストが解析された場合は、通信制御部414は、通話対象として、プライベートに関連のあるユーザまたはグループ(例えば家族等)を選択してもよい。これにより、ユーザの状況に適した通話対象を自動的に選択することができる。
なお、コンテキストに応じた通話対象は、例えば、予めユーザにより設定されてもよい。また、コンテキストに応じた通話対象は、例えば、ユーザの過去の音声通信履歴と、時刻情報、位置情報等の環境情報とに基づく機械学習等により、自動的に設定されてもよい。
<3.3.通話対象との音声通信における音声出力処理>
また、本実施形態に係る通信制御部414は、例えば、通話対象との音声通信における音声出力処理を行う。通話対象との音声通信における音声出力処理は、例えば、音声通信における通話対象に対する代理発話処理を含む。音声通信における通信対象に対する代理発話処理とは、通話対象に対してユーザの発話が困難である場合に、ユーザに替えて所定の内容を含む音声を通話対象に対して伝達する(すなわち、代理発話)処理をいう。本実施形態に係る通信制御部414は、例えば、センサ情報等の環境情報、環境情報から得られるコンテキスト、または音声通信における音声情報等に基づいて、代理発話処理を行う。
(環境情報に基づく代理発話処理)
例えば、通信制御部414は、小型端末100等から得られるセンサ情報等の環境情報等に基づいて、代理発話処理を制御してもよい。より具体的には、まず、情報解析部411が小型端末100等から得られるセンサ情報を解析する。そして、通信制御部414は、センサ情報の解析結果に基づいて、代理発話処理を行う。
かかるセンサ情報は、例えば、小型端末100に備えられる加速度センサ132またはジャイロセンサ133等から得られる、小型端末100の動きに係る情報を含む。そうすると、通信制御部414は、かかる小型端末100の動きによって、代理の発話処理をすることとなる。すなわち、小型端末100を装着しているユーザは、頭の動きに応じて、代理発話をすることができる。
図15および図16は、本実施形態に係るユーザの頭の動きに基づく代理発話処理の一例を示す概要図である。まず、図15に示すように、ユーザ1020は小型端末100を装着している。このとき、小型端末100に備えられる加速度センサ132およびジャイロセンサ133等により、ユーザ1020の頭の動きが検出される。具体的には、図15に示すように、ユーザ1020が頭を縦方向に振っているとする。この場合、通信制御部414は、ユーザ1020が頭を縦方向に振っていることの検出情報に基づいて、代理発話処理を行う。この場合の代理発話は、通話対象からの音声メッセージに対して、「YES」に相当する内容を含む。例えば、当該代理発話処理により、通話対象に対して「OK!」という内容の音声が伝達され得る。
一方、図16に示すように、ユーザ1021は小型端末100を装着している。このとき、小型端末100に備えられる加速度センサ132およびジャイロセンサ133等により、ユーザ1021の頭の動きが検出される。具体的には、図16に示すように、ユーザ1021が頭を横方向に振っているとする。この場合、通信制御部414は、ユーザ1021が頭を横方向に振っていることの検出情報に基づいて、代理発話処理を行う。この場合の代理発話は、通話対象からの音声メッセージに対して、「NO」に相当する内容を含む。例えば、当該代理発話処理により、通話対象に対して「NO!」という内容の音声が伝達され得る。
かかる代理発話処理によれば、ユーザが発話をしなくても、通話対象に対して音声による声掛けや返答が可能となる。したがって、ユーザが発話することができない環境であっても、頭を振る等のジェスチャのみで、通話対象に対して容易に意思を伝達することが可能である。
なお、代理発話における音声情報は、予めユーザが録音した音声により生成される音声情報であってもよいし、過去の音声通信においてユーザの発話により生成された音声を抽出して生成される音声情報であってもよい。
また、かかるセンサ情報は、例えば、小型端末100に備えられる近接センサ131から得られる、小型端末100の装着状態に係る情報を含む。そうすると、通信制御部414は、小型端末100の装着状態に応じて、代理発話処理をすることとなる。
例えば、小型端末100がユーザの耳に装着された際に、近接センサ131は、装着状態を検出したとする。そうすると、通信制御部414は、小型端末100が装着されたことの検出情報に基づいて、代理発話処理を行う。具体的には、通信制御部414は、ユーザが小型端末100を装着したことから、ユーザがオンラインであることを表す内容を含める代理発話処理を行う。これにより、通話対象は、当該ユーザがオンラインであることを容易に知ることができる。
一方で、近接センサ131が、ユーザの耳に小型端末100が装着されていない状況であることを検出したとする。この場合において、通話対象から音声メッセージを受信したとき、通信制御部414は、小型端末100が装着されていない状況であることを表す内容を含める代理発話処理を行う(例えば、「小型端末が装着されていません」等)。これにより、通話対象は、ユーザとは通話ができない状態にあることを知ることができる。
また、かかるセンサ情報は、例えば、小型端末100以外のデバイス(他のデバイス)から得られるセンサ情報であってもよい。当該センサ情報は、例えば、上述したような指輪型デバイス、スマートウォッチ等の腕輪型デバイス、ネックレス型デバイス、体幹に装着するタイプのデバイス、または身体に埋め込められたデバイス等の、ユーザに付着または装着された他のウェアラブルデバイスから得られるセンサ情報(第3センサ情報)であってもよい。この場合、通信制御部414は、他のデバイスから得られたセンサ情報に基づいて、代理発話処理をしてもよい。
なお、センサ情報に基づく代理発話処理においては、意図しないジェスチャ等に基づく処理がなされる場合もあり得る。そのため、通信制御部414は、例えば、音声通信の状態が所定の状態である場合には、代理発話処理をしなくてもよい。所定の状態とは、例えば、自ユーザが発話中である状態、および相手が発話していない状態を含む。この場合、通信制御部414は、例えば、代理発話に係る音声情報を送信せず、または通話対象において受信した代理発話に係る音声情報を再生しない。
(コンテキストに関する情報に基づく代理発話処理)
また、例えば、通信制御部414は、コンテキストに関する情報に基づいて、代理発話処理を制御してもよい。具体的には、まず、コンテキスト解析部412が環境情報等から携帯端末200を使用するユーザのコンテキストを解析し、コンテキストに関する情報を出力する。そして、通信制御部414は、コンテキストに関する情報に基づいて、代理発話処理を行う。
図17は、本実施形態に係るコンテキストに関する情報に基づく代理発話処理の一例を示す概要図である。図17に示すように、小型端末100Aを装着するユーザ1022は会議中であり、小型端末100Bを装着するユーザ1023からユーザ1022に対して音声通信を介した音声メッセージ(1)が受信されたとする。このとき、ユーザ1022が所持する携帯端末200(図示せず)から、環境情報(例えば、位置情報、スケジュール情報等を含む)がサーバ400に送信される。サーバ400は、当該環境情報からコンテキストを解析し、ユーザ1022が会議中であり、というコンテキストに関する情報を取得する。すると、通信制御部414は、ユーザ1023の小型端末100Bに対して代理音声メッセージ(2)を伝達する。例えば、現在会議中であり、30分後に通話可能ですとの文言を、仮想のエージェントがユーザ1022の代わりにユーザ1023に対して伝達してもよい。これにより、ユーザ1022が能動的に返事することなく、ユーザ1023に対して応答することが可能となる。
なお、コンテキストに関する情報に基づく代理発話処理は、例えば、通話対象から音声メッセージを受信後、所定の条件を満たした際に行われるようにしてもよい。所定の条件とは、例えば、小型端末100や携帯端末200に対するユーザの操作や動作が所定時間未検出であったことを含む。
(音声通信において入力された音声の解析情報に基づく代理発話処理)
例えば、通信制御部414は、音声通信において入力された音声の解析情報に基づいて、代理発話処理を制御してもよい。より具体的には、まず、情報解析部411が小型端末100等に入力された音声情報を解析する。そして、通信制御部414は、音声情報の解析結果に基づいて、代理発話処理を行う。
例えば、ユーザの咳、咳払いまたはうがい等の特徴的な音声が、代理発話処理に用いられてもよい。この場合、情報解析部411は、これらの特徴的な音声を解析する。そして、通信制御部414は、音声の解析結果に基づいて、代理発話処理を行う。具体的には、小型端末100を装着するユーザが会議中である場合に通話対象から音声によるメッセージが受信されたとする。このとき、ユーザが咳払いをすると、咳払いに由来する音声が小型端末100に入力され、サーバ400に送信される。そして、情報解析部411により音声解析され、通信制御部414は、咳払いに対応する代理発話処理を行う。例えば、通信制御部414は、「現在会議中であり、後で連絡します」という内容の代理音声メッセージを通話対象に伝達する。これにより、ユーザが文言を発しなくとも、ユーザの意図した音声メッセージを相手に送信することができる。
なお、これらの特徴的な音声は、例えば、機械学習等の技術により判別されてもよい。特徴的な音声のパターンと代理発話の内容との関連付けは、ユーザにより設定されてもよいし、学習により自動的に設定されてもよい。
以上、代理発話処理の例について説明した。なお、代理発話処理において代理発話に使用される音声は、特に限定されない。例えば、代理発話に使用される音声は、予め所定のメッセージをユーザが読み上げたものを録音したものであってもよいし、TTS(Text To Speech)の技術により、予め録音したユーザの音声から再現されるものであってもよい。また、代理発話に使用される音声は、ユーザ独自の音声に限らず、他人の音声(例えば、著名人の音声)等であってもよい。また、代理発話に使用される音声は、取得したコンテキストに応じた音声であってもよい。例えば、ユーザが電車に乗っているというコンテキストが解析された場合、通信制御部414は、代理発話として、電車の揺れる音を通話対象に対して送信してもよい。また、通信制御部414は、電車の揺れる音に加えて、「Aさんは電車に乗車中です」という音声メッセージを通話対象に対して送信してもよい。この際、通信制御部414は、「Aさんは電車に乗車中です」という音声メッセージのBGMとして、電車の揺れる音を音声メッセージに比較して小さい音量で当該音声メッセージに合成し、通話対象に対して送信してもよい。これにより、通話対象側は、ユーザの状況を直感的に把握することができる。
また、通話対象に送信される音声は、音声通信における音声情報の解析結果に応じて選択されてもよい。例えば、ユーザよりも目上のユーザまたはグループに対して代理発話による音声を送信する場合、音声情報には、フォーマルな文言が含まれる可能性が高い。そこで、情報解析部411が音声情報を解析し、フォーマルな文言が多く含まれていると判別した場合、通信制御部414は、フォーマルな音声メッセージを通話対象に対して送信してもよい(例えば、通信制御部414は、肯定的な返事として通話対象に対して「承知しました」という内容の音声を伝達する)。一方で、ユーザと対等または目下のユーザまたはグループに対して代理発話による音声を送信する場合、音声情報には、カジュアルな文言が含まれる可能性が高い。そこで、情報解析部411が音声情報を解析し、カジュアルな文言が多く含まれていると判別した場合、通信制御部414は、カジュアルな音声メッセージを通話対象に対して送信してもよい(例えば、通信制御部414は、肯定的な返事として通話対象に対して「OK!」という内容の音声を伝達する)。これにより、代理発話処理において、より自然な通話が可能となる。
なお、通話対象との音声通信における音声出力処理は、音声通信における通話対象に対する代理発話処理に限られない。例えば、通信制御部414は、環境情報に基づいて、音声通信における音声の調整に係る処理を行ってもよい。
例えば、通信制御部414は、コンテキストに関する情報に基づいて、音声通信における音声の調整に係る処理を行ってもよい。例えば、情報解析部411が、音声通信における音声情報を解析し、ユーザへの関連度が低い会話がなされていると判定したとする。この場合、通信制御部414は、ユーザの装着する小型端末100のスピーカ140の音量を下げるよう小型端末100を制御する処理を行ってもよい。
ここで、ユーザへの関連度の高低は、例えば、音声通信に参加しているユーザの数、音声通信におけるユーザの名前の検出数、ユーザの発話機会の数、ユーザのジェスチャ等による発話機会の数、または会話内容に基づいて決定されてもよい。
また、例えば、情報解析部411が、音声通信における音声情報を解析し、ユーザの装着する小型端末100からの音声情報からユーザが騒音環境にいると判定したとする。この場合、通信制御部414は、ユーザの装着する小型端末100のスピーカ140の音量を上げるよう小型端末100を制御する処理を行ってもよい。
かかる構成により、ユーザの状況に基づいて自動的に音声の調整をすることが可能となる。
また、通信制御部414は、代理発話処理の際に、別途、発話対象からの音声メッセージを録音するよう小型端末100または携帯端末200を制御する処理をしてもよい。これにより、ユーザは自らが応答できなかった音声メッセージについて再度確認することが可能である。
以上、本開示の第2の実施形態について説明した。なお、本実施形態に係る通信制御部414の機能は、第1の実施形態に組み合わせることが可能である。
<<4.第3の実施形態>>
次に、本開示の第3の実施形態について説明する。図18は、本開示の第3の実施形態に係る情報処理システム1Aの構成を示すブロック図である。図18に示すサーバ400Aにおいては、第1の実施形態に係るサーバ400とは異なり、制御部410Aがグルーピング処理部413を有しない。すなわち、サーバ400Aは、グルーピング処理部413としての機能を有しない。
このため、本実施形態に係るサーバ400Aは、上述した第2の実施形態に係るサーバ400の通信制御部414の有する各種機能を実現する。すなわち、本実施形態に係る通信制御部414は、ユーザ端末に関する環境情報に基づいて音声通信に係る処理を制御する。かかる音声通信は、所定のユーザまたはグループにおける携帯端末200の間における通信である。
本実施形態に係るサーバ400Aの構成においても、本実施形態に係る通信制御部414は、上述した第2の実施形態に係る通信制御部414の機能を発揮し得る。すなわち、サーバ400Aは、グルーピング処理に係る機能を有していなくても、音声通信に係る各種処理を制御することが可能である。
以上、本開示の第3の実施形態について説明した。
<<5.第4の実施形態>>
次に、本開示の第4の実施形態について説明する。本実施形態では、通信制御部414によるアシスタント機能について説明する。アシスタント機能とは、複数のユーザ間またはグループ内での音声通信における通話において、音声通信の状況の説明、ユーザに対する応答に係る機能である。かかるアシスタント機能により、通話の状況をより正確に把握でき、また、会話内容をより豊かなものとすることができる。
かかるアシスタント機能は、音声通信において音声により、各ユーザに対して情報を提示する。具体的には、まず、情報解析部411が、音声通信に係る情報を解析する。音声通信に係る情報とは、音声通信のユーザの参加状況や、音声通信における音声情報を含む。そして、通信制御部414は、音声通信に係る情報の解析結果に基づいて、適宜音声により情報をユーザ等に提示する。
また、例えば、通信制御部414は、音声通信のグループに参加しているユーザ全体に対して、音声により情報を提示する処理をしてもよい。また、通信制御部414は、音声通信のグループに参加しているユーザのうち、所定の条件を満たすユーザにのみに対して、音声により情報を提示する処理をしてもよい。
アシスタント機能の例について説明する。図19は、本実施形態に係るアシスタント機能の一例を説明するための概要図である。図19に示すように、小型端末100を装着しているユーザ1024が所定のグループにおける通話に参加するとする。まず、ユーザ1024が当該所定のグループにおける通話に参加したとする。すると、情報解析部411は当該音声通信のグループにユーザ1024が加入したことを判定する。そして、通信制御部414は、ユーザ1024に対して、グループに参加しているユーザに関する情報を音声により提示する。図19に示す例では、「XXさん、YYさん、ZZさんがこのグループに参加しています」という音声がユーザ1024に対して小型端末100を介して伝達される。
また、ユーザ1024の通話中に、当該所定のグループに他のユーザが参加したとする。すると、情報解析部411は当該音声通信のグループに当該他のユーザが加入したことを判定する。そして、通信制御部414は、ユーザ1024に対して、グループに新たなユーザが参加したことを音声により提示する。図19に示す例では、「このグループにDDさんが新たに参加しました」という音声がユーザ1024に対して小型端末100を介して伝達される。
このように、音声通信のユーザの参加状況に基づく情報を音声によりユーザに提示することにより、通話しながらグループのユーザの参加状況を容易に把握することができる。なお、例えば、元からグループに参加しているユーザの参加状況については、新たに参加したユーザのみに提示されてもよい。また、新たに参加したユーザに関する情報については、元からグループに参加しているユーザの各々に提示されてもよい。
また、アシスタント機能の他の例について説明する。図20は、本実施形態に係るアシスタント機能の他の例を説明するための概要図である。図20に示すように、小型端末100を装着しているユーザ1025が他のユーザ(Ms.DD)と音声通信において通話しているとする。まず他のユーザが明日の天気に関する音声メッセージ(1)を発信し、ユーザ1025が明日の天気について把握していない旨の返事をしたとする(音声メッセージ(2))。この場合、例えば、ユーザ1025が「Hey Assistant」と発話するとする。かかる発話の文言が、アシスタント機能を呼び出すトリガーとなる。かかるアシスタント機能を呼び出す文言は、例えば、情報解析部411による音声情報の解析により抽出され得る。
続けて、ユーザ1025が明日の天気について質問したとすると、アシスタント機能(Assi.)により「明日の天気は雨でしょう」という音声がユーザ1025および他のユーザに伝達される(例えば、他のユーザ(Ms.DD)は音声メッセージ(4)にて、アシスタント機能により提示された情報に対するコメントを発している)。
このように、音声通信におけるアシスタント機能に関連する音声情報に基づく情報(例えば、質問に対する応答)を音声により各ユーザに提示することにより、通話における会話内容をより豊かなものにすることができる。なお、図20に示した例では、アシスタント機能により各ユーザに対して音声による情報の提示がなされていたが、特定のユーザにのみ音声の情報の提示がなされてもよい。例えば、自ユーザのみが特定の情報について知りたい場合や、特定のユーザのみに情報を伝達する際に、通信制御部414のアシスタント機能が発揮されてもよい。
また、通信制御部414は、アシスタント機能として、音声通信における過去の通話の内容等を、ユーザに音声により提示してもよい。例えば、通信制御部414は、音声通信のグループに新たに加入したユーザに対して、加入前の通話内容またはその要約を、音声により当該ユーザに対して提示してもよい。これにより、新たにグループに加入したユーザは、通話の話題にすぐに追いつくことが可能となる。なお、通話内容の要約は、例えば、情報解析部411により生成され得る。また、通話内容の要約は、音声の代わりに、例えば、表示部等に表示するようにしてもよい。例えば、小型端末100が時計型であり、表示部を有する場合には、小型端末100の当該表示部に通話内容の要約が文字で表示されてもよい。また、小型端末100が表示部を有さないような場合には、携帯端末200の表示操作部280に通話内容の要約が文字で表示されてもよい。
また、通信制御部414は、アシスタント機能として、ユーザが所定のグループに加入している場合に、他のグループから音声メッセージを受信した場合に、通話対象を当該他のグループに移動するか否かを音声により提示してもよい。例えば、通信制御部414は、「趣味」に係る音声通信のグループに参加しているユーザに対して、「仕事」に係る音声通信のグループにおいて会話が開始した場合に、「『仕事』グループに移動しますか?」と音声により提示してもよい。また、通信制御部414は、かかる提示に対するユーザの応答に基づいて、通話対象のグループを切り替える制御をしてもよい。これにより、ユーザは一のグループにおいて通話中であっても、他のグループへの通話に容易に切り替えることができる。
なお、音声通信のグループの移動については、グループの重要度に基づいて行われてもよい。例えば、「仕事」グループが「趣味」グループよりも重要度が高い場合、通信制御部414は、ユーザに対して「仕事」グループにおいて会話が開始していることを提示するとともに、ユーザの通話対象を「趣味」グループから「仕事」グループに移動してもよい。これにより、より重要な通話に参加できなくなる瑕疵を回避することができる。
以上、本開示の第4の実施形態について説明した。なお、本実施形態に係る通信制御部414の機能は、第1の実施形態、第2の実施形態および第3の実施形態に組み合わせることが可能である。
<<6.第5の実施形態>>
次に、本開示の第5の実施形態について説明する。本実施形態では、通信制御部414による遅延抑制機能について説明する。遅延抑制機能とは、発話元における発話の開始時点と、発話元と発話先との音声通信が構築されるまでの時点との間に生じる遅延を抑制する機能を意味する。かかる遅延抑制機能により、音声通信の構築により生じる遅延を低減させ、通話における発話の遅延を伝送速度に基づく遅延に留めることができる。そうすると、ユーザは、音声通信を開始した時点から発話をしても、ほぼ即時に通話対象に音声が伝達される。これにより、ユーザはフェイストゥフェイスで会話しているかのような体験が可能であり、音声通信における通話をより容易にすることができる。なお、本実施形態に係る遅延抑制機能はサーバ400により実現されるが、他の実施形態では、かかる遅延抑制機能は、小型端末100や携帯端末200により実現されてもよい。
以下、本実施形態に係る遅延抑制機能について説明する。図21は、本実施形態に係る遅延抑制機能を説明するための模式図である。図21を参照すると、まず、発話元(Sender)であるユーザから音声が発話される。その際、ユーザの音声に係る音声情報がサーバ400に送信されると、情報解析部411は、公知の音声区間検出手段により、音声区間S1、S2およびS3を抽出する。
なお、かかる音声通信においては、発話元と発話先(Reciever)との間に、音声通信の構築に伴う遅延(Delay)が生じている。そのため、発話先に音声情報が最初に到達するのは、Delayを経過した時点である。
そこで、通信制御部414は、抽出された音声区間S1、S2、S3のみを発話先(Receiver)のユーザの携帯端末200に送信する。その際、図21に示すように、音声区間S1、S2、S3が時系列において連続するように、音声情報が加工される。
これにより、音声区間の間に生じていた無音声区間が省略されるので、省略された区間分、遅延を減少させることができる。かかる遅延抑制処理を繰り返し実施することにより、音声通信の構築に伴う遅延を低減させることができる。
以上、本開示の第5の実施形態について説明した。なお、本実施形態に係る通信制御部414の機能は、第1の実施形態、第2の実施形態、第3の実施形態および第4の実施形態に組み合わせることが可能である。
<<7.ハードウェア構成>>
以上、本開示の実施形態を説明した。上記の各種処理は、ソフトウェアと以下に説明するハードウェアとの協働により実現される。
図22は、本開示に係る小型端末100、携帯端末200またはサーバ400を具現する情報処理装置900のハードウェア構成を示す図である。情報処理装置900は、CPU901と、ROM902と、RAM903と、ホストバス904と、を備える。また、情報処理装置900は、ブリッジ905と、外部バス906と、インタフェース907と、入力装置908と、出力装置909と、ストレージ装置(HDD)910と、ドライブ911と、通信装置912と、を備える。
CPU901は、演算処理装置および制御装置として機能し、各種プログラムに従って情報処理装置900内の動作全般を制御する。また、CPU901は、マイクロプロセッサであってもよい。ROM902は、CPU901が使用するプログラムや演算パラメータ等を記憶する。RAM903は、CPU901の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはCPUバスなどから構成されるホストバス904により相互に接続されている。当該CPU901、ROM902およびRAM903の協働により、小型端末100の制御部110の機能が実現され得る(携帯端末200およびサーバ400についても同様である)。
ホストバス904は、ブリッジ905を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス906に接続されている。なお、必ずしもホストバス904、ブリッジ905および外部バス906を分離構成する必要はなく、1つのバスにこれらの機能を実装してもよい。
入力装置908は、タッチパネル、ボタン、マイクロフォンおよびスイッチなどユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、CPU901に出力する入力制御回路などから構成されている。情報処理装置900のユーザは、該入力装置908を操作することにより、情報処理装置900に対して各種のデータを入力したり処理動作を指示したりすることができる。
出力装置909は、例えば、CRT(Cathode Ray Tube)ディスプレイ装置、液晶ディスプレイ(LCD)装置、OLED(Organic Light Emitting Diode)装置およびランプなどの表示装置を含む。さらに、出力装置909は、スピーカおよびヘッドホンなどの音声出力装置を含む。出力装置909は、例えば、再生されたコンテンツを出力する。具体的には、表示装置は再生された映像データ等の各種情報をテキストまたはイメージで表示する。一方、音声出力装置は、再生された音声データ等を音声に変換して出力する。
ストレージ装置910は、データ格納用の装置である。ストレージ装置910は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。ストレージ装置910は、例えば、HDDまたはSDD等で構成される。このストレージ装置910は、ハードディスクを駆動し、CPU901が実行するプログラムや各種データを格納する。当該ストレージ装置910により、携帯端末200の不図示の記憶部の機能が実現され得る(サーバ400についても同様である)。
ドライブ911は、記憶媒体用リーダライタであり、情報処理装置900に外付けされる。ドライブ911は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記憶媒体913に記録されている情報を読み出して、RAM903に出力する。また、ドライブ911は、リムーバブル記憶媒体913に情報を書き込むこともできる。
通信装置912は、例えば、通信網914に接続するための通信デバイス等で構成された通信インタフェースである。かかる通信インタフェースは、例えば、Bluetooth(登録商標)またはZigBee(登録商標)等の近距離無線通信インタフェースや、有線/無線LAN、Wi−Fi(登録商標)、または携帯通信網(LTE、3G)等の通信インタフェースである。当該通信装置912により、小型端末100の通信部120の機能が実現され得る(携帯端末200およびサーバ400についても同様である)。
<<8.まとめ>>
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
なお、本明細書の情報処理装置(例えば、サーバ400)の処理における各ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はない。例えば、情報処理装置の処理における各ステップは、フローチャートとして記載した順序と異なる順序で処理されても、並列的に処理されてもよい。
また、情報処理装置に内蔵されるCPU、ROMおよびRAMなどのハードウェアに、上述した情報処理装置の各構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムが格納された読取可能な記録媒体も提供される。
また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
ユーザ端末から取得した前記ユーザ端末に関する環境情報に基づいて前記ユーザ端末をグルーピングするグルーピング処理部を備える、情報処理装置。
(2)
前記環境情報は前記ユーザ端末が検出して得られる第1センサ情報を含み、
前記グルーピング処理部は、前記第1センサ情報を解析して得られる解析結果に基づいて前記ユーザ端末をグルーピングする、前記(1)に記載の情報処理装置。
(3)
前記第1センサ情報は、音に関する情報、前記ユーザ端末の動きに関する情報および前記ユーザ端末の位置情報の少なくともいずれかを含む、前記(2)に記載の情報処理装置。
(4)
前記環境情報は、前記ユーザ端末が被写体を撮像することにより生成される画像情報を含み、
前記グルーピング処理部は、前記画像情報を解析して得られる解析結果に基づいて前記ユーザ端末をグルーピングする、前記(1)〜(3)のいずれか1項に記載の情報処理装置。
(5)
前記グルーピング処理部は、前記環境情報から得られる、前記ユーザ端末を利用するユーザのコンテキストに関する情報に基づいて、前記ユーザ端末をグルーピングする、前記(1)〜(4)のいずれか1項に記載の情報処理装置。
(6)
前記環境情報は、前記ユーザ端末とは異なるデバイスが検出して得られる第2センサ情報を含む、前記(1)〜(5)のいずれか1項に記載の情報処理装置。
(7)
前記グルーピング処理部は、前記環境情報の履歴に基づいて前記ユーザ端末をグルーピングする、前記(1)〜(6)のいずれか1項に記載の情報処理装置。
(8)
前記グルーピング処理部は、前記環境情報に基づいて、グルーピング処理により生成されるグループの識別情報を生成する、前記(1)〜(7)のいずれか1項に記載の情報処理装置。
(9)
前記グルーピング処理部は、前記ユーザ端末を介した音声通信に関するグループについてのグルーピングを行い、
前記音声通信に係る処理を制御する通信制御部をさらに備える、前記(1)〜(8)のいずれか1項に記載の情報処理装置。
(10)
前記通信制御部は、前記ユーザ端末に関する環境情報に基づいて前記音声通信に係る処理を制御する、前記(9)に記載の情報処理装置。
(11)
前記通信制御部は、前記環境情報から得られる、前記ユーザ端末を利用するユーザのコンテキストに関する情報に基づいて前記音声通信に係る処理を制御する、前記(10)に記載の情報処理装置。
(12)
前記通信制御部は、ユーザに付着または装着されるデバイスが検出して得られる第3センサ情報に基づいて前記音声通信に係る処理を制御する、前記(10)または(11)のいずれか1項に記載の情報処理装置。
(13)
前記ユーザに付着または装着されるデバイスは、前記音声通信に用いられる音声入出力デバイスを含む、前記(12)に記載の情報処理装置。
(14)
前記通信制御部は、前記音声通信において入力された音声の解析情報に基づいて前記音声通信に係る処理を制御する、前記(10)〜(13)のいずれか1項に記載の情報処理装置。
(15)
前記音声通信に係る処理は、前記音声通信の開始に係る処理を含む、前記(10)〜(14)のいずれか1項に記載の情報処理装置。
(16)
前記音声通信に係る処理は、前記音声通信の通信対象の選択に係る処理を含む、前記(10)〜(15)のいずれか1項に記載の情報処理装置。
(17)
前記音声通信に係る処理は、通話対象との前記音声通信における音声出力に係る処理を含む、前記(10)〜(16)のいずれか1項に記載の情報処理装置。
(18)
前記通話対象との前記音声通信における音声出力に係る処理は、前記音声通信における前記通話対象に対する代理発話処理を含む、前記(17)に記載の情報処理装置。
(19)
プロセッサが、
ユーザ端末から前記ユーザ端末に関する環境情報を取得することと、
取得した前記環境情報に基づいて前記ユーザ端末をグルーピングすることと
を含む情報処理方法。
(20)
ユーザ端末であって、前記ユーザ端末に関する環境情報を取得可能なユーザ端末と、
前記ユーザ端末から取得した前記ユーザ端末に関する環境情報に基づいて前記ユーザ端末をグルーピングするグルーピング処理部を備えるサーバと、
を有する情報処理システム。
1 情報処理システム
100 小型端末
110 制御部
120 通信部
130 センサ部
131 近接センサ
132 加速度センサ
133 ジャイロセンサ
134 生体認証センサ
135 地磁気センサ
140 スピーカ
150 マイクロフォン
160 操作部
200 携帯端末
210 制御部
220 通信部
230 センサ部
231 加速度センサ
232 ジャイロセンサ
240 スピーカ
250 マイクロフォン
260 カメラモジュール
270 GNSSモジュール
280 表示操作部
300 通信ネットワーク
400 サーバ
410 制御部
411 情報解析部
412 コンテキスト解析部
413 グルーピング処理部
414 通信制御部
420 通信部

Claims (11)

  1. ユーザ端末から取得した前記ユーザ端末に関する環境情報に基づいて音声通話処理における代理発話処理を制御する通話制御部を備える、情報処理装置。
  2. 前記通話制御部は、前記環境情報から得られる、前記ユーザ端末から取得したジェスチャの内容に基づいて前記代理発話処理を制御する、請求項1に記載の情報処理装置。
  3. 前記通話制御部は、前記環境情報から得られる、前記ユーザ端末から取得した該ユーザ端末の装着状態に基づいて前記代理発話処理を制御する、請求項1に記載の情報処理装置。
  4. 前記通話制御部は、前記環境情報から得られる、前記ユーザ端末を利用するユーザのコンテキストに関する情報に基づいて前記代理発話処理を制御する、請求項1に記載の情報処理装置。
  5. 前記環境情報は前記ユーザ端末が検出して得られる第1センサ情報を含み、
    前記通話制御部は、前記第1センサ情報を解析して得られる解析結果に基づいて前記代理発話処理を制御する、請求項1に記載の情報処理装置。
  6. 前記第1センサ情報は、前記ユーザ端末が検出した音に関する情報、前記ユーザ端末の動きに関する情報および前記ユーザ端末の位置情報の少なくともいずれかを含む、請求項5に記載の情報処理装置。
  7. 前記通話制御部は、前記音声通信において入力された音声の解析情報に基づいて前記代理発話処理を制御する、請求項1に記載の情報処理装置。
  8. 前記通話制御部は、前記ユーザ端末から取得した前記ユーザ端末に関する環境情報に基づいて通話対象に対して音声情報の送信をするか否かを決定する制御を行う、請求項1に記載の情報処理装置。
  9. 前記通話対象に対して送信される音声情報は、前記ユーザ端末を利用するユーザのコンテキストに応じた情報である、請求項8に記載の情報処理装置。
  10. プロセッサが、
    ユーザ端末から前記ユーザ端末に関する環境情報を取得することと、
    取得した前記環境情報に基づいて音声通話処理における代理発話処理を制御することと、
    を含む情報処理方法。
  11. ユーザ端末であって、前記ユーザ端末に関する環境情報を取得可能なユーザ端末と、
    前記ユーザ端末から取得した前記ユーザ端末に関する環境情報に基づいて音声通話処理における代理発話処理を制御する通話制御部を備えるサーバと、
    を有する情報処理システム。
JP2019501133A 2017-02-24 2018-01-24 情報処理装置、情報処理方法および情報処理システム Active JP6786700B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017033964 2017-02-24
JP2017033964 2017-02-24
PCT/JP2018/002130 WO2018155052A1 (ja) 2017-02-24 2018-01-24 情報処理装置、情報処理方法および情報処理システム

Publications (2)

Publication Number Publication Date
JPWO2018155052A1 true JPWO2018155052A1 (ja) 2019-12-19
JP6786700B2 JP6786700B2 (ja) 2020-11-18

Family

ID=63252686

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019501133A Active JP6786700B2 (ja) 2017-02-24 2018-01-24 情報処理装置、情報処理方法および情報処理システム

Country Status (5)

Country Link
US (1) US11217253B2 (ja)
EP (1) EP3576392A4 (ja)
JP (1) JP6786700B2 (ja)
CN (1) CN110291768B (ja)
WO (1) WO2018155052A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113767358A (zh) * 2019-05-31 2021-12-07 苹果公司 基于环境呈现通信数据
WO2024009743A1 (ja) * 2022-07-08 2024-01-11 パイオニア株式会社 情報提供装置、情報提供方法、プログラム及び記録媒体

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3925430B2 (ja) * 1996-12-27 2007-06-06 株式会社日立製作所 電話装置
TW391092B (en) 1996-12-27 2000-05-21 Hitachi Ltd Cellular mobile telephone apparatus and method for transmitting a response message to an caller
JP4442007B2 (ja) * 2000-03-30 2010-03-31 Kddi株式会社 移動端末にグループ通信を提供するシステム
US7489771B2 (en) * 2002-11-02 2009-02-10 Verizon Business Global Llc Systems and methods for implementing call pickup in a SIP environment
JP2004112820A (ja) 2003-10-31 2004-04-08 Kyocera Corp 携帯テレビ電話端末
JP4241484B2 (ja) 2004-04-14 2009-03-18 日本電気株式会社 携帯端末装置、着信応答メッセージ送信方法およびサーバ装置
US7292872B2 (en) 2004-07-22 2007-11-06 Sony Ericsson Mobile Communications Ab Mobile phone push-to-talk voice activation
US9137770B2 (en) * 2005-09-15 2015-09-15 Qualcomm Incorporated Emergency circuit-mode call support
US20070121902A1 (en) * 2005-11-03 2007-05-31 Andrei Stoica Transfer of live calls
KR20070071880A (ko) 2005-12-30 2007-07-04 브이케이 주식회사 이동통신 단말기의 청아용 대언모드 제공 방법
JP2009094893A (ja) 2007-10-10 2009-04-30 Ntt Docomo Inc 自動発呼システム及び自動発呼方法
JP2010034695A (ja) 2008-07-25 2010-02-12 Toshiba Corp 音声応答装置及び方法
US8385975B2 (en) * 2009-04-23 2013-02-26 Qualcomm Incorporated Context-based messaging for wireless communication
JP4719804B2 (ja) 2009-09-24 2011-07-06 富士通東芝モバイルコミュニケーションズ株式会社 携帯端末
JP5822742B2 (ja) 2012-01-30 2015-11-24 株式会社日立製作所 配電線監視制御システムおよび配電線監視制御方法
US9204263B2 (en) * 2012-05-23 2015-12-01 Mark A. Lindner Systems and methods for establishing a group communication based on motion of a mobile device
CN103095912B (zh) * 2012-12-24 2015-04-29 广东欧珀移动通信有限公司 一种移动终端自动拨打电话的方法及系统
CN103973724A (zh) 2013-01-25 2014-08-06 索尼公司 社交网络的组网方法和装置
CN103973859A (zh) 2013-01-29 2014-08-06 腾讯科技(深圳)有限公司 一种拨号方法、装置及移动终端
CN103248762A (zh) * 2013-04-16 2013-08-14 广东欧珀移动通信有限公司 一种快捷拨号的方法、装置及手机
JP2015154180A (ja) 2014-02-13 2015-08-24 富士通株式会社 呼出し方法、情報処理装置および呼出しプログラム
EP3125189A4 (en) * 2014-03-25 2018-01-17 Sony Corporation Server, client, control method and memory medium
CN103929523A (zh) * 2014-03-26 2014-07-16 广东明创软件科技有限公司 智能处理来电的方法及其移动终端
WO2016081809A1 (en) 2014-11-20 2016-05-26 Superchat, LLC Multi-network chat system
CN104935727B (zh) 2015-04-24 2018-08-31 广东小天才科技有限公司 一种智能穿戴设备接听电话的方法及装置
CN105100482A (zh) * 2015-07-30 2015-11-25 努比亚技术有限公司 一种实现手语识别的移动终端、系统及其通话实现方法
CN105306652A (zh) * 2015-11-13 2016-02-03 上海斐讯数据通信技术有限公司 一种基于智能手机加速度传感器的拨号方法及系统
CN106453047A (zh) * 2016-09-30 2017-02-22 珠海市魅族科技有限公司 快捷回复方法和装置

Also Published As

Publication number Publication date
US11217253B2 (en) 2022-01-04
EP3576392A4 (en) 2019-12-18
CN110291768A (zh) 2019-09-27
EP3576392A1 (en) 2019-12-04
CN110291768B (zh) 2021-11-30
WO2018155052A1 (ja) 2018-08-30
JP6786700B2 (ja) 2020-11-18
US20200098373A1 (en) 2020-03-26

Similar Documents

Publication Publication Date Title
US20220038615A1 (en) Wearable Multimedia Device and Cloud Computing Platform with Application Ecosystem
JP6466565B2 (ja) 発語トリガを常時リッスンするための動的閾値
US8958569B2 (en) Selective spatial audio communication
US10665229B2 (en) Information processing device, information processing method, and program
WO2021232913A1 (zh) 语音信息处理方法及装置、存储介质和电子设备
US20180124225A1 (en) Wireless Earpiece with Walkie-Talkie Functionality
US10403272B1 (en) Facilitating participation in a virtual meeting using an intelligent assistant
WO2014008843A1 (zh) 一种声纹特征模型更新方法及终端
JPWO2017130486A1 (ja) 情報処理装置、情報処理方法およびプログラム
US20180054688A1 (en) Personal Audio Lifestyle Analytics and Behavior Modification Feedback
CN112806067B (zh) 语音切换方法、电子设备及系统
CN105677023B (zh) 信息呈现方法及装置
CN109257498B (zh) 一种声音处理方法及移动终端
JPWO2018155116A1 (ja) 情報処理装置、情報処理方法及びコンピュータプログラム
CN108648754A (zh) 语音控制方法及装置
JP6786700B2 (ja) 情報処理装置、情報処理方法および情報処理システム
JP2023093714A (ja) コンタクト制御プログラム、端末およびコンタクト制御方法
WO2016157993A1 (ja) 情報処理装置、情報処理方法およびプログラム
JPWO2016158003A1 (ja) 情報処理装置、情報処理方法及びコンピュータプログラム
WO2018120241A1 (zh) 识别通话对象身份的方法和终端设备
JP6701887B2 (ja) 情報処理システム、情報処理方法およびプログラム
EP3288035B1 (en) Personal audio analytics and behavior modification feedback
US11948578B2 (en) Composing electronic messages based on speech input
US20240242721A1 (en) Composing electronic messages based on speech input
US11899911B2 (en) Message composition interfaces for use with wearable multimedia devices

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190814

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200519

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201028

R150 Certificate of patent or registration of utility model

Ref document number: 6786700

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150