WO2018061839A1

WO2018061839A1 - 送信装置、送信方法及び送信プログラム

Info

Publication number: WO2018061839A1
Application number: PCT/JP2017/033563
Authority: WO
Inventors: 敬彦山縣; 晋平笹野; 昌治板谷; 健太郎今川; 善成石橋
Original assignee: 株式会社村田製作所
Priority date: 2016-09-29
Filing date: 2017-09-15
Publication date: 2018-04-05
Also published as: JPWO2018061839A1; JP6781961B2

Abstract

ニーズに応じた情報を提供する。コンピュータに、音声を収集して当該音声を示す音声データを生成する音声収集部と、音声データから、音声に含まれるキーワードである音声キーワードを抽出する音声キーワード抽出部と、音声データから、音声の強さ、速度及び抑揚の少なくとも一つを含む、音声の特徴を抽出する音声特徴抽出部と、音声の特徴に基づいて、予め格納された感情キーワード群から、抽出された音声の特徴に対応する感情キーワードを選択する感情キーワード選択部と、抽出された音声キーワード及び選択された感情キーワードを送信する送信部と、を実現させるための送信プログラム。

Description

送信装置、送信方法及び送信プログラム

　本発明は、送信装置、送信方法及び送信プログラムに関する。

　従来の情報提示装置として、特開２０１２－２５６１８３号公報（特許文献１）に記載されたものがある。上記従来の情報提示装置は、ユーザが現在有している欲求の強さと、ユーザが現在置かれている状況とを推定し、これらの組み合わせを記述したデータベースを照会することにより、ユーザが有している欲求とユーザが置かれている状況の双方を満たすことのできるアイテムを提示する。

特開２０１２－２５６１８３号公報

　しかしながら、上記従来の情報提示装置では、ユーザの欲求の強さとユーザが置かれている状況を推定しているに止まるため、必ずしもユーザのニーズに応じた情報を提示することができなかった。

　本発明はこのような事情に鑑みてなされたものであり、ユーザのニーズにより応じた情報を提供することを目的とする。

　本発明の一側面に係る送信プログラムは、コンピュータに、音声を収集して当該音声を示す音声データを生成する音声収集部と、音声データから、音声に含まれるキーワードである音声キーワードを抽出する音声キーワード抽出部と、音声データから、音声の強さ、速度及び抑揚の少なくとも一つを含む、音声の特徴を抽出する音声特徴抽出部と、音声の特徴に基づいて、予め格納された感情キーワード群から、抽出された音声の特徴に対応する感情キーワードを選択する感情キーワード選択部と、抽出された音声キーワード及び選択された感情キーワードを送信する送信部とを実現させる。

　本発明の他の側面に係る送信装置は、音声を収集して当該音声を示す音声データを生成する音声収集部と、音声データから、音声に含まれるキーワードである音声キーワードを抽出する音声キーワード抽出部と、音声データから、音声の強さ、速度及び抑揚の少なくとも一つを含む、音声の特徴を抽出する音声特徴抽出部と、音声の特徴に基づいて、予め格納された感情キーワード群から、抽出された音声の特徴に対応する感情キーワードを選択する感情キーワード選択部と、抽出された音声キーワード及び選択された感情キーワードを送信する送信部とを備える。

　本発明のさらに他の側面に係る送信方法は、音声を収集して当該音声を示す音声データを生成することと、音声データから、音声に含まれるキーワードである音声キーワードを抽出することと、音声データから、音声の強さ、速度及び抑揚の少なくとも一つを含む、音声の特徴を抽出することと、音声の特徴に基づいて、予め格納された感情キーワード群から、抽出された音声の特徴に対応する感情キーワードを選択することと、抽出された音声キーワード及び選択された感情キーワードを送信することとを含む。

　本発明によれば、ユーザのニーズにより応じた情報を提供することが可能となる。

本発明の一実施形態に係る送信装置１１０を含む検索システム１００の構成を示す図である。送信装置１１０が備える機能ブロックの一例を示す図である。ラッセルの感情円環モデル及びそれに含まれるキーワードを示す図である。検索装置１２０が備える機能ブロックの一例を示す図である。出力装置１３０が備える機能ブロックの一例を示す図である。検索システム１００における処理の一例を示すフローチャートである。辞書データベース更新処理を示すフローチャートである。

　以下、添付の図面を参照して本発明の一実施形態について説明する。図１は、本発明の一実施形態に係る送信装置１１０を含む検索システム１００の構成を示す図である。検索システム１００は、送信装置１１０と、検索装置１２０と、出力装置１３０とを備える。本実施形態に係る検索システム１００は、送信装置１１０が収集した音声から抽出されたキーワードと、当該音声から抽出された感情や雰囲気に対応するキーワードに基づいて、所定の検索を行い、その検索結果を出力するシステムである。

　送信装置１１０は、送信装置１１０が置かれている場所で収集した音声に基づいて、所定のキーワードを検索装置１２０に送信するコンピュータである。送信装置１１０は、施設や店舗に設置されたコンピュータであってもよいし、施設や店舗を訪問したユーザが所有するコンピュータ（スマートフォンやタブレット端末等）であってもよい。送信装置は、プロセッサ、メモリ及び通信インタフェースを備える。送信装置１１０は、例えば、携帯電話通信網やインターネットを経由して、検索装置１２０と通信を行うことができる。

　検索装置１２０は、送信装置１１０から受信したキーワードに基づいて、出力装置１３０のユーザに対して情報提供を行うコンピュータ（サーバ）である。検索装置１２０は、プロセッサ、メモリ、データベース及び通信インタフェースを備える。検索装置１２０は、例えば、インターネットを経由して、送信装置１１０及び出力装置１３０と通信を行うことができる。

　出力装置１３０は、検索装置１２０から提供されるデータ（表示データ）に基づいて、検索結果の出力を行うコンピュータである。出力装置１３０は、検索結果として、数値、文字、映像（画像）、音声等を、ディスプレイやスピーカ等に出力する。出力装置１３０は、例えば、スマートフォンやタブレット端末、パーソナルコンピュータ等である。出力装置１３０は、プロセッサ、メモリ及び通信インタフェースを備える。出力装置１３０は、例えば、携帯電話通信網やインターネットを経由して、検索装置１２０と通信を行うことができる。

　なお、出力装置１３０は、検索結果に基づいて、所定の動作を出力してもよい。出力装置１３０は、例えば、検索結果に基づいて、所定の通信を行ったり、モータ、アクチュエータ、センサ等を制御したりしてもよい。

　図２は、送信装置１１０が備える機能ブロックの一例を示す図である。送信装置１１０は、音声収集部２００と、音声キーワード抽出部２１０と、辞書データベース２２０と、音声特徴抽出部２３０と、感情キーワード選択部２４０と、感情データベース２５０と、送信部２６０と、辞書データベース更新指示作成部２７０とを備える。

　送信装置１１０のメモリには、送信プログラムが格納されており、送信装置１１０のハードウェア資源と送信プログラムとの協働により、送信装置１１０の各機能（音声収集部２００、音声キーワード抽出部２１０、辞書データベース２２０、音声特徴抽出部２３０、感情キーワード選択部２４０、感情データベース２５０、送信部２６０、及び辞書データベース更新指示作成部２７０）が実現される。送信プログラムは、コンピュータ読み取り可能な記録媒体から送信装置１１０のメモリに読み込まれて、送信装置１１０のプロセッサにより実行される。

　音声収集部２００は、送信装置１１０の周囲で発せられた音声を収集し、当該音声を示す音声データを生成する。具体的には、音声収集部２００は、マイク等によって収集した音声を電気信号に変換し、当該電気信号が示す情報をデジタルデータに変換した音声データを生成する。また、音声収集部２００は、生成した音声データを一時的に記憶する記憶部を有してもよい。当該記憶部は、例えば、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）、メモリカード、光ディスク、又はＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）などの磁気的、電気的又は光学的に記憶可能な既存の記憶装置又は記憶媒体である。音声収集部２００は、送信装置１１０の内蔵マイクでもよく、或いは外付けマイク（外付け型の有線式マイク又は無線式のマイク）でもよい。例えば、外付けマイクが接続されたタブレット端末は、送信装置１１０として機能する。送信装置１１０は、複数の音声収集部２００を備えてもよい。送信装置１１０は、複数の音声収集部２００の相対位置を検出してもよい。

　音声キーワード抽出部２１０は、音声収集部２００が生成した音声データから、当該音声に含まれるキーワード（以下「音声キーワード」とも呼ぶ。）を抽出する。具体的には、音声キーワード抽出部２１０は、まず、音声データを解析して、当該音声をテキストデータに変換する。そして、音声キーワード抽出部２１０は、当該テキストデータに含まれる各単語を、辞書データベース２２０に予め格納された単語と比較する。そして、音声キーワード抽出部２１０は、当該テキストデータに含まれる各単語が、辞書データベース２２０に予め格納された単語と一致した場合に、当該単語を音声キーワードとして抽出する。

　音声特徴抽出部２３０は、音声収集部２００が生成した音声データから、当該音声の特徴を抽出する。本実施形態において、音声特徴抽出部２３０は、当該音声の強さ、速度及び抑揚の少なくとも一つを抽出し、そして、当該強さ、速度若しくは抑揚、又は、これらの２つ以上の組み合わせを、当該音声の特徴として抽出する。

　音声特徴抽出部２３０は、音声データが示す音声信号の振幅の大きさに基づいて、当該音声の強さを抽出する。音声特徴抽出部２３０は、例えば、所定の単位期間における音声の強度の平均を、当該音声の強さとして抽出する。また、音声特徴抽出部２３０は、所定の文字数、単語数又は文章数を含む音声の強度の平均を、当該音声の強さとして抽出してもよい。

　また、音声特徴抽出部２３０は、音声に含まれる言葉の音数に基づいて、当該音声の速さを抽出する。音声特徴抽出部２３０は、例えば、所定の単位期間の含まれる音数を、当該音声の速さとして抽出する。また、音声特徴抽出部２３０は、所定の単位期間における当該音声の文字数、単語数又は文章数を、当該音声の速さとして抽出してもよい。

　また、音声特徴抽出部２３０は、音声の強さの変化に基づいて、当該音声の抑揚を抽出する。音声特徴抽出部２３０は、例えば、音声を複数の単位に分割し、各単位内における強さの変化、及び／又は、単位間における強さの変化を、当該音声の抑揚として抽出する。音声の単位は、例えば、音声に含まれる文章を構成する単語や節である。

　感情キーワード選択部２４０は、音声特徴抽出部２３０が抽出した音声の特徴に基づいて、当該特徴が示す話者の感情や場の雰囲気をキーワードに変換する。感情キーワード選択部２４０は、例えば、感情データベース２５０に予め格納された感情キーワード群から、音声特徴抽出部２３０が抽出した音声の特徴に対応する感情キーワードを選択する。また、感情データベース２５０は、感情や雰囲気に関連する多数のキーワードを、音声の特徴と対応づけて格納する。具体的には、感情データベース２５０は、当該音声の強さ、速度及び抑揚のそれぞれの値（又は値が取り得る所定の範囲）や、当該値又は範囲の組み合わせのパターンを、各キーワードと対応づけて格納する。そして、感情キーワード選択部２４０は、音声特徴抽出部２３０が抽出した音声の特徴、すなわち、当該音声の強さ、速度及び抑揚のそれぞれの値（又は値が取り得る所定の範囲）や、当該値又は範囲の組み合わせのパターンに基づいて、感情データベース２５０に格納された多数のキーワードの中から、所定のキーワードを選択する。なお、感情データベース２５０に格納されるキーワードは、図３に示すような、いわゆるラッセルの感情円環モデルに含まれるキーワードであってもよい。

　感情キーワード選択部２４０は、音声特徴抽出部２３０が抽出した音声の特徴の他に、収集された音声の発した話者の生体情報にさらに基づいて、感情キーワードを選択してもよい。感情キーワード選択部２４０は、例えば、話者の体温、心拍、脈拍、脳波、皮膚コンダクタンスレベル等の生体情報に基づいて、当該話者の感情を推定し、推定された感情に対応するキーワードを選択してもよい。話者の生体情報は、送信装置１１０に接続されたセンサから取得されてもよいし、また、例えばネットワークを通じて送信装置１１０の外部装置から取得されてもよい。

　音声特徴抽出部２３０は、音声データの波形から発言の肯定又は否定の度合いに関する指標を抽出してもよい。例えば、音声特徴抽出部２３０は、Ｅｍｐａｔｈ（登録商標）を用いて、音声データの波形から発言の肯定又は否定の度合いに関する指標を抽出することができる。Ｅｍｐａｔｈは、音声データの波形の物理的な特徴を解析し、平常、怒り、喜び、悲しみ及び元気度の各項目について５０段階で判定値を算出する。音声特徴抽出部２３０は、このように算出された結果に基づいて、発言の肯定又は否定の度合いに関する指標を抽出することができる。このように、音声データの波形から感情や気分に関する判定値を算出する技術は、音声気分解析技術と呼ばれる。音声気分解析技術を用いて判定される項目は、平常、怒り、喜び、悲しみ及び元気度に限られるものではなく、感情に関わるあらゆる項目を含み得る。感情データベース２５０は、発言の肯定又は否定の度合いに関する指標を、各感情キーワードと対応付けて格納してもよい。感情キーワード選択部２４０は、音声特徴抽出部２３０が抽出した、発言の肯定又は否定の度合いに関する指標に対応する感情キーワードを感情データベース２５０から選択してもよい。

　送信部２６０は、音声キーワード抽出部２１０が抽出した音声キーワード、及び、感情キーワード選択部２４０が選択した感情キーワードを、検索装置１２０に送信する。送信部２６０は、例えば、音声収集部２００が音声を収集してから所定の期間が経過したこと、音声特徴抽出部２３０が抽出した記音声の強さが所定の値を超えたこと、音声キーワード抽出部２１０が所定の単語を抽出したこと等に応答して、音声キーワード抽出部２１０が抽出した音声キーワード、及び、感情キーワード選択部２４０が選択した前記感情キーワードを、検索装置１２０に送信する。当該所定の単語は、例えば、「検索」等である。

　送信部２６０は、音声キーワード及び感情キーワードの他に、環境情報又は生体情報を、検索装置１２０にさらに送信してもよい。環境情報は、例えば、位置、温度、湿度、照度、揺れ等といった、送信装置１１０が置かれている場所や空間に関する情報である。環境情報は、ＧＰＳ、温度センサ、湿度センサ、照度センサ、加速度センサ、赤外線センサ等の測定装置によって取得される。送信部２６０は、環境情報や生体情報を、測定装置から直接的に取得してもよいし、ネットワーク等を通じて間接的に取得してもよい。

　辞書データベース更新指示作成部２７０は、辞書データベース２２０を更新するための指示（辞書データベース更新指示）を作成する。辞書データベース更新指示は、所定の契機で作成される。ここで、所定の契機は、辞書データベース２２０のヒット率が予め定められた閾値を下回った時点でもよく、或いは、予め定められた一定間隔でもよい。ヒット率とは、辞書データベース２２０に登録されている全てのキーワードのうち、音声収集部２００によって収集された音声に含まれているものと判定されたことのあるキーワードの割合を意味する。送信部２６０は、辞書データベース更新指示作成部２７０によって作成された辞書データベース更新指示を検索装置１２０に送信する。

　図４は、検索装置１２０が備える機能ブロックの一例を示す図である。検索装置１２０は、受信部３００と、検索実行部３１０と、データベース３２０と、送信部３３０と、キーワードデータベース３４０と、推測部３５０と、辞書データベース作成部３６０とを備える。検索装置１２０は、所定のキーワードに基づいてデータベース３２０に格納された情報を検索し、検索結果を出力装置１３０に送信する検索エンジンである。検索装置１２０は、送信装置１１０から送信される音声キーワードを受信し、これを蓄積することにより、蓄積された音声キーワードから話題を推測する処理を行ってもよい。音声キーワードが、例えば、「ハンドル」、「ブレーキ」、「タイヤ」などである場合、「車」に関する話題がなされているものと推測できる。推測された話題は、例えば、広告業者に提供される。また、検索装置１２０は、送信装置１１０からの辞書データベース更新指示に応答して、辞書データベース２２０を更新する処理をも行う。

　検索装置１２０のメモリには、音声キーワード及び感情キーワードに基づく検索処理を検索装置１２０に実行させる検索プログラムが格納されており、検索装置１２０のハードウェア資源と検索プログラムとの協働により、検索装置１２０の各機能（受信部３００、検索実行部３１０、データベース３２０、送信部３３０、キーワードデータベース３４０、推測部３５０、及びデータベース作成部３６０）が実現される。検索プログラムは、コンピュータ読み取り可能な記録媒体から検索装置１２０のメモリに読み込まれて、検索装置１２０のプロセッサにより実行される。

　受信部３００は、送信装置１１０が送信した音声キーワード及び感情キーワードを受信する。また、受信部３００は、送信装置１１０が送信した音声キーワード及び感情キーワードの他に、環境情報や生体情報をさらに受信してもよい。受信部３００は、送信装置１１０が送信した辞書データベース更新指示を受信する。

　検索実行部３１０は、受信部３００が受信した音声キーワード及び感情キーワード並びに／又は環境情報及び／若しくは生体情報に基づいて、データベース３２０を検索する。本実施形態において、音声キーワード、感情キーワード、環境情報及び生体情報は、いずれもテキストデータであり、検索実行部３１０は、例えば、データベース３２０に格納された情報のうち、検索に使われたテキストデータのいずれをも含む情報を、検索結果として抽出する。当該情報は、例えば、ウェブサイトに含まれるテキストデータ等である。

　送信部３３０は、検索実行部３１０が抽出した検索結果を、ネットワークを通じて出力装置１３０に送信する。送信部３３０は、例えば、検索実行部３１０が抽出したウェブサイトのＵＲＬや当該ウェブサイトに含まれるテキストデータや画像データ等を、検索結果として出力装置１３０に送信する。

　キーワードデータベース３４０は、受信部３００を通じて受信された音声キーワードを格納する。推測部３５０は、受信部３００を通じて受信された辞書データベース更新指示に応答して、キーワードデータベース３４０に格納されている音声キーワードの関連語を推測する。音声キーワードの関連語とは、音声キーワードと頻繁に同時に使われる語句を意味し、このような語句は、「共起語」とも呼ばれている。共起語は、同意語を必ずしも意味するものではない。推測部３５０は、例えば、人工知能を応用した共起語検索ツールである。このような共起語検索ツールとして、例えば、グーグルやヤフーなどの検索結果の上位となるウェブページのコンテンツで形態素解析を行い、同一文書に頻出する語句を共起語として提示するものが知られている。形態素解析とは、文法的な情報の注記のない自然言語のテキストデータから、対象言語の文法や、辞書と呼ばれる単語の品詞などの情報に基づき、形態素（言語で意味を持つ最小単位）の列に分解し、それぞれの形態素の品詞などを判別する作業を意味する。

　辞書データベース作成部３６０は、受信部３００を通じて受信された辞書データベース更新指示に応答して、辞書データベース２２０を更新する。辞書データベース作成部３６０は、キーワードデータベース３４０に格納されている音声キーワードと、推測部３５０により推測された関連語とに基づいて、更新された辞書データベース２２０を作成する。更新された辞書データベース２２０は、音声収集部２００によって収集された音声から抽出されたことのある音声キーワードとその関連語をキーワードとして登録している。更新前の辞書データベース２２０に登録されているキーワードのうち、音声収集部２００によって収集された音声から抽出されたことのない音声キーワードは、更新後の辞書データベース２２０から削除される。このような更新処理を繰り返すことにより、辞書データベース２２０のヒット率を高めることができる。

　送信部３３０は、更新された辞書データベース２２０を送信装置１１０に送信する。更新された辞書データベース２２０を受信した送信装置１１０は、更新前の辞書データベース２２０を更新後の辞書データベース２２０に差し替える。

　図５は、出力装置１３０が備える機能ブロックの一例を示す図である。出力装置１３０は、検索結果受信部４００と、検索結果出力部４１０とを備える。出力装置１３０において、検索結果受信部４００は、検索結果送信部３３０が送信した検索結果を受信し、検索結果出力部４１０は、受信した検索結果を、数値、文字、映像（画像）、音声等として、ディスプレイやスピーカ等を通じて出力する。

　出力装置１３０のメモリには、出力プログラムが格納されており、出力装置１３０のハードウェア資源と出力プログラムとの協働により、出力装置１３０の各機能（検索結果受信部４００、及び検索結果出力部４１０）が実現される。出力プログラムは、コンピュータ読み取り可能な記録媒体から出力装置１３０のメモリに読み込まれて、出力装置１３０のプロセッサにより実行される。

　図６は、検索システム１００における処理の一例を示すフローチャートである。

　まず、音声収集部２００は、送信装置１１０の周囲で発せられた音声を収集し、当該音声を示す音声データを生成する（Ｓ６００）。音声収集部２００は、例えば、一人又は複数の話者から「今日は暑いですね。」という音声を収集した場合に、この音声データを生成する。次に、音声キーワード抽出部２１０が、音声データから、音声キーワードを抽出する（Ｓ６０１）。音声キーワード抽出部２１０は、例えば、「今日は暑いですね。」という音声データから、「暑い」と単語を音声キーワードとして抽出する。次に、音声特徴抽出部２３０が、音声収集部２００が生成した音声データから、当該音声の特徴を抽出する（Ｓ６０２）。音声特徴抽出部２３０は、例えば、「今日は暑いですね。」という音声における、音声の強さ、速さ、抑揚を抽出する。

　次に、感情キーワード選択部２４０が、音声特徴抽出部２３０が抽出した音声の特徴に基づいて、話者の感情や場の雰囲気を示す感情キーワードを選択する（Ｓ６０３）。感情キーワード選択部２４０は、例えば、「今日は暑いですね。」という音声における、当該音声の強さ、速さ、抑揚の値を組み合わせたパターンに対応する感情キーワードとして、感情データベース２５０に格納されていた「苛立ち」を選択する。次に、送信部２６０は、音声キーワード抽出部２１０が抽出した音声キーワード、及び、感情キーワード選択部２４０が選択した感情キーワードを、検索装置１２０に送信する（Ｓ６０４）。送信部２６０は、「暑い」及び「苛立ち」を、それぞれ音声キーワード及び感情キーワードとして、検索装置１２０に送信する。また、送信部２６０は、送信装置１１０が置かれている場所である「京都府長岡京市神足１丁目にある長岡京駅の外」を示す位置情報と、当該場所における気温である「３６℃」を、環境情報として検索装置１２０に送信する。

　次に、キーワード受信部３００は、送信装置１１０が送信した音声キーワード、感情キーワード及び環境情報を受信する（Ｓ６０５）。キーワード受信部３００は、例えば、「暑い」及び「苛立ち」を、それぞれ音声キーワード及び感情キーワードとして、また、「京都府長岡京市神足１丁目にある長岡京駅の外」を示す位置情報と気温「３６℃」を環境情報として受信する。次に、検索実行部３１０は、キーワード受信部３００が受信した音声キーワード及び感情キーワード並びに環境情報に基づいて、データベース３２０を検索する（Ｓ６０６）。検索実行部３１０は、例えば、これらのキーワード及び環境情報に基づいて、「今日は暑いですね。」という音声を発した話者が、「京都府長岡京市神足１丁目にある長岡京駅の外」において、気温「３６℃」の中で、「暑い」という単語を「苛立ち」という感情とともに発していると判断する。そして、検索実行部３１０は、「『京都府長岡京市神足１丁目にある長岡京駅』の半径１００ｍにおいて、冷たい飲み物を提供する店舗」を検索する。次に、検索結果送信部３３０が、検索実行部３１０が抽出した検索結果を、ネットワークを通じて出力装置１３０に送信する（Ｓ６０７）。検索結果送信部３３０は、例えば、「『京都府長岡京市神足１丁目にある長岡京駅』の半径１００ｍにおいて、冷たい飲み物を提供する店舗」に該当する店舗のウェブサイトの一覧を、検索結果として出力装置１３０に送信する。

　次に、検索結果受信部４００が、検索結果送信部３３０が送信した検索結果を受信する（Ｓ６０８）。そして、検索結果出力部４１０は、受信した検索結果を、ディスプレイやスピーカ等を通じて出力する（Ｓ６０９）。検索結果出力部４１０は、例えば、「『京都府長岡京市神足１丁目にある長岡京駅』の半径１００ｍにおいて、冷たい飲み物を提供する店舗」に該当する店舗のウェブサイトの一覧を、出力装置１３０が備えるディスプレイに表示する。なお、本例において、例えば、位置情報が「京都府長岡京市神足１丁目にある長岡京駅の外」ではなく「京都府長岡京市東神足１丁目１０番１号の建物」を示し、気温が「３６℃」ではなく「２８℃」を示す場合、検索実行部３１０は、「今日は暑いですね。」という音声を発した話者が、当該建物において、「暑い」という単語を気温「２８℃」の中で「苛立ち」という感情とともに発していると判断してもよい。この場合、検索実行部３１０は、「当該建物において気温を制御できること」を検索し、空調を制御することを、検索結果として出力してもよい。この場合、検索結果出力部４１０は、例えば、当該空調の設定温度を「２５℃」に変更することを出力する。

　次に、図７を参照しながら、辞書データベース更新処理の流れについて説明する。
　送信装置１１０は、所定の契機で辞書データベース更新指示を作成し（Ｓ７００）、これを検索装置１２０に送信する（Ｓ７０１）。検索装置１２０は、辞書データベース更新指示を受信すると（Ｓ７０２）、キーワードデータベース３４０から音声キーワードを取得し（Ｓ７０３）、音声キーワードの関連語を推測する（Ｓ７０４）。次に、検索装置１２０は、音声キーワードとその関連語に基づいて、更新された辞書データベース２２０を作成し（Ｓ７０５）、これを送信装置１１０に送信する（Ｓ７０６）。送信装置１１０は、更新後の辞書データベース２２０を受信すると（Ｓ７０７）、更新前の辞書データベース２２０を更新後の辞書データベース２２０に差し替えることにより、辞書データベース２２０を更新する（Ｓ７０８）。

　以上、本発明の例示的な実施形態について説明した。本実施形態によれば、音声を収集して当該音声を示す音声データを生成し、音声データから、音声に含まれるキーワードである音声キーワードを抽出し、音声データから、音声の強さ、速度及び抑揚の少なくとも一つを含む、音声の特徴を抽出し、音声の特徴に基づいて、予め格納された感情キーワード群から、抽出された音声の特徴に対応する感情キーワードを選択し、抽出された音声キーワード及び選択された感情キーワードを送信する。これにより、音声から抽出された単語と感情の双方に基づいて検索することができるので、当該音声を発した話者のニーズにより応じた情報を提供することができる。

　また、本実施形態において、ラッセルの感情円環モデルに含まれるキーワードを、キーワード群として格納してもよい。これにより、話者の感情をより的確に抽出することができる。

　また、本実施形態において、音声に含まれる単語が辞書データベースに格納された単語のいずれかと一致した場合に、当該単語を音声キーワードとして抽出してもよい。これにより、音声キーワードを抽出するアルゴリズムの負荷を低減させることができる。

　また、本実施形態において、音声収集部が音声を収集してから所定の期間が経過したこと、音声特徴抽出部が抽出した音声の強さが所定の値を超えたこと、又は、音声キーワード抽出部が所定の単語を抽出したことに応答して、音声キーワード及び選択された感情キーワードを送信してもよい。これにより、検索の精度をさらに上げることができる。

　また、本実施形態において、所定の検索による検索結果を出力してもよい。これにより、検索結果を話者に伝えたり、又は、話者が置かれた環境に反映させたりすることができる。

　辞書データベース２２０に登録されている音声キーワードに一致するものとして、音声収集部２００が収集した音声から抽出された音声キーワードとその関連語とに基づいて辞書データベース２２０を更新することにより、辞書データベース２２０のヒット率を高めることができる。これにより、辞書データベース２２０を最適化することができる。辞書データベース２２０を最適化することにより、音声収集部２００が収集する音声（例えば、顧客が実際に発話した音声）に基づいて、商品又はサービスが実際に流行しているか否かを適切に判断することができる。また、音声収集部２００が収集する音声は、送信装置１１０が置かれている場所で実際に収集された音声であるため、インターネット上の評価ではなく、現実社会における評価を基礎として、商品又はサービスが実際に流行しているか否かを判断できる。また、辞書データベース２２０の更新を繰り返すことにより、不要なキーワードは、辞書データベース２２０から削除されるため、辞書データベース２２０の記憶容量は少なくてもよい。これにより、送信装置１１０の小型化及び低消費電力化が可能となる。

　なお、以上説明した各実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更／改良され得るととともに、本発明にはその等価物も含まれる。即ち、各実施形態に当業者が適宜設計変更を加えたものも、本発明の特徴を備えている限り、本発明の範囲に包含される。例えば、各実施形態が備える各要素及びその配置、材料、条件、形状、サイズなどは、例示したものに限定されるわけではなく適宜変更することができる。また、各実施形態は例示であり、異なる実施形態で示した構成の部分的な置換又は組み合わせが可能であることは言うまでもなく、これらも本発明の特徴を含む限り本発明の範囲に包含される。

１００…検索システム、１１０…送信装置、１２０…検索装置、１３０…出力装置、２００…音声収集部、２１０…音声キーワード抽出部、２２０…辞書データベース、２３０…音声特徴抽出部、２４０…感情キーワード選択部、２５０…感情データベース、２６０…送信部、３００…キーワード受信部、３１０…検索実行部、３２０…データベース、３３０…検索結果送信部、４００…検索結果受信部、４１０…検索結果出力部

Claims

　コンピュータに、
　音声を収集して当該音声を示す音声データを生成する音声収集部と、
　前記音声データから、前記音声に含まれるキーワードである音声キーワードを抽出する音声キーワード抽出部と、
　前記音声データから、前記音声の強さ、速度及び抑揚の少なくとも一つを含む、前記音声の特徴を抽出する音声特徴抽出部と、
　前記音声の特徴に基づいて、予め格納された感情キーワード群から、抽出された前記音声の特徴に対応する感情キーワードを選択する感情キーワード選択部と、
　抽出された前記音声キーワード及び選択された前記感情キーワードを送信する送信部と、
　を実現させるための送信プログラム。
　請求項１に記載の送信プログラムであって、
　前記コンピュータに、ラッセルの感情円環モデルに含まれるキーワードを、前記キーワード群として格納する感情データベースをさらに実現させる、
　送信プログラム。
　請求項１又は２に記載の送信プログラムであって、
　前記コンピュータに、複数の単語が予め格納された辞書データベースをさらに実現させ、
　前記音声キーワード抽出部は、前記音声に含まれる単語が前記辞書データベースに格納された単語のいずれかと一致した場合に、当該単語を前記音声キーワードとして抽出する、
　送信プログラム。
　請求項１から３のいずれか一項に記載の送信プログラムであって、
　送信部は、前記音声収集部が音声を収集してから所定の期間が経過したことに応答して、前記音声キーワード及び選択された前記感情キーワードを送信する、
　送信プログラム。
　請求項１から３のいずれか一項に記載の送信プログラムであって、
　前記音声特徴抽出部は、前記音声の特徴として、少なくとも前記音声の強さを抽出し、
　送信部は、前記音声特徴抽出部が抽出した前記音声の強さが所定の値を超えたことに応答して、前記音声キーワード及び選択された前記感情キーワードを送信する、
　送信プログラム。
　請求項１から３のいずれか一項に記載の送信プログラムであって、
　送信部は、前記音声キーワード抽出部が所定の単語を抽出したことに応答して、前記音声キーワード及び選択された前記感情キーワードを送信する、
　送信プログラム。
　請求項１から６のいずれか一項に記載の送信プログラムであって、
　前記コンピュータに、前記所定の検索による検索結果を出力する出力部をさらに実現させる、
　送信プログラム。
　音声を収集して当該音声を示す音声データを生成する音声収集部と、
　前記音声データから、前記音声に含まれるキーワードである音声キーワードを抽出する音声キーワード抽出部と、
　前記音声データから、前記音声の強さ、速度及び抑揚の少なくとも一つを含む、前記音声の特徴を抽出する音声特徴抽出部と、
　前記音声の特徴に基づいて、予め格納された感情キーワード群から、抽出された前記音声の特徴に対応する感情キーワードを選択する感情キーワード選択部と、
　抽出された前記音声キーワード及び選択された前記感情キーワードを送信する送信部と、
　を備えた送信装置。
　音声を収集して当該音声を示す音声データを生成することと、
　前記音声データから、前記音声に含まれるキーワードである音声キーワードを抽出することと、
　前記音声データから、前記音声の強さ、速度及び抑揚の少なくとも一つを含む、前記音声の特徴を抽出することと、
　前記音声の特徴に基づいて、予め格納された感情キーワード群から、抽出された前記音声の特徴に対応する感情キーワードを選択することと、
　抽出された前記音声キーワード及び選択された前記感情キーワードを送信することと
を含む送信方法。
　請求項８に記載の送信装置であって、
　前記送信部は、前記送信装置の位置情報を送信する、送信装置。
　請求項３に記載の前記音声キーワード及び前記感情キーワードに基づく検索処理を実行する検索装置であって、
　前記音声キーワードを格納するキーワードデータベースと、
　前記辞書データベースの更新指示を前記コンピュータから受信する受信部と、
　前記受信部を通じて受信された前記更新指示に応答して、前記キーワードデータベースに格納されている音声キーワードの関連語を推測する推測部と、
　前記キーワードデータベースに格納されている音声キーワードと、前記推測された関連語とに基づいて、更新後の辞書データベースを作成する辞書データベース作成部と、
　前記更新後の辞書データベースを前記コンピュータに送信する送信部と、
　を備える検索装置。