WO2018179425A1

WO2018179425A1 - 音声内容記録システム、方法及びプログラム

Info

Publication number: WO2018179425A1
Application number: PCT/JP2017/013825
Authority: WO
Inventors: 俊二菅谷
Original assignee: 株式会社オプティム
Priority date: 2017-03-31
Filing date: 2017-03-31
Publication date: 2018-10-04
Also published as: US20200312325A1; CN110709923B; JPWO2018179425A1; US11328727B2; CN110709923A; JP6845446B2

Abstract

【課題】作業状況等を録音することで、録音した内容を位置情報と紐付けて文章化するシステムを提供する。【解決手段】本発明の音声内容記録システム１において、制御部１０は、取得モジュール１１を実行し、音声、及び音声が発声された位置を取得する。また、制御部１０は、音声認識モジュール１２を実行し、取得された音声を音声認識する。また、制御部１０は、特定モジュール１３を実行し、取得モジュール１１の実行によって取得された位置に紐づいたＷｅｂコンテンツを特定する。また、制御部１０は、記録モジュール１４を実行し、特定モジュール１３の実行により特定されたＷｅｂコンテンツに、音声認識モジュール１２の実行により音声認識された内容を記録する。

Description

音声内容記録システム、方法及びプログラム

　本発明は、音声内容記録システム、方法及びプログラムに関する。

　従来より、録音された音声の内容をテキスト化する技術が提案されている（特許文献１参照）。

特開２０１４－２０２８４８号公報

　ところで、農業従事者にとって、農作業をしながらメモをとることは煩雑であり、作業状況を録音するだけでテキストとして記録できるシステムは、非常に有用である。しかしながら、農業のように、一定の面積を有する広い範囲で作業する職業の場合、作業状況を記録する際、作業状況を位置情報と紐付けて文章化して記録することができれば、よりいっそう利便性が高まる。

　本発明は、このような要望に鑑みてなされたものであり、作業状況等を録音することで、録音した内容を位置情報と紐付けて文章化するシステムを提供することを目的とする。

　本発明では、以下のような解決手段を提供する。

　第１の特徴に係る発明は、Ｗｅｂコンテンツに音声認識された内容を記録する音声内容記録システムであって、
　音声、及び前記音声が発声された位置を取得する取得手段と、
　前記取得された音声を音声認識する音声認識手段と、
　前記取得された位置に紐づいたＷｅｂコンテンツを特定する特定手段と、
　前記特定されたＷｅｂコンテンツに、前記音声認識された内容を記録する記録手段と、
を備える音声内容記録システムを提供する。

　第１の特徴に係る発明によれば、取得手段が音声を取得すると、その音声を音声認識手段が認識するとともに、特定手段は、取得手段が音声を取得した位置に紐づいたＷｅｂコンテンツを特定する。そして、記録手段は、特定手段が特定したＷｅｂコンテンツに、音声認識された内容を記録する。これにより、取得手段に音声を取得させることで、取得手段が取得した音声の内容を、音声が発声された位置と紐付けてＷｅｂコンテンツに記録するシステムを提供できる。

　第２の特徴に係る発明は、第１の特徴に係る発明であって、
　前記特定手段は、前記取得された位置が特定範囲の内側にあるかどうかを判断し、当該特定範囲に紐づいたＷｅｂコンテンツを特定する、音声内容記録システムを提供する。

　農業のように、一定の面積を有する広い範囲で作業する職業の場合、音声が発声された位置を厳密に定めすぎると、データ量が多くなりすぎて、かえって使いづらいシステムになることもあり得る。第２の特徴に係る発明によれば、Ｗｅｂコンテンツを特定範囲と紐付けて管理しているため、データ量が多くなりすぎ、煩雑になることを防ぐことができる。

　第３の特徴に係る発明は、第１又は第２の特徴に係る発明であって、
　前記記録手段は、前記特定されたＷｅｂコンテンツに既に情報がある場合に、前記音声認識された内容を上書きして記録する、音声内容記録システムを提供する。

　第３の特徴に係る発明によれば、農作業の作業記録等を時系列で管理することが可能になる。

　第４の特徴に係る発明は、第１から第３のいずれかの特徴に係る発明であって、
　前記記録手段は、前記音声認識された内容に基づいて、前記特定されたＷｅｂコンテンツ内の特定の項目には、関連する前記音声認識された特定の内容を記録する、音声内容記録システムを提供する。

　第４の特徴に係る発明によれば、Ｗｅｂコンテンツ内の特定の項目には、音声認識された特定の内容が記録される。そのため、不要な内容がＷｅｂコンテンツに記録されることがなくなり、ユーザにとってよりいっそう利便性の高いシステムを提供できる。

　第５の特徴に係る発明は、第１から第４のいずれかの特徴に係る発明であって、
　前記取得手段は、音声と、前記音声が発声された位置と、前記音声が発声された日付と、を取得し、
　前記特定手段は、前記取得された位置及び日付に紐づいたＷｅｂコンテンツを特定する、音声内容記録システムを提供する。

　第５の特徴に係る発明によれば、Ｗｅｂコンテンツに日付が紐付けられるため、ユーザにとってよりいっそう利便性の高いシステムを提供できる。

　第６の特徴に係る発明は、第１から第５のいずれかの特徴に係る発明であって、
　前記Ｗｅｂコンテンツは、前記位置を含む地図を備え、
　前記記録手段は、前記Ｗｅｂコンテンツの地図上の前記位置に、前記音声認識された内容を重畳表示する、音声内容記録システムを提供する。

　第６の特徴に係る発明によれば、取得手段に音声を取得させることで、取得手段が取得した音声の内容を、音声が発声された位置と紐付けてＷｅｂコンテンツに記録される。そして、Ｗｅｂコンテンツの地図上に、音声認識された内容が重畳表示される。そのため、ユーザにとってよりいっそう利便性の高いシステムを提供できる。

　第７の特徴に係る発明は、第１から第６のいずれかの特徴に係る発明であって、
　前記取得手段は、スマートグラスから音声を取得し、当該スマートグラスの位置から当該音声が発声された位置を取得する、音声内容記録システムを提供する。

　第７の特徴に係る発明によれば、端末を持ち運びする必要がないため、農作業のように、両手が作業用具でふさがりがちなユーザにとってよりいっそう利便性の高いシステムを提供できる。

　第８の特徴に係る発明は、第７の特徴に係る発明であって、
　前記Ｗｅｂコンテンツは、前記位置を含む地図を備え、
　前記記録手段は、前記Ｗｅｂコンテンツの地図上に、前記スマートグラスの現在位置を重畳表示する、音声内容記録システムを提供する。

　第８の特徴に係る発明によれば、端末を持ち運びする必要がないことに加え、Ｗｅｂコンテンツの地図上に、音声認識された内容が重畳表示される。そのため、農作業のように、両手が作業用具でふさがりがちなユーザにとってよりいっそう利便性の高いシステムを提供できる。

　本発明によれば、取得手段に音声を取得させることで、取得手段が取得した音声の内容を、音声が発声された位置と紐付けてＷｅｂコンテンツに記録するシステムを提供できる。

図１は、本実施形態における音声内容記録システム１のハードウェア構成とソフトウェア機能を示すブロック図である。図２は、本実施形態における音声内容記録方法を示すフローチャートである。図３は、取得モジュール１１の内容を説明するための一例である。図４は、図３に続く例である。図５は、図４に続く例である。図６は、本実施形態における音声データベース３１の一例である。図７は、本実施形態における辞書データベース３２の一例である。図８は、本実施形態におけるＷｅｂコンテンツデータベース３３の一例である。図９は、本実施形態における分類データベース３４の一例である。図１０は、本実施形態における画像表示部７０での表示内容の一例である。

　以下、本発明を実施するための形態について図を参照しながら説明する。なお、これはあくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。

＜音声内容記録システム１の構成＞
　図１は、本実施形態における音声内容記録システム１のハードウェア構成とソフトウェア機能を説明するためのブロック図である。

　音声内容記録システム１は、データを制御する制御部１０と、他の機器と通信を行う通信部２０と、データを記憶する記憶部３０と、ユーザの操作を受け付ける入力部４０と、ユーザの声を集音する集音部５０と、音声内容記録システム１が存在する位置を検出する位置検出部６０と、制御部１０で制御したデータや画像を出力表示する画像表示部７０とを備える。

　音声内容記録システム１は、スマートフォン、スマートグラス、スマートウォッチ等の携帯端末に一体的に設けられたスタンドアローン型のシステムであってもよいし、携帯端末と当該携帯端末とネットワークを介して接続されるサーバとを備えるクラウド型のシステムであってもよい。本実施形態では、簡単のため、音声内容記録システム１がスタンドアローン型のシステムであるものとして説明する。

　制御部１０は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）等を備える。

　通信部２０は、他の機器と通信可能にするためのデバイス、例えば、ＩＥＥＥ８０２．１１に準拠したＷｉ－Ｆｉ（Ｗｉｒｅｌｅｓｓ　Ｆｉｄｅｌｉｔｙ）対応デバイスを備える。

　制御部１０は、所定のプログラムを読み込み、必要に応じて通信部２０と協働することで、取得モジュール１１と、音声認識モジュール１２と、特定モジュール１３と、記録モジュール１４とを実現する。

　記憶部３０は、データやファイルを記憶する装置であって、ハードディスクや半導体メモリ、記録媒体、メモリカード等による、データのストレージ部を備える。記憶部３０は、後に説明する音声データベース３１、辞書データベース３２、Ｗｅｂコンテンツデータベース３３、分類データベース３４、及び地図データベース３５を記憶する。また、記憶部３０は、画像表示部７０に表示させる画像のデータを記憶する。

　入力部４０の種類は、特に限定されない。入力部４０として、例えば、キーボード、マウス、タッチパネル等が挙げられる。

　集音部５０の種類は、特に限定されない。集音部５０として、例えば、マイク等が挙げられる。

　位置検出部６０は、音声内容記録システム１が位置する緯度及び経度を検出できる装置であれば、特に限定されない。位置検出部６０として、例えば、ＧＰＳ（Ｇｌｏｂａｌ　Ｐｏｓｉｔｉｏｎｉｎｇ　Ｓｙｓｔｅｍ）が挙げられる。

　画像表示部７０の種類は、特に限定されない。画像表示部７０して、例えば、モニタ、タッチパネル等が挙げられる。

＜音声内容記録システム１を用いた音声内容記録方法を示すフローチャート］
　図２は、音声内容記録システム１を用いた音声内容記録方法を示すフローチャートである。上述した各ハードウェアと、ソフトウェアモジュールが実行する処理について説明する。

〔ステップＳ１０：音声、音声が発生された位置の取得〕
　最初に、音声内容記録システム１の制御部１０は、取得モジュール１１を実行し、音声と、音声が発声された位置とを取得する（ステップＳ１０）。また、必須ではないが、制御部１０は、記憶部３０に記憶されているカレンダー（図示せず）を参照し、音声が発声された日付をさらに取得することが好ましい。

　図３～図５は、ステップＳ１０の処理を説明するための一例である。ここでは、山田農場を営む農家が山田農場Ａで栽培する長ネギ畑の様子を観察するものとして説明する。図３に示すように、農家は、緯度：北緯３５度５２分７秒、経度：東経１３９度４６分５６秒の地点にて、「天気予報では雨だったが晴れた。茎が３０ｃｍに成長した。土壌は良好。収穫まで１週間前後かな。」と音声を発生している。

　音声内容記録システム１の集音部５０は、その音声を集音する。そして、制御部１０は、集音部５０で集音した音声をＡ／Ｄ変換し、Ａ／Ｄ変換された情報を記憶部３０の所定領域にセットする。

　その際、音声内容記録システム１の位置検出部６０は、音声内容記録システム１が位置する緯度及び経度を検出する。ここでは、位置検出部６０は、緯度が北緯３５度５２分７秒、経度が東経１３９度４６分５６秒であると検出する。位置に関する情報もまた、Ａ／Ｄ変換された情報とともに記憶部３０の所定領域にセットされる。

　続いて、図４に示すように、農家は、緯度：北緯３５度５２分２秒、経度：東経１３９度４７分５２秒の地点に移動し、「ここに害虫Ａがいた。」と音声を発生している。

　音声内容記録システム１の集音部５０は、その音声を集音する。そして、制御部１０は、集音部５０で集音した音声をＡ／Ｄ変換し、Ａ／Ｄ変換された情報を記憶部３０の所定領域にセットする。また、音声内容記録システム１の位置検出部６０は、音声内容記録システム１が位置する緯度及び経度を検出し、位置に関する情報もまた、Ａ／Ｄ変換された情報とともに記憶部３０の所定領域にセットされる。

　続いて、図５に示すように、農家は、緯度：北緯３５度５１分５７秒、経度：東経１３９度４７分１秒の地点に移動し、「ここが枯れている。」と音声を発生している。

　必須ではないが、ステップＳ１０の処理において、制御部１０は、スマートグラスから音声を取得し、当該スマートグラスの位置から当該音声が発声された位置を取得することが好ましい。これにより、農家等のユーザは、端末を持ち運びする必要がないため、両手が作業用具でふさがりがちなユーザにとってよりいっそう利便性の高い音声内容記録システム１を提供できる。

〔ステップＳ１１：音声認識〕
　図２に戻る。続いて、音声内容記録システム１の制御部１０は、音声認識モジュール１２を実行し、ステップＳ１０の処理で取得した音声を音声認識する（ステップＳ１１）。

　制御部１０は、図６に示す音声データベース３１を参照し、Ａ／Ｄ変換された情報が有する音波の波形から、集音部５０で集音した音声を文字起こしする。この処理により、図３に示した段階でＡ／Ｄ変換された情報は、「テンキヨホウデハアメダッタガハレタ／クキガサンジュッセンチニセイチョウシタ／ドジョウハリョウコウ／シュウカクマデイッシュウカンカナ」とされる。図４に示した段階でＡ／Ｄ変換された情報は、「ココニガイチュウエーガイタ」とされる。図５に示した段階でＡ／Ｄ変換された情報は、「ココガカレテイル」とされる。

　続いて、制御部１０は、図７に示す辞書データベース３２を参照し、文字起こしされた情報を言語に置き換え、文章化する。この処理により、図３に示した段階でＡ／Ｄ変換された情報は、「天気予報では雨だったが晴れた。茎が３０ｃｍに成長した。土壌は良好。収穫まで１週間前後かな。」とされる。図４に示した段階でＡ／Ｄ変換された情報は、「ここに害虫Ａがいた。」とされる。図５に示した段階でＡ／Ｄ変換された情報は、「ここが枯れている。」とされる。

　文章化された情報は、いずれも、Ａ／Ｄ変換された情報、位置に関する情報と関連づけて、記憶部３０の所定領域にセットされる。

〔ステップＳ１２：Ｗｅｂコンテンツの特定〕
　図２に戻る。続いて、音声内容記録システム１の制御部１０は、特定モジュール１３を実行し、ステップＳ１０の処理で取得した位置情報に紐づいたＷｅｂコンテンツを特定する。

　制御部１０は、Ｗｅｂコンテンツデータベース３３を参照する。図８は、Ｗｅｂコンテンツデータベース３３の一例である。Ｗｅｂコンテンツデータベース３３には、圃場と、圃場の範囲に関する情報が識別番号と関連づけて予め記憶されている。

　例えば、緯度が北緯３５度５１分５５秒～３５度５２分１０秒、経度が東経１３９度４６分５５秒～１３９度４７分５秒で囲まれる領域は、山田農場Ａの領域である。そして、山田農場Ａの領域は、識別番号「１」として関連づけられている。

　同様に、緯度が北緯３５度５２分１０秒～３５度５２分２０秒、経度が東経１３９度４６分５５秒～１３９度４７分５秒で囲まれる領域は、山田農場Ｂの領域である。そして、山田農場Ｂの領域は、識別番号「２」として関連づけられている。

　図３～図５の段階を経て記憶部３０の所定領域にセットされている位置情報は、（１）緯度：北緯３５度５２分７秒、経度：東経１３９度４６分５６秒、（２）緯度：北緯３５度５２分２秒、経度：東経１３９度４７分５２秒、（３）緯度：北緯３５度５１分５７秒、経度：東経１３９度４７分１秒である。Ｗｅｂコンテンツデータベース３３を参照すると、これらの位置情報は、いずれも、識別番号「１」の山田農場Ａにおいて特定された範囲の内側に相当する。そのため、制御部１０は、ステップＳ１０の処理で取得した位置情報に紐づいたＷｅｂコンテンツが、識別番号「１」の山田農場ＡのＷｅｂコンテンツであると特定できる。

　本実施形態において、制御部１０は、ステップＳ１０の処理で取得した位置が、Ｗｅｂコンテンツデータベース３３で定める特定範囲の内側にあるかどうかを判断し、当該特定範囲に紐づいたＷｅｂコンテンツを特定するようにしている。例えば、農業のように、一定の面積を有する広い範囲で作業する職業の場合、音声が発声された位置を厳密に定めすぎると、データ量が多くなりすぎて、かえって使いづらいシステムになることもあり得る。本実施形態に記載の発明によれば、Ｗｅｂコンテンツを特定範囲と紐付けて管理しているため、データ量が多くなりすぎ、煩雑になることを防ぐことができる。

　Ｗｅｂコンテンツデータベース３３には、作物の生育状態の情報も記録されている。Ｗｅｂコンテンツデータベース３３には、「日付」、「天気」、「圃場」、「作物」、「茎」、「土壌」、「収穫」、「害虫」、「枯れ」等の項目がリストアップされている。

　例えば、２０１７年２月１日、２月７日の状況が既に記録されている。本日は、２月１４日である。制御部１０は、記憶部３０に記憶されているカレンダー（図示せず）を読み出すことで、Ｗｅｂコンテンツデータベース３３の「日付」には、本日の日付である「２月１４日」が予め記録されている。また、制御部１０は、通信部２０を介して外部の天気予報提供Ｗｅｂサイトから天気の情報を読み出すことで、Ｗｅｂコンテンツデータベース３３の「天気」には、本日の天気である「晴れ」が予め記録されている。

　また、Ｗｅｂコンテンツデータベース３３の「圃場」及び「作物」には、制御部１０は、過去の情報を援用することで、「山田農場Ａ」、「長ネギ」との情報が予め記録されている。

　本実施形態によると、ステップＳ１０の処理において、制御部１０は、音声と、音声が発声された位置と、前記音声が発声された日付と、を取得し、ステップＳ１１の処理において、制御部１０は、ステップＳ１０の処理で取得した位置及び日付に紐づいたＷｅｂコンテンツを特定する。これにより、Ｗｅｂコンテンツに日付が紐付けられるため、ユーザにとってよりいっそう利便性の高い音声内容記録システム１を提供できる。

〔ステップＳ１３：特定したＷｅｂコンテンツに、音声認識された内容を記録〕
　図２に戻る。続いて、音声内容記録システム１の制御部１０は、記録モジュール１４を実行し、ステップＳ１２の処理で特定したＷｅｂコンテンツに、ステップＳ１１の処理で音声認識した内容を記録する（ステップＳ１３）。

　制御部１０は、ステップＳ１１の処理で音声認識した内容を読み出す。記憶部３０の所定領域には、順に、「天気予報では雨だったが晴れた。茎が３０ｃｍに成長した。土壌は良好。収穫まで１週間前後かな。」との情報、「ここに害虫Ａがいた。」との情報、「ここが枯れている。」との情報が記憶されている。制御部１０は、記憶部３０の所定領域から、これらの情報を読み出す。

　続いて、制御部１０は、分類データベース３４を参照する。図９は、分類データベース３４の一例である。分類データベースは、文章化された内容に含まれる単語等と、Ｗｅｂコンテンツデータベース３３にリストアップされている項目との関係が予め記録されている。本実施形態では、Ｗｅｂコンテンツデータベース３３（図８）には、「日付」、「天気」、「圃場」、「作物」、「茎」、「土壌」、「収穫」、「害虫」、「枯れ」等の項目がリストアップされている。分類データベース３４には、これら項目に関連する単語群が記録されている。

　音声認識された内容の一つである「天気予報では雨だったが晴れた。茎が３０ｃｍに成長した。土壌は良好。収穫まで１週間前後かな。」との情報について説明する。制御部１０は、分類データベース３４を参照し、この情報に含まれる「３０ｃｍ」を項目「茎」と関連づける。また、「良好」を項目「土壌」と関連づけ、「１週間」を項目「収穫」と関連づける。そこで、制御部１０は、Ｗｅｂコンテンツデータベース３３（図８）の「２．作物の生育状態」の識別番号「１」、日付「２０１７年２月１４日」のところに、項目「茎」には、「３０ｃｍ」との情報を、項目「土壌」には「良好」との情報を、項目「収穫」には「１週間前後」との情報をセットする。

　また、「ここに害虫Ａがいた。」との情報について説明する。制御部１０は、分類データベース３４を参照し、この情報に含まれる「ここに害虫」を項目「害虫」と関連づける。そこで、制御部１０は、Ｗｅｂコンテンツデータベース３３（図８）の「２．作物の生育状態」の識別番号「１」、日付「２０１７年２月１４日」のところに、項目「害虫」には、「ここに害虫Ａがいた。」との情報をセットしたときの位置情報である「緯度：北緯３５度５２分２秒、経度：東経１３９度４７分５２秒」との情報、及び害虫の種類である「害虫Ａ」の情報をセットする。

　また、「ここが枯れている。」との情報について説明する。制御部１０は、分類データベース３４を参照し、この情報に含まれる「ここが枯れ」を項目「枯れ」と関連づける。そこで、制御部１０は、Ｗｅｂコンテンツデータベース３３（図８）の「２．作物の生育状態」の識別番号「１」、日付「２０１７年２月１４日」のところに、項目「枯れ」には、「ここが枯れている。」との情報をセットしたときの位置情報である「緯度：北緯３５度５１分５７秒、経度：東経１３９度４７分１秒」との情報をセットする。

　本実施形態において、制御部１０は、ステップＳ１２の処理で特定したＷｅｂコンテンツに既に情報がある場合、ステップＳ１１の処理で音声認識した内容を上書きして記録する。これにより、農作業の作業記録等を時系列で管理することが可能になる。

　また、制御部１０は、ステップＳ１１の処理で音声認識した内容に基づいて、ステップＳ１２の処理で特定したＷｅｂコンテンツ内の特定の項目（例えば、日付、天気、圃場、作物、茎、土壌、収穫、害虫、枯れといった項目）には、関連する音声認識された特定の内容を記録する。

　これにより、音声認識された全ての情報（ここでは、「天気予報では雨だったが晴れた。茎が３０ｃｍに成長した。土壌は良好。収穫まで１週間前後かな。」との情報、「ここに害虫Ａがいた。」との情報、及び「ここが枯れている。」との情報）の全てをＷｅｂコンテンツに記録されることがなくなり、不要な内容を削除できる。そのため、ユーザにとってよりいっそう利便性の高い音声内容記録システム１を提供できる。

〔ステップＳ１４：Ｗｅｂコンテンツの画像表示〕
　図２に戻る。続いて、音声内容記録システム１の制御部１０は、ステップＳ１３の処理で記録したＷｅｂコンテンツを画像表示部７０に表示する。

　図１０は、そのときの画像表示部７０の表示例を示す。

　画像表示部７０には、Ｗｅｂコンテンツデータベース３３に記録された情報が表示される。具体的に、右上には、本日の日付である「２０１７／２／１４」と表示され、その下には、本日の天気である「晴れ」と表示される。

　そして、画像表示部７０の左上から下に向かって順に、圃場として「山田農場Ａ」、作物として「長ネギ」、作物の茎の生育状況として「３０ｃｍ」、土壌として「良好」、収穫時期として「１週間前後」と表示される。

　また、制御部１０は、地図データベース３５を参照し、Ｗｅｂコンテンツデータベース３３の識別番号「１」に相当する領域の地図を画像表示部７０に表示させる。そして、制御部１０は、位置検出部６０で検出される点を、地図上の「現在位置」として表示する。また、制御部１０は、Ｗｅｂコンテンツデータベース３３において、項目「害虫」としてセットされた点を、地図上の害虫がいる位置として表示する。また、制御部１０は、Ｗｅｂコンテンツデータベース３３において、項目「枯れ」としてセットされた点を、地図上の枯れが生じている位置として表示する。

　本実施形態に記載の発明によれば、ステップＳ１０の処理で制御部１０が音声を取得すると、ステップＳ１１の処理においてその音声を制御部１０が認識するとともに、ステップＳ１２の処理において、制御部１０は、音声を取得した位置に紐づいたＷｅｂコンテンツを特定する。そして、ステップＳ１３の処理において、制御部１０は、特定されたＷｅｂコンテンツに、音声認識された内容を記録する。これにより、ステップＳ１０の処理で制御部１０が取得した音声の内容を、音声が発声された位置と紐付けてＷｅｂコンテンツに記録する音声内容記録システム１を提供できる。

　また、画像表示部７０に表示されるＷｅｂコンテンツは、音声を取得した位置をはじめとした位置情報を含む地図を備え、制御部１０は、Ｗｅｂコンテンツの地図上に、ステップＳ１１の処理で音声認識した内容を重畳表示する。本実施形態に記載の発明によれば、ステップＳ１０の処理で音声を取得させることで、制御部１０が取得した音声の内容を、音声が発声された位置と紐付けてＷｅｂコンテンツに記録される。そして、画像表示部７０において、Ｗｅｂコンテンツの地図上に、音声認識された内容が重畳表示される。そのため、ユーザにとってよりいっそう利便性の高い音声内容記録システム１を提供できる。

　上述した手段、機能は、コンピュータ（ＣＰＵ、情報処理装置、各種端末を含む）が、所定のプログラムを読み込んで、実行することによって実現される。プログラムは、例えば、フレキシブルディスク、ＣＤ（ＣＤ－ＲＯＭなど）、ＤＶＤ（ＤＶＤ－ＲＯＭ、ＤＶＤ－ＲＡＭなど）等のコンピュータ読取可能な記録媒体に記録された形態で提供される。この場合、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置又は外部記憶装置に転送し記憶して実行する。また、そのプログラムを、例えば、磁気ディスク、光ディスク、光磁気ディスク等の記憶装置（記録媒体）に予め記録しておき、その記憶装置から通信回線を介してコンピュータに提供するようにしてもよい。

　以上、本発明の実施形態について説明したが、本発明は上述したこれらの実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。

　１　　音声内容記録システム
　１０　制御部
　１１　取得モジュール
　１２　音声認識モジュール
　１３　特定モジュール
　１４　記録モジュール
　２０　通信部
　３０　記憶部
　３１　音声データベース
　３２　辞書データバース
　３３　Ｗｅｂコンテンツデータベース
　３４　分類データベース
　３５　地図データベース
　４０　入力部
　５０　集音部
　６０　位置検出部
　７０　画像表示部

Claims

　Ｗｅｂコンテンツに音声認識された内容を記録する音声内容記録システムであって、
　音声、及び前記音声が発声された位置を取得する取得手段と、
　前記取得された音声を音声認識する音声認識手段と、
　前記取得された位置に紐づいたＷｅｂコンテンツを特定する特定手段と、
　前記特定されたＷｅｂコンテンツに、前記音声認識された内容を記録する記録手段と、
を備える音声内容記録システム。
　前記特定手段は、前記取得された位置が特定範囲の内側にあるかどうかを判断し、当該特定範囲に紐づいたＷｅｂコンテンツを特定する、請求項１に記載の音声内容記録システム。
　前記記録手段は、前記特定されたＷｅｂコンテンツに既に情報がある場合に、前記音声認識された内容を上書きして記録する、請求項１又は２に記載の音声内容記録システム。
　前記記録手段は、前記音声認識された内容に基づいて、前記特定されたＷｅｂコンテンツ内の特定の項目には、関連する前記音声認識された特定の内容を記録する、請求項１から３のいずれかに記載の音声内容記録システム。
　前記取得手段は、音声と、前記音声が発声された位置と、前記音声が発声された日付と、を取得し、
　前記特定手段は、前記取得された位置及び日付に紐づいたＷｅｂコンテンツを特定する、請求項１から４のいずれかに記載の音声内容記録システム。
　前記Ｗｅｂコンテンツは、前記位置を含む地図を備え、
　前記記録手段は、前記Ｗｅｂコンテンツの地図上の前記位置に、前記音声認識された内容を重畳表示する、請求項１から５のいずれかに記載の音声内容記録システム。
　前記取得手段は、スマートグラスから音声を取得し、当該スマートグラスの位置から当該音声が発声された位置を取得する、請求項１から６のいずれかに記載の音声内容記録システム。
　前記Ｗｅｂコンテンツは、前記位置を含む地図を備え、
　前記記録手段は、前記Ｗｅｂコンテンツの地図上に、前記スマートグラスの現在位置を重畳表示する、請求項７に記載の音声内容記録システム。
　Ｗｅｂコンテンツに音声認識された内容を記録する音声内容記録方法であって、
　音声、及び前記音声が発声された位置を取得するステップと、
　前記取得された音声を音声認識するステップと、
　前記取得された位置に紐づいたＷｅｂコンテンツを特定するステップと、
　前記特定されたＷｅｂコンテンツに、前記音声認識された内容を記録するステップと、
を備える音声内容記録方法。
　Ｗｅｂコンテンツに音声認識された内容を記録する音声内容記録システムに、
　音声、及び前記音声が発声された位置を取得するステップと、
　前記取得された音声を音声認識するステップと、
　前記取得された位置に紐づいたＷｅｂコンテンツを特定するステップと、
　前記特定されたＷｅｂコンテンツに、前記音声認識された内容を記録するステップと、
を実行させるためのプログラム。