JP6457154B1 - 音声認識補正システム、方法及びプログラム - Google Patents
音声認識補正システム、方法及びプログラム Download PDFInfo
- Publication number
- JP6457154B1 JP6457154B1 JP2018516873A JP2018516873A JP6457154B1 JP 6457154 B1 JP6457154 B1 JP 6457154B1 JP 2018516873 A JP2018516873 A JP 2018516873A JP 2018516873 A JP2018516873 A JP 2018516873A JP 6457154 B1 JP6457154 B1 JP 6457154B1
- Authority
- JP
- Japan
- Prior art keywords
- information
- voice
- recognized
- content
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012937 correction Methods 0.000 title claims abstract description 92
- 238000000034 method Methods 0.000 title claims description 32
- 230000006870 function Effects 0.000 description 18
- 238000001514 detection method Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 12
- 238000005259 measurement Methods 0.000 description 10
- 238000007726 management method Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 101100493705 Caenorhabditis elegans bath-36 gene Proteins 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
ユーザが特定の時点以前に訪れた場所の位置情報を取得する位置情報取得手段と、
前記ユーザが発声した音声を音声認識する音声認識手段と、
前記取得された、前記ユーザが特定の時点以前に訪れた場所の位置情報に関連する複数の項目についての履歴情報のうち、再認識する音声の部分の項目に対応する項目の履歴情報を複数選択し、選択された当該履歴情報に相当する音声データを合成し、合成した音声データと前記再認識する音声の部分とを比較し、最も近い履歴情報を、前記再認識する音声の部分の内容にするように、前記音声認識された内容を補正する補正手段と、
を備える音声認識補正システムを提供する。
前記位置情報取得手段は、前記ユーザの携帯端末から、当該ユーザが特定の時点以前に訪れた場所の位置情報を取得する、音声認識補正システムを提供する。
前記補正手段は、前記取得された位置情報に関するWebコンテンツを参照して、前記音声認識された内容を補正する、音声認識補正システムを提供する。
前記補正手段は、前記取得された位置情報における天気情報を特定して、前記音声認識された内容を補正する、音声認識補正システムを提供する。
前記補正手段は、前記取得された位置情報における時間情報を特定して、前記音声認識された内容を補正する、音声認識補正システムを提供する。
前記ユーザの携帯端末から、当該ユーザの状態を示す状態情報を取得する状態情報取得手段をさらに備え、
前記補正手段は、前記取得された位置情報における状態情報を特定して、前記音声認識された内容を補正する、音声認識補正システムを提供する。
前記ユーザが決済した決済情報を取得する決済情報取得手段をさらに備え、
前記補正手段は、前記取得された位置情報における決済情報を特定して、前記音声認識された内容を補正する、音声認識補正システムを提供する。
複数の携帯端末と、これら複数の携帯端末とネットワークで接続されている管理コンピュータとを含んで構成され、
前記複数の携帯端末は、前記位置情報取得手段と、前記ユーザが発声した音声に関する音声情報を取得する音声情報取得手段とを有し、
前記管理コンピュータは、前記複数の携帯端末によって取得された前記位置情報及び前記音声情報を受信可能に構成され、
前記管理コンピュータは、前記位置情報を送信した携帯端末と、前記音声情報を送信した携帯端末とが同一の携帯端末であるかを判別する判別手段と、前記補正手段とを有し、
前記補正手段は、前記判別手段により同一の携帯端末であると判別された場合に、前記取得された、前記ユーザが特定の時点以前に訪れた場所の位置情報に関連する複数の項目についての履歴情報のうち、再認識する音声の部分の項目に対応する項目の履歴情報を複数選択し、選択された当該履歴情報に相当する音声データを合成し、合成した音声データと前記再認識する音声の部分とを比較し、最も近い履歴情報を、前記再認識する音声の部分の内容にするように、前記音声認識された内容を補正する、音声認識補正システム、を提供する。
前記補正された内容を復唱する復唱手段と、
前記復唱された結果、問題がない場合に前記補正された内容を記録する記録手段とをさらに備える、音声認識システムを提供する。
まず、本発明の第1の実施形態について説明する。
図1は、本実施形態における音声認識補正システム1のハードウェア構成とソフトウェア機能を説明するためのブロック図である。
図2は、音声認識補正システム1を用いた音声認識補正方法を示すフローチャートである。上述した各ハードウェアと、ソフトウェアモジュールが実行する処理について説明する。
最初に、音声認識補正システム1の制御部10は、位置情報取得モジュール11を実行し、ユーザが特定の時点以前に訪れた場所の位置情報を取得する(ステップS10)。
図2に戻る。続いて、制御部10は、状態情報等取得モジュール12を実行し、ユーザの状態を示す状態情報や、現在の天気の情報、クレジットカードや電子決済に関する決済情報等を取得する(ステップS11)。
図2に戻る。続いて、制御部10は、集音部50がユーザの音声を集音したか否かを判別する(ステップS12)。
図2に戻る。続いて、制御部10は、音声認識モジュール13を実行し、集音部50が集音した音声を音声認識する(ステップS13)。
図2に戻る。続いて、制御部10は、補正モジュール14を実行し、ステップS10の処理で取得した位置情報、ステップS11の処理で取得した状態情報等に基づいて、ステップS13の処理で音声認識した内容を補正する(ステップS14)。
図2に戻る。続いて、制御部10は、復唱モジュール15を実行し、ステップS14の処理で補正された内容を復唱する(ステップS15)。
図2に戻る。続いて、制御部10は、記録モジュール16を実行し、ステップS15の処理で復唱された結果、問題がない場合に、ステップS14の処理で補正された内容を記録する(ステップS16)。
次に、本発明の第2の実施形態について説明する。
図11は、本実施形態における音声認識補正システム100のハードウェア構成とソフトウェア機能を説明するためのブロック図である。
携帯端末200は、それぞれ、制御部210と、通信部220と、記憶部230と、入力部240と、集音部250と、位置検出部260と、画像表示部280とを備える。
管理コンピュータ300は、制御部310と、通信部320と、記憶部330と、入力部340と、画像表示部380とを備える。
10 制御部
11 位置情報取得モジュール
12 状態情報等取得モジュール
13 音声認識モジュール
14 補正モジュール
15 復唱モジュール
16 記録モジュール
20 通信部
30 記憶部
31 履歴情報データベース
32 地図データベース
33 滞在時間計測領域
34 音声データベース
35 辞書データバース
36 分類データベース
40 入力部
50 集音部
60 位置検出部
70 タイマ
80 画像表示部
Claims (11)
- ユーザが特定の時点以前に訪れた場所の位置情報を取得する位置情報取得手段と、
前記ユーザが発声した音声を音声認識する音声認識手段と、
前記取得された、前記ユーザが特定の時点以前に訪れた場所の位置情報に関連する複数の項目についての履歴情報のうち、再認識する音声の部分の項目に対応する項目の履歴情報を複数選択し、選択された当該履歴情報に相当する音声データを合成し、合成した音声データと前記再認識する音声の部分とを比較し、最も近い履歴情報を、前記再認識する音声の部分の内容にするように、前記音声認識された内容を補正する補正手段と、
を備える音声認識補正システム。 - 前記位置情報取得手段は、前記ユーザの携帯端末から、当該ユーザが特定の時点以前に訪れた場所の位置情報を取得する、請求項1に記載の音声認識補正システム。
- 前記補正手段は、前記取得された位置情報に関するWebコンテンツを参照して、前記音声認識された内容を補正する、請求項1又は2に記載の音声認識補正システム。
- 前記補正手段は、前記取得された位置情報における天気情報を特定して、前記音声認識された内容を補正する、請求項1から3のいずれかに記載の音声認識補正システム。
- 前記補正手段は、前記取得された位置情報における時間情報を特定して、前記音声認識された内容を補正する、請求項1から4のいずれかに記載の音声認識補正システム。
- 前記ユーザの携帯端末から、当該ユーザの状態を示す状態情報を取得する状態情報取得手段をさらに備え、
前記補正手段は、前記取得された位置情報における状態情報を特定して、前記音声認識された内容を補正する、請求項1から5のいずれかに記載の音声認識補正システム。 - 前記ユーザが決済した決済情報を取得する決済情報取得手段をさらに備え、
前記補正手段は、前記取得された位置情報における決済情報を特定して、前記音声認識された内容を補正する、請求項1から6のいずれかに記載の音声認識補正システム。 - 複数の携帯端末と、これら複数の携帯端末とネットワークで接続されている管理コンピュータとを含んで構成され、
前記複数の携帯端末は、前記位置情報取得手段と、前記ユーザが発声した音声に関する音声情報を取得する音声情報取得手段とを有し、
前記管理コンピュータは、前記複数の携帯端末によって取得された前記位置情報及び前記音声情報を受信可能に構成され、
前記管理コンピュータは、前記位置情報を送信した携帯端末と、前記音声情報を送信した携帯端末とが同一の携帯端末であるかを判別する判別手段と、前記補正手段とを有し、
前記補正手段は、前記判別手段により同一の携帯端末であると判別された場合に、前記取得された、前記ユーザが特定の時点以前に訪れた場所の位置情報に関連する複数の項目についての履歴情報のうち、再認識する音声の部分の項目に対応する項目の履歴情報を複数選択し、選択された当該履歴情報に相当する音声データを合成し、合成した音声データと前記再認識する音声の部分とを比較し、最も近い履歴情報を、前記再認識する音声の部分の内容にするように、前記音声認識された内容を補正する、請求項1から7のいずれかに記載の音声認識補正システム。 - 前記補正された内容を復唱する復唱手段と、
前記復唱された結果、問題がない場合に前記補正された内容を記録する記録手段とをさらに備える、請求項1から8のいずれかに記載の音声認識システム。 - 請求項1に記載の音声認識補正システムを利用した音声認識補正方法であって、
前記位置情報取得手段が、ユーザが特定の時点以前に訪れた場所の位置情報を取得するステップと、
前記音声認識手段が、前記ユーザが発声した音声を音声認識するステップと、
前記補正手段が、前記取得された、前記ユーザが特定の時点以前に訪れた場所の位置情報に関連する複数の項目についての履歴情報のうち、再認識する音声の部分の項目に対応する項目の履歴情報を複数選択し、選択された当該履歴情報に相当する音声データを合成し、合成した音声データと前記再認識する音声の部分とを比較し、最も近い履歴情報を、前記再認識する音声の部分の内容にするように、前記音声認識された内容を補正するステップと、
を備える音声認識補正方法。 - 音声認識システムに、
ユーザが特定の時点以前に訪れた場所の位置情報を取得するステップと、
前記ユーザが発声した音声を音声認識するステップと、
前記取得された、前記ユーザが特定の時点以前に訪れた場所の位置情報に関連する複数の項目についての履歴情報のうち、再認識する音声の部分の項目に対応する項目の履歴情報を複数選択し、選択された当該履歴情報に相当する音声データを合成し、合成した音声データと前記再認識する音声の部分とを比較し、最も近い履歴情報を、前記再認識する音声の部分の内容にするように、前記音声認識された内容を補正するステップと、
を実行させるためのプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2017/013826 WO2018179426A1 (ja) | 2017-03-31 | 2017-03-31 | 音声認識補正システム、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6457154B1 true JP6457154B1 (ja) | 2019-01-23 |
JPWO2018179426A1 JPWO2018179426A1 (ja) | 2019-04-04 |
Family
ID=63674781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018516873A Active JP6457154B1 (ja) | 2017-03-31 | 2017-03-31 | 音声認識補正システム、方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6457154B1 (ja) |
WO (1) | WO2018179426A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110534112B (zh) * | 2019-08-23 | 2021-09-10 | 王晓佳 | 基于位置与时间的分布式语音识别纠错方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004163265A (ja) * | 2002-11-13 | 2004-06-10 | Nissan Motor Co Ltd | ナビゲーション装置 |
JP2005030982A (ja) * | 2003-07-09 | 2005-02-03 | Matsushita Electric Ind Co Ltd | 音声入力方法及び、車載装置 |
JP2006349427A (ja) * | 2005-06-14 | 2006-12-28 | Toyota Motor Corp | 車載音声認識装置 |
JP2012093508A (ja) * | 2010-10-26 | 2012-05-17 | Nec Corp | 音声認識支援システム、音声認識支援装置、利用者端末、方法およびプログラム |
-
2017
- 2017-03-31 WO PCT/JP2017/013826 patent/WO2018179426A1/ja active Application Filing
- 2017-03-31 JP JP2018516873A patent/JP6457154B1/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004163265A (ja) * | 2002-11-13 | 2004-06-10 | Nissan Motor Co Ltd | ナビゲーション装置 |
JP2005030982A (ja) * | 2003-07-09 | 2005-02-03 | Matsushita Electric Ind Co Ltd | 音声入力方法及び、車載装置 |
JP2006349427A (ja) * | 2005-06-14 | 2006-12-28 | Toyota Motor Corp | 車載音声認識装置 |
JP2012093508A (ja) * | 2010-10-26 | 2012-05-17 | Nec Corp | 音声認識支援システム、音声認識支援装置、利用者端末、方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2018179426A1 (ja) | 2018-10-04 |
JPWO2018179426A1 (ja) | 2019-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8918320B2 (en) | Methods, apparatuses and computer program products for joint use of speech and text-based features for sentiment detection | |
CN117577099A (zh) | 设备上的多用户认证的方法、系统和介质 | |
JP6107409B2 (ja) | 位置特定処理装置及び位置特定処理プログラム | |
US9188456B2 (en) | System and method of fixing mistakes by going back in an electronic device | |
US8521681B2 (en) | Apparatus and method for recognizing a context of an object | |
JP6017678B2 (ja) | 音声制御ナビゲーション・システム用のランドマークに基づく場所思考追跡 | |
CN112214418B (zh) | 一种应用程序的合规检测方法、装置和电子设备 | |
CN103488666B (zh) | 信息处理设备和方法、电子装置以及计算机可读存储介质 | |
US8977547B2 (en) | Voice recognition system for registration of stable utterances | |
WO2011093025A1 (ja) | 入力支援システム、方法、およびプログラム | |
US20140324428A1 (en) | System and method of improving speech recognition using context | |
US20170125017A1 (en) | Control device and message output control system | |
CN111028842B (zh) | 触发语音交互响应的方法及设备 | |
US10515634B2 (en) | Method and apparatus for searching for geographic information using interactive voice recognition | |
CN103858497A (zh) | 用于提供基于位置的信息的方法和设备 | |
CN109947971B (zh) | 图像检索方法、装置、电子设备及存储介质 | |
CN110998719A (zh) | 信息处理设备和信息处理方法 | |
WO2019205398A1 (zh) | 用户行为激励方法、装置、计算机设备及存储介质 | |
US20120226497A1 (en) | Sound recognition method and system | |
JP6457154B1 (ja) | 音声認識補正システム、方法及びプログラム | |
US11495245B2 (en) | Urgency level estimation apparatus, urgency level estimation method, and program | |
JP2010016444A (ja) | 状況認識装置、状況認識方法、及び無線端末装置 | |
KR20150037104A (ko) | 클라우드 소싱 기반 관심 지점 정보 업데이트 방법, 이를 위한 시스템 및 장치 | |
CN112863496B (zh) | 一种语音端点检测方法以及装置 | |
CN110263135B (zh) | 一种数据交换匹配方法、装置、介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180330 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20180330 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20180704 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180710 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180904 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6457154 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |