JP6236805B2 - 発話コマンド認識システム - Google Patents
発話コマンド認識システム Download PDFInfo
- Publication number
- JP6236805B2 JP6236805B2 JP2013043104A JP2013043104A JP6236805B2 JP 6236805 B2 JP6236805 B2 JP 6236805B2 JP 2013043104 A JP2013043104 A JP 2013043104A JP 2013043104 A JP2013043104 A JP 2013043104A JP 6236805 B2 JP6236805 B2 JP 6236805B2
- Authority
- JP
- Japan
- Prior art keywords
- command
- voice
- utterance
- weight
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Description
そこで、本発明に目的は、音声認識結果が端末操作可能な発話コマンド以外のものになってしまう危険性があるという課題を解決した発話コマンド認識システムを提供することにある。
クライアント端末と音声認識サーバとを備え、
前記音声認識サーバは、
認識対象となる発話コマンドの表記が記録されたコマンド重み記憶部と、
前記クライアント端末から送られてくる、ユーザが発話した音声の音声データに対して音声認識を行い、前記音声に含まれている単語毎に、その単語に対する候補単語と該候補単語に対する信頼度とを求め、該求めた候補単語の中から信頼度が高い順に複数の候補単語を選択する音声認識部と、
前記コマンド重み記憶部に表記が記録されている発話コマンドであって、その発話コマンドの表記と同一の表記が、前記音声認識部で選択された候補単語を連結した候補単語列に存在する発話コマンドを、前記音声に含まれている発話コマンドと認識するコマンド認識部とを備える。
認識対象となる発話コマンドの表記が記録されたコマンド重み記憶部と、
クライアント端末から送られてくる、ユーザが発話した音声の音声データに対して音声認識を行い、前記音声に含まれている単語毎に、その単語に対する候補単語と該候補単語に対する信頼度とを求め、該求めた候補単語の中から信頼度が高い順に複数の候補単語を選択する音声認識部と、
前記コマンド重み記憶部に表記が記録されている発話コマンドであって、その発話コマンドの表記と同一の表記が、前記音声認識部で選択された候補単語を連結した候補単語列に存在する発話コマンドを、前記音声に含まれている発話コマンドと認識するコマンド認識部とを備える。
認識対象となる発話コマンドの表記が記録されたコマンド重み記憶部と、音声認識部と、コマンド認識部とを備えたコンピュータが実行する発話コマンド認識方法であって、
前記音声認識武が、前記クライアント端末から送られてくる、ユーザが発話した音声の音声データに対して音声認識を行い、前記音声に含まれている単語毎に、その単語に対する候補単語と該候補単語に対する信頼度とを求め、該求めた候補単語の中から信頼度が高い順に複数の候補単語を選択し、
コマンド認識武が、前記コマンド重み記憶部に表記が記録されている発話コマンドであって、その発話コマンドの表記と同一の表記が、前記音声認識部で選択された候補単語を連結した候補単語列に存在する発話コマンドを、前記音声に含まれている発話コマンドと認識する。
認識対象となる発話コマンドの表記が記録されたコマンド重み記憶部を備えたコンピュータを、
クライアント端末から送られてくる、ユーザが発話した音声の音声データに対して音声認識を行い、前記音声に含まれている単語毎に、その単語に対する候補単語と該候補単語に対する信頼度とを求め、該求めた候補単語の中から信頼度が高い順に複数の候補単語を選択する音声認識部、
前記コマンド重み記憶部に表記が記録されている発話コマンドであって、その発話コマンドの表記と同一の表記が、前記音声認識部で選択された候補単語を連結した候補単語列に存在する発話コマンドを、前記音声に含まれている発話コマンドと認識するコマンド認識部として機能させる。
図1を参照すると、本発明の第1の実施の形態に係る発話コマンド認識システムは、音声認識サーバ1と、スマートフォン等のモバイル端末やパーソナルコンピュータ等により実現されるクライアント端末2−1〜2−nと、アプリケーション一覧情報記憶部31を有するクラウドサーバ3とを備え、それらはネットワークNWを介して相互に接続されている。なお、クラウドサーバ3のアプリケーション一覧情報記憶部31には、クライアント端末2−1〜2−nのユーザのユーザ名に関連付けて、そのクライアント端末にインストールされているアプリケーションのアプリケーション名が記録されている。
次に、本実施の形態の動作について詳細に説明する。
×10+(デフォルト値) ・・・ (2)
=114÷160×10+1
=8.125 ・・・ (3)
本実施の形態によれば、音声認識結果が端末操作可能な発話コマンド以外のものになってしまう危険性を少なくすることができる、という効果を得ることができる。その理由は、コマンド重み記憶部112に表記が記録されている発話コマンドであって、その発話コマンドの表記と同一の表記が、音声認識部103で選択された候補単語を連結した候補単語列に存在する発話コマンドを、上記音声に含まれている発話コマンドと認識するコマンド認識部104を備えているからである。
次に、本発明の第2の実施の形態に係る発話コマンド認識システムについて説明する。
本発明によれば、音声認識結果が端末操作可能な発話コマンド以外のものになってしまう危険性を少なくすることができる、という効果を得ることができる。その理由は、コマンド重み記憶部171に表記が記録されている発話コマンドであって、その発話コマンドの表記と同一の表記が、音声認識部172で選択された候補単語を連結した候補単語列に存在する発話コマンドを、上記音声に含まれている発話コマンドと認識するコマンド認識部173を備えているからである。
101・・・送受信部
102・・・単語辞書作成部
103・・・音声認識部
104・・・コマンド認識部
105・・・重み記憶部
106・・・個人データ記録部
107・・・追加部
108・・・言語モデル
109・・・音響モデル
110・・・コマンド表記憶部
111・・・共通単語辞書記憶部
112・・・コマンド重み記憶部
113・・・単語辞書一時記憶部
114・・・個人データ記憶部
115・・・入出力部
2−1〜2−n・・・クライアント端末
21・・・音声入力部
22・・・送受信部
23・・・機能呼出し部
24・・・追加部
25・・・コマンド動作対応表記憶部
26・・・記憶装置
27−1〜27−m・・・アプリケーション
3・・・クラウドサーバ
31・・・アプリケーション一覧情報記憶部
170・・・音声認識サーバ
171・・・コマンド重み記憶部
172・・・音声認識部
173・・・コマンド認識部
180・・・クライアント端末
Claims (7)
- クライアント端末と音声認識サーバとを備え、
前記音声認識サーバは、
認識対象となる発話コマンドの表記が記録されたコマンド重み記憶部と、
前記クライアント端末から送られてくる、ユーザが発話した音声の音声データに対して音声認識を行い、前記音声に含まれている単語毎に、その単語に対する候補単語と該候補単語に対する信頼度とを求め、該求めた候補単語の中から信頼度が高い順に複数の候補単語を選択する音声認識部と、
前記コマンド重み記憶部に表記が記録されている発話コマンドであって、その発話コマンドの表記と同一の表記が、前記音声認識部で選択された候補単語を連結した候補単語列に存在する発話コマンドを、前記音声に含まれている発話コマンドと認識するコマンド認識部と、
ユーザ毎に、そのユーザのクライアント端末にインストールされているアプリケーションの機能を呼び出すために使用する発話コマンドの表記と重みとが関連付けて記録された個人データ記憶部とを備え、
前記音声認識部は、候補単語の信頼度を求める際、前記個人データ記憶部に記録されている、前記音声データの送信元のユーザのクライアント端末にインストールされているアプリケーションで使用する発話コマンドの重みを考慮することを特徴とする発話コマンド認識システム。 - 請求項1記載の発話コマンド認識システムにおいて、
前記コマンド重み記憶部には、アプリケーション毎に、そのアプリケーションの機能を呼び出すために使用する発話コマンドの表記と重みとが記録され、
前記音声認識部は、候補単語の信頼度を求める際、前記コマンド重み記憶部に記録されている発話コマンドの重みの内、前記音声データの送信元のクライアント端末にインストールされているアプリケーションの機能を呼び出すために使用する発話コマンドの重みも考慮することを特徴とする発話コマンド認識システム。 - 請求項1または2記載の発話コマンド認識システムにおいて、
前記音声認識サーバは、ユーザ毎に、そのユーザのクライアント端末のインストールされている各アプリケーションの使用回数を管理し、該管理している各アプリケーションの使用回数に応じて、前記個人データ記憶部に記録されている発話コマンドの重みを変更する重み変更部を備えることを特徴とする発話コマンド認識システム。 - 請求項2または3記載の発話コマンド認識システムにおいて、
前記コマンド認識部は、認識結果を前記音声データの送信元のクライアント端末へ送信し、
前記クライアント端末は、前記コマンド認識部から送られてきた認識結果に基づいて、自クライアント端末にインストールされているアプリケーションの機能を呼び出す機能呼出し部を備え、
前記音声認識サーバは、
前記機能呼び出し部により機能を呼び出すことができる新アプリケーションを追加する場合、前記新アプリケーションの機能を呼び出すために使用するコマンドの表記と重みとを前記コマンド重み記憶部に記録する追加部と、
前記クライアント端末に前記新アプリケーションがインストールされている場合、前記個人データ記憶部に、前記クライアント端末のユーザに関する情報として、前記新アプリケーションの機能を呼び出すために使用するコマンドの表記と重みとを記録する個人データ記録部と備えたことを特徴とする発話コマンド認識システム。 - 認識対象となる発話コマンドの表記が記録されたコマンド重み記憶部と、
クライアント端末から送られてくる、ユーザが発話した音声の音声データに対して音声認識を行い、前記音声に含まれている単語毎に、その単語に対する候補単語と該候補単語に対する信頼度とを求め、該求めた候補単語の中から信頼度が高い順に複数の候補単語を選択する音声認識部と、
前記コマンド重み記憶部に表記が記録されている発話コマンドであって、その発話コマンドの表記と同一の表記が、前記音声認識部で選択された候補単語を連結した候補単語列に存在する発話コマンドを、前記音声に含まれている発話コマンドと認識するコマンド認識部と、
ユーザ毎に、そのユーザのクライアント端末にインストールされているアプリケーションの機能を呼び出すために使用する発話コマンドの表記と重みとが関連付けて記録された個人データ記憶部とを備え、
前記音声認識部は、候補単語の信頼度を求める際、前記個人データ記憶部に記録されている、前記音声データの送信元のユーザのクライアント端末にインストールされているアプリケーションで使用する発話コマンドの重みを考慮することを特徴とする音声認識サーバ。 - 認識対象となる発話コマンドの表記が記録されたコマンド重み記憶部と、音声認識部と、コマンド認識部と、ユーザ毎に、そのユーザのクライアント端末にインストールされているアプリケーションの機能を呼び出すために使用する発話コマンドの表記と重みとが関連付けて記録された個人データ記憶部とを備えたコンピュータが実行する発話コマンド認識方法であって、
前記音声認識部が、前記クライアント端末から送られてくる、ユーザが発話した音声の音声データに対して音声認識を行い、前記音声に含まれている単語毎に、その単語に対する候補単語と該候補単語に対する信頼度とを求め、該求めた候補単語の中から信頼度が高い順に複数の候補単語を選択し、
コマンド認識部が、前記コマンド重み記憶部に表記が記録されている発話コマンドであって、その発話コマンドの表記と同一の表記が、前記音声認識部で選択された候補単語を連結した候補単語列に存在する発話コマンドを、前記音声に含まれている発話コマンドと認識し、
且つ、前記音声認識部が、候補単語の信頼度を求める際、前記個人データ記憶部に記録されている、前記音声データの送信元のユーザのクライアント端末にインストールされているアプリケーションで使用する発話コマンドの重みを考慮することを特徴とする発話コマンド認識方法。 - 認識対象となる発話コマンドの表記が記録されたコマンド重み記憶部と、ユーザ毎に、そのユーザのクライアント端末にインストールされているアプリケーションの機能を呼び出すために使用する発話コマンドの表記と重みとが関連付けて記録された個人データ記憶部とを備えたコンピュータを、
クライアント端末から送られてくる、ユーザが発話した音声の音声データに対して音声認識を行い、前記音声に含まれている単語毎に、その単語に対する候補単語と該候補単語に対する信頼度とを求め、該求めた候補単語の中から信頼度が高い順に複数の候補単語を選択する音声認識部、
前記コマンド重み記憶部に表記が記録されている発話コマンドであって、その発話コマンドの表記と同一の表記が、前記音声認識部で選択された候補単語を連結した候補単語列に存在する発話コマンドを、前記音声に含まれている発話コマンドと認識するコマンド認識部として機能させ、
前記音声認識部は、候補単語の信頼度を求める際、前記個人データ記憶部に記録されている、前記音声データの送信元のユーザのクライアント端末にインストールされているアプリケーションで使用する発話コマンドの重みを考慮するためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013043104A JP6236805B2 (ja) | 2013-03-05 | 2013-03-05 | 発話コマンド認識システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013043104A JP6236805B2 (ja) | 2013-03-05 | 2013-03-05 | 発話コマンド認識システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014170185A JP2014170185A (ja) | 2014-09-18 |
JP6236805B2 true JP6236805B2 (ja) | 2017-11-29 |
Family
ID=51692597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013043104A Active JP6236805B2 (ja) | 2013-03-05 | 2013-03-05 | 発話コマンド認識システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6236805B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9472196B1 (en) | 2015-04-22 | 2016-10-18 | Google Inc. | Developer voice actions system |
KR102443087B1 (ko) | 2015-09-23 | 2022-09-14 | 삼성전자주식회사 | 전자 기기 및 그의 음성 인식 방법 |
JP2017175283A (ja) * | 2016-03-22 | 2017-09-28 | コニカミノルタ株式会社 | 会議システム、テレビ会議装置およびプログラム |
JP6922178B2 (ja) * | 2016-09-30 | 2021-08-18 | 株式会社リコー | 音声認識システム、情報処理装置、プログラム |
CN108288468B (zh) * | 2017-06-29 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 语音识别方法及装置 |
WO2020106314A1 (en) | 2018-11-21 | 2020-05-28 | Google Llc | Consolidation of responses from queries to disparate data sources |
JP7141938B2 (ja) * | 2018-12-07 | 2022-09-26 | 富士フイルムヘルスケア株式会社 | 音声認識入力装置、音声認識入力プログラム及び医用画像撮像システム |
JP6842489B2 (ja) * | 2019-03-28 | 2021-03-17 | Necパーソナルコンピュータ株式会社 | 電子機器、制御方法およびプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4552368B2 (ja) * | 2001-08-09 | 2010-09-29 | カシオ計算機株式会社 | 機器制御システム、音声認識装置及び方法、並びにプログラム |
JP2004021677A (ja) * | 2002-06-18 | 2004-01-22 | Omron Corp | 情報提供システム、情報提供方法、情報提供プログラム及び情報提供プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2008003474A (ja) * | 2006-06-26 | 2008-01-10 | Funai Electric Co Ltd | 電子機器 |
-
2013
- 2013-03-05 JP JP2013043104A patent/JP6236805B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014170185A (ja) | 2014-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6236805B2 (ja) | 発話コマンド認識システム | |
JP7083270B2 (ja) | 複数のインテリジェントパーソナルアシスタントサービスに対する管理レイヤ | |
JP5703256B2 (ja) | 単語レベルの変換候補生成に基づく音声認識システム及び方法 | |
JP6272901B2 (ja) | 発話対象の識別 | |
US9047868B1 (en) | Language model data collection | |
US10140989B2 (en) | Method and system for speech recognition processing | |
JP2016532146A5 (ja) | ||
TW201239652A (en) | Location-based conversational understanding | |
US10395658B2 (en) | Pre-processing partial inputs for accelerating automatic dialog response | |
CN110289015B (zh) | 一种音频处理方法、装置、服务器、存储介质及系统 | |
CN106713111B (zh) | 一种添加好友的处理方法、终端及服务器 | |
US8868419B2 (en) | Generalizing text content summary from speech content | |
CN116075887A (zh) | 使用来自分离的音频输入的语音内容的数据分析和扩张的语音识别 | |
JP2018185561A (ja) | 対話支援システム、対話支援方法、及び対話支援プログラム | |
US11347379B1 (en) | Captions for audio content | |
CN116057625A (zh) | 使用交错音频输入的数据分析和扩张的语音识别 | |
JP2019045831A (ja) | 音声処理装置、方法およびプログラム | |
KR20210098250A (ko) | 전자 장치 및 이의 제어 방법 | |
KR102405822B1 (ko) | 장애인과 비장애인의 의사소통을 위한 서비스 제공 방법 및 장치 | |
US11722572B2 (en) | Communication platform shifting for voice-enabled device | |
US11463507B1 (en) | Systems for generating captions for audio content | |
US10586537B2 (en) | Filtering directive invoking vocal utterances | |
EP3502868A1 (en) | Intelligent personal assistant interface system | |
JP2021067922A (ja) | 映像コンテンツに対する合成音のリアルタイム生成を基盤としたコンテンツ編集支援方法およびシステム | |
JP2021196435A (ja) | 情報処理装置、プログラム、および情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170228 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171003 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171016 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6236805 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |