JP5754177B2 - 音声認識装置、音声認識システム、音声認識方法及びプログラム - Google Patents
音声認識装置、音声認識システム、音声認識方法及びプログラム Download PDFInfo
- Publication number
- JP5754177B2 JP5754177B2 JP2011046724A JP2011046724A JP5754177B2 JP 5754177 B2 JP5754177 B2 JP 5754177B2 JP 2011046724 A JP2011046724 A JP 2011046724A JP 2011046724 A JP2011046724 A JP 2011046724A JP 5754177 B2 JP5754177 B2 JP 5754177B2
- Authority
- JP
- Japan
- Prior art keywords
- rule
- input
- identification information
- speech recognition
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
を有する音声認識装置が提供される。
図1は、本実施形態の音声認識システムの構成の一例を示す機能ブロック図である。図示するように、本実施形態の音声認識システムは、音声認識装置10と、端末装置30と、ウェブページを端末装置30に提供するサーバ40とを有する。
端末装置30で表示されるウェブページの入力フォームへの入力を支援するためのプログラムであって、
コンピュータを、
文字列と、前記文字列の読みがなと、前記文字列の属性を示す属性情報とを対応付けた音声認識辞書を保持する辞書保持手段、
前記属性情報を利用して前記入力フォームに入力される情報の範囲を規定する複数の入力ルール各々を、ルール識別情報と対応付けて保持するルール保持手段、
前記入力フォームに前記ルール識別情報を対応付けた前記ウェブページを受信した複数の前記端末装置各々から、前記ルール識別情報と、音声データとを対応付けて受信する受信手段、
前記受信手段が受信した前記ルール識別情報をキーとして前記ルール保持手段を検索し、対応付けられている前記入力ルールを取得するルール取得手段、
前記ルール取得手段が取得した前記入力ルールに含まれる前記属性情報をキーとして、前記音声認識辞書を検索し、対応付けられている前記読みがなを抽出する検索手段、
前記音声データを複数の候補が含まれる読みがなのデータに変換した後、前記検索手段が抽出した前記読みがな及び前記ルール取得手段が取得した前記入力ルールを利用して、前記複数の候補の中から1つの読みがなを特定し、特定した読みがなに対応付けられている前記文字列を、前記辞書保持手段から取得する変換手段、
として機能させるためのプログラム。
コンピュータを、
入力フォームに入力される情報の範囲を規定する入力ルールを識別するためのルール識別情報を、入力フォームに対応付けたウェブページを受信する端末受信手段、
前記ウェブページをディスプレイに表示する端末表示手段、
前記入力フォームに入力する情報を音声で受付ける端末受付手段、
前記入力フォームに対応付けられた前記ルール識別情報と、前記音声のデータとを対応付けて音声認識装置に送信する端末送信手段、
として機能させるためのプログラム。
本実施形態は、第1の実施形態の構成に加えて、さらに、ルール保持部12に新たな入力ルールを記憶する手段、及び、音声認識装置10がサーバ40にウェブページのHTML文書に記載するルール識別情報を提供する手段を備える。
以下、参考形態の例を付記する。
1. 端末装置で表示されるウェブページの入力フォームへの入力を支援する音声認識装置であって、
文字列と、前記文字列の読みがなと、前記文字列の属性を示す属性情報とを対応付けた音声認識辞書を保持する辞書保持手段と、
前記属性情報を利用して前記入力フォームに入力される情報の範囲を規定する複数の入力ルール各々を、ルール識別情報と対応付けて保持するルール保持手段と、
前記入力フォームに前記ルール識別情報を対応付けた前記ウェブページを受信した複数の前記端末装置各々から、前記ルール識別情報と、音声データとを対応付けて受信する受信手段と、
前記受信手段が受信した前記ルール識別情報をキーとして前記ルール保持手段を検索し、対応付けられている前記入力ルールを取得するルール取得手段と、
前記ルール取得手段が取得した前記入力ルールに含まれる前記属性情報をキーとして、前記音声認識辞書を検索し、対応付けられている前記読みがなを抽出する検索手段と、
前記音声データを複数の候補が含まれる読みがなのデータに変換した後、前記検索手段が抽出した前記読みがな及び前記ルール取得手段が取得した前記入力ルールを利用して、前記複数の候補の中から1つの読みがなを特定し、特定した読みがなに対応付けられている前記文字列を、前記辞書保持手段から取得する変換手段と、
を有する音声認識装置。
2. 1に記載の音声認識装置において、
前記ウェブページを前記端末装置に送信するサーバから、入力ルールを受信するルール受信手段と、
前記入力ルールが前記ルール保持手段に保持されているか判別する判別手段と、
前記入力ルールが前記ルール保持手段に保持されている場合には、その入力ルールに対応付けられている前記ルール識別情報を前記サーバに送信し、前記入力ルールが前記ルール保持手段に保持されていない場合には、その入力ルールに新たな前記ルール識別情報を対応付けて前記ルール保持手段に保持させると共に、前記新たなルール識別情報を前記サーバに送信する更新手段と、
を有する音声認識装置。
3. 入力フォームに入力される情報の範囲を規定する入力ルールを識別するためのルール識別情報を、入力フォームに対応付けたウェブページを受信する端末受信手段と、
前記ウェブページをディスプレイに表示する端末表示手段と、
前記入力フォームに入力する情報を音声で受付ける端末受付手段と、
前記入力フォームに対応付けられた前記ルール識別情報と、前記音声のデータとを対応付けて音声認識装置に送信する端末送信手段と、
を有する端末装置。
4. 1または2に記載の音声認識装置と、
入力フォームに入力される情報の範囲を規定する入力ルールを識別するためのルール識別情報を、入力フォームに対応付けたウェブページを、端末装置に送信するサーバと、
を有する音声認識システム。
5. 4に記載の音声認識システムにおいて、
さらに、3に記載の端末装置を有する音声認識システム。
6. 端末装置で表示されるウェブページの入力フォームへの入力を支援するためのプログラムであって、
コンピュータを、
文字列と、前記文字列の読みがなと、前記文字列の属性を示す属性情報とを対応付けた音声認識辞書を保持する辞書保持手段、
前記属性情報を利用して前記入力フォームに入力される情報の範囲を規定する複数の入力ルール各々を、ルール識別情報と対応付けて保持するルール保持手段、
前記入力フォームに前記ルール識別情報を対応付けた前記ウェブページを受信した複数の前記端末装置各々から、前記ルール識別情報と、音声データとを対応付けて受信する受信手段、
前記受信手段が受信した前記ルール識別情報をキーとして前記ルール保持手段を検索し、対応付けられている前記入力ルールを取得するルール取得手段、
前記ルール取得手段が取得した前記入力ルールに含まれる前記属性情報をキーとして、前記音声認識辞書を検索し、対応付けられている前記読みがなを抽出する検索手段、
前記音声データを複数の候補が含まれる読みがなのデータに変換した後、前記検索手段が抽出した前記読みがな及び前記ルール取得手段が取得した前記入力ルールを利用して、前記複数の候補の中から1つの読みがなを特定し、特定した読みがなに対応付けられている前記文字列を、前記辞書保持手段から取得する変換手段、
として機能させるためのプログラム。
7. コンピュータを、
入力フォームに入力される情報の範囲を規定する入力ルールを識別するためのルール識別情報を、入力フォームに対応付けたウェブページを受信する端末受信手段、
前記ウェブページをディスプレイに表示する端末表示手段、
前記入力フォームに入力する情報を音声で受付ける端末受付手段、
前記入力フォームに対応付けられた前記ルール識別情報と、前記音声のデータとを対応付けて音声認識装置に送信する端末送信手段、
として機能させるためのプログラム。
8. 端末装置で表示されるウェブページの入力フォームへの入力を支援する音声認識方法であって、
文字列とその読みがなとを対応付けた音声認識辞書を保持する辞書保持手段と、
前記入力フォームに入力される情報の範囲を規定する複数の入力ルール各々を、ルール識別情報と対応付けて保持するルール保持手段と、
を備えておき、
前記入力フォームに前記ルール識別情報を対応付けた前記ウェブページを受信した複数の前記端末装置各々から、前記ルール識別情報と、音声データとを対応付けて受信する受信ステップと、
前記受信ステップで受信した前記ルール識別情報をキーとして前記ルール保持手段を検索し、対応付けられた前記入力ルールを取得するルール取得ステップと、
前記ルール取得ステップで取得した前記入力ルールに含まれる前記属性情報をキーとして、前記音声認識辞書を検索し、対応付けられている前記読みがなを抽出する検索ステップと、
前記音声データを複数の候補が含まれる読みがなのデータに変換した後、前記検索ステップで抽出した前記読みがな及び前記ルール取得ステップで取得した前記入力ルールを利用して、前記複数の候補の中から1つの読みがなを特定し、特定した読みがなに対応付けられている前記文字列を、前記辞書保持手段から取得する変換ステップと、
を音声認識装置が実行する音声認識方法。
9. 入力フォームに入力される情報の範囲を規定する入力ルールを識別するためのルール識別情報を、入力フォームに対応付けたウェブページを受信する端末受信ステップと、
前記ウェブページをディスプレイに表示する端末表示ステップと、
前記入力フォームに入力する情報を音声で受付ける端末受付ステップと、
前記入力フォームに対応付けられた前記ルール識別情報と、前記音声のデータとを対応付けて音声認識装置に送信する端末送信ステップと、
を端末装置が実行する入力方法。
11 辞書保持部
12 ルール保持部
13 受信部
14 変換部
15 ルール取得部
16 検索部
17 送信部
18 ルール受信部
19 判別部
20 更新部
30 端末装置
31 端末受信部
32 端末表示部
33 端末受付部
34 端末送信部
40 サーバ
441 ルールID
442 ルール
451 テキスト分類
452 音声認識テキスト
453 音声読みがな
Claims (4)
- 端末装置で表示されるウェブページの入力フォームへの入力を支援する音声認識装置であって、
文字列と、前記文字列の読みがなと、前記文字列の属性を示す属性情報とを対応付けた音声認識辞書を保持する辞書保持手段と、
前記属性情報を利用して前記入力フォームに入力される情報の範囲を規定する複数の入力ルール各々を、ルール識別情報と対応付けて保持するルール保持手段と、
前記入力フォームに前記ルール識別情報を対応付けた前記ウェブページを受信した複数の前記端末装置各々から、前記ルール識別情報と、音声データとを対応付けて受信する受信手段と、
前記受信手段が受信した前記ルール識別情報をキーとして前記ルール保持手段を検索し、対応付けられている前記入力ルールを取得するルール取得手段と、
前記ルール取得手段が取得した前記入力ルールに含まれる前記属性情報をキーとして、前記音声認識辞書を検索し、対応付けられている前記読みがなを抽出する検索手段と、
前記音声データを複数の候補が含まれる読みがなのデータに変換した後、前記検索手段が抽出した前記読みがな及び前記ルール取得手段が取得した前記入力ルールを利用して、前記複数の候補の中から1つの読みがなを特定し、特定した読みがなに対応付けられている前記文字列を、前記辞書保持手段から取得する変換手段と、
前記ウェブページを前記端末装置に送信するサーバから、入力ルールを受信するルール受信手段と、
前記入力ルールが前記ルール保持手段に保持されているか判別する判別手段と、
前記入力ルールが前記ルール保持手段に保持されている場合には、その入力ルールに対応付けられている前記ルール識別情報を前記サーバに送信し、前記入力ルールが前記ルール保持手段に保持されていない場合には、その入力ルールに新たな前記ルール識別情報を対応付けて前記ルール保持手段に保持させると共に、前記新たなルール識別情報を前記サーバに送信する更新手段と、
を有する音声認識装置。 - 請求項1に記載の音声認識装置と、
入力フォームに入力される情報の範囲を規定する入力ルールを識別するためのルール識別情報を、入力フォームに対応付けたウェブページを、端末装置に送信するサーバと、
を有する音声認識システム。 - 端末装置で表示されるウェブページの入力フォームへの入力を支援するためのプログラムであって、
コンピュータを、
文字列と、前記文字列の読みがなと、前記文字列の属性を示す属性情報とを対応付けた音声認識辞書を保持する辞書保持手段、
前記属性情報を利用して前記入力フォームに入力される情報の範囲を規定する複数の入力ルール各々を、ルール識別情報と対応付けて保持するルール保持手段、
前記入力フォームに前記ルール識別情報を対応付けた前記ウェブページを受信した複数の前記端末装置各々から、前記ルール識別情報と、音声データとを対応付けて受信する受信手段、
前記受信手段が受信した前記ルール識別情報をキーとして前記ルール保持手段を検索し、対応付けられている前記入力ルールを取得するルール取得手段、
前記ルール取得手段が取得した前記入力ルールに含まれる前記属性情報をキーとして、前記音声認識辞書を検索し、対応付けられている前記読みがなを抽出する検索手段、
前記音声データを複数の候補が含まれる読みがなのデータに変換した後、前記検索手段が抽出した前記読みがな及び前記ルール取得手段が取得した前記入力ルールを利用して、前記複数の候補の中から1つの読みがなを特定し、特定した読みがなに対応付けられている前記文字列を、前記辞書保持手段から取得する変換手段、
前記ウェブページを前記端末装置に送信するサーバから、入力ルールを受信するルール受信手段と、
前記入力ルールが前記ルール保持手段に保持されているか判別する判別手段と、
前記入力ルールが前記ルール保持手段に保持されている場合には、その入力ルールに対応付けられている前記ルール識別情報を前記サーバに送信し、前記入力ルールが前記ルール保持手段に保持されていない場合には、その入力ルールに新たな前記ルール識別情報を対応付けて前記ルール保持手段に保持させると共に、前記新たなルール識別情報を前記サーバに送信する更新手段と、
として機能させるためのプログラム。 - 端末装置で表示されるウェブページの入力フォームへの入力を支援する音声認識方法であって、
文字列と、前記文字列の読みがなと、前記文字列の属性を示す属性情報とを対応付けた音声認識辞書を保持する辞書保持手段と、
前記入力フォームに入力される情報の範囲を規定する複数の入力ルール各々を、ルール識別情報と対応付けて保持するルール保持手段と、
を備えておき、
前記入力フォームに前記ルール識別情報を対応付けた前記ウェブページを受信した複数の前記端末装置各々から、前記ルール識別情報と、音声データとを対応付けて受信する受信ステップと、
前記受信ステップで受信した前記ルール識別情報をキーとして前記ルール保持手段を検索し、対応付けられた前記入力ルールを取得するルール取得ステップと、
前記ルール取得ステップで取得した前記入力ルールに含まれる前記属性情報をキーとして、前記音声認識辞書を検索し、対応付けられている前記読みがなを抽出する検索ステップと、
前記音声データを複数の候補が含まれる読みがなのデータに変換した後、前記検索ステップで抽出した前記読みがな及び前記ルール取得ステップで取得した前記入力ルールを利用して、前記複数の候補の中から1つの読みがなを特定し、特定した読みがなに対応付けられている前記文字列を、前記辞書保持手段から取得する変換ステップと、
前記ウェブページを前記端末装置に送信するサーバから、入力ルールを受信するルール受信ステップと、
前記入力ルールが前記ルール保持手段に保持されているか判別する判別ステップと、
前記入力ルールが前記ルール保持手段に保持されている場合には、その入力ルールに対応付けられている前記ルール識別情報を前記サーバに送信し、前記入力ルールが前記ルール保持手段に保持されていない場合には、その入力ルールに新たな前記ルール識別情報を対応付けて前記ルール保持手段に保持させると共に、前記新たなルール識別情報を前記サーバに送信する更新ステップと、
を音声認識装置が実行する音声認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011046724A JP5754177B2 (ja) | 2011-03-03 | 2011-03-03 | 音声認識装置、音声認識システム、音声認識方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011046724A JP5754177B2 (ja) | 2011-03-03 | 2011-03-03 | 音声認識装置、音声認識システム、音声認識方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012185225A JP2012185225A (ja) | 2012-09-27 |
JP5754177B2 true JP5754177B2 (ja) | 2015-07-29 |
Family
ID=47015392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011046724A Expired - Fee Related JP5754177B2 (ja) | 2011-03-03 | 2011-03-03 | 音声認識装置、音声認識システム、音声認識方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5754177B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10410632B2 (en) | 2016-09-14 | 2019-09-10 | Kabushiki Kaisha Toshiba | Input support apparatus and computer program product |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9996517B2 (en) * | 2015-11-05 | 2018-06-12 | Lenovo (Singapore) Pte. Ltd. | Audio input of field entries |
JP6712940B2 (ja) * | 2016-10-27 | 2020-06-24 | トッパン・フォームズ株式会社 | 音声入力装置、音声入力方法 |
CN112068793A (zh) * | 2019-06-11 | 2020-12-11 | 北京搜狗科技发展有限公司 | 一种语音输入方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005322148A (ja) * | 2004-05-11 | 2005-11-17 | Mitsubishi Electric Corp | ブラウザ装置 |
JP4731174B2 (ja) * | 2005-02-04 | 2011-07-20 | Kddi株式会社 | 音声認識装置、音声認識システム及びコンピュータプログラム |
US20080153465A1 (en) * | 2006-12-26 | 2008-06-26 | Voice Signal Technologies, Inc. | Voice search-enabled mobile device |
-
2011
- 2011-03-03 JP JP2011046724A patent/JP5754177B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10410632B2 (en) | 2016-09-14 | 2019-09-10 | Kabushiki Kaisha Toshiba | Input support apparatus and computer program product |
Also Published As
Publication number | Publication date |
---|---|
JP2012185225A (ja) | 2012-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5965175B2 (ja) | 応答生成装置、応答生成方法および応答生成プログラム | |
CN1752975B (zh) | 用于支持话音的自动填充的方法和系统 | |
EP3021321B1 (en) | Display apparatus and method for question and answer | |
JP5042799B2 (ja) | 音声チャットシステム、情報処理装置およびプログラム | |
US7818170B2 (en) | Method and apparatus for distributed voice searching | |
US20070061146A1 (en) | Retrieval and Presentation of Network Service Results for Mobile Device Using a Multimodal Browser | |
US20120296653A1 (en) | Speech recognition of character sequences | |
JP4930379B2 (ja) | 類似文検索方法、類似文検索システム及び類似文検索用プログラム | |
CN103377028A (zh) | 用于以语音启动人机界面的方法和系统 | |
CN102144228A (zh) | 根据输入字符序列的资源定位符建议 | |
JP5754177B2 (ja) | 音声認識装置、音声認識システム、音声認識方法及びプログラム | |
CN102799603A (zh) | 提供链接列表的方法和应用所述方法的显示设备 | |
US20160078083A1 (en) | Image display device, method for driving the same, and computer readable recording medium | |
CN104282301A (zh) | 一种语音命令处理方法以及系统 | |
CN101218625A (zh) | 用于移动设备的使用拼写识别的字典查找 | |
WO2016041428A1 (zh) | 一种英文的输入方法和装置 | |
JP2007323558A (ja) | キーワード生成装置、文書検索装置、その方法、およびそのプログラム | |
JP4962416B2 (ja) | 音声認識システム | |
CN104731918A (zh) | 一种语音搜索方法及装置 | |
JP2005215726A (ja) | 話者に対する情報提示システム及びプログラム | |
KR20010064061A (ko) | 음성 인식 기능을 갖는 검색 엔진 | |
JP5300576B2 (ja) | 検索装置、検索方法、および検索プログラム | |
JP4808763B2 (ja) | 音声情報収集装置、その方法およびそのプログラム | |
JP2008171173A (ja) | 文書検索方法および装置、プログラム | |
JP4515186B2 (ja) | 音声辞書作成装置、音声辞書作成方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150428 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150511 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5754177 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |