JP7319639B1 - 音声入力システム及びそのプログラム - Google Patents
音声入力システム及びそのプログラム Download PDFInfo
- Publication number
- JP7319639B1 JP7319639B1 JP2022133164A JP2022133164A JP7319639B1 JP 7319639 B1 JP7319639 B1 JP 7319639B1 JP 2022133164 A JP2022133164 A JP 2022133164A JP 2022133164 A JP2022133164 A JP 2022133164A JP 7319639 B1 JP7319639 B1 JP 7319639B1
- Authority
- JP
- Japan
- Prior art keywords
- screen
- server
- text
- voice input
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004891 communication Methods 0.000 claims abstract description 22
- 238000003825 pressing Methods 0.000 claims abstract description 12
- 238000012790 confirmation Methods 0.000 claims description 21
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000000034 method Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000003384 imaging method Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
Description
本実施の形態では、例えば保険の契約として説明する。なお、その他の音声入力システムに応用できることは勿論である。
音声認識サービスサイトのサーバは70、音声データを認識し、これをテキストデータに変換して(d54)、音声入力サービス部20に送信する(d56)。
上記実施形態では、ユーザ端末10による音声入力操作の際、ユーザ端末10と音声入力サービス部20との通信環境が安定している場合を想定しているが、通信トラフィックの変動する場合には、安定して音声入力操作が実行できなくなる。そこで、図4に示した(d20)の音声入力受付判定処理を起動する際、バックグラウンド処理として、以下の処理ST1~ST4を組み入れるように制御してもよい。
ST1:ウェブ申込フォーム第1画面読み込み後、ダミー通信を1回行う。ただし、デバイスの通信環境を確認する処理に代えてもよい。
ST2:ユーザ利用環境として安定した通信が可能な場合は、API音声テキスト変換用のウェブ申込フォームを表示する。
ST4:通信可能と判断した後に、接続不安定もしくは何らかの通信障害、エラー発生時は、図10に示す画面をユーザ端末10に提示して、ウェブ申込フォームのレイアウトから独立して入力し易いキーボード入力画面を項目ごとに表示する。
図10に示すように、ウェブ申込フォームの音声入力処理操作中に通信障害が発生した場合は、生年月日入力画面において、ユーザによるキーボード入力を受け付け、該受け付けた生年月日の情報を操作中のウェブ申込フォームに反映させることで、音声入力障害発生時にも柔軟な対応をユーザに提示できる。
上記本発明は、少なくとも下記の実施の形態を含むことができる。
10 携帯端末(ユーザ端末)
20 音声入力サービス部
22 画面生成部
24 音声入力要求部
26 音声テキスト化要求部
28 発声ガイド部
29 受信部
30 通信ネットワーク
50 Webサイトのサーバ
70 音声認識サービスサイトのサーバ
Claims (5)
- ユーザの携帯端末と、音声入力情報をテキスト情報に変換する音声認識サービスサイトの第1のサーバと、前記第1のサーバから前記テキスト情報を受信するWebサイトの第2のサーバとを通信ネットワークで接続した音声入力システムであって、
前記携帯端末は、
音声情報を入力するマイクと、
前記第2のサーバとに接続した際に、複数の行に割り付けられたテキストを入力する画面を表示部に表示する画面生成部と、
前記画面を押下することで音声入力を受け付ける音声入力要求部と、
前記音声入力要求部を押下するタイミングで前記画面生成部が前記ユーザに対して、前記マイクの使用を許可するか否かを問う第1の確認画面を前記表示部に表示し、該第1の確認画面に対して前記ユーザから前記マイクの使用を許可する指示を待って、前記第1のサーバを起動させる音声テキスト化要求部と、
前記マイクを通して入力された音声情報に対して前記第1のサーバから変換されたテキスト情報を受信する受信部と、を有し、
前記画面生成部は、前記ユーザに対して、前記マイクの使用を許可するか否かを問う第1の確認画面を生成し、かつ、前記受信部が前記第1のサーバから前記テキスト情報を受信した場合、前記テキスト情報を前記画面に入力するテキストとして決定するかを前記ユーザに問う第2の確認画面を生成し、前記第2の確認画面に対する前記ユーザからの指示に基づいて前記画面に対するテキスト入力を完了すること特徴とする音声入力システム。 - 音声入力のテキスト変換解読レベルを考慮して、エラーを回避するために基本発生音を発生させて、前記ユーザに発声状態をアドバイスする発生ガイド部を備えたことを特徴とする請求項1に記載の音声入力システム。
- 前記発生ガイド部は、さらに音声入力のテキスト変換解読レベルを考慮して、発声するスピードが早すぎる、又は低すぎるをケアする処理を行うことを特徴とする請求項2に記載の音声入力システム。
- 前記テキスト情報を前記携帯端末に送信する送信部はプッシュ型で送信することを特徴とする請求項1に記載の音声入力システム。
- ユーザの携帯端末と、音声入力情報をテキスト情報に変換する音声認識サービスサイトの第1のサーバと、前記テキスト情報を受信するWebサイトの第2のサーバとを通信ネットワークで接続した音声入力システムであって、
コンピュータを、
音声情報を入力するマイクを備える前記携帯端末、
前記第2のサーバとに接続した際に、複数の行に割り付けられたテキストを入力する画面を前記Webサイトのサーバから受信し表示部に表示する画面生成部、
前記画面を押下することで音声入力を受け付ける音声入力要求部と、
前記音声入力要求部を押下するタイミングで前記画面生成部が前記ユーザに対して、前記マイクの使用を許可するか否かを問う第1の確認画面を前記表示部に表示し、該第1の確認画面に対して前記ユーザから前記マイクの使用を許可する指示を待って、前記第1のサーバを起動させる音声テキスト化要求部、
前記マイクを通して入力された音声情報に対して前記第1のサーバから変換されたテキスト情報を受信する受信部として機能させ、かつ、前記画面生成部は、前記ユーザに対して、前記マイクの使用を許可するか否かを問う第1の確認画面を生成し、かつ、前記受信部が前記第1のサーバから前記テキスト情報を受信した場合、前記テキスト情報を前記画面に入力するテキストとして決定するかを前記ユーザに問う第2の確認画面を生成し、前記第2の確認画面に対する前記ユーザからの指示に基づいて前記画面に対するテキスト入力を完了させることを特徴とする音声入力プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022133164A JP7319639B1 (ja) | 2022-08-24 | 2022-08-24 | 音声入力システム及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022133164A JP7319639B1 (ja) | 2022-08-24 | 2022-08-24 | 音声入力システム及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7319639B1 true JP7319639B1 (ja) | 2023-08-02 |
JP2024030340A JP2024030340A (ja) | 2024-03-07 |
Family
ID=87469565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022133164A Active JP7319639B1 (ja) | 2022-08-24 | 2022-08-24 | 音声入力システム及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7319639B1 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000352992A (ja) | 1999-06-11 | 2000-12-19 | Fujitsu Ten Ltd | 音声認識装置 |
JP2005164944A (ja) | 2003-12-02 | 2005-06-23 | Canon Inc | 動作パラメータ決定装置、電子装置、音声合成装置、対話システム、動作パラメータ決定方法、及びコンピュータで読み取り可能な制御プログラム |
CN104795069A (zh) | 2014-01-21 | 2015-07-22 | 腾讯科技(深圳)有限公司 | 语音识别方法和服务器 |
JP2018049080A (ja) | 2016-09-20 | 2018-03-29 | 株式会社リコー | 通信システム、情報処理装置、プログラム、通信方法 |
JP2019074608A (ja) | 2017-10-13 | 2019-05-16 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
US20190215879A1 (en) | 2016-09-11 | 2019-07-11 | Lg Electronics Inc. | Method and apparatus for connecting device by using bluetooth technology |
-
2022
- 2022-08-24 JP JP2022133164A patent/JP7319639B1/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000352992A (ja) | 1999-06-11 | 2000-12-19 | Fujitsu Ten Ltd | 音声認識装置 |
JP2005164944A (ja) | 2003-12-02 | 2005-06-23 | Canon Inc | 動作パラメータ決定装置、電子装置、音声合成装置、対話システム、動作パラメータ決定方法、及びコンピュータで読み取り可能な制御プログラム |
CN104795069A (zh) | 2014-01-21 | 2015-07-22 | 腾讯科技(深圳)有限公司 | 语音识别方法和服务器 |
US20190215879A1 (en) | 2016-09-11 | 2019-07-11 | Lg Electronics Inc. | Method and apparatus for connecting device by using bluetooth technology |
JP2018049080A (ja) | 2016-09-20 | 2018-03-29 | 株式会社リコー | 通信システム、情報処理装置、プログラム、通信方法 |
JP2019074608A (ja) | 2017-10-13 | 2019-05-16 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2024030340A (ja) | 2024-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8000454B1 (en) | Systems and methods for visual presentation and selection of IVR menu | |
JP6812392B2 (ja) | 情報出力方法、情報出力装置、端末装置及びコンピュータ読取可能な記憶媒体 | |
US8223931B1 (en) | Systems and methods for visual presentation and selection of IVR menu | |
US8553859B1 (en) | Device and method for providing enhanced telephony | |
CN109087639B (zh) | 用于语音识别的方法、装置、电子设备及计算机可读介质 | |
US8625756B1 (en) | Systems and methods for visual presentation and selection of IVR menu | |
US8880120B1 (en) | Device and method for providing enhanced telephony | |
CN101341532A (zh) | 通过标记共享话音应用处理 | |
US10698934B1 (en) | Interface between a virtual personal assistant and an interactive voice response system | |
CN101341482A (zh) | 声音启动的网络操作 | |
KR20180123150A (ko) | 정보 처리 시스템, 접수 서버, 정보 처리 방법 및 프로그램 | |
TW200540649A (en) | Method and apparatus for automatic telephone menu navigation | |
JP6920773B1 (ja) | 情報提供方法、情報提供システム、情報提供装置及びコンピュータプログラム | |
US20050124322A1 (en) | System for communication information from a server via a mobile communication device | |
US8731148B1 (en) | Systems and methods for visual presentation and selection of IVR menu | |
US8867708B1 (en) | Systems and methods for visual presentation and selection of IVR menu | |
JP2024520659A (ja) | 対話型通信システムを動的にナビゲートするための方法、装置、及びシステム | |
JPWO2005091128A1 (ja) | 音声処理装置とシステム及び音声処理方法 | |
US10395317B2 (en) | Method for intermediating network communications between user device and destination system | |
JP2001197207A (ja) | 多言語応対装置 | |
JP7319639B1 (ja) | 音声入力システム及びそのプログラム | |
US11656844B2 (en) | Providing a communications channel between instances of automated assistants | |
JP7377668B2 (ja) | 制御装置、制御方法及びコンピュータプログラム | |
KR20020020585A (ko) | 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체 | |
JP3550654B2 (ja) | 音声認識装置および方法、並びに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221212 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20221212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230314 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230711 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230712 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7319639 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |