JP2022117375A - 音声認識プログラム及び音声認識装置 - Google Patents
音声認識プログラム及び音声認識装置 Download PDFInfo
- Publication number
- JP2022117375A JP2022117375A JP2021060936A JP2021060936A JP2022117375A JP 2022117375 A JP2022117375 A JP 2022117375A JP 2021060936 A JP2021060936 A JP 2021060936A JP 2021060936 A JP2021060936 A JP 2021060936A JP 2022117375 A JP2022117375 A JP 2022117375A
- Authority
- JP
- Japan
- Prior art keywords
- time
- utterance
- voice
- speech
- retroactive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 description 23
- 230000000694 effects Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 9
- 238000005070 sampling Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 6
- 230000007613 environmental effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
Images
Landscapes
- Telephone Function (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】ユーザHから入力された音声Vから、第1発話と、その第1発話の直後の第2発話との開始時刻StT及び終了時刻EdTとがそれぞれ取得される。第2発話の開始時刻StTと第1発話の終了時刻EdTとの発話間隔ΔTに基づいて遡及時間Tが取得され、第2発話の開始時刻StTから遡及時間Tを遡った認識開始時刻StRより音声認識が開始される。これにより、第2発話V2の開始から確実に第2発話V2の音声認識を開始できる。従って、第1発話と第2発話とが連続して入力された場合でも第2発話の開始から確実に音声認識を開始できるので、第1発話と第2発話とを正確に音声認識できる。
【選択図】図3
Description
11 フラッシュROM(記憶部)
11b 音声バッファ(音声記憶手段)
11a 音声認識プログラム
V 音声
V1 第1発話
V2 第2発話
S20 音声記憶ステップ
StT 開始時刻
EdT 終了時刻
ΔT 発話間隔
x1 第1所定時間
x2 第2所定時間
T 遡及時間
Tx1 第1遡及時間
Tx2 第2遡及時間
S31 開始時刻取得ステップ、開始時刻取得手段
S39 終了時刻取得ステップ、終了時刻取得手段
S32 間隔取得ステップ、間隔取得手段
S34~S36 遡及時間取得ステップ、遡及時間取得手段
S37 音声認識ステップ、音声認識手段
Claims (7)
- 記憶部を備えたコンピュータに、音声認識処理を実行させる音声認識プログラムであって、
前記記憶部を音声が記憶される音声記憶手段として機能させ、
入力された音声を前記音声記憶手段に記憶する音声記憶ステップと、
前記音声記憶手段に記憶される音声による発話の開始時刻を取得する開始時刻取得ステップと、
前記音声記憶手段に記憶される音声による発話の終了時刻を取得する終了時刻取得ステップと、
その終了時刻取得ステップで取得された第1発話の終了時刻と、前記開始時刻取得ステップで取得された開始時刻であって前記第1発話の後に入力される第2発話の開始時刻との時間差である発話間隔を取得する間隔取得ステップと、
その間隔取得ステップで取得された発話間隔に基づいて、前記開始時刻取得ステップで取得された前記第2発話の開始時刻から遡る時間である遡及時間を取得する遡及時間取得ステップと、
前記音声記憶手段に記憶される音声において、前記開始時刻取得ステップで取得された前記第2発話の開始時刻から前記遡及時間取得ステップで取得された遡及時間を遡った時刻から前記第2発話の音声認識を開始する音声認識ステップとを備えていることを特徴とする音声認識プログラム。 - 前記遡及時間取得ステップは、前記間隔取得ステップで取得された発話間隔が第1所定時間以下の場合は、前記第1所定時間以上の時間である第1遡及時間を遡及時間として取得するものであることを特徴とする請求項1記載の音声認識プログラム。
- 前記遡及時間取得ステップは、前記間隔取得ステップで取得された発話間隔が第2所定時間以上の場合は、前記第2所定時間以下の時間である第2遡及時間を遡及時間として取得するものであることを特徴とする請求項1又は2に記載の音声認識プログラム。
- 前記第1遡及時間は、前記第1所定時間以上かつ前記第2所定時間以下の時間であることを特徴とする請求項3記載の音声認識プログラム。
- 前記第2遡及時間は、前記第1所定時間以上かつ前記第2所定時間以下の時間であることを特徴とする請求項3又は4に記載の音声認識プログラム。
- 前記遡及時間取得ステップは、前記間隔取得ステップで取得された発音間隔が第1所定時間と第2所定時間との間である場合は、遡及時間として前記発音間隔を取得するものであることを特徴とする請求項1から5のいずれかに記載の音声認識プログラム。
- 音声を入力する音声入力手段と、
その音声入力手段で入力された音声を記憶する音声記憶手段と、
その音声記憶手段で記憶された音声による発話の開始時刻を取得する開始時刻取得手段と、
前記音声記憶手段で記憶された音声による発話の終了時刻を取得する終了時刻取得手段と、
その終了時刻取得手段で取得された第1発話の終了時刻と、前記開始時刻取得手段で取得された開始時刻であって前記第1発話の後に入力される第2発話の開始時刻との時間差である発話間隔を取得する間隔取得手段と、
その間隔取得手段で取得された発話間隔に基づいて、前記開始時刻取得手段で取得された前記第2発話の開始時刻から遡る時間である遡及時間を取得する遡及時間取得手段と、
前記音声記憶手段で記憶された音声において、前記開始時刻取得手段で取得された前記第2発話の開始時刻から前記遡及時間取得手段で取得された遡及時間を遡った時刻から前記第2発話の音声認識を開始する音声認識手段と、を備えていることを特徴とする音声認識装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021013495 | 2021-01-29 | ||
JP2021013495 | 2021-01-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022117375A true JP2022117375A (ja) | 2022-08-10 |
Family
ID=82750009
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021060936A Pending JP2022117375A (ja) | 2021-01-29 | 2021-03-31 | 音声認識プログラム及び音声認識装置 |
JP2021060947A Pending JP2022117376A (ja) | 2021-01-29 | 2021-03-31 | 音声認識プログラム及び音声認識装置 |
JP2021060919A Pending JP2022117374A (ja) | 2021-01-29 | 2021-03-31 | 音声認識プログラム及び音声認識装置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021060947A Pending JP2022117376A (ja) | 2021-01-29 | 2021-03-31 | 音声認識プログラム及び音声認識装置 |
JP2021060919A Pending JP2022117374A (ja) | 2021-01-29 | 2021-03-31 | 音声認識プログラム及び音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (3) | JP2022117375A (ja) |
-
2021
- 2021-03-31 JP JP2021060936A patent/JP2022117375A/ja active Pending
- 2021-03-31 JP JP2021060947A patent/JP2022117376A/ja active Pending
- 2021-03-31 JP JP2021060919A patent/JP2022117374A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2022117376A (ja) | 2022-08-10 |
JP2022117374A (ja) | 2022-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100742888B1 (ko) | 음성 인식 방법 | |
US8315873B2 (en) | Sentence reading aloud apparatus, control method for controlling the same, and control program for controlling the same | |
JP5431282B2 (ja) | 音声対話装置、方法、プログラム | |
JP6495015B2 (ja) | 音声対話制御装置、音声対話制御装置の制御方法、および音声対話装置 | |
JP6459330B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP2012163692A (ja) | 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム | |
EP1477965A1 (en) | Spoken keyword recognition apparatus and method | |
JP5375423B2 (ja) | 音声認識システム、音声認識方法および音声認識プログラム | |
JP2022117375A (ja) | 音声認識プログラム及び音声認識装置 | |
JP2009104047A (ja) | 情報処理方法及び情報処理装置 | |
JP5074759B2 (ja) | 対話制御装置、対話制御方法及び対話制御プログラム | |
JP4798039B2 (ja) | 音声対話装置および方法 | |
JP3578587B2 (ja) | 音声認識装置および音声認識方法 | |
JP4437047B2 (ja) | 音声対話装置 | |
JPH0950288A (ja) | 音声認識装置及び音声認識方法 | |
JPH08263092A (ja) | 応答音声生成方法および音声対話システム | |
JP6966374B2 (ja) | 音声認識システム及びコンピュータプログラム | |
JP6748565B2 (ja) | 音声対話システム及び音声対話方法 | |
JP2010204442A (ja) | 音声認識装置、音声認識方法、音声認識プログラムおよびプログラム記録媒体 | |
JP3360978B2 (ja) | 音声認識装置 | |
KR102632806B1 (ko) | Stt결과 조기 확정을 위한 음성 인식 방법 및 장치 | |
JP2005084589A (ja) | 音声認識装置 | |
JP2000099070A (ja) | 音声認識装置及びその方法、コンピュータ可読メモリ | |
EP1426924A1 (en) | Speaker recognition for rejecting background speakers | |
JP2010211122A (ja) | 音声認識装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20211005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211223 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230801 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240426 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240507 |