JP2018173522A - 音声認識装置、音声認識方法、及びプログラム - Google Patents
音声認識装置、音声認識方法、及びプログラム Download PDFInfo
- Publication number
- JP2018173522A JP2018173522A JP2017071168A JP2017071168A JP2018173522A JP 2018173522 A JP2018173522 A JP 2018173522A JP 2017071168 A JP2017071168 A JP 2017071168A JP 2017071168 A JP2017071168 A JP 2017071168A JP 2018173522 A JP2018173522 A JP 2018173522A
- Authority
- JP
- Japan
- Prior art keywords
- situation
- conversation
- voice recognition
- voice
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
取得した音声データを認識し、音声認識結果として複数の変換候補を求める音声認識手段、会話の状況を判定する状況判定手段、前記音声認識手段により求めた複数の変換候補の中から前記状況判定手段により判定した会話の状況に適した変換候補を抽出する抽出手段、として機能させるためのプログラムである。
Memory)等により構成される。
CPUは、記憶部12、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス19を介して接続された各部を駆動制御する。ROMは、コンピュータ10のブートプログラムやBIOS等のプログラム、データ等を恒久的に保持する。RAMは、ロードしたプログラムやデータを一時的に保持するとともに、制御部11が各種処理を行うために使用するワークエリアを備える。制御部11は、上記プログラムを読み出して実行することにより、図1に示す音声認識装置1の各部(音声取得部21、音声認識部22、状況判定部23、音声認識結果抽出部24、出力部25、及び音解析部26等)として機能する。すなわち、制御部11はマイク18または通信制御部17等から入力された音声データを取得し、取得した音声データについて後述する音声認識処理(図3参照)を実行する。
表示部16は、例えば液晶パネル、CRTモニタ等のディスプレイ装置と、ディスプレイ装置と連携して表示処理を実行するための論理回路(ビデオアダプタ等)で構成され、制御部11の制御により入力された表示情報をディスプレイ装置上に表示させる。なお、入力部15及び表示部16は、表示画面にタッチパネル等の入力装置を一体的に設けたタッチパネルディスプレイとしてもよい。
マイク18は、音声を収集し、音声データとして制御部11に入力する。
バス19は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
音声取得部21は、会話の音声データを取得する。会話の音声データは、音声認識装置1がマイク18を備えるものであれば、マイク18から入力された音声データでもよいし、通信制御部17及びネットワーク3を介して音声認識装置1と通信接続された機器とから入力されたものでもよい。
制御部11は、記憶部12から図3に示す音声認識処理に関するプログラム及びデータを読み出し、このプログラム及びデータに基づいて処理を実行する。
「RPG(ゲーム)」の尤度=会話内容「0.5」+音判定「0」=0.5
「観光」の尤度=会話内容「0.2」+音判定「0.8」=1.0
となる。
「RPG(ゲーム)」の尤度=(会話内容「0.5」+音判定「0」)×ゲームのコンテキストの重み「0」=0
「観光」の尤度=(会話内容「0.2」+音判定「0.8」)×観光のコンテキストの重み「0.7」=0.7
10……………コンピュータ
11……………制御部
12……………記憶部
13……………メディア入出力部
14……………周辺機器I/F部
15……………入力部
16……………表示部
17……………通信制御部
18……………マイク
19……………バス
21……………音声取得部
22……………音声認識部
23……………状況判定部
231…………会話内容判定部
232…………周囲状況判定部
24……………音声認識結果抽出部
25……………出力部
26……………音解析部
27……………画像取得部
28……………画像解析部
29……………位置情報取得部
3………………ネットワーク
5………………ジャンルデータ
6………………対話型ロボット
7………………PC
100…………音声認識システム
Claims (9)
- 音声データを取得する音声取得手段と、
取得した音声データを認識し、音声認識結果として複数の変換候補を求める音声認識手段と、
音声データ取得時の状況を判定する状況判定手段と、
前記音声認識手段により求めた複数の変換候補の中から前記状況判定手段により判定した状況に適した変換候補を抽出する抽出手段と、
を備えることを特徴とする音声認識装置。 - 状況と関連付けられた単語を記憶する記憶手段を備え、
前記状況判定手段は、前記単語を音声データから抽出し、前記単語に基づいて前記状況を判定することを特徴とする請求項1に記載の音声認識装置。 - 前記状況判定手段は、更に、取得される周囲の音に基づいて前記状況を判定することを特徴とする請求項2に記載の音声認識装置。
- 前記状況判定手段は、更に、取得される画像に基づいて前記状況を判定することを特徴とする請求項2または請求項3に記載の音声認識装置。
- 前記状況判定手段は、更に、取得される位置情報に基づいて前記状況を判定することを特徴とする請求項2から請求項4のいずれかに記載の音声認識装置。
- 前記状況判定手段により判定した会話の状況の履歴を記憶する記憶手段を更に備え、
前記抽出手段は、前記記憶手段に記憶された会話の状況の履歴に基づき、前記音声認識手段により求めた複数の変換候補の中から会話の状況に適した変換候補を抽出することを特徴とする請求項1から請求項5のいずれかに記載の音声認識装置。 - 前記抽出手段は、設定された尤度に基づいて抽出候補に優先付けを行うことを特徴とする請求項1から請求項6のいずれかに記載の音声認識装置。
- コンピュータが、
音声データを取得するステップと、
取得した音声データを認識し、音声認識結果として複数の変換候補を求めるステップと、
音声データ取得時の状況を判定するステップと、
前記複数の変換候補の中から前記状況に適した変換候補を抽出するステップと、
を含むことを特徴とする音声認識方法。 - コンピュータを、
音声データを取得する音声取得手段、
取得した音声データを認識し、音声認識結果として複数の変換候補を求める音声認識手段、
音声データ取得時の状況を判定する状況判定手段、
前記音声認識手段により求めた複数の変換候補の中から前記状況判定手段により判定した状況に適した変換候補を抽出する抽出手段、
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017071168A JP6866731B2 (ja) | 2017-03-31 | 2017-03-31 | 音声認識装置、音声認識方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017071168A JP6866731B2 (ja) | 2017-03-31 | 2017-03-31 | 音声認識装置、音声認識方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018173522A true JP2018173522A (ja) | 2018-11-08 |
JP6866731B2 JP6866731B2 (ja) | 2021-04-28 |
Family
ID=64108742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017071168A Active JP6866731B2 (ja) | 2017-03-31 | 2017-03-31 | 音声認識装置、音声認識方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6866731B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021171820A1 (ja) * | 2020-02-27 | 2021-09-02 | ソニーグループ株式会社 | 情報処理装置、および情報処理方法、並びにプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000315204A (ja) * | 1999-03-03 | 2000-11-14 | Fujitsu Ltd | 文字列入力装置及び方法 |
JP2006317722A (ja) * | 2005-05-13 | 2006-11-24 | Xanavi Informatics Corp | 音声処理装置 |
JP2007288374A (ja) * | 2006-04-14 | 2007-11-01 | Mitsubishi Electric Corp | 携帯電話機及び通話制御方法 |
US20160140955A1 (en) * | 2014-11-13 | 2016-05-19 | International Business Machines Corporation | Speech recognition candidate selection based on non-acoustic input |
JP2016099501A (ja) * | 2014-11-21 | 2016-05-30 | 日本電信電話株式会社 | 音声認識装置、音声認識方法及び音声認識プログラム |
-
2017
- 2017-03-31 JP JP2017071168A patent/JP6866731B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000315204A (ja) * | 1999-03-03 | 2000-11-14 | Fujitsu Ltd | 文字列入力装置及び方法 |
JP2006317722A (ja) * | 2005-05-13 | 2006-11-24 | Xanavi Informatics Corp | 音声処理装置 |
JP2007288374A (ja) * | 2006-04-14 | 2007-11-01 | Mitsubishi Electric Corp | 携帯電話機及び通話制御方法 |
US20160140955A1 (en) * | 2014-11-13 | 2016-05-19 | International Business Machines Corporation | Speech recognition candidate selection based on non-acoustic input |
JP2016099501A (ja) * | 2014-11-21 | 2016-05-30 | 日本電信電話株式会社 | 音声認識装置、音声認識方法及び音声認識プログラム |
Non-Patent Citations (1)
Title |
---|
岩本秀明: "次発話予測モデルによる音声認識候補の再順序付け", 情報処理学会研究報告, vol. 2000, no. 11, JPN6017044887, 28 January 2000 (2000-01-28), JP, pages 135 - 140, ISSN: 0004394963 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021171820A1 (ja) * | 2020-02-27 | 2021-09-02 | ソニーグループ株式会社 | 情報処理装置、および情報処理方法、並びにプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6866731B2 (ja) | 2021-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11341972B2 (en) | Speech recognition using two language models | |
TWI585745B (zh) | 用於在一數位助理中處理語音之方法,用於處理語音之電子器件,及用於處理語音之電腦可讀儲存媒體 | |
US9824687B2 (en) | System and terminal for presenting recommended utterance candidates | |
JP6857581B2 (ja) | 成長型対話装置 | |
US11217230B2 (en) | Information processing device and information processing method for determining presence or absence of a response to speech of a user on a basis of a learning result corresponding to a use situation of the user | |
KR20190100334A (ko) | 문맥상의 핫워드들 | |
US11183187B2 (en) | Dialog method, dialog system, dialog apparatus and program that gives impression that dialog system understands content of dialog | |
KR20240008405A (ko) | 장치에 대한 다중 사용자 인증 | |
US10586528B2 (en) | Domain-specific speech recognizers in a digital medium environment | |
KR101615848B1 (ko) | 유사상황 검색을 통한 대화 스티커 추천방법 및 컴퓨터 프로그램 | |
US11164584B2 (en) | System and method for uninterrupted application awakening and speech recognition | |
JP7276129B2 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム | |
JP6897677B2 (ja) | 情報処理装置及び情報処理方法 | |
US20230046658A1 (en) | Synthesized speech audio data generated on behalf of human participant in conversation | |
KR102433964B1 (ko) | 관계 설정을 이용한 실감형 인공지능기반 음성 비서시스템 | |
WO2020202862A1 (ja) | 応答生成装置及び応答生成方法 | |
JP6866731B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
US20200135186A1 (en) | System and method for speech recognition with decoupling awakening phrase | |
JP6306447B2 (ja) | 複数の異なる対話制御部を同時に用いて応答文を再生する端末、プログラム及びシステム | |
US11430429B2 (en) | Information processing apparatus and information processing method | |
JP6383748B2 (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
KR20210098250A (ko) | 전자 장치 및 이의 제어 방법 | |
JP6571587B2 (ja) | 音声入力装置、その方法、及びプログラム | |
AU2018101475B4 (en) | Improving automatic speech recognition based on user feedback | |
JP2018013595A (ja) | 情報処理装置、端末装置、システム、情報処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201014 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210309 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210322 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6866731 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |