JP2021196435A - 情報処理装置、プログラム、および情報処理方法 - Google Patents
情報処理装置、プログラム、および情報処理方法 Download PDFInfo
- Publication number
- JP2021196435A JP2021196435A JP2020101355A JP2020101355A JP2021196435A JP 2021196435 A JP2021196435 A JP 2021196435A JP 2020101355 A JP2020101355 A JP 2020101355A JP 2020101355 A JP2020101355 A JP 2020101355A JP 2021196435 A JP2021196435 A JP 2021196435A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- information
- recognition
- data
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 36
- 238000003672 processing method Methods 0.000 title claims abstract description 7
- 230000004044 response Effects 0.000 claims abstract description 110
- 230000005540 biological transmission Effects 0.000 claims abstract description 47
- 230000008878 coupling Effects 0.000 claims description 12
- 238000010168 coupling process Methods 0.000 claims description 12
- 238000005859 coupling reaction Methods 0.000 claims description 12
- 238000001514 detection method Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 abstract description 30
- 230000003993 interaction Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 16
- 230000008569 process Effects 0.000 description 14
- 239000000203 mixture Substances 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000005401 electroluminescence Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
Description
図1を参照して、対話システム1のシステム構成例を説明する。対話システム1は、発話者の音声に応じて動作するシステムである。対話システム1は、上記(1)〜(3)の機能をユーザに提供する。なお、このユーザは、対話装置100または対話装置100の周辺にいる別のユーザに対して発話する発話者(以下、単に「発話者」ともいう)を含む。
図2〜3を参照して、対話システム1の概要を説明する。
<3−1.対話装置>
図4を参照して、本実施形態に係る対話装置100の機能構成を説明する。図4に示すように、対話装置100は、通信部130と、制御部110と、音声取得部120と、出力部140と、入力部150と、記憶部160と、を備える。
図8を参照して、本実施形態に係るサーバ装置200の機能構成を説明する。図8に示すように、サーバ装置200は、制御部210と、通信部230と、記憶部250と、を備える。通信部230と記憶部250の機能は、それぞれ対話装置100の通信部130と記憶部160と同様のため説明を割愛する。
図9および図10を参照して、対話装置100の動作例を説明する。なお、以下に示す図7の動作例の処理の順番は一例であって、適宜、変更されてもよい。図9は、複数の音声認識システム300に音声認識処理を分散させる場面の対話装置100の動作例を示すフロー図である。図10は、秘匿情報の有無に応じて、対話装置100内部と外部のサーバ装置200とに応答情報の生成処理を振り分ける場面の動作例を示すフロー図である。
図11を参照して、上述してきた対話装置100およびサーバ装置200をコンピュータ800により実現する場合のハードウェア構成の一例を説明する。なお、それぞれの装置の機能は、複数台の装置に分けて実現することもできる。
Claims (10)
- 音声を認識する複数の音声認識システムとネットワークを介して接続する情報処理装置であって、
発話者の音声の音声データを取得する音声取得部と、
前記音声データから、前記音声データの複数の区間に対応する複数の発話データを生成する生成部と、
前記複数の発話データのそれぞれを、前記複数の区間における順序を示すインデックス情報と共に、前記複数の音声認識システムのいずれかに送信する送信部と、
前記複数の音声認識システムから、前記複数の発話データのそれぞれについて、前記発話データの認識結果を示す第1認識情報と前記インデックス情報とを受信する受信部と、
前記インデックス情報に基づき、前記複数の音声認識システムから受信した複数の前記第1認識情報を、前記順序で結合する結合部と、
前記結合された第1認識情報に基づき、前記音声に対して応答するための第1応答情報を生成する応答生成部と、
前記第1応答情報に基づき、前記音声に対する応答を出力する出力部と、を備える、
情報処理装置。 - 前記生成部は、
前記取得された音声の音声データから発話区間と無音区間とを検出する検出部と、
前記音声データを、前記発話区間ごとの前記発話データに分割する分割部と、を備える、
請求項1に記載の情報処理装置。 - 前記送信部は、前記発話データの長さ、前記発話データの音量、前記情報処理装置と前記発話者との距離、前記音声認識システムごとの利用時間、または前記音声認識システムごとの利用料の少なくとも一つに基づき、送信先の音声認識システムを特定する、
請求項1または2に記載の情報処理装置。 - 情報処理装置は、前記音声の認識結果に基づき前記音声に対して応答するための第2応答情報を生成するサーバ装置と前記ネットワークを介して接続し、
前記情報処理装置は、
前記音声データに基づき、前記取得された音声を認識し、認識結果を示す第2認識情報を生成する音声認識部と、
前記第2認識情報に秘匿対象の秘匿情報が含まれるか否かを判定する判定部と、をさらに備え、
前記第2認識情報に秘匿情報が含まれる場合、前記応答生成部は、前記第2認識情報に基づき、前記音声に対して応答するための第1応答情報を生成し、
前記第2認識情報に秘匿情報が含まれない場合、前記送信部は、前記第2認識情報を前記サーバ装置に送信し、
前記受信部は、前記サーバ装置から、前記第2認識情報に基づき生成された前記第2応答情報を受信する、
前記出力部は、前記受信した第2応答情報に基づき、前記音声に対する応答を出力する、
請求項1から3のいずれか一項に記載の情報処理装置。 - 前記送信部は、前記発話データおよび前記インデックス情報を前記複数の音声認識システムのいずれかに送信する際に、前記複数の音声認識システムのいずれかにおける複数のアカウントを用いて、前記発話データおよび前記インデックス情報を送信する、
請求項1から4のいずれか一項に記載の情報処理装置。 - 前記送信部は、前記発話データおよび前記インデックス情報を前記複数の音声認識システムのいずれかに送信する際に、前記複数の音声認識システムのいずれかとの複数のセッションを用いて、前記発話データおよび前記インデックス情報を送信する、
請求項1から5のいずれか一項に記載の情報処理装置。 - 前記送信部は、前記発話データおよび前記インデックス情報を前記複数の音声認識システムのいずれかに送信する際に、前記複数の音声認識システムのいずれかにおける複数のアカウントと複数のセッションとを用いて、前記発話データおよび前記インデックス情報を送信する、
請求項1から6のいずれか一項に記載の情報処理装置。 - 前記音声取得部は、複数の発話者による音声の音声データを取得し、
前記情報処理装置は、前記取得された音声データから前記発話者を識別する識別部をさらに備え、
前記生成部は、前記識別された発話者ごとに前記発話データを生成し、
前記送信部は、前記複数の発話者における前記発話データを混在させて、前記インデックス情報と共に前記複数の音声認識システムのいずれかに送信する、
請求項1から7のいずれか一項に記載の情報処理装置。 - 音声を認識する複数の音声認識システムとネットワークを介して接続する情報処理装置に、
発話者の音声の音声データを取得する音声機能と、
前記音声データから、前記音声データの複数の区間に対応する複数の発話データを生成する生成機能と、
前記複数の発話データのそれぞれを、前記複数の区間における順序を示すインデックス情報と共に、前記複数の音声認識システムのいずれかに送信する送信機能と、
前記複数の音声認識システムから、前記複数の発話データのそれぞれについて、前記発話データの認識結果を示す第1認識情報と前記インデックス情報とを受信する受信機能と、
前記インデックス情報に基づき、前記複数の音声認識システムから受信した複数の前記第1認識情報を、前記順序で結合する結合機能と、
前記結合された第1認識情報に基づき、前記音声に対して応答するための第1応答情報を生成する応答生成機能と、
前記第1応答情報に基づき、前記音声に対する応答を出力する出力機能と、を実現させる、
プログラム。 - 音声を認識する複数の音声認識システムとネットワークを介して接続する情報処理装置が、
発話者の音声の音声データを取得し、
前記音声データから、前記音声データの複数の区間に対応する複数の発話データを生成し、
前記複数の発話データのそれぞれを、前記複数の区間における順序を示すインデックス情報と共に、前記複数の音声認識システムのいずれかに送信し、
前記複数の音声認識システムから、前記複数の発話データのそれぞれについて、前記発話データの認識結果を示す第1認識情報と前記インデックス情報とを受信し、
前記インデックス情報に基づき、前記複数の音声認識システムから受信した複数の前記第1認識情報を、前記順序で結合し、
前記結合された第1認識情報に基づき、前記音声に対して応答するための第1応答情報を生成し、
前記第1応答情報に基づき、前記音声に対する応答を出力する、
情報処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020101355A JP2021196435A (ja) | 2020-06-11 | 2020-06-11 | 情報処理装置、プログラム、および情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020101355A JP2021196435A (ja) | 2020-06-11 | 2020-06-11 | 情報処理装置、プログラム、および情報処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021196435A true JP2021196435A (ja) | 2021-12-27 |
Family
ID=79197850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020101355A Pending JP2021196435A (ja) | 2020-06-11 | 2020-06-11 | 情報処理装置、プログラム、および情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021196435A (ja) |
-
2020
- 2020-06-11 JP JP2020101355A patent/JP2021196435A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102660922B1 (ko) | 복수의 지능형 개인 비서 서비스를 위한 관리 계층 | |
US10152964B2 (en) | Audio output of a document from mobile device | |
KR101838095B1 (ko) | 음성 인식을 위한 방법, 상호 작용 장치, 서버 및 시스템 | |
KR101883301B1 (ko) | 인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버 | |
US9294277B2 (en) | Audio encryption systems and methods | |
CN102292766A (zh) | 用于提供用于语音识别自适应的复合模型的方法、装置和计算机程序产品 | |
KR20080058124A (ko) | 촉각 서비스를 제공하는 휴대단말기 및 그 방법 | |
JP6236805B2 (ja) | 発話コマンド認識システム | |
KR102292671B1 (ko) | 보이스 가능 디바이스를 디스플레이 디바이스와 페어링 | |
CN110086941B (zh) | 语音播放方法、装置及终端设备 | |
WO2015125560A1 (ja) | 情報処理装置、音声対話装置、および制御プログラム | |
KR20080037402A (ko) | 이동통신 단말기의 회의록 작성 방법 | |
JP2021196435A (ja) | 情報処理装置、プログラム、および情報処理方法 | |
KR102206426B1 (ko) | 사용자 기기의 도움말 제공 방법 및 그에 관한 장치 | |
KR102574294B1 (ko) | 인공지능 플랫폼 제공 장치 및 이를 이용한 컨텐츠 서비스 방법 | |
TWM515143U (zh) | 語音翻譯系統及翻譯處理裝置 | |
US10235364B2 (en) | Interpretation distributing device, control device, terminal device, interpretation distributing method, control method, information processing method, and program | |
KR20180128653A (ko) | 대화 검색 방법, 대화 검색이 가능한 휴대형 단말 및 대화 관리 서버 | |
CN110634478A (zh) | 用于处理语音信号的方法及装置 | |
KR101638870B1 (ko) | Ars서버 및, 이 ars서버에 입력되는 응답신호를 생성 및 출력하는 ars 어플리케이션 프로그램을 기록한 기록매체 및, 이를 이용한 ars 서비스 방법 | |
US11086592B1 (en) | Distribution of audio recording for social networks | |
JP2020071470A (ja) | 情報処理システムおよび文字起こし方法 | |
JP2020072367A (ja) | 情報処理システムおよび文字起こし方法 | |
JP6729957B1 (ja) | 管理システム、管理方法およびコンピュータプログラム | |
JP6468069B2 (ja) | 電子機器制御システム、サーバー、及び、端末装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230417 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240329 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240515 |