JP2018055022A - 音声認識システム、情報処理装置、プログラム - Google Patents
音声認識システム、情報処理装置、プログラム Download PDFInfo
- Publication number
- JP2018055022A JP2018055022A JP2016193855A JP2016193855A JP2018055022A JP 2018055022 A JP2018055022 A JP 2018055022A JP 2016193855 A JP2016193855 A JP 2016193855A JP 2016193855 A JP2016193855 A JP 2016193855A JP 2018055022 A JP2018055022 A JP 2018055022A
- Authority
- JP
- Japan
- Prior art keywords
- user
- information
- information processing
- voice
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
図1は、本実施形態の音声認識システム100の動作の概略を説明する図の一例である。電子黒板2は音声認識サービス11及び認証サービス12を利用することができる。また、電子黒板2はICカード8を読み取るカードリーダ117を有する。
(1)電子黒板2のユーザは自分の携帯するICカード8をカードリーダ117に近づける。
(2)電子黒板2はカードリーダ117から読み込んだカード情報(カードを特定する情報)を、認証サービス12に送信し、ユーザ情報(ユーザを特定する情報) を取得する。
(3)会議が開催されユーザが近くの参加者又は他の拠点の参加者と会話する。電子黒板2はユーザが発声した音声データを取得して、ユーザ情報と共に音声データを音声認識サービス11に送信する。
(4)音声認識サービス11は、ユーザ情報によりユーザごとに管理する辞書データを特定する。辞書データには、ユーザの発声内容(単語など)の意図が登録されている。
(5)音声認識サービス11はユーザの辞書データを利用して音声データを解析し、ユーザの意図に沿って作成した認識結果(テキストデータやバイナリデータ)を電子黒板2に送信する。
(6)電子黒板2は受信したテキストデータをディスプレイ3に表示したり、バイナリデータを自機の操作などに使用したりする。
図2は、本実施形態の音声認識システム100の概略構成図の一例である。音声認識システム100は、ネットワークNを介して通信する電子黒板2、クラウドサーバ50及び認証装置40を有する。
<<電子黒板のハードウェア構成図例>>
図3は、電子黒板2のハードウェア構成図の一例である。図3に示されているように、電子黒板2は、電子黒板2全体の動作を制御するCPU101、IPL等のCPUの駆動に用いられるプログラムを記憶したROM102、CPU101のワークエリアとして使用されるRAM103、ネットワークNとの通信を制御するネットワークコントローラ105、及び、USBメモリ5との通信を制御する外部記憶コントローラ106を備えている。
図4は、クラウドサーバ50の概略的なハードウェア構成図の一例である。クラウドサーバ50は、CPU201と、CPU201が使用するデータの高速アクセスを可能とするメモリ202とを備える。CPU201及びメモリ202は、システム・バス203を介して、クラウドサーバ50の他のデバイス又はドライバ、例えば、グラフィクス・ドライバ204及びネットワーク・ドライバ(NIC)205へと接続されている。
システム・バス203には、更にI/Oバス・ブリッジ207が接続されている。I/Oバス・ブリッジ207の下流側には、PCIなどのI/Oバス208を介して、IDE、ATA、ATAPI、シリアルATA、SCSI、USBなどにより、HDD(ハードディスクドライブ)209などの記憶装置が接続されている。HDD209はクラウドサーバ50の全体を制御するプログラム209pを記憶している。HDD209はSSD(Solid State Drive)でもよい。
図5は、電子黒板2、クラウドサーバ50及び認証装置40の機能を示すブロック状に示す機能ブロック図の一例である。
電子黒板2は、カード情報読取部21、カード情報送信部22、音声取得部23、ユーザ情報受信部24、情報表示部25、認証・音声送信部26、機器操作部27、及び、情報受信部28の各機能を有する。
カード情報送信部22は、CPU101がRAM103に記憶されたプログラムを実行しネットワークコントローラ105を制御すること等により実現され、読み取ったカード情報を認証装置40に送信する。
認証・音声送信部26は、CPU101がRAM103に記憶されたプログラムを実行しネットワークコントローラ105を制御すること等により実現され、ユーザ情報と音声データをクラウドサーバ50に送信する。ユーザ情報と音声データは同時に送信される必要はなく、別々に送信されてよい。この場合、クラウドサーバ50は、一度、ユーザ情報を受信すると次にユーザ情報を受信するまで、最後に受信したユーザ情報に対応付けられた音声データであると判断する。
まず、認証装置40は認証DB44(データベース)を有している。認証DB44は、図4に示したHDD209やメモリ202に構築され、予めカード情報とユーザ情報の組が記憶されている。表1に認証DB44に記憶されているカード情報とユーザ情報を示す。
まず、クラウドサーバ50は辞書DB45を有している。辞書DB45は、図4に示したHDD209やメモリ202に構築され、予めユーザごとに辞書データが記憶されている。表2に辞書DB45に記憶されているユーザごとの辞書データを示す。
図6は音声認識部54の音声認識に関する機能をブロック状に示す機能ブロック図の一例である。クラウドサーバ50は、前処理部54a、特徴抽出部54b、及び識別演算部54cを有し、識別演算部54cは更に音響モデル54dと言語モデル54eを使用する。これら各機能は、図4に示したHDD209からメモリ202に展開されたプログラム209pをCPU201が実行することにより実現されている。
図7は、音声認識システム100の動作手順を示すシーケンス図の一例である。以下、ステップに沿って説明する。
以上、本発明を実施するための最良の形態について実施例を用いて説明したが、本発明はこうした実施例に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
23 音声取得部
24 ユーザ情報受信部
25 情報表示部
26 音声送信部
27 機器操作部
40 認証装置
50 クラウドサーバ
51 音声受信部
52 情報送信部
54 音声認識部
100 音声認識システム
Claims (10)
- 音声データに対し音声認識を行う第一の情報処理装置と、前記第一の情報処理装置に音声データを送信する第二の情報処理装置とを有する音声認識システムであって、
前記第二の情報処理装置は、
ユーザに関するユーザ情報を前記第一の情報処理装置に送信するユーザ情報送信手段を有し、
前記第一の情報処理装置は、
前記ユーザ情報を受信するユーザ情報受信手段と、
前記ユーザ情報に対応付けられた辞書データを使用して、前記第二の情報処理装置から送信された音声データに音声認識を施す音声認識手段と、
音声データの認識結果を前記第二の情報処理装置に送信する認識結果送信手段と、
を有する音声認識システム。 - 前記辞書データには、ユーザの発声内容に対するユーザの意図が登録されており、
前記音声認識手段は、前記ユーザの意図に沿って前記認識結果を作成する請求項1に記載の音声認識システム。 - 前記辞書データにはユーザの発声内容と変換後の単語が対応付けて登録されており、
前記音声認識手段は、ユーザの発声内容を前記変換後の単語に変換して前記認識結果を作成する請求項1又は2に記載の音声認識システム。 - 前記辞書データにはユーザの発声内容と変換後の単語が対応付けて登録されており、
前記音声認識手段は、ユーザの発声内容が検索することを含む場合、前記変換後の単語に基づく検索範囲を検索する検索要求を前記認識結果として作成する請求項1又は2に記載の音声認識システム。 - 前記辞書データにはユーザの発声内容に装置のコマンドが対応付けられており、
前記音声認識手段は、ユーザの発声内容を前記コマンドに変換した前記認識結果を作成する請求項1又は2に記載の音声認識システム。 - 前記辞書データにはユーザの発声内容に、前記第一の情報処理装置及び前記第二の情報処理装置でない装置に発声内容を送信する旨が対応付けられており、
前記音声認識手段は、ユーザの発声内容を前記装置に送信する送信情報に変換した前記認識結果を作成する請求項1又は2に記載の音声認識システム。 - 前記辞書データにはユーザの発声内容ごとに、前記第一の情報処理装置による前記認識結果の処理方法が対応付けられており、
前記認識結果送信手段は、前記認識結果と共に前記処理方法を前記第二の情報処理装置に送信し、
前記第二の情報処理装置は、
前記処理方法に基づいて前記認識結果を処理する請求項1〜6のいずれか1項に記載の音声認識システム。 - 前記処理方法は、ユーザの発声内容の表示、ユーザの発声内容に応じた操作、又は、ユーザの発声内容の他の装置への送信であり、
前記第二の情報処理装置は、前記処理方法を参照して、ユーザの発声内容を表示するか、ユーザの発声内容に応じた操作を行うか、又は、ユーザの発声内容を他の装置に送信する請求項7に記載の音声認識システム。 - 第二の情報処理装置から送信された音声データに認識処理を施す情報処理装置であって、
前記第二の情報処理装置のユーザに関するユーザ情報を受信するユーザ情報受信手段と、
前記ユーザ情報に対応付けられた辞書データを使用して、前記第二の情報処理装置から送信された音声データに音声認識を施す音声認識手段と、
音声データの認識結果を前記第二の情報処理装置に送信する認識結果送信手段と、
を有する情報処理装置。 - 第二の情報処理装置から送信された音声データに認識処理を施す情報処理装置を、
前記第二の情報処理装置のユーザに関するユーザ情報を受信するユーザ情報受信手段と、
前記ユーザ情報に対応付けられた辞書データを使用して、前記第二の情報処理装置から送信された音声データに音声認識を施す音声認識手段と、
音声データの認識結果を前記第二の情報処理装置に送信する認識結果送信手段、
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016193855A JP6922178B2 (ja) | 2016-09-30 | 2016-09-30 | 音声認識システム、情報処理装置、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016193855A JP6922178B2 (ja) | 2016-09-30 | 2016-09-30 | 音声認識システム、情報処理装置、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018055022A true JP2018055022A (ja) | 2018-04-05 |
JP6922178B2 JP6922178B2 (ja) | 2021-08-18 |
Family
ID=61835810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016193855A Active JP6922178B2 (ja) | 2016-09-30 | 2016-09-30 | 音声認識システム、情報処理装置、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6922178B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108735211A (zh) * | 2018-05-16 | 2018-11-02 | 智车优行科技(北京)有限公司 | 语音处理方法、装置、车辆、电子设备、程序及介质 |
JP2020077020A (ja) * | 2018-11-05 | 2020-05-21 | コニカミノルタ株式会社 | 画像形成装置及び画像形成システム |
JP7468003B2 (ja) | 2020-03-10 | 2024-04-16 | 株式会社リコー | 音声処理装置、音声処理システム、音声処理方法およびプログラム |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000331002A (ja) * | 1999-05-14 | 2000-11-30 | Sony Corp | 検索装置、検索方法、検索制御プログラムを記録した記録媒体 |
JP2002101203A (ja) * | 2000-09-20 | 2002-04-05 | Ricoh Co Ltd | 音声処理システム、音声処理方法およびその方法を記憶した記憶媒体 |
JP2003005781A (ja) * | 2001-06-20 | 2003-01-08 | Denso Corp | 音声認識機能付き制御装置及びプログラム |
JP2003177782A (ja) * | 2001-12-10 | 2003-06-27 | Ricoh Co Ltd | 音声認識装置、プログラムおよび記録媒体 |
JP2005227510A (ja) * | 2004-02-12 | 2005-08-25 | Ntt Docomo Inc | 音声認識装置及び音声認識方法 |
JP2009047865A (ja) * | 2007-08-17 | 2009-03-05 | Mobi Techno:Kk | 音声認識を用いた情報提供システム |
JP2009075582A (ja) * | 2007-08-29 | 2009-04-09 | Advanced Media Inc | 端末装置、言語モデル作成装置、および分散型音声認識システム |
KR20090131716A (ko) * | 2008-06-19 | 2009-12-30 | 권오중 | 인터넷을 이용한 수준별 다자간 그룹 외국어 회화 학습방법 및 그 시스템 |
JP2013088535A (ja) * | 2011-10-14 | 2013-05-13 | Vri Inc | 音声制御システム及びプログラム |
JP2014170185A (ja) * | 2013-03-05 | 2014-09-18 | Nec Corp | 発話コマンド認識システム |
JP2015081971A (ja) * | 2013-10-22 | 2015-04-27 | 株式会社Nttドコモ | 機能実行指示システム及び機能実行指示方法 |
JP2016153225A (ja) * | 2015-02-16 | 2016-08-25 | 株式会社リコー | 情報処理装置、制御方法、及びプログラム |
-
2016
- 2016-09-30 JP JP2016193855A patent/JP6922178B2/ja active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000331002A (ja) * | 1999-05-14 | 2000-11-30 | Sony Corp | 検索装置、検索方法、検索制御プログラムを記録した記録媒体 |
JP2002101203A (ja) * | 2000-09-20 | 2002-04-05 | Ricoh Co Ltd | 音声処理システム、音声処理方法およびその方法を記憶した記憶媒体 |
JP2003005781A (ja) * | 2001-06-20 | 2003-01-08 | Denso Corp | 音声認識機能付き制御装置及びプログラム |
JP2003177782A (ja) * | 2001-12-10 | 2003-06-27 | Ricoh Co Ltd | 音声認識装置、プログラムおよび記録媒体 |
JP2005227510A (ja) * | 2004-02-12 | 2005-08-25 | Ntt Docomo Inc | 音声認識装置及び音声認識方法 |
JP2009047865A (ja) * | 2007-08-17 | 2009-03-05 | Mobi Techno:Kk | 音声認識を用いた情報提供システム |
JP2009075582A (ja) * | 2007-08-29 | 2009-04-09 | Advanced Media Inc | 端末装置、言語モデル作成装置、および分散型音声認識システム |
KR20090131716A (ko) * | 2008-06-19 | 2009-12-30 | 권오중 | 인터넷을 이용한 수준별 다자간 그룹 외국어 회화 학습방법 및 그 시스템 |
JP2013088535A (ja) * | 2011-10-14 | 2013-05-13 | Vri Inc | 音声制御システム及びプログラム |
JP2014170185A (ja) * | 2013-03-05 | 2014-09-18 | Nec Corp | 発話コマンド認識システム |
JP2015081971A (ja) * | 2013-10-22 | 2015-04-27 | 株式会社Nttドコモ | 機能実行指示システム及び機能実行指示方法 |
JP2016153225A (ja) * | 2015-02-16 | 2016-08-25 | 株式会社リコー | 情報処理装置、制御方法、及びプログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108735211A (zh) * | 2018-05-16 | 2018-11-02 | 智车优行科技(北京)有限公司 | 语音处理方法、装置、车辆、电子设备、程序及介质 |
JP2020077020A (ja) * | 2018-11-05 | 2020-05-21 | コニカミノルタ株式会社 | 画像形成装置及び画像形成システム |
JP7107174B2 (ja) | 2018-11-05 | 2022-07-27 | コニカミノルタ株式会社 | 画像形成装置及び画像形成システム |
JP7468003B2 (ja) | 2020-03-10 | 2024-04-16 | 株式会社リコー | 音声処理装置、音声処理システム、音声処理方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6922178B2 (ja) | 2021-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2349969C2 (ru) | Синхронное понимание семантических объектов, реализованное с помощью тэгов речевого приложения | |
US8903726B2 (en) | Voice entry of sensitive information | |
US20160372110A1 (en) | Adapting voice input processing based on voice input characteristics | |
US10741172B2 (en) | Conference system, conference system control method, and program | |
JP2018045001A (ja) | 音声認識システム、情報処理装置、プログラム、音声認識方法 | |
WO2020238045A1 (zh) | 智能语音识别方法、装置及计算机可读存储介质 | |
JP2018040906A (ja) | 辞書更新装置およびプログラム | |
JPWO2018055983A1 (ja) | 翻訳装置、翻訳システム、および評価サーバ | |
CN114787814A (zh) | 指代解析 | |
JP6922178B2 (ja) | 音声認識システム、情報処理装置、プログラム | |
KR20150041592A (ko) | 피호출자의 전자 디바이스에서 연락처 정보를 업데이트하는 방법 및 전자 디바이스 | |
CN111063355A (zh) | 会议记录的生成方法及记录终端 | |
US11900931B2 (en) | Information processing apparatus and information processing method | |
CN109686359B (zh) | 语音输出方法、终端及计算机可读存储介质 | |
CN109510844B (zh) | 一种基于声纹的对话交流式的账号注册方法及装置 | |
JP2010026686A (ja) | 統合的インタフェースを有する対話型コミュニケーション端末及びそれを用いたコミュニケーションシステム | |
JP2017146672A (ja) | 画像表示装置、画像表示方法、画像表示プログラム及び画像表示システム | |
US20190066676A1 (en) | Information processing apparatus | |
KR102433964B1 (ko) | 관계 설정을 이용한 실감형 인공지능기반 음성 비서시스템 | |
KR20210042520A (ko) | 전자 장치 및 이의 제어 방법 | |
CN114708849A (zh) | 语音处理方法、装置、计算机设备及计算机可读存储介质 | |
JP2013250490A (ja) | 処理装置、処理システム、音声認識方法及びプログラム | |
US20200243092A1 (en) | Information processing device, information processing system, and computer program product | |
JP2016024378A (ja) | 情報処理装置、その制御方法及びプログラム | |
JP2013238986A (ja) | 処理装置、処理システム、出力方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190703 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200331 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200527 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200811 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201008 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210401 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20210401 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20210412 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20210413 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210629 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210712 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6922178 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |