JP2015200860A - 辞書データベース管理装置、apiサーバ、辞書データベース管理方法、及び辞書データベース管理プログラム - Google Patents
辞書データベース管理装置、apiサーバ、辞書データベース管理方法、及び辞書データベース管理プログラム Download PDFInfo
- Publication number
- JP2015200860A JP2015200860A JP2014111324A JP2014111324A JP2015200860A JP 2015200860 A JP2015200860 A JP 2015200860A JP 2014111324 A JP2014111324 A JP 2014111324A JP 2014111324 A JP2014111324 A JP 2014111324A JP 2015200860 A JP2015200860 A JP 2015200860A
- Authority
- JP
- Japan
- Prior art keywords
- information
- server
- language
- processing
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
図1は、本発明の実施形態に係るサーバ管理システム1の一実施形態を示す概略構成図(システム構成図)である。図1に示すように、本発明の実施の形態に係るサーバ管理システム1は、例示的に、ユーザ端末装置2、サーバ管理装置3、音声認識処理サーバ5、言語処理サーバ7、及び音声合成処理サーバ9を備えて構成されている。
第2実施形態は、第1実施形態の音声認識処理サーバ5、言語処理サーバ7、及び音声合成処理サーバ9に、言語情報を辞書登録する際の実施形態である。すなわち、第2実施形態では、言語処理の対象となる、少なくとも韻律関連情報、形態素関連情報、又は読み表記関連情報を含む言語情報を一括して取得する。そして、この言語情報が韻律関連情報であるか、形態素関連情報であるか、読み表記関連情報であるか、に応じてそれぞれの情報に対応する処理を実行する、各サーバ5,7,9のユーザ辞書DB(データベース)152,172,192に各情報が登録される。以下では、第1実施形態と異なる点について特に説明し、他の点については説明を省略する。
(態様1)
第1音声情報を受信する受信部と、
1)前記受信した第1音声情報に対応して第1文字列情報を出力する音声認識処理、
2)前記第1文字列情報に対応して第2文字列情報を出力する言語処理、および、
3)前記第2文字列情報に対応して第2音声情報を出力する音声合成処理、
のうち少なくとも1つを実行する処理実行部と、
a)前記音声認識処理を実行する音声認識処理サーバ、
b)前記言語処理を実行する言語処理サーバ、及び
c)前記音声合成処理を実行する音声合成処理サーバ
のうち少なくとも一つを識別するサーバ識別情報を含むサーバ識別情報データベースと、
前記第2音声情報を送信する送信部と、
を備え、
前記音声認識処理、前記言語処理、および前記音声合成処理のうち1つ以上の処理を実行し、それ以外の処理を前記サーバ識別情報データベースにより識別されたサーバに転送して実行させる、サーバ管理装置。
(態様2)
言語情報を登録するAPIサーバであって、
前記言語情報を取得する言語情報取得部と、
取得した前記言語情報が韻律関連情報である場合には当該韻律関連情報を蓄積して音声合成処理を実施する音声合成処理サーバに登録し、前記言語情報が形態素関連情報である場合には当該形態素関連情報を蓄積して自然言語処理を実施する自然言語処理サーバに登録し、前記言語情報が読み表記関連情報である場合には当該読み表記関連情報を蓄積して音声認識処理を実施する音声認識処理サーバに登録する言語情報登録部と、を備えるAPIサーバ。
上記APIサーバによれば、言語処理の対象となる言語情報を一括して取得する。そしのこの言語情報が韻律関連情報であるか、形態素関連情報であるか、読み表記関連情報であるか、に応じてそれぞれの情報に対応する処理を実行するサーバに各情報が登録される。例えば言語情報が、韻律関連情報、すなわち、言語を構成する音声の長短、母音・子音、およびアクセントの配列、音数等に関する情報であれば、当該情報を蓄積して前記言語に対応する音声を合成する処理を実行する音声合成処理サーバに登録される。例えば言語情報が形態素関連情報、すなわち、意味を持つ最小の言語単位(morpheme)を定義する情報であれば、当該情報を蓄積して自然言語解析を実施する自然言語処理サーバに登録される。例えば言語情報が読み表記関連情報、すなわち、言語の読みや漢字や仮名等の標記に関する情報であれば、当該情報を蓄積して音声認識を実施する音声認識処理サーバに登録される。
上記APIサーバによれば、言語情報の登録を希望するユーザ、例えば所定の音声ガイドサービスの提供主体となるユーザは、コンピュータ装置を用いて、APIサーバにアクセスし、APIサーバの指示に従って言語情報を一括登録することができる。具体的には、上記実施形態のシステムであれば、ユーザから提供された言語情報が、APIサーバの登録管理処理により、音声認識処理サーバ5、言語処理サーバ7、および音声合成処理サーバ9のいずれかに、言語情報の種類に応じて正しく登録されることになる。このような言語情報を登録するユーザにとっては、音声認識処理サーバ5、言語処理サーバ7、および音声合成処理サーバ9のそれぞれに個別に対応する言語情報を登録するといった手間を省くことができ、音声ガイドサービスを開始するために必要な膨大な量の登録作業を簡単に済ませることができる。
そしてある程度の言語情報を各処理サーバに登録したあとは、上記実施形態で説明したように、サーバ管理装置3の制御によって、ユーザの音声による問い合わせに対応する回答を提供できるようになる。
(態様3)
前記音声合成サーバ、前記自然言語サーバ、および前記音声認識サーバを識別する識別情報を管理する管理サーバと通信可能に構成されており、
前記管理サーバとの通信により取得した前記識別情報に基づいて前記言語情報を登録する、上記態様2に記載のAPIサーバ。
上記APIサーバによれば、上記した音声合成処理サーバ、自然言語処理サーバ、および音声認識処理サーバを識別するための識別情報を管理する管理サーバに問い合わせることで、取得した言語情報を登録すべきサーバのアドレスを認識し、言語情報の種別に対応するサーバに正しく言語情報を登録することが可能である。
1A:辞書DB管理システム
2:ユーザ端末装置
3:サーバ管理装置
3A:辞書DB管理装置
4:APIサーバ
5:音声認識処理サーバ
7:言語処理サーバ
9:音声合成処理サーバ
12:サーバ管理部
14:サーバ情報DB
16:音声/文字列情報DB
18:ユーザ情報DB
36:処理状況判断部
38:通信状況判断部
39:音声認識処理管理部
40:言語処理管理部
41:音声合成処理管理部
44:エラー処理部
52:音声認識処理部
74:文字列情報生成部
82:言語処理部
104:文字列情報処理部
112:音声合成処理部
134:音声情報生成部
150,170,190:基本辞書DB
152,172,192:ユーザ辞書DB
200:入力装置
300:言語情報取得部
302:識別情報取得部
304:言語情報補完部
306:言語情報登録部
Claims (12)
- 言語情報を登録する辞書データベース管理装置であって、
前記言語情報を取得する言語情報取得部と、
取得した前記言語情報が韻律関連情報を含む場合には当該韻律関連情報を蓄積して音声合成処理を実施する音声合成処理サーバの第1辞書データベースに登録し、前記言語情報が形態素関連情報を含む場合には当該形態素関連情報を蓄積して自然言語処理を実施する言語処理サーバの第2辞書データベースに登録し、前記言語情報が読み表記関連情報を含む場合には当該読み表記関連情報を蓄積して音声認識処理を実施する音声認識処理サーバの第3辞書データベースに登録する言語情報登録部と、
を備える辞書データベース管理装置。 - 前記音声合成処理サーバ、前記言語処理サーバ、および前記音声認識処理サーバを識別する識別情報を取得する識別情報取得部をさらに備え、
前記言語情報登録部は、前記識別情報に基づいて前記言語情報を登録する、
請求項1に記載の辞書データベース管理装置。 - 言語情報を登録する辞書データベース管理方法であって、
前記言語情報を取得するステップと、
取得した前記言語情報が韻律関連情報を含む場合には当該韻律関連情報を蓄積して音声合成処理を実施する音声合成処理サーバの第1辞書データベースに登録し、前記言語情報が形態素関連情報を含む場合には当該形態素関連情報を蓄積して自然言語処理を実施する言語処理サーバの第2辞書データベースに登録し、前記言語情報が読み表記関連情報を含む場合には当該読み表記関連情報を蓄積して音声認識処理を実施する音声認識処理サーバの第3辞書データベースに登録するステップと、を含む、
辞書データベース管理方法。 - 言語情報を登録する辞書データベース管理プログラムであって、
コンピュータに、
前記言語情報を取得する機能と、
取得した前記言語情報が韻律関連情報を含む場合には当該韻律関連情報を蓄積して音声合成処理を実施する音声合成処理サーバの第1辞書データベースに登録し、前記言語情報が形態素関連情報を含む場合には当該形態素関連情報を蓄積して自然言語処理を実施する言語処理サーバの第2辞書データベースに登録し、前記言語情報が読み表記関連情報を含む場合には当該読み表記関連情報を蓄積して音声認識処理を実施する音声認識処理サーバの第3辞書データベースに登録する機能と、
を実現させるための辞書データベース管理プログラム。 - 少なくとも一つの音声認識処理サーバ、少なくとも一つの言語処理サーバ、及び少なくとも一つの音声合成処理サーバを識別するサーバ識別情報を含むサーバ識別情報データベースと、
第1音声情報を受信する受信部と、
前記受信した第1音声情報を、前記サーバ識別情報に基づいて特定された音声認識処理サーバに転送し、前記第1音声情報に対応して前記音声認識処理サーバから返信された第1文字列情報を受信する音声認識処理管理部と、
前記第1文字列情報を前記サーバ識別情報に基づいて特定された言語処理サーバに転送し、前記第1文字列情報に対応して前記言語処理サーバから返信された第2文字列情報を受信する言語処理管理部と、
前記第2文字列情報を前記サーバ識別情報に基づいて特定された音声合成処理サーバに転送し、前記第2文字列情報に対応して前記音声合成処理サーバから返信された第2音声情報を受信する音声合成処理管理部と、
前記第2音声情報を送信する送信部と、
を備えるサーバ管理装置。 - 複数のサーバを管理して第1情報から第2情報を生成するためのサーバ管理装置であって、
第1サーバ及び第2サーバを識別するサーバ識別情報を含む第1データベースと、
前記サーバ識別情報に基づいて特定された前記第1サーバに前記第1情報を転送し、前記第1情報に対応して前記第1サーバから返信された中間情報を受信する第1サーバ管理部と、
前記中間情報を前記サーバ識別情報に基づいて特定された前記第2サーバに転送し、前記中間情報に対応して前記第2サーバから返信された前記第2情報を受信する第2サーバ管理部と、
を備えるサーバ管理装置。 - 請求項6に記載のサーバ管理装置であって、
前記第1サーバが、音声認識処理を実行するサーバであり、
前記第2サーバが、言語処理又は音声合成処理を実行するサーバである、
サーバ管理装置。 - 請求項6に記載のサーバ管理装置であって、
前記第1サーバが、言語処理を実行するサーバであり、
前記第2サーバが、音声合成処理を実行するサーバである、
サーバ管理装置。 - 複数のサーバを管理して第1情報から第2情報を生成するためのサーバ管理プログラムであって、
コンピュータに、
第1サーバ及び第2サーバを識別するサーバ識別情報を参照する機能と、
前記サーバ識別情報に基づいて特定された前記第1サーバに前記第1情報を転送し、前記第1情報に対応して前記第1サーバから返信された中間情報を受信する機能と、
前記中間情報を前記サーバ識別情報に基づいて特定された前記第2サーバに転送し、前記中間情報に対応して前記第2サーバから返信された前記第2情報を受信する機能と、
を実現させるためのサーバ管理プログラム。 - 複数のサーバを管理して第1情報から第2情報を生成するためのサーバ管理方法であって、
第1サーバ及び第2サーバを識別するサーバ識別情報を参照することと、
前記サーバ識別情報に基づいて特定された前記第1サーバに前記第1情報を転送し、前記第1情報に対応して前記第1サーバから返信された中間情報を受信することと、
前記中間情報を前記サーバ識別情報に基づいて特定された前記第2サーバに転送し、前記中間情報に対応して前記第2サーバから返信された第2情報を受信することと、
を含むサーバ管理方法。 - 言語情報を登録するAPIサーバであって、
前記言語情報を取得する言語情報取得部と、
取得した前記言語情報が韻律関連情報である場合には当該韻律関連情報を蓄積して音声合成処理を実施する音声合成サーバに登録し、前記言語情報が形態素関連情報である場合には当該形態素関連情報を蓄積して自然言語処理を実施する自然言語サーバに登録し、前記言語情報が読み表記関連情報である場合には当該読み表記関連情報を蓄積して音声認識処理を実施する音声認識サーバに登録する言語情報登録部と、
を備えるAPIサーバ。 - 前記音声合成サーバ、前記自然言語サーバ、および前記音声認識サーバを識別する識別情報を管理する管理サーバと通信可能に構成されており、
前記管理サーバとの通信により取得した前記識別情報に基づいて前記言語情報を登録する、
請求項11に記載のAPIサーバ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014111324A JP5901694B2 (ja) | 2014-04-01 | 2014-05-29 | 辞書データベース管理装置、apiサーバ、辞書データベース管理方法、及び辞書データベース管理プログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014075491 | 2014-04-01 | ||
JP2014075491 | 2014-04-01 | ||
JP2014111324A JP5901694B2 (ja) | 2014-04-01 | 2014-05-29 | 辞書データベース管理装置、apiサーバ、辞書データベース管理方法、及び辞書データベース管理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015200860A true JP2015200860A (ja) | 2015-11-12 |
JP5901694B2 JP5901694B2 (ja) | 2016-04-13 |
Family
ID=54552133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014111324A Active JP5901694B2 (ja) | 2014-04-01 | 2014-05-29 | 辞書データベース管理装置、apiサーバ、辞書データベース管理方法、及び辞書データベース管理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5901694B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018163611A (ja) * | 2017-03-27 | 2018-10-18 | 株式会社東芝 | 情報処理装置、情報処理方法、および情報処理プログラム |
WO2019016938A1 (ja) * | 2017-07-21 | 2019-01-24 | 三菱電機株式会社 | 音声認識装置及び音声認識方法 |
WO2019035371A1 (ja) * | 2017-08-17 | 2019-02-21 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09152884A (ja) * | 1995-11-30 | 1997-06-10 | Fujitsu Ten Ltd | 音声合成装置 |
JP2003219038A (ja) * | 2001-10-22 | 2003-07-31 | Ntt Comware Corp | 顧客情報と連携させたコールセンタシステム装置及び顧客情報と連携させたコール方法 |
JP2004072274A (ja) * | 2002-08-02 | 2004-03-04 | Canon Inc | 音声処理システム及びその制御方法 |
JP2005241832A (ja) * | 2004-02-25 | 2005-09-08 | Toshiba Corp | 単語辞書管理装置、単語辞書管理方法、および単語辞書管理プログラム |
JP2006011066A (ja) * | 2004-06-25 | 2006-01-12 | Nec Corp | 音声認識/合成システム、同期制御方法、同期制御プログラム、および同期制御装置 |
-
2014
- 2014-05-29 JP JP2014111324A patent/JP5901694B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09152884A (ja) * | 1995-11-30 | 1997-06-10 | Fujitsu Ten Ltd | 音声合成装置 |
JP2003219038A (ja) * | 2001-10-22 | 2003-07-31 | Ntt Comware Corp | 顧客情報と連携させたコールセンタシステム装置及び顧客情報と連携させたコール方法 |
JP2004072274A (ja) * | 2002-08-02 | 2004-03-04 | Canon Inc | 音声処理システム及びその制御方法 |
JP2005241832A (ja) * | 2004-02-25 | 2005-09-08 | Toshiba Corp | 単語辞書管理装置、単語辞書管理方法、および単語辞書管理プログラム |
JP2006011066A (ja) * | 2004-06-25 | 2006-01-12 | Nec Corp | 音声認識/合成システム、同期制御方法、同期制御プログラム、および同期制御装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018163611A (ja) * | 2017-03-27 | 2018-10-18 | 株式会社東芝 | 情報処理装置、情報処理方法、および情報処理プログラム |
WO2019016938A1 (ja) * | 2017-07-21 | 2019-01-24 | 三菱電機株式会社 | 音声認識装置及び音声認識方法 |
WO2019035371A1 (ja) * | 2017-08-17 | 2019-02-21 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
US11322141B2 (en) | 2017-08-17 | 2022-05-03 | Sony Corporation | Information processing device and information processing method |
Also Published As
Publication number | Publication date |
---|---|
JP5901694B2 (ja) | 2016-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10192545B2 (en) | Language modeling based on spoken and unspeakable corpuses | |
US9317501B2 (en) | Data security system for natural language translation | |
US9805718B2 (en) | Clarifying natural language input using targeted questions | |
US8775189B2 (en) | Control center for a voice controlled wireless communication device system | |
JP6334815B2 (ja) | 学習装置、方法、プログラムおよび音声対話システム | |
CN106558307A (zh) | 智能对话处理设备、方法和系统 | |
JP2020505643A (ja) | 音声認識方法、電子機器、及びコンピュータ記憶媒体 | |
US11093110B1 (en) | Messaging feedback mechanism | |
JP2007141133A (ja) | 用例翻訳装置、用例翻訳方法および用例翻訳プログラム | |
WO2014183373A1 (en) | Systems and methods for voice identification | |
CN109858045B (zh) | 机器翻译方法和装置 | |
US20210034663A1 (en) | Systems and methods for managing voice queries using pronunciation information | |
US20120166176A1 (en) | Speech translation system, dictionary server, and program | |
US20180286386A1 (en) | Deep language and acoustic modeling convergence and cross training | |
JP6625772B2 (ja) | 検索方法及びそれを用いた電子機器 | |
JP2018045001A (ja) | 音声認識システム、情報処理装置、プログラム、音声認識方法 | |
JP6306376B2 (ja) | 翻訳装置及び翻訳方法 | |
JP5901694B2 (ja) | 辞書データベース管理装置、apiサーバ、辞書データベース管理方法、及び辞書データベース管理プログラム | |
US11410656B2 (en) | Systems and methods for managing voice queries using pronunciation information | |
JP2014102280A (ja) | 機能実行指示システム、機能実行指示方法及び機能実行指示プログラム | |
JP2018174416A (ja) | 多言語振分装置、多言語振分方法、及びプログラム | |
KR20230020508A (ko) | 텍스트 에코 제거 | |
JP2021082125A (ja) | 対話装置 | |
CN114586021B (zh) | 信息输出装置、信息输出方法以及记录介质 | |
JP6836094B1 (ja) | 情報処理装置および情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150813 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150908 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151124 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160307 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5901694 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |