JP2008059586A - Ssmlエディターシステム - Google Patents

Ssmlエディターシステム Download PDF

Info

Publication number
JP2008059586A
JP2008059586A JP2007220793A JP2007220793A JP2008059586A JP 2008059586 A JP2008059586 A JP 2008059586A JP 2007220793 A JP2007220793 A JP 2007220793A JP 2007220793 A JP2007220793 A JP 2007220793A JP 2008059586 A JP2008059586 A JP 2008059586A
Authority
JP
Japan
Prior art keywords
ssml
mrcp
editor
grammar
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007220793A
Other languages
English (en)
Inventor
Shoseki Lee
鍾碩 李
Ki Tae Park
起台 朴
Eikoku Kim
英國 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
VOICEWARE CO Ltd
Pentax Corp
Original Assignee
VOICEWARE CO Ltd
Pentax Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by VOICEWARE CO Ltd, Pentax Corp filed Critical VOICEWARE CO Ltd
Publication of JP2008059586A publication Critical patent/JP2008059586A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】VoIP基盤のMRCP-TTSサービスのSSMLエディターシステムを提供する。
【解決手段】SSMLエディターシステム(100)は、文書編集機能を提供する基本SSMLエディター(110)と、基本SSMLエディター(110)に接続されており、基本SSMLエディター(110)で作成中であったり作成されたSSML文書がSSML文法にあうように作成されたかどうかを判断し、間違った部分を構成する文法管理モジュール(120)と、基本SSMLエディター(110)または文法管理モジュール(120)に接続されており、MRCPサーバを通じて作成されたSSML文書による音声を確認することができるようにするMRCP管理モジュール(130)と、作成されたSSML文書をSSMLデータベースに保存するデータベース管理モジュールを備える。
【選択図】図3

Description

本発明はSSMLエディターシステムに関し、より具体的には、リアルタイムエラーチェック及び音声確認の可能なSSMLエディターシステムに関する。
VoIP(Voice over Internet Protocol)基盤のMRCP-TTSサービスは、ARSサービスと似ている、ユーザが要請するサービスを、音声で提供するサービスである。
図1を参照して一般的なVoIP基盤のMRCP-TTSサービスシステムのサービス提供過程を説明すると、まず、サービス利用者が有線電話(10a)、無線電話(10b)、又はPC(10c)を用いてサービスを要請し、次にSIPサーバ(20)が適当なシナリオに従ったSSML(Speech Synthesis Markup Language:音声合成記述言語)文書をSSMLデータベース(30)から持ってきてMRCP(Media Resource Control Protocol)サーバ(40)に該当SSML文書の音声合成を要請する。この際、音声合成要請を受けたMRCPサーバは、要請されたSSML文書をTTS(Text-To-Speech)エンジン(50)が解析可能な形態に加工して伝達し、TTSエンジンは音声データベース(60)を用いて実際の音声を合成した後、MRCPサーバに再び伝達する。そしてMRCPサーバは、TTSエンジンから受けた合成された音声をSIPサーバに伝達し、SIPサーバがこれをユーザに提供する。
現在、このようなサービスを提供するためのあらゆるプロトコル及びSSMLの標準が決められており、このようなサービスを用いることによって、サービス提供者は、より低廉な価格で需要者により便利で豊富なサービスを提供することができることになるため、今後VoIP基盤のMRCP-TTSサービスが広く用いられるであろう。
しかし、このようなVoIP基盤のMRCP-TTSサービスでは、全てのコンテンツがSSML文書で構成されなければならないので、サービス提供者は、提供しようとする全てのコンテンツに対応するSSML文書を作成して、データベースに構築しておかなければならないのにもかかわらず、現在このようなSSML文書を簡単に作成することのできるSSMLエディターは皆無な状態である。
従って、従来VoIP基盤のMRCP-TTSサービスの提供者は、自身の提供しようとするサービスに適するようSSML文書が作成されたかどうかを確認するために、作成されたSSML文書をSSMLデータベースに保存し、有無線電話やPCを通じてSIPサーバに接続し直接対応するサービスを要請した後、実際に合成され提供される音声を聞く方式で一々確認しなければならない。
また、自身の提供しようとする音声が提供されない場合、自身が作成したSSML文書のどの部分が間違っているのかを把握して、再び修正し保存して音声を確認する過程を繰り返さなければならない。
更に、既に登録されたSSML文書を検索、挿入、修正、または削除するためにも、別途のプロセスを経なければならないため、従来のVoIP基盤のMRCP-TTSサービスでは、サービス提供者が自身の提供しようとするコンテンツに対応するSSML文書に対するデータベースを構築するのが容易でなかった。
従って本発明者は、SSML文書を効率的に作成し、リアルタイム/非リアルタイム作成されたSSML文書のエラーがチェックできるだけでなく、SSMLデータベースに保存する必要がなく、作成と同時に完成したSSML文書に対応する音声が確認できる新たなSSMLエディターシステムを開発することに至ったのである。
本発明の目的は、VoIP基盤のMRCP-TTSサービスのSSMLエディターシステムを提供するためのものである。
本発明の別の目的は、当業者が慣れている方法でSSML文書を簡単に作成することができるSSMLエディターシステムを提供するためのものである。
本発明のまた別の目的は、SSML文書作成中、または作成後にSSML文法の確認及び校正の可能なSSMLエディターシステムを提供するためのものである。
本発明のまた別の目的は、MRCPサーバへの接続、メッセージ伝達のためのSIP/SDP/MRCPメッセージを自動に生成するSSMLエディターシステムを提供するためのものである。
本発明のまた別の目的は、MRCPサーバに直接接続して、メッセージ伝送及び音声受信の可能なSSMLエディターシステムを提供するためのものである。
本発明のまた別の目的は、SSMLデータベースに接続して保存されたSSML文書の検索、挿入、修正、削除の可能なSSMLエディターシステムを提供するためのものである。
本発明の上記及びその他の目的は、下記で説明される本発明によって全て達成できる。
本発明によるSSMLエディターシステムは、SSML文書の編集機能を提供する基本SSMLエディターと、基本SSMLエディターに接続されており、基本SSMLエディターで作成中であったり作成されたSSML文書が、SSML文法に合うように作成されたかどうかを判断し、間違った部分を校正する文法管理モジュールと、基本SSMLエディターまたは文法管理モジュールに接続されており、MRCPサーバを通じて作成されたSSML文書による音声が確認できるようにするMRCP管理モジュールと、作成されたSSML文書をSSMLデータベースに保存するデータベース管理モジュールとを備えることを特徴とする。
基本SSMLエディターは、一般的なテキスト編集窓にSSMLコードを直接入力したり、GUI基盤の文書編集が可能であり、SSML文書をツリー状に編集することができるようにするのが望ましい。
文法管理モジュールは、SSML文書の作成中、該当位置で予め入力可能な項目を推薦し、入力途中にリアルタイムまたは非リアルタイムで文法エラーのチェック及び校正が可能なようできる。
MRCP管理モジュールは、SSMLを基盤としてSIP/SDP/MRCPメッセージを自動で生成し、生成されたメッセージを通じてMRCPサーバに接続してメッセージを伝達した後、RTPを通じて伝達された音声を確認することができる。
また、データベース管理モジュールは、SSMLデータベースに保存されている文書を検索、挿入、修正及び削除することができる。
本発明は、当業者が慣れている方法でSSML文書を簡単に作成することができ、SSML文書作成中、または作成後にSSML文法の確認及び校正が可能であり、MRCPサーバへの接続、メッセージ伝達のためのSIP/SDP/MRCPメッセージを自動で生成し、MRCPサーバーに直接接続して、メッセージ伝送及び音声受信が可能であり、SSMLデータベースに接続して保存されたSSML文書の検索、挿入、修正、削除が可能であり、ユーザが作成にSSML文書のデータベースを構築することができるVoIP基盤のMRCP-TTSサービスのSSMLエディターシステムを提供する効果を有する。
図2に、本発明の一実施形態であるSSMLエディターシステムが適用されたMRCP-TTSサービスシステムの構成図が図示されている。SSMLエディターシステム(100)は、MRCP-TTSサービスシステムのSSMLデータサービス(30)に作成されたSSML文書を保存するために、またはSSMLデータベースに保存されているSSML文書を検索、修正、削除するために、SSMLデータベースに接続されている。
また、SSMLエディターシステム(100)は、作成されたSSML文書のテストのために、MRCPサーバ(40)とも接続されており、ここでの接続は、インターネット等のような伝送路を通じた接続であってもよい。
図3に、SSMLエディターシステム(100)の構成図が図示されている。SSMLエディターシステム(100)は、大きく分けて基本SSMLエディター(110)、文法管理モジュール(120)、MRCP管理モジュール(130)及びDB(データベース)管理モジュール(140)で構成される。
基本SSMLエディター(110)は、SSMLエディターシステム(100)において文書編集機能を提供するものであって、その他の別のXMLエディターと類似するように構成することによって、ユーザが容易に使用できるよう構成するのが望ましい。従って、図4に図示された画面左側のようにSSMLコードを直接入力してSSML文書を作成できるようにテキストエディターで構成する。
また、SSML文書作成に用いられる命令語は、audio、breakなど12個に過ぎないため、図4に図示された画面右側のようにSSML文書作成に用いられる命令語を提示しておき、これをマウスでクリックするかドラッグして、文書作成に用いることができるようにするGUI(Graphical User Interface)基盤の文書編集機能を備えたGUI基盤のエディターで構成することも望ましい。
また、ウィンドウの文書探索機のように、SSMLをツリー状に編集することができるよう、ツリー基盤のエディターで構成することも望ましい。
基本SSMLエディター(110)は、新しいSSML文書を作成したり、DB管理モジュール(140)を通じてSSMLデータベース(30)に保存されているSSML文書を呼び出した後文書作業を行うこともできる。
基本SSMLエディターで作成中であったり作成されたSSML文書は、文法管理モジュール(120)によりSSML文法に合うよう作成されたかどうかが確認され、文法に誤りがある場合、自動校正したり、ユーザに文法に誤りがあることを通知できる。
図5に図示された文法管理モジュール(120)の構成図を参考にして、より詳細に説明すると、基本SSMLエディター(110)で作成中であったり作成されたSSML文書は、文法管理モジュール(120)に伝達される。文法管理モジュール(120)に伝達されたSSML文書は、まずSSMLパーサ(121)により解析できる単位に分割され、構文解析される。
すなわち、入力されたSSML文書は、構文を解釈することのできる単位に分割され、文法に合うようにパースツリーで構成され、必要な全ての入力が提供されたかどうかが点検されもする。
このように構文が把握されたSSML文書は、SSML文法検査モジュール(122)により文法に合うよう作成されたかどうかが確認され、SSML文法校正モジュール(123)により校正される。
SSML文法校正モジュール(123)は、命令語に誤記が含まれている等、間違った部分が明確な場合には、これを状況に合うよう校正し、明確でない誤りの場合には、ユーザにどの部分に誤りがあるのかを表示して知らせる。
上記のような文法管理モジュール(120)は、作成者がSSML文書を作成中にも文書を把握して、予め入力可能な項目などを推薦したりリアルタイムでエラーチェックが可能なようすることができる。
上記のように自動でSSML文法の誤りの可否を検査し、作成者に誤りの可否、適切な命令語情報などを知らせることによって、正確なSSML文書がより容易に作成できる。
上記のような文法検査が完了したSSML文書は、文法管理モジュール(120)または基本SSMLエディター(110)からMRCP管理モジュール(130)へ伝達される。従来のシステムでは、作成されたSSML文書による音声を確認するためには、作成されたSSML文書をSSMLデータベース(30)に保存し、その音声を確認するためにMRCP-TTSサーバに接続しなければならなかったが、本実施形態では、MRCP管理モジュールにより自動的にMRCPサーバに接続され、作成されたSSML文書による合成音が受信されて、作成者がリアルタイムで作成したSSML文書による音声を確認することができる。
SIPサーバ(20)がSSMLデータベース(30)に保存された文書の音声合成をMRCPサーバ(40)に要求した事と同じように本実施形態によるSSMLエディターシステムがMRCPサーバに作成されたSSML文書の音声合成を要求するためには、MRCPサーバにSIPメッセージ、SDPメッセージ、MRCPメッセージを伝送しなくてはならない。従って、上記MRCP管理モジュール(130)は、作成されたSSML文書を用いて自動でSIP、SDP、MRCPメッセージを作成し、作成されたメッセージをMRCPサーバに伝送する。
このような本実施形態によるMRCP管理モジュールの構成図が図6に図示されており、これを参考にしてより詳細に説明すると、作成されたSSML文書が受信されると、MRCPメッセージ生成モジュール(131)がSSML文書からMRCPメッセージを生成する。
MRCPメッセージは、MRCPサーバへの伝送のためにMRCP支援モジュール(134)へ伝達されると共に、SDP(Session Description Protocol)メッセージ生成モジュール(132)へ伝達する。SDPメッセージ生成モジュールは、MRCPメッセージからSDPメッセージを生成し、生成されたSDPメッセージは、MRCPサーバへの伝送のためSDP支援モジュール(135)へ伝達されると共に、SIP(Session Initiation Protocol)メッセージ生成モジュール(133)へ伝達される。SIPメッセージ生成モジュールは、SDPメッセージからSIPメッセージを生成し、生成されたSIPメッセージは、MRCPサーバへの伝送のためSIP支援モジュール(136)へ伝達される。
上記のように生成されたそれぞれのMRCP/SDP/SIPメッセージは、それぞれのMRCP/SDP/SIP支援モジュールを通じてSIPメッセージ、SDPメッセージ、MRCPメッセージの順にMRCPサーバへ伝送される。SIPメッセージとSDPメッセージは、MRCPサーバに接続するためのメッセージであり、作成されたSSML文書に対応する音声を合成するようにするためのメッセージであって、全て国際標準方式に沿う。
MRCPサーバを通じてTTSエンジンで合成された音声は、SDPメッセージに含まれたアドレス情報によって再びSSMLエディターシステムに提供され、MRCP管理モジュール(130)のRTP(Real time Transport Protocol)支援モジュール(137)を通じてSSMLエディターシステムに受信され、ユーザは自ら作成したSSML文書に対応する音声をリアルタイムで確認することができることになる。
一般的なVoIP基盤のMRCP-TTSサービスシステムの構成図である。 本発明の一実施形態であるSSMLエディターシステムが適用されたMRCP-TTSサービスシステムの構成図である。 本発明の一実施形態である SSMLエディターシステムの構成図である。 本発明の一実施形態である SSMLエディターシステムを実行させた画面を示す図である。 本発明の一実施形態である SSMLエディターシステムのうち文法管理モジュールの構成を示す構成図である。 本発明の一実施形態である SSMLエディターシステムのうちMRCP管理モジュールの構成を示す構成図である。
符号の説明
10a 有線電話
10b 無線電話
10c PC
20 SIPサーバ
30 SSMLデータベース
40 MRCPサーバ
50 TTSエンジン
60 音声データベース
100 SSMLエディターシステム
110 基本SSMLエディター
120 文法管理モジュール
121 SSMLパーサ
122 SSML文法検査モジュール
123 SSML文法校正モジュール
130 MRCP管理モジュール
131 MRCPメッセージ生成モジュール
132 SDPメッセージ生成モジュール
133 SIPメッセージ生成モジュール
134 MRCP支援モジュール
135 SDP支援モジュール
136 SIP支援モジュール
137 RTP支援モジュール
140 データベース管理モジュール

Claims (5)

  1. SSML文書編集機能を提供する基本SSMLエディターと、
    上記基本SSMLエディターに接続されており、上記基本SSMLエディターで作成中であったり作成されたSSML文書が、SSML文法に合うよう作成されたかどうかを判断し、間違った部分を校正する文法管理モジュールと、
    上記基本SSMLエディターまたは文法管理モジュールに接続されており、MRCP サーバを通じて作成されたSSML文書による音声が確認できるようにするMRCP管理モジュールと、
    作成されたSSML文書をSSMLデータベースに保存するデータベース管理モジュールと、
    を備えることを特徴とするSSMLエディターシステム。
  2. 上記基本SSMLエディターは、一般的なテキスト編集窓にSSMLコードを直接入力するテキスト基盤エディター、GUI基盤の文書編集が可能なGUI基盤エディター、またはSSML文書をツリー状に編集できるツリー基盤エディターで構成されることを特徴とする請求項1に記載のSSMLエディターシステム。
  3. 上記文法管理モジュールは、リアルタイムまたは非リアルタイムで文法のエラーチェック及び校正、入力可能な項目推薦が可能なようにSSMLパーサ、SSML文法検査モジュール、SSML文法校正モジュールを備えることを特徴とする請求項1に記載のSSMLエディターシステム。
  4. 上記MRCP管理モジュールは、上記作成されたSSML文書からMRCPメッセージを生成するMRCPメッセージ生成モジュール、上記MRCPメッセージからSDPメッセージを生成するSDPメッセージ生成モジュール、上記SDPメッセージからSIPメッセージを生成するSIPメッセージ生成モジュール、上記MRCPメッセージをMRCPサーバへ伝送するMRCP支援モジュール、上記SDPメッセージをMRCPサーバへ伝送するSDP支援モジュール、上記SIPメッセージをMRCPサーバへ伝送するSIP支援モジュール、及びMRCPからの音声情報を受信するRTP支援モジュールを含んでなることを特徴とする請求項1に記載のSSMLエディターシステム。
  5. 上記データベース管理モジュールは、保存されているSSML文書を検索、挿入、修正及び削除することができるようにMRCP-TTSシステムのSSMLデータベースに接続されていることを特徴とする請求項1に記載のSSMLエディターシステム。
JP2007220793A 2006-09-01 2007-08-28 Ssmlエディターシステム Withdrawn JP2008059586A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20060084218 2006-09-01

Publications (1)

Publication Number Publication Date
JP2008059586A true JP2008059586A (ja) 2008-03-13

Family

ID=39242173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007220793A Withdrawn JP2008059586A (ja) 2006-09-01 2007-08-28 Ssmlエディターシステム

Country Status (1)

Country Link
JP (1) JP2008059586A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014222542A (ja) * 2014-08-06 2014-11-27 株式会社東芝 文書マークアップ支援装置、方法、及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014222542A (ja) * 2014-08-06 2014-11-27 株式会社東芝 文書マークアップ支援装置、方法、及びプログラム

Similar Documents

Publication Publication Date Title
KR101027548B1 (ko) 통신 시스템용 보이스 브라우저 다이얼로그 인에이블러
US9177551B2 (en) System and method of providing speech processing in user interface
US8189746B1 (en) Voice rendering of E-mail with tags for improved user experience
JP3949667B2 (ja) 様々な標準やテストレベルを支援するテストストリームの作成方法及び装置
US20120004910A1 (en) System and method for speech processing and speech to text
US9761241B2 (en) System and method for providing network coordinated conversational services
CA2345660C (en) System and method for providing network coordinated conversational services
JP4466666B2 (ja) 議事録作成方法、その装置及びそのプログラム
WO2016150235A1 (zh) 一种WebRTC P2P音视频通话的方法及装置
CN1591315A (zh) 用于高级交互接口的语义对象同步理解
JP2005530279A (ja) インターネットコンテンツのアクセスに関するシステム及び方法
JP2010539742A (ja) マルチメディアメッセージングサービス(mms)の動画への適合のための方法およびシステム
CA3147813A1 (en) Method and system of generating and transmitting a transcript of verbal communication
CN110244941A (zh) 任务开发方法、装置、电子设备及计算机可读存储介质
JP2008059586A (ja) Ssmlエディターシステム
WO2011157007A1 (zh) 多媒体数据内容的适配转发方法及装置
US8838673B2 (en) Method and apparatus to generate audio versions of web pages
US7630893B2 (en) Transcription rule base enrichment
Cisco Release Notes for the uVoice Platform, Release 6.1(3)
JP4289080B2 (ja) 音声データ提供装置、音声データ提供方法、および音声データ提供プログラム
WO2024044914A1 (zh) 生成描述远程过程调用的代码的方法、电子设备、介质及程序产品
JP2000259632A (ja) 自動通訳システム、通訳プログラム伝送システム、記録媒体および情報伝送媒体
JP2005107320A (ja) 音声再生用データ生成装置
JP2005078232A (ja) 情報作成装置
JP2009122988A (ja) 翻訳登録方法、翻訳登録サーバ及び翻訳登録プログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20080502

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20101102