CN1235458A - 信息发送和接收装置以及信息发送和接收方法 - Google Patents

信息发送和接收装置以及信息发送和接收方法 Download PDF

Info

Publication number
CN1235458A
CN1235458A CN99100866A CN99100866A CN1235458A CN 1235458 A CN1235458 A CN 1235458A CN 99100866 A CN99100866 A CN 99100866A CN 99100866 A CN99100866 A CN 99100866A CN 1235458 A CN1235458 A CN 1235458A
Authority
CN
China
Prior art keywords
information
intermediate language
demarcation
transmission
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN99100866A
Other languages
English (en)
Inventor
中津山孝
今井勉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1235458A publication Critical patent/CN1235458A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/5307Centralised arrangements for recording incoming messages, i.e. mailbox systems for recording messages comprising any combination of audio and non-audio components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]

Abstract

公开一种信息发送和接收方法,包括步骤:产生中间语言信息作为相应于提供的文本信息的读出信息,至少组合产生的中间语言信息和输入的文本信息以便产生发送信息,发送产生的发送信息,接收发送信息,将接收的发送信息至少分成文本信息和中间语言信息,显示分出的文本信息,和产生相应于分出的中间语言信息的话音合成信息并输出该话音合成信息。

Description

信息发送和接收装置 以及信息发送和接收方法
本发明涉及信息发送和接收装置、信息发送装置、信息发送装置、和信息发送和接收方法。并更具体地,本发明涉及发送和接收文本信息的信息发送和接收装置,信息发送装置,信息发送装置,和信息发送和接收方法。
话音信息通过通信线路从服务器侧到终端单元侧循环的常规信息业务大致范围分为以下两种类型。
第一种类型,出版资料的印刷文本、作为文本数据的语句等等在服务器侧上读出并转换为数字话音信号或模拟音频信号的话音信号。该话音信号通过通信线路发送到终端单元,终端单元对接收的话音信号进行预定的音频处理并输出话音。
第二种类型,服务器侧通过通信线路发送文本数据到终端单元。在这种情况下,终端单元侧执行对应于接收的文本数据的话音合成处理、获得话音信号、进行预定的音频处理,并输出话音。
已经开发了用户能够选择系统的这样两种类型之一的这样一种信息业务(一经需求即服务)。
但是,上述系统的这样两种类型具有下述问题。在服务器侧转换文本数据为话音信号并发送它到终端单元侧的第一种类型中,由于作为通信线路的传输路径的传输速率的限制,当缩短循环时间时,话音信号应当压缩以此减少数据量。
当话音信号被压缩时,音频信息质量显著恶化。因此,在这种情况下,以高质量的话音信号不能循环给终端单元侧的用户。
无论如何,为了以高质量发送话音信号,则不能压缩话音信号。在这种情况下,循环时间变长。用户不希望有这种情况。
在服务器侧发送文本数据并且终端单元侧对文本信息进行语音合成处理并输出话音的第二种类型中,终端单元侧的硬件和软件的费用提高了。
当分析文本数据和合成语音时,如果处理非特定文本,则该处理所用的词语和句法的必要信息量变大。此外,当需要高质量的话音输出时,音调和重音的分析便得复杂。因此,在终端单元侧上执行的处理负载显著增加。
这些因素相当多地限制终端单元的普及、尺寸减小、和费用的降低。
因此本发明的一个目的是提供解决上述问题的信息发送和接收装置。
本发明的另一个目的是提供解决上述问题的信息发送装置。
本发明的又一个目的是提供解决上述问题的信息接收装置。
本发明的一个目的是提供解决上述问题的信息信息发送和接收方法。
根据本发明,所提供的信息发送和接收装置包括:一个中间语言信息发生部分、一个发送信息发生部分、发送部分、一个接收部分、一个信号处理部分、一个显示部分、和一个输出部分。该中间语言信息发生部分产生中间语言信息作为对应于提供的文本信息的读出信息。该发送信息产生部分组合至少文本信息和中间语言信息并产生发送信息。该发送部分发送由发送信息发生部分产生的发送信息。该接收部分接收来自发送部分的发送信息。该信号处理部分把接收部分接收的发送信息分离为至少文本信息和中间语言信息以及对应于分离的中间语言信息的发生话音合成信息。显示部分显示由信号处理部分分离的文本信息。输出部分输出对应于信号处理部分产生的话音合成信息的话音。
根据本发明,所提供的信息发送装置包括:一个中间语言信息发生部分、一个发送信息发生部分、一个发送部分。中间语言信息发生部分以提供的文本信息为对应于提供的文本信息的读出信息的方式产生中间语言信息。发送信息产生部分组合至少文本信息和中间语言信息以便产生发送信息。发送部分发送由发送信息发生部分产生的发送信息。
根据本发明,提供信息接收部分。该装置接收至少文本信息合中间语言信息的发送信息。该装置包括一个接收部分、一个信号处理部分、一个显示部分、一个输出部分。接收部分接收发送信息。信号处理部分把接收部分接收的发送信息分离为至少文本信息和对应于分离的中间语言信息的发生话音合成信息。显示部分显示由信号处理部分分离的文本信息。输出装置输出对应于信号处理部分产生的话音合成信息的话音。
根据本发明,提供信息发送和接收方法。信息发送和接收方法产生中间语言信息作为对应于提供的文本信息的读出信息,组合至少产生的文本信息和中间语言信息并产生发送信息,发送产生的发送信息,接收发送的发送信息,把接收的发送信息分离为至少文本信息和中间语言信息,显示分离的文本信息,并产生和输出分离的中间语言信息话音合成信息
从结合幅图中读出的以下详细说明中,本发明的以上和其他目的、特征和优点将便得显而易见。
图1是表示根据本发明一个实施例的信息循环系统的结构方框图;
图2是表示根据该实施例的终端单元结构的方框图;
图3是表示根据该实施例的发送信息发生处理的流程图;
图4是表示根据该实施例的地一操作事例的中间语言转换程序流程图;
图5A到5E是解释根据该实施例的第一操作事例的发送信息发生处理的示意图;
图6是用于解释根据该实施例的第一操作事例的发送信息数据的一个事例的示意图;
图7是用于解释根据本发明该实施例的第一操作事例的发送信息数据的事例的示意图;
图8是用于解释根据该实施例的第一操作事例的发送信息数据的事例的示意图;
图9是表示根据该实施例的第一操作事例的接收的发送信息的再生处理流程图;
图10是用于解释根据该实施例的限定信息的示意图;
图11是表示根据该实施例的第二操作事例的中间语言转换程序流程图;
图12A到12E是用于解释根据该实施例的第二操作事例的发送信息格式的示意图;
图13是用于解释根据该实施例的第二操作事例的发送信息数据的事例的示意图;
图14是用于解释根据该实施例的读音符号信息的示意图;
图15是用于解释根据所分离信息的读音符号信息的示意图;
图16A到图16C是用于解释根据该实施例的音调/重音数据的示意图;
图17是用于解释根据该实施例的音调/重音数据一个真实事例的示意图;
图18是用于解释根据该实施例的压迫音量数据的示意图;
图19是用于解释根据该实施例的第二操作事例的发送信息数据事例的示意图;
图20A到20F是用于解释根据该实施例的第二操作事例的发送信息格式的示意图;
图21是用于解释根据该实施例的S-命令示意图;
图22A和22B是用于解释根据该实施例的T-命令示意图;
图23是用于解释根据本发明实施例的V-命令示意图;
图24是用于解释根据该实施例的第二操作事例的发送信息数据的事例的示意图;
图25A和25B是表示据该实施例的第二操作事例的接收的发送信息的再生处理流程图;
图26A和26B是表示根据一个实施例的第二操作事例的接收的发送信息的再生处理流程图;和
图27A和27B是表示根据该实施例的第二操作事例的接收的发送信息的再生处理流程图。
下面参考附图说明根据本发明的信息循环系统。
将以下述顺序描述一个实施系统。1、信息循环系统的结构2、终端单元侧的结构3、写作系统中的发送信息发生操作(第一操作示例)4、对应于第一操作示例的终端单元侧上的处理5、写作系统中的发送信息发生操作(第二操作示例)6、对应于第二操作示例的终端单元侧上的处理1、信息循环系统的结构
图1表示根据本发明的信息循环系统结构。
信息循环系统包括目录1、写作系统2、数据库3、服务提供器4、传输路径5、终端侧发送/接收单元6、和再生终端单元7。
目录1代表作为信息源的各种刊物和电子文本数据。换句话说,目录1打印文本(诸如报纸、杂志、小说、等等)和电子刊物文本数据。
写作系统2产生发送信息,作为循环给用户的,对应于如目录1那样的打印文本或文本数据信息的业务信息。
写作系统2包含一个OCR(光字符读取器)21、一个文本存储部分22、一个翻译/转换部分23、一个中间语言发生部分24、一个发送信息发生部分25、和一个操作部分26。
在写作系统2中,除ODR和操作部分26以外的部分都用功能方框表示。
换句话说,从硬件角度来看,这些功能方框是由一个信息处理单元(诸如个人计算机或工作站)、一个数据输入接口单元、和一个操作员接口单元构成。文本存储部分22、翻译/转换部分23、中间语言发生部分24、和发送信息发生部分25构成个人计算机中的处理功能。
作为数据输入接口单元,输入作为数据的目录的输入单元沿着OCR21排列(输入单元的例子是CD-ROM驱动和通信终端单元)。
此外,作为操作员接口单元,安排诸如键盘和鼠标(等效于操作部分26)和显示监视器为输入单元。
当提供打印文本目录时,由OCR21执行读出处理。由OCR21读出的数据被转换为作为电子数据的文本数据并存储在文本存储部分22中。已经增加了电子刊物的标题号。但是,不必转换作为电子数据(诸如CD-ROM数据和通过通信线路馈送的内容)提供的内容为文本数据。因此,在这种情况下,这种内容通过数据输入接口单元(未示出)直接存储在文本存储部分22。
翻译转换部分/23翻译或转换存储在文本存储部分22中的文本数据为具有相同意义的另一种语言。例如,翻译转换部分/23翻译日本字符串为诸如英语、法语、或德语的外语的文本数据。或者,翻译转换部分/23转换标准日本语文本数据为日本TOHOKU、OSAKA、或KYUSYU地区的方言。此外,翻译转换部分/23转换书面式文本数据为口语式文本数据。
将要循环给用户的文本数据(即,作为目录1提供的文本数据或由翻译转换部分/23翻译或转换的文本数据)被馈送给中间语言发生部分24和发送信息发生部分25。虽然以后将描述由中间语言发生部分24和发送信息发生部分25执行的处理,但简要地说,中间语言发生部分24转换提供的文本数据TX为中间语言信息MT,作为每个字符串转换文本串的读出信息并馈送该中间语言信息MT到发送信息发生部分25。
发送信息发生部分25产生具有提供的文本数据(或转换文本串TTX)和中间语言信息MT的发送信息SD。
发送信息SD存储在数据库3中。此后,发送信息SD被用做信息循环业务中的业务数据。
服务提供器为用户执行对传输路径5、用户登记处理、计费处理等等的连接业务。
信息循环业务的用户使用便携、压缩和轻巧单元的再生终端单元7。
当用户需要信息时,他或她就连接再生终端单元7到终端侧发送/接收单元6。终端侧发送接收单元/6可以放置在KIOSK车站或公共场所便利店或用户房间以便于用户能连接再生终端单元7到终端侧发送接收单元/6。
在任何情况下,终端侧发送接收单元/7被连接到作为诸如ISDN(综合业务数据网)线路或信息循环业务的专用通信线路的公共电话网线路的传输路径5。或者,传输路径5的部分或全部不局限于有线线路,而可以是无线通信线路。
再生终端单元7和终端侧发送接收单元/6通过其连接器连接。或者,他们可以通过电缆或例如利用红外线或电波的无线连接装置连接。
用户通过终端侧发送接收单元/6和业务提供器4请求用于希望信息的数据库3。因此用户请求的相关信息(即由写作系统2产生的传输信息)从数据库3中读出。从数据库3中读出的传输信息通过传输路径5发送到终端侧发送接收单元/6。
由终端侧发送接收单元/6接收的传输信息(即用户请求的业务信息)在所连接的再生终端单元7上作为话音和图象输出。2、终端单元侧的结构,
图2表示终端侧发送接收单元/6和再生终端单元7的结构。在终端侧发送接收单元/6中,调制解调器62的终端61连接到传输路径5以便能够与服务提供器4通信。
在图2所示的这个例子中,终端侧发送接收单元/6被连接到具有电源终端(电源插头)63的商业电源上。例如,电源电路64进行整流和平滑处理并输出操作电源电压。此外,还配备了对再生终端单元7的电池74充电的电源充电电路65。
当终端侧发送接收单元/6和再生终端单元7连接时,终端67和终端72被连接。电池充电电路65能给电池74提供充电电流。从而,再生终端单元7从电池74获得操作电压。此外,当再生终端单元7连接到终端侧发送接收单元/6时,操作电压给电池74充电。
当终端侧发送接收单元/6和再生终端单元7连接时,调制解调器62的终端66和接口部分73的终端71被连接。通过传输路径5从业务提供器4接收的传输信息经过调制解调器62和再生终端单元7的接口部分73馈送给控制器75。用户的传输信息通过接口73和调制解调器62发送给业务提供器4。
控制器75由所谓的微计算机构成。控制器75控制再生终端单元7每个部分的操作,监视用户在操作部分77上的操作,和执行用于输出传输信息的话音和图象所必须的信息处理。
用于输出话音和图象所必须的信息处理例如是用于从传输信息中分离文本数据和中间语言信息的处理、用于合成对应于中间语言信息的话音的处理等等(以后将参考图9描述这些处理)
控制器75利用存储器76执行要求的处理。存储器76由ROM或存储操作程序、用于各种处理所必须的参数、和话音合成处理所必须的信息、用于存储传输信息的RAM、用于工作区RAM的RAM等等构成。
作为话音输出系统,再生终端单元7具有音频电路78和话音输出部分80。控制器75使中间语言信息从传输信息中分离。由话音合成处理产生的合成话音信息(话音信号)馈送给音频电路78。音频电路78对话音信号进行D/A变换处理、均衡处理、放大处理等等并馈送合成的话音信号给话音输出部分80。话音输出部分80由扬声器SP头机HP等等构成。话音输出部分80输出对应于合成的话音信息给用户。换句话说,用户能够听到作为从业务提供器4中循环的业务信息(传输信息)的话音。
作为显示输出系统,再生终端单元7具有显示驱动器79和显示部分81。控制器75使文本数据从传输信息中分离之后,所分离的文本数据送给显示驱动器79。显示驱动器79驱动对应于文本数据的显示部分81以便显示文本数据。显示部分81是由例如液晶显示板或CRT构成。当显示部分81显示文本数据时,用户除了听到从话音输出部分80中输出的话音之外还能够从显示目录中看到文本数据。
操作部分77具有许多键,用户利用它可以进行各种操作。利用这些键,用户能够请求业务提供器4用于希望的信息和导致控制器75合成接收信息的话音以便显示其文本数据。换句话说,控制器75执行对应于用户在操作部分77上的操作。3、在写作系统中的发送信息发生操作(第一操作示例)
下一步,将描述图1和2所示的系统中用于产生发送信息的处理(由写作系统2执行)和用于话音和图象的处理(由再生终端单元7执行)。
参考图3、4、和5,将描述作为由写作系统2执行的产生发送信息的处理的第一操作示例。
在写作系统2中,存储在文本存储部分22中的文本数据TX馈送给中间语言发生部分24。中间语言发生部分24产生中间语言信息MT。利用产生的中间语言信息MT和文本信息TX(将参考图3描述转换文本串TTX),发送信息发生部分25产生发送信息SD。
图3表示由中间语言发生部分24和发送信息发生部分25执行的程序。
当要转换为中间语言信息MT的文本数据T输入给中间语言发生部分24时,写作系统2开始图3所示的从步骤F101的处理。
在步骤F101,中间语言发生部分24初始化作为转换文本串TTX存储的数据(将要处理的寄存器数据)。
在步骤F102、F103和F104,写作系统2例如利用字符分析输入文本串(文本数据TX)字符以便检测文本限定参数。
限定参数是代表诸如标点符号、段落和短语的信息。换句话说,限定参数是表示一个语句单元的信息。
作为标点符号、段落和短语的文本限定(换句话说,限定参数)可以设定为对应于控制部分26上的操作员命令。
在步骤F102,写作系统2用字符分析输入文本串字符。在步骤F104,写作系统2执行用于给转换文本串TTX加入非限定数据(字符)的处理。
当写作系统2检测标点符号参数时,流程从步骤F103进到F105。在这点上,转换文本串TTX具有等效于利用限定参数限定的句子、短语、字等等的文本串。
在步骤F105,当检测限定参数时写作系统2执行用于转换作为转换文本串TTX的信息为中间语言串MT的操作。
图4表示在步骤F105的转换处理。
读出转换文本串TTX之后,流程进到步骤S4。在步骤S4,写作系统2将它转换为具有日语句法信息(在步骤S2)和字典信息(在步骤S3)的日语短语。字典信息的示例是拼读符号字典和诗文字典。
在日语短语转换处理中,写作系统2产生作为拼读符号串(在步骤S5)的信息和作为作为音调(韵律)/重音数据(在步骤S6)的信息。中间语言发生部分24产生音频音量数据(在步骤S7)。
写作传统2分类拼读符号串信息为元音、辅音和无声音(在步骤S8、S9、和S10)。
写作系统2利用中间语言转换表处理元音、辅音、无声音、音调/重音数据和音频音量数据(在步骤S11)。之后,写作系统2组合得到的信息(在步骤S12)和形成作为中间语言信息MT的信息(在步骤S13)。
在步骤F105产生的中间语言信息mt馈送给发送信息发生部分25。发送信息发生部分25产生转换文本串ttx和发送信息SD(在步骤F106)。在步骤F106,写作系统2以这样一个方式即用限定信息限定中间语言信息mt和转换文本串ttx组合中间语言信息mt和作为数据串的转换文本串ttx,(SP1和SP2)。
在步骤F106为在步骤F105获得的中间语言信息mt产生发送信息SD之后,写作系统2确定对于输入文本串的所有数据单元是否已经完成了用于产生中间语言信息和发送信息。当检测结果为否,则流程返回到步骤F101。在步骤F101,写作系统2初始化转换文本串ttx并重复上述处理。
在步骤F101至F107,写作系统2以图5A至5E所示的格式产生发送信息sd。
利用作为图5A中所示的发送信息sd的首部数据,写作系统2在步骤F105产生中间语言信息mt。在F106,写作系统2产生如吐B所示的发送信息sd。
换句话说,写作系统2产生首部、作为转换文本串ttx的文本数据部分、和作为限定信息SP1的数据、中间语言信息mt、和限定信息SP2。因此,中间语言信息mt和对应于中间语言信息mt的转换文本串ttx利用限定信息SP1和SP2限定,并分组成一组信息(组BR1)。
限定部分SP1代表用于限定转换文本串ttx和中间语言信息mt的限定位置。限定信息SP2是代表中间语言信息mt的一个单元的终止位置。
之后,写作系统2重复步骤F101至F107的处理。因此,如图5C和5D所示,写作系统2在步骤F106更新作为发送信息sd的数据串。换句话说,写作系统2加入作为转换文本串TTX块和中间语言信息mt(块BR2至BR(N))的数据。
当写作系统2为作为发送信息sd一个单元将产生的输入文本串的所有数据元素完成上述操作时,流程从步骤F107进到步骤F108。例如,写作系统2给图5D所示形成的发送信息sd加上如图5E所示的结束标志ED。换句话说,完成发送信息sd的一个单元。
在步骤F108,加上诸如数据长度的管理数据作为发送信息sd的首部数据。这是由于,在步骤F108,已经安排了数据内容。
在步骤F108完成发送信息sd的一个单元之后,流程进到步骤F109。在步骤F109,写作系统25存储所完成的发送信息sd到数据库3。
因此,已经形成循环给用户的发送信息sd的一个单元。
存在作为发送信息sd的多种数据示例。下一步,将参考图6到8解释发送信息sd。
图6表示利用文本数据“本日は晴天なり(日语意思是今天天气好)”产生的发送信息sd的一个示例。
在这种情况中,如图6所示,作为拼读符号串“honnjiituuwa-seiitennaari”的数据作为中间语言信息mt产生。作为上述限定信息SP1的“/”(斜线)和作为限定信息SP2的“∥”(双斜线)被加到中间语言信息mt和文本数据中。因此,形成如图6所示的发送信息sd。在图6到图8所示的发送信息sd示例中,只显示了图5所示的发送信息sd的一个块(BR)。在这些示例中,省略了首部和结束标志。
在图14和15所示的第二操作示例中将描述拼读符号串数据符号的一个示例。
图6到8表示最简单的例子。无论如何,当文本数据是由很多句子、短语、字等等组成时,就连续形成由文本数据、限定信息SP1、中间语言信息mt、和限定SP2。
作为中间语言信息mt,由于除作为拼读符号串的信息外还加上了作为读出信息的各种类型信息诸如音调、重音、和音频音量,则再生终端单元7能够执行更复杂的话音合成处理。
图7表示利用日语文本信息产生英语读出信息的中间语言信息mt的示例并因此形成发送信息sd。
例如,上述翻译转换部分/23转换文本数据“本日は晴天なり”为翻译数据“今天晴朗”。翻译数据由写作系统24处理。因此,如图7所示的拼读符号串数据“tudei-iz-fain”作为中间语言信息mt产生。利用中间语言信息mt、原始日语文本信息、限定信息SP1、和限定信息SP2,形成图7所示示例1的发送信息sd。
或者,如图7所示的示例2,利用翻译文本数据“今天晴朗”和作为拼读符号串数据“tudei-iz-fain”的中间语言信息mt,可以形成发送信息sd。此外,如示例3,利用日语文本数据、英语文本数据、和作为拼读符号串数据“tudei-iz-fain”的中间语言信息mt,可以形成发送信息sd。也可以利用其他各种示例。当使用作为转换为外语例如英语的读出信息的中间语言信息mt时,可以加上诸如音调、重音、音量的信息。
图8表示利用标准日语文本数据产生作为方言读出信息的中间语言信息mt的示例并因此形成发送信息sd。
例如,翻译转换部分/23转换文本数据“我是猫”(我是猫)为图8所示的方言数据。得到的方言数据由写作系统24处理。写作系统24产生作为中间语言信息mt方言读出信息的拼读符号串“oora-neegookkooda”。利用方言的中间语言信息mt、原始文本数据;限定信息SP1、限定信息SP2,形成图8所示的方言发送信息sd。
在这种情况下,当加上诸如音调、重音、和音频音量的信息时,可以更真实地再生方言话音。除上述示例外,也可以考虑各种类型的发送信息sd内容。发送信息sd可以对应于业务类型、用户请求、服务区域等来设定并可以由用户选择。4、对应于第一操作示例的终端单元侧的处理
下一步,当用户加载存储在数据库3中的发送信息sd到再生终端单元7时,再生终端单元7执行以下处理。
如上所述,再生终端单元7的控制器75能够通过终端侧发送接收单元/6读出发送信息sd。
当用户输入用于再生接收信息(=发送信息sd)的命令到再生终端单元7时,控制器75执行图9所示的从步骤F201开始的处理。
在步骤F201,控制器75初始化作为要再生的数据串(寄存器)的再生文本串和在声中间语言串。
在步骤F202、F203、和F204,控制器75从发送信息sd中分离文本数据并产生作为图象数据再生文本数据的再生文本串。换句话说,控制器75连续分析发送信息sd的每个数据元素并检测限定信息SP1,当当前数据元素不是限定信息SP1时,流程进到步骤F203。在步骤F203,控制器75以给再生文本串加上不是限定信息SP1的数据元素(字符)这样一种方式更新再生文本串。在步骤F204,控制器75前进到发送信息sd。流程进到步骤F202。在步骤F202,控制器75确定当前数据元素是否时限定信息SP1。
当控制器75检测了限定信息SP1时,这从图5A至5E所示的发送信息sd的数据格式中明显可见,作为一个句子的文本数据(TTX)被存储为再生文本串。
在步骤F205,控制器75前进到作为接收信息的发送信息sd。在步骤F206、F207、和F208,控制器75从发送信息sd中分离中间语言信息mt并产生用于再生中间语言信息mt(作为话音数据)的再生中间语言串。
换句话说,换句话说,控制器75连续分析发送信息sd的每个数据元素并检测限定信息SP2。当当前数据元素不是限定信息SP2时,在步骤F207控制器75以给再生中间语言串加上不是限定信息的数据元素这样一种方式更新再生中间语言串。在步骤F208,控制器75前进到发送信息sd。在步骤F206,发送信息sd确定当前数据元素是否时限定信息SP2。
当控制器75检测限定信息SP2时,作为对应于存储为上述再生文本串一个句子的文本数据的读出信息的中间语言信息mt数据串被存储为再生中间语言串。
换句话说,如图5所示的一个方框那样获得转换文本串ttx和中间语言信息mt。
之后,流程进到步骤F209和F210。控制器75馈送存储为再生文本串的数据到显示驱动器79。显示驱动器79使显示部分显示再生文本串。此外,控制器75执行用于存储为再生中间语言串的读出信息的话音合成处理并产生话音合成信号。控制器75馈送产生的合成话音信号到音频电路78。音频电路78示话音输出部分80再生和输出话音。
从步骤F201到F210的处理中,控制器75输出作为接收的发送信息sd的一个句子的话音和图象。
因此,在步骤F211,控制器75确定是否已经再生接收的发送信息sd的所有数据元素(所有块)。换句话说,当还未再生接收的发送信息sd的所有数据元素(所有块)时,流程返回到步骤F201。在步骤F201,控制器75重复上述处理。换句话说,控制器75再生和输出作为下一个块的一个句子、一个短语等等。
控制器75再生接收的发送信息的所有块之后,控制器75完成再生处理。
在上述处理中,控制器75再生作为对应于接收的发送信息sd的话音和图象的循环原始文本数据。
在这种情况中,如图9所示,一次产生作为文本数据的一个句子和对应于该作为文本数据的一个句子的中间语言信息mt。此外,再生发送信息sd的每一块。因此,由于图象和话音同步再生,当听话音时,用户可以在显示部分看到对应于该话音的内容。
因此,控制器75只能执行对应于作为读出信息的中间语言信息mt的话音合成处理并输出合成的话音信号。换句话说,由于写作系统2执行要求高的字典和句法数据的文本数据合成处理,则控制器75步必有这种复杂的处理。因此,由于有再生终端单元7执行的处理负小,则它可以利用小规模的硬件和软件操作。
从而,对于再生终端单元7可以容易地实现轻巧结构、低造价、和低功率消耗。
此外,由于控制器75执行用于再生接收的发送信息sd的每一块的处理和用于从对应于限定信息SP1和SP2的中间语言信息mt中分离文本数据TTX的处理,则控制器75的分离处理被简化。因此,对于再生终端单元7可以实现处理的负载降低和硬件和软件的规模减小。
此外,由于发送话音信号没有被压缩,则通过话音信号数据的压缩处理,话音质量没有恶化。此外,由于重音、音调等信息加到发送数据,则话音能够以高质量再生和输出。
另外,由于通过发送路径5发送的发送信息sd的数据量远小于音频数据的数据量,则能迅速发送发送信息sd。因此,给用户提供方便的信息业务。5、写作系统中的发送信息发生操作(第二操作示例)
在上述第一操作示例中,发送信息sd由转换文本串ttx、中间语言信息mt、和限定信息SP1和SP2。在第二操作示例中,采用很多类型的复杂中间语言信息。
参照图10,将描述在第二操作示例中所用的限定信息。
在这个情况中,正如参考图10描述的,使用限定信息SP11、SP12、SP13、SP14、和SP15。
限定信息SP11时表示在发送信息sd块中文本串和中间语言信息的限定。作为限定信息SP11的真实示例,指定“|”为ASCII码“7C”。
限定信息SP12是表示中间语言信息中的限定部分的一个码。“部分”表示中间语言信息中作为读出信息的一个信息元素。在这个实施例中,读出信息分为三种类型的信息,他们是拼读符号串、音调/重音数据、和音频音量数据。每个拼读符号串、音调/重音数据、和音频音量数据的数据宽度被称为一个部分(见图12A至12E的部分SC)。
作为限定信息SP12的实用示例,指定为“/”。
限定信息SP13是表示中间语言信息中与限定部分SP12相同的限定部分的一个码。限定信息SP13表示在省略特定部分情况下的限定位置。
限定信息SP14是表示中间语言信息中控制命令限定部分的一个码。控制命令表示使用于拼读信息的拼读符号串的话音合成处理以多种方式设置。
后面将参考图20至23描述限定信息SP14。
作为限定信息SP14的实用示例,指定为“:”。
限定信息SP15是表示控制命令部分中的每个命令限定。在这个示例中,S-命令、T-命令、和V-命令有效。限定信息SP15表示以后将描述的每个这些命令的限定。
作为限定信息SP15的实用示例,指定为“,”。
一个字节的零码(即,下文所指十六进制“00h”是放在每一块发送信息sd开始的一个码。当考虑零码为限定信息的一种类型时,它表示块限定。
利用限定信息SP11至SP15的这些类型,形成发送信息sd。然而,在写作系统2中用于产生由中间语言发生部分24和发送信息发生部分25执行的发送信息sd的处理几乎与上述图3所示的第一操作示例的处理中的那些相同。
在图3所示的步骤F105的处理(即,用于产生由中间语言发生部分24执行的中间语言信息mt的处理)在图11所示的处理中执行。用于产生由发送信息发生部分25在图11所示(第二操作示例)步骤F106执行的发送信息的处理与图3所示(第一操作示例)的不同之处在于利用限定信息SP11和零码而不是限定信息SP1和SP2来执行处理。
下一步,参考图11,将描述第二操作示例情况下用于产生中间语言信息mt的处理。该处理在图3所示的步骤F105执行。
如在第一操作示例所描述的,在图3所示步骤F101到F104中,作为一个句子、断言等的文本串被存储为一个转换文本串TTX。当转换文本串TTX转换为中间语言信息mt时,在图11所示的步骤S1,写作系统2读出转换文本串ttx。对于日本句法信息(步骤S2)和字典信息(步骤S3),写作系统2转换转换文本串ttx为日语短语(步骤S4)。所指的字典信息例如是拼读符号字典、诗文字典等。
在日语短语转换处理中,写作系统2产生作为拼读符号串的信息(步骤S5)。写作系统2产生音调/重音信息(步骤S6)。此外,写作系统2产生音量数据(步骤S7)。
此外,写作系统2分类该拼读符号串信息为元音、辅音、和无声音(步骤S8、S9、和S10)。
写作系统2利用中间语言转换表处理元音、辅音、和无声音信息,重音/音调数据、和音量数据(步骤S11)。
除了从元音、辅音、和无声音信息中获得的拼读符号信息外,当加上音调/重音信息数据和音量数据之一和二者时,由于加上了音调/重音信息数据和音量数据的数据串的限定信息,当需要时,写作系统2产生细致拟订信息SP12和SP13(步骤S15)。
当操作员指定具有命令值的控制命令时,写作系统2产生具有命令值的控制命令(步骤S14)。在这点上,作为限定控制命令部分的信息和限定控制命令部分中每个命令的信息,写作系统2产生限定信息SP14和SP15(步骤S15)。
写作系统2利用中间语言转换表、产生的限定信息、和产生的控制命令执行用于信息转换的的组合处理(步骤S12)。因此,写作系统2产生作为中间语言信息mt的信息(步骤S13)。
在步骤F105产生的中间语言MT(图11所示的处理)馈送到发送信息发生部分25。连同转换文本串ttx,发送信息发生部分25执行用于发送信息sd的处理(图3所示是步骤F106的处理)。
在步骤F106,写作系统2以利用限定信息(SP11和零码)限定中间语言信息mt和转换文本串ttx的这样一种方式组合作为数据串的中间语言信息mt和转换文本串ttx。换句话说,写作系统2产生一块发送信息sd。
之后,写作系统2执行上述如图3所示的第一操作示例相同的处理。
下一步,将描述在第二操作示例产生的发送信息sd格式的例子。在图12A-12E和20A-20E表示发送信息sd格式的例子。图12A-12E表示没有控制命令的格式的例子,而图20A-20E表示具有控制命令的格式的例子。
参考图12A到19,将描述没有控制命令的读出信息的格式例子和具有控制命令的读出信息的格式例子。
图12A表示发送信息sd的一个串。正如图5E所示的第一操作示例一样,多个块(BR1到BR(N))放置在首部和结束标志ED之间。
无论如何,第二操作示例中的限定信息和每块的内容与第一操作示例不同。
如图12A到12E所述,转换文本串ttx和中间语言信息mt放在与图5E所示的格式相同的每块中。然而,作为限定信息,一个零码防在每块的开始。零码后面是转换文本串ttx。
转换文本串ttx后跟着限定信息SP11和中间语言信息mt。
中间语言信息mt后跟着限定信息SP11。换句话说,最后的限定信息SP11后跟着放置在下一块开始的零码之后。
因此,转换文本串ttx和中间语言信息mt放在每一块中。转换文本串ttx和中间语言信息mt以限定信息SP11和零码而限定。
图12B至12E表示中间语言信息mt的各种格式。
在图12B中,中间语言信息mt只有拼读符号串的一个部分SC构成。
换句话说,产生中间语言信息mt不需要图11所示的步骤S6、S7、S14、和S15的处理。
在图12C中,中间语言信息mt由拼读符号串和音调/重音数据两个部分SC构成。限定信息SP12放在拼读符号串和音调/重音数据之间。在这种情况中,只执行图11所示步骤S7和S14的处理。
在图12D中,中间语言信息mt由由拼读符号串、音调/重音数据和音量数据三个部分构成。限定信息SP12放在两个位置。在这种情况中,仅不执行图11所示的步骤S14的处理。
在图12E中,中间语言信息mt由拼读符号串和音量数据两个部分SC构成。然而,在这个示例中,能够放置为发送信息sd的读出信息的信息是拼读符号串、音调/重音数据和音量数据三个部分SC。在这个示例中,拼读符号串、音调/重音数据和音量数据三个部分按顺序放到中间语言信息mt。这是因为可以简化再生终端单元7的分离处理。
当中间语言信息mt是由拼读符号串和音量数据构成时,这些部分的顺序是不固定的(换句话说,音量数据部分不跟着音调/重音部分)。因此,需要表示不规则的特定装置。
在这个示例中,当省略音调/重音数据并因此拼读符号串跟着音量数据时,拼读符号串和音频音量两个部分用限定信息SP13限定以便表示中间语言信息mt上的不规则顺序。
图12E表示不执行图11所示的步骤S6和S14的处理的格式示例。
从上述示例中很清楚,包含拼读符号信息的中间语言信息mt包含至少拼读符号信息。此外,中间语言信息mt可以包含音调/重音数据和音频音量数据。
对于音调/重音数据和音频音量数据,再生终端单元7可以以高质量合成话音。
在音频音量不象日语一样变化很大的语言中,当省略音频音量数据时,利用高质量的话音合成输出可以减小中间语言信息mt的数据量。
当放置控制命令时,这种格式有效。下一步,将描述每块BR的限定示例和读出信息的信息元素示例。
这些示例应用到放置控制命令的情况中(以后将描述这种情况)。
下一步,参考图13,将描述在图12B所示的格式中文本信息(转换文本串ttx)和中间语言信息mt的安排。
如图13所示,假定送给中间语言发生部分24的文本信息TX是“每朝新闻1月1日朝刊”。
在这种情况下,当在步骤F101到步骤F104形成的转换文本串ttx是“每朝新闻1月1日朝刊”时,形成如图13所示的示例1的发送信息sd(在示例1中,省略首部和结束标志)。
在示例1中,相应于文本信息TX“每朝新闻1月1日朝刊”,作为一块的发送信息sd也形成了。如图11所示,该块是由零码“00h”、转换文本串ttx是“每朝新闻1月1日朝刊”、限定信息SP11“|”、中间语言信息mt“maityousinbun itigatutuitati tyoukan”、和限定信息SP11“|”构成。
在示例2中,相应于文本信息TX“每朝新闻1月1日朝刊”,形成作为三块的发送信息sd。换句话说,如图13所示,形成第一块零码“00h”、转换文本串“每朝新闻”
定界信息sp11“|”,中间语言信息mT“maityousinbun”,和定界信息sp11“|”与零码“00h”的第二块,变换文本字符串tXT“1月1日”,定界信息sp11“|”,中间语言信息mT“itigatutuitati”,和定界信息sp11“|”。
由于从实例1和实例2中显而易见,可以自由设置原始文本信息TX的块定界。例如,定界可以设置对应操作符的操作。换句话说,在图3所示的步骤F102和F103定界块(对应于文本定界参数)。
由于从在第一操作实例中的重放终端单元7的重放处理中显而易见,同时重放一个块的文本信息和中间语言信息mT。这样,因为可以自由设置块的定界,可以对应文本信息(在重放终端单元7中同时执行相应于中间语言信息的文本显示处理和话音处理)的内容灵活设置重放操作。
在诸如报纸或杂志的信息的情况下,一块可以由一个长的文本字符串形成。在诸如英语会话资料的信息的情况下,一块可以由一个短的文本字符串形成。这样,重放终端单元7可以执行相应于将被重放的文本内容的同步处理。
下面,将描述作为中间语言信息mT的读出信息部分的每个信息的实际数据实例。
在这个实例中,考虑发音符号信息,音调/重音数据,和音频音量数据作为读出信息。
关于发音符号信息,发音符号一般指定为罗马字符。
图14示出日语的文本信息的发音符号表示的一个实例。图15示出英国英语/美国英语的文本信息的发音符号表示的一个实例。在图14和图15中,真实的发音声音的字符(左侧)与发音符号的字符(右侧)有关。
产生在图11(图4)的步骤S5,S8,S9和S10分析并在步骤S11变换的发音符号信息对应于图14(以日语)所示的表示实例或图15(以英国英语/美国英语)所示的表示实例。
图16A到图16C表示音调/重音数据的实例。
换句话说,表示法由刚好对应发音符号的A=440Hz的调节音阶表示。
如图16A所示,下档字母字符被指定为对应于调节音阶(C,C#,…B)。换句话说,音阶符号“c,d,e,f,g,a,b”被分别指定为调节音阶“C,D,E,F,G,A,B”。另外,音阶符号“I,j,k,l,kb”被分别指定为调节音阶“C#,D#,F#,G#,A#”。
关于重音,音阶符号“a,b,c,d,e,f,g,h,I,j,k,l”分别由上档字母字符的音阶符号“A,B,C,D,E,F,G,H,I,J,K,L”表示。
就调节音阶而言,八音度由一个数字和一个音阶名称(C,C#,…B)表示。作为音调/重音数据的八音度以如图16B所示的相同数字表示。
这样,如图16C所示,调节音阶C1由“c1”表示。具有重音的调节音阶C1由“C1”表示。同样,调节音阶A4由“a4”或“A4”表示。调节音阶A#9由“h9”或“H9”表示。
因为音调/重音数据刚好对应发音符号信息,所以当一个五音调文本发音为“MI,MI,MI,LA,SI”(音阶名称的E3,E3,E3,A3,B2)并且第一音调和第四音调是重音时,音调/重音数据被表示为如图17所示的“E3,e3,e3,A3,b2”。
但是,在这个实例中,当相同数字后继一个八音度符号时,省略第二或后一个符号的八音度数字以便减少数据量。在这种情况下,音调/重音数据被表示为“E3,e,e,A,b2”。
图18表示音频音量数据的表示法的实例。
音频音量数据是表示相应于重放终端单元7的主音量的音频音量变化的信息。
如图18所示,音频音量数据具有在“1”到“9”范围变化的数据值。数据值“5”表示有关的音频音量是0db。换句话说,音频音量数据的数据值表示重放终端单元7的主音量的音频音量的变化。
数据值“1”到“4”和“6”到“9”以db表示如图18所示的有关的音频音量。例如,音频音量数据的数据值“3”表示比重放终端单元7的主音量的音频音量低-6db。
图19表示在发音符号信息,音调/重音数据,音频音量数据等被放置在中间语言信息mT的情况下发送信息SD的一个实例。
在这个实例中,示出对应于文本“每朝新闻”生成的发送信息SD(省略了首部和尾部标记)。
如图19所示,对应于文本“每朝新闻”的发音符号信息是例如“maityo-sinbun”;对应于那的音调/重音数据是“d3 e e E c b2 a”;对应于那的音频音量数据是“5 6 6 7 5 4 3”。
这样,如图19的实例1所示,以图12C的格式,发送信息SD由零码“00h”的数据字符串,变换文本字符串tTx“每朝新闻”,定界信息sp11“|”,中间语言信息mT的发音符号信息“maityo-sinbun”,定界信息sp12“/”,中间语言信息mT的音调/重音组数据“d3 e e E c b 2a”和定界信息sp11“|”组成。
如图19的实例2所示,以图12D的格式,发送信息SD由零码“00h”的数据字符串,变换文本字符串tTx“每朝新闻”,定界信息sp11“|”,中间语言信息mT的发音符号信息“maityo-sinbun”,定界信息sp12“/”,中间语言信息mT的音调/重音组数据“d3 e e E c b 2a”,定界信息sp12“/”,中间语言信息mT的音频音量数据“5 5 5 7 5 4 3”,和定界信息sp11“/”组成。
如图19的实例3所示,以图12E的格式,发送信息SD由零码“00h”的数据字符串,变换文本字符串tTx“每朝新闻”,定界信息sp11“|”,中间语言信息mT的发音符号信息“maityo-sinbun”,定界信息sp13“∥”,中间语言信息mT的音调/重音组数据“d3 e e E c b 2a”,定界信息sp12“/”,中间语言信息mT的音频音量数据“5 6 6 7 5 4 3”,和定界信息sp11“|”组成。
下面,参照图20,将描述在控制命令作为控制信息加入中间语言信息mT的情况下发送信息SD格式的实例。如利用图12A,图20A所示的实例,图20A表示发送信息SD的一个字符串的所有信息部分。
图20B,20C,20D和20E表示其控制命令加入图12B,12C,12D,和12E所示的格式。换句话说,因为用于定界文本信息tTX和中间语言信息mT的定界信息,中间语言信息mT的读出信息的每个部分SC的安排,和用于以图20B,20C,20D和20E所示的格式定界部分SC的定界信息与图20B,20C,20D,和20E所示的部分相同,为了简明将省略它们的描述。
由于从图20B,20C,20D和20E中显而易见,部分SC作为控制命令CC放置在中间语言信息mT的开始。另外,定界信息sp14放置在控制命令的部分SC的前面和后面以便定界每个部分SC。
换句话说,文本信息tTX后接定界信息sp11。定界信息sp11后接定界信息sp14。定界信息sp14后接控制命令部分。
至少一个命令可以放置在部分SC作为控制命令CC。图20F表示放置三个命令的一个实例。
由于从图20F中显而易见,当放置多个命令时,它们可以利用定界信息sp15定界。
在这个实例中,作为可以放置在控制命令CC的部分SC中的命令,有三种命令,它们是s-命令,t-命令,和v-命令。
这些命令在当前的块中是合法的(换句话说,直到放置下一个零码或下一个命令)。
下面,将描述这些命令的功能。
s-命令(速度命令)用于设置重放终端单元7的话音合成输出的输出速度(读出速度)。
s-命令具有如图21所示的命令值“s1”到“s9”。命令值“s5”表示标准速度。命令值“s1”到“s4”和“s6”到“s9”以图21所示的音阶表示读出速度。
t-命令(音调命令)用于设置重放终端单元7的话音合成输出的音调(音阶)的基频。
t-命令具有如图22A所示的命令值“t1”到“t9”。命令值“t5”表示基本间隔。基本间隔是A4(第四低八音度的音调“LA”)=440Hz。
命令值“t1”到“t4”和“t6”到“t9”表示来自如图22A所示的基本间隔的变化。
当命令值是“t1”时,基本间隔减少三个主级。
在t-命令的命令值是“t5”的基本间隔的情况下,当音调/重音数据的值是“a4”时,该音调的调节音阶是A4(第四八音度的“LA”)。但是,当t-命令的命令值是“t1”时,在音调/重音数据的“a4”的音调的调节音阶减少三个主阶。这样,生成F4(第四八音度中的“FA”)的音调。
换句话说,设置发音符号数据的每个音调的音调变化对应于该音调/重音数据。但是,利用t-命令,当保持特殊间隔的变化的同时,可以改变整个间隔。
图22B表示生成的音阶的实例。
在音调/重音数据是如图17所示的“E3,e,e,A,b2”的情况下,当t-命令=“t5”(标准的)时,生成的音调音阶是如图22B所示的“E3,E3,E3,A3,B2”。
当t-命令=“t7”时,因为基本音阶增加两个主要音阶,产生的音调的音阶是“F#3,F#3,F#3,B3,C#3”。当t-命令=“t1”时,因为基本间隔减少了三个主要音阶,所以产生的音调的音阶是“C3,C3,C3,F3,G2”。
v-命令(音量命令)用于设置重放终端单元7的话音合成输出的基本音频音量。
如图23所示,v-命令具有命令值“v1”到“v9”。命令值“v5”表示基本音频音量(从基本音频音量的变化量是0)。
命令值“v1”到“v4”和“v6”到“v9”表示从如图23所示的基本音频音量的变化。
当命令值是“v1”时,从基本音频音量的音频音量的变化是40%。
换句话说,利用v-命令,当保持特定音调的音频音量的变化的同时,可以改变发音符号字符串的整个音频音量。
利用s-命令,t-命令,和v-命令,可以变化地设置一个特定块或多个块的读出速度,间隔,和音频音量。
利用s-命令,可以慢慢地或很快地读出对应其一个命令值的块。
利用t-命令,可以改变会话的短语的音调(间隔)。这样,可以得到一个男性说话者和一个女性说话者彼此交谈的话音合成的输出。
利用v-命令,可以改变会话语句的短语的音频音量。这样,可以实现具有多个说话者观点的话音合成的输出。
每个命令的命令值和每个命令值的阶宽(s-命令和v-命令中的10%阶和t-命令中的半音间隔)不限于图21到23所述的那些值。
应该注意到命令类型不限于上面描述的那些命令类型。
图24表示具有这种控制命令的发送信息SD的格式的实例。正如图19,所示的格式一样,图24表示相应于正文“每朝新闻”产生的发送信息SD的格式的实例。在这些格式中,认为s-命令“s7”,t-命令“t8”,和v-命令“v2”是控制命令。
在图20B所示的格式中,如图24的实例1所示,发送信息SD由零码“00h”的数据字符串,变换文本字符串tTX“每朝新闻”,定界信息sp11“|“,定界信息sp14“:”,s-命令“s7”,定界信息sp15“,”,t-命令“t8”,定界信息sp15“,”,v-命令“v2”,定界信息sp14“:”,中间语言信息mT的发音符号信息“maityo-sinbun”,和定界信息sp11“|”组成。
在图20C所示的格式中,如图24的实例2所示,发送信息SD由零码“00h”的数据字符串,变换文本字符串tTX“每朝新闻”,定界信息sp11“|“,定界信息sp14“:”,s-命令“s7”,定界信息sp15“,”,t-命令“t8”,定界信息sp15“,”,v-命令“v2”,定界信息sp14“:”,中间语言信息mT的发音符号信息“maityo-sinbun”,定界信息sp12“/”,中间语言信息mT的音调/重音数据“d3eeEEcb2a”,和定界信息sp11“|”组成。
在图20D所示的格式中,如图24的实例3所示,发送信息SD由零码“00h”的数据字符串,变换文本字符串tTX“每朝新闻”,定界信息sp11“|“,定界信息sp14“:”,s-命令“s7”,定界信息sp15“,”,t-命令“t8”,定界信息sp15“,”,v-命令“v2”,定界信息sp14“:”,中间语言信息mT的发音符号信息“maityo-sinbun”,定界信息sp12“/”,中间语言信息mT的音调/重音数据“d3eeEEcb2a”,中间语言信息mT的音频音量数据“5667543”,和定界信息sp11“|”组成。
在图20E所示的格式中,如图24的实例4所示,发送信息SD由零码“00h”的数据字符串,变换文本字符串tTX“每朝新闻”,定界信息sp11“|“,定界信息sp14“:”,s-命令“s7”,定界信息sp15“,”,t-命令“t8”,定界信息sp15“,”,v-命令“v2”,定界信息sp14“:”,中间语言信息mT的发音符号信息“maityo-sinbun”,定界信息sp13“//”,中间语言信息mT的音频音量数据“5667543”,和定界信息sp11“|”组成。
6.相应于第二操作实例的终端单元侧的处理。
在第二操作实例中,发送信息SD以上述的方式形成。形成的发送信息SD存储在数据库3中。下面,参照图26,27和28所示的流程图,将描述发送信息SD的重放终端单元7的重放操作。
重放终端单元7的控制器75通过终端侧发送/接收单元6接收发送信息SD。
当用户发出用于接收信息(=发送信息SD)的一个重放开始命令时,控制器75执行从图25A和图25B所示的F301开始的处理。
在步骤F301,控制器75在作为发送信息SD的数据字符串的一块开始处检测零码。在执行用于剩余的数据字符串(即,该块的实数据)的处理之前,在步骤F302控制器75执行用于该块的实数据的处理的初始化过程。
在这种情况下,控制器75初始化存储文本信息,发音符号信息,音调/重音数据,音频音量数据,和是包括在该块中的数据的控制命令的寄存器RG(1)到RG(n)。这些寄存器和存储在其中的数据单元称做重放文本字符串,重放发音符号字符串,重放音调/重音数据字符串,重放音频音量数据字符串,和控制命令寄存器RG(1)到RG(n)。
在步骤F302的初始化处理可以后接在步骤F301的处理。
下面,在步骤F302,F304,F305,控制器75SD中分出文本信息并产生用于重放文本数据(显示文本)的一个重放文本字符串。
换句话说,控制器75接着分析由零码前序的发送信息SD并且检查定界信息sp11。当分析的数据单元(字符)不是定界信息sp11时,流程进入步骤F304。在步骤F304,控制器75修改重放文本字符串,使得不是定界信息sp11的分析的数据单元被加到重放文本字符串。在步骤F305,控制器75分析发送信息SD的下一个数据单元(下文称做“向前推进接收信息”)。在步骤F303,控制器75确定当前的数据单元是否是定界信息sp11。
当控制器75在特定的位置检测到定界信息sp11时,正如从图12A到图12E和图20A到图20F所示的发送信息SD的格式中显而易见的一样,作为语句的文本数据(tTX)被存储作为在该处的重放文本字符串。
在步骤F306,控制器75分析发送信息SD的下一数据单元(即,向前推进接收信息)。在步骤F307,控制器75确定当前的数据单元是否是定界信息sp14。
当目前的数据单元是定界信息sp14时,如图20A到图20F所示,当前的数据单元后跟一个控制命令CC。
当目前的数据单元是定界信息sp14时,在步骤F307到F313控制器75执行用于控制命令的提取处理。
在步骤F310到F311,控制器75确定当前的数据单元是否是定界信息sp14或sp15。当目前的数据单元既不是定界信息sp14,又不是定界信息sp15时,在步骤F312控制器75将该数据单元存储在寄存器RG(M)。
在步骤F310当控制器75检测到定界信息sp14并存储控制命令时,控制器75向前推进接收的信息。这样,流程通过图25A和25B的分支点(1)进进图26A和26B所示的步骤F315。
在步骤F307当控制器75没有检测到定界信息sp14(即,发送信息SD不包括控制命令),流程通过图25A和25B所示的分支点(1)进到图26A和26B所示的步骤F315。
在这点上,因为通过推进接收信息的当前数据单元处于发音符号信息的开始,所以控制器75执行用于将该数据单元放入重放发音符号字符串的一个过程。
在步骤F316,控制器75向前推进接收的信息。在步骤F317,F318,和F319,控制器75通过推进接收的信息来确定当前的数据单元是否是定界信息sp11,定界信息sp12,或定界信息sp13。
当当前的数据单元既不是定界信息sp11,也不是定界信息sp12,或定界信息sp13时,因为当前的数据单元是组成发音符号信息的数据,所以流程返回到步骤F315。在步骤F315,控制器75执行用于将当前数据单元增加到重放符号字符串的修改处理。
当控制器75重复步骤F315到F319的处理时,在步骤F315到F319之一控制器75检测定界信息。
当接收的信息(发送信息SD)具有图12B所示的格式或图20B所示的格式时,在步骤F317控制器75在一个特定点检测定界信息sp11。
当接收的信息(发送信息SD)具有图12C或图12D所示的格式或图20C或图20D所示的格式时,在步骤F319控制器75在一个特定点检测定界信息sp13。
当接收的信息(发送信息SD)具有图12E所示的格式或图20E所示的格式时,在步骤F319控制器75在一个特定点检测定界信息sp13。
在步骤F318当控制器75检测到定界信息sp12时,因为下一个数据单元是音调/重音数据部分,所以流程进到步骤F320。在步骤F320,控制器75向前推进接收的信息。这样,因为当前的数据单元是在该音调/重音数据的开始,所以在步骤F321控制器75执行用于将该数据单元放入重放发音符号字符串的一个过程。
在步骤F322控制器75向前推进接收的信息。在步骤F323和F324,控制器75确定该当前数据单元是定界信息sp11还是定界信息sp12。
当当前的数据单元既不是定界信息sp11,也不是定界信息sp12时,因为当前的数据单元是组成音调/重音数据的数据,所以流程返回到步骤F321。在步骤F321,控制器75执行用于将当前数据单元增加到重放音调/重音数据字符串的修改处理。
当控制器75重复从步骤F321到F324的处理时,在步骤F323或步骤F324在一个特定点检测定界信息。
 当接收的信息(发送信息SD)具有图12C所示的格式或图20C所示的格式时,在步骤F323控制器75在一个特定点检测定界信息sp11。
当接收的信息(发送信息SD)具有图12D所示的格式或图20D所示的格式时,在步骤F324控制器75在一个特定点检测定界信息sp12。
在步骤F324当控制器75检测到定界信息sp12时,因为下一个数据单元是音频音量数据部分,所以流程进到步骤F325。在步骤F325,控制器75向前推进接收的信息。在步骤F318,当控制器75检测到定界信息sp13时,因为下一个数据单元是音频音量数据部分,所以流程进到步骤F325。在步骤F325,控制器75向前推进接收的信息。
当控制器75已经向前推进接收信息时,因为当前的数据块是在音频音量数据的开始,所以流程进入步骤F326。在步骤F326,控制器75执行用于将当前数据单元放入重放音频音量数据字符串的处理。
在步骤F327,控制器75向前推进接收的信息。在步骤F328,控制器75确定当前的数据单元是否是定界信息sp11。
当当前的数据单元不是定界信息sp11时,因为当前的数据单元是组成音频音量数据的数据,所以流程返回到步骤F326。在步骤F326,控制器75执行用于将当前数据单元增加到重放音频音量数据字符串的修改处理。
当接收的信息(发送信息SD)具有图12D或图12E所示的格式或图20D或图20E所示的格式时,流程进到步骤F328。在步骤F328,控制器75在一个特定点检测定界信息sp11。
如上所述,当接收的信息具有图12C所示的格式或图20C所示的格式时,流程进到步骤F323。在步骤F323控制器75在一个特定点检测定界信息sp11。当接收的信息具有图12B所示的格式或图20B所示的格式时,流程进到步骤F317。在步骤F317,控制器75在一个特定点检测定界信息sp11。当控制器75检测到定界信息sp11时,因为控制器75已经完全接收了发送信息SD的一块,所以流程通过图26A和26B所示的分支点(2)进到图27A和27B所示的步骤F329换句话说,控制器75执行用于从发送信息SD一块中提取并存储在每个寄存器中的数据的重放操作。
在步骤F329,控制器75将作为重放文本字符串存储的数据送给显示驱动器79。显示驱动器79使显示部分81显示该重放文本字符串。
在步骤F330,F332,和F334,控制器75检查控制命令寄存器RG的内容。当控制命令寄存器RG已经存储s-命令时,在步骤F331控制器F329设置读出速度对应于s-命令的命令值。
当控制命令寄存器RG已经存储t-命令时,在步骤F333控制器75设置基本间隔(音调)对应于t-命令的命令值。
当控制命令寄存器RG已经存储v-命令时,在步骤F335控制器75设置视频音量对应于v-命令的命令值。
在步骤F336,F337,和F338,控制器75检查作为中间语言信息mT的读出信息的存储状态。在这个实施例中,中间语言信息mT包括发音符号信息。但是,中间语言信息mT可以不包括音调/重音数据和音频音量数据。
这样,在步骤F336,F337,和F338,控制器75确定是否已经存储重放音调/重音数据字符串和音频音量数据字符串。相应于确定的结果,流程分支。
当已经存储音调/重音数据和音频音量数据时(换句话说,接收信息具有图12B所示的格式或图20B所示的格式),流程进到步骤F339。在步骤F339,控制器75执行相应于作为重放发音符号字符串存储的发音符号信息的语音合成处理并且产生一个合成的语音信号。合成的语音信号送到音频电路78。控制器75使音频电路78通过话音输出部分80重放和输出合成语音信号作为话音。
当音调/重音数据已经存储,而音频音量数据没有存储时(换句话说,接收信息具有图12C所示的格式或图20C所示的格式),流程进到步骤F342。在步骤F342,控制器75执行相应于作为重放发音符号字符串存储的发音符号信息和作为重放音调/重音数据字符串存储的音调/重音数据的语音合成处理并且产生一个合成的语音信号。合成的语音信号送到音频电路78。控制器75使音频电路78通过话音输出部分80重放和输出合成语音信号作为话音。
当已经存储音调/重音数据和音频音量数据时(换句话说,接收信息具有图12D所示的格式或图20D所示的格式),流程进到步骤F340。在步骤F340,控制器75执行相应于作为重放发音符号字符串存储的发音符号信息,作为重放音调/重音数据字符串存储的音调/重音数据,和作为重放音频音量数据字符串存储的音频音量数据的语音合成处理并且产生一个合成的语音信号。合成的语音信号送到音频电路78。控制器75使音频电路78通过话音输出部分80重放和输出合成语音信号作为话音。
当音调/重音数据已经存储,而音频音量数据没有存储时(换句话说,接收信息具有图12E所示的格式或图20E所示的格式),流程进到步骤F341。在步骤F341,控制器75执行相应于作为重放发音符号字符串存储的发音符号信息和作为重放音频音量数据字符串存储的音频音量数据的语音合成处理并且产生一个合成的语音信号。合成的语音信号送到音频电路78。控制器75使音频电路78通过话音输出部分80重放和输出合成语音信号作为话音。
当该块包括一个控制命令(或包括在前序块中的控制命令仍然合法)时,即使在步骤F339,F340,F341,或F342输出合成的话音信号,控制器75执行相应于所有或部分的s-命令,t-命令,和v-命令个处理。
在上述的处理中,输出接收的发送信息SD的一块(一个语句,一个短语,一个词等)作为话音或图象。
这样,当没有重放(即,尚未检测到结束标记ED)接收的发送信息SD的所有数据单元(即,所有块)时,流程返回到如图23所示的图25A和25B的步骤F301。控制器75从步骤F301重复上述处理。换句话说,控制器75重放和输出语句,短语等等作为下一块。
在重放接收的发送信息的所有块以后,在步骤F343控制器75完成重放处理。
这样,正如上述第一操作实例一样,在第二操作实例中,可以作为话音和图象重放循环的原始文本数据。
在第二操作实例中,在文本数据和相应于该文本数据的中间语言信息mT被逐块重放的同时,重放发送信息SD的每块。这样,同时重放图象和话音。因此,用户在想要相应于该数据的话音的同时可以检查显示的数据。
控制器75执行相应于作为读出信息的中间语言信息mT的话音合成处理。因为写作系统2已经执行了利用大型目录和语法数据的文本数据分析处理,所以控制器75不需要执行文本数据分析处理。这样,因为由处理器75执行的处理的负荷小,所以用于处理器75的硬件和软件的规模小。因此,可以为重放终端单元7很容易地实现轻巧的结构,低成本,和低功耗。
另外,由于控制器75逐块地执行接收的发送信息SD并且为对应于定界信息sp11和零码的每块从中间语言信息mT中分出文本数据tTX,所以控制器75的分开处理变得简单了。
在这个实施例中,零码放置在每一块的开始。但是,如上所述,由于定界信息sp11放置在中间语言信息mT之后(在每一块的结尾),所以可以利用中间语言信息mT之后的定界信息sp11检测每块的定界。换句话说,不包括零码的发送信息SD的格式是可以得到的。在这种情况下,在图25A和图25B所示的步骤F301,检测定界信息sp11。
在这个实施例中,相应于定界信息sp12,sp13,和sp14分出/提取中间语言信息mT的每一部分。因此,可以容易地分出/提取中间语言信息mT的每一部分。相应于定界信息sp15可以容易地分出/提取每个控制命令。因此,可以减少由重放终端单元7执行的处理的负荷。这样,可以减少重放终端单元7的硬件和软件规模。
另外,因为发送尚未被压缩的话音信号数据,所以信号数据的质量不会退化。而且,由于诸如音调/重音数据和音频音量数据的信息被加入发送信息SD,所以可以以很高的质量重放并输出话音。
另外,利用控制命令,可以以各种方式输出话音。
而且,因为在发送路径5上发送的发送信息SD的数据量比音频数据的数据量小的多,所以发送信息SD的发送不需要很长时间。这样,提供用户舒适的信息服务。
已经参照附图描述了本发明的特定的优选实施例,可以理解本发明不限于该明确的实施例,并且在不脱离如所附的权利要求书限定的本发明的范围或精神的情况下,可以由本领域技术人员作出种种改变和修改。
在上述的实施例中,假设重放终端单元7是便携式和小的重放单元。但是,因为一般意义上的个人计算机可以足够合成并输出话音,所以利用执行图9(或图25到图27)所示的处理的应用软件可以实现根据本发明的系统。
特别地,具有声音功能的个人计算机可以仅利用这种软件合成语音。
根据本发明,组合文本信息和中间语言信息并且生成发送信息。但是,根据系统结构,可以仅提供根据本发明的中间语言信息作为发送信息SD。
可以增加例如作为从音频记录媒体重放的视频信号的子信息的文本数据。在这种情况下,当增加相应于这种文本数据的中间语言信息并记录在这样的视频记录媒体时,可以利用重放单元的简单处理以高质量得到合成输出的话音。当合成输出的话音与和视频信号一起重放的上述话音信号混合时,可以使用合成输出的话音作为例如叙述的话音。
当在重放终端侧(重放终端单元7)修改用于合成话音的话音单元信息表时,可以由用户选择合成话音的质量。这样,相应于另外的需求,可以提高话音质量。
用户可以自由地选择话音的音调和读出速度。

Claims (58)

1、一种信息发送和接收设备,包括:
中间语言信息产生装置,用于产生作为相应于提供的文本信息的读出信息的中间语言信息;
发送信息产生装置,用于至少组合文本信息和中间语言信息并产生发送
信息;
发送装置,用于发送由所述发送信息产生装置产生的发送信息;
接收装置,用于从所述发送装置接收发送信息;
信号处理装置,用于将由所述接收装置接收的发送信息至少分为文本信息和中间语言信息并产生相应于分出的中间语言信息的话音合成的信息;
显示装置,用于显示由所述信号处理装置分出的文本信息;和
输出装置,用于输出相应于由所述信号处理装置生成的话音合成信息的话音。
2.如权利要求1所述的信息发送和接收设备,
其中所述的发送信息产生装置以将定界该文本信息和中间语言信息的定界信息加入到发送信息中这种方式产生发送信息。
3.如权利要求2所述的信息发送和接收设备,
其中所述的发送信息产生装置以使表示中间语言信息结束位置的定界信息加入到发送信息中这种方式产生发送信息。
4.如权利要求2所述的信息发送和接收设备,
其中所述的发送信息产生装置以使首部放置在发送信息的开始,而结束标记放置在发送信息的结尾这种方式产生发送信息。
5.如权利要求1所述的信息发送和接收设备,
其中所述的中间语言信息产生装置产生相应于提供的文本信息的发音符号信息。
6.如权利要求5所述的信息发送和接收设备,
其中所述的中间语言信息产生装置至少产生音调/重音信息和音频音量信息之一并组合产生的发音符号信息和至少音调/重音信息之一以及音频音量信息以便产生中间语言信息。
7.如权利要求1所述的信息发送和接收设备,
其中所述的中间语言信息产生装置产生相应于提供的文本信息的发音符号信息并为相应于该发音符号信息的话音处理产生命令信息。
8.如权利要求1所述的信息发送和接收设备,
其中的命令信息至少包括话音速度信息,基准间隔信息和基准音频音量信息之一,该话音速度信息用于相应于发音符号信息的话音处理。
9.如权利要求8所述的信息发送和接收设备,
其中所述中间语言信息产生装置产生表示该命令信息的定界的定界信息。
10.如权利要求9所述的信息发送和接收设备,
其中所述中间语言信息产生装置产生另一个定界信息,定界中间语言信息作为一条读出信息。
11.如权利要求1所述的信息发送和接收设备,还包括:
文本信息产生装置,用于产生文本信息作为它的每个单元。
12.如权利要求1所述的信息发送和接收设备,
其中所述的文本信息产生装置检测文本数据定界参数以便产生文本信息作为其的每个单元。
13.如权利要求12所述的信息发送和接收设备,
其中所述的信号处理装置分出文本信息和相应于该定界信息的中间语言信息。
14.如权利要求1所述的信息发送和接收设备,
其中所述的中间语言信息产生装置产生相应于该提供的文本信息的发音符号信息,和
其中所述的信号处理装置产生相应于至少该发音符号信息的话音合成信息。
15.如权利要求14所述的信息发送和接收设备,
其中所述的中间语言信息产生装置至少产生音调/重音信息和音频音量信息之一,和
其中所述的信号处理装置产生相应于至少该发音符号信息和至少该音调/重音信息以及该音频音量信息的话音合成信息。
16.如权利要求14所述的信息发送和接收设备,
其中所述的中间语言信息产生装置为相应于该发音符号信息的的话音处理产生命令信息,和
其中所述的信号处理装置产生相应于该发音符号信息和该命令信息的话音合成信息。
17.如权利要求16所述的信息发送和接收设备,
其中所述的中间语言信息产生装置产生表示该命令信息的定界的定界信息,和
其中所述的信号处理装置转换用于相应于该定界信息是否存在的话音合成信息的产生操作。
18.如权利要求1所述的信息发送和接收设备,
其中所述的发送信息产生装置产生多种类型的定界信息并且将产生的该多种类型的定界信息加到文本信息和中间语言信息中,以便产生发送信息,和
其中所述的信号处理装置确定该接收的发送信息是否是该多种类型的定界信息以便分出文本信息和中间语言信息。
19.如权利要求18所述的信息发送和接收设备,
其中多种类型的定界信息是第一定界信息和第二定界信息,该第一定界信息定界至少该文本信息和中间语言信息,该第二定界信息定界中间语言信息作为一条读出信息。
20.如权利要求19所述的信息发送和接收设备,
其中所述的中间语言信息产生装置产生相应于提供的文本信息的发音符号信息并为相应于该发音符号信息的话音处理产生命令信息,该多种类型的定界信息包括表示命令信息的定界的定界信息。
21.一种信息发送设备,包括:
中间语言信息产生装置,用于以提供的文本信息是相应于提供的文本信息的读出信息的这种方式产生中间语言信息;
发送信息产生装置,用于组合至少该文本信息和中间语言信息以便产生发送信息;和
发送装置,用于发送由所述发送信息产生装置产生的发送信息。
22.如权利要求21所述的信息发送设备,
其中所述的发送信息产生装置以将定界文本信息和中间语言信息的定界信息加入到发送信息的这种方式产生发送信息。
23.如权利要求22所述的信息发送设备,
其中所述的发送信息产生装置以使表示中间语言信息结束位置的定界信息加入到发送信息中这种方式产生发送信息。
24.如权利要求22所述的信息发送设备,
其中所述的发送信息产生装置以使首部放在发送信息的开始,而结束标记放在发送信息的尾部这种方式产生发送信息。
25.如权利要求21所述的信息发送设备,
其中所述的中间语言信息产生装置产生相应于提供的文本信息的发音符号信息。
26.如权利要求25所述的信息发送设备,
其中所述的中间语言信息产生装置至少产生音调/重音信息和音频音量信息之一并组合产生的发音符号信息和至少音调/重音信息之一以及音频音量信息以便产生中间语言信息。
27.如权利要求21所述的信息发送设备,
其中所述的中间语言信息产生装置产生相应于提供的文本信息的发音符号信息并为相应于该发音符号信息的话音处理产生命令信息。
28.如权利要求27所述的信息发送设备,
其中的命令信息至少包括话音速度信息,基准间隔信息和基准音频音量信息之一,该话音速度信息用于相应于发音符号信息的话音处理。
29.如权利要求28所述的信息发送设备,
其中所述中间语言信息产生装置产生表示该命令信息的定界的定界信息。
30.如权利要求29所述的信息发送设备,
其中所述中间语言信息产生装置产生另一个定界信息,定界中间语言信息作为一条读出信息。
31.如权利要求21所述的信息发送设备,还包括:
文本信息产生装置,用于产生文本信息作为它的每个单元。
32.如权利要求31所述的信息发送和接收设备,
其中所述的文本信息产生装置检测文本数据定界参数以便产生文本信息作为其的每个单元。
33.一种用于接收至少包括文本信息和中间语言信息的发送信息的信息接收设备,包括:
接收装置,用于接收发送信息;
信号处理装置,用于将由所述接收装置接收的发送信息至少分为文本信息和中间语言信息并产生相应于分出的中间语言信息的话音合成的信息;
显示装置,用于显示由所述信号处理装置分出的文本信息;和
输出装置,用于输出相应于由所述信号处理装置生成的话音合成信息的话音。
34.如权利要求33所述的信息接收设备,
其中发送信息包括定界该文本信息和该中间语言信息的定界信息,和
其中所述信号处理装置划分成相应于定界信息的文本信息和中间语言信息。
35.如权利要求33所述的信息接收设备,
其中中间语言信息包括相应于该文本信息产生的发音符号信息,和
其中所述的信号处理装置产生至少相应于发音符号信息的话音合成的信息。
36.如权利要求35所述的信息接收设备,
其中中间语言信息至少包括音调/重音信息和音频音量信息之一,和
其中所述的信号处理装置产生相应于至少该发音符号信息和至少该音调/重音信息以及该音频音量信息的话音合成信息。
37.如权利要求36所述的信息接收设备,
其中中间语言信息包括用于相应于发音符号信息的话音处理的命令信息,和
其中所述的信号处理装置产生相应于该发音符号信息和该命令信息的话音合成信息。
38.如权利要求37所述的信息接收设备,
其中所述中间语言信息包括表示命令信息的定界的定界信息,和
其中所述的信号处理装置转换用于相应于该定界信息是否存在的话音合成信息的产生操作。
39.一种信息发送和接收方法,包括步骤:
产生中间语言信息作为相应于提供的文本信息的读出信息;
(b)至少组合在步骤A产生的中间语言信息和提供的文本信息并产生发送信息;
(c)发送在步骤(b)产生的发送信息;
(d)接收在步骤(c)发送的发送信息;
(e)将在步骤(d)接收的发送信息至少分成文本信息和中间语言信息;
(f)显示在步骤(e)分出的文本信息;和
(g)产生并输出相应于在步骤(e)分出的中间语言信息的话音合成的信息。
40.如权利要求39所述的信息发送和接收方法,
其中通过以将定界该文本信息和中间语言信息的定界信息加入到发送信息这种方式产生发送信息执行步骤(b)。
41.如权利要求40所述的信息发送和接收方法,
其中通过以将表示中间语言信息的结束位置的定界信息加入到发送信息这种方式产生发送信息执行步骤(b)。
42.如权利要求41所述的信息发送和接收方法,
其中通过以将首部放置在发送信息的开始,而将尾部标记放置在发送信息的末尾这种方式产生发送信息执行步骤(b)。
43.如权利要求39所述的信息发送和接收方法,
其中通过产生相应于提供的文本信息的发音符号信息执行步骤(a)。
44.如权利要求43所述的信息发送和接收方法,
其中通过至少产生音调/重音信息和音频音量信息之一并组合产生的发音符号信息和至少音调/重音信息与音频音量信息之一来执行步骤(a)以便产生中间语言信息。
45.如权利要求39所述的信息发送和接收方法,
其中通过产生相应于提供的文本信息的发音符号信息并产生用于相应于发音符号信息的话音处理的命令信息来执行步骤(a)。
46.如权利要求45所述的信息发送和接收方法,
其中的命令信息至少包括话音速度信息,基准间隔信息和基准音频音量信息之一,该话音速度信息用于相应于发音符号信息的话音处理。
47.如权利要求46所述的信息发送和接收方法,
其中通过产生表示该命令信息的定界的定界信息来执行步骤(a)。
48.如权利要求47所述的信息发送和接收方法,
其中通过产生定界作为读出信息的中间语言信息的另一个定界信息来执行步骤(a)。
49.如权利要求39所述的信息发送和接收方法,还包括步骤:
(h)产生文本信息作为其每个单元。
50.如权利要求49所述的信息发送和接收方法,
其中通过检测文本数据定界参数来执行步骤(h)以便产生文本信息作为其每个单元。
51.如权利要求39所述的信息发送和接收方法,
其中通过分出相应于该定界信息的文本信息和中间语言信息来执行步骤(e)。
52.如权利要求51所述的信息发送和接收方法,
其中通过产生相应于提供的文本信息的发音符号信息来执行步骤(a),和
其中通过产生相应于至少该发音符号信息的话音合成信息来执行步骤(g)。
53.如权利要求52所述的信息发送和接收方法,
其中通过至少产生音调/重音信息和音频音量信息之一来执行步骤(a),和
其中通过产生相应于至少该发音符号信息和至少该音调/重音信息与该音频音量信息之一的话音合成信息来执行步骤(g)。
54.如权利要求52所述的信息发送和接收方法,
其中通过产生用于相应于发音符号信息的话音处理的命令信息来执行步骤(a),和
其中通过产生相应于该发音符号信息和该命令信息的话音合成信息来执行步骤(g)。
55.如权利要求54所述的信息发送和接收方法,
其中通过产生表示该命令信息的定界的定界信息来执行步骤(a),和
其中通过转换用于相应于该定界信息是否存在的话音合成信息的产生操作来执行步骤(g)。
56.如权利要求39所述的信息发送和接收方法,
其中通过产生多种类型的定界信息和将产生的多种类型的定界信息加入到文本信息与中间语言信息来执行步骤(a)以便产生发送信息,和
其中通过确定该接收的发送信息是否是该多种类型的定界信息来执行步骤(a)以便分出文本信息和中间语言信息。
57.如权利要求56所述的信息发送和接收方法,
其中多种类型的定界信息是第一定界信息和第二定界信息,该第一定界信息定界至少该文本信息和中间语言信息,该第二定界信息定界中间语言信息作为一条读出信息。
58.如权利要求56所述的信息发送和接收方法,
其中所述的中间语言信息产生装置产生相应于提供的文本信息的发音符号信息并为相应于该发音符号信息的话音处理产生命令信息来执行步骤(a),该多种类型的定界信息包括表示命令信息的定界的定界信息。
CN99100866A 1998-01-14 1999-01-14 信息发送和接收装置以及信息发送和接收方法 Pending CN1235458A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP5538/98 1998-01-14
JP553898 1998-01-14
JP72811/98 1998-03-20
JP10072811A JPH11265195A (ja) 1998-01-14 1998-03-20 情報配信システム、情報送信装置、情報受信装置、情報配信方法

Publications (1)

Publication Number Publication Date
CN1235458A true CN1235458A (zh) 1999-11-17

Family

ID=26339504

Family Applications (1)

Application Number Title Priority Date Filing Date
CN99100866A Pending CN1235458A (zh) 1998-01-14 1999-01-14 信息发送和接收装置以及信息发送和接收方法

Country Status (6)

Country Link
EP (1) EP0930767A3 (zh)
JP (1) JPH11265195A (zh)
KR (1) KR19990067832A (zh)
CN (1) CN1235458A (zh)
ID (1) ID21690A (zh)
TW (1) TW437208B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1946065B (zh) * 2005-10-03 2012-01-11 纽昂斯通讯公司 通过可听信号来注释即时消息的方法和系统
CN105340004A (zh) * 2013-06-28 2016-02-17 谷歌公司 用于发音学习的计算机实现的方法、计算机可读介质和系统

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3620787B2 (ja) * 2000-02-28 2005-02-16 カナース・データー株式会社 音声データの符号化方法
CN1159702C (zh) 2001-04-11 2004-07-28 国际商业机器公司 具有情感的语音-语音翻译系统和方法
KR100443046B1 (ko) * 2002-04-30 2004-08-04 (주) 코아보이스 음성합성 서비스의 요금 책정을 위한 시스템 및 서비스 방법
US7865365B2 (en) 2004-08-05 2011-01-04 Nuance Communications, Inc. Personalized voice playback for screen reader
JP6003115B2 (ja) * 2012-03-14 2016-10-05 ヤマハ株式会社 歌唱合成用シーケンスデータ編集装置および歌唱合成用シーケンスデータ編集方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5384893A (en) * 1992-09-23 1995-01-24 Emerson & Stern Associates, Inc. Method and apparatus for speech synthesis based on prosodic analysis
DE69327774T2 (de) * 1992-11-18 2000-06-21 Canon Information Syst Inc Prozessor zur Umwandlung von Daten in Sprache und Ablaufsteuerung hierzu
WO1994017518A1 (en) * 1993-01-21 1994-08-04 Apple Computer, Inc. Text-to-speech system using vector quantization based speech encoding/decoding
CA2119397C (en) * 1993-03-19 2007-10-02 Kim E.A. Silverman Improved automated voice synthesis employing enhanced prosodic treatment of text, spelling of text and rate of annunciation
JPH086591A (ja) * 1994-06-15 1996-01-12 Sony Corp 音声出力装置
JPH09251300A (ja) * 1996-03-18 1997-09-22 Oki Electric Ind Co Ltd テキスト音声変換装置
KR970064509U (ko) * 1996-05-10 1997-12-11 문자다중방송용 텔레비전에서의 text음성송출장치

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1946065B (zh) * 2005-10-03 2012-01-11 纽昂斯通讯公司 通过可听信号来注释即时消息的方法和系统
CN105340004A (zh) * 2013-06-28 2016-02-17 谷歌公司 用于发音学习的计算机实现的方法、计算机可读介质和系统
CN105340004B (zh) * 2013-06-28 2019-09-10 谷歌有限责任公司 用于发音学习的计算机实现的方法、计算机可读介质和系统

Also Published As

Publication number Publication date
TW437208B (en) 2001-05-28
ID21690A (id) 1999-07-15
EP0930767A3 (en) 2003-08-27
KR19990067832A (ko) 1999-08-25
JPH11265195A (ja) 1999-09-28
EP0930767A2 (en) 1999-07-21

Similar Documents

Publication Publication Date Title
CN1197351C (zh) 图像合成装置
CN1311679C (zh) 数据的发送/接收设备及发送/接收方法
CN1121675C (zh) 数据通信系统的数据变换装置
CN1303581C (zh) 具有语音合成功能的信息处理装置及方法
CN1306795C (zh) 发送设备、接收设备及方法
CN1108059C (zh) 数据变换装置
CN1223983C (zh) 乐音语音再现装置及其控制方法、及服务器装置
CN1214614C (zh) 图像处理方法、图像处理装置及记录媒体
CN1222162C (zh) 数字广播系统以及数字视频记录再生装置
CN1271547C (zh) 图像数据通信系统、服务器系统和控制方法
CN1906660A (zh) 语音合成装置
CN1208288A (zh) 用于视听设备的信号处理及声象定位装置和方法
CN1105464A (zh) 能识别口述命令的交互式计算机系统
CN1204810A (zh) 遥控方法、服务器及记录介质
CN1014845B (zh) 在结构式文件中制作、扩展及收缩组元标记的技术
CN1558348A (zh) 将基于模式的分级数据结构转换成平面数据结构的方法以及系统
CN1749958A (zh) 使用形状的公用图表
CN1228866A (zh) 语音处理系统及方法
CN1677387A (zh) 信息处理装置和方法及程序
CN1731391A (zh) 布局处理方法、信息处理装置
CN1655112A (zh) 文档输出方法和文档输出系统
CN1752963A (zh) 文档信息处理设备、文档信息处理方法及处理程序
CN1771724A (zh) 活动画面处理装置、信息处理装置及其程序
CN1416276A (zh) 中间数据接收装置、方法、程序和记录媒体以及发送装置、传输方法
CN1813285A (zh) 语音合成设备、语音合成方法和程序

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication