CN101009094B - 支持发音信息编辑的系统和方法 - Google Patents

支持发音信息编辑的系统和方法 Download PDF

Info

Publication number
CN101009094B
CN101009094B CN2007100044550A CN200710004455A CN101009094B CN 101009094 B CN101009094 B CN 101009094B CN 2007100044550 A CN2007100044550 A CN 2007100044550A CN 200710004455 A CN200710004455 A CN 200710004455A CN 101009094 B CN101009094 B CN 101009094B
Authority
CN
China
Prior art keywords
pronunciation information
phrase
target text
pronunciation
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007100044550A
Other languages
English (en)
Other versions
CN101009094A (zh
Inventor
宇田哲也
北川裕介
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101009094A publication Critical patent/CN101009094A/zh
Application granted granted Critical
Publication of CN101009094B publication Critical patent/CN101009094B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

一种用于支持指明文本读音的发音信息进行编辑的系统,包括采集单元,用于采集将要对其产生发音信息的目标文本、根据所述目标文本中的符号表示产生的发音信息以及所述目标文本中包含的短语的候选词性;显示控制单元,用于优先于与所述目标文本相关联的其他短语的发音信息,显示具有专有名词作为候选词性的短语的发音信息;以及纠正处理单元,用于响应用户的指令纠正所显示的发音信息,并与所述目标文本相关联地在记录设备中记录所纠正的发音信息。本发明能够高效地产生文本的读音。

Description

支持发音信息编辑的系统和方法
技术领域
本发明涉及支持编辑的系统,更确切地说,涉及支持编辑加入到文本的发音信息的系统。
背景技术
近年来已经使用了通过使用计算机根据文本产生发音信息的若干技术。这些技术具有广泛的可应用性。例如,它们不仅可以应用于文本阅读,也可以支持带字幕的电视广播。不过,一直难以不出差错地对文本中包含的全部短语产生发音信息。例如,某人名字中附带有敬语头衔“san”的日文汉字“東”在某些情况下可以读为“higashi-san”,在其他情况下读为“azumasan”。即便使用已知的语形学分析或语境分析,也难以确定这样的人名的正确读音。此外,人名的不正确读音往往很容易令听者不快或不安。
[专利文献1]日本已公开专利申请9-171392
发明内容
[本发明要解决的问题]
结果,常规情况下,校对者已经检验了由计算机产生的发音信息并进行了必要的纠正。例如,专利文献1提出了如下技术:向校对者提供与计算机的交互用户界面,以便对发音信息进行纠正。不过,在所提出的技术中,文本量大时对校对者施加了巨大的工作量。另外,为了严格地纠正人名的错误,校对者必须具有足够的技能和背景知识。
所以,本发明的目的是提供一种系统、一种程序和一种方法,能够解决上述问题。通过组合附带的权利要求书中所介绍的特征而实现所述目的。相关的权利要求进一步定义了有益的实施例。
[解决问题的手段]
为了解决所述问题,本发明的第一方面提供了支持发音信息编辑的系统、使信息处理系统用作所述系统的程序以及由所述系统支持发音信息编辑的方法。所述系统包括采集单元、显示控制单元和纠正处理单元。采集单元采集将要对其产生发音信息的目标文本、根据所述目标文本中的符号表示产生的发音信息以及所述目标文本中包含的短语的候选词性。显示控制单元优先于与所述目标文本相关联的其他短语的发音信息,显示具有专有名词作为候选词性的短语的发音信息。纠正处理单元响应用户的指令纠正所显示的发音信息,并与所述目标文本相关联地在记录设备中记录所纠正的发音信息。
为了解决所述问题,本发明的第二方面提供了支持发音信息编辑的系统、使信息处理系统用作所述系统的程序以及由所述系统支持发音信息编辑的方法。所述系统包括采集单元、显示控制单元和纠正处理单元。采集单元采集将要对其产生发音信息的目标文本、根据所述目标文本中的符号表示产生的发音信息以及对所述目标文本中包含的每个短语计算出的发音信息的准确度。显示控制单元优先于与所述目标文本相关联的具有较高发音信息准确度的短语的发音信息,显示具有较低发音信息准确度的短语的发音信息。纠正处理单元响应用户的指令纠正所显示的发音信息,并与所述目标文本相关联地在记录设备中记录所纠正的发音信息。
[本发明的优点]
根据本发明,能够比过去更有效地产生文本的读音。
附图说明
图1展示了编辑支持系统10的一般结构;
图2展示了目标文本20的实例;
图3展示了词典存储单元50中数据结构实例;
图4展示了显示控制单元310显示的第一个实例;
图5展示了显示控制单元310显示的第二个实例;
图6展示了显示控制单元310显示的第三个实例;
图7是流程图,显示了由编辑支持系统10产生发音信息的过程;
图8展示了图7中步骤S720的过程细节;
图9展示了图8中步骤S800的过程细节;
图10展示了图9之后过程的细节;
图11展示了用作编辑支持系统10的信息处理装置600的硬件配置实例。
具体实施方式
[本发明的优选实施例]
现在将参考实施例介绍本发明,实施例并非试图限制权利要求书中定义的本发明的范围。
图1展示了编辑支持系统10的一般结构。编辑支持系统10包括发音信息编辑设备30、发音信息记录设备50、语言处理单元40和词典存储单元50,并致力于支持对指明文本发音的发音信息的编辑。发音信息编辑设备30采集将要对其产生发音信息的目标文本20。语言处理单元40通过语言处理,比如语形学分析,根据目标文本20的符号表示产生发音信息。发音信息是指明如何读文本的信息,并能够包含重音以及元音和辅音。为了产生发音信息,使用了词典存储单元50。词典存储单元50存储着词典,其中对多个短语中的每一个都记录着该短语的符号表示、发音信息和词性。注意,每个短语都可以包括至少一个字。语言处理单元40从目标文本20的起点开始扫描目标文本20的符号表示,从而搜索词典存储单元50中的多个短语,其中每个都具有与目标文本20的某个部位匹配的符号表示。
如果在词典中登记了具有同一符号表示的多个短语,或者如果存在着短语分离的多个候选者,目标文本20就可能匹配短语的多种组合。在这样的情况下,语言处理单元40根据跟在具有给定词性的短语后面的具有相应词性的短语的概率,选择最可能的短语的组合。语言处理单元40可以对每个短语计算发音信息的准确度,以便选择最可能的短语的组合。在这种情况下,语言处理单元40可以选择算出的准确度之和最大或平均值最高的短语组合。语言处理单元40向发音信息编辑设备30输出所选定的短语组合对应的发音信息的组合。
发音信息编辑设备30包括采集单元300、显示控制单元310和纠正处理单元320。采集单元300从外部采集目标文本20,将目标文本20输出到语言处理单元40,并使语言处理单元40产生目标文本20的发音信息。采集单元300从语言处理单元40采集所产生的发音信息。采集单元300从语言处理单元40采集目标文本20中包含的每个短语的候选词性,它在发音信息的产生过程中已经产生。采集单元300也可以从语言处理单元40采集目标文本20中包含的每个短语多个候选发音信息,它们在发音信息的产生过程中已经产生。采集单元300也可以从语言处理单元40采集每个短语发音信息的准确度。采集单元300采集的目标文本20也可以包括插入到各个位置的标点符号,这些标点符号已经作为词性的分析结果被确定为语句分隔符。
显示控制单元310向用户显示与目标文本20相关联的、目标文本20中包含的每个短语的发音信息。显示控制单元310显示某个短语的发音信息,该短语具有专有名词(尤其是人名)作为候选词性,优先于其他短语的发音信息。例如,时于具有专有名词作为其候选词性的短语,显示控制单元310可以用下划线显示该短语的发音信息,而显示其他短语的发音信息时没有下划线。显示控制单元310也可以,显示具有较低发音信息准确度的某个短语的发音信息。例如,显示控制单元310可以用下划线显示其发音信息具有的准确度低于预定参考值的短语。
纠正处理单元320响应用户的指令纠正所显示的发音信息,并与所述目标文本20相关联地在发音信息记录设备35中记录所纠正的发音信息。响应纠正处理单元320执行的对发音信息的纠正,显示控制单元310向用户显示所纠正的发音信息以取代原始的发音信息。
图2展示了将要从其产生发音信息的目标文本20的实例。目标文本20是其中排列着若干字和符号,比如标点符号的数据。具体地说,图2中所展示的目标文本20是有关外野手铃木秀喜的新闻报导。该新闻报导报告了该外野手何时、何地及如何行动以及发现了什么是行为的结果。目标文本20仅仅包含了人名的符号表示(如“铃木秀喜外野手”),而不包含指明专有名词发音的信息。同样,目标文本20仅仅包含了普通名词的符号表示(如“指名打者”),而不包含指明该普通名词发音的信息。目标文本20可能包含图表或简图,比如指明棒球赛记分牌的图表。目标文本20可以通过外部通信网络比如因特网采集,也可以由用户输入。
图3展示了词典存储单元50的数据结构实例。词典存储单元50存储着根据符号表示产生发音信息所用的词典。该词典对先前已经登记的多个短语中的每一个都记录着该短语的符号表示、发音信息和词性。例如,“秀喜”的符号表示已经被登记为与“ひでき(hideki)”、“ひでよし(hideyoshi)”、“ひでのぶ(hidenobu)”和“しゆ一き(shuhki)”的发音信息相关联。符号表示“秀喜”与发音信息“ ひでき”的组合已经被登记为与专有名词尤其是人名相关联。符号表示“秀喜”与发音信息“しゆ一き”的组合已经被登记为与普通名词相关联。以这种方式,词典可以记录具体的符号表示与多个不同的发音信息和多个不同的词性相关联。
在该词典中,符号表示“島”已经被记录为与发音信息“しま(shima)”相关联,并且没有与其他发音信息相关联。以这种方式,该词典可以记录具体的符号表示与仅仅一个发音信息相关联。符号表示“監督”已经被记录为与普通名词相关联,符号表示“受け”已经被记录为与动词相关联。以这种方式,该词典可以记录若干符号表示除了与专有名词相关联以外,也与各种词性相关联。虽然在图3中发音信息由表音符号比如日文中的平假名表示,但是发音信息也可以由预定的音标和重音标记表示。
图4展示了显示控制单元310显示的第一个实例。显示控制单元310显示发音信息“すずき(suzuki)”与短语“铃木”相关联。由于短语“铃木”具有专有名词作为候选词性,显示控制单元310通过对短语“铃木”进行双下划线而优先于其他短语的发音信息显示发音信息“すずき”。显示控制单元310显示发音信息“しゆ一き”与短语“秀喜”相关联。发音信息“しゆ一き”已经被登记为与普通名词相关联,而符号表示“秀喜”也已经被登记为与专有名词相关联。短语“秀喜”具有专有名词作为候选词性,所以显示控制单元310通过对短语“秀喜”进行双下划线而优先于其他短语的发音信息显示发音信息“しゆ一き”。
除了图4中展示的下划线显示以外,优选的显示方式可以是明显的颜色显示。作为替代,显示控制单元310也可以仅仅显示优选的短语的发音信息列表,而不显示其他短语的发音信息。无论在哪种情况下,都能够仅仅突出地显示不正确概率高的发音信息,这能够减小用户的工作量。
优选情况下,显示控制单元310可以优先于仅仅在词典中登记了一个发音信息的短语的发音信息,显示具有在词典中登记的多个发音信息的某个短语的发音信息。例如,由于短语“秀喜”已经被登记为与多个发音信息相关联,所以显示控制单元310通过提供围绕发音信息“しゆ一き”的方框,优先显示发音信息“しゆ一き”。反之,由于短语“铃木”已经被登记为与仅仅一个发音信息相关联,所以显示控制单元310显示发音信息“すずき”时不提供方框。所以能够进一步突出地显示不正确概率较高的发音信息。
显示控制单元310可以优先于已经被登记的短语的发音信息显示词典中没有登记的短语(后文中称为“未知短语”)的发音信息。例如,由于短语“MRI”在词典中没有登记,所以该短语以下划线显示。结果,发音信息“えむあ一ゐあい(emuahruai)”  优先于没有下划线的短语的发音信息(如“ぴよ一いん(byohin)”)显示。通过对短语“MRI”提供单下划线,与对短语“秀喜”和“铃木”提供双下划线对照,显示控制单元310能够明显地显示未知短语的发音信息和具有专有名词作为候选词性的短语的发音信息。所以,用户能够直观地认识到为什么容易出现不正确的读音的原因。
此外,显示控制单元310可以优先于具有较高发音信息准确度的短语的发音信息,显示某个具有较低发音信息准确度的短语的发音信息。例如,由于短语“1日”的发音信息“ついたち(tsuitachi)”具有的准确度低于参考值,显示控制单元310通过向短语“ 1日”提供虚线,优先地显示发音信息“ついたち”。反之,由于短语“病院”的发音信息“ぴよ一いん”具有的准确度高于参考值,显示控制单元310显示发音信息“ぴよ一いん”时不向短语“病院”提供下划线。所以能够突出地显示其发音信息准确度较低的短语。
在图4展示的第三行的尾端,由语言处理单元40在“良けれぽ”和“指名打者”之间插入了逗号。插入逗号的位置可以是由语言处理单元40确定为意义分隔处。如果在目标文本20中存在着众多的接连短语而没有任何标点符号,语言处理单元40就在意义分隔处插入逗号,以增强目标文本20读音的聆听舒适。在这种情况下,因为逗号的位置不是由产生目标文本20的人确定,所以该位置可能不自然,因此可能与他的意图不同。换言之,逗号的位置误差暗示了语言处理单元40所进行分析的误差,这往往与发音信息的误差有关。所以,显示控制单元310优先于其他短语的发音信息显示邻近逗号短语的发音信息。在图4中展示的实例中,显示控制单元310以波形线显示邻近逗号的短语“良けれぽ”和“指名打者”。
显示控制单元310可以优先于其他短语的发音信息显示与预定格式(如棒球赛记分牌)匹配的格式化数据的发音信息。当这样的格式化数据的字符按原样读出时,可能难以理解其意义。以波形线等区分这样的格式化数据能够引起用户的注意。
图5展示了显示控制单元310显示的第二个实例。显示控制单元310显示出响应用户的操作在显示屏幕上移动的光标。光标可以在显示屏幕上移动,以响应通过定点设备(如鼠标)的操作。例如,用户将光标置于短语的发音信息处并进行点击或键盘操作以选择该短语的发音信息作为将要操作的目标。显示控制单元310可以为将要操作的短语的显示候选发音信息,以响应接收用户的纠正操作。在图5展示的实例中,用户选择短语“秀喜”,从而使显示控制单元310显示短语“秀喜”对应的全部候选发音信息的列表。也就是说,除了发音信息“しゆ一き”以外,显示控制单元310还显示“ひでき”、“ひでよし”和“ひでのぶ”,它们已经被登记在词典存储单元50中作为候选者。
图6展示了显示控制单元310显示的第三个实例。响应由纠正处理单元320响应用户的指令而进行的纠正,显示控制单元310显示纠正后的发音信息以取代未纠正的发音信息。在图6展示的实例中,纠正处理单元320将第三行上短语“秀喜”的发音信息纠正为发音信息“ひでき”,从而使显示控制单元310显示纠正后的发音信息“ひでき”以取代未纠正的发音信息しゆ一き”。响应对具体短语发音信息的纠正,纠正处理单元320也可以纠正目标文本20中具有与该具体短语相同符号表示的其他短语的发音信息,所以其他短语的发音信息与该具体短语的发音信息一致。在图6展示的实例中,响应对第三行上短语“秀喜”的发音信息的纠正,纠正处理单元320将第一行上短语“秀喜”的发音信息纠正为发音信息“ひでき”。在这种情况下,显示控制单元310可以显示第一行上短语“秀喜”的纠正后发音信息,所以它与第三行上短语“秀喜”的发音信息一致。
如果目标文本20涉及多个主题,纠正处理单元320就可以将在一个主题中所进行纠正的结果仅仅反映在该主题中的短语上,而不将该结果反映在其他主题中的短语上。换言之,响应对一个主题中具体短语发音信息的纠正,纠正处理单元320可以纠正同一主题中与该具体短语具有相同符号表示的其他短语的发音信息,从而使其发音信息与该具体短语的发音信息一致。通过在目标文本20中嵌入指明主题分隔的预定标记等,能够容易地区分主题分隔。
图7是流程图,显示了由编辑支持系统10产生发音信息的过程。语言处理单元40根据目标文本20中的符号表示产生发音信息(步骤S700)。采集单元300不仅采集所产生的发音信息,也采集词典存储单元50中关于每个短语登记的候选发音信息和候选词性(步骤S710)。显示控制单元310和纠正处理单元320显示发音信息,纠正发音信息以响应用户的指令,并在发音信息记录设备35中记录所纠正的发音信息(步骤S720)。
图8展示了图7中步骤S720的过程细节。显示控制单元310显示发音信息(步骤S800)。如果纠正处理单元320尚未接收用户的指令(步骤S810中为否),显示控制单元310就继续显示相同的发音信息(步骤S800)。如果纠正处理单元320已经接收用户的指令(步骤S810中为是),纠正处理单元320就响应用户的指令,判断将要操作的短语是否具有多个候选发音信息(步骤S820)。如果存在着多个候选者(步骤S820中为是),纠正处理单元320就显示多个候选发音信息(步骤S830)。
随后,纠正处理单元320判断时将要操作的短语是否已经输入了新的发音信息(步骤S840)。如果已经接收了新的发音信息(步骤S840中为是),纠正处理单元320就根据输入纠正发音信息并在发音信息记录设备35中记录所纠正的信息(步骤S850)。纠正处理单元320纠正目标文本20中具有与将要操作的短语相同符号表示的其他短语的发音信息,从而使其发音信息与将要操作的短语的发音信息一致(步骤S860)。如果纠正处理单元320接收完成纠正的指令(步骤S870中为是),就完成步骤S720的过程。如果纠正处理单元320未接收该指令(步骤S870中为否),纠正处理单元320就使过程返回步骤S800以显示纠正后的发音信息。
图9展示了图8中步骤S800的过程细节。如果具体短语具有人名作为候选词性(步骤S900中为是),显示控制单元310就以双下划线显示具体短语(步骤S910)。在这个实施例中,具体短语是否具有人名作为候选词性由语言处理单元40判断。不过,发音信息编辑设备30可以取代语言处理单元40来对此进行判断。具体地说,发音信息编辑设备30可以从目标文本20中检测专有名词的后缀,比如“選手”、“容疑者”、“社”或“駅”,并判定该后缀之前的短语具有人名作为候选词性。
如果具体短语是未知短语(步骤S920中为是),显示控制单元310就以下划线显示具体短语(步骤S930)。未知短语可能是由字母和数字以及/或者符号的字符串表示的产品名称。如果由语言处理单元40产生的具体短语发音信息的准确度处于或低于参考值(步骤S940中为是),显示控制单元310就以虚线显示具体短语(步骤S950)。如果该具体短语满足倾向于导致不准确读音的预定条件(步骤S960中为是),显示控制单元310就以波形线显示具体短语(步骤S970)。
预定条件可以是紧跟由语言外理单元40所产生逗号的短语的布置,或者是与预定格式匹配的格式化数据。此外,预定条件也可以是符号表示与定义为其发音信息容易不正确的预定短语的匹配。具体地说,符号表示“行つた”可以读作“いつた(itta)”,也可以读作“おこなつた(okonatta)”。此外,符号表示“降り”可以读作“ふり(huri)”,也可以读作“おり(ori)”。发音信息编辑设备30可以预先存储其读音倾向于不正确的此类短语的符号表示,显示控制单元310以下划线显示其符号表示与所存储的符号表示之一匹配的短语。
图10展示了图9中过程之后过程的细节。如果具体短语多个候选词性已经被登记在词典存储单元50中(步骤S1000中为是),显示控制单元310就以围绕发音信息的方框显示该具体短语(步骤S1010)。词典存储单元50可以存储被定义为复合词的预定短语的发音信息。复合词可以是“山田首相”、“佐藤法相”等,其读音分别是“やまだしゆしよぅ(yamadashushou)”和“さとうほうしよう(satouhoushou)”。大多数情况下复合词的读音与登记的读音无异。所以,如果以下划线等优先显示的短语已经被登记为复合词(步骤S1020中为是),显示控制单元310就取消优先显示(步骤S1030)。所以能够进一步突出地仅仅显示容易将要误读的短语。
图11展示了用作编辑支持系统10的信息处理装置600的硬件配置实例。信息处理装置600包括中央处理单元(CPU)外围部分、输入/输出部分和传统输入/输出部分。CPU外围部分包括CPU 1000、随机存取存储器(RAM)1020和图形控制器1075,它们通过主机控制器1082互连。输入/输出部分包括通讯接口1030、硬盘驱动器1040和CD-ROM驱动器1060,它们通过输入/输出控制器1084连接到主机控制器1082。传统输入/输出部分包括BIOS 1010、软盘驱动器1050和输入/输出芯片1070,它们连接到输入/输出控制器1084。
主机控制器1082将RAM 1020连接到CPU 1000和图形控制器1075,它们以高传输速率访问RAM1020。CPU 1000根据BIOS 1010和RAM 1020中存储的程序运行并控制每个单元。图形控制器1075从RAM 1020内帧缓冲器中获得由CPU 1000等产生的图像数据,并且在显示设备1080上显示图像数据。作为替代,图形控制器1075也可以包括帧缓冲器,存储由其中CPU 1000等产生的图像数据。
输入/输出控制器1084把主机控制器1082连接到通讯接口1030、硬盘驱动器1040和CD-ROM驱动器1060,它们是操作速度相对较高的输入/输出设备。通讯接口1030通过网络与外部设备通讯。硬盘驱动器1040存储着信息处理装置600的CPU 1000使用的程序和数据。CD-ROM驱动器1060从CD-ROM 1095读取程序或数据,并且将它向RAM 1020和/或硬盘1040提供。
输入/输出控制器1084也连接到BIOS 1010和操作速度相对低的输入/输出设备,比如软盘驱动器1050和输入/输出芯片1070。BIOS1010存储着在信息处理装置600启动时由CPU 1000所执行的引导程序以及依赖于信息处理装置600硬件的其他程序。软盘驱动器1050从软盘1090读取程序或数据,并且通过输入/输出芯片1070将它向RAM 1020和/或硬盘驱动器1040提供。输入/输出芯片1070以若干端口比如并行端口、串行端口、键盘端口和鼠标端口连接到软盘驱动器1050和多种输入/输出设备。
将向信息处理装置600提供的程序由用户通过存储程序的记录介质提供,比如软盘1090、CD-ROM1095和IC卡。通过输入/输出芯片1070和/或输入/输出控制器1084从记录介质读取程序,安装在信息处理装置600上并执行。由于该程序使信息处理装置600执行的操作无异于图1至图10中展示的编辑支持系统10的操作,所以省略了关于它的介绍。
以上介绍的程序可以存储在外部存储介质中。除了软盘1090和CD-ROM 1095之外,存储介质可以是光记录介质比如DVD或PD、磁光盘比如MD、磁带介质以及半导体存储器比如IC卡。可以使用存储设备比如在连接到私有通讯网络或因特网的服务器系统中所提供的硬盘和RAM作为记录介质,通过网络向信息处理装置600提供程序。
虽然已经通过参考实施例介绍了本发明,但是应当理解,本发明的技术范围不限于所公开的实施例。显然本领域的普通技术人员可以对实施例应用多种修改和改进。显然,根据权利要求书,应用了这样的修改和改进的实施例能够包括在本发明的技术范围内。

Claims (13)

1.一种用于支持对表明文本发音的发音信息进行编辑的系统,所述系统包括:
采集单元,用于采集将要对其产生发音信息的目标文本、根据所述目标文本中的符号表示产生的发音信息以及所述目标文本中包含的短语的候选词性;
显示控制单元,用于相对于与所述目标文本相关联的其他短语的发音信息,优先显示具有专有名词作为候选词性的短语的发音信息;以及
纠正处理单元,用于响应用户的指令纠正所显示的发音信息,并与所述目标文本相关联地在记录设备中记录所纠正的发音信息。
2.根据权利要求1的系统,其中,所述采集单元为每个短语至少采集一个候选发音信息,所述发音信息是根据所述目标文本中的符号表示产生的,以及
其中,所述显示控制单元响应所述纠正处理单元接收用户的纠正指令,显示将要操作的短语的候选发音信息。
3.根据权利要求2的系统,进一步包括:
词典存储单元,用于存储词典,其中若干短语的符号表示与所述短语的发音信息相关联地记录,以便根据所述目标文本中的所述符号表示产生所述发音信息,
其中所述采集单元从所述词典中采集所述候选发音信息,以及
所述显示控制单元进一步用于,相对于在所述词典中仅仅登记有一个发音信息的短语的发音信息,优先显示在所述词典中登记有多个发音信息的短语的至少一个发音信息。
4.根据权利要求1的系统,其中,在短语具有人名作为候选词性的条件下,所述显示控制单元进一步用于,相对于其他短语的发音信息,优先显示所述短语的发音信息。
5.根据权利要求1的系统,进一步包括:
词典存储单元,用于存储词典,其中若干短语的符号表示与所述短语的发音信息相关联地记录,以便根据所述目标文本中的所述符号表示产生所述发音信息,
其中所述显示控制单元进一步用于,相对于在所述词典中已经登记的短语的发音信息,优先显示在所述词典中没有登记的短语的发音信息。
6.根据权利要求5的系统,其中,所述显示控制单元突出地显示在所述词典中没有登记的短语的发音信息和具有人名作为候选词性的短语的发音信息。
7.根据权利要求5的系统,其中,所述词典进一步登记预定作为复合词的短语的发音信息,以及
所述显示控制单元进一步用于,相对于作为复合词登记的短语的发音信息,优先显示其他短语的发音信息。
8.根据权利要求1的系统,其中,所述纠正处理单元响应对第一个短语发音信息的纠正,纠正具有与所述第一个短语的符号表示相同符号表示的第二个短语的发音信息,从而使所述第二个短语的发音信息与所述第一个短语的发音信息一致,并且在所述记录设备中记录所述纠正的发音信息,以及
其中,所述显示控制单元响应对所述第一个短语发音信息的所述纠正,纠正具有与所述第一个短语的符号表示相同符号表示的所述第二个短语的发音信息,从而使所述第二个短语的发音信息与所述第一个短语的发音信息一致,并且显示所述纠正的发音信息。
9.根据权利要求1的系统,其中,所述采集单元采集包括插入的逗号的所述目标文本,插入逗号的位置作为所述词性的分析结果被确定为意义分隔处,以及
所述显示控制单元进一步用于,相对于其他短语的发音信息,优先显示邻近所述逗号的短语的发音信息。
10.根据权利要求1的系统,其中,所述显示控制单元进一步用于,相对于其他短语的发音信息,优先显示与预定格式匹配的格式化数据的发音信息。
11.根据权利要求1的系统,其中,所述采集单元进一步采集对所述目标文本中包含的每个短语计算的发音信息的准确度,以及
所述显示控制单元进一步用于,相对于与所述目标文本相关联的具有较高发音信息准确度的短语的发音信息,优先显示具有较低发音信息准确度的短语的发音信息。
12.一种用于支持对表明文本发音的发音信息进行编辑的系统,所述系统包括:
采集单元,用于采集将要对其产生发音信息的目标文本、根据所述目标文本中的符号表示产生的发音信息以及对所述目标文本中包含的每个短语计算出的发音信息的准确度;
显示控制单元,用于相对于与所述目标文本相关联的具有较高发音信息准确度的短语的发音信息,优先显示具有较低发音信息准确度的短语的发音信息;以及
纠正处理单元,用于响应用户的指令纠正所显示的发音信息,并与所述目标文本相关联地在记录设备中记录所纠正的发音信息。
13.一种用于支持对表明文本发音的发音信息进行编辑的方法,所述方法包括如下步骤:
采集将要对其产生发音信息的目标文本、根据所述目标文本中的符号表示产生的发音信息以及所述目标文本中包含的短语的候选词性;
相对于与所述目标文本相关联的其他短语的发音信息,优先显示具有专有名词作为候选词性的短语的发音信息;以及
响应用户的指令纠正所显示的发音信息,并与所述目标文本相关联地在记录设备中记录所纠正的发音信息。
CN2007100044550A 2006-01-26 2007-01-23 支持发音信息编辑的系统和方法 Expired - Fee Related CN101009094B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006-018063 2006-01-26
JP2006018063 2006-01-26
JP2006018063A JP4859101B2 (ja) 2006-01-26 2006-01-26 テキストに付与する発音情報の編集を支援するシステム

Publications (2)

Publication Number Publication Date
CN101009094A CN101009094A (zh) 2007-08-01
CN101009094B true CN101009094B (zh) 2011-06-29

Family

ID=38454084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100044550A Expired - Fee Related CN101009094B (zh) 2006-01-26 2007-01-23 支持发音信息编辑的系统和方法

Country Status (2)

Country Link
JP (1) JP4859101B2 (zh)
CN (1) CN101009094B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5838781B2 (ja) * 2011-12-20 2016-01-06 富士通株式会社 複合語読み表示方法及びプログラム,並びに読み生成装置
JP2014191587A (ja) * 2013-03-27 2014-10-06 Fujitsu Ltd プログラム、変換方法及び情報処理装置
JP6290230B2 (ja) 2013-10-10 2018-03-07 株式会社東芝 音訳作業支援装置、音訳作業支援方法及びプログラム
JP6336749B2 (ja) * 2013-12-18 2018-06-06 株式会社日立超エル・エス・アイ・システムズ 音声合成システム及び音声合成方法
WO2015162737A1 (ja) 2014-04-23 2015-10-29 株式会社東芝 音訳作業支援装置、音訳作業支援方法及びプログラム
CN107909993A (zh) * 2017-11-27 2018-04-13 安徽经邦软件技术有限公司 一种智能语音报告生成系统
JP7320976B2 (ja) * 2019-04-18 2023-08-04 株式会社河合楽器製作所 歌詞編集装置及び歌詞編集プログラム
CN110767209B (zh) * 2019-10-31 2022-03-15 标贝(北京)科技有限公司 语音合成方法、装置、系统和存储介质
WO2023149644A1 (ko) * 2022-02-03 2023-08-10 삼성전자주식회사 전자 장치 및 사용자 언어 모델 생성 방법
CN115470753B (zh) * 2022-09-27 2024-01-02 广州优谷信息技术有限公司 导读文本显示方法、系统、装置及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3230868B2 (ja) * 1992-12-28 2001-11-19 株式会社リコー 音声合成装置
JPH06223058A (ja) * 1993-01-26 1994-08-12 Sharp Corp 日本語処理装置
JPH06308998A (ja) * 1993-04-26 1994-11-04 Nippon Telegr & Teleph Corp <Ntt> 音声読み上げ装置
JPH0773174A (ja) * 1993-06-29 1995-03-17 Texas Instr Inc <Ti> 日本語処理システム
JP3483230B2 (ja) * 1995-10-20 2004-01-06 株式会社リコー 発声情報作成装置
JPH11305987A (ja) * 1998-04-27 1999-11-05 Matsushita Electric Ind Co Ltd テキスト音声変換装置
JP2002207728A (ja) * 2001-01-12 2002-07-26 Fujitsu Ltd 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体
EP1237094A1 (en) * 2001-01-22 2002-09-04 Sun Microsystems, Inc. A method for determining rubies
JP2003140679A (ja) * 2001-11-06 2003-05-16 Mitsubishi Electric Corp 音声合成装置及び方法、並びに音声合成処理をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004054794A (ja) * 2002-07-23 2004-02-19 Nec Access Technica Ltd 携帯型移動通信端末器および同端末器のメール文字変換方法
JP2004139530A (ja) * 2002-10-21 2004-05-13 Osaka Gas Co Ltd 読み修正プログラム
KR100463655B1 (ko) * 2002-11-15 2004-12-29 삼성전자주식회사 부가 정보 제공 기능이 있는 텍스트/음성 변환장치 및 방법

Also Published As

Publication number Publication date
JP4859101B2 (ja) 2012-01-25
JP2007199410A (ja) 2007-08-09
CN101009094A (zh) 2007-08-01

Similar Documents

Publication Publication Date Title
CN101009094B (zh) 支持发音信息编辑的系统和方法
US7149970B1 (en) Method and system for filtering and selecting from a candidate list generated by a stochastic input method
JP4218758B2 (ja) 字幕生成装置、字幕生成方法、及びプログラム
EP1091303B1 (en) Method and system for providing alternatives for text derived from stochastic input sources
US8412524B2 (en) Replacing text representing a concept with an alternate written form of the concept
US20180143956A1 (en) Real-time caption correction by audience
US6973428B2 (en) System and method for searching, analyzing and displaying text transcripts of speech after imperfect speech recognition
JP5257330B2 (ja) 発言記録装置、発言記録方法、プログラム及び記録媒体
US7818173B2 (en) Information retrieval system, method, and program
JP4987623B2 (ja) ユーザと音声により対話する装置および方法
US20060149557A1 (en) Sentence displaying method, information processing system, and program product
US20090326938A1 (en) Multiword text correction
US20180060282A1 (en) User interface for dictation application employing automatic speech recognition
TW201312548A (zh) 自動地建立文字資料與音訊資料間之映射
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
CN1920812B (zh) 语言处理系统
KR20080031357A (ko) 대안들의 목록을 사용하는 오인된 단어들의 다시 받아쓰기
US20080077869A1 (en) Conference supporting apparatus, method, and computer program product
US11922944B2 (en) Phrase alternatives representation for automatic speech recognition and methods of use
US20070276650A1 (en) Techniques for customization of phonetic schemes
US20070277118A1 (en) Providing suggestion lists for phonetic input
JP2006030326A (ja) 音声合成装置
WO2012144525A1 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
CN110782899B (zh) 信息处理装置、存储介质及信息处理方法
JP7257010B2 (ja) 検索支援サーバ、検索支援方法及びコンピュータプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110629

Termination date: 20120123