CN102640107A - 信息处理装置 - Google Patents
信息处理装置 Download PDFInfo
- Publication number
- CN102640107A CN102640107A CN2009801626537A CN200980162653A CN102640107A CN 102640107 A CN102640107 A CN 102640107A CN 2009801626537 A CN2009801626537 A CN 2009801626537A CN 200980162653 A CN200980162653 A CN 200980162653A CN 102640107 A CN102640107 A CN 102640107A
- Authority
- CN
- China
- Prior art keywords
- character
- sound
- mentioned
- user
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title abstract 2
- 238000006243 chemical reaction Methods 0.000 claims abstract description 20
- 239000000284 extract Substances 0.000 claims abstract description 17
- 230000003750 conditioning effect Effects 0.000 claims description 48
- 238000000034 method Methods 0.000 claims description 40
- 230000009466 transformation Effects 0.000 claims description 33
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000012937 correction Methods 0.000 abstract description 18
- 238000012545 processing Methods 0.000 abstract description 9
- 238000003860 storage Methods 0.000 description 20
- 238000013507 mapping Methods 0.000 description 5
- 235000016496 Panda oleosa Nutrition 0.000 description 2
- 240000000220 Panda oleosa Species 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/018—Input/output arrangements for oriental characters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
- G06F3/04886—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures by partitioning the display area of the touch-screen or the surface of the digitising tablet into independently controllable areas, e.g. virtual keyboards or menus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
- G06F3/0236—Character input methods using selection techniques to select from displayed items
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Document Processing Apparatus (AREA)
- Character Discrimination (AREA)
Abstract
变换部102识别从用户输入的声音,变换为字符串。选择部103根据用户的指定,从上述字符串选择一个或多个字符。分割部104将所选择的上述字符变换为表音字符,并将上述表音字符分割为音单位的表音字符。生成部105从相关联地存储有音相似的多个音单位的表音字符的各个作为相似字符候补的相似字符词典,提取与所分割的音单位的上述表音字符的各个对应的上述相似字符候补,生成上述字符的订正字符候补。显示处理部106使所生成的上述订正字符候补以用户可以选择的方式显示于显示部。
Description
技术领域
本发明涉及信息处理装置。
背景技术
在识别从用户通过声音输入的语言信息并变换为字符串而显示的信息处理装置中,有用户通过手写输入修正误变换的字符串的信息处理装置。
这样的信息处理装置存储在将从用户输入的语言信息变换为字符串的过程中生成的字符串候补。在信息处理装置误变换语言信息并显示的情况下,用户指定误变换的位置的字符串。信息处理装置从所存储的字符串候补中,向用户提示针对于所指定的字符串的字符串候补。用户从所提示的字符串候补中,选择一个字符串。信息处理装置将误变换并显示的位置的字符串置换为所选择的字符串(参照专利文献1)。
专利文献1:特开2008-090625号公报
但是,在专利文献1的技术中,在误识别了从用户通过声音输入的语言信息的情况下,有时所存储的字符串候补会没有包含正确的字符串,从而用户无法选择正确的字符串,不便修正。
发明内容
本发明鉴于上述的课题而提出,目的在于使用户简便地修正由于误识别而显示的字符串。
本发明的一种方式涉及信息处理装置,其具备:变换部,其识别从用户输入的声音,变换为字符串;选择部,其根据用户的指定,从上述字符串选择一个或多个字符;分割部,其将所选择的上述字符变换为表音字符,并将上述表音字符分割为音单位的表音字符;生成部,其从存储有音相似的多个音单位的表音字符的各个作为相似字符候补的相似字符词典,提取与所分割的音单位的上述表音字符的各个对应的上述相似字符候补,生成所选择的上述字符的订正字符候补;以及显示处理部,其使所生成的上述订正字符候补以用户可以选择的方式显示于显示部。
根据本发明,用户能够简便地修正由于误识别而显示的字符串。
附图说明
图1是表示第1实施例所涉及的信息处理装置的外观的图。
图2是表示信息处理装置的结构的方框图。
图3是表示信息处理装置的字符串修正的处理的流程图的图。
图4是表示相似字符词典中存储的相似字符候补的一例图。
图5是表示相似字符词典中存储的字母的相似字符候补的图。
图6是表示第2实施例所涉及的信息处理装置的外观的图。
符号说明
101输入部,102变换部,103选择部,104分割部,105生成部,106显示处理部,107显示部。
具体实施方式
以下,参照附图详细地说明本发明的实施例。
在本说明书和各图中,对同样的要素赋予同一符号,并适宜省略详细的说明。
(第1实施例)
图1是表示第1实施例所涉及的信息处理装置10的外观的图。
信息处理装置10在将从用户输入的声音变换为字符串并显示时,由于误变换,有时可能会显示用户非预期的字符。通过来自用户对误变换的字符的指定,信息处理装置10将所指定的字符分割为音单位的表音字符。信息处理装置10将音相似的相似字符候补组合到所分割的各个表音字符,生成所指定的字符的订正候补即订正字符候补,向用户提示。
由此,例如,即使在用户期望使信息处理装置10显示“今日”而发出“きょう”的声音,但是信息处理装置10识别为“ぎょう”并变换为“行”的情况下,也可以通过用户使用触控笔203等指定“行”,而使信息处理装置10向用户提示“今日(きょう)”作为“行(ぎょう)”的订正字符候补,所以用户可以简便地将“行”修正为“今日”。
图2是表示信息处理装置10的结构的方框图。
本实施例所涉及的信息处理装置10包含:输入部101、显示部107、字符识别词典108、相似字符词典109、存储部111、控制部120。控制部120包含:变换部102、选择部103、分割部104、生成部105、显示处理部106、确定部110。
输入部101接受来自用户的声音作为输入。
变换部102使用字符识别词典108,将输入于输入部101的声音变换为字符串。
选择部103根据来自用户的指定,从变换部102所变换的字符串中选择一个或多个字符。
分割部104将选择部103所选择的字符变换为表音字符,将该表音字符分割为音单位的表音字符。音单位定义为包含音节单位和音素单位中的任一种。
生成部105检索将音相似的多个音单位的表音字符的各个相关联地进行存储的相似字符词典109,对分割部104所分割的音单位的表音字符的各个,提取音相似的相似字符候补。生成部105将所提取的相似字符候补组合,生成订正字符候补。生成部105也可以使用汉字变换词典(未图示),将订正字符候补变换为汉字,并向显示部107输出。
显示处理部106使变换部102所变换的字符串以用户可选择的方式显示于显示部107。显示处理部106使显示部107显示生成部105所生成的订正字符候补。
显示部107除了显示单元之外,还包含感压式的触摸面板等输入单元。用户可以使用触控笔203等选择显示于显示部的字符等。
变换部102、选择部103、分割部104、生成部105和显示处理部106由中央运算处理装置(CPU)实现。
字符识别词典108及相似字符词典109例如可存储于存储部111。
确定部110根据来自用户的指定,确定生成部105所生成的一个订正字符候补。
控制部120可通过读出并执行存储于存储部111等的程序,来实现信息处理装置10各部分的功能。
控制部120所进行的处理的结果也可以存储于存储部111。
图3是表示信息处理装置10的字符串修正的处理的流程图的图。
信息处理装置10的字符串修正从下述状态开始:将从用户向输入部101输入的声音通过变换部102变换为字符串,并显示于显示部107,在该情况下,用户向信息处理装置10提供了对构成所显示的字符串的一部分字符进行修正的指示。
选择部103从变换部102所变换的字符串中,将用户所指定的一个或多个字符向分割部104输出(S301)。
分割部104将选择部103所选择的字符分割为音单位的表音字符(S302)。
生成部105从相似字符词典109提取与分割部104所分割的音单位的表音字符音相似的相似字符候补(S303)。
生成部105将所提取的相似字符候补组合,生成用于向用户提示的新字符的订正候补即订正字符候补(S304)。
显示处理部106将生成部105所生成的订正字符候补显示于显示部107(S305)。
确定部110向显示处理部106输出用户所指定的一个订正字符候补(S306)。
显示处理部106将从选择部103输出的用户所指定的修正对象的字符置换为从确定部110输出的一个订正字符候补,并向显示部107输出(S307)。
通过以上的处理,用户可以简便地修正由于误识别而显示的字符串。
以下,关于信息处理装置10进行详述。
在本实施例中,说明在信息处理装置10显示了误识别为字符串“行(ぎょう)はいい天气ですね”的情况下,用户修正为字符串“今日(きょう)はいい天气ですね”的例子。
输入部101使用麦克风等接收来自用户的声音作为输入。输入部101将输入于麦克风的模拟信号的声音变换(A/D变换)为数字信号的声音数据。
变换部102接收来自输入部101的声音数据作为输入。字符识别词典108存储与声音数据对应的字符数据。变换部102使用字符识别词典108,将所输入的声音数据变换为字符串。在变换为日语的字符串的情况下,变换部102也可以变换为不仅包含平假名,而且还包含片假名和/或汉字的字符串。
例如,变换部102接收来自输入部101的声音数据作为输入,并变换为假名字符串“ぎょうはいいてんきですね”,进而变换为假名汉字混合字符串“行はいい天气ですね”。存储部111存储假名字符串和假名汉字混合字符串。
变换部102将所变换的字符串向选择部103和显示处理部106输出。
显示处理部106使变换部102所变换的字符串显示于显示部107上的字符串显示区域201。
例如,显示处理部106如图1(a)所示,使假名汉字混合字符串“行はいい天气ですね”显示于显示部107上的字符串显示区域201。用户从变换部102所变换的字符串中,指定想要修正的一个或多个字符。
例如,如图1(a)所示,用户从显示于字符串显示区域201上的字符串“行はいい天气ですね”中,使用触控笔203等指定想要修正的字符即“行”。显示部107上的来自用户的指定作为指定信号,从触摸面板经由显示处理部106向选择部103输出。
选择部103接收指定信号,选择从变换部102获得的字符串中用户所指定的字符(例如,“行”),并向分割部104输出。
分割部104将选择部103所选择的字符(例如,“行”)分割为音节单位的表音字符。在所输入的字符为汉字的情况下,分割部104从存储部提取表示汉字的读音的表音字符,分割为音节单位。例如,分割部104从存储部111提取表示从选择部103输入的汉字“行”的读音的平假名“ぎょう”。
另外,在由用户指定了“行は”的情况下,分割部104将“は”变换为表示音的“わ”。
分割部104将字符“ぎょう”分割为音节单位即“ぎょ”和“う”。
分割部104将所分割的“ぎょ”和“う”向生成部105输出。
图4是表示相似字符词典109中存储的相似字符候补的一例图。
相似字符词典109存储音节单位的表音字符、相似字符候补和相似度。关于图4中的“□”将后述。
表音字符指将声音数据的音用字符表示的文本数据。在表音字符中例如有日语的假名、英语的字母、中文的拼音、朝鲜语的朝鲜语字符等。
相似字符词典109对(“あ”、“い”、“ぎょ”等)的各个,存储一个或多个音相似的相似字符候补。对各个相似字符候补确定表示与基准的表音字符音相似的程度的相似度,存储于相似字符词典109。相似度优选通过实验等预先确定。图4所示的相似度的数字越小,表示相似字符候补的音与基准的表音字符的音越相似。
例如,在图4中,相似字符词典109对表音字符“ぎょ”,存储相似字符候补“ぎょ”、“きょ”、“ひょ”等。对各个相似字符候补预先确定相似度,存储于相似字符词典109。例如,“きょ”相对于“ぎょ”的相似度为“2.23265”,“ひょ”相对于“ぎょ”的相似度为“2.51367”。定义为相似度的值越小,音越相似于“ぎょ”。
生成部105检索相似字符词典109,对从分割部104输入的“ぎょ”和“う”的各个,提取相似字符候补。在该情况下,生成部105也可以提取一定的相似度以下的相似字符候补。
例如,生成部105检索相似字符词典109,提取相对于“ぎょ”的相似字符候补“ぎょ”、“きょ”、“ひょ”。此时,将生成部105设定为提取相似度“3”以下的相似字符候补。确定提取的相似字符候补的相似度可以在安装阶段预先确定,也可以由用户任意地设定。在提取相似度“3.5”以下的相似字符候补的情况下,生成部105提取“ぎょ”、“きょ”、“ひょ”、“りょ”、“ぴょ”。
生成部105对于“う”也同样,检索相似字符词典109,提取相似字符候补(“う”、“お”、“え”、“ん”(未图示))。
生成部105将所提取的各个相似字符候补彼此组合,生成订正字符候补。例如,生成部105对“ぎょ”组合“う”、“お”、“え”、“ん”,生成“ぎょう”、“ぎょお”、“ぎょえ”、“ぎょん”作为订正字符候补。对“きょ”组合“う”、“お”、“え”、“ん”,生成“きょう”、“きょお”、“きょえ”、“きょん”作为订正字符候补。对剩余的相似字符候补也同样进行组合,生成订正字符候补。
在与订正字符候补对应的汉字存在的情况下,生成部105也可以使用汉字变换词典(未图示),也生成变换为了汉字的订正字符候补。例如,如图1(a)所示,生成部105也可以将“きょう”变换为汉字,生成“今日”、“協”、“京”、“強”等作为订正字符候补。生成部105将所生成的订正字符候补向显示处理部106和确定部110输出。
显示处理部106将从生成部105输入的订正字符候补向显示部107输出,使其显示于订正候补显示区域202。
另外,生成部105在生成订正字符候补时,也可以计算所组合的相似字符候补的相似度之积,并向显示处理部106输出。在该情况下,显示处理部106按照生成部105所计算的相似度之积从小到大的顺序,在订正候补显示区域202排列显示订正字符候补。
用户选择在订正字符候补显示区域202显示的订正字符候补。例如,使用触控笔203等,从订正字符候补显示区域202显示的订正字符候补中,指定一个订正字符候补(例如,“今日”)。显示部107上的来自用户的指定作为指定信号,从触摸面板经由显示处理部106向确定部110输出。
确定部110接收指定信号,将用户所指定的订正字符候补(例如,“今日”)向显示处理部106输出。
显示处理部106如图1(b)所示,使将由选择部103选择的用户想要修正的字符(例如,“行”)置换为确定部110所确定的订正字符候补(例如,“今日”)后的字符串(例如,“今日はいい天气ですね”)作为新字符串,显示于显示部107上的字符串显示区域201。
如上所述,根据本发明,能够提供用户可以简便地修正由于误识别而显示的字符串的信息处理装置。
在信息处理装置10中,也可以由存储部111存储用户修正后的字符。
在用户新指定包含修正后的字符的字符串的情况下,生成部105检索存储部111,判别已修正了一次的字符和一次都未修正的字符。例如存储部111对于用户修正了一次的字符,以设立标志的状态进行存储。生成部105通过标志的检测,能够判别已修正了一次的字符和一次都未修正的字符。生成部105对一次都未修正的字符,提取相似字符候补,生成订正字符候补。
由此,信息处理装置10不必再度提取针对于已修正了的字符的相似字符候补,能够降低处理成本。
另外,信息处理装置10可能有时将用户未发出的音变换为字符(以下,称为情况1)和未将用户发出的音变换为字符(以下,称为情况2)。
图4中的“□”是表示无音的字符(以下,称为无音字符)。相似字符词典109也可以对于特定的表音字符,将无音字符“□”也与其他相似字符候补同样,作为相似字符候补进行存储。由此,在上述情况1、情况2的情况下,用户也可以简便地进行字符串的修正。
作为情况1的例子,在用户发出了“あす”时,变换部102可能有时变换为“あいす”。在该情况下,分割部104根据来自用户的指定,将“あいす”分割为音节单位即“あ”、“い”和“す”的表音字符,进而在各个表音字符间插入无音字符“□”,设定为“あ□い□す”。生成部105对“あ”、“い”、“す”和“□”的各个,检索相似字符词典109,提取相似字符候补,生成订正字符候补。
在图4中,在“い”的相似字符候补中存在“□”,因此生成部105可以生成“あ□す”作为订正字符候补。显示处理部106通过设定为不使显示部107显示无音字符“□”,用户可以指定“あす”。
这样,即使在信息处理装置10将用户未发出的音变换为字符的情况下,用户也能够简便地进行字符串的修正。
作为情况2的例子,在用户发出了“あいす”时,变换部102可能有时变换为“あす”。在该情况下,分割部104根据来自用户的指定,将“あす”分割为音节单位即“あ”和“す”的表音字符,进而其间插入无音字符“□”,设定为“□”。生成部105与情况1的情况同样地生成订正字符候补。
在图4中,在“□”的相似字符候补中存在“い”,所以生成部105可以生成“あいす”作为订正字符候补。
这样,即使在信息处理装置10未将用户发出的音变换为字符的情况下,用户也能够简便地进行字符串的修正。
另外,分割部104不仅可将“□”插入于表音字符之间,而且也可以插入于最初的表音字符之前、最后的表音字符之后。由此,生成部105能够生成更多的订正字符候补。
在本实施例中,描述了信息处理装置10修正日语字符串的情况,但是本发明并不仅限于日语字符串。
例如,关于修正英语的字母串的情况进行说明。这里,以信息处理装置10将误变换为了“I sink so”的字母串由用户修正为“I think so”的情况为例。
变换部102使用字符识别词典108将从输入部101输入的用户的声音数据变换为字母串(例如,“I sink so”)。在该情况下,字符识别词典108存储与英语的声音数据对应的字母数据。选择部103根据来自用户的指定,从变换部102所变换的字母字符串中选择一个或多个字母(例如,“sink”)。分割部104将从选择部103输入的字母分割为音素单位(例如,“s”、“i”、“n”、“k”)。
图5是表示相似字符词典109中存储的字母的相似字符候补的图。其中,图5中仅示出“s”、“i”、“n”、“k”的例子。
在英语的字母串的情况下,在相似字符词典109中存储容易发生错误的字符作为相似候补。
生成部105与上述日语字符串的情况同样,对分割为音素单位的各个字母,从相似字符词典109提取音相似的相似字符候补(字母)。生成部105将所提取的相似字符候补组合,生成订正字符候补。生成部105将所生成的订正字符候补向显示处理部106输出。在该情况下,生成部105优选向显示处理部106仅输出作为英语单词而存在的订正字符候补作为将相似字符候补组合的结果。
显示处理部106使订正字符候补显示于显示部107。
若进行以上的处理,则信息处理装置10不仅可以修正日语字符串,而且也可以进行英语的字母串的修正。
在中文的情况下,通过同样地将拼音分割为音单位,并进行处理,可以进行字符串的修正。
在韩语的情况下,通过同样地将韩语字符分割为音单位,并进行处理,可以进行字符串的修正。
这样,即使是日语以外的其他语言,只要是具有表音字符的语言,就能够提供通过进行与本实施例同样的处理,用户可以简便地修正由于误识别而显示的字符串的信息处理装置。
另外,信息处理装置10只要具备控制部120即可,而可以不包含输入部101、显示部107、字符识别词典108、相似字符词典109,将它们设置在外部。
(第2实施例)
在本实施例所涉及的信息处理装置20中,显示处理部106通过使显示部107显示包含汉字的假名汉字混合字符串和表示假名汉字混合字符串的读音的注音(ルビ)字符串,可以使用户从假名汉字混合字符串和注音字符串的任一方字符串选择想要修正的字符。由此,用户能够从假名汉字混合字符串和注音字符串修正由于误识别而显示的字符串,所以便利性提高。
图6是表示第2实施例所涉及的信息处理装置20的外观的图。
在信息处理装置20中,与第1实施例的信息处理装置10比较,显示处理部106还使注音字符串显示区域204显示于显示部107上。
如图6(a)所示,例如,根据由来自用户的声音所形成的输入,在字符串显示区域201显示“行はいい天气ですね”。在注音字符串显示区域204显示注音字符串即“ぎょうはいいてんきですね”。
用户使用触控笔203等从显示于字符串显示区域201的字符串中指定想要修正的一个或多个字符。或者,从显示于注音字符串显示区域204的字符串中指定想要修正的一个或多个注音字符。
以下,关于信息处理装置20进行详述。在本实施例中,适宜省略与第1实施例同样的说明。
变换部102将从输入部101输入的声音变换为包含汉字的假名汉字混合字符串和由表音字符串表示的注音字符串。所变换的假名汉字混合字符串和注音字符串存储于存储部111。
如图6(a)所示,例如,用户从显示于显示部107上的注音字符串显示区域204的“ぎょうはいいてんきですね”的注音字符串中,指定想要修正的注音字符“ぎょ”。选择部103选择字符“ぎょ”。
生成部105从变换部102接收选择部103所选择的字符“ぎょ”作为输入。生成部105与第1实施例的情况同样地,从相似字符词典109提取所输入的字符“ぎょ”的相似字符候补(例如,“ぎょ”、“きょ”、“ぴょ”)作为订正字符候补。生成部105将所提取的订正字符候补向显示处理部106输出。
显示处理部106将订正字符候补向显示部107上的订正候补显示区域202输出并使其显示。
用户从显示于订正候补显示区域202的订正字符候补中,指定一个订正字符候补“きょ”。
确定部110确定用户所指定的订正字符候补(“きょ”)。确定部110向显示处理部106输出所确定的订正字符候补(“きょ”)。
显示处理部106将选择部103所选择的“ぎょ”的注音字符置换为确定部110所确定的订正字符候补(“きょ”),向显示部107输出,使其显示于注音字符串显示区域204。显示处理部106向变换部102输出更新信号。
变换部102接收来自显示处理部106的更新信号,将存储部111中存储的修正前的注音字符串置换为修正后的注音字符串。变换部102对修正后的注音字符串进行汉字变换,作成一个或多个假名汉字混合字符串候补。变换部102也可以将所作成的假名汉字混合字符串向显示处理部106输出。在该情况下,显示处理部106使假名汉字混合字符串候补显示于显示部107上(例如,订正候补显示区域202)。若由用户指定一个假名汉字混合字符串候补,则显示处理部106使该假名汉字混合字符串候补显示于显示部107上的字符串显示区域201。这样,如图6(b)所示,用户能够将“行はいい天气ですね”修正为“今日はいい天气ですね”。
在以上的处理中,信息处理装置20以用户可以选择的方式显示假名汉字混合字符串和注音字符串,由此用户能够简便地修正由于误识别而显示的字符串。进而,由于用户能够根据假名汉字混合字符串和注音字符串修正由于误识别而显示的字符串,所以便利性提高。
Claims (3)
1.一种信息处理装置,其特征在于,具备:
变换部,其识别从用户输入的声音,变换为字符串;
选择部,其根据用户的指定,从上述字符串选择一个或多个字符;
分割部,其将所选择的上述字符变换为表音字符,并将上述表音字符分割为音单位的表音字符;
生成部,其从相关联地存储有音相似的多个音单位的表音字符的各个作为相似字符候补的相似字符词典,提取与所分割的音单位的上述表音字符的各个对应的上述相似字符候补,生成所选择的上述字符的订正字符候补;以及
显示处理部,其使所生成的上述订正字符候补以用户可以选择的方式显示于显示部。
2.权利要求1所述的信息处理装置,其特征在于,
上述分割部将上述表音字符分割为音节单位或音素单位的表音字符;
上述生成部对于所分割的音节单位或音素单位的上述表音字符的各个,提取一定相似度的范围的上述相似字符候补,生成上述订正字符候补。
3.权利要求2所述的信息处理装置,其特征在于,
上述变换部识别从用户输入的声音,变换为表音字符串和对上述表音字符串进行汉字变换而得到的假名汉字混合字符串;
上述选择部根据用户的指定,从上述表音字符串和上述假名汉字混合字符串的任一方字符串,选择一个或多个字符。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2009/006471 WO2011064829A1 (ja) | 2009-11-30 | 2009-11-30 | 情報処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102640107A true CN102640107A (zh) | 2012-08-15 |
Family
ID=44065954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009801626537A Pending CN102640107A (zh) | 2009-11-30 | 2009-11-30 | 信息处理装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20120296647A1 (zh) |
JP (1) | JP5535238B2 (zh) |
CN (1) | CN102640107A (zh) |
WO (1) | WO2011064829A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810993A (zh) * | 2012-11-14 | 2014-05-21 | 北京百度网讯科技有限公司 | 一种文本注音方法及装置 |
CN104680160A (zh) * | 2013-11-26 | 2015-06-03 | 冲电气工业株式会社 | 信息处理装置、系统、以及方法 |
CN105810197A (zh) * | 2014-12-30 | 2016-07-27 | 联想(北京)有限公司 | 语音处理方法、语音处理装置和电子设备 |
CN112567440A (zh) * | 2018-08-16 | 2021-03-26 | 索尼公司 | 信息处理装置、信息处理方法和程序 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104871240A (zh) * | 2012-12-28 | 2015-08-26 | 索尼公司 | 信息处理设备、信息处理方法、以及程序 |
JP2015153108A (ja) | 2014-02-13 | 2015-08-24 | 株式会社東芝 | 音声会話支援装置、及び音声会話支援方法及びプログラム |
US20150370891A1 (en) * | 2014-06-20 | 2015-12-24 | Sony Corporation | Method and system for retrieving content |
JP6925789B2 (ja) * | 2016-06-29 | 2021-08-25 | 京セラ株式会社 | 電子機器、制御方法、及びプログラム |
JP6601826B1 (ja) * | 2018-08-22 | 2019-11-06 | Zホールディングス株式会社 | 分割プログラム、分割装置、及び分割方法 |
JP6601827B1 (ja) * | 2018-08-22 | 2019-11-06 | Zホールディングス株式会社 | 結合プログラム、結合装置、及び結合方法 |
CN113299293A (zh) * | 2021-05-25 | 2021-08-24 | 阿波罗智联(北京)科技有限公司 | 语音识别结果处理方法和装置、电子设备、计算机介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050128181A1 (en) * | 2003-12-15 | 2005-06-16 | Microsoft Corporation | Multi-modal handwriting recognition correction |
JP2005241829A (ja) * | 2004-02-25 | 2005-09-08 | Toshiba Corp | 音声情報処理システム、音声情報処理方法及びプログラム |
CN101042867A (zh) * | 2006-03-24 | 2007-09-26 | 株式会社东芝 | 语音识别设备和方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63208096A (ja) * | 1987-02-25 | 1988-08-29 | 株式会社東芝 | 情報入力装置 |
JPH09269945A (ja) * | 1996-03-29 | 1997-10-14 | Toshiba Corp | メディア変換方法およびメディア変換装置 |
JPH10134047A (ja) * | 1996-10-28 | 1998-05-22 | Casio Comput Co Ltd | 移動端末音声認識/議事録作成通信システム |
JP2001005809A (ja) * | 1999-06-25 | 2001-01-12 | Toshiba Corp | 文書作成装置、文書作成方法、及び文書作成プログラムが記録された記録媒体 |
JP4229627B2 (ja) * | 2002-03-28 | 2009-02-25 | 株式会社東芝 | ディクテーション装置、方法及びプログラム |
JP3762327B2 (ja) * | 2002-04-24 | 2006-04-05 | 株式会社東芝 | 音声認識方法および音声認識装置および音声認識プログラム |
US7137076B2 (en) * | 2002-07-30 | 2006-11-14 | Microsoft Corporation | Correcting recognition results associated with user input |
JP3848319B2 (ja) * | 2003-11-11 | 2006-11-22 | キヤノン株式会社 | 情報処理方法及び情報処理装置 |
JP4012143B2 (ja) * | 2003-12-16 | 2007-11-21 | キヤノン株式会社 | 情報処理装置およびデータ入力方法 |
JP4604178B2 (ja) * | 2004-11-22 | 2010-12-22 | 独立行政法人産業技術総合研究所 | 音声認識装置及び方法ならびにプログラム |
JP2008090625A (ja) * | 2006-10-02 | 2008-04-17 | Sharp Corp | 文字入力装置、文字入力方法、制御プログラム、および、記録媒体 |
JP2009187349A (ja) * | 2008-02-07 | 2009-08-20 | Nec Corp | 文章修正支援システム、文章修正支援方法、および文章修正支援用プログラム |
-
2009
- 2009-11-30 CN CN2009801626537A patent/CN102640107A/zh active Pending
- 2009-11-30 JP JP2011542997A patent/JP5535238B2/ja not_active Expired - Fee Related
- 2009-11-30 WO PCT/JP2009/006471 patent/WO2011064829A1/ja active Application Filing
-
2012
- 2012-05-23 US US13/478,518 patent/US20120296647A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050128181A1 (en) * | 2003-12-15 | 2005-06-16 | Microsoft Corporation | Multi-modal handwriting recognition correction |
JP2005241829A (ja) * | 2004-02-25 | 2005-09-08 | Toshiba Corp | 音声情報処理システム、音声情報処理方法及びプログラム |
CN101042867A (zh) * | 2006-03-24 | 2007-09-26 | 株式会社东芝 | 语音识别设备和方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810993A (zh) * | 2012-11-14 | 2014-05-21 | 北京百度网讯科技有限公司 | 一种文本注音方法及装置 |
CN103810993B (zh) * | 2012-11-14 | 2020-07-10 | 北京百度网讯科技有限公司 | 一种文本注音方法及装置 |
CN104680160A (zh) * | 2013-11-26 | 2015-06-03 | 冲电气工业株式会社 | 信息处理装置、系统、以及方法 |
CN105810197A (zh) * | 2014-12-30 | 2016-07-27 | 联想(北京)有限公司 | 语音处理方法、语音处理装置和电子设备 |
CN105810197B (zh) * | 2014-12-30 | 2019-07-26 | 联想(北京)有限公司 | 语音处理方法、语音处理装置和电子设备 |
CN112567440A (zh) * | 2018-08-16 | 2021-03-26 | 索尼公司 | 信息处理装置、信息处理方法和程序 |
Also Published As
Publication number | Publication date |
---|---|
US20120296647A1 (en) | 2012-11-22 |
JPWO2011064829A1 (ja) | 2013-04-11 |
WO2011064829A1 (ja) | 2011-06-03 |
JP5535238B2 (ja) | 2014-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102640107A (zh) | 信息处理装置 | |
US6510412B1 (en) | Method and apparatus for information processing, and medium for provision of information | |
US20070100619A1 (en) | Key usage and text marking in the context of a combined predictive text and speech recognition system | |
JP4829901B2 (ja) | マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置 | |
US8756058B2 (en) | Speech recognition system, speech recognition result output method, and speech recognition result output program | |
US20070242071A1 (en) | Character Display System | |
CN102439540A (zh) | 输入法编辑器 | |
US20150169537A1 (en) | Using statistical language models to improve text input | |
CN102866824A (zh) | 执行链接的显示设备和方法及其识别语音的方法 | |
US20070288240A1 (en) | User interface for text-to-phone conversion and method for correcting the same | |
US9171234B2 (en) | Method of learning a context of a segment of text, and associated handheld electronic device | |
JP4189336B2 (ja) | 音声情報処理システム、音声情報処理方法及びプログラム | |
JP7102710B2 (ja) | 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法 | |
KR20170132643A (ko) | 문자 디스플레이 방법 및 그 장치 | |
JP2008059389A (ja) | 語彙候補出力システム、語彙候補出力方法及び語彙候補出力プログラム | |
KR20130122437A (ko) | 영어의 한글 표기 방법 및 시스템 | |
JP5474723B2 (ja) | 音声認識装置およびその制御プログラム | |
JP2007086404A (ja) | 音声合成装置 | |
JP2002207728A (ja) | 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体 | |
JP5169602B2 (ja) | 形態素解析装置、形態素解析方法及びコンピュータプログラム | |
JP2005018442A (ja) | 表示処理装置、表示処理方法、表示処理プログラム、および記録媒体 | |
US6327560B1 (en) | Chinese character conversion apparatus with no need to input tone symbols | |
KR100980384B1 (ko) | 휴대용 단말기의 문자 입력 방법 | |
JPWO2005076259A1 (ja) | 音声入力システム、音声入力方法、および、音声入力用プログラム | |
JP2009098328A (ja) | 音声合成装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C05 | Deemed withdrawal (patent law before 1993) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120815 |