CN106168945B - 声音输出装置以及声音输出方法 - Google Patents

声音输出装置以及声音输出方法 Download PDF

Info

Publication number
CN106168945B
CN106168945B CN201610171393.1A CN201610171393A CN106168945B CN 106168945 B CN106168945 B CN 106168945B CN 201610171393 A CN201610171393 A CN 201610171393A CN 106168945 B CN106168945 B CN 106168945B
Authority
CN
China
Prior art keywords
words
word
voice
sentence
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610171393.1A
Other languages
English (en)
Other versions
CN106168945A (zh
Inventor
纪井建彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2015238293A external-priority patent/JP6365520B2/ja
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Publication of CN106168945A publication Critical patent/CN106168945A/zh
Application granted granted Critical
Publication of CN106168945B publication Critical patent/CN106168945B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/086Detection of language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种声音输出装置以及声音输出方法。声音输出装置具备:范围指定单元,其使用户从包含多个单词的文本中指定至少包含1个单词的范围;第1声音输出单元,其在通过上述范围指定单元指定了1个单词的情况下,从存储有各单词的声音数据的单词数据库中取得与上述指定的单词对应的声音数据并进行声音输出;以及第2声音输出单元,其在通过上述范围指定单元指定了多个单词的情况下,从存储有朗读句子而得的声音数据的句子数据库中提取与上述指定的多个单词对应的部分的声音数据并进行声音输出。

Description

声音输出装置以及声音输出方法
技术领域
本发明涉及一种用于辅助外语发音学习的声音输出装置以及声音输出方法。
背景技术
以往,作为学习外语的装置,电子辞典、电子单词本等电子设备得到了实用化。
电子单词本可以按照预先决定的信息量登记存储在电子辞典中的辞典数据中的、例如进行辞典检索得到的单词的内容或用户指定的单词的内容,并将该登记的各单词的内容以掀起纸质的单词本的方式显示并查看。
此外,在所述电子辞典和电子单词本中,有的具有针对显示的单词,与“声音”键的操作对应地输出该单词的声音(发音)的功能。
作为输出单词等字符串的声音的装置,考虑若用手指等点击显示于触摸面板式显示画面上的文本,则输出该被触摸的范围的文本的声音的文本朗读装置(例如,日本特开平09-265299号公报)。
此外,考虑识别通过扫描仪读取的字符并显示,并且输出该识别出的字符的声音的简易输入输出装置(例如,日本特开平09-244868号公报)。
并且,考虑具备如下辞典功能的电子装置:若通过笔触摸显示于触摸面板式显示画面上的字符串,则输出以包含被该笔触摸的字符的单词为起点的一连串的字符串的声音(例如,日本特开2010-85727号公报)。
在上述现有的装置中,能够输出与被用户触摸或通过扫描仪读取的范围的字符串对应的声音。
然而,即使在所述用户指定的范围的字符串中包含多个单词,也只能依次连续输出该多个单词的声音,而无法听到根据连续的单词的组合而变化的连音(liaison)的声音。
本发明是鉴于这样的课题而提出的,其目的是提供一种能够将用户指定的范围内的单词的声音输出为与该单词数对应的恰当的声音的声音输出装置以及声音输出方法。
发明内容
本发明的声音输出装置,具备:
范围指定单元,其使用户从包含多个单词的文本中指定至少包含1个单词的范围;
第1声音输出单元,其在通过上述范围指定单元指定了1个单词的情况下,从存储有各单词的声音数据的单词数据库中取得与上述指定的单词对应的声音数据并进行声音输出;以及
第2声音输出单元,其在通过上述范围指定单元指定了多个单词的情况下,从存储有朗读句子而得的声音数据的句子数据库中提取与上述指定的多个单词对应的部分的声音数据并进行声音输出。
根据本发明,能够将用户指定的范围内的单词的声音输出为与该单词数对应的恰当的声音
附图说明
图1是表示本发明的实施方式涉及的声音输出装置10的外观结构的图。
图2是表示上述声音输出装置10的电子电路的结构的框图。
图3A、图3B、图3C、图3D分别是表示上述声音输出装置10的辞典数据库12c、多个单词辞典数据库12d、例句数据库12e、会话集数据库12f的内容的图。
图4是表示上述声音输出装置10的第1实施方式的声音输出处理的流程图。
图5是表示上述声音输出装置10的第1实施方式的再生速度决定处理的流程图。
图6是表示声音输出装置10遵从第1实施方式的声音输出处理的在文档G上的本体操作所对应的声音输出动作的图。
图7是表示上述声音输出装置的第2实施方式的结构的外观图。
图8是说明上述声音输出装置的第3实施方式的图。
图9是表示上述声音输出装置的第3实施方式的声音输出处理的流程图。
具体实施方式
以下,根据附图对本发明的实施方式进行说明。
图1是表示本发明的实施方式涉及的声音输出装置10的外观结构的图。
图2是表示上述声音输出装置10的电子电路的结构的框图。
以下,上述声音输出装置10以笔型的电子设备进行了说明,但例如也可以构成为便携设备,将以下所示的处理程序安装在具备取入或显示文本数据功能的触摸面板式PDA(personal digital assistants,个人数字助理)、电子辞典、PC(personal computer,个人计算机)、便携电话、电子书、便携游戏机等上来构成。
上述图1所示的声音输出装置10具有用户可以单手把持的笔型的本体壳,在本体前端设有具备CCD图像传感器的扫描部17,在本体中央设有带触摸面板的显示部18,在本体后部设有声音输出部19。
该声音输出装置10具有对通过扫描部17读取的文档G的部分图像所包含的文本进行文字识别,从辞典数据中检索该文字识别出的文本,并显示意思和例句的辞典功能,以及从声音输出部19输出与该文字识别出的文本所包含的一个单词或多个单词对应的发音的声音数据的功能。
此外,虽然省略了详细的说明,但声音输出装置10具有使用内部数据库的辞典检索功能和外语学习功能。
上述声音输出装置10的电子电路由通过程序来控制动作的计算机构成,在该电子电路中具备CPU(central processing unit,中央处理单元)11。
上述CPU11根据预先存储在存储装置12内的装置控制程序12a,将RAM16作为作业用存储器来控制电路各部的动作。另外,装置控制程序12a可以从ROM卡等外部记录介质13经由记录介质读取部14读入到上述存储装置12,或从或联网N上的Web服务器(在该情况下为程序服务器)20经由通信部15读入到上述存储装置12。
根据与来自扫描部17、带触摸面板的显示部18的用户操作对应的输入信号或与经由通信部15连接的互联网N上的Web服务器20的通信信号,来启动存储在上述存储装置12中的装置控制程序12a。
在上述CPU11上连接上述存储装置12、记录介质读取部14、通信部15、RAM16、扫描部17、带触摸面板的显示部18、声音输出部19。
在上述存储装置12中作为装置控制程序12a存储有系统程序和通信程序等,其中,系统程序用于管理该装置10的整体动作,通信程序用于经由通信部15与互联网N上的Web服务器20和未图示的用户PC(Personal Computer,个人计算机)等进行数据通信。
此外,上述装置控制程序12a包含声音输出程序(参照图4),其用于从辞典数据库12c、多个单词辞典数据库12d、例句数据库12e或会话集数据库12f取得与通过OCR(OpticalCharacter Recognition,光学字符识别)处理对由上述扫描部17读取的图像数据所包含的文本进行文字识别而得到的单词对应的声音数据并再生。
并且,在上述存储装置12中还存储用于上述OCR处理的文字识别程序12b。此外,还存储用于实现辞典检索功能和外语学习功能的程序。
图3A、图3B、图3C、图3D分别是表示上述声音输出装置10的辞典数据库12c、多个单词辞典数据库12d、例句数据库12e、会话集数据库12f的内容的图。
如图3A所示,上述辞典数据库12c,针对多个词条(单词)中的各个词条,将该词条的发音数据(声音数据)与包含该词条的语义的说明信息对应起来进行存储。
如图3B所示,上述多个单词辞典数据库12d,针对熟语、惯用语、谚语(idiom:成语)等由多个单词构成的词条中的各个词条,将由母语者朗读该词条的连音(liaison)的发音数据(声音数据)与包含该词条的语义的说明信息对应起来存储。
上述例句数据库12e,将使用了存储在上述辞典数据库12c和多个单词辞典数据库12d中的各词条(1个或多个单词)的各个例句、由母语者朗读该例句的连读的朗读数据(声音数据)和该例句的译文对应起来存储。
上述会话集数据库12f,将与各个场面对应的会话句、母语者朗读该会话句的朗读数据(声音数据)以及该会话句的译文对应起来存储。该声音数据也是将连读的声音数据化而得的数据。可以在外语学习功能中利用该会话集数据库12f。
此外,在上述存储装置12中存储通过上述扫描部17读取的图像数据12g、通过上述OCR处理识别为文本的文本数据12h等。
上述RAM16具备显示数据区域16a、再生速度设定数据区域16b。在上述显示数据区域16a中,确保与上述带触摸面板的显示部18的显示尺寸对应的存储容量,展开存储应使该显示部18显示的显示数据。在上述再生速度设定数据区域16b中存储随着上述扫描部17的图像读取而检测出的、与该读取的移动速度对应地决定的上述1个单词或多个单词所对应的声音数据的再生速度(低/中/高)。
这样构成的声音输出装置10,由上述CPU11按照在上述装置控制程序12a(包含用于执行声音输出处理等的程序)中记述的命令控制电路各部的动作,通过软件与硬件协作地动作,来实现在以下的动作说明中叙述的功能。
接着,说明上述结构的声音输出装置10的动作。
(第1实施方式)
图4是表示上述声音输出装置10的声音输出处理的流程图。
图5是表示上述声音输出装置10的再生速度决定处理的流程图。
图6是表示上述声音输出装置10在文档G上的本体操作所对应的声音输出动作的图。
如图6所示,针对在文档G(英语新闻等)中表述的英语(外语)文本所包含的任意的文本部分(单词串),若使声音输出装置10的扫描部17接触并移动,则依次存储伴随该移动由扫描部17读取的文本部分的图像数据12g(步骤S1)。此外,检测出上述扫描部17的移动速度(步骤S2)。
然后,若根据上述检测出的移动速度,判断为上述文本部分的读取已停止(步骤S3(是)),则通过OCR处理对伴随该读取而存储的上述图像数据12g所包含的文本进行文字识别而转换为文本数据12h后存储(步骤S4)。
这样,判断上述文字识别出的文本数据12h是多个单词的文本还是1个单词的文本(步骤S5、S6)。
在此,如上述图6所示,若读取在文档G上表述的1个单词,例如“important”的文本部分,则判断为是1个单词(步骤S6(是)),从辞典数据库12c(参照图3A)检索与该单词对应的词条“important”(步骤S7),并取得与该词条对应的声音数据
Figure GDA0001042426470000061
(步骤S8)。
这样,决定与在上述步骤S2中检测出的上述文本部分的图像读取的移动速度对应的再生速度(步骤SA),以该决定的再生速度从声音输出部19输出与上述词条“important”对应的声音数据
Figure GDA0001042426470000062
(步骤S12)。
此外,如上述图6所示,若读取在文档G上表述的2个单词“What time”的文本部分,则判断为是多个单词(步骤S5(是)),判断在上述多个单词辞典数据库12d中是否有与“Whattime”对应的词条(步骤S9)。
在此,若判断为在上述多个单词辞典数据库12d中没有与“What time”对应的词条(步骤S9(否)),则从例句数据库12e或会话集数据库12f中检索包含“What time”的例句数据或会话句数据(步骤S10)。然后,取得与检索出的例句数据(或会话句数据)对应的声音数据中与上述“What time”对应的部分的声音数据(步骤S11)。在该情况下,若以连音(liaison)发声,则取得其声音数据(步骤S11)。
另外,在从上述例句数据库12e和会话集数据库12f的双方检索出包含上述读取的多个单词“What time”的文本数据的情况下(步骤S10),按照预先设定的优先顺序从该任意数据库中取得与“What time”对应的部分的声音数据(步骤S11)。
这样,与上述1个单词的情况同样地,决定与上述文本部分的图像读取的移动速度对应的再生速度(步骤SA),以该决定的再生速度从声音输出部19输出与“What time”对应的连音(liaison)的声音数据[hwɑt taIm](步骤S12)。
此外,当读取到在上述文档G上表述的2个单词(例如“set out”)的文本部分时(步骤S5(是)),在判断为在上述多个单词辞典数据库12d中存在与该多个单词“set out”(惯用词)对应的词条的情况下(步骤S9(是)),从该多个单词辞典数据库12d检索并取得与该词条“set out”对应的声音数据
Figure GDA0001042426470000063
(步骤S8)。
此外,与上述同样地,决定与上述文本部分的图像读取的移动速度对应的再生速度(步骤SA),以该决定的再生速度从声音输出部19输出与上述“set out”对应的连音(liaison)的声音数据
Figure GDA0001042426470000064
(步骤S12)。
在此,使用图5的流程图说明与上述文本部分的图像读取的移动速度对应的再生速度的决定处理(步骤SA)。
首先,在上述步骤S2中计算从上述图像的读取开始到停止为止重复检测出的移动速度的平均值(平均移动速度V)(步骤A1),比较该平均移动速度V与预先设定的低速值Vs以及高速值Vf(步骤A2,A3)。
然后,在判断为上述平均移动速度V小于上述低速值Vs的情况下(步骤A2(是)),将上述再生速度设定数据16b设定为“低”(步骤A5)。此外,在判断为上述平均移动速度V大于上述高速值Vf的情况下(步骤A3(是)),将上述再生速度设定数据16b设定为“高”(步骤A6)。
另一方面,在判断为上述平均移动速度V在上述低速值Vs至高速值Vf之间的情况下(步骤A2(否)、A3(否)),将上述再生速度设定数据16b设定为“中”(步骤A6)。
因此,根据第1实施方式的声音输出装置10的声音输出功能,若通过扫描部17读取在外语文档G上表述的所期望的部分的文本,则从该图像数据进行文字识别,在识别出1个单词的情况下,从辞典数据库取得与该单词对应的词条的声音数据并输出,在识别出多个单词的情况下,从词条(成语)的声音数据或包含该多个单词的例句等句中取得与上述多个单词对应的部分的朗读声音数据(连音)并输出。
由此,能够将在上述文档G上用户指定的范围内的单词的声音作为与该单词数对应的恰当的声音来输出。
(第2实施方式)
图7是表示上述声音输出装置的第2实施方式的结构的外观图。
在该第2实施方式的声音输出装置中,将上述第1实施方式中的扫描部17构成为独立的笔型扫描仪17D,将通过该笔型扫描仪17D读取到的文档G上的图像数据通过蓝牙(注册商标)等近距离无线信号BT发送给PDA(智能手机等)10A和电子辞典10B。
与上述第1实施方式同样地,使上述PDA10A和电子辞典10B具备移动速度检测功能、OCR功能、辞典功能、再生速度决定功能、与1个单词或多个单词对应的声音输出功能。
因此,根据该第2实施方式的声音输出装置,若通过操作笔型扫描仪17D来读取在外语文档G上表述的所期望部分的文本,则在PDA10A或电子辞典10B中,当上述所期望部分的文本为1个单词时,输出与该单词对应的词条的声音数据,当上述所期望部分的文本为多个单词时,输出与该多个单词对应的词条(成语)的声音数据、或者与包含该多个单词的例句或会话句对应的声音数据中与该多个单词对应的部分的朗读声音数据。
由此,与上述第1实施方式同样地,能够在PDA10A和电子辞典10B侧将在上述文档G上用户指定的范围内的单词的声音作为与该单词数对应的恰当的声音来输出。
(第3实施方式)
图8是说明上述声音输出装置的第3实施方式的图。
在该第3实施方式中,将PDA(智能手机等)或电子辞典等单体的便携设备构成为声音输出装置,显示由内置摄像头拍摄并进行OCR处理而得到的文档GT,或者从外部下载或从预先存储的多个文本数据中由用户选择的文档GT,并输出与用户指定的所期望的部分的文本(1个单词或多个单词)对应的声音数据。
图9是表示上述声音输出装置的第3实施方式的声音输出处理的流程图。
在该第3实施方式的流程图中,对于步骤T10~T17的处理与在上述图4中所示的第1实施方式的流程图中的步骤S5~S12的处理相同,因此省略详细的说明。
首先,若用户通过内置摄像头拍摄英语报纸等外语书的文件,则声音输出装置10取入所拍摄到的图像数据(步骤T1、T2),将通过OCR处理(步骤T3)进行文字识别而得的文本的文档GT显示在显示部18中(步骤T5)。
或者,例如若用户从内置的多个文本数据中选择1个文本数据,则声音输出装置10将用户选择的文档GT显示在显示部18中(步骤T4,T5)。
以在上述显示部18中显示的文档GT为对象,若用笔P拖动d指定所期望的部分的文本(步骤T6(是)),则在判断该笔P的移动的停止(步骤T9(是))为止的期间,取得上述指定的范围的文本并依次存储为文本数据12h(步骤T7)。此外,逐次检测伴随上述笔P的拖动的移动速度(步骤T8)。
然后,若判断为上述笔P的移动已停止(步骤T9(是)),则与上述第1实施方式同样地,在上述指定的范围的文本为1个单词的情况下(步骤T11(是)),从辞典数据库12c中检索并取得与该单词对应的词条的声音数据(步骤T12,T13),并以根据上述移动速度的平均移动速度而决定的再生速度输出(步骤TA(A1~A6)、T17)。
此外,与上述第1实施方式同样地,上述指定的范围的文本为多个单词且在多个单词辞典数据库12d中存在与该多个单词对应的词条(成语)的情况下(步骤T14(是)),从上述多个单词辞典数据库12d中检索并取得与该多个单词对应的词条(成语)的声音数据(步骤T13),并以根据上述移动速度的平均移动速度而决定的再生速度输出(步骤TA(A1~A6)、T17)。
此外,与上述第1实施方式同样地,上述指定的范围的文本为多个单词且在多个单词辞典数据库12d中不存在与该多个单词对应的词条的情况下(步骤T14(否)),从例句数据库12e或会话集数据库12f中检索并取得与包含该多个单词的例句或会话句对应的声音数据中该多个单词所对应的部分的声音数据(步骤T15、T16),并以根据上述移动速度的平均移动速度而决定的再生速度输出(步骤TA、T17)。
因此,根据该第3实施方式的声音输出装置,若通过笔P来拖动指定在显示部中显示的文档GT内的所期望部分的文本,则在上述所期望部分的文本为1个单词的情况下,输出与该单词对应的词条的声音数据,在上述所期望部分的文本为多个单词的情况下,输出与该多个单词对应的词条的声音数据,或输出与包含该多个单词的例句或会话句对应的声音数据中该多个单词所对应的部分的朗读声音数据。
由此,与上述第1实施方式同样地,能够将在上述文档G上用户指定的范围内的单词的声音作为与该单词数对应的恰当的声音来输出。
另外,在上述各实施方式中,将辞典数据库12c、多个单词辞典数据库12d、例句数据库12e、会话集数据库12f构成为不同的数据库,但例如也可以在上述辞典数据库12c中存储其他数据库12d~12f的内容。在该情况下,认为在辞典数据库12c中,除了由原本存在的单个单词构成的词条外,还存储由上述多个单词数据库12d的多个单词构成的词条(成语),与该各词条对应地存储包含该词条的例句和会话句。
在上述各实施方式中记载的声音输出装置进行的各处理的方法,即图4的流程图所示的第1实施方式(第2实施方式)的声音输出处理、图5的流程图所示的伴随上述声音输出处理的再生速度决定处理、图9的流程图所示的第3实施方式的声音输出处理等的各方法,都可以作为能够使计算机执行的程序,存储在存储卡(ROM卡、RAM卡等)、磁盘(软(floppy(注册商标)盘、硬盘等)、光盘(CD-ROM、DVD等)、半导体存储器等外部记录装置的介质(13)中来分发。并且,具备扫描部(17)或文本数据的取入功能的电子设备(10)的计算机(CPU11)将存储在该外部记录装置的介质(13)中的程序读入到存储装置(12),并通过该读入的程序控制动作,由此能够实现在上述各实施方式中说明的与用户指定的范围的文本的单词对应的声音输出功能,实现与上述方法同样的处理。
本申请并不局限于上述各实施方式,在不脱离其宗旨的范围内,可在实施阶段进行各种变形。并且,上述各实施方式中包含各种阶段的发明,通过公开的多个构成要件的恰当的组合能够提取各种发明。例如,即使从各实施方式所示的全部构成要件中删去几个构成要件或将几个构成要件以不同的方式组合,在能够解决发明想要解决的课题,得到在发明效果中叙述的效果的情况下,也可以将删去或组合该构成要件而得的结构提取为发明。

Claims (15)

1.一种声音输出装置,其特征在于,具备:
范围指定单元,其使用户从包含多个单词的文本中指定至少包含1个单词的范围;
第1声音输出单元,其在通过上述范围指定单元指定了1个单词的情况下,从存储有各单词的声音数据的单词数据库中取得与上述指定的单词对应的声音数据并进行声音输出;以及
第2声音输出单元,其在通过上述范围指定单元指定了多个单词的情况下,从存储有朗读句子而得的声音数据的句子数据库中提取与上述指定的多个单词对应的部分的声音数据并进行声音输出;
其中,上述声音输出装置还具备:
辞典数据存储单元,其将词条、包含该词条的语义的说明信息、该词条的连音的声音数据关联起来进行存储;
句子数据存储单元,其存储朗读句子而得的、包含根据句子中连续的单词的组合而变化的连音的声音数据;以及
单词数判定单元,其判断在通过上述范围指定单元指定的范围内包含的单词的个数,
在通过上述单词数判定手段判断为单个单词的情况下,上述第1声音输出单元从作为上述单词数据库的上述辞典数据存储单元中取得与上述指定的单词对应的词条的声音数据并进行声音输出,
在通过上述单词数判定手段判断为多个单词的情况下,上述第2声音输出单元从作为上述句子数据库的上述句子数据存储单元中,提取与上述指定的多个单词对应的、包含上述连音的部分的声音数据,并进行声音输出;
词条判断单元,其在通过上述单词数判定手段判断为多个单词的情况下,判断在上述辞典数据存储单元中是否存在相应的词条;以及
第3声音输出单元,其在通过上述词条判断单元判断为存在相应的词条的情况下,从上述辞典数据存储单元取得与上述指定的多个单词对应的词条的、包含根据句子中连续的单词的组合而变化的连音的声音数据,并进行声音输出,
在通过上述词条判断单元判断为不存在相应的词条的情况下,上述第2声音输出单元从上述句子数据存储单元,提取与上述指定的多个单词对应的、包含根据句子中连续的单词的组合而变化的连音的部分的声音数据,并进行声音输出;
其中,上述声音输出装置进一步具备:
图像读取单元,其读取与用户操作对应地移动后的范围的图像;
文字识别单元,其对通过该图像读取单元读取到的图像所包含的文本进行文字识别;
再生速度设定数据区域,在其中存储随着上述图像读取单元的图像读取而检测出的、与该读取的移动速度对应地决定的上述1个单词或上述多个单词所对应的声音数据的再生速度。
2.根据权利要求1所述的声音输出装置,其特征在于,
上述辞典数据存储单元具有以单个单词为词条的第1辞典数据和以由多个单词构成的成语为词条的第2辞典数据。
3.根据权利要求2所述的声音输出装置,其特征在于,
上述句子数据存储单元具有:例句数据存储单元,其存储包含存储在上述辞典数据存储单元中的词条的例句和朗读该例句的声音数据,
在通过上述词条判断单元判断为在上述辞典数据存储单元中不存在与上述指定的多个单词相应的词条的情况下,上述第2声音输出单元从上述例句数据存储单元取得与包含该多个单词的例句的相同单词串对应的部分的声音数据并进行声音输出。
4.根据权利要求1所述的声音输出装置,其特征在于,
上述范围指定单元按照用户操作,通过上述图像读取单元从所期望的开始位置至结束位置读取所表述的文本来进行指定。
5.根据权利要求1所述的声音输出装置,其特征在于,
该声音输出装置还具备:带触摸面板的显示部,
上述范围指定单元按照用户的触摸操作,从所期望的开始位置至结束位置对显示于上述带触摸面板的显示部的文本进行指定。
6.一种电子设备的声音输出方法,其特征在于,
该声音输出方法具备如下步骤:
范围指定步骤,使用户从包含多个单词的文本中指定至少包含1个单词的范围;
第1声音输出步骤,在通过上述范围指定步骤指定了1个单词的情况下,从存储有各单词的声音数据的单词数据库中取得与上述指定的单词对应的声音数据并进行声音输出;以及
第2声音输出步骤,在通过上述范围指定步骤指定了多个单词的情况下,从存储有朗读句子而得的声音数据的句子数据库中提取与上述指定的多个单词对应的部分的声音数据并进行声音输出;
其中,上述电子设备具有:辞典数据存储部,其将词条、包含该词条的语义的说明信息、该词条的连音的声音数据关联起来进行存储;以及句子数据存储单元,其存储朗读句子而得的、包含根据句子中连续的单词的组合而变化的连音的声音数据,
上述声音输出方法还具备:单词数判定步骤,判断通过上述范围指定步骤指定的范围所包含的单词的个数,
在上述第1声音输出步骤中,在通过上述单词数判定步骤判断为单个单词的情况下,从作为上述单词数据库的上述辞典数据存储部中取得与上述指定的单词对应的词条的声音数据并进行声音输出,
在上述第2声音输出步骤中,在通过上述单词数判定步骤判断为多个单词的情况下,从作为上述句子数据库的上述句子数据存储部中,提取与上述指定的多个单词对应的、包含上述连音的部分的声音数据,并进行声音输出;
词条判断步骤,在通过上述单词数判定步骤判断为多个单词的情况下,判断在上述辞典数据存储部中是否存在相应的词条;以及
第3声音输出步骤,在通过上述词条判断步骤判断为存在相应的词条的情况下,从上述辞典数据存储部取得与上述指定的多个单词对应的词条的、包含根据句子中连续的单词的组合而变化的连音的声音数据,并进行声音输出,
在上述第2声音输出步骤中,在通过上述词条判断步骤判断为不存在相应的词条的情况下,从上述句子数据存储部提取与上述指定的多个单词对应的、包含根据句子中连续的单词的组合而变化的连音的部分的声音数据,并进行声音输出;
其中,该声音输出方法还具备:
图像读取步骤,读取与用户操作对应地移动后的范围的图像;
文字识别步骤,对通过该图像读取步骤读取到的图像所包含的文本进行文字识别;
再生速度决定步骤,在再生速度设定数据区域中存储随着在上述图像读取步骤中的图像读取而检测出的、与该读取的移动速度对应地决定的上述1个单词或上述多个单词所对应的声音数据的再生速度。
7.根据权利要求6所述的声音输出方法,其特征在于,
上述辞典数据存储部具有以单个单词为词条的第1辞典数据和以由多个单词构成的成语为词条的第2辞典数据。
8.根据权利要求7所述的声音输出方法,其特征在于,
上述句子数据存储部具有:例句数据存储部,其存储包含存储在上述辞典数据存储部中的词条的例句和朗读该例句而得的声音数据,
在上述第2声音输出步骤中,在通过上述词条判断步骤判断为在上述辞典数据存储部中不存在与上述指定的多个单词相应的词条的情况下,从上述例句数据存储部取得与包含该多个单词的例句的相同单词串对应的部分的声音数据并进行声音输出。
9.根据权利要求6所述的声音输出方法,其特征在于,
在上述范围指定步骤中,按照用户操作,通过上述图像读取步骤从所期望的开始位置至结束位置读取所表述的文本来进行指定。
10.根据权利要求6所述的声音输出方法,其特征在于,
上述电子设备还具备:带触摸面板的显示部,
在上述范围指定步骤中,按照用户的触摸操作,从所期望的开始位置至结束位置对显示于上述带触摸面板的显示部的文本进行指定。
11.一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被具有电子设备的计算机执行,以实现电子设备的声音输出方法,其特征在于,
该声音输出方法具备如下步骤:
范围指定步骤,使用户从包含多个单词的文本中指定至少包含1个单词的范围;
第1声音输出步骤,在通过上述范围指定步骤指定了1个单词的情况下,从存储有各单词的声音数据的单词数据库中取得与上述指定的单词对应的声音数据并进行声音输出;以及
第2声音输出步骤,在通过上述范围指定步骤指定了多个单词的情况下,从存储有朗读句子而得的声音数据的句子数据库中提取与上述指定的多个单词对应的部分的声音数据并进行声音输出;
其中,上述电子设备具有:辞典数据存储部,其将词条、包含该词条的语义的说明信息、该词条的连音的声音数据关联起来进行存储;以及句子数据存储单元,其存储朗读句子而得的、包含根据句子中连续的单词的组合而变化的连音的声音数据,
上述声音输出方法还具备:单词数判定步骤,判断通过上述范围指定步骤指定的范围所包含的单词的个数,
在上述第1声音输出步骤中,在通过上述单词数判定步骤判断为单个单词的情况下,从作为上述单词数据库的上述辞典数据存储部中取得与上述指定的单词对应的词条的声音数据并进行声音输出,
在上述第2声音输出步骤中,在通过上述单词数判定步骤判断为多个单词的情况下,从作为上述句子数据库的上述句子数据存储部中,提取与上述指定的多个单词对应的、包含上述连音的部分的声音数据,并进行声音输出;
词条判断步骤,在通过上述单词数判定步骤判断为多个单词的情况下,判断在上述辞典数据存储部中是否存在相应的词条;以及
第3声音输出步骤,在通过上述词条判断步骤判断为存在相应的词条的情况下,从上述辞典数据存储部取得与上述指定的多个单词对应的词条的、包含根据句子中连续的单词的组合而变化的连音的声音数据,并进行声音输出,
在上述第2声音输出步骤中,在通过上述词条判断步骤判断为不存在相应的词条的情况下,从上述句子数据存储部提取与上述指定的多个单词对应的、包含根据句子中连续的单词的组合而变化的连音的部分的声音数据,并进行声音输出;
该声音输出方法还具备:
图像读取步骤,读取与用户操作对应地移动后的范围的图像;
文字识别步骤,对通过该图像读取步骤读取到的图像所包含的文本进行文字识别;
再生速度决定步骤,在再生速度设定数据区域中存储随着在上述图像读取步骤中的图像读取而检测出的、与该读取的移动速度对应地决定的上述1个单词或上述多个单词所对应的声音数据的再生速度。
12.根据权利要求11所述的计算机可读存储介质,其特征在于,
上述辞典数据存储部具有以单个单词为词条的第1辞典数据和以由多个单词构成的成语为词条的第2辞典数据。
13.根据权利要求12所述的计算机可读存储介质,其特征在于,
上述句子数据存储部具有:例句数据存储部,其存储包含存储在上述辞典数据存储部中的词条的例句和朗读该例句而得的声音数据,
在上述第2声音输出步骤中,在通过上述词条判断步骤判断为在上述辞典数据存储部中不存在与上述指定的多个单词相应的词条的情况下,从上述例句数据存储部取得与包含该多个单词的例句的相同单词串对应的部分的声音数据并进行声音输出。
14.根据权利要求11所述的计算机可读存储介质,其特征在于,
在上述范围指定步骤中,按照用户操作,通过上述图像读取步骤从所期望的开始位置至结束位置读取所表述的文本来进行指定。
15.根据权利要求11所述的计算机可读存储介质,其特征在于,
上述电子设备还具备:带触摸面板的显示部,
在上述范围指定步骤中,按照用户的触摸操作,从所期望的开始位置至结束位置对显示于上述带触摸面板的显示部的文本进行指定。
CN201610171393.1A 2015-05-13 2016-03-24 声音输出装置以及声音输出方法 Active CN106168945B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2015-097837 2015-05-13
JP2015097837 2015-05-13
JP2015238293A JP6365520B2 (ja) 2015-05-13 2015-12-07 音声出力装置、音声出力方法、およびプログラム
JP2015-238293 2015-12-07

Publications (2)

Publication Number Publication Date
CN106168945A CN106168945A (zh) 2016-11-30
CN106168945B true CN106168945B (zh) 2021-09-28

Family

ID=57358899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610171393.1A Active CN106168945B (zh) 2015-05-13 2016-03-24 声音输出装置以及声音输出方法

Country Status (1)

Country Link
CN (1) CN106168945B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201266376Y (zh) * 2008-10-14 2009-07-01 无敌科技(西安)有限公司 利用组合音标查询单字的装置
CN102722538A (zh) * 2012-05-23 2012-10-10 缪江川 矩阵式英语电子词典
CN104517619A (zh) * 2013-09-20 2015-04-15 卡西欧计算机株式会社 声音输出控制装置及声音输出控制方法
CN104516871A (zh) * 2013-09-29 2015-04-15 无敌科技(西安)有限公司 字词结合语境测验方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050125228A1 (en) * 2003-12-08 2005-06-09 Samuels Derrick D. Digital electronic correction pen with audio pronunciation and spell check capabilities, with built-in memory. Also calculation processing... thereof...
JP2008058678A (ja) * 2006-08-31 2008-03-13 Casio Comput Co Ltd 音声出力装置及び音声出力プログラム
JP2008171208A (ja) * 2007-01-11 2008-07-24 Casio Comput Co Ltd 音声出力装置及び音声出力プログラム
JP6213089B2 (ja) * 2013-09-19 2017-10-18 カシオ計算機株式会社 音声学習支援装置、音声学習支援方法及びコンピュータの制御プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201266376Y (zh) * 2008-10-14 2009-07-01 无敌科技(西安)有限公司 利用组合音标查询单字的装置
CN102722538A (zh) * 2012-05-23 2012-10-10 缪江川 矩阵式英语电子词典
CN104517619A (zh) * 2013-09-20 2015-04-15 卡西欧计算机株式会社 声音输出控制装置及声音输出控制方法
CN104516871A (zh) * 2013-09-29 2015-04-15 无敌科技(西安)有限公司 字词结合语境测验方法

Also Published As

Publication number Publication date
CN106168945A (zh) 2016-11-30

Similar Documents

Publication Publication Date Title
US20160055763A1 (en) Electronic apparatus, pronunciation learning support method, and program storage medium
US20150073801A1 (en) Apparatus and method for selecting a control object by voice recognition
WO2016008128A1 (en) Speech recognition using foreign word grammar
EP2806336A1 (en) Text prediction in a text input associated with an image
US10025772B2 (en) Information processing apparatus, information processing method, and program
JP2020507165A (ja) データ可視化のための情報処理方法及び装置
US10824790B1 (en) System and method of extracting information in an image containing file for enhanced utilization and presentation
KR101567449B1 (ko) 음성인식에 기반한 애니메이션 재생이 가능한 전자책 단말기 및 그 방법
JP2005249829A (ja) 音声認識を行うコンピュータネットワークシステム
JP6365520B2 (ja) 音声出力装置、音声出力方法、およびプログラム
CN112149403A (zh) 一种确定涉密文本的方法和装置
CN106168945B (zh) 声音输出装置以及声音输出方法
CN110795918A (zh) 确定阅读位置的方法、装置及设备
US11606629B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
CN110428668B (zh) 一种数据提取方法、装置、计算机系统及可读存储介质
KR102201153B1 (ko) 전자책 서비스 제공 장치 및 방법
JP6055267B2 (ja) 文字列分割装置、モデルファイル学習装置および文字列分割システム
CN110390241B (zh) 信息处理装置、信息处理方法及计算机可读记录介质
JP2018005368A (ja) 出力態様決定システム
CN116430999A (zh) 一种语音助手实现指尖视觉交互技术的方法和系统
JP2022139053A5 (zh)
JP2997151B2 (ja) 漢字変換装置
CN116540873A (zh) 一种多模态交互实现方法、装置、系统及计算机可读存储介质
KR101434190B1 (ko) 음성신호를 이용한 전자도서 제어방법 및 장치
KR20220136801A (ko) 이미지를 이용한 중국어 연상학습 콘텐츠 제공 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant