CN110889265A - 信息处理设备和信息处理方法 - Google Patents

信息处理设备和信息处理方法 Download PDF

Info

Publication number
CN110889265A
CN110889265A CN201911128993.XA CN201911128993A CN110889265A CN 110889265 A CN110889265 A CN 110889265A CN 201911128993 A CN201911128993 A CN 201911128993A CN 110889265 A CN110889265 A CN 110889265A
Authority
CN
China
Prior art keywords
information processing
utterance
content
processing apparatus
present
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911128993.XA
Other languages
English (en)
Other versions
CN110889265B (zh
Inventor
武村知昭
桝永慎哉
藤田孝次
石绵克利
池永健一
楠元克敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to CN201911128993.XA priority Critical patent/CN110889265B/zh
Publication of CN110889265A publication Critical patent/CN110889265A/zh
Application granted granted Critical
Publication of CN110889265B publication Critical patent/CN110889265B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)
  • Stored Programmes (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请涉及信息处理设备和信息处理方法。提供一种信息处理器设备,包括对表示作为语音识别的结果而获得的发言的内容的字符串进行分析的分析单元,以及将表示发言的内容的字符串和分析结果显示在显示屏幕上的显示控制单元。

Description

信息处理设备和信息处理方法
技术领域
本公开涉及信息处理设备、信息处理方法、以及程序。
背景技术
已经制造了一种能够识别语音以执行处理的设备。还开发了一种使用语音输入的技术。例如,作为使用语音输入和另一输入的技术,存在下面专利文献1中描述的技术。
引用列表
专利文献
专利文献1:JP 2001-166914A
发明内容
技术问题
例如,在能够识别语音以执行处理的预先存在设备(在下文中,也被简称为“预先存在设备”)中,诸如,使用专利文献1中描述的技术的情况,用户不知道被识别用于执行处理的发言的内容的那一部分。因此,在使用预先存在设备的情况下,存在降低用户使用性的情形的可能性,诸如,“不能将设备响应语音发言所执行的行为满意地传输给用户”的情形。
本公开提议了一种信息处理设备、信息处理方法、以及一种程序,其中每种均是新的、经过改进的、并且能够提高用户的使用性。
解决的问题
根据本公开,提供一种信息处理设备,包括:分析单元,被配置为分析表示作为语音识别的结果而获得的发言的内容的字符串;和显示控制单元,被配置为将表示发言的内容的字符串和分析结果显示在显示屏幕上。
根据本公开,提供一种信息处理方法,包括:分析表示作为语音识别的结果而获得的发言的内容的字符串的步骤;和将表示发言的内容的字符串和分析结果显示在显示屏幕上的步骤。
根据本公开,提供一种程序,该程序用于使计算机执行下列步骤:分析表示作为语音识别的结果而获得的发言的内容的字符串的步骤;和将表示发言的内容的字符串和分析结果显示在显示屏幕上的步骤。
发明的有利效果
根据本公开,可以提高用户的使用性。
附图说明
【图1】图1是示出了与根据本实施方式的信息处理方法有关的处理的概况的示例图。
【图2】图2是示出了与根据本实施方式的信息处理方法有关的处理的第一实例的流程图。
【图3】图3是示出了与根据本实施方式的信息处理方法有关的处理的第二实例的流程图。
【图4】图4是示出了根据本实施方式的用于动作分析的词典的实施例的示例图。
【图5】图5是示出了根据本实施方式的分析结果的实施例及对应的应用和服务的示例图。
【图6】图6是示出了与根据本实施方式的信息处理方法有关的处理的第三实例的流程图。
【图7】图7是示出了根据本实施方式的用于得分(score)调整的词典的实施例的示例图。
【图8】图8是示出了根据本实施方式的用于时态分析的词典的实施例的示例图。
【图9】图9是示出了根据本实施方式的信息处理设备的配置的实施例的框图。
【图10】图10是示出了根据本实施方式的信息处理设备的硬件配置的实施例的示例图。
【图11】图11是示出了根据本实施方式的信息处理系统的实施例的示例图。
【图12】图12是示出了根据本实施方式的信息处理系统的处理的实施例的示例图。
具体实施方式
在下文中,将参考附图详细描述本发明的优选实施方式。应注意,在本说明书和附图中,以相同参考标号表示具有大致相同功能和结构的元件,并且省去重复性说明。
在下文中,将按照下列顺序进行描述。
1.根据实施方式的信息处理方法
2.根据实施方式的信息处理设备
3.根据实施方式的信息处理系统
4.根据实施方式的程序
(根据实施方式的信息处理方法)
在描述根据实施方式的信息处理设备的配置之前,首先描述根据实施方式的信息处理方法。在下文中,将描述根据本实施方式的信息处理方法,从而例证其中根据本实施方式的信息处理设备执行与根据本实施方式的信息处理方法有关的处理的情况。
[1]根据实施方式的信息处理方法的概况
如上所述,在使用先前存在的设备的情况下,用户不知道识别执行处理时所使用的发言的内容的哪一部分。因此,在使用预先存在的设备的情况下,存在发生减少用户可使用性的情形的可能性,诸如,“不能将设备响应语音发言而执行的行为满意地传输至用户”的情形。
鉴于此,根据本实施方式的信息处理设备对作为语音识别的结果而获得的发言的内容的字符串进行分析(在下文中,也被简称为“发言的内容的字符串”)(分析处理)。因此,根据本实施方式的信息处理设备将发言的内容的字符串和分析结果显示在显示屏幕上(显示控制处理)。
此处,例如,根据本实施方式的信息处理设备执行与关于显示发言的内容的语音数据的语音识别有关的处理,从而获得被处理的发言的内容的字符串。然而,获取根据本实施方式的被处理的发言的内容的字符串的方法并不局限于上述实施例。例如,根据本实施方式的信息处理设备可从诸如服务器等外部设备获取显示因与外部设备中的语音识别有关的处理而获得的发言的内容的字符串的数据,从而获得被处理的发言的内容的字符串。
与根据本实施方式的语音识别有关的处理的实施例包括使用统计方法的处理和使用隐式马尔可夫模型的处理。然而,与根据本实施方式的语音识别有关的处理不局限于上述实施例。例如,根据本实施方式的信息处理设备或者诸如服务器等外部设备可使用任意处理,通过该处理,可从显示发言的内容的语音数据获得发言的内容的字符串。
根据本实施方式的被信息处理设备促使显示发言的内容的字符串和的分析结果的显示屏幕的实施例包括自身设备(根据本实施方式的信息处理设备)中包括的显示单元(下面所述)。然而,根据本实施方式的被信息处理设备促使显示发言的内容的字符串和分析结果的显示屏幕并不局限于上述实施例。例如,根据本实施方式的信息处理设备可将发言的内容的字符串和分析结果显示在经由有线或者无线网络连接的外部设备中包括的显示设备的显示屏幕上。
因为根据本实施方式的信息处理设备将作为语音识别的结果而获得的发言的内容的字符串显示在显示屏幕上,所以执行发言的用户可可视地领会如何使发言经过语音识别处理。
因为根据本实施方式的信息处理设备一起显示发言的内容的字符串的分析结果和发言的内容的字符串,所以执行该发言的用户可可视地领会如何对发言进行分析。因此,执行该发言的用户可响应该发言领会被识别为在设备(例如,根据本实施方式的信息处理设备或者由根据本实施方式的信息处理设备控制器动作的设备)中执行处理时所使用的发言的内容的那一部分。
如同与根据本实施方式的信息处理方法有关的处理,根据本实施方式的信息处理设备执行(1)分析处理和(2)显示控制处理,并且由此可以提高用户的使用性。
图1是示出了与根据本实施方式的信息处理方法有关的处理的概况的示例图并且示出了通过根据本实施方式的信息处理设备而被显示在显示屏幕上的屏幕的实施例。
图1中的A示出了关于电视接收器的应用的选择屏幕的实施例,并且图1中的A1表示用于选择用户执行语音识别而使用的应用的图标的实施例。
例如,如图1中的B所示,通过用户操作选择图1中的A中所示的屏幕上的由图1中的A1表示的图标的情况下,显示用户执行语音识别所使用的应用的执行屏幕。
在用户对诸如图1中的B所示的屏幕上的麦克风等语音输入设备执行发言的情况下,根据本实施方式的信息处理设备基于显示发言的内容的字符串执行与根据本实施方式的信息处理方法有关的处理(1)(分子处理)。然后,例如,如图1中的C所示,根据本实施方式的信息处理设备执行与根据本实施方式的信息处理方法有关的处理(2)(显示控制处理)并且由此将发言的内容的字符串和分析结果显示在屏幕上。
此处,图1中的C示出了在用户发出“Ashita no XXX ga mitai”(我希望观看明天的XXX)的情况下所显示的屏幕的实施例。如图1中的C1所示,例如,根据本实施方式的信息处理设备显示表示发言的内容“Ashita no XXX ga mitai”(我希望观看明天的XXX)的字符串并且进一步显示分析结果。
图1中的C示出了其中根据本实施方式的信息处理设备通过使用引号而强化表示发言的内容的字符串的分析结果的实施例。然而,根据本实施方式的显示分析结果的方法并不局限于上述实施例。例如,根据本实施方式的信息处理设备可显示支持发言的内容的字符串的分析结果,以使得利用能够可视地改变字符的任意方法强化分析结果,诸如,在字符下面加下划线或者改变字符的颜色或者字体。
例如,如图1中的C中的C2所示,根据本实施方式的信息处理设备可执行与根据本实施方式的信息处理方法有关的处理(2)(显示控制处理),从而将对应于发言的内容的应用和/或对应于发言的内容的服务显示在显示屏幕上。
此处,对应于根据本实施方式的发言的内容的应用的实施例包括各种应用,诸如,用于显示电视广播的节目表的应用、与观看电视广播有关的应用、用于显示记录内容的列表的应用、与记录介质上记录的播放内容有关的应用、以及用于建立到诸如家庭网络等网络的连接的应用。对应于根据本实施方式的发言的内容的服务的实施例包括诸如视频服务、音乐服务、由图像上传网站提供的服务、以及由搜索站点提供的搜索服务等各种服务。
例如,如图1中的D所示,在选择图1中的C中的C2所示的“TV节目“的情况下,显示对应于选择的应用和选择设备的屏幕。
例如,如图1中的C中的C1所示,根据本实施方式的信息处理设备将表示发言的内容的字符串和分析结果显示在显示屏幕上。因此,例如,观看图1中的C中所示的屏幕的用户可基于表示发言的内容的字符串可视地领会如何使发言经过语音识别处理,并且因为显示了利用引号等强化的分析结果,所以还可可视地领会如何对发言进行分析。
因此,根据本实施方式的信息处理设备可提高用户的使用性。无需多言,由根据本实施方式的信息处理设备通过与根据本实施方式的信息处理方法有关的处理而显示的屏幕并不局限于图1中的C所示的实施例,并且通过根据本实施方式的信息处理设备而显示的屏幕并不局限于图1中的A、图1中的B、以及图1中的D所示的实施例。
[2]与根据实施方式的信息处理方法有关的处理的实施例
接着,将更为具体地描述根据本实施方式的信息处理设备中的与根据本实施方式的信息处理方法有关的处理。如上所述,例如,如同与根据本实施方式的信息处理方法有关的处理,根据本实施方式的信息处理设备执行处理(1)(分析处理)和处理(2)(显示控制处理)。
(1)分析处理
根据本实施方式的信息处理设备对表示作为语音识别的结果而获得的发言的内容的字符串进行分析。
例如,根据本实施方式的信息处理设备使用存储在存储单元(下面所述)或者外部记录介质中的用于语义分析的词典执行形态分析,以将表示发言的内容的字符串分割成诸如名词和动词等词。此处,例如,根据本实施方式的词典可以是数据库格式数据或者可以是表格格式数据。
例如,根据本实施方式的信息处理设备可使用存储在存储单元(下面所述)或者外部记录介质中的用于语义分析的词典对表示发言的内容的字符串进一步执行语义分析(或者概念分析)。
应注意,根据本实施方式的处理(1)(分析处理)并不局限于上述实施例。
例如,根据本实施方式的信息处理设备可基于表示发言的内容的字符串的句法分析结果或者基于表示发言的内容的字符串的句法分析结果和语义分析结果设置表示发言的内容的字符串的得分。
此处,例如,根据本实施方式的信息处理设备设置通过形态分析而分割的各个词的得分。更具体地,例如,根据本实施方式的信息处理设备设置各个被分割词的得分并且调整各个分割词的得分设置,从而设置对应于各个分割词的得分。下面将描述与根据本实施方式的得分设置有关的处理的实施例。
例如,根据本实施方式的下面所描述的执行处理中使用了处理(1)(分析处理)中所设置的得分。下面将描述与根据本实施方式的得分设置有关的处理的实施例和其中使用设置得分的处理的实施例。
例如,根据本实施方式的信息处理设备可对表示发言的内容的字符串执行动作分析。例如,通过使用存储在存储单元(下面所述)或者外部记录介质中的用于动作分析的词典确定由形态分析等分割的词中是否包括表示用于动作分析的词典中注册的动作的词,根据本实施方式的信息处理设备对表示发言的内容的字符串执行动作分析。
例如,处理(2)(显示控制处理)中使用了处理(1)(分析处理)中的动作分析的结果。下面将描述其中处理(2)(显示控制处理)中所使用的动作分析结果的处理的实施例。
例如,根据本实施方式的信息处理设备可对表示发言的内容的字符串执行时态分析。例如,通过使用存储在存储单元(下面所述)或者外部记录介质中的用于时态分析的词典确定由形态分析等分割的词中是否包括表示用于时态分析的词典中注册的时态的词,根据本实施方式的信息处理设备对表示发言的内容的字符串执行时态分析。
例如,根据本实施方式的下面所描述的执行处理中使用了处理(1)(分析处理)中的时态分析的结果。下面将描述其中根据本实施方式的下面所描述的执行处理中所使用的时态分析结果的处理的实施例。
在一些情况下,由形态分析等而分割的词中存在语音识别的波动。例如,根据本实施方式的语音识别的波动指“原本应由具体的中文字符表达的词(Kanji)确被日文字音表表达(Hiragana)”和“其中发出词的缩写名称、而非其正式名称的情况,被分割的词变成了缩写名称”。在发生上面所述的语音识别波动的情况下,例如,在根据本实施方式的下面所描述的执行处理中,存在不能正常执行处理或者不能获得用户希望的处理结果的可能性。
鉴于此,例如,根据本实施方式的信息处理设备可校正语音识别的波动,以防止不能正常执行处理的上述情形。例如,根据本实施方式的信息处理设备通过使用存储在存储单元(下面所述)或者外部记录介质中的用于波动吸收(fluctuation absorption)的词典替换通过形态分析等分割的词而校正语音识别的波动。
在根据本实施方式的信息处理设备在处理(1)(分析处理)中校正语音识别波动的情况下,将表示发言的内容(其中,已经校正语音识别的波动)的字符串显示在处理(2)(显示控制处理)中所显示的屏幕上。
例如,如同根据本实施方式的分析处理,根据本实施方式的信息处理设备执行上述处理之中的一个或者两个或者多个处理。无需多言,根据本实施方式的分析处理并不局限于上面所述处理的实施例。
(2)显示控制处理
根据本实施方式的信息处理设备在处理(1)(分析处理)中将表示发言的内容的字符串和分析结果显示在显示屏幕上。此处,例如,如图1中的C中的C1所示,根据本实施方式的信息处理设备显示表示发言的内容的字符串和分析结果,以强化分析结果。
例如,根据本实施方式的信息处理设备可将表示发言的内容的字符串显示在显示屏幕上,因此,字符串可编辑。例如,在根据本实施方式的信息处理设备中,可以对表示发言的内容的整个字符串进行编辑或者对表示发言的内容的字符串中的通过形态分析等分割的每个词进行编辑。
此处,例如,根据本实施方式的信息处理设备允许用户使用诸如键盘等输入设备或者诸如软件键盘等虚拟输入设备通过输入操作对表示发言的内容的字符串进行编辑。应注意,根据本实施方式的编辑表示发言的内容的字符串的方法并不局限于上述实施例。例如,根据本实施方式的信息处理设备允许用户通过用户的发言对表示发言的内容的字符串进行编辑。
例如,在执行与语音识别有关的处理的情况下,由于错误识别,语音识别结果中可能存在错误。在预先存在的设备中,在不基于错误识别的结果做任何事宜的情况下执行该处理并且由此需要重试该处理,在重试时,用户需要再次执行发言。此外,如上所述,在使用预先存在的设备的情况下,用户不能获知被识别为用于执行该处理时所使用的发言的内容的那一部分。而且,即使在预先存在的设备中再次执行发言,也可能再次发生错误识别,并且由此可能发生降低用户使用性的情形,诸如,用户需要多次执行发言以实现用户希望的动作的情形。
如上所述,相反,根据本实施方式的信息处理设备将表示发言的内容的字符串显示在显示屏幕上,因此,执行该发言的用户可可视地领会语音识别的错误识别。根据本实施方式的信息处理设备将表示发言的内容的字符串显示在显示屏幕上,因此,字符串可编辑,因此,例如,即使作为语音识别的结果获得的发言的内容的字符串中存在错误,用户也可校正错误并且可使根据本实施方式的信息处理设备(或者外部设备)执行下面所述的执行处理。
因此,例如,通过显示表示发言的内容的字符串,以使得字符串可编辑,根据本实施方式的信息处理设备可鼓励用户校正发言的内容并且可使自身设备(根据本实施方式的信息处理设备)或者外部设备更为准确地执行该处理。此外,例如,通过显示表示发言的内容的字符串,以使得字符串可编辑,防止了用户需要多次执行发言以实现用户希望的动作的情形,并且由此提供了用户的使用性。
例如,如图1中的C中的C2所示,根据本实施方式的信息处理设备可基于处理(1)(分析处理)中的分析结果将对应于发言的内容的应用和/或对应于发言的内容的服务显示在显示屏幕上。
此处,例如,根据本实施方式的信息处理设备基于性能信息确定显示屏幕上所显示的应用的候选项和/或显示屏幕上所显示的服务的候选项。因此,例如,根据本实施方式的信息处理设备从确定的应用候选项和/或确定的服务候选项选择对应于处理(1)(分析处理)中的分析结果的应用和/或服务并且将选择的应用和/或服务显示在显示屏幕上。
根据本实施方式的性能信息的实施例包括显示设备具有的性能的数据(例如,显示设备具有的功能的数据和显示各个功能的性能的数据)。此处,根据本实施方式的信息处理设备在该处理中所使用的性能信息的实施例包括自身设备(根据本实施方式的信息处理设备)或者由根据本实施方式的信息处理设备控制器功能的外部设备的性能信息。在下文中,对应于根据本实施方式的信息处理设备在该处理中所使用的性能信息的设备,即,由根据本实施方式的信息处理设备控制其功能的设备也被称之为“要控制的设备”。
例如,根据本实施方式的信息处理设备可基于性能信息从对应于处理(1)(分析处理)中的分析结果的应用和/或服务的列表中确定显示屏幕上所显示的应用的候选项和/或显示屏幕上所显示的服务的候选项。在上述情况下,根据本实施方式的信息处理设备将确定的应用候选项和/或确定的服务候选项显示在显示屏幕上。
例如,如图1中的C中的C2所示,在其中显示对应于发言的内容的应用和/或对应于发言的内容的服务的情况下,根据本实施方式的信息处理设备可显示该应用和/或该服务,以使得强化该应用和/或该服务。
此处,作为根据本实施方式的强化该应用和/或服务的方法,例如,调整该应用和该服务的显示顺序,以使得将被强化的应用和/或服务放置在图1中的C中的C2中所示的应用和服务列表的前方。应注意,根据本实施方式的强化该应用和/或服务的方法并不局限于上述实施例。例如,根据本实施方式的信息处理设备可显示该应用和/或服务,以使得利用能够可视地改变该应用和/或服务的任意方法强化该应用和/或服务。例如,任意方法是提供表示该应用和/或服务时与发言的内容的分析结果有关的应用和/或服务的图标(例如,麦克风图标)、提供表示推荐该应用和/或该服务、或者改变字符颜色或者字体的图标。
例如,在处理(1)(分析处理)中对表示发言的内容的字符串执行动作分析的情况下,根据本实施方式的信息处理设备基于分析结果中包括的动作分析的结果强化显示屏幕上的应用和/或服务。
更具体地,在对表示发言的内容的字符串执行动作分析的结果表示诸如“想要观看”等观看动作的情况下,根据本实施方式的信息处理设备强化了与观看有关的应用和服务,诸如,用于显示电视广播的节目表的应用、与观看电视广播有关的应用、与记录介质中存储的播放内容有关的应用、视频服务、以及由图像上传网站提供的服务等。在对表示发言的内容的字符串执行动作分析的结果表示诸如“想要收听”等收听动作的情况下,根据本实施方式的信息处理设备强化与播放语音(包括音乐)有关的硬化和服务,诸如,与存储在记录介质中的播放内容和音乐服务有关的应用等。
例如,在对表示发言的内容的字符串执行动作分析的结果不表示任何具体动作的情况下,根据本实施方式的信息处理设备可强化设置应用或者诸如由搜索站点提供的搜索服务等服务。
如上所述,例如,根据本实施方式的信息处理设备强化显示屏幕上所显示的应用和/或服务。
应注意,与强化根据本实施方式的应用和/或服务有关的处理并不局限于上述实施例。例如,在设置根据本实施方式的每项应用和服务的优度的情况下,根据本实施方式的信息处理设备可显示具有更高优度的应用和/或服务,以使得更为清晰地强化被强化的应用和服务之中的应用和/或服务。
例如,根据本实施方式的信息处理设备执行上述处理,如根据本实施方式的显示控制处理。无需多言,根据本实施方式的显示控制处理并不局限于上述所述处理的实施例。
例如,如同与根据本实施方式的信息处理方法有关的处理,根据本实施方式的信息处理设备执行上述所述处理(1)(分析处理)和处理(2)(显示控制处理)。
应注意,与根据本实施方式的信息处理方法有关的处理并不局限于处理(1)(分析处理)和处理(2)(显示控制处理)。
例如,根据本实施方式的信息处理设备可执行与屏幕上选择的对应于发言的内容的应用和对应于发言的内容的服务有关的处理,诸如,显示屏幕上显示对应于发言的内容的应用和对应于发言的内容的服务(执行处理)。
更具体地,例如,如同根据本实施方式的执行处理,根据本实施方式的信息处理设备执行下面所描述的处理(a)、处理(b)、或者处理(c)。应注意,下面将描述根据本实施方式的执行处理的具体实施例。
(a)根据实施方式的执行处理的第一实例
例如,在处理(1)(分析处理)中对表示发言的内容的字符串执行得分设置的情况下,根据本实施方式的信息处理设备基于设置参考值与设置得分之间的比较结果确定表示发言的内容的字符串的一部分或者全部作为在执行对应于发言的内容的应用或者执行与对应于发言的内容的服务有关的处理时所使用的字符串。然后,根据本实施方式的信息处理设备利用确定的字符串执行对应于发言的内容的应用或者与对应于发言的内容的服务有关的处理。
此处,例如,根据本实施方式的参考值可以是提前设置的固定值或者可以是基于用户操作等改变的可变值。
更具体地,例如,在表示发言的内容的字符串中并不存在大于参考值的得分(或者等于或大于参考值的得分;同样适用于下列描述)的情况下,根据本实施方式的信息处理设备在该处理中使用表示发言的内容的整个字符串。同时,例如,在表示发言的内容的字符串中存在大于参考值的得分的情况下,根据本实施方式的信息处理设备在该处理中使用表示发言的内容的字符串中具有大得分的字符串的一个或者两个或者多个部分。
(b)根据实施方式的执行处理的第二实例
例如,在处理(1)(分析处理)中对表示发言的内容的字符串执行时态分析的情况下,根据本实施方式的信息处理设备基于时态分析结果在该处理中选择性地使用表示字符串(表示发言的内容)中包括的时态的词。更具体地,在上述情况下,在时态分析结果表示字符串(表示发言的内容)中包括的时态的词的情况下,根据本实施方式的信息处理设备在该处理中使用表示字符串(表示发言的内容)中包括的时态的词。
(c)根据实施方式的执行处理的第三实例
例如,根据本实施方式的信息处理设备还可执行其中将根据第一实例的处理与根据第二实例的处理结合的处理。
例如,如同根据本实施方式的执行处理,根据本实施方式的信息处理设备执行上述所述处理(a)、处理(b)、或者处理(c)。
与根据本实施方式的信息处理方法有关的处理并不局限于“处理(1)(分析处理)和处理(2)(显示控制处理)”与“处理(1)(分析处理)、处理(2)(显示控制处理)、以及执行处理”。
例如,根据本实施方式的信息处理设备可将处理(1)(分析处理)中的分析结果记录为日志(日志记录控制处理)。
此处,根据本实施方式的信息处理设备记录日志的目标实例包括存储单元(下面所述)、连接至根据本实施方式的信息处理设备的外部记录介质、以及经由网络(或者直接)可通信的外部设备。根据本实施方式的网络的实施例包括诸如局域网(LAN)或者广域网(WAN)等有线网络、诸如无线局域网(WLAN)或者经由基站的无线广域网(WWAN)等无线网络、以及使用诸如传输控制协议/因特网协议(TCP/IP)等通信协议的因特网。
例如,因为根据本实施方式的信息处理设备将分析结果记录为日志,所以用于执行与语音识别有关的处理的设备(例如,根据本实施方式的信息处理设备或者诸如服务器等外部设备)可使用该日志,以提高语音识别的准确度或者改善应用的行为。
[3]与根据实施方式的信息处理方法有关的处理的具体实例
接着,将描述与根据本实施方式的信息处理方法有关的处理的具体实例。在下文中,描述了假定由根据本实施方式的信息处理设备执行与根据本实施方式的信息处理方法有关的处理。
(A)与根据实施方式的信息处理方法有关的处理的第一实例
图2是示出了与根据本实施方式的信息处理方法有关的处理的第一实例的流程图。此处,例如,图2中示出的步骤S104和S106的处理对应于处理(1)(分析处理),并且图2中示出的步骤S108的处理对应于处理(2)(显示控制处理)。图2示出了其中根据本实施方式的信息处理设备对显示发言的内容的语音数据执行与语音识别有关的处理的实施例。应注意,如上所述,可以在诸如服务器等外部设备中对显示发言的内容的语音数据执行与语音识别有关的处理。
根据本实施方式的信息处理设备确定是否检测语音(S100)。例如,在信息处理设备接收显示从诸如麦克风等语音输入设备传输的发言的内容的语音数据的情况下,根据本实施方式的信息处理设备对语音进行检测。
在步骤S100中,在不确定是否对语音进行检测的情况下,根据本实施方式的信息处理设备并不继续该处理,直至其确定对语音进行检测。
在步骤S100中,在确定对语音进行检测的情况下,根据本实施方式的信息处理设备对语音数据执行与语音识别有关的处理(S102)。例如,如同与语音识别有关的处理,根据本实施方式的信息处理设备执行使用统计方法的处理或者使用隐式马尔可夫模型的处理。
根据本实施方式的信息处理设备对表示从步骤S102的处理获得的发言的内容的字符串进行分析(S104)。此处,例如,根据本实施方式的信息处理设备对表示发言的内容的字符串执行句法分析和语义分析。
当执行步骤S104的处理时,根据本实施方式的信息处理设备校正语音识别的波动(S016)。例如,根据本实施方式的信息处理设备通过使用存储在存储单元(下面所述)等中的用于波动吸收的词典替换由形态分析等分割的词而校正语音识别的波动。
当执行步骤S106的处理时,根据本实施方式的信息处理设备显示表示步骤S104中显示屏幕上的发言的内容和分析结果的字符串(S108)。例如,如图1中的C中的C1所示,根据本实施方式的信息处理设备显示表示发言的内容的字符串的分析结果,以使得强化表示发言的内容的字符串的分析结果。
例如,如同与根据本实施方式的信息处理方法有关的处理,根据本实施方式的信息处理设备执行如图2中所示的处理。例如,通过执行图2中所示的处理,实现了与根据本实施方式的信息处理方法有关的处理(1)(分析处理)和处理(2)(显示控制处理)。
因此,例如,通过执行图2中所示的处理,根据本实施方式的信息处理设备可提高用户的使用性。
应注意,与根据本实施方式的第一实例的信息处理方法有关的处理并不局限于图2中所示的实例。
例如,根据本实施方式的信息处理设备并不一定需要图2中步骤S106的处理。例如,即使在不执行步骤S106的处理的情况下,根据本实施方式的信息处理设备也可执行与根据本实施方式的信息处理方法有关的处理(1)(分析处理)和处理(2)(显示控制处理)。因此,例如,即使在不执行步骤S016的处理的情况下,根据本实施方式的信息处理设备也可提高用户的使用性。
(B)与根据实施方式的信息处理方法有关的处理的具体实例
与根据本实施方式的信息处理方法有关的处理并不局限于根据第一实例的处理。例如,如图1中的C中的C2所示,在根据本实施方式的处理(2)(显示控制处理)中,根据本实施方式的信息处理设备可基于处理(1)(分析处理)中的分析结果将例如对应于发言的内容的应用和/或对应于发言的内容的服务进一步显示在显示屏幕上。
图3是示出了与根据本实施方式的信息处理方法有关的处理的第二实例的流程图。图3示出了在根据本实施方式的信息处理设备将对应于发言的内容的应用和/或对应于发言的内容的服务进一步显示在显示屏幕上的情况下执行的处理的实例。此处,例如,图3中的步骤S208的处理对应于处理(1)(分析处理),并且图3中的步骤S210的处理对应于处理(2)(显示控制处理)。例如,根据图3中所示的第二实例的处理可以与根据图2中所示的第一实例的处理并行执行或者可在执行根据图2中所示的第一实例的处理之后执行。
根据本实施方式的信息处理设备确定是否获取要控制的设备的性能信息(S200)。在步骤S200中确定获取要控制的设备的性能信息的情况下,根据本实施方式的信息处理设备执行下面所述步骤S204的处理。
在步骤S200中不确定是否获取要控制的设备的性能信息的情况下,根据本实施方式的信息处理设备从要控制的设备获取性能信息(S202)。例如,在根据本实施方式的要控制的设备是自身设备(根据本实施方式的信息处理设备)的情况下,根据本实施方式的信息处理设备生成性能信息,以获取性能信息。同时,例如,在根据本实施方式的要控制的设备是外部设备的情况下,根据本实施方式的信息处理设备将包括关于性能信息的指令传输的传输命令的性能信息传输请求传输至外部设备,以获取性能信息。
例如,在步骤S200中确定获取要控制的设备的性能信息的情况下,或者在步骤S202的处理中获取要控制的设备的性能信息的情况下,根据本实施方式的信息处理设备基于性能信息指定应用和服务列表中对应于要控制的设备的应用或者服务(S204)。
根据本实施方式的信息处理设备确定是否获取表示发言的内容的字符串(S206)。例如,在步骤S206中不确定是否获取表示发言的内容的字符串的情况下,根据本实施方式的信息处理设备并不继续该处理,直至确定获取表示发言的内容的字符串。
在步骤S206中确定获取表示发言的内容的字符串的情况下,根据本实施方式的信息处理设备对表示发言的内容的字符串执行动作分析(S208)。例如,通过使用存储在存储单元(下面所述)中的用于动作分析的词典确定由图2中的步骤S104的处理中的形态分析等分割的词中是否包括表示用于动作分析的词典中注册动作的词,根据本实施方式的信息处理设备可对表示发言的内容的字符串执行动作分析。
图4是示出了用于根据本实施方式的动作分析的词典的实施例的示例图。此处,在图4中,以“关键词”表示词并且以“类型”表示动作。图4中所示的A示出了表格格式(其中,英文词和动作彼此相关联)中用于动作分析的词典的实施例,并且图4中所示的B示出了表格格式(其中,日文词与动作彼此相关联)中用于动作分析的词典的实施例。图4示出了其中用于动作分析的词典中的每个词均与表示语音部分的信息相关联的实施例。
例如,根据本实施方式的信息处理设备确定由形态分析分割的词中是否包括表示用于图4中所示的动作分析的词典中注册的动作的词。在确定其中包括该词的情况下,将对应于该词的动作指定为由字符串(表示发言的内容)表示的动作并且由此对表示发言的内容的字符串中的动作进行分析。
无需多言,根据本实施方式的与对表示发言的内容的字符串执行的动作分析有关的处理并不局限于上述实施例并且根据本实施方式的用于动作分析的词典并不局限于图4中所示的实施例。
返回参考图3,描述与根据本实施方式的信息处理方法有关的处理的第二实例。当执行步骤S208中的处理时,根据本实施方式的信息处理设备显示对应的应用或者服务,以使得在步骤S208的处理中基于动作分析的结果强化对应的应用或者服务(S210)。
例如,在步骤S208中对表示发言的内容的字符串执行动作分析的结果表示诸如“想要观看”等观看动作的情况下,根据本实施方式的信息处理设备强化与观看有关的应用和/或服务,诸如,用于显示电视广播的节目表的应用等。在步骤S208中对表示发言的内容的字符串执行动作分析的结果表示诸如“想要收听”等收听动作的情况下,根据本实施方式的信息处理设备强化与播放语音(包括音乐)有关的应用和/或服务,诸如,与记录介质中存储的播放内容有关的应用。在步骤S208中对表示发言的内容的字符串执行动作分析的结果不表示任何具体操作的情况下,根据本实施方式的信息处理设备可强化设置应用或者诸如通过搜索站点提供的搜索服务等服务。
例如,可以在步骤S208中对表示发言的内容的字符串执行动作分析的结果中设置被优先显示的应用和服务。
图5是示出了根据本实施方式的分析结果的实施例及对应的应用和服务的示例图。此处,在图5中,以“时态或者动作类型”表示分析结果,并且以“高优先级分类”表示服务。图5示出了其中分析结果与应用和服务彼此相关联的表格的实施例。图5中所示的A示出了时态分析的结果与对应于时态分析的结果的应用和服务的实施例。图5中的B示出了动作分析的结果与对应于动作分析的结果的应用和服务的实施例。图5中所示的C示出了在表示发言的内容的字符串中既不包括时态又不包括动作的情况下作为时态分析和动作分析的结果的对应应用或者服务的实施例。
例如,通过参考图5中所示的表格,根据本实施方式的信息处理设备在步骤S208中指定对应于对表示发言的内容的字符串所执行的动作分析结果的应用和/或服务。因此,例如,根据本实施方式的信息处理设备将指定的应用和/或服务优先显示在显示屏幕上。
例如,如同与根据本实施方式的信息处理方法有关的处理,根据本实施方式的信息处理设备可并行处理图3中所示的处理与根据图2中所示的第一实例的处理,或者可在执行根据图2中所示的第一实例的处理之后执行图3中所示的处理。
因此,例如,如图1中的C中的C2所示,通过执行图3中所示的处理,根据本实施方式的信息处理设备可基于处理(1)(分析处理)中的分析结果将对应于发言的内容的应用和/或对应于发言的内容的服务进一步显示在显示屏幕上。无需多言,与根据本实施方式的第二实例的信息处理方法有关的处理并不局限于图3中所示的实施例。
(C)与根据实施方式的信息处理方法有关的处理的第三实例
应注意,与根据本实施方式的信息处理方法有关的处理并不局限于根据第一实例的处理或者根据第二实例的处理。例如,根据本实施方式的信息处理设备可进一步执行根据本实施方式的上述所述执行处理。
图6是示出了与根据本实施方式的信息处理方法有关的处理的第三实例的流程图。如同根据本实施方式的执行处理,图6示出了其中根据本实施方式的信息处理设备利用表示发言的内容的字符串执行与搜索内容有关的处理的实施例。在图6中,由根据本实施方式的信息处理设备搜索的内容的实施例包括诸如存储在记录介质(诸如,光盘或者磁盘)等记录介质中的图像数据和语音数据等内容数据、电视广播节目、以及经由网络中的搜索服务而获得的各种信息和数据。
此处,例如,图6中的步骤S308至S318的处理对应于处理(1)(分析处理),并且图6中的步骤S314和S320至S324的处理对应于执行处理。例如,图6中所示的根据第三实例的处理可以与图2中所示的根据第一实例的处理并行执行,或者可以在执行图2中所示的第一实例的处理之后执行。可替代地,例如,图6中所示的根据第三实例的处理可以与图3中所示的根据第二实例的处理并行执行。
根据本实施方式的信息处理设备确定是否获取要控制的设备的性能信息(S300)。在步骤S300中确定获取要控制的设备的性能信息的情况下,根据本实施方式的信息处理设备执行下面所述的步骤S304的处理。
在步骤S300中不确定是否获取要控制的设备的性能信息的情况下,根据本实施方式的信息处理设备以图3中的步骤S202的相同方式从要控制的设备获取性能信息(S302)。
在步骤S300中确定获取要控制的设备的性能信息的情况下,或者在步骤S302的处理中确定获取要控制的设备的性能信息的情况下,根据本实施方式的信息处理设备基于性能信息从应用和服务的列表中指定对应于要控制的设备的应用和/或服务(S304)。
根据本实施方式的信息处理设备确定是否获取表示发言的内容的字符(S306)。例如,在步骤S306中不确定是否获取表示发言的内容的字符串的情况下,根据本实施方式的信息处理设备并不继续该处理,直至确定获取表示发言的内容的字符串。
在步骤S306中确定获取表示发言的内容的字符串的情况下,根据本实施方式的信息处理设备设置表示发言的内容的字符串的参考得分(S308)。此处,根据本实施方式的信息处理设备在图2中的步骤S104的处理中将通过形态分析等分割的各个分割词的参考得分设置为“1”。例如,在表示发言的内容的字符串(或者已校正语音识别的波动的字符串)是图1中的C所示的“Ashita no XXX ga mitai”(我想要观看明天的XXX)的情况下,根据本实施方式的信息处理设备将词“Ashita”/“no”/“XXX”/“ga”/“mi”/“ta”/“i”中的每个的参考得分设置为“1”。无需多言,根据本实施方式的参考得分并不局限于“1”。
当在步骤S308中设置参考得分时,根据本实施方式的信息处理设备调整所设置的参考得分(S310)。例如,根据本实施方式的信息处理设备利用存储在存储单元(下面所述)或者外部记录介质中的用于得分调整的词典调整所设置的参考得分。
图7是示出了根据本实施方式的用于得分调整的词典的实施例的示例图。此处,在图7中,以“关键词”表示词,并且以“附加值”表示用于调整得分的调整值。图7中所示的A示出了表格格式(其中,英文词与调整值彼此相关联)中用于得分调整的词典的实施例,并且图7中所示的B示出了表格格式(其中,日文词与调整值彼此相关联)中用于得分调整的词典的实施例。
例如,根据本实施方式的信息处理设备通过参考图7中所示的用于得分调整的词典在图2中的步骤S104的处理中指定对应于通过形态分析等而分割的各个词的调整值。因此,例如,根据本实施方式的信息处理设备通过将对应于各个指定词的调整值添加到对应词的参考得分中而调整所设置的参考得分。
例如,在表示发言的内容的字符串(或者其中已经校正语音识别的波动的字符串)是图1中的C所示的“Ashita no XXX ga mitai”(我想要观看明天的XXX)的情况下,根据本实施方式的信息处理设备调整相应词“Ashita”/“no”/“XXX”/“ga”/“mi”/“ta”/“i”的得分。下面引用了调整得分的实施例。无需多言,调整得分并不局限于下列实施例。
“Ashita”的得分:“1.3”
“no”的得分:“1”
“XXX”的得分:“2”
“ga”的得分:“1”
“mi”的得分:“0.5”
“ta”的得分:“1”
“i”的得分:“1”
无需多言,与针对根据本实施方式的表示发言的内容的字符串所设置的得分调整有关的处理并不局限于上述实施例,并且根据本实施方式的用于得分调整的词典并不局限于图7中所示的实施例。
返回参考图6,将描述与根据本实施方式的信息处理方法有关的处理的第三实例。当执行步骤S310中的处理时,根据本实施方式的信息处理设备确定表示发言的内容的字符串中是否存在大于设置参考值的得分(S314)。
例如,在步骤S314中不确定是否存在大于设置参考值的得分的情况下,根据本实施方式的信息处理设备利用表示发言的内容的整个字符串搜索内容(S314)。
例如,在步骤S314中确定存在大于设置参考值的得分的情况下,根据本实施方式的信息处理设备基于设置得分确定搜索词(S316)。
例如,根据本实施方式的信息处理设备确定表示发言的内容的字符串中具有最大得分的字符串的一部分作为搜索词。例如,在表示发言的内容的字符串(或者已经校正语音识别的波动的字符串)是图1中的C所示的“Ashita no XXX ga mitai”(我想要观看明天的XXX)的情况下获得的上述所述调整得分的实施例中,“XXX”的得分是调整得分中的最大值。因此,例如,在上述情况下,根据本实施方式的信息处理设备确定“XXX”作为搜索词。此处,在步骤S316中将“XXX”确定为搜索词并且然后在执行下面所述步骤S318之后执行各个处理的情况下显示在显示屏幕上的屏幕的实施例是图1中的C所示的屏幕。无需多言,在步骤316中将“XXX”确定为搜索词并且然后在执行下面所述步骤S318之后执行各个处理的情况下显示在显示屏幕上的屏幕并不局限于图1中的C所示的屏幕。
例如,根据本实施方式的信息处理设备可确定表示发言的内容的字符串中具有大得分的字符串的多个部分作为搜索词。例如,在使用字符串的多个部分的情况下,根据本实施方式的信息处理设备通过对字符串的多个部分执行AND搜索或者对字符串的多个部分执行OR搜索而搜索内容。
当执行步骤S316中的处理时,根据本实施方式的信息处理设备对表示发言的内容的字符串执行时态分析(S318)。例如,通过使用存储在存储单元(下面所述)中的用于时态分析的词典确定通过形态分析等分割的词中是否包括用于时态分析的词典中注册的时态的词,根据本实施方式的信息处理设备对表示发言的内容的字符串执行时态分析。
图8是示出了根据本实施方式的用于时态分析的词典的实施例的示例图。此处,在图8中,以“关键词”表示词,并且以“类型”表示对应的时态。图8中所示的A示出了表格格式(其中,英文词及对应的时态彼此相关联)中的时态分析的词典的实施例,并且图8中所示的B示出了表格格式(其中,日文词与对应时态彼此相关联)中的用于时态分析的词典的实施例。
例如,根据本实施方式的信息处理设备通过参考图8中所示的用于时态分析的词典在图2的步骤S104的处理中确定通过形态分析等分割的词中是否包括表示用于时态分析的词典中注册的时态的词。例如,在通过形态分析等分割的词中包括表示时态的词的情况下,根据本实施方式的信息处理设备确定对应于该词的时态作为表示发言的内容的字符串中包括的时态。例如,在通过形态分析等分割的词中不包括表示时态的词的情况下,根据本实施方式的信息处理设备确定表示发言的内容的字符串中不包括表示时态的字符串。
无需多言,根据本实施方式的与对表示发言的内容的字符串执行的时态分析有关的处理并不局限于上述实施例,并且根据本实施方式的用于时态分析的词典并不局限于图8中所示的实施例。
返回参考图6,将描述与根据本实施方式的信息处理方法有关的处理的第三实例。当执行步骤S318中的处理时,根据本实施方式的信息处理设备确定表示发言的内容的字符串中是否存在表示时态的字符串(S320)。例如,在步骤S318中确定表示发言的内容的字符串中包括时态的情况下,根据本实施方式的信息处理设备确定表示发言的内容的字符串中存在表示时态的字符串。
在步骤S320中不确定表示发言的内容的字符串中存在表示时态的字符串的情况下,根据本实施方式的信息处理设备使用在步骤S316中确定的搜索词搜索内容(S322)。
在步骤S320中确定表示发言的内容的字符串中存在表示时态的字符串的情况下,根据本实施方式的信息处理设备通过将在步骤S318中确定的时态设置为参数而利用在步骤S316中确定的搜索词搜索内容。
例如,在确定时态是过去时的情况下,根据本实施方式的信息处理设备搜索诸如存储在光盘或者磁盘等记录介质中的图像数据和语音数据等内容数据(内容实施例)。同时,例如,在确定时态是将来时的情况下,根据本实施方式的信息处理设备搜索电视广播的节目(内容实施例)。
例如,如同与根据本实施方式的信息处理方法有关的处理,根据本实施方式的信息处理设备可并行执行图6中所示的处理与根据图2中所示的第一实例的处理或者在执行图2中所示的第一实例的处理之后执行图6中所示的处理,或者可进一步并行执行图6中所示的处理与根据图3中所示的第二实例的处理。
因此,例如,通过执行图6中所示的处理,根据本实施方式的信息处理设备可执行与屏幕上选择的对应于发言的内容的应用或者对应于发言的内容的服务有关的处理,诸如,图1中的C所示的屏幕,对应于发言的内容的应用和对应于发言的内容的服务被显示在该屏幕上。
应注意,与根据本实施方式的第三实例的信息处理方法有关的处理并不局限于图6中示出的实施例。例如,根据本实施方式的信息处理设备可以不执行与图6中的步骤S318、S312、以及S324中的时态有关的处理。
例如,如同与根据本实施方式的信息处理方法有关的处理,根据本实施方式的信息处理设备执行根据(A)中所描述的第一实例的处理、根据(B)中所描述的第二实例的处理、以及根据(C)中所描述的第三实例的处理。无需多言,与根据本实施方式的信息处理方法有关的处理并不局限于上述处理。
(根据实施方式的信息处理设备)
接着,将描述能够执行与根据上述所述实施方式的信息处理方法有关的处理的根据本实施方式的信息处理设备的配置的实例。
图9是示出了根据本实施方式的信息处理设备100的配置的实施例的框图。例如,信息处理设备100包括通信单元102和控制单元104。
例如,信息处理设备100可包括只读内存(ROM;未示出)、随机存取内存(RAM;未示出)、存储单元(未示出)、用户可操作的操作单元(未示出)、以及在显示屏幕上显示各个屏幕的显示单元(未示出)。例如,在信息处理设备100中,通过用作数据传输路径的总线连接上述组成元件。
此处,ROM(未示出)存储由控制单元104所使用的程序或者诸如算法参数等控制数据。RAM(未示出)临时存储由控制单元104执行的程序。
存储单元(未示出)是被包括在信息处理设备100中的存储单元并且存储诸如各种词典和应用等各种数据。此处,存储单元(未示出)的实施例包括诸如硬盘等磁记录介质和诸如闪存内存等非易失性内存。存储单元(未示出)可被可拆卸地安装在信息处理设备100上。
操作单元(未示出)的实施例包括下面所描述的操作输入设备,并且显示单元(未示出)的实施例包括下面所描述的显示设备。
【信息处理设备100的硬件配置的实例】
图10是示出了根据本实施方式的信息处理设备100的硬件配置的实施例的示例图。例如,信息处理设备100包括MPU 150、ROM 152、RAM154、记录介质156、输入和输出接口158、操作输入设备160、显示设备162、以及通信接口164。例如,在信息处理设备100中,通过用作数据传输路径的总线166连接组成元件。
例如,MPU 150包括微处理单元(MPU)和各个处理电路并且用作控制整个信息处理设备100的控制单元104。例如,在信息处理设备100中,MPU 150用作下面所描述的分析单元110、显示控制单元112、日志记录控制单元114、以及处理单元116。
ROM 152存储诸如MPU 150所使用的计算参数和程序等控制数据。例如,RAM 154临时存储由MPU 150执行的程序。
记录介质156用作存储单元(未示出)并且存储诸如各种词典和应用等各种数据。此处,记录介质156的实施例包括诸如硬盘等磁记录介质和诸如闪存内存等非易失性内存。记录介质156可被可拆卸地安装在信息处理设备100上。
例如,输入和输出接口158连接操作输入设备160或者显示设备162。操作输入设备160用作操作单元(未示出),并且显示设备162用作显示单元(未示出)。此处,输入和输出接口158的实施例包括通用串行总线(USB)终端、数字可视接口(DVI)终端、高清晰多媒体接口(HDMI)(注册商标)终端、以及各个处理电路。例如,操作输入设备160被包括在信息处理设备100中并且连接至信息处理设备100中的输入和输出接口158。操作输入设备160的实施例包括按钮、方向键、诸如滚轮按钮等转动类型选择器、及其组合。例如,显示设备162被包括在信息处理设备100中并且连接至信息处理设备100中的输入和输出接口158。显示设备162的实施例包括液晶显示器(LCD)和有机电致发光(EL)显示器(也被称为有机发光二极管(OLED)显示器)。
无需多言,输入和输出接口158可作为信息处理设备100的外部设备连接至诸如操作输入设备(例如,键盘或者鼠标)、显示设备等外部设备。显示设备162的实施例可以是显示用户操作的诸如触摸屏等设备。
通信接口164是被包括在信息处理设备100中的通信单元并且用作经由网络(或者直接)执行与诸如要控制的设备等外部设备的无线/有线通信的通信单元102。此处,通信接口164的实施例包括通信天线和射频(RF)电路(无线通信)、IEEE 802.15.1端口与传输和接收电路(无线通信)、IEEE802.11b端口与传输和接收电路(无线通信)、以及局域网(LAN)终端与传输和接收电路(有线通信)。
例如,信息处理设备100包括图10中示出的配置并且执行与根据本实施方式的信息处理方法有关的处理。根据本实施方式的信息处理设备100的硬件配置并不局限于图10中示出的配置。
例如,在信息处理设备100经由通过例如输入和输出接口158连接的外部通信设备与诸如要控制的设备或者服务器等外部设备通信时,信息处理设备100并不一定必须包括通信接口164。
例如,信息处理设备100还可被配置为不包括操作设备160或者显示设备162。
例如,信息处理设备100可进一步包括诸如麦克风等语音输入设备和用于放大从语音输入设备传输的语音信号的放大器电路。
返回参考图9,将描述信息处理设备100的配置的实施例。通信单元102是被包括在信息处理设备100中的通信单元并且经由网络(或者直接)执行与诸如要控制的设备和服务器等外部设备的有线和无线通信。例如,由控制单元104控制通信单元102的通信。
此处,通信单元102的实施例包括通信天线和RF电路、以及LAN终端与传输和接收电路。通信单元102的配置并不局限于上述配置。例如,通信单元102可具有对应于能够执行通信的任何标准的配置,诸如,USB终端与传输和接收电路或者能够经由网络与外部设备通信的任何配置。
例如,控制单元104包括MPU并且控制整个信息处理设备100。例如,控制单元104包括分析单元110、显示控制单元112、日志记录控制单元114、以及处理单元116并且主动执行与根据本实施方式的信息处理方法有关的处理。
分析单元110主动执行处理(1)(分析处理)并且对表示作为语音识别的结果而获得的发言的内容的字符串进行分析。此处,以这样一种方式获得表示根据本实施方式的经过处理的发言的内容的字符串,例如,被包括在信息处理设备100中的组成元件(诸如,控制单元104)执行与对显示发言的内容的语音数据的语音识别有关的处理。然而,获取根据本实施方式的经过处理的发言的内容的字符串的方法并不局限于上述实施例。例如,如上所述,信息处理设备100可从诸如服务器等外部设备获取显示因与外部设备中的语音识别有关的处理而获得的发言的内容的字符串的数据,从而获得经过处理的发言的内容的字符串。
例如,通过使用存储在存储单元(未示出)中的用于波动吸收的词典替换由形态分析等分割的词,分析单元110可校正语音识别的波动。
例如,分析单元110可使用词典对表示发言的内容的字符串执行动作分析和时态分析。
此外,例如,分析单元110还可基于分析结果设置表示发言的内容的字符串的得分。例如,分析单元110通过执行图6中的步骤S308和步骤S310中的处理设置得分。
显示控制单元112主动执行处理(2)(显示控制处理)并且将表示发言的内容的字符串和分析单元110中的分析结果显示在显示屏幕上。
例如,显示控制单元112可显示表示发言的内容的字符串,以使得表示发言的内容的整个字符串或者表示发言的内容的字符串中的通过形态分析等分割的各个词可编辑。
例如,在分析单元110中校正语音识别的波动的情况下,显示控制单元112显示表示发言的内容的字符串,其中,已经校正语音识别的波动。
例如,如图1中的C中的C2所示,显示控制单元112可将对应于发言的内容的应用和/或对应于发言的内容的服务显示在显示屏幕上,以使得基于分析单元110中的分析结果强化该应用和/或该服务。
更具体地,例如,在分析单元110中对表示发言的内容的字符串执行动作分析的情况下,显示控制单元112基于分析单元110的分析结果中包括的动作分析的结果强化显示屏幕上所显示的应用和/或服务。
例如,在将对应于发言的内容的应用和/或对应于发言的内容的服务显示在显示屏幕上的情况下,显示控制单元112可基于要控制的设备的性能信息确定显示屏幕上所显示的应用候选项和/或显示屏幕上所显示的服务候选项。
日志记录控制单元114主动执行日志记录控制处理并且将分析单元110中的分析结果用作日志。日志记录控制单元114记录日志的目标实施例包括存储单元(未示出)、外部记录介质、以及经由网络可通信的外部设备。例如,在将日志记录在外部设备中的情况下,日志记录控制单元114使通信单元102将日志数据传输至外部设备。
处理单元116主动执行执行处理并且执行与对应于发言的内容的选择的应用或者对应于发言的内容的选择的服务有关的处理。
例如,在分析单元110中设置得分的情况下,处理单元116可基于设置参考值与设置得分之间的比较结果通过确定在执行对应于发言的内容的应用或者执行与对应于发言的内容的服务有关的处理中所使用的字符串执行该处理。更具体地,例如,在不存在大于参考值的得分的处理中,处理单元116在该处理中使用表示发言的内容的整个字符串。同时,在存在大于参考值的得分的情况下,处理单元116在该处理中使用表示发言的内容的字符串中具有大得分的字符串的一个或者两个或者多个部分。
例如,如图6中的步骤S324所示,在分析单元110中执行时态分析并且分析单元110中的时态分析的结果表示显示发言的内容的字符串中包括表示时态的词的情况下,处理单元116可在该处理中使用表示发言的内容的字符串中包括的表示时态的词。
例如,控制单元104包括分析单元110、显示控制单元112、日志记录控制单元114、以及处理单元116,并且由此主动执行与根据本实施方式的信息处理方法有关的处理。
例如,通过图9中示出的配置,信息处理设备100执行与根据本实施方式的信息处理方法有关的处理(例如,处理(1)(分析处理)、处理(2)(显示控制处理)、执行处理、以及日志记录控制处理)。
因此,例如,通过图9中示出的配置,信息处理设备100可提高用户的使用性。此外,例如,通过图9中示出的配置,信息处理设备100可施加通过执行与根据上述所述实施方式的信息处理方法有关的处理而获得的效果。
应注意,根据本实施方式的信息处理设备100的配置并不局限于图9中示出的配置。
例如,根据本实施方式的信息处理设备100并不一定必须包括日志记录控制单元114和处理单元116中的两个或者一个。即使在根据本实施方式的信息处理设备100并不包括日志记录控制单元114和处理单元116中的两个或者一个的情况下,根据本实施方式的信息处理设备100也可主动执行与根据本实施方式的信息处理方法有关的处理(1)(分析处理)和处理(2)(显示控制处理)。
因此,即使在根据本实施方式的信息处理设备100并不包括日志记录控制单元114和处理单元116中的两个或者一个的情况下,根据本实施方式的信息处理设备100也可提高用户的使用性。
例如,在根据本实施方式的信息处理设备100中,可以单独提供(例如,通过各个处理电路可以实现)图9中示出的分析单元110、显示控制单元112、日志记录控制单元、以及处理单元116中的一个或者两个或者多个单元、与控制单元104。
例如,在根据本实施方式的信息处理设备100经由外部通信设备与诸如要控制的设备或者服务器等外部设备通信的情况下,信息处理设备100并不一定必须包括通信单元102。
如上所述,例如,如同与根据本实施方式的信息处理方法有关的处理,根据本实施方式的信息处理设备执行处理(1)(分析处理)和处理(2)(显示控制处理)。
此处,根据本实施方式的信息处理设备在处理(2)(显示控制处理)中将作为语音识别的结果获得的发言的内容的字符串显示在显示屏幕上,并且由此执行该发言的用户可可视地领会如何使发言经过语音识别处理。在处理(2)(显示控制处理)中,根据本实施方式的信息处理设备一起显示处理(1)(分析处理)中的发言的内容的字符串的分析结果与发言的内容的字符串,并且由此执行该发言的用户可可视地领会如何对发言进行分析。
因此,根据本实施方式的信息处理设备可提高用户的使用性。
例如,根据本实施方式的信息处理设备将表示发言的内容的字符串显示在显示屏幕上,以使得在处理(2)(显示控制处理)中的字符串可编辑。
因此,例如,通过显示表示发言的内容的字符串,以使得在处理(2)(显示控制处理)中的字符串可编辑,根据本实施方式的信息处理设备可鼓励用户校正发言的内容并且可由此使自身设备(根据本实施方式的信息处理设备)或者外部设备更准确地执行该处理。此外,例如,通过显示表示发言的内容的字符串,以使得在处理(2)(显示控制处理)中的字符串可编辑,防止了用户需要多次执行发言来实现用户所希望的动作的情形。
因此,通过在处理(2)(显示控制处理)中显示表示发言的内容的字符串,以使得字符串可编辑,根据本实施方式的信息处理设备也可进一步提高用户的使用性。
例如,如图1中的C中的C2所示,在处理(2)(显示控制处理)中,根据本实施方式的信息处理设备基于显示屏幕上的处理(1)(分析结果)中的分析结果显示对应于发言的内容的应用和/或对应于发言的内容的服务。此外,例如,根据本实施方式的信息处理设备将对应于发言的内容的应用和/或对应于发言的内容的服务显示在显示屏幕上,因此,强化了该应用和/或该服务。
如上所述,例如,通过基于显示屏幕上的分析结果显示对应于发言的内容的应用和/或对应于发言的内容的服务,可以实现更适合用于要控制的设备的显示器。根据本实施方式的信息处理设备不是以一种格式、而是以更为合适的格式显示发言的内容的分析结果,并且由此可吸收发言模糊性并且用户可找出新的内容。
因此,通过基于处理(2)(显示控制处理)中的分析结果将对应于发言的内容的应用和对应于发言的内容的服务显示在显示屏幕上,根据本实施方式的信息处理设备可进一步提高用户的使用性。
在上述描述中,已经描述例证信息处理设备的实施方式。然而,本实施方式并不局限于该实施方式。本实施方式适用于诸如平板电脑设备、诸如移动电话和智能电话等通信设备、语音/音乐播放设备(或者视频/音乐记录和播放设备)、游戏机、诸如个人计算机(PC)等计算机、以及远程控制器等各种设备。例如,本实施方式还适用于可被集成到上述设备中的处理集成电路(IC)。
(根据本实施方式的信息处理系统)
如上所述,根据本实施方式的信息处理设备还可在诸如服务器等外部设备中处理表示作为语音识别的结果处理而获得的发言的内容的字符串。鉴于此,接着,将描述其中根据本实施方式的信息处理设备可在外部设备中处理表示作为语音识别的结果处理而获得的发言的内容的字符串的根据本实施方式的信息处理系统的实施例。
图11是示出了根据本实施方式的信息处理系统1000的实施例的示例图。
例如,信息处理系统1000包括信息处理设备100、语音识别处理设备200、由信息处理设备100控制器功能的要控制的设备300A、300B、…(以下通常也被称之为“要控制的设备300”)。例如,信息处理设备100与语音识别处理设备200经由网络400彼此通信。网络400的实施例包括诸如LAN或者WAN等有线网络、诸如经由基站的无线LAN或者无线WAN等无线网络、以及使用诸如TCP/IP等通信协议的因特网。
应注意,图11示出了信息处理系统1000包括多个要控制的设备300的实施例。然而,根据本实施方式的信息处理系统并不局限于上述实施例。例如,根据本实施方式的信息处理系统可包括受控制的单个设备300。例如,在由信息处理设备100控制其功能的目标的情况下,根据本实施方式的信息处理系统并不一定包括图11中示出的要控制的设备300A、300B、…。
语音识别处理设备200对显示发言的内容的语音数据执行诸如利用统计方法等处理或者利用隐式马尔可夫模型的处理等与语音识别有关的处理。语音识别处理设备200将显示因与对语音数据执行的语音识别有关的处理而获得的发言的内容的字符串的数据传输至信息处理设备100。
例如,语音识别处理设备200管理与根据本实施方式的词典(在下文中,被称之为“词典数据”)有关的数据。应注意,在根据本实施方式的信息处理系统中,诸如服务器等另一设备可管理词典数据。例如,通过管理诸如语音识别处理设备200等外部设备中的词典,可以更容易改变信息处理设备100的处理(1)(分析处理)中的行为。在下文中,将描述语音识别处理设备200管理词典数据的实施例。
此外,例如,语音识别处理设备200管理日志数据。应注意,在根据本实施方式的信息处理系统中,诸如服务器等另一设备可管理日志数据或者信息处理设备100可管理日志数据。在下文中,将描述其中语音识别处理设备200管理日志数据的实施例。
此处,例如,语音识别处理设备200具有图10中示出的硬件配置。然而,语音识别处理设备200的硬件配置并不局限于上述实施例。
信息处理设备100对显示从语音识别处理设备200传输的发言的内容的字符串的数据执行与根据上述所述实施方式的信息处理方法有关的处理。
例如,要控制的设备300基于从信息处理设备100传输的控制命令执行处理并且由信息处理设备100控制器功能。此处,例如,要控制的设备300具有图10中示出的硬件配置。然而,要控制的设备300的硬件配置并不局限于上述实施例。
例如,通过图11中示出的配置可以实现信息处理系统,其中,信息处理设备100可处理表示因在语音识别处理设备200(外部设备的实例)中执行的语音识别处理而获得的发言的内容的字符串。
接着,将描述信息处理系统1000中的处理的实施例。图12是示出了根据本实施方式的信息处理系统1000的处理的实施例的示例图。此处,图12中的步骤S414的处理对应于处理(1)(分析处理),并且图12中的步骤S418的处理对应于处理(2)(显示控制处理)。图12中的步骤S416和S420表示根据本实施方式的执行处理的实施例,并且图12中的步骤S422对应于根据本实施方式的日志记录控制处理。
信息处理设备100和要控制的设备300执行连接处理(S400)。此处,例如,以这样一种方式执行步骤S400中的处理,即,信息处理设备100基于用户的连接操作将连接请求传输至要控制的设备300。
当在步骤S400中连接信息处理设备100与要控制的设备300时,信息处理设备100指定要控制的设备300的性能(S402)。例如,信息处理设备100基于从要控制的设备300传输的性能信息而响应性能信息传输请求将用于性能信息的指令传输的性能信息传输请求传输至要控制的设备300并且指定要控制的设备300的性能。
例如,信息处理设备100将词典更新检验请求传输至通化识别处理设备200(S404)。
在步骤S404中接收从信息处理设备100传输的词典更新检验请求的语音识别处理设备200对存储在记录介质156中的词典数据等进行检验。在更新词典数据的情况下,语音识别处理设备200将词典数据传输至信息处理设备100(S406)。例如,通过执行步骤S406中的处理,对根据本实施方式的存储在信息处理设备100中包括的存储单元(未示出)中的词典进行更新。此处,例如,语音识别处理设备200可传输显示整个词典的词典数据或者仅可传输对应于作为词典数据的更新部分的数据。
当获得发言的语音数据时,信息处理设备100将语音数据传输至语音识别处理设备200(S408)。
在步骤S408中接收从信息处理设备100传输的语音数据的语音识别处理设备200对语音数据执行与语音识别有关的处理(S410)。然后,语音识别处理设备200将显示因与语音识别有关的处理而获得的发言的内容的字符串的数据传输至信息处理设备100。
在步骤S412中接收显示从语音识别处理设备200传输的发言的内容的字符串的数据的信息处理设备100对显示发言的内容的字符串的数据执行分析处理(S414)。
信息处理设备100基于步骤S414中的分析结果搜索内容(S416)。此处,通过信息处理设备100搜索其内容的目标的实施例包括存储单元(未示出)、诸如光盘等外部记录介质、以及诸如发言识别处理设备200等外部设备。
作为具体实施例,例如,信息处理设备100结合诸如语音识别处理设备200等外部设备中的内容搜索引擎对连接的电视接收器(要控制的设备300的实施例)执行节目搜索或者对因特网上的协作服务的移动图像和音乐执行搜索。此外,例如,信息处理设备100与连接的电视接收器(要控制的设备300的实施例)通信并且搜索电视接收器中的记录标题内容、电视接收器的应用等。而且,例如,信息处理设备100与家庭网络中的PC(要控制的设备300的实施例)通信并且搜索存储在PC中包括的记录介质中的图像数据(显示移动图像和静止图像的数据)、音乐数据等。此外,例如,信息处理设备100执行网络搜索。例如,信息处理设备100还可搜索被插入到碟播放器中的碟(要控制的设备300的实施例)。
信息处理设备100将发言的内容的字符串和步骤S414中的分析结果显示在显示屏幕上(S418)。此外,例如,如图1中的C中的C2所示,信息处理设备100可基于步骤S414中的分析结果和步骤S416中的搜索结果将对应于发言的内容的应用和/或对应于发言的内容的服务显示在显示屏幕上。
例如,在检测到对步骤S418中屏幕上所显示的应用或者服务执行操作(用于使要控制的设备300执行动作的操作)的情况下,信息处理设备100将对应于该操作的控制命令传输至要控制的设备300(S420)。
例如,信息处理设备100还将步骤S414中的分析结果的日志或者显示各个处理中的日志的日志数据传输至语音识别处理设备200(S422)。
例如,在信息处理系统1000中执行图12中示出的处理。此处,即使在执行图12中示出的处理的情况下,信息处理设备100也能够执行与上述所述实施方式的信息处理方法有关的处理。因此,例如,通过执行图12中示出的处理,实现了能够提高用户使用性的信息处理系统。无需多言,根据本实施方式的信息处理系统1000的处理并不局限于图12中示出的处理。
已经描述了例证作为根据本实施方式的信息处理系统的组成元件的语音识别处理设备200的上述描述。然而,本实施方式并不局限于该实施方式。本实施方式适用于诸如包括PC和服务器的计算机等各种设备。例如,本实施方式还适用于可被集成到上述设备中的处理IC。
通过包括假定连接至诸如云计算等网络的多个设备的(或者设备之间通信)系统可以实现与根据本实施方式的语音识别处理设备200有关的处理。
已经描述了例证作为根据本实施方式的信息处理系统的组成元件的要控制的设备300的上述描述。然而,本实施方式并不局限于该实施方式。本实施方式适用于诸如电视接收器、诸如PC和服务器等计算机、视频/音乐播放设备(或者视频/音乐记录和播放设备)、以及游戏机等各种设备。例如,本实施方式还适用于可被集成到上述设备中的处理IC。
(根据实施方式的程序)
在计算机中执行用于使计算机行驶根据本实施方式的信息处理设备的功能的程序(例如,能够执行与根据本实施方式的信息处理方法有关的处理的程序,诸如,“处理(1)(分析处理)和处理(2)(显示控制处理)”、“处理(1)(分析处理)、处理(2)(显示控制处理)、以及执行处理”、“处理(1)(分析处理)、处理(2)(显示控制处理)、以及日志记录控制处理”、“处理(1)(分析处理)、处理(2)(显示控制处理)、执行处理、以及日志记录控制处理”)。
从而使得可以提高用户的使用性。此外,因为在计算机中执行用于使计算机用作根据本实施方式的信息处理设备的程序,所以可以施加通过执行与根据上述所述实施方式的信息处理方法有关的处理而获得的效果。
本领域技术人员应当理解的是,只要在所附技术方案或者其等同物的范围内,根据设计需要和其他因素,可做出各种变形、组合、子组合、以及更改。
例如,上面已经提供了使计算机用作根据本实施方式的信息处理设备的程序(计算机程序)。然而,本实施方式还可提供存储上述程序的记录介质。
上述所述配置是本实施方式的实施例,当然属于本公开的实施方式的技术范围。
此外,本技术还可配置为如下。
(1)一种信息处理设备,包括:
分析单元,分析单元被配置为对表示作为语音识别的结果而获得的发言的内容的字符串进行分析;和
显示控制单元,显示控制单元被配置为将表示发言的内容的字符串和分析结果显示在显示屏幕上。
(2)根据(1)所述的信息处理设备,
其中,显示控制单元以可编辑的状态显示表示发言的内容的字符串。
(3)根据(1)或(2)所述的信息处理设备,
其中,分析单元校正语音识别的波动;并且
其中,显示控制单元显示表示发言的内容的字符串,其中已校正波动。
(4)根据(1)至(3)中任一项所述的信息处理设备,
其中,显示控制单元基于分析结果以强化应用和/或服务的方式将对应于发言的内容的应用和/或对应于发言的内容的服务显示在显示屏幕上。
(5)根据(4)所述的信息处理设备,
其中,分析单元对表示发言的内容的字符串执行动作分析;并且
其中,显示控制单元基于分析结果中包括的动作分析结果以强化应用和/或服务的方式将该应用和/或该服务显示在显示屏幕上。
(6)根据(4)或(5)所述的信息处理设备,
其中,显示控制单元基于表示设备所具有的性能的性能信息,确定显示屏幕上所显示的应用的候选项和/或显示屏幕上所显示的服务的候选项。
(7)根据(4)至(6)中任一项所述的信息处理设备,进一步包括:
处理单元,处理单元被配置为执行与对应于发言的内容的选择的应用或者对应于发言的内容的选择的服务有关的处理。
(8)根据(7)所述的信息处理设备,
其中,分析单元基于对表示发言的内容的字符串执行的句法分析结果或者基于对句法分析的结果执行的语义分析结果和表示发言的内容的字符串设置表示发言的内容的字符串的得分;并且
其中,处理单元
在不存在大于参考值的得分或者不存在等于或大于参考值的得分的情况下,在该处理中使用表示发言的内容的整个字符串;并且
在存在大于参考值的得分或者存在等于或大于参考值的得分的情况下,在该处理中使用表示发言的内容的字符串之中具有大得分的字符串的一个或者两个或者多个部分。
(9)根据(7)或(8)所述的信息处理设备,
其中,分析单元对表示发言的内容的字符串执行时态分析;并且
其中,在时态分析结果表示表示发言的内容的字符串中包括表示时态的词,则处理单元在该处理中使用表示发言的内容的字符串中包括的表示时态的词。
(10)根据(1)至(9)中任一项所述的信息处理设备,进一步包括:
日志记录控制单元,日志记录控制单元被配置为将分析结果记录为日志。
(11)一种信息处理方法,包括:
分析表示作为语音识别的结果而获得的发言的内容的字符串的步骤;和
将表示发言的内容的字符串和分析结果显示在显示屏幕上的步骤。
(12)一种用于使计算机执行下列步骤的程序:
分析作为语音识别的结果而获得的发言的内容的字符串的步骤;和
将表示发言的内容的字符串和分析结果显示在显示屏幕上的步骤。
参考标示列表
100 信息处理设备
102 通信单元
104 控制单元
110 分析单元
112 显示控制单元
114 日志记录控制单元
116 处理单元
200 语音识别处理设备
300,300A,300B 要控制的设备
400 网络
1000 信息处理系统。

Claims (12)

1.一种信息处理设备,包括:
分析单元,被配置为对表示作为语音识别的结果而获得的发言的内容的字符串进行分析;和
显示控制单元,被配置为将表示所述发言的所述内容的所述字符串和分析结果显示在显示屏幕上。
2.根据权利要求1所述的信息处理设备,
其中,所述显示控制单元以可编辑的状态显示表示所述发言的所述内容的所述字符串。
3.根据权利要求1所述的信息处理设备,
其中,所述分析单元校正所述语音识别的波动;并且
其中,所述显示控制单元显示表示所述发言的所述内容的所述字符串,其中已校正所述波动。
4.根据权利要求1所述的信息处理设备,
其中,所述显示控制单元基于所述分析结果以强化应用和/或服务的方式将对应于所述发言的所述内容的应用和/或对应于所述发言的所述内容的服务显示在显示屏幕上。
5.根据权利要求4所述的信息处理设备,
其中,所述分析单元对表示所述发言的所述内容的所述字符串执行动作分析;并且
其中,所述显示控制单元基于所述分析结果中包括的所述动作分析的结果以强化所述应用和/或所述服务的方式将所述应用和/或所述服务显示在所述显示屏幕上。
6.根据权利要求4所述的信息处理设备,
其中,所述显示控制单元基于表示所述设备具有的性能的性能信息,确定所述显示屏幕上显示的所述应用的候选项和/或所述显示屏幕上显示的所述服务的候选项。
7.根据权利要求4所述的信息处理设备,进一步包括:
处理单元,所述处理单元被配置为执行与对应于所述发言的所述内容的选择的应用或者对应于所述发言的所述内容的选择的服务有关的处理。
8.根据权利要求7所述的信息处理设备,
其中,所述分析单元基于对表示所述发言的所述内容的所述字符串执行的句法分析的结果或者基于对所述句法分析的所述结果和表示所述发言的所述内容的所述字符串执行的语义分析的结果设置关于表示所述发言的所述内容的所述字符串的得分;并且
其中,所述处理单元
在不存在大于参考值的得分或者不存在等于或大于所述参考值的得分的情况下,在所述处理中使用表示所述发言的所述内容的整个字符串;并且
在存在大于所述参考值的得分或者存在等于或大于所述参考值的得分的情况下,在所述处理中使用表示所述发言的所述内容的所述字符串之中具有大得分的所述字符串中的一个或者两个或者多个部分。
9.根据权利要求7所述的信息处理设备,
其中,所述分析单元对表示所述发言的所述内容的所述字符串执行时态分析;并且
其中,在所述时态分析的结果表示表示所述发言的所述内容的所述字符串中包括表示时态的词,则所述处理单元在所述处理中使用表示所述发言的所述内容的所述字符串中包括的表示时态的所述词。
10.根据权利要求1所述的信息处理设备,进一步包括:
日志记录控制单元,被配置为将所述分析结果记录为日志。
11.根据权利要求1所述的信息处理设备,
其中,所述信息处理设备能从外部设备获取表示所述发言的所述内容的所述字符串的数据。
12.一种信息处理方法,包括:
分析表示作为语音识别的结果而获得的发言的内容的字符串的步骤;以及
将表示所述发言的所述内容的所述字符串和分析结果显示在显示屏幕上的步骤。
CN201911128993.XA 2012-12-28 2013-11-20 信息处理设备和信息处理方法 Active CN110889265B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911128993.XA CN110889265B (zh) 2012-12-28 2013-11-20 信息处理设备和信息处理方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2012-287357 2012-12-28
JP2012287357 2012-12-28
CN201380067142.3A CN104871240A (zh) 2012-12-28 2013-11-20 信息处理设备、信息处理方法、以及程序
PCT/JP2013/081312 WO2014103568A1 (ja) 2012-12-28 2013-11-20 情報処理装置、情報処理方法、およびプログラム
CN201911128993.XA CN110889265B (zh) 2012-12-28 2013-11-20 信息处理设备和信息处理方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380067142.3A Division CN104871240A (zh) 2012-12-28 2013-11-20 信息处理设备、信息处理方法、以及程序

Publications (2)

Publication Number Publication Date
CN110889265A true CN110889265A (zh) 2020-03-17
CN110889265B CN110889265B (zh) 2024-01-30

Family

ID=51020662

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201380067142.3A Pending CN104871240A (zh) 2012-12-28 2013-11-20 信息处理设备、信息处理方法、以及程序
CN201911128993.XA Active CN110889265B (zh) 2012-12-28 2013-11-20 信息处理设备和信息处理方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201380067142.3A Pending CN104871240A (zh) 2012-12-28 2013-11-20 信息处理设备、信息处理方法、以及程序

Country Status (6)

Country Link
US (4) US10424291B2 (zh)
EP (2) EP2940683A4 (zh)
JP (2) JPWO2014103568A1 (zh)
CN (2) CN104871240A (zh)
BR (1) BR112015014830B1 (zh)
WO (1) WO2014103568A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014103568A1 (ja) 2012-12-28 2014-07-03 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
KR102352764B1 (ko) * 2014-11-04 2022-01-19 삼성전자주식회사 사용자 단말 장치, 사용자 단말 장치와 연계되는 디스플레이 장치, 연계 시스템 및 그 제어 방법
US10271093B1 (en) 2016-06-27 2019-04-23 Amazon Technologies, Inc. Systems and methods for routing content to an associated output device
US10931999B1 (en) * 2016-06-27 2021-02-23 Amazon Technologies, Inc. Systems and methods for routing content to an associated output device
CN116631391A (zh) * 2016-06-27 2023-08-22 亚马逊技术公司 用于将内容路由到相关联输出设备的系统和方法
WO2018056105A1 (ja) * 2016-09-26 2018-03-29 ソニー株式会社 情報処理装置、情報処理方法、プログラム、および情報処理システム
US10449440B2 (en) 2017-06-30 2019-10-22 Electronic Arts Inc. Interactive voice-controlled companion application for a video game
US10621317B1 (en) 2017-09-14 2020-04-14 Electronic Arts Inc. Audio-based device authentication system
US10572586B2 (en) * 2018-02-27 2020-02-25 International Business Machines Corporation Technique for automatically splitting words
WO2020116531A1 (ja) * 2018-12-05 2020-06-11 株式会社 東芝 会話分析システム、方法及びプログラム
WO2020240958A1 (ja) * 2019-05-30 2020-12-03 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
US10926173B2 (en) * 2019-06-10 2021-02-23 Electronic Arts Inc. Custom voice control of video game character
KR20240044260A (ko) * 2022-09-28 2024-04-04 엘지전자 주식회사 디스플레이 장치 및 그의 동작 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070073540A1 (en) * 2005-09-27 2007-03-29 Hideki Hirakawa Apparatus, method, and computer program product for speech recognition allowing for recognition of character string in speech input
CN102737100A (zh) * 2011-04-06 2012-10-17 索尼公司 信息处理设备、方法、系统和历史管理服务器、方法
CN102792320A (zh) * 2010-01-18 2012-11-21 苹果公司 智能自动化助理

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0756933A (ja) * 1993-06-24 1995-03-03 Xerox Corp 文書検索方法
US7165098B1 (en) * 1998-11-10 2007-01-16 United Video Properties, Inc. On-line schedule system with personalization features
US6594630B1 (en) * 1999-11-19 2003-07-15 Voice Signal Technologies, Inc. Voice-activated control for electrical device
JP3907363B2 (ja) 1999-12-06 2007-04-18 キヤノン株式会社 情報入力装置、情報入力方法、及び記憶媒体
US7158935B1 (en) * 2000-11-15 2007-01-02 At&T Corp. Method and system for predicting problematic situations in a automated dialog
US8019602B2 (en) * 2004-01-20 2011-09-13 Microsoft Corporation Automatic speech recognition learning using user corrections
US7929767B2 (en) * 2004-09-22 2011-04-19 Microsoft Corporation Analyzing subordinate sub-expressions in expression recognition
WO2007047487A1 (en) * 2005-10-14 2007-04-26 Nuance Communications, Inc. One-step repair of misrecognized recognition strings
US20100153885A1 (en) * 2005-12-29 2010-06-17 Rovi Technologies Corporation Systems and methods for interacting with advanced displays provided by an interactive media guidance application
US9436951B1 (en) * 2007-08-22 2016-09-06 Amazon Technologies, Inc. Facilitating presentation by mobile device of additional content for a word or phrase upon utterance thereof
JP4967519B2 (ja) * 2006-08-11 2012-07-04 日産自動車株式会社 音声認識装置
US9015172B2 (en) * 2006-09-22 2015-04-21 Limelight Networks, Inc. Method and subsystem for searching media content within a content-search service system
US8631440B2 (en) * 2007-04-30 2014-01-14 Google Inc. Program guide user interface
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US20090210411A1 (en) * 2008-02-15 2009-08-20 Oki Electric Industry Co., Ltd. Information Retrieving System
JP5220451B2 (ja) 2008-03-26 2013-06-26 日本電気株式会社 電話受付システム、電話受付方法、プログラム、及び記録媒体
KR20090107365A (ko) 2008-04-08 2009-10-13 엘지전자 주식회사 이동 단말기 및 그 메뉴 제어방법
KR101513615B1 (ko) * 2008-06-12 2015-04-20 엘지전자 주식회사 이동 단말기 및 그 음성 인식 방법
US8108214B2 (en) 2008-11-19 2012-01-31 Robert Bosch Gmbh System and method for recognizing proper names in dialog systems
JP4977116B2 (ja) * 2008-12-03 2012-07-18 株式会社東芝 音声認識装置、方法、およびプログラム
US9367608B1 (en) * 2009-01-07 2016-06-14 Guangsheng Zhang System and methods for searching objects and providing answers to queries using association data
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
EP2454733A1 (en) * 2009-07-15 2012-05-23 Google, Inc. Commands directed at displayed text
KR101253104B1 (ko) * 2009-09-01 2013-04-10 한국전자통신연구원 패턴 데이터베이스화 장치 및 그 방법, 이를 이용한 음성 이해 장치 및 그 방법
JP5535238B2 (ja) * 2009-11-30 2014-07-02 株式会社東芝 情報処理装置
US9817889B2 (en) * 2009-12-04 2017-11-14 Sony Corporation Speech-based pronunciation symbol searching device, method and program using correction distance
EP4318463A3 (en) * 2009-12-23 2024-02-28 Google LLC Multi-modal input on an electronic device
US8522283B2 (en) * 2010-05-20 2013-08-27 Google Inc. Television remote control data transfer
US8359020B2 (en) * 2010-08-06 2013-01-22 Google Inc. Automatically monitoring for voice input based on context
JP2012063526A (ja) * 2010-09-15 2012-03-29 Ntt Docomo Inc 端末装置、音声認識方法および音声認識プログラム
JP2015038526A (ja) * 2011-03-31 2015-02-26 株式会社東芝 音声処理装置、及び音声処理方法
US9236045B2 (en) * 2011-05-23 2016-01-12 Nuance Communications, Inc. Methods and apparatus for proofing of a text input
WO2013012107A1 (ko) * 2011-07-19 2013-01-24 엘지전자 주식회사 전자 기기 및 그 제어 방법
US8488916B2 (en) * 2011-07-22 2013-07-16 David S Terman Knowledge acquisition nexus for facilitating concept capture and promoting time on task
WO2013022221A2 (en) * 2011-08-05 2013-02-14 Samsung Electronics Co., Ltd. Method for controlling electronic apparatus based on voice recognition and motion recognition, and electronic apparatus applying the same
US20130073293A1 (en) * 2011-09-20 2013-03-21 Lg Electronics Inc. Electronic device and method for controlling the same
WO2014103568A1 (ja) 2012-12-28 2014-07-03 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
US10121493B2 (en) * 2013-05-07 2018-11-06 Veveo, Inc. Method of and system for real time feedback in an incremental speech input interface
KR102227599B1 (ko) * 2013-11-12 2021-03-16 삼성전자 주식회사 음성인식 시스템, 음성인식 서버 및 디스플레이 장치의 제어방법
EP3089157B1 (en) * 2013-12-26 2020-09-16 Panasonic Intellectual Property Management Co., Ltd. Voice recognition processing device, voice recognition processing method, and display device
JP6375521B2 (ja) * 2014-03-28 2018-08-22 パナソニックIpマネジメント株式会社 音声検索装置、音声検索方法、および表示装置
US20150301795A1 (en) * 2014-04-16 2015-10-22 Facebook, Inc. Crowd sourced based training for natural language interface systems
US9852136B2 (en) * 2014-12-23 2017-12-26 Rovi Guides, Inc. Systems and methods for determining whether a negation statement applies to a current or past query
US10268491B2 (en) * 2015-09-04 2019-04-23 Vishal Vadodaria Intelli-voyage travel
US20170329790A1 (en) * 2015-09-28 2017-11-16 Developing Software LLC Location based push notification and multi-user class social introduction
US9978367B2 (en) * 2016-03-16 2018-05-22 Google Llc Determining dialog states for language models
US10304444B2 (en) * 2016-03-23 2019-05-28 Amazon Technologies, Inc. Fine-grained natural language understanding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070073540A1 (en) * 2005-09-27 2007-03-29 Hideki Hirakawa Apparatus, method, and computer program product for speech recognition allowing for recognition of character string in speech input
CN102792320A (zh) * 2010-01-18 2012-11-21 苹果公司 智能自动化助理
CN102737100A (zh) * 2011-04-06 2012-10-17 索尼公司 信息处理设备、方法、系统和历史管理服务器、方法

Also Published As

Publication number Publication date
US11100919B2 (en) 2021-08-24
JP2018170015A (ja) 2018-11-01
US20150310854A1 (en) 2015-10-29
US20230267920A1 (en) 2023-08-24
JP6603754B2 (ja) 2019-11-06
BR112015014830B1 (pt) 2021-11-16
US20210358480A1 (en) 2021-11-18
BR112015014830A2 (pt) 2017-07-11
CN110889265B (zh) 2024-01-30
EP2940683A4 (en) 2016-08-10
US20190348024A1 (en) 2019-11-14
EP2940683A1 (en) 2015-11-04
CN104871240A (zh) 2015-08-26
EP3896596A1 (en) 2021-10-20
US10424291B2 (en) 2019-09-24
JPWO2014103568A1 (ja) 2017-01-12
US11676578B2 (en) 2023-06-13
WO2014103568A1 (ja) 2014-07-03

Similar Documents

Publication Publication Date Title
CN110889265B (zh) 信息处理设备和信息处理方法
CN106098060B (zh) 语音的纠错处理方法和装置、用于语音的纠错处理的装置
US20170109435A1 (en) Apparatus and method for searching for information
US20170076724A1 (en) Voice recognition apparatus and controlling method thereof
CN107155121B (zh) 语音控制文本的显示方法及装置
CN111832316B (zh) 语义识别的方法、装置、电子设备和存储介质
CN111061383B (zh) 文字检测方法及电子设备
US20130041666A1 (en) Voice recognition apparatus, voice recognition server, voice recognition system and voice recognition method
US20150052169A1 (en) Method, electronic device, and computer program product
EP1890242A1 (en) Method and apparatus for constructing database in mobile communication terminal
CN111078986A (zh) 数据检索方法、装置及计算机可读存储介质
US20150382070A1 (en) Method, electronic device, and computer program product
US11373634B2 (en) Electronic device for recognizing abbreviated content name and control method thereof
KR20140141026A (ko) 디스플레이 장치 및 검색 결과를 표시하는 방법.
CN110780749B (zh) 一种字符串纠错方法和装置
US11455990B2 (en) Electronic device and control method therefor
US11978448B2 (en) Display device and method of operating the same
CN113707145A (zh) 显示设备及语音搜索方法
US11706482B2 (en) Display device
CN112653919A (zh) 字幕添加方法及装置
CN110858100B (zh) 联想候选词生成方法及装置
CN106815288A (zh) 一种视频相关信息生成方法及其装置
CN117809633A (zh) 显示设备和意图识别方法
CN113608813A (zh) 处理方法、智能终端及存储介质
KR20150136315A (ko) 디스플레이 장치 및 이의 제어 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant