CN103052940B - 信息处理装置 - Google Patents

信息处理装置 Download PDF

Info

Publication number
CN103052940B
CN103052940B CN201080068379.XA CN201080068379A CN103052940B CN 103052940 B CN103052940 B CN 103052940B CN 201080068379 A CN201080068379 A CN 201080068379A CN 103052940 B CN103052940 B CN 103052940B
Authority
CN
China
Prior art keywords
function
interface images
key portion
information
likelihood value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201080068379.XA
Other languages
English (en)
Other versions
CN103052940A (zh
Inventor
濑户祐介
铃木忠
岩宫亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN103052940A publication Critical patent/CN103052940A/zh
Application granted granted Critical
Publication of CN103052940B publication Critical patent/CN103052940B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

信息处理装置(1)包括:显示部(30),该显示部(30)对按照每个功能类别具有表示规定功能的功能执行键部(23)的界面画面、以及按照每个功能类别进行切换的界面画面变更键部(22)进行显示;界面画面控制部(20),该界面画面控制部(20)基于输入的操作信号来控制显示部(30)中的画面的切换显示;界面画面操作历史记录部(110),该界面画面操作历史记录部(110)基于输入的操作信号,将功能执行键部(23)、界面画面变更键部(22)的操作时刻及操作内容作为连续操作信息进行记录;似然值提供部(120),该似然值提供部(120)基于记录的连续操作信息,对功能执行键部(23)所表示的每个功能计算并提供表示用户所希望的程度的似然值;优先识别词汇设定部(130),该优先识别词汇设定部(130)输出与似然值为规定值以上的功能相对应的词汇信息;声音识别部(60),该声音识别部(60)参照输入的词汇信息对所输入的声音进行声音识别;以及功能执行部(70),该功能执行部(70)执行使用界面画面操作部(40)进行了操作的功能执行键部(23)的功能,或者执行与利用声音识别部(60)进行声音识别所得到的词汇相对应的功能。

Description

信息处理装置
技术领域
本发明涉及例如利用来自用户的操作输入和声音输入来选择执行功能的信息处理装置。
背景技术
现有的信息处理装置例如采用以下结构:即,将能执行的功能作为许多功能执行键进行显示,用户通过选择功能执行键,使相应的程序启动来执行功能。这样的信息处理装置将功能执行键按照功能的种类进行层级化来显示,用户难以仅利用操作输入来寻找所希望的功能执行键。因此,公开有利用声音识别来使得容易选择功能执行键的结构。例如,根据专利文献1,信息处理装置采用以下结构:即,基于功能执行键的操作次数,确定优先进行声音识别的词汇,并对与当前未显示的功能执行键的功能、处于远离当前的操作位置的位置的功能执行键的功能相对应的词汇优先进行声音识别。
现有技术文献
专利文献
专利文献1:国际公开第2006/137245号
发明内容
然而,上述专利文献1的信息处理装置由于不是对与用户所希望的功能相对应的词汇优先进行声音识别的装置,因此,存在会执行用户所希望的功能以外的功能的问题。
本发明是为了解决如上所述的课题而完成的,其目的在于提供一种容易利用声音识别来执行用户所希望的功能的信息处理装置。
本发明的信息处理装置包括:显示部,该显示部对按照每个功能类别具有表示规定功能的功能执行键部的界面画面、以及将界面画面按照每个功能类别进行切换的界面画面变更键部进行显示;界面画面操作部,该界面画面操作部接收对显示在显示部上的功能执行键部及界面画面变更键部的操作;界面画面控制部,该界面画面控制部从界面画面操作部输入有与对界面画面变更键部的操作相对应的操作信号,基于该操作信号,控制显示部中的界面画面的切换显示;界面画面操作历史记录部,该界面画面操作历史记录部基于从界面画面操作部输入的与对功能执行键部和界面画面变更键部的操作相对应的操作信号,将功能执行键部及界面画面变更键部的操作时刻、以及以规定时间以下的间隔对界面画面变更键部连续进行操作的操作内容作为连续操作信息进行记录;似然值提供部,该似然值提供部基于记录在界面画面操作历史记录部中的连续操作信息,对功能执行键部所表示的每个功能计算并提供表示用户所希望的程度的似然值;优先识别词汇设定部,该优先识别词汇设定部预先存储有每个功能的词汇信息,输出与由似然值提供部所设定的似然值为规定值以上的功能相对应的词汇信息;声音识别部,该声音识别部参照从优先识别词汇设定部输入的词汇信息,对所输入的声音进行声音识别;以及功能执行部,该功能执行部执行使用界面画面操作部进行了操作的功能执行键部的功能,或者执行与利用声音识别部进行声音识别所得到的词汇相对应的功能。
根据本发明,能容易地利用声音识别来执行用户所希望的功能。
附图说明
图1是表示本发明的实施方式1所涉及的信息处理装置的功能结构的图。
图2是表示本发明的实施方式1所涉及的信息处理装置中显示的界面画面的一个示例的图。
图3是表示本发明的实施方式1所涉及的信息处理装置中的操作时刻的图。
图4是表示本发明的实施方式1所涉及的信息处理装置中的连续操作的图。
图5是表示本发明的实施方式1所涉及的信息处理装置中的功能执行键部的显示时间和似然值(likelihood value)的一个示例的图。
图6是表示本发明的实施方式1所涉及的信息处理装置中的处理动作的流程图。
图7是表示本发明的实施方式2所涉及的信息处理装置的功能结构的图。
图8是表示本发明的实施方式2所涉及的信息处理装置中的处理动作的流程图。
图9是表示本发明的实施方式3所涉及的信息处理装置的功能结构的图。
图10是表示本发明的实施方式3所涉及的信息处理装置中的处理动作的流程图。
具体实施方式
以下,为了更详细地说明本发明,参照附图对用于实施本发明的方式进行说明。
实施方式1
图1表示实施方式1所涉及的信息处理装置的功能结构。如图1所示,信息处理装置1包括界面画面控制部20、显示部30、界面画面操作部40、声音输入部50、声音识别部60、功能执行部70、界面画面操作历史记录部110、似然值提供部120、及优先识别词汇设定部130。
界面画面控制部20采用以下的结构:即,存储有预先设定好的多个界面画面信息21,将界面画面信息21的内容和信息经由显示部30作为界面画面进行显示。界面画面信息21中包含多个界面画面变更键部22和多个功能执行键部23,多个功能执行键部23分别表示规定的功能,多个界面画面变更键部22分别表示功能种类(类别)。将多个功能执行键部23按照其每个功能种类划分到界面画面变更键部22而进行层级化。
此外,界面画面控制部20采用以下结构:即,从界面画面操作部40输入与对显示部30的界面画面变更键部22的操作相对应的操作信号,基于对界面画面变更键部22的操作信号来控制显示部30中的界面画面(与界面画面变更键部22相对应的功能执行键部23)的切换显示,并将来自界面画面操作部40的命令信号输出到功能执行部70。
界面画面控制部20例如在用户经由界面画面操作部40输入显示功能菜单的指示时,输出最上层的界面画面信息21。接着,界面画面控制部20将与用户所选择的界面画面变更键部22相对应的多个功能执行键部23作为界面画面输出到显示部30。此外,界面画面控制部20例如在经由界面画面操作部40输入有命令信号时,发出将所输入的命令信号输出到功能执行部70以执行功能的命令。
而且,界面画面控制部20采用以下结构:即,基于来自界面画面操作部40的操作信号,将操作内容信息和操作时刻信息(操作信息)输出到界面画面操作历史记录部110。界面画面控制部20例如在用户经由画面操作部40输入对界面画面变更键部22的操作信号或对功能执行键部23的操作信号时,将表示被操作的界面画面变更键部22或功能执行键部23的操作内容信息、及表示被操作的时间的操作时刻信息作为操作信息输出到界面画面操作历史记录部110。
显示部30起到显示将来自界面画面控制部20的功能执行键部23和界面画面变更键部22包含在内的界面画面的作用,其例如由监视器所构成。界面画面将表示规定功能的功能执行键部23按照每个功能类别来进行显示,并根据用户所选择的界面画面变更键部22按每个功能类别进行切换。
界面画面操作部40接收用户对显示在显示部30上的界面画面进行的操作,并基于对界面画面的功能执行键部23的操作信号,将执行与该功能执行键部23相对应的功能的命令信号经由界面画面控制部20输出到功能执行部70。界面画面操作部40例如由触摸屏、遥控器、控制面板所构成。
声音输入部50起到将来自用户的声音作为声音信息进行输入的作用,其例如由麦克风所构成。
声音识别部60采用以下的结构:即,基于来自声音输入部50的声音信息和来自优先识别词汇设定部130的词汇信息,并参照词汇信息来对所输入的声音信息进行声音识别。声音识别部60例如在输入有来自用户的开始声音识别的信号时,输入来自声音输入部50的声音信息和来自优先识别词汇设定部130的词汇信息,判定与参照词汇信息来识别声音信息所得到的词汇相对应的功能,并将执行所判定的功能的命令信号输出到功能执行部70。
功能执行部70采用以下的结构:即,执行使用界面画面操作部20进行了操作的功能执行键部23的功能、或者与利用声音识别部60进行声音识别所得到的词汇相对应的功能。功能执行部70例如在输入有将使用界面画面控制部20进行了操作的功能执行键部23的功能信息包含在内的命令信号、或将与利用声音识别部60进行声音识别所得到的词汇相对应的功能信息包含在内的命令信号时,基于所输入的命令信号中包含的功能信息,从预先存储的多个程序中启动与功能信息相对应的程序来执行功能。
界面画面操作历史记录部110基于与从界面画面操作部20输入的对功能执行键部23和界面画面变更键部22进行的操作相对应的操作信号,将功能执行键部23及界面画面变更键部22的操作时刻、以及以规定时间以下的间隔对界面画面变更键部22连续进行操作的操作内容作为连续操作信息进行记录。界面画面操作历史记录部110中包含:表示直到对功能执行键部23进行操作为止对界面画面变更键部22连续进行了操作的操作内容的过去的连续操作信息、以及表示当前为止未对功能执行键部23进行操作而对界面画面变更键部22连续进行操作的操作内容的当前操作中的连续操作信息。
此外,界面画面操作历史记录部110起到将所记录的连续操作信息输出到似然值提供部120的作用。另外,界面画面操作历史记录部110从出厂到当前为止、或从启动到当前为止记录上述操作信息和连续操作信息。
界面画面操作历史记录部110例如基于从界面画面控制部20输入的操作信息,在操作信息为对功能执行键部23进行操作的内容时,将直到对功能执行键部23进行操作为止以规定时间以下的间隔对界面画面变更键部22连续进行了操作的操作内容和每次操作的操作时刻作为过去的连续操作信息进行记录。即,过去的连续操作信息表示执行了功能的情况下的连续操作,不包含未执行功能的情况下的连续操作。另外,将利用声音识别来执行了功能的情况也作为过去的连续操作信息进行记录。
界面画面操作历史记录部110在操作内容为对功能执行键部23以外的部件进行操作的内容时,将以规定时间以下的间隔连续进行的操作内容及其操作时刻进行更新、追加,从而作为当前操作中的连续操作信息进行记录,并将当前操作中的连续操作信息输出到似然值提供部120。若输出当前操作中的连续操作信息,则界面画面操作历史记录部110接着将过去的连续操作信息输出到似然值提供部120。以下,在仅记载为连续操作信息时,将其作为包含当前操作中的连续操作信息和过去的连续操作信息这双方的连续操作信息来进行说明。
另外,在用一个操作执行了功能时,界面画面操作历史记录部110仅将执行了功能的操作内容及其操作时刻作为过去的连续操作信息进行存储。
似然值提供部120采用以下的结构:即,根据记录在界面画面操作历史记录部110中的连续操作信息,确定功能执行键部23的显示时间(从显示功能执行键部23到结束显示为止的时间),以显示时间越短、所希望的程度越高的方式,对功能执行键部23所表示的每个功能,计算并提供表示是否是用户在当前时刻希望执行的功能的概率(程度)的似然值。
似然值提供部120例如基于记录在界面画面操作历史记录部110中的当前操作中的连续操作信息,在当前时刻与当前操作中的连续操作信息中包含的最新的操作时刻之间的间隔为规定时间以下时,判定为当前的操作在最新的连续操作内。在判定为当前的操作在最新的连续操作内时,似然值提供部120基于当前操作中的连续操作信息,计算出在显示部30上所显示的每个功能执行键部23的显示时间。似然值提供部120基于各显示时间,对每个功能计算并确定与功能执行键部23的显示时间相对应的似然值。似然值提供部120对功能信息提供似然值并输出。
另外,似然值提供部120也可以采用基于当前操作中的连续操作信息和过去的连续操作信息来计算出似然值的结构。在此情况下,似然值提供部120将当前操作中的连续操作信息与过去的连续操作信息进行比较,或对过去的连续操作信息进行取舍选择来计算出似然值。似然值提供部120例如将记录在界面画面操作历史记录部110中的、表示直到对功能执行键部23进行操作为止对界面画面变更键部22连续进行了操作的操作内容的过去的连续操作信息与表示当前为止未对功能执行键部23进行操作而对界面画面变更键部22连续进行操作的操作内容的当前操作中的连续操作信息进行比较,从而计算出一致度,并将该一致度推定为在对由过去的连续操作信息所执行的功能的当前操作中对功能执行键部23进行操作时的、要对该功能提供的似然值并进行提供。
优先识别词汇设定部130采用以下的结构:即,预先存储每个功能的词汇信息,输出与由似然值提供部120设定的似然值为规定值以上的功能相对应的词汇信息。优先识别词汇设定部130例如基于来自似然值提供部120的对功能信息提供的似然值,将与似然值为规定值以上的功能信息相对应的词汇信息输出到声音识别部60,并增加在声音识别部60中要进行识别的词汇的变形,从而设定成优先进行声音识别。例如,在增加与用两个画面显示地图的功能相对应的词汇的“两个画面显示”的变形时,该优先识别词汇设定部130将“两个画面地图”、“画面分割”等替换语也追加到要进行识别的词汇中。
接下来,使用图2对信息处理装置1的显示部30中所显示的界面画面的一个示例进行说明。
如图2的界面画面21a所示,在显示部30显示有多个界面画面变更键部22a和功能执行键部23。通过用户选择界面画面变更键部22a,从而显示与被选择的界面画面变更键部22a的种类相对应的多个功能执行键部23a。在图2中,界面画面21a表示“导航设定”画面,作为界面画面变更键部22a,选择“画面显示”,作为“画面显示”的功能执行键部23a,显示有“1个画面、2D显示”、“2个画面、2D/2D显示”、“1个画面、3D显示”、“2个画面、3D/2D显示”。用户从上述多个功能执行键部23a中选择一个,从而执行与所选择的功能执行键部23a相对应的功能。
接下来,对信息处理装置1中的连续操作进行说明。图3表示信息处理装置1中的操作时刻,横轴表示时间轴。图4表示信息处理装置1中的连续操作。
图3中,操作时刻T1、T2、T3、T4、T5、T6、T7、T8、T9、T10、T11、Tnow表示界面画面被操作的时间。对于各操作时刻的间隔,操作时刻T1~T2表示5s(秒),操作时刻T2~T3表示7秒,操作时刻T3~T4表示5秒,操作时刻T4~T5表示6秒,操作时刻T5~T6表示65秒,操作时刻T6~T7表示81秒,操作时刻T7~T8表示73秒,操作时刻T8~T9表示10秒,操作时刻T9~T10表示15秒,操作时刻T10~T11表示9秒,操作时刻T11~Tnow表示10秒。
此处,在用户进行操作时,在规定时间以内连续地进行操作的情况下,可以认为正在寻找所希望的功能的功能执行键部23。因此,例如,在将规定时间设定为30秒时,界面画面操作历史记录部110将各操作时刻的间隔在规定时间30秒以下的间隔的连续的操作判定为连续操作,将操作时刻T1~T5及其操作内容、操作时刻T8~Tnow及其操作内容分别作为图4所示的连续操作(连续操作信息)Pm进行记录。
如图4所示,界面画面操作历史记录部110记录有从过去到最新的连续操作信息P1、P2、…、Pm(TOm、1、TOm、2…、TOm、n、…、TOm、mLast=OexeF)、…、PLast。此外,如图4所示,在将操作信息以规定时间以内的间隔输入而连续操作中、且在连续操作中到当前时刻为止功能执行键部23未被选择时,界面画面操作历史记录部110记录为当前操作中的连续操作信息NOW(TOnow、1、TOnow、2、…、TOnow、n、…、TOnow、nowLast≠OexeF)。
接下来,对实施方式1中的似然值进行说明。图5表示信息处理装置中的功能执行键部的显示时间和似然值。
似然值提供部120基于来自界面画面操作历史记录部110的当前操作中的连续操作信息中包含的各操作内容和操作时刻,对图5所示的与功能执行键部151相对应的每个功能信息152计算出显示时间153和似然值154。在图5中,与功能执行键部151中的“FKB”相对应的功能信息152中的“B”的显示时间153为“0(sec)”,与功能执行键部151中的“FKA”相对应的功能信息152中的“A”的显示时间153为“5.5(sec)”,与功能执行键部151中的“FKD”相对应的功能信息152中的“D”的显示时间153为“11.2(sec)”,与功能执行键部151中的“FKE”相对应的功能信息152中的“E”的显示时间153为“15.7(sec)”,与功能执行键部151中的“FKC”相对应的功能信息152中的“C”的显示时间153为“25.4(sec)”。
似然值提供部120对各显示时间153乘上―1(负1)来计算出似然值154。如图5所示,与功能执行键部151中的“FKB”相对应的功能信息152中的“B”的似然值154为“0”,与功能执行键部151中的“FKA”相对应的功能信息152中的“A”的似然值154为“―5.5”,与功能执行键部151中的“FKD”相对应的功能信息152中的“D”的似然值154为“―11.2”,与功能执行键部151中的“FKE”相对应的功能信息152中的“E”的似然值154为“―15.7”,与功能执行键部151中的“FKC”相对应的功能信息152中的“C”的似然值154为“―25.4”。似然值提供部120以功能B>A>D>E>C的方式计算出似然值154,从而将用户不太查看的功能执行键部23的功能的似然值154设定得较高。似然值提供部120将似然值154提供给上述各功能信息152,并输出到优先识别词汇设定部130。优先识别词汇设定部130使用该似然值154进行设定,以对与已经显示的功能执行键部23的功能以外的功能相对应的词汇优先进行声音识别。
另外,上述的似然值154的计算方法是一个示例,只要将似然值154设定为与每个功能执行键部23的显示时间成反比的值即可。似然值提供部120例如也可以采用将从预先设定的规定值减去相当于每个功能的显示时间的值而得到的值作为似然值来进行计算的结构。如果具有上述结构,则能获得对与显示时间较少的功能执行键部23的功能相对应的词汇优先进行声音识别这样的效果。
接下来,使用图6所示的流程图来说明实施方式1的信息处理装置1中的处理动作。
若用户经由界面画面操作部40对界面画面进行操作,则信息处理装置1开始处理(图6的“开始”)。
若用户经由界面画面操作部40对界面画面变更键部22或功能执行键部23进行操作,则界面画面控制部20将表示被操作的界面画面变更键部22或功能执行键部23的操作内容、以及表示被操作的时间的操作时刻输出到界面画面操作历史记录部110。
界面画面操作历史记录部110基于从界面画面控制部20输入的操作信息,直到功能执行键部23被操作为止,追加、更新以规定时间以下的间隔连续地进行的操作内容及其操作时刻,并作为当前操作中的连续操作信息进行记录(步骤ST101)。
界面画面操作历史记录部110在进行步骤ST101的处理的同时,判定所输入的操作信息的操作内容是功能执行键部23的操作还是功能执行键部23以外的操作(步骤ST102)。
在步骤ST102中判定为是功能执行键部23的操作时(步骤ST102中为“否”),直到对功能执行键部23进行操作为止,界面画面操作历史记录部110将以规定时间以下的间隔连续地进行的操作内容及其操作时刻作为过去的连续操作信息进行记录,直到输入下一个操作信息为止结束处理(“结束”)。
另一方面,在步骤ST102中判定为是功能执行键部23以外的操作时(步骤ST102中为“是”),界面画面操作历史记录部110更新、追加以规定时间以下的间隔连续地进行的操作内容及其操作时刻,以作为当前操作中的连续操作信息NOW进行记录,并将当前操作中的连续操作信息NOW输出到似然值提供部120。
似然值提供部120基于当前操作中的连续操作信息NOW,计算出在连续操作信息NOW的连续操作期间内经由显示部30显示的每个功能执行键部23的显示时间(步骤ST103)。
若似然值提供部120在步骤ST103中计算出每个功能执行键部23的显示时间,则基于各显示时间,计算并确定每个功能的似然值。似然值提供部120将所确定的似然值提供给各功能信息并输出到优先识别词汇设定部130(步骤ST104)。
若输入由似然值提供部120提供了似然值的各功能信息,则优先识别词汇设定部130基于提供给功能信息的似然值来判定似然值是否在规定值以上。优先识别词汇设定部130对声音识别部60设定与提供了规定值以上的似然值的功能信息相对应的词汇信息,以增加能进行声音识别的词汇的变形(步骤ST105)。
声音识别部60基于来自优先识别词汇设定部130的词汇信息和来自声音输入部50的声音信息来识别与声音信息相对应的词汇信息,通过将对应于词汇信息而预先设定的功能信息输出到功能执行部70来发出执行功能的命令。
此时,声音识别部60基于所输入的声音信息和增加了变形的词汇信息来进行声音识别,从而对与显示时间较少的功能执行键部23的功能相对应的词汇优先进行声音识别,能提高识别与用户所希望的功能相对应的声音的可能性。
如上所述,根据实施方式1,由于信息处理装置1构成为包括:显示部30,该显示部30显示按照每个功能类别具有表示规定功能的功能执行键部23的界面画面、以及将界面画面按照每个功能类别进行切换的界面画面变更键部22;界面画面操作部40,该界面画面操作部40接收对显示在显示部30上的功能执行键部23及界面画面变更键部22的操作;界面画面控制部20,该界面画面控制部20从界面画面操作部40输入有与对界面画面变更键部22的操作相对应的操作信号,并基于该操作信号,控制显示部30中的界面画面的切换显示;界面画面操作历史记录部110,该界面画面操作历史记录部110基于从界面画面操作部40输入的与对功能执行键部23和界面画面变更键部22的操作相对应的操作信号,将功能执行键部23及界面画面变更键部22的操作时刻、以及以规定时间以下的间隔对界面画面变更键部22连续地进行了操作的操作内容作为连续操作信息进行记录;似然值提供部120,该似然值提供部120根据记录在界面画面操作历史记录部110中的连续操作信息,确定功能执行键部23的显示时间,并以显示时间越短、所希望的程度越高的方式,对功能执行键部23所表示的每个功能计算并提供表示用户所希望的程度的似然值;优先识别词汇设定部130,该优先识别词汇设定部130预先存储有每个功能的词汇信息,输出与由似然值提供部120所设定的似然值为规定值以上的功能相对应的词汇信息;声音识别部60,该声音识别部60参照从优先识别词汇设定部130输入的词汇信息,对所输入的声音进行声音识别;以及功能执行部70,该功能执行部70执行使用界面画面操作部40进行了操作的功能执行键部23的功能,或者执行与利用声音识别部60进行声音识别所得到的词汇相对应的功能,因此,在当前操作中的连续操作中,能容易对与已经显示的功能执行键部的功能以外的功能相对应的词汇进行声音识别。其结果是,信息处理装置1能获得容易利用声音识别来执行用户所希望的功能这样的效果。
此外,根据本实施方式1,信息处理装置1构成为包括似然值提供部120,该似然值提供部120将记录在界面画面操作历史记录部110中的、表示直到对功能执行键部23进行操作为止对界面画面变更键部22连续进行了操作的操作内容的过去的连续操作信息与表示当前为止未对功能执行键部23进行操作而对界面画面变更键部22连续进行操作的操作内容的当前操作中的连续操作信息进行比较,将由与当前操作中的连续操作信息相类似的操作内容的过去的连续操作信息所执行的功能的似然值推定为当前操作中对功能执行键部23进行操作时的要提供给该功能的似然值,并进行提供,因此,可获得能应用过去进行的连续操作来推定用户所希望的功能这样的效果。
实施方式2
实施方式1中,对基于表示用户所希望的概率(程度)的每个功能的似然值来设定声音识别的优先识别词汇信息的结构进行了说明。实施方式2对考虑用户寻找所希望的功能时花费的劳力来设定声音识别的优先识别词汇信息的结构进行说明。
图7表示实施方式2所涉及的信息处理装置的功能结构。实施方式2的信息处理装置1A是在实施方式1的信息处理装置1的结构中添加了声音引导信息生成部131、成本计算部140、及声音输出部150的结构。
如图7所示,信息处理装置1A包括界面画面控制部20、显示部30、界面画面操作部40、声音输入部50、声音识别部60A、功能执行部70、界面画面操作历史记录部110、似然值提供部120A、优先识别词汇设定部130A、声音引导信息生成部131、成本计算部140、及声音输出部150。
界面画面控制部20、显示部30、界面画面操作部40、声音输入部50、功能执行部70、界面画面操作历史记录部110、似然值提供部120A是与实施方式1相同的结构,因此省略说明。
成本计算部140采用以下的结构:即,使用记录在界面画面操作历史记录部110中的、表示直到对功能执行键部23进行操作为止对界面画面变更键部22连续进行了操作的操作内容的过去的连续操作信息与表示当前为止未对功能执行键部23进行操作而对界面画面变更键部22连续进行操作的操作内容的当前操作中的连续操作信息,将当前操作中对界面画面变更键部22连续进行操作的时间与从多个过去的连续操作信息中确定的过去的直到对功能执行键部23进行操作为止的经过时间的平均值之差作为表示直到执行功能为止所需的用户的劳力的成本值进行计算。成本计算部140例如基于记录在界面画面操作历史记录部110中的当前操作中的连续操作信息和过去的连续操作信息,将当前操作中的连续操作的经过时间(最新的操作时刻-最初的操作时刻)与过去的连续操作的经过时间的平均时间(连续操作的经过时间的总和/总的连续操作次数)之差作为成本值进行计算。
另外,成本计算部140也可以采用利用其他方法计算成本值的结构。在此情况下,成本计算部140例如将当前操作中的连续操作信息与过去的连续操作信息进行比较,或者对过去的连续操作信息进行取舍选择来计算出成本值。成本计算部140例如将记录在界面画面操作历史记录部110中的过去的连续操作信息与当前操作中的连续操作信息进行比较,用当前操作中的经过时间和与当前操作中的操作内容类似的过去的连续操作信息中的直到对功能执行键部23进行操作为止的经过时间之差来计算出表示用户的劳力的成本值。
优先识别词汇设定部130A采用在来自成本计算部140的成本值小于规定值时,不进行优先识别词汇设定就结束处理的结构。此外,优先识别词汇设定部130A采用以下结构:即,在来自成本计算部140的成本值为规定值以上时,基于来自似然值提供部120A的所有的每个功能信息的似然值进行解除设定,以不对与似然值小于规定值的功能信息相对应的词汇信息进行声音识别。而且,优先识别词汇设定部130A起到以下的作用:即,基于与似然值最高的功能相对应的词汇信息,对声音引导信息生成部131发出指示以输出促使说出该词汇信息的声音引导信息。
例如,在来自成本计算部140的成本值为规定值以上时,优先识别词汇设定部130A基于来自似然值提供部120A的所有的功能信息和每个功能信息的似然值进行解除,以使声音识别部60A不对与被提供了小于预先设定的规定值的似然值的功能信息相对应的词汇信息进行识别。优先识别词汇设定部130A接着基于来自似然值提供部120A的每个功能信息的似然值,对声音引导信息生成部131输出指示信号,以输出促使说出与似然值最高的功能信息相对应的词汇的声音引导信息。
在来自声音输入部50的再输入次数小于规定次数时,声音识别部60A基于从声音输入部50输入的声音信息对声音引导信息生成部131发生指示,以输出促使声音的再输入的声音引导信息。声音识别部60A例如在判定为无法进行声音识别时,基于从声音输入部50输入的声音信息,确认声音信息的再输入次数,判定再输入次数是否小于预先设定的规定次数。声音识别部60A在判定为再输入次数小于规定次数时,对声音引导信息生成部131输出指示信号,以输出促使声音的再输入的声音引导信息。另外,声音识别部60A在判定为再输入次数为规定次数以上时,对声音引导信息生成部131输出指示信号,以输出对声音识别处理发生错误这一情况进行通知的声音引导信息。
声音引导信息生成部131起到基于来自优先识别词汇设定部130A的指示、输出促使说话的声音引导信息的作用。声音引导信息生成部131例如根据来自优先识别词汇设定部130A的指示信号,从预先存储的每个功能的声音引导信息中生成被指示的功能的声音引导信息,并将其输出到声音输出部150。声音引导信息例如预先记录有“在寻找有关路径设定的操作吗?”、“请讲有关路径设定的操作内容”等成为与用户的对话形式这样的多个内容。
此外,声音引导信息生成部131起到基于来自声音识别部60A的指示输出促使声音的再输入的声音引导信息、或通知声音识别错误的声音引导信息的作用。声音引导信息生成部131例如根据来自声音识别部60A的指示信号,从预先存储的每个功能的声音引导信息中生成被指示的功能的声音引导信息并输出到声音输出部150。此时的声音引导信息例如预先记录有像“请再讲一遍有关路径设定的操作内容”这样促使声音的再输入、或像“无法识别”这样通知声音识别错误的内容。
声音输出部150起到将来自声音引导信息生成部131的声音引导信息作为声波输出的作用,其例如由扬声器构成。
此处,对成本计算部140的成本值计算方法进行说明。
成本计算部140例如利用以下的公式(1)计算出上述图4所示的当前操作中的界面画面连续操作NOW中的经过时间。
Snow=TOnow、nowLast-TOnow、1   (1)
当前操作中的连续操作NOW中的经过时间Snow如公式(1)所示,表示从最新的操作时刻TOnow、nowLast减去最初的操作时刻TOnow、1所得到的值。
成本计算部140接着利用以下的公式(2)计算出过去的连续操作的经过时间的平均时间E(SPm)。
E ( S Pm ) = 1 Last Σ Last ( T Om , mLast - T Om , 1 ) - - - ( 2 )
过去的连续操作Pm(m=1、2、…、Last)中的经过时间SPm是从功能执行键部23的操作时刻TOm、mLast减去连续操作的最初的操作时刻TOm、1而得到的、公式(2)所示的值。
过去的连续操作Pm(m=1、2、…、Last)中的经过时间SPm的平均时间E(SPm)如公式(2)所示,表示将连续操作的经过时间SPm的总和除以总的连续操作次数Last(1~Last)所得到的值。
成本计算部140接着利用以下的公式(3)将由公式(1)计算出的当前操作中的连续操作的经过时间Snow与由公式(2)计算出的过去的连续操作的经过时间的平均时间E(SPm)之差作为成本值Cost进行计算。
Cost=Snow-E(SPm)   (3)
接下来,使用图8所示的流程图说明实施方式2所涉及的信息处理装置中的处理动作。
若用户经由界面画面操作部40对界面画面进行操作,则信息处理装置1A开始处理(图8的“开始”)。
图8中,步骤ST101~步骤ST104为止的处理动作与实施方式1相同,因此,省略对该处理动作的说明。
若似然值提供部120A在步骤ST104中将每个功能的似然值输出到优选识别词汇设定部130A,则成本计算部140基于记录在界面画面操作历史记录部110中的当前操作中的连续操作信息,从当前操作中的连续操作信息中的最新的操作时刻TOnow、nowLast减去最初的操作时刻TOnow、1来计算出经过时间Snow(步骤ST201)。
成本计算部140在步骤ST201之后,对于每次连续操作,从功能执行键部23的操作时刻TOm、mLast减去最初的操作时刻TOm、1,从而计算出过去的连续操作Pm中的经过时间SPm,并计算出过去的连续操作Pm(m=1、2、…、Last)的经过时间SPm(m=1、2、…、Last)的总和。
成本计算部140将过去的连续操作Pm(m=1、2、…、Last)的经过时间SPm(m=1、2、…、Last)的总和除以总的连续操作次数Last(1~Last),从而计算出过去的连续操作Pm(m=1、2、…、Last)中的经过时间SPm的平均时间E(SPm)(步骤ST202)。
成本计算部140在步骤ST202之后,将当前操作中的连续操作的经过时间Snow与过去的连续操作的经过时间的平均时间E(SPm)之差作为成本值Cost进行计算,并输出到优选识别词汇设定部130A。
优先识别词汇设定部130A判定来自成本计算部140的成本值Cost(=Snow-E(SPm))是否为预先设定的规定值以上(Snow-E(SPm)≥规定值)(步骤ST203)。在步骤ST203中判定为成本值Cost小于预先设定的规定值时(步骤ST203中为“否”),优先识别词汇设定部130A不进行优先识别词汇设定,并结束处理(“结束”)。
另一方面,在步骤ST203中判定为成本值Cost为预先设定的规定值以上时(步骤ST203中为“是”),优先识别词汇设定部130A基于来自似然值提供部120A的对功能信息提供的似然值,对声音识别部60A设定与似然值为规定值以上的功能信息相对应的词汇信息,并解除与似然值小于规定值的功能信息相对应的词汇信息的设定(步骤ST204)。
优先识别词汇设定部130A若在步骤ST204中解除与似然值小于规定值的功能信息相对应的词汇信息,则向声音引导信息生成部131输出指示信号以输出促使说话的声音引导信息。
若优先识别词汇设定部130A在步骤ST204之后紧接着输入指示信号,则声音引导信息生成部131生成促使说话的声音引导信息,并经由声音输出部150进行输出(步骤ST205)。
若声音引导信息生成部131在步骤ST205中输出促使说话的声音引导信息,则声音识别部60A判定是否经由声音输入部50输入了声音信息(步骤ST206)。若声音识别部60A在步骤ST206中判定为未输入声音信息时(步骤ST206中为“否”),则重复步骤ST206的判定。
若声音识别部60A在步骤ST206中判定为输入了声音信息时(步骤ST206中为“是”),则基于来自声音输入部50的声音信息进行声音识别处理(步骤ST207)。
声音识别部60A判定在步骤ST207中是否完成了声音识别(步骤ST208)。声音识别部60A在步骤ST208中判定为完成了声音识别时(步骤ST208中为“是”),向功能执行部70输出执行功能的命令信号。
功能执行部70基于来自声音识别部60A的命令信号中包含的功能信息,从预先存储的多个程序中启动与功能信息相对应的程序以执行功能(步骤ST209),并结束处理(“结束”)。
声音识别部60A在步骤ST208中判定为未完成声音识别时(步骤ST208中为“否”),基于从声音输入部50输入的声音信息,确认声音信息的再输入次数,判定再输入次数是否在规定次数N以上(步骤ST210)。
声音识别部60A在步骤ST210中判定为再输入次数小于规定次数N时(步骤ST210中为“否”),向声音引导信息生成部131输出指示信号以输出促使声音的再输入的声音引导信息。
若优先识别词汇设定部130A在步骤ST210中为“否”时从优先识别词汇设定部130A输入指示信号,则声音引导信息生成部131生成促使声音的再输入的声音引导信息,并经由声音生成部150进行输出(步骤ST211),重复从步骤ST206开始的处理动作。
另一方面,声音识别部60A在步骤ST210中判定为再输入次数为规定次数N以上时(步骤ST210中为“是”),对声音引导信息生成部131输出指示信号,以输出对声音识别处理发生错误这一情况进行通知的声音引导信息。
若优先识别词汇设定部130A在步骤ST210中为“是”时输入指示信号,则声音引导信息生成部131生成对声音识别处理发生错误这一情况进行通知的声音引导信息,并经由声音输出部150进行输出(步骤ST212),从而结束处理(“结束”)。
如上所述,根据实施方式2,由于信息处理装置1A构成为包括实施方式1的结构,并且包括:成本计算部140,该成本计算部140使用记录在界面画面操作历史记录部110中的、表示直到对功能执行键部23进行操作为止对界面画面变更键部22连续进行了操作的操作内容的过去的连续操作信息、以及表示当前为止未对功能执行键部23进行操作而对界面画面变更键部22连续进行操作的操作内容的当前操作中的连续操作信息,将当前操作中对界面画面变更键部22连续进行操作的经过时间(最新的操作时刻-最初的操作时刻)、与根据多个过去的连续操作信息确定的表示过去的对功能执行键部23进行操作为止的经过时间的平均值(连续操作的经过时间的总和/总的连续操作次数)之差作为表示执行功能为止所需的用户的劳力的成本值进行计算;以及优先识别词汇设定部130A,该优先识别词汇设定部130A在来自成本计算部140的成本值为规定值以上时,基于由似然值提供部120A设定的所有的每个功能信息的似然值进行设定,以解除与似然值小于规定值的功能信息相对应的词汇信息,因此,在用户消耗的劳力(成本值)较大的情况下判定为没有找到所希望的功能,能增加与较高似然值的功能相对应的词汇的变形来进行声音识别。能利用声音识别来执行所希望的功能的情况比以往要多。其结果是,信息处理装置1A可获得能降低用户无法实现所希望的功能而放弃操作的情况的发生频度这样的效果。
此外,根据实施方式2,由于信息处理装置1A构成为包括成本计算部140,该成本计算部140将记录在界面画面操作历史记录部110中的、过去的连续操作信息与当前操作中的连续操作信息进行比较,利用当前操作中的经过时间和与当前操作中的操作内容相类似的过去的连续操作信息中的功能执行键部23被操作为止的经过时间之差,来计算出表示用户的劳力的成本值,因此,可获得能应用过去进行的连续操作来推定用户进行操作的劳力这样的效果。
而且,根据实施方式2,由于信息处理装置1A构成为包括:优先识别词汇设定部130A,该优先识别词汇设定部130A在来自成本计算部140的成本值为规定值以上时,对声音引导信息生成部131发出指示,以输出促使说出与似然值较高的功能相对应的词汇的声音引导信息;声音识别部60A,该声音识别部60A基于从声音输入部50输入的声音信息,在来自声音输入部50的再输入次数为规定次数以上时,对声音引导信息生成部131发出指示,以输出促使声音的再输入的声音引导信息;声音引导信息生成部131,该声音引导信息生成部131基于来自优先识别词汇设定部130A的指示或来自声音识别部60A的指示,生成促使说话的声音引导信息;以及声音输出部150,该声音输出部150基于来自声音引导信息生成部131的声音引导信息来输出声音引导,因此,能在没有发现用户正在寻找的功能执行键部23的情况下利用声音引导来引导促使说话。其结果是,信息处理装置1A可获得能降低用户无法实现所希望的功能而放弃操作的情况的发生频度这样的效果。
实施方式3
实施方式2中,对将表示用户也许会消耗的劳力的成本值基于各连续操作的经过时间来进行计算的结构进行了说明。实施方式3对将各连续操作的经过时间进行加权来计算成本值的结构进行说明。
图9表示实施方式3所涉及的信息处理装置的功能结构。实施方式3的信息处理装置1B是在实施方式2的信息处理装置1A的结构中添加了操作历史切换部24的结构。
如图9所示,信息处理装置1B包括界面画面控制部20、显示部30、界面画面操作部40、声音输入部50、声音识别部60A、功能执行部70、似然值提供部120B、优先识别词汇设定部130B、声音引导信息生成部131、成本计算部140B、及声音输出部150。
显示部30、界面画面操作部40、声音输入部50、功能执行部70、界面画面操作历史记录部110、声音引导信息生成部131、及声音输出部150与实施方式1构成相同,因此省略说明。
界面画面控制部20采用以下的结构:即,存储有预先设定好的多个界面画面信息21,将界面画面信息21经由显示部30作为界面画面进行显示。界面画面信息21具有多个界面画面变更键部22、多个功能执行键部23、及操作历史切换部24。操作历史切换部24是切换提供给操作信息的每个用户的信息(用户信息)的操作键。操作历史切换部24例如采用以下的结构:即,用户经由界面画面操作部40对操作历史切换部24进行操作,从而切换到从预先存储的多个用户信息中指定的用户信息,并将被指定的用户信息提供并输出给操作信息。另外,多个界面画面变更键部22和多个功能执行键部23与实施方式1相同,因此,省略说明。
此外,界面画面控制部20起到以下的作用:即,基于用户经由界面画面操作部40输入的操作信号,将对操作内容和操作时刻提供了用户信息的操作信息输出到界面画面操作历史记录部110。例如,若用户经由界面画面操作部40对界面画面变更键部22或功能执行键部23进行操作,则界面画面控制部20将用户信息提供给示出表示被操作的界面画面变更键部22或功能执行键部23的操作内容、及表示被操作的时间的操作时刻的操作信息,并输出到界面画面操作历史记录部110。
界面画面操作历史记录部110起到以下的作用:即,从界面画面控制部20输入基于每个用户对于显示部30的功能执行键部23和界面画面变更键部22的操作信号的操作内容信息和操作时刻信息,对每个用户记录表示以规定时间以下的间隔被操作的操作内容和操作时刻的连续操作信息。界面画面操作历史记录部110从出厂时到当前为止、或从启动时到当前为止记录上述操作信息和连续操作信息。
界面画面操作历史记录部110具有操作历史选择部111。操作历史选择部111起到以下的作用:即,从每个用户的连续操作信息中选择并输出由操作历史切换部24指定的用户的连续操作信息。操作历史选择部111例如存储有用户通过操作历史切换部24指定的用户信息,从每个用户的连续操作信息中选择与来自操作历史切换部24的用户信息相对应的用户的连续操作信息,并输出到似然值提供部120B和成本计算部140B。
似然值提供部120B起到以下的作用:即,基于当前操作中的连续操作中被选择的操作内容的选择模式信息与过去的连续操作中被选择的操作内容的选择模式信息的一致度,对每个用户确定表示是否是当前时刻用户希望执行的功能的概率(程度)的似然值。
似然值提供部120B例如基于记录在界面画面操作历史记录部110中的当前操作中的连续操作信息和过去的连续操作信息,提取出当前操作中的连续操作的操作内容的选择模式信息和过去的每次连续操作的操作内容的选择模式信息。似然值提供部120B计算出当前操作中的连续操作的操作内容的选择模式信息与过去的连续操作的操作内容的选择模式信息的一致度,并输出将该一致度提供作为由过去的连续操作所操作的功能的似然值的功能信息。在后面叙述该似然值的计算方法。
成本计算部140B采用以下的结构:即,将从过去的连续操作信息中确定的功能执行键部23被操作为止的经过时间用对该功能执行键部23的功能所设定的似然值来进行加权,将当前操作中界面画面变更键部22被连续操作的时间、与根据多个过去的连续操作信息导出的经加权后的经过时间的平均值之差作为表示执行功能为止所需的用户的劳力的成本值来进行计算。
成本计算部140B例如基于当前操作中的连续操作信息来计算当前操作中的连续操作的经过时间(最新的操作时刻-最初的操作时刻)。此外,成本计算部140B基于过去的连续操作信息和似然值,计算出乘上似然值进行加权后的过去的连续操作的经过时间的平均时间((似然值×各连续操作的经过时间)的总和/总的连续操作次数)。成本计算部140B将当前操作中的连续操作的经过时间与乘上似然值进行加权后的过去的连续操作的经过时间的平均时间的差分值作为成本值来进行计算。
优先识别词汇设定部130B起到以下的作用:即,在来自成本计算部140B的成本值为规定值以上时,根据来自似然值提供部120B的每个功能的似然值来设定与各功能相对应的词汇信息。例如,优先识别词汇设定部130B在来自成本计算部140B的成本值为规定值0以上时,根据来自似然值提供部120B的每个功能的似然值,增加设定与似然值为规定值以上的功能相对应的词汇信息,并解除设定与似然值小于规定值的功能相对应的词汇信息。
此处,对实施方式3中的似然值提供部120B的似然值计算方法进行说明。
似然值提供部120B基于记录在界面画面操作历史记录部110中的连续操作信息,例如提取出上述图4所示的当前操作中的连续操作NOW的操作内容的选择模式信息Vnow=(Onow、1、Onow、2…、Onow、nowLast)和过去的连续操作Pm的操作内容的选择模式信息VPm=(Om、1、Om、2…、Om、mLast),并计算出选择模式信息Vnow与选择模式信息VPm的一致度。似然值提供部120B将计算出的一致度作为在连续操作Pm中执行的功能X的似然值Wx与功能信息一起进行输出。另外,在过去的连续操作Pm中功能X被多次执行时,似然值提供部120B将多个一致度中的最大值作为似然值Wx。
一致度设定成按照某一基准来进行判断。例如,按照以下(1)、(2)那样进行设定。
(1)设定成越是界面变更键部22的操作内容一致的功能,一致度越高。
(2)设定成越是界面画面的显示内容一致的功能,一致度越高。
另外,由于根据与过去的连续操作Pm的一致度来确定功能的似然值,因此,将不存在过去的连续操作Pm的功能的似然值设为0。
以下示出设定成越是界面变更键部22的操作内容一致的功能、一致度越高的情况的计算例。
(界面变更键部22的操作内容的一致度的计算例)
对于作为界面变更键部22而准备的各操作f1~fn(j=1、…、n),计算以下的操作类似度Rmj,其在过去的连续操作Pm与当前操作中的连续操作的操作次数之差越大时,值越小。
Rmj=1/(1+|[过去的连续操作Pm的操作次数]―[当前操作中的连续操作的操作次数]|)
针对过去的每次连续操作Pm,对于操作f1~fn,将操作类似度Rmj之和作为操作一致度Sm进行计算。将操作一致度Sm作为过去的连续操作Pm所执行的功能的似然值进行提供。
以下示出设定成越是界面画面的显示内容一致的功能、一致度越高的情况的计算例。
(界面画面的显示内容的一致度的计算例)
对于作为界面画面而准备的各画面I1~In(j=1、…、n),计算以下的显示类似度Hmj,其在过去的连续操作Pm与当前操作中的连续操作的有无显示之差越大时,值越小。
Hmj=1过去的连续操作Pm和当前操作中的连续操作都进行显示的情况
Hmj=1过去的连续操作Pm和当前操作中的连续操作都不进行显示的情况
Hmj=0过去的连续操作Pm和当前操作中的连续操作仅其中一方进行显示的情况
针对过去的每次连续操作Pm,对于画面I1~In,将显示类似度Hmj之和作为显示一致度Km进行计算。将显示一致度Km作为过去的连续操作Pm所执行的功能的似然值进行提供。
通过如此计算似然值,能将与一致度较高的过去的选择模式所执行的功能相对应的词汇信息优先进行声音识别。另外,在实施方式3的似然值提供部120B中,也可以采用与实施方式1、2同样地计算似然值的结构。
此处,对实施方式3中的成本计算部140B的成本值计算方法进行说明。
成本计算部140B利用实施方式1所示的公式(1)计算出当前操作中的连续操作NOW的经过时间Snow
成本计算部140B接着利用以下的公式(4)计算出过去的连续操作的经过时间的平均时间E(Wx*SPm)。
E ( Wx * S Pm ) = 1 Last Σ Last Wx ( T Om , mLast - T Om , 1 ) - - - ( 4 )
过去的连续操作的经过时间的平均时间E(Wx*SPm)如公式(4)所示,是将连续操作Pm中所执行的功能X的似然值Wx乘以连续操作Pm的经过时间SPm所得到的值。
成本计算部140B利用以下的公式(5)将由公式(1)计算出的当前操作中的连续操作的经过时间Snow与由公式(2)计算出的过去的连续操作的经过时间的平均时间E(Wx*SPm)之差作为成本值Cost进行计算。
Cost=Snow-E(Wx*SPm)   (5)
接下来,使用图10所示的流程图说明实施方式3所涉及的信息处理装置中的处理动作。
若用户经由界面画面操作部40对界面画面进行操作,则信息处理装置1B开始处理(图8的“开始”)。
界面画面控制部20在界面画面上显示对用户信息进行切换的操作历史切换部24,并进行促使操作的显示。若用户经由界面画面操作部40输入操作历史切换部24的操作,则界面画面控制部20从预先设定的多个用户信息中选择被指定的用户信息。
接着,若用户经由画面操作部40对界面画面变更键部22或功能执行键部23进行操作,则界面画面控制部20将用户信息提供给示出表示被操作的界面画面变更键部22或功能执行键部23的操作内容、以及表示被操作的时间的操作时刻的操作信息,并输出到界面画面操作历史记录部110。
界面画面操作历史记录部110基于从界面画面控制部20输入的每个用户的操作信息,直到功能执行键部23被操作为止,追加、更新以规定时间以下的间隔连续地进行的操作内容及其操作时刻,并将其作为当前操作中的连续操作信息进行记录(步骤ST101)。
若界面画面操作历史记录部110若在步骤ST101中更新、记录当前操作中的连续操作信息,则判定所输入的操作信息的操作内容是功能执行键部23的操作还是功能执行键部23以外的操作(步骤ST102)。
界面画面操作历史记录部110在步骤ST102中判定为是功能执行键部23的操作时(步骤ST102中为“否”),将直到对功能执行键部23进行操作为止、以规定时间以下的间隔连续地进行的操作内容及其操作时刻作为连续操作信息进行记录,直到输入下一个操作信息为止结束处理(“结束”)。
另一方面,界面画面操作历史记录部110在步骤ST102中判定为是功能执行键部23以外的操作时(步骤ST102中为“是”),更新、追加以规定时间以下的间隔连续地进行的操作内容及其操作时刻,将其作为当前操作中的连续操作信息进行记录,并将该当前操作中的连续操作信息和过去的连续操作信息输出到似然值提供部120B。
若从界面画面操作历史记录部110输入当前操作中的连续操作信息和过去的连续操作信息,则似然值提供部120B基于当前操作中的连续操作信息,提取出当前操作中的连续操作NOW的操作内容的选择模式信息Vnow(步骤ST301)。
似然值提供部120B在步骤ST301之后,基于过去的连续操作信息,对过去的每次连续操作Pm(m=1、2、…、Last)提取出操作内容的选择模式信息VPm(m=1、2、…、Last)(步骤ST302)。
似然值提供部120B计算出在步骤ST301中提取出的选择模式信息Vnow与在步骤ST302中提取出的选择模式信息VPm的一致度,并将计算出的一致度作为连续操作Pm中被执行的功能X的似然值Wx提供给功能信息,并输出到成本计算部140B和优先识别词汇设定部130B(步骤ST303)。
若似然值提供部120B在步骤ST303中将每个功能的似然值Wx输出到优选识别词汇设定部130B,则成本计算部140B基于记录在界面画面操作历史记录部110中的当前操作中的连续操作信息,从当前操作中的连续信息的最新的操作时刻TOnow、nowLast减去最初的操作时刻TOnow、1来计算当前操作中的连续操作的经过时间Snow(步骤ST304)。
成本计算部140B在步骤ST304之后,针对每次连续操作,从功能执行键部23的操作时刻TOm、mLast减去最初的操作时刻TOm、1来计算出过去的每次连续操作Pm(m=1、2、…、Last)的经过时间SPm(m=1、2、…、Last)
成本计算部140B将来自似然值提供部120B的似然值Wx乘以过去的连续操作Pm(m=1、2、…、Last)的经过时间SPm(m=1、2、…、Last)来进行加权,将对过去的每次连续操作Pm(m=1、2、…、Last)进行加权后的经过时间(Wx*SPm(m=1、2、…、Last))的总和除以总的连续操作次数Last(1~Last),从而计算出对过去的每次连续操作Pm(m=1、2、…、Last)进行加权后的经过时间SPm的加权平均时间E(Wx*SPm)(步骤ST305)。
成本计算部140B将在步骤ST304中计算出的当前操作中的连续操作的经过时间Snow与在步骤ST305中计算出的加权平均时间E(Wx*SPm)的差分作为成本值Cost输出到优选识别词汇设定部130B。
优先识别词汇设定部130B判定来自成本计算部140B的成本值Cost(=Snow-E(Wx*SPm))是否为预先设定的规定值以上(Snow-E(Wx*SPm)≥规定值)(步骤ST306)。此处,将规定值设定为“0”,判定当前操作中的连续操作的经过时间Snow是否为加权平均时间E(Wx*SPm)以上。
优先识别词汇设定部130B在步骤ST306中判定为成本值Cost小于预先设定的规定值“0”时(步骤ST306中为“否”),不进行优先识别词汇设定,并结束处理(“结束”)。
另一方面,优先识别词汇设定部130B在步骤ST306中判定为成本值Cost在预先设定的规定值“0”以上时(步骤ST306中为“是”),对声音识别部60A设定与提供了规定值以上的似然值Wx的功能信息相对应的词汇信息,并增加能进行声音识别的声音的变形(步骤ST307)。
优先识别词汇设定部130B在步骤ST307之后,对声音识别部60A解除与提供了小于规定值的似然值Wx的功能信息相对应的词汇信息的设定,并删减能进行声音识别的声音的变形(步骤ST308)。
若优先识别词汇设定部130B在步骤ST308中解除与似然值小于规定值的功能信息相对应的词汇信息,则向声音引导信息生成部131输出指示信号,以输出促使说话的声音引导信息。
在实施方式3的信息处理装置1B中,在步骤ST308之后,进行实施方式2的步骤ST205之后的处理。步骤ST205之后的处理动作与实施方式2相同,因此,省略说明。
如上所述,根据实施方式3,由于信息处理装置1B构成为包括:成本计算部140B,该成本计算部140B将根据过去的连续操作信息确定的功能执行键部23被操作为止的经过时间用对该功能执行键部23的功能所设定的似然值进行加权,将当前操作中界面画面变更键部22被连续操作的时间、与根据多个过去的连续操作信息导出的经加权后的经过时间的平均值之差作为表示执行功能为止所需的用户的劳力的成本值来进行计算;以及优先识别词汇设定部130B,该优先识别词汇设定部130B在来自成本计算部140B的成本值为规定值以上时,根据来自似然值提供部120B的每个功能的似然值来设定与各功能相对应的词汇信息,因此,能考虑到用户对各功能的期望程度,来判定操作是否费事。其结果是,可获得能提高信息处理装置1B中的成本值的计算精度这样的效果。
此外,根据实施方式3,由于信息处理装置1B构成为包括:界面画面控制部20,该界面画面控制部20基于用户经由界面画面操作部40输入的操作信号,将用户信息提供给表示操作内容和操作时刻的操作信息并输出到界面画面操作历史记录部110;以及界面画面操作历史记录部110,该界面画面操作历史记录部110具有操作历史选择部111,该操作历史选择部111基于与从界面画面操作部40输入的对功能执行键部23和界面画面变更键部22的操作相对应的每个用户的操作信号,将功能执行键部23及界面画面变更键部22的操作时刻、以及以规定时间以下的间隔对界面画面变更键部22连续地进行操作的操作内容作为连续操作信息针对每个用户进行记录,并针对每个用户选择并输出记录在界面画面操作历史记录部110中的连续操作信息,因此,能针对每个用户使用单独的连续操作信息。其结果是,信息处理装置1B能获得容易利用声音识别来针对每个用户执行其所希望的功能这样的效果。
工业上的实用性
根据本发明,由于信息处理装置能容易地利用声音识别执行用户所希望的功能,因此,信息处理装置例如能利用于车载导航等的信息处理装置。

Claims (10)

1.一种信息处理装置,其特征在于,包括:
显示部,该显示部对按照每个功能类别具有表示规定功能的功能执行键部的界面画面、以及将所述界面画面按照每个所述功能类别进行切换的界面画面变更键部进行显示;
界面画面操作部,该界面画面操作部接收对显示在所述显示部上的所述功能执行键部及所述界面画面变更键部的操作;
界面画面控制部,该界面画面控制部从所述界面画面操作部输入有与对所述界面画面变更键部的操作相对应的操作信号,基于该操作信号,控制所述显示部中的所述界面画面的切换显示;
界面画面操作历史记录部,该界面画面操作历史记录部基于从所述界面画面操作部输入的与对所述功能执行键部和所述界面画面变更键部的操作相对应的操作信号,将所述功能执行键部及所述界面画面变更键部的操作时刻、以及以规定时间以下的间隔对所述界面画面变更键部连续进行操作的操作内容作为连续操作信息进行记录;
似然值提供部,该似然值提供部基于记录在所述界面画面操作历史记录部中的连续操作信息,对所述功能执行键部所表示的每个功能计算并提供表示用户所希望的程度的似然值;
优先识别词汇设定部,该优先识别词汇设定部预先存储有每个功能的词汇信息,输出与由所述似然值提供部所设定的似然值为规定值以上的功能相对应的词汇信息;
声音识别部,该声音识别部参照从所述优先识别词汇设定部输入的词汇信息,对所输入的声音进行声音识别;以及
功能执行部,该功能执行部执行使用所述界面画面操作部进行了操作的所述功能执行键部的功能,或者执行与利用所述声音识别部进行声音识别所得到的词汇相对应的功能。
2.如权利要求1所述的信息处理装置,其特征在于,所述似然值提供部根据表示当前为止未对所述功能执行键部进行操作而对所述界面画面变更键部连续进行操作的操作内容的当前操作中的连续操作信息,确定所述功能执行键部的显示时间,并以所述显示时间越短、所希望的程度越高的方式,对所述功能执行键部所表示的每个功能计算并提供所述似然值。
3.如权利要求1所述的信息处理装置,其特征在于,所述优先识别词汇设定部进行设定,以对与由所述似然值提供部所设定的所述似然值为规定值以上的功能相对应的词汇信息优先进行声音识别。
4.如权利要求1所述的信息处理装置,其特征在于,在记录于所述界面画面操作历史记录部的、表示直到对所述功能执行键部进行操作为止对所述界面画面变更键部连续进行了操作的操作内容的过去的连续操作信息中,还记录有被执行的功能的似然值,
所述似然值提供部将所述过去的连续操作信息、与表示当前为止未对所述功能执行键部进行操作而对所述界面画面变更键部连续进行操作的操作内容的当前操作中的连续操作信息进行比较,将由与所述当前操作中的连续操作信息相类似的操作内容的所述过去的连续操作信息所执行的功能的似然值提供作为当前操作中对所述功能执行键部进行操作时的该功能的所述似然值。
5.如权利要求1所述的信息处理装置,其特征在于,所述似然值提供部将记录在所述界面画面操作历史记录部中的、表示直到对所述功能执行键部进行操作为止对所述界面画面变更键部连续进行了操作的操作内容的过去的连续操作信息、与表示当前为止未对所述功能执行键部进行操作而对所述界面画面变更键部连续进行操作的操作内容的当前操作中的连续操作信息进行比较,将所述当前操作中的连续操作信息与所述过去的连续操作信息的一致度提供作为在对由所述过去的连续操作信息所执行的功能的当前操作中对所述功能执行键部进行操作时的所述似然值。
6.如权利要求1所述的信息处理装置,其特征在于,包括成本计算部,该成本计算部使用记录在所述界面画面操作历史记录部中的、表示对所述功能执行键部进行操作为止对所述界面画面变更键部连续进行了操作的操作内容的过去的连续操作信息、以及表示当前为止未对所述功能执行键部进行操作而对所述界面画面变更键部连续进行操作的操作内容的当前操作中的连续操作信息,将当前操作中对所述界面画面变更键部连续进行操作的时间、与根据多个所述过去的连续操作信息确定的过去的直到对所述功能执行键部进行操作为止的经过时间的平均值之差作为表示执行功能为止所需的用户的劳力的成本值来进行计算,
所述优先识别词汇设定部在由所述成本计算部计算出的成本值为规定值以上时进行解除设定,以不对与由所述似然值提供部所设定的似然值小于规定值的功能相对应的词汇信息进行声音识别。
7.如权利要求6所述的信息处理装置,其特征在于,所述成本计算部使用与当前操作中的连续操作信息的操作内容相类似的过去的连续操作信息来计算成本值。
8.如权利要求6所述的信息处理装置,其特征在于,所述成本计算部将根据所述过去的连续操作信息确定的对所述功能执行键部进行操作为止的经过时间用对该功能执行键部的功能所设定的似然值进行加权,将当前操作中对所述界面画面变更键部连续进行操作的时间、与根据多个所述过去的连续操作信息导出的经所述加权后的经过时间的平均值之差作为表示执行功能为止所需的用户的劳力的成本值来进行计算。
9.如权利要求1所述的信息处理装置,其特征在于,所述界面画面操作历史记录部基于从所述界面画面操作部输入的与对所述功能执行键部和所述界面画面变更键部的操作相对应的每个用户的操作信息,将所述功能执行键部及所述界面画面变更键部的操作时刻、以及以规定时间以下的间隔对所述界面画面变更键部连续进行操作的操作内容作为连续操作信息针对每个用户进行记录,
所述信息处理装置具有操作历史选择部,该操作历史选择部针对每个用户选择并输出记录在所述界面画面操作历史记录部中的连续操作信息。
10.如权利要求6所述的信息处理装置,其特征在于,包括声音引导信息生成部,该声音引导信息生成部在来自所述成本计算部的成本值为规定值以上时,输出促使说话的声音引导。
CN201080068379.XA 2010-08-09 2010-08-09 信息处理装置 Expired - Fee Related CN103052940B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2010/004996 WO2012020444A1 (ja) 2010-08-09 2010-08-09 情報処理装置

Publications (2)

Publication Number Publication Date
CN103052940A CN103052940A (zh) 2013-04-17
CN103052940B true CN103052940B (zh) 2015-09-30

Family

ID=45567428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080068379.XA Expired - Fee Related CN103052940B (zh) 2010-08-09 2010-08-09 信息处理装置

Country Status (5)

Country Link
US (1) US9002715B2 (zh)
JP (1) JP5128011B2 (zh)
CN (1) CN103052940B (zh)
DE (1) DE112010005802T5 (zh)
WO (1) WO2012020444A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107209493A (zh) * 2015-01-22 2017-09-26 三菱电机株式会社 工程工具程序以及工程工具

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201027415A (en) * 2009-01-05 2010-07-16 Wistron Corp Function configuration method and related device for a remote control device
US10268446B2 (en) * 2013-02-19 2019-04-23 Microsoft Technology Licensing, Llc Narration of unfocused user interface controls using data retrieval event
TW201543361A (zh) * 2014-05-07 2015-11-16 Giga Byte Tech Co Ltd 觸發開啟巨集的輸入系統
KR102480728B1 (ko) * 2017-11-10 2022-12-23 삼성전자주식회사 전자장치 및 그 제어방법
US11513815B1 (en) 2019-05-24 2022-11-29 Hiro Systems Pbc Defining data storage within smart contracts
US11657391B1 (en) 2019-05-24 2023-05-23 Hiro Systems Pbc System and method for invoking smart contracts
US10699269B1 (en) * 2019-05-24 2020-06-30 Blockstack Pbc System and method for smart contract publishing
KR20220010259A (ko) * 2020-07-17 2022-01-25 삼성전자주식회사 음성 신호 처리 방법 및 장치
CN116610277A (zh) * 2023-07-19 2023-08-18 深圳市研盛芯控电子技术有限公司 智能显示控制系统和智能显示控制方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1385783A (zh) * 2001-05-14 2002-12-18 索尼电脑娱乐美国公司 在游戏环境中以菜单驱动的语音来控制角色的系统和方法
JP2004212533A (ja) * 2002-12-27 2004-07-29 Ricoh Co Ltd 音声コマンド対応機器操作装置、音声コマンド対応機器、プログラム、及び記録媒体
CN1764896A (zh) * 2003-04-07 2006-04-26 诺基亚有限公司 在具有用户接口的电子设备中提供允许语音的输入的方法和设备

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324702A (ja) * 1992-05-20 1993-12-07 Fuji Xerox Co Ltd 情報処理装置
JPH09128397A (ja) * 1995-11-06 1997-05-16 Sharp Corp 通訳機
US6111940A (en) * 1998-11-09 2000-08-29 Pilgrim Telephone, Inc. Method for providing telephonic services
US6404925B1 (en) * 1999-03-11 2002-06-11 Fuji Xerox Co., Ltd. Methods and apparatuses for segmenting an audio-visual recording using image similarity searching and audio speaker recognition
GB2359461A (en) * 2000-02-21 2001-08-22 Nokia Mobile Phones Ltd Personalised information from a phone is backed up and/or transferred between phones using a computer
US6895380B2 (en) * 2000-03-02 2005-05-17 Electro Standards Laboratories Voice actuation with contextual learning for intelligent machine control
US20020035474A1 (en) * 2000-07-18 2002-03-21 Ahmet Alpdemir Voice-interactive marketplace providing time and money saving benefits and real-time promotion publishing and feedback
US7246062B2 (en) * 2002-04-08 2007-07-17 Sbc Technology Resources, Inc. Method and system for voice recognition menu navigation with error prevention and recovery
US8311835B2 (en) * 2003-08-29 2012-11-13 Microsoft Corporation Assisted multi-modal dialogue
JP2005181386A (ja) 2003-12-16 2005-07-07 Mitsubishi Electric Corp 音声対話処理装置及び音声対話処理方法並びにプログラム
WO2006058103A2 (en) * 2004-11-24 2006-06-01 Siemens Medical Solutions Usa, Inc. A predictive user interface system
EP1895508B1 (en) 2005-06-21 2010-10-06 Pioneer Corporation Speech recognizing device, information processing device, speech recognizing method, program, and recording medium
US20100131642A1 (en) * 2007-04-17 2010-05-27 Metrometrix Pty Ltd. System for monitoring the use of content in a vehicle
US20090166098A1 (en) * 2007-12-31 2009-07-02 Apple Inc. Non-visual control of multi-touch device
US8380499B2 (en) * 2008-03-31 2013-02-19 General Motors Llc Speech recognition adjustment based on manual interaction
US8676904B2 (en) * 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US8194849B2 (en) * 2009-02-27 2012-06-05 Research In Motion Limited System and method for providing audible messages in replacement of telephone tones

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1385783A (zh) * 2001-05-14 2002-12-18 索尼电脑娱乐美国公司 在游戏环境中以菜单驱动的语音来控制角色的系统和方法
JP2004212533A (ja) * 2002-12-27 2004-07-29 Ricoh Co Ltd 音声コマンド対応機器操作装置、音声コマンド対応機器、プログラム、及び記録媒体
CN1764896A (zh) * 2003-04-07 2006-04-26 诺基亚有限公司 在具有用户接口的电子设备中提供允许语音的输入的方法和设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107209493A (zh) * 2015-01-22 2017-09-26 三菱电机株式会社 工程工具程序以及工程工具
CN107209493B (zh) * 2015-01-22 2019-03-15 三菱电机株式会社 工程工具程序以及工程工具

Also Published As

Publication number Publication date
WO2012020444A1 (ja) 2012-02-16
JP5128011B2 (ja) 2013-01-23
US9002715B2 (en) 2015-04-07
DE112010005802T5 (de) 2013-05-16
CN103052940A (zh) 2013-04-17
JPWO2012020444A1 (ja) 2013-10-28
US20130066637A1 (en) 2013-03-14

Similar Documents

Publication Publication Date Title
CN103052940B (zh) 信息处理装置
CN105741836B (zh) 声音识别装置以及声音识别方法
JP6078964B2 (ja) 音声対話システム及びプログラム
JP5717601B2 (ja) 車載機に接続された外部機器の動作制御装置および動作制御方法
JP4206332B2 (ja) 入力装置、ゲームシステム、プログラムおよび情報記憶媒体
CN111052223A (zh) 播放控制方法、播放控制装置及程序
JP2016157225A (ja) 音声検索装置、音声検索方法及びプログラム
CN111901665B (zh) 教学资源播放方法、设备及存储介质
KR102066451B1 (ko) 차량용 ai 서비스를 제공하는 방법 및 이를 이용한 장치
JP6969491B2 (ja) 音声対話システム、音声対話方法及びプログラム
KR20220037819A (ko) 복수의 기동어를 인식하는 인공 지능 장치 및 그 방법
CN104707331A (zh) 一种游戏体感产生方法及装置
US11798382B2 (en) Haptic signal generating method and device using audio signal pattern
JP2019045831A (ja) 音声処理装置、方法およびプログラム
US11710495B2 (en) Device for outputting sound and method therefor
JP2016126436A (ja) 画像認識評価システム及び画像認識評価装置
JP6571587B2 (ja) 音声入力装置、その方法、及びプログラム
KR20100073178A (ko) 음성 인식을 위한 화자 적응 장치 및 그 방법
JP2017049537A (ja) 操作装置、訂正方法およびプログラム
JP7502127B2 (ja) 情報処理装置及び疲労度判定装置
JP4408665B2 (ja) 音声認識用発話データ収集装置、音声認識用発話データ収集方法、及びコンピュータプログラム
JP6597048B2 (ja) アライメント装置およびプログラム
WO2023073945A1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP2010197607A (ja) 音声認識装置、音声認識方法およびプログラム
JP6786018B2 (ja) 音声認識装置、車載用ナビゲーション装置、自動音声対話装置、及び音声認識方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150930

Termination date: 20210809

CF01 Termination of patent right due to non-payment of annual fee