CN115298737A - 语音识别装置和语音识别方法 - Google Patents

语音识别装置和语音识别方法 Download PDF

Info

Publication number
CN115298737A
CN115298737A CN202080098726.7A CN202080098726A CN115298737A CN 115298737 A CN115298737 A CN 115298737A CN 202080098726 A CN202080098726 A CN 202080098726A CN 115298737 A CN115298737 A CN 115298737A
Authority
CN
China
Prior art keywords
target device
detection mode
voice
operation target
control request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080098726.7A
Other languages
English (en)
Inventor
杉本美香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nissan Motor Co Ltd
Original Assignee
Nissan Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nissan Motor Co Ltd filed Critical Nissan Motor Co Ltd
Publication of CN115298737A publication Critical patent/CN115298737A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60HARRANGEMENTS OF HEATING, COOLING, VENTILATING OR OTHER AIR-TREATING DEVICES SPECIALLY ADAPTED FOR PASSENGER OR GOODS SPACES OF VEHICLES
    • B60H1/00Heating, cooling or ventilating [HVAC] devices
    • B60H1/00642Control systems or circuits; Control members or indication devices for heating, cooling or ventilating devices
    • B60H1/00735Control systems or circuits characterised by their input, i.e. by the detection, measurement or calculation of particular conditions, e.g. signal treatment, dynamic models
    • B60H1/00757Control systems or circuits characterised by their input, i.e. by the detection, measurement or calculation of particular conditions, e.g. signal treatment, dynamic models by the input of sound, e.g. by using a voice synthesizer
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60QARRANGEMENT OF SIGNALLING OR LIGHTING DEVICES, THE MOUNTING OR SUPPORTING THEREOF OR CIRCUITS THEREFOR, FOR VEHICLES IN GENERAL
    • B60Q3/00Arrangement of lighting devices for vehicle interiors; Lighting devices specially adapted for vehicle interiors
    • B60Q3/80Circuits; Control arrangements
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R25/00Fittings or systems for preventing or indicating unauthorised use or theft of vehicles
    • B60R25/30Detection related to theft or to other events relevant to anti-theft systems
    • B60R25/31Detection related to theft or to other events relevant to anti-theft systems of human presence inside or outside the vehicle
    • EFIXED CONSTRUCTIONS
    • E05LOCKS; KEYS; WINDOW OR DOOR FITTINGS; SAFES
    • E05FDEVICES FOR MOVING WINGS INTO OPEN OR CLOSED POSITION; CHECKS FOR WINGS; WING FITTINGS NOT OTHERWISE PROVIDED FOR, CONCERNED WITH THE FUNCTIONING OF THE WING
    • E05F15/00Power-operated mechanisms for wings
    • E05F15/70Power-operated mechanisms for wings with automatic actuation
    • E05F15/73Power-operated mechanisms for wings with automatic actuation responsive to movement or presence of persons or objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • EFIXED CONSTRUCTIONS
    • E05LOCKS; KEYS; WINDOW OR DOOR FITTINGS; SAFES
    • E05YINDEXING SCHEME ASSOCIATED WITH SUBCLASSES E05D AND E05F, RELATING TO CONSTRUCTION ELEMENTS, ELECTRIC CONTROL, POWER SUPPLY, POWER SIGNAL OR TRANSMISSION, USER INTERFACES, MOUNTING OR COUPLING, DETAILS, ACCESSORIES, AUXILIARY OPERATIONS NOT OTHERWISE PROVIDED FOR, APPLICATION THEREOF
    • E05Y2400/00Electronic control; Electrical power; Power supply; Power or signal transmission; User interfaces
    • E05Y2400/10Electronic control
    • E05Y2400/45Control modes
    • EFIXED CONSTRUCTIONS
    • E05LOCKS; KEYS; WINDOW OR DOOR FITTINGS; SAFES
    • E05YINDEXING SCHEME ASSOCIATED WITH SUBCLASSES E05D AND E05F, RELATING TO CONSTRUCTION ELEMENTS, ELECTRIC CONTROL, POWER SUPPLY, POWER SIGNAL OR TRANSMISSION, USER INTERFACES, MOUNTING OR COUPLING, DETAILS, ACCESSORIES, AUXILIARY OPERATIONS NOT OTHERWISE PROVIDED FOR, APPLICATION THEREOF
    • E05Y2400/00Electronic control; Electrical power; Power supply; Power or signal transmission; User interfaces
    • E05Y2400/80User interfaces
    • E05Y2400/85User input means
    • EFIXED CONSTRUCTIONS
    • E05LOCKS; KEYS; WINDOW OR DOOR FITTINGS; SAFES
    • E05YINDEXING SCHEME ASSOCIATED WITH SUBCLASSES E05D AND E05F, RELATING TO CONSTRUCTION ELEMENTS, ELECTRIC CONTROL, POWER SUPPLY, POWER SIGNAL OR TRANSMISSION, USER INTERFACES, MOUNTING OR COUPLING, DETAILS, ACCESSORIES, AUXILIARY OPERATIONS NOT OTHERWISE PROVIDED FOR, APPLICATION THEREOF
    • E05Y2900/00Application of doors, windows, wings or fittings thereof
    • E05Y2900/50Application of doors, windows, wings or fittings thereof for vehicles
    • E05Y2900/53Type of wing
    • E05Y2900/531Doors
    • EFIXED CONSTRUCTIONS
    • E05LOCKS; KEYS; WINDOW OR DOOR FITTINGS; SAFES
    • E05YINDEXING SCHEME ASSOCIATED WITH SUBCLASSES E05D AND E05F, RELATING TO CONSTRUCTION ELEMENTS, ELECTRIC CONTROL, POWER SUPPLY, POWER SIGNAL OR TRANSMISSION, USER INTERFACES, MOUNTING OR COUPLING, DETAILS, ACCESSORIES, AUXILIARY OPERATIONS NOT OTHERWISE PROVIDED FOR, APPLICATION THEREOF
    • E05Y2900/00Application of doors, windows, wings or fittings thereof
    • E05Y2900/50Application of doors, windows, wings or fittings thereof for vehicles
    • E05Y2900/53Type of wing
    • E05Y2900/548Trunk lids
    • EFIXED CONSTRUCTIONS
    • E05LOCKS; KEYS; WINDOW OR DOOR FITTINGS; SAFES
    • E05YINDEXING SCHEME ASSOCIATED WITH SUBCLASSES E05D AND E05F, RELATING TO CONSTRUCTION ELEMENTS, ELECTRIC CONTROL, POWER SUPPLY, POWER SIGNAL OR TRANSMISSION, USER INTERFACES, MOUNTING OR COUPLING, DETAILS, ACCESSORIES, AUXILIARY OPERATIONS NOT OTHERWISE PROVIDED FOR, APPLICATION THEREOF
    • E05Y2900/00Application of doors, windows, wings or fittings thereof
    • E05Y2900/50Application of doors, windows, wings or fittings thereof for vehicles
    • E05Y2900/53Type of wing
    • E05Y2900/55Windows
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mechanical Engineering (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Thermal Sciences (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

语音识别装置基于通过用户发出的语音进行的指示来受理针对搭载于移动体的装置的控制请求,所述语音识别装置具备:语音获取部,其获取语音;语音数据转换部,其将获取到的语音转换为语音数据;操作对象装置确定部,其对语音数据进行分析,来确定作为操作的对象的操作对象装置;检测模式设定部,其根据操作对象装置来设定用于确定与语音数据对应的控制请求的检测模式;以及控制请求确定部,其基于所设定的检测模式对语音数据进行分析,来确定针对操作对象装置的控制请求。

Description

语音识别装置和语音识别方法
技术领域
本发明涉及一种语音识别装置和语音识别方法。
背景技术
语音识别装置对用户发出的语音进行语音识别,并基于语音识别结果进行各种处理。专利文献1所记载的车辆设备控制装置具有检测包括模棱两可的词在内的关键词的关键词检测单元,即使在通过用户发出的语音进行的指示不清楚的情况下,也能够尽可能按照用户的意图进行语音识别。
现有技术文献
专利文献
专利文献1:日本特开2006-308848号公报
发明内容
发明要解决的问题
然而,在通过专利文献1所记载的车辆设备控制装置对搭载于车辆等移动体的装置进行控制的情况下,根据装置的种类不同,有时不适合基于不清楚的指示进行控制。
本发明要解决的问题在于,提供一种能够在与各个操作对象装置相应的适当的检测模式下确定基于通过用户的语音进行的指示的控制请求的语音识别装置和语音识别方法。
用于解决问题的方案
本发明所涉及的语音识别装置和语音识别方法根据操作对象装置来设定用于确定控制请求的检测模式,并基于所设定的检测模式来确定控制请求,由此解决上述问题。
发明的效果
根据本发明,能够根据操作对象装置设定检测模式,因此起到以下效果:在与各个操作对象装置相应的适当的检测模式下,确定基于通过用户的语音进行的指示的控制请求。
附图说明
图1是表示利用本发明的第一实施方式所涉及的语音识别装置的车辆的结构的框图。
图2是表示使用图1所示的语音识别装置的语音识别方法的流程图。
图3是表示由图1所示的语音识别装置预先设定的第一检测模式对象装置和第二检测模式对象装置的例子的图。
图4是例示基于规则库识别的第二检测模式与基于自然语言识别的第一检测模式之间的语音识别范围的差异的表。
图5是表示包括本发明的第二实施方式所涉及的语音识别装置的车辆的结构的框图。
图6是表示利用本发明的第三实施方式所涉及的语音识别装置的车辆的结构的图。
图7是表示使用图6所示的语音识别装置的语音识别方法的流程图。
图8是表示在图7所示的语音识别方法中根据各个车辆状态进行相加的误识别等级的分数的表。
图9是表示在图7所示的语音识别方法中判断为语音收集环境不好的情况下的操作对象装置与检测模式的对应关系的图。
图10是表示使用图6所示的语音识别装置的语音识别方法的另一例的流程图。
具体实施方式
下面,基于附图来说明本发明的实施方式。
《第一实施方式》
参照图1~4对第一实施方式所涉及的语音识别装置100以及使用语音识别装置100的语音识别方法进行说明。
如图1所示,作为移动体的车辆1具有车内灯3、空调4、门窗控制装置5、天窗控制装置6、后背门控制装置7、显示器12、音频设备13、导航设备14、通话装置15、行驶控制装置31、前照灯32、座椅控制装置33以及后备箱控制装置34作为车载装置。另外,车辆1具有控制这些车载装置的设备控制部11、用于输入通过用户的语音进行的指示的作为麦克风的语音获取部101、以及通过无线或有线来与设备控制部11及语音获取部101连接且能够与车外的服务器20进行通信的通信部107。
此外,车内灯3、空调4以及音频设备13是对车辆1的内部即室内的环境状态进行调整的环境调整装置。即,车内灯3调整包括光量的环境状态。空调4调整包括温度的环境状态。音频设备13调整包括音量的环境状态。
另外,车辆1的通信部107能够通过无线来与服务器20进行通信。此外,在服务器20中也设置有能够与车辆1的通信部107进行通信的服务器侧通信部(未图示)。服务器20具有语音数据转换部102、操作对象装置确定部104、检测模式设定部105以及控制请求确定部106。设置于车辆1的显示器12、音频设备13、导航设备14、通话装置15、设备控制部11、语音获取部101以及通信部107与服务器20的语音数据转换部102、操作对象装置确定部104、检测模式设定部105以及控制请求确定部106构成导航系统10。导航系统10例如是IVI系统等。另外,设置于车辆1的语音获取部101及通信部107与服务器20的语音数据转换部102、操作对象装置确定部104、检测模式设定部105以及控制请求确定部106构成语音识别装置100。即,语音识别装置100构成导航系统10的一部分。另外,语音识别装置100受理通过用户发出的语音进行的指示,经由设备控制部11来控制车载装置中的任意一方以上或全部。即,导航系统10具有语音识别装置100,所述语音识别装置100基于通过乘坐车辆1的用户发出的语音进行的指示,来受理针对搭载于车辆1的各种装置的控制请求。语音识别装置100是语音识别系统。
此外,如图3所示,门窗控制装置5具有门窗锁定装置5a和门窗开闭装置5b。天窗控制装置6具有天窗锁定装置6a和天窗开闭装置6b。后背门控制装置7具有后背门锁定装置7a和后背门开闭装置7b。后备箱控制装置34具有后备箱锁定装置34a和后备箱开闭装置34b。
另外,座椅控制装置33是对设置于车辆1的室内的座椅的各种功能进行控制的装置,具有座椅按摩装置33a、座椅加热器33b以及座椅位置调整装置33c。座椅位置调整装置33c能够调整座椅的高度、座椅的前后方向上的位置以及座椅的靠背的角度。
另外,图1所示的行驶控制装置31是在选择了自动驾驶模式作为车辆1的行驶模式的情况下控制车辆1的行驶的装置。具体地说,行驶控制装置31控制车辆1的驱动致动器、转向致动器以及制动致动器。
显示器12是能够通过用户的触摸操作来输入针对音频设备13、导航设备14、通话装置15以及其它车载装置的控制指示的具备输入功能的触摸面板式的显示器。另外,显示器12能够将针对通话装置15的来电信息、经由通话装置15进行会话的通话对方的信息、导航设备14的引导信息等以包括字符信息、图标的影像的形式输出。另外,音频设备13能够输出用于通知通话装置15有来电的语音、经由通话装置15进行对话的通话对方的说话语音、表示导航设备的引导信息的语音等。
此外,显示器12并不限定于具备输入功能的触摸面板式的显示器,只要是输出包括字符信息的2D影像或3D影像的装置即可。另外,显示器12不限于设置于车辆1的仪表板的显示器,可以是前挡风玻璃投影式的平视显示器、其它各种显示器。
显示器12和音频设备13构成信息提供装置。
服务器20的语音数据转换部102经由通信部107接收由语音获取部101获取到的语音信息,并将该语音信息转换为语音数据。此外,语音数据是基于语音的文本数据。
另外,服务器20的操作对象装置确定部104对由语音数据转换部102进行转换所得到的语音数据进行分析,根据语音数据中包含的关键词来确定成为操作的对象的操作对象装置。操作对象装置例如是车内灯3、空调4、门窗控制装置5、天窗控制装置6、后背门控制装置7、显示器12、音频设备13、导航设备14、通话装置15、行驶控制装置31、前照灯32、座椅控制装置33以及后备箱控制装置34中的一个或多个车载装置。此外,操作对象装置确定部104在确定控制请求时,参照服务器20中保存的词典数据和上下文数据。另外,根据操作对象装置,操作对象装置确定部104将各操作对象装置预先设定为第一检测模式对象装置或者第二检测模式对象装置。操作对象装置确定部104参照对象装置信息来判定确定出的操作对象装置是第一和第二检测模式对象装置中的哪一方,该对象装置信息预先设定了各操作对象装置是第一检测模式对象装置和第二检测模式对象装置中的哪一方。第一检测模式对象装置是在确定控制请求时成为后述的使用基于自然语言识别的第一检测模式的对象的装置。另外,第二检测模式对象装置是在确定控制请求时成为后述的使用基于规则库识别的第二检测模式的对象的装置。而且,表示由操作对象装置确定部104判定出的“操作对象装置是第一和第二检测模式对象装置中的哪一方”的信息(下面,也称为判定信息)经由车辆1侧的通信部107和设备控制部11被输出到显示器12以及/或者音频设备13。即,关于表示确定出的操作对象装置是第一检测模式对象装置还是第二检测模式对象装置的判定信息,以包含影像、文本的图像的形式显示于显示器12、或者由音频设备13通过语音的形式输出。另外,由操作对象装置确定部104设定的操作对象装置的判定信息被输出到检测模式设定部105。
检测模式设定部105根据操作对象装置确定部104判定出的操作对象装置的判定信息,来设定用于确定与由语音数据转换部102进行转换所得到的语音数据对应的控制请求的检测模式。具体地说,检测模式设定部105根据操作对象装置的判定信息,来将检测模式设定为后述的基于自然语言识别的第一检测模式和后述的基于规则库识别的第二检测模式中的某一方。由检测模式设定部105设定的检测模式的信息经由车辆1侧的通信部107和设备控制部11被输出到显示器12以及/或者音频设备13。即,关于表示当前的检测模式被设定为第一检测模式和第二检测模式中的哪一方的信息(下面,也称为“检测模式设定信息”),以包含影像、文本的图像的形式显示于显示器12、或者由音频设备13通过语音的形式输出。另外,表示由检测模式设定部105设定的检测模式的检测模式设定信息被输出到控制请求确定部106。
控制请求确定部106基于由检测模式设定部105设定的检测模式,对由语音数据转换部102进行转换所得到的语音数据进行分析,来确定针对操作对象装置的控制请求的内容。此外,控制请求确定部106与操作对象装置确定部104同样地,在确定控制请求时,参照服务器20中保存的词典数据和上下文数据。而且,控制请求确定部106将针对确定出的操作对象装置的控制请求的内容经由车辆1侧的通信部107发送到设备控制部11。设备控制部11基于接收到的操作对象装置的信息和针对操作对象装置的控制请求的内容来控制操作对象装置。
接着,使用图2所示的流程图对利用语音识别装置100的语音识别方法的过程进行说明。
首先,在步骤S1中,语音识别装置100的车辆1侧的语音获取部101获取用户发出的语音。具体地说,语音获取部101通过频率来检测用户说话,在检测到用户说话的情况下,获取包含用户发出的语音的语音信息来作为语音识别对象。像这样,语音获取部101仅在用户说话的期间获取语音信息,由此与始终获取语音信息的情况相比,能够减少语音识别装置100的控制负担。另外,在预先决定了表示开始通过语音进行指示的特定的关键词的情况下,语音获取部101也可以在用户刚说出特定的关键词之后就获取作为语音识别对象的语音信息。
接着,在步骤S2中,语音识别装置100的服务器20侧的语音数据转换部102将获取到的语音转换为能够识别为文本的语音数据。
并且,接着,在步骤S3中,操作对象装置确定部104对由语音数据转换部102进行转换所得到的语音数据进行分析,来确定作为控制对象的操作对象装置。操作对象装置确定部104通过自然语言识别对语音数据进行分析,来确定操作对象装置。具体地说,在用户说出“打开天窗”的情况下,操作对象装置确定部104参照词典数据和上下文数据来将操作对象装置确定为天窗开闭装置6b。另外,在用户以“开上窗”、“开车顶”等说法说出了通过语音进行的指示的情况下,操作对象装置确定部104也判断为该情况下的“上窗”或者“车顶”是指天窗,并将操作对象装置确定为天窗开闭装置6b。即,操作对象装置确定部104即使在基于用户发出的语音的语音数据与预先定义的控制请求文本不一致的情况下,也能够确定操作对象装置。
接着,在步骤S4中,操作对象装置确定部104判定在步骤S3中确定出的操作对象装置是否为第一检测模式对象装置。在此,参照图3对用于判定操作对象装置是第一检测模式对象装置、还是该操作对象装置不是第一检测模式对象装置而是第二检测模式对象装置的方法进行说明。
在图3所示的例子中,车辆1的车载装置根据操作重要度的高低被预先划分为三个分类。操作重要度是指该车载装置的控制对车辆1的行驶状态或乘坐车辆1的用户造成的影响的大小的程度。因而,操作重要度越高的车载装置,对车辆1的行驶造成的影响越大,因此使控制请求的误识别的可能性尽可能接近0这样的要求大。即,操作重要度越高的操作对象装置,越需要语音识别装置100确定的控制请求与实际的通过用户的语音进行的指示准确且可靠地一致。
具体地说,导航设备14、通话装置15、音频设备13、显示器12、车内灯3、空调4、座椅按摩装置33a以及座椅加热器33b被划分为操作重要度“1(低,Low)”的分类。认为这些配件装置对驾驶产生的影响低,因此将这些配件装置划分为最低的操作重要度。另一方面,座椅位置调整装置33c被划分为操作重要度“2(中,Middle)”的分类。即,用户就座的座椅的位置、高度会影响用户驾驶车辆1,因此座椅位置调整装置33c的操作重要度比座椅按摩装置33a和座椅加热器33b的操作重要度高。另外,行驶控制装置31、前照灯32、门窗锁定装置5a、门窗开闭装置5b、天窗锁定装置6a、天窗开闭装置6b、后背门锁定装置7a、后背门开闭装置7b、后备箱锁定装置34a以及后备箱开闭装置34b对车辆1的行驶或用户造成的影响特别大,因此被划分为操作重要度“3(高,High)”的分类。操作对象装置确定部104将被划分为操作重要度“1(低)”的分类的车载装置和被划分为操作重要度“2(中)”的分类的车载装置判定为第一检测模式对象装置。另外,操作对象装置确定部104将被划分为操作重要度“3(高)”的分类的车载装置判定为第二检测模式对象装置。
此外,虽然预先对各个车载装置设定了第一检测模式对象装置和第二检测模式对象装置的区别,但操作对象装置确定部104能够适当地变更第一检测模式对象装置和第二检测模式对象装置的设定。
接着,如图2所示,如果在步骤S4中判定为操作对象装置是第一检测模式对象装置,则在步骤S5中,检测模式设定部105将检测模式设定为第一检测模式。然后,在步骤S6中,控制请求确定部106判定是否能够通过自然语言识别从通过步骤S2转换得到的语音数据中读取用户的指示内容。根据控制请求确定部106是否能够参照词典数据和上下文数据来基于自然语言识别对由语音数据转换部102进行转换所得到的语音数据进行分析从而确定出控制请求的内容,来判定是否能够读取指示内容。在无法从语音数据中读取指示的情况下,在步骤S12中,语音识别装置100对用户进行重新听取。关于重新听取,通过以包含字符的图像的形式显示于显示器12、或者通过由音频设备13进行语音引导,来提示给用户。另一方面,在能够从语音数据中读取指示内容的情况下,在步骤S7中,控制请求确定部106确定针对操作对象装置的控制请求。即,控制请求确定部106参考词典数据和上下文数据并基于自然语言识别对由语音数据转换部102进行转换所得到的语音数据进行解释,来确定控制请求的内容。在步骤S11中,确定出的控制请求被发送到车辆1的设备控制部11以控制操作对象装置,流程结束。
如果在步骤S4中判定为操作对象装置不是第一检测模式对象装置、即判定为操作对象装置是第二检测模式对象装置,则在步骤S8中,检测模式设定部105将检测模式设定为第二检测模式。而且,在步骤S9中,判定通过步骤S2转换得到的语音数据是否与预先定义的控制请求文本一致,在不一致的情况下,在步骤S12中,对用户进行重新听取。对用户进行的重新听取是提议或请求重新进行语音输入(说出指示)的处理。此时,控制请求确定部106将引导信息经由车辆1的通信部107和设备控制部11输出到显示器12或者音频设备13,所述引导信息引导用户以语音数据与控制请求文本一致的方式重新进行指示(语音输入/说话)。
另一方面,在语音数据与控制请求文本一致的情况下,在步骤S10中,控制请求确定部106通过基于规则库识别的第二检测模式来确定与控制请求文本对应的控制请求。在步骤S11中,确定出的控制请求经由车辆1的通信部107被发送到设备控制部11以控制操作对象装置,流程结束。
此外,关于规则库识别中的语音数据是否与控制请求文本一致的判断,通过将基于在步骤S1中输入的语音的全部语音数据(文本数据)与控制请求文本进行比较来执行。全部语音数据是基于从说话开始到说话结束为止所输入的语音的语音数据。也就是说,控制请求确定部判断基于从说话开始起到结束为止的一系列语音的语音数据与控制请求文本是否一致。
在此,使用图4对基于自然语言识别的第一检测模式与基于规则库识别的第二检测模式的差异进行说明。在图4中,示出控制对象装置是空调且控制请求的内容是“想要接通空调的电源”的情况下的、第一检测模式与第二检测模式的差异。此外,在图3所示的例子中,空调4被规定为第一检测模式对象装置,但在图4所示的例子中,为了便于说明,设为第一检测模式和第二检测模式均能够应用于针对空调4的控制请求的确定中。
如图4所示,关于控制对象装置是空调且控制请求的内容是“想要接通空调的电源”的情况,与该控制请求的内容对应的控制请求文本被预先定义为“开空调”。
在基于规则库识别的第二检测模式中,在判定为基于用户发出的语音的语音数据与控制请求文本一致的情况下,确定针对作为操作对象装置的空调的控制请求(参照图2的步骤S10)。即,在图4所示的例子中,在检测模式设定部105将检测模式设定为第二检测模式的情况下,仅在用户按照所定义的控制请求文本说出“开空调”时,设备控制部11将空调4的电源接通。因而,在用户说出了与控制请求文本不一致的内容的情况下,例如在说出了“打空调”、“嗯…想开空调”或者“开空调会冷吧”的情况下,设备控制部11不使空调4的电源接通,维持断开的状态。
在基于自然语言识别的第一检测模式中,除了用户说出作为控制请求文本的“开空调”的情况以外,例如在说出了“打空调”或者“嗯…想开空调”的情况下,设备控制部11也将空调4的电源接通。具体地说,在用户说出了“打空调”的情况下,控制请求确定部106将语音数据拆分为“空调”和“打”,并参照词典数据判断为“打”是“开”的近义词,从而确定出“想要接通空调的电源”这个控制请求。此外,在第一检测模式中使用的词典数据将登记的一个词语和意思内容与该单词共通的其它单词作为近义词对应起来进行存储。另外,在用户说出了“嗯…想开空调”的情况下,控制请求确定部106判断为“嗯”是感叹词,是没有意思的词语,并且判断为“嗯…想开空调”是表示与“开空调”相同的请求的语音数据。由此,控制请求确定部106基于“嗯…想开空调”这样的语音数据确定出“想要接通空调的电源”这样的控制请求。
即,关于与各个控制请求对应地能够识别的语音数据的范围,基于规则库识别的第二检测模式下的所述范围比基于自然语言识别的第一检测模式下的所述范围小。即,基于规则库识别的第二检测模式仅确定被定义有控制请求文本的控制请求,因此能够确定控制请求的内容的语音数据的范围根据所定义的控制请求的数量而受到限制。另外,基于规则库识别的第二检测模式仅确定与所定义的控制请求文本一致的控制请求,因此通过第二检测模式能够确定的(通过第二检测模式能够输入的)语音数据受到限制。即,检测模式被设定为第二检测模式的情况下的语音输入的自由度比检测模式被设定为第一检测模式的情况下的语音输入的自由度低。因而,第二检测模式与第一检测模式相比,用于确定控制请求的条件更严。
换言之,关于与各个操作对象装置及控制请求对应地能够识别的语音数据的范围,基于自然语言识别的第一检测模式下的所述范围比基于规则库识别的第二检测模式下的所述范围大。即,第一检测模式与第二检测模式相比,用于确定操作对象装置和控制请求的条件更松。
另一方面,在用户说出“开空调会冷吧”的情况下,控制请求确定部106根据词典数据和上下文数据对词语的组合及顺序进行分析,推测为通过用户的语音进行的指示是“如果接通空调的电源,车辆的室温会低于适当温度,因此不想接通空调的电源”这个意思。因而,控制请求确定部106不对车辆1的设备控制部11发送使空调4的电源接通的指示。即,在用户说出“开空调会冷吧”的情况下,无论检测模式被设定为第一检测模式和第二检测模式中的哪一方,空调4的电源均维持为断开的状态,不会接通。
此外,语音识别装置100的控制请求确定部106能够学习语音数据与用户的实际的指示内容之间的对应关系的模式,并定期地更新词典数据和上下文数据。
根据以上,本实施方式所涉及的语音识别装置100和使用语音识别装置100的语音识别方法根据操作对象装置来设定用于确定与语音数据对应的控制请求的检测模式,并基于所设定的检测模式来确定控制请求。因而,语音识别装置100能够在与各个操作对象装置相应的适当的检测模式下基于通过用户的语音进行的指示来确定控制请求。
另外,语音识别装置100在确定出的操作对象装置是第一检测模式对象装置的情况下,将检测模式设定为通过自然语言识别来分析所述语音数据的第一检测模式,在确定出的操作对象装置是第二检测模式对象装置的情况下,将检测模式设定为通过与自然语言识别不同的方法的语音识别来分析语音数据的第二检测模式。即,语音识别装置100能够根据操作对象装置将检测模式设定为使用自然语言识别的第一检测模式和使用与自然语言识别不同的方法的语音识别的第二检测模式中的某一方。另外,关于与各个控制请求对应地能够识别的语音数据的范围,第二检测模式下的该范围比第一检测模式下的该范围小,第二检测模式下的该范围是受限定的。因而,语音识别装置100能够根据操作对象装置来区分使用基于受理通过语音进行的模糊指示(自由度高的指示)的自然语言识别的第一检测模式、以及基于自由度比自然语言识别的自由度低但准确度高的语音识别的第二检测模式。此外,在使用自然语言识别来分析语音数据的情况下,有时控制请求确定部106应该识别的对象词语的数量增加、或者语音数据中包含具有多个含义的词语。因此,与将检测模式设定为第二检测模式的情况相比,在将检测模式设定为第一检测模式的情况下,控制请求的误识别的可能性变高。因而,例如在对操作重要度高、且不适合通过语音进行的模糊指示的操作对象装置发出了控制指示的情况下,语音识别装置100能够选择能够期待高准确度的语音识别的第二检测模式作为检测模式。另一方面,在对操作重要度不太高的操作对象装置发出了控制指示的情况下,语音识别装置100能够选择能够进行语音识别的范围大、且允许输入的语音的自由度高的第一检测模式。
另外,在检测模式被设定为第二检测模式的情况下,语音识别装置100判定语音数据是否与预先定义的控制请求文本一致。而且,语音识别装置100在判定为语音数据与控制请求文本一致的情况下,确定与控制请求文本对应的控制请求。即,第二检测模式是通过规则库识别来分析语音数据的检测模式。因而,例如在针对操作重要度高、且不适合基于自然语言识别的语音识别的操作对象装置确定控制请求的情况下,语音识别装置100能够选择通过规则库识别来分析语音数据的第二检测模式。因而,语音识别装置100在针对不适合基于自然语言识别的语音识别的操作对象装置确定控制请求的情况下,能够提高语音识别的准确度,从而防止对于通过用户的语音进行的指示的误识别。
另外,在检测模式被设定为第二检测模式,并且基于通过语音进行的指示的语音数据不与控制请求文本一致的情况下,语音识别装置100引导用户重新通过语音进行指示。由此,在检测模式被设定为第二检测模式的情况下,语音识别装置100能够促使用户以能够进行规则库识别的方式发出通过语音进行的指示。
并且,操作对象装置确定部104在确定为操作对象装置是用于控制车辆1的行驶的行驶控制装置31的情况下,将操作对象装置判定为第二检测模式对象装置。行驶控制装置31对车辆1的驱动致动器、转向致动器及制动致动器的控制对车辆1的行驶状态造成较大的影响,因此行驶控制装置31的操作重要度特别高。因而,通过操作对象装置确定部104将行驶控制装置31判定为第二检测模式对象装置,控制请求确定部106能够可靠且准确地确定针对行驶控制装置31的控制请求。因而,能够维持车辆1的行驶状态的稳定性。
另外,操作对象装置确定部104在确定为操作对象装置是车辆1的后备箱、车门或门窗的锁定装置、或者后备箱、车门或门窗的开闭装置的情况下,将操作对象装置判定为第二检测模式对象装置。即,操作对象装置确定部104预先将门窗锁定装置5a、门窗开闭装置5b、天窗锁定装置6a、天窗开闭装置6b、后背门锁定装置7a、后背门开闭装置7b、后备箱锁定装置34a或者后备箱开闭装置34b设定为第二检测模式对象装置。车辆1的后备箱、车门或门窗是否锁定、或者后备箱、车门或门窗是否打开对车辆1的行驶状态和乘坐车辆1的用户会造成很大影响。因此,门窗锁定装置5a、门窗开闭装置5b、天窗锁定装置6a、天窗开闭装置6b、后背门锁定装置7a、后背门开闭装置7b、后备箱锁定装置34a以及后备箱开闭装置34b的操作重要度特别高。通过操作对象装置确定部104将这些锁定装置和开闭装置判定为第二检测模式对象装置,控制请求确定部106能够可靠且准确地确定针对门窗控制装置5、天窗控制装置6、后背门控制装置7或后备箱控制装置34的控制请求。因而,能够维持车辆1的行驶状态的稳定性。
操作对象装置确定部104在确定为操作对象装置是用于对包括车辆1的内部的温度、光量以及音量中的至少某一方的环境状态进行调整的环境调整装置、即车内灯3、空调4或者音频设备13的情况下,将操作对象装置判定为第一检测模式对象装置。车内灯3、空调4或音频设备13与行驶控制装置31或者门等的锁定装置或开闭装置相比,对车辆1的行驶状态和用户造成的影响较小。因此,如图3所示,车内灯3、空调4以及音频设备13的操作重要度为“1(低)”。因而,通过操作对象装置确定部104将车内灯3、空调4或者音频设备13判定为第一检测模式对象装置,控制请求确定部106能够使用容许输入的语音的自由度高的第一检测模式来确定针对这些装置的控制请求。由此,用户能够通过各种说话模式来更有感觉地发出用于控制车内灯3、空调4或音频设备13的接通/断开、或者车内灯3的光量、空调4的风量或音频设备13的设定音量等的指示。
操作对象装置确定部104在确定为操作对象装置是用于控制设置于车辆1的内部的座椅的状态的座椅控制装置33、即座椅按摩装置33a、座椅加热器33b或者座椅位置调整装置33c的情况下,将操作对象装置判定为第一检测模式对象装置。座椅控制装置33与行驶控制装置31或者门等的锁定装置或开闭装置相比,对车辆1的行驶状态和用户造成的影响较小。因此,如图3所示,座椅按摩装置33a和座椅加热器33b的操作重要度为“1(低)”,座椅位置调整装置33c的操作重要度为“2(中)”。因而,通过操作对象装置确定部104将座椅按摩装置33a、座椅加热器33b或座椅位置调整装置33c判定为第一检测模式对象装置,控制请求确定部106能够使用允许输入的语音的自由度高的第一检测模式来确定针对各个座椅控制装置33的控制请求。由此,用户能够通过各种说话模式(自由度高的说话模式)来更有感觉地发出用于控制座椅按摩装置33a的按摩强弱的切换、由座椅加热器33b加热的座椅面的温度、或者由座椅位置调整装置33c调整的座椅的高度、位置等的指示。
操作对象装置确定部104在确定为操作对象装置是对用户进行信息的提供的信息提供装置、即显示器12或者音频设备13的情况下,将操作对象装置判定为第一检测模式对象装置。显示器12或者音频设备13与行驶控制装置31或者门等的锁定装置或开闭装置相比,对车辆1的行驶状态和用户造成的影响较小。因此,如图3所示,显示器12或音频设备13的操作重要度为“1(低)”。因而,通过操作对象装置确定部104将显示器12或者音频设备13判定为第一检测模式对象装置,控制请求确定部106能够使用允许输入的语音的自由度高的第一检测模式来确定控制请求。由此,用户能够通过各种说话模式来更有感觉地发出用于控制显示器12或音频设备13的接通/断开、或者显示器12的画面的亮度、字符的大小或音频设备13的设定音量等的指示。
此外,音频设备13是调整车辆1的内部的环境状态的环境调整装置,并且也是信息提供装置。另外,信息提供装置不仅限于显示器12或音频设备13,也可以包括仪表板(未图示)等。
另外,在图2所示的步骤S3中,操作对象装置确定部104基于自然语言识别对语音数据进行分析,来确定操作对象装置。由此,即使在用户以与控制请求文本不一致的说法发出了通过语音进行的指示的情况下,操作对象装置确定部104也能够确定操作对象装置。
此外,在本实施方式中,语音数据转换部102、操作对象装置确定部104、检测模式设定部105以及控制请求确定部106设置于服务器20,但这些中的一部分功能也可以设置于车辆1。
《第二实施方式》
在图5中示出包括第二实施方式所涉及的语音识别装置200的车辆1的结构。此外,在以下的说明中,与图1~4所记载的附图标记相同的附图标记表示相同或同样的构成要素或者步骤,因此省略详细的说明。
如图5所示,车辆1具有导航系统110,该导航系统110通过语音输入来控制显示器12、音频设备13、导航设备14以及通话装置15中的任意一方以上或者这些的全部。导航系统110具有语音识别装置200,该语音识别装置200基于通过乘坐于车辆1的用户发出的语音进行的指示来受理针对搭载于车辆1的各种装置的控制请求。构成语音识别装置200的、语音获取部101、语音数据转换部102、操作对象装置确定部104、检测模式设定部105、控制请求确定部106以及通信部107全部设置于车辆1。检测模式设定部105和控制请求确定部106能够经由通信部107来与设备控制部11进行数据或信号的交换。
此外,语音识别装置200通过与图2所示的语音识别方法同样的过程来确定针对操作对象装置的控制请求。
根据以上,与第一实施方式所涉及的语音识别装置100同样地,本实施方式所涉及的语音识别装置200根据操作对象装置来设定用于确定与语音数据对应的控制请求的检测模式,并基于所设定的检测模式来确定控制请求。因而,语音识别装置200能够与语音识别装置100同样地在与各个操作对象装置相应的适当的检测模式下基于通过用户的语音进行的指示来确定控制请求。另外,由于语音识别装置200搭载于车辆1,因此能够与通信环境无关地基于通过用户的语音进行的指示来确定针对操作对象装置的控制请求。
《第三实施方式》
参照图6~10对第三实施方式所涉及的语音识别装置300和利用语音识别装置300的语音识别方法进行说明。
如图6所示,服务器20具有语音收集环境判定部108。语音收集环境判定部108判定用于语音获取部101获取语音的语音收集环境是否良好。另外,车辆1具有检测车辆1的行驶速度的车速传感器2。车速传感器2例如根据车辆1的车轮的旋转速度(车轮速度)来检测车辆1的行驶速度。并且,车辆1具有检测车辆1的周围的风速的风速传感器8。另外,在车辆1中设置有获取车辆1的状态信息的车辆信息获取部103。车辆信息获取部103通过无线或有线来与车速传感器2或风速传感器8连接。另外,车辆信息获取部103通过无线或有线还与语音获取部101及通信部107连接。
此外,车辆信息获取部103构成移动体信息获取部。
设置于车辆1的显示器12、音频设备13、导航设备14、通话装置15、设备控制部11、语音获取部101、车辆信息获取部103及通信部107与服务器20的语音收集环境判定部108、语音数据转换部102、操作对象装置确定部104、检测模式设定部105及控制请求确定部106构成导航系统210。另外,设置于车辆1的语音获取部101、车辆信息获取部103及通信部107与服务器20的语音收集环境判定部108、语音数据转换部102、操作对象装置确定部104、检测模式设定部105及控制请求确定部106构成语音识别装置300。即,语音识别装置300构成导航系统210的一部分。另外,语音识别装置300受理通过用户发出的语音进行的指示,经由设备控制部11来控制车载装置中的任意一方以上或全部。即,导航系统210具有语音识别装置300,该语音识别装置300基于通过乘坐车辆1的用户发出的语音进行的指示,来受理针对搭载于车辆1的各种装置的控制请求。语音识别装置300是语音识别系统。
在此,车辆信息获取部103经由车速传感器2、风速传感器8、语音获取部101以及通信部107获取车辆1的状态信息。车辆1的状态信息是与会对车辆1的室内的语音环境产生影响的要素有关的信息。例如,车辆1的状态信息是车辆1的室内的噪音的大小、门窗、天窗或后背门等开口部的开闭信息、车辆1的行驶速度、车辆1的周围的风速、音频设备13的设定音量、从空调4吹出的空气的风量等。车辆1的室内的噪音的大小是由语音获取部101检测出的噪声、即用户说出的语音以外的声音的大小(例如测量值),以dB(分贝)为单位来计算该噪音的大小。另外,车辆信息获取部103经由通信部107和设备控制部11来获取音频设备13的设定音量、从空调4吹出的空气的风量、门窗、天窗或后背门的开闭信息等作为车辆1的状态信息。另外,车辆信息获取部103也能够基于车辆1的室内的噪音的大小和音频设备13的设定音量来计算车辆1的内部的例如室内的噪音等级,并获取计算出的噪音等级作为车辆1的状态信息。具体地说,通过将根据车辆1的室内的噪音的大小所分配的分数和根据音频设备13的设定音量所分配的分数相加来计算噪音等级。噪音等级可以使用由设置于车辆1的车厢内的麦克风得到的测量值来计算,也可以使用由设置于车辆1的车体的麦克风、振动传感器得到的测量值来计算。
设置于服务器20的语音收集环境判定部108基于由车辆信息获取部103获取到的车辆1的状态信息来判定车辆1的室内的语音收集环境是否良好。车辆1的室内的语音收集环境是语音识别装置300的语音获取部101用来获取用户发出的语音的环境。车辆1的室内的语音收集环境越好,语音获取部101获取的语音中包含的噪声(除了用户的说话语音之外的声音)越少,从而语音识别装置300能够准确地识别通过用户的语音进行的指示的可能性越高。另一方面,车辆1的室内的语音收集环境越不好,语音获取部101获取的语音中包含的噪声越多,从而语音识别装置300错误地确定通过用户的语音进行的指示、即误识别的可能性越高。此外,通过用户的语音进行的指示的识别处理包括成为控制的对象的操作对象装置的确定处理以及/或者针对操作对象装置的控制请求的内容的确定处理。
接着,使用图7所示的流程图来对利用语音识别装置300的语音识别方法的过程进行说明。
如图7所示,如果在步骤S4中判定为操作对象装置是第一检测模式对象装置,则在步骤S13中,车辆信息获取部103获取移动体的状态信息、即车辆的状态信息。然后,在步骤S14中,语音收集环境判定部108基于车辆的状态信息来判定语音收集环境是否良好。
此外,步骤S13的处理可以与步骤S1~S4的处理并行地执行。步骤S13的处理可以在本控制过程开始以后持续地或周期性地进行。另外,车辆信息获取部103可以从本控制过程开始前起持续地或周期性地获取车辆的状态信息,并且在步骤S13的处理中从预先持续地或周期性地获取到的状态信息中提取并获取语音获取后的车辆的状态信息。
在此,使用图8来说明基于车辆的状态信息判定语音收集环境是否良好的基准。
根据与车辆1的状态信息相应的误识别等级来判定语音收集环境是否良好。误识别等级是表示语音识别装置300无法准确地识别用户发出的语音从而无法确定正确的控制请求的可能性的指标。在图8所示的例子中,将误识别等级表现为定量的指标值。即,误识别等级的指标值越高,则车辆1的室内的噪声越多,从而语音数据转换部102无法将语音准确地转换为语音数据,因此通过用户的语音进行的指示的误识别的可能性变高。因而,误识别等级的指标值越高,则语音收集环境越不好。在图8所示的表中,规定了与车辆1的状态信息相应的误识别等级(指标值)的相加分数。此外,图8表示误识别等级的计算方法的一例,能够根据车辆特性、语音识别装置的特性等预先定义相加分数、相加事项。
如图8所示,车辆1的天窗W1或门窗W2为打开状态的情况下的误识别等级的相加分数为1分。另外,空调4的风量为预先决定的基准风量以上的情况下的误识别等级的相加分数为2分。另外,天窗W1或门窗W2为打开状态、且车辆1的行驶速度为20km/h以上且小于80km/h的情况下的误识别等级的相加分数为2分。另外,天窗W1或门窗W2为打开状态、且车辆1的行驶速度为80km/h以上的情况下的误识别等级的相加分数为3分。并且,车辆1的室内的噪音等级为预先决定的基准噪音等级以上的情况下的误识别等级的相加分数为3分。
此外,车辆1的天窗W1和门窗W2构成车辆1的开口部。车辆1的开口部并不限定于天窗W1或门窗W2,例如也可以是车辆1的门。
通过根据车辆1的状态信息来将图8的表的右侧所示的分数相加来计算语音收集环境的误识别等级(指标值)。例如,关于表示天窗W1为打开状态、且车速为20km/h以上且小于80km/h的情况下的误识别等级的分数,将1分和2分相加而计算为3分。另外,关于表示天窗W1为打开状态、且空调风量为基准风量以上、且车速为80km/h以上的情况下的误识别等级的分数,将1分、2分、3分相加而计算为6分。
在步骤S14中,语音收集环境判定部108将误识别等级的基准等级确定为4分,并且在误识别等级小于作为基准等级的4分的情况下判定为语音收集环境良好,在误识别等级为4分以上的情况下判定为语音收集环境不良。此外,基准等级的分数能够预先根据车辆特性、语音识别装置的特性等进行定义。另外,基准等级的分数也能够基于实验或模拟来预先进行定义。
如果在步骤S14中判定为语音收集环境良好,则在步骤S5中,检测模式设定部105将检测模式设定为第一检测模式。即,在语音收集环境判定部108判定为语音收集环境良好、并且操作对象装置确定部104将操作对象装置判定为第一检测模式对象装置的情况下,检测模式设定部105将检测模式设定为所述第一检测模式。
另一方面,如果在步骤S14中判定为语音收集环境不良,则在步骤S15中,操作对象装置确定部104将操作对象装置的设定从第一检测模式对象装置变更为第二检测模式对象装置。即,在语音收集环境判定部108判定为语音收集环境不良的情况下,操作对象装置确定部104将预先被设定为第一检测模式对象装置的操作对象装置变更并重新设定为第二检测模式对象装置。服务器20将表示操作对象装置的设定的变更的信息、即包括操作对象装置的设定已从第一检测模式对象装置变更为第二检测模式对象装置的信息经由车辆1的通信部107和设备控制部11输出到显示器12或音频设备13。而且,在步骤S8中,检测模式设定部105将检测模式设定为第二检测模式。
在此,在图9中示出以下状态的例子:在步骤S15中,操作对象装置确定部104将操作对象装置的设定从第一检测模式对象装置变更并重新设定为第二检测模式对象装置。
如果在步骤S14中判定为语音收集环境不良,则如图9所示,将被划分为操作重要度为“1(低)”的分类的导航设备14、通话装置15、音频设备13、显示器12、车内灯3、空调4、座椅按摩装置33a以及座椅加热器33b判定为第二检测模式对象装置,通过基于规则库识别的第二检测模式来确定控制请求。另外,将被划分为操作重要度为“2(中)”的分类的座椅位置调整装置33c也同样地判定为第二检测模式对象装置,通过基于规则库识别的第二检测模式来确定控制请求。
此外,关于被划分为操作重要度为“3(高)”的分类的行驶控制装置31、前照灯32、门窗锁定装置5a、门窗开闭装置5b、天窗锁定装置6a、天窗开闭装置6b、后背门锁定装置7a、后背门开闭装置7b、后备箱锁定装置34a以及后备箱开闭装置34b,不进行设定的变更。因而,如果在步骤S14中判定为语音收集环境不良,则操作对象装置均被设定为第二检测模式对象装置,在针对操作对象装置的控制请求的确定中均应用基于规则库识别的第二检测模式。
根据以上,在本实施方式所涉及的语音识别装置300和使用语音识别装置300的语音识别方法中,在语音收集环境判定部108判定为语音收集环境良好、并且操作对象装置确定部104将操作对象装置判定为第一检测模式对象装置的情况下,检测模式设定部105将检测模式设定为所述第一检测模式。因而,语音识别装置300仅在语音收集环境良好的情况下、即语音收集环境中的噪声少的情况下,对操作重要度不太高的第一检测模式对象装置应用基于自然语言识别的第一检测模式,并确定控制请求。即,语音识别装置300构成为避免在具有较多噪声的语音收集环境中应用基于自然语言识别的第一检测模式。因而,即使在通过具有高语音输入自由度的自然语言识别来确定控制请求的情况下,语音识别装置300也能够根据语音收集环境来降低误识别的可能性,因此能够更可靠地确定针对操作对象装置的控制请求。
另外,在语音收集环境判断部108判定为语音收集环境不良的情况下,操作对象装置确定部104将预先被设定为第一检测模式对象装置的操作对象装置变更并重新设定为第二检测模式对象装置。在此,在语音收集环境不良的情况下、即具有较多噪声的语音收集环境下,在控制请求的确定中发生误识别的可能性变高。因此,通过将预先被设定为第一检测模式对象装置的操作对象装置也重新设定为第二检测模式对象装置并应用基于规则库识别的第二检测模式来确定控制请求,能够防止误识别。
语音收集环境判定部108获取从作为空调装置的空调4吹出的空气的风量作为状态信息。空调4的风量越多,语音获取部101获取的语音中越容易混入噪声,因此通过获取从空调4吹出的空气的风量作为状态信息,语音收集环境判定部108能够更适当地判定语音收集环境是否良好。
另外,语音收集环境判定部108获取设置于车辆1的开口部即天窗W1或门窗W2的开闭状态、以及天窗W1或门窗W2为打开状态的情况下的车辆1的行驶速度来作为状态信息。这是因为,在车辆1在天窗W1或门窗W2打开的状态下行驶的情况下,车辆1的行驶速度越快,则风声、相向车辆的行驶声音等从外部进入车辆1的室内的噪声越大。因此,通过获取天窗W1或门窗W2的开闭状态以及车辆1的行驶速度作为状态信息,语音收集环境判定部108能够更适当地判定语音收集环境是否良好。
并且,语音收集环境判定部108获取设置于车辆1的开口部即天窗W1或门窗W2的开闭状态、以及天窗W1或门窗W2为打开状态的情况下的车辆1的周围的风速来作为状态信息。这是因为,在天窗W1或门窗W2处于打开状态的情况下,车辆1的周围的风速越快,则吹入车辆1的室内的风量越多,从而噪声越大。此外,即使在车辆1未行驶而停止的情况下,如果天窗W1或门窗W2处于打开状态,则车辆1的周围的风速也会对车辆1的室内的语音收集环境产生影响。因此,通过获取天窗W1或门窗W2的开闭状态以及车辆1的周围的风速作为状态信息,语音收集环境判定部108能够更适当地判定语音收集环境是否良好。
此外,车辆1的开口部并不限定于天窗W1或门窗W2,也可以是其它窗或门。
另外,语音收集环境判定部108获取车辆1的室内的噪音等级作为状态信息。车辆1的室内的噪音等级越高,语音获取部101获取的语音中越容易混入噪声,因此通过获取车辆1的室内的噪音等级作为状态信息,语音收集环境判定部108能够更适当地判定语音收集环境是否良好。
另外,在操作对象装置确定部104将预先被设定为第一检测模式对象装置的操作对象装置变更并重新设定为第二检测模式对象装置的情况下,语音识别装置300向设置于车辆1的显示器12或者音频设备13输出表示操作对象装置的设定的变更的信息。由此,用户能够可靠地确认到操作对象装置的设定已从第一检测模式对象装置变更为第二检测模式对象装置,从而用户容易发出与操作对象装置的当前的设定匹配的语音指示。
此外,使用本实施方式所涉及的语音识别装置300的语音识别方法并不限定于图7所示的流程。在图10中示出使用语音识别装置300的语音识别方法的其它例。
如图10所示,如果在步骤S3中确定了操作对象装置,则在步骤S23中,车辆信息获取部103获取车辆的状态信息。此外,步骤S23的处理可以与步骤S1~S4的处理并行地执行。而且,在步骤S24中,语音收集环境判定部108基于车辆的状态信息来判定语音收集环境是否良好。如果在步骤S24中判定为语音收集环境不良的情况下,则语音识别装置300不判定操作对象装置是否为第一检测模式对象装置,而是将检测模式一律设定为第二检测模式。即,在语音收集环境判定部108判定为语音收集环境良好、且操作对象装置确定部104将操作对象装置判定为第二检测模式对象装置的情况下、或者在语音收集环境判定部108判定为语音收集环境不良的情况下,检测模式设定部105将检测模式设定为第二检测模式。在该情况下,在判定为语音收集环境不良的情况下,如图9所示,也将操作对象装置均设定为第二检测模式对象装置,在针对操作对象装置的控制请求的确定中均应用基于规则库识别的第二检测模式。由此,即使在通过具有高语音输入自由度的自然语言识别来确定控制请求的情况下,语音识别装置300也能够根据语音收集环境来降低误识别的可能性。
另外,车辆信息获取部103能够获取车辆1的行驶状态作为车辆1的状态信息。在该情况下,操作对象装置确定部104在基于车辆1的行驶状态判定为车辆1停止的情况下,能够将预先被设定为第二检测模式对象装置的操作对象装置变更并重新设定为第一检测模式对象装置。具体地说,图3所示的作为第二检测模式对象装置的前照灯32、门窗锁定装置5a、门窗开闭装置5b、天窗锁定装置6a、天窗开闭装置6b、后背门锁定装置7a、后背门开闭装置7b、后备箱锁定装置34a以及后备箱开闭装置34b在车辆1停止的期间对用户产生的影响变小。因而,可以将这些车载装置的设定变更为第一检测模式对象装置,通过基于具有高语音输入的自由度的自然语言识别的第一检测模式来确定控制请求。即,可以在车辆1停车的期间,将操作对象装置均设定为第一检测模式对象装置,在针对操作对象装置的控制请求的确定中均应用基于自然语言识别的第一检测模式。另外,在操作对象装置确定部104将预先被设定为第二检测模式对象装置的操作对象装置变更并重新设定为第一检测模式对象装置的情况下,语音识别装置300可以向设置于车辆1的显示器12或者音频设备13输出表示操作对象装置的设定的变更的信息。
另外,语音识别装置100、200、300可以与使用自然语言识别和规则库识别中的哪一方来作为语音识别的方法的区别无关地,根据确定出的操作对象装置来设定第一检测模式或第二检测模式。例如,第一检测模式和第二检测模式也可以均为基于自然语言识别的检测模式。在该情况下也同样地,关于与各个控制请求对应地能够识别的语音数据的范围,设定为第二检测模式下的该范围比第一检测模式下的该范围小。具体地说,可以将第一检测模式设为基于多意图(Multi-intent)式的自然语言识别的检测模式,将第二检测模式设为基于单意图(Single-intent)式的自然语言识别的检测模式。在基于多意图式的自然语言识别的检测模式中,控制请求确定部106能够根据包含两个以上的控制请求的语音指示、例如“关闭空调,打开窗户”等指示确定出两个控制对象装置(空调4和门窗W2)和针对各个控制对象装置的控制请求(“想要关闭空调”和“想要打开门窗”)。另一方面,在基于单意图式的自然语言识别的检测模式下,控制请求确定部106仅在例如“关闭空调”或者“打开窗户”那样每一次语音指示包括一个控制请求的情况下能够确定控制请求。
另外,语音识别装置100、200、300可以使自然语言识别的方法在如图3所示的那样被划分为操作重要度为“1(低)”的分类的操作对象装置和被划分为操作重要度为“2(中)”的分类的操作对象装置中不同。具体地说,检测模式设定部105可以对被划分为操作重要度为“1(低)”的分类的操作对象装置设定基于多意图式的自然语言识别的第一检测模式,并对被划分为操作重要度为“2(中)”的分类的操作对象装置设定基于单意图式的自然语言识别的第一检测模式。另外,并不限定于此,检测模式设定部105可以根据各个第一检测模式对象装置来适当地设定基于具有两种以上的方法的自然语言识别的检测模式。
另外,移动体并不限定于车辆,可以是电车或飞机。
上述的车辆1相当于本发明所涉及的移动体。上述的车内灯3相当于本发明所涉及的环境调整装置。上述的空调4相当于本发明所涉及的环境调整装置和空调装置。上述的显示器12相当于本发明所涉及的信息提供装置。上述的音频设备13相当于本发明所涉及的环境调整装置和信息提供装置。上述的车辆信息获取部103相当于本发明的移动体信息获取部。上述的天窗W1和门窗W2相当于本发明的开口部。
附图标记说明
100、300:语音识别装置(语音识别系统);200:语音识别装置;1:车辆(移动体);3:车内灯(环境调整装置);4:空调(环境调整装置/空调装置);5a:门窗锁定装置;5b:门窗开闭装置;6a:天窗锁定装置;6b:天窗开闭装置;7a:后背门锁定装置;7b:后背门开闭装置:12:显示器(信息提供装置);13:音频设备(环境调整装置/信息提供装置);31:行驶控制装置;33:座椅控制装置;34a:后备箱锁定装置;34b:后备箱开闭装置;101:语音获取部;102:语音数据转换部;103:车辆信息获取部(移动体信息获取部);104:操作对象装置确定部;105:检测模式设定部;106:控制请求确定部;108:语音收集环境判定部;W1:天窗(开口部);W2:门窗(开口部)。

Claims (18)

1.一种语音识别装置,基于通过用户发出的语音进行的指示来受理针对搭载于移动体的装置的控制请求,所述语音识别装置具备:
语音获取部,其获取所述语音;
语音数据转换部,其将由所述语音获取部获取到的所述语音转换为语音数据;
操作对象装置确定部,其对由所述语音数据转换部进行转换所得到的所述语音数据进行分析,来确定作为操作的对象的操作对象装置;
检测模式设定部,其根据由所述操作对象装置确定部确定出的所述操作对象装置,来设定用于确定与所述语音数据对应的所述控制请求的检测模式;以及
控制请求确定部,其基于由所述检测模式设定部所设定的所述检测模式,对所述语音数据进行分析,来确定针对所述操作对象装置的所述控制请求。
2.根据权利要求1所述的语音识别装置,其特征在于,
所述检测模式设定部根据所述操作对象装置来设定第一检测模式或者第二检测模式,其中,所述第一检测模式用于通过自然语言识别对所述语音数据进行分析,以确定与所述语音数据对应的所述控制请求,所述第二检测模式用于通过与自然语言识别不同的方法的语音识别对所述语音数据进行分析,以确定与所述语音数据对应的所述控制请求,
在确定出的所述操作对象装置是第一检测模式对象装置的情况下,所述检测模式设定部将所述检测模式设定为所述第一检测模式,
在确定出的所述操作对象装置是第二检测模式对象装置的情况下,所述检测模式设定部将所述检测模式设定为所述第二检测模式,
关于与各个所述控制请求对应地能够识别的所述语音数据的范围,所述第二检测模式下的所述范围比所述第一检测模式下的所述范围小。
3.根据权利要求2所述的语音识别装置,其特征在于,
在所述检测模式设定部将所述检测模式设定为所述第二检测模式的情况下,
所述控制请求确定部判定所述语音数据是否与预先定义的控制请求文本一致,
所述控制请求确定部在判定为所述语音数据与所述控制请求文本一致的情况下,确定与所述控制请求文本对应的所述控制请求。
4.根据权利要求3所述的语音识别装置,其特征在于,
在所述检测模式被设定为所述第二检测模式、并且基于通过语音进行的所述指示的所述语音数据不与所述控制请求文本一致的情况下,
所述控制请求确定部向设置于所述移动体的信息提供装置输出引导信息,所述引导信息用于引导所述用户以使所述语音数据与所述控制请求文本一致的方式重新进行所述指示。
5.根据权利要求2至4中的任一项所述的语音识别装置,其特征在于,
所述操作对象装置确定部在确定为所述操作对象装置是用于对所述移动体的行驶进行控制的行驶控制装置的情况下,将所述操作对象装置判定为所述第二检测模式对象装置。
6.根据权利要求2至4中的任一项所述的语音识别装置,其特征在于,
所述操作对象装置确定部在确定为所述操作对象装置是所述移动体的后备箱、车门或车窗的锁定装置、或者所述后备箱、所述车门或所述车窗的开闭装置的情况下,将所述操作对象装置判定为所述第二检测模式对象装置。
7.根据权利要求2至4中的任一项所述的语音识别装置,其特征在于,
所述操作对象装置确定部在确定为所述操作对象装置是对包括所述移动体的内部的温度、光量以及音量中的至少任一者的环境状态进行调整的环境调整装置的情况下,将所述操作对象装置判定为所述第一检测模式对象装置。
8.根据权利要求2至4中的任一项所述的语音识别装置,其特征在于,
所述操作对象装置确定部在确定为所述操作对象装置是对设置于所述移动体的内部的座椅的状态进行控制的座椅控制装置的情况下,将所述操作对象装置判定为所述第一检测模式对象装置。
9.根据权利要求2至4中的任一项所述的语音识别装置,其特征在于,
所述操作对象装置确定部在确定为所述操作对象装置是对所述用户进行信息提供的信息提供装置的情况下,将所述操作对象装置判定为所述第一检测模式对象装置。
10.根据权利要求2至9中的任一项所述的语音识别装置,其特征在于,还具备:
移动体信息获取部,其获取所述移动体的状态信息;以及
语音收集环境判定部,其基于由移动体信息获取部获取到的所述移动体的所述状态信息,来判定用于获取所述语音的语音收集环境是否良好,
在所述语音收集环境判定部判定为所述语音收集环境良好、并且所述操作对象装置确定部将所述操作对象装置判定为所述第一检测模式对象装置的情况下,所述检测模式设定部将所述检测模式设定为所述第一检测模式。
11.根据权利要求10所述的语音识别装置,其特征在于,
在所述语音收集环境判定部判定为所述语音收集环境不良的情况下,所述操作对象装置确定部将预先被设定为所述第一检测模式对象装置的所述操作对象装置变更并重新设定为所述第二检测模式对象装置。
12.根据权利要求10或11所述的语音识别装置,其特征在于,
所述移动体信息获取部获取从设置于所述移动体的空调装置吹出的空气的风量来作为所述状态信息。
13.根据权利要求10至12中的任一项所述的语音识别装置,其特征在于,
所述移动体信息获取部获取设置于所述移动体的开口部的开闭状态和所述开口部处于打开状态的情况下的所述移动体的行驶速度来作为所述状态信息。
14.根据权利要求10至12中的任一项所述的语音识别装置,其特征在于,
所述移动体信息获取部获取设置于所述移动体的开口部的开闭状态和所述开口部处于打开状态的情况下的所述移动体的周围的风速来作为所述状态信息。
15.根据权利要求2至9中的任一项所述的语音识别装置,其特征在于,
还具备移动体信息获取部,所述移动体信息获取部获取所述移动体的状态信息,
所述移动体信息获取部获取所述移动体的行驶状态来作为所述状态信息,
所述操作对象装置确定部在基于所述移动体的所述行驶状态判定为所述移动体停止了的情况下,将预先被设定为所述第二检测模式对象装置的所述操作对象装置变更并重新设定为所述第一检测模式对象装置。
16.根据权利要求2至15中的任一项所述的语音识别装置,其特征在于,
在所述操作对象装置确定部将预先被设定为所述第一检测模式对象装置的所述操作对象装置变更并重新设定为所述第二检测模式对象装置的情况下,或者在将预先被设定为所述第二检测模式对象装置的所述操作对象装置变更并重新设定为所述第一检测模式对象装置的情况下,向设置于所述移动体的信息提供装置输出表示所述操作对象装置的设定的变更的信息。
17.根据权利要求1至16中的任一项所述的语音识别装置,其特征在于,
所述操作对象装置确定部基于自然语言识别对所述语音数据进行分析,来确定操作对象装置。
18.一种语音识别方法,是使用语音识别装置的方法,所述语音识别装置基于通过用户发出的语音进行的指示来受理针对搭载于移动体的装置的控制请求,在所述语音识别方法中,
所述语音识别装置进行以下处理:
获取所述语音;
将获取到的所述语音转换为语音数据;
对所述语音数据进行分析,来确定作为操作的对象的操作对象装置;
根据所述操作对象装置,来设定用于检测与所述语音数据对应的所述控制请求的检测模式;以及
基于所设定的所述检测模式,对所述语音数据进行分析,来确定针对所述操作对象装置的所述控制请求。
CN202080098726.7A 2020-03-19 2020-03-19 语音识别装置和语音识别方法 Pending CN115298737A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/012349 WO2021186679A1 (ja) 2020-03-19 2020-03-19 音声認識装置及び音声認識方法

Publications (1)

Publication Number Publication Date
CN115298737A true CN115298737A (zh) 2022-11-04

Family

ID=77771984

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080098726.7A Pending CN115298737A (zh) 2020-03-19 2020-03-19 语音识别装置和语音识别方法

Country Status (5)

Country Link
US (1) US20230139640A1 (zh)
EP (1) EP4123640A4 (zh)
JP (1) JP7392827B2 (zh)
CN (1) CN115298737A (zh)
WO (1) WO2021186679A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4123640A4 (en) * 2020-03-19 2023-04-05 Nissan Motor Co., Ltd. VOICE RECOGNITION DEVICE AND VOICE RECOGNITION METHOD

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10248831A (ja) * 1997-03-13 1998-09-22 Hitachi Medical Corp 医用診断装置
JP2006308848A (ja) * 2005-04-28 2006-11-09 Honda Motor Co Ltd 車両機器制御装置
CN104412323A (zh) * 2012-06-25 2015-03-11 三菱电机株式会社 车载信息装置
CN105917405A (zh) * 2014-01-17 2016-08-31 微软技术许可有限责任公司 外源性大词汇量模型到基于规则的语音识别的合并
US20170236510A1 (en) * 2016-02-17 2017-08-17 Honda Motor Co., Ltd. Voice processing device
JP2018117728A (ja) * 2017-01-23 2018-08-02 Gmoインターネット株式会社 環境模擬装置
JP2019073255A (ja) * 2017-10-19 2019-05-16 アイシン精機株式会社 運転支援装置
EP4123640A1 (en) * 2020-03-19 2023-01-25 Nissan Motor Co., Ltd. Voice recognition apparatus and voice recognition method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5014662B2 (ja) 2006-04-13 2012-08-29 アルパイン株式会社 車載用音声認識装置及び音声認識方法
JP4982807B2 (ja) 2008-03-06 2012-07-25 独立行政法人産業技術総合研究所 操作方法およびそのための操作装置、プログラム
JP6516585B2 (ja) * 2015-06-24 2019-05-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 制御装置、その方法及びプログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10248831A (ja) * 1997-03-13 1998-09-22 Hitachi Medical Corp 医用診断装置
JP2006308848A (ja) * 2005-04-28 2006-11-09 Honda Motor Co Ltd 車両機器制御装置
CN104412323A (zh) * 2012-06-25 2015-03-11 三菱电机株式会社 车载信息装置
CN105917405A (zh) * 2014-01-17 2016-08-31 微软技术许可有限责任公司 外源性大词汇量模型到基于规则的语音识别的合并
US20170236510A1 (en) * 2016-02-17 2017-08-17 Honda Motor Co., Ltd. Voice processing device
JP2018117728A (ja) * 2017-01-23 2018-08-02 Gmoインターネット株式会社 環境模擬装置
JP2019073255A (ja) * 2017-10-19 2019-05-16 アイシン精機株式会社 運転支援装置
EP4123640A1 (en) * 2020-03-19 2023-01-25 Nissan Motor Co., Ltd. Voice recognition apparatus and voice recognition method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JOZEF IVANECKÝ: "An In-Car Speech Recognition System for Disabled Drivers", TEXT, SPEECH AND DIALOGUE, 3 September 2012 (2012-09-03), pages 505 - 512, XP047013090 *

Also Published As

Publication number Publication date
EP4123640A4 (en) 2023-04-05
JPWO2021186679A1 (zh) 2021-09-23
WO2021186679A1 (ja) 2021-09-23
EP4123640A1 (en) 2023-01-25
US20230139640A1 (en) 2023-05-04
JP7392827B2 (ja) 2023-12-06

Similar Documents

Publication Publication Date Title
US6587824B1 (en) Selective speaker adaptation for an in-vehicle speech recognition system
US20180182382A1 (en) Dialogue processing apparatus, a vehicle having same, and a dialogue processing method
US20160267909A1 (en) Voice recognition device for vehicle
US20200320999A1 (en) Agent apparatus, agent system, and server device
CN110956967A (zh) 基于声纹识别的车辆控制方法与车辆
US11996099B2 (en) Dialogue system, vehicle, and method of controlling dialogue system
KR101755308B1 (ko) 음성 인식 모듈, 그를 가지는 단말기 및 차량
CN115298737A (zh) 语音识别装置和语音识别方法
JP2019100130A (ja) 車両制御装置及びコンピュータプログラム
JP7286368B2 (ja) 車両機器制御装置、車両機器制御方法、およびプログラム
JP7261626B2 (ja) 車載機器制御システム、車載機器制御装置、車載機器制御方法、及びプログラム
JP2020144285A (ja) エージェントシステム、情報処理装置、移動体搭載機器制御方法、及びプログラム
KR20160100640A (ko) 차량 및 그 제어 방법
JP7239365B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
KR20230090510A (ko) 단말기 및 차량
US20230238020A1 (en) Speech recognition system and a method for providing a speech recognition service
US20230206918A1 (en) Speech Recognition System and Method for Providing Speech Recognition Service
CN111798842A (zh) 对话系统和对话处理方法
JP2021148971A (ja) 音声認識方法及び音声認識装置
US20210303263A1 (en) Dialogue system and vehicle having the same, and method of controlling dialogue system
US20230035752A1 (en) Systems and methods for responding to audible commands and/or adjusting vehicle components based thereon
KR20200000621A (ko) 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법
US20230206917A1 (en) Vehicle and control method thereof
JP7297483B2 (ja) エージェントシステム、サーバ装置、エージェントシステムの制御方法、およびプログラム
KR20230126571A (ko) 자연어 처리 장치 및 자연어 처리 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination