CN114694349A - 一种交互方法及交互系统 - Google Patents
一种交互方法及交互系统 Download PDFInfo
- Publication number
- CN114694349A CN114694349A CN202011612148.2A CN202011612148A CN114694349A CN 114694349 A CN114694349 A CN 114694349A CN 202011612148 A CN202011612148 A CN 202011612148A CN 114694349 A CN114694349 A CN 114694349A
- Authority
- CN
- China
- Prior art keywords
- driver
- chat content
- fatigue
- distraction
- conversation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000003993 interaction Effects 0.000 title claims abstract description 49
- 230000002452 interceptive effect Effects 0.000 claims abstract description 23
- 230000004044 response Effects 0.000 claims abstract description 14
- 238000001514 detection method Methods 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 6
- 230000001815 facial effect Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 3
- 206010041349 Somnolence Diseases 0.000 abstract description 10
- 208000032140 Sleepiness Diseases 0.000 abstract description 9
- 230000037321 sleepiness Effects 0.000 abstract description 9
- 230000006399 behavior Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 6
- 206010039203 Road traffic accident Diseases 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 241001282135 Poromitra oscitans Species 0.000 description 2
- 206010048232 Yawning Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004399 eye closure Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 210000000689 upper leg Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B21/00—Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
- G08B21/02—Alarms for ensuring the safety of persons
- G08B21/06—Alarms for ensuring the safety of persons indicating a condition of sleep, e.g. anti-dozing alarms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Emergency Management (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提供了一种交互方法及交互系统。上述的交互方法包括:响应于驾驶员处于疲劳或分心状态,生成聊天内容;以及基于上述聊天内容与上述驾驶员进行多轮对话,以解除上述驾驶员的疲劳或分心;其中所生成的聊天内容关联于前一轮对话的驾驶员回复且引导上述驾驶员进行下一轮对话。本发明还提供了实现上述交互方法的交互系统。根据本发明所提供的交互方法及交互系统,在驾驶员处于疲劳或分心状态时,能够与驾驶员进行趣味聊天交互来引导驾驶员进行多轮对话,以达到主动解除驾驶员困意的目的,从而行车安全。
Description
技术领域
本发明涉及智能车辆领域,尤其涉及一种基于驾驶员监控系统的交互方法及交互系统。
背景技术
伴随着社会经济的不断高速发展,人们生活水平不断提高。快速、舒适、便捷的生活也成为人们不断追求的目标,使得机动车数量不断增加。机动车数量的提高虽然使得人们生活条件和质量有了更明显的提高,但与此同时,交通事故率也逐年不断增加。
交通事故是当前世界各国所面临的严重社会问题之一,已被公认为当今世界危害人类生命安全的第一大公害。有相关统计分析表明,交通事故中80%~90%是人的因素造成的。在这些导致交通事故的人为因素中,疲劳驾驶一直被列为引发交通事故的主要原因之一,必须引起高度的重视。
在汽车工业中,高级智能驾驶辅助系统主要出现在少数高级轿车的前装环节,而中国汽车保有量中存在大量的中低级轿车,少有高级驾驶辅助系统的保障。在汽车后装市场加入高级智能驾驶辅助系统同样可以起到更好的保护作用。
高级智能驾驶辅助系统(ADAS,Advanced Driver Assistance System)中的驾驶员监控系统(DMS,driver monitoring system)或者称为疲劳驾驶预警系统能够在驾驶员行驶过程中,实时监测驾驶员的疲劳状态、驾驶行为等。在发现驾驶员出现疲劳、打哈欠、眯眼睛、分心及其他错误驾驶状态后,预警系统将会对此类行为进行及时的分析,并进行语音灯光提示。达到警示驾驶员,纠正错误驾驶行为的方式。
但在现有技术中,DMS系统在发现驾驶员有疲劳或不良驾驶状态后,主要的应对错失包括:语音提醒、音乐播放、空调温度、风向、风量调节,以及导航至下一个服务区休息。但这些应对错失还未完全成熟。
可以理解的是,在长途驾驶的时候,如果车里只有一个人,即使DMS系统提醒驾驶员,驾驶员一个人仍然很难解除困意(现有的解除困意的方式包括听音乐、扭自己大腿,其实效果不佳),如果副驾有人聊天,在整个驾驶过程中,基本就不会发困。
有鉴于此,希望能够提供一种交互方法及系统,能够在驾驶员出现疲劳或分心状态时,有效地解除驾驶员的疲劳和困意,从而能够有效地纠正驾驶员的错误驾驶行为,提高行车安全。
发明内容
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
如上所描述的,为了解决现有技术中,DMS在发现驾驶员存在错误驾驶行为后仅仅采用最基本的提醒措施,无法有效解除驾驶员的困意、分心,达到纠正驾驶员错误驾驶行为的问题,本发明提供了一种交互方法及交互系统。
具体的,本发明的一方面所提供的交互方法包括:
响应于驾驶员处于疲劳或分心状态,生成聊天内容;以及
基于所述聊天内容与所述驾驶员进行多轮对话,以解除所述驾驶员的疲劳或分心;其中
所生成的聊天内容关联于前一轮对话的驾驶员回复且引导所述驾驶员进行下一轮对话。
本发明的另一方面还提供了一种交互系统,具体包括:
扬声器、麦克风、存储器;以及
与所述存储器连接的处理器;其中
所述处理器被配置为:
响应于驾驶员处于疲劳或分心状态,生成聊天内容;以及
基于所述聊天内容通过所述扬声器和所述麦克风与所述驾驶员进行多轮对话,以解除所述驾驶员的疲劳或分心;其中
所生成的聊天内容关联于前一轮对话的驾驶员回复且引导所述驾驶员进行下一轮对话。
本发明的另一方面还提供了一种计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令在由处理器执行时实施如本发明所提供的交互方法的步骤。
根据本发明所提供的一种交互方法及系统,能够在驾驶员出现疲劳或分心状态时,有效地解除驾驶员的疲劳和困意,从而能够有效地纠正驾驶员的错误驾驶行为,提高行车安全。
附图说明
在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本发明的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。
图1示出了根据本发明的一方面所提供的交互方法一实施例的流程图。
图2示出了根据本发明的一方面所提供的交互系统的示意图。
附图标记
100 交互系统
110 处理器
120 存储器
130 扬声器
140 麦克风
150 摄像装置
具体实施方式
以下结合附图和具体实施例对本发明作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本发明的保护范围进行任何限制。
给出以下描述以使得本领域技术人员能够实施和使用本发明并将其结合到具体应用背景中。各种变型、以及在不同应用中的各种使用对于本领域技术人员将是容易显见的,并且本文定义的一般性原理可适用于较宽范围的实施例。由此,本发明并不限于本文中给出的实施例,而是应被授予与本文中公开的原理和新颖性特征相一致的最广义的范围。
在以下详细描述中,阐述了许多特定细节以提供对本发明的更透彻理解。然而,对于本领域技术人员显而易见的是,本发明的实践可不必局限于这些具体细节。换言之,公知的结构和器件以框图形式示出而没有详细显示,以避免模糊本发明。
请读者注意与本说明书同时提交的且对公众查阅本说明书开放的所有文件及文献,且所有这样的文件及文献的内容以参考方式并入本文。除非另有直接说明,否则本说明书(包含任何所附权利要求、摘要和附图)中所揭示的所有特征皆可由用于达到相同、等效或类似目的的可替代特征来替换。因此,除非另有明确说明,否则所公开的每一个特征仅是一组等效或类似特征的一个示例。
注意,在使用到的情况下,标志左、右、前、后、顶、底、正、反、顺时针和逆时针仅仅是出于方便的目的所使用的,而并不暗示任何具体的固定方向。事实上,它们被用于反映对象的各个部分之间的相对位置和/或方向。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
注意,在使用到的情况下,进一步地、较优地、更进一步地和更优地是在前述实施例基础上进行另一实施例阐述的简单起头,该进一步地、较优地、更进一步地或更优地后带的内容与前述实施例的结合作为另一实施例的完整构成。在同一实施例后带的若干个进一步地、较优地、更进一步地或更优地设置之间可任意组合的组成又一实施例。
以下结合附图和具体实施例对本发明作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本发明的保护范围进行任何限制。
如上所描述的,为了解决现有技术中,DMS在发现驾驶员存在错误驾驶行为后仅仅采用最基本的提醒措施,无法有效解除驾驶员的困意、分心,达到纠正驾驶员错误驾驶行为的问题,本发明提供了一种交互方法及交互系统,请结合图1和图2来理解本发明所提供的交互方法及交互系统。
首先,请参考图1,图1示出了本发明所提供的交互方法的流程图。如图1所示出的,本发明的一方面所提供的交互方法包括:
步骤S100:判断驾驶员是否疲劳或分心;
响应于驾驶员疲劳或分心,执行步骤S200:生成聊天内容;以及
步骤S300:基于所述聊天内容与所述驾驶员进行多轮对话,以解除所述驾驶员的疲劳或分心。
在一实施例中,在上述的步骤S100中,本发明所提供的交互方法可以通过获取外部的驾驶员疲劳检测装置返回的驾驶员是否疲劳或分心的数据来判断驾驶员是否疲劳或分心,而不用自行通过各种检测手段去判断驾驶员是否疲劳或分心。
在上述的实施例中,可以理解的是,可以通过现有或将有的各种驾驶员疲劳检测装置来进行驾驶员疲劳或分心的实质性判断。上述驾驶员疲劳的实质性判断可以通过捕捉驾驶员的面部图像来判断驾驶员是否打哈欠、是否闭眼来实现。上述驾驶员分心的实质性判断同样可以通过捕捉驾驶员的图像来判断驾驶员是否存在低头、看窗外、接打电话、抽烟等错误驾驶行为。需要注意的是,上述关于驾驶员疲劳或分心的实质性判断的举例仅为示意性,不应不当地限制本发明的保护范围。
在另一实施例中,在上述的步骤S100中,本发明所提供的交互方法可以通过收集各种驾驶员状态信息来进行疲劳和分心的实质性判断。可以理解的是,如上所描述的,驾驶员疲劳或分心的实质性判断可以通过现有或将有的手段,关于驾驶员疲劳或分心的实质性判断的具体实现方式不应不当地限制本发明的保护范围。
由于在步骤S300中,本发明所提供的交互方法需要基于步骤S200中生成的聊天内容进行多论对话,因此,在步骤S200中,需要有效地生成能够使得多轮对话继续下去的聊天内容。也就是说,所生成的聊天内容至少需要与驾驶员形成互动,要理解驾驶员的回复,从而能够针对性的回复并引导所述驾驶员进行下一轮对话。这也就要求在生成聊天内容的过程中,需要及时获取驾驶员前一轮对话的回复。
在一实施例中,为了能够生成关联于前一轮对话的驾驶员回复的聊天内容,需要有效地获取驾驶员在前一轮对话中的答复内容。现有技术中,常规的做法是实时地通过录音设备来获取在一段时间内车厢内的音频,随后,对音频进行处理,以提炼出驾驶员的回复。但这样做存在一定识别失败的风险,例如车辆内噪声太多,无法进行语音识别,或者即使语音识别成功,但是数据库中并没有关于用户指令的相关回复。这种情况下,无法给出合适的交互内容,无法将多轮对话继续下去。
在一实施例中,为了解决无法进行语音识别的问题,本发明的一方面所提供的步骤S200进一步包括:对所述车内语音进行降噪处理;对降噪后的车内语音进行识别,以提取前一轮对话的驾驶员回复;以及基于所提取的前一轮对话的驾驶员回复生成聊天内容。
通过主动对车内语音进行降噪,能够有效地提高车内语音的音频质量,从而能够有效地基于语音音频进行识别,提高语音识别的准确率。需要注意的是,可以通过现有或将有的降噪技术来实现车内语音的降噪,关于降噪的具体实现方式不应不当地限制本发明的保护范围。
在另一实施例中,为了无法进行语音识别的问题,本发明的一方面所提供的步骤S200进一步包括:获取所述驾驶员在前一轮对话过程中的面部视频;根据所述面部视频进行唇动检测,以提取前一轮对话的驾驶员回复;以及基于所提取的前一轮对话的驾驶员回复生成聊天内容。
驾驶员的答复不仅可以通过声音来表征,还可以通过面部表情、唇部动作的变化来表征。通过获取驾驶员的面部视频,并基于面部视频进行唇动检测,能够排除掉声音中存在误差,亦能够有效地获取驾驶员回复。需要注意的是,可以通过现有或将有的唇动检测技术来实现驾驶员回复的提取,关于唇动检测的具体实现方式不应不当地限制本发明的保护范围。
在另一实施例中,为了解决在提取驾驶员回复后,若存在数据库中没有预存关于用户回复的相关答复而无法及时答复驾驶员的问题的情况,本发明的一方面所提供的步骤S200进一步包括:生成引导性聊天内容,以继续所述多轮对话。
举例来说,当无法理解用户所说的话时,本发明所提供的交互方法不会提示“我好像不理解你的意思”等让用户失望的答复,而是用“恩,好的,知道了呢,然后呢,你想怎样”等话术答复用户,也就是具有引导性的聊天内容,然后结合用户的下一句话再判断用户的意图,从而保证多轮聊天能够顺利继续下去。
为了能够更好地引导所述驾驶员进行下一轮对话,从而实现与驾驶员进行多轮对话来达到解除驾驶员疲劳或分心的目的,在上述的步骤S200中,优选的,需要增加所生成的聊天内容的趣味性。也就是说,需要使所生成的聊天内容至少需要具有友好性、有趣性、不可预知性、风格多样不单一的特点。在本发明的一实施例中,可以通过人工智能AI来实现具有特点的趣味聊天内容的生成。
具体的,可以根据聊天上下文从自嘲调侃、曲解意思、运用谐音、声东击西、故意夸张、善于联想、成语接龙等风格自由切换来形成趣味聊天内容,甚至可以作诗、唱歌(非点播,AI自行作诗、唱歌)旨在形成有趣、不可预料、充满惊喜的聊天内容,从而最终达到消除驾驶员困意的目的。
上述的趣味聊天内容可以包括两个方面,一种是关联于时事热点的。需要注意的是,此处的“时事”需要从广义的角度去理解,“时事”可以包括驾驶员最近的状态(可以通过外接驾驶员社交软件等方式实现),可以包括车辆的当前状态(比如满油、动力充沛),还可以包括当前车外状态(比如车外天气情况、路况等)。
在上述的实施例中,可以结合心理学(包括驾驶员画像)和最新时事热点、流行语,不断更新词库,根据聊天上下文从自嘲调侃、曲解意思、运用谐音、声东击西、故意夸张、善于联想、成语接龙等风格自由切换来形成趣味聊天内容。举例来说,网络流行语部分会定期爬取网络上最近的流行语句用来与用户日常对话,成语接龙部分是连续接龙小游戏,当用户胜出后会对用户进行夸奖等。
趣味聊天内容的另一方面包括AI的即兴创作,包括即兴唱歌、即兴作诗等等。即兴唱歌和即兴作诗会结合聊天上下文和车外风景等进行即兴的歌曲创作和诗歌创造,从而引起用户的兴趣和点评。
可以理解的是,在上述的步骤S200中,趣味聊天内容的生成还可以借助第三方开源平台来实现。例如,现有的微软小冰等。
进一步的,在本发明所提供的交互方法的另一方面,上述交互方法还包括:获取所述驾驶员的疲劳或分心等级,随后,生成所述聊天内容进一步包括:根据所述驾驶员的疲劳或分心等级调整所述聊天内容。具体的,主要是调整所述聊天内容的趣味性,从而能够通过不同的聊天趣味性起到不同的解除疲劳的效果。
上述驾驶员的疲劳或分心等级可以在步骤S100判断驾驶员是否疲劳或分心的过程中一并得到。举例来说,可以通过统计驾驶员打哈欠的频率、闭眼的时长来确定驾驶员的疲劳等级。可以通过统计驾驶员低头、看窗外、接打电话、抽烟的时长和频率来确定驾驶员的分心等级。
其中,响应于所述驾驶员的疲劳或分心等级高于预设等级,调整所述聊天内容为即兴创作,以引导所述驾驶员进行评论。响应于所述驾驶员的疲劳或分心等级不高于预设等级,调整所述聊天内容关联于时事热点,以引导所述驾驶员进行多轮对话。可以理解的是,若驾驶员的疲劳或分心程度不高,则通过一些简单的幽默聊天就可以起到解除疲劳和专心的作用。而如果驾驶员的疲劳或者分心程度较高,则需要引导驾驶员积极地思考,因此可以通过即兴创作一些歌曲、诗句来引导驾驶员思考、讨论,从而能够有效地解除疲劳、改善分心问题。
在另一实施例中,在步骤S300与驾驶员进行多轮对话的步骤中,还可以包括:根据所述驾驶员的疲劳或分心等级调整所述多轮对话的频率和/或音量。例如,当驾驶员疲劳或分心等级较高,则可以调高扬声器的输出音量,以给用户强提醒。另外,当驾驶员疲劳或分心等级较高,可以调整聊天内容的播放速度,从而能够迫使驾驶员集中精神。当聊天内容的播放速度提高后,一方面可以通过缩短播放聊天内容的时间来提高交互的频率,另一方面也会带动驾驶员更积极地响应,也能够提高交互的频率。
至此,已经描述了本发明所提供的交互方法的具体实现方式。根据本发明所提供的交互方法,能够在驾驶员出现疲劳或分心状态时,有效地解除驾驶员的疲劳和困意,从而能够有效地纠正驾驶员的错误驾驶行为,提高行车安全。
本发明的另一方面还提供了一种交互系统,请参考图2,图2示出了本发明所提供的交互系统的示意图。如图2所示出的,本发明所提供的交互系统100包括处理器110、存储器120、扬声器130、麦克风140以及摄像装置150。
上述的存储器120可以认为是本发明的另一方面所提供的计算机可读存储介质的表现形式。存储器120上存储有计算机程序,当该计算机程序被处理器110执行时实现如上述交互方法的步骤。处理器110能够生成聊天内容,并且通过扬声器130和麦克风140与驾驶员进行多轮对话,从而能够解除驾驶员的疲劳与分心情况。
为了更好地使多轮对话持续进行下去,处理器110通过对麦克风140获取的车内语音进行主动消噪,从而能够得到质量较优的音频用于语音识别,从而能够更精准地获得驾驶员在前一轮对话中的回复。
不仅如此,处理器110还能够通过摄像装置150获取驾驶员的面部视频,从而能够基于面部视频进行唇动检测,也为更精准地获得驾驶员在前一轮对话中的回复提供了可能。
本发明所提供的交互系统能够实现上述的交互方法,具体的请参照上述关于交互方法的描述,在此不再赘述。
需要注意的是,在一实施例中,本发明所提供的交互系统可以构架在现有的DMS系统中,从而能够改进现有的DMS系统,使其既能够实现有效检测驾驶员疲劳、分心状况和严重程度的功能,在实现现有的提醒功能的情况下,还能够实现解除驾驶员疲劳的功能,从而能够完善现有的DMS系统中当发现驾驶员疲劳时的应对措施。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,当该计算机程序被处理器执行时实现如上述交互方法的步骤。具体请参考上述关于交互方法的描述,在此不再赘述。
结合本文所公开的实施例描述的各种解说性逻辑模块、和电路可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。
结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中,存储介质可以被整合到处理器。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替换方案中,处理器和存储介质可作为分立组件驻留在用户终端中。
在一个或多个示例性实施例中,所描述的功能可在硬件、软件、固件或其任何组合中实现。如果在软件中实现为计算机程序产品,则各功能可以作为一条或更多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者,其包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定,这样的计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁存储设备、或能被用来携带或存储指令或数据结构形式的合意程序代码且能被计算机访问的任何其它介质。任何连接也被正当地称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)、或诸如红外、无线电、以及微波之类的无线技术从web网站、服务器、或其它远程源传送而来,则该同轴电缆、光纤电缆、双绞线、DSL、或诸如红外、无线电、以及微波之类的无线技术就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟(CD)、激光碟、光碟、数字多用碟(DVD)、软盘和蓝光碟,其中盘(disk)往往以磁的方式再现数据,而碟(disc)用激光以光学方式再现数据。上述的组合也应被包括在计算机可读介质的范围内。
提供之前的描述是为了使本领域中的任何技术人员均能够实践本文中所描述的各种方面。但是应该理解,本发明的保护范围应当以所附权利要求书为准,而不应被限定于以上所解说实施例的具体结构和组件。本领域技术人员在本发明的精神和范围内,可以对各实施例进行各种变动和修改,这些变动和修改也落在本发明的保护范围之内。
Claims (17)
1.一种交互方法,其特征在于,所述交互方法包括:
响应于驾驶员处于疲劳或分心状态,生成聊天内容;以及
基于所述聊天内容与所述驾驶员进行多轮对话,以解除所述驾驶员的疲劳或分心;其中
所生成的聊天内容关联于前一轮对话的驾驶员回复且引导所述驾驶员进行下一轮对话。
2.如权利要求1所述的交互方法,其中,生成所述聊天内容进一步包括:
获取包含驾驶员回复的车内语音;
对所述车内语音进行降噪处理;
对降噪后的车内语音进行识别,以提取前一轮对话的驾驶员回复;以及
基于所提取的前一轮对话的驾驶员回复生成聊天内容。
3.如权利要求1所述的交互方法,其中,生成所述聊天内容进一步包括:
获取所述驾驶员在前一轮对话过程中的面部视频;
根据所述面部视频进行唇动检测,以提取前一轮对话的驾驶员回复;以及
基于所提取的前一轮对话的驾驶员回复生成聊天内容。
4.如权利要求2或3所述的交互方法,其中,响应于无法提取前一轮对话的驾驶员回复,生成引导性聊天内容,以继续所述多轮对话。
5.如权利要求1所述的交互方法,其中,所述交互方法还包括:
获取所述驾驶员的疲劳或分心等级;其中
生成所述聊天内容进一步包括:
根据所述驾驶员的疲劳或分心等级调整所述聊天内容。
6.如权利要求5所述的交互方法,其中,响应于所述驾驶员的疲劳或分心等级高于预设等级,调整所述聊天内容为即兴创作,以引导所述驾驶员进行评论。
7.如权利要求5所述的交互方法,其中,响应于所述驾驶员的疲劳或分心等级不高于预设等级,调整所述聊天内容关联于时事热点,以引导所述驾驶员进行多轮对话。
8.如权利要求5所述的交互方法,其特征在于,与所述驾驶员进行多轮对话进一步包括:
根据所述驾驶员的疲劳或分心等级调整所述多轮对话的频率和/或音量。
9.一种交互系统,其特征在于,所述交互系统包括:
扬声器、麦克风、存储器;以及
与所述存储器连接的处理器;其中
所述处理器被配置为:
响应于驾驶员处于疲劳或分心状态,生成聊天内容;以及
基于所述聊天内容通过所述扬声器和所述麦克风与所述驾驶员进行多轮对话,以解除所述驾驶员的疲劳或分心;其中
所生成的聊天内容关联于前一轮对话的驾驶员回复且引导所述驾驶员进行下一轮对话。
10.如权利要求9所述的交互系统,其中,所述处理器生成所述聊天内容进一步包括:
从所述麦克风获取包含驾驶员回复的车内语音;
对所述车内语音进行降噪处理;
对降噪后的车内语音进行识别,以提取前一轮对话的驾驶员回复;以及
基于所提取的前一轮对话的驾驶员回复生成聊天内容。
11.如权利要求9所述的交互系统,其中,所述交互系统还包括摄像装置;
所述处理器生成所述聊天内容进一步包括:
从所述摄像装置获取所述驾驶员在前一轮对话过程中的面部视频;
根据所述面部视频进行唇动检测,以提取前一轮对话的驾驶员回复;以及
基于所提取的前一轮对话的驾驶员回复生成聊天内容。
12.如权利要求10或11所述的交互系统,其中,响应于无法提取前一轮对话的驾驶员回复,所述处理器被配置为:
生成引导性聊天内容,以继续所述多轮对话。
13.如权利要求9所述的交互系统,其中,所述处理器还被配置为:
获取所述驾驶员的疲劳或分心等级;其中
所述处理器生成所述聊天内容进一步包括:
根据所述驾驶员的疲劳或分心等级调整所述聊天内容。
14.如权利要求13所述的交互系统,其中,响应于所述驾驶员的疲劳或分心等级高于预设等级,所述处理器调整所述聊天内容为即兴创作,以引导所述驾驶员进行评论。
15.如权利要求13所述的交互系统,其中,响应于所述驾驶员的疲劳或分心等级不高于预设等级,所述处理器调整所述聊天内容关联于时事热点,以引导所述驾驶员进行多轮对话。
16.如权利要求13所述的交互系统,其特征在于,所述处理器与所述驾驶员进行多轮对话进一步包括:
根据所述驾驶员的疲劳或分心等级调整所述多轮对话的频率和/或音量。
17.一种计算机可读存储介质,其上存储有计算机可读指令,其特征在于,所述计算机可读指令在由处理器执行时实施如权利要求1-8中任意一项所述的交互方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011612148.2A CN114694349A (zh) | 2020-12-30 | 2020-12-30 | 一种交互方法及交互系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011612148.2A CN114694349A (zh) | 2020-12-30 | 2020-12-30 | 一种交互方法及交互系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114694349A true CN114694349A (zh) | 2022-07-01 |
Family
ID=82132518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011612148.2A Pending CN114694349A (zh) | 2020-12-30 | 2020-12-30 | 一种交互方法及交互系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114694349A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6236968B1 (en) * | 1998-05-14 | 2001-05-22 | International Business Machines Corporation | Sleep prevention dialog based car system |
US20150360695A1 (en) * | 2014-06-13 | 2015-12-17 | International Business Machines Corporation | Mitigating driver fatigue |
CN108170056A (zh) * | 2017-12-28 | 2018-06-15 | 重庆电子工程职业学院 | 一种互动交流驾驶机器人及其控制方法 |
CN207895660U (zh) * | 2017-12-28 | 2018-09-21 | 重庆电子工程职业学院 | 仿人头像表情交流机器人 |
CN109300476A (zh) * | 2017-07-25 | 2019-02-01 | 云拓科技有限公司 | 主动聊天装置 |
CN110008879A (zh) * | 2019-03-27 | 2019-07-12 | 深圳市尼欧科技有限公司 | 车载个性化音视频内容推送方法及装置 |
CN110428838A (zh) * | 2019-08-01 | 2019-11-08 | 大众问问(北京)信息科技有限公司 | 一种语音信息识别方法、装置及设备 |
CN110641476A (zh) * | 2019-08-16 | 2020-01-03 | 广汽蔚来新能源汽车科技有限公司 | 基于车载机器人的交互方法、装置、控制器和存储介质 |
CN111547063A (zh) * | 2020-05-12 | 2020-08-18 | 武汉艾瓦客机器人有限公司 | 一种疲劳检测的智能车载情感交互装置 |
-
2020
- 2020-12-30 CN CN202011612148.2A patent/CN114694349A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6236968B1 (en) * | 1998-05-14 | 2001-05-22 | International Business Machines Corporation | Sleep prevention dialog based car system |
US20150360695A1 (en) * | 2014-06-13 | 2015-12-17 | International Business Machines Corporation | Mitigating driver fatigue |
CN109300476A (zh) * | 2017-07-25 | 2019-02-01 | 云拓科技有限公司 | 主动聊天装置 |
CN108170056A (zh) * | 2017-12-28 | 2018-06-15 | 重庆电子工程职业学院 | 一种互动交流驾驶机器人及其控制方法 |
CN207895660U (zh) * | 2017-12-28 | 2018-09-21 | 重庆电子工程职业学院 | 仿人头像表情交流机器人 |
CN110008879A (zh) * | 2019-03-27 | 2019-07-12 | 深圳市尼欧科技有限公司 | 车载个性化音视频内容推送方法及装置 |
CN110428838A (zh) * | 2019-08-01 | 2019-11-08 | 大众问问(北京)信息科技有限公司 | 一种语音信息识别方法、装置及设备 |
CN110641476A (zh) * | 2019-08-16 | 2020-01-03 | 广汽蔚来新能源汽车科技有限公司 | 基于车载机器人的交互方法、装置、控制器和存储介质 |
CN111547063A (zh) * | 2020-05-12 | 2020-08-18 | 武汉艾瓦客机器人有限公司 | 一种疲劳检测的智能车载情感交互装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7231289B2 (ja) | 音声応答システム | |
JP6953464B2 (ja) | 情報プッシュ方法及び装置 | |
Kamaruddin et al. | Driver behavior analysis through speech emotion understanding | |
US10755704B2 (en) | Information processing apparatus | |
JP6730802B2 (ja) | 音声指向ネットワークを経由してドライバ通信を容易にするシステムおよび方法 | |
CN104811559A (zh) | 降噪方法、通信方法及移动终端 | |
CN110111782B (zh) | 语音交互方法及设备 | |
CN116386277A (zh) | 疲劳驾驶检测方法、装置、电子设备及介质 | |
CN115171731A (zh) | 一种情绪类别确定方法、装置、设备及可读存储介质 | |
US11138379B2 (en) | Determination of transcription accuracy | |
CN112927688B (zh) | 用于车辆的语音交互方法及系统 | |
CN114694349A (zh) | 一种交互方法及交互系统 | |
Tiersma et al. | Testing the comprehensibility of jury instructions: California's old and new instructions on circumstantial evidence | |
CN113160796B (zh) | 一种广播音频的语种识别方法、装置、设备及存储介质 | |
CN114792521A (zh) | 基于语音识别的智能答复方法及装置 | |
WO2022041177A1 (zh) | 通信消息处理方法、设备及即时通信客户端 | |
CN113066263A (zh) | 一种预防疲劳驾驶的方法及装置 | |
CN115862682B (zh) | 声音检测方法及相关设备 | |
Kessler | The Voice of Mockumentary | |
Han et al. | Uncovering Human Traits in Determining Real and Spoofed Audio: Insights from Blind and Sighted Individuals | |
CN118605736A (zh) | 一种听障外卖员使用的人机交互头戴式设备及其控制方法 | |
JP2024155769A (ja) | 電子機器 | |
CN116189682A (zh) | 文本信息显示方法、装置、电子设备及存储介质 | |
Peet | Understanding, Luck, and Communicative Value. | |
JP2024150630A (ja) | 音声応答システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20220701 |