CN110402584A - 车内通话控制装置、车内通话系统以及车内通话控制方法 - Google Patents

车内通话控制装置、车内通话系统以及车内通话控制方法 Download PDF

Info

Publication number
CN110402584A
CN110402584A CN201780088241.8A CN201780088241A CN110402584A CN 110402584 A CN110402584 A CN 110402584A CN 201780088241 A CN201780088241 A CN 201780088241A CN 110402584 A CN110402584 A CN 110402584A
Authority
CN
China
Prior art keywords
passenger
determination unit
voice data
car
speaking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780088241.8A
Other languages
English (en)
Other versions
CN110402584B (zh
Inventor
西川源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Corp
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Corp filed Critical Mitsubishi Corp
Publication of CN110402584A publication Critical patent/CN110402584A/zh
Application granted granted Critical
Publication of CN110402584B publication Critical patent/CN110402584B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • B60W50/10Interpretation of driver requests or demands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1787General system configurations
    • G10K11/17885General system configurations additionally using a desired external signal, e.g. pass-through audio such as music or speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Mechanical Engineering (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Transportation (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Navigation (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

判定部(7)基于在车内采集到的声音数据对是否存在车辆的确定乘客的说话进行判定。在由判定部(7)判定出存在确定乘客的说话的情况下,控制部(8)启动车内通话功能。

Description

车内通话控制装置、车内通话系统以及车内通话控制方法
技术领域
本发明涉及控制在车辆的乘客彼此之间所进行的车内通话的功能的车内通话控制装置、车内通话系统以及车内通话控制方法。
背景技术
近年,开始普及使用设置于车内的麦克风和扬声器在乘客彼此之间所进行的通话功能、即所谓的车内通话(下面,记载为InCarCom)。例如,专利文献1中记载了具有InCarCom功能的现有车载装置。该车载装置控制语音数据输出部,以使得在判定出存在从前座的乘客向后座的乘客的对话动作时将前座的乘客的语音数据输出至后座,在判定出没有对话动作时不将前座的乘客的语音数据输出至后座。
现有技术文献
专利文献
专利文献1:
日本专利特开2015-71320号公报
发明内容
发明所要解决的技术问题
在专利文献1所记载的车载装置中,基于前座的乘客的视线或脸部方向的检测结果,对是否存在从前座的乘客向后座的乘客的对话动作进行判定。将乘客所拍摄到的图像数据进行图像分析从而检测前座的乘客的视线或脸部方向。因此,存在下述问题,即:获得图像数据的车载摄像头、以及将图像数据进行图像分析从而检测乘客的视线或脸部方向的方法变得必要。
本发明是为了解决上述问题而完成的,其目的在于得到一种无需检测乘客的对话动作就能够适当地启动在乘客彼此之间所进行的车内通话的功能的车内通话控制装置、车内通话系统以及车内通话控制方法。
解决技术问题所采用的技术方案
本发明所涉及的车内通话控制装置包括:判定部,该判定部基于在车内采集到的声音数据,对是否存在车辆的确定乘客的说话进行判定;以及控制部,在由判定部判定出存在确定乘客的说话的情况下,该控制部启动在车辆的乘客彼此之间所进行的车内通话的功能。
发明效果
根据本发明,由于基于在车内采集到的声音数据来对是否存在确定乘客的说话进行判定,因此无需检测从前座的乘客向后座的乘客的对话动作。并且,能够在判定出存在以乘客为对象进行对话的确定乘客的说话时,适当地启动在乘客彼此之间所进行的车内通话的功能。
附图说明
图1是表示本发明的实施方式1所涉及的车内通话系统的结构的框图。
图2A是表示实现实施方式1所涉及的车内通话控制装置的功能的硬件结构的框图。图2B是表示执行实现实施方式1所涉及的车内通话控制装置的功能的软件的硬件结构的框图。
图3是表示实施方式1所涉及的车内通话控制方法的流程图。
图4是表示本发明的实施方式2所涉及的车内通话系统的结构的框图。
图5是表示语音数据登录处理的流程图。
图6是表示每个乘客的语音数据和车辆座位的关联处理的流程图。
图7是表示实施方式2所涉及的车内通话控制方法的流程图。
图8是表示本发明的实施方式3所涉及的车内通话系统的结构的框图。
图9是表示实施方式3所涉及的车内通话控制方法的流程图。
图10是表示本发明的实施方式4所涉及的车内通话系统的结构的框图。
图11是表示实施方式4所涉及的车内通话控制方法的流程图。
具体实施方式
下面,为了更详细地说明本发明,根据附图,对用于实施本发明的方式进行说明。
实施方式1.
图1是表示本发明的实施方式1所涉及的车内通话系统1的结构的框图。车内通话系统1是控制车辆的InCarCom功能的系统,例如,设置于具有InCarCom功能的车载系统。作为车载系统,列举有车载导航系统等。图1中,车内通话系统1包括车内通话控制装置2、InCarCom部3、麦克风4、放大器5以及扬声器6。
车内通话控制装置2在存在确定乘客的说话时启动InCarCom部3。确定乘客为从车辆的乘客中所选择出的一个或多个乘客,例如,使用未图示的输入装置在车辆行驶前设定于车内通话控制装置2。
由于从后座的乘客向驾驶员打招呼有可能会妨碍驾驶的集中,因此设定驾驶员作为确定乘客即可。
InCarCom部3执行使用了麦克风4和扬声器6的InCarCom功能。例如,在麦克风4配置于前座的周边、扬声器6配置于后座的周边的情况下,InCarCom部3对由麦克风4所采集到的乘客的语音数据实施回音消除、噪声消除等语音信号处理,并通过放大器5从扬声器6输出语音。另外,若InCarCom部3停止,则虽然麦克风4持续进行采集,但由麦克风4所采集到的声音数据无法从扬声器6输出。
麦克风4为设置于车内的语音输入装置,可以为已有的车载设备所包括的麦克风。放大器5对输出至扬声器6的信号的强度进行放大。扬声器6为设置于车内的语音输出装置,可以为车载用扬声器。
另外,麦克风4和扬声器6可以使用能够与车内通话控制装置2进行无线或有线的通信连接的移动终端所包括的装置。
另外,图1中各表示了一个对确定乘客的说话进行采集的麦克风4和一个向对话对象的乘客输出语音的扬声器6,但也可以针对每个乘客设置麦克风和扬声器。即,由麦克风4所采集到的确定乘客的说话语音从设置于对话对象的乘客的座位的扬声器6输出,对话对象的乘客的说话语音由设置于该乘客的座位的麦克风所采集并从设置于确定乘客的座位的扬声器输出。
如图1所示,车内通话控制装置2包括判定部7和控制部8。
判定部7基于在车内采集到的声音数据对是否存在确定乘客的说话进行判定。判定部7中设定有从车辆的乘客中所选择的确定乘客。
例如,判定部7基于由麦克风4所采集到的声音数据对是否存在确定乘客的说话进行判定。
控制部8为控制InCarCom部3的控制部,在由判定部7判定出存在确定乘客的说话的情况下,启动InCarCom部3。
另外,如前所述,InCarCom部3为执行InCarCom功能的结构,因此将“启动InCarCom部3”与“启动InCarCom功能”设为相同意思。
图2A是表示实现车内通话控制装置2的功能的硬件结构的框图。图2A中,信号处理装置100和处理电路101例如由总线互相连接。信号处理装置100为实现InCarCom部3的装置。
图2B是表示执行实现车内通话控制装置2的功能的软件的硬件结构的框图。图2B中,信号处理装置100、CPU(Central Processing Unit:中央处理单元)102和存储器103例如由总线互相连接。
车内通话控制装置2中的判定部7和控制部8的各功能由处理电路来实现。即,车内通话控制装置2包括处理电路,该处理电路用于执行图3所示的步骤ST1至步骤ST3的处理。处理电路可以是专用硬件,也可以是执行存储器中所存储的程序的CPU。
例如,可以用专用的信号处理装置来实现判定部7,将控制部8构成作为控制InCarCom部3的专用的控制装置。
可以将判定部7、控制部8以及InCarCom部3集成于一个芯片作为SoC(System On aChip:片上系统)。
在处理电路是如图2A所示的专用硬件的情况下,处理电路101例如与单一电路、复合电路、程序化后的处理器、并列程序化后的处理器、ASIC(Application SpecificIntegrated Circuit:专用集成电路)、FPGA(Field Programmable Gate Array:现场可编程门阵列)或它们的组合相对应。判定部7和控制部8的功能可以分别由各自的处理电路来实现,也可以将这些的功能汇总而由一个处理电路来实现。
在处理电路是图2B所示的CPU102的情况下,判定部7和控制部8的各功能利用软件、固件或软件与固件的组合来实现。软件或固件以程序的形式来表述,并存储于存储器103。
CPU102读出存储于存储器103的程序并执行,从而实现各部分的功能。即,车内通话控制装置2包括存储器103,该存储器103用于存储在由CPU102执行时最终执行图3所示的步骤ST1至步骤ST3的处理的程序。这些程序是使计算机执行判定部7和控制部8的步骤或方法的程序。
存储器103例如与RAM(Random Access Memory:随机存取存储器)、ROM(Read OnlyMemory:只读存储器)、闪存、EPROM(Erasable Programmable Read Only Memory:可擦可编程只读存储器)、EEPROM(Electrically-EPROM:电可擦可编程只读存储器)等非易失性或易失性的半导体存储器、磁盘、软盘、光盘、压缩光盘、迷你光盘、DVD等相对应。
另外,对于判定部7和控制部8的各功能,可以用专用硬件来实现一部分,并用软件或固件来实现一部分。
例如,对于判定部7,利用作为专用硬件的处理电路实现其功能,对于控制部8,可以通过CPU102读取存储于存储器103的程序并执行从而实现其功能。
由此,处理电路能利用硬件、软件、固件或它们的组合来实现各种上述功能。
接着对动作进行说明。
图3是表示实施方式1所涉及的车内通话控制方法的流程图,表示了直到启动车辆的InCarCom功能为止的一系列的处理。
判定部7获取由麦克风4所采集到的声音数据(步骤ST1)。
接着,判定部7基于获取到的声音数据,对是否存在确定乘客的说话进行判定(步骤ST2)。确定乘客列举有前座的乘客等。
在判定出没有确定乘客的说话的情况下(步骤ST2:否),车内通话控制装置2返回步骤ST1的处理。
在判定出存在确定乘客的说话的情况下(步骤ST2:是),判定部7向控制部8通知存在确定乘客的说话这一情况。
若控制部8从判定部7接收上述通知,则启动InCarCom部3(步骤ST3)。即,启动InCarCom功能。
如上所述,实施方式1所涉及的车内通话系统1和车内通话控制装置2包括判定部7和控制部8。判定部7基于在车内采集到的声音数据对是否存在车辆的确定乘客的说话进行判定。在由判定部7判定出存在确定乘客的说话的情况下,控制部8启动InCarCom部3。
通过包括上述的结构,由于基于由麦克风4所采集到的声音数据来对是否存在确定乘客的说话进行判定,因此无需检测从前座的乘客向后座的乘客的对话动作。并且,能够在判定出存在以乘客为对象进行对话的确定乘客的说话时,适当地启动InCarCom功能。
实施方式2.
图4是表示本发明的实施方式2所涉及的车内通话系统1A的结构的框图,对和图1中相同的结构要素标注相同的标号,并省略说明。
车内通话系统1A与实施方式1所示的系统相同,为控制InCarCom功能的系统,设置于车载导航系统等。
如图4所示,车内通话系统1A包括车内通话控制装置2A、InCarCom部3、麦克风4、放大器5、扬声器6、存储装置9以及输入装置10。
如图4所示,车内通话控制装置2A包括判定部7A和控制部8。
判定部7A基于由麦克风4所采集到的声音数据、表示车内座位和乘客之间的对应关系的信息以及车辆的每个乘客的语音数据,对是否存在确定乘客的说话进行判定。判定部7A中对应于座位来设定确定乘客。例如,在将驾驶员设为确定乘客的情况下,判定部7A中设定“驾驶座”作为判定基准。
存储装置9存储车辆的每个乘客的语音数据。每个乘客的语音数据是指事先采集到的每个乘客的说话语音数据。
可以使用已有的车载设备所包括的存储器作为存储装置9。例如,将每个乘客的语音数据存储于车载导航系统所包括的存储器。
输入装置10为用于向车内通话控制装置2A输入信息的装置,例如,为使用了车载导航系统所包括的触摸面板或硬件按钮的输入装置。车内通话控制装置2A中,设定使用输入装置10来表示车内座位和乘客之间的对应关系的信息。判定部7A通过参照该设定信息,从而能够识别哪个乘客就座于车内的哪个座位。
与实施方式1相同,车内通话控制装置2A中的、判定部7A和控制部8的各功能由处理电路来实现。即,车内通话控制装置2A包括用于执行上述功能的处理电路。如图2A和图2B所示,处理电路可以为专用硬件,也可以为执行存储于存储器的程序的CPU。
接着对动作进行说明。
图5是表示语音数据登录处理的流程图。
首先,车内通话系统1A获取由麦克风4所采集到的每个乘客的说话语音(步骤ST1a)。存储装置9存储所获取到的语音数据(步骤ST2a)。例如,存储装置9将每个乘客的语音数据与乘客的识别信息相关联地进行存储。
接着,存储装置9对是否存储了所有乘客的语音数据进行确认(步骤ST3a)。例如,若使用输入装置10通知有完成了语音数据登录,则存储装置9判断为存储了所有乘客的语音数据。
在存在未存储到存储装置9中的乘客的语音数据的情况下(步骤ST3a:否),回到步骤ST1a的处理。
另一方面,若将所有的乘客的语音数据存储于存储装置9(步骤ST3a:是),则车内通话系统1A结束处理。
图6是表示每个乘客的语音数据和车辆座位的关联处理的流程图。判定部7A从存储装置9中所存储的语音数据中选择车辆的乘客的语音数据(步骤ST1b)。
接着,判定部7A获取表示使用输入装置10输入的车内座位和乘客之间的对应关系的信息(步骤ST2b)。例如,可以是未图示的显示器显示座位选择用画面,乘客使用触摸面板等输入装置10来选择就座的座位。
判定部7A参照表示车内的座位和乘客之间的对应关系的信息,将从存储装置9中选择出的语音数据和车辆的座位进行关联(步骤ST3b)。例如,判定部7A生成对乘客的语音数据和该乘客所就座的座位进行关联而得到的参照用数据并进行保持。
之后,判定部7A确认是否针对所有的乘客将座位和语音数据进行了关联(步骤ST4b)。
在存在未将座位和语音数据进行关联的乘客的情况下(步骤ST4b:否),回到步骤ST1b,选择未处理的乘客的语音数据。
另一方面,在针对所有的乘客将座位和语音数据进行了关联的情况下(步骤ST4b:是),判定部7A结束处理。
另外,存储装置9中已存储有语音数据的乘客可以省略图5所示的语音数据登录处理而仅进行与图6所示的座位的关联处理。
另外,虽然示出了在执行图5所示的语音数据登录处理之后执行图6所示的关联处理的情况,但也可以交换执行顺序。例如,可以在设定座位之后,就座于该座位的乘客说话并登录语音数据。
图7是表示实施方式2所涉及的车内通话控制方法的流程图,表示了直到启动车辆的InCarCom功能为止的一系列的处理。设判定部7A中设定驾驶员作为确定乘客,并设定“驾驶座”作为判定基准。首先,判定部7A获取由麦克风4所采集到的声音数据(步骤ST1c)。
接着,判定部7A根据从存储装置9中选择出的语音数据,来推定与由麦克风4所采集到的声音数据相对应的语音数据,并推定与推定出的语音数据相对应的座位(步骤ST2c)。例如,判定部7A对由麦克风4所采集到的声音数据和从存储装置9中选择出的每个乘客的语音数据之间的频率特性和频谱进行比较,推定哪个乘客的说话语音是由麦克风4所采集得到的。接着,判定部7A通过参照对乘客的语音数据和该乘客所就座的座位进行关联而得到的上述参照用数据,从而对推定出采集到说话的乘客所就座的座位进行推定。
接着,判定部7A对是否存在确定乘客的说话进行判定(步骤ST3c)。
例如,判定部7A对在步骤ST2c中推定出的座位是否与作为判定基准的“驾驶座”相一致进行判定。在判定出没有确定乘客的说话、即推定出的座位不是驾驶座的情况下(步骤ST3c:否),车内通话控制装置2A回到步骤ST1c的处理。
在判定出存在确定乘客的说话、即推定出的座位是驾驶座的情况下(步骤ST3c:是),判定部7A向控制部8通知存在确定乘客的说话这一情况。
若控制部8从判定部7A接收上述通知,则启动InCarCom部3(步骤ST4c)。即,启动InCarCom功能。
如上所述,实施方式2所涉及的车内通话系统1A和车内通话控制装置2A中,判定部7A基于在车内采集到的声音数据、表示车内的座位和乘客的对应关系的信息以及车辆的每个乘客的语音数据,对是否存在确定乘客的说话进行判定。即使如上述那样构成,由于基于由麦克风4所采集到的声音数据来对是否存在确定乘客的说话进行判定,因此无需检测从前座的乘客向后座的乘客的对话动作。并且,能够在判定出存在以乘客为对象进行对话的确定乘客的说话时,适当地启动InCarCom功能。
尤其是,由于将车辆的座位设为判定基准,因此下述这样的每个座位的控制变得较为容易,即:即使就座于后座的乘客说话也不启动InCarCom功能,仅当就座于前座的乘客说话时启动InCarCom功能。
实施方式3.
图8是表示本发明的实施方式3所涉及的车内通话系统1B的结构的框图,对和图1中相同的结构要素标注相同的标号,并省略说明。
车内通话系统1B与实施方式1所示的系统相同,为控制InCarCom功能的系统,设置于车载导航系统等。
如图8所示,车内通话系统1B包括车内通话控制装置2B、InCarCom部3、麦克风4a、4b、放大器5以及扬声器6。
麦克风4a、4b为配置于车内的多个部位的语音输入装置,例如,配置于车辆的前座侧和后座侧。另外,实施方式3中,可以将麦克风配置于车内的多个部位,也可以针对每个座位配置麦克风。
如图8所示,车内通话控制装置2B包括判定部7B和控制部8。
判定部7B基于麦克风4a、4b的声音数据的采集定时或采集了音量最大的声音的麦克风的位置,对是否存在确定乘客的说话进行判定。
判定部7B中对应于座位来设定确定乘客。例如,在将驾驶员设为确定乘客的情况下,判定部7B中设定“驾驶座”作为判定基准。
判定部7B基于麦克风4a、4b的声音数据的采集定时或采集了音量最大的声音的麦克风的位置,推定说话的乘客的座位,比较推定出的座位和设定为判定基准的座位,从而对是否存在确定乘客的说话进行判定。
在车内有一个乘客说话的情况下,其说话语音以最短时间到达与该乘客最近的麦克风并被采集,反过来其说话语音以最长时间到达与该乘客最远的麦克风并被采集。因此,判定部7B基于与麦克风位置相对应的语音的采集定时的不同(语音的到达时间差),推定说话的乘客的座位。
在车内中有一个乘客说话的情况下,其说话语音由与该乘客最近的麦克风以最大音量进行采集,反过来其说话语音由与该乘客远离的麦克风以衰减而较小的音量进行采集。因此,判定部7B可以基于与麦克风位置相对应的采集音量的不同,推定说话的乘客的座位。
与实施方式1相同,车内通话控制装置2B中的、判定部7B和控制部8的各功能由处理电路来实现。即,车内通话控制装置2B包括用于执行上述功能的处理电路。如图2A和图2B所示,处理电路可以为专用硬件,也可以为执行存储于存储器的程序的CPU。
接着对动作进行说明。
图9是表示实施方式3所涉及的车内通话控制方法的流程图,表示了直到启动车辆的InCarCom功能为止的一系列的处理。设判定部7B中设定驾驶员作为确定乘客,并设定“驾驶座”作为判定基准。首先,判定部7B获取由麦克风4a、4b所采集到的声音数据(步骤ST1d)。
接着,判定部7B推定麦克风4a、4b的声音数据的采集定时、或麦克风4a、4b中采集了音量最大的声音数据的麦克风(步骤ST2d)。
例如,若由多个麦克风分别采集从相同乘客说出的语音,则判定部7B分别测定采集时刻。而且,判定部7B推定语音的到达时间最短的麦克风,并推定与推定出的麦克风最近的座位。
或者,若由多个麦克风分别采集从相同乘客说出的语音,则判定部7B分别测定采集到的音量。而且,判定部7B推定采集到的语音的音量最大的麦克风,并推定与推定出的麦克风最近的座位。
接着,判定部7B对是否存在确定乘客的说话进行判定(步骤ST3d)。
例如,判定部7B对在步骤ST2d中推定出的座位是否与作为判定基准的“驾驶座”相一致进行判定。在判定出没有确定乘客的说话、即推定出的座位不是驾驶座的情况下(步骤ST3d:否),车内通话控制装置2B回到步骤ST1d的处理。
在判定出存在确定乘客的说话、即推定出的座位是驾驶座的情况下(步骤ST3d:是),判定部7B向控制部8通知存在确定乘客的说话这一情况。
控制部8若从判定部7A接收上述通知,则启动InCarCom部3(步骤ST4d)。即,InCarCom功能被启动。
另外,示出了推定麦克风4a、4b的声音数据的采集定时、或麦克风4a、4b中采集了音量最大的声音数据的麦克风的情况,但也可以组合这些基准。
例如,判定部7B可以推定语音的到达时间最短的麦克风,并且推定采集到的语音的音量最大的麦克风,在这些麦克风相一致的情况下,推定出是与说话的乘客最近的麦克风。由此,能够提高推定麦克风的可靠性。
如上所述,在实施方式3所涉及的车内通话系统1B和车内通话控制装置2B中,判定部7B基于麦克风4a、4b的声音数据的采集定时或采集了音量最大的声音的麦克风的位置,对是否存在确定乘客的说话进行判定。即使如上述那样构成,由于基于由麦克风4a、4b所采集到的声音数据来对是否存在确定乘客的说话进行判定,因此无需检测从前座的乘客向后座的乘客的对话动作。并且,能够在判定出存在以乘客为对象进行对话的确定乘客的说话时,适当地启动InCarCom功能。
尤其是,将麦克风4a、4b的采集定时或音量设为判定基准,因此能够省略每个乘客的语音数据的事先登录和座位位置与乘客之间的关联。
实施方式4.
图10是表示本发明的实施方式4所涉及的车内通话系统1C的结构的框图,对与图1和图4相同的结构要素标注相同的标号,并省略说明。
车内通话系统1C与实施方式1所示的系统相同,为控制InCarCom功能的系统,设置于车载导航系统等。
如图10所示,车内通话系统1C包括车内通话控制装置2C、InCarCom部3、麦克风4a、4b、放大器5、扬声器6、存储装置9以及输入装置10。
如图10所示,车内通话控制装置2C包括判定部7C、控制部8A以及语音识别部11。
判定部7C基于由麦克风4a、4b所采集到的声音数据、表示车内座位和乘客之间的对应关系的信息以及车辆的每个乘客的语音数据,对是否存在确定乘客的说话进行判定。
判定部7C中对应于座位来设定确定乘客。例如,在将驾驶员设为确定乘客的情况下,判定部7C中设定“驾驶座”作为判定基准。
在基于语音识别部11的识别结果,判定出由确定乘客说出了启动用关键词的情况下,控制部8A启动InCarCom部3,并在判定出由确定乘客说出了停止用关键词的情况下,控制部8A停止InCarCom部3。
语音识别部11通过对由麦克风4a、4b分别采集得到的声音数据进行语音识别,从而对乘客的说话语音中是否包含有启动用关键词或停止用关键词进行确认。
与实施方式1相同,车内通话控制装置2C中的、判定部7C、控制部8A以及语音识别部11的各功能由处理电路来实现。即,车内通话控制装置2C包括用于执行上述功能的处理电路。如图2A和图2B所示,处理电路可以为专用硬件,也可以为执行存储于存储器的程序的CPU。
接着对动作进行说明。
图11是表示实施方式4所涉及的车内通话控制方法的流程图,表示了直到启动或停止车辆的InCarCom功能为止的一系列的处理。
设判定部7C中设定确定乘客,并设定其座位作为判定基准。首先,判定部7C获取由麦克风4a、4b所采集到的声音数据(步骤ST1e)。
接着,判定部7C推定从存储装置9中选择出的语音数据中与由麦克风4a、4b所采集到的声音数据相对应的语音数据,并推定与推定出的语音数据相对应的座位(步骤ST2e)。
例如,判定部7C对由麦克风4a、4b采集到的各声音数据和从存储装置9中选择出的每个乘客的语音数据之间的频率特性和频谱进行比较,推定哪个乘客的说话语音是由麦克风4a、4b所采集得到的。
接着,判定部7C通过参照对乘客的语音数据和该乘客所就座的座位进行关联而得到的参照用数据,从而对推定出采集到说话的乘客所就座的座位进行推定。
接着,判定部7C对是否存在确定乘客的说话进行判定(步骤ST3e)。
例如,判定部7C对在步骤ST2e中推定出的座位是否与判定基准的座位相一致进行判定。在判定出没有确定乘客的说话的情况下(步骤ST3e:否),车内通话控制装置2C返回步骤ST1e的处理。
若判定为存在确定乘客的说话(步骤ST3e:是),则判定部7C将判定出是确定乘客的说话语音的语音数据输出至语音识别部11。
语音识别部11对从判定部7C输入的语音数据进行语音识别(步骤ST4e)。语音识别部11的识别结果输出至控制部8A。
控制部8A基于语音识别部11的识别结果,对是否由确定乘客说出了启动用关键词、停止用关键词以及其它词的某个进行判定(步骤ST5e)。若判定为由确定乘客说出了其它词(步骤ST5e:其它),则控制部8A结束处理。
另一方面,若判定为由确定乘客说出了启动用关键词(步骤ST5e:启动用关键词),则控制部8A启动InCarCom部3(步骤ST6e)。
此处,在3列座位的车辆中,举例示出下述情况:针对每个座位设置InCarCom部3,将就座于前座(第1列座位)的乘客设为确定乘客,并准备不同的多个关键词作为启动用关键词。
在判定出前座的乘客说出了作为启动用关键词的“第2列接通”的情况下,控制部8A启动前座和第2列座位之间的InCarCom部3。由此,前座的乘客和第2列座位的乘客之间的InCarCom成为可能。
另外,在判定为前座的乘客说出了作为启动用关键词的“第3列接通”的情况下,控制部8A启动前座和第3列座位之间的InCarCom部3。由此,前座的乘客和第3列座位的乘客之间的InCarCom成为可能。
并且,在判定为前座的乘客说出了作为启动用关键词的“全部接通”的情况下,控制部8A启动前座、第2列座位和第3列座位之间的InCarCom部3。由此,前座的乘客、第2列座位的乘客和第3列座位的乘客之间的InCarCom成为可能。
另一方面,若判定为由确定乘客说出了停止用关键词(步骤ST5e:停止用关键词),则控制部8A停止InCarCom部3(步骤ST7e)。
此处,在3列座位的车辆中,举例示出下述情况:针对每个座位设置InCarCom部3,将就座于前座(第1列座位)的乘客设为确定乘客,并准备不同的多个关键词作为停止用关键词。
在判定出前座的乘客说出了作为停止用关键词的“第2列关闭”的情况下,停止前座和第2列座位之间的InCarCom部3。
另外,在判定为前座的乘客说出了作为停止用关键词的“第3列关闭”的情况下,控制部8A停止前座和第3列座位之间的InCarCom部3。
并且,在判定为前座的乘客说出了作为停止用关键词的“全部关闭”的情况下,控制部8A停止前座、第2列座位和第3列座位之间的InCarCom部3。
如上所述,实施方式4所涉及的车内通话系统1C和车内通话控制装置2C中,基于语音识别部11的识别结果,在判定出由确定乘客说出了启动用关键词的情况下控制部8A启动InCarCom部3,并在判定出由确定乘客说出了停止用关键词的情况下控制部8A停止InCarCom部3。
即使如上述那样构成,由于基于由麦克风4a、4b所采集到的声音数据来对是否存在确定乘客的说话进行判定,因此无需检测从前座的乘客向后座的乘客的对话动作。并且,能够在判定出存在以乘客为对象进行对话的确定乘客的说话时,适当地启动InCarCom功能。
尤其是,将关键词设为InCarCom功能的启动以及停止的判定基准,因此能够以与关键词相对应的各种各样的条件来启动或停止InCarCom功能,并能够提高InCarCom的便利性。
此外,本发明在其发明范围内,能够自由组合各实施方式,或者将各实施方式的任意构成要素进行变形,或者也可以在各实施方式中省略任意的构成要素。
工业上的实用性
本发明所涉及的车内通话控制装置无需检测乘客的对话动作就能够适当地启动InCarCom功能,因此能够应用于具有InCarCom功能的车载设备。
标号说明
1、1A~1C车内通话系统
2、2A~2C车内通话控制装置
3InCarCom部
4、4a、4b麦克风
5放大器
6扬声器
7、7A~7C判定部
8、8A控制部
9存储装置
10输入装置
11语音识别部
100信号处理装置
101处理电路
102CPU
103存储器

Claims (8)

1.一种车内通话控制装置,其特征在于,包括:
判定部,该判定部基于在车内采集到的声音数据,对是否存在车辆的确定乘客的说话进行判定;以及
控制部,在由所述判定部判定出存在确定乘客的说话的情况下,该控制部启动在车辆的乘客彼此之间所进行的车内通话的功能。
2.如权利要求1所述的车内通话控制装置,其特征在于,
所述判定部基于在车内采集到的声音数据、表示车内的座位和乘客之间的对应关系的信息以及车辆的每个乘客的语音数据,对是否存在确定乘客的说话进行判定。
3.如权利要求1所述的车内通话控制装置,其特征在于,
所述判定部基于设置于车内的多个麦克风各自的声音数据的采集定时,对是否存在确定乘客的说话进行判定。
4.如权利要求1所述的车内通话控制装置,其特征在于,
所述判定部基于设置于车内的多个麦克风中采集了音量最大的声音的麦克风的位置,对是否存在确定乘客的说话进行判定。
5.如权利要求1所述的车内通话控制装置,其特征在于,
包括语音识别部,该语音识别部对在车内采集到的声音数据进行语音识别,
在基于所述语音识别部的识别结果而判定出由确定乘客说出了启动用关键词的情况下,所述控制部启动车内通话的功能。
6.如权利要求1所述的车内通话控制装置,其特征在于,
包括语音识别部,该语音识别部对在车内采集到的声音数据进行语音识别,
在基于所述语音识别部的识别结果而判定出由确定乘客说出了停止用关键词的情况下,所述控制部停止车内通话的功能。
7.一种车内通话系统,其特征在于,包括:
声音输入装置,该声音输入装置设置于车内;
声音输出装置,该声音输出装置设置于车内;
判定部,该判定部基于由所述声音输入装置所采集到的声音数据,对是否存在车辆的确定乘客的说话进行判定;以及
控制部,在由所述判定部判定出存在确定乘客的说话的情况下,该控制部利用所述声音输出装置来启动在车辆的乘客彼此之间所进行的车内通话的功能。
8.一种车内通话控制方法,其特征在于,包括下述步骤:
判定部基于在车内采集到的声音数据对是否存在车辆的确定乘客的说话进行判定的步骤;以及
在由所述判定部判定出存在确定乘客的说话的情况下,控制部启动在车辆的乘客彼此之间所进行的车内通话的功能的步骤。
CN201780088241.8A 2017-03-17 2017-03-17 车内通话控制装置、车内通话系统以及车内通话控制方法 Active CN110402584B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/010951 WO2018167949A1 (ja) 2017-03-17 2017-03-17 車内通話制御装置、車内通話システムおよび車内通話制御方法

Publications (2)

Publication Number Publication Date
CN110402584A true CN110402584A (zh) 2019-11-01
CN110402584B CN110402584B (zh) 2021-11-23

Family

ID=63521908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780088241.8A Active CN110402584B (zh) 2017-03-17 2017-03-17 车内通话控制装置、车内通话系统以及车内通话控制方法

Country Status (5)

Country Link
US (1) US11094315B2 (zh)
JP (1) JP6767082B2 (zh)
CN (1) CN110402584B (zh)
DE (1) DE112017007280T5 (zh)
WO (1) WO2018167949A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111132089A (zh) * 2019-12-31 2020-05-08 东软睿驰汽车技术(沈阳)有限公司 一种车内通话接听方法及系统
WO2023056764A1 (zh) * 2021-10-08 2023-04-13 中国第一汽车股份有限公司 一种车内通话方法、装置、系统及车辆

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102017213241A1 (de) * 2017-08-01 2019-02-07 Bayerische Motoren Werke Aktiengesellschaft Verfahren, Vorrichtung, mobiles Anwendergerät, Computerprogramm zur Steuerung eines Audiosystems eines Fahrzeugs
US11167693B2 (en) * 2018-11-19 2021-11-09 Honda Motor Co., Ltd. Vehicle attention system and method
CN109391928A (zh) * 2018-11-23 2019-02-26 泰安宇祺通讯技术有限公司 一种轨道交通对讲系统及其使用方法
JP7386076B2 (ja) 2019-12-26 2023-11-24 株式会社デンソーテン 車載装置及び応答出力制御方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006094389A (ja) * 2004-09-27 2006-04-06 Yamaha Corp 車内会話補助装置
JP2007043356A (ja) * 2005-08-02 2007-02-15 Nissan Motor Co Ltd 音量自動調節装置および音量自動調節方法
JP2007208828A (ja) * 2006-02-03 2007-08-16 Denso Corp 車両用音声入出力制御装置
CN103841242A (zh) * 2012-11-27 2014-06-04 德尔福电子(苏州)有限公司 一种车内通话系统
CN105472128A (zh) * 2015-11-16 2016-04-06 广东欧珀移动通信有限公司 一种通话控制方法及装置
CN106027746A (zh) * 2016-05-23 2016-10-12 北京京东尚科信息技术有限公司 一种通话控制装置及通话控制方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090055178A1 (en) * 2007-08-23 2009-02-26 Coon Bradley S System and method of controlling personalized settings in a vehicle
DE112012006617B4 (de) 2012-06-25 2023-09-28 Hyundai Motor Company Bord-Informationsvorrichtung
JP6284331B2 (ja) 2013-10-01 2018-02-28 アルパイン株式会社 会話支援装置、会話支援方法及び会話支援プログラム
US20160039356A1 (en) * 2014-08-08 2016-02-11 General Motors Llc Establishing microphone zones in a vehicle
US9697824B1 (en) * 2015-12-30 2017-07-04 Thunder Power New Energy Vehicle Development Company Limited Voice control system with dialect recognition
US20170217445A1 (en) * 2016-01-29 2017-08-03 GM Global Technology Operations LLC System for intelligent passenger-vehicle interactions

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006094389A (ja) * 2004-09-27 2006-04-06 Yamaha Corp 車内会話補助装置
JP2007043356A (ja) * 2005-08-02 2007-02-15 Nissan Motor Co Ltd 音量自動調節装置および音量自動調節方法
JP2007208828A (ja) * 2006-02-03 2007-08-16 Denso Corp 車両用音声入出力制御装置
CN103841242A (zh) * 2012-11-27 2014-06-04 德尔福电子(苏州)有限公司 一种车内通话系统
CN105472128A (zh) * 2015-11-16 2016-04-06 广东欧珀移动通信有限公司 一种通话控制方法及装置
CN106027746A (zh) * 2016-05-23 2016-10-12 北京京东尚科信息技术有限公司 一种通话控制装置及通话控制方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111132089A (zh) * 2019-12-31 2020-05-08 东软睿驰汽车技术(沈阳)有限公司 一种车内通话接听方法及系统
WO2023056764A1 (zh) * 2021-10-08 2023-04-13 中国第一汽车股份有限公司 一种车内通话方法、装置、系统及车辆

Also Published As

Publication number Publication date
US20200043470A1 (en) 2020-02-06
JP6767082B2 (ja) 2020-10-14
CN110402584B (zh) 2021-11-23
WO2018167949A1 (ja) 2018-09-20
JPWO2018167949A1 (ja) 2019-07-18
US11094315B2 (en) 2021-08-17
DE112017007280T5 (de) 2019-11-28

Similar Documents

Publication Publication Date Title
CN110402584A (zh) 车内通话控制装置、车内通话系统以及车内通话控制方法
US11437020B2 (en) Techniques for spatially selective wake-up word recognition and related systems and methods
JP3910898B2 (ja) 指向性設定装置、指向性設定方法及び指向性設定プログラム
JP5156260B2 (ja) 雑音を除去して目的音を抽出する方法、前処理部、音声認識システムおよびプログラム
EP1933303A1 (en) Speech dialog control based on signal pre-processing
KR101669866B1 (ko) 음향 신호 조정
CN110120217B (zh) 一种音频数据处理方法及装置
US9311930B2 (en) Audio based system and method for in-vehicle context classification
CN112397065A (zh) 语音交互方法、装置、计算机可读存储介质及电子设备
US9786295B2 (en) Voice processing apparatus and voice processing method
CN111489750A (zh) 声音处理设备和声音处理方法
CN111863005A (zh) 声音信号获取方法和装置、存储介质、电子设备
JP6459330B2 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
EP3847645B1 (en) Determining a room response of a desired source in a reverberant environment
CN109243457B (zh) 基于语音的控制方法、装置、设备及存储介质
Yamada et al. In-vehicle speaker recognition using independent vector analysis
WO2020240789A1 (ja) 音声対話制御装置及び音声対話制御方法
CN109686379A (zh) 用于去除免提音频中的车辆几何结构噪声的系统和方法
WO2018173112A1 (ja) 音出力制御装置、音出力制御システムおよび音出力制御方法
KR101710695B1 (ko) 차량용 음성 인식을 위한 마이크로폰 제어 시스템 및 그 제어 방법
JP4507996B2 (ja) 運転者負荷推定装置
JP6833147B2 (ja) 情報処理装置、プログラム及び情報処理方法
CN111370014B (zh) 多流目标-语音检测和信道融合的系统和方法
JP7407665B2 (ja) 音声出力制御装置および音声出力制御プログラム
US20230252987A1 (en) Vehicle and control method thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant