JP7317157B2 - 緊急車両のオーディオ及びビジュアル検出のポスト融合 - Google Patents

緊急車両のオーディオ及びビジュアル検出のポスト融合 Download PDF

Info

Publication number
JP7317157B2
JP7317157B2 JP2022003280A JP2022003280A JP7317157B2 JP 7317157 B2 JP7317157 B2 JP 7317157B2 JP 2022003280 A JP2022003280 A JP 2022003280A JP 2022003280 A JP2022003280 A JP 2022003280A JP 7317157 B2 JP7317157 B2 JP 7317157B2
Authority
JP
Japan
Prior art keywords
adv
emergency vehicle
neural network
probability
network model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022003280A
Other languages
English (en)
Other versions
JP2022058594A (ja
Inventor
ケチェン シュウ
ホンイ スン
チー ルオ
ウェイ ワン
ゼジュン リン
ウェズレー レイノルズ
フェン リュウ
ジャンタオ フー
ジンハオ ミャオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu USA LLC
Original Assignee
Baidu USA LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu USA LLC filed Critical Baidu USA LLC
Publication of JP2022058594A publication Critical patent/JP2022058594A/ja
Application granted granted Critical
Publication of JP7317157B2 publication Critical patent/JP7317157B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/02Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to ambient conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • B60W60/0015Planning or execution of driving tasks specially adapted for safety
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • B60W60/0027Planning or execution of driving tasks using trajectory prediction for other traffic participants
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W10/00Conjoint control of vehicle sub-units of different type or different function
    • B60W10/18Conjoint control of vehicle sub-units of different type or different function including control of braking systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W10/00Conjoint control of vehicle sub-units of different type or different function
    • B60W10/20Conjoint control of vehicle sub-units of different type or different function including control of steering systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units, or advanced driver assistance systems for ensuring comfort, stability and safety or drive control systems for propelling or retarding the vehicle
    • B60W30/18Propelling the vehicle
    • B60W30/18009Propelling the vehicle related to particular drive situations
    • B60W30/18163Lane change; Overtaking manoeuvres
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/809Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data
    • G06V10/811Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data the classifiers operating on different input data, e.g. multi-modal recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • G06V20/584Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/09Arrangements for giving variable traffic instructions
    • G08G1/0962Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
    • G08G1/0965Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages responding to signals from another vehicle, e.g. emergency vehicle
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/57Mechanical or electrical details of cameras or camera modules specially adapted for being embedded in other devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/90Arrangement of cameras or camera modules, e.g. multiple cameras in TV studios or sports stadiums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/181Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/08Mouthpieces; Microphones; Attachments therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0002Automatic control, details of type of controller or control system architecture
    • B60W2050/0004In digital systems, e.g. discrete-time systems involving sampling
    • B60W2050/0005Processor details or data handling, e.g. memory registers or chip architecture
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2420/00Indexing codes relating to the type of sensors based on the principle of their operation
    • B60W2420/40Photo or light sensitive means, e.g. infrared sensors
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2420/00Indexing codes relating to the type of sensors based on the principle of their operation
    • B60W2420/54Audio sensitive means, e.g. ultrasound
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2520/00Input parameters relating to overall vehicle dynamics
    • B60W2520/06Direction of travel
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/40Dynamic objects, e.g. animals, windblown objects
    • B60W2554/402Type
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/40Dynamic objects, e.g. animals, windblown objects
    • B60W2554/404Characteristics
    • B60W2554/4041Position
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/40Dynamic objects, e.g. animals, windblown objects
    • B60W2554/404Characteristics
    • B60W2554/4044Direction of movement, e.g. backwards
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S2205/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S2205/01Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations specially adapted for specific applications
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/803Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived from receiving transducers or transducer systems having differently-oriented directivity characteristics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles

Description

本開示の実施形態は一般に、自律運転車両の運転に関する。より具体的には、本開示の実施形態は、源からの情報を使用して緊急車両を検出するためのシステム及び方法に関する。
自律モード(例えば、ドライバなし)で走行する車両は、乗る人、特にドライバから運転に関わる幾つかの責任を取り除くことができる。車両は、自律モードで走行しているとき、搭載されたセンサを使用して様々な場所に進むことができるため、人の介入を最小限に抑えて、又は場合によっては乗客なしで車両は走行することができる。
緊急車両(例えば、パトカー、消防車、救急車)が道路で検出された場合、ADVは、地域の交通規則を遵守すべく適切な措置を講じる必要がある。従って、ADVの周囲環境で緊急車両を正確に検出することは、ADVが不必要に停止する必要がないように、走行中のADVにとって重要である。検出の精度を高めるための1つの手法は、複数の源からの情報(例えば、ADVのセンサからの画像及び音声)を使用して、単一の源の場合の不安定性を排除することである。このような手法では、複数の源からの情報の融合が必要である。
本開示の一態様は、自律運転車両(ADV)を運転するためにコンピュータが実行する方法であって、前記ADVの自律運転システム(ADS)で、1つ以上のオーディオ取込デバイスを使用して取り込まれたオーディオ信号のストリームと、前記ADVの周囲環境から前記ADVに取り付けられた1つ以上の画像取込デバイスを使用して取り込まれた一連の画像フレームとを受信し、前記ADSによって第1のニューラルネットワークモデルを使用して、取り込まれたオーディオ信号のストリームの少なくとも一部がサイレン音からであるという第1の確率を決定し、前記ADSによって第2のニューラルネットワークモデルを使用して、前記一連の画像フレームの少なくとも1つの画像フレームが緊急車両からであるという第2の確率を決定し、前記ADSによって前記第1の確率及び前記第2の確率に基づいて、緊急車両が前記周囲環境に存在すると決定する、方法である。
本開示の実施形態は、同様の参照符号が同様の要素を示す添付図面に限定されることなく、例として図示されている。
一実施形態によるネットワーク化されたシステムを示すブロック図である。 一実施形態による自律車両の例を示すブロック図である。 一実施形態による自律車両と共に使用される認知・計画システムの例を示すブロック図である。 一実施形態による自律車両と共に使用される認知・計画システムの例を示すブロック図である。 一実施形態による緊急車両検出システムの例を示す図である。 一実施形態による緊急車両検出システムを更に示す図である。 一実施形態における緊急車両検出システムの性能上の利点を示す図である。 一実施形態における緊急車両検出システムの性能上の利点を示す図である。 一実施形態による緊急車両を検出する処理を示すフローチャートである。
本開示の様々な実施形態及び態様を、以下の詳細な記述を参照して説明し、添付図面は様々な実施形態を示す。以下の記述及び図面は本開示の例示であり、本開示を限定していると解釈されるべきではない。本開示の様々な実施形態の完全な理解を提供すべく、多くの特定の詳細な記述を説明する。しかしながら、場合によっては、本開示の実施形態の簡潔な記述を提供すべく、周知又は従来の詳細な記述を説明しない。
本明細書における「一実施形態」又は「実施形態」の言及は、実施形態と併せて記載されている特定の特徴、構造又は特性が本開示の少なくとも1つの実施形態に含まれ得ることを意味する。本明細書の様々な箇所における「一実施形態」という表現は全て、必ずしも同一の実施形態について言及しているわけではない。
様々な実施形態によれば、自律運転車両(ADV)を運転するためのシステム、方法、及び媒体が説明されている。実施形態は、ADVに取り付けられたセンサによって取り込まれたオーディオデータ及びビジュアルデータの決定レベル融合(ポスト融合)を使用する。オーディオデータ及びビジュアルデータの特徴レベル融合と比較して、本開示の実施形態は、オーディオデータ及びビジュアルデータの厳密なタイミング同期を必要とせず、異なるデータ源の異なる特徴信頼性の問題を克服することができる。
一実施形態では、オーディオデータ及びビジュアルデータの両方を使用してADVの周囲環境における緊急車両の存在を検出するために、緊急車両検出システムが、道路を走行するADVに設けられ得る。緊急車両検出システムは、訓練されたニューラルネットワークを使用してオーディオデータから検出結果を個別に生成し、別の訓練されたニューラルネットワークを使用してビジュアルデータから別の検出結果を個別に生成することができる。緊急車両検出システムは、2つの検出結果を融合して、緊急車両の位置及び移動方向を決定することができる。ADVは、緊急車両の位置及び移動方向に応答して適切な措置を講じることができる。
一実施形態では、緊急車両検出システムは、オーディオサブモジュール及びビジュアルサブモジュールを含み、オーディオサブモジュール及びビジュアルサブモジュールは夫々、訓練されたニューラルネットワークである。オーディオサブモジュールは、ADVに取り付けられたマイクロフォンによって取り込まれたオーディオデータを入力として受け、走行中のADVの周囲環境にサイレン音が存在する可能性を表す確率とサイレン音の音源の方向とを生成することができる。ビジュアルサブモジュールは、ADVに取り付けられたカメラによって取り込まれたビジュアルデータを入力として受け、緊急車両が周囲環境に存在する可能性を表す確率と緊急車両までの距離とを生成する。
緊急車両検出システムのポスト融合部品は、オーディオサブモジュール及びビジュアルサブモジュールからの検出結果を融合して、緊急車両が周囲環境に存在するか否かを決定することができる。緊急車両が周囲環境に存在する場合、ポスト融合部品は、緊急車両の位置及び移動方向を決定することができる。一実施形態では、2つの確率のうちの少なくとも1つが閾値を超える場合、緊急車両検出システムは、緊急車両が周囲環境に存在すると決定することができる。
緊急車両検出システムは、オーディオデータ及びビジュアルデータの両方を使用して、2つのタイプのデータからの検出結果を融合し、従って、緊急車両検出システムの性能を高める。緊急車両検出システムは、ビジュアルデータのみに基づく場合、視界の悪い環境で緊急車両を正確に検出できない場合がある。緊急車両検出システムは、オーディオデータのみに基づく場合、騒々しい環境で緊急車両を正確に検出できない場合がある。両方のタイプのデータのポスト融合組み合わせにより、緊急車両検出システムは様々な環境で適切に機能することができる。
本明細書に記載の実施形態は、実行可能なコンピュータプログラム命令を記憶する非一時的な機械可読媒体を含むことができ、コンピュータプログラム命令は、1つ以上のデータ処理システムによって実行されると、1つ以上のデータ処理システムに本明細書に記載の1つ以上の方法を実行させることができる。コンピュータプログラム命令は、フラッシュメモリ又は他の形態のメモリなどの不揮発性メモリに記憶され得る。実施形態は、方法の請求項として更に実施され得る。
上記の概要は、本開示における全ての実施形態の網羅的なリストを含まない。全てのシステム及び方法は、本開示に記載されている様々な態様及び実施形態の全ての適切な組み合わせから実施され得る。
自律運転車両
図1は、本開示の一実施形態による自律運転ネットワーク構成を示すブロック図である。図1を参照すると、ネットワーク構成100は、ネットワーク102を介して1つ以上のサーバ103~104に通信可能に結合され得る自律運転車両(ADV)101を含む。示されているADVは1つであるが、複数のADVがネットワーク102を介して互いに及び/又はサーバ103~104に結合され得る。ネットワーク102は、有線又は無線の、ローカルエリアネットワーク(LAN)、インターネットなどのワイドエリアネットワーク(WAN)、セルラーネットワーク、衛星ネットワーク又はそれらの組み合わせなどの任意のタイプのネットワークであり得る。サーバ(複数可)103~104は、ウェブサーバ又はクラウドサーバ、アプリケーションサーバ、バックエンドサーバ、又はそれらの組み合わせなどの、任意の種類のサーバ又は一群のサーバであり得る。サーバ103~104は、データ分析サーバ、コンテンツサーバ、交通情報サーバ、地図・特定地点(MPOI)サーバ、又は位置サーバなどであり得る。
ADVは、ドライバからの入力がほとんど又は全くない状態で車両が環境を進む自律モードで構成され得る車両を指す。そのようなADVは、車両が走行する環境に関する情報を検出するように構成された1つ以上のセンサを有するセンサシステムを備えることができる。車両及び車両の関連する制御部(複数可)は、環境を進むために、検出された情報を使用する。ADV101は、手動モード、完全な自律モード、又は部分的な自律モードで走行することができる。
一実施形態では、ADV101は、自律運転システム(ADS)110、車両制御システム111、無線通信システム112、ユーザインタフェースシステム113、及びセンサシステム115を含むが、これらに限定されない。ADV101は、エンジン、車輪、ステアリングホイール、トランスミッションなどの通常の車両に含まれるある共通の部品を更に含み得、共通の部品は、例えば加速信号又は加速コマンド、減速信号又は減速コマンド、ステアリング信号又はステアリングコマンド、制動信号又は制動コマンドなどの様々な通信信号及び/又は通信コマンドを使用して、車両制御システム111及び/又はADS110によって制御され得る。
部品110~115は、相互接続、バス、ネットワーク、又はそれらの組み合わせを介して互いに通信可能に結合され得る。例えば、部品110~115は、コントローラエリアネットワーク(CAN)バスを介して互いに通信可能に結合され得る。CANバスは、ホストコンピュータがなくてもマイクロコントローラとデバイスとがアプリケーションで相互に通信できるように設計された車両バス規格である。CANバスは、自動車内の多重電気配線のために本来設計されたメッセージベースのプロトコルであるが、多くの他の状況でも使用される。
ここで図2を参照すると、一実施形態では、センサシステム115は、1つ以上のカメラ211、全地球測位システム(GPS)ユニット212、慣性測定ユニット(IMU)213、レーダユニット214、及び光検出・測距(LIDAR)ユニット215を含むが、これらに限定されない。GPSユニット212は、ADVの位置に関する情報を提供するように作動可能な送受信機を含み得る。IMUユニット213は、慣性加速度に基づいて、ADVの位置及び向きの変化を検知し得る。レーダユニット214は、無線信号を使用してADVのローカル環境内の物体を検知するシステムを表し得る。ある実施形態では、レーダユニット214は、物体を検知することに加えて、物体の速度及び/又は進路を更に検知し得る。LIDARユニット215は、レーザを使用して、ADVが配置されている環境内の物体を検知し得る。LIDARユニット215は、他のシステム部品の中でもとりわけ、1つ以上のレーザ源、レーザスキャナ、及び1つ以上の検出器を含むことができる。カメラ211は、ADVを取り巻く環境の画像を取り込むための1つ以上のデバイスを含み得る。カメラ211は、スチルカメラ及び/又はビデオカメラであり得る。カメラは、例えば、回転及び/又は傾斜するプラットフォームにカメラを取り付けることによって、機械的に移動可能であり得る。
センサシステム115は、ソナーセンサ、赤外線センサ、ステアリングセンサ、スロットルセンサ、制動センサ、及びオーディオセンサ(例えば、マイクロフォン)などの他のセンサを更に含み得る。オーディオセンサは、ADVを取り巻く環境からの音を取り込むように構成され得る。ステアリングセンサは、車両のステアリングホイール、車輪のステアリング角又はそれらの組み合わせを検知するように構成され得る。スロットルセンサ及び制動センサは、車両のスロットル位置及び制動位置を夫々検知する。ある状況では、スロットルセンサ及び制動センサは、一体化されたスロットル/制動センサとして一体化され得る。
一実施形態では、車両制御システム111は、ステアリングユニット201、スロットルユニット202(加速ユニットとも称される)、及び制動ユニット203を含むが、これらに限定されない。ステアリングユニット201は、車両の方向又は進路を調整するためのユニットである。スロットルユニット202は、モータ又はエンジンの速度を制御することにより、車両の速度及び加速度を制御するためのユニットである。制動ユニット203は、摩擦を与えて車両の車輪又はタイヤを減速させることによって車両を減速させるためのユニットである。図2に示す部品は、ハードウェア、ソフトウェア、又はそれらの組み合わせで実装され得ることに留意されたい。
図1に戻って参照すると、無線通信システム112は、ADV101と、デバイス、センサ、他の車両などの外部システムとの通信を可能にするためのシステムである。例えば、無線通信システム112は、1つ以上のデバイスと直接、又はネットワーク102上のサーバ103~104などの通信ネットワークを介して無線通信することができる。無線通信システム112は、任意のセルラー通信ネットワーク又は無線ローカルエリアネットワーク(WLAN)を使用して、例えばWiFiを使用して別の部品又はシステムと通信することができる。無線通信システム112は、例えば、赤外線リンク、Bluetooth(登録商標)などを使用して、デバイス(例えば、乗客のモバイルデバイス、ディスプレイデバイス、車両101内のスピーカ)と直接、通信することができる。ユーザインタフェースシステム113は、例えば、キーボード、タッチスクリーンディスプレイデバイス、マイクロフォン、及びスピーカなどを含む、車両101内に実装された周辺機器の一部であり得る。
ADV101の機能の一部又は全ては、特に自律運転モードで走行しているとき、ADS110によって制御又は管理され得る。ADS110は、センサシステム115、車両制御システム111、無線通信システム112及び/又はユーザインタフェースシステム113から情報を受信し、受信した情報を処理し、出発地点から目的地点までのルート又は経路を計画し、その後、計画・制御情報に基づいて車両101を運転するために必要なハードウェア(例えば、プロセッサ(複数可)、メモリ、記憶部)及びソフトウェア(例えば、オペレーティングシステム、計画・ルーティングプログラム)を含む。或いは、ADS110は、車両制御システム111と一体化され得る。
例えば、乗客としてのユーザは、例えばユーザインタフェースを介して、旅行の出発位置及び目的地を指定し得る。ADS110は、旅行関連のデータを取得する。例えば、ADS110は、サーバ103~104の一部であり得るMPOIサーバから位置及びルートのデータを取得し得る。位置サーバは位置サービスを提供し、MPOIサーバは、特定の位置の地図サービス及びPOIを提供する。或いは、そのような位置及びMPOIの情報は、ADS110の永続記憶装置にローカルにキャッシュされ得る。
ADV101がルートに沿って移動している間、ADS110は、交通情報システム又は交通情報サーバ(TIS)からリアルタイムの交通情報を更に取得し得る。サーバ103~104は、第三者のエンティティによって作動してもよいことに留意されたい。或いは、サーバ103~104の機能は、ADS110と一体化され得る。リアルタイムの交通情報、MPOI情報、及び位置情報、並びにセンサシステム115によって検出又は検知されたリアルタイムのローカル環境データ(例えば、障害物、物体、近くの車両)に基づいて、ADS110は、最適なルートを計画し、指定された目的地に安全且つ効率的に到着すべく、計画されたルートに従って、例えば制御システム111を介して車両101を運転することができる。
サーバ103は、様々なクライアントのためにデータ分析サービスを行うためのデータ分析システムであり得る。一実施形態では、データ分析システム103は、データコレクタ121及び機械学習エンジン122を含む。データコレクタ121は、様々な車両、つまりADV又は人間のドライバが運転する通常の車両から運転統計データ123を収集する。運転統計データ123は、発せられる運転コマンド(例えば、スロットルコマンド、制動コマンド、ステアリングコマンド)及び様々な時点で車両のセンサによって取り込まれる車両の応答(例えば、速度、加速、減速、方向)を示す情報を含む。運転統計データ123は、例えば、ルート(出発位置及び目的地位置を含む)、MPOI、道路状況、気象状況など、様々な時点の運転環境について記述する情報を更に含み得る。
運転統計データ123に基づいて、機械学習エンジン122は、様々な目的のために、一連の規則、アルゴリズム、及び/又は予測モデル124を生成又は訓練する。そのため、アルゴリズム124は、ADVにアップロードされて、自律運転中にリアルタイムで利用され得る。
図3A及び図3Bは、一実施形態によるADVと共に使用される自律運転システムの例を示すブロック図である。自律運転システム300は、ADS110、制御システム111、及びセンサシステム115を含むがこれらに限定されない、図1のADV101の一部として実装され得る。図3A及び図3Bを参照すると、ADS110は、位置特定モジュール301、認知モジュール302、予測モジュール303、決定モジュール304、計画モジュール305、制御モジュール306、及びルーティングモジュール307を含むが、これらに限定されない。
モジュール301~307の一部又は全ては、ソフトウェア、ハードウェア、又はそれらの組み合わせで実装され得る。例えば、これらのモジュールは、永続記憶装置352にインストールされ、メモリ351にロードされ、1つ以上のプロセッサ(図示せず)によって実行され得る。これらのモジュールの一部又は全ては、図2の車両制御システム111の一部又は全てのモジュールに通信可能に結合又は一体化され得ることに留意されたい。モジュール301~307の一部は、一体化されたモジュールとして共に一体化され得る。
位置特定モジュール301は、(例えば、GPSユニット212を使用して)ADV300の現在の位置を決定し、ユーザの旅行又はルートに関連するあらゆるデータを管理する。位置特定モジュール301(地図・ルートモジュールとも称される)は、ユーザの旅行又はルートに関連するあらゆるデータを管理する。ユーザは、例えばユーザインタフェースを介してログインし、旅行の出発位置及び目的地を指定し得る。位置特定モジュール301は、地図・ルートデータ311のように、ADV300の他の部品と通信して旅行関連データを取得する。例えば、位置特定モジュール301は、位置サーバ及び地図・POI(MPOI)サーバから位置及びルートのデータを取得し得る。位置サーバは位置サービスを提供し、MPOIサーバは、地図・ルートデータ311の一部としてキャッシュされ得る地図サービス及び特定の位置のPOIを提供する。ADV300がルートに沿って移動している間、位置特定モジュール301は、交通情報システム又は交通情報サーバからリアルタイムの交通情報を更に取得し得る。
センサシステム115によって提供されるセンサデータ及び位置特定モジュール301によって得られる位置特定情報に基づいて、認知モジュール302によって周囲環境の認知情報を決定する。認知情報は、一般のドライバが運転している車両の周囲でドライバが何を認知しているかを表し得る。認知情報には、例えば物体の形態で車線構成、信号機、別の車両の相対位置、歩行者、建物、横断歩道、又は他の交通関連標識(例えば、一時停止標識、道を譲れ標識)などが含まれ得る。車線構成には、例えば、車線の形状(例えば、直線又は湾曲)、車線の幅、道路内の車線数、一方通行又は対面通行の車線、合流又は分離する車線、出口車線など、1つ以上の車線について記述する情報が含まれる。
認知モジュール302は、ADVの環境内の物体及び/又は特徴を識別するために、1つ以上のカメラによって取り込まれた画像を処理して分析するためのコンピュータビジョンシステム又はコンピュータビジョンシステムの機能を含み得る。物体は、信号機、道路境界、他の車両、歩行者、及び/又は障害物などを含むことができる。コンピュータビジョンシステムは、物体認識アルゴリズム、ビデオ追跡、及び他のコンピュータビジョン技術を使用し得る。ある実施形態では、コンピュータビジョンシステムは、環境をマッピングし、物体を追跡し、物体の速度などを推定することができる。認知モジュール302は、レーダ及び/又はLIDARなどの他のセンサによって提供される他のセンサデータに基づいて物体を検出することもできる。
認知モジュール302は、オーディオデータ及びビジュアルデータの両方を使用して、ADVの周囲環境における緊急車両の存在を検出することができる緊急車両検出モジュール308を含み得る。
物体毎に、予測モジュール303は、その状況下で物体がどう振る舞うかを予測する。一連の地図・ルート情報311及び交通規則312を考慮して、ある時点での運転環境を認知する認知データに基づいて予測する。例えば、物体が反対方向の車両であり、現在の運転環境が交差点を含む場合、予測モジュール303は、車両が直進するか又は曲がる可能性があると予測する。認知データが交差点に信号機がないことを示す場合、予測モジュール303は、車両が交差点に入る前に完全に停止しなければならない可能性があると予測し得る。認知データが、車両が現在、左折専用車線又は右折専用車線にいることを示す場合、予測モジュール303は、車両が左折又は右折する可能性が高いと予測し得る。
物体毎に、決定モジュール304は、物体にどのように対応するかに関する決定を行う。例えば、特定の物体(例えば、交差するルート内の別の車両)、及び物体について記述するメタデータ(例えば、速度、方向、回転角度)について、決定モジュール304は、物体に対処する方法(例えば、追い越す、道を譲る、停止する、通過する)を決定する。決定モジュール304は、永続記憶装置352に記憶され得る交通規則又は運転規則312などの一連の規則に従ってそのような決定を行い得る。
ルーティングモジュール307は、出発地点から目的地点までの1つ以上のルート又は経路を提供するように構成される。例えば、ユーザから受けた出発位置から目的地位置への所与の旅行について、ルーティングモジュール307は、地図・ルート情報311を取得し、出発位置から目的地位置に到着するための全ての可能なルート又は経路を決定する。ルーティングモジュール307は、出発位置から目的地位置に到着するためにルーティングモジュール307が決定するルート毎に、地形図の形態で基準線を生成し得る。基準線とは、他の車両、障害物、又は交通状況などの、他からの干渉がない理想的なルート又は経路を指す。つまり、道路に他の車両、歩行者、又は障害物がない場合、ADVは、基準線に正確又は厳密に従うべきである。その後、地形図は、決定モジュール304及び/又は計画モジュール305に提供される。決定モジュール304及び/又は計画モジュール305は可能な全てのルートを調べて、位置特定モジュール301からの交通状況、認知モジュール302によって認知される運転環境、及び予測モジュール303によって予測される交通状況などの、他のモジュールによって提供される他のデータを考慮して最適なルートの1つを選択して修正する。ADVを制御するための実際の経路又はルートは、ある時点での特定の運転環境に応じて、ルーティングモジュール307によって提供される基準線に近いか又はこの基準線と異なり得る。
認知された物体毎の決定結果に基づいて、計画モジュール305は、ルーティングモジュール307によって提供された基準線を基準として使用して、ADVの経路又はルート又は軌跡、並びに運転パラメータ(例えば、距離、速度、及び/又は回転角度)を計画する。すなわち、所与の物体について、決定モジュール304は、物体に対処するためになすべきことを決定する一方、計画モジュール305は、その方法を決定する。例えば、所与の物体について、決定モジュール304は、物体を通過すると決定し得る一方、計画モジュール305は、物体の左側又は右側のどちらを通過するかを決定し得る。車両300が次の移動サイクル(例えば、次のルート/経路セグメント)でどのように移動するかについて記述する情報を含む計画・制御データを、計画モジュール305によって生成する。例えば、計画・制御データは、時速30マイル(mph)の速度で10メートル移動し、次に25mphの速度で右車線に変わるように車両300に指示し得る。
計画・制御データに基づいて、制御モジュール306は、計画・制御データによって定められた軌跡(ルート又は経路とも称される)に従って、適切なコマンド又は信号を車両制御システム111にCANバスモジュール321を介して送信することによって、ADVを制御して運転する。計画・制御データには、経路又はルートに沿って様々な時点で適切な車両設定又は運転パラメータ(例えば、スロットルコマンド、制動コマンド、ステアリングコマンド)を使用してルート又は経路の第1の地点から第2の地点まで車両を運転するのに十分な情報が含まれる。
一実施形態では、計画段階は、運転サイクルとも称される複数の計画サイクルで、例えば100ミリ秒(ms)の時間間隔毎に実行される。計画サイクル又は運転サイクル毎に、計画・制御データに基づいて1つ以上の制御コマンドが発せられる。すなわち、100ms毎に、計画モジュール305は、例えば目標位置及びADVが目標位置に到着するのに必要な時間を含む次のルートセグメント又は経路セグメントを計画する。或いは、計画モジュール305は、特定の速度、方向及び/又はステアリング角などを更に指定し得る。一実施形態では、計画モジュール305は、5秒間などの次の所定の時間、ルートセグメント又は経路セグメントを計画する。計画サイクル毎に、計画モジュール305は、前のサイクルで計画された目標位置に基づいて、現在のサイクル(例えば、次の5秒間)の目標位置を計画する。その後、制御モジュール306は、現在のサイクルの計画・制御データに基づいて、1つ以上の制御コマンド(例えば、スロットル制御コマンド、制動制御コマンド、ステアリング制御コマンド)を生成する。
決定モジュール304及び計画モジュール305は、一体化されたモジュールとして一体化され得ることに留意されたい。決定モジュール304/計画モジュール305は、ADVの運転経路を決定するためのナビゲーションシステム又はナビゲーションシステムの機能を含み得る。例えば、ナビゲーションシステムは、最終目的地に至る車道に基づく経路に沿ってADVを一般に前進させながら、認知された障害物を実質的に避ける経路に沿ってADVを移動させるための一連の速度及び方向進路を決定し得る。目的地は、ユーザインタフェースシステム113を介したユーザ入力に従って設定され得る。ナビゲーションシステムは、ADVが走行している間に運転経路を動的に更新し得る。ナビゲーションシステムは、ADVの運転経路を決定するために、GPSシステムからのデータ及び1つ以上の地図を組み込むことができる。
緊急車両検出
図4は、一実施形態による緊急車両検出システム400の例を示す。
図4に示されるように、緊急車両検出モジュール308は、オーディオサブモジュール407及びビジュアルサブモジュール409を含むことができる。オーディオサブモジュール407は、所定のアルゴリズム又はニューラルネットワークを実装するソフトウェアモジュールとすることができる。ニューラルネットワークは、多数の緊急車両から収集された(例えば、ADVの配置前の)オーディオ訓練データを使用して訓練された畳み込みニューラルネットワーク(CNN)とすることができる。訓練データは、a)緊急車両のサイレンを有すると分類されたオーディオデータ、及びb)緊急車両のサイレンを有しないと分類されたオーディオデータを含むことができる。
例えば、訓練データは、多数のオーディオサンプルを含むことができ、オーディオサンプルの一部は、緊急車両のサイレンを有すると分類される、様々な警察車両のサイレン、消防車のサイレン及び救急車のサイレンを含み、オーディオサンプルの一部は、緊急車両のサイレンを有しないと分類される、犬の吠え声、鳥のさえずり、車の警笛、音楽などの他のノイズを含むが、これらに限定されない。
一実施形態では、ADV101が道路セグメントを走行しているとき、訓練されたニューラルネットワークは、ADV101に取り付けられたオーディオセンサ403によって取り込まれたオーディオデータ(例えば、オーディオ信号)を受信し404、オーディオデータに基づいて、ADV101の周囲環境における緊急車両のサイレンのオーディオシグネチャの存在を検出することができる。オーディオセンサ403(オーディオ取込デバイスとも称される)は、ADV101の様々な位置に取り付けられた複数のマイクロフォンを含むことができる。マイクロフォンは、ADV101の周りの様々な方向の音を検知するように配置された、ADV上の固定された既知の位置を有するマイクロフォンアレイを形成することができる。オーディオサブモジュール407は、緊急車両からのサイレン音の存在の確率411、及びサイレン音の方向413を出力することができる。
一実施形態では、サイレン音の方向413は、数値及び移動方向インジケータによって表され得る。数値は、ADV101を表す線とサイレン音の音源からADV101までの線との間の角度である。ADV101を表す線は、ADV101の走行方向に沿ってADV101を通過する線とすることができる。移動方向インジケータは、サイレン音の音源がADV101に向かって移動しているか、又はADV101から離れる方向に移動しているかを示すことができる。サイレン音の音源の移動方向は、(例えば、ドップラー効果による)サイレンの振幅又は周波数の変化に基づいて決定され得る。
一実施形態では、ビジュアルサブモジュール409は、所定のアルゴリズム又はニューラルネットワークを実装するソフトウェアモジュールとすることができる。ニューラルネットワークは、多数の緊急車両から収集されたビジュアルデータを使用して訓練されたCNNとすることもできる。一実装では、CCNは、You Only Look Once(YOLO)ベースのニューラルネットワークモデルとすることができる。
ADV101が道路を走行しているとき、ビジュアルサブモジュール409は、ビジュアルセンサ405によって取り込まれたビジュアルデータを受信し406、緊急車両がADV101の周囲環境に存在するか否かを決定することができる。ビジュアルセンサ405からのビジュアルデータ及びオーディオセンサ403からのオーディオデータは、ADV101の同じ周囲環境から同時的に取り込まれる。オーディオデータは、オーディオ信号のストリームとすることができ、ビジュアルデータは、一連の画像フレームとすることができる。
ビジュアルサブモジュール409は、ADV101の周囲環境における緊急車両の存在の確率415、及び緊急車両までの距離417を出力することができる。
ビジュアルサブモジュール409内のニューラルネットワークを訓練するとき、各訓練画像フレームのバウンディングボックスのサイズ、及び画像フレームを撮影するために使用されるカメラの外因性パラメータを、画像フレームのラベル付けデータの一部として使用することができる。従って、訓練されたニューラルネットワークに緊急車両の画像フレームが提供されると、ニューラルネットワークモデルは、画像フレームのサイズ、及び画像フレームの取り込みに使用されるカメラの外因性パラメータに基づいて、緊急車両からADV101までの距離を出力することができる。
各画像フレームは、一組の内因性パラメータ及び一組の外因性パラメータと関連付けられ得る。カメラの内因性パラメータはカメラに固有である。内因性パラメータの例は、カメラの焦点距離とすることができる。他方で、カメラの外因性パラメータは、任意の所与のカメラに固有ではない。外因性パラメータには、複数のカメラ配置におけるカメラ間の相対的な回転及び並進が含まれる。
一実施形態では、緊急車両検出モジュール308は、オーディオサブモジュール407及びビジュアルサブモジュール409からの検出結果を融合するために使用されるポスト融合部品420を更に含むことができる。上に示したように、検出結果は、周囲環境におけるサイレン音の存在の確率411、サイレン音の方向413、周囲環境における緊急車両の存在の確率415、及び緊急車両からADV101までの距離417によって表される。検出結果は、ビジュアルサブモジュール409からの他の出力(図示せず)、例えば、緊急車両がADV101から離れる方向に運転しているか、又はADV101に向かって運転しているかを更に含むことができる。
ポスト融合部品420は検出結果を融合して、緊急車両がADV101の周囲環境に存在することを示す情報、緊急車両の位置及び/又は緊急車両の移動方向を出力することができる。
緊急車両検出モジュール308からの出力情報は、自律運転システム110によって使用されて、CANバスモジュール321を介して車両制御システム111に送信されるコマンド又は信号を生成することができる。コマンド又は信号に基づいて、車両制御システム111は、適切な措置を講じるためにADV101を制御することができる。
一実施形態では、緊急車両がADV101に向かって移動しているとの決定に応答して、ADV101は、現在の走行車線から出るか、又は制動して減速するか、又は道路の側方に進むことができる。緊急車両がADV101から離れる方向に移動している場合、ADV101は妨害されることなく現在の経路に沿って走行し続けることができる。
図5は、一実施形態による緊急車両検出システム400を更に示す。より具体的には、図5は、ポスト融合部品420における融合論理回路の1つの実装を示す。
一実施形態では、ポスト融合部品420は、2つの異なる情報源、すなわち、オーディオセンサ403及びビジュアルセンサ405からの検出結果を融合することができる。各情報源からの検出結果は、緊急車両がADV101の周囲環境に存在するか否かを個別に示すことができる。例えば、サイレン音の存在の確率411は、サイレン音の存在が緊急車両の存在と強く相関しているために緊急車両が存在する確率を示している。ポスト融合の処理により、オーディオサブモジュール407及びビジュアルサブモジュール409からの検出結果を単一の検出結果に組み合わせることができる。オーディオビジュアル融合は、特にオーディオ分類器の性能が低下する傾向にあってビジュアルデータが音響ノイズの影響を受けない騒々しい周囲環境で緊急車両検出モジュール308の検出性能を高めることができる。
一実施形態では、ポスト融合処理の例がポスト融合部品420に示され、ポスト融合部品420は、所定の閾値に夫々関連付けられる確率411及び確率415をチェックすること、及び、ステップ503に示されるように確率411又は確率415の少なくとも1つが関連する閾値を超えるか否かを決定することを含む複数のステップを実行することができる。確率411及び確率415のいずれも関連する閾値を超えない場合、ポスト融合部品420は、ステップ505に示されるように、緊急車両が周囲環境に存在しないと決定する。しかしながら、確率411又は確率415の少なくとも1つが夫々の閾値を超える場合、ポスト融合部品420は、ステップ507に示されるように緊急車両が周囲環境に存在すると決定する。
更に示されるように、緊急車両が存在する場合、ポスト融合部品420は、ステップ509で緊急車両からADV101までの距離417及びサイレン音の音源の方向413を融合して、ステップ511に示されるように緊急車両の位置を取得することができる。
図6A~図6Bは、一実施形態における緊急車両検出システム400の性能上の利点を示す。緊急車両検出システム400は、緊急車両の存在を検出するために複数の情報源からの情報を使用する。この複数情報源の手法は、緊急車両検出システム400が様々なタイプの環境で緊急車両の存在を正確に検出することを保証する。
図6Aは、視界が悪い周囲環境の例を示す。雨が降っている環境が示されているが、緊急車両検出システム400の特徴及び利点は、夜間などの他の視界が悪い環境に適用可能である。
図6Aに示されるように、マイクロフォンアレイ603及びカメラアレイ607が、ADV605に取り付けられている。マイクロフォンアレイ603は、ADV605が道路を走行しているとき、ADV605の周囲環境からオーディオ信号を取り込むために使用され得る。ADV605に取り付けられたマイクロフォン及びカメラは、他の方式で、例えば非アレイ方式で配置され得る。緊急車両609が周囲環境に存在し、別の車線でADV605に向かって運転している。
ADV605に取り付けられた緊急車両検出システム400は、マイクロフォンアレイ603によって取り込まれたオーディオデータ、及びカメラアレイ707によって取り込まれたビジュアルデータを受信し、オーディオデータ及びビジュアルデータの夫々から別個の検出結果を生成することができる。
視界が悪い環境は、ビジュアルデータに基づく検出精度に悪影響を及ぼすが、オーディオデータに基づく検出結果には影響を及ぼさない。例えば、緊急車両検出システム400は、サイレン音が周囲環境に存在する確率が98%であり、緊急車両が周囲環境に存在する確率が遥かに低い(67%)と決定することができる。緊急車両検出システム400のビジュアルサブモジュールは、雨の日の緊急車両609の形状を正確に検出することができないが、緊急車両検出システム400のオーディオサブモジュールは、サイレン音及び方向を依然として正確に検出することができる。結果として、ポスト融合後の全体的な検出精度は損なわれず、緊急車両検出システム400は、依然として緊急車両609を正確に検出することができる。
図6Bは、騒々しい環境を含む晴天の周囲環境の例を示す。このような騒々しい環境では、緊急車両検出システム400のオーディオサブモジュールの検出結果は悪影響を受けるが(66%)、緊急車両検出システム400のビジュアルサブモジュールの検出結果は悪影響を受けない(97%)。従って、ポスト融合の後、緊急車両検出システム400の全体的な検出精度は依然として高い。
図7は、一実施形態による緊急車両を検出する処理700を示す。処理700は、ソフトウェア、ハードウェア、又はそれらの組み合わせを含み得る処理論理回路によって実行され得る。例えば、処理700は、図4に記載されている自律運転システムによって実行され得る。
図7に示されるように、ステップ701で、処理論理回路は、オーディオ信号のストリーム及び一連の画像フレームを受信する。オーディオ信号のストリームは、ADVに取り付けられた1つ以上のオーディオ取込デバイスを使用してADVの周囲環境から取り込まれ、一連の画像フレームは、ADVに取り付けられた1つ以上の画像取込デバイスを使用して周囲環境から取り込まれる。ステップ702で、処理論理回路は、第1のニューラルネットワークモデルを使用して、取り込まれたオーディオ信号のストリームの少なくとも一部がサイレン音からであるという第1の確率を決定する。ステップ703で、処理論理回路は、第2のニューラルネットワークモデルを使用して、取り込まれた一連の画像フレームの少なくとも1つの画像フレームが緊急車両からであるという第2の確率を決定する。ステップ704で、処理論理回路は、第1の確率及び第2の確率に基づいて、緊急車両が周囲環境に存在すると決定する。
上記に示されて説明された部品の一部又は全ては、ソフトウェア、ハードウェア又はそれらの組み合わせで実装され得ることに留意されたい。例えば、そのような部品は、永続記憶装置にインストールされて記憶されたソフトウェアとして実装されることができ、そのソフトウェアは、プロセッサ(図示せず)によってメモリにロードされて実行され、本願全体で説明される処理又は演算を実行することができる。或いは、そのような部品は、集積回路(例えば、特定用途向けIC、すなわちASIC)、デジタルシグナルプロセッサ(DSP)、又はフィールドプログラマブルゲートアレイ(FPGA)などの専用ハードウェアにプログラムされた又は埋め込まれた実行可能コードとして実装されることができ、その実行可能コードは、アプリケーションから対応するドライバ及び/又はオペレーティングシステムを介してアクセスされ得る。更に、そのような部品は、1つ以上の特定の命令を介してソフトウェア部品によってアクセス可能な命令セットの一部としての、プロセッサ又はプロセッサコア内の特定のハードウェア論理回路として実装され得る。
前述の詳細な説明の一部は、コンピュータメモリ内のデータビットに対する演算のアルゴリズム及び記号表現に関して示されている。これらのアルゴリズムの記述及び表現は、データ処理の技術分野における当業者が自身の仕事内容を他の当業者に最も効率的に伝えるために使用する方法である。アルゴリズムは、本明細書では一般に、所望の結果につながるセルフコンシステントシーケンスの演算であると考えられている。演算は、物理量の物理的操作を必要とする演算である。
しかしながら、これらの用語及び同様の用語の全ては、適切な物理量に関連付けられるべきであり、これらの量に適用される単なる便利なラベルであることに留意されたい。上記の記述から明らかなように、特に別段の記載がない限り、本明細書全体を通して、以下の特許請求の範囲に記載されるような用語を使用した記述は、コンピュータシステムのレジスタ及びメモリ内の物理(電子)量として表されるデータを操作して、コンピュータシステムのメモリ又はレジスタ又は他のそのような情報記憶装置、送信装置若しくは表示装置内の物理量として同様に表される他のデータに変換するコンピュータシステム又は同様の電子コンピューティングデバイスの動作及び処理を指すことを理解されたい。
本開示の実施形態は、本明細書における演算を実行するための装置に更に関する。このようなコンピュータプログラムは、非一時的なコンピュータ可読媒体に記憶されている。機械可読媒体は、機械(例えば、コンピュータ)によって可読な形態で情報を記憶するためのあらゆるメカニズムを含む。例えば、機械可読(例えば、コンピュータ可読)媒体は、機械(例えば、コンピュータ)可読記憶媒体(例えば、読み取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスク記憶媒体、光記憶媒体、フラッシュメモリデバイス)を含む。
前述の図面に示されている処理又は方法を、ハードウェア(例えば回路、専用論理回路など)、(例えば、非一時的なコンピュータ可読媒体に埋め込まれた)ソフトウェア又はこれら両方の組み合わせを備えた処理論理回路によって行ってもよい。処理又は方法が複数の連続的な演算の点から上述されているが、記載されている演算の一部を異なる順に行ってもよいと認識されるべきである。更に、一部の演算を連続的ではなく並行して行ってもよい。
本開示の実施形態は、コンピュータ上で動作しているときに、前述の図面に示されている処理又は方法を前記コンピュータに実行させるためのコンピュータプログラムに更に関する。
本開示の実施形態は、特定のプログラミング言語を参照して記載されていない。様々なプログラミング言語を使用して、本明細書に記載されているような本開示の実施形態の教示を実施してもよいことが認識される。
前述の明細書では、本開示の実施形態は、本開示の特定の例示的な実施形態を参照して記載されている。以下の特許請求の範囲に記載されているような本開示のより広い趣旨及び範囲から逸脱することなく、様々な変更がなされ得ることは明らかである。従って、明細書及び図面は限定的な意味ではなく例示の意味で考慮されるべきである。
(関連出願への相互参照)
本願は、2021年1月14日に出願された「緊急車両のオーディオ及びビジュアル検出を融合するための機械学習モデル」と題された米国特許出願第17/149638号に関連する。本願は、その全体が参照により本明細書に組み込まれる。

Claims (18)

  1. 自律運転車両(ADV)を運転するためにコンピュータが実行する方法であって、
    前記ADVの自律運転システム(ADS)で、1つ以上のオーディオ取込デバイスを使用して取り込まれたオーディオ信号のストリームと、前記ADVの周囲環境から前記ADVに取り付けられた1つ以上の画像取込デバイスを使用して取り込まれた一連の画像フレームとを受信し、
    前記ADSによって第1のニューラルネットワークモデルを使用して、取り込まれたオーディオ信号のストリームの少なくとも一部がサイレン音からであるという第1の確率を決定し、
    前記ADSによって第2のニューラルネットワークモデルを使用して、前記一連の画像フレームの少なくとも1つの画像フレームが緊急車両からであるという第2の確率を決定し、
    前記ADSによって前記第1の確率及び前記第2の確率に基づいて、緊急車両が前記周囲環境に存在すると決定し、
    前記第1のニューラルネットワークモデルを使用して、前記ADVと前記サイレン音の音源との間の角度、及び前記音源の移動方向を決定し、
    前記第2のニューラルネットワークモデルを使用して、前記少なくとも1つの画像フレームを囲むバウンディングボックスのサイズ、及び、前記少なくとも1つの画像フレームを取り込むために使用される画像取込デバイスの1つ以上の外因性パラメータに基づいて、前記ADVと前記緊急車両との距離を決定し、前記外因性パラメータには、複数のカメラ配置におけるカメラ間の相対的な回転及び並進が含まれる、方法。
  2. 前記第1の確率が第1の閾値を超えている場合、
    前記第2の確率が第2の閾値を超えている場合、又は、
    前記第1の確率が前記第1の閾値を超え、前記第2の確率が前記第2の閾値を超えている場合、
    緊急車両が前記周囲環境に存在すると決定する、請求項に記載の方法。
  3. 緊急車両が前記周囲環境に存在するとの決定に応答して、前記サイレン音の音源と前記ADVとの間の前記角度、前記音源の前記移動方向、及び、前記緊急車両から前記ADVまでの前記距離を融合して、前記緊急車両の位置及び前記緊急車両の移動方向を決定する、請求項に記載の方法。
  4. 前記緊急車両の前記位置及び前記移動方向に基づいて、前記ADVの位置の決定に応答して、前記ADVを制御して、前記ADVを操舵して現在の運転車線から出すこと、又は前記ADVを制動して減速することのうちの少なくとも1つを行う、請求項に記載の方法。
  5. 前記第1のニューラルネットワークモデルを、複数の緊急車両から収集された緊急車両サイレンを表すオーディオデータで訓練し、前記第2のニューラルネットワークモデルを、前記オーディオデータの収集と同時的に収集されたビジュアルデータで訓練する、請求項1に記載の方法。
  6. 前記第1のニューラルネットワークモデル及び前記第2のニューラルネットワークモデルは夫々、畳み込みニューラルネットワークである、請求項1に記載の方法。
  7. 前記1つ以上のオーディオ取込デバイスは1つ以上のマイクロフォンを含み、前記1つ以上の画像取込デバイスは1つ以上のカメラを含む、請求項1に記載の方法。
  8. 命令が記憶されている非一時的な機械可読媒体であって、
    前記命令は、プロセッサによって実行されると、前記プロセッサに自律運転車両(ADV)を運転する処理を行わせ、前記処理を行わせる際に、
    前記ADVの自律運転システム(ADS)で、1つ以上のオーディオ取込デバイスを使用して取り込まれたオーディオ信号のストリームと、前記ADVの周囲環境から前記ADVに取り付けられた1つ以上の画像取込デバイスを使用して取り込まれた一連の画像フレームとを受信させ、
    前記ADSによって第1のニューラルネットワークモデルを使用して、取り込まれたオーディオ信号のストリームの少なくとも一部がサイレン音からであるという第1の確率を決定させ、
    前記ADSによって第2のニューラルネットワークモデルを使用して、前記一連の画像フレームの少なくとも1つの画像フレームが緊急車両からであるという第2の確率を決定させ、
    前記ADSによって前記第1の確率及び前記第2の確率に基づいて、緊急車両が前記周囲環境に存在すると決定させ
    前記処理を行わせる際に、
    前記第1のニューラルネットワークモデルを使用して、前記ADVと前記サイレン音の音源との間の角度、及び前記音源の移動方向を決定させ、
    前記第2のニューラルネットワークモデルを使用して、前記少なくとも1つの画像フレームを囲むバウンディングボックスのサイズ、及び、前記少なくとも1つの画像フレームを取り込むために使用される画像取込デバイスの1つ以上の外因性パラメータに基づいて、前記ADVと前記緊急車両との距離を決定させ、前記外因性パラメータには、複数のカメラ配置におけるカメラ間の相対的な回転及び並進が含まれる、機械可読媒体。
  9. 前記処理を行わせる際に、
    前記第1の確率が第1の閾値を超えている場合、
    前記第2の確率が第2の閾値を超えている場合、又は、
    前記第1の確率が前記第1の閾値を超え、前記第2の確率が前記第2の閾値を超えている場合、
    緊急車両が前記周囲環境に存在すると決定させる、請求項に記載の機械可読媒体。
  10. 前記処理を行わせる際に、
    緊急車両が前記周囲環境に存在するとの決定に応答して、前記サイレン音の前記音源と前記ADVとの間の前記角度、前記音源の前記移動方向、及び、前記緊急車両から前記ADVまでの前記距離を融合して、前記緊急車両の位置及び前記緊急車両の移動方向を決定させる、請求項に記載の機械可読媒体。
  11. 前記処理を行わせる際に、
    前記緊急車両の前記位置及び前記移動方向に基づいて、前記ADVの位置の決定に応答して、前記ADVを制御させ、前記ADVを操舵して現在の運転車線から出すこと、又は前記ADVを制動して減速することのうちの少なくとも1つを行わせる、請求項10に記載の機械可読媒体。
  12. 前記第1のニューラルネットワークモデルは、複数の緊急車両から収集された緊急車両サイレンを表すオーディオデータで訓練されており、前記第2のニューラルネットワークモデルは、前記オーディオデータの収集と同時的に収集されたビジュアルデータで訓練されている、請求項に記載の機械可読媒体。
  13. 前記第1のニューラルネットワークモデル及び前記第2のニューラルネットワークモデルは夫々、畳み込みニューラルネットワークである、請求項に記載の機械可読媒体。
  14. 前記1つ以上のオーディオ取込デバイスは1つ以上のマイクロフォンを含み、前記1つ以上の画像取込デバイスは1つ以上のカメラを含む、請求項に記載の機械可読媒体。
  15. プロセッサと、
    前記プロセッサに結合されて命令を記憶するメモリと
    備えており、
    前記命令は、前記プロセッサによって実行されると、前記プロセッサに自律運転車両(ADV)を運転する処理を行わせ、前記処理を行わせる際に、
    前記ADVの自律運転システム(ADS)で、1つ以上のオーディオ取込デバイスを使用して取り込まれたオーディオ信号のストリームと、前記ADVの周囲環境から前記ADVに取り付けられた1つ以上の画像取込デバイスを使用して取り込まれた一連の画像フレームとを受信させ、
    前記ADSによって第1のニューラルネットワークモデルを使用して、オーディオ信号の前記ストリームの少なくとも一部がサイレン音からであるという第1の確率を決定させ、
    前記ADSによって第2のニューラルネットワークモデルを使用して、前記一連の取り込まれた画像フレームの少なくとも1つの画像フレームが緊急車両からであるという第2の確率を決定させ、
    前記ADSによって前記第1の確率及び前記第2の確率に基づいて、緊急車両が前記周囲環境に存在すると決定させ
    前記処理を行わせる際に、
    前記第1のニューラルネットワークモデルを使用して、前記ADVと前記サイレン音の音源との間の角度、及び前記音源の移動方向を決定させ、
    前記第2のニューラルネットワークモデルを使用して、前記少なくとも1つの画像フレームを囲むバウンディングボックスのサイズ、及び、前記少なくとも1つの画像フレームを取り込むために使用される画像取込デバイスの1つ以上の外因性パラメータに基づいて、前記ADVと前記緊急車両との距離を決定させ、前記外因性パラメータには、複数のカメラ配置におけるカメラ間の相対的な回転及び並進が含まれる、データ処理システム。
  16. 前記処理を行わせる際に、
    前記第1の確率が第1の閾値を超えている場合、
    前記第2の確率が第2の閾値を超えている場合、又は、
    前記第1の確率が前記第1の閾値を超え、前記第2の確率が前記第2の閾値を超えている場合、
    緊急車両が前記周囲環境に存在すると決定させる、請求項15に記載のデータ処理システム。
  17. 前記処理を行わせる際に、
    緊急車両が前記周囲環境に存在するとの決定に応答して、前記サイレン音の前記音源と前記ADVとの間の前記角度、前記音源の前記移動方向、及び、前記緊急車両から前記ADVまでの前記距離を融合させて、前記緊急車両の位置及び前記緊急車両の移動方向を決定させる、請求項16に記載のデータ処理システム。
  18. コンピュータ上で動作しているときに、請求項1~のいずれか1つに記載の方法を前記コンピュータに実行させるためのコンピュータプログラム。
JP2022003280A 2021-01-14 2022-01-12 緊急車両のオーディオ及びビジュアル検出のポスト融合 Active JP7317157B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/149,638 US20220219736A1 (en) 2021-01-14 2021-01-14 Emergency vehicle audio and visual detection post fusion
US17/149,638 2021-01-14

Publications (2)

Publication Number Publication Date
JP2022058594A JP2022058594A (ja) 2022-04-12
JP7317157B2 true JP7317157B2 (ja) 2023-07-28

Family

ID=80121748

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022003280A Active JP7317157B2 (ja) 2021-01-14 2022-01-12 緊急車両のオーディオ及びビジュアル検出のポスト融合

Country Status (5)

Country Link
US (1) US20220219736A1 (ja)
EP (1) EP3971770A3 (ja)
JP (1) JP7317157B2 (ja)
KR (1) KR102607029B1 (ja)
CN (1) CN114379590B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3988417A1 (en) * 2020-10-23 2022-04-27 Tusimple, Inc. Safe driving operations of autonomous vehicles
US20230331253A1 (en) * 2022-04-19 2023-10-19 Gm Cruise Holdings Llc Systems and methods for responding to detected emergency vehicles

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190027032A1 (en) 2017-07-24 2019-01-24 Harman International Industries, Incorporated Emergency vehicle alert system
US20190049989A1 (en) 2017-11-17 2019-02-14 Intel Corporation Identification of audio signals in surrounding sounds and guidance of an autonomous vehicle in response to the same

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10074274B2 (en) * 2016-02-29 2018-09-11 Faraday & Future Inc. Emergency signal detection and response
US20180137756A1 (en) * 2016-11-17 2018-05-17 Ford Global Technologies, Llc Detecting and responding to emergency vehicles in a roadway
US10127818B2 (en) * 2017-02-11 2018-11-13 Clear Commute Ventures Pty Ltd Systems and methods for detecting and avoiding an emergency vehicle in the proximity of a substantially autonomous vehicle
US10319228B2 (en) * 2017-06-27 2019-06-11 Waymo Llc Detecting and responding to sirens
US10852736B2 (en) * 2018-04-03 2020-12-01 Baidu Usa Llc Method to track and to alert autonomous driving vehicles (ADVS) of emergency vehicles
JP7048465B2 (ja) * 2018-09-18 2022-04-05 株式会社東芝 移動体制御装置、方法及びプログラム
US11532168B2 (en) * 2019-11-15 2022-12-20 Nvidia Corporation Multi-view deep neural network for LiDAR perception
EP4204767A1 (en) * 2020-11-18 2023-07-05 Google LLC Detecting and handling driving event sounds during a navigation session

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190027032A1 (en) 2017-07-24 2019-01-24 Harman International Industries, Incorporated Emergency vehicle alert system
US20190049989A1 (en) 2017-11-17 2019-02-14 Intel Corporation Identification of audio signals in surrounding sounds and guidance of an autonomous vehicle in response to the same

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Aarajit Garg, Anchal Kumar Gupta, Divyansh Shrivastava, Yash Didwania, Prayash Jyoti Bora,Emergency Vehicle Detection by Autonomous Vehicle,International Journal of Engineering Research & Technology,Volume 08, Issue 05,IJERT,2019年05月11日,P. 190-194,https://www.ijert.org/research/emergency-vehicle-detection-by-autonomous-vehicle-IJERTV8IS050104.pdf

Also Published As

Publication number Publication date
EP3971770A2 (en) 2022-03-23
KR102607029B1 (ko) 2023-11-30
KR20220013580A (ko) 2022-02-04
EP3971770A3 (en) 2022-07-20
CN114379590A (zh) 2022-04-22
CN114379590B (zh) 2023-12-19
US20220219736A1 (en) 2022-07-14
JP2022058594A (ja) 2022-04-12

Similar Documents

Publication Publication Date Title
CN111775945B (zh) 用于自动驾驶的用于检测最接近的路径内对象的方法和装置
CN112498365A (zh) 基于置信度水平和距离、响应于障碍物的自动驾驶车辆的延迟决策
JP7340046B2 (ja) 緊急車両の音声および視覚の検出を融合した機械学習モデル
JP7317157B2 (ja) 緊急車両のオーディオ及びビジュアル検出のポスト融合
CN112793584B (zh) 紧急车辆音频检测
CN113129624A (zh) 交通堵塞情况下的最快车道确定算法
CN112230646A (zh) 设计用于单车运行的自动驾驶系统下的车辆队列实施
JP2022058593A (ja) 自律運転車両を使用した自動オーディオデータラベル付け
CN114764523A (zh) 利用自主驾驶车辆的模型训练和车载验证的系统和方法
US11613275B2 (en) Grayscale-based camera perception
US11608056B2 (en) Post collision damage reduction brake system incorporating front obstacle avoidance
CN113815640A (zh) 用于具有不同速度限制的车道的车道变更系统
CN113247017A (zh) 用于确保自动驾驶车辆的稳定绕行的双缓冲系统
KR102597917B1 (ko) 자율 주행 차량을 위한 음원 검출 및 위치 측정
US11325529B2 (en) Early brake light warning system for autonomous driving vehicle
CN113366440A (zh) 具有致动延时的动态模型
US20230202516A1 (en) Planning under prediction with confidence region for an autonomous driving vehicle
JP7229278B2 (ja) 経路計画のための二次計画法に基づき、片側に寄せる方法
US11662219B2 (en) Routing based lane guidance system under traffic cone situation
CN113815525A (zh) 用于车辆强制制动的l3级自动应急灯系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230704

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230718

R150 Certificate of patent or registration of utility model

Ref document number: 7317157

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150