CN107872567A - 移动装置和用于确定其场境的方法 - Google Patents
移动装置和用于确定其场境的方法 Download PDFInfo
- Publication number
- CN107872567A CN107872567A CN201710889274.4A CN201710889274A CN107872567A CN 107872567 A CN107872567 A CN 107872567A CN 201710889274 A CN201710889274 A CN 201710889274A CN 107872567 A CN107872567 A CN 107872567A
- Authority
- CN
- China
- Prior art keywords
- context
- mobile device
- processing unit
- audio
- motion sensor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 59
- 230000033001 locomotion Effects 0.000 claims abstract description 51
- 230000005236 sound signal Effects 0.000 claims abstract description 26
- 238000004590 computer program Methods 0.000 claims abstract description 12
- 238000010801 machine learning Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 description 18
- 238000001514 detection method Methods 0.000 description 8
- 238000012805 post-processing Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6033—Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
- H04M1/6041—Portable telephones adapted for handsfree use
- H04M1/6075—Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle
- H04M1/6083—Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle by interfacing with the vehicle audio system
- H04M1/6091—Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle by interfacing with the vehicle audio system including a wireless interface
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
- H04M1/72454—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/025—Services making use of location information using location based information parameters
- H04W4/027—Services making use of location information using location based information parameters using movement velocity, acceleration information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W48/00—Access restriction; Network selection; Access point selection
- H04W48/02—Access restriction performed under specific conditions
- H04W48/04—Access restriction performed under specific conditions based on user or terminal location or mobility data, e.g. moving direction, speed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. TPC [Transmission Power Control], power saving or power classes
- H04W52/02—Power saving arrangements
- H04W52/0209—Power saving arrangements in terminal devices
- H04W52/0251—Power saving arrangements in terminal devices using monitoring of local events, e.g. events related to user activity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
- H04W64/006—Locating users or terminals or network equipment for network management purposes, e.g. mobility management with additional information processing, e.g. for direction or speed determination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6008—Substation equipment, e.g. for use by subscribers including speech amplifiers in the transmitter circuit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6033—Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
- H04M1/6041—Portable telephones adapted for handsfree use
- H04M1/6075—Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/12—Details of telephonic subscriber devices including a sensor for measuring a physical value, e.g. temperature or motion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Environmental & Geological Engineering (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
根据本公开的第一方面,提供一种移动装置,所述移动装置包括:运动传感器,所述运动传感器被配置成检测所述移动装置的一个或多个移动;音频传感器,所述音频传感器被配置成捕获一个或多个音频信号;处理单元,所述处理单元被配置成取决于由所述运动传感器检测的至少一个移动和由所述音频传感器捕获的至少一个音频信号而确定所述移动装置的场境。根据本公开的第二方面,构想一种用于确定移动装置的场境的对应方法。根据本公开的第三方面,提供一种对应计算机程序。
Description
技术领域
本公开涉及一种移动装置。此外,本公开涉及一种用于确定移动装置的场境的方法,且涉及一种对应计算机程序。
背景技术
当今,例如智能手机的移动装置用于各种各样的环境中。在一些环境(即,场境)中,可能需要自动地配置移动装置以供特定使用。举例来说,如果移动装置进入车辆,那么可能需要使移动装置进入安全驾驶模式,在安全驾驶模式中,装置的用户界面更易于使用且装置的某些功能被停用。然而,为了自动地进入此类模式,还应自动地确定装置的场境。此外,需要以可靠的方式确定所述场境。
发明内容
根据本公开的第一方面,提供一种移动装置,所述移动装置包括:运动传感器,所述运动传感器被配置成检测所述移动装置的一个或多个移动;音频传感器,所述音频传感器被配置成捕获一个或多个音频信号;处理单元,所述处理单元被配置成取决于由所述运动传感器检测的至少一个移动和由所述音频传感器捕获的至少一个音频信号而确定所述移动装置的场境。
在一个或多个实施例中,所述处理单元被配置成仅在所述所检测的移动指示所述场境为可能的时才使用所述所捕获的音频信号来确定所述场境。
在一个或多个实施例中,所述处理单元被配置成对所述所检测的移动进行分类且使用对所述所检测的移动进行分类的结果来确定所述场境是否为可能的。
在一个或多个实施例中,所述处理单元被配置成使用机器学习算法来确定所述场境。
在一个或多个实施例中,所述处理单元被配置成使用有限状态机来对所述所检测的移动进行分类。
在一个或多个实施例中,所述运动传感器包括以下各者中的至少一个:加速计、陀螺仪、指南针、气压计、重力仪。
在一个或多个实施例中,所述场境包括声部分,且所述处理单元被配置成使用声场境分类器来确定所述场境的所述声部分。
在一个或多个实施例中,所述处理单元被配置成使用随时间而变的表决处理来确定最可能的场境。
在一个或多个实施例中,所述处理单元被配置成使用释放计时器来避免不同场境之间的快速切换。
在一个或多个实施例中,所述场境包括音频事件,且所述处理单元被配置成使用音频事件检测分类器来确定所述音频事件。
在一个或多个实施例中,所述场境为车辆或建筑物。
在一个或多个实施例中,所述处理单元被配置成彼此独立地对运动数据和音频数据进行分类,且合并所述分类结果以便确定所述场境。
根据本公开的第二方面,构想一种用于确定移动装置的场境的方法,所述方法包括:由所述移动装置的运动传感器检测所述移动装置的至少一个移动;由所述移动装置的音频传感器捕获至少一个音频信号;由所述移动装置的处理单元取决于所述所检测的移动和所述所捕获的音频信号而确定所述场境。
根据本公开的第三方面,提供一种计算机程序产品,所述计算机程序产品包括可执行指令,所述可执行指令在被执行时实行或控制所阐述的种类的方法。
在一个或多个实施例中,提供一种非暂时性机器可读介质,所述非暂时性机器可读介质包括所阐述的种类的计算机程序。
附图说明
将参考附图来更详细地描述实施例,在附图中:
图1示出移动装置的说明性实施例;
图2示出场境确定方法的说明性实施例;
图3示出处理单元的说明性实施例;
图4示出ACR分类器的说明性实施例;
图5示出处理单元的另一说明性实施例。
具体实施方式
如上文所提及,可能需要使移动装置能够自动地且以可靠的方式确定其场境。为了促进此需要,如图1所示出而提供一种移动装置,且如图2所示出而构想一种场境确定方法。
图1示出移动装置100的说明性实施例。移动装置100包含运动传感器102和音频传感器104。举例来说,音频传感器104可为麦克风。运动传感器102和音频传感器104以操作方式耦合到处理单元106。运动传感器102被配置成检测移动装置100的一个或多个移动。此外,音频传感器104被配置成捕获一个或多个音频信号。此外,处理单元106被配置成取决于移动装置100的至少一个移动和由音频传感器104捕获的至少一个音频信号而确定移动装置100的场境。以此方式,由于使用移动和音频信号两者来确定场境,故可以可靠的方式确定场境。举例来说,如果将仅使用移动,那么可能不会检测到某些场境:如果汽车未移动,但发动机正在运行,那么装置可能无法检测到装置位于汽车内。此外,运动传感器可能无法区分汽车、公共汽车、列车等等。另一方面,音乐和风可能会缩减音频信号的辨别能力。因此,通过取决于移动和音频信号两者(即,以协同的方式)确定装置的场境,可更准确地确定所述场境。
图2示出场境确定方法200的说明性实施例。具体地说,示出用于确定移动装置100的场境的方法200。方法200包括在202处由移动装置100的运动传感器102检测移动装置100的至少一个移动。此外,方法包括在204处由移动装置100的音频传感器104捕获至少一个音频信号。此外,方法200包括在206处由移动装置100的处理单元106取决于所检测的移动和所捕获的音频信号而确定所述场境。如上文所解释,由于使用移动和音频信号两者来确定场境,故可以可靠的方式确定场境。
在一个或多个实施例中,处理单元106被配置成仅在所检测的移动指示所述场境为可能的时才使用所捕获的音频信号来确定所述场境。换句话说,有条件地使用所捕获的音频信号。以此方式,可节省电力:音频传感器(例如,麦克风)相比于运动传感器常常消耗更多的能量,但其使能够更准确地确定场境。然而,运动传感器102可能够提供某一场境为很可能的指示。在所述状况下,可仅在场境为很可能的情况下才激活音频传感器104,使得所述音频传感器仅偶尔地消耗能量(例如,在应确认装置位于可能的场境内的状况下)。在实际且高效的实施方案中,可使用分类器来确定某一场境是否为可能的。在所述状况下,处理单元106被配置成对所检测的移动进行分类且使用分类的结果来确定场境是否为可能的。举例来说,处理单元106可被配置成使用活动分类器,所述活动分类器采取运动数据作为输入且输出移动装置的活动的指示(例如,进入汽车)。活动分类器可形成处理单元的整体部分,例如存储于处理单元106中且由处理单元106执行的软件实施功能。可替换的是,举例来说,活动分类器可作为存储于别处的单独功能而由处理单元106调用。
在一个或多个实施例中,处理单元被配置成使用机器学习算法来确定场境。具体地说,与完全确定性算法对比,机器学习算法可实现一般化,即,在处理单元106的训练或注册期间尚未使用的特定场境(例如,特定汽车)的确定。机器学习算法可存储于处理单元106中且由处理单元106执行。
图3示出所阐述的种类的处理单元300的说明性实施例。处理单元包括被配置成从麦克风(未示出)接收音频数据302的声场境识别(ACR)分类器。音频数据302可对应于由麦克风捕获的音频信号;音频信号可由合适构件(例如,模/数转换器)变换为可输入到ACR分类器312的音频数据302。ACR分类器312形成场境感测块310的部分。此外,处理单元300包括被配置成从运动传感器(未示出)接收运动数据304的活动分类器306。运动数据304可对应于由运动传感器检测的移动;所检测的移动可由合适构件(例如,模/数转换器)变换为可输入到活动分类器306的运动数据304。运动数据304由活动分类器306处理,其输出高级运动信息(例如,静止、行走、奔跑、车辆内)。此外,处理单元300包括被配置成分析高级运动信息(即,“活动”)的有限状态机(FSM)308。如果活动对应于“进入汽车”型式(即,行走且接着坐下),那么FSM 308可触发麦克风(未示出)的激活且其可触发ACR分类器312以对从麦克风接收的音频数据302进行分类。接着,ACR分类器312分析音频数据302且输出“汽车内”或“其它”决策。因此,在实际且高效的实施方案中,处理单元300被配置成使用FSM 308来对所检测的移动进行分类。使用FSM 308作为用于ACR分类器312的触发机构可使能够缩减不正确的肯定决策(即,错误肯定,例如装置不位于汽车中时的“汽车内”决策)以及缩减装置的功率消耗。
应注意,一般来说,处理单元300的不同组件(即,活动分类器306、FSM 308、ACR分类器312)可形成处理单元300的整体部分。举例来说,这些组件可为存储于处理单元300中且由处理单元300执行的软件实施功能。可替换的是,举例来说,这些组件可作为存储于别处的单独功能而由处理单元300调用。
在一个或多个实施例中,运动传感器包括以下各者中的至少一个:加速计、陀螺仪、指南针、气压计、重力仪。这些类型的运动传感器相比于典型的音频传感器消耗更少的功率。因此,通过使用这些类型的运动传感器,且如上文所解释而有条件地激活音频传感器,可实现显著的功率缩减,同时仍有可能以足够的准确度确定装置的场境。举例来说,在图3所示出的实施例中,所述一个或多个运动传感器可以始终接通模式而运行,而可仅在相关的区中(即,在根据活动分类器306的良好汽车环境候选者中)触发麦克风和ACR分类器312。此外,如图3所示出,在实际且高效的实施方案中,处理单元300被配置成使用ACR分类器312来确定场境的声部分。
图4示出ACR分类器312的说明性实施例。ACR分类器400包括被配置成接收音频数据302的特征提取单元400。此外,ACR分类器312包括以操作方式耦合到特征提取单元400的流分类器402。此外,ACR分类器312包括以操作方式耦合到分类器402的后处理单元404。在操作中,特征提取单元400可从脉码调制(PCM)音频数据提取有意义的特征。以此方式,举例来说,可遍及30毫秒的PCM窗而每10毫秒计算13个梅尔频率倒谱系数(MFCC)。从这些特征中,流分类器402可每3秒采取一次决策:“汽车内”或“其它”。由于3秒的特征引起3,874个系数(298×13)要被处理,故仅存储沿着这3秒的每个系数的平均数和标准差,从而产生26个系数(13×2)。特征的此压缩使能够显著地缩减计算成本。
接着,后处理单元404可对每3秒的流进行后处理。后处理单元404可考虑过去决策且其可缓和当前决策倾向。此举可能是重要的,这是因为其产生更稳定的状态(“汽车内”或“其它”),继而产生更可靠的动作辅助工具。后处理单元404可执行以下步骤。第一,可应用释放计时器:当检测应下降时,其(例如)在6秒期间保持上升。也就是说,释放计时器在检测结束之后的6秒期间由分类器402保持检测。举例来说,在分类器402在40秒期间检测“汽车内”场境的状况下,最终结果(即,后处理单元404的输出)将为46秒的检测。释放计时器延长检测持续时间,由此提供更大的稳定性,但其为盲过程,这是因为其延长了正确的肯定决策和不正确的肯定决策两者。其想法是在知晓场境将不非常快速地改变(例如,用户不能每20秒从汽车内场境转到另一场境)的先验的情况下保持分类器402的决策。第二,应用多数表决:如果当前决策A不同于最后3个决策B,那么由B代替当前决策。因此,释放计时器对“汽车内”决策加权,但如上文所提及,其为盲过程,因此其升高了良好检测率和误报警率两者。良好检测率被定义为正确的肯定决策的数目除以待检测为肯定的决策的总数目。误报警率被定义为不正确的肯定决策的数目除以待检测为否定(即,待检测为除“汽车内”以外的另一场境)的决策的总数目。多数表决将先前决策添加到当前决策,因此其使决策流平稳,但其引入高时延。通过以此次序组合两个步骤,释放计时器驱使多数表决平稳向“汽车内”决策集中。
图5示出处理单元500的另一说明性实施例。除图3中已经示出的组件之外,处理单元还包括音频事件检测(AED)分类器504和融合块506。在这个实施例中,FSM 308被配置成触发ACR分类器312和AED分类器504两者以处理音频数据302。触发ACR分类器312和AED分类器504可同时完成。举例来说,AED分类器312可检测将“进入汽车”场境(例如,开门和关门、系安全带、起动发动机)特性化的特定音频事件。因此,在一个或多个实施例中,处理单元500被配置成使用AED分类器504来确定场境中发生的音频事件。检测此种类的事件可促进装置的场境的快速确定。举例来说,可在驾驶之前的“进入汽车”时刻期间确定场境“汽车内”。
取决于麦克风(未示出)的质量和位置,可能难以检测音频事件。然而,由于分类结果(即,分类决策或“标签”)由ACR分类器312输出,故AED分类器504和活动分类器306提供补充信息,从而融合这些结果以实现更好的最终场境确定(即,较高的准确度和较低的时延)。具体地说,融合是指组合独立采取的基于音频的决策与基于运动的决策,以便实现可靠的“汽车内”预测。举例来说,可得知,当活动分类器输出肯定“汽车内”检测持续长于1分钟时且当音频分类器同时输出肯定“汽车内”决策持续几秒时,移动装置实际上位于汽车内的概率为80%。因此,通过组合基于音频的决策与基于运动的决策,可推断出移动装置位于汽车内,而基于音频的决策和基于运动的决策可能不指示这样的状况。因此,在一个或多个实施例中,处理单元500被配置成彼此独立地对运动数据(使用活动分类器306)和音频数据302(使用ACR分类器312和AED分类器504)进行分类,且合并分类结果以便确定移动装置的场境。由此,可实现快速而准确的场境确定。
上文所描述的实施例涉及检测车辆的场境,更具体地说,涉及汽车的场境。然而,技术人员将了解,本发明所公开的装置和方法并不限于检测这些特定场境。也就是说,本发明所公开的装置和方法还可在尝试检测另一场境(例如,建筑物)时被有利地使用。具体地说,这些装置和方法可有利地用于特定活动型式(例如,行走/停止、空闲/行走)结合一个或多个特定音频信号将某一环境特性化的任何情形中。举例来说,当进入办公室时,特定活动型式(行走/停止)可连同办公室音频噪声一起发生。举例来说,其它场境可涉及进入电影院、餐馆或海滩。活动分类器可仅用作音频分类器触发器(使得可节省电力)或用作音频分类器触发器和运动分类器(使得可节省电力且可采取补充决策)。
本文中所描述的系统和方法可至少部分地由一个计算机程序或多个计算机程序体现,所述计算机程序可在单个计算机系统中或跨越多个计算机系统以活动和非活动两种状态而呈多种存在形式。举例来说,它们可以作为由程序指令组成的软件程序而以源代码、目标代码、可执行码或用于执行步骤中的一些的其它格式存在。以上格式中的任一格式可以压缩或未压缩形式在计算机可读介质上实施,所述计算机可读介质可以包括存储装置和信号。
如本文中所使用,术语“移动装置”是指任何类型的便携式电子装置,包括蜂窝式电话、个人数字助理(PDA)、智能手机、平板计算机等等。此外,术语“计算机”是指包括例如通用中央处理单元(CPU)、专用处理器或微控制器等等处理器的任何电子装置。计算机能够接收数据(输入),能够对数据执行一系列预定操作,并且能够由此产生信息或信号形式的结果(输出)。取决于上下文,术语“计算机”将意指(具体地说)处理器或(更一般来说)与单个壳体或外壳内包含的相关元件的组合件相关联的处理器。
术语“处理器”或“处理单元”是指数据处理电路,所述数据处理电路可以是微处理器、协同处理器、微控制器、微型计算机、中央处理单元、现场可编程门阵列(FPGA)、可编程逻辑电路和/或基于存储于存储器中的操作性指令操控信号(模拟信号或数字信号)的任何电路。术语“存储器”是指一个存储电路或多个存储电路,例如只读存储器、随机存取存储器、易失性存储器、非易失性存储器、静态存储器、动态存储器、闪速存储器、高速缓冲存储器和/或存储数字信息的任何电路。
如本文中所使用,“计算机可读介质”或“存储介质”可以是能够包含、存储、传达、传播或传输计算机程序以供指令执行系统、设备或装置使用或结合指令执行系统、设备或装置使用的任何构件。计算机可读介质可以是(例如但不限于)电子、磁性、光学、电磁、红外线或半导体系统、设备、装置或传播介质。计算机可读介质的更特定的例子(非穷尽性列表)可以包括以下各项:具有一根或多根导线的电连接、便携式计算机磁盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)、光纤、便携式光盘只读存储器(CDROM)、数字多功能光盘(DVD)、蓝光光盘(BD)以及存储卡。
应注意,已经参考不同主题描述了以上实施例。具体地说,一些实施例可参考方法类的权利要求进行描述,而其它实施例可参考设备类的权利要求进行描述。然而,本领域技术人员将从上述内容了解到,除非另有说明,否则除属于一种类型主题的特征的任何组合外,与不同主题相关的特征的任何组合,具体地说方法类的权利要求的特征和设备类的权利要求的特征的组合,也视为与本文一起被公开。
此外,应注意,图式是示意性的。在不同图式中,用相同的附图标记表示类似或相同元件。此外,应注意,为了提供说明性实施例的简洁描述,可能并未描述属于技术人员的习惯做法的实施细节。应了解,在任何此类实施方案的发展中,如在任何工程或设计项目中,必须制定大量实施方案特定的决策以便实现研发者的特定目标,例如遵守系统相关的和商业相关的约束条件,这些约束条件在不同的实施方案中可以不同。此外,应了解,此类发展工作可能是复杂且耗时的,但不过是本领域的技术人员进行设计、制造和生产的例行任务。
最后,应注意,技术人员将能够在不脱离所附权利要求书的范围的情况下设计许多可替换的实施例。在权利要求书中,置于圆括号之间的任何附图标记不应解释为限制权利要求。单词“包括”不排除在权利要求中列出那些元件或步骤之外的元件或步骤的存在。在元件之前的单词“一”不排除多个此类元件的存在。权利要求书中所叙述的措施可以借助于包括若干不同元件的硬件和/或借助于适当编程设计的处理器来实施。在列出若干构件的装置权利要求中,可以由硬件中的同一个物件实施若干这些构件。单凭在彼此不同的从属权利要求中叙述某些措施这一事实,并不表示不能使用这些措施的组合来获得优势。
附图标记列表
100 移动装置
102 运动传感器
104 音频传感器
106 处理单元
200 场境确定方法
202 检测移动装置的至少一个移动
204 捕获至少一个音频信号
206 取决于移动和音频信号而确定移动装置的场境
300 处理单元
302 音频数据
304 运动数据
306 活动分类器
308 有限状态机
310 场境感测
312 声场境识别(ACR)分类器
400 特征提取
402 分类器
404 后处理
500 处理单元
502 场境感测
504 音频事件检测(AED)分类器
506 融合块
Claims (10)
1.一种移动装置,其特征在于,所述移动装置包括:
运动传感器,所述运动传感器被配置成检测所述移动装置的一个或多个移动;
音频传感器,所述音频传感器被配置成捕获一个或多个音频信号;
处理单元,所述处理单元被配置成取决于由所述运动传感器检测的至少一个移动和由所述音频传感器捕获的至少一个音频信号而确定所述移动装置的场境。
2.根据权利要求1所述的装置,其特征在于,所述处理单元被配置成仅在所述所检测的移动指示所述场境为可能的时才使用所述所捕获的音频信号来确定所述场境。
3.根据权利要求2所述的装置,其特征在于,所述处理单元被配置成对所述所检测的移动进行分类且使用对所述所检测的移动进行分类的结果来确定所述场境是否为可能的。
4.根据在前的任一项权利要求所述的装置,其特征在于,所述处理单元被配置成使用机器学习算法来确定所述场境。
5.根据在前的任一项权利要求所述的装置,其特征在于,所述处理单元被配置成使用有限状态机来对所述所检测的移动进行分类。
6.根据在前的任一项权利要求所述的装置,其特征在于,所述运动传感器包括以下各者中的至少一个:加速计、陀螺仪、指南针、气压计、重力仪。
7.根据在前的任一项权利要求所述的装置,其特征在于,所述场境包括声部分,且其中所述处理单元被配置成使用声场境分类器来确定所述场境的所述声部分。
8.一种用于确定移动装置的场境的方法,其特征在于,所述方法包括:
由所述移动装置的运动传感器检测所述移动装置的至少一个移动;
由所述移动装置的音频传感器捕获至少一个音频信号;
由所述移动装置的处理单元取决于所述所检测的移动和所述所捕获的音频信号而确定所述场境。
9.一种计算机程序,其特征在于,所述计算机程序包括可执行指令,所述可执行指令在被执行时实行或控制根据权利要求8所述的方法。
10.一种非暂时性机器可读存储介质,其特征在于,所述非暂时性机器可读存储介质包括根据权利要求9所述的计算机程序。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16306245.8 | 2016-09-28 | ||
EP16306245.8A EP3301891B1 (en) | 2016-09-28 | 2016-09-28 | Mobile device and method for determining its context |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107872567A true CN107872567A (zh) | 2018-04-03 |
CN107872567B CN107872567B (zh) | 2021-01-26 |
Family
ID=57130326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710889274.4A Expired - Fee Related CN107872567B (zh) | 2016-09-28 | 2017-09-27 | 移动装置和用于确定其场境的方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10091343B2 (zh) |
EP (1) | EP3301891B1 (zh) |
CN (1) | CN107872567B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200252500A1 (en) * | 2019-01-31 | 2020-08-06 | Marcello Giordano | Vibration probing system for providing context to context-aware mobile applications |
US20210089637A1 (en) * | 2019-09-20 | 2021-03-25 | Micron Technology, Inc. | Methods and apparatus for persistent biometric profiling |
US11983459B1 (en) * | 2020-01-13 | 2024-05-14 | Matthew MacGregor Roy | Name-recognizing mobile device for automatically adjusting earphone volume |
US20220272055A1 (en) * | 2021-02-25 | 2022-08-25 | Google Llc | Inferring assistant action(s) based on ambient sensing by assistant device(s) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140152259A1 (en) * | 2012-11-30 | 2014-06-05 | Tesla Motors, Inc. | Response to detection of an overcharge event in a series connected battery element |
CN103918247A (zh) * | 2011-09-23 | 2014-07-09 | 数字标记公司 | 基于背景环境的智能手机传感器逻辑 |
CN104011627A (zh) * | 2012-12-11 | 2014-08-27 | 英特尔公司 | 用于计算设备的情境感测 |
CN104737523A (zh) * | 2012-11-02 | 2015-06-24 | 高通股份有限公司 | 通过指派用于数据群集的情境标签来管理移动装置中的情境模型 |
US20160217670A1 (en) * | 2013-08-22 | 2016-07-28 | Doro AB | Sensor system |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020128000A1 (en) | 2001-02-06 | 2002-09-12 | Do Nascimento, Oswaldo L. | Driving detection/notification and location/situation-based services |
US7016705B2 (en) | 2002-04-17 | 2006-03-21 | Microsoft Corporation | Reducing power consumption in a networked battery-operated device using sensors |
GB2466242B (en) | 2008-12-15 | 2013-01-02 | Audio Analytic Ltd | Sound identification systems |
FI20095570L (fi) | 2009-05-22 | 2009-09-11 | Valtion Teknillinen | Kontekstin tunnistaminen mobiiliaitteissa |
US8750853B2 (en) | 2010-09-21 | 2014-06-10 | Cellepathy Ltd. | Sensor-based determination of user role, location, and/or state of one or more in-vehicle mobile devices and enforcement of usage thereof |
PL398136A1 (pl) * | 2012-02-17 | 2013-08-19 | Binartech Spólka Jawna Aksamit | Sposób wykrywania kontekstu urzadzenia przenosnego i urzadzenie przenosne z modulem wykrywania kontekstu |
US9336295B2 (en) * | 2012-12-03 | 2016-05-10 | Qualcomm Incorporated | Fusing contextual inferences semantically |
US8971968B2 (en) * | 2013-01-18 | 2015-03-03 | Dell Products, Lp | System and method for context aware usability management of human machine interfaces |
US9974045B2 (en) * | 2015-06-29 | 2018-05-15 | Google Llc | Systems and methods for contextual discovery of device functions |
US9955305B2 (en) * | 2016-06-01 | 2018-04-24 | Tile, Inc. | User intervention based on proximity between tracking devices |
-
2016
- 2016-09-28 EP EP16306245.8A patent/EP3301891B1/en not_active Not-in-force
-
2017
- 2017-09-20 US US15/710,570 patent/US10091343B2/en active Active
- 2017-09-27 CN CN201710889274.4A patent/CN107872567B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103918247A (zh) * | 2011-09-23 | 2014-07-09 | 数字标记公司 | 基于背景环境的智能手机传感器逻辑 |
CN104737523A (zh) * | 2012-11-02 | 2015-06-24 | 高通股份有限公司 | 通过指派用于数据群集的情境标签来管理移动装置中的情境模型 |
US20140152259A1 (en) * | 2012-11-30 | 2014-06-05 | Tesla Motors, Inc. | Response to detection of an overcharge event in a series connected battery element |
CN104011627A (zh) * | 2012-12-11 | 2014-08-27 | 英特尔公司 | 用于计算设备的情境感测 |
US20160217670A1 (en) * | 2013-08-22 | 2016-07-28 | Doro AB | Sensor system |
Also Published As
Publication number | Publication date |
---|---|
US10091343B2 (en) | 2018-10-02 |
US20180091638A1 (en) | 2018-03-29 |
EP3301891B1 (en) | 2019-08-28 |
EP3301891A1 (en) | 2018-04-04 |
CN107872567B (zh) | 2021-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107872567A (zh) | 移动装置和用于确定其场境的方法 | |
Dahake et al. | Speaker dependent speech emotion recognition using MFCC and Support Vector Machine | |
CN106682602B (zh) | 一种驾驶员行为识别方法及终端 | |
CN106531155B (zh) | 生成声学模型的设备和方法和用于语音识别的设备和方法 | |
KR101165537B1 (ko) | 사용자 장치 및 그의 사용자의 상황 인지 방법 | |
CN110047512B (zh) | 一种环境声音分类方法、系统及相关装置 | |
US20210191971A1 (en) | Electronic apparatus for searching related image and control method therefor | |
CN110010156A (zh) | 基于对事件子部分的序列的建模的声音事件检测 | |
US11527259B2 (en) | Learning device, voice activity detector, and method for detecting voice activity | |
CN105103221A (zh) | 对文本到语音发音问题检测的语音识别辅助评估 | |
JP6436088B2 (ja) | 音声検出装置、音声検出方法及びプログラム | |
CN108320734A (zh) | 语音信号处理方法及装置、存储介质、电子设备 | |
US9595261B2 (en) | Pattern recognition device, pattern recognition method, and computer program product | |
US9530417B2 (en) | Methods, systems, and circuits for text independent speaker recognition with automatic learning features | |
KR20200119414A (ko) | 음향 이벤트 별로 특성을 고려한 음향 이벤트 검출 방법 및 장치 | |
US10733385B2 (en) | Behavior inference model building apparatus and behavior inference model building method thereof | |
WO2020056995A1 (zh) | 语音流利度识别方法、装置、计算机设备及可读存储介质 | |
KR101667557B1 (ko) | 실시간 음원 분류 장치 및 방법 | |
JP2020184311A (ja) | 自動データ水増しにおけるトレーニング時間の短縮 | |
US20180059797A1 (en) | User command determination based on a vibration pattern | |
CN110858479B (zh) | 语音识别模型更新方法、装置、存储介质及电子设备 | |
EP3267438B1 (en) | Speaker authentication with artificial neural networks | |
US11440554B2 (en) | Method and system for determining driver emotions in conjuction with driving environment | |
Opperman et al. | Smartphones as a platform for advanced measurement and processing | |
US10529339B2 (en) | Method and system for facilitating reliable pattern detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210126 Termination date: 20210927 |