CN112201244A - 一种记账方法、装置和耳机 - Google Patents

一种记账方法、装置和耳机 Download PDF

Info

Publication number
CN112201244A
CN112201244A CN202011063585.3A CN202011063585A CN112201244A CN 112201244 A CN112201244 A CN 112201244A CN 202011063585 A CN202011063585 A CN 202011063585A CN 112201244 A CN112201244 A CN 112201244A
Authority
CN
China
Prior art keywords
user
account information
voice data
headset
accounting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011063585.3A
Other languages
English (en)
Inventor
赵楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Intelligent Technology Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN202011063585.3A priority Critical patent/CN112201244A/zh
Publication of CN112201244A publication Critical patent/CN112201244A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1016Earpieces of the intra-aural type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1041Mechanical or electronic switches, or control elements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/10Details of earpieces, attachments therefor, earphones or monophonic headphones covered by H04R1/10 but not provided for in any of its subgroups

Abstract

本发明实施例提供了一种记账方法、装置和耳机,所述方法包括:获取用户语音数据;识别所述用户语音数据中的账目信息,以及记录所述账目信息。在本发明实施例中不需要用户用手操作耳机就能完成记账。在用户不便于用手操作的情况下,也能满足用户的记账需求。

Description

一种记账方法、装置和耳机
技术领域
本发明涉及电子设备技术领域,特别是涉及一种记账方法、一种记账装置和一种耳机。
背景技术
随着经济和互联网的发展,人们的理财意识也逐渐增强,有记账需求的人也越来越多,基于这一需求,市面上出现的记账软件也越来越多。
目前用户通常使用电子设备上的记账软件进行记账,但是在一些场景中,电子设备的操作仍然存在一些限制,不利于用户对电子设备进行操作。例如,在驾驶汽车、骑行、跑步等场景中,用户不方便对手持式的电子设备进行操作。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种记账方法、一种记账装置和一种耳机。
为了解决上述问题,本发明实施例公开了一种记账方法,应用于耳机,所述方法包括:
获取用户语音数据;
识别所述用户语音数据中的账目信息,以及记录所述账目信息。
可选地,所述识别所述用户语音数据中的账目信息,包括:
对所述用户语音数据进行语音识别得到识别文本;
对所述识别文本进行语句检测,得到至少一个语句;
识别所述至少一个语句对应的用户意图,并确定对应于记账意图的语句;
从对应于记账意图的语句中识别账目信息。
可选地,所述确定对应于记账意图的语句,包括:
确定所述至少一个语句对应的标签,将对应于预设标签的语句确定为对应于记账意图的语句;
和/或,将具有预设指令词的语句确定为对应于记账意图的语句。
可选地,还包括:
依据所述对应于记账意图的语句进行至少一轮对话,并获取所述至少一轮对话中的用户语音数据;
从所述至少一轮对话的用户语音数据中,识别对应于所述记账意图的语句。
可选地,所述依据所述对应于记账意图的语句进行至少一轮对话,包括:
若所述对应于记账意图的语句中,不存在对应于预设标签的语句,则依据所述对应于记账意图的语句进行至少一轮对话。
可选地,所述从对应于记账意图的语句中识别账目信息,包括:
从对应于所述预设标签的语句中,确定与所述预设标签对应的文本信息;
将与所述预设标签对应的文本信息,确定为账目信息。
可选地,所述记录所述账目信息,包括:
确定所述账目信息对应的类别,并按照所述账目信息对应的类别记录所述账目信息。
可选地,所述确定所述账目信息对应的类别,包括:
依据所述账目信息对应的预设标签,确定所述账目信息对应的类别。
可选地,还包括:
依据所述用户语音数据输出反馈信息。
可选地,所述依据所述用户语音数据输出反馈信息,包括:
依据所述用户语音数据获取反馈信息,并语音播放所述反馈信息。
可选地,还包括:
依据记录所述账目信息后获取的用户语音数据,修改已记录的账目信息。
可选地,还包括:
当满足预设条件时,输出提醒信息。
可选地,所述当满足预设条件时,输出提醒信息,包括:
当满足预设条件时,获取提醒信息,并语音播放所述提醒信息。
可选地,所述当满足预设条件时,输出提醒信息,包括:
当满足预设支出条件时,输出提醒信息。
可选地,所述当满足预设条件时,输出提醒信息,包括:
当满足预设时间条件时,输出提醒信息。
可选地,所述识别所述用户语音数据中的账目信息,包括:
在耳机本地识别所述用户语音数据中的账目信息。
可选地,所述耳机与服务器通信;所述识别所述用户语音数据中的账目信息,以及记录所述账目信息,包括:
向所述服务器发送所述用户语音数据,以使所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息。
可选地,所述耳机与耳机收纳装置通信,所述耳机收纳装置与服务器通信;所述识别所述用户语音数据中的账目信息,以及记录所述账目信息,包括:
向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置向所述服务器发送所述用户语音数据,通过所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息;或者,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,向所述服务器发送所述账目信息,通过所述服务器记录所述账目信息。
可选地,所述耳机与耳机收纳装置通信;所述识别所述用户语音数据中的账目信息,以及记录所述账目信息,包括:
向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,以及记录所述账目信息。
可选地,所述耳机具有语音助手,所述记账方法应用于所述语音助手。
可选地,在所述获取用户语音数据之前,还包括:
响应作用于耳机的预设触控区域的触控操作,所述语音助手唤醒。
可选地,在所述语音助手获取用户语音数据之前,还包括:
所述语音助手监听用户语音数据;
当检测到用户语音数据中包含预设唤醒词时,所述语音助手唤醒。
本发明实施例还公开了一种记账装置,应用于耳机,所述记账装置包括:
用户语音数据获取模块,用于获取用户语音数据;
记账模块,用于识别所述用户语音数据中的账目信息,以及记录所述账目信息。
可选地,所述记账模块包括:
识别文本获得子模块,用于对所述用户语音数据进行语音识别得到识别文本;
语句获得子模块,用于对所述识别文本进行语句检测,得到至少一个语句;
语句确定子模块,用于识别所述至少一个语句对应的用户意图,并确定对应于记账意图的语句;
账目信息识别子模块,用于从对应于记账意图的语句中识别账目信息。
可选地,所述语句确定子模块包括:
第一语句确定单元,用于确定所述至少一个语句对应的标签,将对应于预设标签的语句确定为对应于记账意图的语句;
和/或,第二语句确定单元,用于将具有预设指令词的语句确定为对应于记账意图的语句。
可选地,还包括:
对话模块,用于依据所述对应于记账意图的语句进行至少一轮对话,并获取所述至少一轮对话中的用户语音数据;
语句识别模块,用于从所述至少一轮对话的用户语音数据中,识别对应于所述记账意图的语句。
可选地,所述对话模块包括:
对话子模块,用于若所述对应于记账意图的语句中,不存在对应于预设标签的语句,则依据所述对应于记账意图的语句进行至少一轮对话。
可选地,所述账目信息识别子模块包括:
文本确定单元,用于从对应于所述预设标签的语句中,确定与所述预设标签对应的文本信息;
账目信息确定单元,用于将与所述预设标签对应的文本信息,确定为账目信息。
可选地,所述记账模块包括:
记账子模块,用于确定所述账目信息对应的类别,并按照所述账目信息对应的类别记录所述账目信息。
可选地,所述记账子模块包括:
类别确定单元,用于依据所述账目信息对应的预设标签,确定所述账目信息对应的类别。
可选地,还包括:
反馈模块,用于依据所述用户语音数据输出反馈信息。
可选地,所述反馈模块包括:
反馈信息播放子模块,用于依据所述用户语音数据获取反馈信息,并语音播放所述反馈信息。
可选地,还包括:
修改模块,用于依据记录所述账目信息后获取的用户语音数据,修改已记录的账目信息。
可选地,还包括:
提醒模块,用于当满足预设条件时,输出提醒信息。
可选地,所述提醒模块包括:
提醒信息播放子模块,用于当满足预设条件时,获取提醒信息,并语音播放所述提醒信息。
可选地,所述提醒模块包括:
第一提醒子模块,用于当满足预设支出条件时,输出提醒信息。
可选地,所述提醒模块包括:
第二提醒子模块,用于当满足预设时间条件时,输出提醒信息。
可选地,所述记账模块包括:
本地识别子模块,用于在耳机本地识别所述用户语音数据中的账目信息。
可选地,所述耳机与服务器通信;所述记账模块包括:
第一发送子模块,用于向所述服务器发送所述用户语音数据,以使所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息。
可选地,所述耳机与耳机收纳装置通信,所述耳机收纳装置与服务器通信;所述记账模块包括:
第二发送子模块,用于向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置向所述服务器发送所述用户语音数据,通过所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息;或者,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,向所述服务器发送所述账目信息,通过所述服务器记录所述账目信息。
可选地,所述耳机与耳机收纳装置通信;所述记账模块包括:
第三发送子模块,用于向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,以及记录所述账目信息。
可选地,所述耳机具有语音助手,所述语音助手部署在所述记账装置。
可选地,还包括:
第一唤醒模块,用于响应作用于耳机的预设触控区域的触控操作,唤醒所述语音助手。
可选地,还包括:
监听模块,用于监听用户语音数据;
第二唤醒模块,用于当检测到用户语音数据中包含预设唤醒词时,唤醒所述语音助手。
本发明实施例还公开了一种耳机,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户语音数据;
识别所述用户语音数据中的账目信息,以及记录所述账目信息。
可选地,所述识别所述用户语音数据中的账目信息,包括:
对所述用户语音数据进行语音识别得到识别文本;
对所述识别文本进行语句检测,得到至少一个语句;
识别所述至少一个语句对应的用户意图,并确定对应于记账意图的语句;
从对应于记账意图的语句中识别账目信息。
可选地,所述确定对应于记账意图的语句,包括:
确定所述至少一个语句对应的标签,将对应于预设标签的语句确定为对应于记账意图的语句;
和/或,将具有预设指令词的语句确定为对应于记账意图的语句。
可选地,还包含用于进行以下操作的指令:
依据所述对应于记账意图的语句进行至少一轮对话,并获取所述至少一轮对话中的用户语音数据;
从所述至少一轮对话的用户语音数据中,识别对应于所述记账意图的语句。
可选地,所述依据所述对应于记账意图的语句进行至少一轮对话,包括:
若所述对应于记账意图的语句中,不存在对应于预设标签的语句,则依据所述对应于记账意图的语句进行至少一轮对话。
可选地,所述从对应于记账意图的语句中识别账目信息,包括:
从对应于所述预设标签的语句中,确定与所述预设标签对应的文本信息;
将与所述预设标签对应的文本信息,确定为账目信息。
可选地,所述记录所述账目信息,包括:
确定所述账目信息对应的类别,并按照所述账目信息对应的类别记录所述账目信息。
可选地,所述确定所述账目信息对应的类别,包括:
依据所述账目信息对应的预设标签,确定所述账目信息对应的类别。
可选地,还包含用于进行以下操作的指令:
依据所述用户语音数据输出反馈信息。
可选地,所述依据所述用户语音数据输出反馈信息,包括:
依据所述用户语音数据获取反馈信息,并语音播放所述反馈信息。
可选地,还包含用于进行以下操作的指令:
依据记录所述账目信息后获取的用户语音数据,修改已记录的账目信息。
可选地,还包含用于进行以下操作的指令:
当满足预设条件时,输出提醒信息。
可选地,所述当满足预设条件时,输出提醒信息,包括:
当满足预设条件时,获取提醒信息,并语音播放所述提醒信息。
可选地,所述当满足预设条件时,输出提醒信息,包括:
当满足预设支出条件时,输出提醒信息。
可选地,所述当满足预设条件时,输出提醒信息,包括:
当满足预设时间条件时,输出提醒信息。
可选地,所述识别所述用户语音数据中的账目信息,包括:
在耳机本地识别所述用户语音数据中的账目信息。
可选地,所述耳机与服务器通信;所述识别所述用户语音数据中的账目信息,以及记录所述账目信息,包括:
向所述服务器发送所述用户语音数据,以使所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息。
可选地,所述耳机与耳机收纳装置通信,所述耳机收纳装置与服务器通信;所述识别所述用户语音数据中的账目信息,以及记录所述账目信息,包括:
向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置向所述服务器发送所述用户语音数据,通过所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息;或者,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,向所述服务器发送所述账目信息,通过所述服务器记录所述账目信息。
可选地,所述耳机与耳机收纳装置通信;所述识别所述用户语音数据中的账目信息,以及记录所述账目信息,包括:
向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,以及记录所述账目信息。
可选地,所述一个或者一个以上的程序包括语音助手。
可选地,还包含用于进行以下操作的指令:
响应作用于耳机的预设触控区域的触控操作,唤醒所述语音助手。
可选地,还包含用于进行以下操作的指令:
监听用户语音数据;
当检测到用户语音数据中包含预设唤醒词时,唤醒所述语音助手。本发明实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的记账方法的步骤。
本发明实施例包括以下优点:
在本发明实施例中,耳机可以获取用户语音数据,识别用户语音数据中的账目信息以及记录账目信息,不需要用户用手操作耳机就能完成记账。在用户不便于用手操作的情况下,也能满足用户的记账需求。例如,用户骑行时可以随时说出需要记账的内容,耳机可以在骑行过程中完成记账,不需要用户停下来拿出手机进行记账。
附图说明
图1是本发明实施例的一种记账方法的步骤流程图;
图2是本发明实施例的另一种记账方法的步骤流程图;
图3是本发明实施例的另一种记账方法的步骤流程图;
图4是本发明实施例的另一种记账方法的步骤流程图;
图5是本发明实施例中耳机的示意图;
图6是本发明实施例的另一种记账方法的步骤流程图;
图7是本发明实施例的另一种记账方法的步骤流程图;
图8是本发明实施例的另一种记账方法的步骤流程图;
图9是本发明实施例的另一种记账方法的步骤流程图;
图10是本发明实施例的另一种记账方法的步骤流程图;
图11是本发明实施例的另一种记账方法的步骤流程图;
图12是本发明实施例的一种记账装置的结构框图;
图13是一示例性实施例示出的一种用于记账的耳机的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明实施例的一种记账方法的步骤流程图,该方法应用于耳机,所述方法具体可以包括如下步骤:
步骤101,获取用户语音数据。
耳机是人们日常生活中经常使用的可携带电子设备,耳机可以具有播放功能,拾音功能和通信功能。用户可以使用耳机听歌或进行电话沟通。
步骤102,识别所述用户语音数据中的账目信息,以及记录所述账目信息。
在本发明实施例中,可以识别用户语音数据中的账目信息,以及记录账目信息以完成记账。
例如,用户戴着耳机说出:“帮我记个账,午饭花了35元”,耳机拾取用户语音数据,从用户语音数据识别出账目信息“午饭花了35元”并记录到账单。
在本发明实施例中,耳机可以获取用户语音数据,识别用户语音数据中的账目信息以及记录账目信息,不需要用户用手操作耳机就能完成记账。在用户不便于用手操作的情况下,也能满足用户的记账需求。例如,用户骑行时可以随时说出需要记账的内容,耳机可以在骑行过程中完成记账,不需要用户停下来拿出手机进行记账。
参照图2,示出了本发明实施例的另一种记账方法的步骤流程图,该方法应用于耳机,所述耳机具有语音助手,所述方法具体可以包括如下步骤:
步骤201,所述语音助手获取用户语音数据。
在本发明实施例中,耳机可以安装有语音助手,语音助手可以是安装在耳机中独立运行的程序,可以提供多种多样的交互功能,例如记账功能。
步骤202,所述语音助手识别所述用户语音数据中的账目信息,以及记录所述账目信息。
在本发明实施例中,语音助手可以根据用户语音数据触发记账功能,语音助手可以识别用户语音数据中的账目信息,以及记录账目信息以完成记账。
例如,用户戴着耳机说出:“帮我记个账,午饭花了35元”,耳机拾取用户语音数据,语音助手可以从用户语音数据识别出账目信息“午饭花了35元”并记录到账单。
在本发明实施例中,耳机的语音助手可以获取用户语音数据,识别用户语音数据中的账目信息以及记录账目信息,不需要用户用手操作耳机就能完成记账。在用户不便于用手操作的情况下,也能满足用户的记账需求。例如,用户骑行时可以随时说出需要记账的内容,耳机的语音助手可以在骑行过程中完成记账,不需要用户停下来拿出手机进行记账。
参照图3,示出了本发明实施例的另一种记账方法的步骤流程图,该方法应用于耳机,所述方法具体可以包括如下步骤:
步骤301,获取用户语音数据。
步骤302,对所述用户语音数据进行语音识别得到识别文本。
耳机可以具有语音识别ASR(Automatic Speech Recognition)功能。例如,耳机可以设有语音识别芯片,或者可以在耳机芯片中设置语音识别程序。
可以通过耳机的语音识别功能,在耳机本地对用户语音数据进行语音识别得到识别文本。
步骤303,对所述识别文本进行语句检测,得到至少一个语句。
对用户语音数据进行语音识别得到识别文本是纯文本,不具有标点符号。例如,用户说出的话为:“午饭花了35元,停车花了15元,购物花了200元”。对用户说出的话进行语音识别得到的识别文本为“午饭花了35元停车花了15元购物花了200元”。
如果识别文本具有较多的内容,直接对识别文本进行语义分析处理得到的分析结果,不能准确反映用户实际想要表达的意思,需要对识别文本进行语句检测得到语句,再根据语句进行语义分析。
语句检测包括断句检测和符号添加。断句检测是检测识别文本中在哪里需要断句。例如,对识别文本“午饭花了35元停车花了15元购物花了200元”进行断句检测,可以确定在“午饭花了35元”之后需要断句,可以确定在“停车花了15元”之后需要断句。符号添加是在断句的位置添加标点符号,如逗号,句号、问号等。例如在“午饭花了35元”添加逗号,在“停车花了15元”之后添加逗号。经过语句检测后,得到三个语句分别为“午饭花了35元”,“停车花了15元”,“购物花了200元”。
步骤304,识别所述至少一个语句对应的用户意图,并确定对应于记账意图的语句。
耳机可以识别语句对应的用户意图,在识别得到用户意图包括记账意图时,确定对应于记账意图的语句。在本发明实施例中,耳机支持指令连说,可以确定多个对应于记账意图的语句。
例如,用户说出:“帮我记下账,中午随便买了点吃的花了20元,不好吃,早不知道不买”。耳机根据用户语音数据,识别得到四个语句分别是“帮我记下账”,“中午随便买了点吃的花了20元”,“不好吃”,“早不知道不买”。耳机可以根据“帮我记下账”确定用户具有记账意图,确定“中午随便买了点吃的花了20元”是对应于记账意图。确定“不好吃”,“早不知道不买”不对应于记账意图。
在本发明实施例中,耳机可以使用自然语言理解NLU(Natural LanguageUnderstanding)技术对语句进行语义分析,从而得到用户意图。例如,使用预先训练得到的语义分析模型对语句进行语义分析。
利用自然语言理解技术还可以为语句生成对应的标签,根据语句对应的标签可以更准确描述用户的意图。例如,语句:“中午随便买了点吃的花了20元”,该语句相应的标签可以包括:午饭、支出、金额。
在本发明实施例中,所述确定对应于记账意图的语句的步骤可以进一步包括如下子步骤:
子步骤S11,确定所述至少一个语句对应的标签,将对应于预设标签的语句确定为对应于记账意图的语句;
预设标签可以是与记账意图相关的标签。例如,与记账意图相关的预设标签可以包括:支出、收入、金额、事项、货物等等。
例如,用户说出:“帮我记下账,今天买菜,鱼20,猪肉50,还有3块钱大葱”。耳机识别得到的语句可以包括:“帮我记下账”,“今天买菜”,“鱼20”,“猪肉50”,“还有3块钱大葱”。其中,“今天买菜”对应的标签可以是时间、事项、支出;“鱼20”对应的标签可以是货物、金额;“猪肉50”对应的标签可以是货物、金额;“还有3块钱大葱”对应的标签可以是货物、金额。
其中标签为事项、支出、金额,都是与记账意图相关的预设标签。因此,“今天买菜”,“鱼20”,“猪肉50”,“还有3块钱大葱”都是对应于记账意图的语句。
和/或,子步骤S12,将具有预设指令词的语句确定为对应于记账意图的语句。
预设指令词可以是预先配置为与记账意图相关的词,也可以是根据语义分析模型训练得到的指令词。例如,“记个账”,“记下账”等等。在上述示例中“帮我记下账”也是对应于记账意图的语句。
在本发明实施例中,所述记账方法还可以包括:
依据所述对应于记账意图的语句进行至少一轮对话,并获取所述至少一轮对话中的用户语音数据;从所述至少一轮对话的用户语音数据中,识别对应于所述记账意图的语句。
耳机可以依据对应于记账意图的语句进行至少一轮对话,在至少一轮对话中耳机可以向用户发出询问,引导用户说出更多账目信息。
在本发明实施例中,所述依据所述对应于记账意图的语句进行至少一轮对话的步骤可以包括:若所述对应于记账意图的语句中,不存在对应于预设标签的语句,则依据所述对应于记账意图的语句进行至少一轮对话。
例如,用户说出:“帮我记下账”。
耳机可以确定语句“帮我记下账”对应于记账意图,但还不存在对应于收入或支出的标签,耳机可以进一步询问:“需要记账什么内容呢?”。
用户可以说出:“花了30”。
耳机可以确定语句“花了30”对应的标签包括支出、金额,但还不存在对应于事项的标签,耳机可以进一步询问:“30块花在什么地方了?”。
用户可以说出:“花在了午饭”。
耳机可以确定“花在了午饭”对应的标签是午饭,午饭属于事项的一种分支。至此,耳机得到了对应于支出、金额、事项的标签的语句,耳机可以停止对话,采用轮对话得到的语句进行记账。
在本发明实施例中,耳机可以基于不同的记账详细程度进行记账,在一种示例中,记账详细程度可以分为三级。
第一级详细程度下,耳机需要得到对应于标签为支出或收入的语句和对应于标签为金额的语句,才可以进行记账。例如,耳机得到语句是“花了20”,该语句对应的标签为支出和金额。耳机可以根据该语句得到账目信息“支出20”,因为不知道具体事项,耳机可以将这笔账目信息纳入其他支出分类。
如果耳机得到的语句不对应有第一级详细程度所需的标签,则耳机可以进行至少一轮对话,引导用户说出能够满足需求的语句。
第二级详细程度下,耳机需要得到对应于标签为支出或收入,对应于标签为金额的语句,和对应于标签为事项的语句,才可以进行记账。例如,耳机得到的语句是“花了40”,“吃饭”,账目信息可以是“吃饭花了40”,耳机可以将这笔账纳入早午晚餐的分类。账目信息如果不包括时间信息,耳机可以默认账目信息对应的时间是当天。
如果耳机得到的语句不对应有第二级详细程度所需的标签,则耳机可以进行至少一轮对话,引导用户说出能够满足需求的语句。
第三级详细程度下,耳机需要得到对应于标签为支出或收入,对应于标签为金额的语句,对应于标签为事项的语句,以及对应于标签为时间的语句,才可以进行记账。例如,耳机得到的语句是“昨天花了40”,“吃饭”,账目信息可以是“昨天吃饭花了40”,耳机可以将这笔账纳入早午晚餐的分类,且账目信息对应的时间是昨天。
如果耳机得到的语句不对应有第三级详细程度所需的标签,则耳机可以进行至少一轮对话,引导用户说出能够满足需求的语句。
上述示例描述了耳机如何根据记账详细程度进行至少一轮对话,在实际中耳机可以根据其他需求设定进行至少一轮对话的方式,本发明实施例对此不做限定。
步骤305,从对应于记账意图的语句中识别账目信息。
例如,耳机可以从语句“随便买了点吃的花了20元”中识别出账目信息:“买吃的”,“花了”,“20”。
在本发明实施例中,所述从对应于记账意图的语句中识别账目信息步骤可以包括如下子步骤:
子步骤S21,从对应于所述预设标签的语句中,确定与所述预设标签对应的文本信息。
子步骤S22,将与所述预设标签对应的文本信息,确定为账目信息。
例如,用户说出“帮我记下账,今天买菜,鱼20,猪肉50,还有3块钱大葱”。耳机识别得到的语句可以包括:“帮我记下账”,“今天买菜”,“鱼20”,“猪肉50”,“还有3块钱大葱”。“今天买菜”对应的标签可以是时间、事项、支出;“鱼20”对应的标签可以是货物、金额;“猪肉50”对应的标签可以是货物、金额;“还有3块钱大葱”对应的标签可以是货物、金额。
从“今天买菜”确定与标签为时间,对应的文本是“今天”;确定与标签为事项,对应的文本是“买菜”;确定与标签为支出,对应的文本是“买”。根据与标签对应的文本,可以得到账目信息可以为“今天买菜”。
从“鱼20”确定与标签为货物,对应的文本是“鱼”;确定与标签为金额,对应的文本是“20”。根据与标签对应的文本,可以得到账目信息可以为“鱼20”。
从“猪肉50”确定与标签为货物,对应的文本是“猪肉”;确定与标签为金额,对应的文本是“50”。根据与标签对应的文本,可以得到账目信息可以为“猪肉50”。
从“还有3块钱大葱”确定与标签为货物,对应的文本“大葱”;确定与标签为金额,对应的文本“3”。根据与标签对应的文本,可以得到账目信息可以为“大葱3”。
步骤306,记录所述账目信息。
在本发明实施例中,耳机可以在识别出账目信息后,直接记录账目信息。也可以在识别出账目信息后,再次向用户确认账目信息是否准确,在用户确认后才记录账目信息。例如,耳机可以播放“账目信息是否为买吃的花了20”。如果用户回复确认,耳机才记录账目信息。
在本发明实施例中,所述记账方法还可以包括:依据记录所述账目信息后获取的用户语音数据,修改已记录的账目信息。
如果用户觉得之前说出的账目信息不正确,用户可以告诉耳机需要调整。例如,用户说出:“记个账,晚餐花了30”,在耳机记录相应的账目信息后,用户说出:“刚刚说错了,晚餐应该是花了40”,耳机可以根据用户说的话调整账目信息。
在本发明实施例中,所述记录所述账目信息的步骤可以包括:确定所述账目信息对应的类别,并按照所述账目信息对应的类别记录所述账目信息。
耳机可以自动对账目信息进行分类,不需要用户自己选择类别,可以减少用户记账所支出的时间。
例如,账目信息为“午饭50”,可以纳入到早午晚餐的类别。账目信息为“花了40”,由于不清楚是花在什么地方,可以纳入到其他支出的类别。
如果用户觉得耳机为账目信息确定的类别不合适,用户可以通过语音修改账目信息所纳入的分类。
例如,耳机将账目信息“游戏充值100”纳入到休闲玩乐的类别,用户可以说出:“将游戏充值记到电子游戏的类别”。如果耳机在先具有电子游戏这个类别,耳机可以将游戏充值100”直接纳入到电子游戏的类别。如果耳机在先不具有电子游戏这个类别,耳机可以设定电子游戏的类别,再将账目信息“游戏充值100”纳入到电子游戏的类别。
在本发明实施例中,用户可以直接说出账目信息所纳入的类别,耳机可以从语句中识别出用户指定的类别。例如,用户说出“搜狗听话,记个账,中午吃饭花了500元,纳入人情往来”。
在本发明实施例中,所述确定所述账目信息对应的类别的步骤可以包括:依据所述账目信息对应的预设标签,确定所述账目信息对应的类别。
例如,账目信息“午饭20”,对应的标签可以包括午饭。根据标签午饭,可以将账目信息“午饭20”纳入到早午晚餐的类别。
可以按照事项划分多个类别,部分类别还可以进一步细分。类别可以包括耳机默认设置的,也可以是用户通过语音设置的。
例如,类别可以包括两个大类:支出、收入。
支出类别下可以细分有:
食品酒水:早午晚餐、食材、水果、零食、烟酒茶饮。
衣服饰品:衣服裤子、鞋帽包包、化妆饰品。
行车交通:公共交通、打车出租、私家车费用、加油、修车、汽车保险、高速路费、违章罚款、停车费。
居家物业:日常用品、房租、水电煤气、物业管理、维修保养。
交流通讯:座机费、手机费、上网费、邮寄费。
休闲娱乐:运动健身、腐败聚会、休闲玩乐、旅游度假、宠物宝贝。
学习进修:书报杂志、培训进修、数码设备。
人情往来:送礼请客、孝敬家长、还人钱物、慈善捐助、红白喜事。
医疗保险:药品费、保健费、美容费、治疗费。
金融保险:银行手续、投资亏损、按揭还款、消费税收、利息支出、赔偿罚款、基金申购。
其他杂项:其他支出、意外丢失、烂账损失。
收入类别下可以细分有:
职业收入:工资收入、奖金收入、利息收入、加班收入、投资收入、兼职收入。
其他收入:经营所得、中奖收入、意外来钱、礼金收入、家长赠送。
在本发明实施例中,所述记账方法还可以包括:依据所述用户语音数据输出反馈信息。
耳机可以通过输出反馈信息与用户进行互动,如通过反馈信息可以告知用户已经记账。
所述依据所述用户语音数据输出反馈信息的步骤可以包括:依据所述用户语音数据获取反馈信息,并语音播放所述反馈信息。
反馈信息可以包括文本,耳机可以利用从文本到语音TTS(Text To Speech)技术,生成文本对应的语音并播放。例如,用户说出:“搜狗听话,记个账,午饭花了20元”,耳机可以播放:“中午困不困?困得话我的肩膀可以借给你,20元已入账”。
耳机还可以在反馈信息中告知用户账目信息所纳入的类别。例如,耳机可以输出:“午饭20元纳入早午晚餐类别”。
耳机还可以在反馈信息对用户进行趣味性调侃。例如,用户说出:“搜狗听话,记个账,买水果花了350”。耳机可以识别出买水果花350是明显过大的开销,耳机可以输出:“大哥,买水果花了350元,能吃完吗?”。又例如,用户说出:“搜狗听话,记个账,销售提成5万元”。耳机识别出是大笔的收入,耳机可以输出:“厉害厉害,钱会越赚越多的,销售提成5万元已入账”。
耳机还可以通过反馈信息告知用户分析性信息。例如,用户说出:“搜狗听话,买家具花了60000元”。耳机分析得到该笔支出是单项最高支出,耳机可以输出:“买家具60000元已入账,有史以来最高支出!”。又例如,用户说出:“搜狗听话,足底按摩100元”。耳机分析得到出现单日最高支出,耳机可以输出:“足底按摩100元已入账,今日累计支出600元,创造单日支出新纪录!”。
耳机还可以通过反馈信息告知用户建设性信息。例如,用户说出:“搜狗听话,记个账,晚上点了啤酒、麻小、鸭脖、薯片,一共花了230元”。耳机可以分析得到热量过高,耳机可以输出:“根据我多年的经验,这些东西的热量有点高哦,230元吃的已入账”。
在本发明实施例中,所述记账方法还可以包括:当满足预设条件时,输出提醒信息。
提醒信息可以是提醒用户记账,提醒用户支出超支,提醒用户交房租、交水电水费、还房贷、还车贷、信用卡还款等等。
所述当满足预设条件时,输出提醒信息的步骤可以包括:当满足预设条件时,获取提醒信息,并语音播放所述提醒信息。
提醒信息可以包括文本,耳机可以利用TTS技术,生成文本对应的语音并播放。例如,耳机检测到用户几天没记账,耳机可以输出;“主人,您几天没记账了”。
在一种示例中,所述当满足预设条件时,所述输出提醒信息的步骤可以包括:当满足预设支出条件时,输出提醒信息。
预设支出条件可以包括:单笔开销超过预设阈值,本周开销超过预设阈值,本月开销超过预设阈值,某个分类开销超过预设阈值。当然,预设支出条件还可以由用户根据实际需要进行设定,本发明实施例对此不做限定。其中,预设阈值可以是耳机默认设置的,也可以是耳机根据用户历史支出统计得到,还可以是用户设置的。
在另一种示例中,所述当满足预设条件时,输出提醒信息的步骤可以包括:当满足预设时间条件时,输出提醒信息。
预设时间条件可以是当前时间达到了预设时间。例如,耳机可以每天晚上8点提醒用户记账。
又例如,耳机检测到用户经常在某一个时间段记一个支出的账单,耳机可以将该时间段设置为预设时间。如果耳机检测到当天用户没有在这个时间段记账,耳机可以输出:“是不是工作忙过头了?记得要按时吃午饭,午饭后要记账哦”。
在本发明实施例中,耳机可以获取用户语音数据;对用户语音数据进行语音识别得到识别文本;对所述识别文本进行语句检测,得到至少一个语句;识别至少一个语句对应的用户意图,并确定对应于记账意图的语句;手从对应于记账意图的语句中识别账目信息,并记录账目信息。本发明实施例不需要用户用手操作耳机就能完成记账。在用户不便于用手操作的情况下,也能满足用户的记账需求。例如,用户骑行时可以随时说出需要记账的内容,耳机可以在骑行过程中完成记账,不需要用户停下来拿出手机进行记账。
参照图4,示出了本发明实施例的另一种记账方法的步骤流程图,该方法应用于耳机,耳机具有语音助手,所述方法具体可以包括如下步骤:
步骤401,所述语音助手获取用户语音数据。
在本发明实施例中,语音助手可以在唤醒后,才能获取用户语音数据。
语音助手唤醒的方式可以包括:响应作用于耳机的预设触控区域的触控操作,所述语音助手唤醒。参照图5所示为本发明实施例中耳机的示意图。预设触控区域可以设置在耳机背向听筒的一侧,用户可以通过双击预设触控区域唤醒耳机的语音助手。
语音助手唤醒的方式还可以包括:所述语音助手监听用户语音数据;当检测到用户语音数据中包含预设唤醒词时,所述语音助手唤醒。
当语音助手监听到用户说出唤醒词时,语音助手唤醒自身。例如,用户说出:“搜狗听话”,语音助手监听到用户说出了唤醒词“搜狗听话”唤醒自身。
语音助手在被唤醒后,如果在预设时间段内没有获取到用户语音数据,语音助手可以重新进入休眠。
步骤402,所述语音助手对所述用户语音数据进行语音识别得到识别文本。
在本发明实施例中,所述语音助手对所述用户语音数据进行语音识别得到识别文本的步骤可以包括:所述语音助手在耳机本地识别所述用户语音数据中的账目信息,以及记录所述账目信息。
在本发明实施例中,耳机可以具有语音识别ASR(Automatic SpeechRecognition)功能。例如,耳机可以设有语音识别芯片,或者可以在耳机芯片中设置语音识别程序。
语音助手可以通过耳机的语音识别功能对用户语音数据进行语音识别得到识别文本。
步骤403,所述语音助手对所述识别文本进行语句检测,得到至少一个语句。
对用户语音数据进行语音识别得到识别文本是纯文本,不具有标点符号。例如,用户说出的话为:“午饭花了35元,停车花了15元,购物花了200元”。对用户说出的话进行语音识别得到的识别文本为“午饭花了35元停车花了15元购物花了200元”。
如果识别文本具有较多的内容,直接对识别文本进行语义分析处理得到的分析结果,不能准确反映用户实际想要表达的意思,需要对识别文本进行语句检测得到语句,在根据语句进行语义分析。
语句检测包括断句检测和符号添加。断句检测是检测识别文本中在哪里需要断句。例如,对识别文本“午饭花了35元停车花了15元购物花了200元”进行断句检测,确定在“午饭花了35元”之后需要断句,确定在“停车花了15元”之后需要断句。符号添加是在断句的位置添加标点符号,如逗号,句号、问号等。例如在“午饭花了35元”添加逗号,在“停车花了15元”之后添加逗号。经过语句检测后,得到三个语句分别为“午饭花了35元”,“停车花了15元”,“购物花了200元”。
步骤404,所述语音助手识别所述至少一个语句对应的用户意图,并确定对应于记账意图的语句。
语音助手可以识别语句对应的用户意图,在识别得到用户意图包括记账意图时,确定对应于记账意图的语句。
在本发明实施例中,语音助手支持指令连说,可以确定多个对应于记账意图的语句。
例如,用户说出:“帮我记下账,中午随便买了点吃的花了20元,不好吃,早不知道不买”。语音助手根据用户语音数据,识别得到四个语句分别是“帮我记下账”,“中午随便买了点吃的花了20元”,“不好吃”,“早不知道不买”。语音助手可以根据“帮我记下账”确定用户具有记账意图,确定“中午随便买了点吃的花了20元”是对应于记账意图。确定“不好吃”,“早不知道不买”不对应于记账意图。
在本发明实施例中,语音助手可以使用自然语言理解NLU(Natural LanguageUnderstanding)技术对语句进行语义分析,从而得到用户意图。例如,使用预先训练得到的语义分析模型对语句进行语义分析。
利用自然语言理解技术还可以为语句生成对应的标签,根据语句对应的标签可以更准确描述用户的意图。例如,语句:“中午随便买了点吃的花了20元”,该语句相应的标签可以包括:午饭、支出、金额。
在本发明实施例中,所述确定对应于记账意图的语句的步骤可以进一步包括如下子步骤:
子步骤S31,所述语音助手确定所述至少一个语句对应的标签,将对应于预设标签的语句确定为对应于记账意图的语句;
预设标签可以是与记账意图相关的标签。例如,与记账意图相关的预设标签可以包括:支出、收入、金额、事项、货物等等。
例如,用户说出:“帮我记下账,今天买菜,鱼20,猪肉50,还有3块钱大葱”。语音助手识别得到的语句可以包括:“帮我记下账”,“今天买菜”,“鱼20”,“猪肉50”,“还有3块钱大葱”。其中,“今天买菜”对应的标签可以是时间、事项、支出;“鱼20”对应的标签可以是货物、金额;“猪肉50”对应的标签可以是货物、金额;“还有3块钱大葱”对应的标签可以是货物、金额。
其中标签为事项、支出、金额,都是与记账意图相关的预设标签。因此,“今天买菜”,“鱼20”,“猪肉50”,“还有3块钱大葱”都是对应于记账意图的语句。
和/或,子步骤S32,所述语音助手将具有预设指令词的语句确定为对应于记账意图的语句。
预设指令词可以是预先配置为与记账意图相关的词,也可以是根据语义分析模型训练得到的指令词。例如,“记个账”,“记下账”等等。在上述示例中“帮我记下账”也是对应于记账意图的语句。
在本发明实施例中,所述记账方法还可以包括:
所述语音助手依据所述对应于记账意图的语句进行至少一轮对话,并获取所述至少一轮对话中的用户语音数据;所述语音助手从所述至少一轮对话的用户语音数据中,识别对应于所述记账意图的语句。
语音助手可以依据对应于记账意图的语句进行至少一轮对话,在至少一轮对话中语音助手可以向用户发出询问,引导用户说出更多账目信息。
在本发明实施例中,所述语音助手依据所述对应于记账意图的语句进行至少一轮对话的步骤可以包括:若所述对应于记账意图的语句中,不存在对应于预设标签的语句,则所述语音助手依据所述对应于记账意图的语句进行至少一轮对话。
例如,用户说出:“帮我记下账”。
语音助手可以确定语句“帮我记下账”对应于记账意图,但还不存在对应于收入或支出的标签,语音助手可以进一步询问:“需要记账什么内容呢?”。
用户可以说出:“花了30”。
语音助手可以确定语句“花了30”对应的标签包括支出、金额,但还不存在对应于事项的标签,语音助手可以进一步询问:“30块花在什么地方了?”。
用户可以说出:“花在了午饭”。
语音助手可以确定“花在了午饭”对应的标签是午饭,午饭的标签属于事项的一种分支。至此,语音助手得到了对应于支出、金额、事项的标签的语句,语音助手可以停止至少一轮对话,采用至少一轮对话得到的语句进行记账。
在本发明实施例中,语音助手可以基于不同的记账详细程度进行记账,在一种示例中,记账详细程度可以分为三级。
第一级详细程度下,语音助手需要得到对应于标签为支出或收入的语句和对应于标签为金额的语句,才可以进行记账。例如,语音助手得到语句是“花了20”,该语句对应的标签为支出和金额。语音助手可以根据该语句得到账目信息“支出20”,因为不知道具体事项,语音助手可以将这笔账目信息纳入其他支出分类。
如果语音助手得到的语句不对应有第一级详细程度所需的标签,则语音助手可以进行至少一轮对话,引导用户说出能够满足需求的语句。
第二级详细程度下,语音助手需要得到对应于标签为支出或收入,对应于标签为金额的语句,和对应于标签为事项的语句,才可以进行记账。例如,语音助手得到的语句是“花了40”,“吃饭”,账目信息可以是“吃饭花了40”,语音助手可以将这笔账纳入早午晚餐的分类。账目信息如果不包括时间信息,语音助手可以默认账目信息对应的时间是当天。
如果语音助手得到的语句不对应有第二级详细程度所需的标签,则语音助手可以进行至少一轮对话,引导用户说出能够满足需求的语句。
第三级详细程度下,语音助手需要得到对应于标签为支出或收入,对应于标签为金额的语句,对应于标签为事项的语句,以及对应于标签为时间的语句,才可以进行记账。例如,语音助手得到的语句是“昨天花了40”,“吃饭”,账目信息可以是“昨天吃饭花了40”,语音助手可以将这笔账纳入早午晚餐的分类,且账目信息对应的时间是昨天。
如果语音助手得到的语句不对应有第三级详细程度所需的标签,则语音助手可以进行至少一轮对话,引导用户说出能够满足需求的语句。
上述示例描述了语音助手如何根据记账详细程度进行至少一轮对话,在实际中语音助手可以根据其他需求设定进行至少一轮对话的方式,本发明实施例对此不做限定。
步骤405,所述语音助手从对应于记账意图的语句中识别账目信息。
例如,语音助手可以从语句“随便买了点吃的花了20元”中识别出账目信息:“买吃的”,“花了”,“20”。
在本发明实施例中,所述语音助手从对应于记账意图的语句中识别账目信息步骤可以包括如下子步骤:
子步骤S41,所述语音助手从对应于所述预设标签的语句中,确定与所述预设标签对应的文本信息。
子步骤S42,所述语音助手将与所述预设标签对应的文本信息,确定为账目信息。
例如,用户说出“帮我记下账,今天买菜,鱼20,猪肉50,还有3块钱大葱”。语音助手识别得到的语句可以包括:“帮我记下账”,“今天买菜”,“鱼20”,“猪肉50”,“还有3块钱大葱”。“今天买菜”对应的标签可以是时间、事项、支出;“鱼20”对应的标签可以是货物、金额;“猪肉50”对应的标签可以是货物、金额;“还有3块钱大葱”对应的标签可以是货物、金额。
从“今天买菜”确定与标签为时间,对应的文本是“今天”;确定与标签为事项,对应的文本是“买菜”;确定与标签为支出,对应的文本是“买”。根据与标签对应的文本,可以得到账目信息可以为“今天买菜”。
从“鱼20”确定与标签为货物,对应的文本是“鱼”;确定与标签为金额,对应的文本是“20”。根据与标签对应的文本,可以得到账目信息可以为“鱼20”。
从“猪肉50”确定与标签为货物,对应的文本是“猪肉”;确定与标签为金额,对应的文本是“50”。根据与标签对应的文本,可以得到账目信息可以为“猪肉50”。
从“还有3块钱大葱”确定与标签为货物,对应的文本“大葱”;确定与标签为金额,对应的文本“3”。根据与标签对应的文本,可以得到账目信息可以为“大葱3”。
步骤406,所述语音助手记录所述账目信息。
在本发明实施例中,语音助手可以在识别出账目信息后,直接记录账目信息。也可以在识别出账目信息后,再次向用户确认账目信息是否准确,在用户确认后才记录账目信息。例如,语音助手可以播放“账目信息是否为买吃的花了20”。如果用户回复确认,语音助手才记录账目信息。
在本发明实施例中,所述记账方法还可以包括:所述语音助手依据记录所述账目信息后获取的用户语音数据,修改已记录的账目信息。
如果用户觉得之前说出的账目信息不正确,用户可以告诉语音助手需要调整。例如,用户说出:“记个账,晚餐花了30”,在语音助手记录相应的账目信息后,用户说出:“刚刚说错了,晚餐应该是花了40”,语音助手可以根据用户说的话调整账目信息。
在本发明实施例中,所述记录所述账目信息的步骤可以包括:所述语音助手确定所述账目信息对应的类别,并按照所述账目信息对应的类别记录所述账目信息。
语音助手可以自动对账目信息进行分类,不需要用户自己选择类别,可以减少用户记账所支出的时间。
例如,账目信息为“午饭50”,可以纳入到早午晚餐的类别。账目信息为“花了40”,由于不清楚是花在什么地方,可以纳入到其他支出的类别。
如果用户觉得语音助手为账目信息确定的类别不合适,用户可以通过语音修改账目信息所纳入的分类。
例如,语音助手将账目信息“游戏充值100”纳入到休闲玩乐的类别,用户可以说出:“将游戏充值记到电子游戏的类别”。如果语音助手在先具有电子游戏这个类别,语音助手可以将游戏充值100”直接纳入到电子游戏的类别。如果语音助手在先不具有电子游戏这个类别,语音助手可以设定电子游戏的类别,再将账目信息“游戏充值100”纳入到电子游戏的类别。
在本发明实施例中,用户可以直接说出账目信息所纳入的类别,语音助手可以从语句中识别出用户指定的类别。例如,用户说出“搜狗听话,记个账,中午吃饭花了500元,纳入人情往来”。
在本发明实施例中,所述语音助手确定所述账目信息对应的类别的步骤可以包括:所述语音助手依据所述账目信息对应的预设标签,确定所述账目信息对应的类别。
例如,账目信息“午饭20”,对应的标签可以包括午饭。根据标签午饭,可以将账目信息“午饭20”纳入到早午晚餐的类别。
可以按照事项划分多个类别,部分类别还可以进一步细分。类别可以包括语音助手默认设置的,也可以是用户通过语音设置的。
在本发明实施例中,所述记账方法还可以包括:所述语音助手依据所述用户语音数据输出反馈信息。
语音助手可以通过输出反馈信息与用户进行互动,如通过反馈信息可以告知用户已经记账。
所述语音助手依据所述用户语音数据输出反馈信息的步骤可以包括:所述语音助手依据所述用户语音数据获取反馈信息,并语音播放所述反馈信息。
反馈信息可以包括文本,耳机可以利用TTS技术,生成文本对应的语音并播放。例如,用户说出:“搜狗听话,记个账,午饭花了20元”,语音助手可以输出:“中午困不困?困得话我的肩膀可以借给你,20元已入账”。
语音助手还可以在反馈信息中告知用户账目信息所纳入的类别。例如,语音助手可以输出:“午饭20元纳入早午晚餐类别”。
语音助手还可以在反馈信息对用户进行趣味性调侃。例如,用户说出:“搜狗听话,记个账,买水果花了350”。语音助手可以识别出买水果花350是明显过大的开销,语音助手可以输出:“大哥,买水果花了350元,能吃完吗?”。又例如,用户说出:“搜狗听话,记个账,销售提成5万元”。语音助手识别出是大笔的收入,语音助手可以输出:“厉害厉害,钱会越赚越多的,销售提成5万元已入账”。
语音助手还可以通过反馈信息告知用户分析性信息。例如,用户说出:“搜狗听话,买家具花了60000元”。语音助手分析得到该笔支出是单项最高支出,语音助手可以输出:“买家具60000元已入账,有史以来最高支出!”。又例如,用户说出:“搜狗听话,足底按摩100元”。语音助手分析得到出现单日最高支出,语音助手可以输出:“足底按摩100元已入账,今日累计支出600元,创造单日支出新纪录!”。
语音助手还可以通过反馈信息告知用户建设性信息。例如,用户说出:“搜狗听话,记个账,晚上点了啤酒、麻小、鸭脖、薯片,一共花了230元”。语音助手可以分析得到热量过高,语音助手可以输出:“根据我多年的经验,这些东西的热量有点高哦,230元吃的已入账”。
在本发明实施例中,所述记账方法还可以包括:当满足预设条件时,所述语音助手输出提醒信息。
提醒信息可以是提醒用户记账,提醒用户支出超支,提醒用户交房租、交水电水费、还房贷、还车贷、信用卡还款等等。
所述当满足预设条件时,所述语音助手输出提醒信息的步骤可以包括:当满足预设条件时,所述语音助手获取提醒信息,并语音播放所述提醒信息。
提醒信息可以包括文本,耳机可以利用TTS技术,生成文本对应的语音并播放。例如,语音助手检测到用户几天没记账,语音助手可以输出;“主人,您几天没记账了”
在一种示例中,所述当满足预设条件时,所述语音助手输出提醒信息的步骤可以包括:当满足预设支出条件时,所述语音助手输出提醒信息。
预设支出条件可以包括:单笔开销超过预设阈值,本周开销超过预设阈值,本月开销超过预设阈值,某个分类开销超过预设阈值。当然,预设支出条件还可以由用户根据实际需要进行设定,本发明实施例对此不做限定。其中,预设阈值可以是语音助手默认设置的,也可以是语音助手根据用户历史支出统计得到,还可以是用户设置的。
在另一种示例中,所述当满足预设条件时,所述语音助手输出提醒信息的步骤可以包括:当满足预设时间条件时,所述语音助手输出提醒信息。
预设时间条件可以是当前时间达到了预设时间。例如,语音助手可以每天晚上8点提醒用户记账。
又例如,语音助手检测到用户经常在某一个时间段记一个支出的账单,语音助手可以将该时间段设置为预设时间。如果语音助手检测到当天用户没有在这个时间段记账,语音助手可以输出:“是不是工作忙过头了?记得要按时吃午饭,午饭后要记账哦”。
在本发明实施例中,耳机的语音助手可以获取用户语音数据;对用户语音数据进行语音识别得到识别文本;对所述识别文本进行语句检测,得到至少一个语句;识别至少一个语句对应的用户意图,并确定对应于记账意图的语句;手从对应于记账意图的语句中识别账目信息,并记录账目信息。本发明实施例不需要用户用手操作耳机就能完成记账。在用户不便于用手操作的情况下,也能满足用户的记账需求。例如,用户骑行时可以随时说出需要记账的内容,耳机的语音助手可以在骑行过程中完成记账,不需要用户停下来拿出手机进行记账。
参照图6,示出了本发明实施例的另一种记账方法的步骤流程图,该方法应用于耳机,耳机与服务器通信,所述方法具体可以包括如下步骤:
步骤601,获取用户语音数据。
步骤602,向所述服务器发送所述用户语音数据,以使所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息。
耳机可以将获取的用户语音数据发送给服务器,服务器可以识别用户语音数据中的账目信息,以及记录账目信息。
服务器在记录账目信息后,可以生成反馈信息并发送到耳机,耳机可以根据反馈信息进行反馈。例如,反馈信息可以为文本,耳机可以利用TTS技术,生成文本对应的语音并播放。
在本发明实施例中,服务器可以对用户语音数据进行语音识别得到识别文本;对所述识别文本进行语句检测,得到至少一个语句;识别所述至少一个语句对应的用户意图,并确定对应于记账意图的语句;从对应于记账意图的语句中识别账目信息。
在本发明实施例中,服务器确定对应于记账意图的语句的步骤可以包括:服务器确定所述至少一个语句对应的标签,将对应于预设标签的语句确定为对应于记账意图的语句;和/或,服务器将具有预设指令词的语句确定为对应于记账意图的语句。
在本发明实施例中,服务器可以依据所述对应于记账意图的语句进行至少一轮对话,并获取所述至少一轮对话中的用户语音数据;服务器从所述至少一轮对话的用户语音数据中,识别对应于所述记账意图的语句。
其中,所述服务器依据所述对应于记账意图的语句进行至少一轮对话的步骤可以包括:若所述对应于记账意图的语句中,不存在对应于预设标签的语句,则所述服务器依据所述对应于记账意图的语句进行至少一轮对话。
在至少一轮对话中,服务器可以根据识别的语句生成对话信息,向耳机发送对话信息,耳机可以根据对话信息生成语音并播放。
在本发明实施例中,所述服务器从对应于记账意图的语句中识别账目信息的步骤可以包括:所述服务器从对应于所述预设标签的语句中,确定与所述预设标签对应的文本信息;所述服务器将与所述预设标签对应的文本信息,确定为账目信息。
在本发明实施例中,所述服务器记录所述账目信息的步骤可以包括:所述服务器确定所述账目信息对应的类别,并按照所述账目信息对应的类别记录所述账目信息。
在本发明实施例中,所述服务器确定所述账目信息对应的类别的步骤可以包括:所述服务器依据所述账目信息对应的预设标签,确定所述账目信息对应的类别。
在本发明实施例中,服务器可以依据用户语音数据生成反馈信息,然后向耳机发送反馈信息,最后耳机可以播放反馈信息。
在本发明实施例中,服务器可以依据记录所述账目信息后获取的用户语音数据,修改已记录的账目信息。
在本发明实施例中,服务器可以在当满足预设条件时生成提醒信息,然后向耳机发送提醒信息,最后耳机可以播放提醒信息。
在一种示例中,服务器可以在满足预设支出条件时,生成并向耳机发送提醒信息。在另一种示例中,服务器可以在满足预设时间条件时,生成并向耳机发送提醒信息。
在本发明实施例中,耳机可以获取用户语音数据;将用户语音数据发送给服务器,由服务器识别述用户语音数据中的账目信息,以及记录账目信息。本发明实施例不需要用户用手操作耳机就能完成记账。在用户不便于用手操作的情况下,也能满足用户的记账需求。例如,用户骑行时可以随时说出需要记账的内容,耳机可以在骑行过程中完成记账,不需要用户停下来拿出手机进行记账。
参照图7,示出了本发明实施例的另一种记账方法的步骤流程图,该方法应用于耳机,耳机与服务器通信,耳机具有语音助手,所述方法具体可以包括如下步骤:
步骤701,所述语音助手获取用户语音数据。
在本发明实施例中,语音助手可以在唤醒后,才能获取用户语音数据。
语音助手唤醒的方式可以包括:响应作用于耳机的预设触控区域的触控操作,所述语音助手唤醒。用户可以通过双击预设触控区域唤醒耳机的语音助手。
语音助手唤醒的方式还可以包括:所述语音助手监听用户语音数据;当检测到用户语音数据中包含预设唤醒词时,所述语音助手唤醒。
当语音助手监听到用户说出唤醒词时,语音助手唤醒自身。例如,用户说出:“搜狗听话”,语音助手监听到用户说出了唤醒词然后唤醒自身。
语音助手在被唤醒后,如果在预设时间段内没有获取到用户语音数据,语音助手可以重新进入休眠。
步骤702,所述语音助手向所述服务器发送所述用户语音数据,以使所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息。
语音助手可以将获取的用户语音数据发送给服务器,服务器可以识别用户语音数据中的账目信息,以及记录账目信息。
服务器在记录账目信息后,可以生成反馈信息并发送到耳机,语音助手可以根据反馈信息进行反馈。例如,反馈信息可以为文本,语音助手可以利用从文本到语音TTS(TextTo Speech)技术,生成文本对应的语音并播放。
在本发明实施例中,服务器可以对用户语音数据进行语音识别得到识别文本;对所述识别文本进行语句检测,得到至少一个语句;识别所述至少一个语句对应的用户意图,并确定对应于记账意图的语句;从对应于记账意图的语句中识别账目信息。
在本发明实施例中,服务器确定对应于记账意图的语句的步骤可以包括:服务器确定所述至少一个语句对应的标签,将对应于预设标签的语句确定为对应于记账意图的语句;和/或,服务器将具有预设指令词的语句确定为对应于记账意图的语句。
在本发明实施例中,服务器依据所述对应于记账意图的语句进行至少一轮对话,并获取所述至少一轮对话中的用户语音数据;服务器从所述至少一轮对话的用户语音数据中,识别对应于所述记账意图的语句。
其中,所述服务器依据所述对应于记账意图的语句进行至少一轮对话的步骤可以包括:若所述对应于记账意图的语句中,不存在对应于预设标签的语句,则所述服务器依据所述对应于记账意图的语句进行至少一轮对话。
在至少一轮对话中,服务器可以根据识别的语句生成对话信息,向耳机发送对话信息,语音助手可以根据对话信息生成语音并播放。
在本发明实施例中,所述服务器从对应于记账意图的语句中识别账目信息的步骤可以包括:所述服务器从对应于所述预设标签的语句中,确定与所述预设标签对应的文本信息;所述服务器将与所述预设标签对应的文本信息,确定为账目信息。
在本发明实施例中,所述服务器记录所述账目信息的步骤可以包括:所述服务器确定所述账目信息对应的类别,并按照所述账目信息对应的类别记录所述账目信息。
在本发明实施例中,所述服务器确定所述账目信息对应的类别的步骤可以包括:所述服务器依据所述账目信息对应的预设标签,确定所述账目信息对应的类别。
在本发明实施例中,服务器可以依据用户语音数据生成反馈信息,然后向耳机发送反馈信息,最后语音助手可以播放反馈信息。
在本发明实施例中,服务器可以依据记录所述账目信息后获取的用户语音数据,修改已记录的账目信息。
在本发明实施例中,服务器可以在当满足预设条件时生成提醒信息,然后向耳机发送提醒信息,最后语音助手可以播放提醒信息。
在一种示例中,服务器可以在满足预设支出条件时,生成并向耳机发送提醒信息。在另一种示例中,服务器可以在满足预设时间条件时,生成并向耳机发送提醒信息。
在本发明实施例中,耳机的语音助手可以获取用户语音数据;将用户语音数据发送给服务器,由服务器识别述用户语音数据中的账目信息,以及记录账目信息。本发明实施例不需要用户用手操作耳机就能完成记账。在用户不便于用手操作的情况下,也能满足用户的记账需求。例如,用户骑行时可以随时说出需要记账的内容,耳机的语音助手可以在骑行过程中完成记账,不需要用户停下来拿出手机进行记账。
参照图8,示出了本发明实施例的另一种记账方法的步骤流程图,该方法应用于耳机,耳机与耳机收纳装置通信,耳机收纳装置与服务器通信,所述方法具体可以包括如下步骤:
步骤801,获取用户语音数据。
步骤802,向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置向所述服务器发送所述用户语音数据,通过所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息;或者,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,向所述服务器发送所述账目信息,通过所述服务器记录所述账目信息。
耳机收纳装置是与耳机配套的设备,耳机收纳装置通常用于存放耳机并且给无线耳机充电。在本发明实施例中,耳机收纳装置具有联网功能,使得耳机收纳装置可以与服务器通信。
在一种示例中,耳机可以将用户语音数据发送给耳机收纳装置,由耳机收纳装置将用户语音数据发送给服务器,使得服务器可以识别用户语音数据中的账目信息,以及记录账目信息。服务器从用户语音数据识别到账目信息的方式可以参见上述实施例,在此不做赘述。
服务器在从用户语音数据识别到账目信息后,可以将账目信息返回给耳机收纳装置,由耳机收纳装置记录账目信息。
在另一种示例中,耳机可以将用户语音数据发送给耳机收纳装置,耳机收纳装置可以具有语音识别功能,耳机收纳装置识别用户语音数据中的账目信息,然后向服务器发送账目信息,通过服务器记录账目信息。
在本发明实施例中,服务器可以依据用户语音数据生成反馈信息,然后将反馈信息发送给耳机收纳装置。耳机收纳装置可以具有一显示屏,耳机收纳装置可以在显示屏显示反馈信息。耳机收纳装置也可以将反馈信息发送给耳机,最后由耳机播放反馈信息。
在本发明实施例中,服务器可以依据记录所述账目信息后获取的用户语音数据,修改已记录的账目信息。
在本发明实施例中,当满足预设条件时,服务器可以生成提醒信息,将提醒信息发送给耳机收纳装置,耳机收纳装置可以将提醒信息发送给耳机,最后耳机播放提醒信息。
在一种示例中,服务器可以在满足预设支出条件时,生成并向耳机收纳装置发送提醒信息。在另一种示例中,服务器可以在满足预设时间条件时,生成并向耳机收纳装置发送提醒信息。
在本发明实施例中,耳机可以获取用户语音数据;将用户语音数据发送给耳机收纳装置,耳机收纳装置可以将用户语音数据发送至服务器,由服务器识别述用户语音数据中的账目信息,以及记录账目信息;或者耳机收纳装置可以识别用户语音数据中的账目信息,向服务器发送账目信息,通过服务器记录所述账目信息本发明实施例不需要用户用手操作耳机就能完成记账。在用户不便于用手操作的情况下,也能满足用户的记账需求。例如,用户骑行时可以随时说出需要记账的内容,耳机可以在骑行过程中完成记账,不需要用户停下来拿出手机进行记账。
参照图9,示出了本发明实施例的另一种记账方法的步骤流程图,该方法应用于耳机,耳机与耳机收纳装置通信,耳机收纳装置与服务器通信,耳机具有语音助手,所述方法具体可以包括如下步骤:
步骤901,所述语音助手获取用户语音数据。
在本发明实施例中,语音助手可以在唤醒后,才能获取用户语音数据。
语音助手唤醒的方式可以包括:响应作用于耳机的预设触控区域的触控操作,所述语音助手唤醒。用户可以通过双击预设触控区域唤醒耳机的语音助手。
语音助手唤醒的方式还可以包括:所述语音助手监听用户语音数据;当检测到用户语音数据中包含预设唤醒词时,所述语音助手唤醒。
当语音助手监听到用户说出唤醒词时,语音助手唤醒自身。例如,用户说出:“搜狗听话”,语音助手监听到用户说出了唤醒词然后唤醒自身。
语音助手在被唤醒后,如果在预设时间段内没有获取到用户语音数据,语音助手可以重新进入休眠。
步骤902,所述语音助手向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置向所述服务器发送所述用户语音数据,通过所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息;或者,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,向所述服务器发送所述账目信息,通过所述服务器记录所述账目信息。
耳机收纳装置是与耳机配套的设备,耳机收纳装置通常用于存放耳机并且给无线耳机充电。在本发明实施例中,耳机收纳装置具有联网功能,使得耳机收纳装置可以与服务器通信。
在一种示例中,语音助手可以将用户语音数据发送给耳机收纳装置,由耳机收纳装置将用户语音数据发送给服务器,使得服务器可以识别用户语音数据中的账目信息,以及记录账目信息。服务器从用户语音数据识别到账目信息的方式可以参见上述实施例,在此不做赘述。
服务器在从用户语音数据识别到账目信息后,可以将账目信息返回给耳机收纳装置,由耳机收纳装置记录账目信息。
在另一种示例中,语音助手可以将用户语音数据发送给耳机收纳装置,耳机收纳装置可以具有语音识别功能,耳机收纳装置识别用户语音数据中的账目信息,然后向服务器发送账目信息,通过服务器记录账目信息。
在本发明实施例中,服务器可以依据用户语音数据生成反馈信息,然后将反馈信息发送给耳机收纳装置。耳机收纳装置可以具有一显示屏,耳机收纳装置可以在显示屏显示反馈信息。耳机收纳装置也可以将反馈信息发送给耳机,最后由语音助手播放反馈信息。
在本发明实施例中,服务器可以依据记录所述账目信息后获取的用户语音数据,修改已记录的账目信息。
在本发明实施例中,当满足预设条件时,服务器可以生成提醒信息,将提醒信息发送给耳机收纳装置,耳机收纳装置可以将提醒信息发送给耳机,最后语音助手播放提醒信息。
在一种示例中,服务器可以在满足预设支出条件时,生成并向耳机收纳装置发送提醒信息。在另一种示例中,服务器可以在满足预设时间条件时,生成并向耳机收纳装置发送提醒信息。
在本发明实施例中,耳机的语音助手可以获取用户语音数据;将用户语音数据发送给耳机收纳装置,耳机收纳装置可以将用户语音数据发送至服务器,由服务器识别述用户语音数据中的账目信息,以及记录账目信息;或者耳机收纳装置可以识别用户语音数据中的账目信息,向服务器发送账目信息,通过服务器记录所述账目信息本发明实施例不需要用户用手操作耳机就能完成记账。在用户不便于用手操作的情况下,也能满足用户的记账需求。例如,用户骑行时可以随时说出需要记账的内容,耳机的语音助手可以在骑行过程中完成记账,不需要用户停下来拿出手机进行记账。
参照图10,示出了本发明实施例的另一种记账方法的步骤流程图,该方法应用于耳机,耳机与耳机收纳装置通信,所述方法具体可以包括如下步骤:
步骤1001,获取用户语音数据。
步骤1002,向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,以及记录所述账目信息。
本发明实施例中,为了增加耳机收纳装置的交互性能,耳机收纳装置可以具有语音识别功能。例如耳机收纳装置设有语音识别芯片,或者在耳机收纳装置芯片中设置语音识别的程序。耳机收纳装置在采集用户语音后,可以对用户语音进行识别,得到语音识别结果。
在本发明实施例中,所述耳机收纳装置识别所述用户语音数据中的账目信息的步骤可以包括:所述耳机收纳装置对所述用户语音数据进行语音识别得到识别文本;所述耳机收纳装置对所述识别文本进行语句检测,得到至少一个语句;所述耳机收纳装置识别所述至少一个语句对应的用户意图,并确定对应于记账意图的语句;所述耳机收纳装置从对应于记账意图的语句中识别账目信息。
在本发明实施例中,所述耳机收纳装置确定对应于记账意图的语句的步骤可以包括:所述耳机收纳装置确定所述至少一个语句对应的标签,将对应于预设标签的语句确定为对应于记账意图的语句;和/或,所述耳机收纳装置将具有预设指令词的语句确定为对应于记账意图的语句。
在本发明实施例中,所述耳机收纳装置还可以依据所述对应于记账意图的语句进行至少一轮对话,并获取所述至少一轮对话中的用户语音数据;所述耳机收纳装置从所述至少一轮对话的用户语音数据中,识别对应于所述记账意图的语句。
在本发明实施例中,所述耳机收纳装置依据所述对应于记账意图的语句进行至少一轮对话的步骤可以包括:若所述对应于记账意图的语句中,不存在对应于预设标签的语句,则所述耳机收纳装置依据所述对应于记账意图的语句进行至少一轮对话。
在本发明实施例中,所述耳机收纳装置从对应于记账意图的语句中识别账目信息的步骤可以包括:所述耳机收纳装置从对应于所述预设标签的语句中,确定与所述预设标签对应的文本信息;所述耳机收纳装置将与所述预设标签对应的文本信息,确定为账目信息。
在至少一轮对话中,耳机收纳装置可以根据识别的语句生成对话信息,向耳机发送对话信息,耳机可以根据对话信息生成语音并播放。
在本发明实施例中,所述耳机收纳装置记录所述账目信息的步骤可以包括:所述耳机收纳装置确定所述账目信息对应的类别,并按照所述账目信息对应的类别记录所述账目信息。
在本发明实施例中,所述耳机收纳装置所述账目信息对应的类别的步骤可以包括:所述耳机收纳装置依据所述账目信息对应的预设标签,确定所述账目信息对应的类别。
在本发明实施例中,耳机可以获取用户语音数据;将用户语音数据发送给耳机收纳装置,由耳机收纳装置识别述用户语音数据中的账目信息,以及记录账目信息。本发明实施例不需要用户用手操作耳机就能完成记账。在用户不便于用手操作的情况下,也能满足用户的记账需求。例如,用户骑行时可以随时说出需要记账的内容,耳机可以在骑行过程中完成记账,不需要用户停下来拿出手机进行记账。
参照图11,示出了本发明实施例的另一种记账方法的步骤流程图,该方法应用于耳机,耳机与耳机收纳装置通信,耳机具有语音助手,所述方法具体可以包括如下步骤:
步骤1101,所述语音助手获取用户语音数据。
在本发明实施例中,语音助手可以在唤醒后,才能获取用户语音数据。
语音助手唤醒的方式可以包括:响应作用于耳机的预设触控区域的触控操作,所述语音助手唤醒。用户可以通过双击预设触控区域唤醒耳机的语音助手。
语音助手唤醒的方式还可以包括:所述语音助手监听用户语音数据;当检测到用户语音数据中包含预设唤醒词时,所述语音助手唤醒。
当语音助手监听到用户说出唤醒词时,语音助手唤醒自身。例如,用户说出:“搜狗听话”,语音助手监听到用户说出了唤醒词然后唤醒自身。
语音助手在被唤醒后,如果在预设时间段内没有获取到用户语音数据,语音助手可以重新进入休眠。
步骤1102,所述语音助手向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,以及记录所述账目信息。
本发明实施例中,为了增加耳机收纳装置的交互性能,耳机收纳装置可以具有语音识别功能。例如耳机收纳装置设有语音识别芯片,或者在耳机收纳装置芯片中设置语音识别的程序。耳机收纳装置在采集用户语音后,可以对用户语音进行识别,得到语音识别结果。
在本发明实施例中,所述耳机收纳装置识别所述用户语音数据中的账目信息的步骤可以包括:所述耳机收纳装置对所述用户语音数据进行语音识别得到识别文本;所述耳机收纳装置对所述识别文本进行语句检测,得到至少一个语句;所述耳机收纳装置识别所述至少一个语句对应的用户意图,并确定对应于记账意图的语句;所述耳机收纳装置从对应于记账意图的语句中识别账目信息。
在本发明实施例中,所述耳机收纳装置确定对应于记账意图的语句的步骤可以包括:所述耳机收纳装置确定所述至少一个语句对应的标签,将对应于预设标签的语句确定为对应于记账意图的语句;和/或,所述耳机收纳装置将具有预设指令词的语句确定为对应于记账意图的语句。
在本发明实施例中,所述耳机收纳装置还可以依据所述对应于记账意图的语句进行至少一轮对话,并获取所述至少一轮对话中的用户语音数据;所述耳机收纳装置从所述至少一轮对话的用户语音数据中,识别对应于所述记账意图的语句。
在本发明实施例中,所述耳机收纳装置依据所述对应于记账意图的语句进行至少一轮对话的步骤可以包括:若所述对应于记账意图的语句中,不存在对应于预设标签的语句,则所述耳机收纳装置依据所述对应于记账意图的语句进行至少一轮对话。
在本发明实施例中,所述耳机收纳装置从对应于记账意图的语句中识别账目信息的步骤可以包括:所述耳机收纳装置从对应于所述预设标签的语句中,确定与所述预设标签对应的文本信息;所述耳机收纳装置将与所述预设标签对应的文本信息,确定为账目信息。
在至少一轮对话中,耳机收纳装置可以根据识别的语句生成对话信息,向耳机发送对话信息,语音助手可以根据对话信息生成语音并播放。
在本发明实施例中,所述耳机收纳装置记录所述账目信息的步骤可以包括:所述耳机收纳装置确定所述账目信息对应的类别,并按照所述账目信息对应的类别记录所述账目信息。
在本发明实施例中,所述耳机收纳装置所述账目信息对应的类别的步骤可以包括:所述耳机收纳装置依据所述账目信息对应的预设标签,确定所述账目信息对应的类别。
在本发明实施例中,耳机的语音助手可以获取用户语音数据;将用户语音数据发送给耳机收纳装置,由耳机收纳装置识别述用户语音数据中的账目信息,以及记录账目信息。本发明实施例不需要用户用手操作耳机就能完成记账。在用户不便于用手操作的情况下,也能满足用户的记账需求。例如,用户骑行时可以随时说出需要记账的内容,耳机的语音助手可以在骑行过程中完成记账,不需要用户停下来拿出手机进行记账。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图12,示出了本发明实施例的一种记账装置的结构框图,记账装置应用于耳机,所述记账装置可以包括:
用户语音数据获取模块1201,用于获取用户语音数据;
记账模块1202,用于识别所述用户语音数据中的账目信息,以及记录所述账目信息。
在本发明实施例中,耳机可以获取用户语音数据,识别用户语音数据中的账目信息以及记录账目信息,不需要用户用手操作耳机就能完成记账。在用户不便于用手操作的情况下,也能满足用户的记账需求。例如,用户骑行时可以随时说出需要记账的内容,耳机可以在骑行过程中完成记账,不需要用户停下来拿出手机进行记账。
在本发明实施例中,所述记账模块1202可以包括:
识别文本获得子模块,用于对所述用户语音数据进行语音识别得到识别文本;
语句获得子模块,用于对所述识别文本进行语句检测,得到至少一个语句;
语句确定子模块,用于识别所述至少一个语句对应的用户意图,并确定对应于记账意图的语句;
账目信息识别子模块,用于从对应于记账意图的语句中识别账目信息。
在本发明实施例中,所述语句确定子模块可以包括:
第一语句确定单元,用于确定所述至少一个语句对应的标签,将对应于预设标签的语句确定为对应于记账意图的语句;
和/或,第二语句确定单元,用于将具有预设指令词的语句确定为对应于记账意图的语句。
在本发明实施例中,所述的装置还可以包括:
对话模块,用于依据所述对应于记账意图的语句进行至少一轮对话,并获取所述至少一轮对话中的用户语音数据;
语句识别模块,用于从所述至少一轮对话的用户语音数据中,识别对应于所述记账意图的语句。
在本发明实施例中,所述对话模块可以包括:
对话子模块,用于若所述对应于记账意图的语句中,不存在对应于预设标签的语句,则依据所述对应于记账意图的语句进行至少一轮对话。
在本发明实施例中,所述账目信息识别子模块可以包括:
文本确定单元,用于从对应于所述预设标签的语句中,确定与所述预设标签对应的文本信息;
账目信息确定单元,用于将与所述预设标签对应的文本信息,确定为账目信息。
在本发明实施例中,所述记账模块1202可以包括:
记账子模块,用于确定所述账目信息对应的类别,并按照所述账目信息对应的类别记录所述账目信息。
在本发明实施例中,所述记账子模块可以包括:
类别确定单元,用于依据所述账目信息对应的预设标签,确定所述账目信息对应的类别。
在本发明实施例中,所述的装置还可以包括:
反馈模块,用于依据所述用户语音数据输出反馈信息。
在本发明实施例中,所述反馈模块可以包括:
反馈信息播放子模块,用于依据所述用户语音数据获取反馈信息,并语音播放所述反馈信息。
在本发明实施例中,所述的装置还可以包括:
修改模块,用于依据记录所述账目信息后获取的用户语音数据,修改已记录的账目信息。
在本发明实施例中,所述的装置还可以包括:
提醒模块,用于当满足预设条件时,输出提醒信息。
在本发明实施例中,所述提醒模块可以包括:
提醒信息播放子模块,用于当满足预设条件时,获取提醒信息,并语音播放所述提醒信息。
在本发明实施例中,所述提醒模块可以包括:
第一提醒子模块,用于当满足预设支出条件时,输出提醒信息。
在本发明实施例中,所述提醒模块可以包括:
第二提醒子模块,用于当满足预设时间条件时,输出提醒信息。
在本发明实施例中,所述记账模块1202可以包括:
本地识别子模块,用于在耳机本地识别所述用户语音数据中的账目信息。
在本发明实施例中,所述耳机与服务器通信;所述记账模块1202可以包括:
第一发送子模块,用于向所述服务器发送所述用户语音数据,以使所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息。
在本发明实施例中,所述耳机与耳机收纳装置通信,所述耳机收纳装置与服务器通信;所述记账模块1202可以包括:
第二发送子模块,用于向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置向所述服务器发送所述用户语音数据,通过所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息;或者,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,向所述服务器发送所述账目信息,通过所述服务器记录所述账目信息。
在本发明实施例中,所述耳机与耳机收纳装置通信;所述记账模块1202可以包括:
第三发送子模块,用于向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,以及记录所述账目信息。
在本发明实施例中,所述耳机具有语音助手,所述语音助手部署在所述记账装置。
在本发明实施例中,所述的装置还可以包括:
第一唤醒模块,用于响应作用于耳机的预设触控区域的触控操作,唤醒所述语音助手。
在本发明实施例中,所述的装置还可以包括:
监听模块,用于监听用户语音数据;
第二唤醒模块,用于当检测到用户语音数据中包含预设唤醒词时,唤醒所述语音助手。
本发明实施例还公开了另一种记账装置,应用于耳机,所述耳机具有语音助手,所述语音助手部署在所述记账装置,所述记账装置可以包括:
用户语音数据获取模块,用于获取用户语音数据;
记账模块,用于识别所述用户语音数据中的账目信息,以及记录所述账目信息。
在本发明实施例中,耳机的语音助手可以获取用户语音数据,识别用户语音数据中的账目信息以及记录账目信息,不需要用户用手操作耳机就能完成记账。在用户不便于用手操作的情况下,也能满足用户的记账需求。例如,用户骑行时可以随时说出需要记账的内容,耳机的语音助手可以在骑行过程中完成记账,不需要用户停下来拿出手机进行记账。
图13是根据一示例性实施例示出的一种用于记账的耳机1300的结构框图。参照图13,耳机1300可以包括以下一个或多个组件:处理组件1302,存储器1304,电力组件1306,多媒体组件1308,音频组件1310,输入/输出(I/O)的接口1312,传感器组件1314,以及通信组件1316。
处理组件1302通常控制耳机1300的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件1302可以包括一个或多个处理器1320来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1302可以包括一个或多个模块,便于处理组件1302和其他组件之间的交互。例如,处理部件1302可以包括多媒体模块,以方便多媒体组件1308和处理组件1302之间的交互。
存储器1304被配置为存储各种类型的数据以支持在耳机1300的操作。这些数据的示例包括用于在耳机1300上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件1306为耳机1300的各种组件提供电力。电力组件1306可以包括电源管理系统,一个或多个电源,及其他与为耳机1300生成、管理和分配电力相关联的组件。
多媒体组件1308包括在所述耳机1300和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1308包括一个前置摄像头和/或后置摄像头。当耳机1300处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1310被配置为输出和/或输入音频信号。例如,音频组件1310包括一个麦克风(MIC),当耳机1300处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1304或经由通信组件1316发送。在一些实施例中,音频组件1310还包括一个扬声器,用于输出音频信号。
I/O接口1312为处理组件1302和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1314包括一个或多个传感器,用于为耳机1300提供各个方面的状态评估。例如,传感器组件1314可以检测到耳机1300的打开/关闭状态,组件的相对定位,例如所述组件为耳机1300的显示器和小键盘,传感器组件1314还可以检测耳机1300或耳机1300一个组件的位置改变,用户与耳机1300接触的存在或不存在,耳机1300方位或加速/减速和耳机1300的温度变化。传感器组件1314可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1314还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1314还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1316被配置为便于耳机1300和其他设备之间有线或无线方式的通信。耳机1300可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件1314经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件1314还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,耳机1300可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1304,上述指令可由耳机1300的处理器1320执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本发明实施例还公开了一种耳机,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户语音数据;
识别所述用户语音数据中的账目信息,以及记录所述账目信息。
可选地,所述识别所述用户语音数据中的账目信息,包括:
对所述用户语音数据进行语音识别得到识别文本;
对所述识别文本进行语句检测,得到至少一个语句;
识别所述至少一个语句对应的用户意图,并确定对应于记账意图的语句;
从对应于记账意图的语句中识别账目信息。
可选地,所述确定对应于记账意图的语句,包括:
确定所述至少一个语句对应的标签,将对应于预设标签的语句确定为对应于记账意图的语句;
和/或,将具有预设指令词的语句确定为对应于记账意图的语句。
可选地,还包括:
依据所述对应于记账意图的语句进行至少一轮对话,并获取所述至少一轮对话中的用户语音数据;
从所述至少一轮对话的用户语音数据中,识别对应于所述记账意图的语句。
可选地,所述依据所述对应于记账意图的语句进行至少一轮对话,包括:
若所述对应于记账意图的语句中,不存在对应于预设标签的语句,则依据所述对应于记账意图的语句进行至少一轮对话。
可选地,所述从对应于记账意图的语句中识别账目信息,包括:
从对应于所述预设标签的语句中,确定与所述预设标签对应的文本信息;
将与所述预设标签对应的文本信息,确定为账目信息。
可选地,所述记录所述账目信息,包括:
确定所述账目信息对应的类别,并按照所述账目信息对应的类别记录所述账目信息。
可选地,所述确定所述账目信息对应的类别,包括:
依据所述账目信息对应的预设标签,确定所述账目信息对应的类别。
可选地,还包括:
依据所述用户语音数据输出反馈信息。
可选地,所述依据所述用户语音数据输出反馈信息,包括:
依据所述用户语音数据获取反馈信息,并语音播放所述反馈信息。
可选地,还包括:
依据记录所述账目信息后获取的用户语音数据,修改已记录的账目信息。
可选地,还包括:
当满足预设条件时,输出提醒信息。
可选地,所述当满足预设条件时,输出提醒信息,包括:
当满足预设条件时,获取提醒信息,并语音播放所述提醒信息。
可选地,所述当满足预设条件时,输出提醒信息,包括:
当满足预设支出条件时,输出提醒信息。
可选地,所述当满足预设条件时,输出提醒信息,包括:
当满足预设时间条件时,输出提醒信息。
可选地,所述识别所述用户语音数据中的账目信息,包括:
在耳机本地识别所述用户语音数据中的账目信息。
可选地,所述耳机与服务器通信;所述识别所述用户语音数据中的账目信息,以及记录所述账目信息,包括:
向所述服务器发送所述用户语音数据,以使所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息。
可选地,所述耳机与耳机收纳装置通信,所述耳机收纳装置与服务器通信;所述识别所述用户语音数据中的账目信息,以及记录所述账目信息,包括:
向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置向所述服务器发送所述用户语音数据,通过所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息;或者,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,向所述服务器发送所述账目信息,通过所述服务器记录所述账目信息。
可选地,所述耳机与耳机收纳装置通信;所述识别所述用户语音数据中的账目信息,以及记录所述账目信息,包括:
向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,以及记录所述账目信息。
可选地,所述一个或者一个以上的程序包括语音助手。
可选地,在所述获取用户语音数据之前,还包括:
响应作用于耳机的预设触控区域的触控操作,唤醒所述语音助手。
可选地,在所述语音助手获取用户语音数据之前,还包括:
监听用户语音数据;
当检测到用户语音数据中包含预设唤醒词时,唤醒所述语音助手。
本发明实施例还公开了一种耳机,包括有存储器,以及语音助手,其中语音助手存储于存储器中,且经配置以由一个或者一个以上处理器执行所述语音助手包含用于进行以下操作的指令:
获取用户语音数据;
识别所述用户语音数据中的账目信息,以及记录所述账目信息。
本发明实施例还公开了一种非临时性计算机可读存储介质,当所述存储介质中的指令由耳机的处理器执行时,使得耳机能够执行一种记账方法,所述方法可以包括:
获取用户语音数据;
识别所述用户语音数据中的账目信息,以及记录所述账目信息。
可选地,所述识别所述用户语音数据中的账目信息,包括:
对所述用户语音数据进行语音识别得到识别文本;
对所述识别文本进行语句检测,得到至少一个语句;
识别所述至少一个语句对应的用户意图,并确定对应于记账意图的语句;
从对应于记账意图的语句中识别账目信息。
可选地,所述确定对应于记账意图的语句,包括:
确定所述至少一个语句对应的标签,将对应于预设标签的语句确定为对应于记账意图的语句;
和/或,将具有预设指令词的语句确定为对应于记账意图的语句。
可选地,还包括:
依据所述对应于记账意图的语句进行至少一轮对话,并获取所述至少一轮对话中的用户语音数据;
从所述至少一轮对话的用户语音数据中,识别对应于所述记账意图的语句。
可选地,所述依据所述对应于记账意图的语句进行至少一轮对话,包括:
若所述对应于记账意图的语句中,不存在对应于预设标签的语句,则依据所述对应于记账意图的语句进行至少一轮对话。
可选地,所述从对应于记账意图的语句中识别账目信息,包括:
从对应于所述预设标签的语句中,确定与所述预设标签对应的文本信息;
将与所述预设标签对应的文本信息,确定为账目信息。
可选地,所述记录所述账目信息,包括:
确定所述账目信息对应的类别,并按照所述账目信息对应的类别记录所述账目信息。
可选地,所述确定所述账目信息对应的类别,包括:
依据所述账目信息对应的预设标签,确定所述账目信息对应的类别。
可选地,还包括:
依据所述用户语音数据输出反馈信息。
可选地,所述依据所述用户语音数据输出反馈信息,包括:
依据所述用户语音数据获取反馈信息,并语音播放所述反馈信息。
可选地,还包括:
依据记录所述账目信息后获取的用户语音数据,修改已记录的账目信息。
可选地,还包括:
当满足预设条件时,输出提醒信息。
可选地,所述当满足预设条件时,输出提醒信息,包括:
当满足预设条件时,获取提醒信息,并语音播放所述提醒信息。
可选地,所述当满足预设条件时,输出提醒信息,包括:
当满足预设支出条件时,输出提醒信息。
可选地,所述当满足预设条件时,输出提醒信息,包括:
当满足预设时间条件时,输出提醒信息。
可选地,所述识别所述用户语音数据中的账目信息,包括:
在耳机本地识别所述用户语音数据中的账目信息。
可选地,所述耳机与服务器通信;所述识别所述用户语音数据中的账目信息,以及记录所述账目信息,包括:
向所述服务器发送所述用户语音数据,以使所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息。
可选地,所述耳机与耳机收纳装置通信,所述耳机收纳装置与服务器通信;所述识别所述用户语音数据中的账目信息,以及记录所述账目信息,包括:
向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置向所述服务器发送所述用户语音数据,通过所述服务器识别所述用户语音数据中的账目信息,以及记录所述账目信息;或者,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,向所述服务器发送所述账目信息,通过所述服务器记录所述账目信息。
可选地,所述耳机与耳机收纳装置通信;所述识别所述用户语音数据中的账目信息,以及记录所述账目信息,包括:
向所述耳机收纳装置发送所述用户语音数据,以使所述耳机收纳装置识别所述用户语音数据中的账目信息,以及记录所述账目信息。
可选地,所述耳机具有语音助手。
可选地,在所述获取用户语音数据之前,还包括:
响应作用于耳机的预设触控区域的触控操作,唤醒所述语音助手。
可选地,在所述语音助手获取用户语音数据之前,还包括:
监听用户语音数据;
当检测到用户语音数据中包含预设唤醒词时,唤醒所述语音助手。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种记账方法、一种记账装置和一种耳机,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种记账方法,其特征在于,应用于耳机,所述方法包括:
获取用户语音数据;
识别所述用户语音数据中的账目信息,以及记录所述账目信息。
2.根据权利要求1所述的方法,其特征在于,所述识别所述用户语音数据中的账目信息,包括:
对所述用户语音数据进行语音识别得到识别文本;
对所述识别文本进行语句检测,得到至少一个语句;
识别所述至少一个语句对应的用户意图,并确定对应于记账意图的语句;
从对应于记账意图的语句中识别账目信息。
3.根据权利要求2所述的方法,其特征在于,所述确定对应于记账意图的语句,包括:
确定所述至少一个语句对应的标签,将对应于预设标签的语句确定为对应于记账意图的语句;
和/或,将具有预设指令词的语句确定为对应于记账意图的语句。
4.根据权利要求3所述的方法,其特征在于,还包括:
依据所述对应于记账意图的语句进行至少一轮对话,并获取所述至少一轮对话中的用户语音数据;
从所述至少一轮对话的用户语音数据中,识别对应于所述记账意图的语句。
5.根据权利要求4所述的方法,其特征在于,所述依据所述对应于记账意图的语句进行至少一轮对话,包括:
若所述对应于记账意图的语句中,不存在对应于预设标签的语句,则依据所述对应于记账意图的语句进行至少一轮对话。
6.根据权利要求3所述的方法,其特征在于,所述从对应于记账意图的语句中识别账目信息,包括:
从对应于所述预设标签的语句中,确定与所述预设标签对应的文本信息;
将与所述预设标签对应的文本信息,确定为账目信息。
7.根据权利要求3所述的方法,其特征在于,所述记录所述账目信息,包括:
确定所述账目信息对应的类别,并按照所述账目信息对应的类别记录所述账目信息。
8.一种记账装置,其特征在于,应用于耳机,所述记账装置包括:
用户语音数据获取模块,用于获取用户语音数据;
记账模块,用于识别所述用户语音数据中的账目信息,以及记录所述账目信息。
9.一种耳机,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户语音数据;
识别所述用户语音数据中的账目信息,以及记录所述账目信息。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的记账方法的步骤。
CN202011063585.3A 2020-09-30 2020-09-30 一种记账方法、装置和耳机 Pending CN112201244A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011063585.3A CN112201244A (zh) 2020-09-30 2020-09-30 一种记账方法、装置和耳机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011063585.3A CN112201244A (zh) 2020-09-30 2020-09-30 一种记账方法、装置和耳机

Publications (1)

Publication Number Publication Date
CN112201244A true CN112201244A (zh) 2021-01-08

Family

ID=74013654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011063585.3A Pending CN112201244A (zh) 2020-09-30 2020-09-30 一种记账方法、装置和耳机

Country Status (1)

Country Link
CN (1) CN112201244A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108171403A (zh) * 2017-12-12 2018-06-15 广东广业开元科技有限公司 一种基于语音输入的人工智能手机记账系统和方法
CN108958846A (zh) * 2018-09-27 2018-12-07 出门问问信息科技有限公司 一种记事本事项的创建方法及装置
WO2019007245A1 (zh) * 2017-07-04 2019-01-10 阿里巴巴集团控股有限公司 一种处理方法、控制方法、识别方法及其装置和电子设备
US20190051289A1 (en) * 2017-08-09 2019-02-14 Lenovo (Singapore) Pte. Ltd. Voice assistant system, server apparatus, device, voice assistant method therefor, and program to be executed by copmuter
CN109427008A (zh) * 2017-08-18 2019-03-05 中兴通讯股份有限公司 记账方法、装置及计算机可读存储介质
CN110209667A (zh) * 2019-04-25 2019-09-06 深圳壹账通智能科技有限公司 收支数据的统计方法、装置及计算机设备
CN110659970A (zh) * 2018-06-12 2020-01-07 百度在线网络技术(北京)有限公司 基于语音识别的账务信息处理方法、装置和电子设备
CN111260456A (zh) * 2020-01-17 2020-06-09 厦门快商通科技股份有限公司 一种智能记账管理系统
CN111353868A (zh) * 2020-03-14 2020-06-30 策拉人工智能科技(云南)有限公司 一种人工智能记账系统及其计算方法
CN111444324A (zh) * 2020-03-05 2020-07-24 中国平安人寿保险股份有限公司 基于断句的多意图识别方法、装置、设备及存储介质
CN111696553A (zh) * 2020-06-05 2020-09-22 北京搜狗科技发展有限公司 一种语音处理方法、装置及可读介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019007245A1 (zh) * 2017-07-04 2019-01-10 阿里巴巴集团控股有限公司 一种处理方法、控制方法、识别方法及其装置和电子设备
US20190051289A1 (en) * 2017-08-09 2019-02-14 Lenovo (Singapore) Pte. Ltd. Voice assistant system, server apparatus, device, voice assistant method therefor, and program to be executed by copmuter
CN109427008A (zh) * 2017-08-18 2019-03-05 中兴通讯股份有限公司 记账方法、装置及计算机可读存储介质
CN108171403A (zh) * 2017-12-12 2018-06-15 广东广业开元科技有限公司 一种基于语音输入的人工智能手机记账系统和方法
CN110659970A (zh) * 2018-06-12 2020-01-07 百度在线网络技术(北京)有限公司 基于语音识别的账务信息处理方法、装置和电子设备
CN108958846A (zh) * 2018-09-27 2018-12-07 出门问问信息科技有限公司 一种记事本事项的创建方法及装置
CN110209667A (zh) * 2019-04-25 2019-09-06 深圳壹账通智能科技有限公司 收支数据的统计方法、装置及计算机设备
CN111260456A (zh) * 2020-01-17 2020-06-09 厦门快商通科技股份有限公司 一种智能记账管理系统
CN111444324A (zh) * 2020-03-05 2020-07-24 中国平安人寿保险股份有限公司 基于断句的多意图识别方法、装置、设备及存储介质
CN111353868A (zh) * 2020-03-14 2020-06-30 策拉人工智能科技(云南)有限公司 一种人工智能记账系统及其计算方法
CN111696553A (zh) * 2020-06-05 2020-09-22 北京搜狗科技发展有限公司 一种语音处理方法、装置及可读介质

Similar Documents

Publication Publication Date Title
US10313279B2 (en) Live video-chat function within text messaging environment
US20200228480A1 (en) Messaging environment for mobile device with multitask toolbar, search engine and keyboard control access to apps and centralized functionality
CN110140168A (zh) 上下文热词
US10176511B2 (en) System and method for wireless ordering using speech recognition
CN104378441B (zh) 日程创建方法和装置
KR102420564B1 (ko) 정보 제공 방법 및 디바이스
CN104980585B (zh) 信息提示方法及装置
US9418657B2 (en) Communication system and method for an ear worn communication device
CN109308334B (zh) 信息推荐方法及装置、搜索引擎系统
CN110020009A (zh) 在线问答方法、装置及系统
CN112185389A (zh) 语音生成方法、装置、存储介质和电子设备
EP3161769A1 (en) Voice-controlled information exchange platform, such as for providing information to supplement advertising
US20190018894A1 (en) Call summary
CN111241822A (zh) 输入场景下情绪发现与疏导方法及装置
CN106571136A (zh) 一种语音输出装置和方法
CN111638832A (zh) 信息展示方法、装置、系统、电子设备及存储介质
CN109102802A (zh) 用于处理用户话语的系统
CN103778225B (zh) 广告营销类语言信息的处理方法、识别装置及系统
US20220351266A1 (en) Customization platform and method for service quality evaluation product
KR102318642B1 (ko) 음성 분석 결과를 이용하는 온라인 플랫폼
US9569701B2 (en) Interactive text recognition by a head-mounted device
CN110634336A (zh) 有声电子书生成方法及装置
CN111739530A (zh) 一种交互方法、装置、耳机和耳机收纳装置
US20140093125A1 (en) Personalized Advertising at a Point of Sale Unit
CN107395875A (zh) 基于终端的定时提醒方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210706

Address after: 100084 Room 802, 8th floor, building 9, yard 1, Zhongguancun East Road, Haidian District, Beijing

Applicant after: Beijing Sogou Intelligent Technology Co.,Ltd.

Address before: 100084. Room 9, floor 01, cyber building, building 9, building 1, Zhongguancun East Road, Haidian District, Beijing

Applicant before: BEIJING SOGOU TECHNOLOGY DEVELOPMENT Co.,Ltd.