CN115866118A - 一种基于智能语音处理的手机来电信息处理方法 - Google Patents
一种基于智能语音处理的手机来电信息处理方法 Download PDFInfo
- Publication number
- CN115866118A CN115866118A CN202211484240.4A CN202211484240A CN115866118A CN 115866118 A CN115866118 A CN 115866118A CN 202211484240 A CN202211484240 A CN 202211484240A CN 115866118 A CN115866118 A CN 115866118A
- Authority
- CN
- China
- Prior art keywords
- incoming call
- information
- voice
- answering
- call
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种基于智能语音处理的手机来电信息处理方法,涉及通信技术领域,该方法包括以下步骤:接收来电,所述来电包括来电信息;将接听请求加载到来电信息中发送给用户;获取用户所响应的关于接听请求的回执信息,其中,回执信息中包括是否接听来电和接听来电所采取的接听方式,接听方式包括手动接听和来电秘书接听;如果用户选择来电秘书接听,则执行下一步骤;将来电发送至来电秘书,由来电秘书结合用户的插话信息代为通话应答。本发明方法可以让机主的工作、生活的节奏不被打断,不漏接任何一个电话的同时,还可以智能屏蔽骚扰,防止诈骗,全面解决所有手机负面的影响。
Description
技术领域
本发明涉及通信技术领域,具体是一种基于智能语音处理的手机来电信息处理方法。
背景技术
目前,人们生活越来越离不开手机等移动终端,其中,尤其是移动终端的通话功能,为人们的生活提供了极大的便利。随着移动电话的普及化,移动终端用户只需知道对方号码即可实现通话。然而,用户在使用手机等及移动终端时常常产生较多的烦恼,比如:骚扰电话防不胜防、电话不方便接听的时候重复来电,故而需要对来电进行管理。
用户通常对来电信息的处理方式是直接拒接或者通过设置飞行模式拒接来电;直接拒接的方式容易导致对方因为不清楚用户的自身状态而反复拨打;飞行模式拒接来电会导致用户错过重要的来电,因为无法及时回复来电人员而影响来电人员的心理状态。
发明内容
本发明的目的在于提供一种基于智能语音处理的手机来电信息处理方法,以解决机主在不接听的情况下遗漏来电信息的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于智能语音处理的手机来电信息处理方法,应用于APP终端,该方法包括以下步骤:
接收来电,所述来电包括来电信息,所述接收来电的具体步骤包括:
根据来电信息判定来电是否处于黑名单列表中,如果是,则拒接来电;如果不是,将所述来电转接至APP终端处理;其中,黑名单列表为记录处于异常状态的电话号码所形成的列表;
所述来电信息至少包括电话号码的地址和号码所属类型;
将接听请求加载到来电信息中发送给用户,所述APP终端同步Windows窗口信息框,所述用户通过APP终端和/或windows窗口信息框获取来电信息,用户获取来电信息包括语音信息;
获取用户所响应的关于接听请求的回执信息,其中,回执信息中包括是否接听来电和接听来电所采取的接听方式,接听方式包括手动接听和来电秘书接听;如果用户选择来电秘书接听,则执行下一步骤;
将来电发送至来电秘书,由来电秘书结合用户的插话信息代为通话应答。
在一种可选方案中:所述将接听请求加载到来电信息中发送给用户的具体步骤包括:
将来电信息以文字和录音的呈现形式进行编码,
将接听请求加载到来电信息的编码中,形成请求信号;
向用户发送请求信号。
在一种可选方案中:所述获取用户所响应的回执信息,根据回执信息确认接听请求是否被响应,如果接听请求不被响应,拒接来电;如果接听请求被响应,向用户发送接听方式的请求;具体步骤包括:
接收用户所响应的回执信息,并识别回执信息;
根据回执信息中关于接听请求的信息判定用户是否响应接听请求;
如果接听请求不被响应,向来电人员发送用户拒绝接听,并将该来电划为短时间拒绝接收列表中;如果接听请求被响应,识别回执信息中关于接听方式的选择并依据选择结果所采取的方式接听来电。
在一种可选方案中:所述将来电发送至来电秘书,由来电秘书结合用户的插话信息代为通话应答的具体步骤包括:
接通来电并获取通话语音信息;
识别通话语音并根据语音特征和语义判定语音方言类型和通话场景模式;
结合通话场景模式的应答话术和预设应答方式,以语音方言类型的方式进行代为通话应答;
将来电信息和代为通话应答的记录通过APP终端通知机主;
获取并识别机主所响应的插话信息;其中,插话信息为文字的形式;
将插话信息融入通话应答中并向来电的一方转述。
在一种可选方案中:所述识别通话语音并根据语音特征和语义判定语音方言类型和通话场景模式的具体步骤包括:
接收通话中的语音信息,语音信息接收时长保持在至少一整句话的时长或不低于10秒的时长,同时根据语音声调间隙和语气停顿来识别出整句是否说完;
将语音特征进行分类识别,其中,语音特征包括声类特征、韵类特征、调类特征和方言词汇;分类识别的方式是依据语音特征中的声类特征、韵类特征和调类特征识别语音信息中语音所属方言,依据方言词汇识别文字,对应识别的方言属性判定语音信息所属含义;
将语音特征识别后所判定语音信息所属含义与预设的话术场景比对,判定通话场景模式。
在一种可选方案中:应答方式至少包括应答开场白和语音声音类型及机主插话信息。
在一种可选方案中:所述语音声音类型包括APP终端自带的声音类型和机主通过平台学习构建的声音模型。
在一种可选方案中:机主通过平台学习构建声音模型的具体步骤包括:
采集声音片段和待合成的文字;
提取声音片段中的声音特征,并将声音特征通过声音特征编码器进行编码处理;
将待合成的文字通过文本向量生成器生成文本向量;
将文本向量和编码后的声音特征相互嵌入语音合成器中并生成频谱;
将频谱导入声码器中生成语音信号,构建成声音模型。
在一种可选方案中:所述接收来电信息之前,还包括,获取APP终端的登录请求并响应登录请求,其中,登录请求至少包括来电秘书账号,来电秘书账号支持绑定多部手机。
相较于现有技术,本发明的有益效果如下:
通过设定来电秘书代替机主与来电人员进行简易回复,通过APP和客户端通知机主,避免在机主不方便接听电话时错过重要电话,并且能够使得来电人员知晓机主处于不便于接电话的状态。本发明方法可以让机主的工作、生活的节奏不被打断,不漏接任何一个电话的同时,还可以智能屏蔽骚扰,防止诈骗,全面解决所有手机负面的影响。
附图说明
图1为一种基于智能语音处理的手机来电信息处理方法的流程示意图。
图2为接收来电的流程示意图。
图3为将接听请求加载到来电信息中发送给用户的流程示意图。
图4为获取用户所响应的回执信息的流程示意图。
图5为将来电发送至来电秘书,由来电秘书结合用户的插话信息代为通话应答的流程示意图。
图6为识别通话语音并根据语音特征和语义判定语音方言类型和通话场景模式的流程示意图。
图7为机主通过平台学习构建声音模型的流程示意图。
图8为一键设置呼转的流程示意图。
图9为来电转接设置和机主插话的流程示意图。
图10为支持绑定多部手机到来电秘书接听的流程结构示意图。
图11为深度学习构建自己的声音模型的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。本发明所列举的各实施例仅用以说明本发明,并非用以限制本发明的范围。对本发明所作的任何显而易知的修饰或变更都不脱离本发明的精神与范围。
以下结合具体实施例对本发明的具体实现进行详细描述。
如图1所示,为本发明提供了一种基于智能语音处理的手机来电信息处理方法,该方法应用于APP终端,包括以下步骤:
S100、接收来电,所述来电包括来电信息;
S200、将接听请求加载到来电信息中发送给用户;所述APP终端同步Windows窗口信息框,所述用户通过APP终端和/或windows窗口信息框获取来电信息,用户获取来电信息包括语音信息;
在该步骤中,机主的手机来电,APP终端产生响应并接收来电信息,来电信息可以文字或的形式存储,避免产生响铃状态,以供机主在不方便接听电话的情况下能够通过手机屏幕显示的文字信息查看来电信息,并根据来电信息选择接听与否。
S300、获取用户所响应的关于接听请求的回执信息,其中,回执信息中包括是否接听来电和接听来电所采取的接听方式,接听方式包括手动接听和来电秘书接听;如果用户选择来电秘书接听,则执行下一步骤;
S400、将来电发送至来电秘书,由来电秘书结合用户的插话信息代为通话应答。
如图1和图8所示,在本发明实施例中,机主可能处于手机不在身边或者开会等不便于接听电话的状态,也可能处于便于接听电话的状态;当机主处于便于接听电话的状态时,机主能够根据查看来电信息并根据来电信息,自己选择接听或者由来电秘书接听应答;当机主处于不便于接听电话的状态时,直接由来电秘书接听应答;采用来电秘书接听应答时,服务器下发平台接入号,如:0755-56785678;机主通过一键设置呼转,跳转至手机拨号盘拨打,手机用拨号方式设置呼转,如自动粘贴如下代码至拨号盘:004-0755-56785678#;机主只要一键呼出即可。
如图2所示,作为本发明的一种优选实施例,所述接收来电的具体步骤包括:
S101、根据来电信息判定来电是否处于黑名单列表中;
S102、如果是,则拒接来电;如果不是,将所述来电转接至APP终端;其中,黑名单列表为记录处于异常状态的电话号码所形成的列表;
所述来电信息至少包括电话号码的地址和号码所属类型。
在该步骤中,APP终端识别来电信息,并且比对黑名单列表中处于异常状态的电话号码;从而确认电话号码是否为骚扰电话和诈骗号码等无需接听的来电号码;其次,来电信息中的电话号码的地址,能够进一步显示来电人员经常所处的位置,用户可以根据号码地址来判定是否为需要接听,并且号码所属类型包括座机、手机或者其他来电终端;有助于用户和APP终端识别;其中,被多人标记、不显示来电信息以及被国家反炸A PP提示的来电号码均位于黑名单列表中。
如图3所示,作为本发明的一种优选实施例,所述将接听请求加载到来电信息中发送给用户的具体步骤包括:
S201、将来电信息以文字或录音的呈现形式进行编码;
S202、将接听请求加载到来电信息的编码中,形成请求信号;
S203、向用户发送请求信号;
在该步骤中,来电信息和接听请求可以文字或其他阅读的形式存在,能够以静默的方式发送至用户,避免产生响铃状态,以供机主在不方便接听电话的情况下能够通过手机屏幕显示的文字信息查看来电信息。
如图4所示,作为本发明的一种优选实施例,获取用户所响应的关于接听请求的回执信息,其中,回执信息中包括是否接听来电和接听来电所采取的接听方式,接听方式包括手动接听和来电秘书接听;如果用户选择来电秘书接听,则执行下一步骤的具体步骤包括:
S301、接收用户所响应的回执信息,并识别回执信息;
S302、根据回执信息中关于接听请求的信息判定用户是否响应接听请求;
在该步骤中,发送回执信息时通过设置来电等待时间(超时自动转来电秘书接听),来电等待时间可以设置为10/15/30秒,默认运营商设置是30秒,让机主有时间考虑要不要自己接听(比如好友来电);并且设置来电等待时间也能够确认,手机是否被机主携带在身边;APP终端能够明确用户处于不方便接电话的状态还是处于手机不在身边的状态;如果超过等待时间,用户没有发出回执信息,即默认用户处于不方便接听电话的状态,判定响应接听请求;如果在等待时间内,用户发出回执信息,根据回执信息中关于接听请求的信息判定用户是否响应接听请求。
S303、如果接听请求不被响应,向来电人员发送用户拒绝接听,并将该来电划为短时间拒绝接收列表中;如果接听请求被响应,识别回执信息中关于接听方式的选择并依据选择结果所采取的方式接听来电;
在该步骤中,在拒绝接听来电时,可由来电秘书向来电人员发送拒绝接听的信息,并可给出拒绝接听的理由,避免来电人员误会。机主所响应的回执信息中包含接听电话的方式,以及可能包含接听电话的一些设置,比如,通话语音的音量和采用的语言等;APP终端根据机主选择的接听方式,调整设置并输出接听方式。
如图6和图9所示,作为本发明的一种优选实施例,所述将来电发送至来电秘书,由来电秘书结合用户的插话信息代为通话应答的具体步骤包括:
S401、接通来电并获取通话语音信息;
S402、识别通话语音信息并根据语音特征和语义判定语音方言类型和通话场景模式;
在本发明实施例中,平台存储了26个行业语义积累,300种话术场景,海量关键字,依托机器人的NLP(语言理解)技术和超强的ASR(语音识别)能力,对于特定的服务类电话,如外卖、快递或滴滴等,来电秘书能快速的智能识别和语义判断场景,智能代答;根据不同的情景模式,还可加入机主自定义的应答话术。
S403、结合通话场景模式的应答话术和预设应答方式,以语音方言类型的方式进行代为通话应答;
其中,应答方式至少包括应答开场白和语音声音类型,所述语音声音类型包括APP终端自带的声音类型和机主通过平台学习构建的声音模型;所述应答开场白包括APP终端默认的开场白和机主自定义的开场白;在本发明实施例中,所述应答开场白包括APP终端默认的开场白和机主自定义的开场白;如选择默认开场白或自定义开场白,使用自己习惯的应答方式,如:“您好,我是机主的秘书,请问您找他有什么事?”;其中,自定义语音声音类型,共有男女老少九种声音类型供机主选择,除此之外,还可以通过20条以上的录音由平台学习来构建自己的声音模型;通过特定的开场白能够给予对方一定的信息传递,消除误解;
S404、将来电信息和代为通话应答的记录通过APP终端通知机主;
在该步骤中,来电秘书代为应答的同时通过APP和客户端通知机主,告知来电信息,让机主实时知悉沟通的过程;从而能够让机主初步知晓来电人员的意图,便于机主在方便通话的时候与来电人员进行及时沟通。
S405、获取并识别机主所响应的插话信息;其中,插话信息为文字的形式;
在该步骤中,遇到重大的问题需要立刻解决时,机主在来电秘书与来电人员进行应答的过程中能够以文字信息的方式进行插话,从而能够与来电人员进行短暂沟通,给出相应的解决方案;比如在不能发出声响的环境中,无法接听电话,可以以发送信息的方式进行插话回复来电人员;
S406、将插话信息融入通话应答中并向来电的一方转述;
在该步骤中,来电秘书能够将用户中间的文字信息转变成语音,并将语音通过通话场景模式向来电人员进行回复;保证信息传递的及时性。
如图6和图9所示,作为本发明的一种优选实施例,所述识别通话语音并根据语音特征和语义判定语音方言类型和通话场景模式的步骤具体包括:
S501、接收通话中的语音信息,语音信息接收时长保持在至少一整句话的时长或不低于10秒的时长,同时根据语音声调间隙和语气停顿来识别出整句是否说完;
S502、将语音特征进行分类识别,其中,语音特征包括声类特征、韵类特征、调类特征和方言词汇;分类识别的方式是依据语音特征中的声类特征、韵类特征和调类特征识别语音信息中语音所属方言,依据方言词汇识别文字,对应识别的方言属性判定语音信息所属含义;
S503、将语音特征识别后所判定语音信息所属含义与预设的话术场景比对,判定通话场景模式。
在本发明实施例中,将来电信息进行分类识别,首先将来电信息中的语音信息进行特征识别,包括1-声类特征识别、2-韵类特征识别、3-调类特征识别、4-方言词汇识别,与预存各地方言标准库进行对比,语音信息接收时长保持在至少一整句话的时长或不低于10秒的时长,同时根据语音声调间隙和语气停顿来识别出整句是否说完;
如果说完,再识别其整句语境及含义同时转化成文字信息,根据1-声类特征识别、2-韵类特征识别、3-调类特征识别综合判断出语音所属方言,用来识别所述方言类型,及其所属地域;然后根据对语音的发音进行词汇识别,即根据4-方言词汇识别来识别文字,对应识别的方言属性判定所属含义,将识别的方言文字信息发送给机主;并同时提示其含义;
识别根据接收的所述语音信息转化识别为对应的文字词组,根据词组前后语境识别含义,然后根据接听方的信息库和机主特点回复来电方,包括智能转接,智能回复,或者将获取的语音信息和来电其他信息以文字的形式发送给机主,如果机主(开会中)忙碌中,可以通过文字信息了解来电情况,决定是否立即回复或者延迟会后回复,也可以设置智能助手语音自动回复;
回复中可以通过机主的语音语义转化为对应方言回复给对方,或者通过机主指令自动调取标准答案并转为对应方言回复来电信息。对来信息的语音和文字信息,以及对应的背景信息,进行信息编码,按照编码顺序依序识别来电语音的特征和含义,并对应编码回复来电,回复包括机主设置的自动回复或者确认回复,或者根据机主所在环境(例如开会中)智能助手自动结合机主所在环境信息回复。所有的回复都有对应的编码顺序。根据机主的忙碌情况和来电信息的级别进行判断,级别依据顺序包括:亲人、领导、同事、客户、供应商、朋友等;另外还包括:座机、手机、骚扰电话,诈骗电话等网络备案信息的获取和识别。
对识别的词组中不同位置提取所述词组属性含义,例如属于粤语,对应粤语特点所述词组的含义进行识别,根据整句语音的特征以及所述词组对应位置提取所述单字或词组属性含义,根据其特征在预设句型数据库中匹配确定句型特征结构,对识别的文字整句句子进行结构分析,根据对应方言的独特语法识别含义,并自动回复对应的文字标准答案,语音来电信息对应回复为对应方言语音。
根据参考示例可以确定句型特征结构为主谓结构的问句,所述句型特征结构包括单句结构和复句结构,所述单句结构包括主谓句结构、非主谓句结构和特殊单句结构,所述复句结构包括并列复句结构、承接复句结构、递进复句结构和选择复句结构;
所述句型识别整句后进行识别语音主人所述地方言,然后依据识别的含义进行回复或者通知机主。
机主存储有对应的知识库,根据机主指令或者设置自动转为对应方言回复来电咨询的问题,方言整句的识别为:首先转为对应文字,然后对文字进行语义语境识别,然后根据理解回复对应的方言;
关于“语义语境识别”,根据参考示例调取对应方言的表达方式,然后将文字转为对应的方言语音,包括不同的发音方式,组词方式,表达方式,及依据上面提到的“1声类特征识别、2韵类特征识别、3调类特征识别”,作出对应的发音,例:“这条路走不同(通)”,“同”系“通”之误,方言中阴平、阳平声调相混,而不分阴平、阳平的地区、除甘肃天水外,主要集中在山西与河北,再结合其他方言特征,方言识别结果与系统分析识别相吻合。
可以确定句型特征结构为主谓结构的问句,所述句型特征结构包括单句结构和复句结构,所述单句结构包括主谓句结构、非主谓句结构和特殊单句结构,所述复句结构包括并列复句结构、承接复句结构、递进复句结构和选择复句结构。
参考示例如下:
1.声类特征识别
声类特征识别即通过音节的声母类别来分析、判断识别人的原籍地或长期居留地。
例如,北京地区语音识别以下语句:“勃涅(列)尔(日)列(涅)夫……”
识别人将“勃列日涅夫”识别成“勃涅尔列夫”,反映了两个声类方面的语音问题,一是边鼻音不分:列为边音字,涅为鼻音字,识别人将这两个字错列位置,说明其方音属于边、鼻音不分地区,即重庆、贵阳、武汉、南京、兰州诸地;二是“尔”与“日”同音:语音将日识别成尔,说明这两个字是同音的,只有武汉、西安诸地属于这种情况。根据边、鼻音不分,尔与日同音等特征在武汉重合,分析意见认为识别语音发出人所在地为武汉,确认后得到证实。
2.韵类特征识别
韵类特征识别即通过音节的韵母类别来分析、判断识别说话人的属地或长期居留地。
例如:来电语音信心为“红头转向”、“撕乱”等语汇。
“红头转向”系“昏头转向”之误,“红”、昏”混用,说明语音来源人韵母[一un]和[一ong]相混,山西和河北张家口方音有此特点;“撕乱”系“撕烂”之误,反映出说话人口语中介音[u]消失,致使“乱”[luan]与“烂”[lan]混同,符合张家口方言的特点。可见,语音发出人的方音符合张家口方音的特征。据此推断语音发出人籍贯是张家口。确认后得到证实。
3.调类特征识别
调类特征识别即通过音节的声调类别来分析、判断识别人的属地或长期居留地。
例如:某语音中有“这条路走不同(通)”的语句。
“同”系“通”之误,说明语音发出人的方言中阴平、阳平声调相混,而不分阴平、阳平的地区、除甘肃天水外,主要集中在山西与河北,再结合来电信息中的其他方言特征,分析语音发出人为河北与山西两省相邻地区人。经确认,确实其籍贯为河北井径。确认结果与原识别分析相吻合。
4、方言词汇识别,
每种方言都有一些特殊的方言词语,从词形和词义方面来分析,可以看出方言词汇跟普通话词汇之间的关系,大体上存在着两种不同的类型:
一是词形相同,词义有别。如水。广州话、客家话也用来兼指“雨”,“落水”等于“下雨”的意思。普通话是不能以水为雨的。又如上海话“跑”含有走的意思,而普通话的“跑”表示奔跑,不能表示走。
二是词形不同,词义却是一致的,例如普通话“打架”一词,西安叫“打锤”,上海叫“打相打”,温州是“相打”,广州为“打交”,厦门为“相拍”。除了与普通话词语有形、义联系的方言词外,各地方言中还有一些不同于普通话的特殊方言词。特殊方言词又可分为三种类型:
一是保留古汉语词及其用法。
例如厦门话以“厝”表示“房子”,“卵”表示“蛋”,“鼎”表示“铁锅”,广州话称“走”为“行”,“吃”为“食”,“看”为“睇”。
二是借用外族词形成方言词,
例如东北方言称“肮脏”为“埋汰”,借自满语;粤方言称“胶卷”为“菲林”,借自英语;厦门话称“肥皂”为“雪文”,借自马来语。
三是因自然地理条件或忌讳心理形成的方言词。如粤方言称冰棍为雪条,“冰箱”为“雪柜”;闽南方言称“冰”为“霜”,“冰棍”为“霜条”;广州话称“空屋”为“吉屋”,因“空”、“凶”同音,忌“凶”而改称。②附加特征。附加成分可分为词头和词尾。如词头阿在吴、闽、粤、客家方言中用在称谓名词前构成亲属称谓,还可用在姓或名前表示昵称,如“阿妈”、“阿唐”、“阿明”,在北方方言和普通话中则不用。词尾“们”在普通话中用在人称代词之后表示多数,但在各地方言中相当于有广州方言的“口地”,“人巨口地”即“他们”,上海方言的“拉”,“阿拉”即“我们”,苏州方言的“笃”、“俚笃”即他们温州方言的“来”和客家方言梅县的“兜”等。
如图7和图11所示,作为本发明的一种优选实施例,机主通过平台学习构建声音模型的具体步骤包括:
S601、采集声音片段和待合成的文字;
S602、提取声音片段中的声音特征,并将声音特征通过声音特征编码器进行编码处理;
S603、将待合成的文字通过文本向量生成器生成文本向量;
S604、将文本向量和编码后的声音特征相互嵌入语音合成器中并生成频谱;
S605、将频谱导入声码器中生成语音信号,构建成声音模型。
如图10所示,作为本发明的一种优选实施例,所述接收来电信息之前,还包括,获取APP终端的登录请求并响应登录请求,其中,登录请求至少包括来电秘书账号,来电秘书账号支持绑定多部手机;在本发明实施例中,用户在设置手机接听电话的模式中,可以选择通过该APP终端控制手机接听电话的模式;在选择通过该APP终端控制手机接听电话时,需要通过登录账号和密码,以实现给予APP终端控制手机接听电话的授权,避免其他人员通过来电秘书控制用户的手机接听电话;并且一个来电秘书账号可支持绑定多部手机,以便于选择性进行转接;由持有其他手机的人员进行接听,即便单卡单待的手机亦可以管理两个甚至更多手机的来电信息。
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。
Claims (9)
1.一种基于智能语音处理的手机来电信息处理方法,应用于APP终端,其特征在于,该方法包括以下步骤:
接收来电,所述来电包括来电信息,所述接收来电的具体步骤包括:
根据来电信息判定来电是否处于黑名单列表中,如果是,则拒接来电;如果不是,将所述来电转接至APP终端处理;其中,黑名单列表为记录处于异常状态的电话号码所形成的列表;
所述来电信息至少包括电话号码的地址和号码所属类型;
将接听请求加载到来电信息中发送给用户,所述APP终端同步Windows窗口信息框,所述用户通过APP终端和/或windows窗口信息框获取来电信息,用户获取来电信息包括语音信息;
获取用户所响应的关于接听请求的回执信息,其中,回执信息中包括是否接听来电和接听来电所采取的接听方式,接听方式包括手动接听和来电秘书接听;如果用户选择来电秘书接听,则执行下一步骤;
将来电发送至来电秘书,由来电秘书结合用户的插话信息代为通话应答。
2.根据权利要求1所述的基于智能语音处理的手机来电信息处理方法,其特征在于,所述将接听请求加载到来电信息中发送给用户的具体步骤包括:
将来电信息以文字或录音的呈现形式进行编码,
将接听请求加载到来电信息的编码中,形成请求信号;
向用户发送请求信号。
3.根据权利要求1所述的基于智能语音处理的手机来电信息处理方法,其特征在于,获取用户所响应的关于接听请求的回执信息,其中,回执信息中包括是否接听来电和接听来电所采取的接听方式,接听方式包括手动接听和来电秘书接听;如果用户选择来电秘书接听,则执行下一步骤的具体步骤包括:
接收用户所响应的回执信息,并识别回执信息;
根据回执信息中关于接听请求的信息判定用户是否响应接听请求;
如果接听请求不被响应,向来电人员发送用户拒绝接听,并将该来电划为短时间拒绝接收列表中;如果接听请求被响应,识别回执信息中关于接听方式的选择并依据选择结果所采取的方式接听来电。
4.根据权利要求1所述的基于智能语音处理的手机来电信息处理方法,其特征在于,所述将来电发送至来电秘书,由来电秘书结合用户的插话信息代为通话应答的具体步骤包括:
接通来电并获取通话语音信息;
识别通话语音并根据语音特征和语义判定语音方言类型和通话场景模式;
结合通话场景模式的应答话术和预设应答方式,以语音方言类型的方式进行代为通话应答;
将来电信息和代为通话应答的记录通过APP终端通知机主;
获取并识别机主所响应的插话信息;其中,插话信息为文字的形式;
将插话信息融入通话应答中并向来电的一方转述。
5.根据权利要求1所述的基于智能语音处理的手机来电信息处理方法,其特征在于,所述接收来电信息之前,还包括,获取APP终端的登录请求并响应登录请求,其中,登录请求至少包括来电秘书账号,来电秘书账号支持绑定多部手机和智能联网设备。
6.根据权利要求5所述的基于智能语音处理的手机来电信息处理方法,
其特征在于,所述识别通话语音并根据语音特征和语义判定语音方言类型和通话场景模式的具体步骤包括:
接收通话中的语音信息,语音信息接收时长保持在至少一整句话的时长或不低于10秒的时长,同时根据语音声调间隙和语气停顿来识别出整句是否说完;
将语音特征进行分类识别,其中,语音特征包括声类特征、韵类特征、调类特征和方言词汇;分类识别的方式是依据语音特征中的声类特征、韵类特征和调类特征识别语音信息中语音所属方言,依据方言词汇识别文字,对应识别的方言属性判定语音信息所属含义;
将语音特征识别后所判定语音信息所属含义与预设的话术场景比对,判定通话场景模式。
7.根据权利要求5所述的基于智能语音处理的手机来电信息处理方法,其特征在于,应答方式至少包括应答开场白和语音声音类型及机主插话信息。
8.根据权利要求7所述的基于智能语音处理的手机来电信息处理方法,其特征在于,所述语音声音类型包括APP终端自带的声音类型和机主通过平台学习构建的声音模型。
9.根据权利要求8所述的基于智能语音处理的手机来电信息处理方法,其特征在于,机主通过平台学习构建声音模型的具体步骤包括:
采集声音片段和待合成的文字;
提取声音片段中的声音特征,并将声音特征通过声音特征编码器进行编码处理;
将待合成的文字通过文本向量生成器生成文本向量;
将文本向量和编码后的声音特征相互嵌入语音合成器中并生成频谱;
将频谱导入声码器中生成语音信号,构建成声音模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211484240.4A CN115866118A (zh) | 2022-11-24 | 2022-11-24 | 一种基于智能语音处理的手机来电信息处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211484240.4A CN115866118A (zh) | 2022-11-24 | 2022-11-24 | 一种基于智能语音处理的手机来电信息处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115866118A true CN115866118A (zh) | 2023-03-28 |
Family
ID=85666022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211484240.4A Pending CN115866118A (zh) | 2022-11-24 | 2022-11-24 | 一种基于智能语音处理的手机来电信息处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115866118A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107404586A (zh) * | 2017-08-30 | 2017-11-28 | 努比亚技术有限公司 | 一种来电拒接的方法、终端及可读存储介质 |
CN110401777A (zh) * | 2019-08-02 | 2019-11-01 | 上海尊源通讯技术有限公司 | 一种基于移动通讯终端的ai电话秘书系统 |
CN112261234A (zh) * | 2020-10-23 | 2021-01-22 | 北京蓦然认知科技有限公司 | 一种语音助手执行本地任务的方法及语音助手 |
-
2022
- 2022-11-24 CN CN202211484240.4A patent/CN115866118A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107404586A (zh) * | 2017-08-30 | 2017-11-28 | 努比亚技术有限公司 | 一种来电拒接的方法、终端及可读存储介质 |
CN110401777A (zh) * | 2019-08-02 | 2019-11-01 | 上海尊源通讯技术有限公司 | 一种基于移动通讯终端的ai电话秘书系统 |
CN112261234A (zh) * | 2020-10-23 | 2021-01-22 | 北京蓦然认知科技有限公司 | 一种语音助手执行本地任务的方法及语音助手 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2105034C (en) | Speaker verification with cohort normalized scoring | |
US10182148B2 (en) | Method and system for filtering undesirable incoming telephone calls | |
US6466653B1 (en) | Text-to-speech preprocessing and conversion of a caller's ID in a telephone subscriber unit and method therefor | |
US8391445B2 (en) | Caller identification using voice recognition | |
US7027986B2 (en) | Method and device for providing speech-to-text encoding and telephony service | |
US9361888B2 (en) | Method and device for providing speech-to-text encoding and telephony service | |
US6870914B1 (en) | Distributed text-to-speech synthesis between a telephone network and a telephone subscriber unit | |
US6724866B2 (en) | Dialogue device for call screening and classification | |
WO2003088211A1 (en) | Dynamic and adaptive selection of vocabulary and acoustic models based on a call context for speech recognition | |
WO1994026054A1 (en) | Apparatus and method for transparent telephony | |
JPH10513033A (ja) | 電気通信網に基づく音声ダイヤル呼び出しのための自動語彙作成 | |
KR19990067916A (ko) | 자동 호출 및 데이터 전송 프로세싱 시스템 및 방법 | |
CN111683175B (zh) | 一种自动应答来电的方法、装置、设备及存储介质 | |
US20110173001A1 (en) | Sms messaging with voice synthesis and recognition | |
US20030125947A1 (en) | Network-accessible speaker-dependent voice models of multiple persons | |
CN111179936A (zh) | 通话录音监控方法 | |
US20030233231A1 (en) | Apparatus and method for managing privacy using voice recognition and caller identification | |
CN115866118A (zh) | 一种基于智能语音处理的手机来电信息处理方法 | |
JP2010002973A (ja) | 音声データ主題推定装置およびこれを用いたコールセンタ | |
US20020038212A1 (en) | Telephony system with subtitles and/or translation | |
US20070286395A1 (en) | Intelligent Multimedia Dial Tone | |
KR20040008990A (ko) | 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체 | |
EP0942575A2 (en) | Adaptive telephone answering system | |
US20070116212A1 (en) | Dynamic call announcement using recipient identification | |
CN112673614B (zh) | 电话交换机、保持音通知方法和存储保持音通知程序的计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |