CN111737589A - 一种基于人工智能的推荐方法、装置及系统 - Google Patents

一种基于人工智能的推荐方法、装置及系统 Download PDF

Info

Publication number
CN111737589A
CN111737589A CN202010860428.9A CN202010860428A CN111737589A CN 111737589 A CN111737589 A CN 111737589A CN 202010860428 A CN202010860428 A CN 202010860428A CN 111737589 A CN111737589 A CN 111737589A
Authority
CN
China
Prior art keywords
audio data
recorded audio
standard
recorded
standard audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010860428.9A
Other languages
English (en)
Inventor
刘雨泽
李伟彤
刘征宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Quanqing Culture Media Co ltd
Original Assignee
Beijing Quanqing Culture Media Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Quanqing Culture Media Co ltd filed Critical Beijing Quanqing Culture Media Co ltd
Priority to CN202010860428.9A priority Critical patent/CN111737589A/zh
Publication of CN111737589A publication Critical patent/CN111737589A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于人工智能的推荐方法、装置、系统、可读介质及电子设置,该推荐方法包括:获取待推荐用户对应的第一录制音频数据;确定所述第一录制音频数据对应的第一标准音频数据和乐谱图像;根据所述乐谱图像对所述第一录制音频数据和所述第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据;根据所述第二录制音频数据、所述第二标准音频数据和预设评价规则,获取所述第一录制音频数据的评价结果;根据所述第一录制音频数据对应的评价结果,向所述待推荐用户进行内容推荐。本发明提供的技术方案通过人工智能技术,可以向待推荐用户进行具有针对性的智能推荐,具有适用范围广,效率高,提升速度快的优点。

Description

一种基于人工智能的推荐方法、装置及系统
技术领域
本发明涉及人工智能领域,尤其涉及一种基于人工智能的推荐方法、装置及系统。
背景技术
音乐作为自人类诞生以来就和人类历史有着千丝万缕联系的古老领域,既是一门有着厚重历史积淀、深入研究价值的学科,也是人们日常生活中离不开的休闲娱乐方式。随着互联网时代的到来,移动式唱歌的娱乐方式也越来越流行,歌唱成为了越来越多人的兴趣爱好,从而也导致有越来越多的人想提升自己的歌唱水平。
然而目前用户想要提升歌唱水平,往往需要参加正规音乐学习班、音乐兴趣班、音乐提高班等课堂以了解各种音乐知识和技巧,然而这种提升方式具有地点限制、时间限制、进度限制、老师水平限制等缺点,难以满足当代人想提升歌唱水平的需求,因此为想提升歌唱水平的用户确定一种具有针对性的关于音乐知识和技巧的智能推荐方法是至关重要的。
发明内容
本发明提供了一种基于人工智能的推荐方法、装置、系统、可读介质及电子设备,通过人工智能技术,可以向用户进行针对性的智能推荐,使得用户可以随时随地的进行针对性学习,并且具有适用范围广,效率高,提升速度快的优点,可以满足当代人提升歌唱水平的需求。
第一方面,本发明提供了一种基于人工智能的推荐方法,包括:
获取待推荐用户对应的第一录制音频数据;
确定所述第一录制音频数据对应的第一标准音频数据和乐谱图像;
根据所述乐谱图像对所述第一录制音频数据和所述第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据;
根据所述第二录制音频数据、所述第二标准音频数据和预设评价规则,获取所述第一录制音频数据的评价结果;
根据所述第一录制音频数据对应的评价结果,向所述待推荐用户进行内容推荐。
优选地,
所述根据所述乐谱图像对所述第一录制音频数据和所述第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据,包括:
识别所述乐谱图像中的音符携带的指示信息;
根据所述指示信息对所述第一录制音频数据和所述第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据。
优选地,
所述识别所述乐谱图像中的音符携带的指示信息,包括:
确定所述乐谱图像的乐谱类型;
根据所述乐谱类型,在预先构建的乐谱识别模型中选择当前识别模型;
将所述乐谱图像输入所述当前识别模型,确定所述乐谱图像中音符携带的指示信息。
优选地,
所述根据所述第二录制音频数据、所述第二标准音频数据和预设评价规则,获取所述第一录制音频数据的评价结果,包括:
确定所述第二录制音频数据和所述第二标准音频数据中的各个乐句在音高、节奏和唱词上各自对应的相似度;
根据所述第二录制音频数据和所述第二标准音频数据中的各个乐句在音高、节奏和唱词上各自对应的相似度和预设评价规则,获取所述第一录制音频数据的评价结果。
优选地,
所述根据所述第二录制音频数据和所述第二标准音频数据中的各个乐句在音高、节奏和唱词上各自对应的相似度和预设评价规则,获取所述第一录制音频数据的评价结果,包括:
确定所述第二标准音频数据中各个乐句在预设评价规则中分别对应的音高规则、节奏规则和唱词规则;
确定所述第二标准音频数据中的各个乐句在预设评价规则中分别对应的音高权重、节奏权重和唱词权重;
根据所述第二录制音频数据和所述第二标准音频数据中的各个乐句在音高、节奏和唱词上各自对应的相似度以及对应的所述音高规则、所述节奏规则、所述唱词规则、所述音高权重、所述节奏权重、所述唱词权重,获取所述第一录制音频数据的评价结果。
优选地,
所述根据所述第一录制音频数据对应的评价结果,向所述待推荐用户进行内容推荐,包括:
确定与所述评价结果中的数据信息存在映射关系的练习项;
根据所述评价结果对应的至少一个练习项,向所述待推荐用户进行内容推荐。
第二方面,本发明提供了一种基于人工智能的推荐装置,包括:
第一获取模块,用于获取待推荐用户对应的第一录制音频数据;
确定处理模块,用于确定所述第一录制音频数据对应的第一标准音频数据和乐谱图像;
第二获取模块,用于根据所述乐谱图像对所述第一录制音频数据和所述第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据;
第三获取模块,用于根据所述第二录制音频数据、所述第二标准音频数据和预设评价规则,获取所述第一录制音频数据的评价结果;
推荐处理模块,用于根据所述第一录制音频数据对应的评价结果,向所述待推荐用户进行内容推荐。
第三方面,本发明提供了一种基于人工智能的推荐系统,包括:前端、后端、服务端以及如第二方面所述的基于人工智能的推荐装置;
所述前端,用于获取待推荐用户的第一录制音频数据,并将所述第一录制音频数据发送至所述服务端;
所述服务端,用于接收所述前端发送的所述第一录制音频数据,调取所述后端存储的所述第一录制音频数据对应的第一标准音频数据,将所述第一录制音频数据和所述第一标准音频数据发送至所述基于人工智能的推荐装置,并接收所述基于人工智能的推荐装置发送的向所述待推荐用户进行内容推荐的推荐数据,将所述推荐数据发送至所述前端。
第四方面,本发明提供了一种可读介质,包括执行指令,当电子设备的处理器执行所述执行指令时,所述电子设备执行如第一方面任一所述的方法。
第五方面,本发明提供了一种电子设备,包括处理器以及存储有执行指令的存储器,当所述处理器执行所述存储器存储的所述执行指令时,所述处理器执行如第一方面中任一所述的方法。
本发明提供了一种基于人工智能的推荐方法、装置、系统、可读介质及电子设备,该方法通过获取待推荐用户对应的第一录制音频数据,然后确定第一录制音频数据对应的第一标准音频数据和乐谱图像,进一步地根据乐谱图像对第一录制音频数据和第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据,进而可以根据第二录制音频数据、第二标准音频数据和预设评价规则,获取第一录制音频数据的评价结果,再根据第一录制音频数据对应的评价结果,向待推荐用户进行内容推荐,当待推荐用户接收到推荐内容时,可以根据推荐内容中指出的问题和练习方法进行改进,提升歌唱水平,从而本发明提供的技术方案,通过人工智能技术,实现向用户进行针对性的智能推荐,使得待推荐用户不受地点、时间、进度等限制,实现随时随地的针对性学习,具有适用范围广,效率高,提升速度快的优点,可以满足当代人提升歌唱水平的需求。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中提供的第一种基于人工智能的推荐方法的流程示意图;
图2为本发明实施例中提供的第二种基于人工智能的推荐方法的流程示意图;
图3为本发明实施例中提供的第三种基于人工智能的推荐方法的流程示意图;
图4为本发明实施例中提供的第四种基于人工智能的推荐方法的流程示意图;
图5为本发明实施例中提供的第五种基于人工智能的推荐方法的流程示意图;
图6为本发明实施例中提供的第六种基于人工智能的推荐方法的流程示意图;
图7为本发明实施例中提供的一种基于人工智能的推荐装置的结构示意图;
图8为本发明实施例中提供的一种基于人工智能的推荐系统的结构示意图;
图9为本发明实施例中提供的一种电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本发明的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。根据本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
第一方面,如图1所示,本发明实施例提供一种基于人工智能的推荐方法,该方法包括:
步骤101,获取待推荐用户对应的第一录制音频数据;
步骤102,确定所述第一录制音频数据对应的第一标准音频数据和乐谱图像;
步骤103,根据所述乐谱图像对所述第一录制音频数据和所述第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据;
步骤104,根据所述第二录制音频数据、所述第二标准音频数据和预设评价规则,获取所述第一录制音频数据的评价结果;
步骤105,根据所述第一录制音频数据对应的评价结果,向所述待推荐用户进行内容推荐。
如图1所示的基于人工智能的推荐方法通过获取待推荐用户对应的第一录制音频数据,然后确定第一录制音频数据对应的第一标准音频数据和乐谱图像,其中,第一录制音频数据是指待推荐用户录制的可外放收听的音频数据,第一标准音频数据是第一录制音频数据对应的标准的可外放收听的音频数据;进一步地根据乐谱图像对第一录制音频数据和第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据,第二录制音频数据是指对第一录制音频数据进行处理后得到的不可外放收听,可被计算机识别处理的数据,第二标准音频数据是指对第一标准音频数据进行处理后得到的不可外放收听,可被计算机识别处理的数据;进而可以根据第二录制音频数据、第二标准音频数据和预设评价规则,获取第一录制音频数据的评价结果,再根据第一录制音频数据对应的评价结果向待推荐用户进行内容推荐,当待推荐用户接收到推荐内容时,可以根据推荐内容中指出的问题和练习方法进行改进,提升歌唱水平,从而本实施例提供的技术方案,通过人工智能技术,实现向用户进行针对性的智能推荐,使得用户可以不受地点、时间、进度等限制实现随时随地的针对性学习,具有适用范围广,效率高,提升速度快的优点,可以满足当代人提升歌唱水平的需求。
需要说明的是,本实施例中提及的获取第一录制音频数据以及确定第一录制音频数据对应的第一标准音频数据,在一种可能的实现方式中,可以是接收第一录制音频数据和第一录制音频数据对应的第一标准音频数据,也可以是接收第一录制音频数据,然后根据第一录制音频数据在预先存储的标准音频数据库中进行查找,确定出与第一录制音频数据对应的第一标准音频数据。在根据第二录制音频数据、第二标准音频数据和预设评价规则,获取第一录制音频数据的评价结果时,可以对第二录制音频数据、第二标准音频数据进行对比,然后根据预设评价规则,计算出第一录制音频数据的评价结果。
如图2所示,在本发明一个实施例中,步骤103包括:
步骤1031:识别所述乐谱图像中的音符携带的指示信息;
步骤1032:根据所述指示信息对所述第一录制音频数据和所述第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据。
在上述实施例中,因乐谱图像中的不同音符代表着不同的意义,则在对第一录制音频数据和第一标准音频数据进行处理时,需要乐谱图像中的不同音符携带的指示信息提供依据,从而需要识别出乐谱图像中音符携带的指示信息,其中乐谱图像中音符携带的指示信息主要是指音符对应的时值信息,例如在简谱中,需要识别出简谱图中的数字音符,以及各个数字音符对应的增时线和减时线等内容,以确定出简谱中的每一数字音符对应的时值信息。因为指示信息中存在音符的时值信息,因此会对第一录制音频数据和第一标准音频数据进行粒度划分提供依据。在对第一录制音频数据和第一标准音频数据进行处理时,还包括对第一录制音频数据和第一标准音频数据进行加工转换,将第一录制音频数据和第一标准音频数据转换为可被计算机处理的特定数据格式。在对第一录制音频数据和第一标准音频数据进行不同长度的粒度划分和格式转换后得到第二录制音频数据和第二标准音频数据,此时第二录制音频数据和第二标准音频数据是被划分为不同时长的乐句集合。
在一种可能的实现方式中,在根据所述指示信息对所述第一录制音频数据和所述第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据前,需要对第一录制音频数据进行预处理,例如使用LMS自适应滤波器算法对第一录制音频数据进行降噪预处理,或者对第一录制音频数据进行信号放大预处理等等。
需要说明的是,一方面,为了实现本实施例提供的基于人工智能的推荐方法的快速准确进行,通常该推荐方法对应的推荐系统会设置有两类数据库,即用于持久化数据的持久数据库MYSQL数据库和用于缓存数据的内存数据库Reddis数据库,其中MYSQL数据库用于存储每首歌曲的第一标准音频数据和用户使用该系统后跟唱的第一录制音频数据,Reddis数据库用于存储得到第二录制音频数据和第二标准音频数据。另一方面,识别乐谱图像中的音符携带的指示信息和根据该指示信息对第一录制音频数据和第一标准音频数据进行处理可以是先后进行的,也可以是同时的,只要可以快速准确的获取到第二录制音频数据和第二标准音频数据即可。
如图3所述,在本发明一个实施例中,步骤1031包括:
步骤10311,确定所述乐谱图像的乐谱类型;
步骤10312,根据所述乐谱类型,在预先构建的乐谱识别模型中选择当前识别模型;
步骤10313,将所述乐谱图像输入所述当前识别模型,确定所述乐谱图像中音符携带的指示信息。
在上述实施例中,预先根据不同类型乐谱图像训练不同的乐谱识别模型,例如若乐谱图像为五线谱,则确定五线谱对应的乐谱识别模型为当前识别模型,若乐谱图像为简谱,则简谱对应的乐谱识别模型为当前识别模型。在确定了当前识别模型后,将乐谱图像输入到当前识别模型中,从而保证确定出的乐谱图像中音符携带的指示信息较为准确。具体的,可以基于深度学习的卷积神经网络对乐谱图像中的音符进行识别,确定出乐谱图像中音符携带的指示信息,在构建卷积神经网络模型时,可以根据专家给出的先验知识进行构建,以确定出符合预设精度的卷积神经网络模型。
需要说明的是,本实施例中是为确定出更为准确的乐谱图像中音符携带的指示信息,对乐谱图像的乐谱类型进行区分的,当然也可以直接利用大量的各种乐谱图像为样本数据,确定出统一的乐谱识别模型,此时无需对乐谱类型进行判断,将获取到的乐谱图像输入至统一的乐谱识别模型即可确定出乐谱图像中音符携带的指示信息。
如图4所示,在本发明一个实施例中,步骤104包括:
步骤1041,确定所述第二录制音频数据和所述第二标准音频数据中的各个乐句在音高、节奏和唱词上各自对应的相似度;
步骤1042,根据所述第二录制音频数据和所述第二标准音频数据中的各个乐句在音高、节奏和唱词上各自对应的相似度和预设评价规则,获取所述第一录制音频数据的评价结果。
在上述实施例中,通过对第二录制音频数据和第二标准音频数据中的各个乐句进行对比,确定出第二录制音频数据和第二标准音频数据中的各个乐句在音高、节奏和唱词上各自对应的相似度,预先设置一系列的评价规则,从而在确定出第二录制音频数据和第二标准音频数据中的各个乐句在音高、节奏和唱词上各自对应的相似度后,可以确定出第一录制音频数据的评价结果。
需要说明的是,在确定第二录制音频数据和第二标准音频数据中的各个乐句在音高、节奏和唱词上各自对应的相似度时,需要对第二录制音频数据和第二标准音频数据进行再次的不同粒度划分,不同的粒度划分分别对应于音高、节奏和唱词。具体的,可以利用专家规则系统和基于深度学习的循环神经网络进行第二录制音频数据和第二标准音频数据的粒度划分,以确定出第二录制音频数据和第二标准音频数据中的各个乐句在音高、节奏和唱词上各自对应的相似度。
如图5所示,在本发明一个实施例中,步骤1042包括:
步骤10421,确定所述第二标准音频数据中各个乐句在预设评价规则中分别对应的音高规则、节奏规则和唱词规则;
步骤10422,确定所述第二标准音频数据中的各个乐句在预设评价规则中分别对应的音高权重、节奏权重和唱词权重;
步骤10423,根据所述第二录制音频数据和所述第二标准音频数据中的各个乐句在音高、节奏和唱词上各自对应的相似度以及对应的所述音高规则、所述节奏规则、所述唱词规则、所述音高权重、所述节奏权重、所述唱词权重,获取所述第一录制音频数据的评价结果。
在上述实施例中,预设评价规则是关于音高、节奏和唱词的评价体系,每一条目下对应有一系列被细分的评价规则,被细分的评价规则是预先根据专家团队的意见进行人为设置的。因不同的乐句会对应不同的音高、节奏和唱词,因此需要确定出第二标准音频数据中的每一个乐句分别对应的音高规则、节奏规则和唱词规则。为了对某一乐句进行综合评价,需要确定出第二标准音频数据中各个乐句分别对应的音高权重、节奏权重和唱词权重,从而可以根据第二录制音频数据和第二标准音频数据中的某个乐句在音高、节奏和唱词上分别对应的相似度,以及该乐句对应的音高规则、节奏规则、唱词规则、音高权重、节奏权重和唱词权重,经计算确定该乐句的综合评分,并根据第二录制音频数据中的各个乐句的综合评分,确定出第一录制音频数据的评价结果。
值得注意的是,本实施例中可以将不同乐句中的音高权重、节奏权重和唱词权重设置不同的数值,当然也可以为第二标准音频数据设置统一的音高权重、节奏权重和唱词权重,对此,本实施例不作限定。在冷启动的情况下,在确定第二标准音频数据中的各个乐句分别对应的音高权重、节奏权重和唱词权重时使用预先设定的音高权重、节奏权重和唱词权重;当存在较多使用用户后,收集用户的反馈信息,并根据用户的反馈信息建立数学模型以确定音高权重、节奏权重和唱词权重,此时预设评价规则对应的是预先建立的数学模型,并不断利用新的用户的反馈信息对数学模型进行优化,以保证该数学模型的准确性。
在一种可能的实现方式中,因第二录制音频数据中的乐句对应的时长较短,因此可以将不同的乐句进行分区管理,即可以在确定出每一个乐句的综合评分后,再确定出综合评分最低的区域(可以是将每个乐句的综合评分相加,也可以是取每个乐句的综合评分的算术平均值),确定出的综合评分最低的区域即用户存在问题最大的区域,在评价结果中可以仅体现该区域存在的问题,如此可以实现用户歌唱水平的逐步提升。当然也可以在根据预设评价规则对每一个乐句进行评价后,将每一个乐句存在的音高问题、节奏问题和唱词问题均体现在评价结果中,并确定出第一录制音频数据的整体评分和第一录制音频数据中得分最低的乐句,进行突出呈现。
如图6所示,在本发明一个实施例中,步骤105包括:
步骤1051,确定与所述评价结果中的数据信息存在映射关系的练习项;
步骤1052,根据所述评价结果对应的至少一个练习项,向所述待推荐用户进行内容推荐。
在上述实施例中,预先确定评价结果中可能存在的数据信息,即唱歌中可能存在的常见问题,例如节奏过快或过慢、音高不足、唱词不清等,当然也可以根据专家团队给出的唱歌中常见的专业问题进行数据信息的确定。然后根据先验知识,为每一个可能存在的数据信息确定对应的练习项,例如节奏控制训练、呼吸训练、发音训练等等,即预先建立起评价结果中的可能存在的数据信息和练习项的映射关系,从而在确定了第一录制音频数据的评价结果中的数据信息后,可以根据预先建立的映射关系,确定出该数据信息对应的练习项,并根据每一个练习项向待推荐用户进行内容推荐。该内容推荐对应的推荐数据中是根据用户录制的第一录制音频数据得到的,具有针对性,从而可以快速准确的确定用户的不足之处,并指出改进方案,使得用户可以快速的提升歌唱水平。
在一种可能的实现方式中,得到的评价结果中的数据信息对应较多的内容,即可能存在较多的问题,需要为每一个内容找到对应的练习项,从而会确定出至少一个练习项,此时在进行内容推荐时,可以根据先验知识为至少一个练习项进行排序,以便用户可以更快的进步,在推荐内容中可以存在练习项的相关课程安排以及练习时长、练习次数等内容,以为用户提供优质的进阶方案,当然推荐内容还可以包括与待推荐用户的不足之处相关的音乐知识和音乐技巧,用户可以对推荐内容进行选择设置,如推荐内容仅还有练习内容,或者推荐内容含有练习内容,相关音乐知识和音乐技巧等。
第二方面,如图7所示,本发明实施例提供了一种基于人工智能的推荐装置,包括:
第一获取模块701,用于获取待推荐用户对应的第一录制音频数据;
确定处理模块702,用于确定所述第一录制音频数据对应的第一标准音频数据和乐谱图像;
第二获取模块703,用于根据所述乐谱图像对所述第一录制音频数据和所述第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据;
第三获取模块704,用于根据所述第二录制音频数据、所述第二标准音频数据和预设评价规则,获取所述第一录制音频数据的评价结果;
推荐处理模块705,用于根据所述第一录制音频数据对应的评价结果,向所述待推荐用户进行内容推荐。
在上述实施例中,通过第一获取模块701获取待推荐用户对应的第一录制音频数据,然后利用确定处理模块702确定第一录制音频数据对应的第一标准音频数据和乐谱图像,进一步地利用第二获取模块703根据乐谱图像对第一录制音频数据和第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据,进而利用第三获取模块704根据第二录制音频数据、第二标准音频数据和预设评价规则,获取第一录制音频数据的评价结果,再利用推荐处理模块705根据第一录制音频数据对应的评价结果,向待推荐用户进行内容推荐,当待推荐用户接收到推荐内容时,可以根据推荐内容中指出的问题和练习的方法进行改进,提升歌唱水平,从而本实施例提供的基于人工智能的推荐装置可以实现向用户进行针对性的推荐,使得待用户不受地点、时间、进度等限制,随时随地的进行针对性学习,具有适用范围广,效率高,提升速度快的优点,可以满足当代人提升歌唱水平的需求。
需要说明的是,可以对上述基于人工智能的推荐装置进行不同模块的划分,例如,将基于人工智能的推荐装置划分为数据处理与数据交换模块,OCR乐谱图像识别模块,音乐音频分析模块,其中数据处理与数据交换模块用于获取待推荐用户对应的第一录制音频数据,以及确定所述第一录制音频数据对应的第一标准音频数据;OCR乐谱图像识别模块用于确定所述第一录制音频数据对应的乐谱图像,确定乐谱图像中音符携带的指示信息,并使得数据处理与数据交换模块根据该指示信息对所述第一录制音频数据和所述第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据;音乐音频分析模块用于根据所述第二录制音频数据、所述第二标准音频数据和预设评价规则,获取所述第一录制音频数据的评价结果,并根据所述评价结果,向待推荐用户进行内容推荐。
第三方面,如图8所示,本发明实施例提供了一种基于人工智能的推荐系统,包括:前端40、后端50、服务端60以及如第二方面所述的基于人工智能的推荐装置70;
所述前端40,用于获取待推荐用户的第一录制音频数据,并将所述第一录制音频数据发送至所述服务端60;
所述服务端60,用于接收所述前端40发送的所述第一录制音频数据,调取所述后端50存储的所述第一录制音频数据对应的第一标准音频数据,将所述第一录制音频数据和所述第一标准音频数据发送至所述基于人工智能的推荐装置70,并接收所述基于人工智能的推荐装置70发送的向所述待推荐用户进行内容推荐的推荐数据,将所述推荐数据发送至所述前端40。
在上述实施例中,服务端60可以是基于go语言实现的gRPC架构;推荐装置70可以使用轻量级容器虚拟化技术,则可以很好进行隔离资源使用,由内核直接分配相关资源和权限,拥有自己的独立进程;前端40主要是以app,小程序如微信小程序,支付宝小程序,抖音小程序等形式存在。从而使得本实施例提供的基于人工智能的推荐系统既符合目前各类互联网应用移动端化的大趋势,又可以节约维护的成本。
图9是本发明实施例提供的一种电子设备的结构示意图。在硬件层面,该电子设备包括处理器901以及存储有执行指令的存储器902,可选地还包括内部总线903及网络接口904。其中,存储器902可能包含内存9021,例如高速随机存取存储器(Random-AccessMemory,RAM),也可能还包括非易失性存储器9022(non-volatile memory),例如至少1个磁盘存储器等;处理器901、网络接口904和存储器902可以通过内部总线903相互连接,该内部总线903可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等;内部总线903可以分为地址总线、数据总线、控制总线等,为便于表示,图9中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。当然,该电子设备还可能包括其他业务所需要的硬件。当处理器901执行存储器902存储的执行指令时,处理器901执行本发明任意一个实施例中的方法,并至少用于执行如图1~图6任一所示的方法。
在一种可能实现的方式中,处理器从非易失性存储器中读取对应的执行指令到内存中然后运行,也可从其它设备上获取相应的执行指令,以在逻辑层面上形成一种基于人工智能的推荐装置。处理器执行存储器所存放的执行指令,以通过执行的执行指令实现本发明任一实施例中提供的一种基于人工智能的推荐方法。
处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本发明实施例还提供了一种计算机可读存储介质,包括执行指令,当电子设备的处理器执行执行指令时,所述处理器执行本发明任意一个实施例中提供的方法。该电子设备具体可以是如图9所示的电子设备;执行指令是一种基于人工智能的推荐装置所对应计算机程序。
本领域内的技术人员应明白,本发明的实施例可提供为方法或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例,或软件和硬件相结合的形式。
本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者锅炉不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者锅炉所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者锅炉中还存在另外的相同要素。
以上所述仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (10)

1.一种基于人工智能的推荐方法,其特征在于,包括:
获取待推荐用户对应的第一录制音频数据;
确定所述第一录制音频数据对应的第一标准音频数据和乐谱图像;
根据所述乐谱图像对所述第一录制音频数据和所述第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据;
根据所述第二录制音频数据、所述第二标准音频数据和预设评价规则,获取所述第一录制音频数据的评价结果;
根据所述第一录制音频数据对应的评价结果,向所述待推荐用户进行内容推荐。
2.根据权利要求1所述的方法,其特征在于,所述根据所述乐谱图像对所述第一录制音频数据和所述第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据,包括:
识别所述乐谱图像中的音符携带的指示信息;
根据所述指示信息对所述第一录制音频数据和所述第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据。
3.根据权利要求2所述的方法,其特征在于,所述识别所述乐谱图像中的音符携带的指示信息,包括:
确定所述乐谱图像的乐谱类型;
根据所述乐谱类型,在预先构建的乐谱识别模型中选择当前识别模型;
将所述乐谱图像输入所述当前识别模型,确定所述乐谱图像中音符携带的指示信息。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第二录制音频数据、所述第二标准音频数据和预设评价规则,获取所述第一录制音频数据的评价结果,包括:
确定所述第二录制音频数据和所述第二标准音频数据中的各个乐句在音高、节奏和唱词上各自对应的相似度;
根据所述第二录制音频数据和所述第二标准音频数据中的各个乐句在音高、节奏和唱词上各自对应的相似度和预设评价规则,获取所述第一录制音频数据的评价结果。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第二录制音频数据和所述第二标准音频数据中的各个乐句在音高、节奏和唱词上各自对应的相似度和预设评价规则,获取所述第一录制音频数据的评价结果,包括:
确定所述第二标准音频数据中各个乐句在预设评价规则中分别对应的音高规则、节奏规则和唱词规则;
确定所述第二标准音频数据中的各个乐句在预设评价规则中分别对应的音高权重、节奏权重和唱词权重;
根据所述第二录制音频数据和所述第二标准音频数据中的各个乐句在音高、节奏和唱词上各自对应的相似度以及对应的所述音高规则、所述节奏规则、所述唱词规则、所述音高权重、所述节奏权重、所述唱词权重,获取所述第一录制音频数据的评价结果。
6.根据权利要求1所述的方法,其特征在于,所述根据所述第一录制音频数据对应的评价结果,向所述待推荐用户进行内容推荐,包括:
确定与所述评价结果中的数据信息存在映射关系的练习项;
根据所述评价结果对应的至少一个练习项,向所述待推荐用户进行内容推荐。
7.一种基于人工智能的推荐装置,其特征在于,包括:
第一获取模块,用于获取待推荐用户对应的第一录制音频数据;
确定处理模块,用于确定所述第一录制音频数据对应的第一标准音频数据和乐谱图像;
第二获取模块,用于根据所述乐谱图像对所述第一录制音频数据和所述第一标准音频数据进行处理,获取第二录制音频数据和第二标准音频数据;
第三获取模块,用于根据所述第二录制音频数据、所述第二标准音频数据和预设评价规则,获取所述第一录制音频数据的评价结果;
推荐处理模块,用于根据所述第一录制音频数据对应的评价结果,向所述待推荐用户进行内容推荐。
8.一种基于人工智能的推荐系统,其特征在于,包括:前端、后端、服务端以及如权利要求7所述的基于人工智能的推荐装置;
所述前端,用于获取待推荐用户的第一录制音频数据,并将所述第一录制音频数据发送至所述服务端;
所述服务端,用于接收所述前端发送的所述第一录制音频数据,调取所述后端存储的所述第一录制音频数据对应的第一标准音频数据,将所述第一录制音频数据和所述第一标准音频数据发送至所述基于人工智能的推荐装置,并接收所述基于人工智能的推荐装置发送的向所述待推荐用户进行内容推荐的推荐数据,将所述推荐数据发送至所述前端。
9.一种可读介质,包括执行指令,当电子设备的处理器执行所述执行指令时,所述电子设备执行如权利要求1至6中任一所述的方法。
10.一种电子设备,包括处理器以及存储有执行指令的存储器,当所述处理器执行所述存储器存储的所述执行指令时,所述处理器执行如权利要求1至6中任一所述的方法。
CN202010860428.9A 2020-08-25 2020-08-25 一种基于人工智能的推荐方法、装置及系统 Pending CN111737589A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010860428.9A CN111737589A (zh) 2020-08-25 2020-08-25 一种基于人工智能的推荐方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010860428.9A CN111737589A (zh) 2020-08-25 2020-08-25 一种基于人工智能的推荐方法、装置及系统

Publications (1)

Publication Number Publication Date
CN111737589A true CN111737589A (zh) 2020-10-02

Family

ID=72658833

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010860428.9A Pending CN111737589A (zh) 2020-08-25 2020-08-25 一种基于人工智能的推荐方法、装置及系统

Country Status (1)

Country Link
CN (1) CN111737589A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112817832A (zh) * 2021-01-19 2021-05-18 网易(杭州)网络有限公司 游戏服务器的健康状态获取方法、装置、设备及存储介质
CN112839239A (zh) * 2020-12-30 2021-05-25 广州虎牙科技有限公司 一种音视频加工的方法、装置及服务器
CN113076967A (zh) * 2020-12-08 2021-07-06 无锡乐骐科技有限公司 一种基于图像和音频的乐谱双重识别系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103165119A (zh) * 2013-01-31 2013-06-19 华为技术有限公司 K歌方法及系统
CN105788589A (zh) * 2016-05-04 2016-07-20 腾讯科技(深圳)有限公司 一种音频数据的处理方法及装置
CN107909090A (zh) * 2017-10-11 2018-04-13 天津大学 基于测度学习半监督的钢琴乐谱难度识别方法
CN108416359A (zh) * 2018-03-09 2018-08-17 湖南女子学院 一种乐谱识别系统及识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103165119A (zh) * 2013-01-31 2013-06-19 华为技术有限公司 K歌方法及系统
CN105788589A (zh) * 2016-05-04 2016-07-20 腾讯科技(深圳)有限公司 一种音频数据的处理方法及装置
CN107909090A (zh) * 2017-10-11 2018-04-13 天津大学 基于测度学习半监督的钢琴乐谱难度识别方法
CN108416359A (zh) * 2018-03-09 2018-08-17 湖南女子学院 一种乐谱识别系统及识别方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113076967A (zh) * 2020-12-08 2021-07-06 无锡乐骐科技有限公司 一种基于图像和音频的乐谱双重识别系统
CN112839239A (zh) * 2020-12-30 2021-05-25 广州虎牙科技有限公司 一种音视频加工的方法、装置及服务器
CN112839239B (zh) * 2020-12-30 2023-03-21 广州虎牙科技有限公司 一种音视频加工的方法、装置及服务器
CN112817832A (zh) * 2021-01-19 2021-05-18 网易(杭州)网络有限公司 游戏服务器的健康状态获取方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111737589A (zh) 一种基于人工智能的推荐方法、装置及系统
CN108073568B (zh) 关键词提取方法和装置
US9582757B1 (en) Scalable curation system
JP5831951B2 (ja) 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム
CN103425635B (zh) 一种答案推荐方法和装置
CN110347838B (zh) 线上科室分诊模型训练方法及装置
CN110263854B (zh) 直播标签确定方法、装置及存储介质
CN111125334A (zh) 一种基于预训练的搜索问答系统
CN104111925B (zh) 项目推荐方法和装置
CN107967280B (zh) 一种标签推荐歌曲的方法及系统
CN111080055A (zh) 酒店评分方法、酒店推荐方法、电子装置和存储介质
WO2019137392A1 (zh) 文件分类处理方法、装置及终端、服务器、存储介质
CN111782863B (zh) 音频分段方法、装置、存储介质及电子设备
CN109615009B (zh) 一种学习内容推荐方法及电子设备
CN110990533A (zh) 确定查询文本所对应标准文本的方法及装置
CN113807103B (zh) 基于人工智能的招聘方法、装置、设备及存储介质
CN111209363A (zh) 语料数据处理方法、装置、服务器和存储介质
Ünal et al. A hierarchical approach to makam classification of Turkish makam music, using symbolic data
CN114743619B (zh) 一种用于疾病风险预测的调查问卷质量评价方法及系统
CN107832288B (zh) 中文词语语义相似度的度量方法及装置
CN109344232B (zh) 一种舆情信息检索方法及终端设备
CN114328823A (zh) 数据库自然语言查询方法及装置、电子设备、存储介质
CN117973492A (zh) 一种语言模型的微调方法、装置、电子设备及介质
CN113392321A (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN112052686B (zh) 一种用户交互式教育的语音学习资源推送方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201002

RJ01 Rejection of invention patent application after publication