CN112612880A - 用户主导的开放式智能ai语料提交审核系统及方法 - Google Patents

用户主导的开放式智能ai语料提交审核系统及方法 Download PDF

Info

Publication number
CN112612880A
CN112612880A CN202011497202.3A CN202011497202A CN112612880A CN 112612880 A CN112612880 A CN 112612880A CN 202011497202 A CN202011497202 A CN 202011497202A CN 112612880 A CN112612880 A CN 112612880A
Authority
CN
China
Prior art keywords
user
corpus
auditing
content
chat
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011497202.3A
Other languages
English (en)
Inventor
韦莉婷
李兰静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Gugu Honglan Artificial Intelligence Technology Co ltd
Original Assignee
Shanghai Gugu Honglan Artificial Intelligence Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Gugu Honglan Artificial Intelligence Technology Co ltd filed Critical Shanghai Gugu Honglan Artificial Intelligence Technology Co ltd
Priority to CN202011497202.3A priority Critical patent/CN112612880A/zh
Publication of CN112612880A publication Critical patent/CN112612880A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及AI技术领域,具体涉及一种用户主导的开放式智能AI语料提交审核系统及方法,包括用于用户设置个人信息、偏好、提交语料信息的用户数据输入模块;用于储存用户提交的人物设定和用户贡献的语料的信息储存模块;用于审核用户提交语料审核模块。本发明采用多角色,多性格的人机交互模式,用户可以自行选择符合期待的AI性格与身份,或建立独创的AI性格,AI角色通过分析用户提交的语料与性格设置,输出符合用户期待的回复内容,从输入到输出,一切都由用户主导,作为开放式的语料提交和审核系统,可对用户的行为模式与期待回复进行个性化判断,通过用户提交的数据,生成完美的人物性格角色设定,满足用户深层次的情感需求。

Description

用户主导的开放式智能AI语料提交审核系统及方法
技术领域
本发明涉及AI技术领域,具体涉及一种用户主导的开放式智能AI语料提交审核系统及方法。
背景技术
随着科技的发展与智能手机的普及,越来越多的人了解到了AI技术与人机对话技术,人们期待着人机对话AI能够更好的满足个人的对话需求,但目前的技术很难满足这一点。
而由用户主导的开放式智能AI语料提交和审核系统,是以前从未被使用过的模式。
目前大部分人机对话系统,都仅停留在单一角色,单一性格的对话模式,而本系统创新性的采用多角色,多性格的人机交互模式,用户可以自行选择符合期待的AI性格与身份,或建立独创的AI性格,AI角色通过分析用户提交的语料与性格设置,输出符合用户期待的回复内容,从输入到输出,一切都由用户主导,作为开放式的语料提交和审核系统,可对用户的行为模式与期待回复进行个性化判断,通过用户提交的数据,生成完美的人物性格角色设定,满足用户深层次的情感需求。
发明内容
针对现有技术的不足,本发明公开了一种用户主导的开放式智能AI语料提交审核系统及方法,用于解决目前大部分人机对话系统,都仅停留在单一角色,单一性格的对话模式的问题。
本发明通过以下技术方案予以实现:
第一方面,本发明公开一种用户主导的开放式智能AI语料提交审核系统,包括用于用户设置个人信息、偏好、提交语料信息的用户数据输入模块;用于储存用户提交的人物设定和用户贡献的语料的信息储存模块;用于审核用户提交语料语料审核模块。
更进一步的,所述用户数据输入模块包括个人信息设置单元、语料录入单元和聊天偏好设置单元。
更进一步的,所述个人信息设置单元用于设置用户出生日期、星座、性别、年龄、所在地;所述聊天偏好设置单元用于设置聊天角色、头像、角色称谓、角色对自己的昵称;所述语料录入单元,用于用户提交聊天语料。
更进一步的,所述语料审核模块包括规则匹配单元、内容分类单元和语境考察单元。
更进一步的,所述系统包括审核判定单元。
更进一步的,所述规则匹配单元用于对用户输入的聊天语料进行规则匹配;所述内容分类单元用于筛选用户提交的聊天语料分类;所述语境考察单元用于考察该聊天语料将应用的实际单元;所述审核判定单元用于最终判定审核结果并输出给用户。
更进一步的,所述审核判定单元包括用户提交获得审核资格的申请和审核系统、机审系统和用户反馈系统,用户提交成为角色审核官的申请,系统通过用户提交申请时作答预设题目的正确率来授予符合要求的用户审核资格;
所述机审系统包括违规内容审核、去重审核,用于拒绝用户提交的含黄赌毒政以及和库内语料高度重复的语料;
所述审核系统,获得审核资格的用户将拥有审核通过机审的语料的权利,根据主观感受判定语料通过或者拒绝;
所述用户反馈系统,被通过的语料被分发给用户之后,当用户拉黑、投诉的概率低于系统预设,这些语料会重新被拒绝并移出系统的语料库。
第二方面,本发明公开一种用户主导的开放式智能AI语料提交审核方法,所述方法被执行时使用第一方面所述的用户主导的开放式智能AI语料提交审核系统,其特征在于,所述方法包括以下步骤:
S1输入语料适用的关键词,并选择语料适用的角色设定以及与用户的人物关系;
S2输入语料具体信息完成语料录入;
S3进入语料审核,对用户输入的聊天语料进行规则匹配;
S4对用户提交的聊天语料进行筛选并分类;
S5考察该聊天语料将应用的实际单元是否合理;
S6最终判定审核结果并输出给用户。
更进一步的,所述方法中,输入语料适用的关键词包括角色昵称关键词和回复消息关键词。
更进一步的,所述S3中,对用户输入的聊天语料进行规则匹配,并查看是否符合提交规则。
更进一步的,所述S5中,考察该聊天语料将应用的实际单元是否合理,并判断有无敏感或重复信息,所述方法包括以下步骤:
S1,针对用户提交的内容,使用第三方提供的内容审核系统,将触发了违规信息的内容拒绝并退回给用户;
S2,针对通过了S1审核机制的内容进行第二次系统审核,将用户提交的内容与历史语料匹配相似度,相似度达到90%以上的内容将被标记为重复内容,返回拒绝信息并退回给用户;
S3,针对通过了S2审核机制的内容,将其分发给拥有审核资格的用户,当拥有审核资格的用户投票“通过”的数量达到系统要求,该内容将会正式收录进AI语言库,根据一定的算法推送给符合触发条件的用户;当拥有审核资格的用户投票“拒绝”数量达到系统要求,该内容将会返回拒绝信息并退回给用户。
本发明的有益效果为:
本发明采用多角色,多性格的人机交互模式,用户可以自行选择符合期待的AI性格与身份,或建立独创的AI性格,AI角色通过分析用户提交的语料与性格设置,输出符合用户期待的回复内容,从输入到输出,一切都由用户主导,作为开放式的语料提交和审核系统,可对用户的行为模式与期待回复进行个性化判断,通过用户提交的数据,生成完美的人物性格角色设定,满足用户深层次的情感需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是一种用户主导的开放式智能AI语料提交审核系统结构框图;
图2是一种用户主导的开放式智能AI语料提交审核方法的原理步骤图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本实施例公开如图1所示的一种用户主导的开放式智能AI语料提交审核系统,包括用于用户设置个人信息、偏好、提交语料信息的用户数据输入模块;用于储存用户提交的人物设定和用户贡献的语料的信息储存模块;用于审核用户提交语料审核模块。
本实施例中,用户数据输入模块包括个人信息设置单元、语料录入单元和聊天偏好设置单元。个人信息设置单元用于设置用户出生日期、星座、性别、年龄、所在地;聊天偏好设置单元用于设置聊天角色、头像、角色称谓、角色对自己的昵称;语料录入单元,用于用户提交聊天语料。
本实施例中,语料审核模块包括规则匹配单元、内容分类单元、语境考察单元和审核判定单元,规则匹配单元用于对用户输入的聊天语料进行规则匹配;内容分类单元用于筛选用户提交的聊天语料分类;所述语境考察单元用于考察该聊天语料将应用的实际单元;审核判定单元用于最终判定审核结果并输出给用户。
实施例2
本实施例公开如图2所示的一种用户主导的开放式智能AI语料提交审核方法,包括以下步骤:
S1输入语料适用的关键词,并选择语料适用的角色设定以及与用户的人物关系;
S2输入语料具体信息完成语料录入;
S3进入语料审核,对用户输入的聊天语料进行规则匹配;
S4对用户提交的聊天语料进行筛选并分类;
S5考察该聊天语料将应用的实际单元是否合理;
S6最终判定审核结果并输出给用户。
本实施例中,输入语料适用的关键词包括角色昵称关键词和回复消息关键词。
本实施例S3中,对用户输入的聊天语料进行规则匹配,并查看是否符合提交规则。
本实施例S5中,考察该聊天语料将应用的实际单元是否合理,并判断有无敏感或重复信息,所述方法包括以下步骤:
S1,针对用户提交的内容,使用第三方提供的内容审核系统,将触发了违规信息的内容拒绝并退回给用户;
S2,针对通过了S1审核机制的内容进行第二次系统审核,将用户提交的内容与历史语料匹配相似度,相似度达到90%以上的内容将被标记为重复内容,返回拒绝信息并退回给用户;
S3,针对通过了S2审核机制的内容,将其分发给拥有审核资格的用户,当拥有审核资格的用户投票“通过”的数量达到系统要求,该内容将会正式收录进AI语言库,根据一定的算法推送给符合触发条件的用户;当拥有审核资格的用户投票“拒绝”数量达到系统要求,该内容将会返回拒绝信息并退回给用户。
实施例3
本实施例公开一种由用户主导的开放式智能AI语料提交和审核系统,包括用户数据输入模块,信息储存模块,语料审核模块。
用户数据输入客户端模块,用于用户设置个人信息、偏好、提交语料信息。
个人信息,用户自行输入出生日期、星座、性别、年龄、所在地。
聊天偏好,用户自行选择角色(如爸爸、妈妈、男朋友、女朋友、儿子、女儿)及角色性格(如温柔、霸道、可爱),设置角色头像、角色称谓、角色对自己的称谓。
提交语料信息,用户通过手持设备输入并提交的语料信息。
信息储存模块,用于储存用户提交的人物设定和用户贡献的语料。
语料审核模块,用于审核用户提交语料,包括规则匹配单元,内容分类单元,语境考察单元,审核判定单元。
规则匹配单元,对用户输入的聊天语料进行规则匹配;
内容分类单元,筛选用户提交的聊天语料分类;
语境考察单元,考察该聊天语料将应用的实际单元;
审核判定单元,最终判定审核结果并输出给用户。
实施例4
本实施例公开语料录入单元录入语料的步骤:
步骤1:输入语料适用的关键词(包括角色昵称关键词和回复消息关键词);
步骤2:选择语料适用的角色设定以及与用户的人物关系;
步骤3:输入语料具体信息。
实施例5
本实施例公开5、语料审核模块步骤:
步骤1:选对用户输入的聊天语料进行规则匹配,查看是否符合提交规则;
步骤2:对用户提交的聊天语料进行筛选并分类;
步骤3:考察该聊天语料将应用的实际单元是否合理,有无敏感或重复信息;
步骤4:最终判定审核结果并输出给用户。
综上,本发明采用多角色,多性格的人机交互模式,用户可以自行选择符合期待的AI性格与身份,或建立独创的AI性格,AI角色通过分析用户提交的语料与性格设置,输出符合用户期待的回复内容,从输入到输出,一切都由用户主导。
作为开放式的语料提交和审核系统,可对用户的行为模式与期待回复进行个性化判断,通过用户提交的数据,生成完美的人物性格角色设定,满足用户深层次的情感需求。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (11)

1.一种用户主导的开放式智能AI语料提交审核系统,其特征在于,包括用于用户设置个人信息、偏好、提交语料信息的用户数据输入模块;用于储存用户提交的人物设定和用户贡献的语料的信息储存模块;用于审核用户提交语料审核模块。
2.根据权利要求1所述的用户主导的开放式智能AI语料提交审核系统,其特征在于,所述用户数据输入模块包括个人信息设置单元、语料录入单元和聊天偏好设置单元。
3.根据权利要求2所述的用户主导的开放式智能AI语料提交审核系统,其特征在于,所述个人信息设置单元用于设置用户出生日期、星座、性别、年龄、所在地;所述聊天偏好设置单元用于设置聊天角色、头像、角色称谓、角色对自己的昵称;所述语料录入单元,用于用户提交聊天语料。
4.根据权利要求1所述的用户主导的开放式智能AI语料提交审核系统,其特征在于,所述语料审核模块包括规则匹配单元、内容分类单元和语境考察单元。
5.根据权利要求1所述的用户主导的开放式智能AI语料提交审核系统,其特征在于,所述系统包括审核判定单元。
6.根据权利要求4所述的用户主导的开放式智能AI语料提交审核系统,其特征在于,所述规则匹配单元用于对用户输入的聊天语料进行规则匹配;所述内容分类单元用于筛选用户提交的聊天语料分类;所述语境考察单元用于考察该聊天语料将应用的实际单元;所述审核判定单元用于最终判定审核结果并输出给用户。
7.根据权利要求5所述的用户主导的开放式智能AI语料提交审核系统,其特征在于,所述审核判定单元包括用户提交获得审核资格的申请和审核系统、机审系统和用户反馈系统,用户提交成为角色审核官的申请,系统通过用户提交申请时作答预设题目的正确率来授予符合要求的用户审核资格;
所述机审系统包括违规内容审核、去重审核,用于拒绝用户提交的含黄赌毒政以及和库内语料高度重复的语料;
所述审核系统,获得审核资格的用户将拥有审核通过机审的语料的权利,根据主观感受判定语料通过或者拒绝;
所述用户反馈系统,被通过的语料被分发给用户之后,当用户拉黑、投诉的概率低于系统预设,这些语料会重新被拒绝并移出系统的语料库。
8.一种用户主导的开放式智能AI语料提交审核方法,所述方法被执行时使用如权利要求1-7任一项所述的用户主导的开放式智能AI语料提交审核系统,其特征在于,所述方法包括以下步骤:
S1输入语料适用的关键词,并选择语料适用的角色设定以及与用户的人物关系;
S2输入语料具体信息完成语料录入;
S3进入语料审核,对用户输入的聊天语料进行规则匹配;
S4对用户提交的聊天语料进行筛选并分类;
S5考察该聊天语料将应用的实际单元是否合理;
S6最终判定审核结果并输出给用户。
9.根据权利要求8所述的用户主导的开放式智能AI语料提交审核方法,其特征在于,所述方法中,输入语料适用的关键词包括角色昵称关键词和回复消息关键词。
10.根据权利要求8所述的用户主导的开放式智能AI语料提交审核方法,其特征在于,所述S3中,对用户输入的聊天语料进行规则匹配,并查看是否符合提交规则。
11.根据权利要求8所述的用户主导的开放式智能AI语料提交审核方法,其特征在于,所述S5中,考察该聊天语料将应用的实际单元是否合理,并判断有无敏感或重复信息,所述方法包括以下步骤:
S1,针对用户提交的内容,使用第三方提供的内容审核系统,将触发了违规信息的内容拒绝并退回给用户;
S2,针对通过了S1审核机制的内容进行第二次系统审核,将用户提交的内容与历史语料匹配相似度,相似度达到90%以上的内容将被标记为重复内容,返回拒绝信息并退回给用户;
S3,针对通过了S2审核机制的内容,将其分发给拥有审核资格的用户,当拥有审核资格的用户投票“通过”的数量达到系统要求,该内容将会正式收录进AI语言库,根据一定的算法推送给符合触发条件的用户;当拥有审核资格的用户投票“拒绝”数量达到系统要求,该内容将会返回拒绝信息并退回给用户。
CN202011497202.3A 2020-12-17 2020-12-17 用户主导的开放式智能ai语料提交审核系统及方法 Pending CN112612880A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011497202.3A CN112612880A (zh) 2020-12-17 2020-12-17 用户主导的开放式智能ai语料提交审核系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011497202.3A CN112612880A (zh) 2020-12-17 2020-12-17 用户主导的开放式智能ai语料提交审核系统及方法

Publications (1)

Publication Number Publication Date
CN112612880A true CN112612880A (zh) 2021-04-06

Family

ID=75240990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011497202.3A Pending CN112612880A (zh) 2020-12-17 2020-12-17 用户主导的开放式智能ai语料提交审核系统及方法

Country Status (1)

Country Link
CN (1) CN112612880A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113435859A (zh) * 2021-07-12 2021-09-24 建信金融科技有限责任公司 信访件处理方法、装置、电子设备和计算机可读介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102098332A (zh) * 2010-12-30 2011-06-15 北京新媒传信科技有限公司 一种内容审核方法和装置
US20170212949A1 (en) * 2016-01-21 2017-07-27 Adobe Systems Incorporated Auditing and Augmenting User-Generated Tags for Digital Content
CN109831698A (zh) * 2018-12-28 2019-05-31 广州华多网络科技有限公司 信息审核方法、装置、电子设备及计算机可读取存储介质
CN109947895A (zh) * 2019-02-20 2019-06-28 徐江涛 一种对话聊天模式的记账系统
CN110458627A (zh) * 2019-08-19 2019-11-15 华南师范大学 一种面向用户动态偏好的商品序列个性化推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102098332A (zh) * 2010-12-30 2011-06-15 北京新媒传信科技有限公司 一种内容审核方法和装置
US20170212949A1 (en) * 2016-01-21 2017-07-27 Adobe Systems Incorporated Auditing and Augmenting User-Generated Tags for Digital Content
CN109831698A (zh) * 2018-12-28 2019-05-31 广州华多网络科技有限公司 信息审核方法、装置、电子设备及计算机可读取存储介质
CN109947895A (zh) * 2019-02-20 2019-06-28 徐江涛 一种对话聊天模式的记账系统
CN110458627A (zh) * 2019-08-19 2019-11-15 华南师范大学 一种面向用户动态偏好的商品序列个性化推荐方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113435859A (zh) * 2021-07-12 2021-09-24 建信金融科技有限责任公司 信访件处理方法、装置、电子设备和计算机可读介质

Similar Documents

Publication Publication Date Title
CN109256136B (zh) 一种语音识别方法和装置
JP6502965B2 (ja) コミュニケーション提供システム及びコミュニケーション提供方法
CN110276067B (zh) 文本意图确定方法以及装置
CN110610705A (zh) 一种基于人工智能的语音交互提示器
CN111858892A (zh) 基于知识图谱的语音交互方法、装置、设备及介质
CN105989550A (zh) 一种在线服务评价信息确定方法及设备
CN110929043A (zh) 业务问题提取方法及装置
CN107341157B (zh) 一种客服对话聚类方法和装置
CN108363699A (zh) 一种基于百度贴吧的网民学业情绪分析方法
CN112035634A (zh) 文本情绪检测方法、装置、设备及存储介质
CN112446210A (zh) 用户性别预测方法、装置及电子设备
CN117332072B (zh) 对话处理、语音摘要提取以及目标对话模型训练方法
CN113434670A (zh) 话术文本生成方法、装置、计算机设备和存储介质
JP6649318B2 (ja) 言語情報分析装置および方法
CN115272540A (zh) 基于虚拟客服形象的处理方法和装置、设备、介质
CN116881429A (zh) 一种基于多租户的对话模型交互方法、装置及存储介质
JP6831522B2 (ja) コミュニケーションシステム
CN112612880A (zh) 用户主导的开放式智能ai语料提交审核系统及方法
CN113591489B (zh) 语音交互方法、装置及相关设备
CN111046177A (zh) 一种仲裁案件自动预判方法及装置
CN108733672B (zh) 实现网络信息质量评估的方法和系统
CN112597292A (zh) 问题回复推荐方法、装置、计算机设备和存储介质
CN111400489A (zh) 对话文本摘要生成方法、装置、电子设备和存储介质
CN116108177A (zh) 一种语音交互与品牌定位关系的评价方法及装置
CN111818290B (zh) 一种在线访谈的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210406

RJ01 Rejection of invention patent application after publication