CN112883176B - 基于大数据面向专业职业的人工智能心理健康聊天机器人 - Google Patents

基于大数据面向专业职业的人工智能心理健康聊天机器人 Download PDF

Info

Publication number
CN112883176B
CN112883176B CN202110187082.5A CN202110187082A CN112883176B CN 112883176 B CN112883176 B CN 112883176B CN 202110187082 A CN202110187082 A CN 202110187082A CN 112883176 B CN112883176 B CN 112883176B
Authority
CN
China
Prior art keywords
search
chat
search results
user
search result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110187082.5A
Other languages
English (en)
Other versions
CN112883176A (zh
Inventor
朱定局
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN202110187082.5A priority Critical patent/CN112883176B/zh
Publication of CN112883176A publication Critical patent/CN112883176A/zh
Application granted granted Critical
Publication of CN112883176B publication Critical patent/CN112883176B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/319Inverted lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

基于大数据面向专业职业的人工智能心理健康聊天机器人,包括:专业职业获取步骤;最近聊天语句获取步骤;用户关注度预设权值设置步骤;聊天语句选取步骤。上述方法、系统和机器人,通过用户关注度预设权值来使得聊天语句的选择不但考虑到用户的心理健康状态还考虑到用户的专业职业,从而使得用户在与人工智能机器人聊天时不会觉得浪费时间,而是觉得对于专业职业有帮助,这样就能一举两得,在改进了心理健康的同时也对专业职业有帮助,让忙于专业职业的用户也乐于与机器人进行聊天。

Description

基于大数据面向专业职业的人工智能心理健康聊天机器人
技术领域
本发明涉及人工智能技术领域,特别是涉及一种基于大数据面向专业职业的人工智能心理健康聊天机器人。
背景技术
现有技术下,心理健康聊天机器人使用通用的语料库或与心理健康相关的语料库与用户进行聊天。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有技术下,机器人聊天会花费用户很多时间,有的用户明知自己可能有心理问题,可能也没有时间和机器人聊天,甚至有的用户的心理问题本身就是由于学习或工作太忙、压力太大而导致的,这类用户就更不可能有时间、也不太可能愿意抽出时间来和机器人闲聊,所以现有技术对于那些忙于专业或/和职业的用户而言不适用。
因此,现有技术还有待于改进和发展。
发明内容
基于此,有必要针对现有技术的缺陷或不足,提供基于大数据面向专业职业的人工智能心理健康聊天机器人,将机器人的聊天语句尽量与用户的语句、心理健康知识、用户的专业或/和职业知识相关联,以解决现有技术中机器人的聊天语句与用户专业或/和职业无关,从而占用用户用于专业或/和职业的时间的问题,从而能够使得用户一举两得,既提高了心理健康,又丰富了专业知识和提高了职业能力。例如,和英语专业的人,就使用英语与之进行聊天;和运动员,就尽量使得聊天语句和运动相关;和滑冰运动员,就尽量使得聊天语句和滑冰运动相关,或用知名滑冰运动员的声音或在显示屏显示知名滑冰运动员的形象与之聊天。
第一方面,本发明实施例提供一种人工智能方法,所述方法包括:
专业职业获取步骤:获取用户的专业或/和职业;
最近聊天语句获取步骤:获取机器人与用户最近聊天的语句序列,所述语句序列中的语句按照先后排序;
用户关注度预设权值设置步骤:获取最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值;
聊天语句选取步骤:根据所述用户当前的心理健康状态、用户的专业或/和职业、所述语句序列、当前的聊天模式通过大数据搜索引擎和用户关注度预设权值选取聊天语句发送给用户。
优选地,所述聊天语句选取步骤具体包括:
聊天模式更新步骤:若用户最近输入的语句存在,则所述最近聊天的语句序列至少包括用户最近输入的语句,并将聊天模式设置为回复模式;若用户最近输入的语句不存在且现在距离最近一次聊天语句对应的时间超过了预设等待时长且所述语句序列不为空,则将聊天模式设置为主动续聊模式;若用户最近输入的语句不存在且所述最近聊天的语句序列为空,则将聊天模式设置为主动开聊模式;
不同聊天模式下聊天语句选取步骤:若聊天模式是回复模式,则将所述用户当前的心理健康状态、所述用户的专业或/和职业、所述用户最近输入的语句和所述语句序列输入预设的面向回复的大数据搜索引擎,得到的输出作为对用户的聊天语句;若聊天模式是主动续聊模式,则将所述用户当前的心理健康状态、所述用户的专业或/和职业和最近聊天的语句序列中删除最近一次聊天的语句后的语句序列输入预设的面向续聊的大数据搜索引擎,得到的输出作为对用户的聊天语句;若聊天模式是主动开聊模式,则将所述用户当前的心理健康状态、所述用户的专业或/和职业输入预设的面向开聊的大数据搜索引擎,得到的输出作为对用户的聊天语句。
优选地,所述聊天语句选取步骤具体还包括:
面向回复的大数据搜索引擎构建步骤:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;获取现有的一个或多个搜索引擎或/和具有检索功能的聊天数据库或/和将聊天数据库或/和所述心理健康聊天语料库增加检索功能后作为初始大数据引擎;将预设搜索语句(预设搜索语句包括用户最近输入的语句,例如预设搜索语句为用户最近输入的语句,或用户最近输入的语句与用户的专业或/和职业的组合,或用户最近输入的语句与用户的当前心理健康状态的组合,或用户最近输入的语句与用户的专业或/和职业与用户的当前心理健康状态的组合)作为初始大数据引擎的输入进行搜索,从根据预设排序规则得到的搜索结果中选取前K个搜索结果;将前K个搜索结果中每个搜索结果在排序中的倒排次序作为前K个搜索结果中每个搜索结果对应的第一数量,将前K个搜索结果中每个搜索结果对应的第一数量归一化后得到前K个搜索结果中每个搜索结果对应的第一比例;将前K个搜索结果与最近聊天的语句序列组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第二数量,将前K个搜索结果中每个搜索结果对应的第二数量归一化后得到前K个搜索结果中每个搜索结果对应的第二比例;将前K个搜索结果与用户的心理健康状态组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第三数量,将前K个搜索结果中每个搜索结果对应的第三数量归一化后得到前K个搜索结果中每个搜索结果对应的第三比例;将前K个搜索结果与用户的专业或/和职业组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第四数量,将前K个搜索结果中每个搜索结果对应的第四数量归一化后得到前K个搜索结果中每个搜索结果对应的第四比例;将来源于通用大数据引擎等的搜索结果的来源优先级、来源于通用普通聊天数据库的搜索结果的来源优先级、来源于所述心理健康聊天语料库的搜索结果的来源优先级从低到高进行设置,将前K个搜索结果中每个搜索结果的来源优先级作为前K个搜索结果中每个搜索结果对应的第五数量,将前K个搜索结果中每个搜索结果对应的第五数量归一化后得到前K个搜索结果中每个搜索结果对应的第五比例;将前K个搜索结果中每个搜索结果对应的第一比例、第二比例、第三比例、第四比例、第五比例分别根据最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值进行加权平均得到前K个搜索结果中每个搜索结果对应的优选度,选取对应优选度最高的搜索结果;将初始大数据引擎和上述搜索和结果筛选功能组合为所述预设的面向回复的大数据搜索引擎;将所述对应优选度最高的搜索结果作为所述预设的面向回复的大数据搜索引擎的输出;
面向续聊的大数据搜索引擎构建步骤:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;获取现有的一个或多个搜索引擎或/和具有检索功能的聊天数据库或/和将聊天数据库或/和所述心理健康聊天语料库增加检索功能后作为初始大数据引擎;将预设搜索语句(预设搜索语句包括最近聊天的语句序列中用户最近输入的语句,例如预设搜索语句为最近聊天的语句序列中用户最近输入的语句,或最近聊天的语句序列中用户最近输入的语句与用户的专业或/和职业的组合,或用户最近输入的语句与用户的当前心理健康状态的组合,或最近聊天的语句序列中用户最近输入的语句与用户的专业或/和职业与用户的当前心理健康状态的组合)作为初始大数据引擎的输入进行搜索,从根据预设排序规则得到的搜索结果中选取前K个搜索结果;将前K个搜索结果中每个搜索结果在排序中的倒排次序作为前K个搜索结果中每个搜索结果对应的第一数量,将前K个搜索结果中每个搜索结果对应的第一数量归一化后得到前K个搜索结果中每个搜索结果对应的第一比例;将前K个搜索结果与最近聊天的语句序列组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第二数量,将前K个搜索结果中每个搜索结果对应的第二数量归一化后得到前K个搜索结果中每个搜索结果对应的第二比例;将前K个搜索结果与用户的心理健康状态组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第三数量,将前K个搜索结果中每个搜索结果对应的第三数量归一化后得到前K个搜索结果中每个搜索结果对应的第三比例;将前K个搜索结果与用户的专业或/和职业组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第四数量,将前K个搜索结果中每个搜索结果对应的第四数量归一化后得到前K个搜索结果中每个搜索结果对应的第四比例;将来源于通用大数据引擎等的搜索结果的来源优先级、来源于通用普通聊天数据库的搜索结果的来源优先级、来源于所述心理健康聊天语料库的搜索结果的来源优先级从低到高进行设置,将前K个搜索结果中每个搜索结果的来源优先级作为前K个搜索结果中每个搜索结果对应的第五数量,将前K个搜索结果中每个搜索结果对应的第五数量归一化后得到前K个搜索结果中每个搜索结果对应的第五比例;将前K个搜索结果中每个搜索结果对应的第一比例、第二比例、第三比例、第四比例、第五比例分别根据最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值进行加权平均得到前K个搜索结果中每个搜索结果对应的优选度,选取对应优选度最高的搜索结果;将初始大数据引擎和上述搜索和结果筛选功能组合为所述预设的面向回复的大数据搜索引擎;将所述对应优选度最高的搜索结果作为所述预设的面向回复的大数据搜索引擎的输出;
面向开聊的大数据搜索引擎构建步骤:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;获取现有的一个或多个搜索引擎或/和具有检索功能的聊天数据库或/和将聊天数据库或/和所述心理健康聊天语料库增加检索功能后作为初始大数据引擎;将与用户的专业或/职业相同或相近的预设搜索语句(预设搜索语句包括所述其他用户最近输入的语句,例如预设搜索语句为所述其他用户最近输入的语句,或所述其他用户最近输入的语句与用户的专业或/和职业的组合,或用户最近输入的语句与用户的当前心理健康状态的组合,或最近聊天的语句序列中用户最近输入的语句与用户的专业或/和职业与用户的当前心理健康状态的组合)作为初始大数据引擎的输入进行搜索,从根据预设排序规则得到的搜索结果中选取前K个搜索结果;将前K个搜索结果中每个搜索结果在排序中的倒排次序作为前K个搜索结果中每个搜索结果对应的第一数量,将前K个搜索结果中每个搜索结果对应的第一数量归一化后得到前K个搜索结果中每个搜索结果对应的第一比例;将前K个搜索结果与最近聊天的语句序列组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第二数量,将前K个搜索结果中每个搜索结果对应的第二数量归一化后得到前K个搜索结果中每个搜索结果对应的第二比例;将前K个搜索结果与用户的心理健康状态组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第三数量,将前K个搜索结果中每个搜索结果对应的第三数量归一化后得到前K个搜索结果中每个搜索结果对应的第三比例;将前K个搜索结果与用户的专业或/和职业组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第四数量,将前K个搜索结果中每个搜索结果对应的第四数量归一化后得到前K个搜索结果中每个搜索结果对应的第四比例;将来源于通用大数据引擎等的搜索结果的来源优先级、来源于通用普通聊天数据库的搜索结果的来源优先级、来源于所述心理健康聊天语料库的搜索结果的来源优先级从低到高进行设置,将前K个搜索结果中每个搜索结果的来源优先级作为前K个搜索结果中每个搜索结果对应的第五数量,将前K个搜索结果中每个搜索结果对应的第五数量归一化后得到前K个搜索结果中每个搜索结果对应的第五比例;将前K个搜索结果中每个搜索结果对应的第一比例、第二比例、第三比例、第四比例、第五比例分别根据最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值进行加权平均得到前K个搜索结果中每个搜索结果对应的优选度,选取对应优选度最高的搜索结果;将初始大数据引擎和上述搜索和结果筛选功能组合为所述预设的面向回复的大数据搜索引擎;将所述对应优选度最高的搜索结果作为所述预设的面向回复的大数据搜索引擎的输出。
优选地,所述方法还包括:
聊天心理健康状态预测步骤:将所述最近聊天的语句序列中机器人聊天语句删除,得到最近聊天的用户语句序列,将用户的专业或/和职业、最近聊天的用户语句序列输入预设的人工智能心理健康状态预测模型,计算得到的输出作为所述用户当前的聊天心理健康状态;
其他心理健康状态获取步骤:获取所述用户当前的其他心理健康状态,所述用户当前的其他心理健康状态包括根据其他手段例如传感器、问卷等方式进行评估获得的用户当前心理健康状态;
当前心理健康状态计算步骤:根据所述用户当前的聊天心理健康状态和所述用户当前的其他心理健康状态,计算得到所述用户当前的心理健康状态。
优选地,所述方法还包括:
人工智能心理健康状态预测模型构建步骤:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;从聊天语料库中选取用户的每一条聊天语句作为用户最近输入的语句,将用户最近输入的语句及其之前(预设次数-1)次的最近聊天的语句作为最近聊天的语句序列,将所述最近聊天的语句序列中机器人聊天语句删除,得到最近聊天的用户语句序列;将用户的专业或/和职业、最近聊天的用户语句序列作为人工智能心理健康状态预测模型的输入,将最近聊天的用户语句序列中最近的用户聊天语句对应的心理健康状态作为人工智能心理健康状态预测模型的预期输出,对人工智能心理健康状态预测模型进行训练和测试,得到预设的人工智能心理健康状态预测模型。
第二方面,本发明实施例提供一种人工智能系统,所述系统包括:
专业职业获取模块:获取用户的专业或/和职业;
最近聊天语句获取模块:获取机器人与用户最近聊天的语句序列,所述语句序列中的语句按照先后排序;
用户关注度预设权值设置模块:获取最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值;
聊天语句选取模块:根据所述用户当前的心理健康状态、用户的专业或/和职业、所述语句序列、当前的聊天模式通过大数据搜索引擎和用户关注度预设权值选取聊天语句发送给用户。
优选地,所述聊天语句选取模块具体包括:
聊天模式更新模块:若用户最近输入的语句存在,则所述最近聊天的语句序列至少包括用户最近输入的语句,并将聊天模式设置为回复模式;若用户最近输入的语句不存在且现在距离最近一次聊天语句对应的时间超过了预设等待时长且所述语句序列不为空,则将聊天模式设置为主动续聊模式;若用户最近输入的语句不存在且所述最近聊天的语句序列为空,则将聊天模式设置为主动开聊模式;
不同聊天模式下聊天语句选取模块:若聊天模式是回复模式,则将所述用户当前的心理健康状态、所述用户的专业或/和职业、所述用户最近输入的语句和所述语句序列输入预设的面向回复的大数据搜索引擎,得到的输出作为对用户的聊天语句;若聊天模式是主动续聊模式,则将所述用户当前的心理健康状态、所述用户的专业或/和职业和最近聊天的语句序列中删除最近一次聊天的语句后的语句序列输入预设的面向续聊的大数据搜索引擎,得到的输出作为对用户的聊天语句;若聊天模式是主动开聊模式,则将所述用户当前的心理健康状态、所述用户的专业或/和职业输入预设的面向开聊的大数据搜索引擎,得到的输出作为对用户的聊天语句。
优选地,所述聊天语句选取模块具体还包括:
面向回复的大数据搜索引擎构建模块:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;获取现有的一个或多个搜索引擎或/和具有检索功能的聊天数据库或/和将聊天数据库或/和所述心理健康聊天语料库增加检索功能后作为初始大数据引擎;将预设搜索语句(预设搜索语句包括用户最近输入的语句,例如预设搜索语句为用户最近输入的语句,或用户最近输入的语句与用户的专业或/和职业的组合,或用户最近输入的语句与用户的当前心理健康状态的组合,或用户最近输入的语句与用户的专业或/和职业与用户的当前心理健康状态的组合)作为初始大数据引擎的输入进行搜索,从根据预设排序规则得到的搜索结果中选取前K个搜索结果;将前K个搜索结果中每个搜索结果在排序中的倒排次序作为前K个搜索结果中每个搜索结果对应的第一数量,将前K个搜索结果中每个搜索结果对应的第一数量归一化后得到前K个搜索结果中每个搜索结果对应的第一比例;将前K个搜索结果与最近聊天的语句序列组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第二数量,将前K个搜索结果中每个搜索结果对应的第二数量归一化后得到前K个搜索结果中每个搜索结果对应的第二比例;将前K个搜索结果与用户的心理健康状态组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第三数量,将前K个搜索结果中每个搜索结果对应的第三数量归一化后得到前K个搜索结果中每个搜索结果对应的第三比例;将前K个搜索结果与用户的专业或/和职业组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第四数量,将前K个搜索结果中每个搜索结果对应的第四数量归一化后得到前K个搜索结果中每个搜索结果对应的第四比例;将来源于通用大数据引擎等的搜索结果的来源优先级、来源于通用普通聊天数据库的搜索结果的来源优先级、来源于所述心理健康聊天语料库的搜索结果的来源优先级从低到高进行设置,将前K个搜索结果中每个搜索结果的来源优先级作为前K个搜索结果中每个搜索结果对应的第五数量,将前K个搜索结果中每个搜索结果对应的第五数量归一化后得到前K个搜索结果中每个搜索结果对应的第五比例;将前K个搜索结果中每个搜索结果对应的第一比例、第二比例、第三比例、第四比例、第五比例分别根据最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值进行加权平均得到前K个搜索结果中每个搜索结果对应的优选度,选取对应优选度最高的搜索结果;将初始大数据引擎和上述搜索和结果筛选功能组合为所述预设的面向回复的大数据搜索引擎;将所述对应优选度最高的搜索结果作为所述预设的面向回复的大数据搜索引擎的输出;
面向续聊的大数据搜索引擎构建模块:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;获取现有的一个或多个搜索引擎或/和具有检索功能的聊天数据库或/和将聊天数据库或/和所述心理健康聊天语料库增加检索功能后作为初始大数据引擎;将预设搜索语句(预设搜索语句包括最近聊天的语句序列中用户最近输入的语句,例如预设搜索语句为最近聊天的语句序列中用户最近输入的语句,或最近聊天的语句序列中用户最近输入的语句与用户的专业或/和职业的组合,或用户最近输入的语句与用户的当前心理健康状态的组合,或最近聊天的语句序列中用户最近输入的语句与用户的专业或/和职业与用户的当前心理健康状态的组合)作为初始大数据引擎的输入进行搜索,从根据预设排序规则得到的搜索结果中选取前K个搜索结果;将前K个搜索结果中每个搜索结果在排序中的倒排次序作为前K个搜索结果中每个搜索结果对应的第一数量,将前K个搜索结果中每个搜索结果对应的第一数量归一化后得到前K个搜索结果中每个搜索结果对应的第一比例;将前K个搜索结果与最近聊天的语句序列组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第二数量,将前K个搜索结果中每个搜索结果对应的第二数量归一化后得到前K个搜索结果中每个搜索结果对应的第二比例;将前K个搜索结果与用户的心理健康状态组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第三数量,将前K个搜索结果中每个搜索结果对应的第三数量归一化后得到前K个搜索结果中每个搜索结果对应的第三比例;将前K个搜索结果与用户的专业或/和职业组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第四数量,将前K个搜索结果中每个搜索结果对应的第四数量归一化后得到前K个搜索结果中每个搜索结果对应的第四比例;将来源于通用大数据引擎等的搜索结果的来源优先级、来源于通用普通聊天数据库的搜索结果的来源优先级、来源于所述心理健康聊天语料库的搜索结果的来源优先级从低到高进行设置,将前K个搜索结果中每个搜索结果的来源优先级作为前K个搜索结果中每个搜索结果对应的第五数量,将前K个搜索结果中每个搜索结果对应的第五数量归一化后得到前K个搜索结果中每个搜索结果对应的第五比例;将前K个搜索结果中每个搜索结果对应的第一比例、第二比例、第三比例、第四比例、第五比例分别根据最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值进行加权平均得到前K个搜索结果中每个搜索结果对应的优选度,选取对应优选度最高的搜索结果;将初始大数据引擎和上述搜索和结果筛选功能组合为所述预设的面向回复的大数据搜索引擎;将所述对应优选度最高的搜索结果作为所述预设的面向回复的大数据搜索引擎的输出;
面向开聊的大数据搜索引擎构建模块:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;获取现有的一个或多个搜索引擎或/和具有检索功能的聊天数据库或/和将聊天数据库或/和所述心理健康聊天语料库增加检索功能后作为初始大数据引擎;将与用户的专业或/职业相同或相近的预设搜索语句(预设搜索语句包括所述其他用户最近输入的语句,例如预设搜索语句为所述其他用户最近输入的语句,或所述其他用户最近输入的语句与用户的专业或/和职业的组合,或用户最近输入的语句与用户的当前心理健康状态的组合,或最近聊天的语句序列中用户最近输入的语句与用户的专业或/和职业与用户的当前心理健康状态的组合)作为初始大数据引擎的输入进行搜索,从根据预设排序规则得到的搜索结果中选取前K个搜索结果;将前K个搜索结果中每个搜索结果在排序中的倒排次序作为前K个搜索结果中每个搜索结果对应的第一数量,将前K个搜索结果中每个搜索结果对应的第一数量归一化后得到前K个搜索结果中每个搜索结果对应的第一比例;将前K个搜索结果与最近聊天的语句序列组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第二数量,将前K个搜索结果中每个搜索结果对应的第二数量归一化后得到前K个搜索结果中每个搜索结果对应的第二比例;将前K个搜索结果与用户的心理健康状态组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第三数量,将前K个搜索结果中每个搜索结果对应的第三数量归一化后得到前K个搜索结果中每个搜索结果对应的第三比例;将前K个搜索结果与用户的专业或/和职业组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第四数量,将前K个搜索结果中每个搜索结果对应的第四数量归一化后得到前K个搜索结果中每个搜索结果对应的第四比例;将来源于通用大数据引擎等的搜索结果的来源优先级、来源于通用普通聊天数据库的搜索结果的来源优先级、来源于所述心理健康聊天语料库的搜索结果的来源优先级从低到高进行设置,将前K个搜索结果中每个搜索结果的来源优先级作为前K个搜索结果中每个搜索结果对应的第五数量,将前K个搜索结果中每个搜索结果对应的第五数量归一化后得到前K个搜索结果中每个搜索结果对应的第五比例;将前K个搜索结果中每个搜索结果对应的第一比例、第二比例、第三比例、第四比例、第五比例分别根据最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值进行加权平均得到前K个搜索结果中每个搜索结果对应的优选度,选取对应优选度最高的搜索结果;将初始大数据引擎和上述搜索和结果筛选功能组合为所述预设的面向回复的大数据搜索引擎;将所述对应优选度最高的搜索结果作为所述预设的面向回复的大数据搜索引擎的输出。
优选地,所述系统还包括:
聊天心理健康状态预测模块:将所述最近聊天的语句序列中机器人聊天语句删除,得到最近聊天的用户语句序列,将用户的专业或/和职业、最近聊天的用户语句序列输入预设的人工智能心理健康状态预测模型,计算得到的输出作为所述用户当前的聊天心理健康状态;
其他心理健康状态获取模块:获取所述用户当前的其他心理健康状态,所述用户当前的其他心理健康状态包括根据其他手段例如传感器、问卷等方式进行评估获得的用户当前心理健康状态;
当前心理健康状态计算模块:根据所述用户当前的聊天心理健康状态和所述用户当前的其他心理健康状态,计算得到所述用户当前的心理健康状态。
优选地,所述系统还包括:
人工智能心理健康状态预测模型构建步骤:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;从聊天语料库中选取用户的每一条聊天语句作为用户最近输入的语句,将用户最近输入的语句及其之前(预设次数-1)次的最近聊天的语句作为最近聊天的语句序列,将所述最近聊天的语句序列中机器人聊天语句删除,得到最近聊天的用户语句序列;将用户的专业或/和职业、最近聊天的用户语句序列作为人工智能心理健康状态预测模型的输入,将最近聊天的用户语句序列中最近的用户聊天语句对应的心理健康状态作为人工智能心理健康状态预测模型的预期输出,对人工智能心理健康状态预测模型进行训练和测试,得到预设的人工智能心理健康状态预测模型。
第三方面,本发明实施例提供一种人工智能装置,所述装置包括第二方面实施例任意一项所述系统的模块。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现第一方面实施例任意一项所述方法的步骤。
第五方面,本发明实施例提供一种机器人,包括存储器、处理器及存储在存储器上并可在处理器上运行的人工智能机器人程序,所述处理器执行所述程序时实现第一方面实施例任意一项所述方法的步骤。
本实施例提供的基于大数据面向专业职业的人工智能心理健康聊天机器人,包括:专业职业获取步骤;最近聊天语句获取步骤;用户关注度预设权值设置步骤;聊天语句选取步骤。上述方法、系统和机器人,通过用户关注度预设权值来使得聊天语句的选择不但考虑到用户的心理健康状态还考虑到用户的专业职业,从而使得用户在与人工智能机器人聊天时不会觉得浪费时间,而是觉得对于专业职业有帮助,这样就能一举两得,在改进了心理健康的同时也对专业职业有帮助,让忙于专业职业的用户也乐于与机器人进行聊天。现有技术的心理健康聊天机器人在聊天时往往只考虑心理健康方法的知识而不会考虑用户的专业或职业,这样一方面会使得心理健康服务脱离专业和职业,本申请对不同专业和职业的用户可能需要采用不同的心理健康辅导方式,从而对不同专业和职业的用户的聊天内容也不同。另一方面,现有技术的心理健康聊天机器人因为聊天内容跟专业和职业无关,所以让忙于专业和职业学习或工作的用户感觉与机器人聊天太费时间,而本申请中的心理健康服务机器人在聊天时融入专业和职业知识,使得用户觉得与机器人聊天对其专业和职业有帮助,不但不会觉得浪费时间,反而觉得机器人是个专业和职业的好帮手,从而使得用户更信赖机器人,更有利于心理健康服务聊天的开展。
附图说明
图1为本发明的一个实施例提供的人工智能方法的流程图;
图2为本发明的一个实施例提供的人工智能方法包括的流程图;
图3为本发明的一个实施例提供的人工智能方法包括的流程图;
图4为本发明的一个实施例提供的人工智能方法包括的流程图。
具体实施方式
下面结合本发明实施方式,对本发明实施例中的技术方案进行详细地描述。
本发明的基本实施例
本发明的一个实施例提供一种人工智能方法,如图1所示,所述方法包括:专业职业获取步骤;最近聊天语句获取步骤;用户关注度预设权值设置步骤;聊天语句选取步骤。技术效果:所述方法通过用户关注度预设权值来使得聊天语句的选择不但考虑到用户的心理健康状态还考虑到用户的专业职业,从而使得用户在与人工智能机器人聊天时不会觉得浪费时间,而是觉得对于专业职业有帮助,这样就能一举两得,在改进了心理健康的同时也对专业职业有帮助,让忙于专业职业的用户也乐于与机器人进行聊天。
在一个优选的实施例中,如图2所示,所述聊天语句选取步骤具体包括:聊天模式更新步骤;不同聊天模式下聊天语句选取步骤。技术效果:所述方法提供了多种聊天模式,即能够被动地回复用户的聊天语句,又能够主动地聊天,例如当用户没有回复时可以重新主动换个语句进行聊天,还可以在用户没有发起聊天的情况下机器人主动地向用户发起聊天,从而使得人工智能机器人更接近人类心理咨询师,能够主动地掌控各种情况,使得聊天可以顺利地继续下去。
在一个优选的实施例中,如图3所示,所述聊天语句选取步骤具体还包括:面向回复的大数据搜索引擎构建步骤;面向续聊的大数据搜索引擎构建步骤;面向开聊的大数据搜索引擎构建步骤。技术效果:所述方法通过综合考虑了心理聊天语料库的大数据搜索引擎来选取聊天语句,而且在选取过程中既考虑到心理因素,又考虑到用户的专业职业,所以选取出来的聊天语句既具有提升心理健康水平又具有提升专业或职业知识能力的作用。
在一个优选的实施例中,如图4所示,所述方法还包括:聊天心理健康状态预测步骤;其他心理健康状态获取步骤;当前心理健康状态计算步骤。技术效果:所述方法通过对聊天语句对心理健康状态进行预测,而且与通过其他方式获取的心理健康状态进行融合,使得人工智能机器人的聊天语句也能考虑到用户的心理健康状态,能够更为有的放矢地聊天,能起到更好的心理健康辅导效果。
在一个优选的实施例中,所述方法还包括:人工智能心理健康状态预测模型构建步骤。技术效果:所述方法通过心理健康咨询师聊天语聊库中事先判断出来的用户的心理健康状态反过来用于根据用户聊天语句来预测用户的心理健康状态,其设计非常巧妙,能够充分利用现有的心理健康咨询师聊天语聊库进行用户的心理健康状态的预测。
本发明的优选实施例
专业职业获取步骤:获取用户的专业或/和职业。职业又包括职业所在的行业、岗位、等。例如,若用户是学生,则获取学生所学的专业;如用户是工作人员,则获取用户从事的职业。专业除了包括专业名称,还可以包括具体的专业知识点,例如学生输入的当前所学的知识点或接下来需要学习的知识点。职业除了包括职业名称,还可以包括具体的职业任务,例如职工输入的当前的工作任务或接下来的工作任务,又例如运动员的工作任务可以是具体类型的训练或比赛。
最近聊天语句获取步骤:获取机器人与用户最近聊天的语句序列,所述语句序列中的语句按照先后排序。其中,最近聊天的语句序列包括预设次数的最近聊天的语句及最近一次聊天语句对应的时间,例如若预设次数为5次,则为最近4次聊天的语句。例如,最近4次聊天纪录为,机器人说“你好”,用户说“我不好”,机器人说“你为什么不好”,用户说“心里难过”。其中,用户最近聊天的语句序列不一定指当天或当前聊天的语句,也可以是几天前甚至几个月前甚至几年前的聊天语句,这些聊天语句存在聊天数据库中。例如,用户与机器人最近2年没有聊过天,但在聊天数据库中有3年前用户与机器人的聊天记录,则可以提取3年前用户与机器人的最后几条聊天记录作为机器人与用户最近聊天的语句序列。
聊天心理健康状态预测步骤:将所述最近聊天的语句序列中机器人聊天语句删除,得到最近聊天的用户语句序列,将用户的专业或/和职业(不同专业或/和职业人士的心理健康状态有其特别之处,所以考虑专业或/和职业能使得心理健康状态预测更为准确)、最近聊天的用户语句序列输入预设的人工智能心理健康状态预测模型,计算得到的输出作为所述用户当前的聊天心理健康状态;若所述语句序列为空,则假设用户当前的聊天心理健康状态为正常。
人工智能心理健康状态预测模型构建步骤:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;从聊天语料库中选取用户的每一条聊天语句作为用户最近输入的语句,将用户最近输入的语句及其之前(预设次数一1)次的最近聊天的语句作为最近聊天的语句序列,将所述最近聊天的语句序列中机器人聊天语句删除,得到最近聊天的用户语句序列;将用户的专业或/和职业、最近聊天的用户语句序列作为人工智能心理健康状态预测模型的输入,将最近聊天的用户语句序列中最近的用户聊天语句对应的心理健康状态作为人工智能心理健康状态预测模型的预期输出,对人工智能心理健康状态预测模型进行训练和测试,得到预设的人工智能心理健康状态预测模型;
其他心理健康状态获取步骤:获取所述用户当前的其他心理健康状态,所述用户当前的其他心理健康状态包括根据其他手段例如传感器、问卷等方式进行评估获得的用户当前心理健康状态。
当前心理健康状态计算步骤:根据所述用户当前的聊天心理健康状态和所述用户当前的其他心理健康状态,计算得到所述用户当前的心理健康状态。具体地,将所述用户当前的聊天心理健康状态和所述用户当前的其他心理健康状态根据其测试准确率进行加权平均得到所述用户当前的心理健康状态。例如,所述用户当前的聊天心理健康状态的测试准确率为P,所述用户当前的其他心理健康状态的测试准确率为Q,则所述用户当前的心理健康状态=(P*所述用户当前的聊天心理健康状态+Q*所述用户当前的其他心理健康状态)/(P+Q)。
用户关注度预设权值设置步骤:获取最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值,最近聊天内容的用户关注度预设权值+近期聊天内容的用户关注度预设权值+心理健康的用户关注度预设权值+专业职业的用户关注度预设权值=1;
聊天语句选取步骤:根据所述用户当前的心理健康状态、用户的专业或/和职业、所述语句序列、当前的聊天模式通过大数据搜索引擎和用户关注度预设权值选取聊天语句发送给用户。具体地,聊天模式更新步骤,若用户最近输入的语句存在,则所述最近聊天的语句序列至少包括用户最近输入的语句,并将聊天模式设置为回复模式;若用户最近输入的语句不存在且现在距离最近一次聊天语句对应的时间超过了预设等待时长且所述语句序列不为空,则将聊天模式设置为主动续聊模式;若用户最近输入的语句不存在且所述最近聊天的语句序列为空,则将聊天模式设置为主动开聊模式。不同聊天模式下聊天语句选取步骤,若聊天模式是回复模式,则将所述用户当前的心理健康状态、所述用户的专业或/和职业、所述用户最近输入的语句和所述语句序列(虽然所述语句序列中也包含用户最近输入的语句会导致重复,但这正好加强了用户最近输入的语句的重要性,使得输出与用户最近输入的语句的相关性比其他语句要强,而采用序列,则可以利用RNN等跟时序相关的深度学习模型)输入预设的面向回复的大数据搜索引擎,得到的输出作为对用户的聊天语句;若聊天模式是主动续聊模式,则将所述用户当前的心理健康状态、所述用户的专业或/和职业和最近聊天的语句序列中删除最近一次聊天的语句后的语句序列(显然最近一次聊天的语句是机器人回复语句,而该语句既然用户没有回复,说明该语句不合适,所以删除)输入预设的面向续聊的大数据搜索引擎,得到的输出作为对用户的聊天语句;若聊天模式是主动开聊模式,则将所述用户当前的心理健康状态、所述用户的专业或/和职业输入预设的面向开聊的大数据搜索引擎,得到的输出作为对用户的聊天语句。
面向回复的大数据搜索引擎构建步骤:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;获取现有的一个或多个搜索引擎(例如百度、谷歌等等)或/和具有检索功能的聊天数据库或/和将聊天数据库或/和所述心理健康聊天语料库增加检索功能后作为初始大数据引擎;将预设搜索语句(预设搜索语句包括用户最近输入的语句,例如预设搜索语句为用户最近输入的语句,或用户最近输入的语句与用户的专业或/和职业的组合,或用户最近输入的语句与用户的当前心理健康状态的组合,或用户最近输入的语句与用户的专业或/和职业与用户的当前心理健康状态的组合)作为初始大数据引擎的输入进行搜索,从根据预设排序规则(包括按照相关度从高到低排序或根据时间从近到远排序)得到的搜索结果中选取前K个搜索结果;将前K个搜索结果中每个搜索结果在排序中的倒排次序作为前K个搜索结果中每个搜索结果对应的第一数量,将前K个搜索结果中每个搜索结果对应的第一数量归一化(将对应的第一数量除以所有第一数量之和)后得到前K个搜索结果中每个搜索结果对应的第一比例;将前K个搜索结果与最近聊天的语句序列组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第二数量,将前K个搜索结果中每个搜索结果对应的第二数量归一化(将对应的第二数量除以所有第二数量之和)后得到前K个搜索结果中每个搜索结果对应的第二比例;将前K个搜索结果与用户的心理健康状态组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第三数量,将前K个搜索结果中每个搜索结果对应的第三数量归一化(将对应的第三数量除以所有第三数量之和)后得到前K个搜索结果中每个搜索结果对应的第三比例;将前K个搜索结果与用户的专业或/和职业组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第四数量,将前K个搜索结果中每个搜索结果对应的第四数量归一化(将对应的第四数量除以所有第四数量之和)后得到前K个搜索结果中每个搜索结果对应的第四比例;将来源于通用大数据引擎(例如百度、谷歌等)等的搜索结果的来源优先级、来源于通用普通聊天数据库(不具备心理健康服务功能的聊天数据库)的搜索结果的来源优先级、来源于所述心理健康聊天语料库(具备心理健康服务功能的聊天数据库)的搜索结果的来源优先级从低到高进行设置(例如,分别设置为1、2、3),将前K个搜索结果中每个搜索结果的来源优先级作为前K个搜索结果中每个搜索结果对应的第五数量,将前K个搜索结果中每个搜索结果对应的第五数量归一化(将对应的第五数量除以所有第五数量之和)后得到前K个搜索结果中每个搜索结果对应的第五比例;将前K个搜索结果中每个搜索结果对应的第一比例、第二比例、第三比例、第四比例、第五比例分别根据最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值进行加权平均(第一比例*最近聊天内容的用户关注度预设权值+第二比例*近期聊天内容的用户关注度预设权值+第三比例*心理健康的用户关注度预设权值+第四比例*专业职业的用户关注度预设权值+第四五比例*专业职业的用户关注度预设权值)得到前K个搜索结果中每个搜索结果对应的优选度,选取对应优选度最高的搜索结果;将初始大数据引擎和上述搜索和结果筛选功能组合为所述预设的面向回复的大数据搜索引擎;将所述对应优选度最高的搜索结果作为所述预设的面向回复的大数据搜索引擎的输出。
面向续聊的大数据搜索引擎构建步骤:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;获取现有的一个或多个搜索引擎(例如百度、谷歌等等)或/和具有检索功能的聊天数据库或/和将聊天数据库或/和所述心理健康聊天语料库增加检索功能后作为初始大数据引擎;将预设搜索语句(预设搜索语句包括最近聊天的语句序列中用户最近输入的语句,例如预设搜索语句为最近聊天的语句序列中用户最近输入的语句,或最近聊天的语句序列中用户最近输入的语句与用户的专业或/和职业的组合,或用户最近输入的语句与用户的当前心理健康状态的组合,或最近聊天的语句序列中用户最近输入的语句与用户的专业或/和职业与用户的当前心理健康状态的组合)作为初始大数据引擎的输入进行搜索,从根据预设排序规则(包括按照相关度从高到低排序或根据时间从近到远排序)得到的搜索结果中选取前K个搜索结果;将前K个搜索结果中每个搜索结果在排序中的倒排次序作为前K个搜索结果中每个搜索结果对应的第一数量,将前K个搜索结果中每个搜索结果对应的第一数量归一化(将对应的第一数量除以所有第一数量之和)后得到前K个搜索结果中每个搜索结果对应的第一比例;将前K个搜索结果与最近聊天的语句序列组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第二数量,将前K个搜索结果中每个搜索结果对应的第二数量归一化(将对应的第二数量除以所有第二数量之和)后得到前K个搜索结果中每个搜索结果对应的第二比例;将前K个搜索结果与用户的心理健康状态组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第三数量,将前K个搜索结果中每个搜索结果对应的第三数量归一化(将对应的第三数量除以所有第三数量之和)后得到前K个搜索结果中每个搜索结果对应的第三比例;将前K个搜索结果与用户的专业或/和职业组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第四数量,将前K个搜索结果中每个搜索结果对应的第四数量归一化(将对应的第四数量除以所有第四数量之和)后得到前K个搜索结果中每个搜索结果对应的第四比例;将来源于通用大数据引擎(例如百度、谷歌等)等的搜索结果的来源优先级、来源于通用普通聊天数据库(不具备心理健康服务功能的聊天数据库)的搜索结果的来源优先级、来源于所述心理健康聊天语料库(具备心理健康服务功能的聊天数据库)的搜索结果的来源优先级从低到高进行设置(例如,分别设置为1、2、3),将前K个搜索结果中每个搜索结果的来源优先级作为前K个搜索结果中每个搜索结果对应的第五数量,将前K个搜索结果中每个搜索结果对应的第五数量归一化(将对应的第五数量除以所有第五数量之和)后得到前K个搜索结果中每个搜索结果对应的第五比例;将前K个搜索结果中每个搜索结果对应的第一比例、第二比例、第三比例、第四比例、第五比例分别根据最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值进行加权平均(第一比例*最近聊天内容的用户关注度预设权值+第二比例*近期聊天内容的用户关注度预设权值+第三比例*心理健康的用户关注度预设权值+第四比例*专业职业的用户关注度预设权值+第四五比例*专业职业的用户关注度预设权值)得到前K个搜索结果中每个搜索结果对应的优选度,选取对应优选度最高的搜索结果;将初始大数据引擎和上述搜索和结果筛选功能组合为所述预设的面向回复的大数据搜索引擎;将所述对应优选度最高的搜索结果作为所述预设的面向回复的大数据搜索引擎的输出。
面向开聊的大数据搜索引擎构建步骤:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;获取现有的一个或多个搜索引擎(例如百度、谷歌等等)或/和具有检索功能的聊天数据库或/和将聊天数据库或/和所述心理健康聊天语料库增加检索功能后作为初始大数据引擎;将与用户的专业或/职业相同或相近的预设搜索语句(预设搜索语句包括所述其他用户最近输入的语句,例如预设搜索语句为所述其他用户最近输入的语句,或所述其他用户最近输入的语句与用户的专业或/和职业的组合,或用户最近输入的语句与用户的当前心理健康状态的组合,或最近聊天的语句序列中用户最近输入的语句与用户的专业或/和职业与用户的当前心理健康状态的组合)作为初始大数据引擎的输入进行搜索,从根据预设排序规则(包括按照相关度从高到低排序或根据时间从近到远排序)得到的搜索结果中选取前K个搜索结果;将前K个搜索结果中每个搜索结果在排序中的倒排次序作为前K个搜索结果中每个搜索结果对应的第一数量,将前K个搜索结果中每个搜索结果对应的第一数量归一化(将对应的第一数量除以所有第一数量之和)后得到前K个搜索结果中每个搜索结果对应的第一比例;将前K个搜索结果与最近聊天的语句序列组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第二数量,将前K个搜索结果中每个搜索结果对应的第二数量归一化(将对应的第二数量除以所有第二数量之和)后得到前K个搜索结果中每个搜索结果对应的第二比例;将前K个搜索结果与用户的心理健康状态组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第三数量,将前K个搜索结果中每个搜索结果对应的第三数量归一化(将对应的第三数量除以所有第三数量之和)后得到前K个搜索结果中每个搜索结果对应的第三比例;将前K个搜索结果与用户的专业或/和职业组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第四数量,将前K个搜索结果中每个搜索结果对应的第四数量归一化(将对应的第四数量除以所有第四数量之和)后得到前K个搜索结果中每个搜索结果对应的第四比例;将来源于通用大数据引擎(例如百度、谷歌等)等的搜索结果的来源优先级、来源于通用普通聊天数据库(不具备心理健康服务功能的聊天数据库)的搜索结果的来源优先级、来源于所述心理健康聊天语料库(具备心理健康服务功能的聊天数据库)的搜索结果的来源优先级从低到高进行设置(例如,分别设置为1、2、3),将前K个搜索结果中每个搜索结果的来源优先级作为前K个搜索结果中每个搜索结果对应的第五数量,将前K个搜索结果中每个搜索结果对应的第五数量归一化(将对应的第五数量除以所有第五数量之和)后得到前K个搜索结果中每个搜索结果对应的第五比例;将前K个搜索结果中每个搜索结果对应的第一比例、第二比例、第三比例、第四比例、第五比例分别根据最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值进行加权平均(第一比例*最近聊天内容的用户关注度预设权值+第二比例*近期聊天内容的用户关注度预设权值+第三比例*心理健康的用户关注度预设权值+第四比例*专业职业的用户关注度预设权值+第四五比例*专业职业的用户关注度预设权值)得到前K个搜索结果中每个搜索结果对应的优选度,选取对应优选度最高的搜索结果;将初始大数据引擎和上述搜索和结果筛选功能组合为所述预设的面向回复的大数据搜索引擎;将所述对应优选度最高的搜索结果作为所述预设的面向回复的大数据搜索引擎的输出。
最佳聊天成效更新步骤:若用户关注度预设权值获取成功,则将获取的用户关注度预设权值设置后的聊天成效作为最佳聊天成效的初始值;若用户关注度预设权值获取失败,则将最佳聊天成效的初始值设置为0;将最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值在总和为1的条件下进行不重复地随机赋值;获取基于当前用户关注度预设权值选取得到的聊天语句发送给用户后从机器人发出聊天语句到用户回复之间的时长的负数(间隔时长越短,其负数就越大,说明用户聊天越积极,则说明聊天成效越好)、用户回复内容的长度(用户回复内容的长度越长说明用户对聊天越投入,说明聊天成效越好)、用户心理状态的正向变化(正向变化就是向好的方向的变化,能反映聊天成效,如果用户心理状态变差,则用户心理状态的正向变化为负数),根据从机器人发出聊天语句到用户回复之间的时长、用户回复内容的长度、用户心理状态的变化加权平均得到聊天成效,若当前聊天成效大于最佳聊天成效,则将当前聊天成效作为最佳聊天成效,并将当前的用户关注度预设权值作为最佳的用户关注度预设权值;若当前聊天成效小于或等于当前最佳聊天成效,则当前最佳聊天成效不变;然后继续进行所述不重复地随机赋值,并继续更新最佳聊天成效,直至最佳聊天成效连续不变的次数超过预设次数(例如10次),则将最佳的用户关注度预设权值作为用户关注度预设权值。
聊天语句选取与最佳聊天成效协同步骤:每执行一次聊天语句选取步骤就调用一次最佳聊天成效更新步骤。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,则对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种人工智能方法,其特征在于,所述方法包括:
专业职业获取步骤:获取用户的专业或/和职业;
最近聊天语句获取步骤:获取机器人与用户最近聊天的语句序列,所述语句序列中的语句按照先后排序;
用户关注度预设权值设置步骤:获取最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值;
聊天语句选取步骤:根据所述用户当前的心理健康状态、用户的专业或/和职业、所述语句序列、当前的聊天模式通过大数据搜索引擎和用户关注度预设权值选取聊天语句发送给用户;
所述聊天语句选取步骤具体还包括:
面向回复的大数据搜索引擎构建步骤:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;获取现有的一个或多个搜索引擎或/和具有检索功能的聊天数据库或/和将聊天数据库或/和所述心理健康聊天语料库增加检索功能后作为初始大数据引擎;将预设搜索语句作为初始大数据引擎的输入进行搜索,从根据预设排序规则得到的搜索结果中选取前K个搜索结果;将前K个搜索结果中每个搜索结果在排序中的倒排次序作为前K个搜索结果中每个搜索结果对应的第一数量,将前K个搜索结果中每个搜索结果对应的第一数量归一化后得到前K个搜索结果中每个搜索结果对应的第一比例;将前K个搜索结果与最近聊天的语句序列组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第二数量,将前K个搜索结果中每个搜索结果对应的第二数量归一化后得到前K个搜索结果中每个搜索结果对应的第二比例;将前K个搜索结果与用户的心理健康状态组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第三数量,将前K个搜索结果中每个搜索结果对应的第三数量归一化后得到前K个搜索结果中每个搜索结果对应的第三比例;将前K个搜索结果与用户的专业或/和职业组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第四数量,将前K个搜索结果中每个搜索结果对应的第四数量归一化后得到前K个搜索结果中每个搜索结果对应的第四比例;将来源于通用大数据引擎等的搜索结果的来源优先级、来源于通用普通聊天数据库的搜索结果的来源优先级、来源于所述心理健康聊天语料库的搜索结果的来源优先级从低到高进行设置,将前K个搜索结果中每个搜索结果的来源优先级作为前K个搜索结果中每个搜索结果对应的第五数量,将前K个搜索结果中每个搜索结果对应的第五数量归一化后得到前K个搜索结果中每个搜索结果对应的第五比例;将前K个搜索结果中每个搜索结果对应的第一比例、第二比例、第三比例、第四比例、第五比例分别根据最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值进行加权平均得到前K个搜索结果中每个搜索结果对应的优选度,选取对应优选度最高的搜索结果;将初始大数据引擎和上述搜索和结果筛选功能组合为所述预设的面向回复的大数据搜索引擎;将所述对应优选度最高的搜索结果作为所述预设的面向回复的大数据搜索引擎的输出;
面向续聊的大数据搜索引擎构建步骤:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;获取现有的一个或多个搜索引擎或/和具有检索功能的聊天数据库或/和将聊天数据库或/和所述心理健康聊天语料库增加检索功能后作为初始大数据引擎;将预设搜索语句作为初始大数据引擎的输入进行搜索,从根据预设排序规则得到的搜索结果中选取前K个搜索结果;将前K个搜索结果中每个搜索结果在排序中的倒排次序作为前K个搜索结果中每个搜索结果对应的第一数量,将前K个搜索结果中每个搜索结果对应的第一数量归一化后得到前K个搜索结果中每个搜索结果对应的第一比例;将前K个搜索结果与最近聊天的语句序列组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第二数量,将前K个搜索结果中每个搜索结果对应的第二数量归一化后得到前K个搜索结果中每个搜索结果对应的第二比例;将前K个搜索结果与用户的心理健康状态组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第三数量,将前K个搜索结果中每个搜索结果对应的第三数量归一化后得到前K个搜索结果中每个搜索结果对应的第三比例;将前K个搜索结果与用户的专业或/和职业组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第四数量,将前K个搜索结果中每个搜索结果对应的第四数量归一化后得到前K个搜索结果中每个搜索结果对应的第四比例;将来源于通用大数据引擎等的搜索结果的来源优先级、来源于通用普通聊天数据库的搜索结果的来源优先级、来源于所述心理健康聊天语料库的搜索结果的来源优先级从低到高进行设置,将前K个搜索结果中每个搜索结果的来源优先级作为前K个搜索结果中每个搜索结果对应的第五数量,将前K个搜索结果中每个搜索结果对应的第五数量归一化后得到前K个搜索结果中每个搜索结果对应的第五比例;将前K个搜索结果中每个搜索结果对应的第一比例、第二比例、第三比例、第四比例、第五比例分别根据最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值进行加权平均得到前K个搜索结果中每个搜索结果对应的优选度,选取对应优选度最高的搜索结果;将初始大数据引擎和上述搜索和结果筛选功能组合为所述预设的面向回复的大数据搜索引擎;将所述对应优选度最高的搜索结果作为所述预设的面向回复的大数据搜索引擎的输出;
面向开聊的大数据搜索引擎构建步骤:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;获取现有的一个或多个搜索引擎或/和具有检索功能的聊天数据库或/和将聊天数据库或/和所述心理健康聊天语料库增加检索功能后作为初始大数据引擎;将与用户的专业或/职业相同或相近的预设搜索语句作为初始大数据引擎的输入进行搜索,从根据预设排序规则得到的搜索结果中选取前K个搜索结果;将前K个搜索结果中每个搜索结果在排序中的倒排次序作为前K个搜索结果中每个搜索结果对应的第一数量,将前K个搜索结果中每个搜索结果对应的第一数量归一化后得到前K个搜索结果中每个搜索结果对应的第一比例;将前K个搜索结果与最近聊天的语句序列组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第二数量,将前K个搜索结果中每个搜索结果对应的第二数量归一化后得到前K个搜索结果中每个搜索结果对应的第二比例;将前K个搜索结果与用户的心理健康状态组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第三数量,将前K个搜索结果中每个搜索结果对应的第三数量归一化后得到前K个搜索结果中每个搜索结果对应的第三比例;将前K个搜索结果与用户的专业或/和职业组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第四数量,将前K个搜索结果中每个搜索结果对应的第四数量归一化后得到前K个搜索结果中每个搜索结果对应的第四比例;将来源于通用大数据引擎等的搜索结果的来源优先级、来源于通用普通聊天数据库的搜索结果的来源优先级、来源于所述心理健康聊天语料库的搜索结果的来源优先级从低到高进行设置,将前K个搜索结果中每个搜索结果的来源优先级作为前K个搜索结果中每个搜索结果对应的第五数量,将前K个搜索结果中每个搜索结果对应的第五数量归一化后得到前K个搜索结果中每个搜索结果对应的第五比例;将前K个搜索结果中每个搜索结果对应的第一比例、第二比例、第三比例、第四比例、第五比例分别根据最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值进行加权平均得到前K个搜索结果中每个搜索结果对应的优选度,选取对应优选度最高的搜索结果;将初始大数据引擎和上述搜索和结果筛选功能组合为所述预设的面向回复的大数据搜索引擎;将所述对应优选度最高的搜索结果作为所述预设的面向回复的大数据搜索引擎的输出。
2.根据权利要求1所述的人工智能方法,其特征在于,所述聊天语句选取步骤具体包括:
聊天模式更新步骤:若用户最近输入的语句存在,则所述最近聊天的语句序列至少包括用户最近输入的语句,并将聊天模式设置为回复模式;若用户最近输入的语句不存在且现在距离最近一次聊天语句对应的时间超过了预设等待时长且所述语句序列不为空,则将聊天模式设置为主动续聊模式;若用户最近输入的语句不存在且所述最近聊天的语句序列为空,则将聊天模式设置为主动开聊模式;
不同聊天模式下聊天语句选取步骤:若聊天模式是回复模式,则将所述用户当前的心理健康状态、所述用户的专业或/和职业、所述用户最近输入的语句和所述语句序列输入预设的面向回复的大数据搜索引擎,得到的输出作为对用户的聊天语句;若聊天模式是主动续聊模式,则将所述用户当前的心理健康状态、所述用户的专业或/和职业和最近聊天的语句序列中删除最近一次聊天的语句后的语句序列输入预设的面向续聊的大数据搜索引擎,得到的输出作为对用户的聊天语句;若聊天模式是主动开聊模式,则将所述用户当前的心理健康状态、所述用户的专业或/和职业输入预设的面向开聊的大数据搜索引擎,得到的输出作为对用户的聊天语句。
3.根据权利要求1所述的人工智能方法,其特征在于,所述方法还包括:
聊天心理健康状态预测步骤:将所述最近聊天的语句序列中机器人聊天语句删除,得到最近聊天的用户语句序列,将用户的专业或/和职业、最近聊天的用户语句序列输入预设的人工智能心理健康状态预测模型,计算得到的输出作为所述用户当前的聊天心理健康状态;
其他心理健康状态获取步骤:获取所述用户当前的其他心理健康状态,所述用户当前的其他心理健康状态包括根据其他手段例如传感器、问卷等方式进行评估获得的用户当前心理健康状态;
当前心理健康状态计算步骤:根据所述用户当前的聊天心理健康状态和所述用户当前的其他心理健康状态,计算得到所述用户当前的心理健康状态。
4.根据权利要求3所述的人工智能方法,其特征在于,所述方法还包括:
人工智能心理健康状态预测模型构建步骤:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;从聊天语料库中选取用户的每一条聊天语句作为用户最近输入的语句,将用户最近输入的语句及其之前次的最近聊天的语句作为最近聊天的语句序列,将所述最近聊天的语句序列中机器人聊天语句删除,得到最近聊天的用户语句序列;将用户的专业或/和职业、最近聊天的用户语句序列作为人工智能心理健康状态预测模型的输入,将最近聊天的用户语句序列中最近的用户聊天语句对应的心理健康状态作为人工智能心理健康状态预测模型的预期输出,对人工智能心理健康状态预测模型进行训练和测试,得到预设的人工智能心理健康状态预测模型。
5.一种人工智能系统,其特征在于,所述系统包括:
专业职业获取模块:获取用户的专业或/和职业;
最近聊天语句获取模块:获取机器人与用户最近聊天的语句序列,所述语句序列中的语句按照先后排序;
用户关注度预设权值设置模块:获取最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值;
聊天语句选取模块:根据所述用户当前的心理健康状态、用户的专业或/和职业、所述语句序列、当前的聊天模式通过大数据搜索引擎和用户关注度预设权值选取聊天语句发送给用户;
所述聊天语句选取模块具体还包括:
面向回复的大数据搜索引擎构建模块:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;获取现有的一个或多个搜索引擎或/和具有检索功能的聊天数据库或/和将聊天数据库或/和所述心理健康聊天语料库增加检索功能后作为初始大数据引擎;将预设搜索语句作为初始大数据引擎的输入进行搜索,从根据预设排序规则得到的搜索结果中选取前K个搜索结果;将前K个搜索结果中每个搜索结果在排序中的倒排次序作为前K个搜索结果中每个搜索结果对应的第一数量,将前K个搜索结果中每个搜索结果对应的第一数量归一化后得到前K个搜索结果中每个搜索结果对应的第一比例;将前K个搜索结果与最近聊天的语句序列组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第二数量,将前K个搜索结果中每个搜索结果对应的第二数量归一化后得到前K个搜索结果中每个搜索结果对应的第二比例;将前K个搜索结果与用户的心理健康状态组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第三数量,将前K个搜索结果中每个搜索结果对应的第三数量归一化后得到前K个搜索结果中每个搜索结果对应的第三比例;将前K个搜索结果与用户的专业或/和职业组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第四数量,将前K个搜索结果中每个搜索结果对应的第四数量归一化后得到前K个搜索结果中每个搜索结果对应的第四比例;将来源于通用大数据引擎等的搜索结果的来源优先级、来源于通用普通聊天数据库的搜索结果的来源优先级、来源于所述心理健康聊天语料库的搜索结果的来源优先级从低到高进行设置,将前K个搜索结果中每个搜索结果的来源优先级作为前K个搜索结果中每个搜索结果对应的第五数量,将前K个搜索结果中每个搜索结果对应的第五数量归一化后得到前K个搜索结果中每个搜索结果对应的第五比例;将前K个搜索结果中每个搜索结果对应的第一比例、第二比例、第三比例、第四比例、第五比例分别根据最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值进行加权平均得到前K个搜索结果中每个搜索结果对应的优选度,选取对应优选度最高的搜索结果;将初始大数据引擎和上述搜索和结果筛选功能组合为所述预设的面向回复的大数据搜索引擎;将所述对应优选度最高的搜索结果作为所述预设的面向回复的大数据搜索引擎的输出;
面向续聊的大数据搜索引擎构建模块:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;获取现有的一个或多个搜索引擎或/和具有检索功能的聊天数据库或/和将聊天数据库或/和所述心理健康聊天语料库增加检索功能后作为初始大数据引擎;将预设搜索语句作为初始大数据引擎的输入进行搜索,从根据预设排序规则得到的搜索结果中选取前K个搜索结果;将前K个搜索结果中每个搜索结果在排序中的倒排次序作为前K个搜索结果中每个搜索结果对应的第一数量,将前K个搜索结果中每个搜索结果对应的第一数量归一化后得到前K个搜索结果中每个搜索结果对应的第一比例;将前K个搜索结果与最近聊天的语句序列组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第二数量,将前K个搜索结果中每个搜索结果对应的第二数量归一化后得到前K个搜索结果中每个搜索结果对应的第二比例;将前K个搜索结果与用户的心理健康状态组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第三数量,将前K个搜索结果中每个搜索结果对应的第三数量归一化后得到前K个搜索结果中每个搜索结果对应的第三比例;将前K个搜索结果与用户的专业或/和职业组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第四数量,将前K个搜索结果中每个搜索结果对应的第四数量归一化后得到前K个搜索结果中每个搜索结果对应的第四比例;将来源于通用大数据引擎等的搜索结果的来源优先级、来源于通用普通聊天数据库的搜索结果的来源优先级、来源于所述心理健康聊天语料库的搜索结果的来源优先级从低到高进行设置,将前K个搜索结果中每个搜索结果的来源优先级作为前K个搜索结果中每个搜索结果对应的第五数量,将前K个搜索结果中每个搜索结果对应的第五数量归一化后得到前K个搜索结果中每个搜索结果对应的第五比例;将前K个搜索结果中每个搜索结果对应的第一比例、第二比例、第三比例、第四比例、第五比例分别根据最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值进行加权平均得到前K个搜索结果中每个搜索结果对应的优选度,选取对应优选度最高的搜索结果;将初始大数据引擎和上述搜索和结果筛选功能组合为所述预设的面向回复的大数据搜索引擎;将所述对应优选度最高的搜索结果作为所述预设的面向回复的大数据搜索引擎的输出;
面向开聊的大数据搜索引擎构建模块:获取不同专业或/和职业、不同心理健康状态的用户与心理咨询师的心理健康聊天语料库,该聊天语料库中心理咨询师的聊天语句已经考虑用户的专业或/和职业;获取现有的一个或多个搜索引擎或/和具有检索功能的聊天数据库或/和将聊天数据库或/和所述心理健康聊天语料库增加检索功能后作为初始大数据引擎;将与用户的专业或/职业相同或相近的预设搜索语句作为初始大数据引擎的输入进行搜索,从根据预设排序规则得到的搜索结果中选取前K个搜索结果;将前K个搜索结果中每个搜索结果在排序中的倒排次序作为前K个搜索结果中每个搜索结果对应的第一数量,将前K个搜索结果中每个搜索结果对应的第一数量归一化后得到前K个搜索结果中每个搜索结果对应的第一比例;将前K个搜索结果与最近聊天的语句序列组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第二数量,将前K个搜索结果中每个搜索结果对应的第二数量归一化后得到前K个搜索结果中每个搜索结果对应的第二比例;将前K个搜索结果与用户的心理健康状态组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第三数量,将前K个搜索结果中每个搜索结果对应的第三数量归一化后得到前K个搜索结果中每个搜索结果对应的第三比例;将前K个搜索结果与用户的专业或/和职业组成初始大数据引擎的K个输入进行搜索,统计每个搜索的结果个数,作为前K个搜索结果中每个搜索结果对应的第四数量,将前K个搜索结果中每个搜索结果对应的第四数量归一化后得到前K个搜索结果中每个搜索结果对应的第四比例;将来源于通用大数据引擎等的搜索结果的来源优先级、来源于通用普通聊天数据库的搜索结果的来源优先级、来源于所述心理健康聊天语料库的搜索结果的来源优先级从低到高进行设置,将前K个搜索结果中每个搜索结果的来源优先级作为前K个搜索结果中每个搜索结果对应的第五数量,将前K个搜索结果中每个搜索结果对应的第五数量归一化后得到前K个搜索结果中每个搜索结果对应的第五比例;将前K个搜索结果中每个搜索结果对应的第一比例、第二比例、第三比例、第四比例、第五比例分别根据最近聊天内容、近期聊天内容、心理健康、专业职业、聊天语句来源的用户关注度预设权值进行加权平均得到前K个搜索结果中每个搜索结果对应的优选度,选取对应优选度最高的搜索结果;将初始大数据引擎和上述搜索和结果筛选功能组合为所述预设的面向回复的大数据搜索引擎;将所述对应优选度最高的搜索结果作为所述预设的面向回复的大数据搜索引擎的输出。
6.根据权利要求5所述的人工智能系统,其特征在于,所述系统还包括:
聊天心理健康状态预测模块:将所述最近聊天的语句序列中机器人聊天语句删除,得到最近聊天的用户语句序列,将用户的专业或/和职业、最近聊天的用户语句序列输入预设的人工智能心理健康状态预测模型,计算得到的输出作为所述用户当前的聊天心理健康状态;
其他心理健康状态获取模块:获取所述用户当前的其他心理健康状态,所述用户当前的其他心理健康状态包括根据其他手段例如传感器、问卷等方式进行评估获得的用户当前心理健康状态;
当前心理健康状态计算模块:根据所述用户当前的聊天心理健康状态和所述用户当前的其他心理健康状态,计算得到所述用户当前的心理健康状态。
7.一种人工智能装置,其特征在于,所述装置用于实现权利要求1-4任意一项所述方法的步骤。
8.一种机器人,包括存储器、处理器及存储在存储器上并可在处理器上运行的人工智能机器人程序,其特征在于,所述处理器执行所述程序时实现权利要求1-4任意一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1-4任意一项所述方法的步骤。
CN202110187082.5A 2021-02-10 2021-02-10 基于大数据面向专业职业的人工智能心理健康聊天机器人 Active CN112883176B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110187082.5A CN112883176B (zh) 2021-02-10 2021-02-10 基于大数据面向专业职业的人工智能心理健康聊天机器人

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110187082.5A CN112883176B (zh) 2021-02-10 2021-02-10 基于大数据面向专业职业的人工智能心理健康聊天机器人

Publications (2)

Publication Number Publication Date
CN112883176A CN112883176A (zh) 2021-06-01
CN112883176B true CN112883176B (zh) 2022-08-09

Family

ID=76056437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110187082.5A Active CN112883176B (zh) 2021-02-10 2021-02-10 基于大数据面向专业职业的人工智能心理健康聊天机器人

Country Status (1)

Country Link
CN (1) CN112883176B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013172490A1 (en) * 2012-05-16 2013-11-21 Lg Electronics Inc. Health care system and health care service providing method
CN105183848A (zh) * 2015-09-07 2015-12-23 百度在线网络技术(北京)有限公司 基于人工智能的人机聊天方法和装置
US10762414B1 (en) * 2018-04-19 2020-09-01 Kinoo, Inc. Systems and methods for sharing an artificial intelligence personality

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11580350B2 (en) * 2016-12-21 2023-02-14 Microsoft Technology Licensing, Llc Systems and methods for an emotionally intelligent chat bot

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013172490A1 (en) * 2012-05-16 2013-11-21 Lg Electronics Inc. Health care system and health care service providing method
CN105183848A (zh) * 2015-09-07 2015-12-23 百度在线网络技术(北京)有限公司 基于人工智能的人机聊天方法和装置
US10762414B1 (en) * 2018-04-19 2020-09-01 Kinoo, Inc. Systems and methods for sharing an artificial intelligence personality

Also Published As

Publication number Publication date
CN112883176A (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
CN108509463B (zh) 一种问题的应答方法及装置
CN110597988B (zh) 一种文本分类方法、装置、设备及存储介质
CN107908803B (zh) 问答交互的响应方法及装置、存储介质、终端
CN109299344A (zh) 排序模型的生成方法、搜索结果的排序方法、装置及设备
CN105808590B (zh) 搜索引擎实现方法、搜索方法以及装置
CN107797984A (zh) 智能交互方法、设备及存储介质
CN105574538A (zh) 分类模型训练方法及装置
KR101220557B1 (ko) 사람의 활동 지식 데이터베이스를 이용한 모바일 어플리케이션 검색 방법 및 시스템
CN109816265B (zh) 知识特征掌握度的评价方法、题目推荐方法及电子设备
CN107526831B (zh) 一种自然语言处理方法和装置
CN109388634B (zh) 地址信息的处理方法、终端设备及计算机可读存储介质
CN107357763B (zh) 一种基于自步学习的众包分类数据质量控制方法
JP2010257347A (ja) 指導支援システム及び指導支援情報表示装置
CN111507573A (zh) 业务员考核方法、系统、设备及存储介质
CN110659311A (zh) 题目推送方法、装置、电子设备及存储介质
CN111160699A (zh) 一种专家推荐方法及系统
CN108509588B (zh) 一种基于大数据的律师评估方法及推荐方法
CN112883176B (zh) 基于大数据面向专业职业的人工智能心理健康聊天机器人
JP7202757B1 (ja) 情報処理システム、情報処理方法およびプログラム
CN110413750A (zh) 根据用户问句召回标准问句的方法和装置
CN113506629B (zh) 一种症状自评量表简化及结果预测方法与系统
CN114333461B (zh) 主观题自动评分方法及系统
CN114357297A (zh) 学生画像构建及学习资源分发方法、计算机设备及存储介质
CN114281983A (zh) 分层结构的文本分类方法、系统、电子设备和存储介质
CN116414940A (zh) 标准问题的确定方法、装置及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant