CN116257681A - 一种基于画像技术的民用航空事件调查员推荐方法 - Google Patents

一种基于画像技术的民用航空事件调查员推荐方法 Download PDF

Info

Publication number
CN116257681A
CN116257681A CN202211647321.1A CN202211647321A CN116257681A CN 116257681 A CN116257681 A CN 116257681A CN 202211647321 A CN202211647321 A CN 202211647321A CN 116257681 A CN116257681 A CN 116257681A
Authority
CN
China
Prior art keywords
investigator
data
investigation
accident
portrait
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211647321.1A
Other languages
English (en)
Other versions
CN116257681B (zh
Inventor
吴涛
王占海
陈奇
毛延峰
杨睿
万健
赵聪
朱新平
刘建华
李翀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Civil Aviation Science and Technology
Original Assignee
China Academy of Civil Aviation Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Civil Aviation Science and Technology filed Critical China Academy of Civil Aviation Science and Technology
Priority to CN202211647321.1A priority Critical patent/CN116257681B/zh
Publication of CN116257681A publication Critical patent/CN116257681A/zh
Application granted granted Critical
Publication of CN116257681B publication Critical patent/CN116257681B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于民用航空事件调查员推荐技术领域,公开了一种基于画像技术的民用航空事件调查员推荐方法,包括S1、调查员画像构建;S2、紧急事件关键词提取;S3、筛选适合调查任务的调查员;S4、调查员打分;S5、调查员排序以及给出调查员画像。本发明在给定的民航地区管理局上报的紧急事件信息中,提取关键词信息,然后基于画像技术构建事件调查员画像,再依据关键词信息筛选合适的调查员,接着对筛选出的调查员进行打分排序,最后给出调查员推荐名单和所推荐调查员的画像的推荐方法,解决了民用航空事件调查中无法实现调查员精准推荐的问题。

Description

一种基于画像技术的民用航空事件调查员推荐方法
技术领域
本发明涉及民用航空事件调查员推荐技术领域,具体为一种基于画像技术的民用航空事件调查员推荐方法。
背景技术
航空事件调查是为预防事故所进行的专业性工作,包括收集和分析资料、做出结论(含确定原因和促成因素),并提出安全建议,预防安全事故的发生。随着我国民用航空事业的快速发展,以及航空制造业走向世界,迫切需要我国建立一支素质高、反应迅速的事件调查员队伍。目前,由于事件调查员分布在不同的区域、不同的部门和专业,调查队伍组建,主要依靠调查组长根据行业经验选择一些在业内有一定工作经验和影响力的调查员,此种方式的缺陷在于:1)被推荐的调查员的各项素质或能力没有一套客观的量化标准;2)被推荐的调查员的各项能力不能用一种直观的形式体现出来;3)被推荐调查员的范围太小,有较大局限性。从而影响到了调查组长基于调查任务对调查员进行评判,得不到最佳的推荐名单,影响调查任务的高效执行。同时,考虑到今后我国调查员队伍不断扩大、基础信息不断累积、事件调查需求可能动态更新等不确定因素,如何基于信息化系统,集成有效的算法实现事件调查员精准推荐是民用航空事件调查组织亟待解决的问题。
画像技术是在大数据技术背景下,结合多学科构建研究对象的描述性标签属性,对研究对象的真实特征进行勾勒,形成可描述研究对象的特征、状态等信息的画像。从而更加快速、直观、准确和全面的对研究对象进行评价。因为其高匹配、高精准以及简单可靠的特点,现被应用在诸多大数据挖掘的场合中,例如在用户画像的基础上衍生出的精准营销系统、个性商品推荐系统、广告投放系统等,但目前还未见其应用于民用航空事件调查员的推荐中。
画像技术借助于信息化手段,将调查员基础数据经过数据量化、融合、预处理等,建立调查员画像标签体系(含静态类标签、动态类标签、特征类标签);然后,根据上报的紧急事件信息,提取其中的关键词,以调查员画像标签体系为基础,自动形成调查员筛选及推荐方案;最终经过人工确认形成事件调查员推荐名单。因此,基于画像技术来实现对民用航空事件调查员的推荐,以数据为支撑,将事件调查需求与调查员画像匹配过程的定量化、智能化成为可能。
发明内容
本发明意在提供一种基于画像技术的民用航空事件调查员推荐方法,在给定的民航地区管理局上报的紧急事件信息中,提取关键词信息,然后基于画像技术构建事件调查员画像,再依据关键词信息筛选合适的调查员,接着对筛选出的调查员进行打分排序,最后给出调查员推荐名单和所推荐调查员的画像的推荐方法,解决了民用航空事件调查中无法实现调查员精准推荐的问题。
为了实现上述目的,本发明提供如下技术方案:
一种基于画像技术的民用航空事件调查员推荐方法,包括以下步骤:
S1、调查员画像构建:
先以候选调查员的属性作为数据源构成调查员画像标签体系;
然后针对调查员的全部属性制定具体的量化规则,依据制定的量化规则对调查员数据的全部属性进行数字量化,并将数据进行min-max归一化处理:
Figure BDA0004010261710000021
式中,x为原始数据,x′为归一化数据,xmin为原始数据量纲中的最小值,xma为原始数据量纲中的最大值;
最后将归一化处理后的调查员数据采用雷达图的形式进行调查员个体画像展示;
S2、紧急事件关键词提取:对于各地方民航管理局提交的紧急事件进行关键词提取,并把关键词用字符数组存储起来,然后字符数组中的关键词依次与事故上报文本匹配,如果文本内容中有该关键词则匹配成功,否则匹配不成功;
S3、筛选适合调查任务的调查员:从S1数据源中提取相应数据作为K-means算法聚类的样本数据,并根据调查员选拔的要求,确定K值,并将其作为聚类质心数即分类的类别数,根据距质心的欧式距离大小将其分类,其中,1≤K≤20;
S4、调查员打分:由于每个调查员的各个属性多且各不相同,选取调查员所有标签属性中最为重要的标签属性作为评价调查员综合能力的数据支撑,同时按照标签属性的重要程度给出不同的权重,并对于上述标签属性的量化规则及相应权重;
S5、调查员排序以及给出调查员画像:根据调查员的分值在不同类别中对调查员进行降序的排列,分值越高排名越靠前,筛选上的几率也就越大;同时将调查员的标签与S4中相对应的评分用雷达图来表示,得到调查员的画像,并根据该画像实现完成对民用航空事件调查员的推荐。
进一步地,在S1中,作为调查员数据源的属性包括:性别、民族、外语熟练程度、年龄、身体、心理、品行、政治素质、行业调查员培训成绩、单位层级内部培训成绩、国内特大飞行事故调查经历、国内重大飞行事故调查经历、国内一般飞行事故调查经历、我国民用航空器在境外发生的事故调查经历、领导及管理能力、访谈能力、调查报告编写能力、团队协作能力、媒体应对能力、专业素质及工作单位;
并根据以上调查员数据形成完整的调查员画像三级标签体系:
一级标签分为:静态类标签、动态类标签、特质类标签;
二级标签分为:基本静态信息、身体及心理、思想政治、培训动态、调查经历、工作能力、专业素质;
三级标签分为:性别、民族、外语种类、年龄、身体、心理、品行、政治素质、行业调查员培训、单位层级内部培训、国内特大飞行事故、国内重大飞行事故、国内一般飞行事故、我国民用航空器在境外发生的事故、领导及管理能力、访谈能力、调查报告编写能力、团队协作能力、媒体应对能力、飞行运行专业、空管和机场专业、安全管理专业、适航维修专业、记录器译码专业、客舱安全专业;
其中,二级标签调查经历包含四个三级子标签:国内特大飞行事故、国内重大飞行事故、国内一般飞行事故、我国民用航空器在境外发生的事故,这四个子标签的调查次数量化之前求和,并将求和结果作为数据量化基础数据。
进一步地,在S2中,提取的关键词包括:时间、发生区域、发生事故飞机所属航空公司名称、飞机型号、事故区域、涉及的专业人员、人员受伤情况、事件等级。
进一步地,在S2中,提取关键词采用字符串匹配方法,具体步骤为:
A1、收集与紧急事件关键词提取相关的关键词,包括时间、发生区域、发生事故飞机所属航空公司名称、飞机型号、事故区域、涉及的专业人员、人员受伤情况、事件等级称,建立关键词库;
A2、建立事故上报文本文件,存储需要提取关键词的紧急事件;
A3、将关键词库中的关键词匹配事故上报文本,实现关键词提取。
进一步地,在S3中,提取的数据源包括“行业调查员培训”和“国内特大飞行事故次数”;分类的类别包括优秀、良好、合格,对于欧式空间的样本数据,以平方误差和eSSE作为聚类的目标函数,并作为衡量不同聚类效果的指标,表示为样本点x到所在聚类类别Ci的聚类质心||·间距离的平方和:
Figure BDA0004010261710000041
当eSSE值越小,表明聚类类别内部的样本越相似,最优的聚类结果应使得eSSE达到最小值;由此实现对调查员数据的一个初步的分类,当数据不在一个数量级时采取归一化处理,使其范围在[0,1]之间。
进一步地,在S4中,最为重要标签属性包括品行、团队协作能力、职称、职务及调查经历总次数,上述五个标签属性的量化规则及相应权重如下表所示:
Figure BDA0004010261710000042
Figure BDA0004010261710000051
表中,N1,N2,…,N15属于自然数,权重P1+P2+P3+P4+P5=1;
最后根据数据量化与权重即可通过加权求和的方式求得每个调查员的综合评分。
进一步地,在S5中,排序的方式为:根据二级标签中的身体及心理、思想政治、培训动态、调查经历、工作能力、专业素质作为衡量调查员的几个方面,其中,对于心理都为常态的调查员,只考虑身体部分、思想政治考虑品行和政治素质,培训动态选取行业调查员培训和单位层级内部培训,调查经历考虑国内特大飞行事故、国内重大飞行事故、国内一般飞行事故、我国民用航空器在境外发生的事故并分别选取其时间和次数,工作能力选取领导及管理能力、访谈能力、调查报告撰写能力、团队协作能力、媒体应对能力,专业素质根据调查员的不同专业分别选取飞行运行专业、空管和机场专业、安全管理专业、适航维修专业、记录器译码专业、客舱安全专业,每个方面都结合上述各自考虑或选取的三级标签来综合排序;
评分依据为该方面下三级标签的值来作为该方面的数据来源和依据,若一个方面中存在多个标签,那么求这些标签的平均值,由于各标签的量化标准不同,在此之前先将大于1的值进行归一化处理,达到统一标准。
技术方案的有益效果是:
1、本发明制定了专属于我国调查员的调查员胜任力框架,并基于所作框架分析了我国调查员所需能力,实现了人员与事件需求匹配的调查员职责和能力分析;
2、本发明构建了事件调查员画像理论的应用框架,有效完善了事件调查员画像研究与应用的理论基础,构建了全面、精准、可靠的事件调查员画像理论;
3、本发明制定了调查员标签体系的技术架构,获得多个标签维度下具体的三级标签内容,构建了客观、全面的调查员三级标签体系,同时对调查员的全部标签属性制定了详细的量化规则,实现精准刻画调查员标签画像的目的,为开展调查员类群画像及指标分析打下了坚实的基础,为民用航空事件调查员画像有关研究提供了良好的方法支持及路线指引;
4、本发明采用字符串匹配方法对民航事件进行关键词提取。首先,对某个关键信息进行关键词提取时,只需要收集与该信息有关的关键词,更新补充关键词库,即可实现关键信息的关键词提取,运用广泛,且关键词库补充的越完整,关键词的提取就越准确;其次,对关键信息进行关键词提取中,需要增加提取内容和更改提取内容时,可根据自身需求,对方法进行调用,方便快捷;
5、本发明采用K-means算法对民航事件调查员进行聚类。该算法原理简单,实现容易,主要需要调整的参数仅仅是簇数k,且该算法具有优化迭代的功能,能够克服样本聚类的不确定性,收敛速度快,聚类效果优,算法的解释度强;
6、本发明在给定的民航地区管理局上报的紧急事件信息中,提取关键词信息,然后基于画像技术构建事件调查员画像,再依据关键词信息筛选合适的调查员,接着对筛选出的调查员进行打分排序,最后给出调查员推荐名单和所推荐调查员的画像的推荐方法,解决了民用航空事件调查中无法实现调查员精准推荐的问题。
附图说明
图1为本发明一种基于画像技术的民用航空事件调查员推荐方法的流程框图;
图2为本发明一种基于画像技术的民用航空事件调查员推荐方法S1中的量化框图一;
图3为本发明一种基于画像技术的民用航空事件调查员推荐方法S1中的量化框图二;
具体实施方式
下面结合附图和实施方式对本发明作进一步的详细说明:
如图1至图3所示,
一种基于画像技术的民用航空事件调查员推荐方法,包括以下步骤:
S1、调查员画像构建:调查员画像标签体系首先以候选调查员的下列属性作为数据源:性别、民族、外语熟练程度、年龄、身体、心理、品行、政治素质、行业调查员培训成绩、单位层级内部培训成绩、国内特大飞行事故调查经历、国内重大飞行事故调查经历、国内一般飞行事故调查经历、我国民用航空器在境外发生的事故调查经历、领导及管理能力、访谈能力、调查报告编写能力、团队协作能力、媒体应对能力、专业素质及工作单位;
并根据以上调查员数据形成完整的调查员画像三级标签体系:
一级标签分为:静态类标签、动态类标签、特质类标签;
二级标签分为:基本静态信息、身体及心理、思想政治、培训动态、调查经历、工作能力、专业素质;
三级标签分为:性别、民族、外语种类、年龄、身体、心理、品行、政治素质、行业调查员培训、单位层级内部培训、国内特大飞行事故、国内重大飞行事故、国内一般飞行事故、我国民用航空器在境外发生的事故、领导及管理能力、访谈能力、调查报告编写能力、团队协作能力、媒体应对能力、飞行运行专业、空管和机场专业、安全管理专业、适航维修专业、记录器译码专业、客舱安全专业;
其中,调查员的二级标签调查经历做量化时,将二级标签调查经历下的四个三级子标签:国内特大飞行事故调查经历、国内重大飞行事故调查经历、国内一般飞行事故调查经历、我国民用航空器在境外发生的事故调查经历的调查次数做了求和,将求和结果作为调查经历这一标签属性的数据量化基础;
然后针对调查员的全部属性制定具体的量化规则,依据制定的量化规则对调查员数据的全部属性进行数字量化,并将数据进行min-max归一化处理:
Figure BDA0004010261710000071
式中,x为原始数据,x′为归一化数据,xmin为原始数据量纲中的最小值,xmax为原始数据量纲中的最大值;
最后,将归一化处理后的调查员数据采用雷达图的形式进行调查员个体画像展示;
S2、紧急事件关键词提取:对于紧急事件关键词的提取,采用字符串匹配的方法进行提取,具体步骤为:
A1、把关键词库中的关键词以英文逗号为界限用字符数组存储起来,建立关键词库,把紧急事件内容用字符数组存储起来,紧接着关键词依次与紧急事件内容字符数组进行比对匹配;
A2、匹配成功后,先进行一次判断,如果是与事件等级相关的关键词则进行事件等级的提取,如果是其他类型的关键词则进行其他类型关键词的匹配提取,如果不是以上两种情况则进行下一个关键词的判断;
在提取事件等级时,这里根据死亡、重伤人数进行划分然后提取,如果有40人及以上人数死亡,则该事故被划为特别重大飞行事故;如果有39人及以下人数死亡,则该事故被划为重大飞行事故;如果重伤人数在10人及其以上者,则该事故被划为一般飞行事故;
A3、提取其他类型关键词,这里直接进行关键词比对匹配,如果匹配成功把该关键词直接输出;
A4、提取特别关键词,先判断该关键词是不是特别关键词,当这些关键词与紧急事件内容匹配成功时,将格外输出自己需要的内容;
A5、关键词文档输出,关键词提取完成后,以文档形式输出所提取的关键词;
S3、筛选适合调查任务的调查员:从S1数据源中提取“行业调查员培训”和“国内特大飞行事故次数”相应的30个数据为例,并作为执行K-means聚类算法的样本数据,选取K个(1≤K≤20)样本数据作为初始聚类质心,分类的类别分别为优秀、良好、合格;
对于欧式空间的样本数据,以平方误差和eSSE作为聚类的目标函数,并作为衡量不同聚类效果的指标,表示为样本点x到所在聚类类别Ci的聚类质心μi间距离的平方和:
Figure BDA0004010261710000091
当eSSE值越小,表明聚类类别内部的样本越相似,最优的聚类结果应使得eSSE达到最小值;
由此便对调查员数据进行了一个初步的分类,当数据不在一个数量级时采取归一化处理,使其范围在[0,1]之间;
S4、调查员打分:由于每个调查员的各个属性多且各不相同,因此,选取调查员所有标签属性中最为重要的五个标签属性:品行、团队协作能力、职称、职务及调查经历总次数,作为评价调查员综合能力的数据支撑,同时按照标签属性的重要程度给出不同的权重,对于上述五个标签属性的量化规则及相应权重下表所示:
Figure BDA0004010261710000092
表中,N1,N2,…,N15属于自然数,权重P1+P2+P3+P4+P5=1;
最后根据数据量化与权重即可通过加权求和的方式求得每个调查员的综合评分;
S5、调查员排序以及给出调查员画像:根据调查员的分值在不同类别中对调查员进行降序的排列,分值越高排名越靠前,筛选上的几率也就越大;
根据二级标签中的身体及心理、思想政治、培训动态、调查经历、工作能力、专业素质作为衡量调查员的几个方面,其中身体及心理方面只考虑身体部分(心理都为常态),思想政治考虑品行和政治素质,培训动态选取行业调查员培训和单位层级内部培训,调查经历考虑国内特大飞行事故、国内重大飞行事故、国内一般飞行事故、我国民用航空器在境外发生的事故并分别选取其时间和次数,工作能力选取领导及管理能力、访谈能力、调查报告撰写能力、团队协作能力、媒体应对能力,专业素质根据调查员的不同专业分别选取飞行运行专业、空管和机场专业、安全管理专业、适航维修专业、记录器译码专业、客舱安全专业;
每个方面都结合上述各自考虑或选取的三级标签来综合评分,其评分依据是用该方面下三级标签的值来作为该方面的数据来源和依据,如果一个方面中存在多个标签,那么求这些标签的平均值,考虑到各标签的量化标准不同,在此之前先将大于1的值进行归一化处理,达到统一标准的目的;将调查员的标签与其相对应的评分用雷达图来表示,得到调查员的画像,并根据该画像实现完成对民用航空事件调查员的推荐。
以上所述的仅是本发明的实施例,方案中公知的具体技术方案或特性等常识在此未作过多描述。应当指出,对于本领域的技术人员来说,在不脱离本发明技术方案的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

Claims (7)

1.一种基于画像技术的民用航空事件调查员推荐方法,其特征在于,包括以下步骤:
S1、调查员画像构建:
先以候选调查员的属性作为数据源构成调查员画像标签体系;
然后针对调查员的全部属性制定具体的量化规则,依据制定的量化规则对调查员数据的全部属性进行数字量化,并将数据进行min-max归一化处理:
Figure FDA0004010261700000011
式中,x为原始数据,x′为归一化数据,xmin为原始数据量纲中的最小值,xma为原始数据量纲中的最大值;
最后将归一化处理后的调查员数据采用雷达图的形式进行调查员个体画像展示;
S2、紧急事件关键词提取:对于各地方民航管理局提交的紧急事件进行关键词提取,并把关键词用字符数组存储起来,然后字符数组中的关键词依次与事故上报文本匹配,如果文本内容中有该关键词则匹配成功,否则匹配不成功;
S3、筛选适合调查任务的调查员:从S1数据源中提取相应数据作为K-means算法聚类的样本数据,并根据调查员选拔的要求,确定K值,并将其作为聚类质心数即分类的类别数,根据距质心的欧式距离大小将其分类,其中,1≤K≤20;
S4、调查员打分:由于每个调查员的各个属性多且各不相同,选取调查员所有标签属性中最为重要的标签属性作为评价调查员综合能力的数据支撑,同时按照标签属性的重要程度给出不同的权重,并对于上述标签属性的量化规则及相应权重;
S5、调查员排序以及给出调查员画像:根据调查员的分值在不同类别中对调查员进行降序的排列,分值越高排名越靠前,筛选上的几率也就越大;同时将调查员的标签与S4中相对应的评分用雷达图来表示,得到调查员的画像,并根据该画像实现完成对民用航空事件调查员的推荐。
2.根据权利要求1所述的一种基于画像技术的民用航空事件调查员推荐方法,其特征在于:在S1中,作为调查员数据源的属性包括:性别、民族、外语熟练程度、年龄、身体、心理、品行、政治素质、行业调查员培训成绩、单位层级内部培训成绩、国内特大飞行事故调查经历、国内重大飞行事故调查经历、国内一般飞行事故调查经历、我国民用航空器在境外发生的事故调查经历、领导及管理能力、访谈能力、调查报告编写能力、团队协作能力、媒体应对能力、专业素质及工作单位;
并根据以上调查员数据形成完整的调查员画像三级标签体系:
一级标签分为:静态类标签、动态类标签、特质类标签;
二级标签分为:基本静态信息、身体及心理、思想政治、培训动态、调查经历、工作能力、专业素质;
三级标签分为:性别、民族、外语种类、年龄、身体、心理、品行、政治素质、行业调查员培训、单位层级内部培训、国内特大飞行事故、国内重大飞行事故、国内一般飞行事故、我国民用航空器在境外发生的事故、领导及管理能力、访谈能力、调查报告编写能力、团队协作能力、媒体应对能力、飞行运行专业、空管和机场专业、安全管理专业、适航维修专业、记录器译码专业、客舱安全专业;
其中,二级标签调查经历包含四个三级子标签:国内特大飞行事故、国内重大飞行事故、国内一般飞行事故、我国民用航空器在境外发生的事故,这四个子标签的调查次数量化之前求和,并将求和结果作为数据量化基础数据。
3.根据权利要求2所述的一种基于画像技术的民用航空事件调查员推荐方法,其特征在于:在S2中,提取的关键词包括:时间、发生区域、发生事故飞机所属航空公司名称、飞机型号、事故区域、涉及的专业人员、人员受伤情况、事件等级。
4.根据权利要求3所述的一种基于画像技术的民用航空事件调查员推荐方法,其特征在于:在S2中,提取关键词采用字符串匹配方法,具体步骤为:
A1、收集与紧急事件关键词提取相关的关键词,包括时间、发生区域、发生事故飞机所属航空公司名称、飞机型号、事故区域、涉及的专业人员、人员受伤情况、事件等级称,建立关键词库;
A2、建立事故上报文本文件,存储需要提取关键词的紧急事件;
A3、将关键词库中的关键词匹配事故上报文本,实现关键词提取。
5.根据权利要求2所述的一种基于画像技术的民用航空事件调查员推荐方法,其特征在于:在S3中,提取的数据源包括“行业调查员培训”和“国内特大飞行事故次数”;分类的类别包括优秀、良好、合格,对于欧式空间的样本数据,以平方误差和eSSE作为聚类的目标函数,并作为衡量不同聚类效果的指标,表示为样本点x到所在聚类类别Ci的聚类质心μi间距离的平方和:
Figure FDA0004010261700000031
当eSSE值越小,表明聚类类别内部的样本越相似,最优的聚类结果应使得eSSE达到最小值;由此实现对调查员数据的一个初步的分类,当数据不在一个数量级时采取归一化处理,使其范围在[0,1]之间。
6.根据权利要求2所述的一种基于画像技术的民用航空事件调查员推荐方法,其特征在于:在S4中,最为重要标签属性包括品行、团队协作能力、职称、职务及调查经历总次数,上述五个标签属性的量化规则及相应权重如下表所示:
Figure FDA0004010261700000032
表中,N1,N2,…,N15属于自然数,权重P1+P2+P3+P4+P5=1;
最后根据数据量化与权重即可通过加权求和的方式求得每个调查员的综合评分。
7.根据权利要求2所述的一种基于画像技术的民用航空事件调查员推荐方法,其特征在于:在S5中,排序的方式为:根据二级标签中的身体及心理、思想政治、培训动态、调查经历、工作能力、专业素质作为衡量调查员的几个方面,其中,对于心理都为常态的调查员,只考虑身体部分、思想政治考虑品行和政治素质,培训动态选取行业调查员培训和单位层级内部培训,调查经历考虑国内特大飞行事故、国内重大飞行事故、国内一般飞行事故、我国民用航空器在境外发生的事故并分别选取其时间和次数,工作能力选取领导及管理能力、访谈能力、调查报告撰写能力、团队协作能力、媒体应对能力,专业素质根据调查员的不同专业分别选取飞行运行专业、空管和机场专业、安全管理专业、适航维修专业、记录器译码专业、客舱安全专业,每个方面都结合上述各自考虑或选取的三级标签来综合排序;
评分依据为该方面下三级标签的值来作为该方面的数据来源和依据,若一个方面中存在多个标签,那么求这些标签的平均值,由于各标签的量化标准不同,在此之前先将大于1的值进行归一化处理,达到统一标准。
CN202211647321.1A 2022-12-21 2022-12-21 一种基于画像技术的民用航空事件调查员推荐方法 Active CN116257681B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211647321.1A CN116257681B (zh) 2022-12-21 2022-12-21 一种基于画像技术的民用航空事件调查员推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211647321.1A CN116257681B (zh) 2022-12-21 2022-12-21 一种基于画像技术的民用航空事件调查员推荐方法

Publications (2)

Publication Number Publication Date
CN116257681A true CN116257681A (zh) 2023-06-13
CN116257681B CN116257681B (zh) 2023-10-13

Family

ID=86683405

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211647321.1A Active CN116257681B (zh) 2022-12-21 2022-12-21 一种基于画像技术的民用航空事件调查员推荐方法

Country Status (1)

Country Link
CN (1) CN116257681B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116703129A (zh) * 2023-08-07 2023-09-05 匠达(苏州)科技有限公司 基于人员数据画像的智能任务匹配调度方法及系统
CN117094691A (zh) * 2023-10-16 2023-11-21 四川省瑞人网络科技有限公司 一种基于大数据平台的人力资源管理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111191122A (zh) * 2019-12-20 2020-05-22 重庆邮电大学 一种基于用户画像的学习资源推荐系统
CN111724039A (zh) * 2020-05-26 2020-09-29 河海大学 一种向电力用户推荐客服人员的推荐方法
CN113779384A (zh) * 2021-08-23 2021-12-10 广州百奕信息科技有限公司 一种基于客户画像的航班推荐系统
WO2022206103A1 (zh) * 2021-04-01 2022-10-06 重庆邮电大学 一种微博异构信息的用户画像构建方法
CN115168736A (zh) * 2022-07-29 2022-10-11 中国华能集团清洁能源技术研究院有限公司 一种评标专家推荐方法、装置、设备及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111191122A (zh) * 2019-12-20 2020-05-22 重庆邮电大学 一种基于用户画像的学习资源推荐系统
CN111724039A (zh) * 2020-05-26 2020-09-29 河海大学 一种向电力用户推荐客服人员的推荐方法
WO2022206103A1 (zh) * 2021-04-01 2022-10-06 重庆邮电大学 一种微博异构信息的用户画像构建方法
CN113779384A (zh) * 2021-08-23 2021-12-10 广州百奕信息科技有限公司 一种基于客户画像的航班推荐系统
CN115168736A (zh) * 2022-07-29 2022-10-11 中国华能集团清洁能源技术研究院有限公司 一种评标专家推荐方法、装置、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
皎海军;杜胜贤;廖晨阳;于劲松;: "基于词频-逆文档频率(TFIDF)算法的公文处理智能推荐技术研究", 办公自动化, no. 13 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116703129A (zh) * 2023-08-07 2023-09-05 匠达(苏州)科技有限公司 基于人员数据画像的智能任务匹配调度方法及系统
CN116703129B (zh) * 2023-08-07 2023-10-24 匠达(苏州)科技有限公司 基于人员数据画像的智能任务匹配调度方法及系统
CN117094691A (zh) * 2023-10-16 2023-11-21 四川省瑞人网络科技有限公司 一种基于大数据平台的人力资源管理方法
CN117094691B (zh) * 2023-10-16 2024-02-02 四川省瑞人网络科技有限公司 一种基于大数据平台的人力资源管理方法

Also Published As

Publication number Publication date
CN116257681B (zh) 2023-10-13

Similar Documents

Publication Publication Date Title
CN116257681B (zh) 一种基于画像技术的民用航空事件调查员推荐方法
US11093568B2 (en) Systems and methods for content management
Deepak et al. A novel firefly driven scheme for resume parsing and matching based on entity linking paradigm
US10089581B2 (en) Data driven classification and data quality checking system
US11568311B2 (en) Method and system to test a document collection trained to identify sentiments
Rose et al. Natural language processing based method for clustering and analysis of aviation safety narratives
CN113298431B (zh) 基于航空qar大数据的飞行员胜任能力画像方法及系统
CN110727852A (zh) 一种推送招聘推荐服务的方法、装置及终端
CN109614484A (zh) 一种基于分类效用的文本聚类方法及其系统
CN115544348A (zh) 一种基于互联网大数据的海量信息智能搜索系统
CN115982379A (zh) 基于知识图谱的用户画像构建方法和系统
Guo et al. Evolution mechanism on the unsafe behavioural risks of general aviation pilots
US20150193529A1 (en) Opinion analyzing system and method
Lappas et al. The development of an Ordinary Least Squares parametric model to estimate the Cost Per Flying Hour of ‘unknown’aircraft types and a comparative application
CN108763459A (zh) 基于心理测试及dnn算法的专业倾向分析方法及系统
Baugh Predicting general aviation accidents using machine learning algorithms
CN110334112B (zh) 一种简历信息检索方法及装置
Gürbüz et al. Classification rule discovery for the aviation incidents resulted in fatality
KR102309778B1 (ko) 자연어 처리 기술을 이용한 자기소개서 평가 시스템 및 방법
Garcia et al. Predicting the Severity of Runway Excursions from Aviation Safety Reports
Gottipati et al. Exploring the impact of COVID-19 on aviation industry: A text mining approach
Fala An analysis of fixed-wing stall-type accidents in the United States
Hou et al. Civil aviation safety risk intelligent early warning model based on text mining and multi-model fusion
Szafrański et al. Data analysis of information system TURAWA in the aspect of data mining methods
Rukabu Application of machine learning techniques for incident-accident classification problem in aviation safety management

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Wu Tao

Inventor after: Zhao Cong

Inventor after: Wan Jian

Inventor after: Zhu Xinping

Inventor after: Liu Jianhua

Inventor after: Li Li

Inventor after: Mao Yanfeng

Inventor after: Wang Zhanhai

Inventor after: Chen Qi

Inventor after: Yang Rui

Inventor before: Wu Tao

Inventor before: Li Li

Inventor before: Wang Zhanhai

Inventor before: Chen Qi

Inventor before: Mao Yanfeng

Inventor before: Yang Rui

Inventor before: Wan Jian

Inventor before: Zhao Cong

Inventor before: Zhu Xinping

Inventor before: Liu Jianhua

CB03 Change of inventor or designer information