CN110990521A

CN110990521A - 人名词库生成方法

Info

Publication number: CN110990521A
Application number: CN201911235956.9A
Authority: CN
Inventors: 李城华
Original assignee: Individual
Current assignee: Individual
Priority date: 2019-12-05
Filing date: 2019-12-05
Publication date: 2020-04-10

Abstract

本发明是关于人名词库生成方法。该方法包括：从民族知识库存储的“姓”中获取不同族群、家庭、个人的血缘“姓”；从预设存储位置，获取同一血缘“姓”的不同代纪辈分“氏”；从预设存储位置，获取同一代纪辈分“氏”的不同顺序“排”；从预设存储位置，获取预设数量的“名”。其中，所述预设数量大于一阈值。根据上述步骤获得的姓·氏·排·名四类信息，确定人名取名模型；根据所述人名取名模型建立人文、社会基础学科量化的人名词库。通过本发明的技术方案，可自动获得丰富、全面、不重名的人名词库。

Description

人名词库生成方法

技术领域

本发明涉及终端技术领域，尤其涉及人名词库生成方法。

背景技术

目前，用户的人名是姓和名构成，如王小明这个人名中，姓为王，小明为名，该人名不够丰富，缺少的信息较多，例如，没有表达出该用户是“王”字姓符号中哪个血缘家族的“王”姓、在其家族中的辈分是第几代、在同一血缘同一代的兄弟姐妹中排行老几等，因而，导致现行的人名信息缺失、区隔封闭、同姓同名、同宗不同姓、同姓不同宗、血缘地域宗教文化认同混淆、近亲文化、族群家族对立等现象，人名库不全面。

发明内容

本发明实施例提供了人名词库生成方法。所述技术方案如下：

从民族知识库存储的“姓”中获取不同族群、家庭、个人的血缘“姓”；

从预设存储位置，获取同一血缘“姓”的不同代纪辈分“氏”；

从预设存储位置，获取同一代纪辈分“氏”的不同顺序“排”；

从预设存储位置，获取预设数量的“名”。

其中，所述预设数量大于一阈值。

根据上述步骤获得的四类信息，确定人名取名模型；

根据所述人名取名模型建立人名词库。

在一个实施例中，所述方法还包括：

获取需要重命名的当前名字；

调用所述人名词库；

利用所述人名词库为所述当前名字进行重命名，使得重命名、后的名字与所述人名取名模型相匹配。

在一个实施例中，所述方法还包括：

确定当前需要取名的待取名用户；

获取所述待取名用户当前的家族属性，其中，所述待取名用户当前的家族属性包括：所述待取名用户的姓、所述待取名用户为其家族中的第几代、所述待取名用户在其家族中的同代排行；

根据所述待取名用户当前的家族属性和所述人名词库，确定所述待取名用户的名字。

在一个实施例中，在确定所述待取名用户的名字后，判断当前是否到达数据库更新条件；

当到达所述数据库更新条件后，根据所述待取名用户的名字对所述人名词库进行自动更新；

将更新后的所述人名词库进行保存；其中：

所述数据库更新条件包括：

当前时间达到预设数据库更新时间；

所述待取名用户所使用终端的当前位置位于预设数据库位置更新区域内；

在确定所述待取名用户的名字之后的预设时长内接收到数据库更新指令。

在一个实施例中，根据上述步骤获得的四类信息，确定人名取名模型，包括：

根据上述步骤获得的四类信息，预测各姓对应的氏符号表以及各氏对应的排符号表；

根据所述各姓以及所述各姓对应的氏符号表和所述各氏对应的排符号表，构建由姓.氏.排.名四元素构成的人名取名模型。

在一个实施例中，接收输入的人名关键词；

利用所述人名关键词在所述人名词库中进行搜索，获得搜索结果；

判断所述搜索结果中是否包括多个人名；

当所述搜索结果中包括1个人名时，将所述1个人名进行显示；

当所述搜索结果中包括多个人名时，将所述多个人名进行排序显示。

在一个实施例中，当所述搜索结果中包括多个人名时，将所述多个人名进行排序显示，包括：

确定所述多个人名中各人名的首位置字符；

按照所述各人名的首位置字符的不同，将所述多个人名划分为多个组别；

计算所述多个组别中各组别的人名的首位置字符的出现概率之和；

按照所述各组别的人名的首位置字符的出现概率之和，将所述各组别进行排序显示；以及

确定所述多个组别中各组别中的各人名的组合概率；

按照所述各组别中的各人名的组合概率从高到低的顺序，将所述各组别中的各人名在所述各组别内排序显示。

在一个实施例中，所述方法还包括：

为所述人名词库设置预设签名信息；

将所述预设签名信息保存至本地；

将所述人名词库发送至多个第二设备进行保存；

接收输入的词库调用指令；所述词库调用指令来自本地的输入指令或者外部设备的输入指令；

根据所述词库调用指令从所述多个第二设备中的任一第二设备上调用所述任一第二设备上存储的人名词库；

获取所述任一第二设备上存储的人名词库的当前签名信息；

判断所述任一第二设备上存储的人名词库的当前签名信息是否与所述预设签名信息匹配；

当不匹配时，从所述多个第二设备中的其他第二设备上再次调用存储的人名词库，并重新进行判断，直至所述多个第二设备中的预设第二设备上存储的人名词库的当前签名信息与所述预设签名信息相匹配时，调用所述预设第二设备上存储的人名词库。

在一个实施例中，在确定所述人名取名模型时，设所述民族知识库中当前已知的所有的姓的代号为i，i＝1,2,3,…,n，且设代号为i的姓中j代号的“名”在同代人中排行为k的概率为P_k(i,j)，j为“名”的代号，j＝1,2,3,…,m，则j排行为k的概率为P_kj：

其中f_j是“姓”调节常数，其计算如下：

其中K_i为所述民族知识库中代号为i的姓的个数；

P_kj计算公式中e_j为“名”的调节常数，其计算如下：

因此

对P_kj进行排序，排名靠前的为代号为i的姓中优先级高的“名”。

本发明的实施例提供的技术方案可以包括以下有益效果：

通过获取不同族群、家庭、个人的血缘“姓”，同一血缘“姓”的不同代纪辈分“氏”，同一代纪辈分“氏”的不同顺序“排”以及这些“姓”、“氏”、“排”之下的“名”，可确定人名取名模型，进而按照这个人名取名模型构建人名表格，最后搭建完整的人名词库，从而自动获得丰富、全面、不重名的人名词库，进而便于之后利用该人名词库为其他用户重命名、矫正命名或者新起名，并使其他人员能够通过依据该人名词库所起的名字准确而全面了解用户所来自的是同一民族的哪个族群、同一族群的哪个家族、用户是其家族的第几代人、排行老几，具体的名字信息等。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种人名词库生成方法的流程图。

图2是根据一示例性实施例示出的另一种人名词库生成方法的流程图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

为了解决上述技术问题，本发明实施例提供了一种人名词库生成方法，如图1所示，该方法包括步骤S101至步骤S106：

在步骤S101中，从民族知识库存储的“姓”中获取不同族群、家庭、个人的血缘“姓”；

民族知识库是个大的数据库，存储有海量的来自不同族群、家族的用户的姓。而血缘“姓”即我们平时所说的这个用户姓什么，是血緣认同的文字(拼音文字和非拼音文字)符号。

在步骤S102中，从预设存储位置，获取同一血缘“姓”的不同代纪辈分“氏”；

同一血缘“姓”的不同代纪辈分“氏”即用户是其家族中的第几代人。

在步骤S103中，从预设存储位置，获取同一代纪辈分“氏”的不同顺序“排”；

同一代纪辈分“氏”的不同顺序“排”即用户在同一代人中排行老几。

在步骤S104中，从预设存储位置，获取预设数量的“名”。

其中，所述预设数量大于一阈值。

在步骤S105中，根据上述步骤获得的四类信息，确定人名取名模型。

在步骤S106中，根据所述人名取名模型建立人名词库。

通过获取不同族群、家庭、个人的血缘“姓”，同一血缘“姓”的不同代纪辈分“氏”，同一代纪辈分“氏”的不同顺序“排”以及这些“姓”、“氏”、“排”之下的“名”，可确定人名取名模型，进而按照这个人名取名模型构建人名表格，最后搭建完整的人名词库，从而自动获得丰富、全面、不重名的人名词库，进而便于之后利用该人名词库为其他用户重命名或者起名，并使其能够通过依据该人名词库所起的名字准确而全面了解用户来自同一民族的那个族群、同一族群的哪个家族、用户是其家族的第几代人、同一代排行老几，具体的名字信息等。

如图2所示，在一个实施例中，所述方法还包括：

在步骤S201中，获取需要重命名、矫正命名的当前名字；

在步骤S202中，调用所述人名词库；

在步骤S203中，利用所述人名词库为所述当前名字进行重命名、矫正命名，使得重命名、矫正命名后的名字与所述人名取名模型相匹配。

由于当前名字命名方式的区隔、封闭和对立，通常信息缺失，不太全面，如当前名字为刘小燕，刘是该用户的“姓”、小燕是该用户的“名”，从该名字中无法看出该用户是“刘”字姓符号中哪个血缘家族的“刘”姓、是刘姓家族的第几代人，也不清楚在其家族的同辈中人排行老几，因而，在重命名、或矫正命名当前名字时，可调用该人名词库，然后依据当前名字进行重命名、或矫正命名，使得重命名、或矫正命名后的名字与所述人名取名模型相匹配，从而可重命名、或矫正命名为完整而全面的用户名，使其能够更加清楚地了解该用户是来自同一民族的哪个族群、同一族群的哪个家族、是其家族的第几代人、同一代排行老几等具体的名字信息。

在一个实施例中，所述方法还包括：

确定当前需要取名的待取名用户；

获取所述待取名用户当前的家族属性，其中，所述待取名用户当前的家族属性包括：所述待取名用户的姓(即血缘“姓”的文字符号)、所述待取名用户为其家族中的第几代人(即代纪辈分“氏”的文字符号)、所述待取名用户在其家族中的同代排行(即同一代纪的不同顺序“排”的文字符号)；

通过确定当前需要取名的待取名用户当前的家族属性，可根据当前的家族属性和所述人名词库，确定所述待取名用户的名字，即包含该家族的姓、以及用户是家族中的第几代人，用户在家族同辈中的排行以及该用户表征名的字符是什么。

将更新后的所述人名词库进行保存；其中：

所述数据库更新条件包括：

当前时间达到预设数据库更新时间；

当到达数据库更新条件后，可根据所述待取名用户的名字对所述人名词库进行自动更新，如达到数据库更新时间或者位于数据库位置更新区域或者及时接收到了数据库更新指令，则自动地对人名词库进行更新然后进行保存，从而确保人名词库一直保持最新状态。

当然，在对某个名字进行重命名、矫正命名后，也可以根据重命名、矫正命名后的名字对人名词库进行更新。

根据上述步骤获得的四类信息，预测各姓对应的氏符号表以及各“氏”对应的排符号表；各姓对应的氏符号表由各姓下用于表征每代人的字符所组成；

各“氏”对应的排符号表由用于表征各姓下每代人的排行的字符所组成，而各姓下每代人都有一份不同的“排符号表”。

根据所述各姓以及所述各姓对应的氏符号表和所述各“氏”对应的排符号表，构建由姓.氏.排.名四元素构成的人名取名模型。

由于上述步骤获得的四类信息可能不太全面，如某“姓”下的“氏”可能不太全面，或者某“氏”下的“排”可能不太全面，因而，可根据上述四类信息预测各姓对应的氏符号表以及同“氏”对应的排符号表，然后根据各姓以及所述各姓对应的氏符号表和所述同“氏”对应的排符号表，构建由姓.氏.排.名四元素构成的人名取名模型，这样，人名取名模型就由上述四元素组成。

在一个实施例中，接收输入的人名关键词；

判断所述搜索结果中是否包括多个人名；

在利用人名关键词在人名词库中进行搜索后，可得到搜索结果，进而判断该搜索结果中是否包括多个人名，如果仅包括1个人名，则可将该1个人名进行显示，如果包括多个人名，则将多个人名自动排列显示。

确定所述多个人名中各人名的首位置字符；

各人名的首位置字符即各人名的第一个字，如人名刘致帝远中的首位置字符为刘，其中，刘致帝远所在的刘姓如果对应的氏是致、对应的排为第四，则“刘”字姓a162家族第九代“致”字氏顺序第四“帝”字排的儿子(或女儿)“远”字名。

各组别的人名的首位置字符的出现概率指的是各组别中每个人名的首位置字符的出现概率的和。某个字符出现概率指的是某个字符的使用概率。

按照所述各组别的人名的首位置字符的出现概率之和，将所述各组别进行排序显示；例如可按照出现概率之和从高到低的顺序进行排序显示。

确定所述多个组别中各组别中的各人名的组合概率；

各组别中的各人名的组合概率由各组别中各人名的每个字符的出现概率计算而来。

按照所述各组别中的人名的组合概率从高到低的顺序，将所述各组别中的人名在所述各组别内排序显示。

在将多个人名进行显示时，可将多个人名划分到多个组别中，然后分别统计每个组别的人名的首位置字符的出现概率之和，进而按照每个组别的出现概率之和将多个组别进行排序显示，然后再确定多个组别中各组别的人名的组合概率，最后按照组合概率从高到低的顺序，将各组别中的各人名按照组合概率从高到低的顺序在各组别内自动排列显示，从而使得不同族群、不同家族、同一族群、同一家族的多个人名按照合理顺序进行自动排序显示。

在一个实施例中，所述方法还包括：

为所述人名词库设置预设签名信息；

将所述预设签名信息保存至本地；

将所述人名词库发送至多个第二设备进行保存；

获取所述任一第二设备上存储的人名词库的当前签名信息；

在为人名词库设置预设签名信息后，可将预设签名信息保存至本地，进而将人名词库发送至多个第二设备进行保存，该多个第二设备可位于不同位置，以便于附近的其他设备通过临近的第二设备调用该人名词库，进而在接收到词库调用指令，可从所述多个第二设备中的任一第二设备(如最近的第二设备)上调用所述任一第二设备上存储的人名词库，然后将该任一第二设备上存储的人名词库的当前签名信息与预设签名信息进行匹配度计算，如果匹配度较低即不匹配，说明该任一第二设备上存储的人名词库被人篡改过，不太靠谱，因而，可从多个第二设备中的其他第二设备(多个第二设备中除该任一第二设备之外的第二设备)上再次调用存储的人名词库，并重新进行判断，直至多个第二设备中的预设第二设备上存储的人名词库的当前签名信息与所述预设签名信息相匹配时，再调用所述预设第二设备上存储的人名词库，从而确保调用的人名词库是正确无误的。

预设第二设备是多个第二设备中具有与所述预设签名信息相匹配的签名信息的设备。

其中f_j是“姓”调节常数，用来防止某些“名”在某些特定的“姓”中出现的概率过高从而使其在其他“姓”中的排名过高，其计算如下：

其中K_i为所述民族知识库中代号为i的姓的个数；

P_kj计算公式中e_j为“名”的调节常数，用来防止某些“名”因为姓相同且重名率高而排名过高，其计算如下：

因此

为了能在“名”上体现排行，取名的时候需要综合考虑所有“名”与排行的关系，如“张三”中“三”有很大概率表示其排行老三，因此在取名的时候选择的“名”需要在排行的体现上具有代表性。

通过对P_kj进行排序，排名靠前的为最优的“名”，此算法综合考虑了所有“名”与排行的关系，使得形成的取名模型中取的“名”对于排行的辨认更为简单和准确，能够直观辨别其在同代人中的排行。

本领域技术人员在考虑说明书及实践这里发明的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变——只要具备两个条件：第一、文字，不论是拼音文字或非拼音文字；第二、血缘认同，认同你的家、家族、族群、民族的血缘同一性，都可以适用本“人名取名模型”。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种人名词库生成方法，其特征在于，包括：

从预设存储位置，获取预设数量的“名”，其中，所述预设数量大于一阈值；

根据上述步骤获得的四类信息，确定人名取名模型；

根据所述人名取名模型建立人名词库。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取需要重命名的当前名字；

调用所述人名词库；

利用所述人名词库为所述当前名字进行重命名，使得重命名后的名字与所述人名取名模型相匹配。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

确定当前需要取名的待取名用户；

4.根据权利要求3所述的方法，其特征在于，

在确定所述待取名用户的名字后，判断当前是否到达数据库更新条件；

将更新后的所述人名词库进行保存；其中：

所述数据库更新条件包括：

当前时间达到预设数据库更新时间；

5.根据权利要求4所述的方法，其特征在于，

根据上述步骤获得的四类信息，确定人名取名模型，包括：

6.根据权利要求1所述的方法，其特征在于，

接收输入的人名关键词；

判断所述搜索结果中是否包括多个人名；

7.根据权利要求6所述的方法，其特征在于，

当所述搜索结果中包括多个人名时，将所述多个人名进行排序显示，包括：

确定所述多个人名中各人名的首位置字符；

确定所述多个组别中各组别中的各人名的组合概率；

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：

为所述人名词库设置预设签名信息；

将所述预设签名信息保存至本地；

将所述人名词库发送至多个第二设备进行保存；

获取所述任一第二设备上存储的人名词库的当前签名信息；

9.根据权利要求1所述的方法，其特征在于，在确定所述人名取名模型时，

设所述民族知识库中当前已知的所有的姓的代号为i，i＝1,2,3,…,n，且设代号为i的姓中j代号的“名”在同代人中排行为k的概率为P_k(i,j)，j为“名”的代号，j＝1,2,3,…,m，则j排行为k的概率为P_kj：

其中f_j是“姓”调节常数，其计算如下：

其中K_i为所述民族知识库中代号为i的姓的个数；

P_kj计算公式中e_j为“名”的调节常数，其计算如下：

因此