CN103617248A - 一种名称转换方法及装置 - Google Patents
一种名称转换方法及装置 Download PDFInfo
- Publication number
- CN103617248A CN103617248A CN201310624814.8A CN201310624814A CN103617248A CN 103617248 A CN103617248 A CN 103617248A CN 201310624814 A CN201310624814 A CN 201310624814A CN 103617248 A CN103617248 A CN 103617248A
- Authority
- CN
- China
- Prior art keywords
- chinese
- pinyin
- file destination
- letter
- storehouse
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明的实施例提供一种名称转换方法及装置,涉及通信领域,通过预置字典,提高将中文名称转换为对应拼音首字母的准确率,进而使用户快速准确的定位搜索目标。该方法包括:获取目标文件的中文名称;根据预置多音字字库确定目标文件的中文名称中是否含有多音字;若目标文件的中文名称中含有多音字,则在媒资库中查找与目标文件的中文名称相同的中文名称;若在媒资库中查找到与目标文件的中文名称相同的中文名称,则根据媒资库内的拼音首字母确定目标文件的中文名称的拼音首字母;若在媒资库中没有查找到与目标文件的中文名称相同的中文名称,则根据预置字典确定目标文件的中文名称对应的拼音首字母。
Description
技术领域
本发明涉及通信领域,尤其涉及一种名称转换方法及装置。
背景技术
随着电子技术和网络媒体的高速发展,使得用户对高效精确的搜索到目标文件的需求日益增加,在现有的目标文件的搜索过程中通常是由用户输入目标文件的中文拼音或者中文拼音的首字母,进而查询到当前媒体资源库(媒资库)里对应的目标文件的中文汉字,然后进一步完成相应播放过程。针对这一搜索过程,后台技术人员需要建立中文拼音的首字母与中文汉字的对应关系,即建立将中文汉字转换为对应的中文拼音的首字母的多音字字库。
然而,针对中文汉字中的多音字,利用现有的拼音首字母转换方法会出现错误的对应关系。例如,若当前的中文汉字为“水浒传”时,利用现有的拼音首字母转换方法,有可能会将“水浒传”转换为“SHC”,此时若用户在搜索目标文件“水浒传”时输入“SHZ”,就会得不到或者不能快速获得准确的目标文件。
发明内容
本发明的实施例提供一种名称转换方法及装置,能够提高将中文名称转换为对应拼音首字母的准确率,进而使得用户快速准确的定位搜索目标。
为达到上述目的,本发明的实施例采用如下技术方案:
本发明的实施例提供一种名称转换方法,所述方法包括:
获取目标文件的中文名称;
根据预置多音字字库确定所述目标文件的中文名称中是否含有多音字;
若所述目标文件的中文名称中含有多音字,则在媒资库中查找与所述目标文件的中文名称相同的中文名称;
若在所述媒资库中查找到与所述目标文件的中文名称相同的中文名称,则根据所述媒资库内的拼音首字母确定所述目标文件的中文名称的拼音首字母;其中,所述媒资库内的拼音首字母为所述媒资库中查找到的中文名称的拼音首字母;
若在所述媒资库中没有查找到与所述目标文件的中文名称相同的中文名称,则根据预置字典确定所述目标文件的中文名称对应的拼音首字母,所述预置字典包括所述媒资库内的文件名称与相应的拼音首字母的对应关系,以及预置常规词与相应的拼音首字母的对应关系。
根据预置字典确定所述目标文件的中文名称对应的拼音首字母包括:
根据所述预置字典对所述目标文件的中文名称进行分词,以获得所述目标文件的中文名称的各个最小语义单元;
根据所述预置字典确定所述各个最小语义单元对应的拼音首字母。
所述方法还包括:
若所述目标文件的中文名称中不包含多音字,则根据拼音表确定所述目标文件的中文名称的拼音首字母。
所述方法还包括:
监控所述媒资库内的文件名称与相应的拼音首字母的对应关系是否更新;
如果更新,则更新所述预置字典内的所述媒资库内的文件名称与相应的拼音首字母的对应关系。
所述方法还包括:
实时更新所述预置字典内的预置常规词以及相应的拼音首字母的对应关系。
本发明的实施例提供一种名称转换装置,所述装置包括:
获取模块,用于获取目标文件的中文名称;
查找模块,用于根据预置多音字字库确定所述目标文件的中文名称中是否含有多音字,以及若所述目标文件的中文名称中含有多音字,则在媒资库中查找与所述目标文件的中文名称相同的中文名称;
第一转换模块,用于若在所述媒资库中查找到与所述目标文件的中文名称相同的中文名称,则根据所述媒资库内的拼音首字母确定所述目标文件的中文名称的拼音首字母;其中,所述媒资库内的拼音首字母为所述媒资库中查找到的中文名称的拼音首字母;
第二转换模块,用于若在所述媒资库中没有查找到所述目标文件的中文名称,则根据预置字典确定所述目标文件的中文名称对应的拼音首字母,所述预置字典包括所述媒资库内的文件名称与相应的拼音首字母的对应关系,以及预置常规词与相应的拼音首字母的对应关系。
所述第二转换模块还包括:
分词模块,用于根据所述预置字典对所述目标文件的中文名称进行分词,以获得所述目标文件的中文名称的各个最小语义单元;
执行模块,用于根据所述预置字典确定所述各个最小语义单元对应的拼音首字母。
若所述目标文件的中文名称中不包含多音字,则还包括第三转换模块,用于直接根据拼音表确定所述目标文件的中文名称的拼音首字母。
所述装置还包括:
检测模块,用于监控所述媒资库内的文件名称与相应的拼音首字母的对应关系是否更新;
更新模块,用于如果更新,则更新所述预置字典内的所述媒资库内的文件名称与相应的拼音首字母的对应关系。
所述更新模块,还用于实时更新所述预置字典内的预置常规词以及相应的拼音首字母的对应关系。
本发明的实施例提供一种名称转换方法及装置,通过获取目标文件的中文名称,进而根据预置多音字字库确定目标文件的中文名称中是否含有多音字,若目标文件的中文名称中含有多音字,则在媒资库中查找与目标文件的中文名称相同的中文名称,若在媒资库中查找到与目标文件的中文名称相同的中文名称,则根据媒资库内的拼音首字母确定目标文件的中文名称的拼音首字母,媒资库内的拼音首字母为与目标文件的中文名称相同的中文名称所对应的,进一步地,若在媒资库中没有查找到与目标文件的中文名称相同的中文名称,则根据预置字典确定目标文件的中文名称对应的拼音首字母。通过预置字典,能够提高将中文名称转换为对应拼音首字母的准确率,进而使得用户快速准确的定位搜索目标。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种名称转换方法的流程示意图一;
图2为本发明实施例提供的一种名称转换方法的流程示意图二;
图3为本发明实施例提供的一种名称转换装置的结构示意图一;
图4为本发明实施例提供的一种名称转换装置的结构示意图二;
图5为本发明实施例提供的一种名称转换装置的结构示意图三。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本发明。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
实施例一
本发明的实施例提供一种名称转换方法,如图1所示,包括:
101、名称转换装置获取目标文件的中文名称。
其中,目标文件的中文名称可以为未经过专门人员进行拼音首字母编辑的文件。具体的,本实施例提供一种名称转换方法,需建立中文汉字与其对应的拼音首字母的对应关系,以保证用户能够通过输入所需目标文件的拼音首字母进行目标文件的检索,会输入所需目标文件的拼音或拼音首字母。
102、名称转换装置根据预置多音字字库确定目标文件的中文名称中是否含有多音字。
其中,预置多音字字库为名称转换装置内部预置的多音字字库,其中收录了中文汉字中的所有多音字,用于确定在目标文件中的是否包含有多音字。
例如,某目标文件为“三国演义”,在名称转换装置获取目标文件的中文名称之后,调用预置多音字字库确定目标文件的中文名称中是否含有多音字,查找完毕发现“三国演义”中没有多音字,那么名称转换装置则直接根据拼音表确定目标文件的中文名称的拼音首字母“SGYY”。
又例如,某目标文件为“水浒传”,在名称转换装置获取目标文件的中文名称之后,调用预置多音字字库确定目标文件的中文名称中是否含有多音字,查找完毕发现“水浒传”中的“传”字为多音字,此时名称转换装置需要通过遍历媒资库进一步确认“水浒传”对应的拼音首字母。
103、若目标文件的中文名称中含有多音字,名称转换装置则在媒资库中查找与目标文件的中文名称相同的中文名称。
其中,媒资库为存储所有多媒体文件的数据库,媒资库内的任意多媒体文件都有可能成为目标文件。另外,名称转换装置对媒资库进行实时更新操作以保证媒资库内的多媒体文件最大限度的满足用户的搜索需要。
示例性的,若目标文件的名称为“甄嬛传”,在调用预置多音字字库后,确定目标文件的中文名称中含有多音字“传”,此时,名称转换装置则在媒资库中查找是否包含有与目标文件的中文名称“甄嬛传”相同的中文名称,若媒资库中包含与目标文件的中文名称相同的中文名称,名称转换装置则根据媒资库内的与目标文件的中文名称相同的中文名称转换为目标文件的中文名称对应的拼音首字母,若媒资库中不包含与目标文件的中文名称相同的中文名称,名称转换装置则根据预置多音字字库按照预设规则确定目标文件的中文名称对应的拼音首字母。
相应的,这里对目标文件的中文名称中含有多音字的个数不做限定,可以为一个或者多个。
104、若在媒资库中查找到与目标文件的中文名称相同的中文名称,名称转换装置则根据媒资库内的拼音首字母确定目标文件的中文名称的拼音首字母。
其中,媒资库内的拼音首字母为媒资库中查找到的中文名称的拼音首字母。
具体的,名称转换装置在媒资库中查找是否包含有与目标文件的中文名称相同的中文名称,若媒资库中包含有与目标文件的中文名称相同的中文名称,则说明媒资库内有与目标文件对应的拼音首字母的预置关系,那么名称转换装置则根据媒资库内的拼音首字母确定目标文件的中文名称的拼音首字母,媒资库内的拼音首字母为与目标文件的中文名称相同的中文名称所对应的。
示例性的,若目标文件的名称为“大汉传奇”,其中,“传”字为多音字。名称转换装置则在媒资库中查找是否包含有与目标文件的中文名称相同的中文名称“大汉传奇”,若媒资库中包含有与目标文件的中文名称相同的中文名称,名称转换装置则根据媒资库内的与目标文件的中文名称相同的中文名称“大汉传奇”所对应的拼音首字母“DHCQ”,确定目标文件的中文名称的拼音首字母为“DHCQ”。
105、若在媒资库中没有查找到与目标文件的中文名称相同的中文名称,名称转换装置则根据预置字典确定目标文件的中文名称对应的拼音首字母。
其中,预置字典包括媒资库内的文件名称与相应的拼音首字母的对应关系,以及预置常规词与相应的拼音首字母的对应关系。
具体的,若目标文件的中文名称中含有多音字,名称转换装置则在媒资库中查找是否包含有与目标文件的中文名称相同的中文名称,若媒资库中不包含与目标文件的中文名称相同的中文名称,那么名称转换装置根据预置字典对目标文件的中文名称进行分词,以获得目标文件的中文名称的各个最小语义单元,然后名称转换装置根据预置字典确定各个最小语义单元对应的拼音首字母,进而确定目标文件的中文名称的对应的拼音首字母。
示例性的,若目标文件的中文名称为“十二生肖”,其中“肖”字为多音字。名称转换装置则在媒资库中查找是否包含有与目标文件的中文名称相同的中文名称“十二生肖”,若媒资库中不包含与目标文件的中文名称相同的中文名称“十二生肖”,那么名称转换装置根据预置字典对目标文件的中文名称进行分词,以获得目标文件的中文名称的各个最小语义单元“十二”和“生肖”,然后名称转换装置根据预置字典确定各个最小语义单元对应的拼音首字母“SE”、“SX”,进而确定目标文件的中文名称的对应的拼音首字母“SESX”。
本发明的实施例提供一种名称转换方法,通过获取目标文件的中文名称,进而根据预置多音字字库确定目标文件的中文名称中是否含有多音字,若目标文件的中文名称中含有多音字,则在媒资库中查找与目标文件的中文名称相同的中文名称,若在媒资库中查找到与目标文件的中文名称相同的中文名称,则根据媒资库内的拼音首字母确定目标文件的中文名称的拼音首字母,媒资库内的拼音首字母为与目标文件的中文名称相同的中文名称所对应的,进一步地,若在媒资库中没有查找到与目标文件的中文名称相同的中文名称,则根据预置字典确定目标文件的中文名称对应的拼音首字母。通过预置字典,能够提高将中文名称转换为对应拼音首字母的准确率,进而使得用户快速准确的定位搜索目标。
实施例二
本发明的实施例提供一种名称转换方法,如图2所示,包括:
201、名称转换装置检测媒资库内是否更新目标文件。
其中,媒资库为存储所有多媒体文件的数据库,媒资库内的任意多媒体文件都有可能成为目标文件。另外,名称转换装置对媒资库进行实时更新操作以保证媒资库内的多媒体文件最大限度的满足用户的搜索需要。
具体的,名称转换装置定期对媒资库内的多媒体文件进行检测,若检测到新的多媒体文件出现,那么该多媒体文件被定义为目标文件,等待进一步对目标文件的中文名称进行转换,以获得目标文件的中文名称对应的拼音首字母,使得用户快速准确的定位搜索目标。
202、名称转换装置获取目标文件的中文名称。
其中,目标文件的中文名称可以为未经过专门人员进行拼音首字母编辑的文件。具体的,本实施例提供一种名称转换方法,需建立中文汉字与其对应的拼音首字母的对应关系,以保证用户能够通过输入所需目标文件的拼音首字母进行目标文件的检索,会输入所需目标文件的拼音或拼音首字母。
203、名称转换装置根据预置多音字字库确定目标文件的中文名称中是否含有多音字。
其中,预置多音字字库为称转换装置内部预置的多音字字库,其中收录了中文汉字中的所有多音字,用于确定在目标文件中的是否包含有多音字。
例如,某目标文件为“新红楼梦”,在名称转换装置获取目标文件的中文名称之后,调用预置多音字字库确定目标文件的中文名称中是否含有多音字,查找完毕发现“新红楼梦”中没有多音字,那么名称转换装置则直接根据拼音表确定目标文件的中文名称的拼音首字母“XHLM”。
又例如,某目标文件为“发酵幸福”,在名称转换装置获取目标文件的中文名称之后,调用预置多音字字库确定目标文件的中文名称中是否含有多音字,查找完毕发现“发酵幸福”中的“酵”字为多音字,此时名称转换装置需要通过遍历媒资库进一步确认“发酵幸福”对应的拼音首字母。
204、若目标文件的中文名称中含有多音字,名称转换装置则在媒资库中查找是否包含有与目标文件的中文名称相同的中文名称。
示例性的,若目标文件的名称为“神医华佗”,在调用预置多音字字库后,确定目标文件的中文名称中含有多音字“华”,此时,名称转换装置则在媒资库中查找是否包含有与目标文件的中文名称相同的中文名称“神医华佗”,若媒资库中包含有与目标文件的中文名称相同的中文名称,名称转换装置则根据媒资库内的与目标文件的中文名称相同的中文名称转换为目标文件的中文名称对应的拼音首字母,若媒资库中不包含与目标文件的中文名称相同的中文名称,名称转换装置则根据预置字典按照预设规则确定目标文件的中文名称对应的拼音首字母。
相应的,这里对目标文件的中文名称中含有多音字的个数不做限定,可以为一个或者多个。
205、若媒资库中包含有与目标文件的中文名称相同的中文名称,名称转换装置则根据媒资库内的拼音首字母确定目标文件的中文名称的拼音首字母。
其中,媒资库内的拼音首字母为媒资库中查找到的中文名称的拼音首字母。
具体的,名称转换装置则在媒资库中查找是否包含有与目标文件的中文名称相同的中文名称,若媒资库中包含有与目标文件的中文名称相同的中文名称,说明媒资库内有与目标文件对应的拼音首字母的预置关系,那么名称转换装置则根据媒资库内的与目标文件的中文名称相同的中文名称转换为目标文件的中文名称对应的拼音首字母。
示例性的,若目标文件的名称为“纪晓岚”,其中,“纪”字为多音字。名称转换装置则在媒资库中查找是否包含有与目标文件的中文名称相同的中文名称“纪晓岚”,若媒资库中包含有与目标文件的中文名称相同的中文名称,名称转换装置则根据媒资库内的与目标文件的中文名称相同的中文名称“纪晓岚”,转换为目标文件的中文名称对应的拼音首字母“JXL”,从而确定了目标文件的中文名称对应的拼音首字母。
206、若媒资库中不包含与目标文件的中文名称相同的中文名称,名称转换装置则根据预置字典对目标文件的中文名称进行分词,以获得目标文件的中文名称的各个最小语义单元。
预置字典包括媒资库内的文件名称与拼音首字母的对应关系,以及预置常规词与拼音首字母的对应关系。其中,预置常规词为以词性区分的最小语义单元,例如介词“的”、“地”、“得”等,名词“传奇”、“中国”、“初恋”等等,动词“唱”、“打”、“爱”等等。
具体的,若目标文件的中文名称中含有多音字,名称转换装置则在媒资库中查找是否包含有与目标文件的中文名称相同的中文名称,若媒资库中不包含与目标文件的中文名称相同的中文名称,那么名称转换装置根据预置字典对目标文件的中文名称进行分词,以获得目标文件的中文名称的各个最小语义单元,即把目标文件拆分成以词性作为单元的一个一个不同词语,而且这词语在预置字典已经存在。
示例性的,若目标文件的中文名称为“行走的美丽”,其中“行”字为多音字。名称转换装置则在媒资库中查找是否包含有与目标文件的中文名称相同的中文名称“行走的美丽”,若媒资库中不包含与目标文件的中文名称相同的中文名称“行走的美丽”,那么名称转换装置根据预置字典对目标文件的中文名称进行分词,以获得目标文件的中文名称的各个最小语义单元,分别为动词“行走”、介词“的”和名词“美丽”,然后名称转换装置根据预置字典确定各个最小语义单元对应的拼音首字母“XZ”、“D”和“ML”,进而确定目标文件的中文名称的对应的拼音首字母“XZDML”。
207、名称转换装置根据预置字典确定各个最小语义单元对应的拼音首字母,进而确定目标文件的中文名称的对应的拼音首字母。
具体的,由于预置字典确定各个最小语义单元都存在对应的拼音首字母,例如介词“的”对应的拼音首字母为“D”,名词“初恋”对应的拼音首字母为“CL”,动词“唱”对应的拼音首字母为“C”。所以,名称转换装置根据预置字典确定各个最小语义单元对应的拼音首字母,进而确定目标文件的中文名称的对应的拼音首字母。
示例性的,若目标文件的中文名称为“令狐冲的扮演者”,其中“令”字为多音字。名称转换装置则在媒资库中查找是否包含有与目标文件的中文名称相同的中文名称“令狐冲的扮演者”,若媒资库中不包含与目标文件的中文名称相同的中文名称“令狐冲的扮演者”,那么名称转换装置根据预置字典对目标文件的中文名称进行分词,以获得目标文件的中文名称的各个最小语义单元,分别为介词“的”和名词“扮演者”和“令狐冲”,然后名称转换装置根据预置字典确定各个最小语义单元对应的拼音首字母“LHC”、“D”和“BYZ”,进而确定目标文件的中文名称的对应的拼音首字母“LHCDBYZ”。
208、若目标文件的中文名称中不包含多音字,名称转换装置则直接根据拼音表确定目标文件的中文名称的拼音首字母。
具体的,名称转换装置调用预置多音字字库确定目标文件的中文名称中是否含有多音字,若目标文件的中文名称中不包含多音字,名称转换装置则直接根据拼音表确定目标文件的中文名称的拼音首字母。
示例性的,若目标文件为“非常幸运”,名称转换装置调用预置多音字字库确定目标文件的中文名称“非常幸运”中没有多音字。那么名称转换装置则直接根据拼音表确定目标文件的中文名称的拼音首字母为“FCXY”。
需要说明的是,步骤208与步骤204-206是并列关系,不存在时间上的逻辑关系。
209、名称转换装置实时更新预置字典内的预置常规词以及相应的拼音首字母的对应关系,以及预置字典内的媒资库内的文件名称与相应的拼音首字母的对应关系。
具体的,在名称转换装置运行的过程中会定时的更新预置字典内的媒资库内的文件名称以及预置常规词,以满足用户搜索的最大需要。例如,名称转换装置实时更新预置字典内的媒资库内新增加的电影名称,又例如,名称转换装置实时更新预置常规词,比如收录网络词语“人艰不拆”以及其对应的拼音首字母“RJBC”等等。
需要说明的是,步骤209与步骤201-208是并列关系,不存在时间上的逻辑关系。
本发明的实施例提供一种名称转换方法,通过获取目标文件的中文名称,进而根据预置多音字字库确定目标文件的中文名称中是否含有多音字,若目标文件的中文名称中含有多音字,则在媒资库中查找与目标文件的中文名称相同的中文名称,若在媒资库中查找到与目标文件的中文名称相同的中文名称,则根据媒资库内的拼音首字母确定目标文件的中文名称的拼音首字母,媒资库内的拼音首字母为与目标文件的中文名称相同的中文名称所对应的,进一步地,若在媒资库中没有查找到与目标文件的中文名称相同的中文名称,则根据预置字典确定目标文件的中文名称对应的拼音首字母。通过预置字典,能够提高将中文名称转换为对应拼音首字母的准确率,进而使得用户快速准确的定位搜索目标。
实施例三
本发明的实施例提供一种名称转换装置,如图3所示,包括:
获取模块01,用于获取目标文件的中文名称;
查找模块02,用于根据预置多音字字库确定目标文件的中文名称中是否含有多音字;以及若目标文件的中文名称中含有多音字,则在媒资库中查找与目标文件的中文名称相同的中文名称;
第一转换模块03,用于若在媒资库中查找到与目标文件的中文名称相同的中文名称,则根据媒资库内的拼音首字母确定目标文件的中文名称的拼音首字母;其中,媒资库内的拼音首字母为媒资库中查找到的中文名称的拼音首字母;
第二转换模块04,用于若在媒资库中没有查找到目标文件的中文名称,则根据预置字典确定目标文件的中文名称对应的拼音首字母,预置字典包括媒资库内的文件名称与相应的拼音首字母的对应关系,以及预置常规词与相应的拼音首字母的对应关系。
进一步地,如图4所示,所示第二转换模块04包括:
分词模块05,用于根据预置字典对目标文件的中文名称进行分词,以获得目标文件的中文名称的各个最小语义单元;
执行模块06,用于根据预置字典确定各个最小语义单元对应的拼音首字母。
进一步地,若目标文件的中文名称中不包含多音字,则还包括第三转换模块,用于直接根据拼音表确定目标文件的中文名称的拼音首字母。
进一步地,如图5所示,所示装置还包括:
检测模块07,用于监控媒资库内的文件名称与相应的拼音首字母的对应关系是否更新;
更新模块08,用于如果更新,则更新预置字典内的媒资库内的文件名称与相应的拼音首字母的对应关系。
进一步地,更新模块08,还用于实时更新预置字典内的预置常规词以及相应的拼音首字母的对应关系。
本发明的实施例提供一种名称转换装置,通过获取目标文件的中文名称,进而根据预置多音字字库确定目标文件的中文名称中是否含有多音字,若目标文件的中文名称中含有多音字,则在媒资库中查找与目标文件的中文名称相同的中文名称,若在媒资库中查找到与目标文件的中文名称相同的中文名称,则根据媒资库内的拼音首字母确定目标文件的中文名称的拼音首字母,媒资库内的拼音首字母为与目标文件的中文名称相同的中文名称所对应的,进一步地,若在媒资库中没有查找到与目标文件的中文名称相同的中文名称,则根据预置字典确定目标文件的中文名称对应的拼音首字母。通过预置字典,能够提高将中文名称转换为对应拼音首字母的准确率,进而使得用户快速准确的定位搜索目标。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种名称转换方法,其特征在于,所述方法包括:
获取目标文件的中文名称;
根据预置多音字字库确定所述目标文件的中文名称中是否含有多音字;
若所述目标文件的中文名称中含有多音字,则在媒资库中查找与所述目标文件的中文名称相同的中文名称;
若在所述媒资库中查找到与所述目标文件的中文名称相同的中文名称,则根据所述媒资库内的拼音首字母确定所述目标文件的中文名称的拼音首字母;其中,所述媒资库内的拼音首字母为所述媒资库中查找到的中文名称的拼音首字母;
若在所述媒资库中没有查找到与所述目标文件的中文名称相同的中文名称,则根据预置字典确定所述目标文件的中文名称对应的拼音首字母,所述预置字典包括所述媒资库内的文件名称与相应的拼音首字母的对应关系,以及预置常规词与相应的拼音首字母的对应关系。
2.根据权利要求1所述的名称转换方法,其特征在于,根据预置字典确定所述目标文件的中文名称对应的拼音首字母包括:
根据所述预置字典对所述目标文件的中文名称进行分词,以获得所述目标文件的中文名称的各个最小语义单元;
根据所述预置字典确定所述各个最小语义单元对应的拼音首字母。
3.根据权利要求1或2所述的名称转换方法,其特征在于,所述方法还包括:
若所述目标文件的中文名称中不包含多音字,则根据拼音表确定所述目标文件的中文名称的拼音首字母。
4.根据权利要求1或2所述的名称转换方法,其特征在于,所述方法还包括:
监控所述媒资库内的文件名称与相应的拼音首字母的对应关系是否更新;
如果更新,则更新所述预置字典内的所述媒资库内的文件名称与相应的拼音首字母的对应关系。
5.根据权利要求1或2所述的名称转换方法,其特征在于,所述方法还包括:
实时更新所述预置字典内的预置常规词以及相应的拼音首字母的对应关系。
6.一种名称转换装置,其特征在于,所述装置包括:
获取模块,用于获取目标文件的中文名称;
查找模块,用于根据预置多音字字库确定所述目标文件的中文名称中是否含有多音字,以及若所述目标文件的中文名称中含有多音字,则在媒资库中查找与所述目标文件的中文名称相同的中文名称;
第一转换模块,用于若在所述媒资库中查找到与所述目标文件的中文名称相同的中文名称,则根据所述媒资库内的拼音首字母确定所述目标文件的中文名称的拼音首字母;其中,所述媒资库内的拼音首字母为所述媒资库中查找到的中文名称的拼音首字母;
第二转换模块,用于若在所述媒资库中没有查找到与所述目标文件的中文名称相同的中文名称,则根据预置字典确定所述目标文件的中文名称对应的拼音首字母,所述预置字典包括所述媒资库内的文件名称与相应的拼音首字母的对应关系,以及预置常规词与相应的拼音首字母的对应关系。
7.根据权利要求6所述的名称转换装置,其特征在于,所述第二转换模块还包括:
分词模块,用于根据所述预置字典对所述目标文件的中文名称进行分词,以获得所述目标文件的中文名称的各个最小语义单元;
执行模块,用于根据所述预置字典确定所述各个最小语义单元对应的拼音首字母。
8.根据权利要求6或7所述的名称转换装置,其特征在于,若所述目标文件的中文名称中不包含多音字,则还包括第三转换模块,用于直接根据拼音表确定所述目标文件的中文名称的拼音首字母。
9.根据权利要求6或7所述的名称转换装置,其特征在于,所述装置还包括:
检测模块,用于监控所述媒资库内的文件名称与相应的拼音首字母的对应关系是否更新;
更新模块,用于如果更新,则更新所述预置字典内的所述媒资库内的文件名称与相应的拼音首字母的对应关系。
10.根据权利要求6或7所述的名称转换装置,其特征在于,
所述更新模块,还用于实时更新所述预置字典内的预置常规词以及相应的拼音首字母的对应关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310624814.8A CN103617248A (zh) | 2013-10-28 | 2013-11-26 | 一种名称转换方法及装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310518058.0 | 2013-10-28 | ||
CN201310518058 | 2013-10-28 | ||
CN201310624814.8A CN103617248A (zh) | 2013-10-28 | 2013-11-26 | 一种名称转换方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103617248A true CN103617248A (zh) | 2014-03-05 |
Family
ID=50167951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310624814.8A Pending CN103617248A (zh) | 2013-10-28 | 2013-11-26 | 一种名称转换方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103617248A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111614977A (zh) * | 2017-12-28 | 2020-09-01 | 贵州白山云科技股份有限公司 | 网络系统中文本内容传输优化方法和系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1421803A (zh) * | 2001-11-30 | 2003-06-04 | 英业达股份有限公司 | 可处理多音字的拼音/注音转换系统及方法 |
CN101246478A (zh) * | 2007-02-14 | 2008-08-20 | 高德软件有限公司 | 信息存储及检索方法 |
CN101315639A (zh) * | 2008-06-20 | 2008-12-03 | 北京天语君锐科技有限公司 | 搜索方法及系统 |
CN101930435A (zh) * | 2009-10-27 | 2010-12-29 | 深圳市北科瑞声科技有限公司 | 机构名称检索方法及系统 |
JP2013125450A (ja) * | 2011-12-15 | 2013-06-24 | Hitachi Government & Public Corporation System Engineering Ltd | 外国人氏名正字出力システム及び外国人氏名正字出力方法 |
CN103235789A (zh) * | 2013-03-29 | 2013-08-07 | 惠州市德赛西威汽车电子有限公司 | 一种汉字转换为拼音及首字母的方法 |
CN103365925A (zh) * | 2012-04-09 | 2013-10-23 | 高德软件有限公司 | 获取多音字拼音、基于拼音检索的方法及其相应装置 |
-
2013
- 2013-11-26 CN CN201310624814.8A patent/CN103617248A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1421803A (zh) * | 2001-11-30 | 2003-06-04 | 英业达股份有限公司 | 可处理多音字的拼音/注音转换系统及方法 |
CN101246478A (zh) * | 2007-02-14 | 2008-08-20 | 高德软件有限公司 | 信息存储及检索方法 |
CN101315639A (zh) * | 2008-06-20 | 2008-12-03 | 北京天语君锐科技有限公司 | 搜索方法及系统 |
CN101930435A (zh) * | 2009-10-27 | 2010-12-29 | 深圳市北科瑞声科技有限公司 | 机构名称检索方法及系统 |
JP2013125450A (ja) * | 2011-12-15 | 2013-06-24 | Hitachi Government & Public Corporation System Engineering Ltd | 外国人氏名正字出力システム及び外国人氏名正字出力方法 |
CN103365925A (zh) * | 2012-04-09 | 2013-10-23 | 高德软件有限公司 | 获取多音字拼音、基于拼音检索的方法及其相应装置 |
CN103235789A (zh) * | 2013-03-29 | 2013-08-07 | 惠州市德赛西威汽车电子有限公司 | 一种汉字转换为拼音及首字母的方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111614977A (zh) * | 2017-12-28 | 2020-09-01 | 贵州白山云科技股份有限公司 | 网络系统中文本内容传输优化方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10497366B2 (en) | Hybrid learning system for natural language understanding | |
US11520992B2 (en) | Hybrid learning system for natural language understanding | |
Winnenburg et al. | Facts from text: can text mining help to scale-up high-quality manual curation of gene products with ontologies? | |
CN108369580B (zh) | 针对屏幕上项目选择的基于语言和域独立模型的方法 | |
JP5948671B2 (ja) | マルチメディア情報検索方法及び電子機器 | |
EP2951726A2 (en) | Translating natural language descriptions to programs in a domain-specific language for spreadsheets | |
CN110020422A (zh) | 特征词的确定方法、装置和服务器 | |
CN1971554A (zh) | 使用样例来翻译语音输入的设备和方法 | |
US10108698B2 (en) | Common data repository for improving transactional efficiencies of user interactions with a computing device | |
CN111159330A (zh) | 一种数据库查询语句的生成方法及装置 | |
Derwojedowa et al. | Words, concepts and relations in the construction of Polish WordNet | |
CN103853703A (zh) | 一种信息处理方法及电子设备 | |
CN113051362B (zh) | 数据的查询方法、装置和服务器 | |
CN110941694A (zh) | 知识图谱的搜索定位方法、系统、电子设备和存储介质 | |
CN111178076A (zh) | 命名实体识别与链接方法、装置、设备及可读存储介质 | |
CN103440234A (zh) | 自然语言理解系统及方法 | |
US20040122660A1 (en) | Creating taxonomies and training data in multiple languages | |
CN105243056A (zh) | 一种基于标点符号处理的汉语句法分析方法及装置 | |
CN101770291B (zh) | 输入系统语意分析数据散列存储和分析方法 | |
US20200387815A1 (en) | Building training data and similarity relations for semantic space | |
CN102609410B (zh) | 规范文档辅助写作系统及规范文档生成方法 | |
CN103617248A (zh) | 一种名称转换方法及装置 | |
CN102982063A (zh) | 一种基于关系关键词扩展的元组精化的控制方法 | |
CN103116607B (zh) | 一种新的基于汉语拼音的全文检索系统 | |
CN110147358B (zh) | 自动问答知识库的建设方法及建设系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140305 |
|
RJ01 | Rejection of invention patent application after publication |