CN104021201A - 一种数据转换方法及装置 - Google Patents

一种数据转换方法及装置 Download PDF

Info

Publication number
CN104021201A
CN104021201A CN201410268379.4A CN201410268379A CN104021201A CN 104021201 A CN104021201 A CN 104021201A CN 201410268379 A CN201410268379 A CN 201410268379A CN 104021201 A CN104021201 A CN 104021201A
Authority
CN
China
Prior art keywords
character
alternative
frequency
alternative characters
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410268379.4A
Other languages
English (en)
Other versions
CN104021201B (zh
Inventor
辛玲
肖雪韵
雷华平
谷智慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201410268379.4A priority Critical patent/CN104021201B/zh
Publication of CN104021201A publication Critical patent/CN104021201A/zh
Application granted granted Critical
Publication of CN104021201B publication Critical patent/CN104021201B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种数据转换方法及装置,该方法可以接收字符编码并显示与字符编码对应的字符,用户可选择某一字符且选择与该字符对应的检索命令,获取到该字符及该检索命令后进行检索,进而获得与用户选择的字符存在语义相关度的多个备选数据,以供用户选择,且所述备选数据包括字符、图片、音频及自定义数据中的至少一种。相较于现有技术中只提供与输入的字符编码对应的字符相比,本申请可以为用户提供给更多的备选数据,并且提供的备选数据形式丰富,提高了用户的数据输入体验。

Description

一种数据转换方法及装置
技术领域
本申请涉及输入法技术领域,尤其是一种数据转换方法及装置。
背景技术
随着计算机技术的发展,人们已经越来越习惯于利用计算机进行数据处理及信息交流。在与计算机交互的过程中,需要将数据输入到计算机相应程序中,如信息交流工具、文字处理工具等。
目前的数据转换工具,只能接收用户输入的字符编码,并显示对应的字符供用户选择,数据量少且数据形式单一。
发明内容
有鉴于此,本申请提供了一种数据转换方法及装置,用以解决现有技术中提供给用户选择的数据量少且数据形式单一的技术问题,本申请提供的技术方案如下:
一种数据转换方法,包括:
接收字符编码;
显示与所述接收的字符编码对应的字符;
获取用户选择的字符及对该字符选择的检索指令;
依据所述检索指令的类型,对用户选择的所述字符进行检索,以获得与该字符存在语义相关度的多个备选数据;其中,所述备选数据包括字符、图片、音频及自定义数据中的至少一种;
显示所述多个备选数据;
将用户在多个备选数据中选择的目标数据输出至目标程序。
上述方法,优选的,所述显示与所述接收的字符编码对应的字符包括:
在与所述接收的字符编码对应的字符库中,确定与所述接收的字符编码对应的备选字符;其中,所述字符库中包含有字符编码与字符之间的对应关系,且所述字符库中包含的字符具有预设权重;
当所述备选字符为一个时,显示所述备选字符;
当所述备选字符为多个且每个所述备选字符的使用频率均不为0且每个所述备选字符的上下文频率均不为0时,将所述每个备选字符对应的预设权重、使用频率及上下文频率的乘积确定为各自的第一排序权重,依据所述第一排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
当所述备选字符为多个且仅各个所述备选字符的使用频率中存在多个0时,利用平滑算法对所有为0的使用频率进行修正,将所述每个备选字符对应的预设权重、修正后的使用频率及上下文频率的乘积确定为各自的第二排序权重,依据所述第二排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
当所述备选字符为多个且仅各个所述备选字符的上下文频率中存在多个0时,利用平滑算法对所有为0的上下文频率进行修正,将所述每个备选字符对应的预设权重、使用频率及修正后的上下文频率的乘积确定为各自的第三排序权重,依据所述第三排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
当所述备选字符为多个且各个所述备选字符的使用频率中存在多个0且各个所述备选字符的上下文频率中存在多个0时,利用平滑算法对所有为0的使用频率及所有为0的上下文频率进行修正,将所述每个备选字符对应的预设权重、修正后的使用频率及修正后的上下文频率的乘积确定为各自的第四排序权重,依据所述第四排序权重的大小,排列所述各个备选字符的显示位置并进行显示。
上述方法,优选的,在所述接收字符编码之前还包括:预先设置媒介库;其中:
所述预先设置媒介库包括:
接收输入的文本,利用预设算法生成所述文本中的目标词语之间的语义相关度,存储所述目标词语及所述目标词语之间的语义相关度;其中,所述目标词语包括同义词、近义词、上下位词及属性特征词中的至少一种;
和/或,
存储搜索引擎接口发送的图片,并存储所述图片的网页上下文、文件名或搜索关键词,生成所述图片与所述网页上下文、文件名或搜索关键词之间的相似度及进行存储。
上述方法,优选的,所述依据所述检索指令的类型,对用户选择的字符进行检索,以获得与该字符存在语义相关度的多个备选数据包括:
当所述检索指令为媒介检索时,在预先设置的所述媒介库中,查找与用户选择的所述字符存在语义相关度的多个备选数据;
当所述检索指令为搜索引擎搜索时,调用搜索引擎接口,以触发该搜索引擎返回与用户选择的所述字符具有预设语义相关度的多个备选数据。
上述方法,优选的,所述在预先设置的所述媒介库中,查找与用户选择的所述字符存在语义相关度的多个备选数据包括:
在预先设置的所述媒介库中,查找与用户选择的所述字符存在语义相关度的备选数据,并查找与所述备选数据具有语义相关度的备选数据。
本申请还提供了一种数据转换装置,包括:
接收模块,用于接收字符编码;
转码模块,用于显示与所述接收的字符编码对应的字符;
选择模块,用于获取用户选择的字符及对该字符选择的检索指令;
检索模块,用于依据所述检索指令的类型,对用户选择的所述字符进行检索,以获得与该字符存在语义相关度的多个备选数据;其中,所述备选数据包括字符、图片、音频及自定义数据中的至少一种;
显示模块,用于显示所述多个备选数据;
输出模块,用于将用户在多个备选数据中选择的目标数据输出至目标程序。
上述装置,优选的,所述转码模块包括:
字符确定子模块,用于在与所述接收的字符编码对应的字符库中,确定与所述接收的字符编码对应的备选字符;其中,所述字符库中包含有字符编码与字符之间的对应关系,且所述字符库中包含的字符具有预设权重;
第一显示子模块,用于当所述备选字符为一个时,显示所述备选字符;
第二显示子模块,用于当所述备选字符为多个且每个所述备选字符的使用频率均不为0且每个所述备选字符的上下文频率均不为0时,将所述每个备选字符对应的预设权重、使用频率及上下文频率的乘积确定为各自的第一排序权重,依据所述第一排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
第三显示子模块,用于当所述备选字符为多个且仅各个所述备选字符的使用频率中存在多个0时,利用平滑算法对所有为0的使用频率进行修正,将所述每个备选字符对应的预设权重、修正后的使用频率及上下文频率的乘积确定为各自的第二排序权重,依据所述第二排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
第四显示子模块,用于当所述备选字符为多个且仅各个所述备选字符的上下文频率中存在多个0时,利用平滑算法对所有为0的上下文频率进行修正,将所述每个备选字符对应的预设权重、使用频率及修正后的上下文频率的乘积确定为各自的第三排序权重,依据所述第三排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
第五显示子模块,用于当所述备选字符为多个且各个所述备选字符的使用频率中存在多个0且各个所述备选字符的上下文频率中存在多个0时,利用平滑算法对所有为0的使用频率及所有为0的上下文频率进行修正,将所述每个备选字符对应的预设权重、修正后的使用频率及修正后的上下文频率的乘积确定为各自的第四排序权重,依据所述第四排序权重的大小,排列所述各个备选字符的显示位置并进行显示。
上述装置,优选的,还包括媒介库设置模块,用于在所述接收字符编码之前,预先设置媒介库;
其中:所述媒介库设置模块包括:
第一设置子模块,用于接收输入的文本,利用预设算法生成所述文本中的目标词语之间的语义相关度,存储所述目标词语及所述目标词语之间的语义相关度;其中,所述目标词语包括同义词、近义词、上下位词及属性特征词中的至少一种;
第二设置子模块,用于存储搜索引擎接口发送的图片,并存储所述图片的网页上下文、文件名或搜索关键词,生成所述图片与所述网页上下文、文件名或搜索关键词之间的相似度及进行存储。
上述装置,优选的,所述检索模块包括:
第一检索子模块,用于当所述检索指令为媒介检索时,在预先设置的所述媒介库中,查找与用户选择的所述字符存在语义相关度的多个备选数据;
第二检索子模块,用于当所述检索指令为搜索引擎搜索时,调用搜索引擎接口,以触发该搜索引擎返回与用户选择的所述字符具有预设语义相关度的多个备选数据。
上述装置,优选的,所述第一检索子模块包括:
迭代检索单元,用于在预先设置的所述媒介库中,查找与用户选择的所述字符存在语义相关度的备选数据,并查找与所述备选数据具有语义相关度的备选数据。
由以上技术方案可知,本申请提供的一种数据转换方法及装置,该方法可以接收字符编码并显示与字符编码对应的字符,用户可选择某一字符且选择与该字符对应的检索命令,获取到该字符及该检索命令后进行检索,进而获得与用户选择的字符存在语义相关度的多个备选数据,以供用户选择,且所述备选数据包括字符、图片、音频及自定义数据中的至少一种。相较于现有技术中只提供与输入的字符编码对应的字符相比,本实施例可以为用户提供给更多的数据且数据形式丰富,提高了用户的数据输入体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一种数据转换方法实施例一的流程图;
图2为本申请提供的一种数据转换方法实施例二的部分流程图;
图3为本申请提供的一种数据转换方法实施例三的部分流程图;
图4为本申请提供的一种数据转换方法实施例四的流程图;
图5为本申请提供的一种数据转换装置实施例一的结构示意图;
图6为本申请提供的一种数据转换装置实施例二的部分结构示意图;
图7为本申请提供的一种数据转换装置实施例三的部分结构示意图;
图8为本申请提供的一种数据转换装置实施例四的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,其示出了本申请提供的一种数据转换方法实施例一的流程图,本实施例具体包括:
步骤101:接收字符编码。
其中,接收可以是指用户直接输入,也可以是其他的硬件设备或软件程序发送。字符编码是用于查找与该字符编码对应的,包括汉字笔画、汉语拼音、英文字符或其他外文字符。当然,字符编码可以是简写,只要能确定字符即可。例如,字符编码为汉语拼音,可以接收pingguo的简写形式pg。
步骤102:显示与所述接收的字符编码对应的字符。
其中,所述字符与字符编码之间具有预设的对应关系,依据该对应关系,可以获得与接收的字符编码所对应的字符。需要说明的是,确定的所述字符可以是汉字、英文或其他外文,具体是与输入的字符编码对应的。例如,接收的字符编码为pingguo,与该pingguo对应的字符可能包括苹果、平果及评过;接收的字符编码为ap,与该ap对应的字符可能包括apace、apache、apacity及apple。
另外,并不限定显示所述字符的个数,即可以是一个,也可以是多个,其与具体的确定结果相关。
步骤103:获取用户选择的字符及对该字符选择的检索指令。
其中,所述检索指令可以是指在本地的数据库中进行检索,也可以是指利用搜索引擎在网页中进行检索。
步骤104:依据所述检索指令的类型,对用户选择的所述字符进行检索,以获得与该字符存在语义相关度的多个备选数据;其中,所述备选数据包括字符、图片、音频及自定义数据中的至少一种。
其中,所述语义相关度是指待检索字符与备选数据间具有语义上的关联性,包括同义词、近义词、上下位词及属性特征词等。经过所述步骤可以实现为用户选择的字符进行二次检索,从而获得与该字符对应的更多的数据。
同时,该备选数据可以是字符、图片、音频及自定义数据中的至少一种。例如,与“苹果”这一字符对应的备选数据,可以包括与“苹果”同义的英文字符“apple”,也可以包括苹果图片,还可以包括近义词“苹果手机”、上下位词“红富士”。所述自定义数据是用户预先定义的数据格式,如二进制字符串。例如,用户自定义加密词典,用于将明文数据转换为密文,所述密文可以是一串二进制字符串。
步骤105:显示所述多个备选数据。
其中,所述多个备选数据间可以具有前后位置排序。例如,以横屏方式显示时,可以从屏幕左方依次向右方排序;以竖屏方式显示时,可以从屏幕上方依次向下方排序。
步骤106:将用户在多个备选数据中选择的目标数据输出至目标程序。
其中,所述目标程序可以是各种应用程序,如文字编辑程序、通讯程序、图形编辑程序等。
由以上的技术方案可知,本申请提供的一种数据转换方法,可以首先显示与字符编码对应的字符,用户可选择某一字符且选择与该字符对应的检索命令,获取到该字符及该检索命令后进行检索,进而获得与该字符存在语义相关度的多个备选数据,以供用户在该多个备选数据中选择最终的输出数据。相较于现有技术中只提供与输入的字符编码对应的字符相比,本实施例可以为用户提供给更多的备选数据,提高了用户数据转换体验。
需要说明的是,上述接收到的字符编码可以是用户直接输入的字符编码,还可以是其他应用程序发送的字符编码。当是其他应用程序发送的字符编码时,相当于向多个其他应用程序提供数据输入接口,提供了本方法的应用性。另外,所述字符编码可以是简写形式,例如,“pingguo”的简写形式“pg”。
需要说明的是,上述实施例中的同义词指的是不同语种或不同表现形式但表示同一含义的数据。例如,“苹果”的同义词可以是“apple”,也可以是苹果图片。近义词指的是与某一字符在一定语境下具有语义关联性的字符。例如,在手机语境下,“苹果”与“苹果手机”是近义词。上下位词指的是上位概念与下位概念的字符。例如,“红富士”的上位词是“苹果”,则“红富士”是“苹果”的下位词。属性特征词是指某个字符表示对象的属性特征。例如,“苹果”的属性特征词可以是“甜的”、“圆的”及“好吃”等。
由上述同义词可知,本申请可对用户选择的字符进行语种或表现形式的转换。例如,用户选择的字符是“苹果”,本申请可以提供“苹果”在其他语种中的书写形式,如英文“apple”,还可以提供“苹果”的图片。这样,本申请为不熟悉母语以外语言的用户提供了数据输出的便利。例如,当两个不熟悉对方语言的用户利用聊天工具交流时,本申请可以作为一种方便的数据输入工具。
需要说明的是,同义词、近义词、上下位词及属性特征词之间的语义相关度用数值进行表示。其中,所述数值可以是人工预设的数值,也可以是依据预设算法生成的数值。
同时,所述目标程序中如果不能正常地输出用户选择的备选数据时,则可以将备选数据的其他信息输出至该目标程序。例如,在文本输入程序txt中,若用户选择的是目标数据为图片形式的数据,由于txt文件中不能显示图片,则可输出图片的地址、图片的关键字等。
请参阅图2,其示出了本申请提供的一种数据转换方法实施例二的部分流程图,上述步骤102可以通过以下方式实现:
步骤201:在与所述接收的字符编码对应的字符库中,确定与所述接收的字符编码对应的备选字符;其中,所述字符库中包含有字符编码与字符之间的对应关系,且所述字符库中包含的字符具有预设权重。
其中,预先设置有字符库,在字符库中确定备选字符。字符库可以是词典,例如汉字词典、英文词典。字符库中包含字符编码与字符间的对应关系,则在字符库中查找与接收到的字符编码对应的字符,将查找到的字符确定为备选字符。例如,“pingguo”对应的备选字符为“苹果”、“平果”及“评过”。
所述预设权重可以为小于等于1的数值,如“苹果”、“评过”及“平果”对应的预设权重分别为1、0.9、0.8。需要说明的是,字符具有的预设权重可以是人工设定的,也可以是由预设算法获得的。其中,所述预设算法包括但不限定于分类聚类算法、相似度算法及距离算法。
步骤202:当所述备选字符为一个时,显示所述备选字符。
步骤203:当所述备选字符为多个且每个所述备选字符的使用频率均不为0且每个所述备选字符的上下文频率均不为0时,将所述每个备选字符对应的预设权重、使用频率及上下文频率的乘积确定为各自的第一排序权重,依据所述第一排序权重的大小,排列所述各个备选字符的显示位置并进行显示。
其中,使用频率与一段时间内用户使用各个备选字符的次数相关。所述一段时间可以是一段固定时间如1小时,也可以是从开始到当前输入时间点的一段时间。具体地,使用频率是指每个备选字符的使用次数与所有备选字符的使用次数总和的比值。
例如,步骤201获得多个备选字符为“苹果”、“评过”及“平果”,一段时间内,用户使用各个备选字符的次数依次为100、200及50,则“苹果”、“评过”及“平果”各自对应的使用频率为100/(100+200+50)、200/(100+200+50)及50/(100+200+50),即57.1%、28.5%及14.4%。
上下文频率指的是依据用户输入的前一或前几个输入字符确定的上下文频率。具体地,获取当前用户输入的上文字符,并获取所述各个备选字符紧接所述上文字符的次数,进而获得所述各个备选字符的次数与所有备选字符次数总和的比值,将各个所述比值确定为每个所述备选字符的上下文频率。
例如,当前用户输入的上文字符为“红色的”,备选字符分别为“苹果”、“评过”及“平果”,统计获得所述各个备选字符紧接“红色的”的次数分别为10、0及0,则各个备选字符对应的上下文频率分别为10/(10+0+0)、0及0,即分别为1、0及0。
需要说明的是,每个备选字符对应一个使用频率,在备选字符为多个的情况下,则所述使用频率的个数为多个。因此,如果多个使用频率为0,在后续利用使用频率作为乘法因子计算排序权重时,可能会导致多个排序权重为0,从而无法依据排序权重值的大小对各个备选字符进行排序,则需要对为0的使用频率进行修正。另外,计算备选字符的排序权重时,不仅需要备选字符的使用频率,还需要备选字符的上下文频率。因此,上述情况同样适用于备选字符的上下文频率。
需要说明的是,每个备选字符不仅具有使用频率,还具有上下文频率。当只有使用频率中存在多个0时,执行步骤204,对为0的使用频率进行修正;当只有上下文频率中存在多个0时,执行步骤205,对为0的上下文频率进行修正;当使用频率及上下文频率中均存在多个0时,执行步骤206,对为0的使用频率及为0的上下文频率进行修正。
步骤204:当所述备选字符为多个且仅各个所述备选字符的使用频率中存在多个0时,利用平滑算法对所有为0的使用频率进行修正,将所述每个备选字符对应的预设权重、修正后的使用频率及上下文频率的乘积确定为各自的第二排序权重,依据所述第二排序权重的大小,排列所述各个备选字符的显示位置并进行显示。
步骤205:当所述备选字符为多个且仅各个所述备选字符的上下文频率中存在多个0时,利用平滑算法对所有为0的上下文频率进行修正,将所述每个备选字符对应的预设权重、使用频率及修正后的上下文频率的乘积确定为各自的第三排序权重,依据所述第三排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
步骤206:当所述备选字符为多个且各个所述备选字符的使用频率中存在多个0且各个所述备选字符的上下文频率中存在多个0时,利用平滑算法对所有为0的使用频率及所有为0的上下文频率进行修正,将所述每个备选字符对应的预设权重、修正后的使用频率及修正后的上下文频率的乘积确定为各自的第四排序权重,依据所述第四排序权重的大小,排列所述各个备选字符的显示位置并进行显示。
具体地,步骤204及步骤206中利用平滑算法对为0的使用频率进行修正,是将使用次数为0的值修正为较小的数值如1,进而利用该修正后的较小数值计算使用频率;步骤205及步骤206中利用平滑算法对为0的上下文频率进行修正,是将紧接上文字符次数为0的值修正为较小的数值如1,进而利用该修正后的较小数值计算上下文频率。
例如,步骤203例子中的备选字符“苹果”、“评过”及“平果”对应的上下文频率分别为1、0及0,可见,备选字符的上下文频率中有两个0值,需要将统计获得的所述各个备选字符紧接上文字符(“红色的”)的次数中的0修正为1,则修正后的所述各个备选字符紧接上文字符的次数分别为10、1及1,计算修正后的所述各个备选字符的上下文频率分别为10/(10+1+1)、1及1,即分别为83.3%、8.4%及8.4%。
需要说明的是,步骤202至步骤206的执行顺序并不是顺序执行,而是并列的几种不同情形。同时,步骤203至步骤206中的第一排序权重、第二排序权重、第三排序权重及第四排序权重可以是相同的数值,也可以是不同的数值。
由以上技术方案可知,本实施例可以显示与接收到的字符编码对应的备选字符,且当备选字符为多个时,依据排序权重对所述各个备选字符的显示位置进行排序。由于计算排序权重时需要利用到使用频率及上下文频率,因此,备选字符的位置会受到用户使用习惯的影响,若用户经常使用某个备选字符,该备选字符的位置会靠前显示,方便用户的输入,可以提高用户的使用体验。进一步地,在计算排序权重且出现多个为0的排序权重时,利用平滑算法对0值进行修正,从而解决了无法排序的问题。
在上述方法实施例一的基础上还包括:在所述接收字符编码之前,预先设置媒介库。请参阅图3,其示出了本申请提供一种数据转换方法实施例三的部分流程图,其中,所述预先设置媒介库的步骤可以具体通过以下方式实现:
步骤301:接收输入的文本,利用预设算法生成所述文本中的目标词语之间的语义相关度,存储所述目标词语及所述目标词语之间的语义相关度;其中,所述目标词语包括同义词、近义词、上下位词及属性特征词中的至少一种。
其中,所述输入的文本可以是用户直接输入的文本,也可以是其他应用程序发送过来的文本,如工具书浏览程序发送的词典工具书。同时,所述预设算法包括但不限定于相似度算法、距离算法或分类聚类算法。计算过程中可以能是去掉一些无意义的词获得的各个目标词语,并设定所述各个目标词语之间的语义相关度。需要说明的是,关于目标词语的解释请参见上文,在此不做赘述。
例如,词典工具书中对“红富士”的解释为“苹果的一种”,去掉“的”及“一种”此类无意义的词得到“苹果”,并将以此种方式获得的目标词语(“红富士”及“苹果”)之间的语义相关度设定为0.8。又如,同义词词典中对“西红柿”的解释有“也就是番茄”,则去掉“也就是”后得到“番茄”,并将以此种方式获得的目标词语(“西红柿”及“番茄”)之间的语义相关度设定为1。
本步骤通过统计文本中各个词语之间的语义相关度,获得多个目标词语,及所述目标词语之间的语义相关度,并且,对所述目标词语及语义相关度进行存储。例如,利用算法获知输入文本中的“西红柿”与“番茄”的语义相关度为1,则该两个词语为同义词,存储所述两个词语及该两个词语之间的语义相关度1。又如,利用预设算法计算得到“苹果”与“红富士”的语义相关度为0.8,存储所述两个词及所述两个词之间的语义相关度。
另外,存储的形式也不做限定,如数据库或纯文本。
同时,可以是将具有语义相关度的目标词语作为一个集合进行存储。例如,“苹果”与“平果”、“红富士”之间有语义相关度,则将所述几个目标词语作为一个集合进行存储。当然,也可以利用其他形式存储目标词语,例如知识库。例如,“苹果”与“好吃”、“圆的”、“香甜”具有语义相关度,可以将所述各个目标词语作为知识库中的一种知识关系(属性特征关系)进行存储。又如,“张艺谋”与“导演”具有语义相关度,可以将所述各个目标词语作为知识库中的另一知识关系(上下文关系)进行存储。
步骤302:存储搜索引擎接口发送的图片,并存储所述图片的网页上下文、文件名或搜索关键词,生成所述图片与所述网页上下文、文件名或搜索关键词之间的相似度及进行存储。
其中,当接收到搜索引擎搜索接口发送的图片后,对该图片进行存储。进一步,为该图片设置关键字,则当用户对该名称选择媒介检索时,可以在该媒介库中检索到该图片。具体地,首先存储图片及图片的关键字,所述关键字可以是搜索引擎搜索所述图片时的搜索关键词、可以是该图片在网页中的上下文,还可以是该图片的文件名;然后生成该图片与该关键字之间的语义相关度并存储,该语义相关度可以是人工设定如1。
需要说明的是,对图片的关键字进行词义筛选以保证所述关键字为有意义的词语。例如,若图片的文件名作为关键字,该文件名必须是有意义的文字,而不能是字符串编码。
需要说明的是,上述媒介库可以存在本地,还可以上传至中心服务器,实现媒介库的共享。所述中心服务器中存储有多个媒介库,用户可以利用上述中心媒介库对本地媒介库的更新。另外,所述媒介库中还可以接收输入的或搜索引擎接口发送的音频数据,并对该音频数据设置关键字,该关键字可以是人工设置的,也可以是搜索引擎发送的音频数据名称。例如接收到一段笑声的音频数据,人工将其设置为“哈哈”,或者搜索引擎发送过来的音频数据名称为“咯咯”,将该“咯咯”设置为该音频数据的关键字。
由以上的技术方案,可以实现设置媒介库,所述媒介库中包含有多个目标词语及目标词语之间具有的语义相关度。当接收到用户选择的字符及对该字符的媒介检索时,利用所述语义相关度可以查找到与所述用户选择的字符具有语义相关度的备选数据。
需要说明的是,上述方法实施例中的媒介数据库中的词语可以动态增加。具体地,当用户需要向所述媒介数据库中添加图片时,可以利用相似度算法、距离算法或分类聚类算法计算所述图片与媒介库中的图片之间的相关度,当计算得出与某个图片之间具有相关度时,可以直接用媒介库中的该图片的关键字直接标记用户添加的所述图片,还可以是将所述媒介库中的该图片的关键字所述提示给用户,若用户选择该关键字,则用该关键字标记用户添加的该图片。
例如,用户添加的图片是一张苹果图片,利用预设算法在媒介库中查找到一张与该苹果图片相似的图片,且获得媒介库中该图片的关键字为“苹果”,则将“苹果”提示给用户,若用户确定使用该关键字,则将“苹果”标记用户添加的所述图片。标记的方式可以是将“苹果”这一词语与图片之间的语义相似度设置为1。
再者,当用户需要向所述媒介库中添加文本时,计算获得用户添加的所述文本与媒介库中的一段文本之间具有相关度,若该段文本具有关键字,可以直接将该关键字标记用户添加的所述文本,还可以将该文本的关键字提示给用户,以供用户确定使用所述文本,以提高标记的准确度。为“新闻”,则用该关键字“新闻”标记用户添加的所述文本。
由上述技术方案可以实现,根据用户的添加命令动态地向媒介库中增加词语,提高了媒介库词语数据的灵活性。
请参阅图4,其示出了本申请提供一种数据转换方法实施例四的流程图,具体包括:
步骤401:预先设置媒介库;
步骤402:接收字符编码;
步骤403:显示与所述接收的字符编码对应的字符;
步骤404:获取用户选择的字符及对该字符选择的检索指令;
其中,步骤401至步骤404的说明请参见上述实施例,在此不做赘述。需要说明的是,步骤404中用户选择字符,并且为该字符选择检索指令。检索指令可以是本地检索如在本地的媒介库中检索,也可以是调用搜索引擎接口进行网络检索。下述步骤405与步骤406的执行顺序并非是顺序关系,两者是并列选其一的关系,也就是说,若执行步骤405,则不执行步骤406;反之亦然。
步骤405:当所述检索指令为媒介检索时,在预先设置的所述媒介库中,查找与用户选择的所述字符存在语义相关度的多个备选数据;
其中,所述查找备选数据即是在媒介库中查找与用户选择的字符存在语义相关度的备选数据。其中,步骤401中设置的所述媒介库中包含有多个目标词语,且存储有目标词语间的语义相关度。
当然,并非所有的目标词语间均具有语义相关度,但是,某些目标词语间可能具有间接的语义相关度。例如,“苹果”与“苹果手机”间具有语义相关度0.8,且“苹果手机”及“iphone5s”间具有语义相关度0.7,则所述“苹果”与所述“iphones5s”之间具有间接的语义相关度。
因此,本步骤中的查找可以不仅局限于查找与用户选择的字符具有直接语义相关度的备选数据,还可以查找与所述用户选择的字符具有间接语义相关度的备选数据。具体地,后者可以通过以下方式实现:
在预先设置的所述媒介库中,查找与用户选择的所述字符存在语义相关度的备选数据,并查找与所述备选数据具有语义相关度的备选数据。
其中,查找到的备选数据都是与用户选择的字符具有语义相关度的备选数据。例如,用户选择的字符为“苹果”,查找到与“苹果”具有语义相关度的备选数据包括“apple”、苹果图片、“红富士”及“苹果手机”,进一步查找到与“苹果手机”具有语义相关度的备选数据包括“iphone5s”,则查找到的与用户选择的“苹果”具有语义相关度的备选数据包括:“apple”、苹果图片、“红富士”、“苹果手机”及“iphone5s”。
步骤406:当所述检索指令为搜索引擎搜索时,调用搜索引擎接口,以触发该搜索引擎返回与用户选择的所述字符具有预设语义相关度的多个备选数据;
其中,所述搜索引擎可以是通用搜索引擎,也可以是竖直搜索引擎。所述竖直搜索引擎指的是搜索某一种具体形式数据的搜索引擎,如搜索图片、搜索声音等。
步骤407:显示所述多个备选数据;
其中,显示所述备选数据前可以对各个备选数据的显示位置进行排列。当所述检索指令为媒介检索时,排列的依据可以是查找到的备选数据与用户选择的字符间语义相关度的大小。并且,还可以依据用户使用备选数据的频率及用户输入的上文数据,具体的排序方式可以参见上述方法实施例二中对备选字符的排序,在此不再赘述。
步骤408:将用户在多个备选数据中选择的目标数据输出至目标程序。
其中,对本实施例四进行举例说明。
例如,用户输入的字符编码为“pingguo”,查找到与该字符编码对应的字符包括“苹果”、“评过”、“平果”,对所述各个字符的显示位置进行排序,并依据所述排序显示所述各个字符如显示:“1苹果2平果3评过”。
若用户选择1“苹果”,并选择对该“苹果”进行媒介检索,则在媒介库中进行搜索。若搜索到的备选数据包括“apple”、苹果图片、“红富士”、“苹果手机”及“iphone5s”,且对所述各个备选数据的显示位置排序,显示的内容为:“1.apple2.苹果图片3.红富士4.苹果手机5.iphone5s”。
若用户选择1,则将apple显示到目标程序如文字编辑窗口word中。
由以上的技术方案可知,本实施例可以为用户显示与接收到的字符编码对应的字符,用户选择字符并选择对其的检索方式,其中,所述检索方式可以是在媒介库中检索,也可以是利用搜索引擎进行网页检索,依据检索方式对用户选择的字符进行检索,从而获得与选择的字符对应的多个备选数据,在该多个备选数据中选择最终的输出数据。与现有技术中只能提供与编码字符对应的字符相比,可以为用户提供更多且具有语义相关度的备选数据,进而提高用户的体验度。进一步地,所述备选数据不仅包括字符,还可以包括图片、音频及自定义数据,多种形式的数据可以满足用户不同的输入需求。
对应上述方法实施例一,本申请提供了一种装置实施例。请参阅图5,本装置具体包括:接收模块501、转码模块502、选择模块503、检索模块504、显示模块505及输出模块506。其中:
所述接收模块501,用于接收字符编码。
其中,所述接收模块501接收可以是指用户直接输入,也可以是其他的硬件设备或软件程序发送。字符编码是用于查找与该字符编码对应的,包括汉字笔画、汉语拼音、英文字符或其他外文字符。当然,字符编码可以是简写,只要能确定字符即可。
所述转码模块502,用于显示与所述接收的字符编码对应的字符。
其中,所述字符与字符编码之间具有预设的对应关系,所述转码模块502依据该对应关系,可以获得与接收的字符编码所对应的字符。需要说明的是,所述转码模块502确定的所述字符可以是汉字、英文或其他外文,具体是与输入的字符编码对应的。另外,并不限定显示所述字符的个数,即可以是一个,也可以是多个,其与具体的确定结果相关。
所述选择模块503,用于获取用户选择的字符及对该字符选择的检索指令。
其中,所述检索指令可以是指在本地的数据库中进行检索,也可以是指利用搜索引擎在网页中进行检索。
所述检索模块504,用于依据所述检索指令的类型,对用户选择的所述字符进行检索,以获得与该字符存在语义相关度的多个备选数据;其中,所述备选数据包括字符、图片、音频及自定义数据中的至少一种。
其中,所述语义相关度是指待检索字符与备选数据间具有语义上的关联性,包括同义词、近义词、上下位词及属性特征词等。所述检索模块504可以实现为用户选择的字符进行二次检索,从而获得与该字符对应的更多的备选数据。同时,该备选数据可以是字符、图片、音频及自定义数据中的至少一种。
所述显示模块505,用于显示所述多个备选数据。
其中,所述多个备选数据间可以具有前后位置排序。例如,以横屏方式显示时,可以从屏幕左方依次向右方排序;以竖屏方式显示时,可以从屏幕上方依次向下方排序。
所述输出模块506,用于将用户在多个备选数据中选择的目标数据输出至目标程序。
其中,所述目标程序可以是各种应用程序的窗口,如文字编辑程序、通讯程序、图形编辑程序等窗口。
由以上的技术方案可知,本申请提供的一种数据转换装置,转码模块显示与接收模块接收到字符编码对应的字符,用户可选择某一字符且选择与该字符对应的检索命令,选择模块获取到该字符及该检索命令后进行二次检索,进而检索模块获得与该字符存在语义相关度的多个备选数据并通过显示模块进行显示,以供用户在该多个备选数据中选择最终的目标数据,并利用输出模块将该目标数据输出至目标程序。相较于现有技术中只提供与输入的字符编码对应的字符相比,本实施例可以为用户提供给更多的备选数据,提高了用户数据输入体验。
对应上述方法实施例二,本申请提供了一种装置实施例。请参阅图6,上述装置中的转码模块502具体包括:
字符确定子模块601,用于在与所述接收的字符编码对应的字符库中,确定与所述接收的字符编码对应的备选字符;其中,所述字符库中包含有字符编码与字符之间的对应关系,且所述字符库中包含的字符具有预设权重;
第一显示子模块602,用于当所述备选字符为一个时,显示所述备选字符;
第二显示子模块603,用于当所述备选字符为多个且每个所述备选字符的使用频率均不为0且每个所述备选字符的上下文频率均不为0时,将所述每个备选字符对应的预设权重、使用频率及上下文频率的乘积确定为各自的第一排序权重,依据所述第一排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
第三显示子模块604,用于当所述备选字符为多个且仅各个所述备选字符的使用频率中存在多个0时,利用平滑算法对所有为0的使用频率进行修正,将所述每个备选字符对应的预设权重、修正后的使用频率及上下文频率的乘积确定为各自的第二排序权重,依据所述第二排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
第四显示子模块605,用于当所述备选字符为多个且仅各个所述备选字符的上下文频率中存在多个0时,利用平滑算法对所有为0的上下文频率进行修正,将所述每个备选字符对应的预设权重、使用频率及修正后的上下文频率的乘积确定为各自的第三排序权重,依据所述第三排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
第五显示子模块606,用于当所述备选字符为多个且各个所述备选字符的使用频率中存在多个0且各个所述备选字符的上下文频率中存在多个0时,利用平滑算法对所有为0的使用频率及所有为0的上下文频率进行修正,将所述每个备选字符对应的预设权重、修正后的使用频率及修正后的上下文频率的乘积确定为各自的第四排序权重,依据所述第四排序权重的大小,排列所述各个备选字符的显示位置并进行显示。
需要说明的是,模块601至模块606的说明请参见方法实施例二,在此不做赘述。
对应上述方法实施例三,本申请还提供了一种装置实施例。请参阅图7,在上述装置实施例一的基础上,还可以包括:媒介库设置模块701,用于在所述接收字符编码之前,预先设置媒介库;
其中:所述媒介库设置模块701包括:
第一设置子模块7011,用于接收输入的文本,利用预设算法生成所述文本中的目标词语之间的语义相关度,存储所述目标词语及所述目标词语之间的语义相关度;其中,所述目标词语包括同义词、近义词、上下位词及属性特征词中的至少一种;
第二设置子模块7012,用于存储搜索引擎接口发送的图片,并存储所述图片的网页上下文、文件名或搜索关键词,生成所述图片与所述网页上下文、文件名或搜索关键词之间的相似度及进行存储。
需要说明的是,模块7011至模块7012的说明请参见方法实施例三,在此不做赘述。
对应上述方法实施例四,本申请还提供了一种装置实施例。请参阅图8,本装置实施例具体包括:
媒介库设置模块801,用于预先设置媒介库;
接收模块802,用于接收字符编码;
转码模块803,用于显示与所述接收的字符编码对应的字符;
选择模块804,用于获取用户选择的字符及对该字符选择的检索指令;
第一检索子模块805,用于当所述检索指令为媒介检索时,在预先设置的所述媒介库中,查找与用户选择的所述字符存在语义相关度的多个备选数据;
需要说明的是,所述第一检索子模块805可以包括迭代检索单元,用于在预先设置的所述媒介库中,查找与用户选择的所述字符存在语义相关度的备选数据,并查找与所述备选数据具有语义相关度的备选数据。
第二检索子模块806,用于当所述检索指令为搜索引擎搜索时,调用搜索引擎接口,以触发该搜索引擎返回与用户选择的所述字符具有预设语义相关度的多个备选数据;
显示模块807,用于显示所述多个备选数据;
输出模块808,用于将用户在多个备选数据中选择的目标数据输出至目标程序。
需要说明的是,模块801至模块808的说明请参见上述方法实施例,在此不做赘述。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种数据转换方法,其特征在于,包括:
接收字符编码;
显示与所述接收的字符编码对应的字符;
获取用户选择的字符及对该字符选择的检索指令;
依据所述检索指令的类型,对用户选择的所述字符进行检索,以获得与该字符存在语义相关度的多个备选数据;其中,所述备选数据包括字符、图片、音频及自定义数据中的至少一种;
显示所述多个备选数据;
将用户在多个备选数据中选择的目标数据输出至目标程序。
2.根据权利要求1所述的方法,其特征在于,所述显示与所述接收的字符编码对应的字符包括:
在与所述接收的字符编码对应的字符库中,确定与所述接收的字符编码对应的备选字符;其中,所述字符库中包含有字符编码与字符之间的对应关系,且所述字符库中包含的字符具有预设权重;
当所述备选字符为一个时,显示所述备选字符;
当所述备选字符为多个且每个所述备选字符的使用频率均不为0且每个所述备选字符的上下文频率均不为0时,将所述每个备选字符对应的预设权重、使用频率及上下文频率的乘积确定为各自的第一排序权重,依据所述第一排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
当所述备选字符为多个且仅各个所述备选字符的使用频率中存在多个0时,利用平滑算法对所有为0的使用频率进行修正,将所述每个备选字符对应的预设权重、修正后的使用频率及上下文频率的乘积确定为各自的第二排序权重,依据所述第二排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
当所述备选字符为多个且仅各个所述备选字符的上下文频率中存在多个0时,利用平滑算法对所有为0的上下文频率进行修正,将所述每个备选字符对应的预设权重、使用频率及修正后的上下文频率的乘积确定为各自的第三排序权重,依据所述第三排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
当所述备选字符为多个且各个所述备选字符的使用频率中存在多个0且各个所述备选字符的上下文频率中存在多个0时,利用平滑算法对所有为0的使用频率及所有为0的上下文频率进行修正,将所述每个备选字符对应的预设权重、修正后的使用频率及修正后的上下文频率的乘积确定为各自的第四排序权重,依据所述第四排序权重的大小,排列所述各个备选字符的显示位置并进行显示。
3.根据权利要求1所述的方法,其特征在于,在所述接收字符编码之前还包括:预先设置媒介库;其中:
所述预先设置媒介库包括:
接收输入的文本,利用预设算法生成所述文本中的目标词语之间的语义相关度,存储所述目标词语及所述目标词语之间的语义相关度;其中,所述目标词语包括同义词、近义词、上下位词及属性特征词中的至少一种;
和/或,
存储搜索引擎接口发送的图片,并存储所述图片的网页上下文、文件名或搜索关键词,生成所述图片与所述网页上下文、文件名或搜索关键词之间的相似度及进行存储。
4.根据权利要求3所述的方法,其特征在于,所述依据所述检索指令的类型,对用户选择的字符进行检索,以获得与该字符存在语义相关度的多个备选数据包括:
当所述检索指令为媒介检索时,在预先设置的所述媒介库中,查找与用户选择的所述字符存在语义相关度的多个备选数据;
当所述检索指令为搜索引擎搜索时,调用搜索引擎接口,以触发该搜索引擎返回与用户选择的所述字符具有预设语义相关度的多个备选数据。
5.根据权利要求4所述的方法,其特征在于,所述在预先设置的所述媒介库中,查找与用户选择的所述字符存在语义相关度的多个备选数据包括:
在预先设置的所述媒介库中,查找与用户选择的所述字符存在语义相关度的备选数据,并查找与所述备选数据具有语义相关度的备选数据。
6.一种数据转换装置,其特征在于,包括:
接收模块,用于接收字符编码;
转码模块,用于显示与所述接收的字符编码对应的字符;
选择模块,用于获取用户选择的字符及对该字符选择的检索指令;
检索模块,用于依据所述检索指令的类型,对用户选择的所述字符进行检索,以获得与该字符存在语义相关度的多个备选数据;其中,所述备选数据包括字符、图片、音频及自定义数据中的至少一种;
显示模块,用于显示所述多个备选数据;
输出模块,用于将用户在多个备选数据中选择的目标数据输出至目标程序。
7.根据权利要求6所述的装置,其特征在于,所述转码模块包括:
字符确定子模块,用于在与所述接收的字符编码对应的字符库中,确定与所述接收的字符编码对应的备选字符;其中,所述字符库中包含有字符编码与字符之间的对应关系,且所述字符库中包含的字符具有预设权重;
第一显示子模块,用于当所述备选字符为一个时,显示所述备选字符;
第二显示子模块,用于当所述备选字符为多个且每个所述备选字符的使用频率均不为0且每个所述备选字符的上下文频率均不为0时,将所述每个备选字符对应的预设权重、使用频率及上下文频率的乘积确定为各自的第一排序权重,依据所述第一排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
第三显示子模块,用于当所述备选字符为多个且仅各个所述备选字符的使用频率中存在多个0时,利用平滑算法对所有为0的使用频率进行修正,将所述每个备选字符对应的预设权重、修正后的使用频率及上下文频率的乘积确定为各自的第二排序权重,依据所述第二排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
第四显示子模块,用于当所述备选字符为多个且仅各个所述备选字符的上下文频率中存在多个0时,利用平滑算法对所有为0的上下文频率进行修正,将所述每个备选字符对应的预设权重、使用频率及修正后的上下文频率的乘积确定为各自的第三排序权重,依据所述第三排序权重的大小,排列所述各个备选字符的显示位置并进行显示;
第五显示子模块,用于当所述备选字符为多个且各个所述备选字符的使用频率中存在多个0且各个所述备选字符的上下文频率中存在多个0时,利用平滑算法对所有为0的使用频率及所有为0的上下文频率进行修正,将所述每个备选字符对应的预设权重、修正后的使用频率及修正后的上下文频率的乘积确定为各自的第四排序权重,依据所述第四排序权重的大小,排列所述各个备选字符的显示位置并进行显示。
8.根据权利要求6所述的装置,其特征在于,还包括媒介库设置模块,用于在所述接收字符编码之前,预先设置媒介库;
其中:所述媒介库设置模块包括:
第一设置子模块,用于接收输入的文本,利用预设算法生成所述文本中的目标词语之间的语义相关度,存储所述目标词语及所述目标词语之间的语义相关度;其中,所述目标词语包括同义词、近义词、上下位词及属性特征词中的至少一种;
第二设置子模块,用于存储搜索引擎接口发送的图片,并存储所述图片的网页上下文、文件名或搜索关键词,生成所述图片与所述网页上下文、文件名或搜索关键词之间的相似度及进行存储。
9.根据权利要求8所述的装置,其特征在于,所述检索模块包括:
第一检索子模块,用于当所述检索指令为媒介检索时,在预先设置的所述媒介库中,查找与用户选择的所述字符存在语义相关度的多个备选数据;
第二检索子模块,用于当所述检索指令为搜索引擎搜索时,调用搜索引擎接口,以触发该搜索引擎返回与用户选择的所述字符具有预设语义相关度的多个备选数据。
10.根据权利要求9所述的装置,其特征在于,所述第一检索子模块包括:
迭代检索单元,用于在预先设置的所述媒介库中,查找与用户选择的所述字符存在语义相关度的备选数据,并查找与所述备选数据具有语义相关度的备选数据。
CN201410268379.4A 2014-06-16 2014-06-16 一种数据转换方法及装置 Expired - Fee Related CN104021201B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410268379.4A CN104021201B (zh) 2014-06-16 2014-06-16 一种数据转换方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410268379.4A CN104021201B (zh) 2014-06-16 2014-06-16 一种数据转换方法及装置

Publications (2)

Publication Number Publication Date
CN104021201A true CN104021201A (zh) 2014-09-03
CN104021201B CN104021201B (zh) 2017-06-16

Family

ID=51437955

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410268379.4A Expired - Fee Related CN104021201B (zh) 2014-06-16 2014-06-16 一种数据转换方法及装置

Country Status (1)

Country Link
CN (1) CN104021201B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104536570A (zh) * 2014-12-29 2015-04-22 广东小天才科技有限公司 智能手表的信息处理方法及装置
CN108536676A (zh) * 2018-03-28 2018-09-14 广州华多网络科技有限公司 数据处理方法、装置、电子设备及存储介质
CN113780018A (zh) * 2021-09-06 2021-12-10 珠海格力电器股份有限公司 数据输入方法、电子装置、装置及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271459A (zh) * 2007-03-22 2008-09-24 北京搜狗科技发展有限公司 一种生成词库的方法、一种输入的方法和一种输入法系统
US20110137915A1 (en) * 2009-12-04 2011-06-09 Rohit Bahl Single parse, diagram-assisted import into a unified modeling language based meta-model
CN102110174A (zh) * 2011-04-11 2011-06-29 重庆大学 一种基于关键词的web服务器扩展检索方法
CN103677299A (zh) * 2012-09-12 2014-03-26 深圳市世纪光速信息技术有限公司 一种在输入法中实现智能联想的方法、装置及终端设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271459A (zh) * 2007-03-22 2008-09-24 北京搜狗科技发展有限公司 一种生成词库的方法、一种输入的方法和一种输入法系统
US20110137915A1 (en) * 2009-12-04 2011-06-09 Rohit Bahl Single parse, diagram-assisted import into a unified modeling language based meta-model
CN102110174A (zh) * 2011-04-11 2011-06-29 重庆大学 一种基于关键词的web服务器扩展检索方法
CN103677299A (zh) * 2012-09-12 2014-03-26 深圳市世纪光速信息技术有限公司 一种在输入法中实现智能联想的方法、装置及终端设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
R CEN. ET AL: "Study language models with specifie user goals", 《THE 19TH INTERNATIONAL CONFERENCE ON WORLD WIDE WEB》 *
许丹青 等: "基于日志分析的中文输入法用户行为研究", 《中文信息学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104536570A (zh) * 2014-12-29 2015-04-22 广东小天才科技有限公司 智能手表的信息处理方法及装置
CN108536676A (zh) * 2018-03-28 2018-09-14 广州华多网络科技有限公司 数据处理方法、装置、电子设备及存储介质
CN108536676B (zh) * 2018-03-28 2020-10-13 广州华多网络科技有限公司 数据处理方法、装置、电子设备及存储介质
CN113780018A (zh) * 2021-09-06 2021-12-10 珠海格力电器股份有限公司 数据输入方法、电子装置、装置及可读存储介质
CN113780018B (zh) * 2021-09-06 2024-06-07 珠海格力电器股份有限公司 数据写入方法、电子装置、装置及可读存储介质

Also Published As

Publication number Publication date
CN104021201B (zh) 2017-06-16

Similar Documents

Publication Publication Date Title
JP6864107B2 (ja) 検索結果を提供する方法及び装置
US10051030B2 (en) Interactive searching and recommanding method and apparatus
US8745051B2 (en) Resource locator suggestions from input character sequence
US10832011B2 (en) Question answering system using multilingual information sources
CN103514299B (zh) 信息搜索方法和装置
US9336277B2 (en) Query suggestions based on search data
CN105493075A (zh) 基于所标识的实体的属性值检索
US8356041B2 (en) Phrase builder
US9471601B2 (en) Images for a question answering system
US8775165B1 (en) Personalized transliteration interface
CN111414561B (zh) 用于呈现信息的方法和装置
CN108846138B (zh) 一种融合答案信息的问题分类模型构建方法、装置和介质
CN110737768A (zh) 基于深度学习的文本摘要自动生成方法及装置、存储介质
CN104025077A (zh) 数据流的实时自然语言处理
US20180254043A1 (en) Image display device, method for driving the same, and computer readable recording medium
CN104102720A (zh) 高效输入的预测方法和装置
CN111611452B (zh) 搜索文本的歧义识别方法、系统、设备及存储介质
CN102385609A (zh) 对于包含非编码字符的查询使用统一资源定位符来增强搜索结果相关性排序
KR20200087977A (ko) 멀티모달 문서 요약 시스템 및 방법
CN105550217B (zh) 场景音乐搜索方法及场景音乐搜索装置
JP2021082306A (ja) 目標内容の確定方法、装置、機器及びコンピュータ可読記憶媒体
CN111538830A (zh) 法条检索方法、装置、计算机设备及存储介质
JP5302614B2 (ja) 施設関連情報の検索データベース形成方法および施設関連情報検索システム
CN104021201A (zh) 一种数据转换方法及装置
KR102226742B1 (ko) 예약어를 이용한 정보 제공 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170616

Termination date: 20200616

CF01 Termination of patent right due to non-payment of annual fee