CN102270194B - 字符处理方法及装置 - Google Patents

字符处理方法及装置 Download PDF

Info

Publication number
CN102270194B
CN102270194B CN 201010620426 CN201010620426A CN102270194B CN 102270194 B CN102270194 B CN 102270194B CN 201010620426 CN201010620426 CN 201010620426 CN 201010620426 A CN201010620426 A CN 201010620426A CN 102270194 B CN102270194 B CN 102270194B
Authority
CN
China
Prior art keywords
character string
file
excel
unit
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201010620426
Other languages
English (en)
Other versions
CN102270194A (zh
Inventor
吴克涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Aeonmed Co Ltd
Original Assignee
Beijing Aeonmed Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Aeonmed Co Ltd filed Critical Beijing Aeonmed Co Ltd
Priority to CN 201010620426 priority Critical patent/CN102270194B/zh
Publication of CN102270194A publication Critical patent/CN102270194A/zh
Application granted granted Critical
Publication of CN102270194B publication Critical patent/CN102270194B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了字符处理方法及装置,该方法包括:读取EXCEL格式的数据源文件中存储的第一字符串;按预先设定的字符串替换关系对所述第一字符串进行字符串替换,并将替换后的第二字符串保存在空白的EXCEL文件中;将保存所述第二字符串的EXCEL文件转换为逗号分隔值CSV格式文件。采用本发明能够降低出错率,提高应用效率。

Description

字符处理方法及装置
技术领域
本发明涉及通信领域,具体而言,涉及一种字符处理方法及装置。
背景技术
为了提高用户的感受体验,现有的各种设备或终端(例如麻醉机、手机、售票终端)等等均提供了图形界面,利用图形或文字格式向用户提供各种相关信息。目前应用较多的是利用EXCEL文件来维护界面中显示的字符串。但是,如果界面软件包含多个语言版本,EXCEL本身功能不足,存在的一些缺点就会显示出来,例如,某些操作需要手动完成,操作步骤繁琐,效率低且容易出错。
针对相关技术中界面软件包含多个语言版本,EXCEL本身功能不足会导致操作步骤繁琐,效率低且容易出错的问题,目前尚未提出有效的解决方案。
发明内容
本发明旨在提供一种字符处理方法及装置,以解决相关技术中界面软件包含多个语言版本,EXCEL本身功能不足会导致操作步骤繁琐,效率低且容易出错的问题。
根据本发明的一个方面,提供了一种字符处理方法,包括:读取EXCEL格式的数据源文件中存储的第一字符串;按预先设定的字符串替换关系对所述第一字符串进行字符串替换,并将替换后的第二字符串保存在空白的EXCEL文件中;将保存所述第二字符串的EXCEL文件转换为CSV格式文件。
较优的,所述读取EXCEL格式的数据源文件中存储的第一字符串包括:以单元格为单位读取所述第一字符串并保存在字符串变量sourcestr中;所述按预先设定的字符串替换关系对所述第一字符串进行字符串替换包括:将所述字符串替换关系配置为XLSX格式的字符串替换对照表,以单元格为单元,按照对应关系存储在二维数组中;利用所述二维数组中第一行中各元素对所述sourcestr遍历,用所述二维数组中第二行中对应列的元素内容替代与所述第一行中的元素相同的字符串。
较优的,所述第二字符串在所述空白的EXCEL文件中的位置与其对应的所述第一字符串在所述数据源文件中的位置相同。
较优的,所述将保存所述第二字符串的EXCEL文件设置为CSV格式文件之后,还包括:以单元格为单元读取所述第二字符串;建立包含每个单元格的位置及该单元格中存储的第二字符串的字符长度的对应关系的索引,并存储在另外一个空白的EXCEL文件中;将保存所述索引的EXCEL文件转换为CSV格式文件。
根据本发明的另一个方面,提供了一种字符处理装置,包括:读取单元,用于读取EXCEL格式的数据源文件中存储的第一字符串;替换单元,用于按预先设定的字符串替换关系对所述第一字符串进行字符串替换,并将替换后的第二字符串保存在空白的EXCEL文件中;设置单元,用于将保存所述第二字符串的EXCEL文件转换为CSV格式文件。
较优的,所述读取单元还用于以单元格为单位读取所述第一字符串并保存在字符串变量sourcestr中;所述替换单元还用于将所述字符串替换关系配置为XLSX格式的字符串替换对照表,以单元格为单元,按照对应关系存储在二维数组中;利用所述二维数组中第一行中各元素对所述sourcestr遍历,用所述二维数组中第二行中对应列的元素内容替代与所述第一行中的元素相同的字符串。
较优的,所述替换单元还用于设置所述第二字符串在所述空白的EXCEL文件中的位置与其对应的所述第一字符串在所述数据源文件中的位置相同。
较优的,所述读取单元还用于以单元格为单元读取所述第二字符串;所述替换单元还用于建立包含每个单元格的位置及该单元格中存储的第二字符串的字符长度的对应关系的索引,并存储在另外一个空白的EXCEL文件中;所述设置单元还用于将保存所述字符长度的EXCEL文件转换为CSV格式文件。
在本发明实施例中,利用预先设定的字符串替换关系对数据源文件中存储的第一字符串进行替换,对于某些EXCEL文件不容易处理的字符串,可以通过简单方便标识或使用的其他第二字符串替换,并可以利用字符串替换关系进行批量处理,使得后续操作简单,降低出错率,提高应用效率。另外,将保存第二字符串的EXCEL文件转换为CSV格式文件,由于CSV格式文件具有软件直接可读的特性,在操作中可以直接应用,解决了EXCEL文件不能直接读取、需要转换的问题,提高应用效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的字符处理方法的处理流程图;
图2是根据本发明实施例的利用二维数组的特性进行字符串替换的处理流程图;
图3是根据本发明实施例的查找方法的处理流程图;
图4是根据本发明实施例的字符处理装置的结构示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
相关技术中提到,如果界面软件包含多个语言版本,Excel本身功能不足,存在的一些缺点就会显示出来,例如,某些操作需要手动完成,操作步骤繁琐,效率低且容易出错。为解决上述技术问题,本发明实施例提供了一种字符处理方法,其处理流程如图1所示,包括:
步骤S102、读取EXCEL格式的数据源文件中存储的第一字符串;
步骤S104、按预先设定的字符串替换关系对第一字符串进行字符串替换,并将替换后的第二字符串保存在空白的EXCEL文件中;
步骤S106、将保存第二字符串的EXCEL文件转换为CSV(COMMA SEPARATEDVALUE,逗号分隔值)格式文件。
在本发明实施例中,利用预先设定的字符串替换关系对数据源文件中存储的第一字符串进行替换,对于某些EXCEL文件不容易处理的字符串,可以通过简单方便标识或使用的其他第二字符串替换,并可以利用字符串替换关系进行批量处理,使得后续操作简单,降低出错率,提高应用效率。另外,将保存第二字符串的EXCEL文件转换为CSV格式文件,由于CSV格式文件具有软件直接可读的特性,在操作中可以直接应用,解决了EXCEL文件不能直接读取、需要转换的问题,提高应用效率。
如图1所示流程,步骤S102在实施时,考虑到EXCE文件本身的特性,优选的,可以以单元格为单位读取第一字符串,当然,实施时,也可以应用两个单元格或三个单元格或多个单元格为单位,根据具体情况而定。
以单元格为单位读取第一字符串后将读取的第一字符串保存在字符串变量sourcestr中,以方便后续操作。
如图1所示流程,步骤S104在实施时,按预先设定的字符串替换关系对第一字符串进行字符串替换,通常的替换关系为一一对应的替换关系,因此,可以利用二维数组的特性进行相应替换,相应处理流程请参见图2,包括:
步骤S202、将字符串替换关系配置为XLSX格式的字符串替换对照表,以单元格为单元,按照对应关系存储在二维数组中;
步骤S204、利用二维数组中第一行中各元素对sourcestr遍历,用二维数组中第二行中对应列的元素内容替代与第一行中的元素相同的字符串。
除了二维数组,也可以利用具有其他一一对应特性的数据结构,以提高替换效率。
如图2所示流程,第二字符串在空白的EXCEL文件中的位置与其对应的第一字符串在数据源文件中的位置相同,在后续过程中,如若需要根据第二字符串查找第一字符串,能够根据第二字符串存储的位置较容易地查找到第一字符串,提高查找效率。
在实施时,由于不同的字符串的字符长度不同,不是固定长度,查找比较复杂,例如,当前需要在存储了第二字符串的EXCEL文件中查找第200个第二字符串,就需要按个去计数,并遍历每个第二字符串的长度,直至计数到第200个第二字符串,浪费大量的资源,为解决该问题,本发明实施例提供了一种较优的方式,请参见图3所示流程:
步骤S302、以单元格为单元读取第二字符串;
步骤S304、建立包含每个单元格的位置及该单元格中存储的第二字符串的字符长度的对应关系的索引,并存储在另外一个空白的EXCEL文件中;
步骤S306、将保存上述索引的EXCEL文件转换为CSV格式文件。
如图3所示流程,建立包含每个单元格的位置及该单元格中存储的第二字符串的字符长度的对应关系的索引,每个单元格的位置可以用数字或字母标识,后续若需要查找第N个第二字符串,只需要根据索引查找到相应的位置,即可以读取字符串,简单方便,能够提高查找效率。
为对本发明实施例提供的方法进行更详细更具体的阐述,现以一个具体实施例进行说明。首先读取一个“xlsx”格式的“字符串替换对照表”文件。将该文件中的内容以单元格为单位,按照上下对应关系读取到程序中,存放在一个二维数组中。打开用户选中的Excel文件,该文件为“数据源文件”。程序以单元格为单位读取“数据源文件”中第一页即Sheet1的内容,保存到字符串变量sourcestr中。将上述二维数组中第一行中各元素对sourcestr遍历,如果查找到相同的字符串就用数组第二行中对应列的元素内容替代。数组第一行所有元素对sourcestr遍历后,将结果保存到“数据源文件”的Sheet2中,位置与原始数据在Sheet1中的位置相同。Sheet1中的全部内容转换并存储到Sheet2中。将Sheet2设置为当前页,另存Sheet2为与“数据源文件”同名的CSV格式的文件。读取Sheet2中各单元格内容,保存为新字符串变量newsourcestr。通过公式计算newsourcestr的字节数,将结果累加后保存到“数据源文件”的Sheet3对应单元格中。Sheet2中所有单元格长度计算完成后。将Sheet3设置为当前页,另存Sheet3为指定名称的CSV格式文件。
根据上述实施例的具体说明,该实施例主要分为三个步骤:打开“数据源文件”读取Sheet1中个单元格内容;将读到的内容进行字符串替换,将结果保存到Sheet2中,将Sheet2另存为CSV格式的文件;对Sheet2中各单元格的内容进行读取,计算长度将累计后的结果保存到Sheet3,将Sheet3另存为CSV格式的文件。
本发明实施例主要针对以下三种常用操作进行了封装,进而达到可以简洁高效的完成工作的目的:封装操作一:对文档中指定的字符串进行替代;封装操作二:对文档中单元格进行字节长度累计统计;封装操作三:将文档指定页保存为CSV格式的文件。
基于同一发明构思,本发明实施例还提供了一种字符处理装置,其结构示意图如图4所示,包括:
读取单元401,用于读取EXCEL格式的数据源文件中存储的第一字符串;
替换单元402,用于按预先设定的字符串替换关系对所述第一字符串进行字符串替换,并将替换后的第二字符串保存在空白的EXCEL文件中;
设置单元403,用于将保存所述第二字符串的EXCEL文件转换为CSV格式文件。
在一个实施例中,较优的,读取单元401还可以用于以单元格为单位读取第一字符串并保存在字符串变量sourcestr中;
替换单元402还可以用于将字符串替换关系配置为XLSX格式的字符串替换对照表,以单元格为单元,按照对应关系存储在二维数组中;利用二维数组中第一行中各元素对sourcestr遍历,用二维数组中第二行中对应列的元素内容替代与第一行中的元素相同的字符串。
在一个实施例中,较优的,替换单元402还可以用于设置第二字符串在存储自身的空白的EXCEL文件中的位置与其对应的第一字符串在数据源文件中的位置相同。
在一个实施例中,较优的,读取单元401还可以用于以单元格为单元读取第二字符串;
替换单元402还可以用于建立包含每个单元格的位置及该单元格中存储的第二字符串的字符长度的对应关系的索引,并存储在另外一个空白的EXCEL文件中;
设置单元403还可以用于将保存所述字符长度的EXCEL文件转换为CSV格式文件。
在本发明实施例中,利用预先设定的字符串替换关系对数据源文件中存储的第一字符串进行替换,对于某些EXCEL文件不容易处理的字符串,可以通过简单方便标识或使用的其他第二字符串替换,并可以利用字符串替换关系进行批量处理,使得后续操作简单,降低出错率,提高应用效率。另外,将保存第二字符串的EXCEL文件转换为CSV格式文件,由于CSV格式文件具有软件直接可读的特性,在操作中可以直接应用,解决了EXCEL文件不能直接读取、需要转换的问题,提高应用效率。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种字符处理方法,其特征在于,包括:
读取EXCEL格式的数据源文件中存储的第一字符串;
按预先设定的字符串替换关系对所述第一字符串进行字符串替换,并将替换后的第二字符串保存在空白的EXCEL文件中;
将保存所述第二字符串的EXCEL文件转换为逗号分隔值CSV格式文件,
其中,所述将保存所述第二字符串的EXCEL文件设置为CSV格式文件之后,还包括:
以单元格为单元读取所述第二字符串;
建立包含每个单元格的位置及该单元格中存储的第二字符串的字符长度的对应关系的索引,并存储在另外一个空白的EXCEL文件中;
将保存所述索引的EXCEL文件转换为CSV格式文件。
2.根据权利要求1所述的方法,其特征在于:
所述读取EXCEL格式的数据源文件中存储的第一字符串包括:以单元格为单位读取所述第一字符串并保存在字符串变量sourcestr中;
所述按预先设定的字符串替换关系对所述第一字符串进行字符串替换包括:
将所述字符串替换关系配置为XLSX格式的字符串替换对照表,以单元格为单元,按照对应关系存储在二维数组中;
利用所述二维数组中第一行中各元素对所述sourcestr遍历,用所述二维数组中第二行中对应列的元素内容替代与所述第一行中的元素相同的字符串。
3.根据权利要求2所述的方法,其特征在于,所述第二字符串在所述空白的EXCEL文件中的位置与其对应的所述第一字符串在所述数据源文件中的位置相同。
4.一种字符处理装置,其特征在于,包括:
读取单元,用于读取EXCEL格式的数据源文件中存储的第一字符串;
替换单元,用于按预先设定的字符串替换关系对所述第一字符串进行字符串替换,并将替换后的第二字符串保存在空白的EXCEL文件中;
设置单元,用于将保存所述第二字符串的EXCEL文件转换为逗号分隔值CSV格式文件,
其中,所述读取单元还用于以单元格为单元读取所述第二字符串;
所述替换单元还用于建立包含每个单元格的位置及该单元格中存储的第二字符串的字符长度的对应关系的索引,并存储在另外一个空白的EXCEL文件中;
所述设置单元还用于将保存所述字符长度的EXCEL文件转换为CSV格式文件。
5.根据权利要求4所述的装置,其特征在于,所述读取单元还用于以单元格为单位读取所述第一字符串并保存在字符串变量sourcestr中;
所述替换单元还用于将所述字符串替换关系配置为XLSX格式的字符串替换对照表,以单元格为单元,按照对应关系存储在二维数组中;利用所述二维数组中第一行中各元素对所述sourcestr遍历,用所述二维数组中第二行中对应列的元素内容替代与所述第一行中的元素相同的字符串。
6.根据权利要求4所述的装置,其特征在于,所述替换单元还用于设置所述第二字符串在所述空白的EXCEL文件中的位置与其对应的所述第一字符串在所述数据源文件中的位置相同。
CN 201010620426 2010-12-31 2010-12-31 字符处理方法及装置 Expired - Fee Related CN102270194B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010620426 CN102270194B (zh) 2010-12-31 2010-12-31 字符处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010620426 CN102270194B (zh) 2010-12-31 2010-12-31 字符处理方法及装置

Publications (2)

Publication Number Publication Date
CN102270194A CN102270194A (zh) 2011-12-07
CN102270194B true CN102270194B (zh) 2013-01-02

Family

ID=45052501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010620426 Expired - Fee Related CN102270194B (zh) 2010-12-31 2010-12-31 字符处理方法及装置

Country Status (1)

Country Link
CN (1) CN102270194B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279341B (zh) * 2013-05-09 2016-08-17 四三九九网络股份有限公司 批量汉化flash游戏的方法和装置
CN107025214B (zh) * 2017-04-27 2019-08-30 珠海格力电器股份有限公司 数据处理方法和装置
CN109657209A (zh) * 2018-10-16 2019-04-19 深圳壹账通智能科技有限公司 文本内容的替换方法、装置、设备及计算机存储介质
CN114429218A (zh) * 2022-01-25 2022-05-03 北京百度网讯科技有限公司 消除量子噪声的方法及装置、电子设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1506875A (zh) * 2002-12-12 2004-06-23 华为技术有限公司 语言本地化中特征字符串的提取与替换方法
CN1547116A (zh) * 2003-12-16 2004-11-17 艾默生网络能源有限公司 软件中语言资源本地化的实现方法
CN201489518U (zh) * 2009-09-01 2010-05-26 卡斯柯信号有限公司 一种实时多国别语言支持系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1506875A (zh) * 2002-12-12 2004-06-23 华为技术有限公司 语言本地化中特征字符串的提取与替换方法
CN1547116A (zh) * 2003-12-16 2004-11-17 艾默生网络能源有限公司 软件中语言资源本地化的实现方法
CN201489518U (zh) * 2009-09-01 2010-05-26 卡斯柯信号有限公司 一种实时多国别语言支持系统

Also Published As

Publication number Publication date
CN102270194A (zh) 2011-12-07

Similar Documents

Publication Publication Date Title
CN103186510B (zh) 一种转换文档格式的方法和装置
CN102270194B (zh) 字符处理方法及装置
CN103970736A (zh) 一种将Excel表格转换成数据库表的方法
CN104090889A (zh) 数据处理方法及系统
CN101000677A (zh) 营销业务推荐的匹配方法及系统
CN103777934A (zh) 一种基于matlab生成控制器can交互层的方法及系统
CN109068354B (zh) 基于北斗通信的数据编码传输方法、终端和系统
CN113094355A (zh) 基于国产化通信协议的模型实例化方法、装置、设备及介质
CN103780698A (zh) 一种基于nfc技术的电子名片和电子名片信息交换方法
CN104572994B (zh) 用于搜索数据的方法和装置
CN103347079A (zh) 一种日程事件同步的方法和移动设备
CN102624894B (zh) 一种报文组装与解析的方法和系统
CN101867946A (zh) 一种手机客户端统计网络流量的方法
CN103297183A (zh) 数据通信方法及装置
CN105684455A (zh) 一种基于app的视频分享方法及系统
CN102833386A (zh) 一种实现存储操作记录的方法、系统及移动终端
CN105120046A (zh) 一种根据新增号码的备注信息创建通讯录的方法及装置
CN103378940B (zh) 用于td‑scdma系统的上行信道编码方法及装置
CN104753891A (zh) 一种xml报文解析方法及装置
CN103020189A (zh) 数据处理装置和数据处理方法
CN102437920A (zh) 配置数据的处理方法、装置及无线通讯设备
CN102904785B (zh) 无线上网卡兼容的方法
CN107133077A (zh) 一种网页端调用本地应用功能的方法及装置
CN101888425A (zh) 一种阅读手机电子书时跳转到指定页码的方法
CN107463546A (zh) 一种基于指标库的文档生成方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130102

Termination date: 20151231

EXPY Termination of patent right or utility model