CN105630971A - 一种中文信息处理装置及信息处理方法 - Google Patents

一种中文信息处理装置及信息处理方法 Download PDF

Info

Publication number
CN105630971A
CN105630971A CN201510990947.6A CN201510990947A CN105630971A CN 105630971 A CN105630971 A CN 105630971A CN 201510990947 A CN201510990947 A CN 201510990947A CN 105630971 A CN105630971 A CN 105630971A
Authority
CN
China
Prior art keywords
module
information processing
processing device
information
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510990947.6A
Other languages
English (en)
Inventor
宋振东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Heilongjiang University
Original Assignee
Heilongjiang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Heilongjiang University filed Critical Heilongjiang University
Priority to CN201510990947.6A priority Critical patent/CN105630971A/zh
Publication of CN105630971A publication Critical patent/CN105630971A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/2448Query languages for particular applications; for extensibility, e.g. user defined types

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于信息技术领域公开了一种中文信息处理装置及信息处理方法,包括检索问题输入模块、检索问题处理模块和检索问题输出模块,所述的检索问题输入模块包括键盘输入模块、语音输入模块和蓝牙输入模块,所述的检索问题处理模块包括中央处理器,所述的中央处理器内置信息数据库,所述的中央处理器与兼类分歧词数据库以及动态标注数据库相连接,所述的检索问题输出模块包括显示屏输出模块、打印机输出模块以及云端输出模块,本发明结构简单,功能实用,除了必要的基本数据库以外,增设兼类分歧词数据库和动态标注数据库,可以对问题的解答更加明确、全面、直观,便于用户接受;设有多种数据更新方式,保证数据库的实时更新。

Description

一种中文信息处理装置及信息处理方法
技术领域
本发明涉及一种信息处理装置,特别涉及一种中文信息处理装置及信息处理方法,属于信息处理技术领域。
背景技术
21世纪,人们步入信息时代,对互联网络信息量的需求也与日俱增。大规模信息检索技术和搜索引擎的应用在一定程度上使人们的信息获取能力得到提高。然而,互联网络所固有的海量、异构、无效数据充斥等特点,降低了人们获取信息的准确性和效率。为了提升用户体验,主流信息检索系统在用户检索需求分析、检索方法和结果展现等技术上取得了一定成就。
由于中文语法的特殊性,对于中文信息的处理需要更高的技术要求和手段。对于中文来说,存在多种多样的兼类分歧词,这在一定程度上增加了中文信息处理的难度和复杂性。同时现有的信息处理装置缺乏对问题的动态标注,不能更好的对问题以及回答作出解释和标注,增加了用户理解的成本。
发明内容
本发明要解决的技术问题客是服现有的缺陷,提供一种中文信息处理装置,可以有效解决背景技术中的问题。
为了解决上述技术问题,本发明提供了如下的技术方案:
本发明所述的一种中文信息处理装置,包括检索问题输入模块、检索问题处理模块和检索问题输出模块,所述的检索问题输入模块包括键盘输入模块、语音输入模块和蓝牙输入模块,所述的检索问题处理模块包括中央处理器,所述的中央处理器内置信息数据库,所述的中央处理器与兼类分歧词数据库以及动态标注数据库相连接,所述的检索问题输出模块包括显示屏输出模块、打印机输出模块以及云端输出模块。
作为本发明的一种优选技术方案,所述的检索问题输入模块下端设有身份权限确认模块,所述的身份权限确认模块内存储有权限访问信息处理的用户信息。
作为本发明的一种优选技术方案,所述的信息数据库存储有基本的检索信息,所述的兼类分歧词数据库存储有与基本检索信息相关联的兼类分歧词,所述的动态标注数据库存储有与检索信息以及兼类分歧词相关的标注信息。
作为本发明的一种优选技术方案,所述的中央处理器还与数据库更新模块相连接,所述的数据库更新模块包括USB更新模块、无线云端更新模块、手动输入更新模块以及自动联想记忆更新模块。
作为本发明的一种优选技术方案,中央处理器处理信息包含以下模块:问题分析和检索生成模块、文档检索模块、结果抽取模块、结果分组模块以及分组结果分析和报告生成模块。
作为本发明的一种优选技术方案,所述的三个数据库内包含问题模式库、答案模式库、语义词典、词法分析语料库、句法分析语料库等数据库。
本发明所述的一种中文信息处理处理方法,包括以下步骤:
S1、根据使用的需求以及方便程度选用三种输入方式中的任意一种进行检索问题的输入;
S2、问题输入后,中央处理器接受问题并从三个数据库中对于该问题做相关的基本回答、兼类分歧词以及动态标注进行归纳分组整理,并将结果根据用户的需要输出;
S3、对数据库定期进行自动或者自定义的更新,保证数据库的完整准确
本发明所达到的有益效果是:结构简单,功能实用,除了必要的基本数据库以外,增设兼类分歧词数据库和动态标注数据库,可以对问题的解答更加明确、全面、直观,便于用户接受;设有多种数据库更新方式,在自动与自定义之间做出权衡,保证数据库的实时更新,设有多种输入输出模块,使得信息处理更加便捷、迅速,减轻了信息处理的难度,完善了人机交互的能力。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
在附图中:
图1是本发明实施例所述的一种中文信息处理装置的结构示意图;
图2是本发明实施例所述的一种中文信息处理装置中央处理器对问题处理过程的结构示意图。
图中标号:1、检索问题输入模块;2、检索问题处理模块;3、检索问题输出模块;4、键盘输入模块;5、语音输入模块;6、蓝牙输入模块;7、中央处理器;8、兼类分歧词数据库;9、动态标注数据库;10、显示屏输出模块;11、打印机输出模块;12、云端输出模块;13、USB更新模块;14、无线云端更新模块;15、手动输入更新模块;16、自动联想记忆更新模块;17、身份权限确认模块;18、问题分析和检索生成模块;19、文档检索模块;20、结果抽取模块;21、结果分组模块;22、分组结果分析和报告生成模块。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例:如图1-2所示,本发明一种中文信息处理装置,包括检索问题输入模块1、检索问题处理模块2和检索问题输出模块3,所述的检索问题输入模块1包括键盘输入模块4、语音输入模块5和蓝牙输入模块6,所述的检索问题处理模块2包括中央处理器7,所述的中央处理器7内置信息数据库,所述的中央处理器7与兼类分歧词数据库8以及动态标注数据库9相连接,所述的检索问题输出模块3包括显示屏输出模块10、打印机输出模块11以及云端输出模块12,所述的检索问题输入模块1下端设有身份权限确认模块17,所述的身份权限确认模块17内存储有权限访问信息处理的用户信息,所述的信息数据库存储有基本的检索信息,所述的兼类分歧词数据库8存储有与基本检索信息相关联的兼类分歧词,所述的动态标注数据库9存储有与检索信息以及兼类分歧词相关的标注信息,所述的中央处理器7还与数据库更新模块相连接,所述的数据库更新模块包括USB更新模块13、无线云端更新模块14、手动输入更新模块15以及自动联想记忆更新模块16,中央处理器处理信息包含以下模块:问题分析和检索生成模块18、文档检索模块19、结果抽取模块20、结果分组模块21以及分组结果分析和报告生成模块22,所述的三个数据库内包含问题模式库、答案模式库、语义词典、词法分析语料库、句法分析语料库等数据库。
使用时根据使用的需求以及方便程度选用三种输入方式中的任意一种进行检索问题的输入,当问题输入后,中央处理器接受问题并从三个数据库中对于该问题相关的基本回答、兼类分歧词以及动态标注进行归纳分组整理,并将结果根据用户的需要输出,数据库定期进行自动或者自定义的更新,保证数据库的完整准确。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种中文信息处理装置,包括检索问题输入模块(1)、检索问题处理模块(2)和检索问题输出模块(3),其特征在于,所述的检索问题输入模块(1)包括键盘输入模块(4)、语音输入模块(5)和蓝牙输入模块(6),所述的检索问题处理模块(2)包括中央处理器(7),所述的中央处理器(7)内置信息数据库,所述的中央处理器(7)与兼类分歧词数据库(8)以及动态标注数据库(9)相连接,所述的检索问题输出模块(3)包括显示屏输出模块(10)、打印机输出模块(11)以及云端输出模块(12)。
2.根据权利要求1所述的一种中文信息处理装置,其特征在于,所述的检索问题输入模块下端设有身份权限确认模,(17),所述的身份权限确认模块(17)内存储有权限访问信息处理的用户信息。
3.根据权利要求1所述的一种中文信息处理装置,其特征在于,所述的信息数据库存储有基本的检索信息,所述的兼类分歧词数据库(8)存储有与基本检索信息相关联的兼类分歧词,所述的动态标注数据库(9)存储有与检索信息以及兼类分歧词相关的标注信息。
4.根据权利要求1所述的一种中文信息处理装置,其特征在于,所述的中央处理,(7)还与数据库更新模块相连接,所述的数据库更新模块包括USB更新模块(13)、无线云端更新模块(14)、手动输入更新模块(15)以及自动联想记忆更新模块(16)。
5.根据权利要求1所述的一种中文信息处理装置,其特征在于,中央处理器处理信息包含以下模块:问题分析和检索生成模块、文档检索模块、结果抽取模块、结果分组模块以及分组结果分析和报告生成模块。
6.根据权利要求1所述的一种中文信息处理装置,其特征在于,所述的三个数据库内包含问题模式库、答案模式库、语义词典、词法分析语料库、句法分析语料库等数据库。
7.一种中文信息处理处理方法,其特征在于,包括以下步骤:
S1、根据使用的需求以及方便程度选用三种输入方式中的任意一种进行检索问题的输入;
S2、问题输入后,中央处理器接受问题并从三个数据库中对于该问题做相关的基本回答、兼类分歧词以及动态标注进行归纳分组整理,并将结果根据用户的需要输出;
S3、对数据库定期进行自动或者自定义的更新,保证数据库的完整准确。
CN201510990947.6A 2015-12-25 2015-12-25 一种中文信息处理装置及信息处理方法 Pending CN105630971A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510990947.6A CN105630971A (zh) 2015-12-25 2015-12-25 一种中文信息处理装置及信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510990947.6A CN105630971A (zh) 2015-12-25 2015-12-25 一种中文信息处理装置及信息处理方法

Publications (1)

Publication Number Publication Date
CN105630971A true CN105630971A (zh) 2016-06-01

Family

ID=56045904

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510990947.6A Pending CN105630971A (zh) 2015-12-25 2015-12-25 一种中文信息处理装置及信息处理方法

Country Status (1)

Country Link
CN (1) CN105630971A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102456060A (zh) * 2010-10-28 2012-05-16 株式会社日立制作所 信息处理装置及信息处理方法
CN103514150A (zh) * 2012-06-21 2014-01-15 富士通株式会社 识别具有组合型歧义的歧义词的方法和装置
US20150186534A1 (en) * 2013-12-31 2015-07-02 Google Inc. Rich content for query answers
CN104965821A (zh) * 2015-07-17 2015-10-07 苏州大学张家港工业技术研究院 一种数据标注方法及装置
CN105005557A (zh) * 2015-08-06 2015-10-28 电子科技大学 一种基于依存分析的中文兼类词处理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102456060A (zh) * 2010-10-28 2012-05-16 株式会社日立制作所 信息处理装置及信息处理方法
CN103514150A (zh) * 2012-06-21 2014-01-15 富士通株式会社 识别具有组合型歧义的歧义词的方法和装置
US20150186534A1 (en) * 2013-12-31 2015-07-02 Google Inc. Rich content for query answers
CN104965821A (zh) * 2015-07-17 2015-10-07 苏州大学张家港工业技术研究院 一种数据标注方法及装置
CN105005557A (zh) * 2015-08-06 2015-10-28 电子科技大学 一种基于依存分析的中文兼类词处理方法

Similar Documents

Publication Publication Date Title
CN107180045B (zh) 一种互联网文本蕴含地理实体关系的抽取方法
CN103530378B (zh) 数据分页查询与数据库的构建的方法与装置
CN106919689A (zh) 基于术语释义知识单元的专业领域知识图谱动态构建方法
Bast et al. Open information extraction via contextual sentence decomposition
CN107291948A (zh) 一种分布式newSQL数据库的访问方法
CN106447346A (zh) 一种智能电力客服系统的构建方法及系统
CN107122443A (zh) 一种基于Spark SQL的分布式全文检索系统及方法
CN106407302B (zh) 支持通过简单sql调用中间件数据库特有功能的方法
CN104899295B (zh) 一种异构数据源数据关联分析方法
CN105224622A (zh) 面向互联网的地名地址提取与标准化方法
CN107357933A (zh) 一种用于多源异构科技信息资源的标签描述方法和装置
CN101609460B (zh) 一种支持异构地学数据资源的检索方法及检索系统
CN110941612A (zh) 基于关联数据的自治数据湖构建系统及方法
CN105468605A (zh) 一种实体信息图谱生成方法及装置
CN103778133A (zh) 一种数据库对象的变更方法及装置
CN103390038A (zh) 一种基于HBase的构建和检索增量索引的方法
CN103970902A (zh) 一种大量数据情况下的可靠即时检索方法及系统
CN104021198A (zh) 基于本体语义索引的关系数据库信息检索方法及装置
CN106372044A (zh) 一种基于报表生成类型化维度xbrl报告的方法
US10666731B2 (en) IRC-infoid data standardization for use in a plurality of mobile applications
CN101859303A (zh) 元数据管理方法及管理系统
CN107122415A (zh) 地名地址库数据融合集成的系统
CN106599052A (zh) 一种基于ApacheKylin的数据查询系统及其方法
CN110781183A (zh) Hive数据库中增量数据的处理方法、装置以及计算机设备
CN101639851A (zh) 一种数据存储、查询的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160601

RJ01 Rejection of invention patent application after publication