CN103995826A - 一种安全生产监督管理政务信息的自动编目方法 - Google Patents
一种安全生产监督管理政务信息的自动编目方法 Download PDFInfo
- Publication number
- CN103995826A CN103995826A CN201410140197.9A CN201410140197A CN103995826A CN 103995826 A CN103995826 A CN 103995826A CN 201410140197 A CN201410140197 A CN 201410140197A CN 103995826 A CN103995826 A CN 103995826A
- Authority
- CN
- China
- Prior art keywords
- information
- resources
- cataloguing
- government affairs
- production supervision
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Marketing (AREA)
- Library & Information Science (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种对于安全生产监督管理政务信息,进行自动编目的方法。规范化各类政务信息的编目元数据,以灵活配置的方式,达到实时在线自动化编目的目的,提高了编目的工作效率。
Description
技术领域
本发明属于电子政务领域,涉及安全生产监督管理政务信息的自动编目方法和系统。
背景技术
随着信息技术发展,安全生产监督管理局对信息化进程提出了更高的要求,迫切希望利用WEB技术来帮助自己提升管理能力。信息共享是提升管理能力的一种有效方式,安全生产监督管理局在日常的安全生产监督管理中,产生了大量的政务信息,包括企业基本信息、隐患信息、安全生产标准化信息、重大危险源信息、应急信息、教育培训信息、事故信息、行政执法信息等,这些信息离散的存在于各级安全生产监督管理局及相关企事业单位,迫切要求实现信息共享,提升工作效率。而编目工作是实现信息共享,解决信息孤岛的基础。人工手工编目,在人力资源投入上,在信息工作量上,都不符合现阶段日益膨胀的安全生产政务信息的信息量,因此,迫切需要一款能够对安全生产监督管理政务信息进行自动编目的方法和系统。
发明内容
本发明提供了一种对于安全生产监督管理政务信息,进行自动编目的方法。规范化各类政务信息的编目元数据,以灵活配置的方式,达到实时在线自动化编目的目的,提高了编目的工作效率。
为了达到上述目的,本发明提供了一种对安全生产政务信息自动编目的方法,包括以下步骤:
针对安全生产监督管理政务信息资源,进行信息资源分类。分类包括:企业基本信息、隐患排查信息、安全生产标准化信息、重大危险源信息、应急演练信息、教育培训信息、事故信息、行政执法信息等。
针对安全生产监督管理政务信息资源,制定编目元数据。编目元数据包括:信息资源名称、信息资源分类、信息资源提供方、信息资源所属行政区划、信息资源所属行业、信息资源摘要信息、信息获取地址。
针对每一种分类政务资源信息,制定内容摘要获取算法。如:企业基本信息,抽取地址,主要负责人,描述内容等做为企业摘要信息。
通过可视化的人机交互配置,建立安全生产监督管理政务信息资源数据与编目目录数据的对应关系。配置信息以XML的形式,持久化在系统中。
自动编目引擎,通过配置信息要求,提取安全生产监督管理政务信息资源数据,自动生成目录信息,以供利用方使用。自动编目算法的基本步骤如下:通过配置信息,获取安全生产监督管理政务信息资源数据的数据来源。
附图说明
图1 一种安全生产监督管理政务信息的自动编目方法流程图。
具体实施方式
如图1所示,一种安全生产监督管理政务信息的自动编目方法流程图:
针对安全生产监督管理政务信息资源,进行信息资源分类。分类包括:企业基本信息、隐患排查信息、安全生产标准化信息、重大危险源信息、应急演练信息、教育培训信息、事故信息、行政执法信息等。
针对安全生产监督管理政务信息资源,制定编目元数据。编目元数据包括:信息资源名称、信息资源分类、信息资源提供方、信息资源所属行政区划、信息资源所属行业、信息资源摘要信息、信息获取地址。
针对每一种分类政务资源信息,制定内容摘要获取算法。如:企业基本信息,抽取地址,主要负责人,描述内容等做为企业摘要信息。
通过可视化的人机交互配置,建立安全生产监督管理政务信息资源数据与编目目录数据的对应关系。配置信息以XML的形式,持久化在系统中。
自动编目引擎,通过配置信息要求,提取安全生产监督管理政务信息资源数据,自动生成目录信息,以供利用方使用。自动编目算法的基本步骤如下:通过配置信息,获取安全生产监督管理政务信息资源数据的数据来源,
其中对具体信息的编目配置按照如下步骤进行:
S1:为视音频文件构建一套多维多层面编目标注体系,容纳对视音频文件多层面属性的标注;
定义多维多层面编目的编目框架:
该方法运行的基础是设计一套开放的、兼容并包的数据框架--编目体系架构,突破传统馆藏的规范、格式的视音频信息描述局限,提供一种非结构化的信息描述和表达架构;采用非关系型数据模型,实现对视频进行任意的、非对称的、非关系的描述信息定义,因此能够实现如馆藏、编码技术、拍摄技术、拍摄手法、内容语义、环境特征、情感等方面的高层概念和语义的综合标注。
对视音频素材应用编目框架:
视音频素材自身的描述信息非常有限,通常只包含了标题文件名信息。但实际上,视音频素材本身包含了大量丰富的信息,如果能够充分利用这些信息,对视音频的管理、查找和再利用都会有巨大的帮助。因此,将上一步定义的多维多层面编目的框架应用到视音频素材上,构建一个基础平台,有了这个平台,才有可能通过各种技术手段,将视音频素材自包含的信息获取出来,达到通过一定的搜索引擎进行搜索的能力和目标。
S2:基于该编目标注体系,进行多维度的编目标注;
将视音频素材自包含的信息抽取出来,基于第二步中应用的框架,将这些抽取出来的信息附加到音视频上,实现从抽象的自表达信息变成为具体的、可以存储为数据的、可以识别和检索的信息。
进一步的,编目标准有两种方案:第一种方案是由人来识别这些信息,将这些信息用文字表达出来,方法是依次浏览整个视音频素材,在这个过程中逐渐记录其自包含的信息,并将其文字化。第二种方案采用图像处理手段,自动地获取出来,方法是对视频文件进行分析,对场景进行识别和切分,并查找出关键帧图片,对关键帧图片再应用图像处理算法,获取出图像特征,如颜色、文理、对象、场景等,然后通过人工智能的手段对这些场景进行识别并将其文字化。第一种方案简单直接,但是费时费力,识别的效果好坏完全依赖于识别者的知识和技能;第二种技术难度大,但是一旦突破了技术门槛,它的识别效率、准确度都相比第一种方案高。本方法中,应用第二种方案为主,辅以第一种方案进行适当地调校和优化,达到更佳的效果。
S3:通过图像分析算法抽取代表帧图片;
S4:对代表帧图片进行场景检测,获取高层语义信息,并自动标注与定义到编目标注体系中;
S5:对多维度编目标注体系构建存储与索引系统,提供对编目信息的随机高效存取;
S6:通过多维度编目标注的层面组合与递进检索手段,实现快速、精确的查找。
灵活的编目框架,可以采用XML技术手段来定义容纳各种信息的的编目框架,在GUI 表达上,采用InEdit技术,实现属性的动态拖动编辑与布局。
关键帧抽取算法,可以采用图像向量空间距离对比,直方图对比等图像素材,计算场景变换与抽取代表的关键帧。
图像处理算法,采用颜色计算、灰度化、二值化、直方图、模式识别等通用的成熟算法,获取图像的基本特征,在此基础上,采用人工智能与神经网络,通过机器学习将图像特征与高层语义结合起来,达到自动识别场景并表达为人能够理解的文字与概念的目的。
海量信息存储,采用NoSQL数据库和JSON 数据结构,来达到快速、高效的非结构数据存储与读取。海量信息索引,采用Lucene作为引擎框架,采用Hadoop实现海量数据的分布式调度与索引。
层面的聚类与组合,在检索技术上,采用全文检索作为入口,然后根据概念对结果进行聚类组合,技术上可以采用划分发、层次法、基于密度的方法、基于网格的方法和基于模型的方法等聚类算法或几种算法的组合来实现层面的聚类与组合。
海量编目信息存储与索引:在人工或自动标注阶段,会产生大量的编目信息,这些信息通过关系型数据库是没有办法存储与读取的,本方法采用NoSQL作为数据存储,通过NoSQL的高性能与海量数据处理能力。在索引方法上,通过Hadoop 的分布式文件系统和数据处理能力,实现海量数据的索引。
基于层面的搜索与选取:通过对检索意图的预判,结合检索关键词,按照编目信息的维度进行聚类与组合,提供给操作者选择的选择,由于在人工与自动标注步骤中对高层语义、艺术语义与技术语义进行标准,操作者能够按照视频表达的喜怒哀乐等情感、拍摄的角度与技术等方面来选择需要的音视频和画面。
Claims (7)
1.一种对安全生产政务信息自动编目的方法,包括以下步骤:
针对安全生产监督管理政务信息资源,进行信息资源分类,包括:企业基本信息、隐患排查信息、安全生产标准化信息、重大危险源信息、应急演练信息、教育培训信息、事故信息、行政执法信息。
2.针对安全生产监督管理政务信息资源,制定编目元数据。
3.编目元数据包括:信息资源名称、信息资源分类、信息资源提供方、信息资源所属行政区划、信息资源所属行业、信息资源摘要信息、信息获取地址。
4.针对每一种分类政务资源信息,制定内容摘要获取算法,包括企业基本信息,抽取地址,主要负责人,描述内容等做为企业摘要信息。
5.通过可视化的人机交互配置,建立安全生产监督管理政务信息资源数据与编目目录数据的对应关系。
6.配置信息以XML的形式,持久化在系统中。
7.自动编目引擎,通过配置信息要求,提取安全生产监督管理政务信息资源数据,自动生成目录信息,以供利用方使用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410140197.9A CN103995826A (zh) | 2014-04-09 | 2014-04-09 | 一种安全生产监督管理政务信息的自动编目方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410140197.9A CN103995826A (zh) | 2014-04-09 | 2014-04-09 | 一种安全生产监督管理政务信息的自动编目方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103995826A true CN103995826A (zh) | 2014-08-20 |
Family
ID=51309991
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410140197.9A Pending CN103995826A (zh) | 2014-04-09 | 2014-04-09 | 一种安全生产监督管理政务信息的自动编目方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103995826A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105468614A (zh) * | 2014-09-01 | 2016-04-06 | 方正国际软件(北京)有限公司 | 一种编目的方法及装置 |
CN106294575A (zh) * | 2016-07-21 | 2017-01-04 | 国家林业局调查规划设计院 | 一种基于Lucene的林地图斑矢量数据查询方法 |
CN108228690A (zh) * | 2017-06-30 | 2018-06-29 | 勤智数码科技股份有限公司 | 一种目录管理系统及其管理方法 |
CN108509577A (zh) * | 2018-03-28 | 2018-09-07 | 上海数据交易中心有限公司 | 一种数据编目方法及装置 |
CN112291574A (zh) * | 2020-09-17 | 2021-01-29 | 上海东方传媒技术有限公司 | 一种基于人工智能技术的大型体育赛事内容管理系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100023482A1 (en) * | 2007-04-17 | 2010-01-28 | Jeffrey David Mershon | Systems and methods for the management of information to enable the rapid dissemination of actionable information |
CN101719135A (zh) * | 2009-11-18 | 2010-06-02 | 上海众恒信息产业有限公司 | 一种政务资源目录控制系统及方法 |
CN102799684A (zh) * | 2012-07-27 | 2012-11-28 | 成都索贝数码科技股份有限公司 | 一种视音频文件编目标引、元数据存储索引与搜索方法 |
-
2014
- 2014-04-09 CN CN201410140197.9A patent/CN103995826A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100023482A1 (en) * | 2007-04-17 | 2010-01-28 | Jeffrey David Mershon | Systems and methods for the management of information to enable the rapid dissemination of actionable information |
CN101719135A (zh) * | 2009-11-18 | 2010-06-02 | 上海众恒信息产业有限公司 | 一种政务资源目录控制系统及方法 |
CN102799684A (zh) * | 2012-07-27 | 2012-11-28 | 成都索贝数码科技股份有限公司 | 一种视音频文件编目标引、元数据存储索引与搜索方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105468614A (zh) * | 2014-09-01 | 2016-04-06 | 方正国际软件(北京)有限公司 | 一种编目的方法及装置 |
CN106294575A (zh) * | 2016-07-21 | 2017-01-04 | 国家林业局调查规划设计院 | 一种基于Lucene的林地图斑矢量数据查询方法 |
CN106294575B (zh) * | 2016-07-21 | 2019-11-05 | 国家林业和草原局调查规划设计院 | 一种基于Lucene的林地图斑矢量数据查询方法 |
CN108228690A (zh) * | 2017-06-30 | 2018-06-29 | 勤智数码科技股份有限公司 | 一种目录管理系统及其管理方法 |
CN108509577A (zh) * | 2018-03-28 | 2018-09-07 | 上海数据交易中心有限公司 | 一种数据编目方法及装置 |
CN108509577B (zh) * | 2018-03-28 | 2023-07-14 | 上海数据交易中心有限公司 | 一种数据编目方法及装置 |
CN112291574A (zh) * | 2020-09-17 | 2021-01-29 | 上海东方传媒技术有限公司 | 一种基于人工智能技术的大型体育赛事内容管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102799684B (zh) | 一种视音频文件编目标引、元数据存储索引与搜索方法 | |
DE112020002228T5 (de) | Kognitive video- und audio-suchaggregation | |
CN106095749A (zh) | 一种基于深度学习的文本关键词提取方法 | |
CN103347167A (zh) | 一种基于分段的监控视频内容描述方法 | |
CN103995826A (zh) | 一种安全生产监督管理政务信息的自动编目方法 | |
US11216725B2 (en) | Data searching system and method | |
CN107145559A (zh) | 基于语义技术和游戏化的智能课堂知识管理平台及方法 | |
CN110489565B (zh) | 基于领域知识图谱本体中的对象根类型设计方法及系统 | |
CN106354860A (zh) | 基于标签集的信息资源自动贴标签并自动推送的方法 | |
Nývlt | The role of managing knowledge and information in BIM implementation processes in the Czech Republic | |
CN110795932A (zh) | 基于地质本体的地质报告文本信息提取方法 | |
Khatoon et al. | Social media-based intelligence for disaster response and management in smart cities | |
CN104820711A (zh) | 复杂场景下对人形目标的视频检索方法 | |
CN109885693A (zh) | 基于知识图谱的快速知识对比方法及系统 | |
Rosanensi et al. | Analysis sentiment and tourist response to rinjani mountain tour based on comments from photo upload in instagram | |
CN103473275A (zh) | 一种采用多特征融合的图像自动标注方法和系统 | |
CN103530405A (zh) | 一种基于分层结构的图像检索方法 | |
Autelitano et al. | Spatio-temporal mining of keywords for social media cross-social crawling of emergency events | |
CN103823868B (zh) | 一种面向在线百科的事件识别方法和事件关系抽取方法 | |
CN111897947A (zh) | 一种基于开源信息的数据分析处理方法及装置 | |
CN105468741A (zh) | 一种警务大数据处理系统 | |
CN105354280A (zh) | 一种基于社会媒体平台的社会事件的跟踪和演变方法 | |
Cheng et al. | Process and application of data mining in the university library | |
Paolanti et al. | Deep convolutional neural networks for sentiment analysis of cultural heritage | |
CN112363996B (zh) | 用于建立电网知识图谱的物理模型的方法及系统和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 310023 2 floor, seat B, No. 168, Wuchang Avenue, Yuhang District, Hangzhou, Zhejiang Applicant after: ZHEJIANG IOPINFO TECHNOLOGY CO., LTD. Address before: 310023, B building, No. 168, Wuchang Road, Wuchang Street, Yuhang District, Zhejiang, Hangzhou, 2 Applicant before: Zhejiang Topinfo Technology Co., Ltd. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140820 |
|
RJ01 | Rejection of invention patent application after publication |