CN112911003B - 电子数据提取方法、计算机设备和存储介质 - Google Patents

电子数据提取方法、计算机设备和存储介质 Download PDF

Info

Publication number
CN112911003B
CN112911003B CN202110148751.8A CN202110148751A CN112911003B CN 112911003 B CN112911003 B CN 112911003B CN 202110148751 A CN202110148751 A CN 202110148751A CN 112911003 B CN112911003 B CN 112911003B
Authority
CN
China
Prior art keywords
data
information
electronic data
electronic
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110148751.8A
Other languages
English (en)
Other versions
CN112911003A (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Higovnet Technology Co ltd
Original Assignee
Higovnet Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Higovnet Technology Co ltd filed Critical Higovnet Technology Co ltd
Priority to CN202110148751.8A priority Critical patent/CN112911003B/zh
Publication of CN112911003A publication Critical patent/CN112911003A/zh
Application granted granted Critical
Publication of CN112911003B publication Critical patent/CN112911003B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/34Network arrangements or protocols for supporting network services or applications involving the movement of software or configuration parameters 

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Facsimiles In General (AREA)

Abstract

本申请涉及一种电子数据提取方法、装置、计算机设备和存储介质,所述方法包括:识别处于同一局域网的被采集设备,与被采集设备建立通讯连接;接收被采集设备发送的数据信息;识别数据信息的信息类别,根据信息类别读取数据记录模板;从数据信息中提取电子数据,将电子数据写入数据记录模板,得到电子数据文档。上述方法能够实现在对被采集设备进行电子数据采集时避免被采集设备中隐私信息的泄露,提高电子数据采集过程的数据安全性。

Description

电子数据提取方法、计算机设备和存储介质
技术领域
本申请涉及电子数据技术领域,特别是涉及一种电子数据提取方法、装置、计算机设备和存储介质。
背景技术
现有电子数据的提取方式,要么需要对被采集设备接上数据线,通过是数据线的方式对被采集设备进行电子数据的提取。要么需要在被采集设备上安装插件,通过插件的方式提取被采集设备上的电子数据。
在最近几年爆发的涉网案件中,已无传统的“案发现场”。此类案件的“案发现场”存在于受害者的手机上,现场勘查就是对受害者所使用的电子设备的涉网相关信息进行电子数据的采集。在此电子数据的采集过程中,还需要充分保障受害者的隐私。采用上述现有的电子数据的提取方式不利于保障存在于受害者的电子设备上的隐私信息,容易导致受害者的电子设备上的隐私信息的泄露。
发明内容
基于此,有必要针对上述技术问题,提供一种电子数据提取方法、装置、计算机设备和存储介质,以实现在对被采集设备进行电子数据采集时避免被采集设备中隐私信息的泄露,提高电子数据采集过程的数据安全性。
一种电子数据提取方法,该方法包括:识别处于同一局域网的被采集设备,与被采集设备建立通讯连接;接收被采集设备发送的数据信息;识别数据信息的信息类别,根据信息类别读取数据记录模板;从数据信息中提取电子数据,将电子数据写入数据记录模板,得到电子数据文档。
在其中一个实施例中,与被采集设备建立通讯连接,包括:生成识别码,识别码中包含第一身份识别信息;接收被采集设备发送的通讯连接请求,通讯连接请求携带第二身份识别信息;当第一身份识别信息和第二身份识别信息匹配时,与被采集设备建立通讯连接。
在其中一个实施例中,接收被采集设备发送的数据信息,包括:接收被采集设备中第一客户端发送的数据信息,数据信息为第一客户端进行数据通信时产生的信息或数据信息为被采集设备中第二客户端进行数据通信时产生的信息,第一客户端和第二客户端不同;优选地,从数据信息中提取电子数据,包括:当数据信息包括结构化数据时,从数据信息中提取结构化数据作为电子数据;当数据信息包括非结构化数据时,识别非结构化数据的格式,若根据非结构化数据的格式确定非结构化数据为图片格式的数据,则采用光学识别技术对非结构化数据进行数据识别,以将非结构化数据转换为对应的结构化数据,将数据识别结果作为电子数据。
在其中一个实施例中,接收被采集设备发送的数据信息,包括:接收被采集设备通过无线投屏发送的屏幕信息;对屏幕信息进行截屏或者录屏操作,得到数据信息;从数据信息中提取电子数据,包括:采用光学识别技术对从数据信息中提取电子数据。
在其中一个实施例中,一种电子数据提取方法还包括:若检测到未与被采集设备建立通讯连接,通过摄像的方式获取被采集设备的数据信息。
在其中一个实施例中,一种电子数据提取方法还包括:获取目标案件的案件信息以及与目标案件相关的人员信息;将电子数据文档与案件信息以及人员信息进行关联。
在其中一个实施例中,数据信息为多个;识别数据信息的信息类别,根据信息类别读取数据记录模板,从数据信息中提取电子数据,将电子数据写入数据记录模板,得到电子数据文档,包括:分别识别各所述数据信息的信息类别,根据各信息类别读取各数据记录模板;从各数据信息中提取各电子数据,将各电子数据写入对应的数据记录模板,得到多个电子数据文档,各电子数据文档分别与案件信息以及人员信息进行关联;一种电子数据提取方法还包括:获取目标案件的报告格式,根据报告格式将各电子数据文档进行汇总,得到目标案件的报告;和/或,从多个电子数据文档中识别出用于作为笔录的目标电子数据文档;接收目标电子数据文档的电子签名信息,根据电子签名信息生成目标电子数据文档的电子签名。
一种电子数据提取装置,该装置包括:通讯模块,用于识别处于同一局域网的被采集设备,与被采集设备建立通讯连接;接收模块,用于接收被采集设备发送的数据信息;读取模块,用于识别数据信息的信息类别,根据信息类别读取数据记录模板;提取模块,用于从数据信息中提取电子数据,将电子数据写入数据记录模板,得到电子数据文档。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一实施例方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例方法的步骤。
上述电子数据提取方法、装置、计算机设备和存储介质,采集设备识别处于同一局域网的被采集设备,与被采集设备建立通讯连接,接收被采集设备发送的数据信息。进一步地,识别数据信息的信息类别,根据信息类别读取数据记录模板,从数据信息中提取电子数据,将电子数据写入数据记录模板,得到电子数据文档。因此,采用同一局域网进行端对端的通讯连接的方式接收被采集设备发送的数据信息,可以提高数据信息传输的安全性。此外,由被采集设备选取发送的数据信息,主动将数据信息发送到采集设备中,避免在被采集设备中植入插件或者通过数据线的方式进行电子数据提取时造成的隐私信息的泄露。进一步地,从数据信息中提取电子数据,将电子数据写入对应的数据记录模板,从而实现自动化生成电子数据的电子数据文档,提高电子数据的管理效率。
附图说明
图1为一个实施例中一种电子数据提取方法的应用环境图;
图2为一个实施例中一种电子数据提取方法的流程示意图;
图3为一个实施例中一种电子数据提取方法的操作流程图;
图4为一个实施例中一种电子数据提取方法对于结构化数据的提取的操作流程图;
图5为一个实施例中一种电子数据提取方法对于非结构化数据的提取的操作流程图;
图6为一个实施例中一种电子数据提取装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供一种电子数据提取方法,应用于如图1所示的应用环境中。如图1所示,被采集设备102用于提供被采集的电子数据。采集设备104用于执行本申请的一种电子数据提取方法,以从被采集设备102中提取电子数据。具体地,采集设备104识别处于同一局域网的被采集设备102,与被采集设备102建立通讯连接。进一步地,采集设备104接收被采集设备102发送的数据信息,识别数据信息的信息类别,根据信息类别读取数据记录模板,从数据信息中提取电子数据,将电子数据写入数据记录模板,得到电子数据文档。因此,采集设备104完成了电子数据的提取,实现对被采集设备102的电子数据的采集。其中,被采集设备102可以是移动终端设备,如手机、平板电脑等。采集设备104可以是笔记本电脑、台式电脑、平板电脑等。
在一个实施例中,如图2所示,提供了一种电子数据提取方法,以该方法应用于图1中的采集设备104为例进行说明,包括以下步骤:
S202,识别处于同一局域网的被采集设备,与被采集设备建立通讯连接。
在本实施例中,在电子数据采集之前,采集设备和被采集设备连接到同一局域网中。如连接到同一WiFi热点。WiFi热点:行动热点,用于将可连接网络设备以无线方式互相连接。处于同一局域网的被采集设备和采集设备可以相互直接通讯。因此,当采集设备识别到处于同一局域网的被采集设备时,与被采集设备建立通讯连接。与被采集设备通讯连接后,被采集设备可以直接向采集设备发送数据信息。其中,被采集设备可以是手机或平板电脑。
当采集设备采用同一局域网进行端对端的通讯连接的方式接收被采集设备发送的数据信息,可以提高数据信息传输的安全性。此外,被采集设备与采集设备之间直接通过局域网进行数据传输,需要的流量较少,并且在数据传输过程还可以不受网速影响。
S204,接收被采集设备发送的数据信息。
在本实施例中,被采集设备向采集设备发送数据信息。其中,数据信息内包含结构化数据和/或非结构化数据。例如,数据信息包括文字信息、语音信息、图片信息、视频信息及其他附件信息。如,其他附件信息为PDF文件信息等。被采集设备可以通过客户端的方式向采集设备发送数据信息。客户端可以是即时通讯客户端,也可以是浏览器客户端。
在一实现方式中,被采集设备通过即时通讯客户端向采集设备发送数据信息。如,即时通讯客户端能够实现局域网中的选择备份功能,采用该功能协议可实现将被采集设备中的数据信息发送到采集设备,从而实现电子数据的采集。
S206,识别数据信息的信息类别,根据信息类别读取数据记录模板。
在本实施例中,采集设备接收到数据信息时,对数据信息的信息类型进行识别。当确定出数据信息的信息类别时,根据信息类别读取数据记录模板。具体地,采集设备中预先存储有多个数据记录模板,各数据记录模板与对应的信息类别关联。当确定出数据信息的信息类别时,可根据信息类别读取出对应的数据记录模板。其中,数据信息的信息类别可以是涉嫌犯罪案件的笔录的各种信息类别,不同的信息类别对应不同的数据记录模板。数据记录模板中预先设置了记录电子数据的各种格式,以便于将电子数据按照对应的格式写入数据记录模板中。
S208,从数据信息中提取电子数据,将电子数据写入数据记录模板,得到电子数据文档。
在本实施例中,采集设备接收到数据信息后,从数据信息中提取对应的电子数据。提取的方式可以是:识别数据信息中各数据信息的信息格式,根据信息格式确定数据提取的提取方式,按照提取方式从数据信息中提取电子数据。如:数据信息包含图片格式的信息,确定数据提取的方式为光学识别技术的提取方式,按照光学识别技术从数据信息的图片格式的信息中提取电子数据。再如:数据信息包含文字格式的信息,确定数据提取的方式为文字识别技术的提取方式,按照文字识别技术从数据信息的文字格式的信息中提取电子数据。进一步地,将得到的电子数据写入数据记录模板,得到电子数据文档。因此,可实现自动化生成电子数据的电子数据文档,提供电子数据的管理效率。
上述电子数据提取方法,采集设备识别处于同一局域网的被采集设备,与被采集设备建立通讯连接,接收被采集设备发送的数据信息。进一步地,识别数据信息的信息类别,根据信息类别读取数据记录模板,从数据信息中提取电子数据,将电子数据写入数据记录模板,得到电子数据文档。因此,采用同一局域网进行端对端的通讯连接的方式接收被采集设备发送的数据信息,可以提高数据信息传输的安全性。此外,由被采集设备选取发送的数据信息,主动将数据信息发送到采集设备中,避免在被采集设备中植入插件或者通过数据线的方式进行电子数据提取时造成的隐私信息的泄露。进一步地,从数据信息中提取电子数据,将电子数据写入对应的数据记录模板,从而实现自动化生成电子数据的电子数据文档,提高电子数据的管理效率。
在一实施例中,上述与被采集设备建立通讯连接的步骤,包括:生成识别码,识别码中包含第一身份识别信息;接收被采集设备发送的通讯连接请求,通讯连接请求携带第二身份识别信息;当第一身份识别信息和第二身份识别信息匹配时,与被采集设备建立通讯连接。
在该实施例中,采集设备上生成识别码,识别码中设置有第一身份识别信息。第一身份识别信息用于识别接入采集设备的被采集设备的身份识别。具体地,识别码可以是二维码。进一步地,采集设备在屏幕上显示识别码,以便于被采集设备扫描识别码,从识别码中获取第一身份识别信息。进而,被采集设备向采集设备发送通讯连接请求,通讯连接请求携带第二身份识别信息。其中,第二身份识别信息可以是被采集设备扫描识别码获得的第一身份识别信息。采集设备将第二身份识别信息和第一身份识别信息进行匹配识别。当第二身份识别信息和第一身份识别信息匹配成功时,采集设备与被采集设备建立通讯连接。因此,可提高电子数据采集时,采集设备与被采集设备之间通讯的安全性。
举例说明:当需要提取常用的即时通讯APP(应用程序)的电子数据时,如聊天APP,采集设备上生成二维码,用户操作手机上的即时通讯APP以扫描二维码,进而将用户的手机连接上采集设备。
在一实施例中,上述接收被采集设备发送的数据信息的步骤,包括:接收被采集设备中第一客户端发送的数据信息,数据信息为第一客户端进行数据通信时产生的信息或数据信息为被采集设备中第二客户端进行数据通信时产生的信息,第一客户端和第二客户端不同。优选地,上述从数据信息中提取电子数据的步骤,包括:当数据信息包括结构化数据时,从数据信息中提取结构化数据作为电子数据;当数据信息包括非结构化数据时,识别非结构化数据的格式,若根据非结构化数据的格式确定非结构化数据为图片格式的数据,则采用光学识别技术对非结构化数据进行数据识别,以将非结构化数据转换为对应的结构化数据,将数据识别结果作为电子数据。
在该实施例中,被采集设备通过第一客户端发送数据信息。第一客户端为即时通讯客户端或浏览器客户端。当第一客户端为即时通讯客户端时,数据信息为该即时通讯客户端进行数据通信时产生的信息。例如,该即时通讯客户端为聊天软件客户端,数据信息包括用户通过聊天软件客户端接收和发送的文字信息、语音信息、视频信息以及图片信息等。如,即时通讯客户端为微信客户端、QQ客户端或陌陌客户端等。还可以是,数据信息为第二客户端进行数据通信时产生的信息。第二客户端也为即时通讯客户端。也即是,第一客户端用于发送来源于第二客户端的数据信息。第二客户端的数据信息可以包括文字信息、语音信息、视频信息以及图片信息等。此外,还可以是,第一客户端为浏览器客户端时,第二客户端为即时通讯客户端。数据信息来源于即时通讯客户端进行数据通信时产生的信息。例如,用户通过被采集设备上的浏览器客户端扫描采集设备提供的识别码,以连接采集设备,并进入采集设备提供的数据采集网页。进一步地,通过浏览器客户端将即时通讯客户端产生的数据信息发送到采集设备。因此,扩展了数据信息采集的渠道。
另外,数据信息可以包括结构化数据和非结构化数据。如,结构化数据包括文字。非结构化数据包括图片、语音、视频等。当被采集设备采用第一客户端发送数据信息且数据信息来源于第一客户端时,此时第一客户端可直接提取本客户端中的结构化数据和非结构化数据作为数据信息。当被采集设备采用第一客户端发送数据信息且数据信息来源于第二客户端时,第一客户端无法提取第二客户端内的结构化数据,可采用截图的方式采集第二客户端内的结构化数据,此时采集到的第二客户端内的结构化数据变为非结构化数据。因此,针对被采集设备发送的数据信息,采用两种数据提取的方式对电子数据进行提取。
具体地,当数据信息包括结构化数据时,从数据信息中提取结构化数据作为电子数据。也即是,电子数据为结构化的电子数据,从数据信息中提取结构化数据作为电子数据即可。当数据信息包括非结构化数据时,识别非结构化数据的格式。若根据非结构化数据的格式确定出数据信息中包含图片,可采用光学识别技术提取图片中的文字,将提取到的文字作为电子数据。进一步地,若根据非结构化数据的格式确定出数据信息中包含语音,可使用语音识别技术提取语音中的文字,将提取到的文字作为电子数据。因此,可实现数据信息中的电子数据的提取。
举例说明:从即时通讯应用程序中提取到的是结构化数据,但其他涉诈应用程序由于生命周期较短,无法快速实现结构化数据的提取。在真实应用场景中一般采用截屏、拍照的方式提取涉诈应用程序的结构化数据作为证据,此部分采集设备通过OCR(光学识别技术)识别,可将图片的证据进行结构化转换,为进一步的数据分析应用和案件侦查提供数据支撑。
在一实施例中,上述接收被采集设备发送的数据信息的步骤,包括:接收被采集设备通过无线投屏发送的屏幕信息;对屏幕信息进行截屏或者录屏操作,得到数据信息。上述从数据信息中提取电子数据的步骤,包括:采用光学识别技术对从数据信息中提取电子数据。
在该实施例中,被采集设备还可以采用投屏的方式将数据信息发送到采集设备。当采集设备接收到被采集设备通过无线投屏发送的屏幕信息时,执行截屏或录屏操作,得到的截屏信息或录屏信息作为数据信息。此时,采用光学识别技术从截屏信息或录屏信息中提取电子数据。因此,扩展了电子数据采集的渠道。
例如,无法从部分应用程序的数据中提取结构化数据,需要通过截屏的方式获取电子数据。具体地,利用无线投屏,将手机屏幕投屏到采集设备上,然后在采集设备上进行截屏,以达到无线截屏的目的。进而,从无线截屏中提取电子数据。
在一实施例中,上述接收被采集设备发送的数据信息的步骤之前,还包括:若检测到未与被采集设备建立通讯连接,通过摄像的方式获取被采集设备的数据信息。
具体地,若无法与被采集设备进行通讯连接,则可采用摄像的方式获取被采集设备的数据信息。例如,采集设备为具备摄像头的支持一体化设备,通过摄像头拍照或摄影的方式获取被采集设备上的数据信息。因此,可扩展数据信息采集的渠道。
在一实施例中,上述将电子数据写入数据记录模板,得到电子数据文档的步骤之后,还包括:获取目标案件的案件信息以及与目标案件相关的人员信息;将电子数据文档与案件信息以及人员信息进行关联。
在该实施例中,提取的电子数据为目标案件的记录数据。目标案件可以为涉嫌犯罪的案件。被采集设备为用户的手机。采集设备用于采集用户的手机的数据信息。通过用户的手机的数据信息可以分析出涉嫌犯罪的案件情况。因此,操作人员可以在采集设备中输入目标案件的案件信息。如案件信息包括目标案件的案件名称、案件发生的时间和地点、以及案件的简要描述等。操作人员可以在采集设备中输入与目标案件相关的人员信息。例如,目标案件涉及的人员信息。最终,采集设备将电子数据文档与案件信息以及人员信息进行关联,从而实现了自动化从被采集设备中提取电子数据,并自动化地将电子数据归集到对应的目标案件中,以完成自动化地采集目标案件的电子数据。
进一步地,数据信息为多个,上述识别数据信息的信息类别,根据信息类别读取数据记录模板,从数据信息中提取电子数据,将电子数据写入数据记录模板,得到电子数据文档的步骤,包括:分别识别各数据信息的信息类别,根据各信息类别读取各数据记录模板;从各数据信息中提取各电子数据,将各电子数据写入对应的数据记录模板,得到多个电子数据文档,各电子数据文档分别与案件信息以及人员信息进行关联。此外,上述各电子数据文档分别与案件信息以及人员信息进行关联的步骤之后,还包括:获取目标案件的报告格式,根据报告格式将各电子数据文档进行汇总,得到目标案件的报告;和/或,从多个电子数据文档中识别出用于作为笔录的目标电子数据文档;接收目标电子数据文档的电子签名信息,根据电子签名信息生成目标电子数据文档的电子签名。
具体地,被采集设备将多个数据信息发送到采集设备中。采集设备根据各数据信息的信息类别读取各数据记录模板,将各数据信息的电子数据写入对应的数据记录模板,得到多个电子数据文档。进而,获取目标案件的报告格式。按照目标案件的报告格式将多个电子数据文档进行汇总处理,自动化生成目标案件的报告。此外,还可以识别出用于作为笔录的目标电子数据文档,并将目标电子数据文档进行展示。通过展示界面接收用户输入的目标电子数据文档的电子签名信息,以生成目标电子数据文档的电子签名。因此,实现对电子数据文档的笔录操作。
以下提供一具体实施场景中,以详细说明上述一种电子数据提取方法。
参见图3所示的操作流程图。首先,操作人员在被采集设备上填写目标案件的案件信息以及涉及的人员信息。进而,将采集设备与被采集的手机连接到同一WiFi。在采集设备上生成二维码,通过二维码识别被采集的手机的身份信息。手机扫码后,提取手机中的结构化数据和非结构化数据,进而通过无线方式向采集设备上传结构化数据和非结构化数据。被采集设备根据结构化数据和非结构化数据生成目标案件的报告和笔录。对于生成的笔录,进一步接收电子签名,将电子签名写入到笔录中,以实现自动化完成笔录操作。
其中,对于结构化数据的提取,参见图4所示。采集设备上显示二维码,二维码用于对手机身份信息进行识别。当用户通过手机APP扫描二维码时,采集设备对手机进行授权。用户操作手机,选择手机中提取的结构化数据,并将结构化数据发送到采集设备。采集设备将提取到的结构化的电子数据进行展示。
其中,对于非结构化数据的文件的提取,参见图5所示。采集设备上显示二维码,用户操作手机浏览器以扫描二维码。用户操作手机,选择要上传的文件并向采集设备发送文件。采集设备对文件中的数据进行提取。提取的方式包括语音分离以及OCR识别。因此,采集设备提取到用户的手机上的非结构化数据,并对非结构化数据进行展示。
通过上述各个实施例的一种电子数据提取方法,可满足当前新型涉网案件受害者手机的新型电子数据提取业务的需求,电子数据提取过程无需使用数据线连接受害者手机,也无需在受害者手机上安装任何插件,即可实现真正无痕且由受害者控制的可见的电子数据采集。
应该理解的是,虽然流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,附图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本申请还提供一种电子数据提取装置,如图6所示,该装置包括通讯模块62、接收模块64、读取模块66以及提取模块68。通讯模块62,用于识别处于同一局域网的被采集设备,与被采集设备建立通讯连接;接收模块64,用于接收被采集设备发送的数据信息;读取模块66,用于识别数据信息的信息类别,根据信息类别读取数据记录模板;提取模块68,用于从数据信息中提取电子数据,将电子数据写入数据记录模板,得到电子数据文档。
在其中一个实施例中,通讯模块62具体用于生成识别码,识别码中包含第一身份识别信息;接收被采集设备发送的通讯连接请求,通讯连接请求携带第二身份识别信息;当第一身份识别信息和第二身份识别信息匹配时,与被采集设备建立通讯连接。
在其中一个实施例中,接收模块64具体用于接收被采集设备中第一客户端发送的数据信息,数据信息为第一客户端进行数据通信时产生的信息或数据信息为被采集设备中第二客户端进行数据通信时产生的信息,第一客户端和所述第二客户端不同;优选地,从数据信息中提取电子数据,包括:当数据信息包括结构化数据时,从数据信息中提取结构化数据作为电子数据;当数据信息包括非结构化数据时,识别非结构化数据的格式,若根据非结构化数据的格式确定非结构化数据为图片格式的数据,则采用光学识别技术对非结构化数据进行数据识别,以将非结构化数据转换为对应的结构化数据,将数据识别结果作为电子数据。
在其中一个实施例中,接收模块64具体还用于接收被采集设备通过无线投屏发送的屏幕信息;对屏幕信息进行截屏或者录屏操作,得到数据信息;提取模块68具体用于采用光学识别技术对从数据信息中提取电子数据。
在其中一个实施例中,一种电子数据提取装置还包括获取模块,用于若检测到未与被采集设备建立通讯连接,通过摄像的方式获取被采集设备的数据信息。
在其中一个实施例中,一种电子数据提取装置还包括关联模块,用于获取目标案件的案件信息以及与目标案件相关的人员信息;将电子数据文档与案件信息以及人员信息进行关联。
在其中一个实施例中,数据信息为多个。识别数据信息的信息类别,根据信息类别读取数据记录模板,从数据信息中提取电子数据,将电子数据写入数据记录模板,得到电子数据文档,包括:分别识别各数据信息的信息类别,根据各信息类别读取各数据记录模板;从各数据信息中提取各电子数据,将各电子数据写入对应的数据记录模板,得到多个电子数据文档,各电子数据文档分别与案件信息以及人员信息进行关联。此时,一种电子数据提取装置还包括处理模块,用于获取目标案件的报告格式,根据报告格式将各电子数据文档进行汇总,得到目标案件的报告;和/或,从多个电子数据文档中识别出用于作为笔录的目标电子数据文档;接收目标电子数据文档的电子签名信息,根据电子签名信息生成目标电子数据文档的电子签名。
关于一种电子数据提取装置的具体限定可以参见上文中对于一种电子数据提取方法的限定,在此不再赘述。上述电子数据提取装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信,以与外部的终端进行数据交互。该计算机程序被处理器执行时以实现一种电子数据提取方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:识别处于同一局域网的被采集设备,与被采集设备建立通讯连接;接收被采集设备发送的数据信息;识别数据信息的信息类别,根据信息类别读取数据记录模板;从数据信息中提取电子数据,将电子数据写入数据记录模板,得到电子数据文档。
在其中一个实施例中,处理器执行计算机程序实现上述的与被采集设备建立通讯连接的步骤时,具体实现以下步骤:生成识别码,识别码中包含第一身份识别信息;接收被采集设备发送的通讯连接请求,通讯连接请求携带第二身份识别信息;当第一身份识别信息和第二身份识别信息匹配时,与被采集设备建立通讯连接。
在其中一个实施例中,处理器执行计算机程序实现上述的接收被采集设备发送的数据信息的步骤时,具体实现以下步骤:接收被采集设备中第一客户端发送的数据信息,数据信息为第一客户端进行数据通信时产生的信息或数据信息为被采集设备中第二客户端进行数据通信时产生的信息,第一客户端和所述第二客户端不同。
优选地,从数据信息中提取电子数据,包括:当数据信息包括结构化数据时,从数据信息中提取结构化数据作为电子数据;当数据信息包括非结构化数据时,识别非结构化数据的格式,若根据非结构化数据的格式确定非结构化数据为图片格式的数据,则采用光学识别技术对非结构化数据进行数据识别,以将非结构化数据转换为对应的结构化数据,将数据识别结果作为电子数据。
在其中一个实施例中,处理器执行计算机程序实现上述的接收被采集设备发送的数据信息的步骤时,具体实现以下步骤:接收被采集设备通过无线投屏发送的屏幕信息;对屏幕信息进行截屏或者录屏操作,得到数据信息。处理器执行计算机程序实现上述的从数据信息中提取电子数据的步骤时,具体实现以下步骤:采用光学识别技术对从数据信息中提取电子数据。
在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:若检测到未与被采集设备建立通讯连接,通过摄像的方式获取被采集设备的数据信息。
在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:获取目标案件的案件信息以及与目标案件相关的人员信息;将电子数据文档与案件信息以及人员信息进行关联。
在其中一个实施例中,数据信息为多个,处理器执行计算机程序实现上述的识别数据信息的信息类别,根据信息类别读取数据记录模板,从数据信息中提取电子数据,将电子数据写入数据记录模板,得到电子数据文档的步骤时,具体实现以下步骤:分别识别各数据信息的信息类别,根据各信息类别读取各数据记录模板;从各数据信息中提取各电子数据,将各电子数据写入对应的数据记录模板,得到多个电子数据文档,各电子数据文档分别与案件信息以及人员信息进行关联。处理器执行计算机程序时还实现以下步骤:获取目标案件的报告格式,根据报告格式将各电子数据文档进行汇总,得到目标案件的报告;和/或,从多个电子数据文档中识别出用于作为笔录的目标电子数据文档;接收目标电子数据文档的电子签名信息,根据电子签名信息生成目标电子数据文档的电子签名。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:识别处于同一局域网的被采集设备,与被采集设备建立通讯连接;接收被采集设备发送的数据信息;识别数据信息的信息类别,根据信息类别读取数据记录模板;从数据信息中提取电子数据,将电子数据写入数据记录模板,得到电子数据文档。
在其中一个实施例中,计算机程序被处理器执行实现上述的与被采集设备建立通讯连接的步骤时,具体实现以下步骤:生成识别码,识别码中包含第一身份识别信息;接收被采集设备发送的通讯连接请求,通讯连接请求携带第二身份识别信息;当第一身份识别信息和第二身份识别信息匹配时,与被采集设备建立通讯连接。
在其中一个实施例中,计算机程序被处理器执行实现上述的接收被采集设备发送的数据信息的步骤时,具体实现以下步骤:接收被采集设备中第一客户端发送的数据信息,数据信息为第一客户端进行数据通信时产生的信息或数据信息为被采集设备中第二客户端进行数据通信时产生的信息,第一客户端和所述第二客户端不同。
优选地,从数据信息中提取电子数据,包括:当数据信息包括结构化数据时,从数据信息中提取结构化数据作为电子数据;当数据信息包括非结构化数据时,识别非结构化数据的格式,若根据非结构化数据的格式确定非结构化数据为图片格式的数据,则采用光学识别技术对非结构化数据进行数据识别,以将非结构化数据转换为对应的结构化数据,将数据识别结果作为电子数据。
在其中一个实施例中,计算机程序被处理器执行实现上述的接收被采集设备发送的数据信息的步骤时,具体实现以下步骤:接收被采集设备通过无线投屏发送的屏幕信息;对屏幕信息进行截屏或者录屏操作,得到数据信息。计算机程序被处理器执行实现上述的从数据信息中提取电子数据的步骤时,具体实现以下步骤:采用光学识别技术对从数据信息中提取电子数据。
在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:若检测到未与被采集设备建立通讯连接,通过摄像的方式获取被采集设备的数据信息。
在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取目标案件的案件信息以及与目标案件相关的人员信息;将电子数据文档与案件信息以及人员信息进行关联。
在其中一个实施例中,数据信息为多个,计算机程序被处理器执行实现上述的识别数据信息的信息类别,根据信息类别读取数据记录模板,从数据信息中提取电子数据,将电子数据写入数据记录模板,得到电子数据文档的步骤时,具体实现以下步骤:分别识别各数据信息的信息类别,根据各信息类别读取各数据记录模板;从各数据信息中提取各电子数据,将各电子数据写入对应的数据记录模板,得到多个电子数据文档,各电子数据文档分别与案件信息以及人员信息进行关联。计算机程序被处理器执行时还实现以下步骤:获取目标案件的报告格式,根据报告格式将各电子数据文档进行汇总,得到目标案件的报告;和/或,从多个电子数据文档中识别出用于作为笔录的目标电子数据文档;接收目标电子数据文档的电子签名信息,根据电子签名信息生成目标电子数据文档的电子签名。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种电子数据提取方法,所述方法包括:
识别处于同一局域网的被采集设备,与所述被采集设备建立通讯连接;
接收所述被采集设备发送的数据信息;
识别所述数据信息的信息类别,根据所述信息类别读取数据记录模板;
从所述数据信息中提取电子数据,将所述电子数据写入所述数据记录模板,得到电子数据文档;
获取目标案件的案件信息以及与所述目标案件相关的人员信息;
将所述电子数据文档与所述案件信息以及所述人员信息进行关联;
其中,所述数据信息为多个,所述识别所述数据信息的信息类别,根据所述信息类别读取数据记录模板,从所述数据信息中提取电子数据,将所述电子数据写入所述数据记录模板,得到电子数据文档,包括:
分别识别各所述数据信息的信息类别,根据各信息类别读取各数据记录模板;
从各所述数据信息中提取各电子数据,将各电子数据写入对应的数据记录模板,得到多个电子数据文档,各电子数据文档分别与所述案件信息以及所述人员信息进行关联;
所述方法还包括:
获取所述目标案件的报告格式,根据所述报告格式将各电子数据文档进行汇总,得到所述目标案件的报告;
和/或,
从多个电子数据文档中识别出用于作为笔录的目标电子数据文档;
接收所述目标电子数据文档的电子签名信息,根据所述电子签名信息生成所述目标电子数据文档的电子签名。
2.根据权利要求1所述的方法,其特征在于,所述与所述被采集设备建立通讯连接,包括:
生成识别码,所述识别码中包含第一身份识别信息;
接收所述被采集设备发送的通讯连接请求,所述通讯连接请求携带第二身份识别信息;
当所述第一身份识别信息和所述第二身份识别信息匹配时,与所述被采集设备建立通讯连接。
3.根据权利要求1所述的方法,其特征在于,所述接收所述被采集设备发送的数据信息,包括:
接收所述被采集设备中第一客户端发送的数据信息,所述数据信息为所述第一客户端进行数据通信时产生的信息或所述数据信息为所述被采集设备中第二客户端进行数据通信时产生的信息,所述第一客户端和所述第二客户端不同。
4.根据权利要求1所述的方法,其特征在于,所述从所述数据信息中提取电子数据,包括:
当所述数据信息包括结构化数据时,从所述数据信息中提取结构化数据作为所述电子数据;
当所述数据信息包括非结构化数据时,识别所述非结构化数据的格式,若根据所述非结构化数据的格式确定所述非结构化数据为图片格式的数据,则采用光学识别技术对所述非结构化数据进行数据识别,以将所述非结构化数据转换为对应的结构化数据,将数据识别结果作为所述电子数据。
5.根据权利要求1所述的方法,其特征在于,所述接收所述被采集设备发送的数据信息,包括:
接收所述被采集设备通过无线投屏发送的屏幕信息;
对所述屏幕信息进行截屏或者录屏操作,得到所述数据信息;
所述从所述数据信息中提取电子数据,包括:
采用光学识别技术对从所述数据信息中提取电子数据。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若检测到未与所述被采集设备建立通讯连接,通过摄像的方式获取所述被采集设备的所述数据信息。
7.一种电子数据提取装置,其特征在于,所述装置包括:
通讯模块,用于识别处于同一局域网的被采集设备,与所述被采集设备建立通讯连接;
接收模块,用于接收所述被采集设备发送的数据信息;
读取模块,用于识别所述数据信息的信息类别,根据所述信息类别读取数据记录模板;
提取模块,用于从所述数据信息中提取电子数据,将所述电子数据写入所述数据记录模板,得到电子数据文档;
关联模块,用于获取目标案件的案件信息以及与所述目标案件相关的人员信息,将所述电子数据文档与所述案件信息以及所述人员信息进行关联;
其中,所述数据信息为多个,所述识别所述数据信息的信息类别,根据所述信息类别读取数据记录模板,从所述数据信息中提取电子数据,将所述电子数据写入所述数据记录模板,得到电子数据文档,包括:
分别识别各所述数据信息的信息类别,根据各信息类别读取各数据记录模板;
从各所述数据信息中提取各电子数据,将各电子数据写入对应的数据记录模板,得到多个电子数据文档,各电子数据文档分别与所述案件信息以及所述人员信息进行关联;
所述装置还包括处理模块,所述处理模块用于获取所述目标案件的报告格式,根据所述报告格式将各电子数据文档进行汇总,得到所述目标案件的报告;和/或,从多个电子数据文档中识别出用于作为笔录的目标电子数据文档;接收所述目标电子数据文档的电子签名信息,根据所述电子签名信息生成所述目标电子数据文档的电子签名。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述方法的步骤。
CN202110148751.8A 2021-02-03 2021-02-03 电子数据提取方法、计算机设备和存储介质 Active CN112911003B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110148751.8A CN112911003B (zh) 2021-02-03 2021-02-03 电子数据提取方法、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110148751.8A CN112911003B (zh) 2021-02-03 2021-02-03 电子数据提取方法、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN112911003A CN112911003A (zh) 2021-06-04
CN112911003B true CN112911003B (zh) 2022-06-07

Family

ID=76121841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110148751.8A Active CN112911003B (zh) 2021-02-03 2021-02-03 电子数据提取方法、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112911003B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113495764B (zh) * 2021-09-06 2021-12-14 广州市高奈特网络科技有限公司 自动化数据提取方法、装置、计算机设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108831476A (zh) * 2018-05-31 2018-11-16 平安科技(深圳)有限公司 语音采集方法、装置、计算机设备及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1325408A2 (en) * 2000-10-06 2003-07-09 Ampex Corporation System and method for transferring data between recording devices
CN103761337B (zh) * 2014-02-18 2017-02-08 上海锦恩信息科技有限公司 非结构化数据处理方法及系统
CN104091224B (zh) * 2014-06-10 2017-12-29 东莞市麦蒂科技有限公司 一种生产线数据实时采集分析的系统和方法
CN104680213A (zh) * 2015-02-12 2015-06-03 无锡识凌科技有限公司 一种设备之间快速连接及数据传输的控制方法
CN108280359A (zh) * 2017-01-05 2018-07-13 珠海金山办公软件有限公司 一种安全文档的管理方法及服务器
CN107908745A (zh) * 2017-11-16 2018-04-13 理光图像技术(上海)有限公司 批量文档扫描整理装置、方法、介质及设备
CN108989322B (zh) * 2018-07-28 2022-02-25 南昌努比亚技术有限公司 数据传输方法、移动终端及计算机可读存储介质
CN111355771A (zh) * 2019-05-22 2020-06-30 鸿合科技股份有限公司 文件传输方法、装置、电子设备及存储介质
CN111159513A (zh) * 2020-04-04 2020-05-15 华软智科(深圳)技术有限公司 电子文档管理系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108831476A (zh) * 2018-05-31 2018-11-16 平安科技(深圳)有限公司 语音采集方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN112911003A (zh) 2021-06-04

Similar Documents

Publication Publication Date Title
TWI738659B (zh) 電子簽章通信期之驗證出處的系統及方法
CN111191532B (zh) 基于施工区域的人脸识别方法、装置、计算机设备
CN110099047B (zh) 注册信息处理方法、装置、计算机设备和存储介质
CN112394864B (zh) 信息采集方法、装置、计算机设备和存储介质
TW201516891A (zh) 一種訊息識別方法、相關裝置及其系統
US20180288040A1 (en) System and Method for Biometric Authentication-Based Electronic Notary Public
CN112911003B (zh) 电子数据提取方法、计算机设备和存储介质
CN110647641A (zh) 身份验证方法、装置、计算机设备和存储介质
CN110336791B (zh) 一种断点数据传输方法、装置、设备及计算机存储介质
CN113568934B (zh) 一种数据查询方法、装置、电子设备和存储介质
TW201909014A (zh) 指定條件之認證方法、指定條件之認證軟體、用於進行指定條件之認證的裝置及伺服器
CN110765869B (zh) 分渠道采集数据的唇语活体检测方法、系统和计算机设备
CN110795980A (zh) 基于网络视频的逃犯识别方法、设备、存储介质及装置
CN112419257A (zh) 文本录制视频清晰度检测方法、装置、计算机设备及存储介质
CN110781811A (zh) 异常工单识别方法、装置、可读存储介质和计算机设备
CN112367314B (zh) 身份认证的方法、装置、计算设备和介质
CN114677700A (zh) 身份标识的识别方法和装置、存储介质及电子设备
CN110958608B (zh) 无线网络连接方法、装置、存储介质和计算机设备
Chen et al. Forensic analysis of email on android volatile memory
CN108966154B (zh) 群发短信方法、装置、计算机设备和存储介质
CN109214224B (zh) 信息编码的风险识别方法和装置
CN106936975B (zh) 二维码识别方法、装置及移动终端
CN110858863A (zh) 利用加密图像提供预定义功能的系统及其实施方法
CN114124879B (zh) 多媒体文件分享方法、装置、终端设备和存储介质
CN114513583B (zh) 影像数据的压缩上传方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant