CN107273389A - 庭审录像的查询方法和装置 - Google Patents

庭审录像的查询方法和装置 Download PDF

Info

Publication number
CN107273389A
CN107273389A CN201610218357.6A CN201610218357A CN107273389A CN 107273389 A CN107273389 A CN 107273389A CN 201610218357 A CN201610218357 A CN 201610218357A CN 107273389 A CN107273389 A CN 107273389A
Authority
CN
China
Prior art keywords
trial
court
content
text
searched
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610218357.6A
Other languages
English (en)
Inventor
石鹏
范浩文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201610218357.6A priority Critical patent/CN107273389A/zh
Publication of CN107273389A publication Critical patent/CN107273389A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Abstract

本申请公开了一种庭审录像的查询方法和装置。其中,该方法包括:接收待搜索的文本内容;计算待搜索的文本内容与数据库中的庭审笔录之间的匹配度,其中,匹配度用于表示待搜索的文本内容与数据库中的庭审笔录之间的关联程度,数据库中的每一份庭审笔录对应一个庭审录像;利用匹配度选择庭审笔录对应的庭审录像;以及展示选择的庭审笔录对应的庭审录像。本申请解决了现有技术中查询庭审笔录时查询结果不精确的技术问题。

Description

庭审录像的查询方法和装置
技术领域
本申请涉及数据处理领域,具体而言,涉及一种庭审录像的查询方法和装置。
背景技术
用户需要在数据库中海量的庭审录像中查找出目标录像。如果用户知道目标录像的编号,那么从数据库中找出目标录像是非常容易的,只需要按照庭审录像的编号对庭审录像进行筛选即可。
但是,绝大多数的情况是,用户不知道目标录像的编号,仅仅知道目标录像的案由、时间、地域、涉案金额、当事人等信息,甚至用户连这些信息也不知道。
在现有技术中,用户根据时间、地域、法院等标签查询庭审录像,例如用户在表示时间的输入栏里输入“2005年6月”,在表示法院的输入栏里输入“广州白云山人民法院”,则可以从数据库中筛选出所有的2005年6月发生的、并且广州白云山人民法院审理的案件的庭审录像,但是对用户来说,这个范围仍然太大了,查询结果不精确。如果用户只知道目标案件是一起海上刑事犯罪,案件发生的时间、地域、审理案件的法院这些信息一概不知,那么用户使用现有技术的查询方法是无法查询的。
因此,使用现有技术查询庭审录像时存在查询结果不精确的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种庭审录像的查询方法和装置,以至少解决现有技术中查询庭审笔录时查询结果不精确的技术问题。
根据本申请实施例的一个方面,提供了一种庭审录像的查询方法,包括:接收待搜索的文本内容;计算所述待搜索的文本内容与数据库中的庭审笔录之间的匹配度,其中,所述匹配度用于表示所述待搜索的文本内容与数据库中的庭审笔录之间的关联程度,所述数据库中的每一份庭审笔录对应一个庭审录像;利用所述匹配度选择所述庭审笔录对应的庭审录像;以及展示选择的所述庭审笔录对应的庭审录像。
进一步地,在接收待搜索的文本内容之前,所述方法还包括:接收预设过滤条件;利用所述预设过滤条件对所述数据库中的庭审笔录进行过滤,得到第一庭审笔录;其中,计算所述待搜索的文本内容与数据库中的庭审笔录之间的匹配度包括:计算所述待搜索的文本内容与所述第一庭审笔录之间的匹配度。
进一步地,利用所述匹配度选择所述庭审笔录对应的庭审录像包括:筛选出与所述待搜索的文本内容之间的匹配度大于或者等于预设数值的庭审笔录对应的第二庭审录像;展示选择的所述庭审笔录对应的庭审录像包括:展示所述第二庭审录像。
进一步地,在展示所述第二庭审录像之前,所述方法还包括:按照所述第二庭审录像对应的庭审笔录与所述待搜索的文本内容之间的匹配度的大小顺序,对所述第二庭审录像进行排序,得到排序结果;展示所述第二庭审录像包括:按照所述排序结果的顺序展示所述第二庭审录像。
进一步地,在接收待搜索的文本内容之前,所述方法还包括:对所述数据库中的每一份庭审笔录进行分词,提取出每一份庭审笔录的关键内容;建立所述关键内容与庭审录像之间的对应关系,将所述关键内容存储至所述数据库,其中,计算所述待搜索的文本内容与数据库中的庭审笔录之间的匹配度包括:计算所述待搜索的文本内容与所述数据库中的庭审笔录的关键内容之间的匹配度。
根据本申请实施例的另一方面,还提供了一种庭审录像的查询装置,包括:第一接收单元,用于接收待搜索的文本内容;计算单元,用于计算所述待搜索的文本内容与数据库中的庭审笔录之间的匹配度,其中,所述匹配度用于表示所述待搜索的文本内容与数据库中的庭审笔录之间的关联程度,所述数据库中的每一份庭审笔录对应一个庭审录像;选择单元,用于利用所述匹配度选择所述庭审笔录对应的庭审录像;以及展示单元,用于展示选择的所述庭审笔录对应的庭审录像。
进一步地,所述装置还包括:第二接收单元,用于在所述第一接收单元接收待搜索的文本内容之前,接收预设过滤条件;过滤单元,用于利用所述预设过滤条件对所述数据库中的庭审笔录进行过滤,得到第一庭审笔录;其中,所述计算单元具体用于计算所述待搜索的文本内容与所述第一庭审笔录之间的匹配度。
进一步地,所述选择单元包括:筛选子单元,用于筛选出与所述待搜索的文本内容之间的匹配度大于或者等于预设数值的庭审笔录对应的第二庭审录像;所述展示单元具体用于展示所述第二庭审录像。
进一步地,所述装置还包括:排序单元,用于在所述展示单元展示所述第二庭审录像之前,按照所述第二庭审录像对应的庭审笔录与所述待搜索的文本内容之间的匹配度的大小顺序,对所述第二庭审录像进行排序,得到排序结果;所述展示单元具体用于按照所述排序结果的顺序展示所述第二庭审录像。
进一步地,所述装置还包括:分词单元,用于在所述第一接收单元接收待搜索的文本内容之前,对所述数据库中的每一份庭审笔录进行分词,提取出每一份庭审笔录的关键内容;建立单元,用于建立所述关键内容与庭审录像之间的对应关系,将所述关键内容存储至所述数据库,其中,所述计算单元具体用于计算所述待搜索的文本内容与所述数据库中的庭审笔录的关键内容之间的匹配度。
在本申请实施例中,接收待搜索的文本内容;计算待搜索的文本内容与数据库中的庭审笔录之间的匹配度,其中,匹配度用于表示待搜索的文本内容与数据库中的庭审笔录之间的关联程度,数据库中的每一份庭审笔录对应一个庭审录像;利用匹配度选择庭审笔录对应的庭审录像;以及展示选择的庭审笔录对应的庭审录像。庭审笔录与庭审录像是存在对应关系的,通过计算用户输入的文本内容与庭审笔录之间的匹配度,利用匹配度选择庭审笔录对应的庭审录像,达到了精确查询庭审录像的技术效果,进而解决了现有技术中查询庭审笔录时查询结果不精确的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种可选的庭审录像的查询方法的流程图;
图2是根据本申请实施例的另一种可选的庭审录像的查询方法的流程图;
图3是根据本申请实施例的一种可选的庭审录像的查询装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例,提供了一种庭审录像的查询方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本申请实施例的一种可选的庭审录像的查询方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,接收待搜索的文本内容。
步骤S104,计算待搜索的文本内容与数据库中的庭审笔录之间的匹配度,其中,匹配度用于表示待搜索的文本内容与数据库中的庭审笔录之间的关联程度,数据库中的每一份庭审笔录对应一个庭审录像。
可选地,本申请实施例中的匹配度可以通过计算文本之间的相似度来确定,例如,当数据库中庭审笔录中包含有与待搜索的文本内容相同的内容时,表明待搜索的文本内容与该庭审笔录中的部分文本内容相似度特别高,那么待搜索的文本内容与该庭审笔录的匹配度最高;若庭审笔录中包含有与待搜索的文本内容相似的内容,只是部分词语表述不同,则表明待搜索的文本内容与该庭审笔录中的相关内容的相似度很高,那么待搜索的文本内容与该庭审笔录的匹配度则较高。匹配度越高,则表明待搜索的文本内容与相应的庭审笔录的相关性越大。本申请实施例可以基于现有的文本相似度的计算方式来计算待搜索的文本内容与庭审笔录之间的匹配度,这里不再赘述。
步骤S106,利用匹配度选择庭审笔录对应的庭审录像。
步骤S108,展示选择的庭审笔录对应的庭审录像。
在上述步骤中,庭审笔录与庭审录像是存在对应关系的,通过计算用户输入的文本内容与庭审笔录之间的匹配度,确定出所要搜索的庭审笔录,再利用庭审笔录与庭审录像之间的对应关系找出相应的庭审录像,将庭审录像的查找过程转换成文本搜索过程,相对于现有技术中按照庭审录像的归类标签的查找方式,本申请查询方式可以精确定位出所要查询的内容相关的庭审录像,解决了现有技术中查询庭审录像时查询结果不精确的技术问题,达到了精确查询庭审录像的技术效果。
数据库中存储有大量的庭审笔录和庭审录像。每一个案件都有记录其信息的庭审笔录和庭审录像。由于在一般情况下,每一份庭审笔录和每一个庭审录像上都有案件的编号,因此,记录同一个案件的信息的庭审笔录和庭审录像上的编号是相同的,这使得庭审笔录与庭审录像一一对应。
为了叙述的方便,将用户想要查询的录像称为目标录像。用户可以是法务工作者,也可以是普通公民。
根据本申请实施例,当用户需要在大量庭审录像中查询目标录像时,只需要输入案件的信息。用户输入案件的信息即为待搜索的文本内容,计算待搜索的文本内容与庭审笔录之间的关联程度。关联程度可以用匹配度来表示。即,可以计算待搜索的文本内容与庭审笔录之间的匹配度。根据匹配度从数据库中选择庭审笔录对应的庭审录像,并向用户展示。
例如,在数据库中存储着10万份庭审笔录,和对应这10万份庭审笔录的庭审录像。用户想搜索一个多年前发生的入室抢劫杀人案,用户不知道这个案件发生的具体的时间、地域等信息,只知道作案人是一名15岁的未成年人。根据现有技术的庭审录像的查询方法,需要根据时间、地域、法院、案由等标签进行查询,由于用户不知道这些信息,是无法查询的。而根据本发明实施例,用户可以输入“15岁未成年人入室抢劫杀人案”,则“15岁未成年人入室抢劫杀人案”为待搜索的文本内容。计算待搜索的文本内容与庭审笔录之间的匹配度。计算出有50份庭审笔录与待搜索的文本内容之间的匹配度超过了95%。向用户展示这50份与待搜索的文本内容之间的匹配度超过了95%的庭审笔录对应的庭审录像。
在上述实施例中,充分利用了用户对案件了解的信息,计算出用户对案件了解的信息与庭审笔录之间的相关度,查找出相关度高的庭审笔录对应的庭审录像,从而提高了查询庭审录像的精确性。
由于数据库中的庭审笔录和庭审录像的数量较为庞大,如果未事先进行筛选就计算数据库中的全部庭审笔录与待搜索的文本内容之间的匹配度,计算量会比较大。为解决这个问题,可以在计算匹配度之前,接收预设过滤条件,利用预设过滤条件对数据库中的庭审笔录进行过滤,得到第一庭审笔录,再计算待搜索的文本内容与第一庭审笔录之间的匹配度。
可以通过设置合理的预设过滤条件,使得第一庭审笔录的数量远远小于庭审笔录的总数量,这样就不必对数据库中所有的庭审笔录都计算与待搜索的文本内容之间的匹配度,只需要计算第一庭审笔录与待搜索的文本内容之间的匹配度,能够大大减少计算匹配度时的计算量。预设过滤条件可以为时间、地域、法院、案由、案件类型等。
当计算出庭审笔录与待搜索的文本内容之间的匹配度之后,在向用户展示庭审录像时,由于庭审录像的数量很大,而大量的庭审录像中只有极少数是用户可能在寻找的,没有必要将全部庭审录像展示给用户。作为一种可选的实施例,可以筛选出与待搜索的文本内容之间的匹配度大于或者等于预设数值的庭审笔录对应的第二庭审录像,向用户展示第二庭审录像。
由于第二庭审录像的数量是比较小的,因此向用户展示第二庭审录像时,可以不按顺序进行展示,也可以按照与待搜索的文本内容之间的匹配度的大小,对第二庭审录像进行排序,得到排序结果,按照排序结果的顺序展示第二庭审录像。
对第二庭审录像先排序后展示的好处是:向用户展示的第二庭审录像是按照与待搜索的文本内容之间的匹配度的高低从高到低进行展示的,越是位置靠前的庭审录像,与待搜索的文本内容之间的匹配度就越高,也就越有可能是用户寻找的庭审录像。用户只需按照展示的顺序,从前往后查看庭审录像即可,在提高了查询庭审录像的精确度的同时,为用户提供了方便,节约了用户的宝贵时间。
为了计算待搜索的文本内容与数据库中的庭审笔录之间的匹配度,可以事先将数据库中的每一份庭审笔录进行分词,提取出每一份庭审笔录的关键内容,建立关键内容与庭审录像之间的对应关系,将关键内容存储至数据库。此时,计算待搜索的文本内容与数据库中的庭审笔录的关键内容之间的匹配度,将待搜索的文本内容与庭审笔录的关键内容之间的匹配度作为待搜索的文本内容与庭审笔录之间的匹配度。
作为一种可选的实施例,将庭审笔录进行分词处理,提取出庭审笔录中出现的与案件紧密相关的重点词语和这些重点词语出现的频率,从而计算出这些重点词语的权重,这些重点词语即构成了庭审笔录的关键内容。通过建立关键内容与庭审录像之间的对应关系,使得关键内容直接与庭审录像建立关联。
接收待搜索的文本内容之后,将接收到的待搜索的文本内容也进行分词处理,得到分词结果。计算待搜索的文本内容进行分词处理之后的分词结果与庭审笔录的关键内容的匹配度,将计算结果作为待搜索的文本内容与数据库中的庭审笔录之间的匹配度。具体地,在计算匹配度时,可以先对待搜索的文本内容进行分词处理,将分词得到的每个词语与庭审笔录中的关键内容的重点词语进行匹配,按照预设计算公式利用匹配上的词语的个数以及相应的权值来计算出匹配度。例如,待搜索的文本内容分词后得到10个词语,将该10个词语与庭审笔录中的关键内容中的词语进行匹配,匹配到8个词语(待搜索的文本内容中关于时间、地点、法条等关键词语赋予的权重越大,其他的修饰词等词语的权重小),按照不同词语的权重,计算加权值,作为匹配度。
需要说明的是,在词语匹配中,近义词等也可以认为匹配到相应的词语,还可以对匹配到的近义词的权值进行调整,这里不再赘述。
图2是根据本申请实施例的另一种可选的庭审录像的查询方法的流程图。如图2所示,该方法包括如下步骤S202至步骤S212。
步骤S202,对庭审笔录进行处理,获得案由、地域、时间、涉案金额、适用法条、双方当事人、争点等信息。其中,对庭审笔录的处理可以是按照自然语言处理技术对其进行分词,然后按照例如机器学习的方式识别出其中包含上述信息的词语。
步骤S204,提取庭审笔录的主要内容,将庭审笔录的主要内容与庭审录像建立关联关系。提取庭审笔录的主要内容可以是通过上述的分词处理,从而提取出主要内容,也即提取出关键内容。
步骤S206,存储庭审笔录的主要内容和庭审笔录的主要内容与庭审录像之间的关联关系。
步骤S208,接收用户输入的预设过滤条件和待搜索的文本内容。预设过滤条件可以是案由、地域、时间、涉案金额、适用法条、双方当事人、争点等过滤条件。步骤S208的具体实施方式与上述步骤S102相同。
步骤S210,根据用户输入的预设过滤条件和待搜索的文本内容筛选出重点庭审笔录。步骤S210的具体实施方式与上述步骤S104和步骤S106相同。
先根据用户输入的预设过滤条件过滤掉一部分庭审笔录,再根据待搜索的文本内容筛选出重点庭审笔录。
根据待搜索的文本内容筛选出重点庭审笔录的过程可以为:将待搜索的文本内容进行分词,计算待搜索的文本内容进行分词之后的结果与庭审笔录的主要内容的匹配度,筛选出匹配度高于阈值的庭审笔录。阈值可以根据实际需要预先设置,与待搜索的文本内容进行分词之后的结果的匹配度高于阈值的庭审笔录即为重点庭审笔录。
步骤S212,将筛选出的重点庭审笔录所关联的庭审录像进行展示。步骤S212的具体实施方式与上述步骤S108相同。
重点庭审笔录所关联度的庭审录像中极有可能包括了用户想要查询的庭审录像。通过上述实施例,充分利用了用户对案件了解的信息,根据用户对案件了解的信息与庭审笔录之间的相关度,找出重点庭审笔录,向用户展示重点庭审笔录所关联的庭审录像,从而提高了案件查询的精确性。
根据本发明实施例,还提供了一种庭审录像的查询装置。该庭审录像的查询装置可以执行上述庭审录像的查询方法,上述庭审录像的查询方法也可以通过该庭审录像的查询装置实施。
图3是根据本申请实施例的一种可选的庭审录像的查询装置的示意图。如图3所示,该装置包括:第一接收单元10、计算单元20、选择单元30和展示单元40。
第一接收单元10用于接收待搜索的文本内容。
计算单元20用于计算待搜索的文本内容与数据库中的庭审笔录之间的匹配度,其中,匹配度用于表示待搜索的文本内容与数据库中的庭审笔录之间的关联程度,数据库中的每一份庭审笔录对应一个庭审录像。
可选地,本申请实施例中的匹配度可以通过计算文本之间的相似度来确定,例如,当数据库中庭审笔录中包含有与待搜索的文本内容相同的内容时,表明待搜索的文本内容与该庭审笔录中的部分文本内容相似度特别高,那么待搜索的文本内容与该庭审笔录的匹配度最高;若庭审笔录中包含有与待搜索的文本内容相似的内容,只是部分词语表述不同,则表明待搜索的文本内容与该庭审笔录中的相关内容的相似度很高,那么待搜索的文本内容与该庭审笔录的匹配度则较高。匹配度越高,则表明待搜索的文本内容与相应的庭审笔录的相关性越大。本申请实施例可以基于现有的文本相似度的计算方式来计算待搜索的文本内容与庭审笔录之间的匹配度,这里不再赘述。
选择单元30用于利用匹配度选择庭审笔录对应的庭审录像。
展示单元40用于展示选择的庭审笔录对应的庭审录像。
在上述实施例中,庭审笔录与庭审录像是存在对应关系的,通过计算用户输入的文本内容与庭审笔录之间的匹配度,,确定出所要搜索的庭审笔录,再利用庭审笔录与庭审录像之间的对应关系找出相应的庭审录像,将庭审录像的查找过程转换成文本搜索过程,相对于现有技术中按照庭审录像的归类标签的查找方式,本申请查询方式可以精确定位出所要查询的内容相关的庭审录像,解决了现有技术中查询庭审录像时查询结果不精确的技术问题,达到了精确查询庭审录像的技术效果。
数据库中存储有大量的庭审笔录和庭审录像。每一个案件都有记录其信息的庭审笔录和庭审录像。由于在一般情况下,每一份庭审笔录和每一个庭审录像上都有案件的编号,因此,记录同一个案件的信息的庭审笔录和庭审录像上的编号是相同的,这使得庭审笔录与庭审录像一一对应。
为了叙述的方便,将用户想要查询的录像称为目标录像。用户可以是法务工作者,也可以是普通公民。
根据本申请实施例,当用户需要在大量庭审录像中查询目标录像时,只需要输入案件的信息。用户输入案件的信息即为待搜索的文本内容,计算待搜索的文本内容与庭审笔录之间的关联程度。关联程度可以用匹配度来表示。即,可以计算待搜索的文本内容与庭审笔录之间的匹配度。根据匹配度从数据库中选择庭审笔录对应的庭审录像,并向用户展示。
例如,在数据库中存储着10万份庭审笔录,和对应这10万份庭审笔录的庭审录像。用户想搜索一个多年前发生的入室抢劫杀人案,用户不知道这个案件发生的具体的时间、地域等信息,只知道作案人是一名15岁的未成年人。根据现有技术,需要根据时间、地域、法院、案由等标签进行查询,由于用户不知道这些信息,是无法查询的。而根据本发明实施例,用户可以输入“15岁未成年人入室抢劫杀人案”,则“15岁未成年人入室抢劫杀人案”为待搜索的文本内容。计算待搜索的文本内容与庭审笔录之间的匹配度。计算出有50份庭审笔录与待搜索的文本内容之间的匹配度超过了95%。向用户展示这50份与待搜索的文本内容之间的匹配度超过了95%的庭审笔录对应的庭审录像。
在上述实施例中,充分利用了用户对案件了解的信息,计算出用户对案件了解的信息与庭审笔录之间的相关度,查找出相关度高的庭审笔录对应的庭审录像,从而提高了查询庭审录像的精确性。
可选地,本申请实施例所提供的庭审录像的查询装置还包括第二接收单元和过滤单元。第二接收单元用于在第一接收单元10接收待搜索的文本内容之前,接收预设过滤条件。过滤单元用于利用预设过滤条件对数据库中的庭审笔录进行过滤,得到第一庭审笔录。其中,计算单元20具体用于计算待搜索的文本内容与第一庭审笔录之间的匹配度。
由于数据库中的庭审笔录和庭审录像的数量较为庞大,如果未事先进行筛选就计算数据库中的全部庭审笔录与待搜索的文本内容之间的匹配度,计算量会比较大。为解决这个问题,可以在计算匹配度之前,接收预设过滤条件,利用预设过滤条件对数据库中的庭审笔录进行过滤,得到第一庭审笔录,再计算待搜索的文本内容与第一庭审笔录之间的匹配度。
可以通过设置合理的预设过滤条件,使得第一庭审笔录的数量远远小于庭审笔录的总数量,这样就不必对数据库中所有的庭审笔录都计算与待搜索的文本内容之间的匹配度,只需要计算第一庭审笔录与待搜索的文本内容之间的匹配度,能够大大减少计算匹配度时的计算量。预设过滤条件可以为时间、地域、法院、案由、案件类型等。
可选地,选择单元30包括筛选子单元。筛选子单元用于筛选出与待搜索的文本内容之间的匹配度大于或者等于预设数值的庭审笔录对应的第二庭审录像。展示单元40具体用于展示第二庭审录像。
当计算出庭审笔录与待搜索的文本内容之间的匹配度之后,在向用户展示庭审录像时,由于庭审录像的数量很大,而大量的庭审录像中只有极少数是用户可能在寻找的,没有必要将全部庭审录像展示给用户。作为一种可选的实施例,可以筛选出与待搜索的文本内容之间的匹配度大于或者等于预设数值的庭审笔录对应的第二庭审录像,向用户展示第二庭审录像。
可选地,本申请实施例所提供的庭审录像的查询装置还包括排序单元。排序单元用于在展示单元40展示第二庭审录像之前,按照第二庭审录像对应的庭审笔录与待搜索的文本内容之间的匹配度的大小顺序,对第二庭审录像进行排序,得到排序结果。展示单元40具体用于按照排序结果的顺序展示第二庭审录像。
由于第二庭审录像的数量是比较小的,因此向用户展示第二庭审录像时,可以不按顺序进行展示,也可以按照与待搜索的文本内容之间的匹配度的大小,对第二庭审录像进行排序,得到排序结果,按照排序结果的顺序展示第二庭审录像。
对第二庭审录像先排序后展示的好处是:向用户展示的第二庭审录像是按照与待搜索的文本内容之间的匹配度的高低从高到低进行展示的,越是位置靠前的庭审录像,与待搜索的文本内容之间的匹配度就越高,也就越有可能是用户寻找的庭审录像。用户只需按照展示的顺序,从前往后查看庭审录像即可,在提高了查询庭审录像的精确度的同时,为用户提供了方便,节约了用户的宝贵时间。
可选地,本申请实施例所提供的庭审录像的查询装置还包括分词单元和建立单元。分词单元,用于在第一接收单元10接收待搜索的文本内容之前,对数据库中的每一份庭审笔录进行分词,提取出每一份庭审笔录的关键内容。建立单元,用于建立关键内容与庭审录像之间的对应关系,将关键内容存储至数据库。其中,计算单元20包括具体用于计算待搜索的文本内容与数据库中的庭审笔录的关键内容之间的匹配度。
作为一种可选的实施例,将庭审笔录进行分词处理,提取出庭审笔录中出现的与案件紧密相关的重点词语和这些重点词语出现的频率,从而计算出这些重点词语的权重,这些重点词语即构成了庭审笔录的关键内容。通过建立关键内容与庭审录像之间的对应关系,使得关键内容直接与庭审录像建立关联。
接收待搜索的文本内容之后,将接收到的待搜索的文本内容也进行分词处理,得到分词结果。计算待搜索的文本内容进行分词处理之后的分词结果与庭审笔录的关键内容的匹配度,将计算结果作为待搜索的文本内容与数据库中的庭审笔录之间的匹配度。具体地,在计算匹配度时,可以先对待搜索的文本内容进行分词处理,将分词得到的每个词语与庭审笔录中的关键内容的重点词语进行匹配,按照预设计算公式利用匹配上的词语的个数以及相应的权值来计算出匹配度。例如,待搜索的文本内容分词后得到10个词语,将该10个词语与庭审笔录中的关键内容中的词语进行匹配,匹配到8个词语(待搜索的文本内容中关于时间、地点、法条等关键词语赋予的权重越大,其他的修饰词等词语的权重小),按照不同词语的权重,计算加权值,作为匹配度。
需要说明的是,在词语匹配中,近义词等也可以认为匹配到相应的词语,还可以对匹配到的近义词的权值进行调整,这里不再赘述。
所述庭审录像的查询装置包括处理器和存储器,上述第一接收单元10、计算单元20、选择单元30和展示单元40等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现高精确度查询庭审录像。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:接收待搜索的文本内容;计算待搜索的文本内容与数据库中的庭审笔录之间的匹配度,其中,匹配度用于表示待搜索的文本内容与数据库中的庭审笔录之间的关联程度,数据库中的每一份庭审笔录对应一个庭审录像;利用匹配度选择庭审笔录对应的庭审录像;以及展示选择的庭审笔录对应的庭审录像。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种庭审录像的查询方法,其特征在于,包括:
接收待搜索的文本内容;
计算所述待搜索的文本内容与数据库中的庭审笔录之间的匹配度,其中,所述匹配度用于表示所述待搜索的文本内容与数据库中的庭审笔录之间的关联程度,所述数据库中的每一份庭审笔录对应一个庭审录像;
利用所述匹配度选择所述庭审笔录对应的庭审录像;以及
展示选择的所述庭审笔录对应的庭审录像。
2.根据权利要求1所述的方法,其特征在于,在接收待搜索的文本内容之前,所述方法还包括:
接收预设过滤条件;
利用所述预设过滤条件对所述数据库中的庭审笔录进行过滤,得到第一庭审笔录;
其中,计算所述待搜索的文本内容与数据库中的庭审笔录之间的匹配度包括:计算所述待搜索的文本内容与所述第一庭审笔录之间的匹配度。
3.根据权利要求1所述的方法,其特征在于,利用所述匹配度选择所述庭审笔录对应的庭审录像包括:
筛选出与所述待搜索的文本内容之间的匹配度大于或者等于预设数值的庭审笔录对应的第二庭审录像;
展示选择的所述庭审笔录对应的庭审录像包括:
展示所述第二庭审录像。
4.根据权利要求3所述的方法,其特征在于,在展示所述第二庭审录像之前,所述方法还包括:
按照所述第二庭审录像对应的庭审笔录与所述待搜索的文本内容之间的匹配度的大小顺序,对所述第二庭审录像进行排序,得到排序结果;
展示所述第二庭审录像包括:
按照所述排序结果的顺序展示所述第二庭审录像。
5.根据权利要求1所述的方法,其特征在于,在接收待搜索的文本内容之前,所述方法还包括:
对所述数据库中的每一份庭审笔录进行分词,提取出每一份庭审笔录的关键内容;
建立所述关键内容与庭审录像之间的对应关系,将所述关键内容存储至所述数据库,
其中,计算所述待搜索的文本内容与数据库中的庭审笔录之间的匹配度包括:计算所述待搜索的文本内容与所述数据库中的庭审笔录的关键内容之间的匹配度。
6.一种庭审录像的查询装置,其特征在于,包括:
第一接收单元,用于接收待搜索的文本内容;
计算单元,用于计算所述待搜索的文本内容与数据库中的庭审笔录之间的匹配度,其中,所述匹配度用于表示所述待搜索的文本内容与数据库中的庭审笔录之间的关联程度,所述数据库中的每一份庭审笔录对应一个庭审录像;
选择单元,用于利用所述匹配度选择所述庭审笔录对应的庭审录像;以及
展示单元,用于展示选择的所述庭审笔录对应的庭审录像。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二接收单元,用于在所述第一接收单元接收待搜索的文本内容之前,接收预设过滤条件;
过滤单元,用于利用所述预设过滤条件对所述数据库中的庭审笔录进行过滤,得到第一庭审笔录;
其中,所述计算单元具体用于计算所述待搜索的文本内容与所述第一庭审笔录之间的匹配度。
8.根据权利要求6所述的装置,其特征在于,所述选择单元包括:
筛选子单元,用于筛选出与所述待搜索的文本内容之间的匹配度大于或者等于预设数值的庭审笔录对应的第二庭审录像;
所述展示单元具体用于展示所述第二庭审录像。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
排序单元,用于在所述展示单元展示所述第二庭审录像之前,按照所述第二庭审录像对应的庭审笔录与所述待搜索的文本内容之间的匹配度的大小顺序,对所述第二庭审录像进行排序,得到排序结果;
所述展示单元具体用于按照所述排序结果的顺序展示所述第二庭审录像。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
分词单元,用于在所述第一接收单元接收待搜索的文本内容之前,对所述数据库中的每一份庭审笔录进行分词,提取出每一份庭审笔录的关键内容;
建立单元,用于建立所述关键内容与庭审录像之间的对应关系,将所述关键内容存储至所述数据库,
其中,所述计算单元具体用于计算所述待搜索的文本内容与所述数据库中的庭审笔录的关键内容之间的匹配度。
CN201610218357.6A 2016-04-08 2016-04-08 庭审录像的查询方法和装置 Pending CN107273389A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610218357.6A CN107273389A (zh) 2016-04-08 2016-04-08 庭审录像的查询方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610218357.6A CN107273389A (zh) 2016-04-08 2016-04-08 庭审录像的查询方法和装置

Publications (1)

Publication Number Publication Date
CN107273389A true CN107273389A (zh) 2017-10-20

Family

ID=60052683

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610218357.6A Pending CN107273389A (zh) 2016-04-08 2016-04-08 庭审录像的查询方法和装置

Country Status (1)

Country Link
CN (1) CN107273389A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256071A (zh) * 2018-01-17 2018-07-06 广东欧珀移动通信有限公司 录屏文件的生成方法、装置、终端及存储介质
CN111104500A (zh) * 2019-12-21 2020-05-05 江西省天轴通讯有限公司 一种线索匹配方法、系统、可读存储介质及计算机设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090319513A1 (en) * 2006-08-03 2009-12-24 Nec Corporation Similarity calculation device and information search device
CN103686200A (zh) * 2013-12-27 2014-03-26 乐视致新电子科技(天津)有限公司 智能电视视频资源搜索的方法和系统
CN104731938A (zh) * 2015-03-30 2015-06-24 北京奇艺世纪科技有限公司 一种视频搜索方法及装置
CN104915447A (zh) * 2015-06-30 2015-09-16 北京奇艺世纪科技有限公司 一种热点话题追踪及关键词确定方法及装置
CN105183897A (zh) * 2015-09-29 2015-12-23 北京奇艺世纪科技有限公司 一种视频搜索排序的方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090319513A1 (en) * 2006-08-03 2009-12-24 Nec Corporation Similarity calculation device and information search device
CN103686200A (zh) * 2013-12-27 2014-03-26 乐视致新电子科技(天津)有限公司 智能电视视频资源搜索的方法和系统
CN104731938A (zh) * 2015-03-30 2015-06-24 北京奇艺世纪科技有限公司 一种视频搜索方法及装置
CN104915447A (zh) * 2015-06-30 2015-09-16 北京奇艺世纪科技有限公司 一种热点话题追踪及关键词确定方法及装置
CN105183897A (zh) * 2015-09-29 2015-12-23 北京奇艺世纪科技有限公司 一种视频搜索排序的方法和系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256071A (zh) * 2018-01-17 2018-07-06 广东欧珀移动通信有限公司 录屏文件的生成方法、装置、终端及存储介质
CN108256071B (zh) * 2018-01-17 2021-02-26 Oppo广东移动通信有限公司 录屏文件的生成方法、装置、终端及存储介质
CN111104500A (zh) * 2019-12-21 2020-05-05 江西省天轴通讯有限公司 一种线索匹配方法、系统、可读存储介质及计算机设备

Similar Documents

Publication Publication Date Title
CN101692224B (zh) 融合空间关系语义的高分辨率遥感图像检索方法
CN105550369B (zh) 一种搜索目标商品集的方法及装置
CN103309869B (zh) 数据对象的展示关键词推荐方法及系统
CN102254015A (zh) 基于视觉词组的图像检索方法
CN104077407B (zh) 一种智能数据搜索系统及方法
CN103136228A (zh) 一种图片搜索方法以及图片搜索装置
CN106096609B (zh) 一种基于ocr的商品查询关键字自动生成方法
CN105677728A (zh) 物体图像识别分类管理方法
CN107180093A (zh) 信息搜索方法及装置和时效性查询词识别方法及装置
CN102890700A (zh) 一种基于体育比赛视频的相似视频片段检索方法
CN109213921A (zh) 一种商品信息的搜索方法及装置
CN106682012A (zh) 商品对象信息搜索方法及装置
CN111191022A (zh) 商品短标题生成方法及装置
Li et al. Curve style analysis in a set of shapes
CN106777325A (zh) 案件证据清单生成方法及系统
CN107832444A (zh) 基于搜索日志的事件发现方法及装置
CN108038506A (zh) 一种图书自动分类方法
CN106933897A (zh) 数据查询方法和装置
Sundara Vadivel et al. An efficient CBIR system based on color histogram, edge, and texture features
CN104462347B (zh) 关键词的分类方法及装置
CN108153781A (zh) 提取业务领域的关键词的方法和装置
Zhang et al. Automatic shoeprint retrieval system for use in forensic investigations
CN107273389A (zh) 庭审录像的查询方法和装置
CN110532282A (zh) 数据查询方法及装置
CN105159898A (zh) 一种搜索的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20171020

RJ01 Rejection of invention patent application after publication