CN113268613B - 一种用于获取侵权线索的方法、设备、介质及程序产品 - Google Patents
一种用于获取侵权线索的方法、设备、介质及程序产品 Download PDFInfo
- Publication number
- CN113268613B CN113268613B CN202110482369.0A CN202110482369A CN113268613B CN 113268613 B CN113268613 B CN 113268613B CN 202110482369 A CN202110482369 A CN 202110482369A CN 113268613 B CN113268613 B CN 113268613B
- Authority
- CN
- China
- Prior art keywords
- information
- dimension
- case
- infringer
- suspected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000015654 memory Effects 0.000 claims description 40
- 238000003860 storage Methods 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 20
- 230000006399 behavior Effects 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 3
- 238000011835 investigation Methods 0.000 abstract description 7
- 238000005516 engineering process Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000005291 magnetic effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000000956 alloy Substances 0.000 description 1
- 229910045601 alloy Inorganic materials 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000005294 ferromagnetic effect Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
- G06Q50/184—Intellectual property management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Technology Law (AREA)
- Tourism & Hospitality (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请的目的是提供一种用于获取侵权线索的方法、设备、介质及程序产品,包括:从第一数据源中获取一个或者多个第一案件信息;根据每个第一案件信息对应的第一维度中的维度赋值将所述一个或者多个第一案件信息执行归类操作,以生成一个或者多个归类案件集合;对所述一个或者多个归类案件集合中每个归类案件集合构建语义树,以获取所述每个归类案件集合中的目标特征标签信息;根据所述目标特征标签信息在目标数据库中进行匹配查询以获得一个或者多个疑似侵权方信息。本申请可以缩小潜在侵权者的调查范围,提高了侵权线索的准确度。
Description
技术领域
本申请涉及通信领域,尤其涉及一种用于获取侵权线索的技术。
背景技术
在知识产权领域,对于IP(Intellectual Property,中文名知识产权),现在很多人理解,其实就是所有文创(文学、影视、动漫、游戏等)作品的统称。IP被侵权现象日益严重。为保障权利人利益,打击侵权者,需要加强对侵权行为的调查。目前,侵权行为的线索调查主要依赖人工收集,如果是从事于知识产权领域的律师或法务,需要为了发现侵权线索,需要经常不断的线下走访、网上搜索,工作量极大,效率不高。
发明内容
本申请的一个目的是提供一种用于获取侵权线索的方法、设备、介质及程序产品。
根据本申请的一个方面,提供了一种用于获取侵权线索的方法,应用于网络设备端,该方法包括:
从第一数据源中获取一个或者多个第一案件信息;
根据每个第一案件信息对应的第一维度中的维度赋值将所述一个或者多个第一案件信息执行归类操作,以生成一个或者多个归类案件集合,其中,每个归类案件集合中包括一个或者多个所述第一案件信息,且该一个或者多个所述第一案件信息对应的第一维度中的维度赋值一致;
对所述一个或者多个归类案件集合中每个归类案件集合构建语义树,以获取所述每个归类案件集合中的目标特征标签信息,其中,所述目标特征标签信息包括第二维度对应的维度赋值以及第三维度对应的维度赋值;
根据所述目标特征标签信息在目标数据库中进行匹配查询以获得一个或者多个疑似侵权方信息,其中,所述目标特征标签信息与所述每个疑似侵权方信息对应的特征标签信息的相似度大于预设相似度阈值。
根据本申请的一个方面,提供了一种用于获取侵权线索的网络设备,该设备包括:
一一模块,用于从第一数据源中获取一个或者多个第一案件信息;
一二模块,用于根据每个第一案件信息对应的第一维度中的维度赋值将所述一个或者多个第一案件信息执行归类操作,以生成一个或者多个归类案件集合,其中,每个归类案件集合中包括一个或者多个所述第一案件信息,且该一个或者多个所述第一案件信息对应的第一维度中的维度赋值一致;
一三模块,用于对所述一个或者多个归类案件集合中每个归类案件集合构建语义树,以获取所述每个归类案件集合中的目标特征标签信息,其中,所述目标特征标签信息包括第二维度对应的维度赋值以及第三维度对应的维度赋值;
一四模块,用于根据所述目标特征标签信息在目标数据库中进行匹配查询以获得一个或者多个疑似侵权方信息,其中,所述目标特征标签信息与所述每个疑似侵权方信息对应的特征标签信息的相似度大于预设相似度阈值。
根据本申请的一个方面,提供了一种用于获取侵权线索的计算机设备,包括存储器、处理器及存储在存储器上的计算机程序,其中,所述
处理器执行所述计算机程序以实现如上所述任一方法的操作。
根据本申请的一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如上所述任一方法的操作。
根据本申请的一个方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上所述任一方法的步骤。
与现有技术相比,本申请中网络设备根据一个或者多个第一案件信息中每个第一案件信息对应的第一维度,根据该第一维度中的维度赋值将所述一个或者多个第一案件信息执行归类操作,以生成一个或者多个归类案件集合;并对所述一个或者多个归类案件集合中每个归类案件集合构建语义树,以获取所述每个归类案件集合中的目标特征标签信息,并根据所述目标特征标签信息在目标数据库中进行匹配查询以获得一个或者多个疑似侵权方信息。本申请中分析出侵权行为最为密集的目标特征标签信息,并利用互联网技术和法律大数据相结合,根据该目标特征标签信息作为筛选条件以筛选出与该特征相似或者相同的疑似侵权者,缩小调查范围,提高了侵权线索的准确度,从而有效提高律师的调查效率,减轻律师的工作量。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出根据本申请一个实施例的一种用于获取侵权线索的方法流程图;
图2示出根据本申请一个实施例的一种用于获取侵权线索的示意图;
图3示出根据本申请又一个实施例的一种用于获取侵权线索的示意图;
图4示出根据本申请又一个实施例的一种用于获取侵权线索的示意图;
图5示出根据本申请一个实施例的一种用于获取侵权线索的网络设备结构图;
图6示出可被用于实施本申请中所述的各个实施例的示例性系统。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本申请作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(例如,中央处理器(Central Processing Unit,CPU))、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RandomAccess Memory,RAM)和/或非易失性内存等形式,如只读存储器(Read Only Memory,ROM)或闪存(Flash Memory)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(Phase-Change Memory,PCM)、可编程随机存取存储器(Programmable Random Access Memory,PRAM)、静态随机存取存储器(Static Random-Access Memory,SRAM)、动态随机存取存储器(Dynamic Random AccessMemory,DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、数字多功能光盘(Digital Versatile Disc,DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
本申请所指设备包括但不限于终端、网络设备、或终端与网络设备通过网络相集成所构成的设备。所述终端包括但不限于任何一种可与用户进行人机交互(例如通过触摸板进行人机交互)的移动电子产品,例如智能手机、平板电脑等,所述移动电子产品可以采用任意操作系统,如Android操作系统、iOS操作系统等。其中,所述网络设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑器件(Programmable Logic Device,PLD)、现场可编程门阵列(Field ProgrammableGate Array,FPGA)、数字信号处理器(Digital Signal Processor,DSP)、嵌入式设备等。所述网络设备包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。优选地,所述设备还可以是运行于所述终端、网络设备、或终端与网络设备、网络设备、触摸终端或网络设备与触摸终端通过网络相集成所构成的设备上的程序。
当然,本领域技术人员应能理解上述设备仅为举例,其他现有的或今后可能出现的设备如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。
在本申请的描述中,“多个”的含义是两个或者更多,除非另有明确具体的限定。
图1示出根据本申请一个实施例的一种用于获取侵权线索的方法,应用于网络设备端,所述方法包括步骤S101、步骤S102、步骤S103和步骤S104。
具体地,在步骤S101中,网络设备从第一数据源中获取一个或者多个第一案件信息。其中,所述第一数据源包括传统律所业务产生的案件数据、第三方数据公司、互联网公开案件和企业工商数据(例如,裁判文书网、国家企业信用信息公示系统等)。
在一些实施例中,在步骤S101中,网络设备从第一数据源中获取第一原始数据;对所述第一原始数据执行第一预设操作以获取一个或者多个第一案件信息。其中,所述第一预设操作包括利用spark(内存计算框架)等大数据技术框架对数据进行抽取、清洗、去重、转换等操作,所述抽取操作是把第一原始数据抽取一部分出来,查看数据的结构,所述清洗操作是为了清除不需要、逻辑错误的数据,所述去重操作是为了去掉重复的数据,所述转换操作是对数据格式标准化,比如时间日期、数值格式不统一,处理成统一的数据格式。例如,网络设备中预置有数据采集模块,该数据采集模块使用网络爬虫技术从第一数据源中获取第一原始数据(例如,该第一原始数据为一个或者多个裁定文书数据)并存储于数据仓库中进行保存,网络设备中预置有数据处理模块,该数据处理模块从数据仓库中获取所述第一原始数据并执行第一预设操作。
在一些实施例中,所述对所述第一原始数据执行第一预设操作以获取一个或者多个第一案件信息包括:对所述第一原始数据执行第一预设操作以获取一个或者多个候选第一案件信息;根据预设维度从每个候选第一案件信息中提取与所述预设维度相关的信息以生成对应的第一案件信息。例如,对于每一个候选第一案件信息,网络设备根据预设维度从该每一个候选第一案件信息中提取与所述预设维度相关的信息,并将该相关的信息作为第一案件信息,在一些实施例中,所述预设维度包括以下至少任一项:
1)侵权方名称信息;
2)侵权方的侵权行为信息;
3)侵权方的经营规模信息;
4)侵权方所在地信息;
5)侵权方的侵权金额信息;
6)侵权方的注册资本信息;
7)侵权方的赔偿金额信息;
8)侵权方的经营范围信息。例如,以一个候选第一案件信息为例,网络设备对该候选第一案件信息中的描,内容先进行分词操作(例如,将连续的自然语言文本,切分成具有语义合理性和完整性的词汇序列)、随后对分词操作后的每个词语进行词性标注(Part-of-Speech tagging或POS tagging),在一些实施例中,网络设备可以在进行分词操作后,直接进行专有名词(例如,人名、地名、机构名、时间日期等)的识别。例如,网络设备在该第一候选第一案件信息中识别出“被告”两个字(或者“被申请人”等可以识别出是被告方的字词),将该“被告”等同于“侵权方名称信息”,并将该“被告”标题后的一个短句作为与“侵权方名称信息”对应的内容信息(例如,与该维度对应的维度赋值);例如,网络设备在该第一候选第一案件信息中识别出“侵害某某公司…权”、“原告提出诉讼请求…”等包含指向性侵权行为的信息时,网络设备可以将该信息后的一个短句作为与“侵权方的侵权行为信息”对应的内容信息;例如,网络设备在该第一候选第一案件信息中识别出“判令被告赔偿原告经济损失…”等包含“赔偿”、“金额”的信息时,将该信息后的一个短句作为与“侵权方的侵权金额信息”对应的内容信息;又例如,网络设备可以基于“被告方”、或者“被申请人”等可以识别出是被告方的字词后面的内容识别出与“侵权方的经营规模信息”、“侵权方所在地信息”、“侵权方的注册资本信息”、“侵权方的经营范围信息”相对应的内容,或者,网络设备基于所述侵权方名称信息想对应的内容从工商数据中查询该侵权方的经营规模信息、所在地信息、注册资本信息以及经营范围信息,基于上述预设维度信息,所生成的第一案件信息包括:
侵权方名称信息:A公司;
侵权方的侵权行为信息:侵犯著作权;
侵权方的经营规模信息:批发和零售业,零售业中小型企业,职工人500人以下,销售额15000万元以下,在一些实施例中,在后续基于侵权方的经验规模信息进行统计时,可以只按照销售额、也可以对职工人数以及销售额赋予不同的权重以获得用于表征经验规模信息的数字信息;
侵权方所在地信息:广州省AA市AA区
侵权方的侵权金额信息:200万元;
侵权方的注册资本信息:1500万元;
侵权方的经营范围信息:玩具、工艺品;本领域技术人员应能理解上述第一案件信息仅为举例,其他现有的或今后可能出现的第一案件信息如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。
在一些实施例中,所述第一案件信息满足以下至少任一项:
1)所述第一案件信息的结案时间与当前时间的时间差小于第一时长阈值;
2)所述第一案件信息的结案结果为胜诉;
3)所述第一案件信息的结案结果为诉讼调解。例如,网络设备在获取一个或者多个第一案件信息的过程中,对第一数据源中的内容按照上述条件进行筛选、或者对所述一个或者多个候选第一案件信息按照上述条件进行筛选,以获取一个或者多个第一案件信息。在一些实施例中,网络设备根据该案件的结案时间进行筛选,例如,可以筛选某个具体时间段(例如,2018年整年、2019年整年、1988年8月份)结案的案件,也可以筛选近期结案的案件,例如,当该案件结案的时间与当前时间的时间差小于第一时长阈值,都可以认为该案件信息是近期结案的。
又例如,一般侵权案件的发生都是由被侵权方起诉疑似侵权方,若该案件的结案结果为胜诉或者诉讼调解,可以认为该侵权事实是存在的,该疑似侵权方的侵权行为是确定的,该疑似侵权方可以明确为侵权方。
在一些实施例中,网络设备还可以根据案件类型进行筛选,其中,所述案件类型包括知识产权与竞争纠纷类型、知识产权民事纠纷类型等,具体案件类型根据业务实际需要进行确定,上述仅为举例。
在步骤S102中,网络设备根据每个第一案件信息对应的第一维度中的维度赋值将所述一个或者多个第一案件信息执行归类操作,以生成一个或者多个归类案件集合,其中,每个归类案件集合中包括一个或者多个所述第一案件信息,且该一个或者多个所述第一案件信息对应的第一维度中的维度赋值一致。例如,对于所述一个或者多个第一案件信息中的每个第一案件信息,网络设备先根据业务需求确定该第一案件信息的第一维度,该第一维度可以是侵权方的侵权行为信息、侵权方所在地信息或者侵权方的经营范围信息,该第一维度对应着至少一个维度赋值,例如,侵权方的侵权行为信息对应的维度赋值包括以下至少任一项:
1)生产侵权产品;
2)销售侵权产品;
3)侵犯著作权;
4)侵犯商标权;网络设备可以根据该侵权行为信息对应的维度赋值中的一个维度赋值对该案件信息进行归类;例如,所述侵权方所在地信息包括所述侵权方当前所在地或者注册地,该侵权方所在地信息中的维度赋值可以是所在地对应的市或者直辖市,例如,江苏、上海、北京、山东;例如,所述侵权方的经营范围信息对应的维度赋值可以包括至少一个(例如,经营玩具、经营工艺品、经营工艺品),网络设备可以根据该经营范围信息对应的维度赋值中的一个将该案件信息进行归类。
例如,以第一维度为侵权方的侵权行为信息,该第一维度的维度赋值为生产侵权产品、销售侵权产品、侵犯著作权为例,当前有10个第一案件信息(案件1、案件2、案件3…案件10),其中,案件1至案件3中侵权方的侵权行为信息对应的维度赋值包括生产侵权产品、案件4至案件8中侵权方的侵权行为信息对应的维度赋值包括销售侵权产品、案件9至案件10中侵权方的侵权行为信息对应的维度赋值包括侵犯著作权,网络设备基于相同的维度赋值将案件1至案件3归为一个归类案件集合,案件4至案件8归为一个归类案件集合,案件9至案件10归为一个归类案件集合,在一些实施例中,每个第一案件信息中侵权方的侵权行为信息对应的维度赋值不止一个,例如,当前有5个第一案件信息(案件1、案件2、案件3…案件5),案件1中侵权方的侵权行为信息对应的维度赋值包括侵犯著作权以及销售侵权产品、案件2中侵权方的侵权行为信息对应的维度赋值包括生产侵权产品、销售侵权产品、案件3-案件5中侵权方的侵权行为信息对应的维度赋值包括侵犯著作权,网络设备基于相同的维度赋值将案件2归为一个归类案件集合(例如,赋值维度是生产侵权产品)、案件1以及案件2归为一个归类案件集合(例如,赋值维度是销售侵权产品)、案件1、案件3-案件5归为一个归类案件集合(例如,赋值维度是侵犯著作权)。例如,该一个或者多个归类案件集合可能存在交集案件,对于每个归类案件集合,该归类案件集合中的至少一个第一案件信息的第一维度中的维度赋值一致。
在步骤S103中,网络设备对所述一个或者多个归类案件集合中每个归类案件集合构建语义树,以获取所述每个归类案件集合中的目标特征标签信息,其中,所述目标特征标签信息包括第二维度对应的维度赋值以及第三维度对应的维度赋值。例如,对于每个归类案件集合,若网络设备选取的维度不一致或者排列的先后次序不一致,所构建的语义树也是不一致的,但是最终根据该语义树获得的该归类案件集合中的目标特征标签信息都是一致的。
在一些实施例中,所述对所述一个或者多个归类案件集合中每个归类案件集合构建语义树,包括:对所述一个或者多个归类案件集合中每个归类案件集合,根据所述每个归类案件集合中的一个或者多个所述第一案件信息构建该每个归类案件集合的语义树。例如,以一个归类案件集合为例,网络设备对该归类案件集合构建语义树,其中,所述语义树包括将该归类案件集合中的每个第一案件信息按照至少一个维度进行树形排列。
在一些实施例中,所述根据所述每个归类案件集合中的一个或者多个所述第一案件信息构建该每个归类案件集合的语义树,包括:对于所述每个归类案件集合中的一个或者多个所述第一案件信息,获取每个所述第一案件信息对应的第一维度、第二维度、第三维度以及第四维度的维度赋值;按照所述第一维度、第二维度、第三维度、第四维度的顺序对一个或者多个所述第一案件信息中每个所述第一案件信息对应的第一维度、第二维度、第三维度以及第四维度的维度赋值进行分类以构建该每个归类案件集合的语义树。其中,所述第一维度、第二维度、第三维度、第四维度是有选取的先后顺序的,后续构建语义树即按照第一维度、第二维度、第三维度、第四维度的先后顺序,所述第一维度、第二维度、第三维度、第四维度都不相同,是网络设备根据实际业务需求从侵权方名称信息、侵权方的侵权行为信息、侵权方的经营规模信息、侵权方所在地信息、侵权方的侵权金额信息、侵权方的注册资本信息、侵权方的经营范围信息中选取的。例如,在前述步骤中,网络设备已经按照第一维度的维度赋值获取到一个或者多个归类案件集合,基于此该第一维度以及该第一维度的维度赋值已经确定,随后网络设备确定第二维度(例如,除去第一维度以外的任一个维度),以及确定第三维度(例如,除去第一维度、第二维度以外的任一个维度),为了最后获取到该归类案件结集合的目标特征标签信息,网络设备确定第四维度为侵权方的经营规模信息,以便后续基于此确定可以表征侵权方最密集(例如,经验规模数量越大,越密集)的特征信息。在确定第一维度、第二维度、第三维度、第四维度后,网络设备提取该归类案件集合中每个第一案件信息的第一维度、第二维度、第三维度、第四维度对应的维度赋值,按照第一维度、第二维度、第三维度、第四维度的上下顺序,用前述维度赋值进行语义树的构建。
在一些实施例中,所述按照所述第一维度、第二维度、第三维度、第四维度的顺序对一个或者多个所述第一案件信息中每个所述第一案件信息对应的第一维度、第二维度、第三维度以及第四维度的维度赋值进行分类以构建该每个归类案件集合的语义树,包括:将所述每个所述第一案件信息对应的第一维度的维度赋值作为主要分支;将所述每个所述第一案件信息对应的第二维度的维度赋值中相同的维度赋值进行合并,以作为所述主要分支的第一次要分支,其中,所述第一次要分支中包括一个或者多个合并后的维度赋值;将所述每个所述第一案件信息对应的第三维度的维度赋值与所述一个或者多个合并后的维度赋值中每个合并后的维度赋值进行对应,以作为所述第一次要分支的第二次要分支;将所述每个所述第一案件信息对应的第四维度的维度赋值与所述每个所述第一案件信息对应的第三维度的维度赋值进行对应,并将对应关系下所述第三维度的维度赋值相同的所述第四维度的维度赋值进行合并统计,以作为所述第二次要分支的第三次要分支;根据所述主要分支、所述第一次要分支、所述第二次要分支、所述第三次要分支构建该每个归类案件集合的语义树。例如,在此以第一维度为侵权方的侵权行为信息,该第一维度的维度赋值为生产侵权产品,所述第二维度为侵权方所在地信息,所述第三维度为侵权方的经营范围信息,第四维度为侵权方的经营规模信息为例简述如何构建一个归类案件集合的语义树。
如图2所示,该归类案件集合是以第一维度的维度赋值为生产侵权产品归类的,该归类案件集合中的每个第一案件信息的第一维度的维度赋值均为生产侵权产品,因此以该生产侵权产品作为主要分支,随后,提取每个第一案件信息的第二维度(侵权方所在地信息)的维度赋值(例如,案件1对应上海、案件2对应江苏、案件3对应北京、案件4对应北京、案件5对应广东、案件6对应山东),网络设备将每个第一案件信息的第二维度的维度赋值中相同的维度赋值进行合并,以作为该主要分支的第一次要分支,因此,该第一次要分支从主要分支处延续下来,包括:江苏、上海、北京、广东、山东;再然后,网络设备提取每个第一案件信息的第三维度(侵权方的经营范围信息)的维度赋值(例如,玩具、工艺品、汽车用品中至少一项),并根据该每个第一案件信息中的第二维度的维度赋值将该第三维度的维度赋值进行对应(例如,案件1的第二维度的维度赋值为江苏,第三维度的维度赋值包括玩具、工艺品),则网络设备将玩具和工艺列在第一次要分支的江苏下,其他第一案件信息中的第三维度的维度赋值按上述操作列在第一次要分支中的每个所在地之下,基于此,网络设备生成第二次要分支,网络设备提取每个第一案件信息中与该第三维度的维度赋值对应的第四维度的维度赋值(例如,经营规模信息),将每个侵权方所在地信息下第三维度的维度赋值一致的第四维度的维度赋值进行合并(例如,第一次要分支中的江苏下连接着一个或者多个玩具赋值、一个工艺品赋值,该一个或者多个玩具赋值下分别连接着规模赋值,该工艺品赋值下连接着一个规模赋值,网络设备将同是玩具赋值的多个规模进行合并统计以作为一个玩具赋值下的总规模),以生成从第二次要分支延续下的第三次要分支。网络设备根据主要分支、所述第一次要分支、所述第二次要分支、所述第三次要分支构建该归类案件集合的语义树。
在一些实施例中,所述获取所述每个归类案件集合中的目标特征标签信息,包括:对于所述每个归类案件集合,获取该归类案件集合中所述第三次要分支中一个或者多个合并统计后的所述第四维度的维度赋值;将所述一个或者多个合并统计后的所述第四维度的维度赋值进行正序排序,确定位于第一顺序的合并统计后的所述第四维度的维度赋值;基于该维度赋值确定对应的所述第二次要分支中的第三维度对应的维度赋值、以及对应的所述第一次要分支中的第二维度对应的维度赋值;将所述第四维度的维度赋值、上述第三维度对应的维度赋值以及上述第二维度对应的维度赋值中的至少一个维度赋值作为该归类案件集合中的目标特征标签信息。例如,在网络设备对每个归类案件集合生成对应的语义树的前提下,以一个归类案件集合的语义树为例,网络设备获取该语义树的第三次要分支中一个或者多个合并统计后的所述第四维度的维度赋值,并将该多个维度赋值进行从高到低的排序(例如,维度赋值为可以计算的侵权方的经营规模信息),网络设备将经营规模最大的(统计后的)维度赋值对应的第三维度对应的维度赋值,以及该第三维度对应的维度赋值对应的第二维度的维度赋值作为该归类案件集合中的目标特征标签信息。例如,第三维度对应的维度赋值为玩具,第二维度的维度赋值为广东,网络设备确定该归类案件集合的目标特征标签信息为:侵权方的经营范围信息为玩具,侵权方所在地信息为广东。在一些实施例中,目标特征标签信息的选取可以根据实际业务需求,例如,业务需求为第三维度对应的某个维度赋值(例如,玩具)侵权行为最为密集,网络设备可将第三次要分支中第四维度的维度赋值(例如,该些维度赋值对应在第二次要分支中的维度赋值均为玩具)进行比较,以得到数值最大的第四维度的维度赋值对应的第二维度的维度赋值,网络设备可以将该第二维度的维度赋值以及第三维度对应的维度赋值作为目标特征标签信息。
在一些实施例中,网络设备将经营规模最大的(统计后的)维度赋值对应的第三维度对应的维度赋值、该第三维度对应的维度赋值对应的第二维度的维度赋值以及该归类案件集合中的第一维度的维度赋值中的至少两个维度赋值作为该归类案件集合中的目标特征标签信息,其中,该至少两个维度均不为侵权方的侵权行为信息。例如,在目标特征标签信息中包括至少两个维度赋值的前提下,可以使得后续根据该目标特征标签信息确定出的疑似侵权方的信息更为精准。
又例如,如图3所示,该归类案件集合是以第一维度(例如,第一维度为侵权方的侵权行为信息)的维度赋值为侵犯著作权,该归类案件集合中的每个第一案件信息的第一维度的维度赋值均为侵犯著作权,网络设备将侵犯著作权作为主要分支,随后将每个所述第一案件信息对应的第二维度的维度赋值中相同或者范围相同的维度赋值进行合并,例如,第二维度为侵权方对被侵权方付出的赔偿金额信息,网络设备可将每个第一案件信息中赔偿金额一致的进行合并,或者,网络设备预设多个赔偿金额范围(例如,0-5000、5000-1万…),并将该归类案件集合中的每个第一案件信息按照赔偿金额进行合并,以作为该主要分支的第一次要分支;再然后,对于每个赔偿金额范围下的至少一个第一案件信息,网络设备提取每个第一案件信息的第三维度(侵权方的经营范围信息)的维度赋值(例如,玩具、工艺品、汽车用品中至少一项),并将该赔偿金额范围下的第三维度的维度赋值进行同项合并(例如,玩具的归为一类、工艺品的归为一类),网络设备将多个赔偿金额范围下的多个第三维度的维度赋值的同项合并作为第二次要分支,在进行对每个赔偿金额范围下的第三维度的维度赋值进行同项合并的同时,以一个赔偿金额范围为例,网络设备将该第三维度的维度赋值对应的第一案件信息中的注册资本进行统计(例如,累加操作),以获得对应不同的第三维度的维度赋值而获得的注册资本的统计,网络设备将多个赔偿金额范围下的不同的第三维度的维度赋值对应的注册资本的累加值作为第三次要分支。网络设备根据主要分支、所述第一次要分支、所述第二次要分支、所述第三次要分支构建该归类案件集合的语义树。
在步骤S104中,网络设备根据所述目标特征标签信息在目标数据库中进行匹配查询以获得一个或者多个疑似侵权方信息,其中,所述目标特征标签信息与所述每个疑似侵权方信息对应的特征标签信息的相似度大于预设相似度阈值。其中,所述目标数据库包括网络设备提前从国家企业信用信息系统中爬取的企业工商数据,该目标数据库中包括多个企业的注册资本、经营范围、住所、经营状态等信息,例如,在网络设备获取每个归类案件信息的目标特征标签信息的前提下,网络设备基于该目标特征标签信息中的所述第二维度对应的维度赋值以及第三维度对应的维度赋值与所述目标数据库中的企业信息进行匹配,以获得匹配度较高的企业信息,并将该匹配度较高的企业信息作为一个或者多个疑似侵权方信息,其中,所述疑似侵权方信息包括疑似侵权的企业名称,网络设备将该疑似侵权方信息提供给律师以供律师进行线下人工调查。
在一些实施例中,在步骤S104中,网络设备将所述目标特征标签信息中的所述第二维度对应的维度赋值以及第三维度对应的维度赋值作为索引信息;通过预设搜索方式将所述索引信息在所述目标数据库中进行匹配查询,以获取一个或者多个候选疑似侵权方信息以及与每个候选疑似侵权方信息对应的评分字段信息;根据所述每个候选疑似侵权方信息对应的评分字段信息从所述一个或者多个候选疑似侵权方信息中确定一个或者多个疑似侵权方信息。其中,所述预设搜索方式包括ElasticSearch技术(搜索技术),网络设备将第二维度:维度赋值、以及第三维度:维度赋值,这两个字段作为索引信息,并利用该预设搜索技术在目标数据中进行搜索以获取与该索引信息相似度较高的企业信息(例如每一个或者多个候选疑似侵权方信息),该预设搜索技术返回的结果是按相似性倒序排列的,查询语句会为每个搜索结果生成一个评分字段信息(_srore字段)。在一些实施例中,所述根据所述每个候选疑似侵权方信息对应的评分字段信息从所述一个或者多个候选疑似侵权方信息中确定一个或者多个疑似侵权方信息包括:检测所述一个或者多个候选疑似侵权方信息对应的评分字段信息中是否存在至少一个所述候选疑似侵权方信息的评分字段信息大于预设评分阈值,若是,将所述至少一个所述候选疑似侵权方信息作为一个或者多个疑似侵权方信息,其中,所述目标特征标签信息与所述每个候选疑似侵权方信息对应的特征标签信息的相似度与所述评分字段信息成正比。例如,网络设备基于所述预设搜索方式获取搜索结果,其中,该搜索结果包括至少一家企业信息,该搜索结果中的每家企业信息都对应的_score的评分,该_score的评分越高,证明目标特征标签信息与该搜索结果的相似度越高,网络设备选取相似度较高的至少一家企业信息,并将该至少一家企业确定为一个或者多个疑似侵权方信息。例如,目标特征标签信息:所在地为广东、经营范围为玩具。网络设备根据搜索结果匹配到的企业:汕头市澄海区新奇达玩具厂有限公司,所在地为:广东省汕头市澄海区澄华街道玉亭路,经营范围为:生产、销售:玩具,玩具模型,玩具配件,电子产品,电子配件,童车,塑胶制品,合金制品,工艺品(不含金银饰品),文具。即目标特征标签信息中的每个字段与该疑似侵权方信息对应的企业信息对应的字段的匹配度大于匹配度阈值。
在一些实施例中,所述根据所述每个候选疑似侵权方信息对应的评分字段信息从所述一个或者多个候选疑似侵权方信息中确定一个或者多个疑似侵权方信息包括:根据所述每个候选疑似侵权方信息对应的评分字段信息从所述一个或者多个候选疑似侵权方信息中确定一个或者多个推荐疑似侵权方信息;将所述一个或者多个推荐疑似侵权方信息在第二数据源中进行匹配查询以获取一个或者多个已侵权方信息;将所述一个或者多个推荐疑似侵权方信息中的所述一个或者多个已侵权方信息进行过滤,以生成一个或者多个疑似侵权方信息。例如,网络设备先根据搜索结果中每个候选疑似侵权方信息对应的评分字段信息确定一个或者多个推荐疑似侵权方信息,再从该一个或者多个推荐疑似侵权方信息中进行过滤以获得一个或者多个疑似侵权方信息,例如,网络设备将该一个或者多个推荐疑似侵权方信息在裁判文书网中进行匹配,若匹配结果不为空,网络设备获取该匹配结果信息(例如,在裁判文书网中存在的至少一个候选推荐疑似侵权方信息),网络设备再检测该至少一个候选推荐疑似侵权方信息(例如,根据企业的名称)中已被裁判文书网的侵权案件认定为被告方(或者被申请人)的至少一个已侵权方信息,并将该至少一个已侵权方信息从该一个或者多个推荐疑似侵权方信息中去除以获得一个或者多个疑似侵权方信息,从而去除已被诉讼的企业。
图4示出根据本申请又一个实施例的一种用于获取侵权线索的示意图,网络设备中的数据采集模块用于采集数据,作为元数据保存于数据仓库,数据处理模块负责对数据抽取、清洗、去重、转换,把元数据处理为待分析数据,并保存于数据仓库,数据分析引擎从数据仓库中获取待分析数据首先对元数据做文本内容词法分析、语义分析提取关键特征标签,关键特征标签是侵权者高相关度的画像。
图5示出根据本申请一个实施例的一种用于获取侵权线索的网络设备,所述网络设备包括一一模块101、一二模块102、一三模块103和一四模块104。
具体地,一一模块101,用于从第一数据源中获取一个或者多个第一案件信息。其中,所述第一数据源包括传统律所业务产生的案件数据、第三方数据公司、互联网公开案件和企业工商数据(例如,裁判文书网、国家企业信用信息公示系统等)。
一二模块102,用于根据每个第一案件信息对应的第一维度中的维度赋值将所述一个或者多个第一案件信息执行归类操作,以生成一个或者多个归类案件集合,其中,每个归类案件集合中包括一个或者多个所述第一案件信息,且该一个或者多个所述第一案件信息对应的第一维度中的维度赋值一致。例如,对于所述一个或者多个第一案件信息中的每个第一案件信息,网络设备先根据业务需求确定该第一案件信息的第一维度,该第一维度可以是侵权方的侵权行为信息、侵权方所在地信息或者侵权方的经营范围信息,该第一维度对应着至少一个维度赋值。
一三模块103,用于对所述一个或者多个归类案件集合中每个归类案件集合构建语义树,以获取所述每个归类案件集合中的目标特征标签信息,其中,所述目标特征标签信息包括第二维度对应的维度赋值以及第三维度对应的维度赋值。例如,对于每个归类案件集合,若网络设备选取的维度不一致或者排列的先后次序不一致,所构建的语义树也是不一致的,但是最终根据该语义树获得的该归类案件集合中的目标特征标签信息都是一致的。
一四模块104,用于根据所述目标特征标签信息在目标数据库中进行匹配查询以获得一个或者多个疑似侵权方信息,其中,所述目标特征标签信息与所述每个疑似侵权方信息对应的特征标签信息的相似度大于预设相似度阈值。其中,所述目标数据库包括网络设备提前从国家企业信用信息系统中爬取的企业工商数据,该目标数据库中包括多个企业的注册资本、经营范围、住所、经营状态等信息,例如,在网络设备获取每个归类案件信息的目标特征标签信息的前提下,网络设备基于该目标特征标签信息中的所述第二维度对应的维度赋值以及第三维度对应的维度赋值与所述目标数据库中的企业信息进行匹配,以获得匹配度较高的企业信息,并将该匹配度较高的企业信息作为一个或者多个疑似侵权方信息,其中,所述疑似侵权方信息包括疑似侵权的企业名称,网络设备将该疑似侵权方信息提供给律师以供律师进行线下人工调查。
在一些实施例中,所述第一案件信息满足以下至少任一项:
所述第一案件信息的结案时间与当前时间的时间差小于第一时长阈值;
所述第一案件信息的结案结果为胜诉;
所述第一案件信息的结案结果为诉讼调解;相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
在一些实施例中,一一模块101,用于
从第一数据源中获取第一原始数据;
对所述第一原始数据执行第一预设操作以获取一个或者多个第一案件信息。相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
在一些实施例中,所述对所述第一原始数据执行第一预设操作以获取一个或者多个第一案件信息包括:
对所述第一原始数据执行第一预设操作以获取一个或者多个候选第一案件信息;
根据预设维度从每个候选第一案件信息中提取与所述预设维度相关的信息以生成对应的第一案件信息。相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
在一些实施例中,所述预设维度包括以下至少任一项:
侵权方名称信息;
侵权方的侵权行为信息;
侵权方的经营规模信息;
侵权方所在地信息;
侵权方的侵权金额信息;
侵权方的注册资本信息;
侵权方的赔偿金额信息;
侵权方的经营范围信息;相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
在一些实施例中,所述对所述一个或者多个归类案件集合中每个归类案件集合构建语义树,包括:
对所述一个或者多个归类案件集合中每个归类案件集合,根据所述每个归类案件集合中的一个或者多个所述第一案件信息构建该每个归类案件集合的语义树。相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
在一些实施例中,所述根据所述每个归类案件集合中的一个或者多个所述第一案件信息构建该每个归类案件集合的语义树,包括:
对于所述每个归类案件集合中的一个或者多个所述第一案件信息,获取每个所述第一案件信息对应的第一维度、第二维度、第三维度以及第四维度的维度赋值;
按照所述第一维度、第二维度、第三维度、第四维度的顺序对一个或者多个所述第一案件信息中每个所述第一案件信息对应的第一维度、第二维度、第三维度以及第四维度的维度赋值进行分类以构建该每个归类案件集合的语义树。相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
在一些实施例中,所述按照所述第一维度、第二维度、第三维度、第四维度的顺序对一个或者多个所述第一案件信息中每个所述第一案件信息对应的第一维度、第二维度、第三维度以及第四维度的维度赋值进行分类以构建该每个归类案件集合的语义树,包括:
将所述每个所述第一案件信息对应的第一维度的维度赋值作为主要分支;
将所述每个所述第一案件信息对应的第二维度的维度赋值中相同的维度赋值进行合并,以作为所述主要分支的第一次要分支,其中,所述第一次要分支中包括一个或者多个合并后的维度赋值;
将所述每个所述第一案件信息对应的第三维度的维度赋值与所述一个或者多个合并后的维度赋值中每个合并后的维度赋值进行对应,以作为所述第一次要分支的第二次要分支;
将所述每个所述第一案件信息对应的第四维度的维度赋值与所述每个所述第一案件信息对应的第三维度的维度赋值进行对应,并将对应关系下所述第三维度的维度赋值相同的所述第四维度的维度赋值进行合并统计,以作为所述第二次要分支的第三次要分支;
根据所述主要分支、所述第一次要分支、所述第二次要分支、所述第三次要分支构建该每个归类案件集合的语义树。相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
在一些实施例中,所述获取所述每个归类案件集合中的目标特征标签信息,包括:
对于所述每个归类案件集合,获取该归类案件集合中所述第三次要分支中一个或者多个合并统计后的所述第四维度的维度赋值;
将所述一个或者多个合并统计后的所述第四维度的维度赋值进行正序排序,确定位于第一顺序的合并统计后的所述第四维度的维度赋值;
基于该维度赋值确定对应的所述第二次要分支中的第三维度对应的维度赋值、以及对应的所述第一次要分支中的第二维度对应的维度赋值;
将所述第四维度的维度赋值、上述第三维度对应的维度赋值以及上述第二维度对应的维度赋值中的至少一个维度赋值作为该归类案件集合中的目标特征标签信息。相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
在一些实施例中,一四模块104,用于
将所述目标特征标签信息中的所述第二维度对应的维度赋值以及第三维度对应的维度赋值作为索引信息;
通过预设搜索方式将所述索引信息在所述目标数据库中进行匹配查询,以获取一个或者多个候选疑似侵权方信息以及与每个候选疑似侵权方信息对应的评分字段信息;
根据所述每个候选疑似侵权方信息对应的评分字段信息从所述一个或者多个候选疑似侵权方信息中确定一个或者多个疑似侵权方信息。相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
在一些实施例中,所述根据所述每个候选疑似侵权方信息对应的评分字段信息从所述一个或者多个候选疑似侵权方信息中确定一个或者多个疑似侵权方信息包括:
检测所述一个或者多个候选疑似侵权方信息对应的评分字段信息中是否存在至少一个所述候选疑似侵权方信息的评分字段信息大于预设评分阈值,若是,将所述至少一个所述候选疑似侵权方信息作为一个或者多个疑似侵权方信息,其中,所述目标特征标签信息与所述每个候选疑似侵权方信息对应的特征标签信息的相似度与所述评分字段信息成正比。相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
在一些实施例中,所述根据所述每个候选疑似侵权方信息对应的评分字段信息从所述一个或者多个候选疑似侵权方信息中确定一个或者多个疑似侵权方信息包括:
根据所述每个候选疑似侵权方信息对应的评分字段信息从所述一个或者多个候选疑似侵权方信息中确定一个或者多个推荐疑似侵权方信息;
将所述一个或者多个推荐疑似侵权方信息在第二数据源中进行匹配查询以获取一个或者多个已侵权方信息;
将所述一个或者多个推荐疑似侵权方信息中的所述一个或者多个已侵权方信息进行过滤,以生成一个或者多个疑似侵权方信息。相关操作与图1所示实施例相同或相近,故不再赘述,在此以引用方式包含于此。
除上述各实施例介绍的方法和设备外,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如前任一项所述的方法被执行。
本申请还提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时,如前任一项所述的方法被执行。
本申请还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序;
当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如前任一项所述的方法。
图6示出了可被用于实施本申请中所述的各个实施例的示例性系统;
如图6所示在一些实施例中,系统300能够作为各所述实施例中的任意一个设备。在一些实施例中,系统300可包括具有指令的一个或多个计算机可读介质(例如,系统存储器或NVM/存储设备320)以及与该一个或多个计算机可读介质耦合并被配置为执行指令以实现模块从而执行本申请中所述的动作的一个或多个处理器(例如,(一个或多个)处理器305)。
对于一个实施例,系统控制模块310可包括任意适当的接口控制器,以向(一个或多个)处理器305中的至少一个和/或与系统控制模块310通信的任意适当的设备或组件提供任意适当的接口。
系统控制模块310可包括存储器控制器模块330,以向系统存储器315提供接口。存储器控制器模块330可以是硬件模块、软件模块和/或固件模块。
系统存储器315可被用于例如为系统300加载和存储数据和/或指令。对于一个实施例,系统存储器315可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,系统存储器315可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。
对于一个实施例,系统控制模块310可包括一个或多个输入/输出(I/O)控制器,以向NVM/存储设备320及(一个或多个)通信接口325提供接口。
例如,NVM/存储设备320可被用于存储数据和/或指令。NVM/存储设备320可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。
NVM/存储设备320可包括在物理上作为系统300被安装在其上的设备的一部分的存储资源,或者其可被该设备访问而不必作为该设备的一部分。例如,NVM/存储设备320可通过网络经由(一个或多个)通信接口325进行访问。
(一个或多个)通信接口325可为系统300提供接口以通过一个或多个网络和/或与任意其他适当的设备通信。系统300可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信。
对于一个实施例,(一个或多个)处理器305中的至少一个可与系统控制模块310的一个或多个控制器(例如,存储器控制器模块330)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器305中的至少一个可与系统控制模块310的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例,(一个或多个)处理器305中的至少一个可与系统控制模块310的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器305中的至少一个可与系统控制模块310的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。
在各个实施例中,系统300可以但不限于是:服务器、工作站、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)。在各个实施例中,系统300可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,系统300包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。本领域技术人员应能理解,计算机程序指令在计算机可读介质中的存在形式包括但不限于源文件、可执行文件、安装包文件等,相应地,计算机程序指令被计算机执行的方式包括但不限于:该计算机直接执行该指令,或者该计算机编译该指令后再执行对应的编译后程序,或者该计算机读取并执行该指令,或者该计算机读取并安装该指令后再执行对应的安装后程序。在此,计算机可读介质可以是可供计算机访问的任意可用的计算机可读存储介质或通信介质。
通信介质包括藉此包含例如计算机可读指令、数据结构、程序模块或其他数据的通信信号被从一个系统传送到另一系统的介质。通信介质可包括有导的传输介质(诸如电缆和线(例如,光纤、同轴等))和能传播能量波的无线(未有导的传输)介质,诸如声音、电磁、RF、微波和红外。计算机可读指令、数据结构、程序模块或其他数据可被体现为例如无线介质(诸如载波或诸如被体现为扩展频谱技术的一部分的类似机制)中的已调制数据信号。术语“已调制数据信号”指的是其一个或多个特征以在信号中编码信息的方式被更改或设定的信号。调制可以是模拟的、数字的或混合调制技术。
作为示例而非限制,计算机可读存储介质可包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据的信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动的介质。例如,计算机可读存储介质包括,但不限于,易失性存储器,诸如随机存储器(RAM,DRAM,SRAM);以及非易失性存储器,诸如闪存、各种只读存储器(ROM,PROM,EPROM,EEPROM)、磁性和铁磁/铁电存储器(MRAM,FeRAM);以及磁性和光学存储设备(硬盘、磁带、CD、DVD);或其它现在已知的介质或今后开发的能够存储供计算机系统使用的计算机可读信息/数据。
在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
Claims (15)
1.一种用于获取侵权线索的方法,应用于网络设备端,其中,该方法包括:
从第一数据源中获取一个或者多个第一案件信息;
根据每个第一案件信息对应的第一维度中的维度赋值将所述一个或者多个第一案件信息执行归类操作,以生成一个或者多个归类案件集合,其中,每个归类案件集合中包括一个或者多个所述第一案件信息,且该一个或者多个所述第一案件信息对应的第一维度中的维度赋值一致;
对所述一个或者多个归类案件集合中每个归类案件集合构建语义树,以获取所述每个归类案件集合中的目标特征标签信息,其中,所述目标特征标签信息包括第二维度对应的维度赋值以及第三维度对应的维度赋值,所述语义树包括将该归类案件集合中的每个第一案件信息按照至少一个维度进行树形排列;
根据所述目标特征标签信息在目标数据库中进行匹配查询以获得一个或者多个疑似侵权方信息,其中,所述目标特征标签信息与所述每个疑似侵权方信息对应的特征标签信息的相似度大于预设相似度阈值。
2.根据权利要求1所述的方法,其中,所述第一案件信息满足以下至少任一项:
所述第一案件信息的结案时间与当前时间的时间差小于第一时长阈值;
所述第一案件信息的结案结果为胜诉;
所述第一案件信息的结案结果为诉讼调解。
3.根据权利要求1所述的方法,其中,所述从第一数据源中获取一个或者多个第一案件信息包括:
从第一数据源中获取第一原始数据;
对所述第一原始数据执行第一预设操作以获取一个或者多个第一案件信息。
4.根据权利要求3所述的方法,其中,所述对所述第一原始数据执行第一预设操作以获取一个或者多个第一案件信息包括:
对所述第一原始数据执行第一预设操作以获取一个或者多个候选第一案件信息;
根据预设维度从每个候选第一案件信息中提取与所述预设维度相关的信息以生成对应的第一案件信息。
5.根据权利要求4所述的方法,其中,所述预设维度包括以下至少任一项:
侵权方名称信息;
侵权方的侵权行为信息;
侵权方的经营规模信息;
侵权方所在地信息;
侵权方的侵权金额信息;
侵权方的注册资本信息;
侵权方的赔偿金额信息;
侵权方的经营范围信息。
6.根据权利要求1所述的方法,其中,所述对所述一个或者多个归类案件集合中每个归类案件集合构建语义树,包括:
对所述一个或者多个归类案件集合中每个归类案件集合,根据所述每个归类案件集合中的一个或者多个所述第一案件信息构建该每个归类案件集合的语义树。
7.根据权利要求6所述的方法,其中,所述根据所述每个归类案件集合中的一个或者多个所述第一案件信息构建该每个归类案件集合的语义树,包括:
对于所述每个归类案件集合中的一个或者多个所述第一案件信息,获取每个所述第一案件信息对应的第一维度、第二维度、第三维度以及第四维度的维度赋值;
按照所述第一维度、第二维度、第三维度、第四维度的顺序对一个或者多个所述第一案件信息中每个所述第一案件信息对应的第一维度、第二维度、第三维度以及第四维度的维度赋值进行分类以构建该每个归类案件集合的语义树。
8.根据权利要求7所述的方法,其中,所述按照所述第一维度、第二维度、第三维度、第四维度的顺序对一个或者多个所述第一案件信息中每个所述第一案件信息对应的第一维度、第二维度、第三维度以及第四维度的维度赋值进行分类以构建该每个归类案件集合的语义树,包括:
将所述每个所述第一案件信息对应的第一维度的维度赋值作为主要分支;
将所述每个所述第一案件信息对应的第二维度的维度赋值中相同的维度赋值进行合并,以作为所述主要分支的第一次要分支,其中,所述第一次要分支中包括一个或者多个合并后的维度赋值;
将所述每个所述第一案件信息对应的第三维度的维度赋值与所述一个或者多个合并后的维度赋值中每个合并后的维度赋值进行对应,以作为所述第一次要分支的第二次要分支;
将所述每个所述第一案件信息对应的第四维度的维度赋值与所述每个所述第一案件信息对应的第三维度的维度赋值进行对应,并将对应关系下所述第三维度的维度赋值相同的所述第四维度的维度赋值进行合并统计,以作为所述第二次要分支的第三次要分支;
根据所述主要分支、所述第一次要分支、所述第二次要分支、所述第三次要分支构建该每个归类案件集合的语义树。
9.根据权利要求8所述的方法,其中,所述获取所述每个归类案件集合中的目标特征标签信息,包括:
对于所述每个归类案件集合,获取该归类案件集合中所述第三次要分支中一个或者多个合并统计后的所述第四维度的维度赋值;
将所述一个或者多个合并统计后的所述第四维度的维度赋值进行正序排序,确定位于第一顺序的合并统计后的所述第四维度的维度赋值;
基于该维度赋值确定对应的所述第二次要分支中的第三维度对应的维度赋值、以及对应的所述第一次要分支中的第二维度对应的维度赋值;
将所述第四维度的维度赋值、上述第三维度对应的维度赋值以及上述第二维度对应的维度赋值中的至少一个维度赋值作为该归类案件集合中的目标特征标签信息。
10.根据权利要求1至9中任一项所述的方法,其中,所述根据所述目标特征标签信息在目标数据库中进行匹配查询以获得一个或者多个疑似侵权方信息,其中,所述目标特征标签信息与所述每个疑似侵权方信息对应的特征标签信息的相似度大于预设相似度阈值包括:
将所述目标特征标签信息中的所述第二维度对应的维度赋值以及第三维度对应的维度赋值作为索引信息;
通过预设搜索方式将所述索引信息在所述目标数据库中进行匹配查询,以获取一个或者多个候选疑似侵权方信息以及与每个候选疑似侵权方信息对应的评分字段信息;
根据所述每个候选疑似侵权方信息对应的评分字段信息从所述一个或者多个候选疑似侵权方信息中确定一个或者多个疑似侵权方信息。
11.根据权利要求10所述的方法,其中,所述根据所述每个候选疑似侵权方信息对应的评分字段信息从所述一个或者多个候选疑似侵权方信息中确定一个或者多个疑似侵权方信息包括:
检测所述一个或者多个候选疑似侵权方信息对应的评分字段信息中是否存在至少一个所述候选疑似侵权方信息的评分字段信息大于预设评分阈值,若是,将所述至少一个所述候选疑似侵权方信息作为一个或者多个疑似侵权方信息,其中,所述目标特征标签信息与所述每个候选疑似侵权方信息对应的特征标签信息的相似度与所述评分字段信息成正比。
12.根据权利要求10所述的方法,其中,所述根据所述每个候选疑似侵权方信息对应的评分字段信息从所述一个或者多个候选疑似侵权方信息中确定一个或者多个疑似侵权方信息包括:
根据所述每个候选疑似侵权方信息对应的评分字段信息从所述一个或者多个候选疑似侵权方信息中确定一个或者多个推荐疑似侵权方信息;
将所述一个或者多个推荐疑似侵权方信息在第二数据源中进行匹配查询以获取一个或者多个已侵权方信息;
将所述一个或者多个推荐疑似侵权方信息中的所述一个或者多个已侵权方信息进行过滤,以生成一个或者多个疑似侵权方信息。
13.一种计算机装置/设备/系统,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现如权利要求1至12中任一项所述方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现如权利要求1至12中任一项所述方法的步骤。
15.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至12中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110482369.0A CN113268613B (zh) | 2021-04-30 | 2021-04-30 | 一种用于获取侵权线索的方法、设备、介质及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110482369.0A CN113268613B (zh) | 2021-04-30 | 2021-04-30 | 一种用于获取侵权线索的方法、设备、介质及程序产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113268613A CN113268613A (zh) | 2021-08-17 |
CN113268613B true CN113268613B (zh) | 2024-04-09 |
Family
ID=77229856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110482369.0A Active CN113268613B (zh) | 2021-04-30 | 2021-04-30 | 一种用于获取侵权线索的方法、设备、介质及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113268613B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106919700A (zh) * | 2017-03-09 | 2017-07-04 | 华北电力大学 | 基于并行化cep处理的语义驱动犯罪线索实时推荐方法 |
CN109256216A (zh) * | 2018-08-14 | 2019-01-22 | 平安医疗健康管理股份有限公司 | 医学数据处理方法、装置、计算机设备和存储介质 |
WO2020107484A1 (zh) * | 2018-11-30 | 2020-06-04 | 华为技术有限公司 | 一种acl的规则分类方法、查找方法和装置 |
CN111858834A (zh) * | 2020-07-30 | 2020-10-30 | 平安国际智慧城市科技股份有限公司 | 基于ai的案件争议焦点确定方法、装置、设备及介质 |
CN111930951A (zh) * | 2020-09-21 | 2020-11-13 | 江苏恒维智信息技术有限公司 | 专利侵权线索识别方法、系统、存储介质及设备 |
CN111930933A (zh) * | 2020-05-29 | 2020-11-13 | 深圳壹账通智能科技有限公司 | 一种基于人工智能的检务案件处理方法及装置 |
CN112163072A (zh) * | 2020-09-30 | 2021-01-01 | 北京金堤征信服务有限公司 | 基于多数据源的数据处理方法以及装置 |
CN112507160A (zh) * | 2020-12-03 | 2021-03-16 | 平安科技(深圳)有限公司 | 商标侵权的自动化判定方法、装置、电子设备和存储介质 |
WO2021072885A1 (zh) * | 2019-10-18 | 2021-04-22 | 平安科技(深圳)有限公司 | 识别文本的方法、装置、设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2613034C2 (ru) * | 2010-11-16 | 2017-03-14 | Тибко Софтвеар Инк. | Быстрое установление соответствия при адресации по содержанию (контенту) |
US20200098071A1 (en) * | 2018-09-21 | 2020-03-26 | Jay M. Jackson | Mass tort management, investment, and procurement module |
CN111382352B (zh) * | 2020-03-02 | 2021-03-26 | 腾讯科技(深圳)有限公司 | 数据推荐方法、装置、计算机设备以及存储介质 |
-
2021
- 2021-04-30 CN CN202110482369.0A patent/CN113268613B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106919700A (zh) * | 2017-03-09 | 2017-07-04 | 华北电力大学 | 基于并行化cep处理的语义驱动犯罪线索实时推荐方法 |
CN109256216A (zh) * | 2018-08-14 | 2019-01-22 | 平安医疗健康管理股份有限公司 | 医学数据处理方法、装置、计算机设备和存储介质 |
WO2020107484A1 (zh) * | 2018-11-30 | 2020-06-04 | 华为技术有限公司 | 一种acl的规则分类方法、查找方法和装置 |
WO2021072885A1 (zh) * | 2019-10-18 | 2021-04-22 | 平安科技(深圳)有限公司 | 识别文本的方法、装置、设备及存储介质 |
CN111930933A (zh) * | 2020-05-29 | 2020-11-13 | 深圳壹账通智能科技有限公司 | 一种基于人工智能的检务案件处理方法及装置 |
CN111858834A (zh) * | 2020-07-30 | 2020-10-30 | 平安国际智慧城市科技股份有限公司 | 基于ai的案件争议焦点确定方法、装置、设备及介质 |
CN111930951A (zh) * | 2020-09-21 | 2020-11-13 | 江苏恒维智信息技术有限公司 | 专利侵权线索识别方法、系统、存储介质及设备 |
CN112163072A (zh) * | 2020-09-30 | 2021-01-01 | 北京金堤征信服务有限公司 | 基于多数据源的数据处理方法以及装置 |
CN112507160A (zh) * | 2020-12-03 | 2021-03-16 | 平安科技(深圳)有限公司 | 商标侵权的自动化判定方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113268613A (zh) | 2021-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gupta et al. | A study of big data evolution and research challenges | |
Ciocca et al. | Learning CNN-based features for retrieval of food images | |
US10078632B2 (en) | Collecting training data using anomaly detection | |
US20110264651A1 (en) | Large scale entity-specific resource classification | |
US10956469B2 (en) | System and method for metadata correlation using natural language processing | |
CN107301195A (zh) | 生成用于搜索内容的分类模型方法、装置和数据处理系统 | |
CN111797239A (zh) | 应用程序的分类方法、装置及终端设备 | |
CN111538903B (zh) | 搜索推荐词确定方法、装置、电子设备及计算机可读介质 | |
US20150127657A1 (en) | Method and Computer for Indexing and Searching Structures | |
CN112685534B (zh) | 在创作过程中生成已创作内容的脉络信息的方法与设备 | |
CN113901169A (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN114357184A (zh) | 事项推荐方法及相关装置、电子设备和存储介质 | |
Araújo et al. | Tensorcast: forecasting time-evolving networks with contextual information | |
WO2021055868A1 (en) | Associating user-provided content items to interest nodes | |
CN113268613B (zh) | 一种用于获取侵权线索的方法、设备、介质及程序产品 | |
CN116860311A (zh) | 脚本分析方法、装置、计算机设备及存储介质 | |
US20230230408A1 (en) | Methods, systems, articles of manufacture, and apparatus for decoding images | |
Voronov et al. | Forecasting popularity of news article by title analyzing with BN-LSTM network | |
Mandal et al. | Improving it support by enhancing incident management process with multi-modal analysis | |
CN114996400A (zh) | 裁判文书处理方法、装置、电子设备及存储介质 | |
US11120204B2 (en) | Comment-based article augmentation | |
AU2019290658B2 (en) | Systems and methods for identifying and linking events in structured proceedings | |
CN113344674A (zh) | 基于用户购买力的产品推荐方法、装置、设备及存储介质 | |
CN113505117A (zh) | 基于数据指标的数据质量评估方法、装置、设备及介质 | |
CN113761213A (zh) | 一种基于知识图谱的数据查询系统、方法及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |