CN105808769A - 面向大数据及普通数据的数据采集方法和系统 - Google Patents

面向大数据及普通数据的数据采集方法和系统 Download PDF

Info

Publication number
CN105808769A
CN105808769A CN201610164530.9A CN201610164530A CN105808769A CN 105808769 A CN105808769 A CN 105808769A CN 201610164530 A CN201610164530 A CN 201610164530A CN 105808769 A CN105808769 A CN 105808769A
Authority
CN
China
Prior art keywords
credibility
data
collected object
target data
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610164530.9A
Other languages
English (en)
Inventor
朱定局
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN201610164530.9A priority Critical patent/CN105808769A/zh
Publication of CN105808769A publication Critical patent/CN105808769A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/61Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2219Large Object storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种数据采集方法和系统,其方法包括:获取目标数据,以及获取对应所述目标数据的个体可信度,判断个体可信度是否大于或等于预设值,若是则采集目标数据存入目标数据库或大数据存储库。通过根据个体可信度和预设值对目标数据进行筛选,当个体可信度大于或等于预设值时才采集对应的目标数据,避免采集到不可靠的数据,提高数据采集的正确率。

Description

面向大数据及普通数据的数据采集方法和系统
技术领域
本发明涉及数据处理技术领域,特别是涉及一种面向大数据及普通数据的数据采集方法和系统。
背景技术
对数据进行采集时,例如对大数据进行采集,传统的方法通常只是根据系统或数据库指定需要的数据类型进行采集后,直接将被采集数据存入系统或数据库以备用。例如,存放语言信息的语言数据库需要某个字词的正确释义或发音时,直接采集有这个字词释义或发音的语言信息放入语言数据库,而不会检验被采集的语言信息对该字词的释义或发音是否正确。对于被采集数据的来源可信度不明确的情况,这种传统的数据采集方法不会对数据的正确性进行检验,采集正确率低。
发明内容
基于此,有必要针对上述问题,提供一种可以提高数据采集正确率的数据采集方法和系统。
一种数据采集方法,包括如下步骤:
获取目标数据,以及获取对应所述目标数据的个体可信度;
判断所述个体可信度是否大于或等于预设值;
若是,则采集所述目标数据存入目标数据库或大数据存储库。
一种数据采集系统,包括:
数据获取模块,用于获取目标数据,以及获取对应所述目标数据的个体可信度;
可信度分析模块,用于判断所述个体可信度是否大于或等于预设值;
数据采集模块,用于在所述个体可信度大于或等于预设值时,采集所述目标数据存入目标数据库或大数据存储库。
上述数据的数据采集方法和系统,获取目标数据以及对应目标数据的个体可信度后,判断个体可信度是否大于或等于预设值,在个体可信度大于或等于预设值时采集目标数据存入目标数据库或大数据存储库。通过根据个体可信度和预设值对目标数据进行筛选,当个体可信度大于或等于预设值时才采集对应的目标数据,避免采集到不可靠的数据,提高数据采集的正确率。
附图说明
图1为一实施例中本发明数据采集方法的流程图;
图2为一实施例中根据身份信息查找被采集对象的可信度,将被采集对象的可信度作为对应目标数据的个体可信度的流程图;
图3为另一实施例中本发明数据采集方法的流程图;
图4为一实施例中根据反馈信息修正被采集对象的可信度得到被采集对象新的初始可信度的流程图;
图5为一实施例中本发明数据采集系统的模块图;
图6为另一实施例中本发明数据采集系统的模块图;
图7为一实施例中可信度修正模块的单元图。
具体实施方式
大数据指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,具有数量巨大、难于收集、处理、分析等特点。
本发明所指的普通数据指非大数据。
参考图1,本发明一实施例中的一种数据采集方法,面向大数据及普通数据,包括以下步骤。
S110:获取目标数据,以及获取对应目标数据的个体可信度。
目标数据指待采集的大数据或普通数据,可以是根据指定的采集条件获取目标数据,也可以是用户上传数据后自动获取以作为目标数据。
在其中一实施例中,目标数据包括文本信息和/或语音信息。例如,可以是某个字词的文本信息、普通话发音信息、某种方言发音信息等。
个体可信度指作为个体的人或事物被信赖的程度,是根据经验对作为个体的人或事物为真的相信程度。
在其中一实施例中,步骤S110具体包括步骤11和步骤12。
步骤11:获取目标数据及提供目标数据的被采集对象的身份信息。
被采集对象的身份信息指用于识别被采集对象身份的信息。每一个被采集对象对应一个唯一的身份信息。本实施例中,被采集对象为人,即目标数据由被采集人提供。例如,目标数据为某字词的语音信息,该语音消息由用户A录制,则用户A为该目标数据的被采集对象。具体地,本实施例中,被采集对象的身份信息为被采集人的身份证号码。可以理解,在其他的实施例中,被采集对象也可以是网站等,对应地,被采集对象的身份信息为网址。
步骤12:根据身份信息查找被采集对象的可信度,将被采集对象的可信度作为对应目标数据的个体可信度。
例如,目标数据包括某字词的文本信息和/或语音信息的实施例中,步骤12具体为从语言数据库获取被采集对象的可信度。其中,语言数据库包括多个文本信息和/或语音信息、每个文本信息和/或语音信息的被采集对象的身份信息、每个身份信息的可信度,并且包括文本信息和/或语音信息、身份信息以及可信度之间的关联关系。
可以理解,在其他的实施例中,个体可信度也可以是对应目标数据预先存储,即每一个目标数据对应一个个体可信度,只要获取了目标数据,即可根据关联性对应获取个体可信度。
S130:判断个体可信度是否大于或等于预设值。若否,则表示当前获取的该目标数据不满足要求,可能为错误数据,不采集;若是,则执行步骤S150。
其中,预设值可以根据需要的数据采集正确率进行具体设置。本实施例中,预设值为0.6。可以理解,在其他实施例中,若对数据采集正确率要求较高,则适当设置增加预设值,例如0.8;若对数据采集正确率要求较低,则适当设置减小预设值,例如0.5。
S150:采集目标数据存入目标数据库或大数据存储库。
其中,目标数据库指用于存储普通数据的传统数据库,例如关系型数据库;大数据存储库指用于存储大数据的存储库。当采集的数据为普通数据时,存入目标数据库,当采集的数据为大数据时,存入大数据存储库。
例如,目标数据为某字词的文本信息和/或语音信息的实施例中,采集目标数据存入语言数据库。
通过将个体可信度大于或等于预设值的目标数据采集存入目标数据库或大数据存储库,根据个体可信度对目标数据进行筛选,可以提高数据采集的正确率。
在其中一实施例中,参考图2,步骤12包括步骤S112至步骤S118。
S112:根据身份信息判断目标数据库或大数据存储库中是否存在对应被采集对象的初始可信度。若是,则执行步骤S114;若否,则执行步骤S116。
S114:将初始可信度作为被采集对象的可信度。
S116:将预设可信度作为被采集对象的可信度。
S118:将被采集对象的可信度作为对应目标数据的个体可信度。
预设可信度可以根据实际情况具体设置。本实施例中,预设可信度为0.5。
通过判断是否存在被采集对象的初始可信度,若否则默认预设可信度作为被采集对象的可信度,可以保证每一个被采集人都对应一个可信度,从而避免出现目标数据不存在对应的个体可信度的情况。
在其中一实施例中,步骤S150之后,参考图3,还包括步骤S170和步骤S190。
S170:获取目标数据的反馈信息。
其中,反馈信息指用户对目标数据是否正确的反馈。例如,反馈信息可以包括“正确”或类似含义的信息,以及“错误”或类似含义的信息。
S190:根据反馈信息修正被采集对象的可信度得到被采集对象新的初始可信度,并将新的初始可信度与被采集对象关联存储至目标数据库或大数据存储库中。
通过以用户的反馈为依据对被采集对象的初始可信度进行修正,可以及时提高初始可信度的准确性,可以给后续数据采集提供更准确的参考,提高数据采集的正确率。
在其中一实施例中,反馈信息的类型包括正反馈和负反馈。例如“正确”表示正反馈,“错误”表示负反馈。参考图4,步骤S190中根据反馈信息修正被采集对象的可信度得到被采集对象新的初始可信度的步骤包括步骤S191至步骤S195。
S191:判断反馈信息的类型是否为正反馈。若是,表示该目标数据正确,执行步骤S193,若否,表示目标数据错误,反馈信息的类型为负反馈,执行步骤S195。
S193:按预设差值提高被采集对象的可信度得到被采集对象新的初始可信度。
S195:按预设差值降低被采集对象的可信度得到被采集对象新的初始可信度。
预设差值可以根据实际情况具体设置。例如,本实施例中,预设预值0.1。因此,每获得一次正反馈,对应被采集对象的初始可信度在原来的基础上提高0.1;每获得一次负反馈,对应被采集对象的初始可信度在原来的基础上降低0.1。
本实施例中,初始可信度为大于等于0且小于等于1。步骤S193具体为:
Y=min(1,(X+0.1));
步骤S195具体为:
Y=max(0,(X-0.1));
其中,X为修正之前被采集对象的初始可信度,Y为修正后被采集对象的初始可信度。
在另一实施例中,步骤S150之后,还包括步骤22至步骤25。
步骤22:获取目标数据的反馈信息。
步骤23:根据反馈信息修正个体可信度得到新的个体可信度。
步骤24:判断新的个体可信度是否大于或等于预设值。若否,则执行步骤25。
步骤25:删除目标数据。
通过以反馈信息为依据,对采集之后的目标数据对应的个体可信度进行修正,若修正之后的新的个体可信度小于预设值,则表示该目标数据不符合要求,将其删除,从而对目标数据库或大数据存储库进行及时清理,提高目标数据库或大数据存储库存储数据的整体合格率。
上述数据采集方法,获取目标数据以及对应目标数据的个体可信度后,判断个体可信度是否大于或等于预设值,在个体可信度大于或等于预设值时采集目标数据存入目标数据库或大数据存储库。通过根据个体可信度和预设值对目标数据进行筛选,当个体可信度大于或等于预设值时才采集对应的目标数据,避免采集到不可靠的数据,提高数据采集的正确率。
参考图5,本发明一实施例中的一种数据采集系统,面向大数据及普通数据,包括数据获取模块110、可信度分析模块130和数据采集模块150。
数据获取模块110用于获取目标数据,以及获取对应目标数据的个体可信度。
目标数据指待采集数据的大数据或普通数据,可以是根据指定的采集条件获取目标数据,也可以是用户上传数据后自动获取以作为目标数据。
在其中一实施例中,目标数据包括文本信息和/或语音信息。例如,可以是某个字词的文本信息、普通话发音信息、某种方言发音信息等。
个体可信度指作为个体的人或事物被信赖的程度,是根据经验对作为个体的人或事物为真的相信程度。
在其中一实施例中,数据获取模块110包括目标及身份获取单元(图未示)和可信度获取单元(图未示)。
目标及身份获取单元用于获取目标数据及提供目标数据的被采集对象的身份信息。被采集对象的身份信息指用于识别被采集对象身份的信息。每一个被采集对象对应一个唯一的身份信息。
本实施例中,被采集对象为人,即目标数据由被采集人提供。例如,目标数据为某字词的语音信息,该语音消息由用户A录制,则用户A为该目标数据的被采集对象。具体地,本实施例中,被采集对象的身份信息为身份证号码。可以理解,在其他的实施例中,被采集对象也可以是网站等,对应地,被采集对象的身份信息为网址。
可信度获取单元用于根据身份信息查找被采集对象的可信度,将被采集对象的可信度作为对应目标数据的个体可信度。例如,目标数据包括某字词的文本信息和/或语音信息的实施例中,可信度获取单元具体为从语言数据库获取被采集对象对应的可信度。其中,语言数据库包括多个文本信息和/或语音信息、每个文本信息和/或语音信息的被采集对象的身份信息、每个身份信息的可信度,并且包括文本信息和/或语音信息与身份信息以及可信度之间的关联关系。
可以理解,在其他的实施例中,个体可信度也可以是对应目标数据预先存储,即每一个目标数据对应一个个体可信度,只要获取了目标数据,即可根据关联性对应获取个体可信度。
可信度分析模块130用于判断个体可信度是否大于或等于预设值。若否,则表示当前获取的该目标数据不满足要求,可能为错误数据,不采集;若是,则表示获取的该目标数据满足要求。
其中,预设值可以根据需要的数据采集正确率进行具体设置。本实施例中,预设值为0.6。可以理解,在其他实施例中,若对数据采集正确率要求较高,则适当设置增加预设值,例如0.8;若对数据采集正确率要求较低,则适当设置减小预设值,例如0.5。
数据采集模块150用于在个体可信度大于或等于预设值时,采集目标数据存入目标数据库或大数据存储库。其中,目标数据库指用于存储普通数据的传统数据库,例如关系型数据库;大数据存储库指用于存储大数据的存储库。当采集的数据为普通数据时,存入目标数据库,当采集的数据为大数据时,存入大数据存储库。
通过将个体可信度大于或等于预设值的目标数据采集存入目标数据库或大数据存储库,根据个体可信度对目标数据进行筛选,可以提高数据采集的正确率。例如,目标数据为某字词的文本信息和/或语音信息的实施例中,采集目标数据存入语言数据库。
在其中一实施例中,可信度获取单元具体用于根据身份信息判断目标数据库或大数据存储库中是否存在被采集对象的初始可信度,在存在被采集对象的初始可信度时,将初始可信度作为被采集对象的可信度,否则,将预设可信度作为被采集对象的可信度,以及用于将被采集对象的可信度作为对应目标数据的个体可信度。
预设可信度可以根据实际情况具体设置。本实施例中,预设可信度为0.5。
通过判断是否存在被采集对象的初始可信度,若否则默认预设可信度作为被采集对象的可信度,可以保证每一个被采集人都对应一个个体可信度,从而避免出现目标数据不存在对应的个体可信度的情况。
在其中一实施例中,参考图6,上述数据采集系统还包括反馈信息获取模块170和可信度修正模块190。
反馈信息获取模块170用于获取目标数据的反馈信息。
其中,反馈信息指用户对目标数据是否正确的反馈。例如,反馈信息可以包括“正确”或类似含义的信息,以及“错误”或类似含义的信息。
可信度修正模块190用于根据反馈信息修正被采集对象的可信度得到被采集对象新的初始可信度,并将新的初始可信度与被采集对象关联存储至目标数据库或大数据存储库中。
通过以用户的反馈为依据对被采集对象的初始可信度进行修正,可以及时提高初始可信度的准确性,可以给后续数据采集提供更准确的参考,从而提高数据采集的正确率。
在其中一实施例中,反馈信息的类型包括正反馈和负反馈。例如“正确”表示正反馈,“错误”表示负反馈。参考图7,可信度修正模块190包括反馈信息判断单元191、可信度提高单元193、可信度降低单元195和数据存储单元197。
反馈信息判断单元191用于判断反馈信息的类型是否为正反馈。若是,表示该目标数据正确;若否,表示反馈信息的类型为负反馈,目标数据错误。
可信度提高单元193用于在反馈信息的类型为正反馈时,按预设差值提高被采集对象的可信度得到被采集对象新的初始可信度。
可信度降低单元195用于在反馈信息的类型为负反馈时,按预设差值降低被采集对象的可信度得到被采集对象新的初始可信度。
数据存储单元197用于将新的初始可信度与被采集对象关联存储至目标数据库或大数据存储库中。通过将修正后的初始可信度与被采集对象关联存储,便于后续使用。
其中,预设差值可以根据实际情况具体设置。例如,本实施例中,预设预值0.1。因此,每获得一次正反馈,可信度提高单元193将被采集对象的初始可信度在原来的基础上提高0.1;每获得一次负反馈,可信度降低单元195将被采集对象的初始可信度在原来的基础上降低0.1。
本实施例中,初始可信度为大于等于0且小于等于1。反馈信息判断单元191具体根据:
Y=min(1,(X+0.1));
获取新的初始可信度。可信度降低单元195具体根据:
Y=max(0,(X-0.1));
获取新的初始可信度。其中,X为修正之前的被采集对象的初始可信度,Y为修正后的被采集对象的初始可信度。
在其中一实施例中,数据采集系统还包括数据整理模块(图未示),用于获取目标数据的反馈信息,根据反馈信息修正个体可信度得到新的个体可信度,判断新的个体可信度是否大于或等于预设值。若否,删除目标数据。
数据整理模块通过以反馈信息为依据,对采集之后的目标数据对应的个体可信度进行修正,若修正之后的新的个体可信度小于预设值,则表示该目标数据不符合要求,将其删除,从而对目标数据库或大数据存储库进行及时清理,提高目标数据库或大数据存储库存储数据的整体合格率。
上述数据采集系统,数据获取模块110获取目标数据以及对应目标数据的个体可信度,可信度分析模块130判断个体可信度是否大于或等于预设值,数据采集模块150在个体可信度大于或等于预设值时采集目标数据存入目标数据库或大数据存储库。通过根据个体可信度和预设值对目标数据进行筛选,当个体可信度大于或等于预设值时才采集对应的目标数据,避免采集到不可靠的数据,提高数据采集的正确率。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种数据采集方法,其特征在于,包括如下步骤:
获取目标数据,以及获取对应所述目标数据的个体可信度;
判断所述个体可信度是否大于或等于预设值;
若是,则采集所述目标数据存入目标数据库或大数据存储库。
2.根据权利要求1所述的数据采集方法,其特征在于,所述获取目标数据,以及获取对应所述目标数据的个体可信度的步骤包括:
获取目标数据及提供所述目标数据的被采集对象的身份信息;
根据所述身份信息查找所述被采集对象的可信度,将所述被采集对象的可信度作为对应所述目标数据的个体可信度。
3.根据权利要求2所述的数据采集方法,其特征在于,所述根据所述身份信息查找所述被采集对象的可信度,将所述被采集对象的可信度作为对应所述目标数据的个体可信度的步骤包括:
根据所述身份信息判断所述目标数据库或所述大数据存储库中是否存在所述被采集对象的初始可信度;
若是,则将所述初始可信度作为所述被采集对象的可信度;
若否,则将预设可信度作为所述被采集对象的可信度;
将所述被采集对象的可信度作为对应所述目标数据的个体可信度。
4.根据权利要求3所述的数据采集方法,其特征在于,所述采集所述目标数据存入目标数据库或大数据存储库的步骤之后,还包括:
获取所述目标数据的反馈信息;
根据所述反馈信息修正所述被采集对象的可信度得到所述被采集对象新的初始可信度,并将所述新的初始可信度与所述被采集对象关联存储至所述目标数据库或所述大数据存储库中。
5.根据权利要求4中任意一项所述的数据采集方法,其特征在于,所述根据所述反馈信息修正所述被采集对象的可信度得到所述被采集对象新的初始可信度的步骤包括:
判断所述反馈信息的类型是否为正反馈;
若是,则按预设差值提高所述被采集对象的可信度得到所述被采集对象新的初始可信度;
若否,则按预设差值降低所述被采集对象的可信度得到所述被采集对象新的初始可信度。
6.根据权利要求1-3中任意一项所述的数据采集方法,其特征在于,所述采集所述目标数据存入目标数据库或大数据存储库的步骤之后,还包括:
获取所述目标数据的反馈信息;
根据所述反馈信息修正所述个体可信度得到新的个体可信度;
判断所述新的个体可信度是否大于或等于所述预设值;
若否,则删除所述目标数据。
7.一种数据采集系统,其特征在于,包括:
数据获取模块,用于获取目标数据,以及获取对应所述目标数据的个体可信度;
可信度分析模块,用于判断所述个体可信度是否大于或等于预设值;
数据采集模块,用于在所述个体可信度大于或等于预设值时,采集所述目标数据存入目标数据库或大数据存储库。
8.根据权利要求7所述的数据采集系统,其特征在于,所述数据获取模块包括;
目标及身份获取单元,用于获取所述目标数据及提供所述目标数据的被采集的身份信息;
可信度获取单元,用于根据所述身份信息查找所述被采集对象的可信度,将所述被采集对象的可信度作为对应所述目标数据的个体可信度。
9.根据权利要求8所述的数据采集系统,其特征在于,所述可信度获取单元具体用于:
根据所述身份信息判断所述目标数据库或所述大数据存储库中是否存在所述被采集对象的初始可信度,在存在所述被采集对象的初始可信度时,将所述初始可信度作为所述被采集对象的可信度,否则,将预设可信度作为所述被采集对象的可信度,以及用于将所述被采集对象的可信度作为对应所述目标数据的个体可信度。
10.根据权利要求9所述的数据采集系统,其特征在于,还包括:
反馈信息获取模块,用于获取所述目标数据的反馈信息;
可信度修正模块,用于根据所述反馈信息修正所述被采集对象的可信度得到所述被采集对象新的初始可信度,并将所述新的初始可信度与所述被采集对象关联存储至所述目标数据库或所述大数据存储库中。
CN201610164530.9A 2016-03-21 2016-03-21 面向大数据及普通数据的数据采集方法和系统 Pending CN105808769A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610164530.9A CN105808769A (zh) 2016-03-21 2016-03-21 面向大数据及普通数据的数据采集方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610164530.9A CN105808769A (zh) 2016-03-21 2016-03-21 面向大数据及普通数据的数据采集方法和系统

Publications (1)

Publication Number Publication Date
CN105808769A true CN105808769A (zh) 2016-07-27

Family

ID=56454615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610164530.9A Pending CN105808769A (zh) 2016-03-21 2016-03-21 面向大数据及普通数据的数据采集方法和系统

Country Status (1)

Country Link
CN (1) CN105808769A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709060A (zh) * 2017-01-11 2017-05-24 中国铁塔股份有限公司 一种数据共享方法及系统
CN108319663A (zh) * 2018-01-16 2018-07-24 温州职业技术学院 社区gis数据采集方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101681400A (zh) * 2007-06-07 2010-03-24 皇家飞利浦电子股份有限公司 用于提供健康数据的可靠性度量的信誉系统
US20100169928A1 (en) * 2003-08-07 2010-07-01 Sony Corporation Information processing apparatus, information processing method, program, and recording medium
CN103177092A (zh) * 2013-03-08 2013-06-26 深圳先进技术研究院 知识库数据更新方法、系统及知识库
CN105391602A (zh) * 2015-12-15 2016-03-09 北京奇虎科技有限公司 一种数据采集测试方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100169928A1 (en) * 2003-08-07 2010-07-01 Sony Corporation Information processing apparatus, information processing method, program, and recording medium
CN101681400A (zh) * 2007-06-07 2010-03-24 皇家飞利浦电子股份有限公司 用于提供健康数据的可靠性度量的信誉系统
CN103177092A (zh) * 2013-03-08 2013-06-26 深圳先进技术研究院 知识库数据更新方法、系统及知识库
CN105391602A (zh) * 2015-12-15 2016-03-09 北京奇虎科技有限公司 一种数据采集测试方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709060A (zh) * 2017-01-11 2017-05-24 中国铁塔股份有限公司 一种数据共享方法及系统
CN108319663A (zh) * 2018-01-16 2018-07-24 温州职业技术学院 社区gis数据采集方法

Similar Documents

Publication Publication Date Title
EP1679694B1 (en) Confidence score for a spoken dialog system
US20190228069A1 (en) Intention acquisition method, electronic device and computer-readable storage medium
CN105843889B (zh) 基于可信度面向大数据及普通数据的数据采集方法和系统
US6823331B1 (en) Concept identification system and method for use in reducing and/or representing text content of an electronic document
WO2017215122A1 (zh) 多语音识别模型切换方法、装置和存储介质
US10572594B2 (en) Extracting domain-specific actions and entities in natural language commands recognized based on edition and recognition scores
AU2017424116B2 (en) Extracting domain-specific actions and entities in natural language commands
US8290968B2 (en) Hint services for feature/entity extraction and classification
CN110689881B (zh) 语音识别方法、装置、计算机设备和存储介质
WO2018153316A1 (zh) 获取文本提取模型的方法及装置
CN105868179A (zh) 一种智能问答方法及装置
US20190042560A1 (en) Extracting domain-specific actions and entities in natural language commands
US20070043561A1 (en) Avoiding repeated misunderstandings in spoken dialog system
CN110781280A (zh) 基于知识图谱的语音辅助方法及装置
CN108121455A (zh) 识别纠正方法及装置
WO2020233381A1 (zh) 基于语音识别的服务请求方法、装置及计算机设备
CN107704869B (zh) 一种语料数据抽样方法及模型训练方法
CN105808769A (zh) 面向大数据及普通数据的数据采集方法和系统
RU2612608C2 (ru) Система и способ формирования круга общения и компьютерный носитель информации
CN105843890B (zh) 基于知识库面向大数据及普通数据的数据采集方法和系统
WO2020024415A1 (zh) 声纹识别处理方法、装置、电子设备及存储介质
CN112397052A (zh) Vad断句测试方法、装置、计算机设备及存储介质
JP6689421B1 (ja) 音声解析システム
US20190205320A1 (en) Sentence scoring apparatus and program
CN108831473B (zh) 一种音频处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160727

RJ01 Rejection of invention patent application after publication