CN112418919B - 一种基于大数据筛选和仪器分析的大闸蟹品质评价方法 - Google Patents

一种基于大数据筛选和仪器分析的大闸蟹品质评价方法 Download PDF

Info

Publication number
CN112418919B
CN112418919B CN202011249763.1A CN202011249763A CN112418919B CN 112418919 B CN112418919 B CN 112418919B CN 202011249763 A CN202011249763 A CN 202011249763A CN 112418919 B CN112418919 B CN 112418919B
Authority
CN
China
Prior art keywords
crab
flavor
hairy
big data
crabs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011249763.1A
Other languages
English (en)
Other versions
CN112418919A (zh
Inventor
杨方
郭宏慧
夏文水
姜启兴
于沛沛
许艳顺
高沛
余达威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN202011249763.1A priority Critical patent/CN112418919B/zh
Publication of CN112418919A publication Critical patent/CN112418919A/zh
Application granted granted Critical
Publication of CN112418919B publication Critical patent/CN112418919B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/04Preparation or injection of sample to be analysed
    • G01N30/06Preparation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/04Preparation or injection of sample to be analysed
    • G01N30/16Injection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Finance (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于大数据筛选和仪器分析的大闸蟹品质评价方法,包括以下步骤:大数据挖掘;感官描述词语库建立;关键风味化合物确立;风味特征的量化与评分;依据风味评分评定风味优级蟹和风味次级蟹。通过此评价方法,可为大闸蟹风味优劣的评定提供更加客观的依据,弥补了现有评价方法仅对螃蟹大小进行分级、无法反映消费者需求的评价缺陷。

Description

一种基于大数据筛选和仪器分析的大闸蟹品质评价方法
技术领域
本发明属于食品加工与保藏领域,具体涉及到一种基于大数据筛选和仪器分析的大闸蟹品质评价方法。
背景技术
大闸蟹,学名中华绒螯蟹,淡水蟹,因其营养丰富、风味独特,深受消费者的喜爱。现有关于大闸蟹的品质评价标准(GB/T 19957-2005《地理标志产品阳澄湖大闸蟹》)仅集中在可数指标(体重分级-特级、一级、二级),可量指标(可食部分体重占比),理化指标(粗蛋白、粗脂肪、灰分、水分),缺乏直接的食用感官评价标准,无法真实反映消费者的偏好性。采用感官评价测试,需要培训感官评价小组,耗时且需要大量人力物力,成本高、代价大。
目前,对大闸蟹或中华绒螯蟹品质评价的专利有“无损检测中华绒螯蟹肝胰腺和性腺的脂肪体积的方法”(CN201610066145.0),“一种基于信息融合的中华绒螯蟹品质等级判别方法”(CN201910141492.9),“基于智能手机的中华绒螯蟹内部食用品质无损检测方法”(CN201910575556.6),“一种基于半监督鉴别投影的大闸蟹新鲜度无损检测方法”(CN201610969507.7),“一种大闸蟹公母和大小在线无损检测分级设备”(CN201720581126.1),“用于大闸蟹无损检测的夹持装置”(CN201710141084.4),这些方法都具有无损、实时的优点,但也同现行国家标准一样,只是对生蟹的大小、可食部分比例、蛋白脂肪含量等指标进行分级,而缺乏消费者关心的熟蟹食用风味方面的评价。现有对大闸蟹或中华绒螯蟹风味评价仅提供了在大闸蟹或中华绒螯蟹中对风味贡献较大的化合物,并未筛选出与消费者喜爱风味相关联的关键风味化合物,更未给出通过大闸蟹风味进行大闸蟹评价评级的方法。
因此,鉴于现有技术存在以上不足,本领域亟需一种新的大闸蟹品质评价方法,能客观反映消费者对大闸蟹风味的喜好性,从而对大闸蟹的分级有较可靠的依据。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述和/或现有技术中存在的问题,提出了本发明。
因此,本发明的目的是,克服现有技术中的不足,提供一种基于大数据筛选和仪器分析的大闸蟹品质评价方法。
为解决上述技术问题,本发明提供了如下技术方案:一种基于大数据筛选和仪器分析的大闸蟹品质评价方法,包括,
大数据挖掘:确定大数据挖掘的数据源网址,采用Python编程获取消费者对大闸蟹的评论数据,利用分词库、停用词库抓取大闸蟹感官属性词语;
感官描述词语库建立:建立大闸蟹风味轮和感官描述词语库,采用“wordcloud”库获得可视化的词频统计;
关键风味化合物确立:采用顶空固相微萃取HS-SPME与气相色谱-质谱GC-MS联用技术,通过气味活度值OAV计算,获得气味活性物质;
风味特征的量化与评价:筛选高频词汇指向的关键风味化合物,选择含量高且差异显著性明显的成分作为主成分分析的指标,建立风味品质评价模型;将不同大闸蟹的风味化合物测量值带入公式计算得分,通过比较得分,得出不同大闸蟹风味的优劣;
风味量化评价模型的验证。
作为本发明所述基于大数据筛选和仪器分析的大闸蟹品质评价方法的一种优选方案,其中:所述大数据挖掘,包括利用淘宝网、京东网、大众点评网站和饿了么等公开的网站电商平台和网络评价平台作为数据源采集大闸蟹评论信息,根据网页源代码中的标签进行数据清洗和筛选;
通过Python的requests模块请求、json数据的处理、re等模块解析,设计延时等待和翻页处理,设计感官描述词相关化规则,进行结构化信息的提取和保存。
作为本发明所述基于大数据筛选和仪器分析的大闸蟹品质评价方法的一种优选方案,其中:所述感官描述词语库建立,其中,感官描述词语库为鲜美、肥美、鲜甜、清甜、鲜香等;
风味轮描述词,对于蟹肉有腥味、鲜味、奶香、青草、清甜、玉米味、烤香等,对于蟹膏、蟹黄有油脂味、生番茄味、土腥味、清甜等。
作为本发明所述基于大数据筛选和仪器分析的大闸蟹品质评价方法的一种优选方案,其中:所述可视化的词频统计,包括大闸蟹总体风味特征、不同地域大闸蟹风味特征、大闸蟹风味偏好时代变迁特征。
作为本发明所述基于大数据筛选和仪器分析的大闸蟹品质评价方法的一种优选方案,其中:所述关键风味化合物确立,包括,
将熟制的蟹肉、蟹黄、蟹膏用粉碎机粉碎,HS-SPME条件为,称取蟹各部位样品2.5g于20mL顶空瓶中,用2.5mL饱和NaCl溶液混匀,加入20μL的10ppm 2,4,6-三甲基吡啶,旋紧盖帽,将顶空瓶置于60℃水浴中平衡5~60min,选取萃取头50μm/30μm DVB/CAR/PDMS或萃取头75μm CAR/PDMS,将其活化好插入顶空瓶中并推出纤维吸附头,停留在距离被吸附物表面2mm左右,静置吸附20~60min后,将吸附头收回拔出,立即进样,在气相色谱进样口保持5~15min解吸附,之后拔出;
GC-TOFMS分析条件为,选取Agilent 19091S-431UI DB-WAX Ultra Inert-60℃~325℃(350℃):15m×250μm×0.25μm色谱柱,载气为氦气(纯度>99.99%),进样口温度280℃,不分流进样,初始温度为50℃,保持2min,柱流速为2℃/min,升至150℃,再以4℃/min升至230℃保持10min;MS条件为离子源选取EI,离子源温度230℃,MS四级杆温度150℃,辅助加热器240℃,质量扫描范围30~500u。
作为本发明所述基于大数据筛选和仪器分析的大闸蟹品质评价方法的一种优选方案,其中:所述的蟹肉、蟹膏、蟹黄熟制方法为,
采用蒸锅,每次用相同的水位和相同的电磁炉功率加热15~25min,将熟制蟹按蟹肉、蟹膏、蟹黄拆解后,立即移至容器内并密封好,风味化合物的测定在12小时内完成。
作为本发明所述基于大数据筛选和仪器分析的大闸蟹品质评价方法的一种优选方案,其中:所述气味活度值OAV,其计算方法为:OAV=C/OT;
其中,C为样品中挥发性成分的浓度μg/kg,OT为气味阈值μg/kg;
所述获得气味活性物质,其判定方法为:当OAV>1,该挥发性物质属于气味活性物质,可对样品整体风味具有直接影响。
作为本发明所述基于大数据筛选和仪器分析的大闸蟹品质评价方法的一种优选方案,其中:所述筛选高频词汇指向的关键风味化合物,筛选所得关键风味化合物:
当为蟹肉时,关键风味化合物:三甲胺(i=1)、己醛(i=2)、壬醛(i=3)、癸醛(i=4)、异戊醛(i=5)、3-甲硫基丙醛(i=6);
当为蟹膏、蟹黄时,关键风味化合物:辛醛(i=1)、壬醛(i=2)、反-辛烯醛(i=3)、反-壬烯醛(i=4)、顺-癸烯醛(i=5)、壬-2-烯醛(i=6)、癸-2-烯醛(i=7)、1-辛烯-3-酮(i=8)、反-2-顺-6-壬二烯醛(i=9)。
作为本发明所述基于大数据筛选和仪器分析的大闸蟹品质评价方法的一种优选方案,其中:所述风味特征量化与评价方法中的评价模型建立方法包括,
筛选OAV>1且大数据高频词汇指向的关键风味化合物,计算各主成分的成分系数:F1的成分系数为A1X1、A1X2…A1Xn,F2的成分系数为A2X1、A2X2、A2Xn,FK的成分系数为AKX1、AKX2、AKXn
各主成分的方程分别为F1=A1X1*X1+A1X2*X2+…A1xn*Xn,F2=A2X1*X1+A2X2*X2+…A2XN*Xn,FK=AKX1*X1+AKX2*X2+…AKXn*Xn
以不同特征值的方差贡献率ai(i=1,2…k)为加权系数;
利用综合评价函数F=a1F1+a2F2+…aKFK,建立大闸蟹品质评价模型;其中,X1、X2、......、Xn分别表示各主成分分析的指标的测定值。
作为本发明所述基于大数据筛选和仪器分析的大闸蟹品质评价方法的一种优选方案,其中:所述风味特征评分模型为:
蟹肉:F=0.401X1+0.112X2+0.407X3-0.067X4-0.305X5+0.320X6
蟹黄、蟹膏:
F=0.339X1+0.338X2+0.143X3+0.339X4+0.323X5+0.205X6+0.238X7+0.238X8+0.148X9
其中F表示大闸蟹品质评价得分;Xi表示各关键性气味成分的含量。
作为本发明所述基于大数据筛选和仪器分析的大闸蟹品质评价方法的一种优选方案,其中:所述风味量化评价模型的验证,为风味评价得分值与感官评价得分进行比较,评判风味评价模型的准确性。
本发明有益效果:
(1)本发明将大数据获得的关键感官描述词和仪器分析获得的关键风味化合物进行比对,确立可应用于大闸蟹感官评价公式的关键风味化合物,并利用OAV结合主成分分析建立评价模型,计算大闸蟹风味评分,采用大数据挖掘,直接面向消费者,样本量大,系统误差小,可真实反映消费者对于大闸新颖的快速感官描述性方法,本发明采用大数据挖掘,直接面向消费者,样本量大,系统误差小,可真实反映消费者对于大闸蟹的感官评价。
(2)本发明省时省力、方便、灵活、且数据量庞大,是一种新颖的快速感官描述性方法。
(3)本发明强调对大闸蟹食用品质的评价,弥补了现有大闸蟹品质分级评价仅集中在外观、构造等非感官品质评价上的不足。本发明将消费者喜好的感官描述具象化,筛选出可反映特征风味的化合物,为仪器分析奠定了基础。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1是本发明实施例1中的大闸蟹感官描述词词频云图(左)和风味轮(右)。
图2为本发明实施例1中基于大数据筛选和仪器分析的大闸蟹感官评价方法的流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书实施例对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明的目的通过以下技术方案实现:
(1)大数据挖掘:确定大数据挖掘的数据源网址,采用Python编程获取消费者对大闸蟹的评论数据,利用分词库、停用词库抓取大闸蟹感官属性词语;
(2)感官描述词语库建立:建立大闸蟹风味轮和感官描述词语库,采用“wordcloud”库获得可视化的词频统计;
(3)关键风味化合物确立:采用顶空固相微萃取(HS-SPME)与气相色谱-质谱(GC-MS)联用技术和气味活度值计算,获得关键风味化合物;
(4)风味特征的量化与评分:进一步筛选高频词汇指向的关键风味化合物,设置权重;批量测定大闸蟹关键风味化合物含量,带入品质评价模型计算得分;
(5)依据风味评分比较风味优级蟹和风味次级蟹。
实施例1
在淘宝网(https://www.taobao.com/)输入关键词大闸蟹,点开链接和开发者工具,查阅页面的URL链接、标题、文件夹、产品参数(买家、卖家、销量、点评)等信息,利用Python编程抓取页面信息,通过Python自带库以及编程者自己设计的停用语库,拆解语句成词语、剔除“物流、满意度”等感官无关词汇,获得与大闸蟹感官评价相关的词语,词频高低用可视化云图表征;并将获得的所有大闸蟹感官描述词汇总建立风味轮。如图1所示。
选取阳澄湖、固城湖、太湖、兴化四个地区大闸蟹雌蟹(150±3.19g)、雄蟹(200±5.56g),处理方式在蒸锅中加入1L水,在电磁炉上用1800W功率加热20min后取出,并将蟹肉、蟹黄挑出。分别称取蟹肉、蟹黄样品2.5g于20mL顶空瓶中,用2.5mL饱和NaCl溶液混匀,加入20μL的10ppm 2,4,6-三甲基吡啶,旋紧盖帽,将顶空瓶置于60℃水浴中平衡30min,选取萃取头50μm/30μm DVB/CAR/PDMS,将其活化好插入顶空瓶中并推出纤维吸附头,停留在距离被吸附物表面2mm左右,静置吸附60min后,将吸附头收回拔出,立即进样,在气相色谱进样口保持5min解吸附,之后拔出;GC-TOFMS分析条件为,选取Agilent 19091S-431UI DB-WAX Ultra Inert-60℃~325℃(350℃):15m×250μm×0.25μm色谱柱,载气为氦气(纯度>99.99%),进样口温度280℃,不分流进样,初始温度为50℃,保持2min,柱流速为2℃/min,升至150℃,再以4℃/min升至230℃保持10min;MS条件为离子源选取EI,离子源温度230℃,MS四级杆温度150℃,辅助加热器240℃,质量扫描范围30~500u;气味活度值(OAV)计算方法为OAV=C/OT,其中C为样品中挥发性成分的浓度(μg/kg),OT为气味阈值(μg/kg)。
筛选OAV>1的物质:
表1-1OAV>1的关键风味物质
表1-1A蟹肉中OAV>1的物质
Figure BDA0002771243040000071
表1-1B蟹膏、蟹黄中OAV>1的物质
Figure BDA0002771243040000072
Figure BDA0002771243040000081
根据OAV>1的关键性风味物质中筛选大数据高频风味指向性化合物。
表1-2筛选大数据高频风味指向性化合物
表1-2A蟹肉中大数据高频风味指向性化合物
Figure BDA0002771243040000091
表1-2B蟹黄、蟹膏中大数据高频风味指向性化合物
Figure BDA0002771243040000092
由于筛选得的的风味物质较多,根据不同样品之间的显著性分析进一步筛选关键性风味成分:
表1-3不同样品之间风味成分OAV值
表1-3A蟹肉风味成分OAV值:
Figure BDA0002771243040000093
Figure BDA0002771243040000101
注:字母小写表示差异显著(0.01<p<0.05),字母相同者表示差异不显著(p>0.05),字母不同者表示差异显著(p<0.05)
表1-3B蟹黄、蟹膏风味成分OAV值
Figure BDA0002771243040000102
注:字母小写表示差异显著(0.01<p<0.05),字母相同者表示差异不显著(p>0.05),字母不同者表示差异显著(p<0.05)
由表1-3可知,蟹黄、蟹膏中:反,反-2,4-庚二烯醛、戊醛、异戊醛的OAV值显著性不高,说明不同样品的大闸蟹,反,反-2,4-庚二烯醛、戊醛、异戊醛含量变化不明显,具有一定的稳定性,所以反,反-2,4-庚二烯醛、戊醛、异戊醛不能作为评价大闸蟹风味品质的指标。因此最终筛选到关键风味化合物为:三甲胺(i=1)、己醛(i=2)、壬醛(i=3)、癸醛(i=4)、异戊醛(i=5)、3-甲硫基丙醛(i=6)(蟹肉);
辛醛(i=1)、壬醛(i=2)、反-辛烯醛(i=3)、反-壬烯醛(i=4)、顺-癸烯醛(i=5)、壬-2-烯醛(i=6)、癸-2-烯醛(i=7)、1-辛烯-3-酮(i=8)、反-2-顺-6-壬二烯醛(i=9)(蟹膏、蟹黄),并且作为主成分品质评价模型的指标。
表1-4指标间相关性
表1-4A蟹肉
Figure BDA0002771243040000111
注:**在0.01水平上极显著相关,*在0.05水平上显著相关
表1-4B蟹黄、蟹膏
Figure BDA0002771243040000112
Figure BDA0002771243040000121
注:**在0.01水平上极显著相关,*在0.05水平上显著相关
对4个地区的风味成分进行相关性分析,由表1-4可知,蟹肉中三甲胺与壬醛、3-甲硫基丙醛;己醛和癸醛之间存在显著正相关,蟹黄中辛醛与壬醛、反-2-壬烯醛、顺-2-癸烯醛、反,反-2,4-壬二烯醛、反,反-2,4-癸二烯醛、1-辛烯-3-酮;壬醛与反-2-壬烯醛、顺-2-癸烯醛;反-2-辛烯醛与反,反-2,4-癸二烯醛、1-辛烯-3-酮、反-2-顺-6-壬二烯醛;反-2-壬烯醛与顺-2-癸烯醛、反,反-2,4-癸二烯醛、1-辛烯-3-酮;反,反-2,4-癸二烯醛与1-辛烯-3-酮、反-2-顺-6-壬二烯醛;1-辛烯-3-酮与反-2-顺-6-壬二烯醛显著相关。各成分之间存在较强的相关性,所以可以利用主成分分析对这些变量以某种新的线性组合而形成新的综合性指标。
大闸蟹品质模型建立:
将4个地区大闸蟹样品中测定的蟹肉6个指标、蟹黄9个指标进行PCA(主成分分析),利用spss分析软件得到相关矩阵特征值和累计贡献率,如表1-5和1-6相关矩阵特征值和累计贡献率、成分矩阵
表1-5相关矩阵特征值和累计贡献率
表1-5A蟹肉相关矩阵特征值和累计贡献率
Figure BDA0002771243040000122
Figure BDA0002771243040000131
表1-5B蟹黄相关矩阵特征值和累计贡献率
Figure BDA0002771243040000132
表1-6成份矩阵
表1-6A蟹肉成份矩阵
Figure BDA0002771243040000133
Figure BDA0002771243040000141
根据累计方差贡献率达到85%以上和特征值大于1的原则来确定主成分个数,由表1-5中,蟹肉和蟹黄、蟹膏中前两个主成分累积分别为87.456%、92.799%均大于85%,因此,选用前2个主成分进行大闸蟹品质评价是可行的。
根据表1-5和1-6计算各成分的特征向量:特征向量=对应的特征矩阵/对应的特征值的平方根。
表1-7主成分的特征向量
表1-7A蟹肉主成分的特征向量
Figure BDA0002771243040000142
表1-7B蟹黄、蟹膏主成分的特征向量
Figure BDA0002771243040000143
Figure BDA0002771243040000151
由表1-7可知,主成分模型方程为:
蟹肉中各个主成分的方程分别为:
F1=0.512X1-0.189X2+0.345X3-0.377X4-0.407X5+0.521X6
F2=0.202X1+0.655X2+0.519X3+0.493X4-0.121X5-0.043X6
蟹黄、蟹膏中各个主成分的方程分别为:
F1=0.360X1+0.326X2+0.297X3+0.366X4+0.259X5+0.318X6+0.370X7+0.373X8+0.314X9
F2=0.268X1+0.379X2-0.375X3+0.250X4+0.538X5-0.175X6-0.207X7-0.211X8-0.409X9
大闸蟹品质的综合评价:
由于前2个主成分反映了85%以上原来指标的信息,所以可利用这2个新的综合指标来替代原来的多个复杂指标进行分析,以不同特征值的方差贡献率ai(i=1,2)为加权系数,利用综合评价函数F=a1F1+a2F2建立评价模型:
得到蟹肉:
F=0.401X1+0.112X2+0.407X3-0.067X4-0.305X5+0.320X6
蟹黄、蟹膏:
F=0.339X1+0.338X2+0.143X3+0.339X4+0.323X5+0.205X6+0.238X7+0.238X8+0.148X9
感官评价验证品质评价模型准确性:
感官评价由10位经过感官培训的专业人士组成,并对风味进行评价,采用百分制,感官属性权重根据大数据爬取的感官词汇词频设置,结果为各项评分的总和,最终的评分结果以平均值表示。
表1-8 4个地区蟹肉各感官属性与大数据统计词频的相关系数
表1-8A蟹肉中各感官属性与大数据统计词频的相关系数
Figure BDA0002771243040000161
将4类感官属性与大数据统计感官属性词频之间建立相关系数矩阵,从中可以看到腥味、腥味、青草味、清甜、玉米味、烤香与大数据统计词频在0.05水平上呈现显著正相关,并且各感官属性也存在显著相关性,说明各感官属性不是单独影响感官品质而是综合共同影响感官属性,各感官属性根据相关系数对大数据词频影响大小为腥味、鲜味>清甜、玉米味>烤香>青草味,确定权重腥味(鲜味)、清甜(玉米味)、烤香、青草味的权重比为4:3:2:1。
以4个地区雄性蟹肉为例:
表1-9 4个地区雄性蟹肉的OAV值
Figure BDA0002771243040000162
表1-10 4个地区雄蟹蟹肉感官评定结果和F值
Figure BDA0002771243040000163
由表1-10可以看出,F值评价风味的优劣,与风味感官评价一致,准确性好。
实施例2
以4个地区的雌蟹蟹黄为例
测定各个地区蟹黄风味成分的OAV值。计算出各个样品的模型评分,如表2-1所示。
表2-1 4个地区雌蟹蟹黄各指标OAV的测定值
Figure BDA0002771243040000171
对各个样品请专业的感官评价小组成员感官评定,根据大数据挖掘的感官属性词频,对各类感官属性设置权重,见表2-2。
表2-2感官评定描述属性与数据挖掘的感官属性词频的相关性分析
Figure BDA0002771243040000172
将4类感官属性与大数据统计感官属性词频之间建立相关系数矩阵,从中可以看到油脂味、生番茄味、土腥味、清甜大数据统计词频在0.05水平上呈现显著正相关,并且各感官属性也存在显著相关性,说明各感官属性不是单独影响感官品质而是综合共同影响感官属性,各感官属性根据相关系数对大数据词频影响大小为油脂味>清甜>生番茄味>土腥味,确定权重油脂味、清甜、生番茄味、土腥味的权重比为4:3:2:1。
根据各指标的测定值计算各样品的评价模型得分,然后将感官评价得分与指标测量值两者做相关性分析。
表2-3 4个地区雌蟹蟹黄感官评定结果和评价模型F值
Figure BDA0002771243040000181
大闸蟹感官评分和F值有较好的相关性,相关系数为0.98显著相关。综上,依据大数据筛选高频感官描述词,依据仪器分析筛选OAV较高风味化合物,结合两者构建大闸蟹风味品质评价模型,该模型与风味感官评价高度一致,有着一定的可靠性、适用性。
实施例3
以4个地区的雄蟹蟹膏为例
根据OAV>1筛选关键风味物质,没有结合大数据感官属性词频进一步筛选,直接进行相关性分析和主成分分析,按照实施列1中方法,得到主成分分析模型
F=0.419X1+0.219X2+0.164X3+0.331X4+0.365X5+0.189X6+0.201X7+0.301X8+0.225X9+0.49X10+0.330X11+0.248X12,其中异戊醛(i=1)、己醛(i=2)、庚醛(i=3)、辛醛(i=4)、壬醛(i=5)、反-2-辛烯醛(i=6)、3-甲硫基丙醛(i=7)、反-2-壬烯醛(i=8)、反-2-,顺-6-壬二烯醛(i=9)、反,反-2,4-壬二烯醛(i=10)、1-辛烯-3-酮(i=11)、乙酸乙酯(i=12)
对各个样品请感官评价小组成员进行感官评定,计算F值和感官评价得分见表3-1。
表3-1 4个地区雄蟹蟹膏感官评定结果和评价模型F值
Figure BDA0002771243040000182
得出感官得分与F值相关性较差。
本发明将大数据获得的关键感官描述词和仪器分析获得的关键风味化合物进行比对,确立可应用于大闸蟹感官评价公式的关键风味化合物,并利用OAV结合主成分分析建立评价模型,计算大闸蟹风味评分,采用大数据挖掘,直接面向消费者,样本量大,系统误差小,可真实反映消费者对于大闸新颖的快速感官描述性方法。本发明强调对大闸蟹食用品质的评价,弥补了现有大闸蟹品质分级评价仅集中在外观、构造等非感官品质评价上的不足。本发明将消费者喜好的感官描述具象化,筛选出可反映特征风味的化合物,为仪器分析奠定了基础。本发明弥补了现有大闸蟹品质评价仅停留在外观等非感官评价下的不足,而非消费者关心的感官喜好性的评价。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (7)

1.一种基于大数据筛选和仪器分析的大闸蟹品质评价方法,其特征在于:包括,
大数据挖掘:确定大数据挖掘的数据源网址,采用Python编程获取消费者对大闸蟹的评论数据,利用分词库、停用词库抓取大闸蟹感官属性词语;
感官描述词语库建立:建立大闸蟹风味轮和感官描述词语库,采用“wordcloud”库获得可视化的词频统计,其中,感官描述词语库为鲜美、肥美、鲜甜、清甜、鲜香;风味轮描述词,对于蟹肉有腥味、鲜味、奶香、青草、清甜、玉米味、烤香,对于蟹膏、蟹黄有油脂味、生番茄味、土腥味、清甜;
所述可视化的词频统计,包括大闸蟹总体风味特征、不同地域大闸蟹风味特征、大闸蟹风味偏好时代变迁特征;
关键风味化合物确立:采用顶空固相微萃取HS-SPME与气相色谱-质谱GC-MS联用技术,通过气味活度值OAV计算,获得气味活性物质;
风味特征的量化与评价:筛选高频词汇指向的关键风味化合物,选择含量高且差异显著性明显的成分作为主成分分析的指标,建立风味品质评价模型;
其中,筛选所得关键风味化合物:
当为蟹肉时,关键风味化合物:三甲胺i=1、己醛i=2、壬醛i=3、癸醛i=4、异戊醛i=5、3-甲硫基丙醛i=6;
当为蟹膏、蟹黄时,关键风味化合物:辛醛i=1、壬醛i=2、反-辛烯醛i=3、反-壬烯醛i=4、顺-癸烯醛i=5、壬-2-烯醛i=6、癸-2-烯醛i=7、1-辛烯-3-酮i=8、反-2-顺-6-壬二烯醛i=9;
其中,所述评价模型建立方法包括,筛选OAV>1且大数据高频词汇指向的关键风味化合物,计算各主成分的成分系数:F1的成分系数为A1X1、A1X2…A1Xn,F2的成分系数为A2X1、A2X2、A2Xn,FK的成分系数为AKX1、AKX2、AKXn
各主成分的方程分别为F1=A1X1*X1+A1X2*X2+…A1xn*Xn,F2=A2X1*X1+A2X2*X2+…A2XN*Xn,FK=AKX1*X1+AKX2*X2+…AKXn*Xn
以不同特征值的方差贡献率a i(i=1,2…k) 为加权系数;
利用综合评价函数F=a 1F1+a 2F2+…a KFK,建立大闸蟹品质评价模型;其中,X1、X2、......、Xn分别表示各主成分分析的指标的测定值;
将不同大闸蟹的风味化合物测量值带入公式计算得分,通过比较得分,得出不同大闸蟹风味的优劣;
风味量化评价模型的验证。
2.如权利要求1所述基于大数据筛选和仪器分析的大闸蟹品质评价方法,其特征在于:所述大数据挖掘,包括利用淘宝网、京东网、大众点评网站和饿了么网站公开的电商平台和网络评价平台作为数据源采集大闸蟹评论信息,根据网页源代码中的标签进行数据清洗和筛选;
通过Python的requests模块请求、json数据的处理、re模块解析,设计延时等待和翻页处理,设计感官描述词相关化规则,进行结构化信息的提取和保存。
3.如权利要求1所述基于大数据筛选和仪器分析的大闸蟹品质评价方法,其特征在于:所述关键风味化合物确立,包括,
将熟制的蟹肉、蟹黄、蟹膏用粉碎机粉碎,HS-SPME条件为,称取蟹各部位样品2.5 g于20 mL顶空瓶中,用2.5 mL饱和NaCl溶液混匀,加入20 µL的10 ppm 2,4,6-三甲基吡啶,旋紧盖帽,将顶空瓶置于60℃水浴中平衡5~60 min,选取萃取头50 µm/30 µm DVB/CAR/PDMS或萃取头75 µm CAR/PDMS,将其活化好插入顶空瓶中并推出纤维吸附头,停留在距离被吸附物表面2 mm,静置吸附20~60 min后,将吸附头收回拔出,立即进样,在气相色谱进样口保持5~15 min解吸附,之后拔出;
GC-TOFMS分析条件为,选取Agilent 19091S-431UI DB-WAX Ultra Inert - 60℃~325℃(350℃):15 m×250 µm×0.25 µm色谱柱,载气为氦气,纯度>99.99%,进样口温度280℃,不分流进样,初始温度为50℃,保持2 min,柱流速为2℃/min,升至150℃,再以4℃/min升至230℃保持10 min;MS条件为离子源选取EI,离子源温度230℃,MS 四级杆温度150℃,辅助加热器 240℃,质量扫描范围30~500u。
4.如权利要求3所述基于大数据筛选和仪器分析的大闸蟹品质评价方法,其特征在于:所述的蟹肉、蟹膏、蟹黄熟制方法为,采用蒸锅,每次用相同的水位和相同的电磁炉功率加热15~25 min,将熟制蟹按蟹肉、蟹膏、蟹黄拆解后,立即移至容器内并密封好,风味化合物的测定在12小时内完成。
5.如权利要求1所述基于大数据筛选和仪器分析的大闸蟹品质评价方法,其特征在于:所述气味活度值OAV,其计算方法为:OAV=C/OT;
其中,C为样品中挥发性成分的浓度μg/kg,OT为气味阈值μg/kg;
所述获得气味活性物质,其判定方法为:当OAV>1,该挥发性成分属于气味活性物质,可对样品整体风味具有直接影响。
6.如权利要求1所述基于大数据筛选和仪器分析的大闸蟹品质评价方法,其特征在于:所述风味品质评价模型为:
蟹肉:F=0.401X1+0.112X2+0.407X3-0.067X4-0.305X5+0.320X6
蟹黄、蟹膏:
F=0.339X1+0.338X2+0.143X3+0.339X4+0.323X5+0.205X6+0.238X7+0.238X8+0.148X9
其中F表示大闸蟹品质评价得分;Xi表示各关键性气味成分的含量。
7.如权利要求1所述基于大数据筛选和仪器分析的大闸蟹品质评价方法,其特征在于:所述风味量化评价模型的验证,为风味评价得分值与感官评价得分进行比较,评判风味评价模型的准确性。
CN202011249763.1A 2020-11-10 2020-11-10 一种基于大数据筛选和仪器分析的大闸蟹品质评价方法 Active CN112418919B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011249763.1A CN112418919B (zh) 2020-11-10 2020-11-10 一种基于大数据筛选和仪器分析的大闸蟹品质评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011249763.1A CN112418919B (zh) 2020-11-10 2020-11-10 一种基于大数据筛选和仪器分析的大闸蟹品质评价方法

Publications (2)

Publication Number Publication Date
CN112418919A CN112418919A (zh) 2021-02-26
CN112418919B true CN112418919B (zh) 2022-10-28

Family

ID=74781755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011249763.1A Active CN112418919B (zh) 2020-11-10 2020-11-10 一种基于大数据筛选和仪器分析的大闸蟹品质评价方法

Country Status (1)

Country Link
CN (1) CN112418919B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160195503A1 (en) * 2013-08-07 2016-07-07 Roquette Freres Protein-rich microalgal biomass compositions of optimized sensory quality

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222164A (zh) * 2011-05-30 2011-10-19 中国标准化研究院 一种食品感官质量评价方法及系统
CN109063783A (zh) * 2018-08-20 2018-12-21 扬州佳珏食品有限公司 一种盐水鹅品质综合评价方法以及利用该方法构建的品质评价模型
CN110706028A (zh) * 2019-09-26 2020-01-17 四川长虹电器股份有限公司 基于属性特征的商品评价情感分析系统
CN111898920A (zh) * 2020-08-07 2020-11-06 江南大学 一种评价肉汤调味料关键品质等级的复合方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160195503A1 (en) * 2013-08-07 2016-07-07 Roquette Freres Protein-rich microalgal biomass compositions of optimized sensory quality

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Enhancing English vocabulary learning via computerized adaptive testing";Yang Fang 等;《IEEE》;20171030;全文 *

Also Published As

Publication number Publication date
CN112418919A (zh) 2021-02-26

Similar Documents

Publication Publication Date Title
Bleicher et al. Formation and analysis of volatile and odor compounds in meat—a review
Yao et al. Analysis of flavor formation during production of Dezhou braised chicken using headspace-gas chromatography-ion mobility spec-trometry (HS-GC-IMS)
Seninde et al. Coffee flavor: A review
Danezis et al. Food authentication: Techniques, trends & emerging approaches
Chambers IV et al. Associations of volatile compounds with sensory aroma and flavor: The complex nature of flavor
Suwonsichon The importance of sensory lexicons for research and development of food products
Camin et al. Stable isotope techniques for verifying the declared geographical origin of food in legal cases
Starowicz Analysis of volatiles in food products
Uebelacker et al. Quantitative determination of acetaldehyde in foods using automated digestion with simulated gastric fluid followed by headspace gas chromatography
Qiu et al. Application of sensory evaluation, HS‐SPME GC‐MS, E‐Nose, and E‐Tongue for quality detection in citrus fruits
Hansen et al. Authenticity and traceability of vanilla flavors by analysis of stable isotopes of carbon and hydrogen
de-la-Fuente-Blanco et al. Gas chromatography olfactometry (GC-O) for the (semi) quantitative screening of wine aroma
Gou et al. Advances and perspectives in fruits and vegetables flavor based on molecular sensory science
Paulsen et al. Preference mapping of salmon–sauce combinations: The influence of temporal properties
Guazzotti et al. Migration of styrene in yogurt and dairy products packaged in polystyrene: Results from market samples
Bemrah et al. Assessment of dietary exposure to annatto (E160b), nitrites (E249-250), sulphites (E220-228) and tartaric acid (E334) in the French population: the second French total diet study
Dias et al. Monovarietal extra-virgin olive oil classification: A fusion of human sensory attributes and an electronic tongue
CN109063783A (zh) 一种盐水鹅品质综合评价方法以及利用该方法构建的品质评价模型
Wang et al. An insight by molecular sensory science approaches to contributions and variations of the key odorants in shiitake mushrooms
Lorrain et al. Selection of potential impact odorants and sensory validation of their importance in typical Chardonnay wines
Pagliuca et al. Determination of high molecular mass polycyclic aromatic hydrocarbons in a typical Italian smoked cheese by HPLC-FL
Chang et al. Characterization of the key aroma compounds in pork broth by sensory‐directed flavor analysis
Kim et al. Monitoring and risk assessment of eight polycyclic aromatic hydrocarbons (PAH8) in daily consumed agricultural products in South Korea
CN112418919B (zh) 一种基于大数据筛选和仪器分析的大闸蟹品质评价方法
Cerretani et al. Harmony of virgin olive oil and food pairing: A methodological proposal

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant