基于大叶三七红外光谱系统聚类分析的产地鉴别

基于大叶三七红外光谱系统聚类分析的产地鉴别

刘明地宋萍王博

1.青海民族大学化学化工学院,西宁 810007;

2.青海民族大学生态与资源学院,西宁 810007)

摘要:运用红外光谱技术结合主成分分析和系统聚类分析快速鉴别大叶三七的产地。利用红外光谱测定了13个不同产地的大叶三七的红外光谱原始数据,对比标准正态变换、一阶导数校正、多元散射校正等常规预处理方法与小波变换处理的降噪效果,得知小波变换处理能大大降低原始红外光谱中的噪音和一些不需要的信息。利用小波变换后的红外光谱的标准化数据实现主成分分析和系统聚类分析来鉴别大叶三七的产地,主成分分析和系统聚类分析结果一致,可将13个不同产地大叶三七分为云贵高原、秦岭以南、秦岭以北等三类,即云南昭通(3号)、山西(6号)、云南文山(11号)聚为一大类;陕西太白山(1号)、青海互助(2号)、云南迪庆(4号)、云南大理(5号)、甘肃麦积山(8号)、湖北神农架(9号)、甘肃六盘山(13号)聚为一大类;安徽(7号)、陕西汉中(10号)、四川(12号)样品聚为一大类。实验结果表明:红外光谱技术结合主成分分析和系统聚类分析可以快速、科学地进行大叶三七的产地鉴别,此法可以为中药材产地鉴别提供参考。

关键字:大叶三七;红外光谱;小波变换;主成分分析;系统聚类分析

中图分类号:O641         文献标识码:A

 

The Identification of the Origin of Big Leaf Radix Notoginseng Based on Infrared Spectral and Cluster Analysis

Liu Mingdi1, Song Ping1, Wang Bo2

(1. School of chemical and chemical engineering, Qinghai nationalities university; Xining 810007;

2. School of ecological environment and resources, Qinghai nationalities university; Xining 810007)

Abstract: The Identification of the Origin of Big Leaf Radix Notoginseng was identified by the Fourier Transform Infrared Spectroscopy (FTIR) combined with principal component analysis and systematic cluster analysis. The original infrared spectra of big leaf radix notoginseng from 13 different areas were measured by FTIR, the noise reduction effects of conventional pretreatment methods such as standard normal transformation, first derivative correction, multivariate scattering correction and wavelet transform were compared, it is known that wavelet transform processing can greatly reduce the noise and some unnecessary information in the original infrared spectrum. Using the standardized data of infrared spectrum after wavelet transform to realize principal component analysis and systematic cluster analysis to identify the origin of big leaf notoginseng, principal component analysis and system clustering analysis results are consistent. Big leaf notoginseng of 13 different regions can be divided into three classes, one is Yun-Gui plateau, the other is south of Qin Ling mountains and north of Qin Ling mountains. The production areas of the Yun-Gui plateau include the sample NO.3, NO.6 and NO.11; The second production areas contained the sample NO.1, NO.2, NO.4, NO.5, NO.8, NO.9, NO.13; NO.7, NO.10 and NO.12 are grouped into another production areas. The experimental results show that FTIR combined with principal component analysis and systematic cluster analysis can quickly and scientifically identify the origin of big leaf radix notoginseng. This method can provide reference for the origin identification of Chinese medicinal materials.

Keywords: Big Leaf Radix Notoginseng; FTIR (Fourier Transform Infrared Spectroscopy); Wavelet transform; Principal component analysis; Systematic cluster analysis

 

基金项目:青海民族大学校级青年项目(2016XJQ05)

      青海省自然科学基金项目(2016-ZJ-908)

作者简介:刘明地(1987-),男,陕西商洛人,助教,(E-mail)313826195@qq.com。

大叶三七,为五加科人参属植物大叶三七的根茎,别名竹节参、竹节三七、扣子七、钮子七,学名 Panax pseudo-ginseng Wall.var.japonicus (C.A.Mey) Hoo et Tseng。多生于海拔1200-4000米阴坡林下,性温,味苦、甘。有清热解毒、顺气健胃、止血滋补、舒经活络、消肿止痛等功效,用于跌打损伤、腰腿疼痛、月经不调、吐血、便血及虚劳咳嗽等症[1]。据文献报道大叶三七的主要化学成分为三萜皂苷类成分[2-5],此外,还含有挥发油[6-9]、多糖[10-11]、微量元素[12-14]、氨基酸[15]及蛋白质[16]等成分。大叶三七在我国分布广,且其体内化学成分复杂,导致各产地药材质量各不相同,市场混乱,甚至出现以次充好,非道地性药材冒充道地性药材等现象,严重影响了其临床用药的安全性和有效性。我国数千年的传统中医学实践中,普遍认为药材的道地性(主产地)一直是评价药材品质的独特综合性标准17],而现代医学研究提示中草药的药理活性表现为其体内多种组分的协同效应。显然药材的产地对药材的质量优劣影响很大,道地药材的疗效显著,其药用质量一般远高于非道地(非主产地)药材。因此,在中药材的鉴别上就需要提出一个更为科学、合理的鉴别方法,中药材是一个集合体,在鉴别过程中我们需要充分考虑到各种因素。而中药材的红外图谱是中药材中各种成分的本征反映,在此基础上孙素琴[18]等提出了红外光谱结合化学计量学方法来鉴别中药材的产地和质量。本研究依据13个不同产地的大叶三七的红外光谱数据,结合多种红外光谱预处理方法对光谱数据进行预处理,采用主成分分析和聚类分析对小波降噪压缩后的红外光谱数据进行分析,成功实现了对大叶三七产地的鉴别。

1  实验部分

1.1 样品来源和预处理

样品来源:

实验中所用到的13个不同产地的大叶三七均为阴干的大的根茎,具体产地见表1。

1  大叶三七样品的详细产地

编号

产地

编号

产地

1

2

3

4

5

6

7

陕西太白山

青海互助

云南昭通

云南迪庆

云南大理

山西

安徽

8

9

10

11

12

13

甘肃麦积山

湖北神农架

陕西汉中

云南文山

四川

甘肃六盘山

样品预处理:

将采集的不同产地的大叶三七阴干根茎先用自来水清洗3次后,再用超纯水洗涤3次。清洗后的药材在超净工作台中沥干2h,然后转移进真空干燥箱中于50℃恒温烘干至恒重,取出在高速万能植物粉碎机上粉碎,过100目筛,装入自封袋贴标签置于干燥器中备用。

1.2 实验仪器及药品

仪器:红外光谱仪(PerkinElmer Spectrum Two)

药品:溴化钾(光谱纯),购自天津天光光学仪器有限公司

1.3 不同产地大叶三七的红外光谱

称取1.1预处理后的不同产地的大叶三七1mg100mg光谱纯的溴化钾在研钵中混合均匀后压片,置于PerkinElmer Spectrum Two型红外光谱仪中扫描获取大叶三七的红外光谱数据,测量范围4000-400cm-1,扫描信号累加16次,分辨率1cm-1,为了降低光谱纯溴化钾对光谱数据的影响,扣除光谱纯溴化钾片的红外光谱数据,每个样品平行测定3次,取其平均值作为该样品的远视红外光谱数据,得到不同产地大叶三七的红外光谱图,见图1。

 

1 大叶三七样品的红外光谱图

不同产地大叶三七红外光谱图的预处理

大叶三七原始红外光谱图中夹杂着机器噪音和一些其他的不需要的信息,在使用化学计量学分析时,我们需要尽量减少噪音和不需要的信息对分析结果的影响,因此需要对原始红外光谱图进行预处理。

2.1 常规红外光谱的预处理

对大叶三七的原始红外光谱图常规预处理采用标准正态变换(见图2),多元散射校正(见图3),导数校正(见图4)等预处理方法,由图2、图3、图4可得:图谱在2000-400cm-1依旧有许多毛刺峰,预处理结果消噪效果不明显,无法直接使用。

2 标准正态变换校正红外光谱图

 

3 多元散射校正红外光谱图

 

4 一阶导数校正红外光谱图

2.2 红外光谱的小波变换预处理

小波变换(wavelet transform,WT) 是一种新的信号X(t)时频分析方法,它继承和发展了短时傅立叶变换局部化的思想,同时又克服了窗口大小不随频率变化等缺点,能够提供一个随频率改变的“时间-频率”窗口,通过小波变换可以更容易地分离出噪声或其它不需要的信息,使数据更接近样品本征信息。因此小波分析在红外光谱矩阵数据预处理上更优于传统方法,已应用于红外光谱数据的预处理[19-20]

本研究在MATLAB软件上编程用小波变换预处理方法实现对大叶三七红外光谱数据的去噪和压缩。采用均方根误差RMSE评价小波信号去噪和压缩性能[10],选用高阶正交紧支集Daubechies(db5)小波作为小波变换的母函数,阶数 N=5,最高分解层数N=3,启发式SURE(heursure)方法获取阈值,然后对光谱信号从第一层到第N层的高频系数进行阈值量化处理。小波变换预处理之后,原始信号与去噪、压缩后信号的均方根误差RMSE达到10-5-10-6数量级,说明降噪、压缩效果良好,消去了噪声,但仍保留了原始光谱数据的本征信息。小波去噪、压缩后大叶三七红外光谱图见图5、图6,由图可以明显看出2000-400cm-1处原有的毛刺峰消失。

 

5 大叶三七小波去噪后红外光谱图

 

6 大叶三七小波压缩后红外光谱图

不同产地大叶三七红外光谱的产地鉴别

3.1 不同产地大叶三七红外光谱的主成分分析

以小波去噪、压缩后的不同产地大叶三七红外光谱标准化数据在MATLAB软件上编程实现主成分分析,分析结果见图7。由图7可知:安徽(7号)、陕西汉中(10号)、四川(12号)样品聚为一大类,陕西太白山(1号)、青海互助(2号)、云南迪庆(4号)、云南大理(5号)、甘肃麦积山(8号)、湖北神农架(9号)、甘肃六盘山(13号)聚为一大类,云南昭通(3号)、山西(6号)、云南文山(11号)聚为一大类。 综上所述,主成分分析基本可以鉴别大叶三七的产地。

 

主成分分析PCI-PCII和PCI-PCIII的对画图

3.2 不同产地大叶三七红外光谱的系统聚类分析

以小波去噪、压缩后的不同产地大叶三七红外光谱标准化数据在MATLAB软件上编程实现系统聚类分析,分析结果见图8。

 

8 不同产地大叶三七红外光谱系统聚类分析图

由图8可知:以标准化欧氏距离为归类标准,当标准化欧氏距离等于110(图中红线所示)时,可以将13个不同产地大叶三七聚为三大类,即为云南昭通(3号)、山西(6号)、云南文山(11号)聚为一大类;陕西太白山(1号)、青海互助(2号)、云南迪庆(4号)、云南大理(5号)、甘肃麦积山(8号)、湖北神农架(9号)、甘肃六盘山(13号)聚为一大类;安徽(7号)、陕西汉中(10号)、四川(12号)样品聚为一大类。这与主成分分析结果完全一致,两者相互印证,说明大叶三七红外光谱的系统聚类分析模型稳定。

4  结果分析与讨论

红外光谱运用系统聚类分析鉴别产地其基本思路是根据小波去噪、压缩后的大叶三七红外光谱数据矩阵找出能度量这些数据(标准欧氏距离)之间相似程度的统计量;然后以统计量作为划分类型的依据,把一些相似程度大的变量(或样品)首先聚合为一类,而把另一些相似程度较小的变量(或样品)聚合为另一类,直到所有的变量(或样品)都聚合完毕,最后根据各类之间的亲疏关系,逐步画成一张完整的系统聚类图。可根据“物以类聚”的思想将聚类结果解释为产品质量相似的聚为一类,不相似自然聚为另一类。即可说明与道地性药材聚为一类的非道地药材在质量上与道地药材非常接近,也可认为其为道地药材,是药材质量的以保证。

系统聚类分析结果将本实验中13中不同产地大叶三七归为三类,可以从地理区域解释为云贵高原的大叶三七为一类、秦岭以南地区的大叶三七聚为一类,秦岭以北的大叶三七聚为一类。即3、6、11号为一类,主要是云南大叶三七为主,当然出现了山西(6号)归于此类的特例,其可能因山西大叶三七的生境与云南大叶三七生境相似所致;1、4、2、5、8、9、13号为一类,主要是秦岭以北(地理上的北方)的大叶三七为主,这一类中出现类云南迪庆(4号)、云南大理(5)、湖北神农架(9)等地大叶三七归于此类,说明秦岭以北大叶三七的生境与云南迪庆、云南大理、湖北神农架等地大叶三七的生境相似;7、10、12聚为另一类,主要以秦岭以南(地理上的南方)大叶三七为主,而陕西汉中与四川交界,地处秦巴山区生境更接近,安徽的大叶三七的生境与此两地相似。

综上所述,本次实验所采13个不同产地的大叶三七的产地整体可分为三大块,即云贵高原地区、秦岭以南(地理南方)地区、秦岭以北(地理北方)地区。其中秦岭以北地区大叶三七和云南迪庆、大理两州大叶三七相似,秦岭以南地区大叶三七自成一系,其中湖北神农架大叶三七比较特殊。这样的聚类结果与大叶三七的实际分布情况一致,说明系统聚类分析可以用来鉴别大叶三七的产地。为大叶三七的产地鉴别提供一种快速、准确的鉴别方法,同时为其他药材的产地鉴别提供参考方法。

 

参考文献

[1]  国家药典委员会.中国药典[M].北京:中国医药科技出版,2010:254-2555.

[2]  何春喜,余泽义,何毓敏,等.竹节参总皂苷的大孔吸附树脂纯化与离子交换树脂脱色工艺研究[J].中草药,2017,48(6):1146-1152.

[3]  张海元,李小辉,梅双喜,等.珠子参化学成分研究进展[J].中草药,2017,48(14):2997-3004.

[4]  彭树林,肖  蓉,肖倬殷.川产珠子参化学成分的研究[J].华西药学杂志,1986,1(3):178.

[5]    ,刘  琦,刘银环,等.珠子参叶化学成分研究[J].中国中药杂志, 2014, 39(9): 1635-1638.

[6]  刘朝霞,潘家荣,邹  坤,等.扣子七挥发油成分的研究[J].时珍国医国药,2007,18(2):301-302.

[7]  施丽娜,詹尔益,张玉珠.珠子参挥发油的化学成份[J].昆明医学院学报,1992,13(1):46-48.

[8]  蓝正学,赖普辉,韩  森.秦巴山区钮子七挥发油化学成份及药用价值的研究[J].化学世界,1995(12):641-643.

[9]  赖普辉,田光辉,高艳妮,等.钮子七茎中石油醚提取物成分的GC-MS分析[J]安徽农业科学,2008,36(23):10026-10027.

[10]  袁菊丽,房  ,张璇,等.珠子参多糖提取纯化工艺研究[J].河南中医,2007,27(12):73-74.

[11]  许苗苗,刘银环,杨新杰,等.不同产地珠子参中多糖的含量测定[J].现代中医药,2014,34(5):73-75.

[12]    ,赖普辉.秦巴山区钮子根茎、叶中微量元素的研究[J].广东微量元素科学,2008,15(1):39-45.

[13]  朱小梅.秦巴山区中草药钮子七中微量元素的测定[J].光谱实验室,2010,27(5):2026-2028.

[14]  宋小妹,李渊源,宋  .珠子参不同药用部位微量元素分析[J].西北药学杂志,2011,26(2):79-80.

[15]    ,杨万林,陈锦玉,等.珠子参地上部分氨基酸测定及营养评价[J].氨基酸和生物资源,2013,35(2):1-4.

[16]  李巧云,赵  恒,岳松健,等.大叶珠子参总皂甙的镇痛镇静作用研究[J].华西药学杂志,1993,8(2):90-92.

[17]    ,崔秀明,施莉屏.中药材道地性的研究进展[J]. 现代中药研究与实践,2006,20(1):58-61.

[18]  孙素琴,周  ,陈建波.中药红外光谱分析与鉴定[M].北京:化学工业出版社,2010.

[19]  李丹婷,张长江,汪  .基于小波变换的红外光谱分析[J].光谱学与光谱分析,200626(11)2024-2026.

[20]  石永福,杨得国,李  .一种基于小波变换的数字图像水印新算法[J].华中师范大学学报(自然科学版),2013,47(4):479-482.

微信二维码
扫码添加微信咨询
QQ客服:1663286777
电话:137-1883-9017
收到信息将及时回复