口服液浓缩液近红外测试报告
样品分析:样品是浓缩液,主要原料是西洋参、灵芝等。测量指标是皂苷,皂苷含量是35.2mg/100ml。在实际生产过程中应该还有个控制线,功效是增强免疫力、缓解体力疲劳的保健品。皂苷由皂苷元与糖构成。组成皂苷的糖常见的有葡萄糖、半乳糖、鼠李糖、阿拉伯糖、木糖、葡萄糖醛酸和半乳糖醛酸等。柴胡皂苷的化学结构式如图1所示。

图1为柴胡皂苷的化学结构式
从皂苷的结构式中知,含有丰富的0H,COH等键,但是并没有明显特征吸收峰,主要是查看的这类官能团的吸收带。图2是有机化合物的近红外光谱谱带归属,从图2可以知道,皂苷0H,COH等键的主要吸收位置1900-2000nm、1400-1500nm、1100-1200nm。

图2为有机化合物的近红外光谱谱带归属
2、样品测试:
(1)样品深咖色液体,样品内会有絮状固体,快速搅动有气泡出现,有焦糖的香甜味,共收到相同的样品8瓶成品,根据平底标记,有三个批次,分别标记为A、B、C。
(2)该样品的测试所使用的设备是:晶格码(青岛)智能可以有限公司光栅型近红外光谱仪,可用波长范围是900-2200nm,两条近红外光纤,卤素灯,光程3mm的比色皿(可用光程为3mm的透反射探头)。以空气为参比,进行测量,共采集38组样品,采集不同批次,不同浓度样品的近红外光谱,用于建立近红外化学计量学模型。按照如下方式采集样品:(1)开启批次A样品一瓶,取原液20ml,采集近红外光谱,连续加蒸馏水4ml或3ml,并采集近红外光谱并记录,共计17组数据。(2)开启批次B样品,取10ml样品,采集近红外光谱,然后依次加蒸馏水5ml,采集近红外光谱10条,并依次保存。(3)开启C批次样品,取原液20ml,依次加蒸馏水5ml,采集近红外光谱10条,并依次保存。蒸馏水数据1条,共计38组样品的近红外光谱图如图3所示,共计511个变量,从原始光谱图中可以发现,随着加水后浓度的变化,1900-2000nm、1400-1500nm、1100-1200nm处均有吸光度值的变化,由于在1400-1500nm处,有水吸收的影响,吸收较大,该处的光谱有些失真,所以在后期建模的时候波段选择的时候注意避免。

图3为口服液浓缩液样品近红外光谱图
采集光谱过程中,发现当加水稀释浓度低于10%后,肉眼能观察的谱图变化,并不明显,如图4所示,所有对于皂苷浓度较低的样品,推测近红外反应并不灵敏。

图4为口服液浓缩液低浓度近红外光谱图
3、PLS建模分析
建模过程中A/B/C三个批次原液的皂苷浓度均是35.2mg/100ml,然后根据加蒸馏水量配比不同浓度的溶液,浓度如表1,批次A有17组数据,批次B有10组数据,批次C有10组数据。 取出3A(0.2346)、8A(0.1637)、12A(0.117)、23B(0.1408)、27B(0.0782)、30C(0.2816)、34C(0.1564),作为验证数据,其他数据作为训练数据。首先对训练数据的近红外光谱进行预处理,预处理方法的选择,比较了Detrend、Baseline、MSC、SNV、一阶求导、S.G平滑以及一系列组合预处理方法对模型的影响。通过比较均方根误差(RMSEC)、交叉验证均方根误差(RMSECV)、相关系数(R^2 Cal、R^2)等模型评价参数,其中相关系数越接近1越优,验证均方根误差(RMSEC)、交叉验证均方根误差(RMSECV)(误差越小越优)。通过多个模型的比较,选取的预处理方法是:一阶求导(1st Derivative)+Detrend (offset)+Autoscale的组合。
![]() |
![]() |
|
图5 为训练和验证数据相关系数图 |
图6 为训练数据的误差图 |
训练数据和验证数据的相关如图5所示,模型预测值与实际值的误差如图6所示,绿色的是两条±10%的控制线,训练数据29/31(93.5%)的数据可以控制±10%之内,最大相对误差是第28B号样品,实际浓度是0.0704,模型预测值是0.082467,相对误差是17.14%。绝对误差最大的是第25B号样品,实际浓度是0.1005,模型预测值是0.1138636,绝对误差是0.013。8组验证数据均可在±10%的相对误差线之内,最大相对误差是-10.08%,绝对误差最大是-0.017。
4、结论
本次口服液浓缩液近红外测试实验,共收到8瓶成品,根据罐低标识,分为A/B/C三个批次,每批次开启一瓶,取出样品,并根据不同的加蒸馏水的量,配比不同浓度的溶液,原液的皂苷浓度均是35.2mg/100ml,然后根据加蒸馏水量配比不同浓度的溶液皂苷浓度,并连续采集近红外光谱数据,共计38组数据,其中批次A有17组数据,批次B有10组数据,批次C有10组数据。
取出3A(0.2346)、8A(0.1637)、12A(0.117)、23B(0.1408)、27B(0.0782)、30C(0.2816)、34C(0.1564),7组数据作为验证数据,其他31组数据作为训练数据,建立模型。训练数据29/31(93.5%)的数据可以控制±10%之内,最大相对误差是第28B号样品,实际浓度是0.0704,模型预测值是0.082467,相对误差是17.14%。绝对误差最大的是第25B号样品,实际浓度是0.1005,模型预测值是0.1138636,绝对误差是0.013。8组验证数据均可在±10%的相对误差线之内,最大相对误差是-10.08%,绝对误差最大是-0.017。误差较大的,均是浓度较低的样品,可能原因是皂苷含量较低后,在近红外光谱图中反应不明显,和配比过程中浓度较低的数据量较少,增加低浓度样本个数,有助于提高模型对低浓度预测的正确度。

