近红外光谱定量分析的七个环节
① 准确扫描校正样品集中各个样品规范的近红外光谱:为了克服近红外光谱测定的不稳定性的困难,必须严格控制包括制样、装样、测试条件、仪器参数等测量参数在内的测量条件;利用该校正校品集建立的数学模型,也只能适用于按这个的测量条件所测量光谱的样品。
② 选择与建立校正样品集中各个样品:为了克服近红外光谱复杂与变化的高背景,校正样品集中的各个样品必须包括今后待测样品中的全部背景,利用该校正样品集建立的数学模型,就能够校正样品中各种复杂的背景,该数学模型也只能适用于包括这些背景的样品。可以按光谱特征或浓度来选择校正校品集。
③ 准确测定样品集中每个样品的各种待测成分或性质(称为化学值)。因为这些值测定的精确度是近红外光谱运用数学模型进行定量分析精确度的理论极限。
④ 剔除异常值,建立校正校品集(标样集):由上述 ① 、② 环节测定的校正样品集中种样品的光谱与化学值,有可能由于种随机的原因而有较严重的失真,这些样品的测定值称为异常值。这些失真的样品,若包含在校正校品集中,就会影响所建数学模型的可靠性,因此在建立模型时应当剔除这些异常值。一般定量分析程序中都包含用统计方法指出某些异常值,应用人员可以根据情况决定是否将这些异常样品剔除。
⑤ 对校正样品集中样品光谱的预处理与分析谱区的选定:光谱的预处理与谱区的选定,是克服近红外光谱测定不稳定的有效环节。根据标样光谱的状况对光谱预处理,包括求导、数字滤波、付立叶变换与小波变换滤波等,以降低系统背景与随机背景。近红外光谱定量分析数学模型所包含的谱区(光谱的数据点)一般应根据样品的特点而选定;增加谱区的范围就可以增加对光谱信息采集的范围,即提高信息量;但因为每个光谱的数据点也包含了测量误差,因此数学模型所利用的数据点越多,则包含的测量误差也越大,为了减少近红外光谱中某些信息量小、失真大的部分谱区,以避免这些谱区的测量误差影响数学模型的稳定性,需要选择建立数学模型所用的谱区。可以依据导数光谱或相关系数随频率变化的相关图,用以选择数学模型包括的频率范围。
⑥ 选择算法、确定模型的参数、建立、检验与评价数字模型:常用的算法有逐步回归分析、偏最小二乘法、主成分回归分析等。这些算法的基本思想是应用近红外光谱的全光谱的信息,以解决近红外光谱的谱峰重叠与复杂背景的影响。如前所说,不同组分虽然在某一谱区可能重叠,但在全光谱范围内不可能完全相同,因此,为了区别不同组分,必须应用全光谱的信息。
可用内部交叉证实法确定数学模型所用的最佳维数(即阶数)。内部交叉证实的方法是评价确定数学模型的一种有效方法。这种方法是依次、每次从校正样品集中提出一个或几个样品,然后用剩余的样品建立数学模型,并用数学模型预测原来提出的一个或几个样品,作为对数学模型的检验。反复进行上述步骤,直至校正样品集中的每个样品都被预测检测过一次为止。为了评价数学模型,将内部交叉证实时用数学模型预测计算的校正集中各样品的化学值与各样品的实际值作线性相关,计算相关系数和校正标准差,并用相关系数与校正标准差来评价数学模型的预测效果。要求相关系数接近 1 、校正标准差逼近于校正集测定标样化学值的标准差。如果内部交叉证实的方法确定数学模型预测的效果较好,则可以运用外部证实法进一步检验和评价数学模型;不然,须重复 ④ 、 ⑤ 、 ⑥ 以优化数学模型。
⑦ 用外部证实法检验和评价数学模型,以检验数学模型在时间空间上的稳定性。可以用另外几批独立的、待测量已知的检验样品集,用数学模型预测计算检验集中各样品的待测值;对实际值与预测值作线性相关,并用相关系数和预测标准差来表示预测效果,要求相关系数接近 1 、预测标准差逼近于校正标准差。为了检验数学模型在时间、空间上的稳定性,需要用数学模型预测不同时间和空间的检验样品集,检验预测标准差是否都能得到稳定的结果。如果外部证实的方法确定数学模型预测的效果好,则可以考虑近红外光谱分析中应用这些数学模型;不然须重复 ④ 、 ⑤ 、 ⑥ 以优化数学模型。如果测定的样品在时间和空间条件上有一些新的变化,原有的数学模型已不适合此新条件,则需重新建立有代表性的校正样品集(可以在原有的样品集中增加一些新的样品类型,以使新的校正样品集能代表新的类型样品),然后再按照 ①—⑦ 环节对数学模型进行修正与维护。