
分享:基于近红外光谱的输电线钢芯腐蚀原位检测方法
钢芯铝绞线(ACSR)是输电系统中最常用的输电线,其安全可靠运行对保障电力安全输送至关重要[1]。然而,受大气中水分、化学气体和盐类介质等因素侵蚀的影响,ACSR在使用过程中容易发生腐蚀。腐蚀会导致钢芯强度降低,造成断股或断线等严重的安全隐患[2-6]。在近海地区,ACSR的腐蚀情况更为严重[7]。目前,对于ACSR腐蚀等级的判定,尚缺乏成熟的经验和标准[8],主要通过人为观察在役输ACSR外观或图片识别。然而,这些传统方法无法准确区分介于未腐蚀与严重腐蚀之间的钢芯腐蚀情况。因此,对ACSR腐蚀的原位检测具有重要的实际意义。夏开全等[9-12]分析了在役ACSR的腐蚀情况及原因;张建堃等[13-14]通过人工盐雾试验提出了ACSR的初步腐蚀机理;安宁[15]研究了两种人工模拟工况下ACSR的腐蚀因素。上述研究都对ACSR腐蚀原因进行了分析,但由于检测设备体积庞大,不适合现场操作,因此未对在役导线进行原位检测,也未对输电线钢芯腐蚀问题做出探究。MURRAY等[16]先通过ACSR表面检测判别氧化铁沉积物,根据特定波长的反射光强度比率判断输电线钢芯的腐蚀状态,然后基于铁锈(钢芯腐蚀产物)的反射特性,进行室外试验验证,但该研究仅以简单的反射特性作为判别依据。FUSE等[17]使用X射线衍射和傅里叶变换红外光谱确定钢腐蚀产物的主要稳定成分为纤铁矿(γ-FeOOH),当腐蚀产物累积到一定程度时,部分γ-FeOOH会转变为相对稳定的α-FeOOH和Fe3O4[18]。X射线衍射、能谱仪等设备因体积庞大且试验条件苛刻不适合原位检测,拉曼光谱技术因检测时间较长以及微波和毫米波成像技术感应距离短,也不适合原位检测。
相对上述技术,近红外光谱技术具有检测速度快、无需样本预处理、检测精度高、非接触检测和设备体积小等优点,可以适用于现场原位检测[19],在化工领域的应用也越来越广泛[20]。因此,作者基于近红外光谱技术,提出了ACSR钢芯腐蚀的原位检测方法。首先,对原始光谱数据预处理提高数据质量,并通过潜在投影图(LPG)选择最佳分析波长;然后,通过腐蚀状态与波长的主成分分析(PCA)进行数据降维;最后,将PCA降维得分数据作为输入端,输入经鹈鹕优化算法(POA)优化参数后建立的支持向量机回归(SVR)分类模型中,从而得到了一种ACSR钢芯腐蚀的原位检测方法。该研究也为ACSR原位腐蚀检测提供了新思路。
1. 试验
1.1 试验平台
按图1搭建近红外光谱检测试验装置,其主要设备及功能如表1所示。
试验设备 | 功能 | 备注 |
---|---|---|
DH-2000光源装置 | 发射近红外光 | 钨卤素灯,标称灯泡功率20 W |
NIR-QUERT512近红外光谱仪 | 接收近红外光 | 接收1 000~1 800 nm光源 |
近红外传输光纤 | 传输载体 | - |
反射白板 | 采集参考光谱 | - |
支架 | 固定探头 | - |
含Oceanview软件的电脑 | 获取近红外反射率光谱数据 | - |
1.2 试样选取
试验选取云南地区服役不同时间后4类(a、b、c、d)腐蚀状态的ACSR作为试样,如图2所示。其中,a类为未腐蚀试样,外表光亮,无任何腐蚀产物和点蚀坑洞;b类和c类分别为服役18 a和29 a后试样,表面呈现暗银色,其截面已经完全失去金属光泽,还出现了腐蚀“麻点”及腐蚀坑,无明显的黄色锈蚀斑点,但缝隙有极少量的黄色锈蚀;d类为服役37 a后试样,表面基本被黄色的锈蚀覆盖,内部钢芯基体也遭受到严重的腐蚀,内层钢芯腐蚀产物FeOOH通过绞线缝隙和点蚀孔洞逐渐渗透至外层铝线表面,进而出现大量黄色的锈蚀斑点。
在钢芯腐蚀产物刚好溢出至表面这一时段,人眼或视觉识别无法分辨ACSR表面是否有钢芯腐蚀产物,因此需要通过近红外检测及时发现该问题,同时也提出了一种通过非主观经验判断ACSR腐蚀状态的检测方法。
1.3 近红外光谱数据采集
ACSR腐蚀产物属于附着型固体,大部分近红外光都会被吸收或者漫反射。因此,作者通过对ACSR进行腐蚀检测获得近红外反射光谱数据,其反射率(R)为
|
(1) |
式中:I为实时光谱强度;I0为采集的参考光谱强度;Idark为采集的暗光谱强度。暗光谱是无光源情况下由电路、仪器等引起的信号。式(1)中已消除环境光造成的影响。
由于不同物质对红外光的吸收波段不同,所以在利用近红外光谱技术对不同腐蚀状态下ACSR表面附着腐蚀产物进行定性分析时,需要先通过标准正态变量处理将数据归一化至相同的尺度,避免因测量数值大小不同对后续分析产生影响。
1.4 数据分析方法
图3为近红外光谱数据处理流程图。首先,通过近红外光谱仪测量,得到试样的原始光谱,再通过标准正态变量处理将光谱数据归一到相同尺度上;然后,对比分析获得最佳光谱数据预处理方法,并通过LPG选择最佳建模波长;最后,利用PCA降维的得分数据作为输入端输入SVR模型,经POA优化后建立POA-SVR模型,达到分类识别的目的。
1.4.1 主成分分析原理
PCA是一种常用的多元统计分析和降维技术,用于探索数据中的模式和结构,可从光谱数据中提取重要信息[21]。PCA通过因子分析即对数据矩阵进行特征分析、旋转变换等操作,获得相关信息。本研究基于奇异值(SVD)分解协方差矩阵实现PCA算法。对一个给定的m行n列的数据集D进行SVD分解,如式(2)所示。
|
(2) |
式中:U、S和V为SVD分解出的三个向量。其中,U为左奇异向量矩阵,表示数据在原始空间的投影,代表原始数据在奇异值分解中的旋转部分;S为奇异值矩阵,包含矩阵的奇异值(矩阵特征值的平方根),反映了矩阵中的数据方差,奇异值从大到小排列,较大的奇异值对应主成分中贡献较大的方向;V为右奇异向量矩阵,包含输入数据的特征向量(载荷),载荷是近红外光谱各波段反射值在主成分中的权重系数,反映了每个变量对主成分变化的贡献程度,确定哪些波段对数据变异具有重要影响;R为投影向量(得分),表示每个样本在主成分上的投影值,反映了原始数据点在由主成分组成的低维空间中的位置,并识别出样本之间的差异或分组情况。
R既可以用作降维数据集,也可用于聚类分析。载荷数据可以反映各变量之间的关系。当载荷数据点与原点连线时,若两变量连线夹角较小,则两变量相关性(正相关)较强,当夹角接近180°时,两变量呈现负相关。在PCA过程中,通过绘制主成分图,评估不同组试样之间的聚类情况。得分图反映了样本之间的关系,载荷图反映了变量之间的关系。结合得分图和载荷图,能够探索样本与变量之间的相关性,两者结果越接近,则相关性越强。
1.4.2 光谱数据预处理方法与潜在投影图
在实际近红外光谱检测过程中,不可能保证测试条件完全一致,光漫反射会对检测结果产生一定影响,同时样品成分含量以及噪声等因素也会影响光谱,使光谱之间的强度变化较明显,光谱信息重叠情况严重,很难直观鉴别各样品的峰位、峰强等特征信息。因此,还需对近红外光谱数据进行预处理以改善数据的质量、可解释性和可用性,从而提高数据分析和建模的效率及精度[22]。采用Savitzky-Golay平滑处理可降低光谱的随机噪声和提高光谱信噪比;采用Savitzky-Golay一阶导数可扣除光谱中的背景;采用趋势校正(DT)可去除光谱中一些非谱学性的变化。利用主成分分析中主成分方差解释率的最大值选择最佳预处理方法[23]。
每次近红外检测都会得到449组数据(不同波长及其对应的反射率),其中有些波长可能与测试物质的性质密切相关,但有些波长可能是无信息的。某些波长特征或信息可以通过其他特征或信息线性组合来表示。因此有必要从449组数据中提取最佳波长建立模型。LPG是化学因子分析中一种用于分析连接性数据的技术[24]。首先通过PCA获得数据矩阵的潜变量(载荷)和对象在潜变量上的投影(得分),然后通过载荷图分析数据矩阵的性质,潜变量是测量变量的线性组合,并且投影定义了由潜变量构成的简化变量空间中的样本关系。与其他变量选择算法相比,LPG是一种简单且高效的变量选择方法[24]。该方法通过对近红外光谱数据矩阵执行主成分计算LPG(载荷图),然后从LPG中检测非共线变量,以LPG拐点处的变量建立模型。
1.4.3 支持向量机回归
SVR是一种基于支持向量机的监督学习方法,在解决小样本和非线性的回归建模问题时具有很大的优势[25]。首先,利用PCA降维的数据作为输入端,对不同腐蚀状态进行数值编号并将其作为目标值,然后建立导线腐蚀状态判别的SVR分类模型。为了提高SVR分类模型的精度,引入POA,该算法是根据鹈鹕在捕猎时的行为和策略提出的一种智能优化算法[26]。通过POA优化SVR的惩罚参数C与核参数g,进一步提升分类模型的性能,其方法流程如图4所示。
2. 结果与讨论
2.1 近红外光谱数据采集及预处理
在1 000~1 800 nm光谱波长范围内,对140根导线试样(a、b、c、d类腐蚀状态试样的数量分别为20、50、50、20根)进行近红外光谱测试,从距探头约1 cm处垂直扫描最外层铝线中心,光斑直径约为1.5 mm,得到近红外原始光谱数据。每根试样同一处扫描5次,以去除异常光谱数据后的平均值作为该样品的近红外反射光谱数据,并对光谱数据进行了标准正态变量(SNV)处理,其结果如图5所示。
由图5可见,虽然这些导线在不同腐蚀状态下的腐蚀产物存在差异,但由于它们的主要元素仍是铝,因此,其光谱的波峰、波谷处重合度极高,难以通过该光谱直接区分。为了解决这一问题,需要采用合适的光谱预处理方法,从光谱中提取有效特征信息即筛选出有代表性的波长。结合不同预处理方法,再通过前两主成分(第一主成分PC1和第二主成分PC2)分析得到方差解释率(对总方差的贡献比例),结果如表2所示。
编号 | 预处理方法 | 方差解释率/% | |||||
---|---|---|---|---|---|---|---|
PC1 | PC2 | PC1+PC2 | |||||
① | DT | 76.48 | 22.37 | 98.95 | |||
② | SG-1D | 88.68 | 7.26 | 96.30 | |||
③ | SGS | 71.00 | 28.16 | 99.16 | |||
④ | DT+SG-1D | 77.04 | 9.65 | 86.69 | |||
⑤ | DT+SGS | 76.49 | 22.40 | 98.89 | |||
⑥ | SG-1D+SGS | 89.68 | 7.30 | 96.98 | |||
⑦ | DT+SG-1D+SGS | 84.70 | 10.08 | 94.78 | |||
注:DT为趋势校正;SG-1D为Savitzky-Golay一阶导数;SGS为Savitzky-Golay平滑处理。 |
表2中前两主成分PC1+PC2方差解释率超过98%(可以解释原光谱98%以上信息)的有①、③、⑤共3种预处理方法,这表明不同腐蚀状态试样的化学性质因其腐蚀产物成分不同而不同。其中,预处理③的方差解释率最高,达到了99.16%,即采用该预处理方法时前两个主成分可以代替原光谱数据中最多99.16%的信息。
2.2 近红外波长选择
近红外光谱数据存在着冗余性,对数据进行SNV处理和Savitzky-Golay平滑预处理即预处理③后,通过LPG对近红外波长进行筛选。主成分的载荷图如图6所示。
由前文分析可知,经SNV处理和Savitzky-Golay平滑预处理后,PC1和PC2的方差解释率分别为71.00%和28.16%,累计方差解释率达到99.16%。这表明这两个主成分能够表达99.16%的原始近红外光谱信息。在载荷图中,各载荷点反映了对应波长对主成分变化的贡献大小。通过分析,可以识别具有显著影响的关键波长。在图6中,选择的波长均位于载荷图的拐点,分别为1 052.904、1 121.885、1 179.405、1 233.530、1 300.114、1 393.117、1 429.198、1 490.149、1 566.309、1 635.826 nm。这些拐点清晰地展示了各峰间相对强度的逐渐变化,以及左右直线变量的非共线性。这10个近红外波长将作为最佳波长用来构建模型。
2.3 试样腐蚀状态的主成分分析
将SNV处理和Savitzky-Golay平滑预处理后获得的10个最佳波长进行PCA,获得降维后的二维得分数据和4类样本可视化聚类结果,结果如图7所示。
分析结果中PC1和PC2的方差解释率之和为99%,即该两个主成分表达了原始光谱数据信息的99%。从图7中可以看出,a类和d类腐蚀状态聚类明显,而b类与c类腐蚀状态出现了部分交集,即无法从PCA得分结果完全区分b类与c类试样的腐蚀状态。
2.4 支持向量机回归分类建模
图7中的PCA结果并不能完全解决b类与c类腐蚀状态的分类,因此先采用SVR模型进一步实现分类目的。利用上述主成分降维出的前两主成分得分数据作为SVR模型的输入集,并将4类腐蚀状态标签(分别设为0、1、2、3)作为目标值。通过SVR建立回归模型,默认设置SVR模型惩罚参数C=1,核参数g=0.5,结果如图8所示。
若腐蚀状态标签实际值与目标值之间的差值小于0.5,则将模型分类结果视为正确。该SVR模型的整体分类准确率为92.14%,仍然存在一定的偏差,这表明一些不可靠特征对模型产生了影响。因此,需要对参数进行优化以减小这种影响,从而提高模型的判别率。
经POA寻优后,SVR模型的惩罚参数C=2.12,核参数g=0.57,最后结果如表3所示。结果表明,POA优化后模型识别b类和c类腐蚀状态的正确率分别提高了4%和8%,整体正确率提高了4.29%,最终腐蚀状态识别率达到96.43%,其实际值与目标值的偏差较小,模型整体识别效果良好。
腐蚀状态 | 正确率/% | |
---|---|---|
SVR | POA-SVR | |
a类 | 100 | 100 |
b类 | 90 | 94 |
c类 | 88 | 96 |
d类 | 100 | 100 |
整体 | 92.14 | 96.43 |
2.5 试验验证
为了进一步验证POA-SVR模型的可靠性,采用能谱分析仪(EDS)对4类腐蚀状态试样表面进行化学元素分析,结果如表4所示。EDS分析结果表明,d类腐蚀状态试样表面含有较多的Fe元素,c类腐蚀状态试样表面仅有极少量的Fe元素,这表明d类腐蚀状态试样的钢基体已经遭受严重的破坏,c类腐蚀状态试样的钢芯腐蚀产物已经开始往表面渗透。但b类和c类腐蚀状态试样的表面特征几乎一致,难以通过观察区分,通过上述近红外来光谱技术结合分类模型可以实现对b类和c类腐蚀状态的分类识别。
腐蚀状态 | 摩尔分数/% | ||
---|---|---|---|
Al | Zn | Fe | |
a类 | 89.12 | - | - |
b类 | 62.66 | 0.06 | - |
c类 | 49.24 | 3.44 | 0.69 |
d类 | 54.13 | 5.51 | 9.65 |
因此,将表面附着少量钢芯腐蚀产物的c类腐蚀状态作为导线钢芯腐蚀的临界状态,此时该腐蚀状态导线的钢芯已经失去镀锌层的保护,在随后的腐蚀过程中将加剧腐蚀,直至钢芯断股。当检测出输电线属于c类腐蚀状态时,应及时采取相关处理或更换导线,以避免发生断线及严重安全事故。
3. 结论
(1)采用标准正态变量处理和Savitzky-Golay平滑预处理,可使最大方差解释率达到99.16%。利用LPG筛选了10处最佳波长作为建模变量。结合最佳的预处理方法和最佳的波长,利用主成分分析得分图得到样本的可视化聚类结果,同时获取经降维后的二维得分数据。
(2)利用主成分降维数据结合支持向量机建立了分类模型,并用鹈鹕算法优化支持向量机回归分类模型的参数以提高模型分类精度,最终模型的分类准确率达到96.43%。
文章来源——材料与测试网