基于FORS与机器学习模型的“青铜病”原位无损识别方法
时间: 2025-07-16 点击: 次
来源: 作者:
青铜文物上的锈蚀产物是其重要组成部分,具有文化和美学价值。然而,部分青铜锈蚀会对器物的稳定性产生较大影响,其中危害性最大的一类是铜的氯化物,其生成与“青铜病”紧密相关。一般认为,青铜病是一种自循环腐蚀过程,当铜与土壤中的氯离子接触,会生成氯化亚铜(CuCl),当CuCl暴露于氧气和30%以上的相对湿度环境中,会生成三羟基氯化铜(Cu2(OH)3Cl)。在适宜条件下,自腐蚀反应会持续发生,直至系统中的铜、氧气和水消耗殆尽。“青铜病”会造成青铜文物表面发生点状、大面积锈蚀及穿孔现象,甚至可能导致其完全转化为绿色锈蚀粉末,是青铜文物保存的最大威胁之一。有效治理“青铜病”的关键在于及早发现,根据其分布状态与严重程度制定科学合理的保护方案,并在保护工作完成后对其保存环境进行有效控制,对锈蚀发展状况进行长期监测。目前,文物保护人员发现“青铜病”的流程一般为:观察青铜文物表面锈蚀状况,根据锈蚀形貌特征对疑似为三羟基氯化铜的浅绿色粉状锈蚀进行经验性取样,再利用多种科学分析方法对其成分进行鉴定,从而判断该器物是否存在“青铜病”。然而,受到多种主客观因素的影响,该方法较难全面、准确地揭示青铜文物表面三羟基氯化铜的分布情况,从而无法对青铜文物面临的潜在腐蚀风险进行有效判断。此外,用于锈蚀鉴定的常用分析方法(例如X射线衍射等)多为有损方法,可能对文物的完整性造成影响。综上,目前亟需针对“青铜病”诊断这一关键难题,开发一种原位无损、成本较低、快速准确的检测方法,能够在常规巡检中及时发现文物表面的三羟基氯化铜,确定其分布状态,并能在保护工作完成后利用该方法对文物开展长期监测,评估文物保护效果。 针对这一研究问题,中国国家博物馆与北京科技大学、北京大学、诺丁汉特伦特大学等机构合作,开发了一种基于光纤反射光谱(FORS)和高光谱成像(Hyperspectral imaging)的三羟基氯化铜原位无损鉴定方法,并成功应用于中国国家博物馆馆藏鎏金金刚勇识菩萨的保护之中(详情见文末链接及图1、图2)。然而,FORS虽然能够有效识别较纯的三羟基氯化铜锈蚀产物,其对于混合锈蚀产物中三羟基氯化铜的识别能力仍不理想。这主要是因为青铜文物中的常见锈蚀产物在反射光谱中的特征吸收带存在严重重叠,使得混合物反射光谱的形状与纯物质存在较大差别。为解决这一问题,合作研究团队将机器学习模型和光纤反射光谱(FORS)相结合,利用有监督分类算法自动学习含三羟基氯化铜光谱的特征,实现了混合物中三羟基氯化铜的精准识别,解决了将FORS应用于青铜文物锈蚀研究与保存状况评估的关键瓶颈问题。应用该方法可以使文物保护人员快速、全面、准确地评估青铜文物锈蚀中是否含有“青铜病”的指标锈蚀产物,为青铜文物保护方案制定与保护效果评价提供了关键技术支撑。本研究的模型建立过程主要包括构建训练集、数据预处理、模型训练以及效果评价几个部分,并基于支持向量机(SVM)算法构建的分类模型,讨论了在混合物反射光谱中识别三羟基氯化铜的关键吸收带位置。本文发表于国际著名文物保护期刊《Journal of Cultural Heritage》。

训练集构建
本研究采集了来自中国国家博物馆、湖北随州叶家山、湖北京山苏家垄、河南驻马店等多个博物馆藏及考古遗址出土青铜文物的133份锈蚀样品,并利用X射线粉末衍射(XRD)方法确定了其矿物组成。锈蚀混合物中主要包含孔雀石、赤铜矿等常见矿物,并在其中30.8%的样品内检测到三羟基氯化铜。此外,基于过往研究基础,本研究还利用天然矿物和化学试剂模拟制备了27组不同类型的青铜锈蚀混合物。综合两部分样本的FORS数据,并以“是”或“否”含有三羟基氯化铜对其进行标记,构建了模型的训练集(图3)。
数据预处理
样品的光谱反射率强度受样品状态(如平滑度、曲率)、检测环境、仪器稳定性和测量条件(工作距离和角度)等因素的影响,可能会存在数据信号含噪、谱峰叠加、坐标不一致等问题。这些因素会对建模效果产生一定的负面影响,因此需要对光谱进行预处理(图4)。

为解决不同测量条件带来的横坐标不一致问题,实验采用线性插值法将数据在不同的横坐标上对齐,避免了由于横坐标误差导致的样本无法分类的情况。为应对各样品反射率的差异,将所有数据映射在(0,1)之间进行归一化处理,便于不同单位或量级的指标间的相互比较和加权。针对噪声问题,本研究选用了小波去噪方法,采用阈值法重构信号,以较小的系数幅值消除高频噪声。经过小波滤波和归一化处理后,有效地减少了噪声干扰,同时保持了光谱数据的特征(图5)。利用预处理后的数据对算法进行训练,提高了算法的准确率和运算速度。
模型训练
有监督学习通过让算法学习大量带有标签的样本数据,寻找输入数据与标签之间的对应关系,生成分类函数,并利用该函数泛化新的样例,将输入映射到合适的输出,最终对未知样本的分类结果进行预测。本研究使用了包括逻辑回归(LR)、决策树((DT)、线性判别分析(LDA)、集合子空间判别(ESD)、多层感知器(MLP)和支持向量机(SVM)六种不同的算法进行模型构建。
在进行模型训练之前,首先采用主成分分析(PCA)进行数据降维和可视化。前两个主成分可解释原始变量93.15%的特征信息。结果显示包含与不含三羟基氯化铜的样品沿PC1轴有一定程度的分离,但它们之间仍然存在相当大的重叠,证明光谱并非线性可分(图6)。

三羟基氯化铜参考样品在1465 nm、1855 nm、1987 nm、2159 nm处有特征吸收峰,在2339 nm处有较宽的吸收带(图7a)。本研究所用训练集中的许多样品在上述波长位处没有显示出清晰的吸收带,但通过XRD分析证实其含有三羟基氯化铜(图7b)。相反,一些XRD结果显示不含三羟基氯化铜的样品在这些范围内却出现了吸收带(图7c)。基于以上特征将数据分为含三羟基氯化铜且具有特征吸收带(a)、含有三羟基氯化铜但不具特征吸收带(b)以及不含三羟基氯化铜但具有特征吸收带(c)三组。之后分别利用各组数据对分类模型进行测试,考察其对三羟基氯化铜的识别能力。

效果评价
表1给出了6种算法的精度、F1值和AUC值。值分布区间为[0,1],各参数越接近1,算法的效果和精确度越好。ROC曲线也称受试者工作特征曲线,以假阳性概率(False positive rate)为横轴,真阳性(True positive rate)为纵轴所组成的坐标图。ROC曲线所括面积越大,模型效果越好。本研究建立的所有模型的ROC曲线均在y=x直线以上,且AUC值均大于0.8(图8),对锈蚀混合物中是否含有三羟基氯化铜可进行有效判别。大部分模型对于图7 (b)-(c)中迷惑性较强的样品也有很好的识别效果。
特征吸收带分析
我们从先前的实验中已经获知三羟基氯化铜标准样品的特征吸收带大约在1465 nm、1855 nm、1987 nm、2159 nm和2339 nm处。采用支持向量机分类方法可找到分离类的最佳超平面,并可计算光谱上的不同波长位置对于这一分类的贡献度。图9给出了各分类特征的权重,数字越大则表示该波段对模型的分类影响越大。可以看出,1465 nm、2159 nm两处吸收带的权重最大,2339 nm、1855 nm次之。1987 nm处的权重为负,说明其不能作为识别混合锈蚀混合中的三羟基氯化铜的指标。产生这一现象的原因是1987nm处的吸收带与矿物结构中的羟基有关,而青铜文物锈蚀产物中常见的孔雀石、蓝铜矿等也含有羟基,会在此位置产生强吸收带,对光谱特征产生明显干扰。

结论
本研究建立的6种机器学习方法可对青铜文物锈蚀产物的FORS光谱特征进行定性识别,有效判断其中是否含有三羟基氯化铜。上述模型运行时间均在约5s以下,可用于三羟基氯化铜的快速、精确识别,有利于科学判断“青铜病”的严重程度,便于文物保护人员制定合理的文物保护方案和监测青铜文物的腐蚀发展状况。下一步研究团队将继续扩大训练集样本的数量和覆盖面,进一步提高算法对于不同种类青铜锈蚀混合物的识别能力,并逐步实现识别方法的在线开放共享。
文章链接:
1) Qianqian Hu1,Wei Liu1,Siran Liu*,Jianli Chen. Detecting copper trihydroxychlorides with reflectance spectroscopy and machine learning methods,Journal of Cultural Heritage,2023(59):49-56.
https://doi.org/10.1016/j.culher.2022.11.004
2) Wei Liu, Mo Li, Na Wu, Siran Liu, Jianli Chen*. A new application of Fiber optics reflection spectroscopy (FORS): Identification of “bronze disease” induced corrosion products on ancient bronzes, Journal of Cultural Heritage, 2021(49): 19-27.
https://doi.org/10.1016/j.culher.2021.03.007
3) Florence Liggins, Alessandra Vichi, Wei Liu, Alexander Hogg, Sotiria Kogou, Jianli Chen and Haida Liang*. Hyperspectral imaging solutions for the non-invasive detection and automated mapping of copper trihydroxychlorides in ancient bronze, Heritage Science, 2022(10): 142.
https://doi.org/10.1186/s40494-022-00765-8
作者简介
胡茜茜,北京科技大学科技史与文化遗产研究院硕士生;
刘薇,中国国家博物馆副研究馆员,主要从事金属文物保护研究;
刘思然,北京科技大学科技史与文化遗产研究院副教授,研究方向为冶金与材料史、科技考古;
陈建立,北京大学考古文博学院教授,研究方向为冶金考古、科技考古。