轴承智能故障诊断技术一直是学术领域的热门话题,最新一篇论文发布在nature scientific report上,感兴趣,大家可以参考文后地址查看原文。
摘要
在复杂多变的环境与有限训练数据的条件下,轴承的多工况故障诊断面临巨大挑战。为此,本文提出了一种基于混合灰狼优化算法(HGWA)的卷积神经网络(CNN)与双向长短期记忆网络(BiLSTM)融合诊断方法。该模型通过CNN提取空间特征,利用BiLSTM捕捉时序依赖关系,借助HGWA实现超参数高效优化,在CWRU数据集四种工况下达到100%诊断准确率。优化后的CNN-BiLSTM模型作为预训练模型迁移至新环境时,即使仅使用少量训练数据仍能保持高精度诊断。该方法不仅提升了诊断性能,更在同时间段内实现了更快的优化效率,有效解决了神经网络超参数人工调优难题,为小样本条件下的轴承故障诊断提供了创新解决方案。
引言
在复杂严苛的机械环境中,轴承长期承受振动、冲击、润滑不良等恶劣工况,易出现磨损、疲劳及损伤,这不仅增加维护成本,更带来重大安全风险[1,2]。因此,及时准确诊断与识别轴承故障对保障机械设备安全稳定运行至关重要[3,4]。滚动轴承作为机械系统的核心部件,其运行状态直接影响设备效率与安全[5,6,7]。凭借卓越的径向承载能力,滚动轴承广泛应用于高速、重载及变载荷等严苛工况。然而相较于滑动轴承等传统转子-轴承系统,其结构复杂性与故障模式多样性导致更易损伤且故障排查难度显著增加[8]。
近年来,深度学习在机械故障诊断领域获得广泛关注并取得显著进展。越来越多的学者探索利用先进技术实现轴承故障检测与寿命预测,特别是在复杂工况下的应用[9,10,11]。例如,Zhang等[12]提出振动与声学信号特征融合技术,采用多输入CNN网络实现变工况故障诊断,较单模态传感器算法在实际应用中展现出更高精度。Zhu等[13]利用自编码器(AE)、循环神经网络(RNN)、CNN与生成对抗网络(GAN)应对数据不平衡与小样本挑战,其中CNN在高度不平衡数据场景下展现出强健特征学习能力。Arta等[14]提出LSTM机制增强的深度残差网络进行数据驱动故障诊断,LSTM的记忆调节功能有效捕捉时序信息,提升诊断精度与效率。Chen等[15]设计自适应核尺寸CNN模型自动提取信号多频特征,结合LSTM网络进行分类,降低参数复杂度。Cui等[16]提出三元组注意力增强残差树状决策网络(TARTDN),通过树状决策网络与注意力残差网络融合,提升模型可解释性与不确定性量化能力。这些研究通过一维时域信号分析与数据不平衡问题处理推动了故障诊断发展[17]。Keshun等[18]构建3D注意力增强混合神经网络,采用CNN提取局部特征,BiLSTM捕获长程依赖,但模型依赖特定参数设置,对新故障类型适应性有限。
神经网络中,超参数对模型性能具有决定性影响[19]。传统调参依赖经验法,耗时费力且缺乏理论支撑,制约优化过程透明度与可解释性。超参数优化本质属于多目标优化问题[20],智能优化算法凭借强全局搜索能力,可自适应调整参数策略,在复杂动态不确定性问题中表现突出。研究者融合差分进化算法与灰狼算法优化CNN[21],提升诊断精度与抗噪性;Tian等[22]构建CNN-LSTM模型,采用混合粒子群算法(HPSO)动态调参解决非线性优化问题;Wang等[23]提出ISSA-LSTM方法,改进麻雀算法优化LSTM超参数,展现优异预测精度。现有研究多聚焦模型结构与参数优化以降低调参耗时,却忽视批次大小、丢弃率、学习率等训练参数的精细调节[24,25,26],而这类参数对模型泛化能力提升至关重要。

实际应用中,多数模型需依赖大量标注样本[27,28],但轴承故障样本获取困难,特别是突发性故障样本稀缺[29]。传统数据增强、特征学习等方法在极端不平衡场景下易引入噪声或特征缺失[30]。为此,Fan等[31]提出迁移神经网络实现跨领域知识迁移;Luo等[32]融合多核最大均值差异迁移机制与CNN,利用目标域无标签样本训练;Kuang等[33]设计域条件联合适配网络,通过域对抗与双分类器对抗训练实现跨域诊断;Wang等[34]集成域对抗策略与Wasserstein距离,利用数字孪生数据训练迁移模型;Qian等[35]开发深度判别迁移网络提升跨机故障诊断能力;Ding等[36]提出深度不平衡域自适应框架,通过代价敏感学习实现细粒度空间匹配。这些方法虽缓解领域差异,但仍难以完全解决目标域样本稀缺问题,且多数方法忽视高维复杂关系捕获,导致诊断性能受限。
本文提出CNN-BiLSTM与HGWA算法融合的混合故障诊断模型,解决多工况小样本轴承故障诊断难题。通过CNN-BiLSTM从原始加速度信号提取高维时序特征,HGWA算法优化预训练模型的训练参数,提升模型泛化能力与分类精度。结合少量样本微调预训练模型,使诊断系统适应多种工况,有效应对数据受限环境下的模型训练与故障检测挑战。
本文主要贡献如下:
(1)构建一维CNN-BiLSTM网络,有效提取故障特征并捕捉时序依赖,提升诊断精度;
(2)提出HGWA算法,融合遗传算法交叉变异算子改进灰狼算法,解决局部最优与早熟收敛问题;
(3)采用HGWA优化CNN-BiLSTM训练参数,在CWRU数据集四工况下实现100%诊断精度;
(4)优化模型在新工况中仅需少量样本即可获得高精度诊断,部分模型无需迁移学习微调即可实现跨工况故障诊断。
论文结构如下:
第二章阐述CNN、BiLSTM与迁移学习原理;第三章设计CNN-BiLSTM模型优化流程;第四章探讨小样本多工况诊断策略;第五章通过CWRU与JNU轴承数据集验证方法有效性;第六章总结研究并展望未来方向。
本文通过DeepSeek翻译
来源:https://www.nature.com/articles/s41598-025-92838-4
后记:当前的轴承智能故障诊断技术随着大模型的日益发展,有望迎来更高的发展,未来希望能在自监督学习中有所突破,但不同机器的轴承应用都有其自身的特点,缺少“懂机器”的人的参与和监督,靠不靠谱?