Research Article | | Peer-Reviewed

Prediction and Interpretability Study of Peak Floor Acceleration of Steel Structures Based on XGBoost

Received: 14 April 2026     Accepted: 5 June 2026     Published: 9 June 2026
Views:       Downloads:
Abstract

Peak floor acceleration is a crucial engineering parameter for evaluating the seismic damage and post-earthquake functional state of non-structural components in buildings. To address the limitations of traditional dynamic time-history analysis, such as complex physical modeling and cumbersome computations, a data-driven rapid prediction model based on Extreme Gradient Boosting (XGBoost) is proposed, utilizing real steel structure array monitoring records. By taking ground motion intensity and spatial structural characteristics as inputs, a Bayesian optimization algorithm based on the Tree-structured Parzen Estimator (TPE) is introduced to achieve intelligent hyperparameter tuning. The results demonstrate that the optimized machine learning model exhibits excellent prediction accuracy and generalization performance. Furthermore, attribution analysis combining feature importance and the SHAP interpretability framework reveals that peak ground acceleration and normalized height are the core features dominating the amplification of floor responses. Validation through a finite element case study confirms that the model can effectively reproduce the variation of peak floor acceleration along the building height using only macroscopic geometric parameters of the structure. This provides a reliable analytical tool with physical interpretability for the rapid seismic performance assessment of non-structural components.

Published in Science Research (Volume 14, Issue 3)
DOI 10.11648/j.sr.20261403.17
Page(s) 113-121
Creative Commons

This is an Open Access article, distributed under the terms of the Creative Commons Attribution 4.0 International License (http://creativecommons.org/licenses/by/4.0/), which permits unrestricted use, distribution and reproduction in any medium or format, provided the original work is properly cited.

Copyright

Copyright © The Author(s), 2026. Published by Science Publishing Group

Keywords

Peak Floor Acceleration, Steel Structures, Non-structural Components, XGBoost, Bayesian Optimization, Interpretability Analysis

1.引言
在历次破坏性地震中,现代建筑抗震设计规范的实施有效保障了建筑主体结构的安全,然而机电设备、吊顶及建筑内部物品等非结构构件的严重破坏,依然导致了巨大的直接经济损失与震后功能的长期丧失。准确评估非结构构件的抗震性能与易损性,高度依赖于对楼层运动强度指标,如楼层峰值加速度(Peak floor acceleration, PFA)以及针对物品滑移破坏所定义的等效运动强度指标的精准量化。然而,现有各国规范对于PFA沿结构高程的分布规定仍存在一定的局限性,不能完全反映真实的动力放大效应
同时,采用传统物理有限元模型的非线性动力时程分析(NTHA)存在耗时长、计算成本高的应用难点。随着全球工程强震动台阵记录的不断丰富,已有研究利用真实的实测观测数据获取建筑结构楼层设计谱并反演其动力演化规律。近年来,数据驱动的机器学习技术为工程抗震与防灾减灾领域开辟了新的路径。智能算法已在岩土工程和场地响应预测中展现出极高的适用度,例如,贝叶斯网络模型被成功应用于自由场地震液化沉降评估,展现出优异的逆向推理能力;数据驱动的深度学习和集成学习模型也被用于直接生成建筑结构楼层反应谱,仅输入地面反应谱及少量结构参数即可高效预测各楼层的加速度、速度及位移谱,而借助鲸鱼算法优化的集成模型无需进行复杂的数值模拟,仅凭结构基本特征与非结构构件信息便能获取归一化楼层反应谱。在地震动输入参数预测方面,深度学习算法与Light-GBM集成算法分别被成功用于构建地震动重要持时与显著持时的高效预测模型,显著提升了评估的时效性与精度。
不仅如此,机器学习在建筑结构动力响应预测与损伤评估中也展现出了巨大的潜力。各类智能模型已被广泛应用于高层剪力墙结构的地震易损性分析、自复位钢木混合框架体系的峰值响应代理模型构建。此外,基于物理引导的神经网络模型仅利用基底与屋顶加速度记录及少量结构特征,即可重建各楼层加速度时程与楼层反应谱,物理约束的引入进一步提升了预测的物理可解释性;而面向实时预测需求,利用地面与屋顶实测加速度时程的深度学习方法,也实现了其他楼层响应的实时高效预测。这些研究共同验证了:数据驱动模型在处理高维复杂工程数据、提取结构损伤特征时,具备良好的防过拟合能力与工程可信度。
在众多机器学习算法中,由Chen等提出的极端梯度提升树(XGBoost)在处理复杂的非线性“表格型”特征数据时,展现出良好的泛化能力与学习机制。该算法目前已被成功引入结构工程,用于钢筋混凝土(RC)框架结构的地震响应快速预测等研究中。基于上述研究背景,针对真实钢结构在强震作用下的楼层加速度放大机制,本文依托工程结构强震数据库,以核心地震动强度指标与建筑宏观几何尺寸为输入,构建基于XGBoost算法的PFA快速预测模型。本文旨在不依赖复杂物理建模的前提下,实现结构局部响应的高精度预测,并通过解析特征重要性和有限元算例验证,为建筑内部非结构构件的抗震设计与评估提供高效的方法支撑。
2.数据采集与特征工程
2.1.数据来源
真实且高质量的结构强震记录是机器学习模型泛化能力的重要基础。本文的研究数据来源于美国工程强震数据中心(Center for Engineering Strong Motion Data, CESMD)。该数据库收录了大量结构在历次真实地震中的响应时程。
本研究针对钢结构数据进行筛选,去除了传感器位置不明确或地面输入信号缺失的建筑台阵记录。最终选取了104个钢结构建筑,这些结构在历次地震事件中,共提供了2113条有效的水平向楼层实测反应记录。所构建的数据集在输入强度、结构几何特征及场地条件方面均具有较宽的覆盖范围:PGA介于0.02g至0.4g之间,包含从微弱震动到较强震动的工况;建筑结构包含了办公楼、医院、图书馆等多种典型建筑,长、宽尺寸跨度从3米到208米,层数从1至20层不等;场地条件以VS30表征,范围自162m/s到2625m/s。这说明数据集涵盖不同输入强度、结构尺寸以及场地特性的丰富样本。
2.2.变量特征提取与数据预处理
为了使机器学习模型能够高效、准确地捕捉输入地震动与结构响应之间的非线性映射规律,基于结构动力学基本理论,对CESMD原始强震数据进行了特征提取与数据预处理。
2.2.1.特征变量提取
结构楼层加速度的分布规律主要受地震动输入特性、结构自身动力特性以及场地条件三方面因素控制。据此,本研究提取了以下核心变量:
选取地面最大加速度(PGA)作为表征输入地震动强度的关键参数;选取地表下30米内的等效剪切波速VS30作为评价场地特性重要指标;提取建筑结构的长(L1)与宽(L2)作为宏观几何尺寸特征,为了消除不同建筑绝对高度带来的尺度差异,引入了无量纲特征“归一化高度”z(即传感器所在楼层的高度h与建筑总高度H的比值,z=h/H)来表征楼层放大效应的空间分布规律。将结构各楼层水平方向的实测楼层峰值加速度(PFA)设定为预测目标。
对所有的输入特征及目标变量进行了统计分析,用于了解该数据集的数据分布形态及涵盖的工程范围,具体统计信息如表1所示。
表1 数据集变量统计信息。

变量

均值

最小值

中位数

最大值

L1(m)

73.07

12.19

67.06

208.18

L2(m)

56.61

3.29

53.04

146.30

z(无量纲)

0.52

0

0.50

1

VS30(m/s)

358.25

162

339

2565

PGA(g)

0.023

0.0015

0.012

0.427

PFA(g)

0.031

0.0015

0.017

0.733

2.2.2.数据预处理
图1所示,部分变量(如PGA和PFA)呈现出极强的右偏态分布(Right-skewed Distribution),即数据高度集中在中小地震动强度区间。若直接输入模型,会导致模型对长尾极端高强度样本的预测能力大幅下降。因此,本研究引入对数变换,对连续变量取常用对数X'=lg(X),有效压缩了特征取值范围,平滑了极值影响,使数据分布更趋近于正态分布,因此后续对PFA预测的研究均在对数空间下进行。
Figure 1. 图1 部分变量对数变换前后分布对比。
3.XGBoost预测模型构建与预测结果分析
3.1.XGBoost模型
本研究使用XGBoost算法建立结构最大楼层加速度的预测模型。XGBoost是由陈天奇等人在传统梯度提升决策树(GBDT)基础上提出的一种高度优化的可扩展机器学习系统。与传统依靠单一经验公式拟合结构动力响应的方法相比,XGBoost能够通过集成学习的策略,自动捕获建筑特征、场地条件与地震动输入之间复杂的非线性映射关系。
XGBoost的核心思想是基于提升策略构建前向分布加法模型。与传统算法不同,XGBoost在目标函数中不仅引入了损失函数的二阶泰勒展开,还加入了控制模型复杂度的正则化项,其目标函数可近似表示为:
(1)
其中,gihi分别是预测误差损失函数的一阶和二阶导数;γ为控制叶子节点数量的复杂度惩罚系数;λ为叶子节点权重的L2正则化惩罚系数。XGBoost的正则化准入机制,使其在处理包含环境噪声的真实强震数据时表现出很高的鲁棒性。
图2给出了从输出特征选取到模型优化与建立的过程。主要包括特征选取与数据预处理,贝叶斯优化与超参数调优,XGBoost模型训练与预测。
Figure 2. 图2 基于XGBoost的PFA预测流程。
3.2.超参数优化
在机器学习模型训练中,超参数的设定直接决定了模型的假设空间大小与最终的泛化能力。传统的超参数寻优方法(如网格搜索Grid Search)通过穷举预设的参数组合来寻找最优解。然而,随着XGBoost等集成模型超参数维度(如最大树深、学习率、特征采样率等)的增加,网格搜索计算效率变低。随机搜索(Random Search)虽然在一定程度上缓解了计算压力,但由于其各次采样之间相互独立,无法利用先验经验,寻优效率依然低下。相比之下,贝叶斯优化(Bayesian Optimization, BO)是一种基于序贯模型优化(SMO)的全局寻优策略,其核心思想是利用历史评估结果构建目标函数的概率代理模型,从而利用先验经验指导下一步的采样方向。因此本研究采用贝叶斯优化方法进行超参数优化。选用树形Parzen估计器(Tree-structured Parzen Estimator, TPE)作为贝叶斯优化的代理模型。将经过预处理的数据集划分为训练集(80%)与测试集(20%),并使用基于TPE的贝叶斯全局优化算法,结合5折交叉验证进行超参数调优,在规避强震小样本数据过拟合风险的同时,有效提升了模型预测钢结构楼层峰值加速度(PFA)的能力。
XGBoost需要优化的超参数为弱评估器个数,搜索范围为[500,2000],最大深度,搜索范围为[3,12],学习率,搜索范围为[0.005,0.2],样本子采样率,搜索范围为[0.5,1],特征列采样率,搜索范围为[0.5,1],最小损失函数下降值,搜索范围[0,5],L1正则化惩罚项系数,搜索范围为[0,10],L2正则化惩罚项系数,搜索范围为[0,10]。表2列出了模型的最优超参数结果。
表2 模型的最优超参数结果。

超参数名称

最优结果

弱评估器个数

1487

最大深度

5

学习率

0.044

样本子采样率

0.936

特征列采样率

0.673

最小损失函数下降值

1.034

L1正则化惩罚项系数

0.033

L2正则化惩罚项系数

0

为进一步量化评估模型的性能,选取了决定系数(R2),平均绝对误差(MAE)和均方根误差(RSME)作为评价指标。三种评价指标的计算公式如下所示:
(2)
(3)
(4)
其中n为样本总数量, 为样本真实值, 为样本预测值, 为所有样本真实值的平均值。表3给出了优化前后的模型性能评价指标,经过超参数优化后,模型的R2提升了1.33%,MAE降低了4.32%,RMSE降低了5.93%,表明调优后的模型具有更高的预测精度。
表3 优化前后模型性能指标。

R2

MAE

RSME

优化前

0.89

0.10

0.14

优化后

0.91

0.09

0.13

3.2.预测精度评估
将经过贝叶斯调优后的XGBoost模型应用于测试集,得到在对数空间下的预测结果如图3所示。
Figure 3. 图3 预测值与真实值对比。
对数变换后的散点分布表明,绝大多数预测样本紧密且均匀地收敛于y=x对角线两侧,说明模型能够高精度地预测钢结构楼层最大加速度响应。即便是在横坐标处于-1.0到-0.5的大加速度响应区间(对应PFA范围为0.1g到0.3g),模型仍具备良好的预测精度。
3.3.残差分析
模型的可靠性评估不仅需要计算宏观的全局评价指标(如R2、RMSE),也需要对预测误差(残差)分布形态进行检验。残差分析能反应预测结果是否存在系统性预测偏差。为此,本研究分别从残差的概率分布特征与随响应量级的变化规律两方面展开分析。
图4给出了XGBoost模型在测试集上预测残差的频数分布直方图。从图中可以看出,预测残差整体呈现出以零点(图中红色实线)为中心、左右基本对称的“钟形”近似标准正态分布规律。统计显示,绝大多数预测残差高度收敛于[-0.2,0.2] 的区间内,仅有极个别长尾样本的误差接近±0.5。这种均值趋近于零且方差小的误差分布形态表明了预测模型在整体预测上不存在明显的系统性偏差(Unbiasedness),没有普遍高估或低估楼面加速度的倾向。
Figure 4. 图4 残差频数分布直方图。
为了进一步检验模型在不同加速度激励强度下的预测稳定性,图5给出了预测残差随真实值变化的二维散点分布图。由散点分布可以看出,在真实值横跨整个测试集取值范围的过程中,残差散点在y=0零误差基准线两侧分布均匀,形成了一个宽度稳定的水平带状区域。随着真实加速度幅值的增大,残差数据点并未呈现出向外发散的趋势,保持分布在[-0.5,0.5]的区间范围内。
Figure 5. 图5 残差散点分布图。
上述分析表明,预测模型在不同震动强度的工况下能保持稳定、一致的预测精度,且模型已经充分捕获了输入特征(如PGA、归一化高度等)与楼层加速度放大效应之间的客观动力学规律,预测残差表现出典型的“白噪声”特征。模型不存在系统性的物理信息遗漏,满足高可信度的评价标准。
3.4.特征重要性与模型可解释性分析
在利用机器学习模型进行结构动力响应预测时,分析各输入特征对预测结果的具体影响,对于工程应用具有重要的参考价值。为此,本研究首先基于XGBoost算法内置的树节点分裂增益(Gain)评估了各特征的全局重要性,随后引入博弈论中的SHAP(SHapley Additive exPlanations)框架进行模型事后归因解释。
图6展示了XGBoost模型输出的各特征相对重要性评分。结果表明,地面峰值加速度(PGA)在预测楼层峰值加速度(PFA)时占据主导地位,其重要性评分为0.5918。这与工程抗震的物理经验相符:PGA直接表征了输入结构基底的地震动强弱,而地震动强弱是影响结构动力响应的根本因素之一。位列第二的是结构的归一化高度(z),其重要性评分为0.1540。这表明了沿结构高度方向的局部动力放大效应在PFA预测中的重要性。相比之下,等效剪切波速(VS30,0.0886)以及代表结构宏观刚度的几何尺寸(L2,0.0833,L1,0.0823)评分相对较低。这表明场地条件和结构几何特征在预测过程中主要起到调节响应频谱特性的次级滤波作用,对PFA的直接贡献相对PGA和高度特征而言不显著。
Figure 6. 图6 特征重要性评分。
尽管基于分裂增益的特征重要性能够识别对预测起主导作用的变量,但该指标只能反映各特征权重的相对量级,无法揭示特征取值变化对预测结果的具体正负向影响规律。为了弥补这一不足,本研究进一步输出了SHAP值摘要图,如图7所示。图中纵轴按特征贡献度排列,每一个散点代表测试集中的一个独立样本;颜色从蓝到红代表特征原始取值由小到大;横轴的SHAP值则量化了该特征对模型最终输出(即预测PFA偏离基础期望值)的边际绝对贡献。
Figure 7. 图7 SHAP值摘要图。
图7显示,PGA的散点分布呈现清晰的颜色梯度与较宽的SHAP值跨度。高值样本集中在SHAP正半轴的远端,低值样本则密集分布在负半轴。该分布特征表明输入地面加速度与楼面响应之间呈正向关联,体现出明显的驱动主导效应。
归一化高度z在增益评分中位居第二,但其大部分SHAP散点却分布于零点附近,仅在右侧呈现出一条红色的高值长尾。这一现象反映了高度特征的“条件触发”放大机制,即高度对响应的贡献依赖于基底输入强度。
相对而言,场地等效剪切波速和建筑尺寸在SHAP图中的分布特征表现不同。三者的散点高度聚集于SHAP=0轴线附近,且没有明显的极值延伸,且不同特征取值的样本在正负微小范围内混杂。这是由于在不同频谱特性的地震动输入下,相同场地或结构刚度条件既可能因共振效应产生微弱放大,也可能因避开卓越周期而呈现微弱抑制,故其SHAP值在零点附近正负混杂。
综上所述,通过结合XGBoost内置增益与SHAP框架的全局归因分析,本研究构建的预测模型不仅在宏观统计上实现了高精度预测,在物理和工程解释上也符合结构地震动力响应的基本规律,进一步验证了该模型的可信度与可解释性。
4.算例验证
为了进一步验证所构建的XGBoost预测模型在实际工程应用中的可靠性,选取已有文献中的3层钢框架结构有限元模型进行算例对比分析。
4.1.有限元模型与地震动输入
该验证算例为典型的规则多层钢框架结构,结构总长度(L1)为54.9m,总宽度(L2)为36.6m。该结构共3层,每层高度均为3.96m。图8给出了结构立面图。为模拟真实场地受震情况,选取NGA-West2强震数据库中的天然地震动记录RSN1155_KOCAELI_BUR090作为输入。该记录对应的场地等效剪切波速(VS30)为289.69m/s,对该原始地震动记录进行调幅处理,使其峰值加速度(PGA)达到0.1g。随后,将调幅后的地震波输入到该3层钢框架有限元模型中,进行非线性动力时程分析。
Figure 8. 图8 3层钢框架立面图。
4.2.预测流程与结果
通过时程分析提取有限元模型各层节点的绝对加速度响应,并取其包络峰值作为各层楼层峰值加速度(PFA)的真实基准值用于对比验证。
提取该算例的宏观几何与物理特征作为输入变量,即:结构尺寸参数(L1=54.9m,L2=36.6m)、场地参数(VS30=289.69m/s)、地震动强度参数(PGA=0.1g)以及各楼层的归一化高度(基底z=0、1层z=1/3、2层z=2/3、3层z=1)。将上述特征向量直接输入前文训练的XGBoost预测模型中,模型输出对应楼层的PFA预测值。
表4给出了有限元模拟的计算值与XGBoost模型的预测值结果:
表4 有限元计算与XGBoost模型预测对比。

基底

1层

2层

3层

(z=0)

(z=1/3)

(z=2/3)

(z=1)

计算值(g)

0.1

0.29

0.31

0.45

预测值(g)

0.1

0.23

0.31

0.57

为直观对比XGBoost模型预测结果与有限元计算结果,将各层PFA的计算值和预测值绘制为沿结构高度的对比折线图,如图9所示:
Figure 9. 图9 算例验证对比图。
在结构基底,预测模型通过物理约束满足了z=0时,PFA与PGA相等的边界条件。预测模型在第2层的预测结果与有限元计算结果相近,相对误差仅为-0.65%,而第1层和第3层的相对误差则分别为-20.35%和27.25%。考虑到有限元分析中包含了结构的具体非线性属性(如材料本构属性、具体梁柱节点转动刚度等),而本文构建的预测模型仅依赖结构的几何尺寸进行预测,存在一定误差是合理的。XGBoost模型预测与有限元计算的各层PFA随高度变化趋势基本相同,说明模型能够有效捕捉楼层峰值加速度随结构高度变化的规律。
综合上述对比结果,本文提出的XGBoost预测模型能在短时间内给出与有限元分析相近的预测结果,并且能在脱离精细物理建模的情况下,依靠结构的宏观参数还原楼层峰值加速度沿高度变化的规律。
5.结论
本文依托CESMD数据库获取的真实强震监测台阵记录,建立了基于XGBoost的钢结构楼层峰值加速度(PFA)预测模型,并结合SHAP框架分析了特征驱动机制。主要研究结论如下:
(1)针对强震观测数据极强的右偏态分布特征,采用对数变换有效平滑了极值对模型训练的影响。结合基于树形Parzen估计器(TPE)的贝叶斯优化算法,实现了高维超参数空间的快速寻优,构建的模型在独立测试集上展现出良好的泛化性能。
(2)XGBoost模型对PFA预测的决定系数(R2)达到0.909,平均绝对误差(MAE)和均方根误差(RMSE)分别为0.09和0.13。残差分析表明,误差分布接近均值为零的正态分布,且在不同输入强度下均保持稳定,证明模型能够可靠地预测钢结构不同高度的最大加速度响应。
(3)基于增益评分与SHAP归因分析,定量解析了特征对PFA的贡献逻辑。PGA(59.18%)的重要性位居第一,归一化高度(15.40%)位居第二。其中PGA表现为强正向驱动效应,而高度特征则体现了“条件触发放大”机制。研究验证了预测模型与结构动力学理论的一致性,证明了该模型具备良好的物理可解释性。
(4)通过3层钢框架有限元算例验证,所建XGBoost模型仅依赖结构宏观几何参数与地震动特征即可有效预测楼层峰值加速度沿高度的变化趋势,表明模型在脱离精细物理建模的情况下仍具备较强的工程适用性与可靠性。
致谢
本文研究得到中国地震局工程力学研究所基本科研业务费专项(2024A02)和黑龙江省自然科学基金资助项目(LH2024E016)资助。
References
[1] 贺思维, 曲哲, 周惠蒙等.非结构构件抗震性能试验方法综述 [J]. 土木工程学报, 2017, 50(9): 16-27.
[2] 刘汉泉, 曲哲. 建筑内部物品滑移破坏易脆性分析中的楼面运动强度指标 [J]. 世界地震工程, 2020, 36(2): 85-91.
[3] 尚庆学, 郑迦译, 李吉超,等.各国规范对于楼面峰值加速度规定的对比研究 [J]. 工程力学, 2020, 37(S1): 71-77.
[4] 刘荣恒, 柏文, 戴君武等. 基于强震记录的建筑结构楼层设计谱研究 [J]. 工程力学, 2024, 41(12): 176-188.
[5] 唐小微, 白旭, 胡记磊. 基于贝叶斯网络的自由场地震液化沉降评估 [J]. 振动与冲击, 2018, 37(18): 177-183.
[6] JIA J, GONG M, ZUO Z, et al. A novel deep learning-based method for generating floor response spectra of building structures [J]. Engineering Structures, 2025, 322: 119058.
[7] JIA J, GONG M, ZUO Z, et al. Generating elastic floor response spectra using ensemble learning methods with whale optimization algorithm [J]. Structures, 2025, 82: 110587.
[8] 贾佳, 公茂盛, 赵一男. 基于深度学习算法的地震动重要持时预测模型 [J]. 振动与冲击, 2023, 42(19): 249-259.
[9] 崔铭钊, 公茂盛, 左占宣等.基于Light-GBM算法的地震动显著持时预测模型 [J]. 振动与冲击, 2025, 44(16).
[10] 赵继幸. 基于机器学习的高层剪力墙结构地震易损性研究 [D]. 青岛: 青岛理工大学, 2024.
[11] 李征, 陈飞. 自复位钢木混合框架-耗能支撑结构的地震峰值响应代理模型研究 [J]. 建筑结构学报, 2025.
[12] LIU B, GONG M, WANG X, et al. Physics-guided neural network for structural seismic response reconstruction based on floor response spectra [J]. J Build Eng, 2026, 118: 114972.
[13] JIA J, GONG M, ZUO Z, et al. Real-time structural seismic time history response prediction based on physics-informed deep learning [J]. J Build Eng, 2025, 108.
[14] CHEN T, GUESTRIN C. XGBoost: A scalable tree boosting system [C] //Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco: ACM, 2016: 785-794.
[15] 赵煜东, 许卫晓, 李静等. 基于XGBoost模型集成学习的RC框架结构地震响应预测方法 [J]. 青岛理工大学学报, 2024, 45(2): 78-83.
Cite This Article
  • APA Style

    Li, J., Gong, M. (2026). Prediction and Interpretability Study of Peak Floor Acceleration of Steel Structures Based on XGBoost. Science Research, 14(3), 113-121. https://doi.org/10.11648/j.sr.20261403.17

    Copy | Download

    ACS Style

    Li, J.; Gong, M. Prediction and Interpretability Study of Peak Floor Acceleration of Steel Structures Based on XGBoost. Sci. Res. 2026, 14(3), 113-121. doi: 10.11648/j.sr.20261403.17

    Copy | Download

    AMA Style

    Li J, Gong M. Prediction and Interpretability Study of Peak Floor Acceleration of Steel Structures Based on XGBoost. Sci Res. 2026;14(3):113-121. doi: 10.11648/j.sr.20261403.17

    Copy | Download

  • @article{10.11648/j.sr.20261403.17,
      author = {Jinchi Li and Maosheng Gong},
      title = {Prediction and Interpretability Study of Peak Floor Acceleration of Steel Structures Based on XGBoost},
      journal = {Science Research},
      volume = {14},
      number = {3},
      pages = {113-121},
      doi = {10.11648/j.sr.20261403.17},
      url = {https://doi.org/10.11648/j.sr.20261403.17},
      eprint = {https://article.sciencepublishinggroup.com/pdf/10.11648.j.sr.20261403.17},
      abstract = {Peak floor acceleration is a crucial engineering parameter for evaluating the seismic damage and post-earthquake functional state of non-structural components in buildings. To address the limitations of traditional dynamic time-history analysis, such as complex physical modeling and cumbersome computations, a data-driven rapid prediction model based on Extreme Gradient Boosting (XGBoost) is proposed, utilizing real steel structure array monitoring records. By taking ground motion intensity and spatial structural characteristics as inputs, a Bayesian optimization algorithm based on the Tree-structured Parzen Estimator (TPE) is introduced to achieve intelligent hyperparameter tuning. The results demonstrate that the optimized machine learning model exhibits excellent prediction accuracy and generalization performance. Furthermore, attribution analysis combining feature importance and the SHAP interpretability framework reveals that peak ground acceleration and normalized height are the core features dominating the amplification of floor responses. Validation through a finite element case study confirms that the model can effectively reproduce the variation of peak floor acceleration along the building height using only macroscopic geometric parameters of the structure. This provides a reliable analytical tool with physical interpretability for the rapid seismic performance assessment of non-structural components.},
     year = {2026}
    }
    

    Copy | Download

  • TY  - JOUR
    T1  - Prediction and Interpretability Study of Peak Floor Acceleration of Steel Structures Based on XGBoost
    AU  - Jinchi Li
    AU  - Maosheng Gong
    Y1  - 2026/06/09
    PY  - 2026
    N1  - https://doi.org/10.11648/j.sr.20261403.17
    DO  - 10.11648/j.sr.20261403.17
    T2  - Science Research
    JF  - Science Research
    JO  - Science Research
    SP  - 113
    EP  - 121
    PB  - Science Publishing Group
    SN  - 2329-0927
    UR  - https://doi.org/10.11648/j.sr.20261403.17
    AB  - Peak floor acceleration is a crucial engineering parameter for evaluating the seismic damage and post-earthquake functional state of non-structural components in buildings. To address the limitations of traditional dynamic time-history analysis, such as complex physical modeling and cumbersome computations, a data-driven rapid prediction model based on Extreme Gradient Boosting (XGBoost) is proposed, utilizing real steel structure array monitoring records. By taking ground motion intensity and spatial structural characteristics as inputs, a Bayesian optimization algorithm based on the Tree-structured Parzen Estimator (TPE) is introduced to achieve intelligent hyperparameter tuning. The results demonstrate that the optimized machine learning model exhibits excellent prediction accuracy and generalization performance. Furthermore, attribution analysis combining feature importance and the SHAP interpretability framework reveals that peak ground acceleration and normalized height are the core features dominating the amplification of floor responses. Validation through a finite element case study confirms that the model can effectively reproduce the variation of peak floor acceleration along the building height using only macroscopic geometric parameters of the structure. This provides a reliable analytical tool with physical interpretability for the rapid seismic performance assessment of non-structural components.
    VL  - 14
    IS  - 3
    ER  - 

    Copy | Download

Author Information
  • Key Laboratory of Earthquake Engineering and Engineering Vibration, Institute of Engineering Mechanics, China Earthquake Administration, Harbin, China; Key Laboratory of Earthquake Disaster Mitigation, Ministry of Emergency Management, Harbin, China

  • Key Laboratory of Earthquake Engineering and Engineering Vibration, Institute of Engineering Mechanics, China Earthquake Administration, Harbin, China; Key Laboratory of Earthquake Disaster Mitigation, Ministry of Emergency Management, Harbin, China

  • Abstract
  • Keywords
  • Document Sections

    Show Full Outline
  • 1.引言
  • 2.数据采集与特征工程
  • 3.XGBoost预测模型构建与预测结果分析
  • 4.算例验证
  • 5.结论
  • 致谢
  • References
  • Cite This Article
  • Author Information