基于RBM-GASA-BPNN的潜在高价值旅客预测论文

基于RBM-GASA-BPNN的潜在高价值旅客预测

徐涛^*1,2,3，刘泽君¹，卢敏^1,2,3

(1.中国民航大学计算机科学与技术学院，天津300300；2.中国民航信息技术科研基地，天津300300；3.民航旅客服务智能化应用技术重点实验室，北京101318)

摘要：针对用BP神经网络(Back Propagation Neural Network,BPNN)进行潜在高价值旅客预测时出现的特征表达能力弱、稳定性差、易陷入局部极值的不足，提出一种新颖的基于RBM-GASA-BPNN的潜在高价值旅客预测方法.该方法首先通过聚类算法划分旅客类别，设置类别标签；然后利用受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)提取旅客行为特征并确定最优BPNN 初始权值和偏置的寻优范围，又利用遗传模拟退火算法(Genetic Algorithm-Simulate Anneal,GASA)对BPNN 参数进行精调，确定了最优的BPNN 初始权值和偏置；最后，利用优化后的BPNN对旅客进行分类预测.实验结果表明，本文提出的方法克服了基于BPNN的分类预测方法的缺陷，具有更高的分类预测准确率和潜在高价值旅客预测能力.

关键词：航空运输；价值类别预测；预测模型；潜在高价值旅客；RBM；GASA；BPNN

0 引言

近年来，随着航空市场迅猛发展，航空公司竞争日益增强.潜在高价值旅客作为一项隐形财富，对提升航空公司核心竞争力具有重要影响，越来越受到航空公司的重点关注，预测旅客的价值成长趋势并发现潜在高价值旅客愈加重要.

目前，国内外关于潜在高价值旅客预测的研究主要运用基于特征分类的行为分析方法，即根据旅客的行为特征建立分类预测模型，如基于多层感知器的旅客价值成长性预测方法^[1]，基于贝叶斯决策树的流失客户预测方法^[2]，基于近邻传播算法的旅客分类预测方法^[3]等，预测方法的准确率取决于分类模型的性能.BP 神经网络(Back Propagation Neural Network,BPNN)能发现行为特征与价值类别之间复杂的非线性关系，相比其他分类模型具有更强的泛化和容错能力，更适用于潜在高价值旅客预测问题.但潜在高价值旅客与低价值旅客的特征存在相似性，BPNN的隐藏层提取并表达输入数据特征的能力较弱，且由于初始权值和偏置随机化影响，容易收敛于局部极值，导致预测效果欠佳.

五女山山城依山势而建，东、西、北三面都是百尺峭壁，南面是险峻的陡坡，地形易守难攻。目前城内主要发现了3处大型建筑遗址以及城墙、哨所、兵营、蓄水池等遗址。

家长助教活动主要是指家长在幼儿园教师的指导下，有效地配合教师开展的协助幼儿学习的活动。在《幼儿园教育指导纲要（试行）》中，针对家长助教提出：教师可以在尊重、平等、自愿的原则上吸引家长主动地参与到幼儿园的教育工作中来，使家长成为幼儿园教师的重要合作伙伴，使幼儿家庭与幼儿园之间更加和谐，使幼儿能够在众多家长的鼓励下获得更多的知识。有了家长的帮助，不但可以活跃教学氛围，还可以把家长自身的教育资源合理地加以发掘和利用，使幼儿通过家长助教学习到更多的知识，获得更好的发展。所以，幼儿园应该在充分重视家长助教工作，针对如何指导家长有效地开展助教进行探索和尝试，使家长助教获得积极发展。

为解决以上问题，本文将受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)^[4]和智能优化算法引入BPNN中.一方面，RBM可以无监督学习输入数据特征，能分辨潜在高价值旅客与低价值旅客特征的差别，并为BPNN 提供初始权值和偏置的有效寻优范围.另一方面，智能优化算法是寻找BPNN 最优初始权值和偏置的有效工具.其中，遗传模拟退火算法(Genetic Algorithm-Simulated Annealing,GASA)^[5]结合了遗传算法(Genetic Algorithm,GA)并行搜索和模拟退火算法(Simulated Annealing,SA)概率突跳的特点，具有更好的可操作性和灵活性.

本文提出了一种新颖的混合方法，结合RBM与GASA算法来提高BPNN的分类预测能力，称为基于RBM-GASA-BPNN 的潜在高价值旅客预测方法.该方法先通过聚类算法设置旅客类别标签；然后用RBM从旅客行为属性中提取行为特征，提供BPNN相关参数的寻优范围，并用GASA算法对BPNN 初始权值和偏置进行精调，得到最优的BPNN 网络参数；最后，用优化的BPNN 预测潜在高价值旅客.

1 基于BPNN的潜在高价值旅客预测

基于BPNN 的潜在高价值旅客预测方法主要分为3 步：计算旅客价值，设置旅客类别标签和潜在高价值旅客预测.

1.1 计算旅客价值

采用RFM 模型(Recency Frequency Monetary,RFM)^[6]衡量民航旅客价值，设旅客集合为，时刻集合为旅客x_p在t_q时刻的价值为.其中，为旅客x_p在时刻t_q的价值向量，各分量依次为距离最后一次乘机日期的时长(负值)，乘机次数和乘机金额的归一化值；β=( β_R， β_F，β_M)为固定的权值向量，确定价值向量各分量所占的比例，由民航业背景结合专家经验确定.

1.2 设置旅客类别标签

数据预处理的步骤如下：

记，这部分旅客价值相对较高，受到航空公司的特别重视，可视为时刻t_q的高价值旅客群.设L^tq=X-H^tq，这部分旅客价值相对较低，在部分指标上表现有待提升，可视为时刻t_q的低价值旅客群.

旅客价值的时间预测区间过长对航空公司现阶段发展不利，过短不足以形成行为偏好，因此一般设为1年.时刻t_q的旅客价值在1年后会呈现不同的发展趋势，并于时刻t_q+1形成4种类别.其中，高价值旅客是长期表现高价值的旅客，表示为；潜在高价值旅客是当前表现低价值，1 年后表现高价值的旅客，表示为；低价值旅客是长期表现低价值的旅客，表示为；异常旅表示为

1.3 潜在高价值旅客预测

基于BPNN 的潜在高价值旅客预测方法的思想为：根据时刻t_q属于低价值旅客群L^tq的旅客的行为属性，利用BPNN 预测旅客属于X_pv还是X_lv.X_ev和X_hv非本文研究的重点，不做讨论.

设BPNN 输入层节点v_i 的数目为m，i ∈{1 ,2 ,…,m}，代表m维旅客行为属性；隐藏层节点h_j的数目为n，j ∈{1 ,2 ,…,n}，代表n个行为特征；输出层节点u_l的数目为2，l ∈{1 ,2}，代表2类分类结果客为当前表现高价值，1 年后表现低价值的旅客，(X_pv或X_lv).

初始化BPNN.设w_ij为输入层到隐藏层的权重，w_jl为隐藏层到输出层的权重，b_j为隐藏层偏置，c_l为输出层偏置，随机赋值w_ij、w_jl、b_j、c_l.则行为特征表达式为，预测结果表达式为，其中σ(x)=(1 +e^-x)^-1为Sigmoid激活函数.设y_l为期望输出，误差函数为

四小姐站在石西岳侧面，先是漠然，既而似笑非笑说：“既然你又多了一名嫌疑犯，我就不带走他了。石处长，好好断一断眼前这桩风流案吧。”

输入训练集，利用误差反向传播法^[8]逐层调整权值和偏置，确定网络结构后输入测试集进行旅客分类预测.

2 基于改进BPNN的潜在高价值旅客预测

2.1 RBM预训练

由基于BPNN 的潜在高价值旅客预测方法可知，BPNN 预测能力与两点相关.其一，BPNN 的隐藏层节点h_j是表达输入数据的关键因素.其二，BPNN 的初始权值和偏置的取值是影响网络学习效果的重要因素.为了增强BPNN隐藏层特征表达能力，缩小初始权值和偏置的寻优范围，引入RBM进行预训练.

1.2.5 肺组织的采集连续给药28 d后各组大鼠行心脏取血处死，打开胸腔，取下肺组织用生理盐水冲洗后，将左肺上叶固定于10%甲醛中，另取右肺经液氮处理后置于－80℃冰箱保存，用于后续指标的检测。

将RBM 的可视层作为BPNN 的输入层v=( v₁,v₂,…v_i,…v_m )，RBM 的隐藏层作为BPNN 的隐藏层h=( h₁,h₂,…h_j,…h_n).RBM结构如图1所示.

3、表面平整，有防水防潮处理措施，外墙勒脚做防水处理高度不低于0.6米。当采用灰浆抹面时，抹面层干净整洁，没有明显龟裂、空鼓、剥落现象。当外墙采用清水砖墙时，进行勾缝处理。

图1 RBM 结构
Fig.1 RBM structure

例(8)：And there was Bismarck’s, in the October number;who can look at that without being purer and stronger and nobler for it? And Thurlow Weed’s picture in the September number; I would not have died without seeing that, no, not for anything this world can give.

采用对比散度算法(Contrastive Divergence，CD)^[9]通过式(2)和式(3)对可视层和隐藏层进行重构，更新参数θ={ }w_ij,a_i,b_j.当重构后的可视层与原可视层的分布最大程度相近时，隐藏层可视为输入数据的特征，此时的θ={ }w_ij,a_i,b_j 为BPNN 初始权值和偏置.

2.2 GASA算法精调

RBM预训练过程确定了BPNN最优初始权值和偏置的范围，还需寻优算法对参数进行精调.

采用GASA算法优化BPNN初始权重和偏置.为保持RBM提取的特征对输入样本的映射能力，并增强算法的自适应能力，本文对GASA 算法的交叉、变异概率进行调整.算法步骤如下.

疾病的正确诊断与药物的正确选择是准确使用药物的前提，在COPD稳定期，支气管舒张剂是药物治疗的基石，吸入剂型是《GOLD指南》中推荐的一线药物剂型。但由于价格昂贵，在我国基层医疗机构支气管舒张剂的使用依旧不充分[9]。如在我国西部农村，COPD患者使用药物中，抗生素使用比例高达93%，茶碱58%，吸入糖皮质激素+长效β2受体激动剂（ICS+LABA）为4%[10]。COPD防控的薄弱及患者疾病认识的欠缺，说明药师在其中有着不可或缺的重要性。

Step 1 初始化.初始化温度G()0，随机产生包含N个个体的初始种群，个体的染色体由二进制的BPNN初始权重和偏置组成.

Step 2 计算个体适应度.用个体的染色体赋值BPNN 并进行训练，输入测试样本计算均方误差E_BPNN，以F^*=E_BPNN^-1作为个体的适应度函数，计算每个个体的适应度.

Step 3 选择.采用按比例的适应度分配策略，选出适应度较高的个体作为父辈，个体γ被选择的概率其中，为个体γ的适应值.

Step 4 交叉.对于适应度最高的个体，直接复制到下一代；对于其他个体，不同来源的变量采用不同的交叉概率，进行两点交叉，产生新个体.来源于RBM 的参数交叉概率P_φ1应低于来源于BPNN的参数交叉概率P_φ2，分别为

(1)根据RFM 模型和K-means 聚类算法划分X_pv、X_lv，设置旅客类别标签，将时刻t_q低价值旅客群L^tq的类别标签及行为属性组成样本，划分训练集和测试集.

Step 5 变异.对于适应度最高的个体，直接复制到下一代；对于其他个体，不同来源的变量采用不同的变异概率，代替原个体.来源于RBM的参数变异概率P_τ1应低于来源于BPNN的参数变异概率P_τ2，分别为

式中：κ₃，κ₄为调整系数，变异概率应不大于0.5，可取κ₃=κ₄=0.5.

Step 6 模拟退火调整.经过Step 3～Step 5 的遗传操作后，产生新一代个体.若新个体γ′比原个体γ的适应度高，则接受新个体γ′；若新个体γ′比原个体γ的适应度低，则以突跳概率P_t接受新个体γ′，否则还原为原个体.

综上所述，本研究结果具有较强的说服力，肯定了TAMs在预测NSCLC患者预后的研究价值，对临床有重要的指导意义。

式中为新个体γ′的适应值；G(δ )为当前时刻δ的温度，温度更新公式为，G( δ+1)=λG(δ)，λ为( 0,1)的随机值.

Step 7 迭代.将调整后的个体重组为新种群，进行Step 3～Step 6迭代过程，直到算法收敛.

2.3 基于RBM-GASA-BPNN的潜在高价值旅客预测方法

利用RBM 和GASA 算法优化的BPNN 作为分类器，进行旅客的分类预测.基于RBM-GASABPNN 的潜在高价值旅客预测方法的实现步骤如下.

式中：为种群最大适应值；为种群平均适应值；κ₁，κ₂为调整系数，交叉概率应不大于1，可取κ₁=κ₂=1.

(2)提供参数范围.将训练集输入RBM，使用CD 算法进行预训练，重构误差满足要求后输出RBM 的隐藏层、权重w_ij和偏置b_j，分别作为BPNN的隐藏层、初始权重w_ij和初始偏置b_j.

(3)种群初始化.随机扰动RBM 的权重w_ij、偏置b_j使其在[ ]-1,1 内变化，随机赋值BPNN的初始权重w_jl、初始偏置c_l，得到包含N个个体的初始种群.

天是那么蓝，水是那么动人心魄，他们宛如一对情侣，并肩走向沙滩。一条短裤，一袭红裙，从水浅的地方下去，走到齐腰深的水域。蒋浩德一显身手，向河心游去。紫云拍打着水花，在后面一个劲地喊：“小心！回来！”

(4)迭代优化.将w_ij、b_j、w_jl、c_l进行二进制编码，利用GASA 算法不断更新种群，最终保留适应度最佳的个体.

(5)分类预测.用最佳个体对BPNN 的初始权重和偏置进行赋值.输入训练集，通过反向传播法再次训练BPNN，并输入测试集进行分类预测，从而发现潜在高价值旅客.

实验评价指标采用精确度(Precision)、召回率(Recall)和F1值(F1Score).其中，精确度为潜在高价值旅客正确识别的数目与判定的数目之比，召回率为潜在高价值旅客正确识别的数目与真实的数目之比，F1值为精确度与召回率的调和平均数.

图2 基于RBM-GASA-BPNN 的潜在高价值旅客预测方法框架
Fig.2 A framework for potential high value passenger forecasting based on RBM-GASA-BPNN

3 实验结果与分析

采用中国民航旅客订座记录(Passenger Name Record,PNR)201X 年及次年旅客的出行数据进行实验.

3.1 数据预处理

为进行有监督的分类学习，采用K-means聚类算法^[7]划分价值类别，设置旅客类别标签.对旅客x_p在时刻t_q的指标与价值进行聚类分析，将旅客集合X 聚类出K 个簇，则有X={ X₁, X₂,…,X_k,…,X_K}.令S={1 ,2 ,…,k,…,K }为簇下标集合，任一簇X_k中的旅客都有相似的价值表现.为了清晰显示各簇的价值特点，将各簇X_k的指标均值与旅客集合X的指标均值作比较，则存在S的子集C，使得C中任一下标f 对应的簇X_f⊂X均满足

(1)计算RFM指标.统计并采用离差标准化法对每名旅客x_p的进行线性变换，使其落在[0,1]内.

“我们想大力支持中小企业，但最大的担心来自银企信息不对称。”某股份制银行分行中小企业部总经理石斌杰说，“做贷款，当然要摸清企业的情况，比如税收、社保缴纳、公司产值、老板资金状况、贷款去向等，但这些问题靠目前的征信系统解答不了，增加了办理贷款的难度。另外，我们很希望有担保公司来做中小企业的担保，现在很多企业想贷款，既没有担保也不愿给抵押物，这不利于银行控制风险。”

(2)确定β.民航旅客生命周期较长，存在一定时间内，R指标难以充分反映旅客出行规律的情况，因此有β_R＜β_F且β_R＜β_M的规律.此外，利用层次分析法综合业内10位专家的权值设置意见，采用6个有效判断矩阵计算所得权值的平均值β=( 0.0 86 2,0.270 1,0.643 7) 作为权值向量.

(3)K-means 聚类.计算，对进行K-means聚类，由于簇均值与旅客集合X均值的比较结果只有大于、小于两种可能，因此K=8，可得201X 年潜在高价值旅客、低价值旅客的集合及数目，如表1所示.

(4)属性筛选.对PNR 数据的原始属性与进行相关性分析，筛选出相关性系数的6个强相关性属性，分别为出生年份、起飞日期、起飞时间、舱位、折扣、出行次数.

(5)属性转换.为反映旅客行为偏好，将出生年份转换为年龄，起飞日期转换为节假日、工作日、周末出行比例，起飞时间转换为空闲时间、正常时间、繁忙时间出行比例，舱位转换为头等舱、商务舱、经济舱出行比例，折扣转换为平均折扣，得到12维属性.

这个问题已普遍存在多年。某校校长曾抱怨说，开学两个月，就接待了五拨来校检查的，平均两周一拨，每拨都有项目繁多的检查明细。检查人员很辛苦，上午检查了这家，下午还要去另一家，中午也不得休息。被检查的当然更不胜其烦，事前要准备好书面汇报材料及其他资料，检查时需校、处两级领导多人陪伴上半天。

(6)属性二元化.为满足RBM 的二元输入形式，将12维属性分为低、较低、中、较高、高共5项，并设定阈值，得到60维属性.

表1 数据集统计信息
Table 1 Data set statistics

3.2 实验评价指标

综上，基于RBM-GASA-BPNN 的潜在高价值旅客预测方法的框架如图2所示.

3.3 实验及结果分析

随机抽取训练集20 000条，其中属于X_pv、X_lv的旅客各10 000条；随机抽取测试集10 000条，其中属于X_pv、X_lv的旅客各5 000条.

其中，a_i为可视层偏置.由于RBM层内无连接，层间全连接，节点的激活状态条件独立，因此有：

RB M 中，θ={ w_ij, a_i,b_j} 的初值通常从1 组均值为0、标准差为0.01 的正态分布中随机抽取，m为60，与输入样本维度一致，重构误差阈值为2%.GASA 算法中，G()0 为100°C，N为80，遗传代数为50.BPNN中，目标精度为0.10，u_l个数为2.

为测试本文方法的性能，进行了两种不同的实验.

3.3.1 参数对本文方法影响的实验

RBM隐藏层节点数目和BPNN学习率是对输出结果影响最大的参数，需通过多次训练寻找合适的值.

RBM 隐藏层节点数目取5 到55，步长为5.BPNN 学习率取0.15到0.45，步长为0.10.从图3和图4 可看出，当隐藏层节点数为20、学习率为0.35时，召回率和F1值最高，精确度较高.

水波相送，古道相迎，粉墙静立，青砖不语，关于这座古镇的印象，尚等细读拾取。春江水暖、雁字回时再重游，好好感受古镇清晨的寂静，午后黄昏的纷华，蓝天碧水的映衬，霓虹灯影的点缀……其实已沉醉在千年古镇的桨声灯影里。

3.3.2 不同预测方法对比实验

为验证本文方法的有效性，设计BPNN 方法、RBM-BPNN方法、GA-BPNN方法和GASA-BPNN方法作为对比方法.其中，BPNN 方法用传统的BPNN作为分类器；RBM-BPNN方法用RBM优化的BPNN 作为分类器；GA-BPNN 方法用GA 算法优化的BPNN作为分类器；GASA-BPNN方法用随机初始种群的GASA 算法优化的BPNN 作为分类器.各对比方法在相同数据集上调参后的结果如表2所示.

图3 RBM 隐藏层节点数目对结果的影响
Fig.3 Influence of the number of RBM hidden layer nodes on results

图4 BPNN 学习率对结果的影响
Fig.4 Impact of BPNN learning rate on results

表2 对比方法调参结果
Table 2 Results after adjusting parameters of comparative experiments

令RBM 隐藏层节点数为20，BPNN 学习率为0.35，将本文方法(简称RBM-GASA-BPNN 方法)与对比方法在相同的数据集上进行对比，对比实验的结果如表3所示.

通过表2和表3可看出：

(1)BPNN 方法的预测效果最差，根本原因在于随机化的BPNN 初始权值和偏置无法保证每次都能找到最优解.

(2)RBM-BPNN 方法的平均结果比BPNN 方法好，但比RBM-GASA-BPNN 方法差，是由于RBM提供的隐藏层与权重拟合输出类别的能力较弱，仍需精细化处理.

与对流传热系数类似，对流传质系数也跟流体的物理性能(密度、热导率、黏度和比热容等)、流体的流速以及表面形状等因素有关。舍伍德数(Sh)与浓度边界层的关系类似于努赛尔数(Nu)与热边界层的关系，所以利用舍伍德数可以计算出对流传质系数。

表3 对比实验的结果
Table 3 Results of comparative experiments

(3)GA-BPNN 方法和GASA-BPNN 方法的平均结果均比BPNN方法好.说明优化后的初始权值和偏置能够增强BPNN 的性能，且在有限的迭代次数中，GASA算法比GA算法的寻优效果更好.

(4)GA-BPNN 方法和GASA-BPNN 方法的3项指标均比RBM-GASA-BPNN 方法低，根本原因在于随机化的初始种群会降低寻优效率.

(5)RBM-GASA-BPNN 方法的3 项指标均高于对比方法的最优结果，是因为RBM提供了表达能力更强的隐藏层和优良的初始权重，避免了GASA 算法初始种群的随机化，从而提高了BPNN 寻优精度.

从对比实验的结果可见，RBM-GASA-BPNN方法具有更高的旅客分类准确率和潜在高价值旅客预测能力.

4 结论

本文提出了基于RBM-GASA-BPNN 的潜在高价值旅客预测方法，在基于BPNN 的预测方法的基础上，结合RBM与GASA算法来优化BPNN，增强了BPNN的表达能力和全局寻优效果.实验结果表明，本文提出的方法能显著提高潜在高价值旅客预测的效果，且优于BPNN、RBM-BPNN、GABPNN 和GASA-BPNN 方法.由于本文提出的方法拥有自适应性，因此适用于不同领域的行为分析问题.

参考文献：

[1] 林友芳,张奥爽,万怀宇,等.一种基于社交网络的民航新旅客成长性预测方法[J].北京交通大学学报,2014,38(6):40-46.[LIN Y F,ZHANG A S,WAN H Y,et al.Predicting the growth of new passengers in civil aviation based on social networks[J].Journal of Beijing Jiaotong University,2014,38(6):40-46.]

[2] 尹婷,马军,覃锡忠,等.贝叶斯决策树在客户流失预测中的应用[J].计算机工程与应用,2014,50(7):125-128,189.[YIN T,MA J,QIN X Z,et al.Bayesian decision tree applying in forecasting customer churn[J].Computer Engineering and Applications,2014,50(7):125-128,189.]

[3] 吕红霞,王文宪,蒲松,等.基于聚类分析的铁路出行旅客类别划分[J].交通运输系统工程与信息,2016,16(1):129-134.[LU H X,WANG W X,PU S,et al.Classification of railway passengers based on cluster analysis[J].Journal of Transportation System Engineering and Information Technology,2016,16(1):129-134.]

[4] ZHANG C X,ZHANG J S,JI N N,et al.Learning

ensemble classifiers via restricted boltzmann machines

[J].Pattern Recognition Letters,2014,36(1):161-170.

[5] 何庆,吴意乐,徐同伟.改进遗传模拟退火算法在TSP优化中的应用[J].控制与决策,2018,33(2):219-225.[HE Q,WU Y L,XU T W.Application of improved genetic simulated annealing algorithm in TSP optimization[J].Control and Decision,2018,33(2):219-225.]

[6] ZABKOWSKI T S.RFM approach for telecom insolvency modeling[J].Kybernetes,2016,45(5):815-827.

[7] 杨华晖,孟晨,王成,等.基于目标特征选择和去除的改进K-means 聚类算法[J].控制与决策,2018,10(21):1-8.[YANG H H,MENG C,WANG C,et al.Improved K-means clustering algorithm based on feature selection and removal on target point[J].Control and Decision,2018,10(21):1-8.]

[8] 李永立,吴冲,罗鹏.引入反向传播机制的概率神经网络模型[J].系统工程理论与实践,2014,34(11):2921-2928.[LI Y L,WU C,LUO P.Introducing the backpropagation into probabilistic neural network[J].Systems Engineering-Theory&Practice,2014,34(11):2921-2928.]

[9] MA X,WANG X.Average contrastive divergence for training restricted boltzmann machines[J].Entropy,2016,18(2):35.

Potential High Value Passenger Forecast Based on RBM-GASA-BPNN

XU Tao^1,2,3,LIU Ze-jun¹,LU Min^1,2,3

(1.College of Computer Science and Technology,Civil Aviation University of China,Tianjin 300300,China；2.Information Technology Research Base of Civil Aviation Administration of China,Tianjin 300300,China；3.Key Laboratory of Intelligent Passenger Service of Civil Aviation,CAAC,Beijing 101318,China)

Abstract： Aiming at the problems of weak feature expression ability,poor stability and higher local optimal probability of the potential high-value passengers discovery method based on BP neural network(BPNN),a novel potential high value passengers discovery method based on RBM-GASA-BPNN is proposed in this paper.Firstly,clustering algorithm is used to classify passengers and set category labels.Then the restricted Boltzmann machine(RBM)is used to automatically extract the passenger's behavior features and provide the optimal range of initial weight and bias for BPNN.And the genetic algorithm-simulated annealing(GASA)algorithm is used to adjust the parameters precisely to find the optimal initial weight and bias of BPNN.Finally,the optimized BPNN is used to classify passengers.The experimental results show that the proposed method overcomes the shortcomings of existing method based on BPNN and has a better classification prediction accuracy and potential high value passenger forecast ability.

Keywords： air transportation；value category prediction；prediction model；potential high value passenger；RBM；GASA；BPNN

文章编号： 1009-6744(2019)04-0108-07

中图分类号： TP391

文献标志码： A

DOI： 10.16097/j.cnki.1009-6744.2019.04.016

收稿日期： 2019-01-17

修回日期： 2019-03-16

录用日期：2019-03-26

基金项目：国家自然科学基金/National Natural Science Foundation of China(61502499)；中国民航大学科研基金/The Scientific Research Foundation from Civil Aviation University of China(2013QD18X)；民航旅客服务智能化应用技术重点实验室项目/Key Laboratory of Intelligent Passenger Service of Civil Aviation,CAAC(TS-CAKL-2018-01).

作者简介：徐涛(1962-)，男，重庆人，教授.

*通信作者： txu@cauc.edu.cn

标签：航空运输论文; 价值类别预测论文; 预测模型论文; 潜在高价值旅客论文; rbm论文; GASA论文; BPNN论文; 中国民航大学计算机科学与技术学院论文; 中国民航信息技术科研基地论文; 民航旅客服务智能化应用技术重点实验室论文;