基于多层数据分析框架的半导体加工周期预测论文

基于多层数据分析框架的半导体加工周期预测

汤珺雅,李 莉

(同济大学 电子与信息工程学院,上海 201804)

摘 要: 为了在大数据环境下利用制造数据对半导体加工周期进行准确预测,针对传统预测模型准确性和泛性上的不足提出一种多层数据分析框架,基于该框架实现加工周期预测算法,利用某半导体生产线数据建立预测模型,检验了该预测方法的有效性并与多种常用方法进行了比较。结果表明,基于多层数据分析框架的半导体加工周期预测方法有效提高了模型的准确性和泛性。

关键词: 加工周期预测;半导体制造;多层数据分析框架;机器学习;集成学习

0 引言

随着科技的发展,智能设备广泛应用于生产生活,半导体行业在得到发展的同时也面临着考验。为了提高生产效率,晶圆制造业也逐步走向智能化,并由此产生大量制造数据。如何充分挖掘晶圆制造数据,为企业提供信息、决策支持是值得关注的问题。

随着分布式发电供能技术,能源系统监视、控制和管理技术,以及新的能源交易方式的快速发展和广泛应用,能源耦合紧密,互补互济。而综合能源系统作为能源互联网末端的配、用能载体,是其核心的构成部分。

半导体加工过程是一个典型的复杂生产过程。半导体生产线有很多性能评价指标,包括在制品数量(Work in Processing, WIP)、移动步数(movement)和设备利用率(utilization rate)[1]等。其中半导体生产线加工周期是生产企业关注的一个重要的长期性能指标,对加工周期的预测也是相关研究人员和生产商密切关注的问题。在半导体生产线中,加工周期指晶圆片从进入生产线到完成所有加工步骤,直至离开生产线所需要的时间,对企业的准时交货性能有重要影响。加工周期的准确预测可以为企业运作决策提供支持:

(1)通过预测晶圆加工周期可以预估交货时间,确保准时交货率,并合理安排后期生产任务。

(2)晶圆加工流程将对后续芯片测试、封装流程产生直接影响,对晶圆加工周期的预测为生产商合理开展各生产流程提供了有效支持。

针对半导体生产线中晶圆加工周期的预测问题,相关学者展开了大量研究,目前常见的加工周期预测方法包括复因子线性回归(Multiple-Factor Linear Regression, MFLR)、反向传播网络(Back Propagation Network, BPN)[2]、生产仿真(Production Simulate, PS)、案例推理(Case-Based Reasoning, CBR)和模糊建模方法(Fuzzy Modeling Methods, FMM)[3]。其中:MFLR简单便捷但预测精度不高[4];PS在正确建立预测模型的情况下,有较高的预测精度,但要处理大量的数据,存在数据规模太大和预测时间过长的问题。与上述两种方法相比,BPN[5]能够较好地平衡预测精度和预测时间,可以在允许的预测时间里达到较好的预测精度。Chang等[6]提出的基于BPN的加工周期预测方法,与MFLR方法相比在均方误差上提高了40%,其预测时间和处理的数据量与PS方法相比有明显降低。在BPN的基础上,又出现了相应的改进方法,例如Chang等[7]提出一种基于K 近邻的CBR方法,该方法较BPN在预测准确度上有所提高;Chen[8]提出模糊反馈网络方法(fuzzy modeling and BPN),将模糊方法和反向传播网络相结合,与BPN相比,该方法在预测效率方面的收敛次数更少、效率更高,而且在预测精度上也优于BPN。

基于上述3层数据分析框架对晶圆加工周期建立预测模型是本文研究的重点,本文根据晶圆加工数据的维度、数据量、噪声等特点选择相应的算法对每层数据进行分析。

1 多层数据分析框架

1 .1 加工周期预测流程

随着智能技术的日益成熟,半导体制造业逐步向智能化发展。晶圆加工过程是一个复杂的制造过程,其加工周期是生产商极为关注的长期指标,而加工周期受到多种因素的影响,难以通过简单方法预测。企业应用智能设备能够获得大量晶圆制造数据,通过充分分析挖掘这些数据,提取有效信息,可以预测晶圆加工周期。晶圆加工周期预测流程包括数据采集、数据处理和数据学习,如图1所示。

以前打仗一样15分钟就结束战斗的晚饭竟吃了一个半小时,两个人说说笑笑的样子让宝宝都觉得不适应了。小家伙来拉林蓝的手,吃醋地说:“妈妈,不要陪爸爸说话了,陪宝宝去搭积木。”

数据采集层通过智能设备采集实际生产中的晶圆加工数据,或利用仿真软件模拟实际生产线收集晶圆加工数据;因为采集到的数据,尤其是实际生产中的数据存在噪声大、数值有缺失、特征属性冗余等问题,所以通过数据处理技术对数据进行去噪、缺失值填补、相关性分析、特征选择等处理;数据学习层根据数据量的大小选择合适的机器学习或深度学习方法建立预测模型,并根据新增数据进行增量学习,以一定频率对模型进行优化和更新来保证模型的有效性。

1 .2 多层数据分析框架

"现代观赏石审美标准被界定为:形、质、色、纹、韵及命名、配座、传承八大要素,极大地扩展了观赏石的现代审美范畴。"

(1)特征选择层

尽量避免宝宝接触过敏原和污染空气,以减少喘息性疾病发生。家中尽量不要养猫、狗、兔、鸽子等宠物,室内不要养花。给孩子买玩具时,应尽量选择木、布、金属制作的。

利用2.1节基于K 近邻的特征选择算法对原始数据集进行降维,剩余21个特征属性,分别为是否紧急、剩余步数、注入区在制品数目、注入区队列、注入区加工时间、注入区瓶颈设备数、光刻区紧急工件数、光刻区瓶颈设备数、扩散区在制品数目、扩散区队列、扩散区瓶颈设备数、干法刻蚀区在制品数目、干法刻蚀区队列、干法刻蚀区加工时间、干法刻蚀区紧急工件数、干法刻蚀区瓶颈设备数、湿法刻蚀区在制品数目、湿法刻蚀区队列、湿法刻蚀区加工时间、湿法刻蚀区瓶颈设备数、测试区在制品数目。

公立医院的预算编制主要基于上一年的运作情况。公立医院的预算在实施过程中,由于主、客观条件的变化以及各部门的反馈,预算需要适当调整。预算的制定必须结合部门的实际运用情况进行评估,但在过程具体的实施中,对于预算存在的问题可以及时发现并进行反馈改进,推动财务部门根据医院预算的执行情况调整预算,对相关的程序加强严格审批,从而保证预算可执行行的提高。

晶圆加工周期为数值型,可视为连续曲线上的数值点。针对连续数值数据,宜采用回归方法进行建模。在机器学习层,将数据集分为训练集和测试集,对训练集采用交叉验证的方式选择合适的回归拟合算法,建立回归预测模型,并利用测试集检验模型的泛性,获得具有一定准确性和泛性的有效回归预测模型。

(3)集成学习层

21世纪图书馆项目的目的是研究当前和未来,如何通过图书馆服务来满足或支持各层次的学术和教学需要,以及资源达到最有效的工作效果,提供优质服务。数字人文为民国文献数字化深度开发提供理论和实践的经验和方法,为保护和完善珍贵资源,我们共同推进民国文献数字人文朝着更广泛、更深入的领域发展。

准确性和计算效率是模型建立过程中的两难选择,为了达到较高的计算效率,需要舍弃信息量少的特征属性,导致模型的准确性降低。因此,对回归预测模型进行集成学习,进一步提高模型的准确性,以获得具有更高准确性和泛性的有效回归预测模型。

2 加工周期预测算法

上述加工周期预测方法在预测精度和预测泛性上都有一定程度的提高,但还存在局限。其中:MFLR方法简单便捷但预测精度不高;PS方法在正确建立预测模型的情况下有较高的预测精度,但要处理大量数据,存在数据规模太大和预测时间过长的问题。相比之下,BPN在预测精度和预测时间上能较好地达到平衡,可以在允许的预测时间里达到较好的预测精度,但依然有待提高。本文针对上述方法的不足,提出基于多层数据分析框架的半导体生产线加工周期预测方法,通过对生产线数据的检验,验证了该方法的准确性和泛性。

2 .1 基于K 近邻的特征选择

K 近邻算法[11-12]是一种基于距离的分类算法,具有精度高,对异常数据不敏感的特点。基于K 近邻的特征选择是根据各特征对样本分类能力的大小来确定特征的权重,以各特征的最终权重为指标,评价其重要程度。在半导体加工周期预测中,权重越大的因素对加工周期的影响程度越大。令A 为一个影响因素,其权重计算公式为

(mk )。

(1)

式中:diff (A ,R 1,R 2)为样本R 1和样本R 2在特征A 上的差,

(2)

p (Class (R ))为样本R 对应的目标属性所包括的样本占总体样本的比例;Class (R )为样本R 所对应目标属性的值;p (C )为与所抽取的样本R 的目标属性值不同的目标属性值C 所包含的样本占总体样本的比例;m 为抽样次数;k 为近邻数。

2 .2 基于决策树的机器学习

考虑到半导体生产线的样本数据量大、类别较多,选用决策树算法进行机器学习。决策树主要有ID3算法和C4.5算法,因为C4.5算法构造树的过程需要对数据集进行多次顺序扫描和排序,效率较低,所以采用ID3算法构造决策树。ID3算法通过信息熵作为启发式函数选择决策节点的特征属性。选择具有最大信息增益的特征属性作为当前分枝节点,通过这种方式选择的节点属性可以保证决策树具有最小的分支数量。信息熵计算如下:

(3)

式中X 为变量,取值为X 1,X 2,…,X n ,每个值出现的概率为p (X 1),p (X 2),…,p (X n )。

信息增益是针对某个具体特征属性而言的,对于一个特征属性A ,系统在没有特征属性A 时的信息量和系统具有特征属性A 时的信息量的差值即为特征属性A 给系统带来的信息增益。

2 .3 基于Bagging 的集成学习

相关系数corr [12]是用来度量两个变量之间线性关系的指标,在本实验中用于衡量晶圆加工周期预测值和实际值之间的相关程度,相关系数越接近1,表示预测值与实际值之间的线性相关性越强,拟合程度越好,皮尔森相关系数计算如下:

Bagging算法步骤如下:

不久前,京东自主研发的无人大飞机首飞成功,对此王振辉表示,无人机的发展,是京东整个无人机体系里的一个非常重要的架构。“我们会不断研发出不同重量的无人机。现在江苏宿迁是我们无人机的操控中心,也是无人机人员培训中心。无人机的大规模应用还涉及到空域的问题,京东无人机目前已在陕西、江苏、海南、青海、广东、福建、广西共7省进行常态化物流配送,有效解决许多农村、道路不便地区最后一公里的配送问题,让智慧物流造福了这些地带和人群。”

(1)从样本中随机选出n 个样本。

(2)在所有属性上,对n 个样本训练分类器。

(3)重复以上两步m 次,训练m 个分类器;用m 个分类器对新数据进行分类,投票决定分类结果。

影响晶圆加工周期的因素很多,其制造数据具有属性多的特点,其中冗余的属性会影响数据学习效率、干扰学习效果。本文针对上述数据特点,提出包括特征选择、机器学习[9]、集成学习的3层数据分析框架,通过有效的算法实现框架功能;最后,基于某半导体企业仿真模型的历史数据,通过特征选择建立决策树[10],预测模型及其集成学习模型,来获得具有更高预测准确度和预测泛性的加工周期预测模型。各层功能如图2所示。

3 实验及结果分析

3 .1 评价指标

(1)相关系数

目前常用的集成学习方法包括Bagging[4]和Boosting[13]算法。Bagging算法适用于多个同类弱分类器的集成,而Boosting算法适用于多个不同种类弱分类器的集成,故本文选用Bagging算法作为集成学习的方法。通过改变训练的样本集训练多个不同的决策树模型,采用投票机制投票选择决策树模型的预测结果,获得最终的加工周期预测模型。

在平台创办主体上,调研的7家平台既有企业创办的,也有创办于事业单位和新型研发机构的,有两家平台还是创业人士为实现个人梦想创办的。创办企业的背景资料显示,有的平台具有科技金融投资背景,有的是资深科技服务机构,有的是行业联合创新中心,都与科技产业紧密关联。在平台规模上,调研发现,科研众包平台普遍规模较小,大的平台有40来个员工,小的则不到20人,人员结构上主要采取“平台运维人员+专业服务团队”的模式,呈现出很典型的互联网企业特征。

(4)

式中:为晶圆加工周期的预测值向量,Y 为晶圆加工周期的实际值向量。

(2)均方根误差

本文结合合肥轨道交通1号线南一环站、芜湖路站和水阳江路站,设计介绍一种新型的站、桥结合方式——明挖地铁站与市政高架桥同期同位并行分离式合建方法,即地铁车站与高架桥同期开工,结构体在车站顶板与桥梁墩柱扩大基础之间采用防水层进行分离,结构受力上只传递竖向荷载,使得车站结构及桥梁受力更为合理。

均方根误差RMSE [14]衡量预测值和实际值之间的差异程度,体现预测误差的绝对大小。均方根误差越小,拟合程度越好。

(5)

(3)相对绝对误差

根绝对误差RAE [14]衡量绝对误差与实际值偏离均值程度的相对大小,体现预测误差的相对大小。相对绝对误差越小,拟合程度越好。

(6)

(4)相对平方根误差

相对平方根误差RRSE [14],衡量预测误差总体相对于实际数据偏离均值程度的相对大小,体现预测误差的漂移。相对平方根误差越小,拟合越好。

(7)

(5)训练时间

训练时间Time 衡量算法的复杂度和效率,训练时间越小,表明算法复杂度越低,效率越高。

针对晶圆制造数据特征属性多的特点,设计特征选择层对冗余的特征属性进行剔除。特征的增多会大大增加算法求解的搜索空间,从而增加学习算法的复杂度,使所需训练的样本数增加,甚至可能带来更高的误差。因此通过特征选择层寻找能够描述加工周期数据规律的最小子集,提高后续模型训练的效率。

3 .2 实验数据

本文实验数据来自某实际半导体生产线仿真模型的历史数据,经过整理得到11 170个样本,每个样本包括43个特征属性和1个目标属性,如表1所示。

提高柱塞总成密封效果的措施……………………………………………………………王海云,闵凡兵,崔晓燕,王克强(4.22)

表1 样本属性

3 .3 实验及结果分析

(1)K 近邻特征选择结果

考虑到现有供应库存的优化,为商业地产供给侧结构改革做足准备工作。优化现有库存供给从以下三个措施展开:第一,结合城中村改造,提供更多户型可供消费者选择,缩短拆迁户的安置时间,节约政府资源,提高居民满意度。第二,加强现有住宅公共设施的配套建设,发挥商品住宅集群效应,促进土地资源合理有效利用。这对于吸引潜在居民有很大作用。第三,以优化现有的质量改进库存,将现有库存和人文,历史有机结合,整合资源,利用先进技术吸引和创造另一个领域的商业地产行业的潜力买家。

(2)机器学习层

(2)预测结果分析

利用上述评价指标对本文提出的基于多层数据分析框架的半导体加工周期预测方法与常用的回归预测方法进行比较,对比算法包括岭回归[15]、K 近邻回归[16]、支持向量机回归[17]、回归树[18]、多层感知机回归[19],分别从各方法训练出的模型准确性、降维对模型的影响度、模型对新数据的泛性3个发面评价预测方法的优劣。实验设计如下:

1)将数据样本分为训练样本和测试样本,分别为10 000个和1 170个。

2)随机将训练样本分为训练集和评估集,分别占训练样本的70%和30%。

3)重复训练10次,对结果取平均值。

结果如表2所示,表中将本文提出的基于多层数据分析的半导体加工周期预测方法简称为MLDAF。

表2 各算法结果

(3)各方法准确性比较

情境是指用于表征与交互环境相关的实体状态的信息集合,它包括空间、时间、物理环境状态、人的情绪、心理状态及相互关系等。

从降维前的数据分析结果可以看出,MLDAF的RMSE 误差最小,RAE 误差和RRSE 误差的漂移也比较小;比较算法中,K 近邻算法的效果最好,和MLDAF算法相比准确性略低,但训练时间较短。

(4)降维对各方法影响

从降维后的数据分析结果可以看出,MLDAF算法的RMSE 误差、RAE 误差和RRSE 误差漂移仍然较小;比较算法中,K 近邻算法的效果仍然最好,和MLDAF算法相比准确性略低,但训练时间较短。

对比降维前后数据结果可以看出,降维后大多数算法的训练时间更短,训练效率更高(支持向量机和多层感知机除外):①降维后大多数算法在准确性上有所下降,说明减少的属性中包含了部分有用信息;②降维后岭回归和多层感知机的准确性有所提高,说明信息量较少时,这两种方法的学习能力更强。

(5)各方法的泛性比较

将测试集的相关指标与训练集相关指标做差,结果如表3所示。可以看出,各算法在测试集上的性能较训练集均有所下降;MLDAF算法的RMSE 误差、RAE 误差和RRSE 误差在训练集和测试集上相差很小,算法泛性良好,而训练集性能良好的K 近邻算法在测试集上性能大幅度下降,泛性很差;岭回归算法在训练集和测试集上的性能均较好,泛性也较好。

表3 各算法泛性比较

(6)拟合比较

将MLDAF和准确性最好的K 近邻法、泛性最好的岭回归法进行直观比较,做出预测值和实际值的曲线,观察曲线的拟合度,如图3~图6所示。对比图3和图4可以看出,MLDAF比K 近邻法的拟合程度更好;对比图4和图5可以看出,MLDAF比岭回归法的拟合程度有显著提升;对比图4和图6可以看出,MLDAF在训练集和测试集上均能达到很高的拟合程度,具有较好的泛性。

4 结束语

半导体加工周期是半导体厂商最关注的长期指标之一,对加工周期的预测一直是研究人员关注的问题,在大数据和智能制造背景下,基于数据的方法比传统方法更具有优势。基于此,本文提出基于多层数据分析框架的半导体生产线加工周期预测方法,与多种普通回归方法相比,该方法在性能上有一定提高:①算法在训练集上的准确性更高;②数据降维前后算法的准确性波动更小,即数据中的冗余属性对该算法的干扰性很小;③算法在测试集上的准确性更高,算法泛性远高于其他算法。因此该方法能够对半导体生产线加工周期进行准确、有效地预测。另外,该多层数据分析框架具有一定的普适性,可以根据实际应用中的数据特征适当选择和调整框架各层算法进行拓展应用。

未来将进一步关注模型的更新机制,采取增量学习[20]的方式对模型进行更新,维持模型的准确性,并进一步实现实时预测。

河南卢氏伟晶岩以锂白云母化、小叶钠长石化、高岭石化最为发育,中叶钠长石化次之,锂云母化微弱。在伟晶岩脉中,铌、钽矿化显著增强,锂辉石也略有增加,锂云母钠长石型交代作用最复杂,矿化最好。其还具有硅化、绢云母化、高岭石化后期、碳酸盐化、褐铁矿化等。稀有金属矿化主要发生在白云母、叶钠长石、锂辉石等第一期的K→Na→Li交代阶段和微斜长石→锂白云母,小叶钠长石、锂辉石→电气石等第二期的K(Li)→[B(Li)]-Na(Li)→Li(Na)交代阶段。Ta、Nb的富集成矿主要与钠长石化及锂云母化,红电气石化密切相关,而Li、Rb、Cs的富集成矿则偏于与锂云母化、红电气石化的密切相关[8]。

参考文献:

[1] YANG Lixi, ZOU Xiangyun. Influential factors on cycle time in wafer fabrication and simulation analysis[J]. Journal of Wuhan University of Technology:Information & Management Engineering,2013,35(6):893-897(in Chinese).[杨立熙,邹湘云.晶圆生产周期的影响因素及仿真分析[J].武汉理工大学学报:信息与管理工程版,2013,35(6):893-897.]

[2] BERTHOLD M, HAND D J. Intelligent data analysis:an introduction[J]. Technometrics,2010,60(4):131-156.

[3] CHEN Huiling, YANG Bo, WANG Gang, et al. A novel bankruptcy prediction model based on an adaptive fuzzy, k-nearest neighbor method[J]. Knowledge-Based Systems,2011,24(8):1348-1359.

[4] CHEN T, WANG Y C, TSAI H R. Lot cycle time prediction in a ramping-up semiconductor manufacturing factory with a SOM-FBPN-ensemble approach with multiple buckets and partial normalization[J]. International Journal of Advanced Manufacturing Technology,2009,42(11/12):1206-1216.

[5] ANIFOWOSE F, AHMED Q, KHAN F I. System availability enhancement using computational intelligence-based decision tree predictive model[J]. Proceedings of the Institution of Mechanical Engineers Part O:Journal of Risk & Reliability,2015,229(6):612-626.

[6] CHANG P C, HIEH J C, LIAO T W. Evolving fuzzy rules for due-date assignment problem in semiconductor manufacturing factory[J]. Journal of Intelligent Manufacturing,2005,16(4/5):549-557.

[7] CHANG P C, HSIEH J C, LIAO T W. A case-based reasoning approach for due-date assignment in a wafer fabrication factory[C]//Proceedings of the 4th International Conference on Case-Based Reasoning Research and Development.Berlin, Germany:Springer-Verlag,2001:648-659.

[8] CHEN T. A fuzzy back propagation network for output time prediction in a wafer fab[J]. Applied Soft Computing,2003,2(3):211-222.

[9] MEDINA F, AGUILA S, BARATTO M C, et al. Prediction model based on decision tree analysis for laccase mediators[J]. Enzyme & Microbial Technology,2013,52(1):68-76.

[10] HAN S H, LU S X, LEUNG S C H. Segmentation of telecom customers based on customer value by decision tree model[J]. Expert Systems with Applications,2012,39(4):3964-3973.

[11] GENG Lijuan, LI Xingyi. Research on KNN algorithm for big data classification[J]. Application Research of Computers,2014,31(5):1342-1344(in Chinese).[耿丽娟,李星毅.用于大数据分类的KNN算法研究[J].计算机应用研究,2014,31(5):1342-1344.]

[12] XIE Xianshi, XIANG Dong, DUAN Guanghong, et al. Information content and correlation analysis of product part coding system[J]. Computer Integrated Manufacturing Systems,2007,13(10):1978-1984(in Chinese).[谢贤仕,向 东,段广洪,等.产品零件编码系统的信息含量及相关性分析[J].计算机集成制造系统,2007,13(10):1978-1984.]

[13] XIN Le, FAN Yushun. Aensemble service model supporting multi-mode collaboration[J]. Computer Integrated Manufacturing Systems,2016,22(1):13-24(in Chinese).[辛 乐,范玉顺.支持多模式协作的业务服务集成模型[J].计算机集成制造系统,2016,22(1):13-24.]

[14] ZHU Xuechu, QIAO Fei. Industrial big data based manufacturing cycle prediction method of wafer manufacturing system[J]. Computer Integrated Manufacturing Systems,2017,23(10):2172-2179(in Chinese).[朱雪初,乔 非.基于工业大数据的晶圆制造系统加工周期预测方法[J].计算机集成制造系统,2017,23(10):2172-2179.]

[15] YAO Hongliang, MA Xiaoqin, WANG Hao, et al. Morphological features and causal green regression based stock market situation forecasting algorithm[J]. Computer Engineering,2016,42(2):175-183(in Chinese).[姚宏亮,马晓琴,王 浩,等.基于形态特征与因果岭回归的股市态势预测算法[J].计算机工程,2016,42(2):175-183.]

[16] FENG Wei, QIU Zhanzhi, SONG Xudong. Distributed K -nearest neighbor based fender impact energy prediction method[J]. Computer Engineering and Design,2017,38(10):2740-2744(in Chinese).[冯 巍,邱占芝,宋旭东.基于分布式K 近邻的护舷撞击能量预测法[J].计算机工程与设计,2017,38(10):2740-2744.]

[17] WU Jianxin, YANG Hao. Linear regression-based efficient svm learning for large-scale classification[J]. IEEE Transactions of Neural Netw Learn Syst,2017,26(10):2357-2369.

[18] HU Y J, KU T H, YANG Y H, et al. Prediction of patient-controlled analgesic consumption:a multimodel regression tree approach[J]. IEEE Journal of Biomedical & Health Informatics,2018,22(1):265-275.

[19] AMID S, GUNDOSHMIAN T M. Prediction of output energies for broiler production using linear regression, ANN (MLP, RBF), and ANFIS models[J]. Environmental Progress & Sustainable Energy,2017,36(2):577-585.

[20] POLIKAR R, UPDA L, UPDA S S, et al. Learn++:an incremental learning algorithm for supervised neural networks[J]. IEEE transactions on Systems, Man, And Cybernetics,2001,31(4):497-508.

Cycle time prediction method for semiconductor wafer fabrication facility based on multi -layer data analysis framework

TANG Junya ,LI Li

(School of Electronics and Information Engineering, Tongji University, Shanghai 201804, China)

Abstract :To predict cycle time accurately of semiconductor processing based on manufacturing data and to cover the shortage of traditional model’s generalization, a multi-layer data analysis framework was proposed. A cycle time prediction algorithm based on this framework was realized. Based on the data of a semiconductor line, a prediction model was built, and the effectiveness of this method was validated by comparing with several common methods. Experiments demonstrated that the proposed multi-layer data analysis framework based cycle time prediction method could effectively improve the accuracy and the generalization.

Keywords :cycle time prediction; semiconductor manufacturing; multi-layer data analysis framework; machine learning; ensemble learning

DOI :10.13196/j.cims.2019.05.006

收稿日期: 2016-09-29;修订日期:2018-02-08。

Received 29 Sep.2016;accepted 08 Feb.2018.

基金项目: 国家自然科学基金资助项目(51475334)。

Foundation item: Project supported by the National Natural Science Foundation, China(No.51475334).

中图分类号: TP273

文献标识码: A

作者简介:

汤珺雅(1993-),女,安徽六安人,博士研究生,研究方向:制造业大数据分析,E-mail:1610453@tongji.edu.cn;

李 莉(1975-),女,山东安丘人,教授,博士,博士后,研究方向:数据驱动的建模与优化控制。

标签:;  ;  ;  ;  ;  ;  

基于多层数据分析框架的半导体加工周期预测论文
下载Doc文档

猜你喜欢