人工智能在地球物理领域中的应用情况及展望论文_彭伟

人工智能在地球物理领域中的应用情况及展望论文_彭伟

四川省地质矿产勘查开发局物探队 四川成都 610072

摘要:本文通过介绍人工智能技术基本概念以及地球物理学对于人工智能技术的应用情况,分析地球物理学存在的多解性、人工错判等问题,结合人工智能在机器学习和深度学习的技术进展,提出可行的改进思路和创新点。

关键词:人工智能;地球物理;机器学习;深度学习

0 引言

人工智能技术,包括机器学习和深度学习技术。机器学习,一般分为4类:监督学习、无监督学习、半监督学习、强化学习(或增强学习)[1]。深度学习,是机器学习的一个分支,是相对单层感知机而言的多层感知机,主要网络包括卷积神经网络、循环神经网络等。

地球物理学,是一门基于传播介质的物理参数差异,研究提出理论模型,利用设备采集重、磁、电、震等物理参数,通过数据反演或正演处理,求解物理参数真实分布情况,从而解决矿产、工程勘察以及固体地球研究等领域问题的学科。数据处理采用最小二乘法、线性回归、牛顿法、拟牛顿法、共轭梯度法、遗传算法、神经网络、蚁群算法等方法。

可以看出,地球物理学对于人工智能技术的算法应用是非常全面的。比如,地球物理学在数据反演处理中,经常用到最小二乘法,采用了卷积神经网络中的偏执项、归一化、正则项等思想。但这两者不同点也同样明显,地球物理学研究的是确定的物理模型、简单特征的数据最优化问题,人工智能研究的是不确定模型、不确定特征的数据,通过建立更加复杂的模型,进行图像识别、语音识别、自然语言处理等方面的应用。

多年的应用实践发现,地球物理学在数据处理方面的还存在诸多问题,最显著的是多解性,由于地球物理的资料解释,往往采用单一方法或少量的特征参数进行解释,多解性问题不可避免。如果能够采用多种方法或更多的特征参数进行综合判断,多解性问题会大大降低。另外,由于多解性的存在,同时,受知识结构的影响,导致人工解释也存在很大的差异,如果能够采用多参数综合解释,利用深度学习中的卷积神经网络进行计算机自主识别,会降低人工判断的错判率。

1 机器学习概述

包括机器学习(Machine Learning)在内的人工智能(Artificial Intelligence)技术经过60多年的演进已成为新型的国家竞争力,这主要得益于硬件计算能力的提升、算法的优化和数据量的累积。机器学习就是让计算机实现人的学习行为,不断完善自身性能的过程。它集成多学科,吸收了概率统计学、控制论、神经网络学、复杂环境下的计算理论等领域的研究成果。

机器学习过程的数学表达为:(x,y)为问题空间甲中的样本,即(x,y)∈W,其中,x是1个n维向量,y是属性域中的值。一般情况下,只能观测到W的1个真子集Q,记为Q∈W,称为数据集。根据Q建立模型M,使得M对W中的所有样本预测期望的正确率大于给定的常数θ。该描述暗含了以下几个内容:

(1)数据集Q的建立。样本数据具有特征属性,一般需完成数据的预处理和特征提取。

(2)模型M是对问题空间W的泛化过程,包括模型算法的训练、验证和测试。

(3)常数Q是对模型M正确率的度量策略。

由此可见,数据(集)特征、模型算法和度量策略是机器学习过程好坏成败的关键因素。

机器学习一般分为4类:监督学习、无监督学习、半监督学习、强化学习。

监督学习中对数据集的标记对预测结果起决定性作用,常用的算法有支持向量机、决策树、朴素贝叶斯、隐马尔科夫等。无监督学习主要根据相似性原理,由聚类分析做出预测,更近乎人的学习方式,在现实中经常作为监督学习的辅助工具。半监督学习是在缺少标记数据的情况下可做出预测,并不断更新数据集、提升性能、充分再利用标记信息的过程。由于“有标记的数据少,未标记的数据多”这种现象普遍存在,使得半监督学习成为研究热点。如强化学习中奖赏函数(打分器)至关重要。AlphaGo的升级品AlphaGo Zero是强化学习最著名的代表,常见算法有多摇臂赌博机算法、时序差分算法、模仿学习机等。由此可见在机器学习中数据特征和模型算法的重要性。

机器学习平台采用高级编程语言(如Python,C,Java,Scala等)实现各种机器学习算法。对于不同的机器学习任务和不同的用户服务需求,可以有针对性地选择机器学习平台。各商业巨头拥有用于自身建设和服务的机器学习平台和专业团队,以实现巨大的经济利益,例如Google Cloud Platform,微软 Azure、AmazonML、腾讯 TML、阿里云 DTPAY 等商业平台。而对于中小型企业,SkyTree,BigML,Wise,io基于云方式在线为该类用户提供大数据分析和机器学习平台建设服务,使得机器学习成为一种商业服务。Apache Mahout 框架、Apache Spark 平台、Petuum和GraphLab是当前较为流行的应用于处理大规模数据的开放平台,采用了并行化的数据处理方式和计算模型,旨在提高计算分析效率,不同于小规模数据上的传统机器学习算法。相比于大数据的挖掘分析,小数据的机器学习工具有基于 Python实现的Scikit - Learn、Java语言开发的Weka和matlab平台等,可以为个人、研究团体提供面向任务的机器学习算法,且便于算法的二次开发等。[1]

2 深度学习概述

深度学习的概念起源于人工神经网络的研究,Hinton等(Hinton and Salakhutdinov 2006;Hinton et al.,2006)基于深度置信网络(DBN)提出了非监督贪心逐层训练算法,通过逐层初始化来解决深度神经网络相关的优化问题.Hinton(2012)揭示了神经网络最大价值在 于对特征的自动提取和抽象,它免去了人工提取特征的繁琐工作,可以自动找出复杂且有效的高阶特征。这一点非常类似于人的学习过程,即先理解简单概念,再逐渐过渡到复杂概念,神经网络的结构每增加一层,可以提取到的特征就更抽象。[2]

深度学习过程,主要包括前向传播和反向传播。前向传播经过卷积计算(或池化计算)、激活函数、归一化、计算损失值;反向传播采用梯度下降法不断优化不同层特征参数(调参),寻找最小损失值,从而达到训练分类、回归等模型的目的。

深度学习的应用方向主要为图像识别语音识别、自然语言处理。Yann LeCun在1998年提出的LeNet-5、Alex Krizhevsky2012年提出的Alexnet、google公司Karen Simonyan2014年提出的VGG、google公司Christian Szegedy2015年提出的Inception、何凯明2015年提出的ResNet、Gao Huang2016年提出的DenseNet、google公司Barret Zoph2017年提出的NasNet、1997年提出的长短记忆网络LSTM、2018年上海交大提出的切片循环神经网络SRNN、以及双向循环神经网络Bi-RNN。

期刊文章分类查询,尽在期刊图书馆[3-7]

深度学习平台有google公司的TensorFlow,支持Python、C++、java、Go、R多种编程语言,同时使用C++ Eigen库,可在各种服务器和移动设备部署模型,支持细粒度的网格层,但没有对视频识别很有用的三维卷积,执行性能相对落后Caffe;Facebook公司的Caffe,是工业级深度学习工具包,对于计算机视觉处理性能优异,同时可跨平台运行,支持C++、Matlab和Python编程接口,但不支持细粒度网络层;Keras是一个高层神经网络API,使用TensorFlow、Theano及CNTK作为后端,封装了一致而简洁的API,容易上手,同样因为封装丧失了灵活性;PyTorch是基于Python编写,设计更优雅,学习成本低,是一个简洁高效的深度学习框架;百度公司的PaddlePaddle,是具备工业级应用、超大规模并行学习能力的开源深度学习平台,同样为了适应工业级应用,封装过度,如果修改算法,需要从框架的C++底层开始实现。

3 地球物理应用情况

地球物理学对于包括机器学习和深度学习的人工智能算法主要应用在反演过程中,主要的反演算法有最小二乘法、线性回归、牛顿法、拟牛顿法、共轭梯度法、模拟退火法、遗传算法、神经网络、蚁群算法、小波多尺度分析、灰色系统分析等。下面从重、磁、电、震不同应用方面来举例。

重力应用中,在趋势面分析,需要对区域性变化、随机性变化、局部性变化进行分离,突出局部异常,排除随机干扰。通过构造一组正交多项式与未知系数的乘积和模拟理论重力值,再通过最小二乘法使得理论重力值与实测重力值的差值和的最小化,进而求解未知系数,再通过理论重力计算公式每个网格点的趋势值,即为区域性变化值,实测值减去该趋势值,即为局部性变化值。[8]

磁法应用中,在异常特征拾取中,对已知磁性异常进行特征标识,应用BP神经网络进行监督学习,训练出符合此特征的神经网络,对于常规化极、延拓、一阶导数等方法无法识别的异常,有良好的应用效果。[9]在环境磁学应用方面,笔者曾经对于长江流域各水系沉积物,通过测量得到不同磁性参数,建立磁诊断模型,采用最小二乘法、线性回归法、遗传算法等三种线性和非线性方法进行反演计算,得出各沉积物来自不同水系的溯源分析结果。

电法应用中,笔者在对激发极化电法数据cole-cole模型参数的提取中,通过cole-cole模型,采用阻尼最小二乘法,计算得出时间常数、充电率、频率系数等cole-cole模型频率域参数,该方法对于深部找矿有良好分辨率。[10]

地震应用中,在地震时间-噪音分类问题中,赵明等人在2019年使用13839个汶川地震余震事件建立数据集,应用深度学习卷积神经网络(CNN)方法进行训练,并用8900个新的汶川余震事件作为检测数据集,其训练和检测准确率均达到95%以上。在对连续波形的检测中,CNN方法在精度和召回率上优于STA/LTA和Fbpicker传统方法,并能找出大量人工挑选极易遗漏的微震事件。应用训练好的最优模型对选自全国台网的441个台站8天的连续波形数据进行了识别、到时挑取及与参考地震目录关联,CNN检出7016段波形,用自动挑选算法拾取到1380对P,S到时,并与540个地震目录事件成功关联,对1级以上事件总体识别准确率为54%,2级以上为80%。[11]

测井应用中,利用自然伽马、深感应、岩性密度、中子-密度孔隙度和平均中子-密度孔隙度5种测井参数,以及陆相-海相指示和相对位置2种地质约束变量作为输入变量训练深度神经网络模型,通过对实际井数据的测试验证,在识别岩性的应用中,取得了非常理想的效果。[2]在孔隙度预测应用中,利用CNN和决策树建立孔隙度的非线性模型,可以有效预测孔隙度,也可以应用与储层孔隙度预测中,相对于传统的线性回归方法相比,有更高的准确性。[12]

4 总结

通过以上的应用情况分析,可以看到,地球物理学在对人工智能算法方面的应用是全面而深入的。近年来,随着深度学习技术的不断成熟,地球物理领域也逐渐引入深度卷积神经网络,并取得了不错的应用效果。我们看到,由于地球物理学,有严密的理论基础,且经过实践考验,可通过正演方式,获得大量有标识的数据集,使得进行监督学习训练模型成为可能。同时,我们也注意到,由于地球物理学勘探方法的单一性应用,特征参数少、特征形态差异不明显,对于目标体数据画像难以准确进行,存在多解性的问题。

这为我们指明了改进的方向。第一,地球物理学理论基础是否足够坚实,有些理论是建立在假设和实验的基础上,太过理想化,是否具有足够的代表性,实际地下情况会复杂得多,很多情况下,应用效果并不是十分理想,是否可以通过深度学习,收集足够多的实测数据,进行大规模训练,建立针对性强的神经网络模型,应用效果可能会更好。第二,出于经济原因,单一性方法勘探迫不得已,但是否能够通过一次勘探,根据理论模型、机器学习算法,反演出多种物理参数,利用深度学习网络,进行多特征参数的自动识别,减少人工干预,提高解释精度,当然这需要理论的进步和发展。同时,我们也应该清醒的认识到,人工智能技术不是万能的。受制于仪器的精度和野外生产的诸多因素,采集的数据质量较差,如果不加甄别的使用,以此训练出的模型,用做识别和判断会出问题。

总之,在人工智能的时代,地球物理学将会焕发出新的活力,在地球物理学理论创新缺乏的背景下,这将是新的创新源泉和动力。

参考资料:

[1]王克海,鲁冠亚,张盼盼.基于机器学习的中小跨径公路梁桥抗震设计评价方法研究[J].公路交通科技,2019,36(02):74-84.

[2]安鹏,曹丹平.基于深度学习的测井岩性识别方法研究与应用[J].地球物理学进展,2018,33(03):1029-1034.

[3]Christian Szegedy,et al.Rethinking the Inception Architecture for Computer Vision[DB/OL].https://arxiv.org/abs/1512.00567,2015-12.

[4]Kaiming He,et al.Deep Residual Learning for Image Recognition[DB/OL].https://arxiv.org/abs/1512.03385,2015-12.

[5]Karen Simonyan,et al.Very Deep Convolutional Networks For Large-Scale Image Recognition[DB/OL].https://arxiv.org/abs/1409.1556,2014-09.

[6]Gao Huang,et al.Densely Connected Convolutional Networks[DB/OL].https://arxiv.org/abs/1608.06993,2016-08.

[7]Barret Zoph,et al.Learning Transferable Architectures for Scalable Image Recognition[DB/OL].https://arxiv.org/abs/1707.07012,2017-07.

[8]朱永盛,于舟.重力数据处理方法在寻找油气田中的应用[J].青岛海洋大学学报,1994(01):93-101.

[9]刘艳丽.高精度磁法数据处理在地质找矿中的应用[J].科学技术创新,2018(03):27-28.

[10]彭伟,梁义强,张淳,刘鹏鹏.Cole-Cole模型参数在时间域激电找矿中的应用[J].物探与化探,2018,42(03):513-517.

[11]赵明,陈石,Dave Yuen.基于深度学习卷积神经网络的地震波形自动分类与识别[J].地球物理学报,2019,62(01):374-382.

[12]甘宇,何沂,逯宇佳,吕雪松.基于机器学习的孔隙度预测方法研究[J].油气地球物理,2018,16(03):54-57.

论文作者:彭伟

论文发表刊物:《基层建设》2019年第21期

论文发表时间:2019/10/16

标签:;  ;  ;  ;  ;  ;  ;  ;  

人工智能在地球物理领域中的应用情况及展望论文_彭伟
下载Doc文档

猜你喜欢