📌

地质大数据功能分析及其分类算法研究

Classification

地学大数据

Type

博士论文

Magazine

博士论文

Author

王娜

Published

May 5, 2019

Rate

⭐⭐

Quick Note

📌

摘要

地学信息的攫取与放大研究

🍎

内容

机器学习和深度学习算法在地学研究中应用，主要使用的方法包括支持向量机、随机森林、k 最近邻、神经网络、贝叶斯等。

类对地质大数据进行研究的终极目标无非有两项，一是通过数据分析与挖掘，发现人类社会生产所需的矿产资源；二是依据地质大数据内部蕴含的地壳空间变异信息，实现对各种类型地质灾害的早期预警。

以地学信息技术应用为基础，以数学应用模型为计算手段，以地学数据复杂处理为任务，以精细化、智能化及三维可视化功能为目标的地学空间数据融合分析成果不断出现。

采用有监督的学习方法诸如支持向量机、k 最近邻、随机森林、梯度提升、朴素贝叶斯和集成学习分类器的计算方法，通过计算验证对比机器学习的分类效果与优选方案，给出上述计算结果的误差分析。

🍀

结论

基于神经网络的机器学习与深度学习方法在地质变量研究中的前景十分广阔，特别是地质大数据需要高性能计算，机器学习与深度学习对于大幅提高数据处理速度及图形分析质量具有不可替代的作用。

💡

方法

人类对地质大数据进行研究的终极目标无非有两项，一是通过数据分析与挖掘，发现人类社会生产所需的矿产资源；二是依据地质大数据内部蕴含的地壳空间变异信息，实现对各种类型地质灾害的早期预警。

分别采用深度神经网络、Elman 神经网络和 Jordan 神经网络三种方法计算，比较结果，以达到实施地球化学元素精准分类的目的。

信息转换功能—费希尔判别方法；程度度量功能—综合权模型；判别分类功能—贝叶斯判别方法；组合关联功能—典型相关方法和对应分析方法；结构优化功能—最小维数分析方法。

采用无监督的学习方法挖掘数据集潜在的结构，确定数据分类，并对样本数据进行类别标记，运用支持向量机、k 最近邻、随机森林、梯度提升、朴素贝叶斯和集成学习分类器的方法，建立分类模型。

📌

正文

云计算是一种基于互联网的公共参与计算模型，其计算资源是一种基于互联网的公共参与计算模型，是动态的、可扩展的、虚拟化的，并以服务的方式提供。

云计算的主要功能是：利用云计算的虚拟化技术和分布式存储技术，在互联网环境中构建“地质大数据网络资源集群。

地质大数据云计算执行功能

单学科数据计算
地质空间虚拟化技术
地质空间数据存储技术

在大数据时代，云计算是一项重要的支撑。云中的大数据有许多潜在的功能服务层，它们跨越了大量的节点、集群和层。大型数据平台集成需要虚拟化体系结构，一个全面的云数据虚拟化基础设施应该使用集成方法，来确保大数据的统一访问、建模、部署、优化和管理成为一种异构资源。

使用插值法、统计法等方法对缺失数据补齐；利用单元平均值对分布不均匀的数据进行网格处理等等。

地学信息数据是典型的多源数据，数据量大，结构复杂，且具有不确定性及不完整性的特点，因此无法人工处理。想从海量的数据中找到规律，构建模型，必须将地学数据分析方法与机器学习方法相结合。

🍎

系

🍀

数

💡

数据