背景
物探数据资源有别与其他油田数据,物探数据体量大、数据类型丰富,传统的管理模式无法满足日益提升的物探数据管理应用需求。
- 大量的数据资源分散存储在研究人员手上,不仅影响了数据共享,同时存在数据遗失的安全隐患;
- 企业精细化管理要求不断提升,专业人员缺少对物探资料的整体把握;
- 云计算、大数据等新的信息技术不断涌现,必须要建立可有效扩展的物探体数据管理应用模式。传统模式信息架构弹性不足,升级成本高昂,阻碍了新技术的应用。
这些问题对物探数据资源管理架构体系提出了新的需求。
数据本体
地学智慧湖仓的数据来自于多个不同的数据源,这些数据这些数据源采用的格式和标准不一致,尤其是空间参考标准,如空间坐标系统、投影方式、比例尺、空间网格大小等.需要数据提取工具从不同的数据源中提取数据,并且对这些数据进行必要的转换、标准化、集成,使其符合地学智慧湖仓的模型结构、空间标准核语义规范。
数据立方体
三维数据
当试图将大数据中的大地球数据具体化时,我们不可避免地会联想到“数字地球”的愿景,该愿景由当时的美国副总统戈尔在 1998 年提出。
为了确保更广泛地重用数据,实现跨多个领域的跨学科集成,以及实现程序化访问,数据集必须对来自不同社区的广泛用户可用且有价值 [ 3 ]。
与大多数数字技术一样,地震采集和处理工具默认考虑按照 Nyquist-Shannon 定理采样的信号;其中每个周期至少需要两个样本来恢复信号中感兴趣的最高频率分量。
NASA地球科学数据和信息系统 (ESDIS) 项目的软件工程师兼副项目经理珍妮·贝恩克 (Jeanne Behnke) 说:“我们试图从狂野的西部开始,让人们坚持三到四种格式。” 2017 年,其存档中拥有 24 PB 的数据,并向约 300 万用户分发了 13 亿个文件。Behnke 说,共享变得越来越容易。
NASA 正在推动元数据的标准化。ESDIS 采用了由国际标准化组织 (ISO) 制定的国际元数据标准,该标准规定了数据集应如何标记并建议使用关键字来描述它们。
EarthScope 数据将被存档和维护,以便随着新分析技术的开发,研究人员可以重新审视旧测量。“这些数据,”他说,“将在未来很长一段时间内被挖掘。”