📌
Data integration for earthquake disaster using real-world data
🦐
摘要- 实体解析 (ER) 的目的是识别从不同来源引用同一现实世界实体的记录。大多数传统的 ER 研究基于基于字符串的数据来识别记录,因此 ER 问题主要依赖于字符串比较技术。
🐙
研究内容- 世界各地的数据都达到了 PB 级别,能够高效挖掘和分析数据的技术引起了越来越多的关注。然而,在使用数据之前,首先要保证数据的可用性,这也使得数据管理问题成为一个重要的关注点。
- 主要问题是从许多数据库中匹配与现实世界中相同实体相关的记录,这在许多领域应用程序中变得越来越重要。这个问题被称为实体解析(Ayat et al.2014 年;埃尔玛加米德等人。2006 )、记录联动、去重和记录匹配。
- 实体解析通常用于提高数据质量和完整性(Ayat et al. 2012 ; Magnani and Montesi 2010),以重用现有数据源进行新研究并降低数据采集成本(Winkler 2004 ; Christen 2011)。