多源地名地址组织与整合服务
  • 作者:瑞恩网络科技
  • 发表时间:2021-06-01 12:59
  • 来源:未知

(1)地名地址数据关联服务
地名地址数据在关联过程中,需要解决的主要问题包括空间位置数据如何确定关联原则和建立关联关系。根据关联方法的不同可以分为:地名与地址、POI关联、地址与POI关联。
地名与地址的关联过程可以分为三部分:时间序列判断、名称相似度判断、几何位置临近性判断。


根据对地址与POI关联性的分析可知地址与POI之间存在较为薄弱的引用联系,POI中的地址描述具有不规范的特点,可以根据地址数据库中的数据为其提供相对规范和推荐的数据,丰富POI的数据内容。



(2)多源地名地址信息融合
利用机器学习模型进行文本中的地名、地址和兴趣点相关要素的信息识别、语义消歧和时空匹配,并形成规范化的数据表达形式与其他地名地址信息库进行集成。从非结构化信息资源中进行地名地址数据挖掘,与测绘地理信息和地名普查具有明显的优势互补,将形成一种新型的地名数据加工、处理、更新与服务手段。
多源的信息来源会在数据精度、文本描述、类别分类等数据项上存在差异,为保证入库数据的唯一性,需要对多源数据中的重复、相近内容进行合并、统一。对于地名地址数据的描述主要通过文本描述与空间位置进行表述,因此对多源地名地址数据的融合主要借助文本相似性与空间相似性的相关技术执行。通过依次判别不同来源地名地址的文本相似性与空间相似性,将同一地名地址的不同表述信息进行统一,实现多源地名地址数据融合统一。
(3)地名地址数据更新
地名更新:地名描述的地理实体在其生命周期内,会经过出现、变更、消亡不同的阶段。若仅从单个地理实体变化的角度出发,那么描述它的地名信息会发生三种变化:增加地名、更新地名、注销地名,其中地名更新又可以分为三种:仅更新地名名称信息、仅更新地名几何位置信息、更新名称和几何位置信息。而在现实世界中,地理实体的变化往往涉及到两个及两个以上的地理实体,那么描述它们的地名信息会发生复合式的变化。这种变化最基本的类型有以下四种:合并、并入、分割、分裂,其中合并和并入的主要区别在于:合并后生产新的地名,而并入后保留原地名之一作为新地名的标志,分割和分裂的主要区别在与:分割后保留原地名,而分裂后生成全新的地名。 单一地名信息的变化不会影响到其他地名的信息,而与之关联的地址和POI信息则需要同步变更。
地址更新:地址数据更新主要包括地址数据的增加、更新和删除,每种操作对应的关联关系更新方法不同。根据上文的分析,地址依赖于地名且为POI提供参考信息。
POI更新:POI通常分布在地名表示的空间范围内,部分依赖于地名信息,而且可以借鉴地址的详细描述作为参考信息。POI的更新操作主要包括:POI的增加、 POI的更新、POI的删除。其中,增加一个POI时,可以根据上文设计的关联方法建立POI和地名、地址之间的关联关系即可,不会对现有的数据造成影响。在POI数据的描述中,包括POI名称、地址、POI坐标、分类等其他属性。POI数据的更新可以分为两类:非几何属性的更新、几何位置的更新。