您好,欢迎来到筏尚旅游网。
搜索
您的当前位置:首页面向自然资源多源异构数据时空信息智能同化的方法及系统[发明专利]

面向自然资源多源异构数据时空信息智能同化的方法及系统[发明专利]

来源:筏尚旅游网
(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 CN 111680025 A(43)申请公布日 2020.09.18

(21)申请号 202010556735.8(22)申请日 2020.06.17

(71)申请人 珠海市测绘院

地址 519000 广东省珠海市香洲区九州大

道中2002号国土资源局2号楼203办公室

申请人 上海刻羽信息科技有限公司(72)发明人 李旺民 贠法长 何福久 李进禄 

黎彬 马德富 丁建勋 高春辉 冯琰 路志越 何冰 (74)专利代理机构 广州三环专利商标代理有限

公司 44202

代理人 侯丽燕(51)Int.Cl.

G06F 16/21(2019.01)

权利要求书3页 说明书10页 附图4页

G06F 16/29(2019.01)G06F 16/26(2019.01)G06F 16/23(2019.01)

CN 111680025 A()发明名称

面向自然资源多源异构数据时空信息智能同化的方法及系统(57)摘要

本发明公开了面向自然资源多源异构数据时空信息的智能同化方法及系统,方法包括:S1,数据格式检查及解析;S2,空间数据识别;S3,关

S5,建立索引。本发明键信息抽取;S4,结果展示;

将现有技术中自然资源涉及面广,数据信息分散且复杂,数据标准不一,内容表达深度各异,数据之间缺乏联系及测绘业务规则不统一且多变,跨平台、复杂多源异构数据处理自动化程度低的问题得以解决,还改善了测绘生产技术形态落后,测绘服务规格不统一,数据产品与需求脱节、存在重复测绘、大数据挖掘难,协同服务困难和自然资源体系下业务化测绘地理信息服务类型多、信息流复杂等问题,进而为高效能按需测绘地理信息技术提供了支撑与服务。

CN 111680025 A

权 利 要 求 书

1/3页

1.面向自然资源多源异构数据时空信息的智能同化方法,其特征在于,包括:S1,数据格式检查及解析,通过定制数据格式解析服务程序,并通过调用对应的数据格式解析服务程序识别不同的录入数据文件的格式,对自然资源多源异构数据进行结构解析;

S2,空间数据识别,对解析后的数据,通过对比标准属性库模板判断其属性信息的含义,并检验空间图形数据的坐标参考以及图形拓扑关系,并将不同坐标参考下的数据信息统一归算到指定坐标参考下;

S3,关键信息抽取,根据空间数据识别单元的识别结果,对其中的几何图形信息和属性信息进行匹配和筛选;

S4,结果展示,根据信息提取单元提取的包含时间、空间在内的多个维度的信息流建立数据模型库进行数据结构层次的展示;

S5,建立索引,把目标检索模型和检索结果的相关对象及其抽象的语义关系转换成具体的数据和图形,显示在二维或者三维可视化空间中,实现对结果的快速索引和信息表达。

2.如权利要求1所述的面向自然资源多源异构数据时空信息的智能同化方法,其特征在于,还包括对模型库中的信息流的动态更新,对模型库中的信息流的动态更新方法包括:首先以新旧要素的匹配特征为切入点,通过采用GEO.AI技术中的神经决策树的方法实现更新信息的识别及快速发现,然后再通过基于格网划分的变化信息快速定位方法,对新旧数据中的空间信息和属性信息变化进行快速而准确的定位,最后对数据模板与数据库同步更新。

3.如权利要求2所述的面向自然资源多源异构数据时空信息的智能同化方法,其特征在于,所述以新旧要素的匹配特征为切入点,通过采用GEO.AI技术中的神经决策树实现更新信息的识别及快速发现的方法具体包括步骤:

(a1)选取已实现更新信息检测的对象组合作为训练样本;(a2)计算训练样本的变化特征;(a3)把变化特征参数作为输入层,变化分类信息作为输出层,进行神经网络训练,并验证神经网络模型的准确性与可靠性,以获得神经网络模型的阈值与权重矩阵;

(a4)对更新数据与原数据进行空间叠加操作,获取候选的测试更新对象组合,并计算其变化特征参数;

(a5)把变化特征参数作为输入量,使用步骤(a3)中建立的神经网络模型进行更新信息的模式判别,以获取更新信息的分类结果。

4.如权利要求2所述的面向自然资源多源异构数据时空信息的智能同化方法,其特征在于,通过基于格网划分的变化信息快速定位的具体方法包括步骤:

(b1)通过检测确保新旧数据是同一比例尺及采用同一坐标系,分别对新旧数据增加特征点坐标属性字段及存储要素属性汇总信息的属性字段;

(b2)分别对新旧数据进行全局查询,计算要素特征点坐标、要素属性汇总信息、并确定新旧数据对比的范围,特征点坐标代表要素所处的位置,点要素直接取其坐标,线要素取其中点,面要素取其质心,要素属性汇总信息是将要素属性字段的字段值按字段名的字符串匹配排序进行拼接,每个字段值之间用特殊符号分隔;

(b3)将变化检测范围按统一的宽度和高度划分为m×n个规则的格网,格网的宽度根据

2

CN 111680025 A

权 利 要 求 书

2/3页

检测范围和要素总数自动确定,格网的宽度记为Gwidth,高度记为Ghight,根据格网的总数定义数组变量来存储格网中要素的汇总信息;

(b4)分别对新旧数据按特征点坐标进行排序查询,并按特征点坐标将要素匹配到相应的格网,线要素和面要素的几何值信息为要素的弧段长度,点要素不需要累加几何值信息;

(b5)对新旧数据中编号相同网格中的特征点X坐标、特征点Y坐标、弧段长度、属性值拼接字符串进行对比。

5.如权利要求2所述的面向自然资源多源异构数据时空信息的智能同化方法,其特征在于,对数据模板与数据库同步更新的方法,具体包括根据空间地理信息数据自身的数据库格式特点,通过分析其数据模板中的数据字典,与+Oracle数据库数据字典进行匹配,分析关键数据内容的结构变化,通过仲裁将模板中变化的数据格式写入oracle数据库,使成果模板和数据库同步更新。

6.如权利要求2所述的面向自然资源多源异构数据时空信息的同化方法,其特征在于,还包括对数据时空信息的全流程服务协同与共享,具体的协同与共享方法包括:基于平台体系化标准数据,按时间、区域、业务类型、管理阶段四个维度建立自然资源测绘全过程服务协同管理的信息流概念模型,通过该信息流概念模型将数据、信息及服务实现一整套的协同管理,通过建立数据共享仓库与服务共享仓库,对非结构化数据、结构化数据以及标准化服务进行信息整合,建立数据与服务的索引信息数据库以及权限管理数据库,用于协同和共享,信息流概念模型对结构化数据与非结构化数据进行了分类定义,套用模型定义可以自动识别数据本身的结构化程度与组成形式,对于结构化数据,信息流概念模型将自动识别数据结构进行数据仓库模板定制;对于非结构化数据,信息流概念模型将数据进行压缩、关键信息抽取、建立索引几个环节,完成非结构化数据的数据仓库模板建立;对于标准化数据服务,信息流概念模型将分配不同的标准化空间数据服务管理模板,完成数据服务共享仓库的自动化建立,通过服务的动态更新对数据服务仓库实现灵活更新,最终形成动态的数据共享平台。

7.面向自然资源多源异构数据时空信息的智能同化系统,其特征在于,所述系统包括:数据结构解析单元,用于定制数据格式解析服务程序,并通过调用对应的数据格式解析服务程序识别不同的录入数据文件的格式并进行实时解析;

空间数据识别单元,对解析后的数据,通过对比标准属性库模板判断其属性信息的含义,并检验空间图形数据的坐标参考以及图形拓扑关系,并将不同坐标参考下的数据信息统一归算到指定坐标参考下;

信息提取单元,用于根据空间数据识别单元的识别结果,对其中的几何图形信息和属性信息进行匹配和筛选;

时空数据多层次模型库建立单元,将信息提取单元提取的包含时间、空间在内的多个维度的信息流在模型库中进行数据结构层次展示;

数据转换单元,用于把目标检索模型和检索结果的相关对象及其抽象的语义关系转换成具体的数据和图形,显示在二维或者三维可视化空间中,实现对结果的快速索引和信息表达。

8.如权利要求7所述的面向自然资源多源异构数据时空信息智能同化系统,其特征在于,不同的录入数据文件包括ARCGIS格式、MapGIS格式、.edb格式、Excel格式、.txt格式的

3

CN 111680025 A

权 利 要 求 书

3/3页

数据文件。

4

CN 111680025 A

说 明 书

1/10页

面向自然资源多源异构数据时空信息智能同化的方法及系统

技术领域

[0001]本申请涉及测绘地理信息技术领域,尤其涉及面向自然资源多源异构数据时空信息智能同化的方法及系统。

背景技术[0002]测绘地理信息可支撑自然资源统一管理的科学高效开展。然而,自然资源涉及面广,数据信息分散且复杂,数据标准不一,内容表达深度各异,数据之间缺乏联系;同时,测绘业务规则不统一且多变,跨平台、复杂多源异构数据处理自动化程度低,测绘生产技术形态落后;测绘服务规格不统一,数据产品与需求脱节、存在重复测绘、大数据挖掘难,协同服务困难;自然资源体系下业务化测绘地理信息服务类型多、信息流复杂。当前地理信息生产和服务模式难以满足精准、高效、多样化的自然资源统一管理服务发展需求。发明内容

[0003]本发明提供了一种面向自然资源多源异构数据时空信息智能同化系统及方法,用以满足科学高效的自然资源统一管理需求,解决现有技术中自然资源涉及面广,数据信息分散且复杂,数据标准不一,内容表达深度各异,数据之间缺乏联系及测绘业务规则不统一且多变,跨平台、复杂多源异构数据处理自动化程度低的问题,还用于解决测绘生产技术形态落后,测绘服务规格不统一,数据产品与需求脱节、存在重复测绘、大数据挖掘难,协同服务困难和自然资源体系下业务化测绘地理信息服务类型多、信息流复杂等问题,进而为高效能按需测绘地理信息技术提供支撑与服务。[0004]其具体的技术方案如下:

[0005]面向自然资源多源异构数据时空信息的智能同化方法,其特征在于,包括:[0006]S1,数据格式检查及解析,通过定制数据格式解析服务程序,并通过调用对应的数据格式解析服务程序识别不同的录入数据文件的格式,对自然资源多源异构数据进行结构解析;

[0007]S2,空间数据识别,对解析后的数据,通过对比标准属性库模板判断其属性信息的含义,并检验空间图形数据的坐标参考以及图形拓扑关系,并将不同坐标参考下的数据信息统一归算到指定坐标参考下;[0008]S3,关键信息抽取,根据空间数据识别单元的识别结果,对其中的几何图形信息和属性信息进行匹配和筛选;[0009]S4,结果展示,根据信息提取单元提取的包含时间、空间在内的多个维度的信息流建立数据模型库进行数据结构层次的展示;[0010]S5,建立索引,把目标检索模型和检索结果的相关对象及其抽象的语义关系转换成具体的数据和图形,显示在二维或者三维可视化空间中,实现对结果的快速索引和信息表达。

[0011]面向自然资源多源异构数据时空信息的智能同化方法,还包括对模型库中的信息

5

CN 111680025 A

说 明 书

2/10页

流的动态更新,对模型库中的信息流的动态更新方法包括:首先以新旧要素的匹配特征为切入点,通过采用GEO.AI技术中的神经决策树的方法实现更新信息的识别及快速发现,然后再通过基于格网划分的变化信息快速定位方法,对新旧数据中的空间信息和属性信息变化进行快速而准确的定位,最后对数据模板与数据库同步更新。[0012]进一步地,所述以新旧要素的匹配特征为切入点,通过采用GEO.AI技术中的神经决策树实现更新信息的识别及快速发现的方法具体包括步骤:[0013](a1)选取已实现更新信息检测的对象组合作为训练样本;[0014](a2)计算训练样本的变化特征;[0015](a3)把变化特征参数作为输入层,变化分类信息作为输出层,进行神经网络训练,并验证神经网络模型的准确性与可靠性,以获得神经网络模型的阈值与权重矩阵;[0016](a4)对更新数据与原数据进行空间叠加操作,获取候选的测试更新对象组合,并计算其变化特征参数;[0017](a5)把变化特征参数作为输入量,使用步骤(a3)中建立的神经网络模型进行更新信息的模式判别,以获取更新信息的分类结果。[0018]进一步地,通过基于格网划分的变化信息快速定位的具体方法包括步骤:[0019](b1)通过检测确保新旧数据是同一比例尺及采用同一坐标系,分别对新旧数据增加特征点坐标属性字段及存储要素属性汇总信息的属性字段;[0020](b2)分别对新旧数据进行全局查询,计算要素特征点坐标、要素属性汇总信息、并确定新旧数据对比的范围,特征点坐标代表要素所处的位置,点要素直接取其坐标,线要素取其中点,面要素取其质心,要素属性汇总信息是将要素属性字段的字段值按字段名的字符串匹配排序进行拼接,每个字段值之间用特殊符号分隔;[0021](b3)将变化检测范围按统一的宽度和高度划分为m×n个规则的格网,格网的宽度根据检测范围和要素总数自动确定,格网的宽度记为Gwidth,高度记为Ghight,根据格网的总数定义数组变量来存储格网中要素的汇总信息;[0022](b4)分别对新旧数据按特征点坐标进行排序查询,并按特征点坐标将要素匹配到相应的格网,线要素和面要素的几何值信息为要素的弧段长度,点要素不需要累加几何值信息;[0023](b5)对新旧数据中编号相同网格中的特征点X坐标、特征点Y坐标、弧段长度、属性值拼接字符串进行对比。[0024]进一步地,面向自然资源多源异构数据时空信息的智能同化方法,还包括对数据模板与数据库同步更新的方法,具体包括根据空间地理信息数据自身的数据库格式特点,通过分析其数据模板中的数据字典,与+Oracle数据库数据字典进行匹配,分析关键数据内容的结构变化,通过仲裁将模板中变化的数据格式写入oracle数据库,使成果模板和数据库同步更新。

[0025]进一步地,所述的面向自然资源多源异构数据时空信息的同化方法,还包括对数据时空信息的全流程服务协同与共享,具体的协同与共享方法包括:基于平台体系化标准数据,按时间、区域、业务类型、管理阶段四个维度建立自然资源测绘全过程服务协同管理的信息流概念模型,通过该信息流概念模型将数据、信息及服务实现一整套的协同管理,通过建立数据共享仓库与服务共享仓库,对非结构化数据、结构化数据以及标准化服务进行

6

CN 111680025 A

说 明 书

3/10页

信息整合,建立数据与服务的索引信息数据库以及权限管理数据库,用于协同和共享;信息流概念模型对结构化数据与非结构化数据进行了分类定义,套用模型定义可以自动识别数据本身的结构化程度与组成形式;对于结构化数据,信息流概念模型将自动识别数据结构进行数据仓库模板定制;对于非结构化数据,信息流概念模型将数据进行压缩、关键信息抽取、建立索引几个环节,完成非结构化数据的数据仓库模板建立;对于标准化数据服务,信息流概念模型将分配不同的标准化空间数据服务管理模板,完成数据服务共享仓库的自动化建立,通过服务的动态更新对数据服务仓库实现灵活更新,最终形成动态的数据共享平台。

[0026]面向自然资源多源异构数据时空信息的智能同化系统,其特征在于,所述系统包括:

[0027]数据结构解析单元,用于定制数据格式解析服务程序,并通过调用对应的数据格式解析服务程序识别不同的录入数据文件的格式并进行实时解析;[0028]空间数据识别单元,对解析后的数据,通过对比标准属性库模板判断其属性信息的含义,并检验空间图形数据的坐标参考以及图形拓扑关系,并将不同坐标参考下的数据信息统一归算到指定坐标参考下;[0029]信息提取单元,用于根据空间数据识别单元的识别结果,对其中的几何图形信息和属性信息进行匹配和筛选;

[0030]时空数据多层次模型库,将信息提取单元提取的包含时间、空间在内的多个维度的信息流在模型库中进行数据结构层次展示;[0031]信息表达和转换单元,用于把目标检索模型和检索结果的相关对象及其抽象的语义关系转换成具体的数据和图形,显示在二维或者三维可视化空间中,实现对结果的快速索引和信息表达。[0032]进一步地,不同的录入数据文件包括ARCGIS格式、MapGIS格式、.edb格式、Excel格式、.txt格式的数据文件。[0033]有益效果:本发明将现有技术中自然资源涉及面广,数据信息分散且复杂,数据标准不一,内容表达深度各异,数据之间缺乏联系及测绘业务规则不统一且多变,跨平台、复杂多源异构数据处理自动化程度低的问题得以解决,还改善了测绘生产技术形态落后,测绘服务规格不统一,数据产品与需求脱节、存在重复测绘、大数据挖掘难,协同服务困难和自然资源体系下业务化测绘地理信息服务类型多、信息流复杂等问题,进而为高效能按需测绘地理信息技术提供了支撑与服务。

附图说明

[0034]图1为本发明的方法流程结构示意图;

[0035]图2为本发明的空间地理数据信息的匹配原理图;

[0036]图3为本发明的多层次时空数据模型建立的基本原理;[0037]图4为本发明空间地理信息结构化的基本原理;[0038]图5为本发明具体应用的自然资源数据转换流程。

7

CN 111680025 A

说 明 书

4/10页

具体实施方式

[0039]下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解,本发明实施例以及实施例中的具体技术特征只是对本发明技术方案的说明,而不是限定,在不冲突的情况下,本发明实施例以及实施例中的具体技术特征可以相互组合。[0040]如图1所示,面向自然资源多源异构数据时空信息的智能同化方法,包括:[0041]S1,数据格式检查及解析,通过定制数据格式解析服务程序,并通过调用对应的数据格式解析服务程序识别不同的录入数据文件的格式,对自然资源多源异构数据进行结构解析;

[0042]自然资源多源空间数据是指面向自然资源领域多数据来源、多数据格式、多时空数据、多比例尺、多语义的数据,从狭义上说主要是指数据格式的多样性,包括不同数据源的不同格式及不同数据结构导致的数据存储格式的差异。异构性一般体现在系统异构、结构异构、语法异构和语义异构上,可以从系统异构、结构异构、语法异构和语义异构上进行分析。目前自然资源相关业务数据包含ARCGIS格式(Mxd、shp、mdb、GDB等)、MapGIS格式、.edb格式、Excel格式、.txt格式等多种格式类型,其各自数据结构、所示含义、业务用途以及数据标准均有不同,因而这些数据的标准化同化和整合,将成为其未来统一管理以及提供共享服务的基础。

[0043]自然资源空间数据识别主要是针对解析后的数据。[0044]S2,空间数据识别,对解析后的数据,通过对比标准属性库模板判断其属性信息的含义,并检验空间图形数据的坐标参考以及图形拓扑关系,并将不同坐标参考下的数据信息统一归算到指定坐标参考下;[0045]S3,关键信息抽取,根据空间数据识别单元的识别结果,对其中的几何图形信息和属性信息进行匹配和筛选;

[0046]自然资源多源异构空间数据信息筛选策略主要是提升对信息的提取的优化程度,其结果将直接影响数据同化的最终速度和效果。针对原数据与目标数据的多种对应关系,信息提取策略将用来对地理要素的相关属性、几何对象(表达要素的几何图形)及要素间的拓扑关系进行识别、匹配并转化,通过将要素属性、几何对象以要素为单位统一组织,最终转化为可统一表达的关键自然资源地理信息,匹配原理如图2所示。[0047]信息提取策略中要素的存储是通过将要素对应的几何对象分解为最基本的点、线、面,即基本几何对象,并配合其坐标位置来实现。拓扑关系的构建是利用同一几何对象可能被多个复合几何对象(由多个基本几何对象构成)所共用的特征,通过搜寻复合几何对象是否共享某个相同的几何对象来实现。拓扑关系用于保证转换之后的要素间仍保持正确的关系。

[0048]建立自然资源多源异构空间数据信息提取策略,主要包含地理要素与要素属性的信息提取两个重要内容。[0049]<1>地理要素:自然资源多源异构空间数据中,地理要素作为数据同化的主要对象,它主要包含了属性、一般关系和空间关系等信息,是表达自然资源空间地理概念以及地理概念之间关系的有效手段,也是实现数据同化与信息抽取的一个技术重点。根据自然资源地理要素内容、性质及使用要求,可以将其进行分类,分别为控制点类要素、水系类要素、居民地及附属设施类要素、交通类要素、管线类要素、地貌类要素、植被与土质类要素等,以

8

CN 111680025 A

说 明 书

5/10页

及注记类要素。同一地理要素类中的某一地理要素,可能因为依比例尺表达与否,又分为不同的几何类型,通过点、线、面等几何要素进行分别表达。在建立地理要素对应关系时,应根据不同规定考虑几何对象匹配。[0050]<2>要素属性:自然资源多源异构数据的属性信息描述了数据的质量、数量以及附加信息特征,根据数据标准规定,可以将要素的属性进行自定义,包括属性项名称、属性字段类型、属性值字段宽度、属性字段值保留小数位数、属性项的取值是否为空及属性字段的取值方式。属性项名称表达该属性项为要素的哪一属性;属性字段类型表达属性项对应属性值的类型;属性值字段宽度表达属性项对应属性值的字符长度;属性字段值保留小数位数表示当属性项的字段类型为浮点型时,保留的小数位数;属性字段的取值方式表示属性项对应的属性值通过何种方式取得。数据转换的过程中,可能会存在单凭地理要素编码不能实现转换的情况,这就需要通过属性来加以限定,达到转换目的。[0051]建立自然资源多源异构空间数据信息提取策略,需要纳入数据同化结果分析原则,从要素类别、属性方面分析同化要素之间的差异,从而确定信息抽取策略。由于地理要素及其属性是转换的最主要内容,因此针对原始数据与目标数据的要素类别及属性间关系进行分析。

[0052]原始数据信息与最终信息之间的对应转换可分为以下2种情况:[0053]<1>原数据信息中包含最终不必要的信息,可不需要建立对应关系,或通过扩充最终要素信息的原则进行同化。

[00]<2>原数据信息包含目标必要抽取信息,则根据其不同的对应关系,进行以下3类转换:

[0055]①一对一关系。

[0056]直接通过对目标信息与原数据信息的编码建立关系,实现对应。[0057]②一对多关系。

[0058]通过几何类型关系和一般关系条件进行对应筛选,几何类型关系对应是指当指定要素在原数据信息与目标数据信息中存在要素同义但几何类型表达不同的情况,可通过要素的几何类型,将原数据信息的几何类型要素对应到正确类型的几何要素上。一般关系条件筛选指当要素编码不能单凭几何类型来区分时,通过增加限定条件,辅助实现原数据与目标数据的对应。条件就是语义所描述的地理现象在语法层面的差异。[0059]③多对一关系。

[0060]指的是原数据中的多个要素对应目标数据中的一个要素,可在目标数据中通过属性项(要素等级、编码等)来区分。

[0061]原数据信息与目标信息的属性对应分析

[0062]<1>要素在2种数据中属性值的取值类型一致时,可直接通过属性一对一建立对应关系。

[0063]<2>要素在2种数据中属性值取值类型不一致时,该情况可通过设计外属性值对应功能建立正确对应关系。[00]<3>特殊情况下,当要素关系为多对一时,转换之后需要给目标数据赋予正确的属性,通过外属性值中添加特殊条件来实现。

[0065]在对目标抽取信息与原数据信息分析的基础上,结合预处理结果,需要对地理要

9

CN 111680025 A

说 明 书

6/10页

素和要素属性设计映射关系对象表,用来存储目标数据与原数据中要素的对应关系。[0066]S4,结果展示,根据信息提取单元提取的包含时间、空间在内的多个维度的信息流建立数据模型库进行数据结构层次的展示;

[0067]自然资源多源异构数据经过信息提取之后,将形成包含时间、空间在内的多个维度的信息流,将该信息流在数据结构层次展示出来,需要建立自然资源时空数据多层次模型。这其中主要包括2个基本层次:信息的表达性可视化任务(taskV)、分析性可视化任务(taskA)。[0068]信息流的表达性可视化任务主要以多模态时空数据、信息和知识的高效表达与传递为基本目标,重点包括信息的离散-连续、动-静、真实感-抽象化的自适应表达,将不同特征下的信息流模型化、可读化、可视化。[0069]其形式化定义为:[0070]taskV=〈data,render〉。

[0071]自然资源数据信息流的表达性可视化任务主要是以数据为驱动,形成数据的可存储和可绘制机制。数据存储管理调度为处理层任务,以高效的数据I/O为目标;数据的可表达性为展示层任务,以高性能的数据表现与转化为目标。表达性可视化任务从数据处理层跃迁到数据展示层的过程是从数据到信息流再到可视化模型的过程。

[0072]分析性可视化任务旨在表达通过复杂计算分析所获取的多模态时空数据中所隐含的信息,突出数据中所包含的特征与关联关系,保持数据重构的完整性和可分析性特征。典型的应用包括实时计算与近实时模拟结果的动态可视化、空间格局与分布模式可视化、符号化与拓扑关系可视化等。其形式化定义为:[0073]taskA=〈data,model,render〉。

[0074]分析性可视化任务由数据和模型协同驱动,动态生成任务为处理层任务,以分析模拟计算为主,以在数据模型中叠加分析计算信息,从而实现信息完整转化以及可分析模型的动态构建为目标。分析性可视化任务从数据处理层跃迁到数据展示层的过程是数据到信息的过程,依赖的核心技术为分析模型计算。模型库建立原理流程如图3所示。[0075]S5,建立索引,把目标检索模型和检索结果的相关对象及其抽象的语义关系转换成具体的数据和图形,显示在二维或者三维可视化空间中,实现对结果的快速索引和信息表达。

[0076]自然资源数据信息流模型库主要是实现自然资源地理信息抽取与转化的主要任务,是基于地理命名实体识别(Geo-NER)、地理命名实体消歧(Geo-Disambiguation)和地理空间求焦(Geo-Focusing),建立信息流模型中的关键数据索引,从而实现关键信息的抽取和转换。

[0077]自然资源数据信息流模型库索引的建立,通过对抽象的数据信息流模型库进行交互式的可视化表达以增强感知,最小化认知负担,是提高信息流模型库索引性能与效果的主流方法。信息的可读性结合信息索引的需求,它可以把目标检索模型和检索结果等相关对象及其抽象的语义关系转换成具体的数据和图形,显示在二维或者三维可视化空间中,实现对结果的快速索引和信息表达。数据转换将原始信息流模型库中的信息进行分类构造,通过结构化、对象化、语义化,表达出自然资源数据信息流中的语义和目标数据间的关系;定义符合任务的可视化空间结构,结构化的数据对象映射到可视化空间;视图变换通过

10

CN 111680025 A

说 明 书

7/10页

调整位置、比例尺、过滤等图形参数创建可视化空间下的实际视图。对于具体的地理信息同化任务,地理信息抽取就是数据结构化过程,空间地理信息结构化的基本原理图如图4所示。

[0078]面向自然资源多源异构数据时空信息的智能同化方法,还包括对模型库中的信息流的动态更新,对模型库中的信息流的动态更新方法包括:首先以新旧要素的匹配特征为切入点,通过采用GEO.AI技术中的神经决策树的方法实现更新信息的识别及快速发现,然后再通过基于格网划分的变化信息快速定位方法,对新旧数据中的空间信息和属性信息变化进行快速而准确的定位,最后对数据模板与数据库同步更新。[0079]进一步地,所述以新旧要素的匹配特征为切入点,通过采用GEO.AI技术中的神经决策树实现更新信息的识别及快速发现的方法具体包括步骤:[0080](a1)选取已实现更新信息检测的对象组合作为训练样本;[0081](a2)计算训练样本的变化特征;[0082](a3)把变化特征参数作为输入层,变化分类信息作为输出层,进行神经网络训练,并验证神经网络模型的准确性与可靠性,以获得神经网络模型的阈值与权重矩阵;[0083](a4)对更新数据与原数据进行空间叠加操作,获取候选的测试更新对象组合,并计算其变化特征参数;[0084](a5)把变化特征参数作为输入量,使用步骤(a3)中建立的神经网络模型进行更新信息的模式判别,以获取更新信息的分类结果。[0085]进一步地,通过基于格网划分的变化信息快速定位的具体方法包括步骤:[0086](b1)通过检测确保新旧数据是同一比例尺及采用同一坐标系,分别对新旧数据增加特征点坐标属性字段及存储要素属性汇总信息的属性字段;[0087](b2)分别对新旧数据进行全局查询,计算要素特征点坐标、要素属性汇总信息、并确定新旧数据对比的范围,特征点坐标代表要素所处的位置,点要素直接取其坐标,线要素取其中点,面要素取其质心,要素属性汇总信息是将要素属性字段的字段值按字段名的字符串匹配排序进行拼接,每个字段值之间用特殊符号分隔;[0088](b3)将变化检测范围按统一的宽度和高度划分为m×n个规则的格网,格网的宽度根据检测范围和要素总数自动确定,格网的宽度记为Gwidth,高度记为Ghight,根据格网的总数定义数组变量来存储格网中要素的汇总信息;[00](b4)分别对新旧数据按特征点坐标进行排序查询,并按特征点坐标将要素匹配到相应的格网,线要素和面要素的几何值信息为要素的弧段长度,点要素不需要累加几何值信息;[0090](b5)对新旧数据中编号相同网格中的特征点X坐标、特征点Y坐标、弧段长度、属性值拼接字符串进行对比。

[0091]变化要素的发现方法是在目标数据中搜索出与源数据的面积,弧段长度、方向、重心等空间特征与语义特征相同(差异小于阈值)的对象,当搜索结果为空时说明要素发生了变化。在做新旧要素逐一变化对比时,需要通过大量的空间查询,当数据范围较大时,花费时间较多。由于本方法已对查询空间进行了格网划分,且要素属性中记录了该要素的重心坐标,进行要素空间查询时通过属性过滤,只对要素所在格网内的要素进行,大大缩小了查询的范围,提高了查询的效率。

11

CN 111680025 A[0092]

说 明 书

8/10页

对于自然资源多源异构数据更新模板是根据以入库管理的数据字典建立的,数据

格式与业务规则发生变化,随之会出现成果模板发生细微改变,因此,本实施例采用了数据模板与数据库同步更新技术。对数据模板与数据库同步更新的方法,具体包括根据空间地理信息数据自身的数据库格式特点,通过分析其数据模板中的数据字典,与+Oracle数据库数据字典进行匹配,分析关键数据内容的结构变化,通过仲裁将模板中变化的数据格式写入oracle数据库,使成果模板和数据库同步更新。这样新旧成果数据格式兼容,快速响应业务的变化,避免因为数据格式的变化导致的系统性升级和修改,极大的降低了运维成本,提高数据管理的效率。

[0093]所述的面向自然资源多源异构数据时空信息的同化方法,还包括对数据时空信息的全流程服务协同与共享,具体的协同与共享方法包括:基于平台体系化标准数据,按时间、区域、业务类型、管理阶段四个维度建立自然资源测绘全过程服务协同管理的信息流概念模型:

[0094]{Process:(规划设计管理,自然资源审批管理…规划审批管理,规划监督管理,不动产确权登记管理);[0095]Service type:(建设用地,建筑工程…市政工程,耕地保护);[0096]Region:(区域1,区域2,…,区域8);[0097]Time:(年,月,季,日)}。

[0098]融合采用商业智能(Geo.BI)技术,将测绘地理信息与生产、管理、服务、监督信息高效整合为专题数据仓库,组建了以基准→生产→管理→服务为主线的工作流,打通了业务服务上下游,形成以管理节点为标识的服务数据链,实现了时间、空间、业务类型、管理阶段度的信息流和工作流整合。融合采用联机分析处理(OLAP)、人工智能(Geo.AI)等技术,对专题数据仓库数据进行收集与整理,形成训练数据,以规划监督测绘成果中的空间、特征值、指标信息、建设单位信息、管理阶段信息、监督信息等属性为结点,通过机器学习构造并持续优化决策树算法模型,进一步进行知识挖掘,预判高发违建行为并进行重点监管。解决了全业务信息共享与全过程动态监督难题,实现了不需人工干预的全流程服务协同。[0099]通过信息流概念模型将数据、信息及服务实现一整套的协同管理,通过建立数据共享仓库与服务共享仓库,对非结构化数据、结构化数据以及标准化服务进行信息整合,建立数据与服务的索引信息数据库以及权限管理数据库,用于协同和共享。信息流概念模型对结构化数据与非结构化数据进行了分类定义,套用模型定义可以自动识别数据本身的结构化程度与组成形式。对于结构化数据,信息流概念模型将自动识别数据结构进行数据仓库模板定制;对于非结构化数据,信息流概念模型将数据进行压缩、关键信息抽取、建立索引几个环节,完成非结构化数据的数据仓库模板建立;对于标准化数据服务,信息流概念模型将分配不同的标准化空间数据服务管理模板,完成数据服务共享仓库的自动化建立,通过服务的动态更新对数据服务仓库实现灵活更新,最终形成动态的数据共享平台。[0100]面向自然资源多源异构数据时空信息的智能同化系统,包括:[0101]数据结构解析单元,用于定制数据格式解析服务程序,并通过调用对应的数据格式解析服务程序识别不同的录入数据文件的格式并进行实时解析;[0102]空间数据识别单元,对解析后的数据,通过对比标准属性库模板判断其属性信息的含义,并检验空间图形数据的坐标参考以及图形拓扑关系,并将不同坐标参考下的数据

12

CN 111680025 A

说 明 书

9/10页

信息统一归算到指定坐标参考下;[0103]信息提取单元,用于根据空间数据识别单元的识别结果,对其中的几何图形信息和属性信息进行匹配和筛选;

[0104]时空数据多层次模型库,将信息提取单元提取的包含时间、空间在内的多个维度的信息流在模型库中进行数据结构层次展示;[0105]信息表达和转换单元,用于把目标检索模型和检索结果的相关对象及其抽象的语义关系转换成具体的数据和图形,显示在二维或者三维可视化空间中,实现对结果的快速索引和信息表达。

[0106]不同的录入数据文件包括ARCGIS格式、MapGIS格式、.edb格式、Excel格式、.txt格式的数据文件等。

[0107]面对信息分散、协同困难等信息化难题,本发明创新设计了面向自然资源统一管理的“纵向贯通、横向协同、集成测绘”的高效能按需测绘地理信息技术支撑及服务模式。纵向能够支撑国家、省、市、县四级自然资源管理部门实施自然资源分布集成、统一管理;横向实现了从建设项目信息协同、技术标准协同、工作流程协同、管理信息协同、平台服务协同等五方面对市县级自然资源管理职能的网络化、信息化、智能化协同服务;同时,实现了对传统测绘服务模式的升级重构,将原来按行业规范定制的测绘地理信息标准数据生产与服务,升级到精细化的专题数据产品和信息供给,并扩展到分布式协同共享相关管理属性信息及其所需的服务;将测绘生产工艺流程从传统标准化的专业测绘升级到专题要素信息的信息化采集、发现、挖掘、转换、整理以及标准化、模块化融合衍生;将服务方式从传统的离线数据提供升级为分布式存贮和计算、网络化共享与协同服务;通过超融合服务器集群,依托超融合架构的分布式技术和虚拟化技术,将分布在每个节点服务器上的本地存储、计算和网络资源虚拟化聚合为可横向扩展的逻辑资源池,对外提供统一的测绘地理信息服务。[0108]下面为应用上述方法和系统的两个应用实例:[0109](1)自然资源多源异构数据智能化信息抽取与展示[0110]基于WEBGIS的土地审批测绘信息服务平台项目中,Web制图系统主要用来测绘业务人员在线出图,在制图之前需要导入加载用地红线,绘制范围线所在区域底图。用地红线数据根据实际业务需求,通常包含.edb、.txt、.shp等多种数据格式与类型。系统应用智能同化手段,集中读取并解析各类数据内容,从中抽取了几何信息进行图形的重构,同时对应抽取了属性信息作为制图信息补充,从而快速有效的实现了自然资源多源异构数据的在线解析和加载,并实现了关键信息的抽取以及在地图上自动叠加显示与分析,通过空间分析结果自动找到对应图幅信息,为web端自动化制图提供了良好的辅助。[0111](2)自然资源多源异构数据格式与坐标智能转换[0112]鉴于在最新的自然资源数据生产和业务环节,某市自然资源局发文要求使用政务版国土基础数据进行用地报批审核并明确过渡期的具体要求,因而在平台应用建设当中政务版坐标转换成为了必不可少的内容。由于涉及到的业务数据种类复杂格式多样,想要将数据进行精确转换需要对数据进行解析、抽取、转换、重构,最终得到目标坐标系下数据。在本应用中基于自然资源多源异构数据智能同化方法,实现了各类数据的集中快速解析和关键信息抽取,将抽取出的信息流结果根据转换要求进行了储存与实时转换,最终将转换结构按照几何数据类型进行重构,得到目标坐标系下的数据结果。数据转换应用原理如图5所

13

CN 111680025 A

说 明 书

10/10页

示。

[0113]

尽管已描述了本申请的优选实施例,但本领域内的普通技术人员一旦得知了基本

创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改,包括采用特定符号、标记确定顶点等变更方式。[0114]显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

14

CN 111680025 A

说 明 书 附 图

1/4页

图1

15

CN 111680025 A

说 明 书 附 图

2/4页

图2

16

CN 111680025 A

说 明 书 附 图

3/4页

图3

图4

17

CN 111680025 A

说 明 书 附 图

4/4页

图5

18

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- efsc.cn 版权所有 赣ICP备2024042792号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务