首页 > 新闻中心 > 公司新闻

【解决方案】▏细说“数据治理”的故事

发布时间:2019.04.26 阅读量:


在生态文明体制改革的背景下,要求建立“山水林田湖草城”为生命共同体的发展模式,而要在建设管理层面实现这个目标,就需要将原来分散在各个部门的数据进行有效的梳理和融合,形成相互关联的、可治理的共生的自然资源与空间规划数据体系



数据治理三阶段


结合我们与多地的自然资源部门的交流及调研情况,我们认为数据治理可以分为三个阶段:


(数据治理三阶段示意图)





数据治理目标


从数据本身而言,在新形势下对数据的治理要求是建立科学、开放的数据资源体系。从数据资产管理、业务决策支持、持续运营提升三个方面进行拆解,具体可以分为以下五个层次:


(数据的治理目标)


从分割到整合:将原本各部门各自为战的业务数据打通。

从零散到融合:原来的规划是各个部门各自做规划,一套规划只管自己规划内的数据内容,而未来的空间规划是自顶向下,层层传导的,因此数据也需要相融合。

从冲突到协同:即识别出原来多套规划间的冲突,协同原有各类规划的规划目标导向和管控导向。

从断裂到连续:即串联起空间规划整体的业务条线,建立业务数据的空间关联,提供细粒度的精准管理支持。

从固化到活化:未来的数据是一个统一的数据体系,要能持续地运作。亦可以独立于业务存在,以服务的形式实现数据的运营及共享。



(自然资源业务环)


面向业务场景应用,数据治理可分为两个层次。

一是以国土空间规划编制支持为近期首要目标的空间规划数据治理。建立空间规划数据底板,以三调数据、自然资源确权登记数据为基础,完善国土空间规划数据资源体系,实现快速提取规划编制指标性信息,为相关业务的办理提供专题决策支持。

二是以面向未来全域空间规划体系的建立、支持空间用途管制与监测评估预警为系统全面目标的自然资源数据治理,通过分析业务流程中每个环节对数据的需求,建立体系化的、可持续更新的动态数据支撑体系和配套机制。




数据治理过程


在自然资源空间规划信息化整体解决方案(下)中,我们简单的介绍了数据治理的五大步骤,即:


(数据治理五大步骤)


为了更好地理解“合整评理治”这个过程,在这里,我们用烹饪的过程来对数据治理作生活化的解读。

就像,当我们要做一道“农家小炒肉”时……

(用烹饪解读数据治理,图片来源:“日食记及网络)


相信大家通过“农家小炒肉”的例子,对“合整评理治”这个过程已经有所了解了。回到数据治理本身,针对数据的“合整评理治”具体又是怎样的过程呢?



数据成果汇交

建立一个汇总处理机制,将自然资源包含的一系列数据进行汇总。提供跨网络跨数据库的数据汇交工具关联原始数据源,抽取所需数据并落到核心数据库。汇总后形成统一的数据集市,以服务的形式提供数据资源的共享。


转换规整

进行数据的初步规整工作,包括格式转换、统一坐标等。


自然资源空间规划数据体系编目

对现有数据进行梳理编目,具体包括现状数据、规划数据、管理数据和社会经济数据四大类。梳理后对每一个数据赋予唯一的数据地址,便于后续在体系内查找所需的数据。



数据标准化规范化

完善自然资源体系,以三调数据为基础,拓展补充实有数据、新兴互联网数据等,再统一建立数据的标准规范,同时提供软件和工具支持,在数据入库时完成标准化的检验工作,确保数据的完整性和规范性。


元数据体系建设

建立一套元数据的标准体系,包括基本数据描述、数据质量描述、数据分类描述、其他扩展描述等维度。利用元数据对数据进行描述,能让每一个使用数据的人都对数据的时间、空间、来源、格式等信息有清晰的认知和了解。


数据标签化

结合元数据标准,对数据进行标签化处理,即对数据内容形成画像。面向自然资源,我们梳理了元数据、感知数据、认知数据、空间治理数据四个方面的一系列的标签,构成数据标签体系。在此基础上,利用机器对现有数据进行自动化的检查,具体包括图文一致性、空间一致性、时间一致性、逻辑一致性的整理及冗余清洗


数据空间化

块数据的治理,即把原来条线分割的条数据变成空间块数据。把包括行政审批、资产登记、空间管控、社会管理、空间规划等方面的数据都落地到未来空间规划总体协同中,使数据能层次衔接,相互关联。



数据体系化评价分析

梳理数据评价专题,构建数据评价规则与模型,形成数据评价体系。对数据进行画像和聚焦,评估面向各个业务场景需要哪些数据做支撑。


数据应用反馈评价

以业务应用的数据支持要求为导向,收集不同角色用户的数据使用反馈,了解数据的使用情况及可能优化的方向,分析评价业务闭环中的数据支持度。


数据周期性体检

建立数据的周期体检机制,评价现有数据好不好用,完不完整,合不合理,科不科学。




梳理数据应用框架

面向业务梳理数据应用框架,捋清数据之间的关联、明确各类数据的治理的方向,形成数据应用清单。


指标模型体系构建

利用可视化数据模型定制工具,数据模型发布管理工具等将数据模型固化并落到系统中,来实现对模型的管理。目前我们梳理了包括双评价、审批、用途管制、监测评估预警等的空间规划分析数据模型体系。


专题数据推送

可视化空间BI工具实现数据的便捷展现,信息专用包实现各类数据模型的定向推送,为每个人每个业务场景推送所需的决策专题图集。



构建全方位数据运营机制

基于业务构建数据生命周期,建立可持续的全方位的数据运营机制。我们面向基础测绘数据管理、规划编制数据运作、决策支持模型运作、空间用途制数据关联、监测评估预警管理、数据对外共享制度设计等业务层面,形成了六大类数据运营管理机制,包括数据标准管理机制、数据目录管理机制、数据责任管理机制、数据汇交共享机制、数据评价反馈机制以及数据安全管理机制等。


建立业务数据双向互动机制

数据体系运作机制的核心最终是要落地至业务数据相关联的模型,通过关联模型建立业务和数据两者之间的双向互动机制,以数据为导向补全业务关键环节





数据治理核心支撑

  “知库”平台


“知库”平台,是以知识管理的理念定制并管理多个数据模型并统一以资源理念管理相应数据成果的信息平台。“知库”提供了对从原始数据,到专题组织的数据资源,到面向业务场景应用的决策支持服务资源等多个层次的数据治理工具,让各种类型的数据得以在任何层面上进行可控的、可追溯的融合、管理及运营


(搭建知识管理中间层


依托“知库”平台,我们通过数据治理模式,打破了传统的一个业务对应一个系统,形成一套数据的单一模式。通过中间层即知识体系的搭建,实现对多源数据库中的数据进行抽取梳理,构建核心的知识管理模型,对数据进行知识化管理,将业务办理过程中的非空间化的数据与空间进行关联等。在沉淀有价值的数据的同时,实现数据的有序且可持续化运作。



数据治理工具


就像烹饪过程中需要锅铲刀勺等工具来将原材料加工成美味佳肴一般,在数据治理的过程中,我们需要体系化的数据治理工具来实现数据的“加工过程”,具体包括数据的汇交、模型的定制、数据的智能展示及定向推送等。


数据汇交工具

实现跨数据、跨网络的多源数据汇交组织及共享。


时空数据流程引擎

实现可视化的数据模型定制,数据模型的发布、运行及管理。


可视化的空间BI工具

通过拖拉拽的形式,使数据能以多种图表的形式便捷的展现。


信息专用包工具

实现对各类信息专题的定向推送,为每个人每个业务场景提供精准的数据支持。


同时,我们也沉淀了多类数据空间化的工具,包括元数据、场数据、地理编码数据、块数据、对象数据等。通过将非空间数据落地到空间,能建立起空间数据与业务数据的关联。


(数据空间化工具分类




打造全新的知识管理信息化模式


我们提出未来的信息化模式,是全新的知识管理的信息化模式,具体是由“圆桌•知库”两大平台协同支撑。“圆桌”,是跨业务系统的消息共享协同平台。“知库”,是将数据通过模型进行知识化管理的平台。两大平台通过探针式地交互,由“知库”到“圆桌”,能将通过数据治理的细粒度的专题数据精准地推送到每一项业务的办理场景;由“圆桌”到“知库”,能将业务审批的数据实时抽取,通过数据模型的管理汇总更新到知识体系中。


(圆桌•知库平台探针式交互)


对应到信息化的技术架构,“知识引擎”层与“知识传达”层,即为“知库”平台的特有体现。

(信息技术架构图)


“知识引擎”,不仅是包含各类元数据、指标因子、数据模型、运算模型等的数据仓库,还能利用模型把知识体系内的多源数据进行有效关联。通过“知识引擎”对数据进行体系化的梳理,知识化的完善,能降低认知成本,减少传递偏差,提高知识传递效率,丰富知识体系,最终形成可学习的、持续性的认知升级模式。


(能主动学习的“知识引擎”)


“知识传达”,即通过“知库”中体系化的数据治理工具实现模型的可视化配置,专题数据的推送等;通过数据集市,以服务的形式实现数据资源的共享。


在此基础上,依托“圆桌”平台,以消息协同模式落地到应用平台,进而将数据推送到每项业务应用中。


预期效果


1

自然资源业务管理数据全覆盖


将使分散于各部门的数据实现互联互通,实现自然资源业务体系中包括选址、批地、供地、用地条件、方案、工程、核实验收等业务全生命周期的数据全覆盖及统一管理,为自然资源部门的业务应用、决策支持提供充分的数据支持。


2

全面体系化的信息大汇集


通过“知库”中数据治理工具的使用,使治理后形成的自然资源数据体系具有对多源、异构、多时相的信息进行汇集和处理及应用的能力,建立数据标准体系,实现数据资源的生产、存储、管理、更新及动态配置,以支撑各类业务场景的应用,为科学决策提供全面的数据支持。


3

知识专题化的数据大仓库


根据自然资源业务需求构建多维度的指标体系,同步建立可配置、可管理、可运营的数据模型,实现数据指标的动态检测和数据的可视化管控,形成知识专题的数据大仓库,按需将数据分发推送至各类业务场景中,以数据生态构建业务生态,解决业务最后一公里问题。


4

可持续运营的机制全支撑


建立自然资源全方位的数据运营机制,即面向基础测绘数据管理、规划编制数据运作、决策支持模型运作、空间用途制数据关联、监测评估预警管理、数据对外共享制度设计等维度构建数据的运营机制,充分发挥信息资源作用,现数据的长效运营,提高数据资源的利用率。


5

数据治理与业务工作共同推进


数据应用于业务才能体现出数据价值。通过建立业务与数据双向互动机制,实现业务数据双生长,以数据治理闭环来支持数据生态体系,以数据生态体系来支持自然资源全业务的生态圈


(业务数据双生长)



下集预告:面向空间规划编制的数据底板治理