地质图空间数据库成果数据质量控制方法研究

2014-10-15 16:47:57    来源:中国地理信息产业协会

摘要:本文依托1:5万区域地质图空间数据库建设成果数据质量控制,通过总结和分析,系统阐述了空间数据库成果数据质量控制的基本理论与方法技术。

    在当前的“大数据”时代,数据是科学研究的基础。1∶5万区域地质图空间数据库建设开始于1998年,2000年起1∶5万区域地质图空间数据库在除上海外的各省(市、自治区)开始在各省进行试点性数据库建设,通过十多年的努力,1∶5万区域地质图空间数据库及元数据库建设基本完成[1]。质量是一切产品的生命,它反映的是产品乃至生产产品的过程的优劣程度[2]。数据质量的优劣除了将直接影响GIS应用分析结果的应用目标的实现[3],还直接影响到空间数据库所带来的经济效益和社会效益,影响到所有基于该空间数据库的应用、分析、决策的正确性和可靠性[4]。 缺少质量指标的GIS产品和其他产品一样,将无法得到用户的信任[5]。地质空间数据质量控制对地球科学和GIS空间信息技术的发展十分重要[6]。在工作推进过程中,形成了一套可行、有效和规范的空间数据库质量控制方法技术和质量控制体系,成熟的空间数据库建设工作流程,同时编制了一系列工具软件,用于检查、监控、验收、评价成果数据质量,保障1∶5万区域地质图空间数据库成果数据复核相关要求[7]


二、空间数据库质量控制问题分析

1. 质量控制标准

    质量控制标准是空间数据库建设的基础和首要任务。1:5万地质图空间数据库质量控制标准为《1:5万区域地质图空间数据库(分省)建设实施细则》、元数据建设标准《地质调查元数据标准DD 2006-05》、空间数据库属性代码汇编《1:5万区域地质图空间数据库标准 代码汇编》、《数字地质图空间数据库建设指南2.0》及相关行业标准[8]


2. 质量问题分析

    (1)建库流程分析

    空间数据的精度直接影响空间数据库的成果精度,这是建库工作的基础,也是从建库伊始直到建库结束贯彻其全过程,时刻需要注意的问题[9]。为了加强数字化生产质量监控和管理,确保数字化生产成果的质量,使1∶5万区域地质图空间数据库建设在统一规范的框架内正常有序的开展,提出了一套数据库建设工作流程。同时质量问题也伴随数据的采集、处理和应用过程而产生。

    (2)数据源质量问题

    完整、齐全而又有效的第一手资料是建立区域地质图空间数据库的前提,也是对区域地质空间数据进行空间分析的基础[10]。数据源一般为纸质折叠基础地质图,由于折叠和保存时间一般较长,导致图件产生畸变、破损,直接影响所采集信息的质量。

    (3)图形矢量化质量问题

    矢量化图形是建库的重要环节,在进行图形矢量化的过程中,由于采用的MAPGIS软件版本的不同、系统库的不统一等,图形参数产生质量问题,即使本省系统库也可能存在差别。同时在矢量化时,由于操作习惯和业务熟练程度不同,数字化图形的质量难以保证,空间位置的准确性无法满足。

    (4)图形校正质量问题

    在数字化的过程中,有的图元,经过简单校正,可以满足精度要求,有的图元误差较大,经过编辑和修改难以达到实际精度要求,影响建库的质量。

    (5)属性编辑质量问题

    属性数据和图形数据是空间数据的重要组成部分,属性数据是详细描述目标空间特征意外的目标特性[11-12]。由于属性结构复杂,在录入过程中可能出现错漏、全半角部分、字段名称等错误。

    (6)图面整饰质量问题

    图面整饰过程中,图面文件线型、点文件子图参数选择是否合理,图例、花纹、色标等是否按照国际及行业相关标准执行,图层压盖关系是否保持一致,直接影响图面整饰的质量。

    (7)投影变换质量问题

    对于各分层文件,其投影参数、TIC点要求完全一致,并要正确设置投影参数,统一使用同一版本、同一种方式进行投影,进行成批文件的转换,保证投影转换的质量[13]。如果在进行文件投影转换时,输入的TIC点的个数和精度不符合要求,转换后的结果文件的位置或图形参数就会出现错误。


三 质量控制方法与技术

1. 文档资料质量检查方法

    (1)文档资料检查内容

    文档资料检查内容包括合同书、专题年度工作方案、工作方案认定结论、专题年度报告、专题年度告初审意见书、工作日志、自检记录表、互检记录表、抽检记录表、彩喷地质图、编稿原图、地质报告及说明书、数据光盘等。

    (2)文档资料检查评级标准

    文档资料部分以100分计算,具体分值分布情况如下,分省专题文档资料部分所得的总分(以S1表示),为各部分实际分值之和。具体方法如下:

    1)合同书、专题年度工作方案、专题年度告初审意见书、原图错误检查汇总表、编稿原图、地质报告及说明书文档资料只计有无,“有”计满分,“无”计零分。

    2)年度工作方案:认定结论评分按工作方案评审单位下发的《年度工作方案认定书》所定结论评分,评价结果为优,得6分;评价结果为良,得4分;合格得2分。工作方案不合格经再次评审认定的年度工作方案,按合格处理;验收文档未提交认定书,按合格处理。

    3)专题年度报告:内容参照《1∶5万区域地质图空间数据库(分省)建设实施细则》年度工作报告提纲编写,质量评分参照年度工作报告质量要求表对应部分评分,评价结果为好,得8-6分;评价结果为一般,得5-0分。

    4)工作日志:评价结果为好,得10-8分,指工作日志填写认真,能详细记录各项工作的起止日期、记录工作中各阶段的内容、和工作中遇到的问题及处理意见;评价结果为较好,得7-5分,指记录了工作流程及工作内容;评价结果为一般,得4-0分,指记录简单,日期不明确等。

    5)自、互、抽检记录表:评价结果为好,指详细记录每一个工作阶段所检查的内容及修改意见,有检查人员本人亲笔签名,装订整齐,字迹清晰;评价结果为较好,指记录每一个工作阶段所检查的内容及修改意见,有检查员签名;评价结果为一般,指记录内容简单差指无自、互、抽检表。

    6)属性表卡表:评价结果为好,得10-8分,指地质人员手写记录,填写格式正确,无丢、漏数据项,装订整齐,符合《指南》、《实施细则》内容要求及存档要求;评价结果为较好,得7-5分,指地质人员手写记录,填写格式正确,但内容属性表填写与《指南》、《实施细则》要求有差异;评价结果为一般,得4分,指属性表内容不完整或较零乱定;0分指无属性表卡片或由数据库属性表输出后再用手抄写的。

    7)彩色喷墨地质图:评价结果为好,得5-4分,指图面各要素清晰,整饰美观,图面内容完整,符合使用要求的定为好;评价结果为较好,得3-2分,指图面内容基本清楚;评价结果为一般,得 1分,指图面个别要素有丢漏,参数定义不合理,图面看上去较乱。

    8)元数据:评价结果为好,得20-15分,指按元数据填写规则填写,内容完整、正确;评价结果为较好,得14-10分,指按元数据填写规则填写,内容较完整;评价结果为一般,得9-1分,指按元数据填写规则填写,内容不完整,缺失部分数据项内容;0分指无元数据文件。

    9)文档编录、整饰程度:评价结果为好,得2分,指文档编录、整饰整齐,符合归档要求;评价结果为一般,得1分,指文档编录整饰基本符合要求。


2.地质图图面质量检查方法

    (1)地质图图面检查内容

    图面检查是指对提交的MAPGIS输出的全要素彩色喷墨地质图进行质量检查,重点审查全要素彩色喷墨地质图中各类地质要素与数字化使用的地质图之间的一致性。

    (2)地质图图面检查评级标准

    ①单图幅错误数算法

    图幅错误类型分为严重与一般两种类型。严重错误包括:地质体丢失、地质界线压盖或穿插关系错误、面积性的重要地质体的注记丢失等;一般性错误包括:点元、其它线元的丢失或多余、地理底图的线划、注记错漏、单个地质符号的注记及引线错漏等、地质体的颜色、花纹错误等。

    ②单图幅图面检查评级标准

    单图幅图面检查得分计算单图幅图面质量满分以100分计算,单图幅图面检查得分以满分减去错误数所占分值乘以该图幅的复杂度,严重错误分值与一般错误分值单独计算。遵循就低不就高的原则,取最低分值作为单图幅计算机检查得分的基础分值。1个严重错误占5分,1个一般错误占1.5分。

m=100 - 严重错误数×5×单图幅复杂度系数               

n=100 - 一般错误×1.5×单图幅复杂度系数               

    其中m为单图幅扣除严重错误得分,n 为单图幅扣除一般错误得分。如果m>n,则单图幅图面检查得分= n +(m-n)/4;如果n>m,则单图幅图面检查得分= m + (m - n)/4。

    ③全部工作图幅评级标准

S2=各单幅得分总和/所检查图幅数                         

P=(不合格图幅数/所检查图幅数)×100%                  

    当P≥30%时,图面检查为不及格;当P<30%且S2≥60时,图面检查为及格。


3.计算机数据质量检查方法

    (1)检查内容

    检查内容包括文件的完整性、空间实体完整性、属性表是否有、图层分层正确性、属性结构正确性、代码项范围与标准代码表的一致性及必填项是否缺失、命名的正确性、检查数据格式、不同图层共用界线的一致性、多边形封闭、结点建立等。

    (2)计算机数据检查评分

    ①单图幅计算机检查评分

    单图幅计算机检查计分满分以100分计算,单图幅计算机检查得分为100减去缺陷所占分值乘以该图幅的复杂度系数,严重缺陷、重缺陷与轻缺陷分值单独计算,遵循就低不就高的原则,取最低分值作为单图幅计算机检查得分的基础分值。单个严重缺陷为5分,单个重缺陷为2分,单个轻缺陷为0.5分。

x=100 - 严重缺陷数×5×单图幅复杂度系数   

y=100 - 重缺陷数×2×单图幅复杂度系数     

z=100 - 轻缺陷数×0.5×单图幅复杂度系数   

    式中,x单图幅扣除严重缺陷得分;y 单图幅扣除重缺陷得分;z单图幅扣除轻缺陷得分。

    ixyz中最小值,i=min(xyz);j为剩余两个值中缺陷类型占相对严重的得分值;k为第三个得分值。

    单图幅图面检查得分=i + 3×(ji)/16+(ki)/16  

    ②全部工作图幅计算机检查评分

S3=各单幅得分总和/所检查图幅数               

    ③属性数据检查评分

    属性数据检查得分按照缺陷率的方法计算,全部工作图幅计算机检查得分为单图幅得分的平均值。

S4=各单幅得分总和/所检查图幅数 

           

4.空间数据库成果评价模型

    (1)评价结果

S= S1×10%+ S2×30%+ S3×30%+ S4×30%    

    式中,S为空间数据库成果检查评价总分;S1为空间数据库文档得分;S2为空间数据库地质图图面得分;S3为空间数据库计算机检查得分;S4为属性数据检查得分。

    (2)评价成果分级

    当S2S3S4都大于或等于60且完成任务书下达工作量时,若S≥90,则评价结果为优秀;若75≤S<90,则评价结果为良好;若60≤S<75,则评价结果为及格;若S<60,则评价结果为不及格;当S1S2S3三者之中有一个不及格,或者任务完成情况不好,则整个成果为不及格。


四 应用效果

    借助质量控制模型建成的1∶5万区域地质图空间数据库全部达到优秀级别,提供的空间数据的质量在数学基础、空间精度,空间数据标准化程度、图元录入质量、图形分层、拓扑一致性、结点关系、属性精度、代码一致性、图元编码、属性与图元对应等方面具有坚实可靠的基础,保证了空间数据库建设的稳步开展。本着边建设边服务的宗旨,高质量的数据库成果已在全国各省矿产资源潜力评价等重大专项中全面应用;同时先后为中国地震局地壳应力研究所、地质力学所、武警黄金部队、地调院、大区地调中心等单位提供数据服务2800余幅,数据库成果应用于基础地质研究、矿产资源勘查评价、矿产勘查规划、地震活动研究、旅游地质、抗旱打井等社会各领域应用。


五 结束语

    本文依托1:5万区域地质图空间数据库建设成果数据质量控制工作,全面阐述了质量控制的标准、空间数据库质量问题以及应用于成果数据质量控制的方法技术。通过数据质量控制后建成的数据库成果,已经向社会提供服务应用,证实了该质量控制方法的有效性和可行性,具有一定的推广价值和借鉴意义。

    严格控制数据质量是重中之重,是数据库建设的关键。今后研究重点,应深入分析空间数据质量指标的自动检验和评价方法与技术、逐步建立更加完善的质量评价模型,将各个质量评价环节纳入整个质量控制体系,提高成果数据的质量。


参考文献:

 [1]刘荣梅,王城锡,张庆和,等.1:5万区域地质图空间数据库建设成果报告(2008-2010年度)[R].

[2]王卫安,孙红春.地理信息系统的质量控制[J].测绘通报,1999,4:32-34.

[3]刘春,刘大杰,史文中.GIS数字地图质量子幅抽样方案的探讨[J].测绘学报(增刊),2002,31:99-102.

[4]李诺夫.GIS数据质量控制方法探讨[J].测绘通报,2011,8:66-34.

[5]张菊清,杨元喜.空间数据几何精度的质量控制研究现状与未来研究重点[J].测绘通报,2009,10:5-8.

[6]杨秀梅.地质空间数据质量问题探讨[J].地矿测绘,2010,26(2):33-37.

[7]左群超,杨东来,宋越,等.中国矿产资源潜力评价成果数据质量控制及方法技术[J].中国地质,2013,40(4):1314-1328.

[8]孙立梅,杨正萌,周文瑾,等.1:5万数字地质图空间数据库的质量控制[J].吉林地质,2007,26(2):63-66,81.

[9]陈为公,陈为标,蔡洪春,等.基于MAPGIS的地学控件数据库中数据质量的研究[J].地质与资源,2002,11(4):233-235.

[10]马瑜宏,王纪存,谢颂士.区域地质图空间数据建库质量控制的MapGIS分析[J].地球信息科学学报,2011,13(6):758-762.

[11]刘大杰,史文中,董小华,等.GIS空间数据的精度分析与质量控制[M].上海:上海科学技术文献出版社,1999.

[12]张明,周世健,曾绍炳.GIS中属性数据质量控制的研究[J]. 测绘科学,2010,35(3):70-73.

[13]陈玉兰,何翠云.    广西1:5万数字地质图空间数据库的质量监控[J].广西科学院学报,2009,25(3):206-209.

[14]张振芳,赵佳,王岳明.地质图空间数据库建设数据质量控制研究与实践——以1:25万区域地质图空间数据库建设为例[J].地理信息世界,2013,20(4):82-85,99.

 

作者简介:赵林林(1986-),男,贵州省遵义人,中国地质调查局发展研究中心助理工程师,硕士,2011年毕业于中国人民大学地图学与地理信息系统专业,主要研究方向为计算机应用、数据库开发。


原文标题:地质图空间数据库质量控制方法研究

 

声明:中国勘测联合网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考。