数据质量用例

任务组将提供一个用例报告列表,其中的数据被评估为该特定用途的适用性。用例描述将包括所需的数据、质量维度和用于评估数据/数据集的阈值。这应提供一套可用于评估数据是否适合特定用途的参考信息。

任务组

召集人

英里尼科尔斯

动机

  • 除了数据可用性之外,“数据质量”可能是生物多样性数据用户面临的最重要的问题,对于研究界尤其如此。
  • 这个任务小组正在审查与“数据质量”有关的实际的、真实的世界使用,目的是提供最佳的当前实践。
  • 如果能够为生物多样性记录的用户提供一组实际的数据质量用例,那么生物多样性数据就可以得到更大的利用和更适当的利用。数据提供者,特别是像GBIF和它的节点这样的聚合器将增加用户社区的可信度,并能够提供更有效的适用性评估示例。
  • 其他数据质量任务组将集中于概述或框架(TG1)和工具、服务和工作流(TG2)。

目标、产出和结果

机构和用户社区使用的一组用例,用于选择用于特定目的的记录和/或数据集(2016年3月)。报告的范围将根据作出反应的机构和用户社区而定。

策略

  • 这些用例将以结构化的形式记录在《生物多样性数据适用性评估和管理概念框架》(Veiga等人出版)的基础上。
  • 用例模板将放置在协作编辑环境中,以便完成和讨论。
  • 通过任务组参与者与其他政府和保护机构以及用户社区联系,建立并记录用例,在用例中他们评估数据的适用性,以及所需的数据、维度和阈值。

成为参与

本工作组欢迎对数据质量有实际兴趣和/或有为特定目的选择数据集和记录经验的任何人。

资源

  • Belbin, L., Daly, J., Hirsch, T., Hobern, D. and LaSalle, J.(2013)。专家对汇总事件记录的审计:“汇总者”的回应。ZooKeys 305: 67 - 76。https://doi.org/10.3897/zookeys.305.5438。
  • 查普曼,广告(2005)。数据清理的原则和方法。原始物种和物种发生数据,1.0版。全球生物多样性信息设施的报告,哥本哈根,75页。http://www.gbif.org/resource/80528。
  • 查普曼,广告(2005 b)。数据质量原则,1.0版。全球生物多样性信息设施报告,哥本哈根,61p。https://doi.org/10.15468/doc.jrgg-a190。
  • Costello MJ, Michener WK, Gahegan M, Zhang Z-Q, Bourne P, Chavan V(2012)。促进生物多样性数据出版物1.0版的质量保证和知识产权,哥本哈根:全球生物多样性信息设施,40页,ISBN 87-92020-49-6。
  • Mesibov R(2013)一名专家对累计发生记录的审计。293: ZooKeys队。https://doi.org/10.3897/zookeys.293.5111
  • Otegui J, Ariño AH, Encinas MA, Pando F(2013)评估全球生物多样性信息设施(GBIF)西班牙节点的主要数据。公共科学图书馆学报8(1):e55144。https://doi.org/10.1371/journal.pone.0055144
  • http://community.gbif.org/pg/groups/21292/gbiftdwg-biodiversity-data-quality-interest-group/
  • https://github.com/tdwg/infrastructure/issues/48。