传统的缺失值填充模型难以准确填充数据匮乏地区的日径流数据。在无法有效利用多维度数据的情况下,对径流量尤其是径流极值的模拟将很难进行。径流量和水文要素之间的定量关系对模型的准确性至关重要,但传统的观测网络的准确性和完整性通常不足以提供准确的径流日数据。在缺资料、少资料的干旱区内陆河流域,目前有关缺失值填充/数据重建已有不同的研究成果,但对不同缺失率,不同缺失分布的径流数据尚没有系统性的处理方案。
针对这一科学问题,中国科学院新疆生态与地理研究所荒漠与绿洲生态国家重点实验室陈亚宁研究员团队基于CMIP6-SSP245,NOAA-NCDC,HWSD和监测站点径流数据,对日径流量缺失值填充和重建问题在以下方面进行了创新性的研究:(1)开发了一个基于贝叶斯公式的降噪概率扩散模型用于填充日径流数据,在不同的缺失率下取得了良好的填充结果,NSE,KGE与R2决定系数在10种常用算法中均排名前3;(2)平衡了算法在不同的缺失数据分布下的效率,在非随机缺失(NMAR)下,平均KGE为70.9%,部分随机缺失(MAR)下为62.4%,完全随机缺失(MCAR)下为43.1%;(3)对中亚干旱区典型流域,包括天山北坡的玛纳斯河流域和天山南坡的开都河流域的日径流进行了缺失值填充和重建。研究结果显示,降噪概率扩散模型(DDPM)在中亚干旱区典型流域的日径流缺失值插补和充填上表现出良好的效果。研究团队发现,填充后的数据与实际观测值之间的一致性明显提高。这意味着DDPM能够准确地恢复径流序列中的缺失数据,并能够在一定程度上还原地表径流的时空分布特征。此外,研究团队还发现,中亚干旱区内陆河流域的日径流缺失值主要受到气候变化和自然环境因素的影响。降水量、土壤湿度以及蒸散发量等因素对径流的变化具有驱动作用。通过对这些关键因素的综合分析,研究者们能够更好地理解中亚地区水资源的时空变化规律,并为水资源管理与决策提供科学支持。
这项研究成果以“Exploring Denoising Diffusion Probabilistic Model for Daily Streamflow Gap Filling in Central Asia Typical Watersheds”为题发表在Journal of Hydrology: Regional Studies期刊上。新疆生地所荒漠与绿洲生态国家重点实验室何淦昌硕士为第一作者,陈亚宁研究员为通讯作者。该研究得到国家自然科学基金和中国科学院西部青年学者项目的资助。
DDPM和MissForest在玛纳斯河流域模拟的概率密度函数