R语言遍历文件夹求取其中所有栅格文件的平均值
本文介绍基于
R
语言中的
raster
包,遍历读取
多个文件夹
下的
多张栅格遥感影像
,分别批量对
每一个文件夹
中的
多个栅格图像
计算
平均值
,并将所得
各个结果栅格
分别加以保存的方法。
其中,本文是用
R
语言来进行操作的;如果希望基于
Python
语言实现类似的平均值求取操作,大家可以参考
Python ArcPy批量计算多时相遥感影像的各像元平均值
与
Python忽略NoData计算多张遥感影像的像元平均值:whitebox库
这两篇文章。
首先,来看一下本文所需实现的需求。如下图所示,现有多个文件夹,其中每一个文件夹内部都含有大量的栅格遥感影像。
其中,上图中的每一个文件夹的命名都是以遥感影像的
分幅条带号
为依据的。例如,打开第一个名为
47RMN
的文件夹,其中均为条带号为
47RMN
(即同一空间范围)、
不同成像时间
的遥感影像,如下图所示;其中,紫色框内的遥感影像文件名即可看出,这些图像是
同一条带号
、
不同时间
的遥感影像数据。
我们要做的,就是分别对每一个文件夹中的全部遥感影像计算平均值,从而得到
不同条带号
遥感影像的平均值;最终我们将得到
多张
结果图像,每一景结果图像就是
这一条带号
、
不同成像时间
对应的遥感影像的平均值。同时为了方便区分,我们需要将每一景结果图像文件的文件名设置为与
条带号
有关的内容。
明确了需求,我们即可开始代码的撰写。本文所用到的代码如下所示。
library(raster)
result_path <- r"(E:\02_Project\01_Chlorophyll\Select\Result)"
tif_folder <- list.files(path = r"(E:\02_Project\01_Chlorophyll\Select)", pattern = NULL, all.files = FALSE, full.names = TRUE)
for (folder in tif_folder){
folder_name <- substr(folder, nchar(folder) - 4, nchar(folder))
tif_file_name <- list.files(path = folder, pattern = ".tif$", full.names = TRUE, ignore.case = TRUE)
tif_file_all <- stack(tif_file_name)
NAvalue(tif_file_all) <- -10000
tif_mean <- calc(tif_file_all, fun = mean, na.rm = TRUE)
tif_mean_new <- tif_mean / 100
# plot(tif_mean_new)
result_file_name <- file.path(result_path, paste(folder_name, "_mean.tif", sep = ""))
rf <- writeRaster(tif_mean_new, filename = result_file_name, overwrite = TRUE)
cat(folder_name, "is completed!", "\n")
}
首先,需要通过
library(raster)
代码,导入本文所需的
R
语言
raster
包;关于这一包的配置,大家可以参考
基于R语言的raster包读取遥感影像
。接下来,我们需要指定结果存放的路径,并将其放入变量
result_path
中。
接下来,我们通过
list.files()
函数,将包含有各个条带号的
小文件夹
的
大文件夹
(也就是本文开头第一张图所示的文件夹)加以遍历,将每一个
小文件夹
的路径存入
tif_folder
。执行上述前
3
行代码后,得到的
tif_folder
结果如下图所示。
可以看到,
tif_folder
是一个字符串,其中每一个元素都是每一个
小文件夹
的路径。
接下来的
for
循环,就是对
tif_folder
加以遍历,即对每一个
小文件夹
进行操作。其中,我们首先通过
substr()
函数,获取当前操作的
小文件夹
名称,并将其存放于
folder_name
中;随后,对当前对应的
小文件夹
加以遍历,取出其中的全部
遥感影像文件
,并存放于
tif_file_name
;接下来,就是读取
全部遥感影像
,并计算其平均值;这里具体的代码解释大家可以参考文章
R语言求取大量遥感影像的平均值、标准差:raster库
。此外需要注意的是,由于我这里每一景遥感影像原本没有专门设置
NoData
值,而是用
-10000
作为其
NoData
值,因此需要通过
NAvalue(tif_file_all) <- -10000
这句代码,将值为
-10000
的像元作为
NoData
值的像元,防止后期计算平均值时对结果加以干扰。
接下来,我们通过
file.path()
函数配置一下输出结果的路径——其中,结果遥感影像文件的名称就可以直接以其所对应的
条带号
来设置,并在条带号后添加一个
_mean
后缀,表明这个是平均值的结果图像;但此外,这个仅仅是文件的名字,还需要将文件名与路径拼接在一起,才可以成为完整的保存路径,因此需要用到
file.path()
函数。最后,将结果图像通过
writeRaster()
函数加以保存即可,这句代码的解释大家同样参考
R语言求取大量遥感影像的平均值、标准差:raster库
这篇文章即可。
最后,由于我们要处理的文件夹比较多,因此可以通过
cat()
函数输出一下当前代码的运行进度。
运行上述代码,我们将在指定的结果保存路径中看到
每一个条带号
对应的平均值结果图像,如下图所示。
至此,大功告成。