本文介绍基于
R
语言中的
raster
包,读取
单张
或批量读取
多张
栅格图像,并对栅格图像数据加以
基本处理
的方法。

1 包的安装与导入

首先,我们需要配置好对应的
R
语言包;前面也提到,我们这里选择基于
raster
包来实现栅格图像数据的读取与处理工作。首先,如果有需要的话,我们可以先到
raster
包在
R
语言的
官方网站
中,查阅
raster
包的基本情况,比如其作者信息、当前的版本、所依赖的其他包等等;如下图所示。

image

当然,这些内容看不看都不影响我们接下来的操作。接下来,我们开始安装
raster
包;这里我是在
RStudio
中进行代码的撰写的。

首先,我们输入如下的代码,从而开始
raster
包的下载与自动配置。

install.packages("raster")

随后,按下
回车
键,运行代码,如下图所示。

可以看到,我们在安装
raster
包时,会自动将其所需依赖的其他包(如果在此之前没有配置过)都一并配置好,非常方便。

接下来,输入如下的代码,从而将刚刚配置好的
raster
包导入。

library(raster)

随后,按下
回车
键,运行代码,如下图所示。

此时,在
RStudio
右下方的“
Packages
”中,可以看到
raster
包以及其所依赖的
sp
包都处于选中的状态,表明二者都已经配置成功,且完成导入。

2 单一栅格图像读取与处理

接下来,我们首先开始读取、处理单独一景栅格图像数据。

首先,我们输入如下的代码;其中第一句是指定接下来要打开的栅格图像的路径与文件名,第二句则是通过
raster()
函数打开这一栅格图像。

tif_file_name <- r"(E:\02_Project\01_Chlorophyll\ClimateZone\Split\A_LCC0.TIF)"
tif_file <- raster(tif_file_name)

运行上述代码。此时,我们可以在
RStudio
中右上方的“
Environment
”中看到我们刚刚新建的两个变量,以及其对应的值。

接下来,我们可以直接通过
plot()
函数,对刚刚读取到的栅格图像数据加以绘制。

plot(tif_file)

运行代码后,可以在
RStudio
中右下方的“
Plots
”看到绘制完毕的图像。可以说,这一绘制栅格图像的方式,相较于
Python

C++
等语言都更为方便。

随后,我们简单介绍一下对这一栅格图像数据的处理操作。例如,我们可以通过
mean()
函数与
sd()
函数,计算栅格图像全部像元数值的平均值和标准差;这里我们用到了
na.rm = TRUE
参数,具体含义稍后会提到。

tif_mean <- mean(tif_file[], na.rm = TRUE)
tif_std <- sd(tif_file[], na.rm = TRUE)

运行上述代码,随后输入如下的代码,即可查看我们刚刚计算得到的平均值与标准差。

tif_mean
tif_std

结果图下图所示。

前面我们提到了
na.rm = TRUE
参数,这一参数表示是否消除数据集中无效值
NA
的影响;如果我们不将其设置为
TRUE
,那么就表示不消除数据集中的无效值;而如果我们的栅格图像中出现无效值(
NoData
值),那么就会使得平均值、标准差等计算结果同样为无效值
NA
;如下图所示。

3 大量栅格图像读取与处理

接下来,我们介绍一下基于
raster
包批量读取大量栅格图像的方法。

首先,我们需要将存放有大量栅格图像的文件夹明确,并将其带入
list.files()
函数中;这一函数可以对指定路径下的文件加以遍历。其中,
pattern
是对文件名称加以匹配,我们用
".tif$"
表示只筛选出文件名称是以
.tif
结尾的文件;
full.names
表示是否将文件的全名(即路径名称加文件名称)返回,
ignore.case
表示是否不考虑匹配文件名称时的大小写差异。

tif_file_path <- list.files(r"(E:\02_Project\01_Chlorophyll\ClimateZone\Split\0)", pattern = ".tif$", full.names = TRUE, ignore.case = TRUE)

运行上述代码,并将这一变量打印出来,结果如下图所示。可以看到,此时我们已经将指定路径下的
.tif
格式的栅格图像全部提取出来了。

接下来,我们通过
stack()
函数,将全部栅格图像的数据放入同一个变量中;随后,我们可以打印一下这个变量,查看其中的内容。这里需要注意,如果通过这种方法批量读取栅格图像,需要保证每一景图像的空间参考信息、行数与列数完全一致,否则会弹出报错信息。如果大家的栅格图像行数与列数不完全一致,可以参考文章
Python实现snap:对齐多张遥感影像的空间范围
,对各个栅格图像加以统一。

tif_file_all <- stack(tif_file_path)
tif_file_all

运行上述代码,得到如下所示的结果。可以看到,这一变量中保存了
12
个图层(虽然栅格图像只有
7
景,但是其中有几景是具有多个波段的);其中,除了最基本的栅格图像维度、空间范围、空间参考信息等内容,
names
还展示了
12
个图层各自的名称,
min values

max values
则还展示了每一个图层的最小值与最大值。

此外,我们还可以继续基于
plot()
函数,直接批量绘制多个图层各自的栅格图像。

plot(tif_file_all)

运行上述代码,结果如下所示。

此外,我们还可以基于
mean()
等函数,对栅格图像的基本数学统计信息加以计算。不过在对多个栅格图像数据加以计算时需要注意,在
tif_file_all
后是否添加
[]
符号,得到的结果是不一样的——如果不添加
[]
符号,我们相当于是加以逐像元分析,对每一个位置的像元在
12
个图层中的数值加以统计,并计算该像元在
12
个图层中的平均值;因此最终所得结果是一景新的栅格图像,图像中的每一个像元数值都表示该像元在
12
个图层中的平均值。而如果我们添加了
[]
符号,那么就和前述单一栅格图像的处理一样,计算的结果就是一个数值,即
12
个图层中每一个像元对应数值的总体的平均值。

tif_all_mean <- mean(tif_file_all, na.rm = TRUE)
tif_all_mean_2 <- mean(tif_file_all[], na.rm = TRUE)

我们分别打印上述两个变量,得到结果如下图所示。

由此可以更加明显地看出添加
[]
符号与否的差异。

本文就只是对
R
语言
raster
包读取、处理栅格数据加以基本的方法介绍,至于更加深入的用法,我们将在后期的文章中加以介绍。

标签: none

添加新评论