北京大学R语言教程(李东风)第5章：逻辑型向量及其运算

风生水起 • 2023年10月24日 00:27 • 百科 • 阅读 648

逻辑型向量与比较运算

逻辑型是R的基本数据类型之一，只有两个值TRUE和FALSE,
缺失时为NA。逻辑值一般产生自比较，如

sele <- (log10(15) < 2); print(sele)
## [1] TRUE

向量比较结果为逻辑型向量。如

c(1, 3, 5) > 2
## [1] FALSE  TRUE  TRUE
(1:4) >= (4:1)
## [1] FALSE FALSE  TRUE  TRUE

从例子可以看出，向量比较也遵从R的向量间运算的一般规则：
向量与标量的运算是向量每个元素与标量都分别运算一次，
等长向量的运算时对应元素的运算，
不等长但长度为倍数关系的向量运算是把短的从头重复利用。

与NA比较产生NA，如

c(1, NA, 3) > 2
## [1] FALSE    NA  TRUE
NA == NA
## [1] NA

为了判断向量每个元素是否NA，
用is.na()函数，如

is.na(c(1, NA, 3) > 2)
## [1] FALSE  TRUE FALSE

用is.finite()判断向量每个元素是否Inf值。

比较运算符包括

<   <=  >  >=  ==  !=  %in%

分别表示小于、小于等于、大于、大于等于、等于、不等于、属于。
要注意等于比较用了两个等号。

%in%是比较特殊的比较，
x %in% y的运算把向量y看成集合，
运算结果是一个逻辑型向量，
第i个元素的值为x的第i元素是否属于y的逻辑型值。
如

c(1,3) %in% c(2,3,4)
## [1] FALSE  TRUE
c(NA,3) %in% c(2,3,4)
## [1] FALSE  TRUE
c(1,3) %in% c(NA, 3, 4)
## [1] FALSE  TRUE
c(NA,3) %in% c(NA, 3, 4)
## [1] TRUE TRUE

函数match(x, y)起到和x %in% y运算类似的作用，
但是其返回结果不是找到与否，
而是对x的每个元素，
找到其在y中首次出现的下标，找不到时取缺失值，如

match(c(1, 3), c(2,3,4,3))
## [1] NA  2

为了表达如“x>0而且x<1”,
“x≤0或者x≥1”之类的复合比较，
需要使用逻辑运算把两个比较连接起来。
逻辑运算符为&, |和!, 分别表示“同时成立”、“两者至少其一成立”、“条件的反面”。
比如，设age<=3表示婴儿，sex=='女'表示女性，则
age<=3 & sex=='女'表示女婴,
age<=3 | sex=='女'表示婴儿或妇女,
!(age<=3 | sex=='女')表示既非婴儿也非妇女。
为了确定运算的先后次序可以用圆括号()指定。

用xor(x, y)表示x与y的异或运算，
即值不相等时为真值，相等时为假值，
有缺失值参加运算时为缺失值。

逻辑向量与逻辑标量之间的逻辑运算，
两个逻辑向量之间的逻辑运算规则遵从一般R向量间运算规则。

在右运算符是缺失值时，
如果左运算符能够确定结果真假，
可以得到非缺失的结果。
例如，TRUE | NA为TRUE,
FALSE & NA为FALSE。
不能确定结果时返回NA，
比如，
TRUE & NA为NA,
FALSE | NA为NA。

&&和||分别为短路的标量逻辑与和短路的标量逻辑或，
仅对两个标量进行运算，如果有向量也仅使用第一个元素。
一般用在if语句、while语句中，
且只要第一个比较已经决定最终结果就不计算第二个比较。
例如

if(TRUE || sqrt(-1)>0) next

其中的sqrt(-1)部分不会执行。
其中条件的结果为TRUE, 第二部分没有参加计算，
否则第二部分的计算会发生函数自变量范围错误。

逻辑运算函数

因为R中比较与逻辑运算都支持向量之间、向量与标量之间的运算，
所以在需要一个标量结果时要特别注意，
后面讲到的if结构、while结构都需要逻辑标量而且不能是缺失值。
这时，应该对缺失值结果单独考虑。

若cond是逻辑向量，
用all(cond)测试cond的所有元素为真；
用any(cond)测试cond至少一个元素为真。
cond中允许有缺失值，结果可能为缺失值。
如

c(1, NA, 3) > 2
## [1] FALSE    NA  TRUE
all(c(1, NA, 3) > 2)
## [1] FALSE
any(c(1, NA, 3) > 2)
## [1] TRUE
all(NA)
## [1] NA
any(NA)
## [1] NA

函数which()返回真值对应的所有下标，如

which(c(FALSE, TRUE, TRUE, FALSE, NA))
## [1] 2 3
which((11:15) > 12)
## [1] 3 4 5

函数identical(x,y)比较两个R对象x与y的内容是否完全相同，
结果只会取标量TRUE与FALSE两种。
如

identical(c(1,2,3), c(1,2,NA))
## [1] FALSE
identical(c(1L,2L,3L), c(1,2,3))
## [1] FALSE

其中第二个结果假值是因为前一向量是整数型，
后一向量是实数型。

函数all.equal()与identical()类似，
但是在比较数值型时不区分整数型与实数型，
而且相同时返回标量TRUE，
但是不同时会返回一个说明有何不同的字符串。如

all.equal(c(1,2,3), c(1,2,NA))
## [1] "'is.NA' value mismatch: 1 in current 0 in target"
all.equal(c(1L,2L,3L), c(1,2,3))
## [1] TRUE

函数duplicated()返回每个元素是否为重复值的结果，如：

duplicated(c(1,2,1,3,NA,4,NA))
## [1] FALSE FALSE  TRUE FALSE FALSE FALSE  TRUE

用函数unique()可以返回去掉重复值的结果。

北京大学R语言教程(李东风)第5章：逻辑型向量及其运算

逻辑型向量与比较运算

逻辑运算

逻辑运算函数

相关推荐

更好的 ESG 评级会提振债券持有人吗？

“Smart Beta”对我们意味着什么？

金融时间序列分析讲义第2章： 金融数据及其特征

潜龙

美元霸权的困境：崛起的大国和全球货币的未来

发表回复

金融时间序列分析讲义第2章：金融数据及其特征