逻辑型向量与比较运算
逻辑型是R的基本数据类型之一,只有两个值TRUE和FALSE,
缺失时为NA。逻辑值一般产生自比较,如
sele <- (log10(15) < 2); print(sele)
## [1] TRUE
向量比较结果为逻辑型向量。如
c(1, 3, 5) > 2
## [1] FALSE TRUE TRUE
(1:4) >= (4:1)
## [1] FALSE FALSE TRUE TRUE
从例子可以看出,向量比较也遵从R的向量间运算的一般规则:
向量与标量的运算是向量每个元素与标量都分别运算一次,
等长向量的运算时对应元素的运算,
不等长但长度为倍数关系的向量运算是把短的从头重复利用。
与NA比较产生NA,如
c(1, NA, 3) > 2
## [1] FALSE NA TRUE
NA == NA
## [1] NA
为了判断向量每个元素是否NA,
用is.na()
函数,如
is.na(c(1, NA, 3) > 2)
## [1] FALSE TRUE FALSE
用is.finite()
判断向量每个元素是否Inf值。
比较运算符包括
< <= > >= == != %in%
分别表示小于、小于等于、大于、大于等于、等于、不等于、属于。
要注意等于比较用了两个等号。
%in%
是比较特殊的比较,x %in% y
的运算把向量y看成集合,
运算结果是一个逻辑型向量,
第i个元素的值为x的第i元素是否属于y的逻辑型值。
如
c(1,3) %in% c(2,3,4)
## [1] FALSE TRUE
c(NA,3) %in% c(2,3,4)
## [1] FALSE TRUE
c(1,3) %in% c(NA, 3, 4)
## [1] FALSE TRUE
c(NA,3) %in% c(NA, 3, 4)
## [1] TRUE TRUE
函数match(x, y)
起到和x %in% y
运算类似的作用,
但是其返回结果不是找到与否,
而是对x
的每个元素,
找到其在y
中首次出现的下标,找不到时取缺失值,如
match(c(1, 3), c(2,3,4,3))
## [1] NA 2
逻辑运算
为了表达如“x>0而且x<1”,
“x≤0或者x≥1”之类的复合比较,
需要使用逻辑运算把两个比较连接起来。
逻辑运算符为&
, |
和!
, 分别表示“同时成立”、“两者至少其一成立”、“条件的反面”。
比如,设age<=3
表示婴儿,sex=='女'
表示女性,则age<=3 & sex=='女'
表示女婴,age<=3 | sex=='女'
表示婴儿或妇女,!(age<=3 | sex=='女')
表示既非婴儿也非妇女。
为了确定运算的先后次序可以用圆括号()
指定。
用xor(x, y)
表示x
与y
的异或运算,
即值不相等时为真值,相等时为假值,
有缺失值参加运算时为缺失值。
逻辑向量与逻辑标量之间的逻辑运算,
两个逻辑向量之间的逻辑运算规则遵从一般R向量间运算规则。
在右运算符是缺失值时,
如果左运算符能够确定结果真假,
可以得到非缺失的结果。
例如,TRUE | NA
为TRUE
,FALSE & NA
为FALSE
。
不能确定结果时返回NA
,
比如,TRUE & NA
为NA
,FALSE | NA
为NA
。
&&
和||
分别为短路的标量逻辑与和短路的标量逻辑或,
仅对两个标量进行运算,如果有向量也仅使用第一个元素。
一般用在if语句、while语句中,
且只要第一个比较已经决定最终结果就不计算第二个比较。
例如
if(TRUE || sqrt(-1)>0) next
其中的sqrt(-1)
部分不会执行。
其中条件的结果为TRUE
, 第二部分没有参加计算,
否则第二部分的计算会发生函数自变量范围错误。
逻辑运算函数
因为R中比较与逻辑运算都支持向量之间、向量与标量之间的运算,
所以在需要一个标量结果时要特别注意,
后面讲到的if
结构、while
结构都需要逻辑标量而且不能是缺失值。
这时,应该对缺失值结果单独考虑。
若cond
是逻辑向量,
用all(cond)
测试cond
的所有元素为真;
用any(cond)
测试cond
至少一个元素为真。cond
中允许有缺失值,结果可能为缺失值。
如
c(1, NA, 3) > 2
## [1] FALSE NA TRUE
all(c(1, NA, 3) > 2)
## [1] FALSE
any(c(1, NA, 3) > 2)
## [1] TRUE
all(NA)
## [1] NA
any(NA)
## [1] NA
函数which()
返回真值对应的所有下标,如
which(c(FALSE, TRUE, TRUE, FALSE, NA))
## [1] 2 3
which((11:15) > 12)
## [1] 3 4 5
函数identical(x,y)
比较两个R对象x
与y
的内容是否完全相同,
结果只会取标量TRUE与FALSE两种。
如
identical(c(1,2,3), c(1,2,NA))
## [1] FALSE
identical(c(1L,2L,3L), c(1,2,3))
## [1] FALSE
其中第二个结果假值是因为前一向量是整数型,
后一向量是实数型。
函数all.equal()
与identical()
类似,
但是在比较数值型时不区分整数型与实数型,
而且相同时返回标量TRUE,
但是不同时会返回一个说明有何不同的字符串。如
all.equal(c(1,2,3), c(1,2,NA))
## [1] "'is.NA' value mismatch: 1 in current 0 in target"
all.equal(c(1L,2L,3L), c(1,2,3))
## [1] TRUE
函数duplicated()
返回每个元素是否为重复值的结果,如:
duplicated(c(1,2,1,3,NA,4,NA))
## [1] FALSE FALSE TRUE FALSE FALSE FALSE TRUE
用函数unique()
可以返回去掉重复值的结果。
韭菜热线原创版权所有,发布者:风生水起,转载请注明出处:https://www.9crx.com/77741.html