北京大学R语言教程(李东风)第11章:列表类型

R中列表(list)类型来保存不同类型的数据。
一个主要目的是提供R分析结果输出包装:
输出一个变量,
这个变量包括回归系数、预测值、残差、检验结果等等一系列不能放到规则形状数据结构中的内容。
实际上,数据框也是列表的一种,
但是数据框要求各列等长,
而列表不要求。

列表可以有多个元素,
但是与向量不同的是,
列表的不同元素的类型可以不同,
比如,
一个元素是数值型向量,
一个元素是字符串,
一个元素是标量,
一个元素是另一个列表。

定义列表用函数list(), 如

rec <- list(name="李明", age=30,
  scores=c(85, 76, 90))
rec
## $name
## [1] "李明"
## 
## $age
## [1] 30
## 
## $scores
## [1] 85 76 90

typeof()函数判断一个列表,
返回结果为list
可以用is.list()函数判断某个对象是否列表类型

为了生成元素为空的长度为n的列表,程序如:

11.2 列表元素访问

列表的一个元素也可以称为列表的一个“变量”,
单个列表元素必须用两重方括号格式访问,如

rec[[3]]
## [1] 85 76 90
rec[[3]][2]
## [1] 76
rec[["age"]]
## [1] 30

列表的单个元素也可以用$格式访问,如

如果使用单重方括号对列表取子集,
结果还是列表而不是列表元素,如

rec[3]
## $scores
## [1] 85 76 90
is.list(rec[3])
## [1] TRUE

列表一般都应该有元素名,
元素名可以看成是变量名,
列表中的每个元素看成一个变量。
names()函数查看和修改元素名。

names(rec)
## [1] "name"   "age"    "scores"
names(rec)[names(rec)=="scores"] <- "三科分数"
names(rec)
## [1] "name"     "age"      "三科分数"
rec[["三科分数"]]
## [1] 85 76 90

可以修改列表元素内容。

rec[["三科分数"]][2] <- 0
print(rec)
## $name
## [1] "李明"
## 
## $age
## [1] 30
## 
## $三科分数
## [1] 85  0 90

直接给列表不存在的元素名定义元素值就添加了新元素,
而且不同于使用向量,对于列表而言这是很正常的做法,比如

rec[["身高"]] <- 178
print(rec)
## $name
## [1] "李明"
## 
## $age
## [1] 30
## 
## $三科分数
## [1] 85  0 90
## 
## $身高
## [1] 178

把某个列表元素赋值为NULL就删掉这个元素。

rec[["age"]] <- NULL
print(rec)
## $name
## [1] "李明"
## 
## $三科分数
## [1] 85  0 90
## 
## $身高
## [1] 178

list()函数中允许定义元素为NULL,这样的元素是存在的,如:

li <- list(a=120, b="F", c=NULL); li
## $a
## [1] 120
## 
## $b
## [1] "F"
## 
## $c
## NULL

但是,要把已经存在的元素修改为NULL值而不是删除此元素,
或者给列表增加一个取值为NULL的元素,
这时需要用单重的方括号取子集,
这样的子集会保持其列表类型,
给这样的子列表赋值为list(NULL),如:

li["b"] <- list(NULL)
li["d"] <- list(NULL)
li
## $a
## [1] 120
## 
## $b
## NULL
## 
## $c
## NULL
## 
## $d
## NULL

11.3 列表类型转换

as.list()把一个其它类型的对象转换成列表;
unlist()函数把列表转换成基本向量。如

li1 <- as.list(1:3)
li1
## [[1]]
## [1] 1
## 
## [[2]]
## [1] 2
## 
## [[3]]
## [1] 3
li2 <- list(x=1, y=c(2,3))
unlist(li2)
##  x y1 y2 
##  1  2  3

11.4 连接列表

两个列表可以用c连接成一个列表,
如:

li1 <- list(1:2)
li2 <- list(11:12)
li <- c(li1, li2)
li
## [[1]]
## [1] 1 2
## 
## [[2]]
## [1] 11 12

如下的做法没有达到目的:

li <- list()
li <- c(li, 1:3)
li <- c(li, 11:13)
li
## [[1]]
## [1] 1
## 
## [[2]]
## [1] 2
## 
## [[3]]
## [1] 3
## 
## [[4]]
## [1] 11
## 
## [[5]]
## [1] 12
## 
## [[6]]
## [1] 13

需要改为:

li <- list()
li <- c(li, list(1:3))
li <- c(li, list(11:13))
li
## [[1]]
## [1] 1 2 3
## 
## [[2]]
## [1] 11 12 13

11.5 返回列表的函数示例–strsplit()

strsplit()输入一个字符型向量并指定一个分隔符,
返回一个项数与字符型向量元素个数相同的列表,
列表每项对应于字符型向量中一个元素的拆分结果。

x <- c("10, 8, 7", "5, 2, 2", "3, 7, 8", "8, 8, 9")
res <- strsplit(x, ","); res
## [[1]]
## [1] "10" " 8" " 7"
## 
## [[2]]
## [1] "5"  " 2" " 2"
## 
## [[3]]
## [1] "3"  " 7" " 8"
## 
## [[4]]
## [1] "8"  " 8" " 9"

为了把拆分结果进一步转换成一个数值型矩阵,
可以使用sapply()函数如下:

t(sapply(res, as.numeric))
##      [,1] [,2] [,3]
## [1,]   10    8    7
## [2,]    5    2    2
## [3,]    3    7    8
## [4,]    8    8    9

sapply()函数是apply类函数之一,
稍后再详细进行讲解。

韭菜热线原创版权所有,发布者:风生水起,转载请注明出处:https://www.9crx.com/77953.html

(0)
打赏
风生水起的头像风生水起普通用户
上一篇 2023年10月30日 01:56
下一篇 2023年10月31日 00:16

相关推荐

  • 为什么加密世界应该接受美联储的打击

    监管扫荡可能正是该行业最终合法化所需要的。 兵临城下。 这就是当今加密货币行业内部的感受,美国当局对众多参与者提出起诉、诉讼、罚款,并下令关闭各种产品。甚至稳定币这种由美元支持的相对简单的资产也成为了目标。 一年来,加密货币市场价值损失了约三分之二,FTX 的失败也粉碎了投资者的信任,此次打击令整个行业陷入混乱。然而,如果该行业要放弃技术革命的宏伟梦想并成为…

    2023年8月26日
    14200
  • 发达市场公共债务:风险与现实

    发达市场公共债务:风险与现实 执行摘要 公共部门承受了疫情后财政压力的冲击,导致许多发达经济体的政府债务可持续性恶化。 对于许多国家来说,政府债务水平并不是主要问题。然而,债务水平较高的国家面临更不稳定的财政状况,尽管债务水平可能仍将保持可持续,但前提是计划实施财政紧缩政策。 美国的表现突出,债务轨迹急剧上升,但其作为全球储备货币发行国的地位和较低的税负提供…

    2024年9月20日
    14500
  • 现在似乎每个人都想要铀

    一种产品的价格在 12 个月内上涨了 90%。现在的成本比 16 年来还要高。大多数人在进入这样的市场时都会三思而后行。 那些经营核电站并且必须拥有相关产品:铀的人则不然。咨询公司 Ocean Wall 的尼克·劳森 (Nick Lawson) 表示,关闭工厂会让你损失一大笔钱。想想每天 100 万美元。它还可能使你极不受欢迎,因为美国有五分之一的家庭依赖核…

    2024年2月26日
    10900
  • 北京大学R语言教程(李东风)第31章: 使用infer包进行统计推断

    R的infer扩展包提供了与tidyverse系统习惯做法一致的进行假设检验的方法。 在进行理论推断时, 主要使用随机模拟方法进行计算, 也支持基于理论分布的方法。 这个包的当前版本(1.2.9001)还有一些错误, 不能用于较正式的研究问题。 以数据框(tibble)为输入, 用动词specify指定针对的变量, 用hypothesis指定假设检验(包括置…

    2023年11月21日
    45400
  • 北京大学金融时间序列分析讲义第22章: 波动率模型的应用

    下面研究GARCH模型导致的波动率期限结构,比如,日对数收益率的波动率与月对数收益率的波动率的关系。以时间t为基础,距离t时刻h期(比如h个交易日)的对数收益率为 rt,h=∑i=1hrt+i 于是 E(rt,h|Ft)=∑i=1hE(rt+i|Ft) h期的条件方差,即波动率平方为 Var(rt,h|Ft)=∑i=1hVar(rt+i|Ft)+∑1≤i&l…

    2023年8月4日
    59100

发表回复

登录后才能评论
客服
客服
关注订阅号
关注订阅号
分享本页
返回顶部