北京大学R语言教程(李东风)第11章:列表类型

R中列表(list)类型来保存不同类型的数据。
一个主要目的是提供R分析结果输出包装:
输出一个变量,
这个变量包括回归系数、预测值、残差、检验结果等等一系列不能放到规则形状数据结构中的内容。
实际上,数据框也是列表的一种,
但是数据框要求各列等长,
而列表不要求。

列表可以有多个元素,
但是与向量不同的是,
列表的不同元素的类型可以不同,
比如,
一个元素是数值型向量,
一个元素是字符串,
一个元素是标量,
一个元素是另一个列表。

定义列表用函数list(), 如

rec <- list(name="李明", age=30,
  scores=c(85, 76, 90))
rec
## $name
## [1] "李明"
## 
## $age
## [1] 30
## 
## $scores
## [1] 85 76 90

typeof()函数判断一个列表,
返回结果为list
可以用is.list()函数判断某个对象是否列表类型

为了生成元素为空的长度为n的列表,程序如:

11.2 列表元素访问

列表的一个元素也可以称为列表的一个“变量”,
单个列表元素必须用两重方括号格式访问,如

rec[[3]]
## [1] 85 76 90
rec[[3]][2]
## [1] 76
rec[["age"]]
## [1] 30

列表的单个元素也可以用$格式访问,如

如果使用单重方括号对列表取子集,
结果还是列表而不是列表元素,如

rec[3]
## $scores
## [1] 85 76 90
is.list(rec[3])
## [1] TRUE

列表一般都应该有元素名,
元素名可以看成是变量名,
列表中的每个元素看成一个变量。
names()函数查看和修改元素名。

names(rec)
## [1] "name"   "age"    "scores"
names(rec)[names(rec)=="scores"] <- "三科分数"
names(rec)
## [1] "name"     "age"      "三科分数"
rec[["三科分数"]]
## [1] 85 76 90

可以修改列表元素内容。

rec[["三科分数"]][2] <- 0
print(rec)
## $name
## [1] "李明"
## 
## $age
## [1] 30
## 
## $三科分数
## [1] 85  0 90

直接给列表不存在的元素名定义元素值就添加了新元素,
而且不同于使用向量,对于列表而言这是很正常的做法,比如

rec[["身高"]] <- 178
print(rec)
## $name
## [1] "李明"
## 
## $age
## [1] 30
## 
## $三科分数
## [1] 85  0 90
## 
## $身高
## [1] 178

把某个列表元素赋值为NULL就删掉这个元素。

rec[["age"]] <- NULL
print(rec)
## $name
## [1] "李明"
## 
## $三科分数
## [1] 85  0 90
## 
## $身高
## [1] 178

list()函数中允许定义元素为NULL,这样的元素是存在的,如:

li <- list(a=120, b="F", c=NULL); li
## $a
## [1] 120
## 
## $b
## [1] "F"
## 
## $c
## NULL

但是,要把已经存在的元素修改为NULL值而不是删除此元素,
或者给列表增加一个取值为NULL的元素,
这时需要用单重的方括号取子集,
这样的子集会保持其列表类型,
给这样的子列表赋值为list(NULL),如:

li["b"] <- list(NULL)
li["d"] <- list(NULL)
li
## $a
## [1] 120
## 
## $b
## NULL
## 
## $c
## NULL
## 
## $d
## NULL

11.3 列表类型转换

as.list()把一个其它类型的对象转换成列表;
unlist()函数把列表转换成基本向量。如

li1 <- as.list(1:3)
li1
## [[1]]
## [1] 1
## 
## [[2]]
## [1] 2
## 
## [[3]]
## [1] 3
li2 <- list(x=1, y=c(2,3))
unlist(li2)
##  x y1 y2 
##  1  2  3

11.4 连接列表

两个列表可以用c连接成一个列表,
如:

li1 <- list(1:2)
li2 <- list(11:12)
li <- c(li1, li2)
li
## [[1]]
## [1] 1 2
## 
## [[2]]
## [1] 11 12

如下的做法没有达到目的:

li <- list()
li <- c(li, 1:3)
li <- c(li, 11:13)
li
## [[1]]
## [1] 1
## 
## [[2]]
## [1] 2
## 
## [[3]]
## [1] 3
## 
## [[4]]
## [1] 11
## 
## [[5]]
## [1] 12
## 
## [[6]]
## [1] 13

需要改为:

li <- list()
li <- c(li, list(1:3))
li <- c(li, list(11:13))
li
## [[1]]
## [1] 1 2 3
## 
## [[2]]
## [1] 11 12 13

11.5 返回列表的函数示例–strsplit()

strsplit()输入一个字符型向量并指定一个分隔符,
返回一个项数与字符型向量元素个数相同的列表,
列表每项对应于字符型向量中一个元素的拆分结果。

x <- c("10, 8, 7", "5, 2, 2", "3, 7, 8", "8, 8, 9")
res <- strsplit(x, ","); res
## [[1]]
## [1] "10" " 8" " 7"
## 
## [[2]]
## [1] "5"  " 2" " 2"
## 
## [[3]]
## [1] "3"  " 7" " 8"
## 
## [[4]]
## [1] "8"  " 8" " 9"

为了把拆分结果进一步转换成一个数值型矩阵,
可以使用sapply()函数如下:

t(sapply(res, as.numeric))
##      [,1] [,2] [,3]
## [1,]   10    8    7
## [2,]    5    2    2
## [3,]    3    7    8
## [4,]    8    8    9

sapply()函数是apply类函数之一,
稍后再详细进行讲解。

韭菜热线原创版权所有,发布者:风生水起,转载请注明出处:https://www.9crx.com/77953.html

(0)
打赏
风生水起的头像风生水起普通用户
上一篇 2023年10月30日 01:56
下一篇 2023年10月31日 00:16

相关推荐

  • 央行和投资者对黄金感兴趣

    上周世界黄金协会报告称,七月份各国央行继续增加全球黄金储备。世界黄金协会还强调,中国、波兰和土耳其是本月最大的黄金买家。 为什么央行对黄金感兴趣? 央行经常转向黄金,因为无论货币或地缘政治发展如何,它通常都能保持其价值。这可能是数据继续显示许多央行热衷于增加全球黄金储备的一个促成因素。 今年投资者也对黄金产生了兴趣。利用从Explorer平台获得的数据,我们…

    2023年9月20日
    18100
  • 美国就业人数增幅超过预期,而工资增长放缓

    作者:的Augusta Saraiva 美国八月份招聘人数有所增加,工资增长放缓,劳动力市场的韧性和温和性呈现出喜忧参半的景象。 美国劳工统计局周五发布的报告显示,在前两个月大幅下调后,非农就业人数增加了 187,000 人。失业率攀升至3.8%,主要反映了参与率的上升,而工资增长放缓。 报告显示,电影和货运行业的就业人数总共减少了 54,000 人,这主要…

    2023年9月7日
    13400
  • 当您的投资组合 100% 投资于股票,美股市场如何分散风险

    有读者问: 我今年34岁,风险承受能力较高。我所有的投资账户都是100%投资股票的。当我进行研究时,我很难找到一个经过验证的真实答案,那就是如何在大盘股、中盘股、国际市场、新兴市场等之间最好地分配我的股票投资。我不希望得到本身可能的最高回报(尽管那很好),相反,我希望拥有一个多元化的投资组合,让我能够接触股票市场的各个方面,以便我的长期回报率为 7%-10 …

    2023年7月24日
    15300
  • 北京大学R语言教程(李东风)第52章:Rcpp介绍

    为了提高R程序的运行效率,可以尽量使用向量化编程,减少循环,尽量使用内建函数。对于效率的瓶颈,尤其是设计迭代算法时,可以采用编译代码,而Rcpp扩展包可以很容易地将C++代码连接到R程序中,并且支持在C++中使用类似于R的数据类型。 没有学过C++语言的读者,如果需要编写比较独立的不太依赖于R的已有功能的算法,可以考虑学习使用Julia语言编写。Julia语…

    2023年12月16日
    23200
  • 北京大学金融时间序列分析讲义第25章: 协整分析与向量误差修正模型

    25.1 虚假回归问题 线性回归分析是统计学的最常用的模型之一,但是,如果回归的自变量和因变量都是时间序列,回归就不满足回归分析的基本假定:模型误差项独立同分布。 比如,一元线性回归模型 yt=a+bxt+et, t=1,2,…,n, 需要假定e1,e2,…,et不相关,零均值,方差同为σ2,x1,x2,…,xn非随机,这时最小二乘估计是无偏估计。 当lim…

    2023年8月7日
    47300

发表回复

登录后才能评论
客服
客服
关注订阅号
关注订阅号
分享本页
返回顶部