大师网-带你快速走向大师之路 解决你在学习过程中的疑惑,带你快速进入大师之门。节省时间,提升效率

R 学习笔记(3) -- 列表

R 中的向量要求元素都为同一类型,而列表不一样,列表可以组合不同类型的元素,类似于 Python 中的字典。

创建列表 list()

存储一个员工的姓名,薪资,是否为工会成员:

> j <- list(name="Joe", salary=55000, union=T)
> j
$name
[1] "Joe"

$salary
[1] 55000

$union
[1] TRUE

> # 有多种访问列表元素的方式,$/[[ ]] 都可以
> j$salary
[1] 55000
> # 标签 tag 也可以简写,只要不引起歧义,R 都可以识别
> j$sal
[1] 55000
> j[["salary"]]
[1] 55000
> # 也可以用数字索引的方式
> j[[2]]
[1] 55000
> # 列表也是一种向量,可以用以下方式创建
> z <- vector(mode="list")
> z[["abc"]] <- 3
> z
$abc
[1] 3

访问列表 lst 中的组件 c 的三种方法,返回的是 c 的数据类型:

  • lst$c
  • lst[["c"]]
  • lst[[i]] i 是组件 c 在 lst 中的数字索引

与后两种方法类似的列表操作还有:

  • lst["c"]
  • lst[i]

这两种操作返回的是一个新列表,是原列表的子列表。
列表索引单中括号与双重中括号的区别

> j[1:2]
$name
[1] "Joe"

$salary
[1] 55000

> j2 <- j[2]
> j2
$salary
[1] 55000

> class(j2)
[1] "list"
> str(j2)
List of 1
 $ salary: num 55000
> j3 <- j[[2]]
> j3
[1] 55000
> class(j3)
[1] "numeric"
> str(j3)
 num 55000
> # 双重中括号一次只能取一个列表组件
> j[[1:2]]
Error in j[[1:2]] : 下标出界

用单中括号对原列表取子集,返回子列表,用双重中括号取原列表组件,返回的是组件本身的类型,而不是列表。


增加或删除列表元素

列表创建之后可以增加新的组件,删除某个组件时将其重新赋值为 NULL 即可,删除一个组件之后,它之后的元素索引全部减 1:

> z <- list(a="abc",b=1)
> z
$a
[1] "abc"

$b
[1] 1

> z$c <- "test"
> z
$a
[1] "abc"

$b
[1] 1

$c
[1] "test"

> z[[4]] <- 123
> z
$a
[1] "abc"

$b
[1] 1

$c
[1] "test"

[[4]]
[1] 123

> z$b <- NULL
> z
$a
[1] "abc"

$c
[1] "test"

[[3]]
[1] 123

> # 用 c() 连接函数合并两个列表
> c(z,list(500))
$a
[1] "abc"

$c
[1] "test"

[[3]]
[1] 123

[[4]]
[1] 500

访问列表元素和值

names() 函数可直接获取列表各元素的名字,unlist() 函数去列表化,也可以得到列表各元素的值:

> j
$name
[1] "Joe"

$salary
[1] 55000

$union
[1] TRUE

> names(j)
[1] "name"   "salary" "union" 
> j[["name"]]
[1] "Joe"
> unj <- unlist(j)
> unj
   name  salary   union 
  "Joe" "55000"  "TRUE" 
> class(unj)
[1] "character"
> unname(unj)
[1] "Joe"   "55000" "TRUE"

unlist() 去列表化时,如果列表中元素类型不同,会转为可以最大限度保持不同组件特性的类型,例如本例中的字符串。
unname() 函数可以去除 unlist() 得到的向量的元素名字。


对列表使用 apply 函数

lapply() 就是 list apply,对列表作用的 apply 函数,得到的结果也是一个列表。
sapply() 就是 simplified apply,得到矩阵或向量形式的结果。

> L <- list(1:3,25:29)
> L
[[1]]
[1] 1 2 3

[[2]]
[1] 25 26 27 28 29

> lapply(L,median)
[[1]]
[1] 2

[[2]]
[1] 27

> sapply(L,median)
[1]  2 27

order() 函数对向量排序,返回的是排序后向量在原向量中的索引:

> x <- c(12,5,13,8)
> order(x)
[1] 2 4 1 3
> sort(x)
[1]  5  8 12 13

sort() 函数返回排序后的向量。


递归列表

列表可以是递归的,即列表的组件也是列表。
连接函数 c() 有一个可选参数 recursive 决定在拼接的时候是否把原列表压平,就是把所有组件的元素提取出来组成一个向量。

> list(a=1,b=2,c=list(d=5,e=9))
$a
[1] 1

$b
[1] 2

$c
$c$d
[1] 5

$c$e
[1] 9


> c(list(a=1,b=2,c=list(d=5,e=9)),recursive=T)
  a   b c.d c.e 
  1   2   5   9