导入 .csv 文件
使用基础 R 导入
可以使用包含 read.table
的 read.csv
导入逗号分隔值文件(CSV),但使用 sep = ","
将分隔符设置为逗号。
# get the file path of a CSV included in R's utils package
csv_path <- system.file("misc", "exDIF.csv", package = "utils")
# path will vary based on installation location
csv_path
## [1] "/Library/Frameworks/R.framework/Resources/library/utils/misc/exDIF.csv"
df <- read.csv(csv_path)
df
## Var1 Var2
## 1 2.70 A
## 2 3.14 B
## 3 10.00 A
## 4 -7.00 A
用户友好的选项 file.choose
允许浏览目录:
df <- read.csv(file.choose())
笔记
- 与
read.table
不同,read.csv
默认为header = TRUE
,并使用第一行作为列名。 - 除非
as.is = TRUE
或stringsAsFactors = FALSE
,否则所有这些函数都会默认将字符串转换为factor
类。 read.csv2
变体默认为sep = ";"
和dec = ","
,用于来自以逗号用作小数点且分号作为字段分隔符的国家/地区的数据。
使用包导入
readr
软件包的 read_csv
功能提供了更快的性能,大文件的进度条,以及比标准 read.csv
更受欢迎的默认选项,包括 stringsAsFactors = FALSE
。
library(readr)
df <- read_csv(csv_path)
df
## # A tibble: 4 x 2
## Var1 Var2
## <dbl> <chr>
## 1 2.70 A
## 2 3.14 B
## 3 10.00 A
## 4 -7.00 A