文件的读写20230204_全球独家

日期：2023-02-13 11:07:44 来源：腾讯云

一、csv的打开方式

a）默认：excel

b）记事本

c）适用大文件：sublime

(相关资料图)

d）R语言 >read.csv(" ") 注意文件的位置，选择相对路径还是绝对路径

二、文件的读入与导出

（1）文件读入

1⃣️ 常用于读取csv格式：read.csv(" " )

2⃣️ 常用于读取txt格式： read.table(" " )

ps(相关读取文件代码的比较):

read.table(file, header = FALSE, sep = "", quote = "\"" ...). 默认没有标题，分隔符是空格 read.csv(file, header = TRUE, sep = ",", quote = "\" ...)。默认有标题，分隔符是“，”read.csv2(file, header = TRUE, sep = ";", quote = "\" ...) 默认有标题，分隔符是“ ；”read.delim(file, header = TRUE, sep = "\t", quote = "\" ...) 默认有标题，分隔符是“\t”(制表符)

（2）文件导出

1⃣️ 导出csv格式: write.csv(要导出数据框的变量名, file=" example.csv"). example是自己设置的名称

2⃣️ 导出txt格式：write.table(要导出的变量名,file="example.txt")

⚠️注意事项：导出文件时命名最好不要与原文件相同，不然会覆盖，导致原始数据丢失

（3）特殊文件的保存和加载： Rdata

‼️Rdata保存的是变量信息，不是文件！！因此不能x=load("example.Rdata"),变量不能被赋值给其他变量。

保存：save(test,file="example.Rdata)

加载：load("example.Rdata")

总结：

1）.R 是脚本文件

2）.Rdata 是变量信息

3）.Rproj 是包括路径

三、保留列名和行名

保留列名：header=T, 表格自带的列名会变成真正的列名。

ex1<-read.table("ex1.txt")

ex1<-read.table("ex1.txt",header=T)

保留行名：row.names=1，行名也会自动变成真正的行名

ex2 <- read.csv("ex2.csv")

ex2 <- read.csv("ex2.csv",row.names = 1,check.names = F)

ps: check.names=F 使行名与原始一致。

⚠️注意事项：当使用row.names=1时，行名不允许重复

> rod = read.csv("rod.csv",row.names = 1)Error in read.table(file = file, header = header, sep = sep, quote = quote,  :   duplicate "row.names" are not allowed> rod = read.csv("rod.csv")> View(rod)

列名重复，故不能使用row.names=1

四、不完整表格的读入

> soft <- read.table("soft.txt") #报错是表格有一列没有值Error in scan(file = file, what = what, sep = sep, quote = quote, dec = dec,  :   line 2 did not have 5 elements

报错显示：表格第二行没有五个元素，那为什么没有五个元素会报错呢？可以先用excel打开文件看一下

发现果然是从第二行开始第五列都没有数据

> soft <- read.table("soft.txt",header = T,fill = T)

通过搜索发现了fill=T 这个函数，可以在有缺失值的情况下正常读入文件。

但是从826行开始我们发现读入的数据与原表不符合。

原表(空出一列）

因此可以得知，fill=T虽然可以读入文件，但是也会导致“问题文件”的读入错误，因为它的默认值是sep=" ",会把一整个空格认为也是分隔符，导致第五列的内容被错误的放入了空着的第四列。

>soft2 <- read.table("soft.txt",header = T,sep = "\t")>View(soft2)

加上sep="\t"，只会识别一个制表符作为分割，因此可以识别空列

总结：用于读取/导出文件的R包

base包(常用）:

read.table() read.csv() read.delim()

write.table() write.csv()

(以下读的速度比较快，适用于大文件)

readr包：

read_table() read_csv() read_tsv()

write_table() write_csv()

（看看read_csv的用法）

> library(readr)> read_csv("ex2.csv")

发现read_csv给出了一些数据框的概况

发现数据类型也变成双精度浮点数，保留了小数点一位

data.table包：

fread（）

1）非常方便，可以准确读取一些“问题文件”，例如刚刚有缺失空列的soft.txt，最好带上参数 data.table=F,可以确保产生干净的数据框。

> soft_1<-data.table::fread("soft.txt",data.table = F)

(非常方便，不需要乱七八糟的参数，可以读出复杂的文件）

rio包：

1) import() 可以读入一些后缀不正确的包

eg：首先设置了一个txt文件并把后缀改成mp4，使用普通音频文件打开方式会失败。

分别使用read.table 和read.csv 读取，都可以读取但出现了warning

接下来就可以使用import()函数！！

> import("xh.mp4")Error: Format not supported  #但是直接import出现了Error，考虑需要加一个参数

> import("xh.mp4",format = " ")Error: Format not supported   #课上小结老师开始使用的format参数设置为空格也报错了> import("xh.mp4",format = "\t")  #但是使用"\t"就成功了 V1         V2 1 gjl 2018150012 2 ljh 2017153034

> import("xh.mp4",format = ";")   V1         V21 gjl 20181500122 ljh 2017153034> import("xh.mp4",format = "|")   V1         V2 1 gjl 2018150012 2 ljh 2017153034  > import("xh.mp4",format = ",")    V1         V2  1 gjl 2018150012  2 ljh 2017153034

(根据帮助手册，发现好像";" "|" "," 都可以使用，但是会不会和我之前设置文档分割是空格有关,因此我又把文档的分隔换成";"

重新设置分隔为“；”

⚠️⚠️发现原本的分隔符确实可以原原本本的展现，由此可得format的参数可以为“，”（逗号），“｜”（管道符），“；”（分号），“\t”（制表符）

2） import_list() 可以读取一个带有多个工作簿的表格文件

>a<-import_list("example.xlsx")>a$sheet1  #可以通过$sheet读取这个表格文件的不同工作簿

3）export() 可以把一个由多个数据框组成的列表输出为带有多个工作簿的表格文件

ps：如果单个数据框导出，可以把后缀改成.csv.

标签：文件存储 HTML 编程算法

上一篇：当前热点-《简言的夏冬》一开始,就用了一个字幕,展示了一个叫做商务调查的概念

下一篇：最后一页

投资促进

展览展示

13 2023-01

2022年江苏省用电量达7399.5亿千瓦时同比增长4.2%

精彩推送

申城明天有中雨记得带伞下周阳光回归今日热搜

2023-02-08

我的歌声里吉他谱

2023-02-08

如何管理鼠标右键菜单_怎么管理鼠标右键菜单

2023-02-08

不当使用除草机阿伯眼睛受伤险失明环球简讯

2023-02-08

袁隆平的主要事迹及贡献简介_袁隆平事迹简短的事例-世界短讯

2023-02-08

完成领导交办的各项工作任务情况_完成领导交办的各项工作任务|聚看点

2023-02-08

马斯克：特斯拉宏伟蓝图第三篇章将于3月1日公布

2023-02-08

【天天聚看点】出现反义词是什么意思_出现反义词

2023-02-08

今日快讯：小学教师师德师风学习体会

2023-02-08

拜登发表国情咨文演讲，系共和党入主众议院后首次_天天速读

2023-02-08

今日热门!科技部正式批复建设国家区块链技术创新中心

2023-02-08

西亚斯国际学院图书馆简介全球今亮点

2023-02-08

当前速读：清洗女死尸_清洗女死尸图片

2023-02-08

全球热头条丨电信网费一个月多少钱怎么安装宽带？

2023-02-08

入团介绍人意见范文50_入党介绍人转正意见范文

2023-02-08

意大利杯半决赛时间安排：北京时间4月5日凌晨3点尤文VS国米

2023-02-08

太阳是什么星-焦点速读

2023-02-08

从工业机器人到民生领域“机器人+” 应用智能制造加速发展

2023-02-07

文本格式都有什么环球快消息

2023-02-07

曼城因祸得福，输给曼联之后，推动英超改革，再见黑哨要闻速递

2023-02-07

SP@梨泰院宾馆-每日热讯

2023-02-07

23农业银行CD001今日发布发行公告

2023-02-07

农历闰二月多少年一次_闰二月多少年一次-热资讯

2023-02-07

关于苹果的资料播报

2023-02-07

那个唱《理想三旬》的少年，终于不漂了

2023-02-07

今日热文：嘉宾访谈 | 放疗副作用大？癌症患者都可以放疗？听长沙珂信肿瘤医院朱道奇博士谈放疗

2023-02-07

每日快播：科目三怎么在网上交补考费_科目三补考费网上缴费

2023-02-07

凤形股份董秘回复：公司电机主要用于各类运输船类等，根据船只规模情况进行定制，公司目前在手订单稳定

2023-02-07

七夕·未会牵牛意若何

2023-02-07

南宁市区周边一日游最佳景点_南宁市一日游必去景点|世界聚焦

2023-02-07

世界微资讯！张铁林现任老婆的简介_张铁林现任老婆

2023-02-07

小学生对自己的寄语与希望_小学生对自己的寄语

2023-02-06

金园实验中学学费_金园实验中学

2023-02-06

怎样使用对讲机图解_对讲机怎么用图解天天通讯

2023-02-06

证券板块跌1.17% 信达证券涨10.01%居首天天快播

2023-02-06

今天最新消息全球网络犯罪急需强化协同打击_世界速讯

2023-02-06

2022年江苏省用电量达7399.5亿千瓦时同比增长4.2%

2023-01-13

快递保价纠纷频发的背后快递物流业保价规则亟需官方出面制定

2022-09-15

广州公安户政部门深化“放管服” “跨省办”范围更广泛

2022-04-01

江苏徐州疫情防控升级：“静下来”延长一周至4月9日零时

2022-04-01

4月1日0至16时福建新增本土确诊8例、本土无症状感染者42例

2022-04-01

陕西铜川一地调整为低风险区调整后全市无中高风险地区

2022-04-01

中国首例以合理许可费确定损失数额案件宣判

2022-04-01

吉林市“无疫小区”可根据疫情形势优先解封

2022-04-01

中国储备粮管理集团有限公司安徽分公司副总经理胡群接受审查调查

2022-04-01

哈尔滨新增8例本土新冠病毒阳性感染者活动轨迹公布

2022-04-01

山东日照莒县新增本土阳性感染者3例详情公布

2022-04-01

中国气象局：清明假期大部地区雨少温高需防范火灾隐患

2022-04-01

“火焰蓝”变身“大白”战斗在一线

2022-04-01

民航局对七个入境航班发出熔断指令

2022-04-01

文件的读写20230204_全球独家

一、csv的打开方式

二、文件的读入与导出

（1）文件读入

（2）文件导出

（3）特殊文件的保存和加载： Rdata

总结：

三、保留列名和行名

ps: check.names=F 使行名与原始一致。

四、不完整表格的读入

因此可以得知，fill=T虽然可以读入文件，但是也会导致“问题文件”的读入错误，因为它的默认值是sep=" ",会把一整个空格认为也是分隔符，导致第五列的内容被错误的放入了空着的第四列。

总结：用于读取/导出文件的R包

base包(常用）:

(以下读的速度比较快，适用于大文件)

readr包：

data.table包：

rio包：

⚠️⚠️发现原本的分隔符确实可以原原本本的展现，由此可得format的参数可以为“，”（逗号），“｜”（管道符），“；”（分号），“\t”（制表符）

2） import_list() 可以读取一个带有多个工作簿的表格文件

3）export() 可以把一个由多个数据框组成的列表输出为带有多个工作簿的表格文件

快递保价纠纷频发的背后 快递物流业保价规则亟需官方出面制定

清明假期全国大面积放晴 北方多地气温将创新高

辽宁新增2例本土新冠肺炎确诊病例、61例本土无症状感染者

黑龙江新增本土确诊病例16例、本土无症状感染者17例

天津市新增1例本土确诊病例、3例本土无症状感染者

北京新增2例境外输入确诊病例和4例无症状感染者

申城明天有中雨记得带伞 下周阳光回归 今日热搜

我的歌声里吉他谱

如何管理鼠标右键菜单_怎么管理鼠标右键菜单

不当使用除草机 阿伯眼睛受伤险失明 环球简讯

袁隆平的主要事迹及贡献简介_袁隆平事迹简短的事例-世界短讯

完成领导交办的各项工作任务情况_完成领导交办的各项工作任务|聚看点

马斯克：特斯拉宏伟蓝图第三篇章将于3月1日公布

【天天聚看点】出现反义词是什么意思_出现反义词

今日快讯：小学教师师德师风学习体会

拜登发表国情咨文演讲，系共和党入主众议院后首次_天天速读

今日热门!科技部正式批复建设国家区块链技术创新中心

西亚斯国际学院图书馆简介 全球今亮点

当前速读：清洗女死尸_清洗女死尸图片

全球热头条丨电信网费一个月多少钱 怎么安装宽带？

入团介绍人意见范文50_入党介绍人转正意见范文

意大利杯半决赛时间安排：北京时间4月5日凌晨3点尤文VS国米

太阳是什么星-焦点速读

从工业机器人到民生领域“机器人+” 应用 智能制造加速发展

文本格式都有什么 环球快消息

曼城因祸得福，输给曼联之后，推动英超改革，再见黑哨 要闻速递

SP@梨泰院宾馆-每日热讯

23农业银行CD001今日发布发行公告

农历闰二月多少年一次_闰二月多少年一次-热资讯

关于苹果的资料 播报

那个唱《理想三旬》的少年， 终于不漂了

今日热文：嘉宾访谈 | 放疗副作用大？癌症患者都可以放疗？听长沙珂信肿瘤医院朱道奇博士谈放疗

每日快播：科目三怎么在网上交补考费_科目三补考费网上缴费

凤形股份董秘回复：公司电机主要用于各类运输船类等，根据船只规模情况进行定制，公司目前在手订单稳定

七夕·未会牵牛意若何

南宁市区周边一日游最佳景点_南宁市一日游必去景点|世界聚焦

世界微资讯！张铁林现任老婆的简介_张铁林现任老婆

小学生对自己的寄语与希望_小学生对自己的寄语

金园实验中学学费_金园实验中学

怎样使用对讲机图解_对讲机怎么用图解 天天通讯

证券板块跌1.17% 信达证券涨10.01%居首 天天快播

今天最新消息 全球网络犯罪急需强化协同打击_世界速讯

2022年江苏省用电量达7399.5亿千瓦时 同比增长4.2%

快递保价纠纷频发的背后 快递物流业保价规则亟需官方出面制定

广州公安户政部门深化“放管服” “跨省办”范围更广泛

江苏徐州疫情防控升级：“静下来”延长一周至4月9日零时

4月1日0至16时福建新增本土确诊8例、本土无症状感染者42例

陕西铜川一地调整为低风险区 调整后全市无中高风险地区

中国首例以合理许可费确定损失数额案件宣判

吉林市“无疫小区”可根据疫情形势优先解封

中国储备粮管理集团有限公司安徽分公司副总经理胡群接受审查调查

哈尔滨新增8例本土新冠病毒阳性感染者 活动轨迹公布

山东日照莒县新增本土阳性感染者3例 详情公布

中国气象局：清明假期大部地区雨少温高 需防范火灾隐患

“火焰蓝”变身“大白”战斗在一线

民航局对七个入境航班发出熔断指令

快递保价纠纷频发的背后快递物流业保价规则亟需官方出面制定

清明假期全国大面积放晴北方多地气温将创新高

申城明天有中雨记得带伞下周阳光回归今日热搜

不当使用除草机阿伯眼睛受伤险失明环球简讯

西亚斯国际学院图书馆简介全球今亮点

全球热头条丨电信网费一个月多少钱怎么安装宽带？

从工业机器人到民生领域“机器人+” 应用智能制造加速发展

文本格式都有什么环球快消息

曼城因祸得福，输给曼联之后，推动英超改革，再见黑哨要闻速递

关于苹果的资料播报

那个唱《理想三旬》的少年，终于不漂了

怎样使用对讲机图解_对讲机怎么用图解天天通讯

证券板块跌1.17% 信达证券涨10.01%居首天天快播

今天最新消息全球网络犯罪急需强化协同打击_世界速讯

2022年江苏省用电量达7399.5亿千瓦时同比增长4.2%

快递保价纠纷频发的背后快递物流业保价规则亟需官方出面制定

陕西铜川一地调整为低风险区调整后全市无中高风险地区

哈尔滨新增8例本土新冠病毒阳性感染者活动轨迹公布

山东日照莒县新增本土阳性感染者3例详情公布

中国气象局：清明假期大部地区雨少温高需防范火灾隐患