excel数据处理基础实验内容与步骤(Excel处理临床数据基础篇)
excel数据处理基础实验内容与步骤(Excel处理临床数据基础篇)Ctrl S 保存文件 Ctrl X 剪切单元格数据 快捷键 作用 Ctrl C 复制单元格数据 Ctrl V 粘贴单元格数据
前面的推文分享了Excel数据录入的小技巧,当我们收集好原始临床数据后,一般不能直接拿来用,需要对原始数据进行初步处理,才能导入到统计软件(如SPSS、Stata、R等)中去。
今天介绍下Excel处理原始数据的基本技巧。
目 录
- 1. 熟练使用快捷键
- 2. 注意数据保存、备份和备注
- 3. 统一数据格式
- 4. 冻结窗格
- 5. 处理表头
- 6. 处理合并单元格
- 7. 选择性粘贴
- 8. 替换的用法
- 9. 处理不规范日期数据
- 10. 快速填充
- 11. 查找重复值
- 12. 查找异常值
- 13. 数据分列
- 14. 快速跳转到表格最后一行
- End
1. 熟练使用快捷键
要熟练使用快捷键来代替鼠标操作。
1.1 常见快捷键
快捷键 作用
Ctrl C 复制单元格数据
Ctrl V 粘贴单元格数据
Ctrl X 剪切单元格数据
Ctrl S 保存文件
Ctrl Z 撤销上一步操作
F4 重复上一步动作
注意:F4这个快捷键,它的作用就是重复你的上一步动作,在需要进行重复操作的时候要记得使用它。
1.2 其他快捷键
快捷键 作用
Ctrl A 选定整个工作表
Ctrl E 快速填充
Home 移到行首
Ctrl Home 移到工作表第一个单元格
Ctrl End 移到工作表最右下单元格
快捷键其实有很多,但是不想推荐太多快捷键,记住一些常用的就可以了。
2. 注意数据保存、备份和备注
在数据处理过程中,要时刻记得保存数据,要养成良好的习惯,不要过分相信自动保存功能,未必靠谱。
数据的备份是很重要的,在每一次进行数据处理前备份一份数据,方便回档。
在每次处理完数据后,记得在Excel里新建一个表用来备注处理的时间和处理的内容,方便以后可以回档查询。
处理完后的数据表文件可以以“处理时间-数据表名称-版本号(V1.5)”命名,。
3. 统一数据格式
统一数据表的字体、大小、对齐、颜色;
调整合适的行高和列宽,第一行变量名称可以适当调高一点,字体稍大一号,行高要统一,列宽根据变量内容调整;
不要使用颜色来标记行数据,表格弄得五颜六色,辣眼睛,而且人的记忆力有限,到最后你记不清啥颜色代表什么。
可以通过格式刷来快速统一格式。
4. 冻结窗格
一个好的临床数据库一般有几百甚至几千例病例,在处理数据时,经常要拖动右边的滚动条查看数据,拖到下面时,列标题一般就看不到了,怎么让列标题一直显示了? 这里就需要用到冻结窗格。
如上所示,冻结窗格有三种:同时冻结行与列;冻结首行;冻结首列。
比如你想使左边前三列和顶端前三行始终显示:
5. 处理表头
有的原始数据集在收集数据时,除了第一列显示变量名称之外,还在第二行添加变量解释,这个在收集数据时是可以的,但是在处理原始数据时需要简化表头,方便以后导入统计软件中。
处理方法:删除第二行的变量名称解释;修正变量名称,使其尽量通俗易懂、简单明了,变量名称不能太长,可以使用缩写;考虑到大多数统计软件是国外开发的软件,变量名称尽量使用英文等。
6. 处理合并单元格
临床原始数据表中,若存在合并单元格,就不能正常进行填充、筛选、透视表、公式等操作。
6.1 查找合并单元格
怎么快速查找出原始数据表中存在的合并单元格?
6.2 取消合并单元格
合并单元格不多的话,可以通过上面查到的单元格一个一个的取消合并;若是合并单元格数量很多,可以选中表格,点击取消单元格合并。
7. 选择性粘贴
在数据处理中,可能通过输入公式在新的一列中得到了一列新数值,怎么去掉新列单元格中的公式?
方法:复制包含公式的新列,然后在空白列鼠标右键选择选择性粘贴-粘贴数值-值和源格式。
8. 替换的用法
如下图所示,左边的列怎么快速转换为右边的列?
使用替换可以快速完成上面的转换。
9. 处理不规范日期数据
在前面讲过,Excel中日期型数据接受的输入格式为2009-03-05或2009/03/05,对于不符合规范的日期格式怎么快速转换为规范格式。
不规范的日期数据格式
对于使用小数点或其他连接符号来表示的日期数据如2009.03.05或2009。03。05,通过替换功能将小数点或其他符号替换为/或-。
通过上述替换基本可以将大部分不规范日期数据转换为规范数据。但是对于没有连接符表示的日期数据如20090305,你替换不了,该怎么处理?
使用分列方法:
还有一些格式如03052009(月日年)、03052009(日月年)也可以使用上面分列的方法。
如果还有一些我没提到的奇葩格式,那就不要转换了,捶死那个收集数据的人。
10. 快速填充
在临床数据中,可能需要将连续性变量转换为分类变量,怎么快速实现转换?
在连续性变量旁边新建一列,通过数字筛选功能选择连续变量不同的范围,然后在新建列使用快速填充功能填充分类变量。
11. 查找重复值
怎么快读查找一列数据中的重复数据,比如说,住院号一般是唯一的,对于多次住院的患者,可能自取第一次分析,怎么快速找出这些重复的住院号。
这样重复的数据会显示出颜色,然后根据列的筛选-排序就可以快速找出重复值。
12. 查找异常值
在原始数据收集过程中,难免会出现差错,导致数据录入错误,比如:小数点没输或输成逗号;变量数据值过大;联系电话位数不对;缺失值的存在等等。
怎么快速找出这些异常值?
通过筛选-排序,拖动筛选中的滚动条来查看哪些变量存在缺失值、异常值;勾选异常值,需要修正的修正。
13. 数据分列
对于日期型数据如2009/03/05,有时我们需要其中的月份用来分析,怎么快速新建一列放置月份数据?
还是使用分列的方法,经过前面不规范日期数据的处理,默认整列数据全部是规范日期数据。
14. 快速跳转到表格最后一行
在数据处理中,经常来回需要拉动滚动条查看表格的最后一行或者最右边一列,然后再回到第一行,鼠标来回拉动滚动条费时费力,怎么快速实现这种操作了?
方法:选中任意单元格,鼠标放在单元格的边框上面: 双击下边框,跳转到表格最后一行; 双击上边框,跳转到表格第一行; 双击左边框,跳转到表格最左边列; 双击右边框,跳转到表格最右边列。