excel是什么意思?(浅谈excel基本用法)

wufei123 发布于 2024-01-16 阅读(158)

目前excel是日常工作中最常用的办公工具,如果不考虑性能和数据量,它可以应付绝大部分的分析工作,所以学好excel是进入数据分析最快的捷径以前一直觉得自己的excel还一般,能运用基本的公式图表,但通过这段时间的学习,发现还有很多细节和功能平时都被忽略,其功能的强大,值得我们勤于思考,不断求索。

首先如果运营excel做数据分析的基本步骤要清晰。经总结规律所有的数据分析步骤轮廓一致,大致分为五个步骤。数据分析基本步骤:

首先提出问题,明白数据分析的目的;其次理解数据,即解读数据行和列的数据含义,同时认识单元格的类型,目前单元格只分为三种类型,即字符串(文本型)、即文字符号或者左上角带绿三角的数字数值型即数字货币日期等逻辑型只包含两种类型即true和false。

还有一点需要注意的是一般文本形式的数据在单元格一般靠左,数值型(即可以用来运算)的数据一般在单元格靠右第三,数据清洗,即对数据进行清扫,此步骤可贯穿整个数据分析过程,包括后期构建完数据模型也要检查清理数据,保证数据的完整性,一致性和精简准确性。

数据清洗还包含七个步骤,基本的步骤包括删除重复值,补全缺失值,数据一致化处理及排序实际操作中常运用到很多excel的基本功能运用,以下以实际案例为例,从网上爬取到一部分数据,想要分析出在哪个城市得到的数据分析工作机会多,同时分析薪水如何和根据工作经验的变化薪酬的变动趋势。

首先我们要对数据进行清理,隐藏不需要的,删除重复的,补全缺失的。在此分析中职位ID是唯一可以区分是否重复的列,所以选择按以下步骤操作即可删除重复项。

删除重复项后还需检查所有列的数据是否与职位ID的数据量一致,如若不一致需补全此处补全数据的方式有很多种,例如删除缺失的行、用平均值代替缺失值、用统计模型算出的值代替缺失值此处可运用填充的技巧,即先选定所有空白单元格,直接输入上海。

补全完后,检查数据的一致性例如此实践中公司所属领域有多个领域,用逗号分开,这种格式是不一致的,会影响后面的数据分析结果,我们需要对这样的数据进行统一的命名和处理此处运用excel的分列功能需要注意的是分列功能会覆盖掉右列单元格,所以我们要先复制这一列到最后一个空白列的地方,再进项分列。

具体的分列步骤如下图,最后点击确认即可

此时数据清洗已经完成大半,回到实践的问题,哪个城市的工作机会更多,之前已经补全所有行的城市,便于后期数据分析处理第二个问题薪水如何,实际爬取出的薪水列是字符串的个区间,要分析一组大量数据的整体情况在前面统计学里有提过,一般用平均值来表达一组数据整体情况。

所以接下来我们要对薪资这列数据进行处理文本形式中9k-15k要计算出平均薪资,必须分列开成两列最低薪资及最高薪资,一般处理这种拆分文本成数值的有两种形式,第一种运用分列和替代功能,第二种方式运用函数文本方式。

注意不论是运用哪种方式提取完了之后检查数据返回值是否有错误值,如果有根据错误提示更改,例如本实践中方式一会遇到原本薪资列中大写的K无法被后期替换规则中小写k替换掉,方式二中会遇到提取不到最大值,但是没有关系,所有的问题都有解决办法,只要善于思考,勤于变通,evething is so easy!。

第二种方式运用函数提取数值的形式。一般运用提取字符段的函数有left、mid、right,这里顺便也学习了一下所有文本函数基本所有的文本函数都包含下图中。

回到此次实践的提取最低薪资和最高薪资运用以上图片中的文本函数即可,此处比较简单,不做过多赘述。

值得一提的是计算平均值,平时工作中虽经常运用公式,但总是找或者手输公式,容易记错单词或者耗时去找,此次竟然发现可以用中文搜索可以说相当方便了,学无止境啊,革命尚未成功,同志还需细心。

同时也要注意用函数公司提取的数字并非真正的数字类型,这里也可以通过上面提到过的字符形式的数值一般在单元格中靠左,数值型的数字在单元格中一般在单元格中靠右,可以通过复制粘贴成值,再通过分列功能将字符串形式的数字转换成数值型的类型,之后即可计算平均数。

数据经过处理之后就可以进行分析使用了,例如对平均薪水进行排序,排序的时候为了让前面所有数据一起变化,需要选择所有列,这里需要注意如果平均薪水之前有空白列,只会选择到从平均薪水开始往左连续的列进行排序,所以操作中一定要注意表格的完整性。

到此数据清理基本完成,回顾我们做的逻辑,数据的第一步是选择将不需要的隐藏掉,第二步将命名不清晰的列重新命名,第三步用职位ID对重复数据进行删除,第四部使用excel的条件定位功能快速查到缺失值并进行处理,第五步一致化处理数据,对公司所属领域使用分列功能进行处理,对薪水范围使用字符串截取函数提取出最低薪水和最高薪水,第六步对数据进行排序。

下面进行最后一步异常值处理,本次实践中主要是查找到职位名称中一些不属于数据分析的职位名称查到并清理掉这里运用数据组的函数查找功能

这里运用的组合函数不多做赘述,可参考以下图片。

到这里就完成了所有数据的清洗,接下来我们需要筛选出“是的”的选项,需要注意的是必须将筛选出的数据表复制粘贴到新建的表中,以便后期数据透视表的操作,因为数据透视表的操作中会对所有数据进行同时不得不提一句在对数据进行分析的时候主要使用excel的数据透视表进行分析。

第四步是构建模型,构建模型的过程实际就是数据处理的过程,通过此步得到第一步的问题答案,也是数据分析最关键的一步;首先看第一个问题,在哪些城市找到数据分析师的工作机会比较大。

同时也可以分析出在这些城市中工作经验对机会的相关程度。

当然也可以用百分比来表示会更清晰一点。

再来看第二个问题,薪水的问题,此处需要先安装excel的数据分析功能,单击左上角的选项文件下的选项。

最后得到如下结果:

也可以在数据透视表中的到每个城市的平均薪水,在列的值区域右击,在值汇总数据中选择平均值即可。

最后一步即数据可视化,数据的可视性除了数据的准确性还需遵循两个原则,第一通俗易懂,第二配色舒服这部分内容设置到各种图标及审美品位,但实际应用中还得根据项目内容使用恰当的可视化形式 以上的数据分析的基本操作,实际应用中要根据遇到的问题实际解决,但基本逻辑不变。

excel还有很多功能值得我们去研究,简单举几个例子,对日期数据的处理,vlookup的用法经常需要掌握统一日期格式、数据透视表中按月汇总数据、如何使用数据透视表计算每个月的最大值首先日期格式比较简单,先用分列格式分列。

如果还有带时间点的没分列完可用单元格自定义日期操作。

实际应用中按月汇总也比较简单,可以直接在行标签下的任意一个单元格右击组合,按月分类即可每个月的最大值,即列值区域任意右击选择汇总方式为最大值即可 excel中还有一个应用率比较高的vlookup基本功能比较简单,主要是需要掌握重复数据如何获取查找和模糊查找的具体应用。

这个也要根据实际应用,第一个问题需要利用添加列作为唯一识别进行识别第二个模糊应用一般应用于数据分组,应用方法跟精确查找方法一致,具体应用如下图:

excel的功能还特别多,以上仅仅是一小部分,赶着下班前一分钟更完,好险,下次再来~

亲爱的读者们,感谢您花时间阅读本文。如果您对本文有任何疑问或建议,请随时联系我。我非常乐意与您交流。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。