您现在的位置:   首页 >> 新闻中心 >> 数据分析

如何七周成为数据分析师19:Python的数据结构

发布人:www.yunke.ai 发布时间:2021-01-01 146 次浏览

本文是《如何七周成为数据分析师》的第十九篇教程,如果想要了解写作初衷,可以先行阅读七周指南。温馨提示:如果您已经熟悉Python,大可不必再看这篇文章,或只挑选部分。

Python一共有三大数据结构,它是Python进行数据分析的基础,分别是tuple元组,list数组以及dict字典。本文通过这三者的学习,打下数据分析的基础。

数组

数组是一个有序的集合,他用方括号表示。

image.png

num就是一个典型的数组。数组不限定其中的数据类型,可以是整数也可以是字符串,或者是混合型。

数组可以直接用特定的函数,函数名和Excel相近。

image.png

sum是求和,len则是统计数组中的元素个数。

上述列举的函数是数组内整体元素的应用,如果我只想针对单一的元素呢?比如查找,这里就要用到数组的特性,索引。索引和SQL中的索引差不多,都是用来指示数据所在位置的逻辑指针。数组的索引便是元素所在的序列位置。

image.png

注意,索引位置是从0开始算起,这是编程语言的默认特色了。num[0]指数组的第一个元素,num[1]指数组的第二个元素。

我们用len()计算出了数组元素个数是5,那么它**一个元素的索引是4。若是数组内的元素特别多呢?此时查找数组**一位的元素会有点麻烦。Python有一个简易的方法,可以用负数表示,意为从**一个数字计算索引。

image.png

这里的num[4]等价于num[-1],num[-2]则指倒数第二个的元素。

再来一个新问题,如何一次性选择多个元素?例如筛选出数组前三个元素。在Python中,用:表示范围。

image.png

num[0:3]筛选了前三个元素,方括号左边是闭区间,右边是开区间,所以这里是num[0],num[1]和num[2],并不包含num[3]。这个方法叫做切片。

image.png

上述是索引的特殊用法,[0:]表示从第0个索引开始,直到**一个元素。[:3]表示从第一个元素开始,直到第3个索引。

image.png

负数当然也有特殊用法。[-1:]表示从**一个元素开始,因为它已经是**一个元素了,所以只返回它本身。[:-1]表示从第一个元素开始到**一个元素。num[-2:-1]和num[-3:-1]大同小异。