pandas(一)基本数据结构

如题所述

第1个回答  2022-06-13
pandas 是基于 Numpy 构建的含有更高级数据结构和工具的数据分析包,可以快速地处理大规模数据。pandas主要有三种数据结构,所有的操作也都是基于这三种结构而来的。

这里,最常用的是二维的DataFrame表格型结构,其次是一维的Series序列型结构,至于三维的Panel实际使用情况较少,我们暂不讨论。在使用之前,别忘了导入包。

Series 是一种一维的数组结构,主要由索引(标签)和数据值组成,能够保存任何数据类型(整型,浮点型,字符串或其他Python对象类型)。其中,索引类似于数组的下标,只不过series的索引不仅可以是数字,还可以是字符串,日期等类型。而数据值部分,不要求所有元素的类型完全相同,可以是任意类型。下图所示的就是典型的Series结构,左边是字符索引,右边是对应的值,看起来好像竖起来的数组。

DataFrame是一个二维索引的数据结构,类似于表格型结构,它的列可以存在不同的类型。你可以把它简单的想成Excel表格或SQL Table,它的每个列都是一个Series结构。它是最常用的Pandas对象,没有之一。DataFrame主要由行索引,列索引和数据值三部分构成。与Series一样,DataFrame的索引类型是多样的,数据值的类型也不做限制。

Panel是一个三维结构,由DataFrame组成,使用较少,暂不讨论。
相似回答
大家正在搜