Python大数据之pandas快速入门(二)_网站优化分享

您的位置：上海毫米网络优化公司 > 网站优化分享 >

文章目录

3. DataFrame 的行列标签和行列位置编号

3.1 DataFrame 的行标签和列标签
3.2 DataFrame 的行位置编号和列位置编号
4. DataFrame 获取指定行列的数据

4.1 loc函数获取指定行列的数据
4.2 iloc函数获取指定行列的数据
4.3 loc和iloc的切片操作
4.4 [] 语法获取指定行列的数据

总结

3. DataFrame 的行列标签和行列位置编号

3.1 DataFrame 的行标签和列标签

1）如果所示，分别是 DataFrame 的行标签和列标签

Python大数据之pandas快速入门(二),img,第1张

2）获取 DataFrame 的行标签

# 获取 DataFrame 的行标签
china.index

Python大数据之pandas快速入门(二),img,第2张

3）获取 DataFrame 的列标签

# 获取 DataFrame 的列标签
china.columns

Python大数据之pandas快速入门(二),img,第3张

4）设置 DataFrame 的行标签

# 注意：DataFrame设置行标签时，并不会改变原来的DataFrame，而是返回的副本
china_df = china.set_index('year')

Python大数据之pandas快速入门(二),img,第4张

3.2 DataFrame 的行位置编号和列位置编号

DataFrame 除了行标签和列标签之外，还具有行列位置编号。

行位置编号：从上到下，第1行编号为0，第二行编号为1，…，第n行编号为n-1

列位置编号：从左到右，第1列编号为0，第二列编号为1，…，第n列编号为n-1

Python大数据之pandas快速入门(二),img,第5张

注意：默认情况下，行标签和行位置编号是一样的。

4. DataFrame 获取指定行列的数据

以下示例都使用加载的 gapminder.tsv 数据集进行操作，注意将 year 这一列设置为行标签。

Python大数据之pandas快速入门(二),img,第6张

4.1 loc函数获取指定行列的数据

基本格式：

语法	说明
df.loc[[行标签1, ...], [列标签1, ...]]	根据行标签和列标签获取对应行的对应列的数据，结果为：DataFrame
df.loc[[行标签1, ...]]	根据行标签获取对应行的所有列的数据结果为：DataFrame
df.loc[:, [列标签1, ...]]	根据列标签获取所有行的对应列的数据结果为：DataFrame
df.loc[行标签]	1）如果结果只有一行，结果为：Series 2）如果结果有多行，结果为：DataFrame
df.loc[[行标签]]	无论结果是一行还是多行，结果为DataFrame
df.loc[[行标签], 列标签]	1）如果结果只有一列，结果为：Series，行标签作为 Series 的索引标签 2）如果结果有多列，结果为：DataFrame
df.loc[行标签, [列标签]]	1）如果结果只有一行，结果为：Series，列标签作为 Series 的索引标签 2）如果结果有多行，结果为DataFrame
df.loc[行标签, 列标签]	1）如果结果只有一行一列，结果为单个值 2）如果结果有多行一列，结果为：Series，行标签作为 Series 的索引标签 3）如果结果有一行多列，结果为：Series，列标签作为 Series 的索引标签 4）如果结果有多行多列，结果为：DataFrame

演示示例：

示例1：获取行标签为 1952, 1962, 1972 行的 country、pop、gdpPercap 列的数据
示例2：获取行标签为 1952, 1962, 1972 行的所有列的数据
示例3：获取所有行的 country、pop、gdpPercap 列的数据
示例4：获取行标签为 1957 行的所有列的数据
示例5：获取行标签为 1957 行的 lifeExp 列的数据

示例实现：

1）示例1：获取行标签为 1952, 1962, 1972 行的 country、pop、gdpPercap 列的数据

# 示例1：获取行标签为 1952, 1962, 1972 行的 country、pop、gdpPercap 列的数据
china_df.loc[[1952, 1962, 1972], ['country', 'pop', 'gdpPercap']]

Python大数据之pandas快速入门(二),img,第7张

2）示例2：获取行标签为 1952, 1962, 1972 行的所有列的数据

# 示例2：获取行标签为 1952, 1962, 1972 行的所有列的数据
china_df.loc[[1952, 1962, 1972]]

Python大数据之pandas快速入门(二),img,第8张

3）示例3：获取所有行的 country、pop、gdpPercap 列的数据

# 示例3：获取所有行的 country、pop、gdpPercap 列的数据
china_df.loc[:, ['country', 'pop', 'gdpPercap']]

Python大数据之pandas快速入门(二),img,第9张

4）示例4：获取行标签为 1957 行的所有列的数据

# 示例4：获取行标签为 1957 行的所有列的数据
china_df.loc[1957]

Python大数据之pandas快速入门(二),img,第10张

# 示例4：获取行标签为 1957 行的所有列的数据
china_df.loc[[1957]]

Python大数据之pandas快速入门(二),img,第11张

5）示例5：获取行标签为 1957 行的 lifeExp 列的数据

# 示例5：获取行标签为 1957 行的 lifeExp 列的数据
china_df.loc[[1957], 'lifeExp']
或
china_df.loc[1957, ['lifeExp']]
或
china_df.loc[1957, 'lifeExp']

Python大数据之pandas快速入门(二),img,第12张

4.2 iloc函数获取指定行列的数据

基本格式：

语法	说明
df.iloc[[行位置1, ...], [列位置1, ...]]	根据行位置和列位置获取对应行的对应列的数据，结果为：DataFrame
df.iloc[[行位置1, ...]]	根据行位置获取对应行的所有列的数据结果为：DataFrame
df.iloc[:, [列位置1, ...]]	根据列位置获取所有行的对应列的数据结果为：DataFrame
df.iloc[行位置]	结果只有一行，结果为：Series
df.iloc[[行位置]]	结果只有一行，结果为：DataFrame
df.iloc[[行位置], 列位置]	结果只有一行一列，结果为：Series，行标签作为 Series 的索引标签
df.iloc[行位置, [行位置]]	结果只有一行一列，结果为：Series，列标签作为 Series 的索引标签
df.iloc[行位置, 行位置]	结果只有一行一列，结果为单个值

演示示例：

示例1：获取行位置为 0, 2, 4 行的 0、1、2 列的数据
示例2：获取行位置为 0, 2, 4 行的所有列的数据
示例3：获取所有行的列位置为 0、1、2 列的数据
示例4：获取行位置为 1 行的所有列的数据
示例5：获取行位置为 1 行的列位置为 2 列的数据

示例实现：

1）示例1：获取行位置为 0, 2, 4 行的 0、1、2 列的数据

# 示例1：获取行位置为 0, 2, 4 行的 0、1、2 列的数据
china_df.iloc[[0, 2, 4], [0, 1, 2]]

Python大数据之pandas快速入门(二),img,第13张

2）示例2：获取行位置为 0, 2, 4 行的所有列的数据

# 示例2：获取行位置为 0, 2, 4 行的所有列的数据
china_df.iloc[[0, 2, 4]]

Python大数据之pandas快速入门(二),img,第14张

3）示例3：获取所有行的列位置为 0、1、2 列的数据

# 示例3：获取所有行的列位置为 0、1、2 列的数据
china_df.iloc[:, [0, 1, 2]]

Python大数据之pandas快速入门(二),img,第15张

4）示例4：获取行位置为 1 行的所有列的数据

# 示例4：获取行位置为 1 行的所有列的数据
china_df.iloc[1]

Python大数据之pandas快速入门(二),img,第16张

# 示例4：获取行位置为 1 行的所有列的数据
china_df.iloc[[1]]

Python大数据之pandas快速入门(二),img,第17张

5）示例5：获取行位置为 1 行的列位置为 2 列的数据

# 示例5：获取行位置为 1 行的列位置为 2 列的数据
china_df.iloc[[1], 2]
或
china_df.iloc[1, [2]]
或
china_df.iloc[1, 2]

Python大数据之pandas快速入门(二),img,第18张

4.3 loc和iloc的切片操作

基本格式：

语法	说明
df.loc[起始行标签:结束行标签, 起始列标签:结束列标签]	根据行列标签范围获对应行的对应列的数据，包含起始行列标签和结束行列标签
df.iloc[起始行位置:结束行位置, 起始列位置:结束列位置]	根据行列标签位置获对应行的对应列的数据，包含起始行列位置，但不包含结束行列位置

演示示例：

示例1：获取 china_df 中前三行的前三列的数据，分别使用上面介绍的loc和iloc实现

Python大数据之pandas快速入门(二),img,第19张

示例实现：

1）示例1：获取 china_df 中前三行的前三列的数据，分别使用上面介绍的loc和iloc实现

# 示例1：获取 china_df 中前三行的前三列的数据，分别使用上面介绍的loc和iloc实现
china_df.loc[1952:1962, 'country':'lifeExp']
或
china_df.iloc[0:3, 0:3]

Python大数据之pandas快速入门(二),img,第20张

4.4 [] 语法获取指定行列的数据

基本格式：

语法	说明
df[['列标签1', '列标签2', ...]]	根据列标签获取所有行的对应列的数据，结果为：DataFrame
df['列标签']	根据列标签获取所有行的对应列的数据 1）如果结果只有一列，结果为：Series，行标签作为 Series 的索引标签 2）如果结果有多列，结果为：DataFrame
df[['列标签']]	根据列标签获取所有行的对应列的数据，结果为：DataFrame
df[起始行位置:结束行位置]	根据指定范围获取对应行的所有列的数据，不包括结束行位置

演示示例：

示例1：获取所有行的 country、pop、gdpPercap 列的数据
示例2：获取所有行的 pop 列的数据
示例3：获取前三行的数据
示例4：从第一行开始，每隔一行获取一行数据，一共获取3行

示例实现：

1）示例1：获取所有行的 country、pop、gdpPercap 列的数据

# 示例1：获取所有行的 country、pop、gdpPercap 列的数据
china_df[['country', 'pop', 'gdpPercap']]

Python大数据之pandas快速入门(二),img,第21张

2）示例2：获取所有行的 pop 列的数据

# 示例2：获取所有行的 pop 列的数据
china_df['pop']

Python大数据之pandas快速入门(二),img,第22张

# 示例2：获取所有行的 pop 列的数据
china_df[['pop']]

Python大数据之pandas快速入门(二),img,第23张

3）示例3：获取前三行的数据

# 示例3：获取前三行的数据
china_df[0:3]

Python大数据之pandas快速入门(二),img,第24张

4）示例4：从第一行开始，每隔一行获取一行数据，一共获取3行

# 示例4：从第一行开始，每隔一行获取一行数据，一共获取3行
china_df[0:6:2]

Python大数据之pandas快速入门(二),img,第25张

总结

能够知道 DataFrame 和 Series 数据结构
能够加载 csv 和 tsv 数据集
能够区分 DataFrame 的行列标签和行列位置编号
能够获取 DataFrame 指定行列的数据
- loc
- iloc
- loc和iloc的切片操作
- []
个人主页网页设计图片珠海网站建设托管知名网站建设多少费用定制建设网站做个网站大概需要多少钱重庆网站建设优化

上一篇：hadoop01

下一篇：出现ZooKeeper JMX enabled by default这种错误的解决方法