我们相信:世界是美好的,你是我也是。平行空间的世界里面,不同版本的生活也在继续...

机器学习操作的结构化数据,基本上就是一个又一个的dataframe。而实际的代码层面上来说,对于字符数据又是无法处理的。真正能处理的,只有数字或者浮点数等数据。所以,对于dataframe的数据类型筛选,是比较有必要的。其中一个重要操作就是.select_dtypes()操作。

苏南大叔:dataframe数据,df.select_dtypes()根据dtype进行数据筛选 - dtype数据筛选
dataframe数据,df.select_dtypes()根据dtype进行数据筛选(图3-1)

大家好,这里是苏南大叔的“黑客马拉松夺旗赛”博客,这里讲述苏南大叔和计算机代码之间的故事。测试环境:python@3.6.8pandas@1.1.5

测试数据定义

这里定义个dataframe数据,代码如下:

import pandas as pd
data = pd.DataFrame({
    'name' : ['虎子','老许','二赖子','老白','小黑'],
    'age'  : [5,3,6,8,10],
    'weight'  : [1.2,3.5,6.1,2.5,3.6],
    'good' : [True,True,True,False,False],
    'class': ["dog","bird","fish","catty","puppy"]
})

不知道有什么dtype的话,直接查看df.dtypes即可。

print(data)
print(data.dtypes)

输出:

  name  age  weight   good  class
0   虎子    5     1.2   True    dog
1   老许    3     3.5   True   bird
2  二赖子    6     6.1   True   fish
3   老白    8     2.5  False  catty
4   小黑   10     3.6  False  puppy
name       object
age         int64
weight    float64
good         bool
class      object
dtype: object

苏南大叔:dataframe数据,df.select_dtypes()根据dtype进行数据筛选 - 字段类型
dataframe数据,df.select_dtypes()根据dtype进行数据筛选(图3-2)

参考文章:

数据筛选

根据dtype可以进行进一步的数据筛选。

测试代码一:

data_1 = data.select_dtypes(include=['float64', 'int64'])
print(data_1)

输出:

   age  weight
0    5     1.2
1    3     3.5
2    6     6.1
3    8     2.5
4   10     3.6

测试代码二:

data_2 = data.select_dtypes(include=['object', 'bool'])
print(data_2)

输出:

  name   good  class
0   虎子   True    dog
1   老许   True   bird
2  二赖子   True   fish
3   老白  False  catty
4   小黑  False  puppy

测试代码三:

data_3 = data.select_dtypes(include=['int64', 'bool'])
print(data_3)

输出:

   age   good
0    5   True
1    3   True
2    6   True
3    8  False
4   10  False

苏南大叔:dataframe数据,df.select_dtypes()根据dtype进行数据筛选 - 数据筛选
dataframe数据,df.select_dtypes()根据dtype进行数据筛选(图3-3)

参考文章:

结语

筛选好目标数据,就可以对数据进行进一步分析了。

如果本文对您有帮助,或者节约了您的时间,欢迎打赏瓶饮料,建立下友谊关系。
本博客不欢迎:各种镜像采集行为。请尊重原创文章内容,转载请保留作者链接。

 【福利】 腾讯云最新爆款活动!1核2G云服务器首年50元!

 【源码】本文代码片段及相关软件,请点此获取更多信息

 【绝密】秘籍文章入口,仅传授于有缘之人   python