python编程,如何判断变量是否为缺失值NaN?NaN表述发布于2024年05月20日 python 上文对python的空值None做了描述,本文描述缺失值NaN,英文解释为Not A Number。None是单独的一个NoneType,而NaN被理解为float类型中的一员,这可能就是两者的最大区别。大家好,这... 阅读更多
python编程,如何区分判断一个变量是否为空值None?发布于2024年05月19日 python 菩提本无树,明镜亦非台。本来无一物,何处惹尘埃。python的变量层面上没有Null,函数层面上有Null。代码层面上,python中存在:None和NaN,空字符串以及空格。对于特征工程来说,这些大概率情况下,都... 阅读更多
dataframe特征工程,如何利用df.info()统计缺失值Nan?发布于2024年05月18日 python 日常工作中,遇到的数据集不会像鸢尾花数据集那样完美,总会是出现一些空值。本文就是讲一下如何对数据集中的空值进行统计。以及在csv数据转换为dataframe的时候,对缺失值的处理。大家好,这里是苏南大叔的“程序如此... 阅读更多
机器学习,如何使用fetch_openml加载泰坦尼克数据集?发布于2024年05月17日 机器学习 在sklearn包里面,并不存在titanic.csv数据集文件本身。但是,可以通过fetch_openml()函数扩展到很多数据集,其中就包括titanic数据集。并且,在openml网站上,这个泰坦尼克数据集还... 阅读更多
机器学习数据集,解读泰坦尼克数据,有哪些字段?发布于2024年05月16日 机器学习 继鸢尾花数据集之后,苏南大叔来分析一下机器学习中非常著名的泰坦尼克数据集。这个数据集的标签是“survived”,而字段包括:年龄、阶层、票价、仓号、登船地、是否有亲戚同乘等等。数据表明:泰坦尼克号的乘客里面,最终... 阅读更多