数据整理操作及众所周知【数据分析】

作者 : admin 本文共1240个字,预计阅读时间需要4分钟 发布时间: 2024-06-10 共1人阅读

数据整理操作及众所周知【数据分析】插图

各位大佬好 ,这里是阿川的博客,祝您变得更强

数据整理操作及众所周知【数据分析】插图(1) 个人主页:在线OJ的阿川

大佬的支持和鼓励,将是我成长路上最大的动力数据整理操作及众所周知【数据分析】插图(2)

阿川水平有限,如有错误,欢迎大佬指正数据整理操作及众所周知【数据分析】插图(3)

数据整理操作及众所周知【数据分析】插图(4)

数据整理操作及众所周知【数据分析】插图(5)

Python 初阶
Python–语言基础与由来介绍
Python–注意事项
Python–语句与众所周知
数据清洗前 基本技能
数据分析—技术栈和开发环境搭建
数据分析—Numpy和Pandas库基本用法及实例
数据整理前 必看
数据分析—三前奏:获取/ 读取/ 评估数据
数据分析—数据清洗操作及众所周知

这是目录

  • 合并拼接数据
  • 分组数据
  • 众所周知

合并拼接数据

多个DataFrame的数据进行合并或者拼接

  • concat不同的DataFrame进行拼接
    • ignore_index=True 参数忽视原本DataFrame的索引
    • axis 参数可以指定纵向和横向合并

数据整理操作及众所周知【数据分析】插图(6)

数据整理操作及众所周知【数据分析】插图(7)

  • merge 根据不同的DataFrame相同列进行合并
    • on参数锁定条件列进行合并

数据整理操作及众所周知【数据分析】插图(8)

  • left-on 左边指定列
  • right-on 右边指定列

数据整理操作及众所周知【数据分析】插图(9)

  • suffixes参数修改列名后缀

数据整理操作及众所周知【数据分析】插图(10)

  • how 该参数 决定以什么样的方式合并

  • join 根据索引合并

    • lsuffix 修改左边后缀
    • rsuffix 修改右边后缀

数据整理操作及众所周知【数据分析】插图(11)

  • how参数决定什么样方式合并
    • inner(默认方式) 保留左右表都有匹配的值

数据整理操作及众所周知【数据分析】插图(12)

  • outer 保留左右表的所有值,若有匹配不上的,则用NaN填充

数据整理操作及众所周知【数据分析】插图(13)

  • left 保留 左边的值,用右边的值去匹配,若匹配不上则填充NaN

数据整理操作及众所周知【数据分析】插图(14)

  • right 保留 右边的值,用左边的值去匹配,若匹配不上则填充NaN

数据整理操作及众所周知【数据分析】插图(15)

分组数据

DataFrame数据进行分组

  • groupby 根据选择条件进行分组,且应该提取相应的变量,做相应聚合操作

生成一个实例,但看不到究竟长什么样
因为实例中一个单元格里多个数据情况,并不是有效表格,数据要提取到具体的,再用聚合函数
多个数据 聚合成单个数据,从而符合一个单元格中一个数据规则

数据整理操作及众所周知【数据分析】插图(16)

众所周知

聚合函数是可将多个Series变成单个数据的函数

常见的有
count 得到元素的数量
first 得到第一个元素
last 得到最后一个元素
mean默认的聚合方式) 得到所有元素平均值
median 得到所有元素中位数
min 得到所有元素的最小值
max 得到所有元素的最大值
std 得到所有元素的标准差
var 得到所有元素的方差
prod 得到所有元素的积
sum 得到所有元素的和

  • cut 根据范围进行精细分组
    • [ ] 分箱标准
      • 想要分组范围进行划分
    • labels参数切片空间进行命名

数据整理操作及众所周知【数据分析】插图(17)

  • query 条件筛选

数据整理操作及众所周知【数据分析】插图(18)

  • pivot_table 透视表,基于原始数据对表进行重塑
    • index参数可以指定索引
    • columns参数可以指定列名
    • values参数可以指定值
    • aggfunc参数 指定聚合方式

数据整理操作及众所周知【数据分析】插图(19)

  • .loc.loc 层次化索引,可以针对处理多个索引的pivot_table透视表
  • reset_index 重置索引

数据整理操作及众所周知【数据分析】插图(20)

好的,到此为止啦,祝您变得更强

数据整理操作及众所周知【数据分析】插图(5)
想说的话

实不相瞒,写的每篇博客都要写五六个小时(加上自己学习和纸质笔记,共八九小时吧),很累希望大佬支持

数据整理操作及众所周知【数据分析】插图(21)

道阻且长 行则将至
个人主页:在线OJ的阿川数据整理操作及众所周知【数据分析】插图大佬的支持和鼓励,将是我成长路上最大的动力 数据整理操作及众所周知【数据分析】插图(22)
本站无任何商业行为
个人在线分享 » 数据整理操作及众所周知【数据分析】
E-->
© 2018 Theme by - 本站无任何商业行为 & WordPress Theme. All rights reserved 蒙ICP备2023002302号-2