开窗函数MYSQL

作者 : admin 本文共1958个字,预计阅读时间需要5分钟 发布时间: 2024-06-13 共1人阅读

在MySQL中,开窗函数允许你对一组行执行计算,并返回每个行的计算结果。这些函数对于执行复杂的分析操作非常有用,比如计算移动平均值、累计总和、行排名等。以下是对MySQL中一些常用开窗函数的细致讲解:

### 1. ROW_NUMBER()
`ROW_NUMBER()`为结果集中的每行分配一个唯一的序号,序号的分配是根据`OVER()`子句中指定的排序顺序决定的。如果存在相同的行,则序号会跳过重复的行。

**示例**:
“`sql
SELECT 
  employee_id,
  first_name,
  last_name,
  ROW_NUMBER() OVER (ORDER BY hire_date DESC) AS row_num
FROM 
  employees;
“`
这个查询将根据`hire_date`降序排列员工,并为每个员工分配一个唯一的序号。

### 2. RANK() 和 DENSE_RANK()
`RANK()`和`DENSE_RANK()`用于对结果集中的行进行排名。`RANK()`在遇到并列排名时会跳过后续的序号(例如,如果两行并列第一,则下一个序号是第三),而`DENSE_RANK()`不会跳过,即使存在并列排名,序号也会连续。

**示例**:
“`sql
SELECT 
  employee_id,
  salary,
  RANK() OVER (ORDER BY salary DESC) AS rank
FROM 
  employees;
“`
这个查询将根据`salary`对员工进行排名。

### 3. NTILE()
`NTILE(n)`将结果集分为`n`个大致相等的组,并为每组分配一个组号。如果结果集中的行数不能被`n`整除,那么一些组将比其他组多一行。

**示例**:
“`sql
SELECT 
  employee_id,
  salary,
  NTILE(4) OVER (ORDER BY salary DESC) AS quartile
FROM 
  employees;
“`
这个查询将员工根据`salary`分为四个收入等级。

### 4. LEAD() 和 LAG()
`LEAD(column)`和`LAG(column)`允许你访问当前行之后的第n行(`LEAD`)或之前的第n行(`LAG`)的数据。如果不指定n,默认为1。

**示例**:
“`sql
SELECT 
  current_salary,
  LEAD(current_salary) OVER (ORDER BY employee_id) AS next_salary
FROM 
  employees;
“`
这个查询将返回每行的当前薪资和下一行的薪资。

### 5. SUM() OVER()
使用`SUM()`开窗函数可以计算从结果集的开始到当前行的累积总和。

**示例**:
“`sql
SELECT 
  employee_id,
  salary,
  SUM(salary) OVER (ORDER BY hire_date) AS cumulative_salary
FROM 
  employees;
“`
这个查询将计算从`employees`表中最早入职的员工到当前员工的累计薪资。

### 6. AVG() OVER()
`AVG()`开窗函数可以计算从结果集的开始到当前行的滑动平均值。

**示例**:
“`sql
SELECT 
  employee_id,
  salary,
  AVG(salary) OVER (ORDER BY hire_date ROWS BETWEEN 5 PRECEDING AND CURRENT ROW) AS moving_avg
FROM 
  employees;
“`
这个查询将计算基于最近6个员工(包括当前员工)的薪资滑动平均值。

### 7. FIRST_VALUE() 和 LAST_VALUE()
`FIRST_VALUE()`和`LAST_VALUE()`分别返回窗口内第一行和最后一行的数据。

**示例**:
“`sql
SELECT 
  employee_id,
  hire_date,
  FIRST_VALUE(hire_date) OVER (PARTITION BY department_id ORDER BY hire_date) AS first_hire_date
FROM 
  employees;
“`
这个查询将为每个部门返回最早的入职日期。

### 注意事项
– 开窗函数使用`PARTITION BY`子句来指定分组的列,这允许在每个分区内独立执行计算。
– `ROWS BETWEEN … AND …`允许你指定窗口的边界,例如`ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING`表示当前行的前一行和后一行。
– 开窗函数通常与`ORDER BY`子句结合使用,以定义计算的顺序。

开窗函数为MySQL提供了强大的数据分析能力,使得你可以在SQL查询中执行复杂的数据操作。

本站无任何商业行为
个人在线分享-虚灵IT资料分享 » 开窗函数MYSQL
E-->