news 2026/4/3 4:10:48

pandas实现sql的case when查询,原来这么简单!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
pandas实现sql的case when查询,原来这么简单!

sql中的case when的功能是实现单列或者多列的条件统计,其实Pandas也可以实现的,比如万能的apply方法,就是写起来复杂一些,没有sql case when那么直观。

apply方法可以对dataframe、series执行特定函数,其实很强大,因为python什么逻辑都可以写。

举个例子,一张考试成绩的表scores,有语文和数学的得分,现在给考生综合打分,两门都在90以上打A,都在80-90之间打B,其他则打C。

这里如果用sql来查询的话,使用case when就很简单明了。

SELECT *, CASE WHEN chinese_score >= 90AND math_score >= 90THEN'A' WHEN chinese_score >= 80AND math_score >= 80THEN'B' ELSE'C' ENDAS score_type FROM scores

如果用pandas apply方法来实现的话,需要自定义一个判断函数,用来对成绩进行分类。

然后用apply方法应用到dataframe上,以下是完整代码,可以放到本地电脑跑。

import pandas as pd # 示例数据 data = { 'chinese_score': [90, 80, 79, 100, 89], 'math_score': [91, 95, 79, 99, 89], } df = pd.DataFrame(data) # 定义条件判断函数 def check_conditions(row): # 条件1:年龄>30,分数>80,性别为男性 result = 'A'if (row['chinese_score'] >= 90) and (row['math_score'] >= 90) \ else'B'if (row['chinese_score'] >= 80) and (row['math_score'] >= 80) \ else'C' return result # 应用apply生成标记列 score_type_1 = df.apply(check_conditions, axis=1) score_type_1

逻辑也很简单,判断函数实现多列的判断条件,apply将该判断函数应用到数据集上,就能实现类似sql case when的功能。

apply的应用场景很多,远比你想象的多得多,比如一张学生成绩信息的表,它可以给每位学生通过deepseek制定个性化的提升建议。

除了pandas apply能实现case when的功能外,numpy的select方法也能搞定,而且更为通用、简洁,建议试试。

import numpy as np import pandas as pd # 示例数据 data = { 'chinese_score': [90, 80, 79, 100, 89], 'math_score': [91, 95, 79, 99, 89], } df = pd.DataFrame(data) # 定义条件和对应的值 conditions = [ (df['chinese_score'] >= 90) & (df['math_score'] >= 90), (df['chinese_score'] >= 80) & (df['math_score'] >= 80) ] choices = ['A', 'B'] # select方法 score_type_1 = np.select(conditions, choices, default='C') score_type_1

numpy select方法类似case when语法,通过一个多列条件判断,区分不同的分类。

除了这两种,其实pandas种还有不少能实现的途径,但没必要尝试,因为这两种相对通用便捷,且符合python哲学。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/25 1:28:31

大模型(Qwen3)训练实战:从零开始玩转LLaMA-Factory

这一篇来整体讲一下大模型的训练和微调,选用的大模型依然是大模型(Qwen3),训练和微调的框架使用的是LLaMA-Factory。 在人工智能技术日新月异的今天,大型语言模型(LLM)已成为科技领域的热门话题。但对于大多…

作者头像 李华
网站建设 2026/4/1 7:36:06

机器人工程毕设 stm32与深度学习口罩佩戴检测系统(源码+硬件+论文)

文章目录 0 前言1 主要功能2 硬件设计(原理图)3 核心软件设计4 实现效果5 最后 0 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉…

作者头像 李华
网站建设 2026/3/31 7:58:22

大模型打分机制揭秘:为何需要多次更换位置进行评分?

这是一个在 LLM 评测里已经被系统性验证过的问题,通常称为 position bias / order bias(位置偏差、顺序偏差)。 背景 在 pairwise 或 listwise 的 LLM-as-a-judge 评测中,常见 prompt 形式是:给定问题 Q 回答 A&#x…

作者头像 李华
网站建设 2026/3/21 2:32:12

GTSAM 中的 gtsam::Scatter解读和实战示例

一、Scatter 在 GTSAM 中到底干什么? 概述 gtsam::Scatter 负责把 GaussianFactorGraph 中“局部因子块”散射(scatter)到“全局线性系统结构”中。 它是 “因子图 → 线性代数” 的桥梁。 稍微严谨一点 在 GTSAM 的线性化阶段,…

作者头像 李华
网站建设 2026/3/31 20:55:28

ReAct、FC、MCP、Skills 一路演进,Agent 到底是不是垃圾?

这篇文章源于我近半年关于Agent(去除敏感信息)的生产实践,也源于近一年和各个团队关于Agent的一些交流,包括我对类Manus项目的一些困惑。 就当前来说,存在两个截然相反的声音:Agent就是未来,其他…

作者头像 李华