Pandas与SQL的超强结合，爆赞！

WBOY 143 阅读 0 评论 682 点赞

人生苦短，我学Python！

本文的所有演示数据，均是基于下方的四张表。下面这四张表大家应该不陌生，这就是网传50道经典MySQL面试题中使用到的几张原表。关于下方各表之间的关联关系，我就不给大家说明了，仔细观察字段名，应该就可以发现。

简介

pandas中的DataFrame是一个二维表格，数据库中的表也是一个二维表格，因此在pandas中使用sql语句就显得水到渠成，pandasql使用SQLite作为其操作数据库，同时Python自带SQLite模块，不需要安装，便可直接使用。

这里有一点需要注意的是：使用pandasql读取DataFrame中日期格式的列，默认会读取年月日、时分秒，因此我们要学会使用sqlite中的日期处理函数，方便我们转换日期格式，下方提供sqlite中常用函数大全，希望对你有帮助。

sqlite函数大全：http://suo.im/5DWraE

导入相关库：

import pandas as pd
from pandasql import sqldf
登录后复制

声明全局变量的2种方式

在使用之前，声明该全局变量；
一次性声明好全局变量；

在使用之前，声明该全局变量

df1 = pd.read_excel("student.xlsx")
df2 = pd.read_excel("sc.xlsx")
df3 = pd.read_excel("course.xlsx")
df4 = pd.read_excel("teacher.xlsx")
global df1
global df2
global df3
global df4
query1 = "select * from df1 limit 5"
query2 = "select * from df2 limit 5"
query3 = "select * from df3"
query4 = "select * from df4"
sqldf(query1)
sqldf(query2)
sqldf(query3)
sqldf(query4)
登录后复制

部分结果如下：

一次性声明好全局变量

df1 = pd.read_excel("student.xlsx")
df2 = pd.read_excel("sc.xlsx")
df3 = pd.read_excel("course.xlsx")
df4 = pd.read_excel("teacher.xlsx")
pysqldf = lambda q: sqldf(q, globals())
query1 = "select * from df1 limit 5"
query2 = "select * from df2 limit 5"
query3 = "select * from df3"
query4 = "select * from df4"
sqldf(query1)
sqldf(query2)
sqldf(query3)
sqldf(query4)
登录后复制

部分结果如下：

写几个简单的SQL语句

查看sqlite的版本

student = pd.read_excel("student.xlsx")
pysqldf = lambda q: sqldf(q, globals())
query1 = """
 select sqlite_version(*)
"""
pysqldf(query1)
登录后复制

结果如下：

where筛选

student = pd.read_excel("student.xlsx")
pysqldf = lambda q: sqldf(q, globals())
query1 = """
select *
from student
 where strftime('%Y-%m-%d',sage) = '1990-01-01'
"""
pysqldf(query1)
登录后复制

结果如下：

多表连接

student = pd.read_excel("student.xlsx")
sc = pd.read_excel("sc.xlsx")
pysqldf = lambda q: sqldf(q, globals())
query2 = """
 select *
 from student s
 join sc on s.sid = sc.sid
"""
pysqldf(query2)
登录后复制

部分结果如下：

分组聚合

student = pd.read_excel("student.xlsx")
sc = pd.read_excel("sc.xlsx")
pysqldf = lambda q: sqldf(q, globals())
query2 = """
 select s.sname as 姓名,sum(sc.score) as 总分
 from student s
 join sc on s.sid = sc.sid
 group by s.sname
"""
pysqldf(query2)
登录后复制

结果如下：

union查询

student = pd.read_excel("student.xlsx")
pysqldf = lambda q: sqldf(q, globals())
query1 = """
select *
from student
 where strftime('%Y-%m',sage) = '1990-01'
 union
select *
from student
 where strftime('%Y-%m',sage) = '1990-12'
"""
pysqldf(query1)
登录后复制

结果如下：

以上就是Pandas与SQL的超强结合，爆赞！的详细内容，转载自php中文网

点赞(682) 打赏

免责声明：本文内容由网友自发贡献，或转载各大站转载，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系123246359@163.com核实处理。
本文分类：python
本文标签：php
浏览次数：143 次浏览
发布日期：2023-04-10 12:48:13
本文链接：https://yinghuohong.cn/python/15692.html

上一篇 > 盘点 90% Python 爬虫中的常见加密算法
下一篇 > Python 批量加水印只需一行命令！

评论列表共有 0 条评论

暂无评论

Pandas与SQL的超强结合，爆赞！

简介

在使用之前，声明该全局变量

一次性声明好全局变量

写几个简单的SQL语句

查看sqlite的版本

where筛选

多表连接

分组聚合

union查询

PHP实现在线进制转换器，10进制，2、4、8、16、32进制转换

fileclude（文件包含漏洞及php://input、php://filter的使用）

PHP 对银行卡，手机号，真实姓名，身份证进行掩码加星号处理

悟空CRM11.0 PHP版本docker容器化部署全流程

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复