
DeepSeek+pandas-ai:超强组合,处理表格数据只需一句话
pandas-ai是一个基于生成式AI的Python库,它通过自然语言理解技术将你的指令转化为Pandas代码。基础操作:“找出销售额最高的5个国家”复杂计算:“计算幸福指数最低的两个国家的GDP总和”可视化:“用不同颜色绘制各国GDP的柱状图”
·
DeepSeek+pandas-ai:超强组合,处理表格数据只需一句话
让数据分析像聊天一样简单
用一句自然语言就能完成数据清洗、统计分析和可视化?今天介绍的 pandas-ai 与 DeepSeek-V3 的组合,将彻底颠覆你对数据分析的认知!本文将手把手教你如何用一句话完成复杂的数据操作。
一、什么是pandas-ai?
pandas-ai是一个基于生成式AI的Python库,它通过自然语言理解技术将你的指令转化为Pandas代码。不同于传统Pandas需要手动编写逻辑,你可以直接提问:
- 基础操作:“找出销售额最高的5个国家”
- 复杂计算:“计算幸福指数最低的两个国家的GDP总和”
- 可视化:“用不同颜色绘制各国GDP的柱状图”
二、从零开始配置环境
2.1 安装核心库(关键!)
pip install pandasai-openai
2.2 配置DeepSeek密钥(这里我用阿里云的)
重要! API密钥切勿泄露:
import pandasai as pai
from pandasai_openai import OpenAI
import matplotlib.pyplot as plt
# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei'] # 设置中文字体
# 这里如果是deepseek官方api就换一下key和url
llm = OpenAI(
api_token="your api key",
api_base="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
llm.model = 'deepseek-v3'
pai.config.set({
"llm": llm,
})
config = pai.config.get()
df = pai.read_csv("heart.csv") # csv 格式的才行
response = df.chat("分析第一列和其他列之间的数量关系")
print(response)
三、提示词:用一句话处理Excel数据
3.1 基础查询
1、计算平均数,标准差等等
2、统计数量,判断数量关系
··· ···
3.2 操作表格
1、删除某列
2、获取指定行或列
··· ···
3.3 自动生成可视化
1、用条形图,饼状图,折线图等plot 可以画的图 它都能画出来
2、比如:用折线图 分析 年龄和工资的关系
更多推荐
所有评论(0)