PandasAI:让数据分析开口说话!
名称:pandas-ai ()
类型:开发者与数据库互动模型
介绍:通过使用大语言模型(LLMs)和基于检索的生成模型(RAG),让开发者与数据库或数据湖(比如 SQL、CSV、parquet 格式)的互动变得像聊天一样简单,从而大大简化了数据分析的过程.
PandasAI 是一个开源的 Python 库,旨在为流行的数据分析和处理工具 pandas 添加生成式人工智能(Generative AI)功能。它使用户能够通过自然语言查询与数据进行交互,使数据分析变得更加对话化和直观。 citeturn0search0
主要功能:
自然语言查询: 用户可以使用类似人类的查询语言与数据进行交互,无需编写复杂的代码。 citeturn0search5
无缝集成: PandasAI 与 pandas 紧密集成,保留了 pandas 的所有功能,同时增加了 AI 驱动的查询能力。 citeturn0search0
多平台支持: PandasAI 可在 Jupyter 笔记本、Streamlit 应用等环境中使用,提供灵活的使用体验。 citeturn0search0
安装与使用:
安装: 使用以下命令通过 pip 安装 PandasAI:
pip install pandasai
基本使用: 安装后,可以按照以下步骤使用 PandasAI:
import pandas as pd from pandasai import SmartDataframe from pandasai.llm import OpenAI # 创建示例 DataFrame df = pd.DataFrame({ "国家": ["美国", "英国", "法国", "德国", "意大利", "西班牙", "加拿大", "澳大利亚", "日本", "中国"], "收入": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000] }) # 设置 OpenAI API 密钥 llm = OpenAI(api_token="你的-openai-api-key") # 创建 SmartDataframe 对象 pandas_ai = SmartDataframe(df, config={"llm": llm}) # 使用自然语言查询数据 response = pandas_ai.ask("哪个国家的收入最高?") print(response)
上述代码将输出收入最高的国家。
注意事项:
API 密钥: 使用 PandasAI 需要设置 OpenAI 的 API 密钥。您可以通过将密钥直接传递给
OpenAI
对象,或设置环境变量OPENAI_API_KEY
来实现。 citeturn0search3环境要求: PandasAI 需要 Python 版本 3.8 及以上。 citeturn0search0
资源与链接:
PandasAI GitHub 仓库: citeturn0search0
PandasAI 官方网站: citeturn0search5
PandasAI 的出现,使数据分析变得更加人性化和直观,降低了非技术用户与数据交互的门槛,同时也为技术用户节省了时间和精力。
GitHub:https://github.com/sinaptik-ai/pandas-ai
油管:https://youtu.be/3kq_JrNf0os
留言
發佈留言