PandasAI:让数据分析开口说话!

 

PandasAI:让数据分析开口说话!



名称:pandas-ai ()
类型:开发者与数据库互动模型
介绍:通过使用大语言模型(LLMs)和基于检索的生成模型(RAG),让开发者与数据库或数据湖(比如 SQL、CSV、parquet 格式)的互动变得像聊天一样简单,从而大大简化了数据分析的过程.

PandasAI 是一个开源的 Python 库,旨在为流行的数据分析和处理工具 pandas 添加生成式人工智能(Generative AI)功能。它使用户能够通过自然语言查询与数据进行交互,使数据分析变得更加对话化和直观。 citeturn0search0

主要功能:

  • 自然语言查询: 用户可以使用类似人类的查询语言与数据进行交互,无需编写复杂的代码。 citeturn0search5

  • 无缝集成: PandasAI 与 pandas 紧密集成,保留了 pandas 的所有功能,同时增加了 AI 驱动的查询能力。 citeturn0search0

  • 多平台支持: PandasAI 可在 Jupyter 笔记本、Streamlit 应用等环境中使用,提供灵活的使用体验。 citeturn0search0

安装与使用:

  1. 安装: 使用以下命令通过 pip 安装 PandasAI:

    pip install pandasai
  2. 基本使用: 安装后,可以按照以下步骤使用 PandasAI:

    import pandas as pd
    from pandasai import SmartDataframe
    from pandasai.llm import OpenAI
    
    # 创建示例 DataFrame
    df = pd.DataFrame({
        "国家": ["美国", "英国", "法国", "德国", "意大利", "西班牙", "加拿大", "澳大利亚", "日本", "中国"],
        "收入": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000]
    })
    
    # 设置 OpenAI API 密钥
    llm = OpenAI(api_token="你的-openai-api-key")
    
    # 创建 SmartDataframe 对象
    pandas_ai = SmartDataframe(df, config={"llm": llm})
    
    # 使用自然语言查询数据
    response = pandas_ai.ask("哪个国家的收入最高?")
    print(response)

    上述代码将输出收入最高的国家。

注意事项:

  • API 密钥: 使用 PandasAI 需要设置 OpenAI 的 API 密钥。您可以通过将密钥直接传递给 OpenAI 对象,或设置环境变量 OPENAI_API_KEY 来实现。 citeturn0search3

  • 环境要求: PandasAI 需要 Python 版本 3.8 及以上。 citeturn0search0

资源与链接:

  • PandasAI GitHub 仓库: citeturn0search0

  • PandasAI 官方网站: citeturn0search5

PandasAI 的出现,使数据分析变得更加人性化和直观,降低了非技术用户与数据交互的门槛,同时也为技术用户节省了时间和精力。

GitHub:https://github.com/sinaptik-ai/pandas-ai

油管:https://youtu.be/3kq_JrNf0os


留言