翼度科技»论坛 编程开发 python 查看内容

python使用pandas从minio读取excel文件方式

7

主题

7

帖子

21

积分

新手上路

Rank: 1

积分
21
安装依赖

要使用Pandas从MinIO读取Excel文件,你需要先使用MinIO Python SDK从MinIO存储桶中下载文件,然后使用Pandas读取该文件。
安装必要的库:
  1. pip install pandas minio -i https://pypi.tuna.tsinghua.edu.cn/simple
复制代码
python 3 的方式
  1. import pandas as pd
  2. from minio import Minio
  3. from io import BytesIO

  4. # MinIO 连接配置
  5. # MinIO 连接配置
  6. minio_client = Minio(
  7.     "localhost:9000",       # MinIO服务器地址
  8.     access_key="admin",  # 访问密钥
  9.     secret_key="admin",  # 秘钥
  10.     secure=False                   # 如果是https连接,设为True
  11. )

  12. bucket_name = "test-read"   # 存储桶名称
  13. file_path = "测试/test.xlsx"  # 文件在 MinIO 中的路径

  14. def read_csv_from_minio(minio_client,bucket_name, file_path):
  15.     """
  16.     从 MinIO 中读取 CSV 文件并加载到 pandas DataFrame
  17.     :param bucket_name: 存储桶名称
  18.     :param file_path: MinIO 中的文件路径
  19.     :return: pandas DataFrame
  20.     """
  21.     try:
  22.         # 从 MinIO 下载文件内容
  23.         response = minio_client.get_object(bucket_name, file_path)
  24.         # 使用 BytesIO 包装文件内容,以便 pandas 读取
  25.         # binary_data = response.read()  # 将数据读取为字节
  26.         df = pd.read_excel(BytesIO(response.data), sheet_name=1)
  27.         return df
  28.     except Exception as e:
  29.         print(f"读取文件失败,错误信息: {e}")
  30.         return None

  31. # 调用函数并查看数据框
  32. df = read_csv_from_minio(bucket_name, file_path)
  33. if df is not None:
  34.     print(df.head())
复制代码
python 2 的方式
  1. import pandas as pd
  2. from minio import Minio
  3. from StringIO import StringIO

  4. # MinIO 连接配置
  5. # MinIO 连接配置
  6. minio_client = Minio(
  7.     "localhost:9000",       # MinIO服务器地址
  8.     access_key="admin",  # 访问密钥
  9.     secret_key="admin",  # 秘钥
  10.     secure=False                   # 如果是https连接,设为True
  11. )

  12. bucket_name = "test-read"   # 存储桶名称
  13. file_path = "测试/test.xlsx"  # 文件在 MinIO 中的路径

  14. def read_csv_from_minio(minio_client,bucket_name, file_path):
  15.     """
  16.     从 MinIO 中读取 CSV 文件并加载到 pandas DataFrame
  17.     :param bucket_name: 存储桶名称
  18.     :param file_path: MinIO 中的文件路径
  19.     :return: pandas DataFrame
  20.     """
  21.     try:
  22.         # 从 MinIO 下载文件内容
  23.         response = minio_client.get_object(bucket_name, file_path)
  24.         # 使用 BytesIO 包装文件内容,以便 pandas 读取
  25.         # binary_data = response.read()  # 将数据读取为字节
  26.         df = pd.read_excel(StringIO(response.data), sheet_name=1)
  27.         return df
  28.     except Exception as e:
  29.         print(f"读取文件失败,错误信息: {e}")
  30.         return None

  31. # 调用函数并查看数据框
  32. df = read_csv_from_minio(bucket_name, file_path)
  33. if df is not None:
  34.     print(df.head())
复制代码
总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

来源:https://www.jb51.net/python/331116mr0.htm
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

举报 回复 使用道具