翼度科技»论坛 编程开发 python 查看内容

Python工程实践之np.loadtxt()读取数据

5

主题

5

帖子

15

积分

新手上路

Rank: 1

积分
15
前言

机器学习中使用np.loadtxt()可以高效的导入数据,np.loadtxt()适合.txt文件和.csv文件。但是它默认读取float类型的值。

1.np.loadtxt()读取txt文件


1-1 基础参数
  1. numpy.loadtxt(
  2.     fname, dtype=, comments='#',
  3.     delimiter=None, converters=None,
  4.     skiprows=0, usecols=None,
  5.     unpack=False, ndmin=0)
复制代码
1-2 参数详解
  1. fname要读取的文件、文件名、或生成器。dtype数据类型,默认float。comments注释。delimiter分隔符,默认是空格。skiprows跳过前几行读取,默认是0,必须是int整型。usecols要读取哪些列,0是第一列。例如,usecols = (1,4,5)将提取第2,第5和第6列。默认读取所有列。unpack如果为True,将分列读取。
复制代码
1-3 应用示例

文件的存储路径为:'./data.txt', 文件内容如下:


1-3-1fname

fname可以是文件的路径也可以是要读取的文件。
  1. #根据文件名直接读取
  2. data = np.loadtxt('./data/data.csv')
复制代码


1-3-2 dtype

dtype默认为np.float32类型,也可以设置为其他类型,比如int。设置为其他dtype时需要考虑数据本身的类型。
  1. #设置dtype
  2. data = np.loadtxt('./data/data.csv',dtype=np.float32)
  3. #设置dtype
  4. data = np.loadtxt('./data/data.csv',dtype=int)
复制代码


1-3-3 comments

comment的是指, 如果行的开头为comment的值,那在读取时就会跳过该行。示例代码中comment  = '1',则在读取数据时,会跳过开头为1的行。
  1. data = np.loadtxt('./data.txt',dtype = int,comments='1')
复制代码


1-3-4 delimiter

delimiter是分隔符,默认是空格。
  1. data = np.loadtxt('./data.txt',dtype = int,comments='1',delimiter=' ')
复制代码

我们改变一下数据,将数据中的分隔符改为','之后再重新读取。
  1. data = np.loadtxt('./data.txt',dtype = int,delimiter=',')
复制代码


1-3-5 skiprows

skiprows跳过前几行读取,默认是0,必须是int整型。skiprows = 2则表示跳过前两行读取数据。
  1. data = np.loadtxt('./data.txt',dtype = int,delimiter=',',skiprows=2)
复制代码
读取数据时,设定 skiprows = 2,则将前两行跳过,从第三行开始读取。


1-3-6 usecols

usecols要读取哪些列,0是第一列。例如,usecols = (1,4,5)将提取第2,第5和第6列。默认读取所有列。
读取第2列数据。
  1. data = np.loadtxt('./data.txt',dtype = int,delimiter=',',usecols = 1)
复制代码

读取第2,6,9列数据。
  1. data = np.loadtxt('./data.txt',dtype = int,delimiter=',',usecols =(1,5,8))
复制代码


1-3-7 unpack

unpack如果设置为Ture,将分列读取,类似于矩阵的转置。
未设置之前,数据读取时是以行为单位进行读取。

设置unpack=Ture之后再次读取,矩阵的列变为了行。


1-4 np.loadtxt()读取csv文件

读取csv文件与读取txt文件的参数一致,需要注意的是csv文件的分隔符一般是“,”并且含有表头,所以需要使用delimiter=','作为分隔符,以及使用skiprows=1跳过表头。
原始csv文件内容:
  1. #根据data_path读取文件内容
  2. train_XY  = np.loadtxt(data_path, delimiter=',', skiprows = 1,dtype=np.float32)
复制代码


总结

到此这篇关于Python工程实践之np.loadtxt()读取数据的文章就介绍到这了,更多相关np.loadtxt()读取数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

来源:https://www.jb51.net/python/292095org.htm
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

举报 回复 使用道具