作者:云朵君
来源:数据STUDIO
Pandas是基于NumPy的一种工具,该工具是为解决数据分析任务而创建的。pandas纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使python成为强大而高效的数据分析环境的重要因素之一。
NumPyNumPy库是Python中用于科学计算的核心库。它提供了一个高性能的多维数组对象,以及用于处理这些数组的工具。
导入Numpyimportnumpyasnp创建Arrays
a=np.array([1,2,3])b=np.array([(1.5,2,3),(4,5,6)],dtype=float)c=np.array([[(1.5,2,3),(4,5,6)],[(3,2,1),(4,5,6)]],dtype=float)#创建一个由0组成的数组np.zeros((3,4))#创建一个1的数组np.ones((2,3,4),dtype=np.int16)#创建一个等距值数组(步长值)d=np.arange(10,25,5)#创建一个等距值数组(样本数)np.linspace(0,2,9)#创建一个常量数组e=np.full((2,2),7)#创建一个2X2单位矩阵f=np.eye(2)#创建一个随机值的数组np.random.random((2,2))#创建一个空数组np.empty((3,2))输入与输出从磁盘上导入与存储
np.save(my_array,a)np.savez(array.npz,a,b)np.load(my_array.npy)导入与存储文本文件
np.loadtxt("myfile.txt")np.genfromtxt("my_file.csv",delimiter=,)np.savetxt("myarray.txt",a,delimiter="")数据类型
np.int64#有符号64位整数类型np.float32#标准双精度浮点数np.