什么是数据分析
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
使用python做数据分析的常用库有
1.numpy 基础数值算法
2.scipy科学计算
3.matplotlib 数据可视化4,pandas 序列高级函数
numpy简介
NumPy(Numerical Python)是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
numpy 支持的数据类型比 Python 内置的类型要多很多,基本上可以和 C 语言的数据类型对应上,其中部分类型对应为 Python 内置的类型。
名称 | 描述 |
---|---|
bool_ | 布尔型数据类型(True 或者 False) |
int_ | 默认的整数类型(类似于 C 语言中的 long,int32 或 int64) |
intc | 与 C 的 int 类型一样,一般是 int32 或 int 64 |
intp | 用于索引的整数类型(类似于 C 的 ssize_t,一般情况下仍然是 int32 或 int64) |
int8 | 字节(-128 to 127) |
int16 | 整数(-32768 to 32767) |
int32 | 整数(-2147483648 to 2147483647) |
int64 | 整数(-9223372036854775808 to 9223372036854775807) |
uint8 | 无符号整数(0 to 255) |
uint16 | 无符号整数(0 to 65535) |
uint32 | 无符号整数(0 to 4294967295) |
uint64 | 无符号整数(0 to 18446744073709551615) |
float_ | float64 类型的简写 |
float16 | 半精度浮点数,包括:1 个符号位,5 个指数位,10 个尾数位 |
float32 | 单精度浮点数,包括:1 个符号位,8 个指数位,23 个尾数位 |
float64 | 双精度浮点数,包括:1 个符号位,11 个指数位,52 个尾数位 |
complex_ | complex128 类型的简写,即 128 位复数 |
complex64 | 复数,表示双 32 位浮点数(实数部分和虚数部分) |
complex128 | 复数,表示双 64 位浮点数(实数部分和虚数部分) |
numpy基础:ndarray数组
内存中的ndarray
内存中的ndarray对象可以分为元数据(metadata)和实际数据,元数据存储对目标数组的描述信息,如:dim count,dimensions,dtype,data等。实际数据用以储存完整的数组数据
与变量相似我们可以用标签的方式去理解ndarry的实际储存模式
将实际数据与元数据分开存放,一方面提高了内存空间的使用效率,另一方面减少对实际数据的访问频率,提高性能。
ndarray数组对象的特点
- Numpy数组是同质数组,即所有元素的数据类型必须相同
- 2.Numpy数组的下标从0开始,最后一个元素的下标为数组长度减11
ndarray数组对象的创建方法
1.np.array(任何可被解释为Numpy数组的逻辑结构)
import numpy as np ary=np.array([1,2,3,4,5,6]) print(ary,type(ary))
2.np.arange(起始位置,终止位置,步长)跟range类似
import numpy as np a=np.arange(0,5,1) print(a)
3.np.zeros(数组长度,数组元素类型)产生相同元素的一个0数组
import numpy as np a=np.zeros(10,dtype=int) print(a)
4.np.ones(数组长度,数组元素类型)产生相同元素的一个1数组
import numpy as np a=np.ones(10,dtype=int) print(a)
ndarray数组的运算
同单个标量运算不同,ndarray提供了十分简便的数组运算,使用数组我们可以单次进行大量的数据修改和计算
1.np的加减运算
这里我们可以看作是Python中的列表生成式,我们在对np集合进行加减运算时,实际上是对该集合进行打包运算
a=[1,2,3,4,5,6] b=[i+3 for i in a] print(b)
2.np的乘除运算
同上
3.np的比较运算
我们都知道,比较运算将产生一个布尔值,这里的判断将会直接将结果储存在列表并返回;
这里1,2,3,4,5,6中只有4,5,6大于3故产生了3个false3个true
转载请注明:XAMPP中文组官网 » Python数据分析——numpy简介