網站首頁 編程語言 正文
前言:
NumPy 是 Python 語言的一個擴充程序庫,支持大量高維度數組與矩陣運算,此外也針對數組運算提供大量的數學函數庫。同時NumPy 是機器學習必不可少的工具之一。
常用操作主要有:
- 創建數組
- 數組運算
- 數學函數
- 數組切片和索引
- 數組形狀操作
- 數組排序
- 數組統計
環境
- Python 3.6
- NumPy: 1.14.2
1、導包
import numpy as np
2、通過列表創建數組 array()
np.array([1, 2, 3]) #一維數組
np.array([(1, 2, 3), (4, 5, 6)]) #二維數組
3、0/1數組 zeros()、ones()
np.zeros((3, 3)) #3行3列
np.ones((2, 3, 4))
4、等差數組 arange() reshape()
#一維等差
np.arange(5) #array([0, 1, 2, 3, 4])
# 二維等差
np.arange(6).reshape(2, 3)
結果:
array([[0, 1, 2],
[3, 4, 5]])
5、單位矩陣 eye()
np.eye(3)
結果:
array([[1., 0., 0.],
[0., 1., 0.],
[0., 0., 1.]])
7、等間隔數組
#一維
np.linspace(1, 10, num=6) #array([ 1. , 2.8, 4.6, 6.4, 8.2, 10. ])
8、隨機數組
np.random.rand(2, 3)
array([[0.40360777, 0.74141574, 0.32018331],
[0.15261484, 0.18692149, 0.19351765]])
9、隨機整數數組
np.random.randint(10, size=(2, 3)) #數值小于10
array([[2, 1, 0],
[2, 7, 5]])
10、依據函數創建數組
np.fromfunction(lambda i, j: i + j, (3, 6)) array([[0., 1., 2., 3., 4., 5.], [1., 2., 3., 4., 5., 6.], [2., 3., 4., 5., 6., 7.]])
數組運算
+-*/ 加減乘除,對應位置元素
# 矩陣乘法
np.dot(A, B)
# 如果使用 np.mat 將二維數組準確定義為矩陣,就可以直接使用 * 完成矩陣乘法計算
np.mat(A) * np.mat(B)
轉置:
A.T
矩陣求逆:
np.linalg.inv(A)
e^x
np.exp(a)
平方根:
np.sqrt(a)
三次方:
np.power(a, 3)
數組的切皮與索引
一維數組:
a = np.array([1, 2, 3, 4, 5])
# 一維數組索引
a[0], a[-1]
# 一維數組切片
a[0:2], a[:-1]
二維數組;
a = np.array([(1, 2, 3), (4, 5, 6), (7, 8, 9)])
# 索引
a[0], a[-1]
######## 切片
# 取第二列
a[:, 1]
#取第 2,3 行
a[1:3, :]
數組形狀
形狀(行列數)
a.shape
更改行列數
a.reshape(2, 3) #指向新對象, reshape 并不改變原始數組
# resize 會改變原始數組
a.resize(2, 3)
展平數組
a.ravel()
垂直拼合數組,摞起來
np.vstack((a, b))
水平拼合數組,挨著擺
np.hstack((a, b))
分割數組:
array([[5, 0, 2],
[4, 2, 4],
[4, 7, 9]])
# 沿橫軸分割數組
np.hsplit(a, 3)
[array([[5],
[4],
[4]]), array([[0],
[2],
[7]]), array([[2],
[4],
[9]])]
# 沿縱軸分割數組
np.vsplit(a, 3)
[array([[5, 0, 2]]), array([[4, 2, 4]]), array([[4, 7, 9]])]
數組排序:
# 生成示例數組
a = np.array(([1, 4, 3], [6, 2, 9], [4, 7, 2]))
# #### 返回每列最大值
np.max(a, axis=0)
# #### 返回每行最小值
np.min(a, axis=1)
# #### 返回每列最大值索引
np.argmax(a, axis=0)
# #### 返回每行最小值索引
np.argmin(a, axis=1)
數組統計:
# 繼續使用上面的 a 數組
np.median(a, axis=0)
# #### 統計數組各行的算術平均值
np.mean(a, axis=1)
# #### 統計數組各列的加權平均值
np.average(a, axis=0)
# #### 統計數組各行的方差
np.var(a, axis=1)
# #### 統計數組各列的標準偏差
np.std(a, axis=0)
進階:
# #### 51. 創建一個 5x5 的二維數組,其中邊界值為1,其余值為0
# In[60]:
Z = np.ones((5,5))
Z[1:-1,1:-1] = 0
Z
# #### 52. 使用數字 0 將一個全為 1 的 5x5 二維數組包圍
# In[61]:
Z = np.ones((5,5))
Z = np.pad(Z, pad_width=1, mode='constant', constant_values=0)
Z
# #### 53. 創建一個 5x5 的二維數組,并設置值 1, 2, 3, 4 落在其對角線下方
# In[62]:
Z = np.diag(1+np.arange(4),k=-1)
Z
# #### 54. 創建一個 10x10 的二維數組,并使得 1 和 0 沿對角線間隔放置
# In[63]:
Z = np.zeros((10,10),dtype=int)
Z[1::2,::2] = 1
Z[::2,1::2] = 1
Z
# #### 55. 創建一個 0-10 的一維數組,并將 (1, 9] 之間的數全部反轉成負數
# In[64]:
Z = np.arange(11)
Z[(1 < Z) & (Z <= 9)] *= -1
Z
# #### 56. 找出兩個一維數組中相同的元
# In[65]:
Z1 = np.random.randint(0,10,10)
Z2 = np.random.randint(0,10,10)
print("Z1:", Z1)
print("Z2:", Z2)
np.intersect1d(Z1,Z2)
# #### 57. 使用 NumPy 打印昨天、今天、明天的日期
# In[66]:
yesterday = np.datetime64('today', 'D') - np.timedelta64(1, 'D')
today = np.datetime64('today', 'D')
tomorrow = np.datetime64('today', 'D') + np.timedelta64(1, 'D')
print("yesterday: ", yesterday)
print("today: ", today)
print("tomorrow: ", tomorrow)
# #### 58. 使用五種不同的方法去提取一個隨機數組的整數部分
# In[67]:
Z = np.random.uniform(0,10,10)
print("原始值: ", Z)
print ("方法 1: ", Z - Z%1)
print ("方法 2: ", np.floor(Z))
print ("方法 3: ", np.ceil(Z)-1)
print ("方法 4: ", Z.astype(int))
print ("方法 5: ", np.trunc(Z))
# #### 59. 創建一個 5x5 的矩陣,其中每行的數值范圍從 1 到 5
# In[68]:
Z = np.zeros((5,5))
Z += np.arange(1,6)
Z
# #### 60. 創建一個長度為 5 的等間隔一維數組,其值域范圍從 0 到 1,但是不包括 0 和 1
# In[69]:
Z = np.linspace(0,1,6,endpoint=False)[1:]
Z
# #### 61. 創建一個長度為10的隨機一維數組,并將其按升序排序
# In[70]:
Z = np.random.random(10)
Z.sort()
Z
# #### 62. 創建一個 3x3 的二維數組,并將列按升序排序
# In[71]:
Z = np.array([[7,4,3],[3,1,2],[4,2,6]])
print("原始數組: \n", Z)
Z.sort(axis=0)
Z
# #### 63. 創建一個長度為 5 的一維數組,并將其中最大值替換成 0
# In[72]:
Z = np.random.random(5)
print("原數組: ",Z)
Z[Z.argmax()] = 0
Z
# #### 64. 打印每個 NumPy 標量類型的最小值和最大值
# In[73]:
for dtype in [np.int8, np.int32, np.int64]:
print("The minimum value of {}: ".format(dtype), np.iinfo(dtype).min)
print("The maximum value of {}: ".format(dtype),np.iinfo(dtype).max)
for dtype in [np.float32, np.float64]:
print("The minimum value of {}: ".format(dtype),np.finfo(dtype).min)
print("The maximum value of {}: ".format(dtype),np.finfo(dtype).max)
# #### 65. 將 `float32` 轉換為整型
# In[74]:
Z = np.arange(10, dtype=np.float32)
print(Z)
Z = Z.astype(np.int32, copy=False)
Z
# #### 66. 將隨機二維數組按照第 3 列從上到下進行升序排列
# In[75]:
Z = np.random.randint(0,10,(5,5))
print("排序前:\n",Z)
Z[Z[:,2].argsort()]
# #### 67. 從隨機一維數組中找出距離給定數值(0.5)最近的數
# In[76]:
Z = np.random.uniform(0,1,20)
print("隨機數組: \n", Z)
z = 0.5
m = Z.flat[np.abs(Z - z).argmin()]
m
# #### 68. 將二維數組的前兩行進行順序交換
# In[77]:
A = np.arange(25).reshape(5,5)
print(A)
A[[0,1]] = A[[1,0]]
print(A)
# #### 69. 找出隨機一維數組中出現頻率最高的值
# In[78]:
Z = np.random.randint(0,10,50)
print("隨機一維數組:", Z)
np.bincount(Z).argmax()
# #### 70. 找出給定一維數組中非 0 元素的位置索引
# In[79]:
Z = np.nonzero([1,0,2,0,1,0,4,0])
Z
# #### 71. 對于給定的 5x5 二維數組,在其內部隨機放置 p 個值為 1 的數
# In[80]:
p = 3
Z = np.zeros((5,5))
np.put(Z, np.random.choice(range(5*5), p, replace=False),1)
Z
# #### 72. 對于隨機的 3x3 二維數組,減去數組每一行的平均值
# In[81]:
X = np.random.rand(3, 3)
print(X)
Y = X - X.mean(axis=1, keepdims=True)
Y
# #### 73. 獲得二維數組點積結果的對角線數組
# In[82]:
A = np.random.uniform(0,1,(3,3))
B = np.random.uniform(0,1,(3,3))
print(np.dot(A, B))
# 較慢的方法
np.diag(np.dot(A, B))
# In[83]:
# 較快的方法
np.sum(A * B.T, axis=1)
# In[84]:
# 更快的方法
np.einsum("ij, ji->i", A, B)
# #### 74. 找到隨機一維數組中前 p 個最大值
# In[85]:
Z = np.random.randint(1,100,100)
print(Z)
p = 5
Z[np.argsort(Z)[-p:]]
# #### 75. 計算隨機一維數組中每個元素的 4 次方數值
# In[86]:
x = np.random.randint(2,5,5)
print(x)
np.power(x,4)
# #### 76. 對于二維隨機數組中各元素,保留其 2 位小數
# In[87]:
Z = np.random.random((5,5))
print(Z)
np.set_printoptions(precision=2)
Z
# #### 77. 使用科學記數法輸出 NumPy 數組
# In[88]:
Z = np.random.random([5,5])
print(Z)
Z/1e3
# #### 78. 使用 NumPy 找出百分位數(25%,50%,75%)
# In[89]:
a = np.arange(15)
print(a)
np.percentile(a, q=[25, 50, 75])
# #### 79. 找出數組中缺失值的總數及所在位
# In[90]:
# 生成含缺失值的 2 維數組
Z = np.random.rand(10,10)
Z[np.random.randint(10, size=5), np.random.randint(10, size=5)] = np.nan
Z
# In[91]:
print("缺失值總數: \n", np.isnan(Z).sum())
print("缺失值索引: \n", np.where(np.isnan(Z)))
# #### 80. 從隨機數組中刪除包含缺失值的行
# In[92]:
# 沿用 79 題中的含缺失值的 2 維數組
Z[np.sum(np.isnan(Z), axis=1) == 0]
# #### 81. 統計隨機數組中的各元素的數量
# In[93]:
Z = np.random.randint(0,100,25).reshape(5,5)
print(Z)
np.unique(Z, return_counts=True) # 返回值中,第 2 個數組對應第 1 個數組元素的數量
# #### 82. 將數組中各元素按指定分類轉換為文本值
# In[94]:
# 指定類別如下
# 1 → 汽車
# 2 → 公交車
# 3 → 火車
Z = np.random.randint(1,4,10)
print(Z)
label_map = {1: "汽車", 2: "公交車", 3: "火車"}
[label_map[x] for x in Z]
# #### 83. 將多個 1 維數組拼合為單個 Ndarray
# In[95]:
Z1 = np.arange(3)
Z2 = np.arange(3,7)
Z3 = np.arange(7,10)
Z = np.array([Z1, Z2, Z3])
print(Z)
np.concatenate(Z)
# #### 84. 打印各元素在數組中升序排列的索引
# In[96]:
a = np.random.randint(100, size=10)
print('Array: ', a)
a.argsort()
# #### 85. 得到二維隨機數組各行的最大值
# In[97]:
Z = np.random.randint(1,100, [5,5])
print(Z)
np.amax(Z, axis=1)
# #### 86. 得到二維隨機數組各行的最小值(區別上面的方法)
# In[98]:
Z = np.random.randint(1,100, [5,5])
print(Z)
np.apply_along_axis(np.min, arr=Z, axis=1)
# #### 87. 計算兩個數組之間的歐氏距離
# In[99]:
a = np.array([1, 2])
b = np.array([7, 8])
# 數學計算方法
print(np.sqrt(np.power((8-2), 2) + np.power((7-1), 2)))
# NumPy 計算
np.linalg.norm(b-a)
# #### 88. 打印復數的實部和虛部
# In[100]:
a = np.array([1 + 2j, 3 + 4j, 5 + 6j])
print("實部:", a.real)
print("虛部:", a.imag)
# #### 89. 求解給出矩陣的逆矩陣并驗證
# In[101]:
matrix = np.array([[1., 2.], [3., 4.]])
inverse_matrix = np.linalg.inv(matrix)
# 驗證原矩陣和逆矩陣的點積是否為單位矩陣
assert np.allclose(np.dot(matrix, inverse_matrix), np.eye(2))
inverse_matrix
# #### 90. 使用 Z-Score 標準化算法對數據進行標準化處理
# Z-Score 標準化公式:
# $$Z = \frac{X-\mathrm{mean}(X)}{\mathrm{sd}(X)}$$
# In[102]:
# 根據公式定義函數
def zscore(x, axis = None):
xmean = x.mean(axis=axis, keepdims=True)
xstd = np.std(x, axis=axis, keepdims=True)
zscore = (x-xmean)/xstd
return zscore
# 生成隨機數據
Z = np.random.randint(10, size=(5,5))
print(Z)
zscore(Z)
# #### 91. 使用 Min-Max 標準化算法對數據進行標準化處理
# Min-Max 標準化公式:
# $$Y = \frac{Z-\min(Z)}{\max(Z)-\min(Z)}$$
# In[103]:
# 根據公式定義函數
def min_max(x, axis=None):
min = x.min(axis=axis, keepdims=True)
max = x.max(axis=axis, keepdims=True)
result = (x-min)/(max-min)
return result
# 生成隨機數據
Z = np.random.randint(10, size=(5,5))
print(Z)
min_max(Z)
# #### 92. 使用 L2 范數對數據進行標準化處理
# L2 范數計算公式:
# $$L_2 = \sqrt{x_1^2 + x_2^2 + \ldots + x_i^2}$$
# In[104]:
# 根據公式定義函數
def l2_normalize(v, axis=-1, order=2):
l2 = np.linalg.norm(v, ord = order, axis=axis, keepdims=True)
l2[l2==0] = 1
return v/l2
# 生成隨機數據
Z = np.random.randint(10, size=(5,5))
print(Z)
l2_normalize(Z)
# #### 93. 使用 NumPy 計算變量直接的相關性系數
# In[105]:
Z = np.array([
[1, 2, 1, 9, 10, 3, 2, 6, 7], # 特征 A
[2, 1, 8, 3, 7, 5, 10, 7, 2], # 特征 B
[2, 1, 1, 8, 9, 4, 3, 5, 7]]) # 特征 C
np.corrcoef(Z)
# 相關性系數取值從 `[-1, 1]` 變換,靠近 1 則代表正相關性較強,-1 則代表負相關性較強。結果如下所示,變量 A 與變量 A 直接的相關性系數為 `1`,因為是同一個變量。變量 A 與變量 C 之間的相關性系數為 `0.97`,說明相關性較強。
# ```
# [A] [B] [C]
# array([[ 1. , -0.06, 0.97] [A]
# [-0.06, 1. , -0.01], [B]
# [ 0.97, -0.01, 1. ]]) [C]
# ```
# #### 94. 使用 NumPy 計算矩陣的特征值和特征向量
# In[106]:
M = np.matrix([[1,2,3], [4,5,6], [7,8,9]])
w, v = np.linalg.eig(M)
# w 對應特征值,v 對應特征向量
w, v
# 我們可以通過 `P'AP=M` 公式反算,驗證是否能得到原矩陣。
# In[107]:
v * np.diag(w) * np.linalg.inv(v)
# #### 95. 使用 NumPy 計算 Ndarray 兩相鄰元素差值
# In[108]:
Z = np.random.randint(1,10,10)
print(Z)
# 計算 Z 兩相鄰元素差值
print(np.diff(Z, n=1))
# 重復計算 2 次
print(np.diff(Z, n=2))
# 重復計算 3 次
print(np.diff(Z, n=3))
# #### 96. 使用 NumPy 將 Ndarray 相鄰元素依次累加
# In[109]:
Z = np.random.randint(1,10,10)
print(Z)
"""
[第一個元素, 第一個元素 + 第二個元素, 第一個元素 + 第二個元素 + 第三個元素, ...]
"""
np.cumsum(Z)
# #### 97. 使用 NumPy 按列連接兩個數組
# In[110]:
M1 = np.array([1, 2, 3])
M2 = np.array([4, 5, 6])
np.c_[M1, M2]
# #### 98. 使用 NumPy 按行連接兩個數組
# In[111]:
M1 = np.array([1, 2, 3])
M2 = np.array([4, 5, 6])
np.r_[M1, M2]
# #### 99. 使用 NumPy 打印九九乘法表
# In[112]:
np.fromfunction(lambda i, j: (i + 1) * (j + 1), (9, 9))
# #### 100. 使用 NumPy 將實驗樓 LOGO 轉換為 Ndarray 數組
# In[113]:
from io import BytesIO
from PIL import Image
import PIL, requests
# 通過鏈接下載圖像
URL = 'https://static.shiyanlou.com/img/logo-black.png'
response = requests.get(URL)
# 將內容讀取為圖像
I = Image.open(BytesIO(response.content))
# 將圖像轉換為 Ndarray
shiyanlou = np.asarray(I)
shiyanlou
# In[114]:
# 將轉換后的 Ndarray 重新繪制成圖像
from matplotlib import pyplot as plt
get_ipython().run_line_magic('matplotlib', 'inline')
plt.imshow(shiyanlou)
plt.show()
原文鏈接:https://www.dandelioncloud.cn/article/details/1501148740688883713
相關推薦
- 2022-05-22 C#單例模式與多線程用法介紹_C#教程
- 2022-03-18 .Net使用分表分庫框架ShardingCore實現多字段分片_實用技巧
- 2022-07-07 redis連接報錯error:NOAUTH?Authentication?required_Redi
- 2022-08-15 Android開發gradle拉取依賴的加速配置_Android
- 2023-01-28 python元組的可變與不可變問題_python
- 2022-08-03 python中的三種注釋方法_python
- 2022-01-20 關于 Symbol() 能不能當作 key值使用
- 2022-11-29 React?Hooks獲取數據實現方法介紹_React
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支