網站首頁 編程語言 正文
numba使用LLVM編譯器架構將純Python代碼生成優化過的機器碼,
將面向數組和使用大量數學的python代碼優化到與c,c++和Fortran類似的性能,而無需改變Python的解釋器。
from numba import jit, int32
import math
# 例子1
@jit(int32(int32, int32))
def f(x, y):
return x + y
f(1, 3)
4
Numba編譯的函數可以調用其他編譯的函數。這些函數調用甚至可以在本地代碼中被內聯,這取決于優化器的啟發式方法。比如說。
# 例子2
@jit
def square(x):
return x ** 2
@jit
def hypot(x, y):
return math.sqrt(square(x) + square(y))
hypot(1, 3)
3.1622776601683795
# 例子3
@jit
def go_fast_sum1(size: float) -> int:
sum = 0
for i in range(size):
sum += i
return sum
@jit
def go_fast_sum2(size):
sum = 0
for i in range(size):
sum += i
return sum
@jit(int32(int32))
def go_fast_sum3(size):
sum = 0
for i in range(size):
sum += i
return sum
def pure_python_sum(size):
sum = 0
for i in range(size):
sum += i
return sum
%timeit go_fast_sum1(1000)
192 ns ± 6.89 ns per loop (mean ± std. dev. of 7 runs, 10,000,000 loops each)
%timeit go_fast_sum2(1000)
193 ns ± 4.93 ns per loop (mean ± std. dev. of 7 runs, 10,000,000 loops each)
%timeit go_fast_sum3(1000)
201 ns ± 4.9 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)
%timeit pure_python_sum(1000)
47.8 μs ± 5.39 μs per loop (mean ± std. dev. of 7 runs, 10,000 loops each)
上面幾個例子看出來,不同寫法,差別不是很大,都有得到提升。就按你自己舒服方式寫就好
nopython:
這個模式,是被推薦的模式
說白了就是這段代碼的運行將脫離python解釋器,變成機器碼來運行,所以速度超快。
@jit(nopython=True)
def go_fast_sum4(size):
sum = 0
for i in range(size):
sum += i
return sum
%timeit go_fast_sum4(1000)
190 ns ± 12.5 ns per loop (mean ± std. dev. of 7 runs, 10,000,000 loops each)
@jit(nopython=True)
def go_fast_sum5(size: float) -> int:
sum = 0
for i in range(size):
sum += i
return sum
%timeit go_fast_sum5(1000)
195 ns ± 26 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)
object
普通模式,就是在python解釋器里運行的模式。沒有寫nopython=True那么就默認是這個
def foo():
A#非數學計算類。
for i in range(1000):
B#數學計算類。
C#非數學計算類。
這個模式將自動識別那個循環,然后優化,脫離python解釋器,運行。而對于A,C這兩個東西無法優化,需要切換回到python解釋器,極其浪費時間,效果差。切換很費時間,這種情況,最好不要用nopython的模式,而使用下面地這種普通模式。
并行模式
@jit(nopython=True, parallel=True)
def go_fast_sum6(size: float) -> int:
sum = 0
for i in range(size):
sum += i
return sum
%timeit go_fast_sum6(1000)
/home/ubuntu/.local/lib/python3.8/site-packages/numba/core/typed_passes.py:329: NumbaPerformanceWarning: [1m
The keyword argument 'parallel=True' was specified but no transformation for parallel execution was possible.
To find out why, try turning on parallel diagnostics, see https://numba.readthedocs.io/en/stable/user/parallel.html#diagnostics for help.
[1m
File "../../../../tmp/ipykernel_3446152/3683479791.py", line 1:[0m
[1m<source missing, REPL/exec in use?>[0m
[0m
warnings.warn(errors.NumbaPerformanceWarning(msg,
196 ns ± 15.5 ns per loop (mean ± std. dev. of 7 runs, 10,000,000 loops each)
原文鏈接:https://blog.csdn.net/linkedin_21843693/article/details/125857106
相關推薦
- 2024-07-18 Spring Security之認證過濾器
- 2023-07-25 使用Redis做Mybatis的二級緩存
- 2022-06-26 C#實現數組元素的數據類型轉換方法詳解_C#教程
- 2022-06-06 Python實現文字pdf轉換圖片pdf效果_python
- 2022-11-06 Android淺析viewBinding和DataBinding_Android
- 2022-04-18 2.* 版本taro引入 taro-ui編譯小程序階段報錯, Module not found: C
- 2022-04-01 maven的settings.xml文件中配置多個nexus倉庫
- 2024-03-09 【Redis】Redis 實現分布式Session
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支