日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學(xué)無先后,達(dá)者為師

網(wǎng)站首頁 編程語言 正文

python的import?機制是怎么實現(xiàn)的_python

作者:??編程學(xué)習(xí)網(wǎng)???? ? 更新時間: 2022-07-06 編程語言

import 機制功能

Python 的 import 機制基本上可以切分為三個不同的功能:

  • Python運行時的全局模塊池的維護和搜索;
  • 解析與搜索模塊路徑的樹狀結(jié)構(gòu);
  • 對不同文件格式的模塊執(zhí)行動態(tài)加載機制;

盡管 import 的表現(xiàn)形式千變?nèi)f化,但是都可以歸結(jié)為:import x.y.z 的形式,當(dāng)然 import sys 也可以看成是 x.y.z 的一種特殊形式。而諸如 from、as 與 import 的結(jié)合,實際上同樣會進行 import x.y.z 的動作,只是最后在當(dāng)前名字空間中引入的符號各有不同。

然后導(dǎo)入模塊,虛擬機會調(diào)用 __import__,那么我們就來看看這個函數(shù)長什么樣子。

static PyObject *
builtin___import__(PyObject *self, PyObject *args, PyObject *kwds)
{
    static char *kwlist[] = {"name", "globals", "locals", "fromlist",
                             "level", 0};
    //初始化globals、fromlist都為NULL
    PyObject *name, *globals = NULL, *locals = NULL, *fromlist = NULL;
    int level = 0;//表示默認(rèn)絕對導(dǎo)入
  
    //從PyTupleObject中解析出需要的信息
    if (!PyArg_ParseTupleAndKeywords(args, kwds, "U|OOOi:__import__",
                    kwlist, &name, &globals, &locals, &fromlist, &level))
        return NULL;
    //導(dǎo)入模塊
    return PyImport_ImportModuleLevelObject(name, globals, locals,
                                            fromlist, level);
}

里面有一個PyArg_ParseTupleAndKeywords函數(shù),我們需要提一下,它在虛擬機中是一個被廣泛使用的函數(shù),原型如下:

//Python/getargs.c
int PyArg_ParseTupleAndKeywords(PyObject *, PyObject *,
                                const char *, char **, ...);

這個函數(shù)的作用是參數(shù)解析,負(fù)責(zé)將 args 和 kwds 中所包含的所有對象(指針)按指定的格式 format 解析成各種目標(biāo)對象,可以是 Python 的對象,例如 PyListObject、PyLongObject,也可以是 C 的原生對象。

我們知道這個 builtin__import__ 里面的參數(shù) args 指向一個 PyTupleObject ,包含了?import?函數(shù)運行所需要的參數(shù)和信息,它是虛擬機在執(zhí)行 IMPORT_NAME 指令的時候打包產(chǎn)生的。

然而在這里,虛擬機進行了一個逆動作,將打包后的這個 PyTupleObject 拆開,重新獲得當(dāng)初的參數(shù)。Python 在自身的實現(xiàn)中大量使用了這樣的打包、拆包策略,使得可變數(shù)量的對象能夠很容易地在函數(shù)之間傳遞。

該系列完結(jié)后,會介紹如何用 C 給 Python 寫擴展,到時候會剖析這個函數(shù)的用法。

在完成了對參數(shù)的拆包動作之后,會進入 PyImport_ImportModuleLevelObject ,這個我們在 import_name 中已經(jīng)看到了,當(dāng)然它內(nèi)部也是調(diào)用了 __import__。

另外每個包和模塊都有一個__name__和__path__屬性。

import numpy as np
import numpy.core
import six
print(np.__name__, np.__path__) 
"""
numpy ['C:\\python38\\lib\\site-packages\\numpy']
"""
print(np.core.__name__, np.core.__path__)
"""
numpy.core ['C:\\python38\\lib\\site-packages\\numpy\\core']
"""
print(six.__name__, six.__path__) 
"""
six []
"""

name__就是模塊名或者包名,如果是包下面的包或者模塊,那么就是包名.包名或者包名.模塊名;至于__path__則是包所在的路徑,對于模塊而言, __path?為空列表。

此外還有一個?file?屬性,對于模塊而言就是其自身的完整路徑;對于包而言則分兩種情況,如果包內(nèi)部存在 __init__.py 文件,那么得到的就是 __init__.py 文件的完整路徑,沒有則為 None。

下面來看一下不同的導(dǎo)入方式對應(yīng)的字節(jié)碼,然后在虛擬機的層面來理解這些導(dǎo)入方式。

單模塊導(dǎo)入

以一個簡單的模塊導(dǎo)入為例:

import sys
"""
  0 LOAD_CONST               0 (0)
  2 LOAD_CONST               1 (None)
  4 IMPORT_NAME              0 (sys)
  6 STORE_NAME               0 (sys)
  8 LOAD_CONST               1 (None)
 10 RETURN_VALUE
"""

這是我們一開始考察的例子,現(xiàn)在我們已經(jīng)很清楚地了解了 IMPORT_NAME 的行為。在 IMPORT_NAME 指令的最后,虛擬機會將 PyModuleObject對象(指針)壓入到運行時棧,隨后會將 <"sys", PyModuleObject *> 存放到當(dāng)前的 local名字空間中。

級聯(lián)導(dǎo)入

import sklearn.linear_model.ridge
"""
  0 LOAD_CONST               0 (0)
  2 LOAD_CONST               1 (None)
  4 IMPORT_NAME              0 (sklearn.linear_model.ridge)
  6 STORE_NAME               1 (sklearn)
  8 LOAD_CONST               1 (None)
 10 RETURN_VALUE
"""

如果是級聯(lián)導(dǎo)入,那么 IMPORT_NAME 的指令參數(shù)則是完整的路徑信息,該指令的內(nèi)部將解析這個路徑,并為 sklearn, sklearn.linear_model, sklearn.linear_model.ridge都創(chuàng)建一個 PyModuleObject 對象,這三者都存在于 sys.modules 里面。

但是我們看到 STORE_NAME 是 sklearn,表示只有 sklearn 這個符號暴露在了當(dāng)前模塊的 local 空間里面。可為什么是sklearn呢?難道不應(yīng)該是 sklearn.linear_model.ridge 嗎?

其實經(jīng)過我們之前的分析這一點已經(jīng)不再是問題了,因為 import sklearn.linear_model.ridge并不是說導(dǎo)入一個模塊或包叫做 sklearn.linear_model.ridge,而是先導(dǎo)入 sklearn,然后把 linear_model 放在 sklearn 的屬性字典里面,再把 ridge 放在 linear_model 的屬性字典里面。

同理 sklearn.linear_model.ridge 代表的是先從 local 空間里面找到 sklearn,再從 sklearn 的屬性字典中找到 linear_model,然后在 linear_model 的屬性字典里面找到ridge。因為 linear_model 和 ridge 已經(jīng)在相應(yīng)的屬性字典里面,我們通過 sklearn 一級一級往下找是可以找到的,因此只需要將符號 skearn 暴露給 local 空間即可。

或者說暴露 sklearn.linear_model.ridge 本身就是不合理的,因為這表示導(dǎo)入一個名字就叫做 sklearn.linear_model.ridge 的模塊或者包,但顯然不存在。而即便我們創(chuàng)建了這樣的一個模塊或包,由于 Python 的語法解析規(guī)范依舊不會得到想要的結(jié)果。不然的話,假設(shè) import test_import.a,那是導(dǎo)入名為 test_import.a 的模塊或包呢?還是導(dǎo)入 test_import 下的 a 呢?

也正如我們之前分析的 test_import.a,我們在導(dǎo)入 test_import.a 的時候,會把 test_import 加載進來,然后把 a 加到 test_import 的屬性字典里面,最后只需要把 test_import 返回即可。

因為通過 test_import 可以找到 a,或者說 test_import.a 代表的含義就是從 test_import 的屬性字典里面獲取 a,所以 import test_import.a 必須要返回 test_import,而且只需返回 test_import。

至于 sys.modules 里面雖然存在字符串名為 "test_import.a"的 key 的,但這是為了避免重復(fù)加載所采取的策略,它依舊表示從 test_import 的屬性字典里面獲取 a。

import pandas.core

print(pandas.DataFrame({"a": [1, 2, 3]}))
"""
   a
0  1
1  2
2  3
"""
# 所以通過 pandas.DataFrame 是可以調(diào)用的

導(dǎo)入 pandas.core 會先導(dǎo)入 pandas,也就是執(zhí)行 pandas 內(nèi)部的?init?文件。雖然 sys.modules 里面同時有 "pandas" 和 "pandas.core",但是暴露在 local 空間的只有 pandas,所以調(diào)用 pandas.DataFrame 是完全合理的。至于 pandas.core 顯然它無法暴露,因為這不符合 Python 的變量命名規(guī)范,變量的名稱里面不能出現(xiàn)小數(shù)點,它只是單純地表示從 pandas 的屬性字典中加載 core。

from & import

from sklearn.linear_model import ridge
"""
  0 LOAD_CONST               0 (0)
  2 LOAD_CONST               1 (('ridge',))
  4 IMPORT_NAME              0 (sklearn.linear_model)
  6 IMPORT_FROM              1 (ridge)
  8 STORE_NAME               1 (ridge)
 10 POP_TOP
 12 LOAD_CONST               2 (None)
 14 RETURN_VALUE
"""

注意此時的 2 LOAD_CONST 不再是 None 了,而是一個元組,虛擬機將 ridge 放到了當(dāng)前模塊的 local 空間中。并且 sklearn.linear_model 和 sklearn 都被導(dǎo)入了,存在 sys.modules 里面。

但是 sklearn 卻并不在當(dāng)前 local 空間中,盡管它被創(chuàng)建了,但是又被隱藏了。IMPORT_NAME 是 sklearn.linear_model,也表示導(dǎo)入 sklearn,然后把 sklearn 下面的 linear_model 加入到 sklearn 的屬性字典里面。

而之所以 sklearn 沒在 local 空間里面,可以這樣理解。當(dāng)只出現(xiàn) import 的時候,那么我們必須從頭開始一級一級向下調(diào)用,所以頂層的包必須加入到 local 空間里面。但這里通過 from ... import ...把 ridge 導(dǎo)出了,此時 ridge 已經(jīng)指向了 sklearn 下面的 linear_model 下面的 ridge,那么就不需要 sklearn 了,或者說 sklearn 就沒必要暴露在 local 空間里面了,但它確實被導(dǎo)入進來了。

并且 sys.modules 里面也不存在 "ridge"這個key,存在的是 "sklearn.linear_model.ridge",暴露給 local空間的符號是 ridge。

所以正如上面所說,不管什么導(dǎo)入,都可以歸結(jié)為 import x.y.z 的形式,只是暴露出來的符號不同罷了。

import & as

import sklearn.linear_model.ridge as xxx
"""
  0 LOAD_CONST               0 (0)
  2 LOAD_CONST               1 (None)
  4 IMPORT_NAME              0 (sklearn.linear_model.ridge)
  6 IMPORT_FROM              1 (linear_model)
  8 ROT_TWO
 10 POP_TOP
 12 IMPORT_FROM              2 (ridge)
 14 STORE_NAME               3 (xxx)
 16 POP_TOP
 18 LOAD_CONST               1 (None)
 20 RETURN_VALUE
""

這個和上面的 from & import 類似,"sklearn", "sklearn.linear_model", "sklearn.linear_model.ridge" 都在 sys.modules 里面。但是我們加上了 as xxx,那么這個 xxx 就直接指向了 sklearn 下面的 linear_model 下面的 ridge,此時就不需要 sklearn 了。

因此只有 xxx 暴露在了當(dāng)前模塊的 local空間里面,而 sklearn 雖然也被導(dǎo)入了,但它只在 sys.modules 里面,沒有暴露給當(dāng)前模塊的 local 空間。

from & import & as

from sklearn.linear_model import ridge as xxx

這個我想連字節(jié)碼都不需要貼了,和之前的 from & import 一樣,只是最后暴露給 local 空間的 ridge 變成了我們自己指定的 xxx。

與module對象有關(guān)的名字空間問題

同函數(shù)、類一樣,每個 PyModuleObject 也有自己的名字空間。一個模塊不能直接訪問另一個模塊的內(nèi)容,盡管模塊內(nèi)部的作用域比較復(fù)雜,比如:遵循 LEGB 規(guī)則,但是模塊與模塊之間的劃分則是很明顯的。

# test1.py
name = "古明地覺"
def print_name():
    return name
# test2.py
from test1 import name, print_name
name = "古明地戀"
print(print_name())  # 古明地覺

執(zhí)行 test2.py 之后,發(fā)現(xiàn)打印的依舊是"古明地覺"。我們說 Python 是根據(jù) LEGB 規(guī)則進行查找,而 print_name 函數(shù)里面沒有 name,那么去外層找。test2.py 里面的 name 是"古明地戀",但是打印的依舊是 test1.py 里面的 "古明地覺"。為什么?

還是那句話,模塊與模塊之間的作用域劃分的非常明顯,print_name 是 test1.py 里面的函數(shù),所以在返回 name 的時候,只會從 test1.py 中搜索,無論如何都是不會跳過test1.py、跑到 test2.py 里面的。

再來看個例子:

# test1.py
name = "古明地覺"
nicknames = ["小五", "少女覺"]
# test2.py
import test1
test1.name = "?古明地覺?"
test1.nicknames = ["覺大人"]
from test1 import name, nicknames
print(name)  # ?古明地覺?
print(nicknames)  # ['覺大人']

此時打印的結(jié)果變了,很簡單,這里是直接把 test1 里面的變量修改了。因為這種方式,相當(dāng)于直接修改 test1 的屬性字典。那么后續(xù)再導(dǎo)入的時候,打印的就是修改之后的值。

# test1.py
name = "古明地覺"
nicknames = ["小五", "少女覺"]
# test2.py
from test1 import name, nicknames
name = "古明地戀"
nicknames.remove("小五")
from test1 import name, nicknames
print(name)  # 古明地覺
print(nicknames)  # ["少女覺"]

如果是 from test1 import name, nicknames,那么相當(dāng)于在當(dāng)前的 local空間中新創(chuàng)建變量 name 和 nicknames,它們和 test1 中的 name 和 nicknames 指向相同的對象。

name = "古明地覺" 相當(dāng)于重新賦值了,所以不會影響test1里的 name;而 nicknames.remove 則是在本地進行修改,所以會產(chǎn)生影響。

小結(jié)

以上就是模塊(包)相關(guān)的內(nèi)容,雖然一個項目可以有很多個文件,但是每個文件的執(zhí)行原理是一致的。無論一個文件是作為模塊被導(dǎo)入,還是直接作為啟動文件被執(zhí)行,虛擬機的執(zhí)行流程都沒有變化。

通過模塊和包,我們便可以對項目進行功能上的劃分,從而更好地組織項目。

原文鏈接:https://juejin.cn/post/7094826376762490893

欄目分類
最近更新