日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

Python進階之import導入機制原理詳解_python

作者:Silent丿丶黑羽 ? 更新時間: 2022-12-22 編程語言

前言

在Python中,一個.py文件代表一個Module。在Module中可以是任何的符合Python文件格式的Python腳本。了解Module導入機制大有用處。

1. Module組成

一個.py文件就是一個module。Module中包括attribute, function等。 這里說的attribute其實是module的global variable。

我們創建1個test1.py文件,代碼如下

# 定義1個全局變量a
a = 1
# 聲明一個全局變量moduleName
global moduleName


# 定義一個函數printModuleName
def printModuleName():
    print(a + 2)
    print(__name__)
    print(moduleName)

print(dir())

這里我們定義了3個全局變量amoduleNameprintModuleName,除了我們自己定義的以外還有module內置的全局變量

1.1 Module 內置全局變量

上面我們說到了,每一個模塊都有內置的全局變量,我們可以使用dir()函數,用于查看模塊內容,例如上面的例子中,使用dir()查看結果如下:

['__annotations__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'a', 'moduleName', 'printModuleName']

其中a, moduleName, printModuleName 是由用戶自定義的。其他的全是內置的。下面介紹幾個常用的內置全局變量

1.1.1?__name__

指的是當前模塊的名稱,比如上面的test1.py,模塊的名稱默認就是test1,如果一個module是程序的入口,那么__name__=__'main'__,這也是我們經常看到用到的

1.1.2?__builtins__

它就是內置模塊builtins的引用。可以通過如下代碼測試:

import builtins
print(builtins == __builtins__)

打印結果為True,在Python代碼里,不需要我們導入就能直接使用的函數、類等,都是在這個內置模塊里的。例如:rangedir?

1.1.3?__doc__

它就是module的文檔說明,具體是文件頭之后、代碼(包含import)之前的第一個多行注釋,測試如下

"""
模塊導入機制測試
"""


import builtins


# 定義1個全局變量a
a = 1
# 聲明一個全局變量moduleName
global moduleName


# 定義一個函數printModuleName
def printModuleName():
    print(a + 2)
    print(__name__)
    print(moduleName)


print(__doc__)

最后打印結果為

模塊導入機制測試

當然如果你想查看某個方法的說明,也可以這么使用

1.1.4?__file__

當前module所在的文件的絕對路徑

1.1.5?__package__

當前module所在的包名。如果沒有,為None。

2. 包package

為避免模塊名沖突,Python引入了按目錄組織模塊的方法,稱之為包(package)。包是含有Python模塊的文件夾。

當一個文件夾下有init.py時,意為該文件夾是一個包(package),其下的多個模塊(module)構成一個整體,而這些模塊(module)都可通過同一個包(package)導入其他代碼中。

其中init.py文件用于組織包(package),方便管理各個模塊之間的引用、控制著包的導入行為。

該文件可以什么內容都不寫,即為空文件,存在即可,相當于一個標記。

但若想使用from pacakge_1 import *這種形式的寫法,需在init.py中加上:__all__ = ['file_a', 'file_b'],并且package_1下有file_a.pyfile_b.py,在導入時init.py文件將被執行。

但不建議在init.py中寫模塊,以保證該文件簡單。不過可在init.py導入我們需要的模塊,以便避免一個個導入、方便使用。

其中,__all__是一個重要的變量,用來指定此包(package)被import *時,哪些模塊(module)會被import進【當前作用域中】。不在__all__列表中的模塊不會被其他程序引用。可以重寫__all__,如__all__=?['當前所屬包模塊1名字', '模塊1名字'],如果寫了這個,則會按列表中的模塊名進行導入

在模糊導入時,形如from package import *,*是由__all__定義的。

當我們在導入一個包(package)時(會先加載__init__.py定義的引入模塊,然后再運行其他代碼),實際上是導入的它的__init__.py文件(導入時,該文件自動運行,助我們一下導入該包中的多個模塊)。我們可以在 init.py中再導入其他的包(package)或模塊或自定義類。

2.1 實戰案例

首先我們創建3個包,分別是testtest2test3test包下創建test1.py用來執行測試

test2包下創建file_a.pyfile_b.py,用來測試包的導入

test3包下創建file_c.py,輔助測試

具體結構如下:

核心代碼在test2/__init__.py中如下

__all__ = ['file_a', 'file_b', 'file_c', 'test_d']


from test3 import file_c


def test_d():
    return "test_d"

解釋下,當我們在test/test1.py中寫了from test2 import *這句代碼,程序不是直接導入test2下的所有模塊,而是導入__init__.py文件并自動運行,由于我們寫了__all__ = ['file_a', 'file_b', 'file_c', 'test_d'],file_a和file_b是當下包中的模塊,file_c是我們從test3包中導入的,test_d是__init__.py下我們定義的函數。

所以from test2 import *就是把__all__中指定的模塊和函數導入進來了,接著我們查看test1.py下的代碼

from test2 import *
print(file_a.a())
print(file_b.b())
print(file_c.c())
print(test_d())

如果打印有結果,則證明了導入成功,并且導入的是__all__下的模塊和函數

3.sys.modules、命名空間

3.1 sys.modules

sys.modules是一個將模塊名稱映射到已加載的模塊的字典。可用來強制重新加載modules。Python一啟動,它將被加載在內存中。

當我們導入新modules,sys.modules將自動記錄下該module;當第二次再導入該module時,Python將直接到字典中查找,加快運行速度。

它是1個字典,故擁有字典的一切方法,如sys.modules.keys()sys.modules.values()sys.modules['os']。但請不要輕易替換字典、或從字典中刪除某元素,將可能導致Python運行失敗。

3.2 命名空間

命名空間就像一個dict,key是變量名字,value是變量的值。

  • 每個函數function都有自己的命名空間,稱local namespace,記錄函數的變量。
  • 每個模塊module都有自己的命名空間,稱global namespace,記錄模塊的變量,包括functions、classes、導入的modules、module級別的變量和常量。
  • build-in命名空間,它包含build-in function和exceptions,可被任意模塊訪問。

假設你要訪問某段Python代碼中的變量x時,Python會在所有的命名空間中查找該變量,順序是:

  • local namespace 即當前函數或類方法。若找到,則停止搜索;
  • global namespace 即當前模塊。若找到,則停止搜索;
  • build-in namespace Python會假設變量x是build-in的內置函數或變量。若變量x不是build-in的內置函數或變量,Python將報錯NameError。
  • 對于閉包,若在local namespace找不到該變量,則下一個查找目標是父函數的local namespace。

我們可以看一個小例子

# test_namespace.py
def func(a=1):
    b = 2
    print(locals())  # 打印當前函數的局部命名空間
    '''
    locs = locals()  # 只讀,不可寫,會報錯
    locs['c'] = 3
    print(c)
    '''
    return a + b


func()
glos = globals()
glos['d'] = 4
print(d)
print(globals())

執行func()會打印函數func的局部命名空間,結果如下:

{'a': 1, 'b': 2}

執行print(globals())會打印模塊test_namespace的全局命名空間,結果如下:

{'__name__': '__main__', '__doc__': None, '__package__': None, '__loader__': <_frozen_importlib_external.SourceFileLoader object at 0x7fde2605c730>, '__spec__': None, '__annotations__': {}, '__builtins__': <module 'builtins' (built-in)>, '__file__': '/Users/jkc/PycharmProjects/pythonProject1/test_namespace.py', '__cached__': None, 'func': <function func at 0x7fde246b9310>, 'glos': {...}, 'd': 4}

內置函數locals()globals()都會返回一個字典。區別:前者只讀、后者可寫。

命名空間在from module_name importimport module_name中的體現:from關鍵詞是導入模塊或包中的某個部分。

from module_A import X:會將該模塊的函數/變量導入到當前模塊的命名空間中,無須用module_A.X訪問了。

import module_A:modules_A本身被導入,但保存它原有的命名空間,故得用module_A.X方式訪問其函數或變量。

接下來我們測試一下:

可以看到我們導入了函數a和模塊file_c,接著我們打印了全局變量,結果如下:

{'__name__': '__main__', '__doc__': None, '__package__': None, '__loader__': <_frozen_importlib_external.SourceFileLoader object at 0x7fab9585c730>, '__spec__': None, '__annotations__': {}, '__builtins__': <module 'builtins' (built-in)>, '__file__': '/Users/jkc/PycharmProjects/pythonProject1/test3/test_namespace.py', '__cached__': None, 'a': <function a at 0x7fab95b04040>, 'file_c': <module 'file_c' from '/Users/jkc/PycharmProjects/pythonProject1/test3/file_c.py'>}

可以很清楚的看到全局變量中有函數a和模塊file_c,接著我們嘗試能否調用者2個

from test2.file_a import a
import file_c


print(globals())


file_c.c()
a()

最后也是可以成功調用

4. 導入

準備工作如下:

4.1 絕對導入

所有的模塊import都從“根節點”開始。根節點的位置由sys.path中的路徑決定,項目的根目錄一般自動在sys.path中。如果希望程序能處處執行,需手動修改sys.path

例1:c.py中導入B包/B1子包/b1.py模塊

import os
import sys


BASE_DIR = os.path.dirname(os.path.abspath(__file__))
sys.path.append(BASE_DIR)

# 導入B包中的子包B1中的模塊b1
from B.B1 import b1

例2:b1.py中導入b2.py模塊

# 從B包中的子包B1中導入模塊b2
from B.B1 import b2

4.2 相對導入

只關心相對自己當前目錄的模塊位置就好。不能在包(package)的內部直接執行(會報錯)。不管根節點在哪兒,包內的模塊相對位置都是正確的。

b1.py代碼如下:

# from . import b2  # 這種導入方式會報錯
import b2  # 正確
b2.print_b2()

b2.py代碼如下:

def print_b2():
    print('b2')

最后運行b1.py,打印b2。

4.3 單獨導入包

單獨import某個包名稱時,不會導入該包中所包含的所有子模塊。

c.py導入同級目錄B包的子包B1包的b2模塊,執行b2模塊的print_b2()方法:

c.py代碼

import B
B.B1.b2.print_b2()

運行c.py會以下錯誤

AttributeError: module 'B' has no attribute 'B1'

因為import B并不會自動將B下的子模塊導入進去,需要手動添加,解決辦法如下

在B/init.py代碼下添加如下代碼

from . import B1

在B/B1/init.py代碼下添加如下代碼

from . import b2

此時,執行c.py,成功打印b2。

5. import運行機制

我們要理解Python在執行import語句時,進行了啥操作?

step1:創建一個新的、空的module對象(它可能包含多個module);

step2:將該module對象 插入sys.modules中;

step3:裝載module的代碼(如果需要,需先編譯);

step4:執行新的module中對應的代碼。

在執行step3時,首先需找到module程序所在的位置,如導入的module名字為mod_1,則解釋器得找到mod_1.py文件,搜索順序是:

當前路徑(或當前目錄指定sys.path)->PYTHONPATH->Python安裝設置相關的默認路徑。

對于不在sys.path中,一定要避免用import導入自定義包(package)的子模塊(module),而要用from…import…的絕對導入或相對導入,且包(package)的相對導入只能用from形式。

5.1 標準import,頂部導入

5.2 嵌套import

5.2.1 順序導入-import

  • moduleB定義了變量b=2
  • moduleA導入模塊moduleB,當然moduleB還可以導入其他模塊
  • test模塊導入moduleA

最后執行test.py,將打印3

5.2.2 循環導入/嵌套導入

moduleA.py

from moduleB import ClassB


class ClassA:
    pass

moduleB.py

from moduleA import ClassA


class ClassB:
    pass

當執行moduleA.py時會報錯

ImportError: cannot import name 'ClassA' from partially initialized module 'moduleA'

報錯分析:

1.在運行moduleA時,首選會執行from moduleB import ClassB代碼

2.程序會判斷sys.modules中是否有

3.有代表字在第一次執行時,創建的對象已經緩存在sys.modules,直接得到,不過依然是空對象,因為__dict__找不到ClassB,會報錯

4.沒有會為moduleB.py創建1個module對象,此時創建的module對象為空

  • 4.1 然后執行moduleB.py的第一條語句from moduleA import ClassAPS:這么做的原因是python內部創建了module對象后立馬執行moduleB.py,目的是填充<module moduleB>__dict__,當然最終未能成功填充
  • 4.2 接著判斷sys.modules中是否有
  • 4.3 沒有會為moduleA.py創建1個module對象

PS:此時創建的module對象同樣為空,則需要執行moduleA.py語句from moduleB import ClassB

5.最后回到操作2的過程,這次判斷有module對象,會進行操作3,最后就會報錯cannot import name 'ClassA'

解決辦法:組織代碼(重構代碼):更改代碼布局,可合并或分離競爭資源。

原文鏈接:https://www.cnblogs.com/jiakecong/p/16908795.html

欄目分類
最近更新