日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

python?序列去重并保持原始順序操作_python

作者:ctrl?A_ctrl?C_ctrl?V ? 更新時間: 2022-05-25 編程語言

一、簡單的方法實現

def dedupe(items):
? ? seen = []
? ? for item in items:
? ? ? ? if item not in seen:
? ? ? ? ? ? seen.append(item)
? ? return seen

sequence = [1, 2, 3, 5, 2, 3, 4]
print((dedupe(sequence))) ? ?# [1, 2, 3, 5, 4]

二、用 set 和 yield 實現

代碼:

def dedupe(items):
? ? seen = set() ? ?# 集合set是一個無序不重復元素集
? ? for item in items:
? ? ? ? if item not in seen:
? ? ? ? ? ? yield item
? ? ? ? ? ? seen.add(item) ? ? ? ? ?


sequence = [1, 2, 3, 5, 2, 3, 4]
print(list(dedupe(sequence))) ? ?# [1, 2, 3, 5, 4]
# list(dedupe(sequence))是將生成器中的結果呈現出來

這里對set和yield進行研究。如果不用yield可不可以呢,畢竟用生成器會很難理解,那么首先去掉yied,返回seen:

def dedupe(items):
? ? seen = set()
? ? for item in items:
? ? ? ? if item not in seen:
? ? ? ? ? ? seen.add(item)
? ? return seen


sequence = [1, 2, 3, 5, 2, 3, 4]
print(list(dedupe(sequence))) ? ?# [1, 2, 3, 4, 5]

可以發現輸出的元素并沒有保持原有的順序,這是因為set的特性導致的。set是一個一個無序不重復元素集,使用 add()方法向set中添加元素時并不會將元素添加到末尾,而是按照順序插入到了中間位置。

我們可以逐步打印 seen 的內容看一下:

def dedupe(items):
? ? seen = set()
? ? for item in items:
? ? ? ? if item not in seen:
? ? ? ? ? ? seen.add(item)
? ? ? ? ? ? print("seen: ",seen)
? ? return seen

sequence = [1, 2, 3, 5, 2, 3, 4]
print("sequence元素: ",dedupe(sequence))

# output:
seen: ?{1}
seen: ?{1, 2}
seen: ?{1, 2, 3}
seen: ?{1, 2, 3, 5}
seen: ?{1, 2, 3, 4, 5}
sequence元素: ?{1, 2, 3, 4, 5}

可以發現向集合 {1, 2, 3, 5} 中 add(4),得到的是 {1, 2, 3, 4, 5},而不是 {1, 2, 3, 5, 4},這就是 set 無序性的體現。

那么為什么用 yield 就可以實現保持順序的功能呢?因為 yield 生成器會逐個返回 1, 2, 3, 5, 4

那么為什么 print(list(dedupe(sequence)) )會輸出 [1, 2, 3, 5, 4] 呢?因為 list(dedupe(sequence)) 是將生成器中的結果呈現出來,直接打印生成器 print(dedupe(sequence)) 只會輸出地址,不會輸出內容,

三、Python列表去重并保持順序為什么使用yield?

list(dedupe(a))的作用是將生成器中的結果呈現出來,所以順序沒有改變。修改一下函數就能看到seen,

如圖:

在函數中打印seen:

可以看見在中間出現了一個集合,就是seen,如果去掉print中的list,則打印:

此時出現了一個生成器(generator),但沒有打印print(seen)。為什么呢?因為不調用生成器的話,程序只執行到yeild item,不繼續往下執行了。

我們可以使用next()方法調用生成器:

輸出結果:

可以看出生成器調用了第一個數值5,此時停在第二個數值處,再用next方法調用時,將打印第二個數值2 ,再用next方法調用時,將打印第三個數值1 :

這里用next調用生成器時,必須將生成器實例化,即g = dedupe(a),如果仍然用next(dedupe(a))將一直打印5,因為Python會認為你又重新調用了一次函數。

結果:

原文鏈接:https://blog.csdn.net/qq_43799400/article/details/123667132

欄目分類
最近更新