迭代器是 23 種設(shè)計(jì)模式中最常用的一種(之一),在 Python 中隨處可見它的身影,我們經(jīng)常用到它,但是卻不一定意識(shí)到它的存在。在關(guān)于迭代器的系列文章中(鏈接見文末),我至少提到了 23 種生成迭代器的方法。有些方法是專門用于生成迭代器的,還有一些方法則是為了解決別的問題而“暗中”使用到迭代器。

寬甸網(wǎng)站制作公司哪家好,找創(chuàng)新互聯(lián)!從網(wǎng)頁設(shè)計(jì)、網(wǎng)站建設(shè)、微信開發(fā)、APP開發(fā)、響應(yīng)式網(wǎng)站建設(shè)等網(wǎng)站項(xiàng)目制作,到程序開發(fā),運(yùn)營維護(hù)。創(chuàng)新互聯(lián)2013年至今到現(xiàn)在10年的時(shí)間,我們擁有了豐富的建站經(jīng)驗(yàn)和運(yùn)維經(jīng)驗(yàn),來保證我們的工作的順利進(jìn)行。專注于網(wǎng)站建設(shè)就選創(chuàng)新互聯(lián)。
在系統(tǒng)學(xué)習(xí)迭代器之前,我一直以為 range() 方法也是用于生成迭代器的,現(xiàn)在卻突然發(fā)現(xiàn),它生成的只是可迭代對(duì)象,而并不是迭代器! (PS:Python2 中 range() 生成的是列表,本文基于Python3,生成的是可迭代對(duì)象)
于是,我有了這樣的疑問:為什么 range() 不生成迭代器呢?在查找答案的過程中,我發(fā)現(xiàn)自己對(duì) range 類型的認(rèn)識(shí)存在一些誤區(qū)。因此,本文將和大家全面地認(rèn)識(shí)一下 range ,期待與你共同學(xué)習(xí)進(jìn)步。
1、range() 是什么?
它的語法:range(start, stop [,step]) ;start 指的是計(jì)數(shù)起始值,默認(rèn)是 0;stop 指的是計(jì)數(shù)結(jié)束值,但不包括 stop ;step 是步長,默認(rèn)為 1,不可以為 0 。range() 方法生成一段左閉右開的整數(shù)范圍。
對(duì)于 range() 函數(shù),有幾個(gè)注意點(diǎn):(1)它表示的是左閉右開區(qū)間;(2)它接收的參數(shù)必須是整數(shù),可以是負(fù)數(shù),但不能是浮點(diǎn)數(shù)等其它類型;(3)它是不可變的序列類型,可以進(jìn)行判斷元素、查找元素、切片等操作,但不能修改元素;(4)它是可迭代對(duì)象,卻不是迭代器。
2、 為什么range()不生產(chǎn)迭代器?
可以獲得迭代器的內(nèi)置方法很多,例如 zip() 、enumerate()、map()、filter() 和 reversed() 等等,但是像 range() 這樣僅僅得到的是可迭代對(duì)象的方法就絕無僅有了(若有反例,歡迎告知)。這就是我存在知識(shí)誤區(qū)的地方。
在 for-循環(huán) 遍歷時(shí),可迭代對(duì)象與迭代器的性能是一樣的,即它們都是惰性求值的,在空間復(fù)雜度與時(shí)間復(fù)雜度上并無差異。我曾概括過兩者的差別是“一同兩不同”:相同的是都可惰性迭代,不同的是可迭代對(duì)象不支持自遍歷(即next()方法),而迭代器本身不支持切片(即 getitem () 方法)。
雖然有這些差別,但很難得出結(jié)論說它們哪個(gè)更優(yōu)。現(xiàn)在微妙之處就在于,為什么給 5 種內(nèi)置方法都設(shè)計(jì)了迭代器,偏偏給 range() 方法設(shè)計(jì)的就是可迭代對(duì)象呢?把它們都統(tǒng)一起來,不是更好么?
事實(shí)上,Pyhton 為了規(guī)范性就干過不少這種事,例如,Python2 中有 range() 和 xrange() 兩種方法,而 Python3 就干掉了其中一種,還用了“李代桃僵”法。為什么不更規(guī)范點(diǎn),令 range() 生成的是迭代器呢?
關(guān)于這個(gè)問題,我沒找到官方解釋,以下純屬個(gè)人觀點(diǎn) 。
zip() 等方法都需要接收確定的可迭代對(duì)象的參數(shù),是對(duì)它們的一種再加工的過程,因此也希望馬上產(chǎn)出確定的結(jié)果來,所以 Python 開發(fā)者就設(shè)計(jì)了這個(gè)結(jié)果是迭代器。這樣還有一個(gè)好處,即當(dāng)作為參數(shù)的可迭代對(duì)象發(fā)生變化的時(shí)候,作為結(jié)果的迭代器因?yàn)槭窍男偷模粫?huì)被錯(cuò)誤地使用。
而 range() 方法就不同了,它接收的參數(shù)不是可迭代對(duì)象,本身是一種初次加工的過程,所以設(shè)計(jì)它為可迭代對(duì)象,既可以直接使用,也可以用于其它再加工用途。例如,zip() 等方法就完全可以接收 range 類型的參數(shù)。
也就是說,range() 方法作為一種初級(jí)生產(chǎn)者,它生產(chǎn)的原料本身就有很大用途,早早把它變?yōu)榈鞯脑挘瑹o疑是一種畫蛇添足的行為。
對(duì)于這種解讀,你是否覺得有道理呢?歡迎就這個(gè)話題與我探討。
3、range 類型是什么?
以上是我對(duì)“為什么range()不產(chǎn)生迭代器”的一種解答。順著這個(gè)思路,我研究了一下它產(chǎn)生的 range 對(duì)象,一研究就發(fā)現(xiàn),這個(gè) range 對(duì)象也并不簡單。
首先奇怪的一點(diǎn)就是,它竟然是不可變序列!我從未注意過這一點(diǎn)。雖然說,我從未想過修改 range() 的值,但這一不可修改的特性還是令我驚訝。
翻看文檔,官方是這樣明確劃分的——有三種基本的序列類型:列表、元組和范圍(range)對(duì)象。(There are three basic sequence types: lists, tuples, and range objects.)
這我倒一直沒注意,原來 range 類型居然跟列表和元組是一樣地位的基礎(chǔ)序列!我一直記掛著字符串是不可變的序列類型,不曾想,這里還有一位不可變的序列類型呢。
那 range 序列跟其它序列類型有什么差異呢?
普通序列都支持的操作有 12 種。range 序列只支持其中的 10 種,不支持進(jìn)行加法拼接與乘法重復(fù)。
那么問題來了:同樣是不可變序列,為什么字符串和元組就支持上述兩種操作,而偏偏 range 序列不支持呢?雖然不能直接修改不可變序列,但我們可以將它們拷貝到新的序列上進(jìn)行操作啊,為何 range 對(duì)象連這都不支持呢?
且看官方文檔的解釋:
…due to the fact that range objects can only represent sequences that follow a strict pattern and repetition and concatenation will usually violate that pattern.
原因是 range 對(duì)象僅僅表示一個(gè)遵循著嚴(yán)格模式的序列,而重復(fù)與拼接通常會(huì)破壞這種模式…
問題的關(guān)鍵就在于 range 序列的 pattern,仔細(xì)想想,其實(shí)它表示的就是一個(gè)等差數(shù)列啊(喵,高中數(shù)學(xué)知識(shí)沒忘…),拼接兩個(gè)等差數(shù)列,或者重復(fù)拼接一個(gè)等差數(shù)列,想想確實(shí)不妥,這就是為啥 range 類型不支持這兩個(gè)操作的原因了。由此推論,其它修改動(dòng)作也會(huì)破壞等差數(shù)列結(jié)構(gòu),所以統(tǒng)統(tǒng)不給修改就是了。
4、小結(jié)
回顧全文,我得到了兩個(gè)偏冷門的結(jié)論:range 是可迭代對(duì)象而不是迭代器;range 對(duì)象是不可變的等差序列。
若單純看結(jié)論的話,你也許沒有感觸,或許還會(huì)說這沒啥了不得啊。但如果我追問,為什么 range 不是迭代器呢,為什么 range 是不可變序列呢?對(duì)這倆問題,你是否還能答出個(gè)自圓其說的設(shè)計(jì)思想呢?(PS:我決定了,若有機(jī)會(huì)面試別人,我必要問這兩個(gè)問題的嘿~)
由于 range 對(duì)象這細(xì)微而有意思的特性,我覺得這篇文章寫得值了。本文是作為迭代器系列文章的一篇來寫的,所以對(duì)于迭代器的基礎(chǔ)知識(shí)介紹不多,另外,還有一種特殊的迭代器也值得單獨(dú)成文,那就是生成器了。
無意間,看到這么一道Python面試題:以下代碼將輸出什么?
def testFun:
temp = [lambda x : i*x for i in range(4)]
return temp
for everyLambda in testFun:
print (everyLambda(2))
腦中默默一想,這還用說么,肯定是:
2
4
6
最后一看答案,竟然是:
6
6
6
6
于是帶著懷疑的心態(tài)(其實(shí)是不服輸,不認(rèn)錯(cuò)),打開編輯器,快速一敲,果然是:
懷疑了人生半天,本來還想黑,WTF Python…然后才想通是自己太生疏......
最后發(fā)現(xiàn)原因竟是:Python 的閉包的后期綁定導(dǎo)致的 late binding。
這意味著在閉包中的變量是在內(nèi)部函數(shù)被調(diào)用的時(shí)候被查找,所以當(dāng)任何testFun 返回的函數(shù)被調(diào)用,i 的值是在它被調(diào)用時(shí)的周圍作用域中查找。
也就是說無論哪個(gè)返回的函數(shù)被調(diào)用,for 循環(huán)都已經(jīng)完成了,i 最后的值是 3,因此,每個(gè)返回的函數(shù) testFun 的值都是 3。
因此一個(gè)等于 2 的值被傳遞進(jìn)以上代碼,它們將返回一個(gè)值 6 (比如:3 x 2)。
究竟如何才能實(shí)現(xiàn)出這樣的結(jié)果呢?
2
4
6
想了想,若能立即綁定參數(shù),或者直接不用閉包總該行吧,用另一種方式避免 i 的改寫。
回憶了之前所學(xué)知識(shí),最后醞釀出了四種解決方案。
第一種:創(chuàng)建一個(gè)閉包,通過使用默認(rèn)參數(shù)立即綁定它的參數(shù)
def testFun:
temp = [lambda x, i=i: i * x for i in range(4)]
return temp
for everyLambda in testFun:
print(everyLambda(2))
第二種:使用functools.partial 函數(shù),把函數(shù)的某些參數(shù)(不管有沒有默認(rèn)值)給固定住(也就是相當(dāng)于設(shè)置默認(rèn)值)
from functools import partial
from operator import mul
def testFun:
return [partial(mul, i) for i in range(4)]
for everyLambda in testFun:
print(everyLambda(2))
第三種:優(yōu)雅的寫法,直接用生成器
def testFun:
return (lambda x, i=i: i * x for i in range(4))
for everyLambda in testFun:
print(everyLambda(2))
第四種:利用yield的惰性求值的思想
def testFun:
for i in range(4):
yield lambda x: i * x
for everyLambda in testFun:
print(everyLambda(2))
最終運(yùn)行結(jié)果:
有了解決方案后,又陷入了懷疑自己,這個(gè)題目究竟是考察的是什么?是在考面試者閉包相關(guān)知識(shí)以及Python 的閉包的后期綁定問題么?
若將題目改成:以下代碼輸出的結(jié)果是(0,2,4,6)么?如果不是,你將會(huì)怎么做,讓它變成(0,2,4,6)?這樣會(huì)不會(huì)更有意思點(diǎn)呢?歡迎大家出妙招,看究竟有多少招?(哈哈哈!!!)
Copyright ? 1999-2020, CSDN.NET, All Rights Reserved
惰性計(jì)算的序列
打開APP
Python 的惰性求值與惰性序列 翻譯
2018-07-23 14:57:48
2點(diǎn)贊
東師小鎮(zhèn)
碼齡5年
關(guān)注
惰性求值
在編程語言理論中,惰性求值(英語:Lazy Evaluation),又譯為惰性計(jì)算、懶惰求值,也稱為傳需求調(diào)用(call-by-need),是一個(gè)計(jì)算機(jī)編程中的一個(gè)概念,它的目的是要最小化計(jì)算機(jī)要做的工作。它有兩個(gè)相關(guān)而又有區(qū)別的含意,可以表示為“延遲求值”和“最小化求值”。
避免不必要的計(jì)算,帶來性能的提升(最小化求值)。
對(duì)于Python中的條件表達(dá)式 if x and y,在x為false的情況下y表達(dá)式的值將不再計(jì)算。而對(duì)于if x or y,當(dāng)x的值為true的時(shí)候?qū)⒅苯臃祷兀辉儆?jì)算y的值。因此編程中可以利用該特性,在 and邏輯中,將小概率發(fā)生的條件放在前面或者在or邏輯中,將大概率發(fā)生的時(shí)間放在前面,有助于性能的提升。
2. 節(jié)省空間,使得無線循環(huán)的數(shù)據(jù)結(jié)構(gòu)成為可能(延遲求值)。
延遲求值特別用于函數(shù)式編程語言中。在使用延遲求值的時(shí)候,表達(dá)式不在它被綁定到變量之后就立即求值,而是在該值被取用的時(shí)候求值。延遲求值的一個(gè)好處是能夠建立可計(jì)算的無限列表而沒有妨礙計(jì)算的無限循環(huán)或大小問題。例如,可以建立生成無限斐波那契數(shù)列表的函數(shù)(經(jīng)常叫做“流”)。第n個(gè)斐波那契數(shù)的計(jì)算僅是從這個(gè)無限列表上提取出這個(gè)元素,它只要求計(jì)算這個(gè)列表的前n個(gè)成員。
惰性序列
Python的惰性序列多數(shù)指 iterator,其特點(diǎn)正如同上文所述,具有惰性計(jì)算特點(diǎn)的序列稱為惰性序列。
Python的iterator是一個(gè)惰性序列,意思是表達(dá)式和變量綁定后不會(huì)立即進(jìn)行求值,而是當(dāng)你用到其中某些元素的時(shí)候才去求某元素對(duì)的值。 惰性是指,你不主動(dòng)去遍歷它,就不會(huì)計(jì)算其中元素的值。
一句話理解:
迭代器的一個(gè)優(yōu)點(diǎn)就是它不要求你事先準(zhǔn)備好整個(gè)迭代過程中所有的元素。
迭代器僅僅在迭代至某個(gè)元素時(shí)才計(jì)算該元素,而在這之前或之后,元素可以不存在或者被銷毀。
這個(gè)特點(diǎn)使得它特別適合用于遍歷一些巨大的或是無限的集合,比如幾個(gè)G的文件,或是斐波那契數(shù)列等等。
記住兩個(gè)關(guān)鍵:
初學(xué)的你,還是太難理解?
你可以將生成器理解為一個(gè)盒子,你可以向這個(gè)盒子里隨意添加元素,當(dāng)你需要的時(shí)候,再取出來用。
請(qǐng)看下面的例子:
作用:惰性求值(一邊循環(huán)一邊計(jì)算的機(jī)制),節(jié)省性能
舉個(gè)例子:斐波那契數(shù)列(0,1,1,2,3,5...),打印斐波那契數(shù)列前50個(gè)元素
當(dāng):
時(shí),我們可以使用匿名函數(shù)。
初學(xué)的你,還是太難理解?
你想實(shí)現(xiàn)一個(gè)求x的平方的函數(shù),但是這個(gè)函數(shù)太簡單,不值得專門def定義,同時(shí),你忘記了平方的英文如何拼寫,要是命名成 "pingfang",又顯得自己太low,于是乎,你可以不給這個(gè)函數(shù)起名字,還能實(shí)現(xiàn)它。這就是匿名函數(shù)lambda表達(dá)式。
比如:求一個(gè)數(shù)的平方
01 如果你是初學(xué)者,可以先不掌握生成器和匿名函數(shù),待學(xué)成python后,再行琢磨;
02 在實(shí)際工作中,生成器和匿名函數(shù)的使用頻次,相對(duì)較高,并且在面試中是高頻問點(diǎn)。
本文題目:python惰性求值函數(shù) python 惰性計(jì)算
分享網(wǎng)址:http://chinadenli.net/article10/dojdodo.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供用戶體驗(yàn)、網(wǎng)站制作、服務(wù)器托管、品牌網(wǎng)站制作、自適應(yīng)網(wǎng)站、網(wǎng)站導(dǎo)航
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)