迭代器模式:一種惰性獲取數(shù)據(jù)項的方式,即按需一次獲取一個數(shù)據(jù)項。

成都創(chuàng)新互聯(lián)服務(wù)項目包括瓦房店網(wǎng)站建設(shè)、瓦房店網(wǎng)站制作、瓦房店網(wǎng)頁制作以及瓦房店網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,瓦房店網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到瓦房店省份的部分城市,未來相信會繼續(xù)擴大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!
所有序列都是可以迭代的。我們接下來要實現(xiàn)一個 Sentence(句子)類,我們向這個類的構(gòu)造方法傳入包含一些文本的字符串,然后可以逐個單詞迭代。
接下來測試 Sentence 實例能否迭代
序列可以迭代的原因:
iter()
解釋器需要迭代對象 x 時,會自動調(diào)用iter(x)。
內(nèi)置的 iter 函數(shù)有以下作用:
由于序列都實現(xiàn)了 __getitem__ 方法,所以都可以迭代。
可迭代對象:使用內(nèi)置函數(shù) iter() 可以獲取迭代器的對象。
與迭代器的關(guān)系:Python 從可迭代對象中獲取迭代器。
下面用for循環(huán)迭代一個字符串,這里字符串 'abc' 是可迭代的對象,用 for 循環(huán)迭代時是有生成器,只是 Python 隱藏了。
如果沒有 for 語句,使用 while 循環(huán)模擬,要寫成下面這樣:
Python 內(nèi)部會處理 for 循環(huán)和其他迭代上下文(如列表推導(dǎo),元組拆包等等)中的 StopIteration 異常。
標(biāo)準(zhǔn)的迭代器接口有兩個方法:
__next__ :返回下一個可用的元素,如果沒有元素了,拋出 StopIteration 異常。
__iter__ :返回 self,以便在需要使用可迭代對象的地方使用迭代器,如 for 循環(huán)中。
迭代器:實現(xiàn)了無參數(shù)的 __next__ 方法,返回序列中的下一個元素;如果沒有元素了,那么拋出 StopIteration 異常。Python 中的迭代器還實現(xiàn)了 __iter__ 方法,因此迭代器也可以迭代。
接下來使用迭代器模式實現(xiàn) Sentence 類:
注意, 不要 在 Sentence 類中實現(xiàn) __next__ 方法,讓 Sentence 實例既是可迭代對象,也是自身的迭代器。
為了“支持多種遍歷”,必須能從同一個可迭代的實例中獲取多個獨立的迭代器,而且各個迭代器要能維護自身的內(nèi)部狀態(tài),因此這一模式正確的實現(xiàn)方式是,每次調(diào)用 iter(my_iterable) 都新建一個獨立的迭代器。
所以總結(jié)下來就是:
實現(xiàn)相同功能,但卻符合 Python 習(xí)慣的方式是,用生成器函數(shù)代替 SentenceIteror 類。
只要 Python 函數(shù)的定義體中有 yield 關(guān)鍵字,該函數(shù)就是生成器函數(shù)。調(diào)用生成器函數(shù),就會返回一個生成器對象。
生成器函數(shù)會創(chuàng)建一個生成器對象,包裝生成器函數(shù)的定義體,把生成器傳給 next(...) 函數(shù)時,生成器函數(shù)會向前,執(zhí)行函數(shù)定義體中的下一個 yield 語句,返回產(chǎn)出的值,并在函數(shù)定義體的當(dāng)前位置暫停,。最終,函數(shù)的定義體返回時,外層的生成器對象會拋出 StopIteration 異常,這一點與迭代器協(xié)議一致。
如今這一版 Sentence 類相較之前簡短多了,但是還不夠慵懶。 惰性 ,是如今人們認為最好的特質(zhì)。惰性實現(xiàn)是指盡可能延后生成值,這樣做能節(jié)省內(nèi)存,或許還能避免做無用的處理。
目前實現(xiàn)的幾版 Sentence 類都不具有惰性,因為 __init__ 方法急迫的構(gòu)建好了文本中的單詞列表,然后將其綁定到 self.words 屬性上。這樣就得處理整個文本,列表使用的內(nèi)存量可能與文本本身一樣多(或許更多,取決于文本中有多少非單詞字符)。
re.finditer 函數(shù)是 re.findall 函數(shù)的惰性版本,返回的是一個生成器,按需生成 re.MatchObject 實例。我們可以使用這個函數(shù)來讓 Sentence 類變得懶惰,即只在需要時才生成下一個單詞。
標(biāo)準(zhǔn)庫提供了很多生成器函數(shù),有用于逐行迭代純文本文件的對象,還有出色的 os.walk 函數(shù)等等。本節(jié)專注于通用的函數(shù):參數(shù)為任意的可迭代對象,返回值是生成器,用于生成選中的、計算出的和重新排列的元素。
第一組是用于 過濾 的生成器函數(shù):從輸入的可迭代對象中產(chǎn)出元素的子集,而且不修改元素本身。這種函數(shù)大多數(shù)都接受一個斷言參數(shù)(predicate),這個參數(shù)是個 布爾函數(shù) ,有一個參數(shù),會應(yīng)用到輸入中的每個元素上,用于判斷元素是否包含在輸出中。
以下為這些函數(shù)的演示:
第二組是用于映射的生成器函數(shù):在輸入的單個/多個可迭代對象中的各個元素上做計算,然后返回結(jié)果。
以下為這些函數(shù)的用法:
第三組是用于合并的生成器函數(shù),這些函數(shù)都可以從輸入的多個可迭代對象中產(chǎn)出元素。
以下為演示:
第四組是從一個元素中產(chǎn)出多個值,擴展輸入的可迭代對象。
以下為演示:
第五組生成器函數(shù)用于產(chǎn)出輸入的可迭代對象中的全部元素,不過會以某種方式重新排列。
下面的函數(shù)都接受一個可迭代的對象,然后返回單個結(jié)果,這種函數(shù)叫“歸約函數(shù)”,“合攏函數(shù)”或“累加函數(shù)”,其實,這些內(nèi)置函數(shù)都可以用 functools.reduce 函數(shù)實現(xiàn),但內(nèi)置更加方便,而且還有一些優(yōu)點。
參考教程:
《流暢的python》 P330 - 363
如果函數(shù)要返回一系列結(jié)果,我們常見的方法就是將結(jié)果放到一份列表中,然后返回給調(diào)用者。比如下面的函數(shù),返回字符串中每個單詞的首字母在真?zhèn)€字符串中的索引:
運行結(jié)果:
上述的結(jié)果完全符合我們的預(yù)期,但 get_word_index 函數(shù)不夠簡潔。下面我們嘗試使用生成器來實現(xiàn):
運行結(jié)果:
改寫之后,不僅運行結(jié)果符合要求,由于不需要和 result 列表交互,函數(shù)也變得非常簡潔。下面我們就來詳細學(xué)習(xí)下生成器吧~
生成器是指使用 yield 表達式的函數(shù),調(diào)用生成器函數(shù)時,它并不會真的運行,而是會返回迭代器。每次在這個迭代器上面調(diào)用內(nèi)置的 next 函數(shù)時,迭代器就會把生成器推進到下一個 yield 表達式那里。生成器傳給 yield 的值均會由迭代器返回給調(diào)用者。
此外,如果輸入量非常大,使用列表作為返回值,那么程序就有可能耗盡內(nèi)存并崩潰。相反,使用生成器之后,則可以應(yīng)對任意長度的輸入數(shù)據(jù)。
例如,下面這個生成器函數(shù)可以獲取文件中單詞的索引,而不管文件內(nèi)容多大,該函數(shù)執(zhí)行時消耗的內(nèi)存,只由單行的文本長度決定:
其中 test_generator.txt 中的內(nèi)容如下:
運行結(jié)果:
下面這句話特別重要: 生成器函數(shù)返回的迭代器,是由狀態(tài)的,及調(diào)用者不應(yīng)該反復(fù)使用它 。我們那 word_index_iter 來說明:
如果想重復(fù)調(diào)用,請將其封裝成容器:
運行結(jié)果:
關(guān)于上述自定義容器的實現(xiàn)原理,我的另外一篇文章做了詳細介紹,鏈接奉上:
迭代:按照一定的順序訪問集合中的每一個元素,或者叫遍歷(其他語言叫做遍歷);
可迭代對象(Iterable):能被迭代的對象,或者說直接作用于for循環(huán)的對象,可以通過for..in來遍歷的對象,比如數(shù)組(list)、元祖(tuple)字符串等;
迭代器(Iterator):能作用于next() 函數(shù),并不斷返回下一個值的對象稱為迭代器,是惰性計算的序列(很重要)
1、判斷一個對象是可迭代對象呢?方法是通過collections模塊的Iterable類型判斷
2、判斷一個對象是否是迭代器Iterator對象
3、可迭代對象Iterable轉(zhuǎn)化為迭代器對象Iterator
4、使用迭代器迭代
1、迭代器的特性
A.惰性計算數(shù)據(jù),節(jié)省內(nèi)存
B.能記錄狀態(tài),并通過next()函數(shù)執(zhí)行下一個狀態(tài)
C.具有可迭代性
2、集合數(shù)據(jù)類型如list、dict、str、tuple等是可迭代對象Iterable但不是迭代器Iterator,不過可以通過iter()函數(shù)轉(zhuǎn)化為一個Iterator對象
原因:Iterator對象表示的是一個數(shù)據(jù)流,Iterator對象可以被next()函數(shù)調(diào)用并不斷返回下一個數(shù)據(jù),直到?jīng)]有數(shù)據(jù)時拋出StopIteration錯誤。Iterator對象表示一個無限大的數(shù)據(jù),集合是有限集合,假如被next()到最后就是沒有返回直接carsh
3、生成器(generator)一定是迭代器,他是一種特殊的迭代器;
如果想了解更多Python知識,請查看
Python的基礎(chǔ)知識之生成器
Python的基礎(chǔ)知識之裝飾器
學(xué)無止境,學(xué)習(xí)Python的伙伴可以多多交流。
網(wǎng)頁名稱:python函數(shù)迭代返回,返回迭代器
URL分享:http://chinadenli.net/article15/dsshedi.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供用戶體驗、Google、網(wǎng)站導(dǎo)航、標(biāo)簽優(yōu)化、網(wǎng)站維護、
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)