我們知道,對文件的讀取操作需要將文件中的數(shù)據(jù)加載到內(nèi)存中,而上面所用到的read()方法會一次性把文件中所有的內(nèi)容全部加載到內(nèi)存中。這明顯是不合理的,當遇到一個幾個G的的文件時,必然會耗光機器的內(nèi)存。這里我們來介紹下Python中讀取文件的相關(guān)方法:
方法描述
read()一次讀取文件所有內(nèi)容,返回一個str
read(size)每次最多讀取指定長度的內(nèi)容,返回一個str;在Python2中size指定的是字節(jié)長度,在Python3中size指定的是字符長度
readlines()一次讀取文件所有內(nèi)容,按行返回一個list
readline()每次只讀取一行內(nèi)容
此外,還要兩個與文件指針位置相關(guān)的方法
方法描述
seek(n)將文件指針移動到指定字節(jié)的位置
tell()獲取當前文件指針所在字節(jié)位置
下面來看下操作實例
1.讀取指定長度的內(nèi)容
Python2
withopen('song.txt','r')asf:
print(f.read(12).decode('utf-8'))
輸出結(jié)果:
匆匆那年
結(jié)果說明:Python2中read(size)方法的size參數(shù)指定的要讀取的字節(jié)數(shù),而song.txt文件是UTF-8編碼的內(nèi)容,一個漢字占3個字節(jié),因此12個字節(jié)剛好是4個漢字。
Python3
withopen('song.txt','r',encoding='utf-8')asf:
print(f.read(12))
輸出結(jié)果:
匆匆那年我們究竟說
結(jié)果說明:Python3中read(size)方法的size參數(shù)指定的要讀取的字符數(shù),這與文件的字符編碼無關(guān),就是返回12個字符。
2.讀取文件中的一行內(nèi)容
Python2
withopen('song.txt','r',encoding='utf-8')asf:
print(f.readline())
Python3
withopen('song.txt','r')asf:
print(f.readline().decode('utf-8'))
輸出結(jié)果都一樣:
匆匆那年我們究竟說了幾遍再見之后再拖延
3.遍歷打印一個文件中的每一行
這里我們只以Python3來進行實例操作,Python2僅僅是需要在讀取到內(nèi)容后進行手動解碼而已,上面已經(jīng)有示例。
方式一:先一次性讀取所有行到內(nèi)存,然后再遍歷打印
withopen('song.txt','r',encoding='utf-8')asf:
forlineinf.readlines():
print(line)
輸出結(jié)果:
匆匆那年我們究竟說了幾遍再見之后再拖延
可惜誰有沒有愛過不是一場七情上面的雄辯
匆匆那年我們一時匆忙撂下難以承受的諾言
只有等別人兌現(xiàn)
這種方式的缺點與read()方法是一樣的,都是會消耗大量的內(nèi)存空間。
方式二:通過迭代器一行一行的讀取并打印
withopen('song.txt','r',encoding='utf-8',newline='')asf:
forlineinf:
print(line)
輸出結(jié)果:
匆匆那年我們究竟說了幾遍再見之后再拖延
可惜誰有沒有愛過不是一場七情上面的雄辯
匆匆那年我們一時匆忙撂下難以承受的諾言
只有等別人兌現(xiàn)
另外,發(fā)現(xiàn)上面的輸出結(jié)果中行與行之間多了一個空行。這是因為文件每一行的默認都有換行符,而print()方法也會輸出換行,因此就多了一個空行。去掉空行也比較簡單:可以用line.rstrip()去除字符串右邊的換行符,也可以通過print(line,end='')避免print方法造成的換行。
file類的其他方法:
方法描述
flush()刷新緩沖區(qū)數(shù)據(jù),將緩沖區(qū)中的數(shù)據(jù)立刻寫入文件
next()返回文件下一行,這個方法也是file對象實例可以被當做迭代器使用的原因
truncate([size])截取文件中指定字節(jié)數(shù)的內(nèi)容,并覆蓋保存到文件中,如果不指定size參數(shù)則文件將被清空;Python2無返回值,Python3返回新文件的內(nèi)容字節(jié)數(shù)
write(str)將字符串寫入文件,沒有返回值
writelines(sequence)向文件寫入一個字符串或一個字符串列表,如果字符串列表中的元素需要換行要自己加入換行符
fileno()返回一個整型的文件描述符,可以用于一些底層IO操作上(如,os模塊的read方法)
isatty()判斷文件是否被連接到一個虛擬終端,是則返回True,否則返回False
以上內(nèi)容為大家介紹了Python文件讀取相關(guān)方法,希望對大家有所幫助,如果想要了解更多Python相關(guān)知識,請關(guān)注IT培訓機構(gòu):千鋒教育。