波多野结衣按摩,在线观看亚洲视频,国产嫩草在线观看,91视频最新地址

首頁 資訊 > 洞察 > 正文

每日熱訊!Python工具箱系列(三十七)

二進制文件操作(上)

python比較擅長與文本相關的操作。但現實世界中,對于非文本消息的處理也很普遍。例如:

◆通過有線、無線傳遞傳感器獲得的測量數據。


(資料圖)

◆衛星通過電磁波發送測量數據。

◆數據中心的數萬臺服務器發送當前CPU的占用率信息、內存占用量等眾多指標數據。

以上數據,當然可以以文本方式發送,但是對于帶寬的占用驚人。假設某個對于PM2.5進行測量的傳感器,每隔一秒發送一次測量數據,以文本方式發送消息,內容如下:

"counter: 1, pm25: 170.24119426834042, timestamp: 2022-07-24 08:52:11.138894+00:00"

以上消息占用了81個字節。而如果能夠按照約定的格式直接發送二進制數據,則只需要20個字節,可以大幅提升傳輸效率。此外,以文本方式在本地保存傳感器數據,則一天就需要81*86400/1024=6834M字節,對于傳感器這種體積小巧的嵌入式系統,存儲空間極為有限,很快就會空間耗盡。因此,對非文本數據直接保存與讀取非常有必要。下面的代碼演示了傳感器類,以及傳感器測量數據的二進制文件存儲與讀取的基本操作。

import binasciiimport randomimport structfrom datetime import datetimefrom io import BytesIOfrom time import sleepimport arrowclass sensordata_v1():    def __init__(self):        utc = arrow.utcnow()        self._timestamp = utc.to("Asia/Shanghai")    @property    def counter(self) -> int:        """        計數器        Returns:            int: 從0開始的計數器        """        return self._counter    @counter.setter    def counter(self, value: int):        self._counter = value    @property    def pm25(self) -> float:        """        PM25測量值        Returns:            float: pm25的當前測量值        """        return self._pm25    @pm25.setter    def pm25(self, value: float):        self._pm25 = value    @property    def timestamp(self) -> datetime:        """        當前時點        Returns:            datetime: 當前的時間        """        return self._timestamp.datetime    def __str__(self):        """        以文字輸出相關內容        Returns:            string: 說明性文字        """        return f"counter: {self.counter}, pm25: {self.pm25}, timestamp: {self.timestamp}"    def __repr__(self):        """        輸出字節流的16進制內容        Returns:            string: 16進制顯示相關數值        """        return str(binascii.hexlify(self.toBytes()))    def toBytes(self):        """        將相關數據轉換成為bytes,便于網絡傳輸或者寫入文件        Returns:            bytes: 整合測量數據到字節流中        """        with BytesIO() as byio:            byio.write(struct.pack("

其中arrow是非常值得推薦的時間處理框架。python有內置的時間處理框架,功能非常完善,但失之于亂與雜,掌握起來非常不易。而arrow則非常人性化,做到了拿來即用。其安裝過程非常簡單,直接pip install arrow即可。在示例程序中,為了能夠方便存儲,我們將時間戳直接用UNIX的timestamp來表示,轉換后為了保持精度,本例使用double(8字節)存儲,如果要求不高,可以改為float(4字節)。

sensordata_v1類使用@property裝飾器來定義屬性。總共有3個屬性:

◆counter-計數器。從0開始計數累加,后續保存到數據庫中時也方便檢索。

◆pm25-PM2.5測量值。在示例代碼中使用random.uniform模擬一個0到300的隨機浮點值,沒有什么太大的意義,保證每次不同即可。

◆timestamp-數據采集時的對應時間。

str類函數

可以自定義,本例中用它來直觀的表示當前的采集值。當對sensordata_v1類的實例打印時,就會自動調用這個函數。

repr類函數

可以自定義,本例中用它來演示轉換成為字節流bytes時的16進制值。對于程序員來說,16進制來表示字節是比較自然的。

toBytes類函數具體展示了如何將類的屬性值轉換成為二進制字節流,主要依靠python內置的struct模塊。在內存中模擬文件打開一個BytesIO,并且依次寫入struct.pack編碼后的字節流,最終統一輸出。

fromBytes類函數具體展示了如何從字節流反解成為對象的屬性值。struct.pack與struct.unpack成對出現。

toFile函數將編碼好的字節流寫入二進制文件。寫入的模式為"wb",其中w代表全覆蓋寫入的意思,b代表二進制模式的意思。fromFile負責從二進制文件讀回保存的字節流,重新生成各個sensordata_v1對象。

生成的二進制文件,可以使用UltraEditor、InHex等。也可以直接使用vscode自帶的2進制文件瀏覽器擴展Hex Editor,顯示效果如下圖所示:

從圖中可以看出,二進制文件確實節省空間,但人類不容易理解,必然借助于專用工具與代碼來管理。但即使計算機與網絡能力強悍如斯,二進制文件與網絡上的字節流仍然必不可少,不可替代。

關鍵詞:

最近更新

關于本站 管理團隊 版權申明 網站地圖 聯系合作 招聘信息

Copyright © 2005-2023 創投網 - www.extremexp.net All rights reserved
聯系我們:39 60 29 14 2@qq.com
皖ICP備2022009963號-3