編碼和解碼
始終從 unicode 編碼為位元組。在這個方向上,你可以選擇編碼。
>>> u'🐍'.encode('utf-8')
'\xf0\x9f\x90\x8d'
另一種方法是從位元組解碼到 unicode。在這個方向上,你必須知道編碼是什麼。
>>> b'\xf0\x9f\x90\x8d'.decode('utf-8')
u'\U0001f40d'
始終從 unicode 編碼為位元組。在這個方向上,你可以選擇編碼。
>>> u'🐍'.encode('utf-8')
'\xf0\x9f\x90\x8d'
另一種方法是從位元組解碼到 unicode。在這個方向上,你必須知道編碼是什麼。
>>> b'\xf0\x9f\x90\x8d'.decode('utf-8')
u'\U0001f40d'