情形 1 : LC_ALL="en_US.UTF-8"
>>>i=u'呵呵'
>>>i
u'\u5475\u5475'
>>>i.encode('utf-8')
'\xe5\x91\xb5\xe5\x91\xb5'
>>>type(i)
<type 'unicode'>
情形 2 : LC_ALL=C
>>> i=u'呵呵'
>>> i
u'\xe5\x91\xb5\xe5\x91\xb5' #这是什么鬼??
>>> type(i)
<type 'unicode'>
>>> i.encode('utf-8')
'\xc3\xa5\xc2\x91\xc2\xb5\xc3\xa5\xc2\x91\xc2\xb5'
唯一的区别就是 LC_ALL 了,所以谁能详细解释下这个编码与 LC_ALL 的关系呢。