blog.hekt.org

Python 2.xと3.0の違い(2) Unicode文字列

2.xでは、Unicode文字列を扱うとき、

# coding: utf-8

print  u"いろは"

あるいは

# coding: utf-8

print unicode("いろは", utf-8)

というようにエンコードを指定し、Unicode文字列であることを示すコードを書かなくてはいけませんが、3.0では普通にUnicode文字列が通ります。

print  ("いろは")

ただし、これは文書をUTF-8で保存した場合のみで、Shift_JISなどほかのエンコードで保存した場合はしっかり指定してやらなければいけません。

# coding: shift_jis

print  ("いろは")