python URL网址链接中的中文UrlEncode编码/UrlDecode解码

不哭 5月前 ⋅ 449 阅读

做爬虫的时候时常会用到URL的编码,常常会有常用编码的转换例如:utf-8的UrlEncode编码/UrlDecode解码,gbk的UrlEncode编码/UrlDecode解码, gb2312的UrlEncode编码/UrlDecode解码那我们怎么转呢?

import urllib
from urllib import parse

def test():
    str = '哔哩哔哩'
    str = str.encode(encoding='gb2312')
    print("中文转gb2312: ", str)
    str = urllib.parse.quote(str)
    print("UrlEncode编码: ", str)
    str = urllib.parse.unquote(str, encoding="gb2312")
    print("UrlDecode解码: ", str)

if __name__ == '__main__':
    test()

这样就可以做到UrlEncode编码/UrlDecode解码并且按照指定的文字编码(ANSI UNICODE UTF-8 GB2312 GBK DBCS UCS……)


全部评论: 0

    我有话说: