• <noscript id="ecgc0"><kbd id="ecgc0"></kbd></noscript>
    <menu id="ecgc0"></menu>
  • <tt id="ecgc0"></tt>

    python入門系列教程(七) 徹底搞懂字符編碼二

    今天是小編分享python入門教程第七講,講述關于python的字符串與令人頭疼的

    字符編碼,徹底搞懂字符編碼二,decode()與encode()兩個方式的利用。

    13入門系列教程七徹底搞懂字符編碼一

    東西/原料

    • python

    方式/步調

    1. 1

      chardet模塊功能:可以檢拆字符串編碼,查抄是否有該模塊,報錯信息提醒沒有該模塊

    2. 2

      若是沒有該chardet模塊的可以用pip install chardet安裝

      以下是安裝環境

    3. 3

      這兩個decode()、encode()

      decode()功能:將其他編碼字符轉化為Unicode編碼字符。 encode()功能:將Unicode編碼字符轉化為其他編碼字符。

    4. 4

      其實亂碼素質上就是當前系統編碼與所供給的字符編碼紛歧致導致的。接下來舉一個用的比力的多的例子

      在windows系統下利用python2獲取百度首頁的title

    5. 5

      首頁利用的字符編碼是utf-8,而我們當前windows系統的默認字符編碼是gbk,我們來測試一下直接提取會不會呈現亂碼問題。

      import re,urllib2

      html = urllib2.urlopen('http://www.baidu.com/').read()

      title = re.findall(r'<title>(.*?)</title>',html)[0]

    6. 6

      怎么解決亂碼呢?

      gbk_title = title.decode('utf-8').encode('gbk')

    注重事項

    • 分享投票點贊或存眷,是對小編最年夜的鼓動勉勵。感謝~
    • 發表于 2018-03-01 00:00
    • 閱讀 ( 765 )
    • 分類:其他類型

    0 條評論

    請先 登錄 后評論
    聯系我們:uytrv@hotmail.com 問答工具
  • <noscript id="ecgc0"><kbd id="ecgc0"></kbd></noscript>
    <menu id="ecgc0"></menu>
  • <tt id="ecgc0"></tt>
    久久久久精品国产麻豆