• <noscript id="ecgc0"><kbd id="ecgc0"></kbd></noscript>
    <menu id="ecgc0"></menu>
  • <tt id="ecgc0"></tt>

    不用寫代碼webscraper30秒抓取任意公眾號文章

    常常看到本身喜好的公家號,是不是想把它所有的文章從頭到從頭至尾看一遍呢?但手機上看的時辰,點擊一篇文章看完后,一不小心或者要處置其它信息,往往要重頭起頭看的,就會跳回最前面,若是你是想看更早前的文章,是不長短常不便利,而且若是當天看不完,第二天又要找很久,是不是很懊惱呢?那么此刻就來解決大師這樣的懊惱!在win7/win10系統上,不消寫代碼,安裝下面這些后,30秒抓取肆意公家號文章題目日期是不是夢!下面是我本身的實操經驗分享給大師

    東西/原料

    • Chrome瀏覽器
    • webscraper插件
    • win7/win10系統

    方式/步調

    1. 1

      Chrome瀏覽器就是谷歌瀏覽器,大師本身百度搜刮下載即可。下載好之后,直接打開網頁是打不開的,大師再百度搜刮下“谷歌瀏覽器賬號助手”,這是一個擴展程序,添加進去,就可以和其它瀏覽器一樣,正常利用了。

    2. 2

      webscraper是谷歌官方的一個插件,操縱這個插件,我們不需要寫代碼,就可以實現主動抓取肆意公家號文章題目日期!那怎么安裝呢,其實很簡單,直接在谷歌應用商鋪里,搜刮“webscraper”,然后添加進擴展就可以了。擴展顯示蜘蛛網的圖標就是了。

    3. 3

      微信要利用老版本的:微信測試版2.6.7。新版本是無法在瀏覽器上打開微信鏈接的。這個大師本身百度一下,應該可以找獲得的。

    4. 4

      打開 微信,進入某個公家號,點開汗青文章頁面,點擊 全數動靜,然后點擊右上角的三個點,分享,點擊發送給伴侶,這里可以選擇本身的伴侶發,也可以選擇文件傳輸助手,然后回到發微信聊天頁面,打開剛分享的鏈接就會主動在谷歌瀏覽器上打開了。

    5. 5

      接下來,我們來演示一下,抓取如圖公家號文章。

      第一步,就是鼠標右鍵點擊,呈現菜單欄,點擊最下面的,查抄。就會呈現查抄的代碼頁面。

    6. 6

      最右邊的那個,就是webscraper。

    7. 7

      點擊下面的 create new sitemap,右邊的倒三角,點擊出來的選項,第二個“import sitemap”。

    8. 8

      如圖1,第一個風雅框,填寫抓取的用的代碼{如圖2}。下面是定名,這個隨意寫個就可以了。

      抓取公家號題目、時候、內容鏈接(以下就是代碼,大師直接復制利用即可)

      {"_id":"gongzhonghao","startUrl":["https://mp.weixin.qq.com/s/YkQyrnDt6e_Sn7oj2JaHyA"],"selectors":[{"id":"total","type":"SelectorElementScroll","parentSelectors":["_root"],"selector":"div.weui_msg_card:nth-of-type(n+2)","multiple":true,"delay":"1000"},{"id":"title","type":"SelectorText","parentSelectors":["total"],"selector":"h4.weui_media_title","multiple":false,"regex":"","delay":0},{"id":"date","type":"SelectorText","parentSelectors":["total"],"selector":"p.weui_media_extra_info","multiple":false,"regex":"","delay":0},{"id":"link","type":"SelectorElementAttribute","parentSelectors":["total"],"selector":"h4.weui_media_title","multiple":false,"extractAttribute":"hrefs","delay":0}]}

    9. 9

      1.粘貼代碼。

      2.定名。

      3.點擊最下面的“import sitemap”

    10. 10

      此時呈現下圖中的這個頁面,點擊中心那項右邊的倒三角,點擊 edit metadata.

    11. 11

      出來的這個頁面里,start URL是要抓取的鏈接。這里我就去復制方才打開的公家號頁面的鏈接,然后粘貼進來,最后,點擊下面的”save sitemap“即可。

    12. 12

      接著出來的頁面里,仍是選擇中心那項,點擊右邊的倒三角,點擊”scraper"。

    13. 13

      出來的這個頁面,點擊最下面的按鈕“start scraping”。

    14. 14

      這時就會跳出,主動抓取的頁面,并主動抓取。

    15. 15

      期待抓取完畢后,會出來這個頁面:點擊  藍色的“refresh"。

    16. 16

      就會出來抓取的數據預覽頁面了。

    17. 17

      這里,仍是選擇中心那項,點擊右邊的倒三角,點擊最后一項”export data as  csv",就會出來一個 download now,點擊就可以將數據下載到電腦里面了。

    18. 18

      打開電腦里面的表格文件,就可以看到抓取到的內容了。到此為止,根基上算完當作了。

    19. 19

      可是,下載下來的排序是錯亂的。這里,需要本身手動去篩選排序即可。

      很是簡單:將題目欄進行篩選,第一個題目欄里面的數字就有巨細挨次的,大師按升序或者降序排序就可以了。若是不大白的,可以多看幾遍,我也是實操了良多次,才會諳練的。祝大師當作功!

    注重事項

    • 焦點點,谷歌瀏覽器和插件安裝,還有老版本微信安裝好,操作就很是簡單了!
    • 全程不需要本身寫代碼,插件是谷歌官方的,而且是免費利用!有不大白的可以留言看到會解答!
    • 發表于 2019-04-26 22:38
    • 閱讀 ( 1073 )
    • 分類:其他類型

    你可能感興趣的文章

    相關問題

    0 條評論

    請先 登錄 后評論
    聯系我們:uytrv@hotmail.com 問答工具
  • <noscript id="ecgc0"><kbd id="ecgc0"></kbd></noscript>
    <menu id="ecgc0"></menu>
  • <tt id="ecgc0"></tt>
    久久久久精品国产麻豆