不用寫代碼webscraper30秒抓取任意公眾號文章

常常看到本身喜好的公家號，是不是想把它所有的文章從頭到從頭至尾看一遍呢？但手機上看的時辰，點擊一篇文章看完后，一不小心或者要處置其它信息，往往要重頭起頭看的，就會跳回最前面，若是你是想看更早前的文章，是不長短常不便利，而且若是當天看不完，第二天又要找很久，是不是很懊惱呢？那么此刻就來解決大師這樣的懊惱！在win7/win10系統上，不消寫代碼，安裝下面這些后，30秒抓取肆意公家號文章題目日期是不是夢！下面是我本身的實操經驗分享給大師

東西/原料

Chrome瀏覽器
webscraper插件
win7/win10系統

方式/步調

1
Chrome瀏覽器就是谷歌瀏覽器，大師本身百度搜刮下載即可。下載好之后，直接打開網頁是打不開的，大師再百度搜刮下“谷歌瀏覽器賬號助手”，這是一個擴展程序，添加進去，就可以和其它瀏覽器一樣，正常利用了。
2
webscraper是谷歌官方的一個插件，操縱這個插件，我們不需要寫代碼，就可以實現主動抓取肆意公家號文章題目日期！那怎么安裝呢，其實很簡單，直接在谷歌應用商鋪里，搜刮“webscraper”，然后添加進擴展就可以了。擴展顯示蜘蛛網的圖標就是了。
3
微信要利用老版本的：微信測試版2.6.7。新版本是無法在瀏覽器上打開微信鏈接的。這個大師本身百度一下，應該可以找獲得的。
4
打開微信，進入某個公家號，點開汗青文章頁面，點擊全數動靜，然后點擊右上角的三個點，分享，點擊發送給伴侶，這里可以選擇本身的伴侶發，也可以選擇文件傳輸助手，然后回到發微信聊天頁面，打開剛分享的鏈接就會主動在谷歌瀏覽器上打開了。
5
接下來，我們來演示一下，抓取如圖公家號文章。
第一步，就是鼠標右鍵點擊，呈現菜單欄，點擊最下面的，查抄。就會呈現查抄的代碼頁面。
6
最右邊的那個，就是webscraper。
7
點擊下面的 create new sitemap,右邊的倒三角，點擊出來的選項，第二個“import sitemap”。
8
如圖1，第一個風雅框，填寫抓取的用的代碼{如圖2}。下面是定名，這個隨意寫個就可以了。
抓取公家號題目、時候、內容鏈接（以下就是代碼，大師直接復制利用即可）
{"_id":"gongzhonghao","startUrl":["https://mp.weixin.qq.com/s/YkQyrnDt6e_Sn7oj2JaHyA"],"selectors":[{"id":"total","type":"SelectorElementScroll","parentSelectors":["_root"],"selector":"div.weui_msg_card:nth-of-type(n+2)","multiple":true,"delay":"1000"},{"id":"title","type":"SelectorText","parentSelectors":["total"],"selector":"h4.weui_media_title","multiple":false,"regex":"","delay":0},{"id":"date","type":"SelectorText","parentSelectors":["total"],"selector":"p.weui_media_extra_info","multiple":false,"regex":"","delay":0},{"id":"link","type":"SelectorElementAttribute","parentSelectors":["total"],"selector":"h4.weui_media_title","multiple":false,"extractAttribute":"hrefs","delay":0}]}
9
1.粘貼代碼。
2.定名。
3.點擊最下面的“import sitemap”
10
此時呈現下圖中的這個頁面，點擊中心那項右邊的倒三角，點擊 edit metadata.
11
出來的這個頁面里，start URL是要抓取的鏈接。這里我就去復制方才打開的公家號頁面的鏈接，然后粘貼進來，最后，點擊下面的”save sitemap“即可。
12
接著出來的頁面里，仍是選擇中心那項，點擊右邊的倒三角，點擊”scraper"。
13
出來的這個頁面，點擊最下面的按鈕“start scraping”。
14
這時就會跳出，主動抓取的頁面，并主動抓取。
15
期待抓取完畢后，會出來這個頁面：點擊藍色的“refresh"。
16
就會出來抓取的數據預覽頁面了。
17
這里，仍是選擇中心那項，點擊右邊的倒三角，點擊最后一項”export data as csv"，就會出來一個 download now，點擊就可以將數據下載到電腦里面了。
18
打開電腦里面的表格文件，就可以看到抓取到的內容了。到此為止，根基上算完當作了。
19
可是，下載下來的排序是錯亂的。這里，需要本身手動去篩選排序即可。
很是簡單：將題目欄進行篩選，第一個題目欄里面的數字就有巨細挨次的，大師按升序或者降序排序就可以了。若是不大白的，可以多看幾遍，我也是實操了良多次，才會諳練的。祝大師當作功！