常常看到本身喜好的公家號,是不是想把它所有的文章從頭到從頭至尾看一遍呢?但手機上看的時辰,點擊一篇文章看完后,一不小心或者要處置其它信息,往往要重頭起頭看的,就會跳回最前面,若是你是想看更早前的文章,是不長短常不便利,而且若是當天看不完,第二天又要找很久,是不是很懊惱呢?那么此刻就來解決大師這樣的懊惱!在win7/win10系統上,不消寫代碼,安裝下面這些后,30秒抓取肆意公家號文章題目日期是不是夢!下面是我本身的實操經驗分享給大師
Chrome瀏覽器就是谷歌瀏覽器,大師本身百度搜刮下載即可。下載好之后,直接打開網頁是打不開的,大師再百度搜刮下“谷歌瀏覽器賬號助手”,這是一個擴展程序,添加進去,就可以和其它瀏覽器一樣,正常利用了。
webscraper是谷歌官方的一個插件,操縱這個插件,我們不需要寫代碼,就可以實現主動抓取肆意公家號文章題目日期!那怎么安裝呢,其實很簡單,直接在谷歌應用商鋪里,搜刮“webscraper”,然后添加進擴展就可以了。擴展顯示蜘蛛網的圖標就是了。
微信要利用老版本的:微信測試版2.6.7。新版本是無法在瀏覽器上打開微信鏈接的。這個大師本身百度一下,應該可以找獲得的。
打開 微信,進入某個公家號,點開汗青文章頁面,點擊 全數動靜,然后點擊右上角的三個點,分享,點擊發送給伴侶,這里可以選擇本身的伴侶發,也可以選擇文件傳輸助手,然后回到發微信聊天頁面,打開剛分享的鏈接就會主動在谷歌瀏覽器上打開了。
接下來,我們來演示一下,抓取如圖公家號文章。
第一步,就是鼠標右鍵點擊,呈現菜單欄,點擊最下面的,查抄。就會呈現查抄的代碼頁面。
最右邊的那個,就是webscraper。
點擊下面的 create new sitemap,右邊的倒三角,點擊出來的選項,第二個“import sitemap”。
如圖1,第一個風雅框,填寫抓取的用的代碼{如圖2}。下面是定名,這個隨意寫個就可以了。
抓取公家號題目、時候、內容鏈接(以下就是代碼,大師直接復制利用即可)
{"_id":"gongzhonghao","startUrl":["https://mp.weixin.qq.com/s/YkQyrnDt6e_Sn7oj2JaHyA"],"selectors":[{"id":"total","type":"SelectorElementScroll","parentSelectors":["_root"],"selector":"div.weui_msg_card:nth-of-type(n+2)","multiple":true,"delay":"1000"},{"id":"title","type":"SelectorText","parentSelectors":["total"],"selector":"h4.weui_media_title","multiple":false,"regex":"","delay":0},{"id":"date","type":"SelectorText","parentSelectors":["total"],"selector":"p.weui_media_extra_info","multiple":false,"regex":"","delay":0},{"id":"link","type":"SelectorElementAttribute","parentSelectors":["total"],"selector":"h4.weui_media_title","multiple":false,"extractAttribute":"hrefs","delay":0}]}
1.粘貼代碼。
2.定名。
3.點擊最下面的“import sitemap”
此時呈現下圖中的這個頁面,點擊中心那項右邊的倒三角,點擊 edit metadata.
出來的這個頁面里,start URL是要抓取的鏈接。這里我就去復制方才打開的公家號頁面的鏈接,然后粘貼進來,最后,點擊下面的”save sitemap“即可。
接著出來的頁面里,仍是選擇中心那項,點擊右邊的倒三角,點擊”scraper"。
出來的這個頁面,點擊最下面的按鈕“start scraping”。
這時就會跳出,主動抓取的頁面,并主動抓取。
期待抓取完畢后,會出來這個頁面:點擊 藍色的“refresh"。
就會出來抓取的數據預覽頁面了。
這里,仍是選擇中心那項,點擊右邊的倒三角,點擊最后一項”export data as csv",就會出來一個 download now,點擊就可以將數據下載到電腦里面了。
打開電腦里面的表格文件,就可以看到抓取到的內容了。到此為止,根基上算完當作了。
可是,下載下來的排序是錯亂的。這里,需要本身手動去篩選排序即可。
很是簡單:將題目欄進行篩選,第一個題目欄里面的數字就有巨細挨次的,大師按升序或者降序排序就可以了。若是不大白的,可以多看幾遍,我也是實操了良多次,才會諳練的。祝大師當作功!
0 篇文章
如果覺得我的文章對您有用,請隨意打賞。你的支持將鼓勵我繼續創作!