【Sitemap產生器】python模組應用,簡易生成Sitemap

過去我們在Sitemap是什麼?免費開源Sitemap產生器完成網站地圖!提到Sitemap是什麼,對網站又有何幫助。然而部分網站可能沒有相關功能,網路上的產生器也有諸多限制,因此己見室利用Python結合Google colab,讓各位在線上也可以做出網站sitemap!

下載Sitemap產生器及開啟Google colab功能

檔案下載:Sitemap_generator1.0_byJikensitu.zip

首先請先下載壓縮檔案,並將檔案解壓縮至桌面。
之後請打開自己的Google Drive,將檔案直接拖移至「我的雲端硬碟」(基本上就是打開後的畫面),注意請不要放到其他位置或是資料夾,會導致程式運行失敗。

安裝爬蟲至Google雲端
安裝爬蟲至Google雲端

請開啟「Sitemap_generator」資料夾,點擊「Sitemap_generator_ver1.0.ipynb」後會發現檔案無法開啟,這時請幫我點選上面的「選擇開啟工具」,搜尋「Colaboratory」並點擊安裝,未來就可以Google drive中運行python程式。

開起Colaboratory功能

最後我們再重新開啟一次「Sitemap_generator_ver1.0.ipynb」,並且如下圖選擇「Google Colaboratory」,便大功告成了!

運行步驟

開啟後你會看到一長串的程式代碼,請深呼不用感到害怕,我們只需要修改紅框中的內容就可以了,在左邊的紅框中填寫”你的網域“,在右邊的紅框中填寫”爬蟲起始位置/首頁“。
之後由上往下,按下左邊藍框中撥放按鈕,或是按下鍵盤的ctrl+F9,就會開始運行程式。

執行程式的一開始除了會先下載Scrapy的模組之外,因為會我們會需要抓取「SITEMAP_crawler」爬蟲設定及下載sitemap,視窗會彈出「要允許這個筆記本存取你的 Google 雲端硬碟檔案嗎?」,也就是是否授權這個python程式可以讀取你的Google drive,按下「連線至Google雲端硬碟」。

這時會再彈出一次Google授權視窗,點選正在操作的帳號並確認即可


確認完後,你便會送出一隻爬蟲爬取自己的網站,回到程式頁面往下滾動,你會看到程式不斷顯示目前爬取的網址、網址回饋碼、canonical等資訊。依照網站大小、網站速度、阻擋爬蟲功能等不同,產出時間會有差別。

scrapy爬蟲爬取網站範例
(運行中範例)

下載檔案

當程式運行完之後,請回到Google雲端硬碟,依照「Sitemap_generator1.0」→「SITEMAP_crawler」→「spiders」的路徑開啟資料夾,裡面含有一個「sitemap_0.xml」檔案,這份便是屬於你的網站的Sitemap。

Sitemap實際範本
Sitemap實際範本

最後依照Sitemap是什麼?免費開源Sitemap產生器完成網站地圖!的提醒,將檔案上傳至後台並且提交至Google Search Console就完成囉

看完了這麼多,我想你對Sitemap已經有了更深入了解,如果喜歡我的文章,或是未來想要了解更多關於SEO的消息,請關注我的網站,我會努力將各種知識分享給各位:)

別忘記複習以下文章,了解網站連結優化相關資訊!
為何網站沒出現在Google搜尋結果?從檢索&索引2環節找出問題!
如何優化網站連結效益?盤點內、外部連結4個核心好處及優化策略!

***己見室聲明並無在程式中加裝任何追蹤使用者資訊、資料的代碼,授權代碼行為僅為提供程式運行,請各位斟酌後再自行判斷

***該程式最後更新時間為2023/09/02,很可能因為Google colab政策改變、Scrapy模組更新導致無法使用

Last Updated on 17 9 月, 2023 by 己見室

取自日文「實驗室(じっけんしつ、jikkensitu)」,在自己的網站上做一些實驗性的修改、優化,同時將這份「自己的所見所聞」分享給所有人,在兩個想法的結合下「己見室」就這麼誕生了。 未來會持續以自身經驗、實際操作過的步驟,帶給各位SEO、數位行銷領域相關的優化方法,請各位持續關注這個網站。

Comments

No comments yet. Why don’t you start the discussion?

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *