目錄 購物車 {{currentCart.getItemCount()}}
商品總數的上限為 100 件,請調整數量再點擊購買

第四章:搜尋引擎運作原理

 

搜尋引擎是什麼?為什麼大家只討論 Google?

 

搜尋引擎是幫助使用者「找到答案的工具」。

 

使用者只要在搜尋欄位中打上「關鍵字」,搜尋引擎就會從數以萬計的網頁當中,找到最相關的內容,推薦給使用者。

 

目前全世界市占率最高的搜尋引擎為 Google,在台灣的市場中佔據高達 94.43% 以上,因此當大家在討論搜尋引擎時,幾乎都是以 Google 為討論的對象。

 

相信這個畫面大家都不陌生,當你有想要知道的事情,就在這個白色小框框內打上相關字詞,Google 便會把相關性最高的網頁排序,並推薦給使用者。

 

例如我們在搜尋欄位打上「SEO 是什麼?」,Google 一共找到了七千多萬個包含這個關鍵字的搜尋結果,並把「最好的」放在最前面顯示。

 

其他的搜尋引擎,如:Yahoo!、Bing、百度等等也是大致使用相同的原理。 

 

Google 搜尋引擎的運作原理?和 SEO 的關係?

 

那 Google 怎麼知道什麼是「最好的」網頁呢?

 

當 Google 平時在蒐集這些網頁的時候,就會將網頁們按照其內容分類進資料庫當中,等到使用者來查資料的時候,再從已經分類好的檔案中,選出最合適的網頁。

 

因此很多人將搜尋引擎的資料庫比喻為一座巨大的圖書館,一個一個的網頁就是圖書館當中的藏書

 

Google 搜尋引擎就好比閱覽藏書無數的圖書管理員,你只要給他關鍵字,他可以按照索引,找到適合你閱讀且可以幫助你解惑的藏書。

 

那你可能會問,Google 怎麼知道圖書該如何分類,哪本書又最適合誰閱讀呢?

 

這就要講到「搜尋引擎運作原理」,有些人又稱之為「演算法

 

搜尋引擎運作主要分為三個部分:爬文、收錄、排名

 

  • 爬文 (Crawling):在網路上搜索新網頁=圖書管理員選購、閱讀新書
     

 

  • 收錄 (Indexing):將網頁收進資料庫=將新書分類編目、收進圖書館
     

 

  • 排名 (Ranking):推薦最符合需求的網頁給搜尋者=管理員幫讀者找適合的書,推薦 10 本就差不多夠看了

 

藉由瞭解這些過程如何運作,製作出 Google 喜歡的網頁內容,試圖將網頁推到排名的最前端,增加曝光(就像擠進圖書館的十大推薦書單)就是 SEO 在做的事情

 

爬文 (Crawling):在網路上搜索新網頁

 

什麼是「爬文」?

 

爬文就是搜尋引擎閱讀網頁內容的過程

 

圖書管理員將書本歸納到圖書館的書架上之前,必須先閱讀過所有的藏書,過濾書中資訊,才能將書本歸類到所屬的書架上。

 

這個大量閱讀書籍內容的動作,就稱為「爬文」。

 

什麼「爬蟲」?

 

爬蟲就是每天在圖書館內大量閱讀書籍,紀錄內容的圖書管理員。

 

搜尋引擎會使用一種叫做「網路爬蟲」或是「爬文蜘蛛」的機器人,閱讀每天不斷更新或是新增的網頁。

 

爬文階段有幾個特性:

 

  • 透過連結爬取

 

  • 行動裝置爬蟲 (Googlebot Smartphone) 優先

 

  • 有爬文額度 (Crawl Budget)

 

  • 可以告訴爬蟲如何爬取網站(爬文額度優化)

 

  • 爬蟲需轉譯程式碼才能了解網頁內容(讓 Google 讀懂程式碼的重要性!)

 

以下將一一介紹這幾項爬蟲的特性。

 

透過連結爬取

 

爬蟲找到新網頁的方法,是透過網頁和網頁之間的超連結。

 

因此,想要讓爬蟲發現你新建立的網頁,最快也最直接的方式,就是建立多個連結,連到你的網頁。

 

你可以在網站內部建立內部連結(連到同樣網站上的連結)。

 

也可以將新網頁藉由留言或是分享的方式,發佈到其他的網站上面,建立反向連結(從他人網站連向自家網站的連結)。

 

爬蟲會藉由連結,造訪一個又一個的網頁,擁有越多連結的網頁,就像是擁有很多推薦書評的書籍,讓這本新著作更容易得到圖書管理員的關注。

 

在做 SEO 時,希望更新的內容快點被爬蟲看到,你可以:

 

  • 建立連結到你的目標網頁:在其他已經存在的網頁上建立連結,連到新網頁,讓爬蟲有機會透過連結找到新網頁。

 

  • 扁平化的網站架構:將連結建立在從網站首頁「3 次點擊內可觸及」的位置,讓網站內的每一個網頁都有相當的機會被爬蟲爬到。

 

行動裝置爬蟲優先 

 

Google 所使用的爬蟲有 2 種:

 

  • 行動裝置爬蟲 (Googlebot Smartphone)——優先執行

 

  • 桌上型裝置爬蟲 (Googlebot Desktop)——第二順位執行

 

由於使用行動裝置(手機、平板)上網的人口越來越多,Google 傾向優先使用行動裝置爬蟲進行網頁爬文,再用桌上型裝置爬蟲進行第二次爬文。

 

因此,確認網頁可以正常的在行動裝置上使用,有機會提高網頁被爬文的機率。

 

至於新網頁多久可以被爬蟲爬到,就要考量到「爬文額度」

 

爬蟲有額度、預算限制 (Crawl Budget)

 

什麼是爬文額度 (Crawling Budget)?

 

爬蟲的工作能力有限,每天能夠讀取的網頁內容沒辦法無限上綱,因此有所謂「爬文額度」的限制。

 

「網站本身大小」和「爬文額度」決定了網站內容更新被爬蟲讀取的效率有多高。

 

我們可以簡單地想成:「單一網頁被爬文機率 = 爬文額度 ÷ 網頁總數」。

 

爬文額度越高的網站,每個網頁被爬文的機率就相對高。

 

而網頁數目越多,就越可能遇到爬文額度不夠的問題。

 

根據 Google 本身提出的資料,網頁數破千的大型網站比較會有爬文額度不足的問題。

 

但 Google 也強調,爬文額度僅影響網頁被爬蟲造訪的機率,與網頁排名沒有關係,內容品質才是決定網頁排名的關鍵。

 

如何知道自家網站的爬文額度?

 

想知道自家網站目前有多少爬文額度,可以透過網路工具 “Google Search Console” 進行查詢。

 

在欄位上填寫自家網站的網址,並進行驗證。

 

驗證之後可以在設定的地方找到「檢索統計資料」欄位,那條藍色高高低低起伏的線,就是過去一段時間該網站的爬文額度線圖。

 

由圖片上看得出來,網站的爬文額度並非固定不變,而是不斷在變動的。

 

若是網站規模龐大,或是網頁遲遲沒有被爬蟲造訪,以下幾個方法有機會提高爬文額度,讓被爬文的機率增加。

 

如何提高網站的爬文額度?

 

根據 Google 官方說法,爬文額度取決於:

 

  • 爬文頻率上限 (Crawl rate limit):

    簡單來說,就是 Google 爬蟲喜歡效率高、反應快的網站。

    如果網站回應速度很快,讓爬蟲的讀取工作相當有效率,爬蟲比較喜歡來造訪,爬文頻率上限就會提高。

    反之,當網站回應速度很慢,或是伺服器出現錯誤,會降低爬蟲造訪的意願,爬文頻率也會降低。

 

  • 爬文需求 (Crawl demand):

    爬蟲傾向於優先造訪熱門的、更新快速的網站。

    當網頁擁有愈多反向連結,或是擁有高權重的反向連結,會提高爬蟲造訪的意願。

    或是經常更新的網站,每次爬文都會有所收穫的網站,也會使爬蟲更常造訪。

 

因此想提高自家網站的爬文額度,你可以:
 

  • 提高爬文的容易度:提高網站速度、避免網頁錯誤等等。
     
  • 增加網頁連結:設法讓更多反向連結連到自己的網站,尤其是高權重的反向連結,提示爬蟲該網頁值得造訪。
     
  • 經常更新網頁:頻繁更新的網頁能提高爬蟲進行爬文的機率。

 

爬文額度優化

 

既然爬文額度的資源有限,除了開源之外,節流也很重要。

 

上一段講的是如何開源:提高爬文額度,接下來要討論,網站中不重要、或是不想被爬蟲看到的網頁,要如何不讓爬蟲造訪,避免浪費爬文額度。

 

通常哪些網頁不想被爬文?

 

以下情況可能是你不希望爬蟲讀取該網頁內容:

 

  • 個人資訊:部分網頁內容可能包含個人隱私

 

  • 重複的網頁:可能是你複製或是分享的內容,不應該重複佔用爬文額度

 

  • 空白或是錯誤網頁:尚未編輯完成或是有錯誤的網頁,不應該佔用爬文額度

 

  • 不具有價值的頁面:部分網頁內容並不能帶給讀者有用的資訊,會降低爬蟲造訪意願

 

如何讓爬蟲不要爬特定網頁?

 

任何你「不希望」或是「不需要」被爬文的網頁,都可以用以下指令請爬蟲略過該網頁:

 

  • 用 “robots.txt” 指示爬蟲:

 

robots.txt 是網站用來和搜尋引擎及爬蟲溝通的方式,可以告訴爬蟲,哪些內容要被讀取,哪些內容希望爬蟲略過。

 

這很像是在網頁入口立一塊看板,看板如果寫上「請進 = allowed」,爬蟲就可以放心造訪,若是寫上「禁止進入 = disallowed」,爬蟲就會略過該網頁。

 

當爬蟲造訪一個網站時,會先看該網站有沒有 “robots.txt file”

 

  • ,爬蟲會完全按照指示爬文網站;指示當中使用 “allowed” “disallowed” 來告訴爬蟲什麼網頁該爬,什麼網頁請略過。

 

  • 沒有,爬蟲會按照本身設定,從一個連結爬向另一個

 

如果網頁有錯誤或是指示不明確,那爬蟲就先不爬了。

disallowed 並不會禁止網頁被收錄,或是將網頁從 Google 收錄當中移除,因此如果希望網頁不要被收錄,得使用 noindex 指令。

 

  • 用 “noindex” 避免網頁被收錄

 

這個指令會告訴搜尋引擎「請不要收錄此網頁」,不被收錄就不會被排名,因此網頁也不會出現在搜尋結果頁面上。

 

在這樣的情況下,使用者還是可以透過連結造訪網頁,但網頁本身無法透過搜尋結果被找到。

 

很重要的是:不可以同時使用 “noindex” 和 “robots.txt file” 來指示爬蟲。

 

當爬蟲已經被 robots.txt 的指令禁止爬文該網頁,爬蟲就爬不到 noindex 的指令。

 

因此,當爬蟲透過其他連結找到該網頁之後,依然會對該網頁進行收錄。

 

此外,絕對不要依賴指令來隱藏個人隱私有心人士可能會創造不服從指令的爬蟲,透過電子郵件或是惡意網站散播到你的電腦當中。

 

Disallowed 的不可回復性

 

當網頁上顯示 disallowed,這個網頁就會像是開關被關掉一樣,直接消失在搜尋引擎資料庫當中。

 

如何提高爬文效率?

 

除了避免不重要的網頁浪費爬文額度,你也可以藉由提高爬文效率,來確保重要的網頁都有被爬蟲爬文到:

 

 

  • 善用內部連結:讓爬蟲更容易找到目標網頁

 

  • 扁平網站架構:讓每個網頁都可以從首頁在 3 次點擊內被找到

 

 

  • 避免網頁錯誤:網頁錯誤會降低爬蟲爬文意願,降低爬文額度

 

影響爬文常見的錯誤

 

認識到什麼是爬文,以及 Google 爬文的特性之後,我們歸納出 4 項常見的錯誤,可能會讓你的網站被爬文的機會大打折扣:

 

  • 登入後才可以查看內容:爬蟲並不會嘗試「登入」你的網頁,當然也就看不到藏在登入頁之後的內容

 

  • 沒有將重點內容文字化:爬蟲爬文還是以文字內容為主,如果重要內容都只放在圖片或是影片當中,爬蟲看不到相當可惜

 

  • 網站架構太多層:如果網頁需要點很多層才看得到,或是僅僅只有一個內部連結連向它,都不容易被爬蟲找到

 

  • 網頁出現錯誤:網頁無法正常顯示,不僅爬蟲和使用者都看不到內容,還會浪費並減低爬文額度

 

收錄、索引 (Indexing):將網頁收進資料庫

 

收錄 (Indexing) 就是搜尋引擎將閱讀過的網頁資訊分類、歸檔的過程。

 

再次以圖書館來比喻搜尋引擎的話,爬文是圖書館員大量閱讀書籍的過程,收錄則是將閱讀過的書籍按照內容分門別類,排到適當的書架上。

 

當使用者想要查詢資料時,搜尋引擎就可以按照收錄的結果,找到適合的藏書,推薦給使用者。

 

只有被收錄過的網頁才有機會被排名,推薦給網路使用者,也就是,你不可能在圖書館找到管理員根本沒有引進的藏書。

 

因此,在進行 SEO 的操作時,一定要確定自己的網頁有被搜尋引擎收錄,才有可能出現在搜尋結果頁面上。

 

行動裝置優先收錄

 

因為使用行動裝置(手機、平板)上網的需求越來越多,Google 在新建立、或是尚未被收錄的網頁,都使用「行動版內容優先收錄」的機制。

 

Google 在收錄時會優先考慮你的網站對於行動裝置是否友善。
 

因此 Google 建議網站管理員確認網頁版和行動版網站含有一樣的內容,並檢查圖片、影片、廣告等內容是否也都是用於行動版網頁。

 

如何確認網頁是否已經被 Google 收錄?

 

想要確認自己的網頁是不是已經被 Google 搜尋引擎收錄,可以使用以下兩種方式:

 

  • 搜尋:「site: +該網頁網址」

    (site 之後直接加上網域名稱,不要加上空白鍵或是 “http://”)

 

  • 使用 Google Searching Console

 

搜尋:「site: +該網頁網址」

 

確認網頁是否被收錄最快速的方法是:在搜尋欄位打上site: + 該網頁網址」

 

該網頁若有顯示在搜尋結果頁面,就表示已成功被收錄。

 

以 JKL 撰寫「外部連結」的文章為例,在搜尋引擎內打上 site: 後面加上頁面網址,網頁有顯示在搜尋結果當中,表示該文章已經被 Google 收錄完成。

 

使用 Google Search Console 確認網頁收錄情況 

 

另一種比較正式的確認方法,是使用 “Google Search Console” 來確認網頁的收錄情形。

 

步驟如下:

 

  • 在Google Search Console 中點擊「網址審查」

 

  • 輸入想要確認的頁面網址 (URL)

 

  • 從「檢查網址」的介面,查看網頁收錄情況

 

如果畫面中有出現綠色勾勾、和「網址在 Google 服務中」的字樣,那就代表頁面已經有成功被收錄。

 

使用 Google Search Console 看索引的涵蓋範圍

 

這個方法的好處是,除了確認目標網頁是否被收錄之外,Google Search Console 提供整個網站完整的報告。

 

藉由收錄涵蓋範圍 (Index Coverage Status) 告訴網站管理員,網站中哪些頁面已經被收錄,哪些還沒或是網頁出現錯誤等等。

 

Google 的收錄速度快嗎?要等多久?

 

根據 Google 官方論壇的最佳回覆,網頁收錄沒有固定時程,通常會落在四天到四週之間,取決於網頁本身的條件,例如:

 

  • 網頁的受歡迎程度:擁有較多反向連結、被許多網頁以連結引用的網頁,收錄的速度往往較快。

 

  • 網頁內容是否可以被爬取:如果網頁伺服器的回應狀態出現錯誤,例如出現 “404 Not Found” 請求失敗的狀況,會延緩網頁被爬文的速度。

    另外,爬文蜘蛛主要以「文字理解」為主,如果網頁當中的重要資訊大多用圖表、影片或是語音檔案等方式呈現,建議要有相對應的文字說明,才更有利於爬文。

 

  • 網頁架構:爬蟲是依靠連結造訪新網頁,如果把網頁當中的重要更新藏在網站架構的相對底層,並不利於爬蟲找到該網頁。

    SEO 專家 Neil Patel 認為:網頁架構是很重要、但卻常被忽略的 SEO 優化項目

    建議在設計網站結構時,不要設定過多的層級,讓每個網頁都在從首頁三個連結內可以連到的位置,並適時加強網頁間的內部連結。

 

主動要求 Google 收錄自己的網頁

 

當發現網頁過了一到兩週,甚至更久都沒有被搜尋引擎收錄時,。

 

你可以嘗試以下幾個方法,積極幫助網頁被收錄:

 

  • 主動要求 Google 收錄自己的網頁

 

  • 增加網站內部連結

 

  • 更改網址重新嘗試

 

手動提出申請的方式有兩種:

 

  • 使用 Google Search Console 裡的「網址審查 (the URL Inspection Tool)」提出「要求建立索引」請求

 

  • 提交 “Sitemap” 

 

主動「要求建立索引」

 

在 Google Search Console 裡的「網址審查」欄位中輸入頁面網址,如果審查結果顯示「網址不在 Google 服務中」,可以按右下角「要求建立索引」。

 

這時候系統就會顯示「編入索引」的相關字樣。

 

等測試結束,就完成收錄的要求了。

 

提交 “Sitemap”

 

除了在 Google Search Console 網址審查提出請求以外,還可以透過提交 "Sitemap" 的方式傳達請求訊息給 Google。

 

什麼是 Sitemap 網站地圖?

 

Sitemap 是個檔案,就像地圖一樣能告訴 Google 你的網站網頁彼此間的關係,以及其他補充資訊,讓 Google 更了解你的網站,Google 便能因此更明確知道如何收錄你的網站。

 

 

根據 Google 官方指示,以下 5 種狀況可能會需要使用 Sitemap:

 

  • 網站規模龐大:當網站所含網頁多餘500頁時,搜尋引擎在收錄時,可能會遺漏其中部分網頁。

 

  • 網站內部網頁各自獨立,彼此間沒有相互連結:可以用 Sitemap 讓 Google 了解網頁間彼此的關係,幫助收錄。

 

  • 新網站,沒有其他反向連結:沒有連結連到你的網頁,就很難被爬蟲發現,這時也可以利用 Sitemap 來指引搜尋引擎收錄。

 

  • 網站中包含大量影片、圖片:也可以用 Sitemap 來補足爬蟲不利於爬取影音資訊的不足。

 

  • 頻繁更新的網站或是網頁內容:例如新聞網站,幾乎時時刻刻都有更新,可以用 Sitemap 來告知 Google 網頁更新的時間。

 

加強內部連結

 

如同前面反覆提到的,爬蟲需要依賴連結找到更新的內容。

 

因此,使用扁平式網站架構,讓每個頁面都可以從首頁在三個點擊內被找到,以及增加網頁間的內部連結,都可以讓造訪網站的爬蟲更快找到新增網頁或內容。

 

更改網址重新嘗試

 

如果以上方法都沒有用,不妨直接把網址改掉,讓 Google 把它當成一個全新的網頁,重新爬文試試看。

 

怎麼讓 Google「不要」收錄網頁?

 

如果網站內有部分內容不想被收錄、顯示在搜尋結果頁面中,你可以利用 noindex 指令,告訴爬蟲不要收錄。

 

用 “noindex” 避免網頁被收錄

 

Noindex 指令會告訴搜尋引擎「不要收錄此網頁」,沒有被搜尋引擎收錄的網頁,自然也會被排除在搜尋排名之外,不會顯示在搜尋結果中。

 

不被爬文 (disallowed) 和不被收錄 (noindex) 的主要用途不同,設定方式也不一樣。

 

使用 noindex 設定的網頁依然有機會被爬文,只是因為不被收錄,不會顯示在搜尋結果之中。

 

另外,兩個只是不可以同時使用,使用 disalloewed 阻擋爬蟲爬文的話,爬蟲就無法讀取 noindex 的指令。

 

被收錄過的網頁可能再被移除嗎?

 

已經被收錄的網頁確實有可能因為意外的錯誤,或者被網頁管理員移除:

 

  • 利用 301 指示碼將舊網頁導向新網頁時,操作上出現錯誤:

    301 指示碼會告訴搜尋引擎,原本的就網址已經被移除,並導引搜尋引擎到新網頁。

    如果導引時出錯,就會造成該網址在搜尋引擎上被顯示為「找不到網頁」或是「網頁出現錯誤」,而被從收錄當中移除。

 

  • 網址當中被加入 “noindex” 的指令:爬蟲爬到之後就會自動不收錄該網頁。

 

  • 網頁被搜尋引擎發現違規事項:例如使用「黑帽手法」,當網頁違反搜尋引擎規範時,可能會被搜尋引擎處罰,導致網頁從收錄當中被踢除。

 

  • 網址經過加密而無法被爬文:網頁也會從收錄中被刪除。

 

排名 (Ranking):推薦最符合需求的網頁給搜尋者

 

經過前兩個步驟:爬文、收錄之後,等於圖書都已經放上書架,歸檔完成。

 

當有使用者需要索取相關書籍時,搜尋引擎就根據當初收錄的檔案,從偌大的資料庫當中選出最合適的,並推薦書單給使用者。

 

這個書單就是「搜尋結果頁面」,也就是我們在搜尋引擎填入關鍵字,並按下 Enter 鍵之後看到的結果頁面。

 

結果頁面上的網頁並不是隨機排列,而是搜尋引擎會把所有包含該關鍵字的網站一一檢視,把認為能提供使用者最多幫助的排在最前面。

 

這樣的過程就稱為「排名」。

 

排名的依據:演算法

 

至於要怎麼排名,每個搜尋引擎都有自己的一套判斷準則,這套準則就被稱為「演算法」。

 

演算法通常考量的因素相當多,使用者搜尋意圖、網頁內容品質好壞、網站本身的權威度等等,都在演算法的考量範圍內。

 

根據 Backlinko 整理的清單,影響關鍵字排名的因素高達 200 種以上,依據 Google 官方說法,可以大致分成以下 5 個類別:

  

  • 查詢字詞的意義(使用者查詢意圖)

 

  • 網頁內容的關聯性

 

  • 網頁內容的品質

 

  • 網頁的可用性(使用者體驗)

 

  • 背景資訊與設定(使用者所在地、查詢記錄等)

 

查詢字詞的意義:分析使用者查詢意圖 

 

當使用者鍵入關鍵字,搜尋引擎會先分析「使用者想知道什麼」。

 

同一個詞有多種可能的意義,演算法能根據過去經驗,或是前後搭配的字詞,找到最合適的解釋。

 

即便關鍵字當中可能有錯別字,演算法都可以根據經驗進行修正,甚至建議使用者「你要找的可能是 ......」。·

 

不過事實上,脫離 Google 演算法原生的英文市場,來到台灣的繁體中文市場,Google 針對同義字判讀出的搜尋結果似乎就不是那麼精準了。

 

例如:想知道「代購這個詞是什麼意思」,使用者可能會用「代購是什麼」和「代購的意思」這兩個不一樣的關鍵字搜尋答案。

 

但實際用這兩個關鍵字搜尋,得到的搜尋結果無論是在內容和數量都不盡相同,像是前 3 名中就只有 1 個網站同時出現在兩個關鍵字的搜尋結果。

 

網頁內容的關聯性:關鍵字出現的位置和頻率、是否確實有相關內容

 

那麼,Google 如何判斷,哪些網頁與關鍵字有所相關呢?最基本的是網頁裡是否包含關鍵字,例如在標題或內文裡有出現該字詞。

 

搜尋引擎將分析關鍵字出現在網頁上的頻率及位置,藉以判斷相關程度。

 

不過,雖然關鍵字出現與否及出現頻率很重要,但這並不是搜尋引擎將網站納入相關資料群的唯一原因。

 

還有另一項同樣舉足輕重的因素:內容相關程度。搜尋引擎分析關鍵字之餘,也會判讀網站內容的意涵是否與該字詞實質相關

 

例如,當搜尋「狗」時,狗的品種起源、狗的行為指南或狗狗旅館、狗狗美容等內容意義上與「狗」有關的網站會出現在搜尋結果;

 

一個只是寫滿一堆「狗狗狗」的文字、沒有為使用者提供實際資訊的網頁則不會被列入排名中。

 

為實用的關鍵字排名:內容品質決定一切 

 

從上述搜尋「狗」的例子可以發現, Google 判讀網站內容的核心指標在於這個網頁對搜尋者來說是否實用、是否幫助搜尋者獲得有用的資訊。

 

因此,除了意涵必須與關鍵字有所關聯外,內容更新時間、良好的使用者體驗等亦是評判的標準之一。

 

此外,網站內容的可信度與權威性也是一大重點。

 

如果其他經營相關主題的知名網站,有連到此網頁的連結,就像是為這個網頁「背書」一般,Google 將判定此網頁確實擁有可靠且優質的實用內容。

 

網頁的可用性:使用者體驗最佳的結果 

 

對 Google 而言,判別一個網站的實用性,除了關鍵字出現頻率、內容相關性與品質外,亦會考量對所有使用者來說、由此網站取得資訊的容易度與方便性。

 

例如,網頁是否支援不同的瀏覽器、網頁是否在所有瀏覽裝置(桌機、筆電、手機、平板等)都可以順利觀看、載入速度是否太慢等。

 

考量背景資訊:會客製化排名結果

 

除了內容關聯性和網頁內容品質外,Google 也會考量使用者所在座標、使用語言、過去搜尋紀錄等等,客製化產生搜尋結果。

 

例如:當使用者搜尋「咖啡廳」時,在搜尋結果頁面上會顯示離使用者地理位置最近的幾家咖啡廳。

 

影響排名的因素

 

影響搜尋結果排名的因素非常多,其中部分是經過 Google 官方證實,一部分是研究搜尋引擎的專家提出的建議。

 

雖說沒有 100% 的正確答案,但若是希望自己的網頁能夠競爭到較前面的排名,有一些重要的準則可以遵循:

 

建立反向連結

 

反向連結就是從別人的網頁連到你的網頁的超連結,通常發生在其他人分享或是引用你的網頁內容時。

 

這表示你的網頁內容被其他人認可,他們替你向 Google 背書說:這是個值得推薦的網站。

 

得到越多的反向連結,表示網站越受歡迎,被爬蟲造訪的機會也越高。

 

如果是被權威度高的網站引用,在 Google 眼中,更具有大大的加分效果。

 

由此可知,每個反向連結的加分效果不盡相同,以下因素決定了反向連結的力量:

 

  • Relevance of the backlink:關聯性越高的越加分

 

  • Authority of the linking page:權威性越高的網站加分越高

 

  • Position of the backlink:出現在網頁內文的效果比頭尾、邊邊好

 

  • Anchor text of the backlink:錨點文字跟關鍵字有關連性會更好

 

想要提高網頁的排名,反向連結可說是最重要的因素之一。

 

延伸閱讀:對 SEO 影響至關重要的排名因素:反向連結 (Backlinks)

 

內容關聯性

 

搜尋引擎的終極目標是滿足使用者的求知慾,解決使用者的問題,讓使用者有最佳體驗。
 

因此從成千上萬的網頁中挑選關聯性最高,可以快速滿足使用者需求的內容,是搜尋引擎存在的目的。

 

搜尋引擎根據網頁內容、標題、大綱、網址當中是否包含關鍵字,來判斷其內容和關鍵字的相關程度。

 

但這不代表在網頁當中塞一堆關鍵字就可以把網頁排名到前面,相反的,如果刻意堆疊無意義的關鍵字,恐違反搜尋引擎規範,網頁可能會直接被下架。

 

內容新鮮度

 

部分具有時效性,或是和時事相關的關鍵字,搜尋引擎在排名時也會考量到網頁內容的新鮮程度。

 

此時,較頻繁更新的網頁就相對有機會被排名到前面。

 

同時,經常更新的網頁也有機會較頻繁的被爬蟲造訪,加快網頁更新被爬文、收錄的速度。

 

內部連結

 

想要被排名,一定要先經過爬文和收錄的階段。

 

內部連結是讓爬蟲找到更新網頁的方式之一,被越多內部連結連到的網頁,等於在告訴搜尋引擎該網頁的重要性,提高被爬文的機會越高。

 

網頁速度

 

在可接受的範圍內,只要網頁能夠順順的顯示,網頁速度通常不會是影響排名的關鍵。

 

網頁速度極快並不會提高該網頁的排名,但是如果網頁速度慢到使用者沒什麼耐心等待,經常等不了就跳出畫面,反而會使網頁排名被降低。

 

可以用 PageSpeed Insights 檢查自家網站的網頁速度。

 

行動裝置可用性

 

前面有提到,因為 Google 注意到,使用行動裝置上網的人口逐漸大過使用桌機或是電腦上網者,因此將網頁是否可以正常顯示在行動裝置上,當作一項重要的評比。

 

如果不確定自己的網頁是否可以在行動裝置上正常顯示,可以用 Google Search Console 檢查。

 

點選左手邊「網址審查」的欄位,找到「行動裝置可用性」,確認底下是否出現綠色勾勾,並顯示「網頁適合在行動裝置上使用」。

 

如何提升排名?

 

這其實就是所有操作 SEO 的專家們在思考的問題。

 

因為搜尋引擎高度複雜,加上 Google 可能怕有心人士鑽漏洞,所以官方不會公佈演算法的完整遊戲規則。

 

但這也是 SEO 有趣的地方,大家在以提高網頁排名為目的的前提下,不斷創作高品質的網頁內容。

 

以下是想提高網頁排名,必須具備的三大技巧:

 

  • 打造優質內容 (45%)

 

  • 建置優質反向連結 (45%)

 

  • 檢測 SEO 技術層面 (10%)

 

打造高品質內容

 

搜尋引擎的最高宗旨是:快速提供相關且完整的資訊,以滿足使用者,因此具備優質內容是競爭網頁排名的必備條件。

 

創造優質內容,必須思考的三個問題是:

 

  • 網頁內容是否可以解決使用者的問題

 

  • 網頁內容是否涵蓋大部分關鍵字的衍生問題

 

  • 網頁內容是否確實提供給使用者價值

 

建立優質反向連結

 

爬蟲需要透過連結才能找到新網頁,且被越多、且權威度越高的網站在連結當中引用,代表該網頁越被大眾推薦。
 

品質越好的內容,通常也越容易得到高品質的反向連結,兩者同時具備,通常網頁排名都不會太差。

 

檢測 SEO 技術層面

 

網頁技術面的重要性雖然不及網頁內容和反向連結,但技術問題確實影響著使用者體驗。

 

網頁速度過慢,或是網頁本身出現錯誤,導致使用者和爬蟲都沒辦法看到其內容,不但使用者觀感不佳,爬蟲也會因為覺得沒效率,而降低造訪頻率。

 

搜尋引擎的排名速度

 

網頁從上架到排上關鍵字首頁,花費時間從 48 小時到半年以上都有可能。

 

如果你搜尋「關鍵字排第一要多久」,會找到 JKL 團隊實測整理的結果:需要 2–6 個月左右,但也有文章發佈後沒幾天就排上第一名的極端案例

 

如果實際查看搜尋結果頁面上文章的「年齡」(文章發佈多久),首頁半數以上的網頁都已經「高齡」 3 年以上

 

發佈時間在一年以內的約只佔 22%,可見 SEO 要看到成效,需要花費一定的時間。

 

白帽、黑帽、灰帽優化手法

 

優化網頁,企圖使網頁排上搜尋結果首頁的做法稱為 SEO,而 SEO 依照手法不同,分為白帽、灰帽、黑帽三種:

 

  • 白帽:使用正規手法,通常需要比較久的時間才能看出成效,但手法安全,不須承擔網頁被下架的風險。例如:寫優質內容。
     
  • 黑帽:利用違反搜尋引擎規章的手法來提升排名,可能可以快速見效,但是一但被發現,網頁可能直接被下架。例如:在網頁內大量填塞使用者看不到的關鍵字。
     
  • 灰帽:介於前兩者中間的灰色地帶。

 

搜尋引擎原理與 SEO 關係

 

SEO 就是一門藉由了解搜尋引擎運作原理,來達到增加網頁曝光度等效果的學問。

 

搜尋引擎為了滿足消費者,提高使用者體驗,會不斷更新,或是每隔一段時間就發布新的建議、規章。

 

有時候 Google 的新策略可能會影響 SEO 排名的結果。

 

例如:Google 為了讓使用者可以更快速得到資訊,將排名最佳的網頁內容直接顯示在尋引擎結果頁面中。

 

如此一來,使用者不必點擊進入網頁就可以得到答案。

 

因此,在操作 SEO 時必須時時關注搜尋引擎的最新調整,並且讓網頁內容與時俱進,才能達到最佳的爬名效果。