{{ 'fb_in_app_browser_popup.desc' | translate }} {{ 'fb_in_app_browser_popup.copy_link' | translate }}
{{ 'in_app_browser_popup.desc' | translate }}
{{word('consent_desc')}} {{word('read_more')}}
{{setting.description}}
{{ childProduct.title_translations | translateModel }}
{{ getChildVariationShorthand(childProduct.child_variation) }}
{{ getSelectedItemDetail(selectedChildProduct, item).childProductName }} x {{ selectedChildProduct.quantity || 1 }}
{{ getSelectedItemDetail(selectedChildProduct, item).childVariationName }}
搜尋引擎是幫助使用者「找到答案的工具」。
使用者只要在搜尋欄位中打上「關鍵字」,搜尋引擎就會從數以萬計的網頁當中,找到最相關的內容,推薦給使用者。
目前全世界市占率最高的搜尋引擎為 Google,在台灣的市場中佔據高達 94.43% 以上,因此當大家在討論搜尋引擎時,幾乎都是以 Google 為討論的對象。
相信這個畫面大家都不陌生,當你有想要知道的事情,就在這個白色小框框內打上相關字詞,Google 便會把相關性最高的網頁排序,並推薦給使用者。
例如我們在搜尋欄位打上「SEO 是什麼?」,Google 一共找到了七千多萬個包含這個關鍵字的搜尋結果,並把「最好的」放在最前面顯示。
其他的搜尋引擎,如:Yahoo!、Bing、百度等等也是大致使用相同的原理。
那 Google 怎麼知道什麼是「最好的」網頁呢?
當 Google 平時在蒐集這些網頁的時候,就會將網頁們按照其內容分類進資料庫當中,等到使用者來查資料的時候,再從已經分類好的檔案中,選出最合適的網頁。
因此很多人將搜尋引擎的資料庫比喻為一座巨大的圖書館,一個一個的網頁就是圖書館當中的藏書。
而 Google 搜尋引擎就好比閱覽藏書無數的圖書管理員,你只要給他關鍵字,他可以按照索引,找到適合你閱讀且可以幫助你解惑的藏書。
那你可能會問,Google 怎麼知道圖書該如何分類,哪本書又最適合誰閱讀呢?
這就要講到「搜尋引擎運作原理」,有些人又稱之為「演算法」。
搜尋引擎運作主要分為三個部分:爬文、收錄、排名。
藉由瞭解這些過程如何運作,製作出 Google 喜歡的網頁內容,試圖將網頁推到排名的最前端,增加曝光(就像擠進圖書館的十大推薦書單),就是 SEO 在做的事情。
爬文就是搜尋引擎閱讀網頁內容的過程。
圖書管理員將書本歸納到圖書館的書架上之前,必須先閱讀過所有的藏書,過濾書中資訊,才能將書本歸類到所屬的書架上。
這個大量閱讀書籍內容的動作,就稱為「爬文」。
爬蟲就是每天在圖書館內大量閱讀書籍,紀錄內容的圖書管理員。
搜尋引擎會使用一種叫做「網路爬蟲」或是「爬文蜘蛛」的機器人,閱讀每天不斷更新或是新增的網頁。
爬文階段有幾個特性:
以下將一一介紹這幾項爬蟲的特性。
爬蟲找到新網頁的方法,是透過網頁和網頁之間的超連結。
因此,想要讓爬蟲發現你新建立的網頁,最快也最直接的方式,就是建立多個連結,連到你的網頁。
你可以在網站內部建立內部連結(連到同樣網站上的連結)。
也可以將新網頁藉由留言或是分享的方式,發佈到其他的網站上面,建立反向連結(從他人網站連向自家網站的連結)。
爬蟲會藉由連結,造訪一個又一個的網頁,擁有越多連結的網頁,就像是擁有很多推薦書評的書籍,讓這本新著作更容易得到圖書管理員的關注。
在做 SEO 時,希望更新的內容快點被爬蟲看到,你可以:
Google 所使用的爬蟲有 2 種:
由於使用行動裝置(手機、平板)上網的人口越來越多,Google 傾向優先使用行動裝置爬蟲進行網頁爬文,再用桌上型裝置爬蟲進行第二次爬文。
因此,確認網頁可以正常的在行動裝置上使用,有機會提高網頁被爬文的機率。
至於新網頁多久可以被爬蟲爬到,就要考量到「爬文額度」。
爬蟲的工作能力有限,每天能夠讀取的網頁內容沒辦法無限上綱,因此有所謂「爬文額度」的限制。
「網站本身大小」和「爬文額度」決定了網站內容更新被爬蟲讀取的效率有多高。
我們可以簡單地想成:「單一網頁被爬文機率 = 爬文額度 ÷ 網頁總數」。
爬文額度越高的網站,每個網頁被爬文的機率就相對高。
而網頁數目越多,就越可能遇到爬文額度不夠的問題。
根據 Google 本身提出的資料,網頁數破千的大型網站比較會有爬文額度不足的問題。
但 Google 也強調,爬文額度僅影響網頁被爬蟲造訪的機率,與網頁排名沒有關係,內容品質才是決定網頁排名的關鍵。
驗證之後可以在設定的地方找到「檢索統計資料」欄位,那條藍色高高低低起伏的線,就是過去一段時間該網站的爬文額度線圖。
由圖片上看得出來,網站的爬文額度並非固定不變,而是不斷在變動的。
若是網站規模龐大,或是網頁遲遲沒有被爬蟲造訪,以下幾個方法有機會提高爬文額度,讓被爬文的機率增加。
根據 Google 官方說法,爬文額度取決於:
因此想提高自家網站的爬文額度,你可以:
既然爬文額度的資源有限,除了開源之外,節流也很重要。
上一段講的是如何開源:提高爬文額度,接下來要討論,網站中不重要、或是不想被爬蟲看到的網頁,要如何不讓爬蟲造訪,避免浪費爬文額度。
以下情況可能是你不希望爬蟲讀取該網頁內容:
任何你「不希望」或是「不需要」被爬文的網頁,都可以用以下指令請爬蟲略過該網頁:
robots.txt 是網站用來和搜尋引擎及爬蟲溝通的方式,可以告訴爬蟲,哪些內容要被讀取,哪些內容希望爬蟲略過。
這很像是在網頁入口立一塊看板,看板如果寫上「請進 = allow
」,爬蟲就可以放心造訪,若是寫上「禁止進入 = disallow
」,爬蟲就會略過該網頁。
當爬蟲造訪一個網站時,會先看該網站有沒有 “robots.txt file”:
allow
和 disallow
來告訴爬蟲什麼網頁該爬,什麼網頁請略過。
如果網頁有錯誤或是指示不明確,那爬蟲就先不爬了。
但 disallow
並不會禁止網頁被收錄,或是將網頁從 Google 收錄當中移除,因此如果希望網頁不要被收錄,得使用 noindex
指令。
noindex
避免網頁被收錄
這個指令會告訴搜尋引擎「請不要收錄此網頁」,不被收錄就不會被排名,因此網頁也不會出現在搜尋結果頁面上。
在這樣的情況下,使用者還是可以透過連結造訪網頁,但網頁本身無法透過搜尋結果被找到。
很重要的是:不可以同時使用 noindex
和 robots.txt 來指示爬蟲。
當爬蟲已經被 robots.txt 的指令禁止爬文該網頁,爬蟲就爬不到 noindex
的指令。
因此,當爬蟲透過其他連結找到該網頁之後,依然會對該網頁進行收錄。
此外,絕對不要依賴指令來隱藏個人隱私,有心人士可能會創造不服從指令的爬蟲,透過電子郵件或是惡意網站散播到你的電腦當中。
disallow
的不可回復性
當網頁上顯示 disallow
,這個網頁就會像是開關被關掉一樣,直接消失在搜尋引擎資料庫當中。
除了避免不重要的網頁浪費爬文額度,你也可以藉由提高爬文效率,來確保重要的網頁都有被爬蟲爬文到:
認識到什麼是爬文,以及 Google 爬文的特性之後,我們歸納出 4 項常見的錯誤,可能會讓你的網站被爬文的機會大打折扣:
收錄 (Indexing) 就是搜尋引擎將閱讀過的網頁資訊分類、歸檔的過程。
再次以圖書館來比喻搜尋引擎的話,爬文是圖書館員大量閱讀書籍的過程,收錄則是將閱讀過的書籍按照內容分門別類,排到適當的書架上。
當使用者想要查詢資料時,搜尋引擎就可以按照收錄的結果,找到適合的藏書,推薦給使用者。
只有被收錄過的網頁才有機會被排名,推薦給網路使用者,也就是,你不可能在圖書館找到管理員根本沒有引進的藏書。
因此,在進行 SEO 的操作時,一定要確定自己的網頁有被搜尋引擎收錄,才有可能出現在搜尋結果頁面上。
因為使用行動裝置(手機、平板)上網的需求越來越多,Google 在新建立、或是尚未被收錄的網頁,都使用「行動版內容優先收錄」的機制。
Google 在收錄時會優先考慮你的網站對於行動裝置是否友善。
因此 Google 建議網站管理員確認網頁版和行動版網站含有一樣的內容,並檢查圖片、影片、廣告等內容是否也都是用於行動版網頁。
想要確認自己的網頁是不是已經被 Google 搜尋引擎收錄,可以使用以下兩種方式:
site:
+該網頁網址」
確認網頁是否被收錄最快速的方法是:在搜尋欄位打上「site:
+ 該網頁網址」。
該網頁若有顯示在搜尋結果頁面,就表示已成功被收錄。
以 JKL 撰寫「外部連結」的文章為例,在搜尋引擎內打上 site:
後面加上頁面網址,網頁有顯示在搜尋結果當中,表示該文章已經被 Google 收錄完成。
另一種比較正式的確認方法,是使用 “Google Search Console” 來確認網頁的收錄情形。
步驟如下:
如果畫面中有出現綠色勾勾、和「網址在 Google 服務中」的字樣,那就代表頁面已經有成功被收錄。
這個方法的好處是,除了確認目標網頁是否被收錄之外,Google Search Console 提供整個網站完整的報告。
藉由收錄涵蓋範圍 (Index Coverage Status) 告訴網站管理員,網站中哪些頁面已經被收錄,哪些還沒或是網頁出現錯誤等等。
根據 Google 官方論壇的最佳回覆,網頁收錄沒有固定時程,通常會落在四天到四週之間,取決於網頁本身的條件,例如:
當發現網頁過了一到兩週,甚至更久都沒有被搜尋引擎收錄時,。
你可以嘗試以下幾個方法,積極幫助網頁被收錄:
手動提出申請的方式有兩種:
在 Google Search Console 裡的「網址審查」欄位中輸入頁面網址,如果審查結果顯示「網址不在 Google 服務中」,可以按右下角「要求建立索引」。
這時候系統就會顯示「編入索引」的相關字樣。
等測試結束,就完成收錄的要求了。
除了在 Google Search Console 網址審查提出請求以外,還可以透過提交 "Sitemap" 的方式傳達請求訊息給 Google。
Sitemap 是個檔案,就像地圖一樣能告訴 Google 你的網站網頁彼此間的關係,以及其他補充資訊,讓 Google 更了解你的網站,Google 便能因此更明確知道如何收錄你的網站。
根據 Google 官方指示,以下 5 種狀況可能會需要使用 Sitemap:
如同前面反覆提到的,爬蟲需要依賴連結找到更新的內容。
因此,使用扁平式網站架構,讓每個頁面都可以從首頁在三個點擊內被找到,以及增加網頁間的內部連結,都可以讓造訪網站的爬蟲更快找到新增網頁或內容。
如果以上方法都沒有用,不妨直接把網址改掉,讓 Google 把它當成一個全新的網頁,重新爬文試試看。
如果網站內有部分內容不想被收錄、顯示在搜尋結果頁面中,你可以利用 noindex
指令,告訴爬蟲不要收錄。
noindex
避免網頁被收錄
noindex
指令會告訴搜尋引擎「不要收錄此網頁」,沒有被搜尋引擎收錄的網頁,自然也會被排除在搜尋排名之外,不會顯示在搜尋結果中。
不被爬文 disallow
和不被收錄 noindex
的主要用途不同,設定方式也不一樣。
使用 noindex
設定的網頁依然有機會被爬文,只是因為不被收錄,不會顯示在搜尋結果之中。
另外,兩個只是不可以同時使用,使用 disallow
阻擋爬蟲爬文的話,爬蟲就無法讀取 noindex
的指令。
已經被收錄的網頁確實有可能因為意外的錯誤,或者被網頁管理員移除:
noindex
的指令:爬蟲爬到之後就會自動不收錄該網頁。
經過前兩個步驟:爬文、收錄之後,等於圖書都已經放上書架,歸檔完成。
當有使用者需要索取相關書籍時,搜尋引擎就根據當初收錄的檔案,從偌大的資料庫當中選出最合適的,並推薦書單給使用者。
這個書單就是「搜尋結果頁面」,也就是我們在搜尋引擎填入關鍵字,並按下 Enter 鍵之後看到的結果頁面。
結果頁面上的網頁並不是隨機排列,而是搜尋引擎會把所有包含該關鍵字的網站一一檢視,把認為能提供使用者最多幫助的排在最前面。
這樣的過程就稱為「排名」。
至於要怎麼排名,每個搜尋引擎都有自己的一套判斷準則,這套準則就被稱為「演算法」。
演算法通常考量的因素相當多,使用者搜尋意圖、網頁內容品質好壞、網站本身的權威度等等,都在演算法的考量範圍內。
根據 Backlinko 整理的清單,影響關鍵字排名的因素高達 200 種以上,依據 Google 官方說法,可以大致分成以下 5 個類別:
當使用者鍵入關鍵字,搜尋引擎會先分析「使用者想知道什麼」。
同一個詞有多種可能的意義,演算法能根據過去經驗,或是前後搭配的字詞,找到最合適的解釋。
即便關鍵字當中可能有錯別字,演算法都可以根據經驗進行修正,甚至建議使用者「你要找的可能是 ......」。·
不過事實上,脫離 Google 演算法原生的英文市場,來到台灣的繁體中文市場,Google 針對同義字判讀出的搜尋結果似乎就不是那麼精準了。
例如:想知道「代購這個詞是什麼意思」,使用者可能會用「代購是什麼」和「代購的意思」這兩個不一樣的關鍵字搜尋答案。
但實際用這兩個關鍵字搜尋,得到的搜尋結果無論是在內容和數量都不盡相同,像是前 3 名中就只有 1 個網站同時出現在兩個關鍵字的搜尋結果。
那麼,Google 如何判斷,哪些網頁與關鍵字有所相關呢?最基本的是網頁裡是否包含關鍵字,例如在標題或內文裡有出現該字詞。
搜尋引擎將分析關鍵字出現在網頁上的頻率及位置,藉以判斷相關程度。
不過,雖然關鍵字出現與否及出現頻率很重要,但這並不是搜尋引擎將網站納入相關資料群的唯一原因。
還有另一項同樣舉足輕重的因素:內容相關程度。搜尋引擎分析關鍵字之餘,也會判讀網站內容的意涵是否與該字詞實質相關。
例如,當搜尋「狗」時,狗的品種起源、狗的行為指南或狗狗旅館、狗狗美容等內容意義上與「狗」有關的網站會出現在搜尋結果;
一個只是寫滿一堆「狗狗狗」的文字、沒有為使用者提供實際資訊的網頁則不會被列入排名中。
從上述搜尋「狗」的例子可以發現, Google 判讀網站內容的核心指標在於這個網頁對搜尋者來說是否實用、是否幫助搜尋者獲得有用的資訊。
因此,除了意涵必須與關鍵字有所關聯外,內容更新時間、良好的使用者體驗等亦是評判的標準之一。
此外,網站內容的可信度與權威性也是一大重點。
如果其他經營相關主題的知名網站,有連到此網頁的連結,就像是為這個網頁「背書」一般,Google 將判定此網頁確實擁有可靠且優質的實用內容。
對 Google 而言,判別一個網站的實用性,除了關鍵字出現頻率、內容相關性與品質外,亦會考量對所有使用者來說、由此網站取得資訊的容易度與方便性。
例如,網頁是否支援不同的瀏覽器、網頁是否在所有瀏覽裝置(桌機、筆電、手機、平板等)都可以順利觀看、載入速度是否太慢等。
除了內容關聯性和網頁內容品質外,Google 也會考量使用者所在座標、使用語言、過去搜尋紀錄等等,客製化產生搜尋結果。
例如:當使用者搜尋「咖啡廳」時,在搜尋結果頁面上會顯示離使用者地理位置最近的幾家咖啡廳。
影響搜尋結果排名的因素非常多,其中部分是經過 Google 官方證實,一部分是研究搜尋引擎的專家提出的建議。
雖說沒有 100% 的正確答案,但若是希望自己的網頁能夠競爭到較前面的排名,有一些重要的準則可以遵循:
反向連結就是從別人的網頁連到你的網頁的超連結,通常發生在其他人分享或是引用你的網頁內容時。
這表示你的網頁內容被其他人認可,他們替你向 Google 背書說:這是個值得推薦的網站。
得到越多的反向連結,表示網站越受歡迎,被爬蟲造訪的機會也越高。
如果是被權威度高的網站引用,在 Google 眼中,更具有大大的加分效果。
由此可知,每個反向連結的加分效果不盡相同,以下因素決定了反向連結的力量:
想要提高網頁的排名,反向連結可說是最重要的因素之一。
延伸閱讀:對 SEO 影響至關重要的排名因素:反向連結 (Backlinks)
搜尋引擎的終極目標是滿足使用者的求知慾,解決使用者的問題,讓使用者有最佳體驗。
因此從成千上萬的網頁中挑選關聯性最高,可以快速滿足使用者需求的內容,是搜尋引擎存在的目的。
搜尋引擎根據網頁內容、標題、大綱、網址當中是否包含關鍵字,來判斷其內容和關鍵字的相關程度。
但這不代表在網頁當中塞一堆關鍵字就可以把網頁排名到前面,相反的,如果刻意堆疊無意義的關鍵字,恐違反搜尋引擎規範,網頁可能會直接被下架。
部分具有時效性,或是和時事相關的關鍵字,搜尋引擎在排名時也會考量到網頁內容的新鮮程度。
此時,較頻繁更新的網頁就相對有機會被排名到前面。
同時,經常更新的網頁也有機會較頻繁的被爬蟲造訪,加快網頁更新被爬文、收錄的速度。
想要被排名,一定要先經過爬文和收錄的階段。
內部連結是讓爬蟲找到更新網頁的方式之一,被越多內部連結連到的網頁,等於在告訴搜尋引擎該網頁的重要性,提高被爬文的機會越高。
在可接受的範圍內,只要網頁能夠順順的顯示,網頁速度通常不會是影響排名的關鍵。
網頁速度極快並不會提高該網頁的排名,但是如果網頁速度慢到使用者沒什麼耐心等待,經常等不了就跳出畫面,反而會使網頁排名被降低。
可以用 PageSpeed Insights 檢查自家網站的網頁速度。
前面有提到,因為 Google 注意到,使用行動裝置上網的人口逐漸大過使用桌機或是電腦上網者,因此將網頁是否可以正常顯示在行動裝置上,當作一項重要的評比。
如果不確定自己的網頁是否可以在行動裝置上正常顯示,可以用 Google Search Console 檢查。
點選左手邊「網址審查」的欄位,找到「行動裝置可用性」,確認底下是否出現綠色勾勾,並顯示「網頁適合在行動裝置上使用」。
這其實就是所有操作 SEO 的專家們在思考的問題。
因為搜尋引擎高度複雜,加上 Google 可能怕有心人士鑽漏洞,所以官方不會公佈演算法的完整遊戲規則。
但這也是 SEO 有趣的地方,大家在以提高網頁排名為目的的前提下,不斷創作高品質的網頁內容。
以下是想提高網頁排名,必須具備的三大技巧:
搜尋引擎的最高宗旨是:快速提供相關且完整的資訊,以滿足使用者,因此具備優質內容是競爭網頁排名的必備條件。
創造優質內容,必須思考的三個問題是:
爬蟲需要透過連結才能找到新網頁,且被越多、且權威度越高的網站在連結當中引用,代表該網頁越被大眾推薦。
品質越好的內容,通常也越容易得到高品質的反向連結,兩者同時具備,通常網頁排名都不會太差。
網頁技術面的重要性雖然不及網頁內容和反向連結,但技術問題確實影響著使用者體驗。
網頁速度過慢,或是網頁本身出現錯誤,導致使用者和爬蟲都沒辦法看到其內容,不但使用者觀感不佳,爬蟲也會因為覺得沒效率,而降低造訪頻率。
網頁從上架到排上關鍵字首頁,花費時間從 48 小時到半年以上都有可能。
如果你搜尋「關鍵字排第一要多久」,會找到 JKL 團隊實測整理的結果:需要 2–6 個月左右,但也有文章發佈後沒幾天就排上第一名的極端案例。
如果實際查看搜尋結果頁面上文章的「年齡」(文章發佈多久),首頁半數以上的網頁都已經「高齡」 3 年以上。
發佈時間在一年以內的約只佔 22%,可見 SEO 要看到成效,需要花費一定的時間。
優化網頁,企圖使網頁排上搜尋結果首頁的做法稱為 SEO,而 SEO 依照手法不同,分為白帽、灰帽、黑帽三種:
SEO 就是一門藉由了解搜尋引擎運作原理,來達到增加網頁曝光度等效果的學問。
搜尋引擎為了滿足消費者,提高使用者體驗,會不斷更新,或是每隔一段時間就發布新的建議、規章。
有時候 Google 的新策略可能會影響 SEO 排名的結果。
例如:Google 為了讓使用者可以更快速得到資訊,將排名最佳的網頁內容直接顯示在尋引擎結果頁面中。
如此一來,使用者不必點擊進入網頁就可以得到答案。
因此,在操作 SEO 時必須時時關注搜尋引擎的最新調整,並且讓網頁內容與時俱進,才能達到最佳的排名效果。