查網站電商媒體電商數據榜單中心數據速報 工具箱小教室電商健檢比較清單對手對戰API關於
數據與 KPI

電商網站技術 SEO:讓 Google 爬得到、收得了、排得上

電商網站技術 SEO:讓 Google 爬得到、收得了、排得上|ECPRO 電商博士
字級
ChatGPT 摘要 Claude 摘要 Perplexity 摘要
林克威導讀

內容再好,Google 爬不到、收不進索引就等於不存在;電商站的技術 SEO 決定了你的商品頁能不能被看見。

本文重點
  • 技術 SEO 是什麼:爬取、索引、排名的技術基礎
  • 電商站最常見的技術問題
  • canonical 與重複內容
  • robots.txt 與 sitemap
  • 結構化資料:Product、BreadcrumbList、Review
  • 網站速度與 Core Web Vitals

很多電商經營者把 SEO 想成「寫部落格、塞關鍵字」,但對一個有數千甚至數萬支商品的購物網站來說,真正卡住流量的往往不是內容,而是技術層。Google 的爬蟲進不來、進來了卻在成千上萬個長得幾乎一樣的篩選網址裡迷路、好不容易爬到的商品頁又因為缺貨被下架⋯⋯這些都是內容編輯永遠解決不了的問題。這篇文章我們就從技術 SEO 的底層邏輯講起,一路帶到電商站最常見的技術地雷該怎麼拆。

技術 SEO 是什麼:爬取、索引、排名的技術基礎

要理解技術 SEO,先要理解 Google 處理一個網頁的三個階段,這三個階段是層層相依的漏斗,前一關過不了,後面全都不用談。

爬取(Crawling)

Google 的爬蟲 Googlebot 會沿著連結一頁一頁抓取你的網站。它不是無限量地抓,每個網站都有一個大致的「爬取預算」(crawl budget),也就是 Googlebot 願意在你站上花費的抓取次數與資源。對只有幾十頁的小站,爬取預算幾乎不是問題;但對一個有數萬支商品、又會因為篩選參數生出幾十萬個網址的電商站,爬取預算就是生死線。你如果讓爬蟲把力氣都花在無意義的重複網址上,真正重要的新商品頁反而遲遲不被抓到。

索引(Indexing)

抓到頁面之後,Google 會渲染、解析內容,判斷這一頁「值不值得」放進索引資料庫。注意,被爬取不等於被索引。如果頁面內容太薄、跟其他頁面重複度太高、或被標記為 noindex,Google 就算爬到了也會選擇不收錄。在 Search Console 裡你常看到的「已檢索,但目前尚未建立索引」,講的就是這個階段被刷掉。

排名(Ranking)

只有進了索引的頁面,才有資格參與排名競爭。排名牽涉的訊號有數百項,但技術面能幫上忙的,主要是讓頁面載入夠快、在手機上好用、結構化資料清楚、內部連結把權重導到對的頁面。技術 SEO 不會直接幫你「贏」,但它能移除所有讓你「連參賽資格都拿不到」的障礙。

一句話總結:技術 SEO 的工作,就是確保你花大錢做的商品與內容,能順利通過爬取與索引這兩道關卡,站上排名的起跑線。

電商站最常見的技術問題

電商站有一組其他類型網站幾乎不會遇到的結構性難題,幾乎每一個成長中的購物網站都會撞上。

  • 大量商品頁高度重複:同一款 T 恤有紅、藍、黑、白、S、M、L、XL 十幾個規格,若每個規格都是獨立網址,內容幾乎一模一樣,Google 會視為重複內容,稀釋彼此的權重。
  • 篩選與排序參數產生無限 URL:分類頁上的「價格由低到高」「品牌」「顏色」「尺寸」等篩選器,往往會在網址後面加上參數,例如 ?color=red&sort=price&size=m。這些參數可以任意組合,理論上能生出成千上萬個網址,每一個內容都大同小異,這是吃掉爬取預算最兇的元凶。
  • 缺貨與下架商品頁:商品賣完或季節性下架後,頁面該保留、該轉址還是該回傳 404?處理不當會累積大量無效頁面或損失既有排名。
  • 分頁(Pagination):一個分類有 500 件商品、每頁顯示 40 件,就會有十幾頁。Google 要怎麼理解第 2 頁、第 3 頁跟第 1 頁的關係,才不會漏抓後面的商品?

這些問題的共通點是:它們都會讓 Google 把有限的爬取與索引資源,浪費在對使用者跟生意都沒有價值的網址上。接下來我們逐一拆解。

canonical 與重複內容

處理重複內容最核心的工具,是 rel="canonical" 這個標籤。它的作用是告訴 Google:「這一頁的內容,其實以另一個網址為準,請把權重集中到那個標準網址上。」

以商品規格為例,假設同一款鞋子有多個顏色網址,你可以讓每個顏色頁的 canonical 都指向主商品頁(或指向自己,視你的策略而定)。以篩選參數為例,/shoes?color=red&sort=price 這種頁面的 canonical 應該指向乾淨的 /shoes。這樣一來,即使爬蟲抓到了帶參數的網址,也知道要把它視為主網址的一個變體,不重複收錄。

要提醒的是,canonical 是「建議」而不是「命令」。Google 會參考你的 canonical,但如果它判斷你標錯了(例如 canonical 指向的頁面內容明顯不同),它有可能忽略。所以 canonical 一定要指向內容真正等價、且回傳 200 狀態碼的頁面,不要指向 404 或轉址頁。常見的低級錯誤是整站所有頁面的 canonical 都指到首頁,這會讓 Google 直接把你所有內頁當成首頁的重複而不收錄,是災難級的失誤。

robots.txt 與 sitemap

這兩個檔案是你跟爬蟲溝通的兩張地圖,一張說「別去哪」,一張說「請來這」。

robots.txt:管控爬取

robots.txt 放在網站根目錄,用來告訴爬蟲哪些路徑不要抓。對電商站來說,最典型的用法是擋掉購物車、結帳、會員中心、站內搜尋結果,以及某些純功能性的參數路徑。要特別分清楚一個常見誤解:robots.txt 的 Disallow 是阻止「爬取」,不是阻止「索引」。如果一個被 Disallow 的網址有很多外部連結指過來,Google 還是可能把這個網址(沒有內容的版本)收進索引。真正要防止某頁被索引,得用網頁層級的 noindex meta 標籤,而且那一頁不能同時被 robots.txt 擋住,否則爬蟲根本讀不到 noindex 指令。

sitemap.xml:主動提報

XML sitemap 是你主動交給 Google 的「重要網址清單」。電商站的 sitemap 應該只放你真正希望被索引的乾淨網址——也就是主商品頁、主分類頁、內容頁——而不要放帶參數的篩選頁、缺貨轉址頁或 noindex 頁。sitemap 裡的 <lastmod> 標記商品最後更新時間,能幫助 Google 判斷哪些頁面需要重新抓取。商品數量龐大的站建議把 sitemap 依類型拆檔(商品、分類、文章各一份),再用一個 sitemap index 統整,方便你在 Search Console 裡分別觀察各類頁面的索引狀況。

結構化資料:Product、BreadcrumbList、Review

結構化資料(Schema.org,通常以 JSON-LD 格式嵌入)是讓 Google 更精準理解頁面內容的標記,對電商站尤其能換來實際的「複合式搜尋結果」曝光。

  • Product:標記商品名稱、圖片、品牌、價格、貨幣、供應狀態(InStock/OutOfStock)。有了它,搜尋結果可能直接顯示價格與供貨狀態,點閱率往往明顯提升(範例:某些商家導入後商品類關鍵字的點閱率提升為原本的一倍以上,實際幅度依站而異)。
  • BreadcrumbList:把「首頁 > 女裝 > 洋裝 > 這件商品」的層級標記出來,讓搜尋結果顯示麵包屑路徑,取代冗長的網址,同時強化網站結構訊號。
  • Review/AggregateRating:標記評價與星等,可能在結果頁顯示星星,這是點閱率的強力磁鐵。但務必只標記頁面上真實存在、使用者可見的評價,捏造星等或標記不存在的評分,會違反 Google 政策而遭到人工處分。

結構化資料寫完一定要用 Google 的複合式搜尋結果測試工具(Rich Results Test)驗證,並在 Search Console 的「強化」報表持續監看有沒有錯誤或警告。

網站速度與 Core Web Vitals

速度不只影響使用者體驗,也是 Google 明確納入的排名訊號。Core Web Vitals 是 Google 量化使用者體驗的三個核心指標:

技術 SEO 檢查項目對搜尋表現的影響
LCP(最大內容繪製)< 2.5 秒頁面主要內容載入速度,直接影響體驗訊號與跳出率
INP(互動至下次繪製)< 200 毫秒反映頁面互動的反應速度,取代舊的 FID 指標
CLS(累計版位配置位移)< 0.1畫面穩定度,避免圖片載入把按鈕擠位造成誤點
canonical 正確指向標準網址集中重複頁面的權重,避免索引稀釋
robots.txt 未誤擋重要資源避免 CSS/JS 被擋導致渲染失敗、無法索引
Product 結構化資料無誤爭取價格、星等等複合式搜尋結果曝光
XML sitemap 只含可索引網址引導爬取預算集中在有價值的頁面
行動版與電腦版內容一致行動優先索引下,避免手機版缺內容而掉排名

電商站拖慢速度的常見兇手是商品大圖:用次世代格式(WebP/AVIF)、依裝置提供適當尺寸、對首屏以下的圖片做延遲載入(lazy load),通常能立刻改善 LCP。第三方追蹤與行銷腳本堆太多,則是 INP 惡化的主因,該精簡就精簡。

行動優先索引

Google 早已全面改用「行動優先索引」,也就是說,它主要以你網站的手機版內容來評估與排名。這對電商站的實務意義是:手機版絕不能是電腦版的閹割版。常見的坑包括手機版為了畫面簡潔而藏掉商品描述、規格表或評價區塊——如果這些內容手機版看不到,Google 就當它們不存在,排名自然受損。務必確保手機版與電腦版的主要文字內容、結構化資料、內部連結一致,並實測手機上的點擊區塊夠大、字級夠讀。

內部連結與網站結構

內部連結決定了權重如何在站內流動,也決定了爬蟲能不能順利抵達深層的商品頁。理想的電商結構是扁平的:從首頁點擊三次以內,就能到達任何一支商品。層級太深、藏在第 20 頁分頁後面的商品,爬蟲很可能永遠抓不到。

實務做法包括:分類頁與商品頁之間用清楚的麵包屑相互連結、在商品頁放「相關商品」「同分類熱銷」區塊把權重橫向傳遞、用內容文章(購物指南、選購教學)連向相關的分類與商品頁形成主題聚落。分頁部分,現在 Google 建議讓每一頁的分頁都是可爬取、可索引的獨立網址,並確保每頁都有指回自己的 canonical,別把第 2 頁以後全指向第 1 頁,否則後面的商品連結會被連帶忽略。

缺貨與下架商品頁怎麼處理

這是電商站獨有、又最容易做錯的一題,判斷原則是「這個商品還會不會回來」。

  1. 暫時缺貨、之後會補貨:保留頁面、維持 200 狀態,用 Product 結構化資料標記 OutOfStock,並在頁面上提供「到貨通知」或推薦替代商品。千萬別直接刪頁,你會白白丟掉這頁累積的排名與外部連結。
  2. 永久下架、但有明確替代品:用 301 永久轉址導到最相近的替代商品或上層分類頁,把權重承接過去。
  3. 永久下架、且無替代品:回傳 410(已刪除)或 404,讓 Google 明白這頁確實不存在了,並從 sitemap 移除。用 410 會讓 Google 更快將其移出索引。

最該避免的錯誤,是把大量缺貨頁全部無差別 301 導回首頁,Google 會把這種轉址視為「軟性 404」而不傳遞權重,等於做白工。

用 Search Console 診斷

Google Search Console 是免費、也是最權威的技術 SEO 診斷工具,電商站至少要定期看這幾份報表:

  • 頁面索引報表:看有多少頁被索引、多少被排除,以及排除原因。「重複,未選取使用者指定的標準網頁」通常代表你的 canonical 沒被採信;「已檢索,但目前尚未建立索引」多半是內容太薄。
  • 網址檢查工具:輸入單一網址,即時查它是否被索引、Google 看到的渲染結果、實際採用的 canonical,是排查個別商品頁問題的利器。
  • Core Web Vitals 報表:用真實使用者數據標出哪些網址群組速度不合格。
  • 成效報表:看每個查詢與頁面的曝光、點閱、排名,找出曝光高但點閱低的頁面去優化標題與結構化資料。

養成每週看一次索引與成效、每次上架大批商品或改版後主動用網址檢查工具送審的習慣,問題才能在擴大前被攔下。

常見錯誤

最後整理幾個電商站反覆踩的技術 SEO 地雷:把整站 canonical 都指向首頁、用 robots.txt 擋住想要 noindex 的頁面(結果 noindex 根本讀不到)、放任篩選參數生成的無限網址被爬取、缺貨頁全部 301 回首頁、手機版藏掉關鍵內容、sitemap 塞滿 404 與轉址網址、以及標記不存在的評價星等。這些錯誤的共通點都是「讓 Google 把資源浪費在錯的頁面,或誤解了你的意圖」。把技術地基打穩,你的內容與商品才有機會被公平看見。

ECPRO 數據觀察

用真實數據延伸這個主題

ECPRO 電商博士實測逾 10 萬個台灣電商網站。想用數據驗證本文觀點,延伸閱讀這幾份實測報告:

覺得有用?分享出去
LINE Facebook X Threads

常見問題

技術 SEO 和一般 SEO(內容 SEO)有什麼不同?

內容 SEO 處理的是「頁面說了什麼」——關鍵字、文案品質、能不能滿足使用者搜尋意圖;技術 SEO 處理的是「Google 能不能順利存取並理解你的頁面」——爬取預算、索引狀態、canonical、網站速度、結構化資料等。兩者互補:內容再好,技術層讓 Google 爬不到、收不了,一樣沒有流量;技術做得再好,內容空洞也排不上。電商站因為頁面量大、URL 結構複雜,技術 SEO 的權重通常更吃重。

電商站的篩選參數網址到底該不該讓 Google 索引?

原則上不該。像「顏色+尺寸+排序」這類可任意組合的參數會生出成千上萬個內容雷同的網址,吃光爬取預算又造成重複內容。標準做法是讓這些參數頁的 canonical 指向乾淨的主分類頁,並且不把它們放進 sitemap。少數情況下,若某個篩選組合本身有明確搜尋需求(例如「紅色洋裝」是熱門查詢),可以考慮把它做成一個獨立、可索引、有專屬內容的分類頁來經營。

商品缺貨了,頁面應該刪掉嗎?

如果之後會補貨,絕對不要刪。保留頁面並維持 200 狀態,用結構化資料標記 OutOfStock,同時提供到貨通知或推薦替代品,才能守住這頁累積的排名與外部連結。只有在商品永久下架時才處理:有替代品就 301 轉址到最相近的商品或分類,完全沒有替代品才回傳 410 或 404 並從 sitemap 移除。切忌把缺貨頁全部無差別導回首頁。

我的商品頁在 Search Console 顯示「已檢索,但目前尚未建立索引」,怎麼辦?

這代表 Google 抓到了頁面,卻判斷它不值得收錄,最常見原因是內容太薄或與其他頁面重複度太高。針對電商商品頁,可以補上獨特的商品描述、規格、真實評價與 Product 結構化資料,讓每頁有足夠差異化的價值;同時檢查 canonical 是否正確、內部連結有沒有把權重導過來。改善後用網址檢查工具重新送審,並給 Google 幾週時間重新評估。

Core Web Vitals 沒過會直接掉排名嗎?

不會像違規那樣被懲罰,但它是實打實的排名訊號之一,尤其在競爭激烈、其他條件相近時,速度與體驗好的頁面會有優勢。更關鍵的是它直接影響使用者:LCP 太慢、CLS 亂跳會拉高跳出率、壓低轉換,這對電商生意的傷害比排名更立即。建議優先處理商品大圖(改用 WebP/AVIF、給對尺寸、延遲載入)與過多的第三方腳本,通常能同時改善 LCP 與 INP。

訂閱電商情報每週一封,台灣電商數據與經營洞察。
相關文章