Canonical URL là gì? 7 Sai lầm khi sử dụng thẻ Canonical Tag

Related Articles

Canonical URL là gì không còn là khái niệm mới mẻ với SEOer. Năm 2009, Google, Microsoft và Yahoo đã hợp nhất để cùng tạo ra thẻ này. Với mong muốn hỗ trợ chủ website giải pháp hiệu quả để khắc phục các vấn đề Duplicate Content một cách nhanh chóng và dễ dàng hơn. 

  • Nhưng đâu đó bạn vẫn không hiểu thật sự Canonical là gì?
  • Cách sử dụng thẻ canonical ra sao? 
  • Chúng có thực sự giúp ích cho hoạt động của website hay không?

Tất cả sẽ được giải đáp trong bài viết này. Hãy cùng tôi khám phá nhé !

Canonical URL là gì?

Canonical URL ( hay còn gọi là Rel Canonical ) là thành phần HTML nhằm mục đích khai báo URL gốc của trang bị trùng lặp nội dung với công cụ tìm kiếm. Sử dụng thẻ Canonical trong trường hợp nội dung bị Duplicate hoặc giống nhau trên nhiều URL .

thẻ canonical là gìCanonical URL là gì?

Nếu có nội dung giống hoặc tương tự trong các URL khác nhau. Bạn có thể dùng nó để chỉ định loại nào là phiên bản chính và sau đó index nó.

Cấu trúc chuẩn của Canonical Tag

Canonical có cấu trúc thế nào? Đó là cú pháp đơn giản, nhất quán và đặc biệt thường được đặt trong phần của website, chẳng hạn như:

canonical là gì,thẻ canonical là gì,sử dụng thẻ canonicalCấu trúc của Canonical Tag là gì?Ý nghĩa của từng phần trong đoạn mã Canonical URL được hiểu như sau :

  • link rel=“canonical”:  Liên kết trong thẻ này là bản gốc của trang này.
  • href=“https://example.com/sample-page/”: truy cập bản gốc tại đây.

Tầm quan trọng của thẻ Canonical trong SEO

Như tôi đã đề cập bắt đầu, thẻ Canonical được sinh ra để xử lý yếu tố Duplicate Content. Chính thế cho nên, tôi sẽ nghiên cứu và phân tích về sự tác động ảnh hưởng của trùng lặp nội dung ( Duplicate Content ) đến SEO, từ đó bạn sẽ hiểu rõ hơn về tầm quan trọng cũng như nguyên do thẻ Canonical tag được tạo ra. Tìm hiểu ngay nào !

Bạn phải biết : Duplicate Content là điều Google cực kỳ “ ghét ”, do nó sẽ làm Google không xác lập được :

  • Bản nào của trang cần index.
  • Loại nào của trang dùng để xếp hạng cho các truy vấn có liên quan.
  • Liệu họ có nên hợp nhất “link equity” trên một trang hay chia nó thành nhiều loại.

Trùng lặp nội dung cũng làm ảnh hưởng tác động đến “ ngân sách thu thập dữ liệu ”. Nghĩa là, Google sẽ mất thời hạn tích lũy thông tin nhiều bản cùng một page thay vì tò mò nội dung quan trọng khác trên website. Tuy nhiên, nếu như bạn có sử dụng Canonical tag, thì nó sẽ giúp xử lý toàn bộ những yếu tố kể trên bằng cách : Thông báo đến Google biết họ nên index và xếp hạng phiên bản nào của page, cũng như vị trí cần hợp nhất “ link equity ” .

Còn trong trường hợp bạn không có bất kể hành vi thông tin nào đến Google về link gốc. Thì Google sẽ thay bạn xem xét và quyết định hành động loại hoặc chọn link tốt nhất. Tất nhiên, dựa vào Google như vậy không phải là một ý tưởng sáng tạo hay. Vì họ hoàn toàn có thể chọn ngẫu nhiên 1 URL mà bạn không thật sự muốn nó sẽ trở thành link gốc .

canonical tag, canonical là gì,thẻ canonical là gì,sử dụng thẻ canonicalNếu không xác định được Canonical URL thì Google sẽ thay bạn xem xét và quyết định loại hoặc URL tốt nhất.

Lưu ý nhỏ về ngân sách thu thập dữ liệu:

Bạn phải luôn ghi nhớ : Tiết kiệm tối đa thời hạn Google tích lũy thông tin trên website so với những nội dung Duplicate Content. Nhưng nếu bạn đang sỡ hữu một website mới, thì bạn hoàn toàn có thể lướt qua nội dung này .

Sự thật về Duplicate Content

Có phải nhiều lúc bạn đã nghĩ rằng : chỉ cần đăng lại nội dung trên trang khác nhau thì sẽ không dính lỗi Duplicate Content. Tuy nhiên, thực tiễn idea này không hề tiến hành. Vì những công cụ thu thập URL, không phải tài liệu trên page .

Nghĩa là, chúng sẽ đánh giá và nhận định URL example.com/product và URL example.com/product?color=red ở 2 page khác nhau. Mặc dù chúng là cùng một website có nội dung giống hệt hoặc tựa như nhau .

Đây được gọi là các parameterized URLs và chúng là nguyên nhân phổ biến dẫn đến Duplicate Content. Đặc biệt là trên web thương mại điện tử có filtered navigation (bộ lọc tùy chỉnh tìm kiếm của người dùng dựa trên những gì họ đang tìm kiếm)

Ví dụ : Hãng Brown Bag Clothing chuyên bán áo sơ mi .

  • Đây là link cho trang danh mục chính của họ:

    https://www.bbclothing.co.uk/en-gb/clothing/shirts.html
  • Nếu bạn chỉ lọc áo sơ mi XL, một thông số sẽ được thêm vào URL như sau:

    https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL
  • Nếu sau đó bạn cũng chỉ lọc những chiếc áo sơ mi màu xanh lam thì một thông số khác sẽ thêm vào:

    https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL&color=Blue.

Trong mắt Google, cả 3 link trên đều là những trang riêng không liên quan gì đến nhau dù nội dung của chúng chỉ khác nhau một chút ít. Nhưng không chỉ những website thương mại điện tử trở thành nạn nhân của Duplicate Content. Dưới đây là một số ít nguyên do khác của nội dung trùng lặpáp dụng cho tổng thể những loại website :

  1. Có parameterized URLs cho các tìm kiếm chọn lọc

    (VD: example.com?q=search-term)
  2. Có parameterized URLs cho các IDs phiên

    (VD: https://example.com?sessionid=3)
  3. Các loại trang có thể in riêng biệt

    (VD: example.com/page and example.com/print/page)
  4. URL riêng biệt cho mỗi bài đăng trong các danh mục khác nhau 

    (VD: example.com/services/SEO/ and example.com/specials/SEO/)
  5. Gồm pages cho các loại thiết bị khác nhau 

    (VD: example.com and m.example.com)
  6. Đồng thời cả AMP và non-AMP trong cùng 1 trang 

    (VD: example.com/page and amp.example/page)
  7. Cùng một nội dung ở các biến thể non-www và www variants 

    (VD: http://example.com and http://www.example.com)
  8. Và cung cấp cùng một nội dung ở các biến thể non-https và https variants 

    (VD: http://www.example.com and https://www.example.com)
  9. Cùng một nội dung có và không có dấu gạch chéo 

    (VD: https://example.com/page/ and http://www.example.com/page)
  10. Có cùng một nội dung ở các bản mặc định, chẳng hạn như trang index

    (VD: https://www.example.com/, https://www.example.com/index.htm,..)
  11. Cùng một nội dung có và không có chữ viết hoa

    (VD: https://example.com/page/ and http://www.example.com/Page/)

Trong những tình huống này, việc dùng đúng Canonical URL là rất quan trọng. Hơn nữa, trùng lặp nội dung giữa nhiều miền cũng là điều cần lưu ý.

Đây là trường hợp khi nội dung được san sẻ trên 2 web khác nhau với mỗi website là một phần nội dung gốc. Nếu bạn là tác giả của bài viết gốc thì nên setup nó trên bài nhằm mục đích thông tin đến những công cụ để tìm kiếm rõ ràng .

Tất nhiên, bài viết bên thứ 3 đăng lại từ bài viết của bạn vẫn có năng lực hiển thị trong list tìm kiếm. Tuy nhiên, việc gắn Canonical tag giúp giảm rủi ro tiềm ẩn chúng được xếp hạng cao hơn nội dung gốc .

Lưu ý : Vẫn có thực trạng 1 số ít web sẽ phủ nhận thêm Canonical Tag. Trong những trường hợp này, bạn có muốn gật đầu rủi ro đáng tiếc hay không là tùy thuộc vào bạn .

Hướng dẫn nhanh cách sử dụng thẻ Canonical

Nhiều người thắc mắc là Canonical URL có dễ thực hiện không? Trước khi thảo luận về bốn cách khác nhau để triển khai URL Canonical. Tôi muốn giới thiệu 5 quy tắc vàng sau:

5 Quy tắc khi sử dụng Canonical Tag

Quy tắc 1: Sử dụng URL tuyệt đối

John Mueller của Google nói rằng cách tốt nhất là không dùng đường dẫn tương đối với phần tử rel=“canonical”. Nghĩa là, bạn nên dùng cấu trúc sau:

Thay vì cấu trúc :

Quy tắc 2: Sử dụng chữ viết thường trong URL

Google thường coi các URL viết hoa và viết thường là hai link khác nhau. Tuy nhiên, bạn nên dùng chữ viết thường trong URL trên máy chủ của mình, sau đó dùng link viết thường cho Canonical Tag.

Quy tắc 3: Sử dụng đúng phiên bản miền HTTPS hay HTTP

Nếu bạn đã chuyển sang SSL, hãy bảo vệ rằng bạn không khai báo bất kỳ URL không phải SSL ( tức là HTTP ) nào trong việc sử dụng thẻ Canonical Tag. Làm như vậy về mặt kim chỉ nan dẫn đến nhầm lẫn và hiệu quả không mong ước .

Đối với secure domain, hãy bảo vệ rằng bạn dùng phiên bản URL sau :

.

Còn nếu bạn không dùng HTTPS thì hãy dùng dạng URL này :

Quy tắc 4: Sử dụng Canonical Tag tự tham chiếu

John Mueller cho rằng mặc dầu không bắt buộc nhưng Canonical tự tham chiếu vẫn là sự lựa chọn đáng xem xét. Vì nó giúp Google hiểu rõ bạn muốn index trang nào hoặc link sẽ có cấu trúc như thế nào khi được index .

Về cơ bản, tự tham chiếu là Canonical trên một trang mà trỏ link đến chính nó .

Ví dụ, nếu URL là https://example.com/sample-page, thì Canonical tự tham chiếu trên trang đó sẽ là :

Hầu hết những CMS phổ cập tân tiến đều tự động hóa thêm những URL tự tham chiếu. Còn với CMS tùy chỉnh, bạn nhờ đến những nhà tăng trưởng web hardcode nó .

Quy tắc 5: Sử dụng 1 Canonical Tag cho mỗi trang

Nếu 1 trang có nhiều hơn 1 Canonical Tag, Google sẽ bỏ lỡ cả thảy. Vì thế, mỗi trang chỉ nên sử dụng 1 thẻ thôi bạn nhé !

Cách triển khai: Có năm cách để chỉ định link gốc với các tín hiệu chuẩn hóa sau: 

  1. HTML tag
  2. HTTP header
  3. Sitemap
  4. 301 redirect
  5. Liên kết nội bộ (Internal links)

Cài đặt thẻ Canonical bằng cách sử dụng HTML rel = “canonical” 

Dùng thẻ rel = canonical là cách đơn giản và rõ ràng nhất để chỉ định link gốc. Cách thực hiện vô cùng đơn giản: chỉ cần thêm mã sau vào phần của bất kỳ trang trùng lặp nào:

Ví dụ : Giả sử bạn có một web thương mại điện tử bán áo phông thun. Bạn muốn chỉ định https://yourstore.com/tshirts/black-tshirts/ là URL gốc. Ngay cả khi nội dung của trang đó có truy vấn được qua những URL khác, ví dụ điển hình như : https://yourstore.com/offers/black-tshirts/. Khi ấy, chỉ cần thêm thẻ tag sau vào bất kể trang trùng lặp nào :

Lưu ý rằng nếu bạn đang dùng CMS, bạn không cần phải lo ngại về mã code của trang .

Cài đặt Canonical Tag trong WordPress

Trước hết, thiết lập Yoast SEO để Canonical tự tham chiếu sẽ được thêm tự động hóa vào trang. Để thêm những mục tùy chỉnh cho thẻ, nhấp chọn phần “ Nâng cao ” trên mỗi bài đăng hoặc trang .

canonical url, canonical là gì,thẻ canonical là gì,sử dụng thẻ canonicalCài đặt Canonical trên Yoast SEO

Cài đặt Canonical Tag trên Shopify

Shopify thêm URL gốc tự tham chiếu cho những loại sản phẩm và bài đăng trên blog theo mặc định. Để thêm mục tùy chỉnh cho URL gốc, bạn cần phải chỉnh sửa trực tiếp những tệp mẫu (. liquid ) .

Cài đặt Canonical Tag trên Squarespace

Squarespace cũng thêm những URL tự tham chiếu theo mặc định và tương tự như như trường hợp của Shopify. Bạn cần phải chỉnh sửa mã trực tiếp nếu muốn thêm tùy chỉnh vào URL gốc .

Cài đặt thẻ Canonical trên các dòng tiêu đề HTTP

Đối với các tài liệu như PDF, không có cách nào để sử dụng thẻ Canonical trong tiêu đề vì không có phần trang .

Trong những trường hợp như vậy, bạn hãy dùng dòng tiêu đề HTTP để đặt cho thẻ. Bạn cũng hoàn toàn có thể dùng nó trong tiêu đề HTTP cho những web chuẩn .

Ví dụ : Giả sử tạo một bản PDF của bài blog nhất định và tàng trữ nó trong thư mục con ( gtvseo.com/blog/* ). Khi ấy, file PDF sẽ có cấu trúc dòng tiêu đề HTTP như sau :

HTTP/1.1 200 OK. Content-Type: application/pdf. Link: ; rel="canonical"

Cài đặt thẻ Canonical trong Sitemaps

Google cho rằng những trang không có Canonical Tag chuẩn không nên được đưa vào sitemaps. Chỉ những URL chuẩn mới được liệt kê vào .

Đó là vì Google chỉ xem những trang được liệt kê trong sitemap là những URL gốc được đề xuất kiến nghị. Tuy nhiên, cũng có vài trường hợp, họ phủ nhận chọn URL trong sitemap làm URL gốc .

Tìm hiểu thêm: 13 Mẹo tối ưu Sitemap cho Website

Cài đặt thẻ Canonical với 301 Redirects

Hãy 301 redirects khi bạn muốn chuyển hướng lưu lượng truy vấn ra khỏi URL trùng lặp và tới URL gốc. Ví dụ : Giả sử web của bạn hoàn toàn có thể truy vấn được tại những URL sau :

  • example.com
  • example.com/index.php
  • example.com/home/

Chọn một URL làm gốc và chuyển hướng những URL khác đến URL gốc đó .

Thực hiện tương tự như với những phiên bản HTTPS / HTTP và www / không phải www trên website của mình. Chọn một bản chuẩn và chuyển hướng những bản khác đến phiên bản đó. Ví dụ : Phiên bản chuẩn của gtvseo.com là URL HTTPS không có www ( https://blogchiase247.net ). Tất cả những URL sau đều chuyển hướng đến đó :

  • http://gtvseo.com/
  • http://www.gtvseo.com/
  • https://www.gtvseo.com/

Cài đặt thẻ Canonical với các liên kết nội bộ

Cách bạn trỏ link từ trang này sang trang khác trên toàn web của mình cũng được xem là một cách Canonical URL. John Mueller đã đề cập đến những tín hiệu được dùng để xác lập URL gốc trong video # AskGoogleWebmasters video .

Tóm lại, bạn càng đồng điệu với toàn bộ 5 tín hiệu kể trên, thì những công cụ của Google càng thuận tiện xác lập URL gốc mong ước được đưa vào. Như John đã đề cập trong video, Google cũng ưu tiên HTTPS hơn URL HTTP và những URL đẹp hơn .

7 Sai lầm thường gặp khi sử dụng thẻ rel=“canonical”

Canonicalization vốn là một chủ đề hơi phức tạp, tiếp tục nằm trong TOP những lỗi kỹ thuật SEO thường gặp nhất trong những năm qua .

Thực tế, có rất nhiều hiểu lầm và quan niệm sai lệch về việc sử dụng Canonical URL đúng cách. Dưới đây là một số sai lầm phổ biến mọi người thường mắc phải khi sử dụng thẻ canonical:

Sai lầm 1: Chặn URL được chuẩn hóa qua Robots.txt 

Việc chặn một URL trong robots.txt sẽ ngăn không cho Google thu thập dữ liệu. Có nghĩa là họ không hề thấy bất kể Canonical Tag nào trên đó. Kết quả là Google cũng không tài nào chuyển hóa “ link equity ” từ Non-Canonical sang Canonical .

Sai lầm 2: Đặt URL được chuẩn hóa thành ‘noindex’

Bạn nhớ nhé, tốt nhất là không nên phối hợp noindex với thẻ canonical lại với nhau. Bởi vì chúng là 2 yếu tố trọn vẹn trái chiều nhau .

Google thường sẽ ưu tiên Canonical hơn thẻ là thẻ “noindex”. Trong trường hợp bạn muốn thực hiện đồng thời noindex và gắn thẻ Tag, hãy dùng 301 redirects. Còn không thì chỉ dùng rel = canonical thôi. 

Sai lầm 3: Đặt mã trạng thái HTTP 4XX cho URL gốc

Việc đặt mã HTTP 4XX cho URL gốc có tác động tương tự như việc dùng thẻ “noindex”. Google sẽ không thể nhìn thấy Canonical Tag để mà chuyển “link quity” sang bản gốc.

Sai lầm 4: Canonicalizing tất cả các Paginated Page đến Page gốc

Các paginated page không nên được tiến hành Canonical URL đến những paginated page tiên phong trong chuỗi. Thay vào đó, tất cả chúng ta sẽ dùng thẻ Tag tự tham chiếu trên những trang này .

John Mueller đã đưa ra lời lý giải cho nghi vấn này như sau : Nếu page A không tựa như như page B. Thì việc page B đang dùng rel = canonical muốn trỏ đến page A sẽ không được chấp thuận đồng ý dùng rel = canonical không đúng cách .

Bạn cũng nên dùng thẻ rel="prev"rel="next" để phân trang. Mặc dù cấu trúc này không còn thịnh hành với Google như một số web khác, chẳng hạn như Bing vẫn còn dùng nó.

Hreflang tags được dùng để chỉ định target đối tượng người dùng dựa vào ngôn từ và vị trí địa lý của website .

Google khuyên rằng khi dùng hreflang : Bạn nên “ chỉ định trang gốc có cùng một ngôn từ với website hoặc ngôn từ sửa chữa thay thế tốt nhất nếu không hề tìm ra ngôn từ chung cho cả 2 ” .

Sai lầm 6: Có quá nhiều thẻ rel=canonical 

Có nhiều thẻ rel = canonical sẽ khiến Google thuận tiện bỏ lỡ cả thảy .

Việc này xảy ra do những thẻ được thêm vào mạng lưới hệ thống ở những điểm khác nhau : Chẳng hạn như bởi CMS, theme và ( những ) plugin. Đây là nguyên do tại sao nhiều plugin có tùy chọn ghi đè bảo vệ chúng là nguồn duy nhất cho những Canonical URL.

Cũng có nhiều trường hợp thẻ rel = canonical được thêm vào bởi JavaScript. Google chấp thuận đồng ý trường hợp này chỉ khi URL gốc không Open trên HTML và sau đó bạn thêm thẻ rel = canonical với JavaScript .

trái lại, nếu HTML đã có thẻ rồi mà bạn lại liên tục hoán đổi page khác ưa thích bằng JavaScript. Thì có lẽ rằng bạn đang gây khó dễ Google bởi hàng loạt tín hiệu hỗn hợp đấy. Hãy cẩn trọng nhé !

Sai lầm 7: Đặt rel=canonical trong phần Body

Rel = canonical chỉ nên xuất hiện trong của tài liệu. Thẻ chuẩn trong phần của web rất dễ bị bỏ qua.

Mặc dù mã nguồn của một trang có thể có thẻ rel = canonical ở đúng vị trí, nhưng khi nó thực sự được tạo trong trình duyệt hoặc được hiển thị bởi Google thì sẽ có nhiều vấn đề xảy ra như: thẻ không được đóng, JavaScript bị chèn hoặc

More on this topic

Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Advertismentspot_img

Popular stories