Canonical URL là gì
Techical | SEO cơ bản

Canonical URL là gì? Tạo canonical link với phương pháp hay nhất

Bài viết này giúp bạn biết được canonical URL là gì và khi nào nên và không nên sử dụng thẻ rel=”canonical”. Đặc biệt là những phương pháp thông minh khi sử dụng chúng trong việc tối ưu SEO tăng lưu lượng truy cập đáng kể cho website.

Nó là một công cụ mạnh mẽ để chống lại các vấn đề nội dung trùng lặp khi có nhiều biến thể của cùng một trang. Về bản chất, nó cho phép bạn chỉ định biến thể trang nào là trang chuẩn: biến thể mà bạn muốn hiển thị trong các công cụ tìm kiếm.

Hãy ghi nhớ các phương pháp hay nhất sau đây khi triển khai canonical URL:

  • Sử dụng URL tuyệt đối, bao gồm miền và giao thức.
  • Chỉ xác định một canonical link trên mỗi trang.
  • Xác định canonical URL trong <head>-section hoặc tiêu đề HTTP của trang .
  • Trỏ đến một trang có thể index.

Canonical URL là gì?

Phần tử link rel=”canonical”, thường được gọi là canonical URL. Nó là một phần tử HTML giúp ngăn nội dung trùng lặp bằng cách thông báo cho các công cụ tìm kiếm thích một tài liệu hơn các tài liệu giống hệt hoặc tương tự khác. Khi trang A có phần tử canonical link tham chiếu đến trang B, bạn nói rằng trang A đã được canonical .

Canonical là quá trình trong đó một phiên bản ưa thích của một trang được chọn hơn nhiều phiên bản khác.

Từ đồng nghĩa với canonical URL

Mặc dù ý nghĩa của chúng không giống nhau nhưng các thuật ngữ sau đây thường được sử dụng để chỉ canonical URL:

  • Thẻ canonical,
  • link canonical,
  • rel canonical hoặc rel=”canonical”.

Để dễ hiểu, khi chúng tôi đề cập đến phần tử HTML chuẩn, chúng tôi sẽ gọi nó là link canonical.

Tại sao bạn cần một canonical URL?

Với canonical URL, bạn có thể ngăn nội dung trùng lặp, cả bên trong và bên ngoài. Nội dung trùng lặp nội bộ xảy ra trong trang web của bạn . Nội dung trùng lặp bên ngoài xảy ra khi các trang trùng lặp hoặc rất giống nhau trên các miền khác nhau tồn tại.

URL canonical ngăn chặn các vấn đề về nội dung trùng lặp
URL canonical ngăn chặn các vấn đề về nội dung trùng lặp

Canonical URL thông báo với Google, Bing và Yahoo những trang nào sẽ hiển thị và những trang nào cần ẩn trong SEPR. Tuy các công cụ tìm kiếm có thể chọn bỏ qua canonical link nhưng nó cho phép chủ sở hữu trang web nhiều quyền kiểm soát hơn đối với sự hiện diện trực tuyến.

Canonical URL trông như thế nào?

Khách truy cập của bạn sẽ không thấy canonical URL khi truy cập trang web của bạn. canonical URL có thể được xác định trong nguồn trang hoặc trong tiêu đề HTTP.

Nguồn trang

URL chính tắc phải được đặt trong <head>-phần của nguồn trang. Đối với trang chủ của chúng tôi, canonical URL trông như sau:

<head>

<link rel=”canonical” href=”https://www.Hmgsearch.com/” />

</head>

Tiêu đề HTTP

Việc xác định canonical URL trong tiêu đề HTTP thường được sử dụng khi bạn cần đặt canonical URL trên tài liệu không phải HTML, chẳng hạn như PDF.

Trong tiêu đề HTTP, nó trông như sau:

HTTP/1.1 200 OK

Server: nginx

Date: friday, 15 Jan 2021 11:54:25 GMT+7

Content-Type: application/pdf

Content-Length: 1569

Last-Modified: Fri, 22 Jan 2021 17:47:17 GMT+7

Link: <http://www.example.com/downloads/cach-dung-office-2016.pdf>; rel=”canonical”

Trường hợp có thể xảy ra mà bạn cần sử dụng tiêu đề HTTP để xác định canonical link cho tài liệu không phải HTML. Khi đó, nội dung được cung cấp cả dưới dạng trang thông thường:

  • Tài liệu HTML
  • PDF (tài liệu không phải HTML).

Xin lưu ý: hiện chỉ có Google hỗ trợ xác định canonical URL bằng tiêu đề HTTP. Đối với hình ảnh, Google không hỗ trợ trang chuẩn được xác định thông qua tiêu đề HTTP.

Khi nào sử dụng canonical URL?

Không có tình huống nào có thể hình dung được, trong đó việc bao gồm một canonical URL là một ý tưởng tồi. Google, Bing và Yahoo chủ yếu dựa vào link canonical để hiểu những trang nào sẽ hiển thị và ẩn trong các trang kết quả của công cụ tìm kiếm. canonical URL có thể tham chiếu chính nó hoặc tham chiếu đến một trang khác.

URL canonical tự tham chiếu

Nếu chỉ có một phiên bản của trang, hãy đảm bảo rằng link canonical là tự tham chiếu.

Về cơ bản, điều này nói với các công cụ tìm kiếm: “Tôi là phiên bản duy nhất của trang này và chỉ tôi mới được index.”.

URL canonical tham chiếu đến một trang khác

Nếu có nhiều phiên bản của một trang, hãy đảm bảo rằng canonical URL đang tham chiếu đến trang bạn muốn được index bởi các công cụ tìm kiếm.

Các trường hợp phổ biến trong đó canonical URL khắc phục sự cố nội dung trùng lặp là:

  • Khi các tham số truy vấn được sử dụng trong URL.
  • Khi các trang hơi khác nhau, thường được gọi là gần trùng lặp.
  • Khi cố ý tạo nhiều phiên bản của một trang.

Tham số truy vấn trong URL

Tùy thuộc vào cấu trúc URL của một trang web, các URL đôi khi chứa các tham số truy vấn. Tham số truy vấn trong URL được sử dụng để yêu cầu nội dung nhất định từ.

Lấy ví dụ:

www.example.com/giay/adidas?lang=vn&id=208

  • Biến lang=vn chỉ ra rằng ngôn ngữ cho trang được yêu cầu là tiếng Việt (Vietnamese).
  • Biến id=208 chỉ ra rằng số trang 208 nên được yêu cầu.
  • Ở giữa các biến có một & ký tự cho biết rằng bạn muốn bạn muốn phiên bảntiếng Việt (Vietnamese) của trang 208.

Mặc dù các tham số truy vấn rất tiện dụng, nhưng các URL chứa tham số truy vấn rất khó đọc và dễ tạo nội dung trùng lặp. URL www.example.com/giay/adidas?id=208&lang=vn yêu cầu trang giống hệt như www.example.com/giay/adidas?lang=vn&id=208, nhưng các trang có URL khác. Có thể dễ dàng sửa dạng nội dung trùng lặp này bằng một canonical URL.

Các trang hơi khác nhau (gần trùng lặp)

Khi các trang chỉ khác nhau một chút, chúng tôi thường gọi chúng là ‘các trang gần trùng lặp’ hoặc ‘gần trùng lặp’. Một ví dụ điển hình về các trang trùng lặp gần như là các trang web thương mại điện tử bán giày. Hãy tưởng tượng bạn có một đôi giày Nike Air Max cỡ 38 với các màu đỏ, xanh và đen. Khi chọn một màu khác, URL sẽ thay đổi, nhưng 99% nội dung trang vẫn giữ nguyên.

  • Tổng thể Nike Air Max size 38: www.example.com/giay/adidas/nam-41/
  • Tổng quát Nike Air Max size 38 màu đỏ: www.example.com/giay/adidas/nam-41-mau-do/
  • Tổng quát Nike Air Max size 38 màu xanh lam: www.example.com/giay/adidas/nam-41-mau-xanh/
  • Tổng quát Nike Air Max size 38 màu đen: www.example.com/giay/adidas/nam-41-mau-den/

Kể từ khi nội dung trên bốn trang là rất giống nhau thì có thể thực hiện một canonical URL từ

  • www.example.com/giay/adidas/nam-41-mau-do/
  • www.example.com/giay/adidas/nam-41-mau-xanh/
  • www.example.com/giay/adidas/nam-41-mau-den/

trỏ đến www.example.com/giay/adidas/nam-41/

Cố ý tạo nhiều phiên bản của một trang

Có thể có nhiều lý do cho việc cố tình tạo nhiều phiên bản của một trang. Để đưa ra hai ví dụ:

  1. Trang đích được cá nhân hóa cho các chiến dịch
  2. Chạy các bài kiểm tra tối ưu hóa tỷ lệ chuyển đổi trong đó bạn kiểm tra ba phiên bản của cùng một trang, về cơ bản có cùng nội dung.

Khi có nhiều phiên bản của một trang, hãy đảm bảo trỏ canonical link đến phiên bản ưa thích mà bạn muốn index. Khi một canonical URL tham chiếu đến một URL khác, điều này sẽ cho các công cụ tìm kiếm biết:

“Có nhiều phiên bản trang của tôi giống hệt nhau hoặc rất giống nhau. Để đảm bảo chỉ mục của bạn đẹp và rõ ràng, hãy đảm bảo index trang mà tôi đang tham khảo ”

Tách trang máy tính để bàn và trang di động

Nếu bạn có các trang dành cho máy tính để bàn và thiết bị di động riêng biệt. Bạn nên sử dụng canonical URL và URL thay thế để truyền đạt mối quan hệ giữa các trang này với công cụ tìm kiếm.

Hiện tại, Google là công cụ tìm kiếm duy nhất hỗ trợ triển khai cụ thể này.

Hãy nói về việc triển khai:

Sử dụng thuộc tính di động
Sử dụng thuộc tính di động để ưu tiên phiên bản di động của trang.

Máy tính để bàn

Trên phiên bản dành cho máy tính để bàn của trang, canonical URL và URL thay thế trong <head>-section trông như sau:

<head>

<link rel=”canonical” href=”https://www.example.com/” />

<link rel=”alternate” href=”https://m.example.com/” />

</head>

Di động

Trên phiên bản dành cho thiết bị di động của trang, link canonical trong <head>-section trông như sau:

<head>

<link rel=”canonical” href=”https://www.example.com/” />

</head>

Bằng cách này, các công cụ tìm kiếm hiển thị phiên bản:

  • Mobile của trang dành cho thiết bị di động
  • Máy tính để bàn của trang dành cho thiết bị PC..

Trang chuẩn trên nhiều miền

Canonical URL có thể được sử dụng để ngăn nội dung trùng lặp trong trường hợp vấn đề nội dung trùng lặp vượt ra ngoài một website. Khi nội dung được xuất bản trên một số trang, trên một số miền thì canonical link của nhiều miền có thể được sử dụng để báo hiệu cho các công cụ tìm kiếm phiên bản nào của trang nên được index.

Hợp nhất các trang không cần thiết với redirect

Khi không cần thiết để nhiều phiên bản của một trang tồn tại, tốt nhất bạn nên chuyển hướng các trang thừa sang phiên bản ưu tiên. Ví dụ trong đó redirect là cách tốt hơn nhiều để xử lý nhiều phiên bản trang:

  • Một trang có sẵn thông qua các giao thức HTTP và HTTPS.
  • Một trang có sẵn thông qua nhiều tên miền ( www.example1.com, www.example2.com, www.example3.com). Hoặc tên miền phụ ( www.example.com, www2.example.com, www3.example.com) và điều này không phục vụ một mục đích.

Xin lưu ý rằng, nếu bạn đang sử dụng trang đổi hướng trong các ví dụ ở trên thì bạn nên vẫn còn sử dụng URL chuẩn hoá. Nếu chuyển hướng của bạn ngừng hoạt động, bạn vẫn có canonical URL của mình để ngăn chặn các vấn đề index .

Các phương pháp hay nhất về canonical URL là gì?

Canonical URL là một công cụ rất mạnh trong hộp công cụ của quản trị viên web. Điều quan trọng là phải tuân theo các phương pháp hay nhất bên dưới khi làm việc với các canonical link để ngăn chặn các vấn đề index:

  • Sử dụng URL tuyệt đối – không có nghi ngờ gì về trang mà công cụ tìm kiếm nên index. Sử dụng URL đầy đủ, bao gồm giao thức (HTTP hoặc HTTPS), miền phụ và miền.
  • Một URL chính tắc trên mỗi trang – chỉ nên có một URL chính tắc trên mỗi trang.
  • Vị trí trong <head>-section hoặc tiêu đề HTTP – link canonical phải luôn được đặt trong <head>-section hoặc trong tiêu đề HTTP
  • Trỏ đến trang có thể index – link rel canonical phải trỏ đến trang có thể index.
  • Chỉ đưa phiên bản ưa thích của một trang vào sitemap XML .

Sử dụng URL tuyệt đối

Chúng tôi chỉ nên sử dụng URL tuyệt đối làm canonical URL. Lấy ví dụ:

<link rel=”canonical” href=”https://www.example.com/dich-vu/sua-chua/”>

Với URL này là canonical URL, không có nghi ngờ gì về vị trí chính xác của URL.

Bây giờ, hãy so sánh canonical URL ở trên với URL không rõ ràng bên dưới:

<link rel=”canonical” href=”sua-chua/”>

Một số máy chủ web được định cấu hình không chính xác, làm cho mỗi trang trên trang web của bạn có thể truy cập được thông qua tất cả các miền và miền phụ. Điều này gây ra một lượng lớn nội dung trùng lặp mà bạn nên tránh mọi lúc.

Việc có các URL tuyệt đối làm link rel canonical ngăn chặn các vấn đề nội dung trùng lặp này xảy ra.

Một canonical URL trên mỗi trang

Chỉ nên có một canonical URL trên mỗi trang. Nếu nhiều hơn một canonical link được xác định, các công cụ tìm kiếm có thể bị nhầm lẫn. Google đã tuyên bố rằng họ sẽ chỉ chọn một trong các URL chính tắc và bỏ qua những URL khác khi họ gặp nhiều canonical URL trên một trang. Mặc dù chúng tôi không chắc Bing và cốc cốc xử lý nhiều canonical URL trên mỗi trang như thế nào nhưng tốt nhất nên sử dụng một canonical URL trên mỗi trang.

Vị trí trong <head>-section

canonical URL phải luôn được đặt trong <head>-section của trang của bạn. Nếu canonical link không được đặt trong <head>-section, các công cụ tìm kiếm sẽ không thể tìm thấy nó và xử lý nó. Đổi lại, điều này có thể dẫn đến các vấn đề nội dung trùng lặp hàng đầu.

Tham khảo một trang có thể index

canonical URL phải luôn tham chiếu đến một trang có thể index. Các công cụ tìm kiếm có thể bị nhầm lẫn khi link rel canonical tham chiếu đến một trang được redirect 301 hoặc chính nó được canonical.

Chỉ bao gồm phiên bản ưu tiên trong sitemap XML

Tất cả các trang có trong sitemap XML của bạn phải được index bởi các công cụ tìm kiếm. Do đó, điều quan trọng là trong trường hợp bạn có nhiều phiên bản của một trang thì chỉ đưa phiên bản ưa thích của một trang vào sitemap XML của mình.

Những hạn chế của canonical URL là gì?

Mặc dù link rel canonical là một công cụ tuyệt vời trong hộp công cụ của quản trị viên web, nhưng nó cũng có những hạn chế.

Hãy xem xét một ví dụ: trang A có một số backlink thực sự mạnh mẽ. Trang A tham chiếu trang B là trang chuẩn của nó. Các công cụ tìm kiếm rất có thể sẽ index trang B và bỏ trang A ra khỏi chỉ mục của chúng.

Mỗi liên kết chuyển cho một số thẩm quyền được gọi là link authority. Link authority được chuyển đến trang A thông qua các backlink mạnh mẽ chuyển một phần đến trang B. Chúng tôi chỉ nói một phần vì đây là vùng màu xám mà các công cụ tìm kiếm không rõ ràng lắm. Không có nghiên cứu nào cho thấy rằng một canonical URL vượt qua tất cả các link authority.

Trên hết, canonical URL đã được giới thiệu để giao tiếp với các công cụ tìm kiếm những trang nào sẽ hiển thị và những trang nào cần ẩn. Do đó, lập trường của chúng tôi về chủ đề này là: một canonical link không hoàn toàn chuyển link authority.

Matt Cutts của Google đã nói rằng “thực sự không có nhiều sự khác biệt giữa chúng [redirect 301 và canonical URL]”.

Nếu bạn muốn chuyển càng nhiều link authority càng tốt, chúng tôi khuyên bạn nên sử dụng redirect 301.

Các URL canonical không ngăn được các vấn đề tối ưu hóa thu thập thông tin

URL canonical nhằm khắc phục các vấn đề về nội dung trùng lặp. Một canonical URL cho công cụ tìm kiếm biết những trang nào cần index, nhưng không cho công cụ tìm kiếm biết những trang nào cần thu thập thông tin. Đây là một sự khác biệt quan trọng để thực hiện.

Khi các công cụ tìm kiếm không dành thời gian thu thập thông tin các trang hữu ích và quan trọng thì có thể có các vấn đề về tối ưu hóa thu thập thông tin.

Có rất nhiều lý do tại sao các công cụ tìm kiếm không thu thập thông tin các trang hữu ích và quan trọng. Các công cụ tìm kiếm có thể bị mắc kẹt trong các vòng chuyển hướng vô hạn. Chúng dành nhiều thời gian để thu thập dữ liệu các trang mà:

  • Bạn không muốn index ngay từ đầu
  • Tiếp tục đi vào ngõ cụt trong trang web của bạn (các trang không có liên kết đến đến các trang khác).

Đó là một sự lãng phí, đặc biệt là vì các công cụ tìm kiếm có cái gọi là ‘crawl budget’ (thời gian được phân bổ để thu thập thông tin một trang web) cho mỗi trang web. file robots.txt có thể được sử dụng để ngăn chặn các vấn đề tối ưu hóa thu thập thông tin.

Câu hỏi thường gặp về canonical URL

Chúng tôi nghi ngờ rằng một số link authority được chuyển khi canonical URL.

Như đã viết trong phần “Hợp nhất link authority chỉ một phần”, chúng tôi không thể nói chắc chắn liệu một canonical URL có chuyển link authority hay không. Những gì chúng tôi biết là một canonical link không có nghĩa là chuyển link authority, đó là những gì redirect 301 dành cho.

Tôi có thể buộc các công cụ tìm kiếm sử dụng canonical URL của tôi không?

Không, link rel canonical là một lời khuyên hơn là một chỉ thị cho các công cụ tìm kiếm.

Canonical URL có tốt hơn redirect 301 không?

Canonical URL và redirect 301 là hai phương tiện hoàn toàn khác nhau để kết thúc.

Link rel canonical được sử dụng khi tất cả các phiên bản của trang mà khách đều có thể truy cập được nhưng chỉ một trong số chúng được index bởi các công cụ tìm kiếm.

Redirect 301 chuyển tiếp cả khách truy cập và công cụ tìm kiếm từ URL này sang URL khác. Một URL được chuyển hướng không thể truy cập được đối với khách truy cập hoặc công cụ tìm kiếm.

Tôi có thể làm rối trang web của mình với các canonical URL không?

Khi được sử dụng sai, các canonical URL có thể gây ra các vấn đề lớn cho việc index trang web của bạn.

Ví dụ: hãy tưởng tượng rằng vì lý do nào đó mà tất cả các trang của bạn đều có trang chuẩn cho trang chủ. Vì link rel canonical giống như một tín hiệu mạnh cho các công cụ tìm kiếm, rất có thể chúng sẽ xử lý nó và hủy index các trang được canonical.

Mặc dù bạn phải cẩn thận với các link rel canonical nhưng cũng nên sử dụng chúng để thông báo với các công cụ tìm kiếm những trang nào cần index và những trang nào cần ẩn.

Tất cả các công cụ tìm kiếm có hỗ trợ canonical URL không?

Chúng tôi biết rằng Google, Bing và Yahoo hỗ trợ canonical URL.

Yandex và Baidu dường như cũng hỗ trợ link rel canonical. Đối với Cốc Cốc, điều đó không rõ ràng.

Công cụ tìm kiếm xử lý nhiều canonical URL trên một trang như thế nào?

Google đã tuyên bố rằng họ sẽ bỏ qua hoàn toàn các phần tử link rel canonical nếu có nhiều canonical URL trên một trang.

Không rõ các công cụ tìm kiếm khác giải quyết vấn đề này như thế nào, mặc dù chúng tôi thực sự khuyên chỉ nên sử dụng một canonical URL trên mỗi trang.

Canonical URL có ngăn các trang được thu thập thông tin không?

Không nó không. Các công cụ tìm kiếm sẽ vẫn thu thập dữ liệu các trang của bạn, bất kể bạn đã đặt canonical URL trỏ đến một URL khác hay chưa. Link rel canonical chỉ là một tín hiệu mạnh mẽ cho các công cụ tìm kiếm về trang ưa thích sẽ hiển thị trong các trang kết quả của công cụ tìm kiếm. Cũng xem các URL canonical không ngăn chặn các vấn đề tối ưu hóa thu thập thông tin.

Tôi có nên sử dụng canonical URL cho các trang được phân trang không?

Nói chung, bạn không nên sử dụng canonical URL cho các trang được phân trang, vì các trang được phân trang thường không hiển thị cùng một nội dung. Thay vào đó, bạn nên sử dụng rel=”next”và rel=”prev”liên kết các phần tử. Đó là một cách tốt hơn để giải thích cho các công cụ tìm kiếm rằng các trang được phân trang trên thực tế là một chuỗi các trang tuân theo một trình tự hợp lý.

Bạn có thể sử dụng link rel canonical cho trang được phân trang, nhưng chỉ khi bạn có trang Xem tất cả tải nhanh. Trong trường hợp đó, bạn tham chiếu trang Xem tất cả trên tất cả các trang được phân trang dưới dạng canonical URL.

Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *