URL chuẩn là phiên bản ưa thích của trang web. Nó xuất hiện trong một đoạn mã nhỏ được tìm thấy trên một trang cho công cụ tìm kiếm biết cách thu thập dữ liệu trang và xếp hạng tầm quan trọng của nội dung.
Nếu bạn tìm thấy cùng một nội dung trên các URL khác nhau, việc sử dụng mã này— được gọi là thẻ rel=canonical—sẽ giúp trình thu thập thông tin tìm kiếm hiểu rõ hơn nội dung nào là thiết yếu, giải quyết các vấn đề trùng lặp nội dung, cải thiện thứ hạng của nội dung đó và cuối cùng là có thể dẫn nhiều khách hàng hơn đến trang web của bạn.
URL chuẩn là gì?
Phần tử liên kết chuẩn hoặc thẻ chuẩn được tìm thấy trong tiêu đề HTML của trang web và cho công cụ tìm kiếm biết liệu có phiên bản nào quan trọng hơn của trang đó hay không. Thẻ canonical xuất hiện dưới dạng rel=”canonical”.
Ví dụ: dòng mã HTML này cho công cụ tìm kiếm biết rằng URL “https://shoestore.org” là phiên bản gốc của trang mà thẻ này xuất hiện trên đó:
<link rel=”canonical” href=”https://shoestore.org” />
Thẻ rất quan trọng vì các công cụ tìm kiếm thường xuyên thu thập dữ liệu các trang web để tìm kiếm thông tin giúp chúng quyết định cách xếp hạng các trang và bài đăng. Nếu trình thu thập thông tin tìm kiếm tìm thấy hai trang có cùng nội dung, nó sẽ không biết cách xếp hạng chúng. Nó không thể quyết định trang nào sẽ được xếp hạng, vì vậy hai trang này sẽ lấn át tiềm năng xếp hạng của trang kia. Kết quả là không phần nội dung SEO nào có thể được xếp hạng.
URL chuẩn phải được thiết lập nếu bạn có hai trang có nội dung tương tự trên trang web của mình hoặc nếu bạn có nội dung trên trang web của mình cũng được sử dụng trên một trang web khác. Bạn có thể sử dụng thẻ chuẩn để trỏ Google đến nội dung gốc và đảm bảo phần đầu tiên nhận được tất cả các lợi ích về tín dụng và SEO.
Thẻ này được giới thiệu vào năm 2009 khi Google làm việc với Microsoft (Bing) và Yahoo để xây dựng sự đồng thuận chấp nhận các điều khoản chuẩn. Mặc dù bài viết này có thể sẽ tập trung vào việc sử dụng thẻ chuẩn để trợ giúp trình thu thập thông tin của Google nhưng hãy biết rằng hầu hết các công cụ tìm kiếm đều chấp nhận các thẻ này.
Tại sao Rel=Canonical tốt cho SEO?
Nói một cách đơn giản, nội dung trùng lặp sẽ gây nhầm lẫn cho các công cụ tìm kiếm. Khi các công cụ tìm kiếm xem xét nhiều trang có cùng nội dung và không có tín hiệu tối ưu hóa từ khóa rõ ràng, chúng:
- Tôi không biết nên ghi công phần nào
- Không biết lập chỉ mục gì
- Tôi không biết nên xếp hạng trang nào
Thẻ rel=canonical làm rõ điều này, giúp các công cụ tìm kiếm hiểu nội dung, ngăn chúng bỏ qua trang và cải thiện cơ hội xếp hạng nội dung.
[novashare_tweet tweet=”Sử dụng thẻ rel=canonical để làm rõ nội dung trùng lặp, giúp công cụ tìm kiếm hiểu nội dung và cải thiện cơ hội xếp hạng nội dung của bạn.” theme=”simple-alt” cta_text=”Nhấp để tweet” Hide_hashtags=”true”]
Đã từng có cuộc nói chuyện rằng nội dung trùng lặp có thể dẫn đến các hình phạt tìm kiếm, giảm thứ hạng của trang web hoặc xóa hoàn toàn khỏi SERP. Tuy nhiên, hiện nay nhiều người làm SEO tin rằng không có hình phạt thực sự nào cả .
Google không trừng phạt các trang web có nội dung trùng lặp; nó chỉ lọc các kết quả trùng lặp để tạo ra trải nghiệm tốt hơn và đáp ứng mục đích tìm kiếm.
- Google biết người dùng không muốn xem cùng một nội dung nhiều lần. Nếu người dùng không tìm thấy thứ họ muốn trong danh sách đầu tiên, tại sao nội dung tương tự trong danh sách thứ hai, thứ ba và thứ tư lại khác nhau?
- Google tích cực cố gắng tìm nguồn nội dung tốt nhất để hiển thị trang đó và tạo trải nghiệm tích cực cho người dùng. Điều này ngăn người dùng phải nhấp qua các nguồn hoặc ghi sai nguồn thuộc về người khác.
- Mặc dù một trang có nội dung trùng lặp sẽ không bị phạt nhưng nó có thể bị lọc ra trong kết quả có lợi cho nội dung khác. Sẽ không có nhiều lưu lượng truy cập cho bài đăng đó, nhưng nó sẽ không tác động tiêu cực đến trang web.
Bất chấp những nỗ lực tốt nhất của bạn, bạn vẫn có thể gặp phải nội dung trùng lặp trên trang web của mình hoặc những người khác có thể đã lấy nội dung của bạn và sao chép nội dung đó trên trang của họ. Các chuyên gia ước tính rằng có tới 29% nội dung trên web được sao chép .
Nhưng bạn có thể nhanh chóng giải quyết những vấn đề này và tạo ra kết quả SEO lâu dài bằng cách sử dụng các phương pháp hay nhất về URL chuẩn tương đối và biết khi nào nên sử dụng thẻ này.
Khi nào tôi nên sử dụng URL Canonical? (5 ví dụ về Canonical Rel)
Dưới đây là một số ví dụ điển hình về thời điểm bạn nên sử dụng thẻ này để xác định nội dung trùng lặp và đáp ứng các phương pháp hay nhất cho SEO.
Khi bạn đăng lại nội dung hiện có
Giả sử bạn có một trang web là một phần của tổ chức nhượng quyền thương mại hoặc quốc gia. Trong trường hợp đó, bạn có thể chia sẻ các tuyên bố, thông cáo báo chí và thậm chí cả nội dung blog được xuất bản lần đầu trên trang web liên bang trung ương.
Thay vì chỉ liên kết đến nội dung gốc và hy vọng khách truy cập trang web nhấp qua, bạn có thể xuất bản nội dung trên trang web của mình. Đây là nội dung trùng lặp cần có thẻ chuẩn. Bạn có thể sử dụng URL chuẩn để hướng trình thu thập thông tin tìm kiếm đến bài đăng gốc để nó không giống như bạn đang sao chép trang.
Ngoài ra, cần phải có thẻ chuẩn nếu bạn dịch bằng phần mềm dịch do con người hoặc máy dịch , các đoạn nội dung nhỏ như thông cáo báo chí, v.v. Nếu bạn dịch toàn bộ trang web của mình thì không cần phải có thẻ chuẩn và bạn chỉ nên sử dụng href lang tương ứng thẻ.
Khi bạn cung cấp nội dung blog
Một trong những chiến lược tiếp thị có thể bao gồm việc cung cấp nội dung hiện có của bạn trên các trang web khác. Cung cấp blog giúp bạn mở rộng nhận thức về thương hiệu và phạm vi tiếp cận của mình trong khi nhà xuất bản lấy nội dung cho trang của họ. Tuy nhiên, nội dung được cung cấp có nghĩa là từ ngữ của bạn hiện được lan truyền trên internet trên nhiều trang.
Trình thu thập thông tin tìm kiếm có thể không biết nội dung nào xuất hiện đầu tiên nếu không có URL chuẩn và nội dung nào cần ưu tiên. May mắn thay, nhiều blog cung cấp nội dung biết cách thiết lập một URL chuẩn để họ không ảnh hưởng đến SEO hoặc thẩm quyền tìm kiếm của các thương hiệu mà họ hợp tác.
Khi bạn kiểm tra A/B các trang khác nhau
Thử nghiệm A/B là một chiến lược mà các nhà tiếp thị sử dụng để xem yếu tố nào trên trang hoạt động tốt nhất. Bạn có thể kiểm tra các chi tiết nhỏ như màu sắc của các nút khác nhau hoặc những thay đổi quan trọng như bố cục hoặc nội dung trang. Trong một số trường hợp, Google có thể thu thập dữ liệu cả hai trang và bối rối không biết nên lập chỉ mục trang nào là trang gốc. URL chuẩn đóng vai trò là lộ trình dẫn đến nội dung gốc.
Khi bạn sử dụng nhiều biến thể URL (Thường là trên các trang web thương mại điện tử)
URL chuẩn thường được sử dụng cho các trang web thương mại điện tử đặt các phân cấp và URL khác nhau khi trang web của chúng thay đổi. Một trang web thương mại điện tử có thể có một danh mục dành riêng cho giày với danh sách sản phẩm, sau đó thay đổi thứ tự để chia danh mục thành giày hoặc dép nam và nữ so với giày chạy bộ.
Điều này có nghĩa là URL của các trang sản phẩm này thay đổi mặc dù chúng vẫn giữ nguyên. Kết quả là có hai URL có cùng nội dung. URL chuẩn là một phần của về SEO thương mại điện tử nhằm hướng các công cụ tìm kiếm đến các trang hàng đầu.
Nếu có nội dung trùng lặp vô ý trên trang web của bạn
Như đã đề cập trước đó, bạn có thể có nội dung trùng lặp trên trang web của mình mà thậm chí không biết. Hàng chục tình huống có thể dẫn đến nội dung trùng lặp ngoài ý muốn. Một số nguyên nhân phổ biến nhất là:
- Trang web của bạn có các phiên bản HTTP và HTTPS hoặc WWW và các trang không phải WWW riêng biệt
- Một trang web khác đã thu thập và xuất bản lại nội dung của bạn
- Mô tả và tiêu đề meta SEO giống nhau cho nhiều trang
- Có các vấn đề kỹ thuật, chẳng hạn như vấn đề phân trang hoặc các phiên bản khác nhau của các trang chỉ có thể in và chỉ có văn bản
Vì việc xác định các vấn đề về nội dung trùng lặp kỹ thuật trên trang web của bạn có thể gặp khó khăn nên bạn nên sử dụng trình kiểm tra nội dung trùng lặp để tìm ra vấn đề.
URL chuẩn so với chuyển hướng 301: Sự khác biệt là gì?
Đôi khi, bạn có thể muốn thiết lập chuyển hướng 301 thay vì URL chuẩn. Chuyển hướng 301 tự động đưa khách truy cập trang web đến một URL mới khi họ nhấp vào liên kết cũ.
Trong phần lớn các trường hợp, bạn sẽ sử dụng chuyển hướng 301 nếu bạn đang hợp nhất nội dung vào kho lưu trữ hoặc cập nhật URL hoặc trang web của mình. Tuy nhiên, nếu bạn vẫn muốn mọi người truy cập vào trang thì ngay cả khi nội dung bị trùng lặp thì bạn cần có URL chuẩn.
URL chuẩn so với thẻ meta Robot Noindex: Cái nào tốt hơn?
Một cách khác mà bạn có thể muốn giải quyết vấn đề trùng lặp nội dung là chặn các công cụ tìm kiếm thu thập dữ liệu trang ngay từ đầu. Thông qua SEO thẻ meta và thẻ meta robot, bạn có thể yêu cầu các công cụ tìm kiếm không thu thập dữ liệu các trang của bạn, đây có vẻ là một cách khắc phục nhanh chóng. Tuy nhiên, trong hầu hết các trường hợp, Google có thể thu thập dữ liệu càng nhiều trang trên trang web của bạn thì càng tốt. Vì vậy, tốt nhất bạn nên sử dụng noindex cho các trang mà bạn không có ý định xếp hạng hoặc nhận lưu lượng truy cập.
Cách thiết lập URL chuẩn
Bây giờ bạn đã hiểu lý do tại sao bạn muốn sử dụng thẻ chuẩn và thẻ này có thể giúp ích như thế nào, đã đến lúc thêm thẻ này vào trang web của bạn. Có nhiều cách để thực hiện việc này, tùy thuộc vào plugin bạn sử dụng và mức độ thoải mái của bạn khi thêm mã vào trang web của mình.
[novashare_tweet tweet=” Mặc dù có nhiều phương pháp để chọn cách tốt nhất để thêm thẻ chuẩn, nhưng bạn phải tuân theo một định dạng thống nhất trên trang web của mình.” theme= “simple-alt” cta_text= “Nhấp để tweet” Hide_hashtags=” true”]
Mặc dù có nhiều phương pháp để chọn cách tốt nhất để thêm thẻ chuẩn nhưng bạn phải tuân theo một định dạng thống nhất trên trang web của mình. Nếu nhiều người có quyền truy cập vào các trang, họ có thể thêm thẻ theo cách khác nhau, dẫn đến nhiều vấn đề SEO hơn.
Thêm URL Canonical bằng Yoast
Yoast SEO là một trong những plugin SEO phổ biến nhất dành cho WordPress và là một công cụ đơn giản và dễ dàng để thêm thẻ chuẩn. Nếu bạn có trang web WordPress, hãy cài đặt plugin miễn phí và dễ dàng thêm thẻ chuẩn thông qua trang chỉnh sửa hoặc phần bài đăng. Điều này lý tưởng nếu bạn không muốn chạm vào mã hoặc các yếu tố kỹ thuật của trang.
Thêm URL Canonical bằng mã tại chỗ
Nếu không có plugin cụ thể cung cấp liên kết chuẩn (hoặc nếu bạn không muốn sử dụng nó cho mục đích này), bạn có thể thêm thẻ rel=canonical vào trang web của mình bằng cách sử dụng các đoạn mã nhỏ. Bạn có thể đặt mã vào tiêu đề trang của mình để thiết lập URL chuẩn ngay khi trình thu thập thông tin truy cập vào trang của bạn:
<link rel="canonical" href="inserturl.com<?php echo $_SERVER['REQUEST_URI'];?>">
Nếu bạn không quen với việc điều chỉnh mã tiêu đề trên trang WordPress của mình, hãy làm theo hướng dẫn này để đảm bảo bạn áp dụng mã chính xác.
Thêm Canonicals thông qua Trình quản lý thẻ của Google
Nếu bạn có nhiều thẻ trên trang web của mình thì bạn có thể quản lý chúng thông qua Trình quản lý thẻ của Google. Điều này cho phép bạn kích hoạt một thẻ khi trang của bạn tải thay vì hàng tá, cải thiện tốc độ và giúp khắc phục sự cố dễ dàng hơn. Moz có hướng dẫn chuyên sâu để quản lý thẻ rel=canonical của bạn thông qua GTM. Công cụ này có thể đặt các tham số khác nhau cho những gì có thể được thu thập thông tin và những gì nên bỏ qua.
Tìm nội dung trùng lặp và thêm URL chuẩn
Thiết lập URL chuẩn là cách nhanh chóng để khắc phục các sự cố SEO liên quan đến nội dung trùng lặp trên trang web của bạn. Sử dụng trình kiểm tra URL chuẩn để tìm và giải quyết các vấn đề trùng lặp nội dung trên trang web của bạn nhằm đảm bảo nội dung của bạn được tối ưu hóa nhằm thu hút và giao tiếp phù hợp với trình thu thập thông tin tìm kiếm.
[novashare_tweet tweet=”Thiết lập URL chuẩn là cách nhanh chóng để khắc phục sự cố SEO với nội dung trùng lặp trên trang web của bạn” theme=”simple-alt” cta_text=”Nhấp để tweet” Hide_hashtags=”true”]
Nguồn: blog.alexa.com
Nội dung bị sao chép có thể là một vấn đề. “URL chuẩn” cho phép bất kỳ ai định sao chép nội dung biết nên sử dụng thẻ nào trong tiêu đề trang của họ. Tuy nhiên, người sao chép có trách nhiệm thông báo cho các công cụ tìm kiếm rằng họ đã sao chép nội dung bằng cách đặt rel=”canonical” vào tiêu đề trang web của họ và trỏ lại nội dung của bạn.