xoá index google
SEO cơ bản | Techical

Cách xóa index google để URL không có trên kết quả tìm kiếm nhanh chóng

Trong khi hầu hết các SEOer đều tập trung vào việc đạt được thứ hạng cao nhất. Đôi khi, điều ngược lại là cần thiết – xóa index google trên trang kết quả tìm kiếm.

Ví dụ: khi bạn đang chiến đấu với:

  • Nội dung lỗi thời hoặc trùng lặp,
  • Môi trường dàn dựng được index
  • Hoặc các trang được index chứa dữ liệu cá nhân nhạy cảm.

Dù tình huống là gì, với hướng dẫn này, bạn sẽ có thể nhanh chóng xóa các URL khỏi Google!

Giới thiệu

Trong khi nhiều người làm SEO chủ yếu tập trung vào việc nội dung của họ được Google index nhanh chóng. Thì điều ngược lại – xóa nội dung nhanh chóng – cũng thường xuyên cần thiết.

Có thể:

  • Toàn bộ môi trường dàn dựng của bạn đã được index,
  • Nội dung nhạy cảm mà lẽ ra Google không bao giờ có thể truy cập được đã được index
  • Hoặc các trang spam được thêm vào do trang web của bạn bị tấn công đang xuất hiện trong Google.

Dù đó là gì, bạn sẽ muốn những URL đó loại bỏ nhanh chóng , phải không? Trong hướng dẫn này, chúng tôi sẽ giải thích chính xác cách đạt được điều đó.

Dưới đây là những trường hợp phổ biến nhất mà bạn cần nhanh chóng xóa URL khỏi Google:

  1. Bạn đang xử lý nội dung trùng lặp hoặc lỗi thời
  2. Môi trường dàn dựng của bạn đã được index
  3. Trang web của bạn đã bị tấn công và chứa các trang spam
  4. Nội dung nhạy cảm đã vô tình được index

Trong bài viết này, chúng tôi sẽ xem xét chi tiết tất cả các trường hợp này và cách xóa các URL này càng sớm càng tốt.

Cách xóa các URL có nội dung trùng lặp hoặc lỗi thời

Có nội dung trùng lặp hoặc lỗi thời trên trang web của bạn được cho là lý do phổ biến nhất để xóa URL khỏi Google.

Hầu hết nội dung lỗi thời không có giá trị gì đối với khách truy cập của bạn, nhưng nó vẫn có thể có giá trị theo quan điểm SEO. Trong khi đó, nội dung trùng lặp có thể ảnh hưởng đáng kể đến hiệu suất SEO của bạn, vì Google có thể nhầm lẫn về URL nào để index và xếp hạng.

Dễ dàng tìm và theo dõi nội dung trùng lặp và lỗi thời

Hãy để dịch vụ SEO Audit tại Hmgsearch tìm kiếm nội dung trùng lặp và lỗi thời trên các trang web của bạn. Sau đó, xử lý và viết nội dung mới độc quyền cho bạn đảm bảo chốt sales tuyệt đối và thân thiện với google. 

Các hành động cụ thể bạn cần thực hiện để xóa index Google tùy thuộc vào ngữ cảnh của các trang bạn muốn xóa, như chúng tôi sẽ giải thích bên dưới.

Khi nào cần truy cập nội dung

Đôi khi, các URL cần phải được người dùng tiếp tục truy cập nhưng bạn không muốn Google index chúng vì chúng thực sự có thể ảnh hưởng đến SEO của bạn. Điều này áp dụng cho duplicate content chẳng hạn.

Hãy lấy một ví dụ:

Bạn điều hành một shop bán hàng online và bạn đang cung cấp những chiếc áo thun giống hệt nhau ngoại trừ màu sắc và kích cỡ khác nhau. Các trang sản phẩm không có mô tả sản phẩm duy nhất; chúng chỉ có một tên và hình ảnh khác nhau.

Trong trường hợp này, Google có thể coi nội dung của các trang sản phẩm của họ là gần như trùng lặp.

Việc có các trang gần như trùng lặp dẫn đến việc Google phải quyết định chọn URL nào làm URL chuẩn để index và chi tiêu crawl budget quý giá.

Trong tình huống này, bạn phải báo hiệu cho Google biết URL nào cần được index và URL nào cần được xóa khỏi index google. Quá trình hành động tốt nhất của bạn cho một URL phụ thuộc vào các yếu tố sau:

  • URL có giá trị: nếu URL đang nhận được Organic traffic và / hoặc các liên kết đến từ các trang web khác. Bạn nên canonical chúng thành URL ưa thích này mà bạn muốn index. Sau đó, Google sẽ gán giá trị của nó cho URL ưa thích , trong khi các URL khác vẫn có thể truy cập được đối với khách truy cập của bạn.
  • URL không có giá trị: nếu URL không nhận được Organic traffic và không có liên kết đến từ các trang web khác. Bạn chỉ cần triển khai noindex thẻ rô bốt/meta robots tag. Điều này gửi cho Google một thông báo rõ ràng là không index URL dẫn đến việc họ không hiển thị URL đó trên các trang kết quả của công cụ tìm kiếm (SERP). Điều quan trọng là phải hiểu rằng trong trường hợp này, Google sẽ không củng cố bất kỳ giá trị nào .

Có nhiều nội dung chất lượng thấp, mỏng hoặc trùng lặp có thể tác động tiêu cực đến nỗ lực SEO của bạn. Nếu bạn gặp vấn đề về nội dung trùng lặp, bạn không nhất thiết phải xóa các trang vi phạm. Thay vào đó, bạn có thể canonical các trang này nếu chúng cần vì lý do khác. Bạn cũng có thể hợp nhất các trang trùng lặp để tạo ra một phần nội dung chất lượng cao hơn, mạnh mẽ hơn. Gần đây tôi đã xóa nội dung trên một trang web và thấy Organic traffic cho toàn bộ trang web đã tăng 32%.

Nếu bạn muốn tránh các vấn đề về nội dung trùng lặp trên các biến thể sản phẩm, điều cần thiết là:

  • Xây dựng một chiến lược SEO vững chắc
  • Sẵn sàng thích ứng nếu bạn thấy cần phải thay đổi.

Giả sử Category của bạn chỉ bao gồm các sản phẩm đơn giản (con) trong đó mỗi sản phẩm đại diện cho một biến thể cụ thể. Trong trường hợp đó, bạn chắc chắn sẽ muốn index tất cả chúng, mặc dù sự khác biệt giữa các biến thể sản phẩm là không đáng kể. Tuy nhiên, bạn sẽ cần phải theo dõi chặt chẽ hiệu suất của chúng. Nếu xuất hiện bất kỳ vấn đề nội dung trùng lặp nào, hãy giới thiệu các sản phẩm mẹ cho website bán hàng online của bạn. Sau khi bắt đầu hiển thị các sản phẩm gốc trên giao diện người dùng, bạn cần điều chỉnh chiến lược index của mình.

Khi bạn có cả sản phẩm mẹ và con hiển thị trên giao diện người dùng dưới dạng các mục riêng biệt. Tôi thực sự khuyên bạn nên triển khai giống nhau rel canonical trên tất cả các sản phẩm để tránh các vấn đề về nội dung trùng lặp.

Trong những trường hợp này, phiên bản ưu tiên phải là sản phẩm mẹ đóng vai trò là tập hợp tất cả các biến thể sản phẩm. Thay đổi này sẽ không chỉ cải thiện SEO cho trang web bán hàng của bạn mà còn giúp tăng đáng kể hiệu suất UX. Bởi vì khách hàng của bạn sẽ có thể tìm thấy biến thể sản phẩm mong muốn của họ dễ dàng hơn.

Tất nhiên, tất cả những gì của anh ấy chỉ đề cập đến những sản phẩm có nội dung giống nhau hoặc rất giống nhau. Nếu bạn có nội dung duy nhất trên tất cả các trang sản phẩm, mỗi trang phải có một URL chuẩn tự tham chiếu.

Khi khách truy cập không thể tiếp cận được nội dung

Nếu có nội dung lỗi thời trên trang web của bạn mà không ai có thể xem, có hai cách có thể để xử lý, tùy thuộc vào ngữ cảnh của URL:

  • Nếu các URL có lưu lượng truy cập và / hoặc liên kết: hãy triển khai redirect 301 đến các URL có liên quan nhất trên trang web của bạn. Tránh redirect đến các URL không liên quan, vì Google có thể coi đây là lỗi soft-404. Điều này sẽ dẫn đến việc Google không chỉ định bất kỳ giá trị nào cho mục tiêu redirect.
  • Nếu các URL không có bất kỳ lưu lượng truy cập và / hoặc liên kết nào: hãy trả lại mã trạng thái HTTP 410. Điều đó cho Google biết rằng các URL đã bị xóa index google vĩnh viễn. Google thường rất nhanh chóng xóa các URL khỏi chỉ mục của nó khi bạn sử dụng mã trạng thái 410.

Sau khi bạn đã triển khai các redirect, hãy vẫn gửi sitemap cũ tới Google Search Console cũng như sơ đồ mới và để ở đó trong 3-4 tháng. Bằng cách này, Google sẽ nhanh chóng nhận các redirect và các URL mới sẽ bắt đầu hiển thị trong SERPs.

Xóa các URL đã lưu trong bộ nhớ cache bằng Google Search Console

Google thường giữ một bản sao lưu trong bộ nhớ cache của các trang của bạn mà họ sẽ mất khá nhiều thời gian để cập nhật hoặc xóa index google. Nếu bạn muốn ngăn khách truy cập nhìn thấy bản sao được lưu trong bộ nhớ cache của trang thì sử dụng tính năng “Xóa URL trong bộ nhớ cache” tại Google Search Console.

Cách xóa các URL được lưu trong bộ nhớ cache bằng Google Search Console

  1. Đăng nhập vào tài khoản Google Search Console của bạn.
  2. Chọn tài sản phù hợp.
  3. Nhấp vào Removals trong menu cột bên phải.
  4. Bấm vào NEW REQUEST.
  5. Chuyển sang tab CLEAR CACHED URL.
  6. Chọn xem bạn muốn Google xóa bộ nhớ cache cho chỉ một URL hay cho tất cả các URL bắt đầu bằng một tiền tố nhất định.
  7. Nhập URL và nhấn Next.

Xin lưu ý rằng bạn có thể hướng dẫn Google không giữ các bản sao được lưu trong bộ nhớ cache của các trang bằng cách sử dụng thẻ meta rô bốt không lưu trữ .

Cách xóa URL môi trường dàn dựng

Môi trường giai đoạn và chấp nhận được sử dụng để kiểm tra các bản phát hành và phê duyệt chúng. Những môi trường này không có nghĩa là để các công cụ tìm kiếm có thể truy cập và index nhưng chúng thường bị nhầm lẫn. Sau đó, bạn kết thúc với các URL môi trường dàn dựng (“URL dàn dựng” từ đây trở đi) đã được index bởi Google.

Nó xảy ra, sống và học hỏi.

Trong phần này, chúng tôi sẽ giải thích cách nhanh chóng và hiệu quả loại bỏ các URL phức tạp đó ra khỏi Google!

Khi URL dàn dựng không xếp thứ hạng cao hơn URL sản xuất

Trong hầu hết các trường hợp, URL sắp xếp của bạn sẽ không xếp hạng cao hơn URL sản xuất. Nếu đây cũng là trường hợp của bạn, chỉ cần làm theo các bước để khắc phục sự cố này. Nếu không, hãy chuyển sang phần tiếp theo.

  1. Đăng nhập vào tài khoản Google Search Console của bạn.
  2. Chọn thuộc tính dàn (hoặc xác minh nếu bạn chưa có).
  3. Nhấp vào Removals trong menu cột bên phải.
  4. Nhấp vào NEW REQUEST và bạn sẽ đến tab TEMPORARILY REMOVE URL:
  5. Chọn Remove all URLs with this prefix, nhập URL /và nhấn Next. Google hiện sẽ giữ các URL ẩn trong 180 ngày các URL sẽ vẫn nằm trong chỉ mục của Google. Vì vậy, bạn sẽ cần phải thực hiện thêm hành động để xóa index google.
  6. Xóa các bản sao nội dung đã lưu trong bộ nhớ cache của Google bằng cách thực hiện các bước được mô tả trong phần Xóa các URL được lưu trong bộ nhớ cache .
  7. Sử dụng noindex chỉ thị robot, bằng cách triển khai nó thông qua nguồn HTML hoặc thông qua X-Robots-Tag tiêu đề HTTP.
  8. Tạo sitemap XML với các URL không được index để Google có thể dễ dàng phát hiện ra chúng và xử lý lệnh noindex rô bốt.
  9. Khi bạn chắc chắn rằng Google đã khử chỉ mục các URL dàn dựng. Bạn có thể xóa sitemap XML và thêm xác thực HTTP để bảo vệ môi trường dàn dựng của bạn và ngăn điều này xảy ra lần nữa.

Mẹo chuyên nghiệp:

Nếu bạn muốn xóa các URL của mình khỏi Microsoft Bing thì có thể thực hiện việc đó thông qua Công cụ xóa nội dung của nó.

Khi URL sắp xếp thứ hạng cao hơn URL sản xuất

Nếu URL dàn dựng của bạn xếp thứ hạng cao hơn URL sản xuất. Bạn cần đảm bảo Google gán tín hiệu của URL dàn dựng cho URL sản xuất và khách truy cập không kết thúc với URL dàn dựng.

  1. Đi qua các bước 1-6 như đã thảo luận trong phần trước .
  2. Sau đó, triển khai redirect 301 từ URL dàn dựng đến URL sản xuất.
  3. Thiết lập một môi trường dàn dựng mới trên một miền (phụ) khác với miền đã được index và đảm bảo áp dụng xác thực HTTP cho nó để ngăn nó được index lại.

Những điều cần tránh khi xử lý các URL dàn dựng được index

Nếu bạn muốn xóa các URL môi trường dàn dựng khỏi Google, đừng bao giờ cố gắng làm như vậy bằng cách sử dụng Disallow: / trong file robots.txt của bạn.

Điều đó sẽ ngăn Google truy cập vào các URL dàn dựng, ngăn họ tìm hiểu về noindex thẻ rô bốt! Google sẽ tiếp tục hiển thị các URL dàn dựng, chỉ với một đoạn mã rất nghèo nàn như ví dụ sau:

Mô tả của Google không có file robots.txt

Tiếp tục học

  • Robots.txt có disallow hướng dẫn các công cụ tìm kiếm hủy index các trang không?

Khi triển khai các thay đổi trên trang web thành hoạt động, hãy trao đổi với các nhà phát triển của bạn về việc đảm bảo quá trình này là 100%. Có một số “phần SEO” có thể dễ dàng gây hại cho tiến trình trang web của bạn nếu không được quản lý đúng cách. Những điều này liên quan đến:

  • File robots.txt.
  • Các file cấu hình máy chủ web như .htaccess, nginx.conf hoặc web.config.
  • Các file bạn sử dụng cho quá trình triển khai thẻ meta (để bảo vệ môi trường dàn dựng của bạn khỏi bị index và trang web đang hoạt động khỏi bị hủy index).
  • Các file JS liên quan đến nội dung và kết xuất DOM.

Tôi đã thấy các trang web lành mạnh giảm SERPs của Google chỉ vì:

  • Trong quá trình triển khai đến quá trình trực tiếp,
  • File robots.txt đã bị phiên bản dàn dựng bằng lệnh Disallow: /
  • hoặc ngược lại: các cổng lũ index đã được mở vì các lệnh quan trọng đã bị xóa kết quả tìm kiếm trên google.

Cách xóa các URL spam

Nếu trang web của bạn đã bị tấn công và chứa rất nhiều URL spam. Bạn nên loại bỏ chúng càng nhanh càng tốt để chúng không làm ảnh hưởng (thêm nữa) đến hiệu suất SEO và độ tin cậy của bạn trong mắt khách truy cập.

Làm theo các bước dưới đây để nhanh chóng đảo ngược thiệt hại.

Bước 1: Sử dụng Công cụ xóa của Google Search Console

Công cụ xóa của Google giúp bạn nhanh chóng xóa các trang spam khỏi Google SERPs. Và một lần nữa, hãy nhớ rằng công cụ này không khử chỉ mục các trang – nó chỉ tạm thời ẩn chúng.

Cách xóa URL bằng công cụ Xóa của GSC

  1. Đăng nhập vào tài khoản Google Search Console của bạn.
  2. Chọn tài sản phù hợp.
  3. Nhấp vào Removals trong menu cột bên phải.
  4. Nhấp vào NEW REQUEST và bạn sẽ đến TEMPORARILY REMOVE URL tab:
  5. Chọn Remove this URL only, nhập URL bạn muốn xóa và nhấn Next. Google hiện sẽ giữ URL ẩn trong 180 ngày nhưng các URL sẽ vẫn nằm trong chỉ mục của Google. Vì vậy, bạn sẽ thực hiện thêm hành động để ẩn chúng.
  6. Lặp lại nhiều lần nếu bạn cần. Nếu bạn đang xử lý một lượng lớn các trang spam, chúng tôi khuyên bạn nên tập trung vào việc ẩn những trang xuất hiện thường xuyên nhất trong Google. Hãy sử dụng tùy chọn Remove all URLs with this prefix  một cách thận trọng. Vì nó có thể ẩn tất cả các URL (có thể là hàng nghìn) khớp với tiền tố bạn đã nhập vào Enter URL trường.
  7. Đồng thời xóa các bản sao đã lưu trong bộ nhớ cache của Google của các URL spam bằng cách thực hiện các bước được mô tả trong phần Xóa các URL được lưu trong bộ nhớ cache .

Bước 2: Xóa các URL spam và phân phát 410

Khôi phục trạng thái trước đó của trang web của bạn bằng cách khôi phục bản sao lưu. Chạy các bản cập nhật và sau đó thêm các biện pháp bảo mật bổ sung để đảm bảo trang web của bạn không còn bị tấn công nữa. Sau đó, kiểm tra xem tất cả các URL spam có biến khỏi trang web của bạn hay không. Tốt nhất nên trả lại mã trạng thái HTTP 410 khi chúng được yêu cầu để làm rõ ràng rằng các URL này đã biến mất và sẽ không bao giờ quay lại.

Bước 3: Tạo một sitemap XML bổ sung

Bao gồm các URL spam trong một sitemap XML riêng và gửi nó đến Google Search Console. Bằng cách này, Google có thể nhanh chóng “ăn sạch” các URL spam và bạn có thể dễ dàng theo dõi quá trình xóa index google thông qua Google Search Console.

Trang web của bạn có bị tấn công không?

Các URL spam có thể ảnh hưởng nghiêm trọng đến hiệu suất SEO của bạn. Hãy để Hmgsearch cảnh báo cho bạn về bất kỳ sự phát triển đáng ngờ nào của các trang trên trang web của bạn trước khi quá muộn.

Những điều cần tránh khi xử lý các URL spam

Tương tự như với môi trường dàn dựng, hãy tránh thêm

Disallow: /file robots.txt của bạn, vì điều đó sẽ ngăn Google thu thập lại thông tin các URL. Google cần nhận thấy rằng các URL spam đã bị xóa.

Cách xóa URL có nội dung nhạy cảm

Nếu bạn thu thập dữ liệu nhạy cảm, chẳng hạn như chi tiết khách hàng hoặc sơ yếu lý lịch từ những người xin việc. Điều quan trọng là phải giữ chúng an toàn trên trang web của bạn. Trong mọi trường hợp, dữ liệu này không được index bởi Google – hoặc bất kỳ công cụ tìm kiếm nào khác cho vấn đề đó.

Tuy nhiên, những sai lầm vẫn xảy ra và nội dung nhạy cảm có thể tìm thấy đường vào kết quả tìm kiếm của Google. Mặc dù vậy, chúng tôi sẽ giải thích cách nhanh chóng xóa nội dung này khỏi Google.

Bước 1: Sử dụng Công cụ xóa URL của Google Search Console

Ẩn các URL có nội dung nhạy cảm thông qua công cụ xóa của GSC là cách nhanh nhất để khiến Google ngừng hiển thị chúng trong SERPs của mình. Tuy nhiên, hãy nhớ rằng công cụ chỉ ẩn các trang đã gửi trong 180 ngày; nó không xóa chúng khỏi chỉ mục của Google.

Cách ẩn URL bằng công cụ GSC Removals

  1. Đăng nhập vào tài khoản Google Search Console của bạn.
  2. Chọn tài sản phù hợp.
  3. Nhấp vào Removals trong menu cột bên phải.
  4. Nhấp vào NEW REQUEST và bạn sẽ đến TEMPORARILY REMOVE URL tab:
  5. Chọn Remove this URL only, nhập URL bạn muốn xóa và nhấn Next. Google hiện sẽ giữ URL ẩn trong 180 ngày, nhưng hãy nhớ rằng các URL sẽ vẫn nằm trong chỉ mục của Google. Vì vậy, bạn sẽ thực hiện thêm hành động để ẩn chúng, như được nêu trong các bước tiếp theo bên dưới.
  6. Lặp lại nhiều lần nếu bạn cần. Nếu nội dung nhạy cảm nằm trong một thư mục cụ thể. Tôi khuyên bạn nên sử dụng tùy chọn Remove all URLs with this prefix. 
  7. Vì điều đó sẽ cho phép bạn ẩn tất cả các URL trong thư mục đó chỉ trong một lần. Nếu bạn đang xử lý:
  • Một lượng lớn URL,
  • Không có tiền tố URL được chia sẻ,
  • Chứa nội dung nhạy cảm,

Chúng tôi khuyên bạn nên tập trung vào việc ẩn những URL xuất hiện thường xuyên nhất trong Google.

  1. Xóa các bản sao nội dung nhạy cảm đã lưu trong bộ nhớ cache của Google bằng cách thực hiện các bước được mô tả trong phần Xóa URL trên google đã lưu trong bộ nhớ cache .

Bước 2: Xóa nội dung và phân phát 410

Nếu bạn không cần có nội dung nhạy cảm trên trang web của mình nữa, bạn có thể xóa các URL và trả lại mã trạng thái 410 HTTP. Điều đó cho Google biết các URL đã bị xóa trên google vĩnh viễn.

Bước 3: Sử dụng một sitemap XML bổ sung

Để kiểm soát và giám sát quá trình xóa URL có nội dung nhạy cảm. Bạn hãy thêm chúng vào một sitemap XML riêng và gửi nó trong Google Search Console.

Bước 4: Ngăn rò rỉ dữ liệu nhạy cảm xảy ra

Để ngăn nội dung nhạy cảm được index và bị rò rỉ trở lại, hãy thực hiện các biện pháp bảo mật thích hợp để ngăn điều này xảy ra.

Đừng quên về các file không phải HTML của bạn!

Có thể bạn áp dụng một thẻ noindex vào các trang web của bạn nhưng Google có thể thỉnh thoảng vẫn thấy và cho index. Chẳng hạn như các file PDF và hình ảnh. Để đảm bảo chúng không được tìm thấy, bạn sẽ cần phải sử dụng x-robots noindex tag. 

Tuy nhiên, có một thách thức với việc sử dụng tiêu đề rô bốt đang kiểm tra và giám sát chúng. Rất may Hmgsearch làm cho việc này trở nên dễ dàng!

Cách xóa nội dung không có trên trang web của bạn

Nếu bạn nhận thấy rằng các trang web khác đang sử dụng nội dung của bạn, đây là một số cách để xóa nội dung đó khỏi Google.

Liên hệ với chủ sở hữu trang web

Điều đầu tiên bạn nên làm là tiếp cận với những người đang điều hành trang web. Trong rất nhiều trường hợp, “thực tập sinh” đã sao chép nhầm nội dung của bạn và họ sẽ nhanh chóng hành động. Bạn có thể đề nghị họ trỏ một tên miền chéo canonical cho nội dung của bạn cùng với một backlink. Sau đó, yêu cầu họ redirect 301 đến URL của riêng bạn hoặc chỉ xóa trên google hoàn toàn.

Điều gì sẽ xảy ra nếu chủ sở hữu của trang web không phản hồi hoặc từ chối thực hiện bất kỳ hành động nào?

Nếu chủ sở hữu trang web không hợp tác, bạn có một số cách để yêu cầu Google xóa trang web đó:

Mẹo chuyên nghiệp

Nếu các trang đã bị xóa trên một trang web khác và Google vẫn chưa bắt kịp. Bạn có thể tiến hành quá trình xóa bằng cách sử dụng công cụ Xóa nội dung đã lỗi thời .

Bạn cũng có thể sử dụng nó khi nội dung đã được cập nhật, nhưng Google vẫn hiển thị đoạn mã và bộ nhớ cache cũ. Nó sẽ buộc họ phải cập nhật nó.

Cách xóa hình ảnh khỏi Google Tìm kiếm

Mặc dù không nên sử dụng file robots.txt để xóa các trang được index khỏi Google Tìm kiếm nhưng Google khuyên bạn nên sử dụng file này để xóa các hình ảnh đã được index .

Tài liệu của Google không rõ ràng lắm về vấn đề này vì bạn xem tài liệu của Công cụ xóa. Bạn sẽ thấy trong phần họ cũng nói về cả file HTML và không phải HTML, dòng Do not use robots.txt as a blocking mechanism.:

Ảnh chụp màn hình xóa thông tin trên google

Đồng thời, bài viết “Ngăn hình ảnh trên trang của bạn xuất hiện trong kết quả tìm kiếm” của họ cho biết:

xóa index google

Vì vậy, làm thế nào để bạn xóa những hình ảnh này?

Giả sử một số hình ảnh trong thư mục /images/secret/đã vô tình được index. Đây là cách loại bỏ chúng:

Cách xóa hình ảnh khỏi Google Tìm kiếm

  1. Thực hiện các bước 1-6 trong phần trên để ẩn nhanh các URL trong Google Tìm kiếm.
  2. Sau đó, thêm các dòng này vào file robots.txt của bạn:

User-agent: Googlebot-Image

 Disallow: /images/secret/ 

Lần tiếp theo khi Googlebot tải xuống file robots.txt của bạn. Họ sẽ thấy lệnh disallow đối với hình ảnh và xóa hình ảnh khỏi chỉ mục của nó.

Không thể có thẻ meta ngăn index trên hình ảnh. Chúng tôi có thể sử dụng tiêu đề phản hồi X-Robots để chỉ định noindex. Tuy nhiên, thay vào đó, Google khuyên chúng tôi nên dựa vào công cụ Xóa hoặc chặn URL hình ảnh có vấn đề bằng robots.txt.

May mắn thay, đây là lần duy nhất một lệnh disallow trong robots.txt sẽ hoạt động để xóa kết quả tìm kiếm trên google. Điều đó được Google khuyến nghị để xóa hình ảnh không khẩn cấp.

Chúng tôi có thể loại trừ các hình ảnh khỏi Tìm kiếm Hình ảnh của Google bằng cách chỉ định tác nhân người dùng Googlebot-Image hoặc khỏi tất cả các tìm kiếm của Google bằng cách chỉ định Googlebot.

Phần kết luận

Có rất nhiều tình huống mà bạn sẽ muốn nhanh chóng xóa URL khỏi Google.

Hãy nhớ rằng không có cách tiếp cận “một kích thước phù hợp với tất cả” cho điều này. Mỗi tình huống yêu cầu một cách tiếp cận khác nhau. Và nếu bạn đang đọc giữa các dòng, bạn sẽ nhận thấy rằng hầu hết các trường hợp bạn cần xóa URL thực sự có thể được ngăn chặn.

Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *