如何讓網頁不被收錄為「庫存頁面」或是「頁庫存檔」
此資訊來自於奇摩的服務中心-網頁刪除熱門問題 以及Google的移除內容 (您可以點入左方連結,查看更多詳細資訊)
以下為奇摩資訊
搜尋引擎在網路上發現相關資料的時候,會把多數網頁的畫面擷取並儲存;這將使我們能夠標示出搜尋相關頁面的資訊,提供網友能迅速找到相關的訊息;並且若該網站的的伺服器臨時無法連結,網友仍可藉由「庫存頁面」讀取相關資訊。
如果您的網站內容不想透過此種儲存方式讀取,可使用NOARCHIVE meta 的標籤指令。
在您的編輯語法中, < HEAD > 的部分裡安置以下指令︰
< META NAME="ROBOTS" CONTENT="NOARCHIVE" >
這個標籤會告訴搜尋引擎不要將您的網頁擷取儲存在庫存頁面,您的網站仍會被搜尋引擎收錄在搜尋結果中,只是不會顯示庫存頁面。
請注意,在您加了NOARCHIVE標籤指令之後,需等到搜尋引擎再次抓取您的網頁,偵測到NOARCHIVE標籤指令時才會生效(約每月更新)。
以下為google資訊
如果您只要阻擋漫遊器進入特定的網頁,請在網頁的 HTML 程式碼裏加入如下的 meta 標籤:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
如果您不介意其他的漫遊器,只 單單不要 Google,請使用下面的指令:
<META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW">
另外如果您的網站不希望讓搜尋引擎獲取找到時,可以參考以下作法
此資訊來自維基百科 (您可以點入左方連結,查看更多詳細資訊)
請以記事本新增一個 robots.txt(統一小寫) 文件檔案,內容請寫入
User-agent: *
Allow:/
接著存檔,並放入網站的根目錄內即可讓搜索引擎不獲取到您的網站。
