星期四, 2月 19, 2015
星期五, 2月 06, 2015
[備份留存] Google Search Appliance Virtual Edition 分析SEO數據
用Google Search Appliance虛擬版分析SEO數據
對於大部分站長來說,比較關心的就是在Google抓取自己的網站時,最終的結果表現如何?有哪些被抓取到了,哪些沒有抓取到,有沒有什麼死鏈存在。當然,一般網上都有很多的googlebot模擬抓取工具,baidu蜘蛛抓取工具。但是畢竟都不是最權威的。實際上google出品了一個獨立的google搜索引擎應用程序。相當於你把google搜索引擎機器人搬回了家。這樣對於我們獲得第一手的網站抓取分析數據,有了極大的幫助。
程序名稱:Google Search Appliance
下載壓縮包大約1G左右,解壓後有36G,想好再下。
http://dl.google.com/vgsa/vgsa_20081028.7z
http://u.115.com/file/f492f97e2a#vgsa.7z.001
http://u.115.com/file/f4b88c1a70#vgsa.7z.002
一共发了两个版本,推荐用最新的
http://dl.google.com/vgsa/vgsa_20081028.7z
http://dl.google.com/vgsa/vgsa_20090210.7z
http://u.115.com/file/f492f97e2a#vgsa.7z.001
http://u.115.com/file/f4b88c1a70#vgsa.7z.002
一共发了两个版本,推荐用最新的
http://dl.google.com/vgsa/vgsa_20081028.7z
http://dl.google.com/vgsa/vgsa_20090210.7z
安裝前必讀
Google Search Appliance虛擬版是Google Search Appliance的免費軟件版本。您可以通過這款免費軟件體驗Google Search Appliance的搜索功能。也可以使用此軟件編寫和測試與搜索設備集成的程序。
必要條件
需要具備下列系統資源:
- Intel® Pentium® 4 2.80 Ghz 處理器(支持超線程技術)或同級別的處理器
- 3 GB RAM
- 40 GB 可用硬盤空間
- 以太網連接
建議使用參考配置以上:
- Intel Pentium D 處理器915(雙核)或同級別的處理器
- 4 GB RAM
- 40 GB 可用硬盤空間,且硬盤轉速為7200 RPM 或更快
- SATA 或更佳存儲接口
- 以太網連接
安裝步驟
請按照本部分所述的步驟安裝和設置Google Search Appliance虛擬版。
核實係統要求
確保您的系統滿足機器配置必要條件下的軟件運行要求。
下載、安裝和配置VMware 軟件
- 如果您尚未安裝VMware Player 1.0(或更高版本)或VMware Server 1.0(或更高版本),請馬上安裝:http://www.vmware.com/products/player/或http://www.vmware .com/products/server/
- 為確保下載的文件完整可用,請在Google 分發網站將MD5 密鑰與您的下載值進行對照,保證其正確無誤。您可以通過MD5 checker (md5sum) 免費軟件來進行比對。
- 如果已安裝了VMware Server,VMware安裝程序會彈出對話框詢問網絡參數。對於“NAT”和“主機到主機”網絡,請點擊是。
下載並解壓縮Google Search Appliance 虛擬版
- 下載Google Search Appliance 虛擬版並將其保存到硬盤。
- 將下載文件解壓縮到本地系統目錄下。請勿將下載文件放到共享網絡系統中。如果您使用的操作系統是Windows或Linux,請使用 7zip實用程序。請注意,此文件解壓縮後的大小約為40 GB。
- 請查看解壓縮過程中是否創建了一個名為
vgsa.{日期}
的目錄。{日期}為此版本的發布日期。
啟動VMware 軟件並運行Google Search Appliance 虛擬版
- 啟動VMware Player 或Server。
- 在VMware Player屏幕的“命令”部分,點擊打開並找到
vgsa.vmx
圖片。 - 運行
vgsa.vmx
以啟動Google Search Appliance。 - 等待5-10 分鐘,直到網絡配置對話框提示“已啟用”狀態為止。
- 您還可以在此對話框中看到Google Search Appliance 虛擬版的IP 地址。請記下此IP 地址。
訪問Google Search Appliance 虛擬版
現在,您便可以通過瀏覽器訪問Google Search Appliance 虛擬版了。
- 要進入管理界面,請輸入此網址:http://
:8000。 有關如何使用特定管理控制台頁面的信息,請點擊任意頁面右上角的“幫助中心”鏈接。 - 要進入用戶搜索頁面,請輸入此網址:http://
:80
有關Google Search Appliance 的開發信息,請參閱:
- Google Search Appliance文檔- http://code.google.com/apis/searchappliance/documentation/
- Google企業開發人員社區- http://code.google.com/enterprise
- Google Enterprise Labs - http://www.google.com/enterprise/labs/
在虛擬機運行成功後,會出現機器配置的界面出現,也許慢點,但2G的內存去運行並作小量抓取足矣。
具體步驟1:在抓取網址項目中按要求填寫要抓的網站,三欄各自的功能參看支持中心
在抓取狀態中開啟抓取,這樣就會有蜘蛛去按gsa的方式去抓取相應網站了,有詳細的統計數據,如下圖
抓取一段時間後,打開抓取診斷一欄可看到抓取結果,點擊其中的某一個抓取結果鏈接,可以看到詳細的抓取信息,還包括一項自建的快照,五臟俱全,並且看到結果保存於default_collection集合中,這樣你就有了一個針對自己網站的索引庫了,打開本地搜索首頁就可以查詢關鍵字了。
訂閱:
文章 (Atom)