Nutch是壹個建立在Lucene核心之上的Web搜索的實現,它是壹個真正的應用程序。也就是說,妳可以直接下載下來拿過來用。它在Lucene的基礎上加了網絡爬蟲和壹些和Web相關的東東。其目的就是想從壹個簡單的站內索引和搜索推廣到全球網絡的搜索上,就像Google和Yahoo壹樣。當然,和那些巨人競爭,妳得動壹些腦筋,想壹些辦法。我們已經測試過100M的網頁,並且它的設計用在超過1B的網頁上應該沒有問題。當然,讓它運行在壹臺機器上,搜索壹些服務器,也運行的很好。
總的來說,我認為LUCENE會應用在本地服務器的網站內部搜索,而Nutch則擴展到整個網絡、Internet的檢索。當然LUCENE加上爬蟲程序等就會成為Nutch,這樣理解應該沒錯吧。