推文按鈕

收進你的MyShare個人書籤

2008年1月20日 星期日

站內搜索- Lucene及Solr

場地王在討論站內關鍵字搜尋
本來想包給Google Local Search
因為覺得關鍵字搜尋牽涉到自然語意....
每個人的語意表達方式都不盡相同
要搜尋到精準並排序並不容易。
所以為了使用者經驗,還是請出Google大神吧!

但是班長分享了一個Java-based的Search Engine叫Apache Lucene,
許多大網站如digg、livejournal、CNet、Joost 都使用Lucene
證明這套Search Engine在穩定度和搜尋效能應該都有一定水準
而且又是free/open source的。

Tsung's Blog:Apache Lucene 入手指南

http://plog.longwin.com.tw/news-technology/2007/07/24/search_engine_lucene_study_2007

Tsung介紹了Lucene,文後又留言最後他們公司使用了solr,
一個open source/free java-based search engine,是建在Lucene之上的search engine
找到另一篇solr的介紹

George Lee's blog
Solr - Enterprise search 的「黑盒子」

「簡單說,Solr 是完全把 Lucene 整個包起來,藏成一個搜尋的黑盒子。你不要管 Lucene 裡面怎麼做Tokenizer、Analyzer (雖然如果想改也可以),而只需要透過 XML/HTTP 來跟 Solr 溝通即可。要新增文件去搜尋,就 用 HTTP POST 塞資料給它。要做搜尋的時候,再另外做 HTTP GET 就好。非常符合 KISS 原則 (Keep It Simple, Stupid)。

雖然還沒進行壓力測試,不過 Solr 的底層是 Lucene,又是 CNet 的人寫出來的,看起來應該是還不錯用才對。」

http://mclee.foolme.net/2007/07/solr-enterprise-search.html

沒有留言: