九大開源搜索引擎介紹
2010-01-08 10:47 來源:中國搜索研究中心 責編:涂運
【CPP114】訊:1. Lucene.
他是一個全文搜索引擎工具包,但只支持文本文件以及少量語種的索引;通過Lucene提供的接口,我們可以自己開發(fā)具體語言的分詞器,針對具體文檔的文本解析器等;Lucene是索引數(shù)據(jù)結(jié)構(gòu)事實上的標準;使用Java編寫,但是被轉(zhuǎn)化為多個庫;
2. LIUS
是Lucene的加強版,Lucene Index Update and Search增加了對多種文檔的支持,增加了索引更新功能;
3. Egother
一個用于全文搜索引擎的Java庫,能夠為具體的應用程序添加全文搜索功能;新的動態(tài)算法提高索引的更新速度;支持平行的查詢方式,支持多種文檔
4.Xapian
使用C++編寫,提供綁定程序使得其他語言能夠方便地使用它;便于進行二次開發(fā)
5. Campass
在Lucene上實現(xiàn)的開源搜索引擎架構(gòu),提供更加簡潔的搜索引擎api增加了索引事務處理功能,與數(shù)據(jù)庫事務處理整合;更新時無需刪除原文檔,更加簡介與高效;資源與搜索引擎之間采用映射機制;能與Hibernate,Spring等架構(gòu)進行整合;開源web搜索引擎系統(tǒng):
6. Nutch
基于Lucene構(gòu)建的web搜索引擎系統(tǒng),簡潔;
7.YaCy
基于p2p的分布式開源web搜索引擎系統(tǒng),使用java;其核心是分布在數(shù)百臺計算機上的被稱為YaCy-peer的計算機程序,基于p2p網(wǎng)絡(luò)構(gòu)成了YaCy網(wǎng)絡(luò),整個網(wǎng)絡(luò)是一個分散的架構(gòu),所有的peer處于對等的地位,沒有統(tǒng)一的中心服務器,每個peer獨立地進行互聯(lián)網(wǎng)的爬行抓取,分析及建立索引庫,并通過p2p網(wǎng)絡(luò)進行共享;而且每個peer又都是一個獨立的代理服務器,能夠?qū)Ρ緳C使用的網(wǎng)頁進行索引,采用多種機制保護用戶的隱私,也通過本機運行的web服務器進行查詢和返回結(jié)果。桌面搜索引擎系統(tǒng)
8. regian
對中文支持跨平臺
9. Zilverline
以Lucene為基礎(chǔ),采用Spring為框架,中文名為銀錢查打引擎;使用Jave編寫;
【點擊查看更多精彩內(nèi)容】
相關(guān)新聞:
企業(yè)網(wǎng)站SEO必知:谷歌搜索引擎收錄與排名習慣淺析
廣告協(xié)會陳永:搜索營銷將垃圾信息變廢為寶
提升報業(yè)收入默多克先禮后兵 新聞集團收費政策叫停谷歌搜索
他是一個全文搜索引擎工具包,但只支持文本文件以及少量語種的索引;通過Lucene提供的接口,我們可以自己開發(fā)具體語言的分詞器,針對具體文檔的文本解析器等;Lucene是索引數(shù)據(jù)結(jié)構(gòu)事實上的標準;使用Java編寫,但是被轉(zhuǎn)化為多個庫;
2. LIUS
是Lucene的加強版,Lucene Index Update and Search增加了對多種文檔的支持,增加了索引更新功能;
3. Egother
一個用于全文搜索引擎的Java庫,能夠為具體的應用程序添加全文搜索功能;新的動態(tài)算法提高索引的更新速度;支持平行的查詢方式,支持多種文檔
4.Xapian
使用C++編寫,提供綁定程序使得其他語言能夠方便地使用它;便于進行二次開發(fā)
5. Campass
在Lucene上實現(xiàn)的開源搜索引擎架構(gòu),提供更加簡潔的搜索引擎api增加了索引事務處理功能,與數(shù)據(jù)庫事務處理整合;更新時無需刪除原文檔,更加簡介與高效;資源與搜索引擎之間采用映射機制;能與Hibernate,Spring等架構(gòu)進行整合;開源web搜索引擎系統(tǒng):
6. Nutch
基于Lucene構(gòu)建的web搜索引擎系統(tǒng),簡潔;
7.YaCy
基于p2p的分布式開源web搜索引擎系統(tǒng),使用java;其核心是分布在數(shù)百臺計算機上的被稱為YaCy-peer的計算機程序,基于p2p網(wǎng)絡(luò)構(gòu)成了YaCy網(wǎng)絡(luò),整個網(wǎng)絡(luò)是一個分散的架構(gòu),所有的peer處于對等的地位,沒有統(tǒng)一的中心服務器,每個peer獨立地進行互聯(lián)網(wǎng)的爬行抓取,分析及建立索引庫,并通過p2p網(wǎng)絡(luò)進行共享;而且每個peer又都是一個獨立的代理服務器,能夠?qū)Ρ緳C使用的網(wǎng)頁進行索引,采用多種機制保護用戶的隱私,也通過本機運行的web服務器進行查詢和返回結(jié)果。桌面搜索引擎系統(tǒng)
8. regian
對中文支持跨平臺
9. Zilverline
以Lucene為基礎(chǔ),采用Spring為框架,中文名為銀錢查打引擎;使用Jave編寫;
【點擊查看更多精彩內(nèi)容】
相關(guān)新聞:
企業(yè)網(wǎng)站SEO必知:谷歌搜索引擎收錄與排名習慣淺析
廣告協(xié)會陳永:搜索營銷將垃圾信息變廢為寶
提升報業(yè)收入默多克先禮后兵 新聞集團收費政策叫停谷歌搜索
- 關(guān)于我們|聯(lián)系方式|誠聘英才|幫助中心|意見反饋|版權(quán)聲明|媒體秀|渠道代理
- 滬ICP備18018458號-3法律支持:上海市富蘭德林律師事務所
- Copyright © 2019上海印搜文化傳媒股份有限公司 電話:18816622098