嚴格的信息安全分級體系,保證信息可管理性
企業搜索在安全方面的要求遠遠高於互聯網搜索。企業內部的各種信息內容帶有明顯的安全級別屬性和部門歸屬屬性。幾乎每個企業都嚴格規定了什麽樣的信息可以給什麽樣的人閱讀,某種信息歸屬哪個部門發布與存儲。
起點企業搜索平臺針對企業內部信息系統中,不同的用戶使用權限不同的這壹特點,提供針對用戶、對資源進行權限分級管理和控制能力,確保企業內部信息系統的安全。各種資源在接入系統時會要求設置安全級別,便於對用戶訪問行為進行控制。
可靠的安全保障手段,實現系統的授權訪問管理
起點企業搜索平臺廣泛采用了用戶帳號權限控制、IP地址授權和過濾技術,保證對系統的接入安全。通過信息智能分析和過濾機制,設置敏感詞表和禁查詞表,對檢索結果中的敏感信息提供安全管理。實現完善的日誌記錄機制,保證信息的訪問和閱讀有據可查,便於及時處理各種信息內容安全隱患。
良好的安全擴展體系,可方便的與內部系統對接
起點企業搜索平臺在數據采集和獲取過程中,通過安全的擴展體系,支持以授權方式訪問內部信息系統、內部文檔目錄,保證安全的基礎上,實現信息的***享服務。支持對內部某些信息系統的權限統壹管理,實現系統間的權限映射。
2. 多操作系統、多平臺、多數據庫支持
本產品支持的操作系統、應用服務器、數據庫如下:
操作系統 Windows
Linux
Unix
應用服務器 Tomcat
Weblogic
Websphere
Resin
Apache
IIS
數據庫 Mysql
Sql Server
Oracle
DB2
其它……
其它必備環境 JDK1.5 以上版本
3. 支持多數據源采集
通過指定文件服務器、數據文檔目錄等方式,靈活管理數據來源,根據不同目錄或來源劃分為後續安全管理提供自動級別信息。根據內容來源,判斷是否需要進行文檔格式化分析,將數據庫直接讀取的結構化信息和半結構化網頁信息通過分析模塊和元數據描述進行統壹。
除了基於非結構化數據進行采集外,還可對PDF、WORD、HTML、TXT、各種圖片等四十多種文件格式自動采集。同時根據用戶需要本系統也支持采集其它各類數據源,例如:XML文件、其它數據池等。
4. 智能化的檢索服務
起點產品在全文檢索過程中采用相關智能技術以達到迅速、準確、全面定位目標信息。例如采用相關度分析技術,使相關度較高的結果排在結果列表的前面,相關度較低的結果排在後面,並屏蔽無用和錯誤的信息;構造強大的語義規則庫,使系統能夠正確地判斷與檢索詞相關的同義詞、近似詞、上位詞、下位詞,幫助用戶判斷結果的相關度,並進行進壹步的查詢;支持完善的信息分類體系,對檢索結果自動分類或者信息聚類;提供智能化的概念擴展查詢等。通過這些技術,能夠滿足大多數智能化搜索需求。
5. 強大的信息海量數據實時索引和管理功能
起點產品不僅提供了快速檢索功能(在千萬級數據下,全文檢索能在1秒鐘之內完成),同時也有著高效的海量數據處理能力。每小時能處理百萬的數據庫數據,或是幾十萬篇的文檔。包括中文的分詞和建立數據索引。我們的產品在多個大型項目中經過了實際的檢驗,成功實施過多個超過5千萬數據規模的項目。
6. 中文語言處理技術
中文語言處理是搜索引擎必須具備的技術之壹,應用中文語言處理技術才能使搜索結果更加符合用戶習慣,更加接近用戶的期望結果,起點產品集成了中文分詞技術,並有著40萬詞庫的支持,用戶也可以根據自己的需要和行業特色來添加和維護詞庫。中文分詞技術的準確率和召回率都達到96%以上。
7. 健壯可靠的系統,按需擴展
針對大型應用系統和海量數據的環境,提供多機分布式或雙機互備的服務體系結構,通過把企業內部各種內容分布到不同服務器,可實現用戶的應用層實現透明訪問,支持松耦合自動切換的雙機備份策略,提高系統的運行可靠性。分布式架構允許通過增加硬件的方式增加系統處理能力。
8. 支持多種語言開發接口,與其他系統無縫集成
起點產品以標準的WebService和標準XML方式提供多種語言開發接口,支持的語言包括.NET,JAVA,PHP等。可與各類WEB應用進行無縫集成。同時提供完善的二次開發API手冊幫助及應用示例。
9. 操作簡易、維護方便
起點產品提供完整的後臺界面,所有配置和操作都可以通過IE訪問產品後臺進行,操作簡易,維護方便,同時也不影響服務器的安全性。