該采集系統有如下特點:
主流語言 - 采用php+mysql編寫而成,安裝對應服務器即可。
完全開源 - 開源代碼,且代碼均有中文注釋,方便管理與學習交流。
規則自定義 - 可以自定義采集規則,可以采集大部分網站內容。
數據修改 - 自定義修改規則,優化數據內容。
數據保存 - 數組形態,系列化數據保存至文件或數據庫,方便上傳、調用。
圖片讀取 - 可以讀取內容的圖片,并保持至本地。
編碼控制 - 轉換編碼,可以保存gb2312,gbk等編碼至utf-8。
標簽清理 - 可以自定義保留的標簽,清理掉不必要標簽。
安全性能 - 通過密碼控制讀取,遠程讀取亦安全。
操作簡單 - 一鍵讀取操作,可以按規則分組讀取,或指定規則id讀取,單一id讀取。
規則分組 - 按規則分組讀取數據,及時更新采集數據。
自定義讀取 - 按自定義規則id讀取數據,有效更及時。
JS讀取 - 運用js控制讀取時效,降低服務器負載。
超時控制 - 可設定頁面執行時間, 減少timeout錯誤。
多次讀取 - 可設定對網頁多次讀取控制,可以更有效的讀取數據。
錯誤控制 - 如果多次出錯,可以停止讀取,減小服務器資源占用。
負載控制 - 多文件夾保存數據,可以有效的解決多文件下服務器負載。
數據修改 - 不僅可以瀏覽數據,而且可以對主體數據進行修改。
規則分析 - 可以向其他人分享您的規則,讓更多人使用。
規則下載 - 下載分享規則,快速獲取需要的內容。
您的評論需要經過審核才能顯示
有用
有用
有用