
八爪魚采集器
八爪魚采集器安裝教程
八爪魚采集器,是一款通用性網頁采集軟件,可視化所現(xiàn)即所得操作,無須編程能力,即可采集任意網頁數(shù)據(jù)。并提供分布式云采集增值服務,支持高并發(fā)大存儲采集。2013年上線,現(xiàn)版本已經更新到5.1版,10W用戶使用。常見采集場景包括QQ號碼,電話號碼,手機號碼采集,郵箱采集,文章采集,客戶資源采集,網頁圖片采集,淘寶買家賣家商品采集,與織夢DEDE,WORDPRESS,DISCUZ,完美兼容。






八爪魚采集器軟件特性
八爪魚采集器,是一款通用性網頁采集軟件,可視化所現(xiàn)即所得操作,無須編程能力,即可采集任意網頁數(shù)據(jù)。并提供分布式云采集增值服務,支持高并發(fā)大存儲采集。2013年上線,現(xiàn)版本已經更新到5.1版,10W用戶使用。常見采集場景包括QQ號碼,電話號碼,手機號碼采集,郵箱采集,文章采集,客戶資源采集,網頁圖片采集,淘寶買家賣家商品采集,58同城趕集百姓分類信息采集,與織夢DEDE,WORDPRESS,DISCUZ,完美兼容。
八爪魚采集器安裝步驟:
1.先解壓所有文件。
2.請雙擊setup.exe開始安裝。
3.安裝完成后在開始菜單或者桌面均可以找到八爪魚采集器快捷方式。
4.啟動八爪魚采集器,需要先登錄才能使用各項功能。
5.如果已經在八爪魚網站注冊并激活賬號,請使用該賬號登錄。
如果沒有注冊過,請點擊登錄界面的“免費注冊”鏈接,或者直接打開,先注冊并激活賬號。
6.第一次使用時,請仔細查看使用指南(使用指南僅在第一次使用時出現(xiàn)一次)。
7.開始自己配置任務前,建議先打開樣本任務熟悉軟件使用,然后再對照“主頁”上的視頻教程學習練習一下。
8.新手建議先學習教程,或者從規(guī)則市場,數(shù)據(jù)市場中尋找自己需要的數(shù)據(jù)或者采集規(guī)則。
八爪魚采集器更新日志
八爪魚采集器8.2.6
迭代功能
更新自定義模式的布局,調整界面各部分尺寸,調整步驟高級選項的位置;
調整高級選項的層級關系,統(tǒng)一XPath的配置。
Bug修復
修復部分包含下拉框任務無法采集完整問題。
八爪魚采集器8.2.0
頁面無內容更新時,可提前結束滾動。
自動跳過無效的翻頁操作。
支持瀑布流網頁的邊滾動邊采集。
支持網頁的邊點擊加載更多內容,邊采集。
自動識別支持在列表項、詳情信息等結果之間切換。
八爪魚采集器8.1.22
Bug修復
解決部分列表網頁自動識別結果不正確的問題
八爪魚采集器8.1.18
Bug修復
解決軟件無法自動升級的問題
八爪魚采集器8.1.16
新增功能
增加按字段去除重復數(shù)據(jù)功能 查看詳情
增加導出采集數(shù)據(jù)到Oracle功能 查看詳情
增加導出采集數(shù)據(jù)到JSON文件功能
Bug修復
解決自定義配置中拖動步驟到判斷條件中異常的問題
解決自定義配置中多次復制字段后導致字段丟失的問題
解決自定義配置中在數(shù)據(jù)預覽中操作字段相關的問題
解決自定義配置中有時不同網頁內容重疊在一起的問題
解決部分任務本地采集時錯誤的提示需要補采的問題
解決自定義配置中編輯任務后未顯示修改未保存標識的問題
解決采集模板詳情中有時信息顯示不全的問題
解決自定義配置中流程圖添加采集步驟菜單顯示不全的問題
解決自定義配置中流程圖中有時循環(huán)項顯示不正確的問題
解決點擊側邊菜單欄最近編輯任務打開任務不顯示網頁的問題
八爪魚采集器8.1.14
主要體驗改進
自定義任務配置中增加列表相關的設置引導
自定義任務配置中增加網頁中沒有要采集數(shù)據(jù)時的設置引導
自定義任務配置中優(yōu)化檢測到Ajax后的設置引導
自定義任務配置中優(yōu)化自動識別結果的設置引導
自定義任務配置中加入表單類是網頁自動識別,識別率約80%+
Bug修復
解決八爪魚打開后,電腦長時間睡眠,重新喚醒后八爪魚白屏問題
八爪魚采集器8.1.12
主要體驗改進
本地采集增加了對7版本采集任務的正則兼容
優(yōu)化自定義配置中在全部字段中刪除字段后預覽數(shù)據(jù)的刷新機制
Bug修復
解決自定義配置中添加采集步驟菜單顯示位置不正確的問題
解決升級新版本后任務列表打不開的問題
解決自定義配置中拖動調整數(shù)據(jù)預覽中字段順序白屏的問題
解決自定義配置中刪除數(shù)據(jù)預覽中字段或數(shù)據(jù)行時提示操作框顯示錯誤的問題
解決采集模板中列表類型的參數(shù)無法配置的問題
解決本地采集中鼠標移動到元素上不生效的問題
解決定時采集中設置日期會出錯的問題
解決自定義配置中JSON任務添加字段會白屏的問題
解決任務列表中任務組模式下批量啟動云采集會長時間卡住的問題
解決自定義配置中添加固定字段后修改字段名錯誤的問題
解決自定義配置中循環(huán)提取固定元素列表預覽數(shù)據(jù)不顯示的問題
解決自定義配置中部分網站無法獲取Cookie的問題
解決定時采集中設置按周、按月定時采集下一次采集時間不正確的問題
解決定時采集中設置間隔時間1分鐘采集不生效的問題
解決自定義配置中有時修改任務名保存不生效的問題
解決自定義配置中設置字段抓取屬性值-選擇屬性值的時候流程圖區(qū)域會隱藏的問題
解決自定義配置中第一次進入時引導提示背景出現(xiàn)用戶調查界面的問題
解決任務列表中刷新后篩選條件重置的問題
解決自定義配置中修改任務名時標簽頁中的任務保存標識不正確的問題
八爪魚采集器8.1.8
主要體驗改進:
改善安裝卸載錯誤日志記錄方式
八爪魚采集器8.1.4
主要體驗改進
優(yōu)化網頁列表數(shù)據(jù)自動識別,將識別率提高到90%以上
Bug修復
解決自定義配置中循環(huán)輸入文本中循環(huán)項重復的問題
解決自定義配置當前頁面數(shù)據(jù)預覽中有時會多出一列空數(shù)據(jù)的問題
解決自定義配置中有時候自動識別生成的采集流程不正確的問題
解決自定義配置當前頁面數(shù)據(jù)預覽中拖動改變字段順序后修改字段名錯誤的問題
解決本地采集中部分網頁Cookie不生效問題
解決自定義配置中自動識別生成的采集字段中有空格的問題
解決本地采集中部分網站無法滾動加載數(shù)據(jù)的問題
解決本地采集中某些情況下數(shù)據(jù)格式化不正確的問題
解決自定義配置提取數(shù)據(jù)配置中修改字段后沒有應用也生效的問題
解決自定義配置中部分網頁自動識別有時會卡住的問題
解決自定義配置自動識別的數(shù)據(jù)預覽中有時修改字段名會白屏的問題
解決主界面左側賬戶過期時間顯示的問題
解決自定義配置中某些操作會造成流程圖錯亂的問題
八爪魚采集器7.4.42018-06-22
主要體驗改進:
【自定義模式】支持采集網址數(shù)量,從2萬擴展到100萬級別
【自定義模式】網址輸入支持文本導入,支持txt、xls、xlsx、csv格式
【自定義模式】網址輸入支持批量生成網址參數(shù),包括數(shù)字變化、字母變化、時間變化、自定義類表四種生成方式
【自定義模式】支持任務跟隨采集,A采集的網址作為B任務的輸入源進行關聯(lián)采集,拓寬使用場景
【任務列表】任務列表可根據(jù)「云采集完成時間」來排序
【其他】任務錯誤報告導出支持excel格式
Bug修復:
修復本地驗證碼識別出錯問題
修復云采集正則替換失效問題
八爪魚采集器V7.2.2 2017-12-25
升級提醒:
系統(tǒng)不支持自動從6.x自動升級到7.x,使用6.x版的用戶請單獨下載V7.x版本再安裝使用。
主要體驗改進:
【任務管理】可自定義每頁顯示任務數(shù)量(10、20、50、100),大批量任務管理更方便
【任務管理】優(yōu)化頁面刷新體驗,減少無效刷新
【自定義模式】可將無關聯(lián)的幾個元素,組成一組列表鏈接進行循環(huán)采集,適應更多場景需求
【自定義模式】創(chuàng)建任務時,可同時設置任務組
【其他】可購買任務控制API
Bug修復:
修復增量采集失效問題,提高增量采集可靠性
修復填入大量URL時引起的性能問題
修復部分客戶端崩潰問題
八爪魚采集器V7.1.82017-11-19
升級提醒:
系統(tǒng)不支持自動從6.x自動升級到7.x,使用6.x版的用戶請先卸載:開始->八爪魚->卸載,再安裝V7.x。
主要體驗改進:
增加智能防封(代理IP)功能,點擊查看詳細說明
提供驗證碼單獨購買渠道,無需捆綁套餐購買
自定義模式,智能輔助框去掉「更多操作」,直接展示全部配置選項
Bug修復:
修復部分客戶端崩潰問題
修復字段名出現(xiàn)亂碼問題
八爪魚采集器V7.1.6 2017-11-02
升級提醒:
系統(tǒng)不支持自動從6.x自動升級到7.x,使用6.x版的用戶請先卸載:開始->八爪魚->卸載,再安裝V7.x。
主要體驗改進:
改進主要頁面UI設計,優(yōu)化圖標、背景色、對話框設計
集成新內核,解決舊版內核中,一大批網頁無法打開的問題
客戶端首頁加入新手教程,合并APP&網站簡易采集模式
自定義模式--智能輔助框增加「撤銷本次選擇」功能
自定義模式--選中元素列表時,顯示列表數(shù)量,方便校對
自定義模式--可以將無關聯(lián)的元素,組成一組列表
優(yōu)化自定義模式中選擇元素的相關操作
在Xpath參考庫中增加XPath教程
Bug修復:
【循環(huán)打開網頁】URL太長導致內存溢出,無法再修改規(guī)則
本地采集出現(xiàn)錯誤報表后,彈窗必須手動點擊
在查看數(shù)據(jù)界面,內容數(shù)據(jù)長度超長,導致查看數(shù)據(jù)卡住,甚至崩潰
修復若干Bug
八爪魚采集器V7.1.4 2017-09-25
升級提醒:
系統(tǒng)不支持自動從6.x自動升級到7.x,使用6.x版的用戶請先卸載:開始->八爪魚->卸載,再安裝V7.x。
體驗改進:
新增UserAgent切換功能,有效規(guī)避網頁防采集(包括火狐45、54、55,火狐手機版29、谷歌瀏覽器最新版)
增加「檢測工作流異?!构δ?,當工作流出錯時將會檢測及自動修復
加入「關于我們」,可以查看客戶端版本及檢測更新
目前可以在「自動導出數(shù)據(jù)庫」時選用已保存的導出配置
刪除單個任務加上確認提示,避免誤操作
優(yōu)化編輯任務名體驗
導出數(shù)據(jù)時,導出數(shù)據(jù)范圍默認跟隨當前頁面篩選條件,避免誤操作
移除「發(fā)布到網站」功能
Bug修復:
修復「新增字段后進行采集,導致數(shù)據(jù)丟失」的問題
修復「預覽包含大量內容的字段導致崩潰」問題
修復「當任務名稱太長時,自動導出里無法顯示任務」的問題
修復IT桔子打開異常問題(需要手動切換UA為火狐54、火狐29)
修復智能模式加載下一頁出錯問題
八爪魚采集器6.4.3
升級提醒:
八爪魚采用云存儲技術,因此升級或者重新安裝都不會影響用戶的數(shù)據(jù),請放心升級。
升級內容:
修復點擊網頁不彈出選擇框的問題
八爪魚采集器6.42016-12-09
升級提醒:
八爪魚采用云存儲技術,因此升級或者重新安裝都不會影響用戶的數(shù)據(jù),請放心升級。
升級內容:
添加識別驗證碼功能,云采集支持自動識別驗證碼,單機采集支持自動識別和手工輸入
添加執(zhí)行計劃設置的功能,并可以使用已保存的計劃批量應用到多個任務上
修復導出到Mysql必須需要mysql數(shù)據(jù)庫權限的問題
優(yōu)化單機采集速度
優(yōu)化軟件內存占用高的問題
八爪魚采集器V6.2.12016-09-26
升級是否影響用戶數(shù)據(jù)?八爪魚采用云存儲技術,因此升級或者重新安裝都不會影響用戶的數(shù)據(jù),請放心升級。
修復文章正文分頁合并導出后的數(shù)據(jù)會有多條
修復找不到時使用默認值設置失效
查看數(shù)據(jù)添加直接查看某頁面的數(shù)據(jù)的功能
翻頁次數(shù)可以設置更大的值
修復打開網頁重試無效的問題
添加右鍵刷新任務和任務組的功能
 
下載地址
-
- 通用安全下載
-
- 移動安全下載
-
- 聯(lián)通安全下載
-
- 電信安全下載
-
- 移動網絡下載
-
- 聯(lián)通網絡下載
-
- 電信網絡下載
-
- 通用網絡下載