使用方法
1、首先在地址欄輸入待采集的網頁地址,如果待采集網頁已經在IE類瀏覽器中打開了,那么軟件的網址列表中
將自動會加入此地址的,你只要下拉選擇一下就會打開了。
2、再點擊抓取測試按鈕,看看網頁源碼及該網頁中所含的表格數量,網頁源碼在軟件下面的文本框中顯示,網
頁中所含的表格數及表頭信息在軟件左上角列表框中顯示。
3、從表格數列表中選擇你要抓取的表格,此時表格左上角第一格文字將顯示在軟件的表格左上角第一格內容
輸入框中,表格所含字段(列)將顯示在軟件左側的中間列表中。
4、再選擇你要采集的表格數據的字段(列),如果不選擇,將全部采集。
5、選擇你是否要抓取表格的表頭行,保存時是否顯示表格線,如果網頁表格中有字段有鏈接,你可以選擇是否
包含鏈接地址,如果有且要采集其鏈接地址,那么你不能同時選擇包含表頭行。
6、如果你要采集的表格數據只有一個網頁,那么你現在就可直接點擊抓取表格抓取了,如果前面不選擇包含表
格線,表格數據將以CVS格式保存,此格式可用微軟EXCEL軟件直接打開轉為EXCEL表格,如果前面選擇包含表
格線,表格數據將以TXT格式保存,可用記事本軟件打開查看,直接具有表格線,也很清晰。
7、如果你要采集的表格數據有連續多個頁面,并且你都想將其采集下來,那么,請再設置程序采集下一頁及后
續頁面的方式,可以是根據鏈接名打開下頁,鏈接名稱幾乎大部分頁面都是“下一頁”,你看頁面,找到后
輸入即可,如果網頁沒有下一頁鏈接,但是網址中包含頁數,那么你也可選擇根據網址中的頁數打開,你可
以選擇從前到后,如從1頁到10頁,也可選擇從后到前,如從10頁到1頁,在頁數輸入框中輸入即可,但此時
網址中代表頁數的位置要用“(*)”代替,否則程序將不認識。
8、再選擇是定時采集或等待網頁打開并加載結束后立即采集,定時采集是程序根據一個設定的很小的時間間隔
去判斷打開的頁面中是否有你要的表格,有就采集,而網頁加載后采集是只要是要采集的網頁已經打開了,
程序就會立即進行采集,兩者各有特色,看需要選擇。
9、最后,就是你點擊一下抓取表格按鈕,就可以泡杯咖啡逍遙去了!
10、如果是你已經比較熟悉了你要采集的網頁的信息,而且要采集指定表格的所有字段,你也可以輸入需要的一
些信息后,不經過抓取測試等操作,直接點擊抓取表格的。
您的評論需要經過審核才能顯示
有用
有用
有用