用于從 MSDN 網站上下載指定章節下的所有文章,讀取內容中的文本及圖片等。讀取完成后,轉換為 Word 文件,并生成相應的目錄。(有了 word 文件,Word 2010 就可以把它導出為 pdf 等其它格式了。)
一個 MSDN 到 Word/PDF 轉換器。我已經用它轉換了 WPF、VSPackage、WWF 等 MSDN 章節為 PDF。
現在的 MSDN 已經做得非常好了,章節非常清晰,從入門到精通各個層次都有。我常常會把 MSDN 當作一個系統的學習書籍來看。有時候,特別想把 MSDN 下載下來,轉換為 PDF,放到平板電腦上看。
軟件截圖
使用方法:
例如,我期望轉換 MSDN 中 《Windows Workflow Fundation》 中的所有內容到 PDF。
步驟
打開你要下載的 MSDN 頁面,查看該頁面的標識。如下圖,其中標識為 dd489441。
編輯配置文件
打開 MSDNConverter.exe.config,編輯以下配置:
把頁面的標識“RootId”設置為上面的 dd489441。
有時候,你不想下載某一些子章節,例如大量類型的 API 說明。你可以把這些不想下載的子章節標識,都加入到 “ExcludeSubIdList” 配置中,以逗號分隔即可。
運行軟件即可
點擊回車,開始全自動運行……
先下載整本書的目錄結構……
目錄下載完畢后,會開始下載每一篇文章的文本內容:
文本下載完畢,會開始下載所有的圖片:
文本和圖片,會下載到程序對應文件夾下緩存著。防止中途中斷不再重復下載。
待文本和圖片下載完成后,程序會打開 Word,開始把內容輸出到 Word 文檔中。在轉換過程中,打開 Word 只是方便查看,不要去人為編輯 Word 文檔,否則會影響轉換。
輸出完成
轉換完成后,程序為整個文檔生成了目錄和導航。這時,保存為 Word、或者 PDF 即可。:)
輸出
結語
目前軟件是 1.3 版本,還有一些問題沒有解決。例如沒識別表格、列表、許多樣式等。