前面那篇文章介紹了用Word自身功能另存為html格式,不過這樣會生成大量的廢代碼,對于專業文本編輯者來說,一個一個手動刪除實在是個費時費力的事情。既然你從事文本編輯,那就懂代碼,下面介紹一個用代碼的方法將doc文檔迅速轉換成html格式。
操作步驟
打開Word2007,將需要進行轉換的文檔打開,復制到剪貼板中。
在桌面新建一個txt記事本,輸入下列代碼:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
< html xmlns="http://www.w3.org/1999/xhtml">
< head>
< meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
< title>word轉成html</title>
< /head>
< body>
——————-
此處輸入黏貼word 中的內容
——————-
</body>
< /html>
將先前復制的文檔粘貼到記事本相應位置,然后點擊菜單欄–文件–另存為。
設置好文件的存放位置,文件名改為*.html,保存類型選為所有文件,單擊保存按鈕。
生成一個html文件,雙擊打開它就會啟動瀏覽器,在瀏覽器頁面可以看到我們轉換之后的效果。
說明
此類方法不會產生大量的垃圾代碼,但是轉換之后的內容版式沒有換行,都是連一起寫的,而且帶有圖片等的文檔用此方法轉換之后,只能顯示文字內容,圖片并不會顯示出來。需要另外的插入圖片代碼。