将html文件转换为word文件的方法如下:
1、在浏览器中点击“文件”→“保存网页”;
2、保存为html文件;
3、右击html文件,选择“打开方式”;
4、找到word的选项,点击确定打开,如图:
第一步、打开网页后单击浏览器菜单栏的“文件”-->另存为,然后选择“网页,全部htm,html”格式;(如下图):
第二步、我们打开Word,然后选择Word菜单栏的“文件”-->打开,找到刚才保存文件的地方,选择打开(如:我这里打开“《Excel2003如何合并单元格》”这个页面):
步骤三、打开以后我们删除一些不需要的地方,比如:顶部和底部的,那些对于我们来说都没什么用,我们要主要就是要内容。然后打开菜单栏的“表格”-->转换-->表格转换为文本,将一些文档中的表格一一去掉。
最后步、修改了一下效果跟先前那个比起来是不是要好得多呀?我们将修改好的文档“另存为”或者“保存”普通的(.doc)格式就可以了。
html文件转换为word文件:
打开这个文档,以桌面上随便一个word为例,就拿今天在军事网上看到的文章为例吧,打这个文件打开;
打开这个word文件后,选择office菜单下面的另存为菜单 ,如图;
在”另存为“的下拉菜单中选择最下面一个”其他格式“,如图;
点击进去之后,在文件格式网页格式,然后再点保存就可以了;
python的win32com库可以处理。
import win32com.client
word = win32com.client.Dispatch('Word.Application')
try:
doc = word.Documents.Open("%s.html" % path)
doc.SaveAs("%s.doc" % path, FileFormat=0)
doc.Close(-1)
except:
pass
需要注意的是文件路径必须是绝对路径