当前位置: 主页 > Office办公 > 电脑专区 > 电脑教程 > 五种保存网页内容的方法分析

五种保存网页内容的方法分析

  • 2021-11-19
  • 来源/作者: 菜鸟图库/ 菜鸟图库
  • 780 次浏览

浏览网页时,经常遇到一些好的内容,想把它保存下来。保存网页内容的方法很多,这里着重介绍一下自己最常使用的几种方式,并进行简单的分析。

常用的五种方法

1、直接保存网页

在浏览器上直接Ctrl+S保存网页(全部),这种方法完全原样的将网页复制下来了,网页上面的任何图片、文字等内容,包括CSS、js等样式全部保存下来。

这是完全复制式保存网页,但零碎文件太多,不好做进一步归纳整理。而且很难迁移到客户端进行阅读,比如用手机或平板上的阅读软件进行阅读。

2、直接复制到onenote

将网页内容直接复制,然后直接Ctrl+V粘贴到onenote,自由选择内容,粘贴后仍然保留原样式,而且放在onenote中,管理极其方便。个人觉得没什么缺点,这是自己最常用的一种方式。

3、生成PDF文件

生成PDF,能保留一部分样式,生成的都是文字版PDF,而且PDF在各个平台都能阅读。主要是操作也很方便,一般安装一个浏览器插件就能很方便的生成PDF。

缺点一是会丢点很多样式,页面不美观。差一点的插件甚至会把图片都给你切分到两个页面上。

缺点二是很多广告弹窗等等不需要的都变成图片保留下来了。

4、复制并制作为epub

如果有时间,有精力,将文章内容复制,并制作成epub。这种方式对于保存网页自然是最完美的,但同时也是最耗费精力的,而且需要具备一定的技能,很多人并不会制作epub。

做成epub的好处很多,首先,内容最精确,需要什么就复制什么;其次,可以将样式全部保留;最后,在各个平台进行阅读都非常方便。

但是确实太耗费精力了,除非你认为那段内容非常有收藏价值,愿意花时间去做这个事,那就靠自己去衡量了。

5、百度收藏为文章

百度收藏最大的优点是保存的都是页面的主要内容区,其他无关的部分就直接去掉了,页面看起来非常干净。

缺点一是样式变化太大,比如有些图文排版优美的网页,百度收藏后基本上丢掉了所有样式,有的表格直接把表格线都弄没了,阅读时极不方便。

缺点二是保留什么内容完全是由百度搜藏内部识别的,一般保留的都是一个页面上的主要内容(具体机制未深究),但它识别的有些时候未必是完整的,尤其是论坛这种页面,百度收藏可能仅仅会保留一楼的文章内容,而下面的楼层可能就直接忽略了,但往往下面的楼层也有很多有意义的内容是需要保留的。

总结

具体选择哪种方法,看自己的实际需求。个人经验是,五种方法各有各的好处,平时都会用到。onenote是最常用的;其次是生成PDF;然后是保存网页,然后是百度收藏;少数情况,遇到特别有价值很想收藏下来的内容会花时间做成专门的epub文件保留。