如何下载阅读高等学校中英文图书网上的民国书和古籍
作者: 肖毛 2006-12-28 22:44:51来源:http://www.lotus-eater.net/
在弱水月年兄的帖子里知道了“高等学校中英文图书网”,对那里的民国书很有兴趣。但那些图书的格式是djvu的,于是开始寻找各种djvu软件及其使用方法。这里,先转贴一篇文章:
作者: oliver197411 发布日期: 2006-7-18
网上读书园地(www.readfree.net)
【原创】菜鸟教程:手把手教你下载、合并djvu书籍
“高等学校中英文图书数字化国际合作计划”网站上有不少好书,古籍和民国和一些现代书籍(比如中华书局的书,某些大学的超星镜像上一本都没有,这里却很多,而且很全。中华书局的二十四史,清史稿这里都有。这里有很多清人的文集,都是刻本,是比较难找的。还有全套的台湾影印本《文渊阁四库全书》,原本扫描,非常清晰!还有民国非常有名的全套万有文库、丛书集成初编、二编以及民国丛书等等,好书实在太多!)这些书籍一般都是可以观看,并且下载的!因为你到图书馆中去查古籍和民国图书往往很麻烦的,不如自己制作,永远拥有!!我以前很难找到的民国中小学教科书,这里有一大堆!
下面介绍我自己摸索的下载和制作djvu的方法。
第一步,点击下面链接下载djvu插件并安装
http://www.cadal.zju.edu.cn/doc/DjVuWebBrowserPlugin.exe
第二步,登陆高级检索界面
http://www.cadal.zju.edu.cn/AdvancedSearchIndex.action
当然你也可以登陆简易检索界面(http://www.cadal.zju.edu.cn/Index.action),但是推荐登陆高级检索界面,功能更强大。
在搜索栏目里输入作者“张舜徽”,好家伙,出来一大堆书。
你可以点击右边的“详细信息”,了解此书是否是你需要的。
现在我以下载《清人文集别录·上册》一书为例,详细说明批量下载与制作方法。
需要用到的软件:
FlashGet:下载软件
djvueditor_V6.01_XiaoSD:DjVu :djvu文件合并工具
第三步,寻找图书的真实下载地址
点击“清人文集别录·上册 ”
出现界面如下
我们需要找到图书的真实下载地址。
点击IE浏览器的查看——源文件
找到以“http://210.32.137.91/”开头的如下地址(其实“http://210.32.137.91/”永远不会改变,任何一本此网站上的书的真实地址都以这个地址开头!)
新建一个txt文档,将“http://210.32.137.91/dlib5/ebooks//book/06/377000/06376760”(不包括左右双引号)复制到其中。
我们还要给这个地址加上通用的后缀“/ptiff/(*).djvu”(不包括左右双引号),这样图书的真实地址最终变成了http://210.32.137.91/dlib5/ebooks//book/06/377000/06376760/ptiff/(*).djvu
第四步,探测图书的页数
在图书页码浏览输入框,随意输入一个极大的数值,比如7777,点“GO”。
本书当然没有7777页,就会在输入框里显示最后一页的页码,这样就可以知道这本书有多少页了,也就解决了批量下载的文件数量问题。
由下图可知本书共有344页
第五步,启动FlashGet的成批下载功能下载这本书。
启动FlashGet,在“任务”栏里选择“添加成批任务”,将上面录入在新建文本文件里的图书真实地址复制上去,同时在下面的“例如”中,填入从1到 344(344为本书的页数,这个数字随着图书不同而变化。),通配符长度为8(通配符长度,每一本图书都一样,这个永远不变)。
点“确定”,批量下载设置完成。
选择一个保存地址,点击“确定”,下载开始。速度快的时候,下载300多页的书大概只需要一二分钟的时间。
第六步,合并成单个djvu文件。
转到你保存的地址看看,下载下来的书,都是按顺序编号的单个文件。现在你已经可以直接双击单个文件,启动IE浏览器直接逐页浏览了。但是非常不方便,这就需要我们把这么多djvu文件合并成一个djvu文件。
安装并启动djvueditor_V6.01_XiaoSD。界面如下。
点击“文件”——“打开文件”按钮,找到刚才下载保存的文件目录,选中第一页,按“打开”。
文件打开后如下图。
点击“编辑”,选“插入在页面之后”。
除了第一页之外,剩下的都选择,然后点击“打开”。
左面会显示所有文件的缩略图。
仔细观察,发现其中最后一页误排到第二页了。解决的办法是选中错误的页码,按“剪切”。
然后将它粘贴到当前最后一页的后面。
点击“保存”按钮,所有的文件将合并到你下载的00000001.djvu中,将它改名为“清人文集别录·上册.djvu”,其他原来下载的文件都可以删除了。
第七步,阅读制作好的djvu文件。
直接双击你制作好的“清人文集别录·上册.djvu”,系统将启动IE浏览器来观看,可以自己随心所欲的设置放大和缩小。
就这么简单!
----------
转贴完毕。现在开始说我的使用体会。
想阅读和制作djvu格式的图书,需要下载几个软件:
1.浏览插件:http://www.cadal.zju.edu.cn/doc/DjVuWebBrowserPlugin.exe(利用它可以在IE里面观看djvu格式的图书,但每次只能显示一页)
2.djvu文件合并工具:DjVuSolo3.1-noncom,全名为DjVu Solo 3.1 (non-commercial version),约2.1兆,英文版,下载链接我忘记了,可以在网上搜。前面提到的合并工具djvueditor_V6.01_XiaoSD,我下载之后并不好用。
我试验过几种软件,只有DjVuSolo3.1可用。使用方法如下:先打开安装后的主程序,随便打开一页下载好的djvu图书,然后点击Edit菜单,点击Append Page(s)选项,把某本图书目录里面的文件全部选定,打开。最后一步,点击File菜单,点击Save as选项,会弹出一个窗口,点击Bundled,点击OK,随便取个书名,所有文件便可以合并为一个djvu格式的图书。
3.浏览器:WinDjView 0.3.5,484k,一个文件,不用安装,英文版,下载链接我忘记了,可以在网上搜。
尽管DjVu Solo 3.1也带浏览功能,但这个软件如果将每页书转化为图片文件,需要四五兆。如果用WinDjView 0.3.5转化,每张图片不到2兆,非常省空间。
另外,如果用迅雷成批下载Djvu图书,通配符长度不能为8,因为迅雷默认的是5。这时需要把http://210.32.137.91/dlib5/ebooks//book/06/377000/06376760/ptiff/(*).djvu,改写成http://210.32.137.91/dlib5/ebooks//book/06/377000/06376760/ptiff/(000000*).djvu(中间应该有几个0,请自己试验,我家里没有装迅雷,这个试验是在别人的电脑里做的,反正当时成功了。
还有,并非该网的所有图书链接都是以http://210.32.137.91/开头的,还有别的网站,这在查源文件时可以发现。
探测图书的页数,不必用采取上面提供的笨方法,你可以直接在网上点击“末页”,不久就会有显示。
页:
[1]