《星球Google我们的生活将怎样被一家公司彻底改变》“登月”计划(2)
时间:2009-11-09 14:44:56来源:[标签:出处]作者:张成
“古登堡计划”一直回避所谓的“权威版本”,认为“在一般读者眼中达到99.9%的准确度的收录文章才是最受欢迎的”。这个计划没有办法很好地涵盖全世界的文学作品:到2002年,该项目仅仅完成了约6300本文学作品的数字化工程,而且所有这些都是完全以纯文字的形式录入,无法体现原书图片所阐释的意义。“古登堡计划”的目标是使纸质文学作品能够更广泛地被接触,其初衷无疑是很崇高的;但该计划固有的局限性之一就是:它被接受的前提必须是读者既不需要也不想要除了纯文本之外的任何东西,同样能给读者带来阅读体验的一些细节,比如字体的变化、书名和标题,以及图书在设计上的微妙特点等,统统被剥夺了。
在传统的出版界眼中最适合完成这项大规模的行动——将所有的图书数字化的机构非美国国会图书馆莫属。到1990年,扫描技术的不断发展带来了数字化成本的大幅度下降,于是国会图书馆开始了他们的数字化计划,几乎将除了纸质书籍之外所有类型的传媒产品都进行了数字化,包括文件、动画、录音、照片。其目的是要建立一个数字化的、记载“美国记忆”的历史资料库。
最雄心勃勃的图书数字化项目始于2001年。当卡内基•梅隆大学收到了美国国家科学基金会(National Science Foundation)为“百万图书项目”提供的50万美元基金时,这项计划正式启动了。为了能够将尽可能多的图书进行数字化,本着“少花钱、多办事”的原则,他们不惜大费周章地将图书运到印度和中国进行扫描。然而,当他们向美国的图书馆提出,要他们提供其馆藏图书并允许将这些图书打包进集装箱,再通过风险很大的海上运往国外进行扫描时,遭到了图书馆的拒绝。遭拒的原因不言自明。布鲁斯特•卡尔(Brewster Kahle),这个在1996年建立了互联网络档案馆(Internet Archive)的互联网创业者——就像他自己说的那样——“跨出了历史性的一步”,因为他将花费了50000美元从堪萨斯市公共图书馆(Kansas City Public Library)购买的15万册藏书无偿捐赠给了“百万图书项目”。
之后“百万图书项目”获得了美国国家科学基金会向其另行提供的250万美元基金,并提出该项目最终要达到的目标应远远超过之前设想的“百万图书”,而是要在2007年前将在中国、印度以及埃及把140万册图书全部实现数字化。这些图书中的绝大部分都是用汉语、印度语、阿拉伯语、法语以及其他一些语种印刷,英语只占了了很小一部分,并且这些图书都是由美国以外国家的大学图书馆提供并履行扫描任务的。很显然,“百万图书计划”更像是一个实验,它的多国合作模式使得这个计划无法实现自立。
2002年,就在谷歌悄然成立了实况调查小组对扫描所有图书的可行性进行调查时,布鲁斯特•卡尔也在谋求着同样一件事,他恳请美国国会图书馆(Library of Congress)将其馆藏的2000万册图书进行数字化。在2002年11月卡尔的一次有关图书馆的发言中,他怀着极大的热情描述了“普遍获得所有人类知识已成为几代人的梦想”的想法,并且坚定地认为古代的亚历山大图书馆就已经在成功地将人类知识集于一处方面做出了榜样。他说,现在的美国国会图书馆应该通过将全部的馆藏图书数字化来媲美甚至超过从前的亚历山大图书馆的辉煌。卡尔是一个有着强大信念的“牛虻”式的人物,他是如此执着于自己的梦想,并且因这个梦想而激动不已,早已将妨碍他实现梦想的种种可能最小化。他很随便地就做出断言,整个美国国会图书馆的藏书数字化工作只需要花费1亿美元就可以完成。卡尔没有解释他是如何计算出这个数字的,但他却乐观地认为美国国会图书馆会愉快地将其所有藏书装船,并统一送往位于印度的海得拉巴进行扫描——之前卡尔在堪萨斯市购买的那批图书就是在那里实现的数字化。
2002年,谷歌的研究小组在总结各个图书数字化项目的经验教训时发现,是花费10美元还是100美元来完成一本书的数字化,取决于许多因素。如果按照平均一本书需要50美元费用计算的话,完成世界范围内的3000万册图书数字化所需要的费用将会是一个惊人的数字:15亿美元。当时的谷歌正处于财富迅速增长的阶段,从2000年的年收益1900万美元、净亏损1500万美元,跃升为2002年的年收益4.4亿美元、净利润约1亿美元,这是振奋人心的增长。但是,以它当时的规模去花费15亿美元的庞大数目进行图书数字化,从财务角度来说显然是不可行的。