首页 >> 图书情报学
陈铭:谷歌图书与Hathitrust比较
2017年08月10日 12:24 来源:《图书馆杂志》 作者:陈铭 字号

内容摘要:谷歌图书和Hathitrust是两个发展迅速的大型的电子书仓库,一直走在图书馆领域的前端,它们有相同点也有不同点。

关键词:谷歌图书;Hathitrust;电子书;仓储

作者简介:

  原标题:谷歌图书与Hathitrust的比较与启示

  作者简介:陈铭,女,南京大学信息管理学院,博士,讲师。研究方向:期刊评价、图书馆服务、开放存取、电子书等,E-mail:chenming@nju.edu.cn。南京 210023

  内容提要:谷歌图书和Hathitrust是两个发展迅速的大型的电子书仓库,一直走在图书馆领域的前端,它们有相同点也有不同点。为了帮助国内图书馆创建符合自身特色的电子书仓储,探索比较它们的异同可以为发展数字出版以及电子书仓储带来全新的视角。作者采用了比较的研究方法,不仅比较了两者之间的发展历程、创建目的;比较了两者的资源数量、资源质量以及包括数字化扫描、存储、运行系统、版权管理的运作模式;而且还详细比较了两者的数据库功能。在分析了两者各自的特点和优势以及深入阐述了国内电子书仓储的建设现状后,作者得出了谷歌图书和Hathitrust对于国内图书馆发展大型电子书仓储业务具有的启示:海量的内容资源、强大的数据库功能、版权策略的助推、合作发展的优势和资源质量的保障。

  关 键 词:谷歌图书 Hathitrust 电子书 仓储

  标题注释:本文系国家社科基金青年项目“图书馆电子书服务体系的构建与评价研究”(项目编号:13CTQ013)和江苏省教育厅高校哲学社会科学研究项目“高校图书馆电子书的评价与利用研究”(项目编号:2013SJD870012)的研究成果之一。

  0 序言

  谷歌图书和Hathitrust是两个发展迅速的大型的电子书仓储,一直走在图书馆领域的前端,它们有相同点也有不同点。它们的巨大发展给国内图书馆界的发展带来深刻的启示。国内商业机构和图书馆界也一直在积极建立数字图书馆,有些已发挥了巨大的作用,有些正欲发挥作用,在建设过程中也有一些成功的经验和不足的教训。探索比较谷歌图书和Hathitrust的异同可以为国内发展数字出版以及电子书仓储带来全新的视角。

  1 谷歌图书和Hathitrust的概念

  1.1 发展历程

  谷歌是一个商业性的机构,它的发展历史比较长,2003年12月谷歌推出对书摘搜索服务的Google Print(谷歌打印)试用版。2004年10月谷歌与美国的兰登书屋合作,正式启动搜索图书全文服务的谷歌图书计划。Google Print在2005年11月更名为Google Book Search(谷歌图书搜索)。它扫描了书的封面页、目录页、版权页及部分内容页并放在网站上,为全世界公众提供在任何地方都能搜索的便捷的在线全文检索服务。谷歌还先后推出了与出版商合作的“Google Print Publisher”(谷歌打印出版商)子项目和与图书馆合作的“Google Print Library”(谷歌打印图书馆)子项目[1],为丰富资源的来源找到了解决途径。目前谷歌已与至少28家重要的图书馆、100多个国家或地区的10000多个出版商和作者建立了合作关系。谷歌对其合作伙伴所拥有的数以百万计的文献资源进行扫描及数字化并加入到谷歌的数据库中,而合作伙伴也可以获得该资源的一个数字拷贝。2010年,谷歌还宣布启动了数字书店,称作Google Editions(谷歌版本),所有的内容均被放在云端。谷歌扫描了超过120万本的书。它还宣称到本年代末,要扫描所有现存的书籍。

  Hathitrust由美国机构合作委员会(Committee on Institutional Cooperation,CIC)的12所大学联盟及加利福尼亚大学(University of California,UC)系统所属的11所大学图书馆于2008年发起,这些研究图书馆合作为包括数百万图书在内的大量数字馆藏创建机构库,起名为Hathitrust,将大学图书馆数百年承担的信息保存和获取。Hathitrust是一个非营利机构,作为来源于北印度语大象一词的机构库,它致力于支持数字化各图书馆的资源,并创建一个庞大的资源库。Hathitrust项目与谷歌图书搜索有很深的联系,CIC和UC组织内的图书馆都曾经通过加入谷歌图书搜索项目数字化了它们的部分馆藏资源。Hathitrust项目成立后,这些图书馆也会继续和谷歌公司合作,共同数字化它们的馆藏资源,目前Hathitrust数据库中有超过200万册的图书是由谷歌数字化的。这些图书资源和Hathitrust扫描的其他资源一起都可以在Hathitrust里被检索获取到。

  1.2 目的比较

  Hathitrust是一个非营利性的组织机构,不会利用所拥有的数字资源去寻求盈利。虽然数字化和保存文献资源需要大量的资金,但项目经费来源于参与Hathitrust的各个资金雄厚的高校。它们在初始加入时,会要求根据它们要被数字化的文献资源的数量交纳一笔初始经费,以后每年再缴纳保存数字资源所需的年费。Hathitrust项目致力于聚合全美最优质的图书馆资源和最顶尖级的专家,将丰富的、具有创新意义的经验应用于该项目中,并寻求更多合作者加入其中。目的是确保文化记录能够被保存并且在未来能够长期被获取。通过共同收集、组织、保存、交流与分享人类知识成果,建立起一个由各成员机构共同拥有与管理的,可靠的,日益全面的图书馆数字资源仓库,减少资源长期保存的空间与花费,满足成员机构的需求,发挥整体大于部分之和的作用。

  而谷歌是一个商业性的机构,是以营利为目的。谷歌所拥有的千万册数字化的图书能为其吸引来更多的用户,用户数量的增加还能带来谷歌广告的升值,从而可以赢得更多的收入。谷歌宣称此项计划是为了实现其“组织全球信息,并使之在全球范围内可获取和可利用”的使命。“将继续发展其技术并扩大与全世界出版商和图书馆的合作关系……并从数字图书馆向整个图书馆业、互联网信息服务业乃至世界文化的传播方面扩展。”[2]谷歌开始从一个单纯检索服务提供商向知识提供商转型,逐步向数字化知识资源进军。

  2 谷歌图书和Hathitrust的资源数量和资源质量比较

  2.1 资源数量比较

  截至2015年9月,根据网站统计(https://books.google.com/)谷歌已扫描了2500万种图书,包含了很多大型研究图书馆里的内容,谷歌将这些图书馆的全部或部分馆藏图书通过扫描制成电子版供全球读者通过谷歌在网上免费检索阅读。其中约100万种书可以免费预览全部内容,100万种书是公版书,另外500万种是绝版而且购买不到的图书馆藏书。加入谷歌计划的还有出版商,如霍顿·米福林、麦克格劳·希尔、牛津大学、剑桥大学等著名出版商。谷歌收集这些出版商已出版或即将出版的出版物。谷歌也与个人作者签订协议,收集其创作的图书,把它们都扫描放入数据库中。

分享到: 0 转载请注明来源:中国社会科学网 (责编:毕雁)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们