自存储需求分析_图书馆论文

自存储的需求分析,本文主要内容关键词为:需求论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 自存储

自存储是开放存取的策略之一。这一概念最早是在1994年由英国南安普敦大学S.Harnad教授提出的[1],存储那些科研人员没有任何盈利想法的论文。自存储有3个实现途径:机构仓储、学科仓储(如arXiv,Cogprints等)和个人主页。可以存储预印本文档(Prepeer Review or Pre-refereeing),也可以存储后印本文档(After Peer Review or Refereed),统称为eprints文档;如果不被允许自存储,作者可以将更正表(Preprint与Postprint之间的差别)与Preprint一起放到档案中,这样读者看到的文章与发表在期刊上的文章是完全一致的。机构仓储(Institutional Repository,IR)自存储即作者将自己的文章存入IR的过程,自存储可以由作者本人进行,也可以由代理机构代为存储,如图书馆、所在机构或院系。

自存储方式交流的思想来源于计算机科学领域,早在几十年前,计算机科学领域就有了ftp存档,供全世界人们下载、使用。科研人员开始建立自己的个人主页,把文章存放在那里,供人们下载、阅读。个人主页的地址很难固定,作者本人也可能会因为各种原因中断更新,且个人主页上的内容不易被搜索或被特定的数据库收录。到20世纪90年代初,arXiv的建立,给物理学领域的科研人员提供了一个存储文章并提供开放访问的领地,这是学科仓储的开始。随后,各机构开始重视本单位各类智力产出交流与保存,IR开始建立。学科仓储和IR都有被收录的机制,更易被人们搜索、下载而不必知道它们的具体网络地址。

自存储对学术信息交流有着重要影响,对研究人员和研究机构将产生积极的影响。对研究者个人来说,将自己的论文通过自存储的方式开放获取,最明显最直接的好处就是文章的引用率提高,并由此提高文章的影响力及作者的学术声誉。传统期刊的文章发表周期较长,但是如果作者在收到文章发表通知的同时就将文章进行自存储,那么获取该文章就不必等到在传统期刊上发表出来之后,这样科学研究的周期将大大缩短,不仅订购了传统期刊的机构读者可以获取,所有对此感兴趣的读者也都可以获取。对研究机构来说,IR是存放工作文件、研究数据的安全地点,研究人员在以后的研究中,可以找到所有存储过的研究记录或者数据以备使用。对那些不便以传统期刊格式发表但又对研究发现有着重要支撑作用的资料,如大量的数据集、视频文件、各种格式的图形文件、音频文件以及多媒体资料等,都可存储在IR中并与其他研究者共享[2]。

2 自存储需求分析

2.1 来自信息产出者的需求

2.1.1 作者自存储论文的原因 研究人员的非盈利信息传播动机和利用需求是开放获取赖以存在的基本前提,这也是开放获取在学术领域兴起的关键原因。一方面,科研人员发表研究成果并不是希望从中获取经济利益,而是希望能最大程度的传播。因为作者出版学术著作或发表论文,其目的是为了获得学术承认,文章传播得越快、越广,就越有利于学术成果的传播,有利于其他学者在此基础上开展后续工作,增加作者文章的被引率。另一方面,研究人员又是使用者,免费、免除版权和授权限制的开放获取模式使研究人员能及时、方便、快捷地获取所需的信息,因此越来越多的研究人员开始选择开放获取模式。

开放获取的实现方式有两种:开放获取期刊和自存储。开放获取期刊是一种作者付费,读者免费的开放获取方式,即读者可以完全免费地获取、利用开放获取期刊上的论文,但作者必须支付一定的费用才能在开放获取期刊上发表文章。如科学公共图书馆(Public Library of Science,PLoS)向作者收取每篇论文的发表费为1 500美元;又如生物医学期刊出版中心(BioMed Central,BMC)规定稿件一旦被采用,作者需付论文处理费和发表费525~1 500美元;而Springer公司在其“Open Choice”的政策中,允许作者自由选择论文的开放权,对同意开放其论文的作者收取每篇论文3 000美元的费用。另据英国Wellcome Trust研究基金会的调查显示[3]:中档和高档质量的开放获取期刊平均每篇论文成本约为1 025美元和1 950美元。

开放获取的支持者正在极力鼓动科研人员将同行评议过的文章通过网络共享,目前国外越来越多的学术期刊在“开放获取”运动的压力下正逐渐放宽对作者的限制,允许他们将自己的科研论文自存储,即将其放到自己的主页上或放到机构仓储或学科仓储中共享。自存储作为开放获取的实现方式之一,被越来越多的作者接受并参与其中。

2.1.2 自存储给作者带来的益处

主要有:

1)扩大影响(获得高被引用率)。论文的被引率是评价学者成就的指标之一,因此学者都希望自己的论文被很多人阅读并引用,而开放获取恰恰可以实现这样的愿望。开放获取的论文可以被更多的人看到,从而产生更大的影响,比之传统出版方式的研究论文,开放获取的研究论文拥有更高的被引数,越是高引用数的论文来自于开放获取的可能性越大,反之低引用数的论文越有可能被限制了开放获取[4]。

S.Lawrence于2001年发表在“Nature”上的文章中提到[5],计算机科学方面可在线免费获取的文章比那些不能在线获取的会议文章多出336%的被引,而事实上在计算机科学领域,会议文章通常比杂志文章拥有更高声望。

Hajjem等调查了1992-2003年10个学科的引用数据,发现在大部分学科领域,那些在网络上可自由获取的论文比那些不能自由获取的论文要高出约50%的被引率[6]。而Eysenbach则发现[7],在论文发表后的4到10个月,开放获取论文的引用率可能是其他论文的2倍。在发表之后的10到16个月,前者的引用率增加到了后者的3倍。

研究表明在传统期刊上发表的,是否通过自存储方式公开的研究论文已经成为影响论文影响力的一个因素,如学科仓储的代表——arXiv.org上张贴的论文均获得了较高的被引。发表在2003年《天体物理学》(Astrophysical Journal)上75%的文章是开放获取的(以预印本形式存放于arXiv.org),这75%的文章获得了90%的引用率,开放获取文章引用率是非开放获取文章引用率的3倍;发表在2003年《核物理学A》(Nuclear Physics A),32%的文章通过arXiv.org开放获取,这部分文章获得了总引用率的78%,开放获取文章引用率是非开放获取文章引用率的7.5倍[8]。印度M.S.Swaminathan研究基金会的S.Arunachalam认为[9],即便许多期刊免除了发展中国家论文作者的开放获取发表费用,作者自存储仍然是最佳的出版模式。他认为开放性存储将是更好的选择,因为它能让我们更迅速地实现100%的开放获取。

2)带来经济利益。作者不但可以通过论文的被引来提高自己的声誉,而且还可以得到相应的经济收入。经济学家发现学术领域的工资受到文章引用率的很大影响,如Hamermesh,Johnson和Weisbrod的研究显示出经济学家发表的论文的被引用数对他们的工资有着积极的影响[10];Diamond从更大的范围研究了引用率与学术领域工资水平的关系,认为所有领域论文的引用率对学者工资都存在正相关,并估算出一个被引数对年度工资的边际影响为50美元左右[11];而Baser和Pema在研究经济学家工资的决定因素的文章中认为每多出一个被引,每年能给作者带来约40美元的经济收入[12]。

机构仓储和学科仓储(OA仓储)扩大了学术成果传播的范围,打破了地域、学科、行业的限制,使读者群得到拓展,缩短了传播的时滞,提高了成果的影响力和显示度。作者是自存储的直接获益者,既能够免费地永久获取学术文献,同时又能够扩大自己的影响。大量的证据显示自存储文章的引用率要高些,大多数学科的论文在引用率方面至少得到了两倍的增长,在某些学科领域中引用率甚至更高。进一步说,基于开放获取模式,学术成果可以方便地获得,研究周期也随之大大加快。与此同时,伴随着论文被引数的增加,作者的收入也随之增加,是名利双收。

2.2 来自信息利用者的需求

期刊价格不断高涨,研究机构很难买齐科研人员需要的全部文献,造成科研人员获取信息困难。自存储作为实现开放获取的有效途径之一,它的出现给苦于缺乏研究资料的科研人员带来一线曙光。由于OA仓储可以被搜索引擎搜索,因而对于读者来说无需知道它的具体位置,只需利用像Google这样的搜索引擎即可查到自己需要的文献,从而节约了时间。如果全世界所有科研人员都能将自己的论文自存储,将从根本上解决科研人员的信息需求。

OA仓储的读者绝大多数是科研人员,他们既是获益者,也是开放获取运动最重要的推动力量。不少科学家认为促进科技信息的开放获取是科学家的责任,对于接受纳税人投资进行科学研究的科学家来说,必须保证自己的研究成果能够成为社会公共知识资产的一个部分。科学家在构建OA仓储的同时也应积极参与自存储,将自己的研究论文存储在机构仓储或学科仓储之中,以实际行动推动开放获取向前发展。科研人员既是自存储的推动者、参与者,也是自存储的得益者。OA仓储对于作为读者的科研工作者来说不但消除了价格壁垒,而且提高了他们获取信息的便利性和获取信息的范围。

2.3 来自机构的需求

学术机构的名声对于其机构内的任何人都是重要的,而机构的研究成果对构建其名声是一个重要的影响因素。R.Crow认为,IR可以提高机构的声望,通过开放获取可以使机构的成果获得更多的引用,如果员工通过开放获取来推动他们的工作,那么机构将获取一个更有利的竞争环境。英国南安普敦大学的S.Harnad认为,基于自存储的机构仓储可以在以下3个方面对机构有利[13]:①可以使机构的研究成果的可见度和影响力最大化。②可以使研究人员更易获取其他机构的研究成果。③机构自身的自存储,可以缩减图书馆每年在期刊上花费的10%。

对于研究机构而言,一方面OA仓储使得他们资助的研究工作更加公开,影响更大,并得到更多的引用;另一方面,这些机构的图书馆在获取出版的科研成果时,不必受到各种手段的限制。IR有以下几方面的作用:①为收集、保存、传播学术内容提供了一个实用的框架。②为机构的学术成就树立品牌。③将校园的学术资源集中在一起,使学术成果能够为全球的用户所用。④实现机构内数字资源的长期保存。⑤有助于降低访问学术成果的成本。

2.4 来自出版方的需求

对出版商而言,OA是一种挑战。如果从传统的商业模式转变为OA模式,那么原来依靠销售所获取的高额利润将不复存在。出版商对OA一直持怀疑和抵制的态度。他们强调,现行科技出版体系的改变,将意味着学术标准的降低和成果互评的终结,并将出版费用转嫁到科学家及科研机构的头上,最终受害的将是整个科研事业。但是随着非盈利性的高水平OA期刊日益增加,越来越多的资助机构提供经费用于作者付费的OA出版,越来越多的高等教育和研究机构建议研究人员将成果发表在OA的期刊上,出版商的态度也在发生变化。另一方面,随着科研人员对自存储认识的提高,意识到自存储的益处之后,纷纷进行自存储,如果出版商不允许他们自存储的话,有可能出现流失优质稿源的危险。一旦出版商失去优质稿源,就会失去市场,从而危及其根本利益。现在,一些出版商采取了灵活的策略,让作者选择按照OA的付费方式,或者按传统的模式发表自己的论文,同时越来越多的传统出版商也放宽了对作者自存储权利的限制。美国化学学会(American Chemistry Society,ACS)宣布对于NIH资助的将要存入指定的开放获取仓储的研究成果仍给予出版[14]。

Elsevier是最大的科技期刊出版商,也是宣布向开放获取做出妥协的第一批出版商之一。2004年5月,Elsevier宣布调整其政策,允许作者将其论文“自存储”到机构仓储或学科仓储,正如Elsevier战略副总裁K.Hunter所说:“许多作者和机构都表达了拥有机构成员知识产品记录的希望,我们听到了,也做出了回应”[15]。Elsevier的作者现在被允许将自己的文章存放在IR中,这些IR必须是由文章中所报道的承担了该项工作的机构维护的。该公司期望它所出版的文章受到影响的不超过5%[16]。

早在2002年,自然出版集团(NPG)允许作者将其投稿的论文张贴到个人网站,对作者的要求是排他性许可出版,而不要求作者转让版权[17]。2005年1月10日,自然出版集团鼓励集团出版的原创研究论文的作者在论文发表6个月后,向相关的资助机构档案库提交作者被接受的同行评议的手稿。此外,还鼓励作者在论文发表6个月后,将手稿存放在所在机构的IR(以及个人网站)中,条件是在记录中提供杂志社网站的链接。

由JISC资助的SHERPA/RoMEO项目对目前出版商的版权政策及自存储进行了调查,对309个出版商调查显示[18]:60.84%的出版商允许作者对经过同行评审并修改过的后印本进行自存档,11%的出版商允许预印本的自存档,28.16%的出版商则对后印本及预印本都不允许自存档。而对10 299种期刊的调查结果显示:62.52%的期刊允许对后印本的自存档,28.52%的期刊允许对预印本的自存档,只有8.96%的期刊不允许自存档后印本和预印本。

2.5 来自图书馆的需求

2.5.1 图书馆的危机自20世纪90年代以来,随着不断的兼并和收购,商业出版者日益垄断期刊市场,大幅度地提高期刊价格。学术出版产业中暴利集团的出现使得图书馆经费危机日益升级。根据美国研究图书馆学会(Association of Research Libraries)的调查,自1986-2002年,美国的研究型图书馆期刊经费增加了227%,但是订购的期刊种数却只增加了9%,购买图书的种数则下降了5%。2003年美国研究型图书馆用于购买期刊的费用相对于1986年而言,涨幅高达260%,平均每份期刊在同期的价格涨幅为215%,而面对每年数量不断增加的期刊市场,美国研究型图书馆在2003年订阅的期刊总数只比1986年增加了14%。而自1986年以来,北美平均每个研究型图书馆订购的期刊削减6%,图书的订购削减26%。自1984-2005年以来,美国消费价格指数(CPI)增长了88%,高等教育价格指数(HEPI)增长了128%,而期刊价格指数(PPI)则增长了536%[19](见图1)。

图1 美国1984-2005年CPI,HEPI以及PPI的比较

大量网络数据库的出现方便了科研人员查找文献,但需要图书馆支付高额的使用费才能使用。如著名的Thomson公司的网络产品之一——Web of Knowledge在我国一个机构的年使用费约为8万美元,合人民币60多万元,这不是每个大学或研究所的图书馆都有能力支付的。

由此可见,各类文献资源的高额购买费和使用费给图书馆购买所需文献带来巨大困难,使大学和科研机构难以获得和利用重要的信息资源。图书馆无力继续维持研究所需资源,全世界研究人员能够利用的期刊在减少,可获得的学术著作急剧下降。可获得的学术研究资源的相对减少,将严重影响到科学研究的品质,一个可以预知的结果是,利用越来越少的文献,进行越来越多的重复研究。

2.5.2 OA仓储、自存储与图书馆 机构/学科仓储对任何人都是免费开放的,这对于当前缺乏经费的图书馆来说无异于“天降甘露”,对于缓解学术期刊的价格危机以及网络数据库方面的使用危机有很大的作用,是对图书馆经费不足的一种补充,提高了图书馆的信息保障能力。

机构/学科仓储也是科研机构和高校保存本机构学术研究成果和资源、实现机构内部交流的重要方式。图书馆作为机构的知识中心,在IR的方案设计、技术实现和内容维护等方面都能发挥重要作用。从2005年5月收集的对美国、法国、英国等13个国家机构知识库建设的问卷调查信息分析可知[20],接近50%的机构表示,是图书馆在专职负责IR,也有少部分机构是由图书馆和信息技术部门、学术管理层、档案单位或者其他多机构协作,联合管理机构仓储。

IR内容的充实需要科研人员的自存储支持,在得到他们的授权后,图书馆可以代为存储,把自存储工作落到实处,将IR真正建立起来。除此之外,图书馆可以承担OA资源长期保存的任务,也可以向用户宣传OA的基本知识和意义,提供当前开放资源的清单,等等。

3 结束语

归根到底,OA仓储对各方都是有利的,学者的自存储行为对其提供了有力支持,同时也能取得相应回报。一些IT公司也看到了OA仓储的潜在价值,如Google开始利用OA文档来充实自身的内容,以扩大用户数量和访问量。2004年11月,Google Scholar网站开通,以全新模式向用户提供网上所有可获得的学术文章,包括期刊论文、学位论文、技术报告等学术文献。Google鼓励作者和出版机构免费提供其学术论文供Google检索,利用Google强大的搜索功能,用户可以通过作者姓名、出版物名称、出版日期、文章标题等方式检索到相关文献(摘要或全文),并将搜索结果按相关程度排序。

标签:;  ;  ;  ;  ;  

自存储需求分析_图书馆论文
下载Doc文档

猜你喜欢