从交互维度到交互功能：构建数字图书馆交互评价的理论模型_数字图书馆论文

从交互维度到交互功能：构建数字图书馆交互评估理论模型，本文主要内容关键词为：维度论文,数字图书馆论文,模型论文,理论论文,功能论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

DOI：10.13530/j.cnki.jlis.160006

修回日期：2015-10-09

0 引言

数字图书馆是一种交互信息检索系统，是一系列交互元素的集合[1]，支持用户与系统的交互是数字图书馆开发与设计的重要方面[2]。交互的成功是用户有效获取数字图书馆资源的重要保证，为此，应将交互功能纳入到数字图书馆设计和评估活动之中。

数字图书馆评估方法和路径多种多样，通常可以归纳为以系统为中心的评估和以用户为中心的评估。当前的数字图书馆评估仍是以系统为中心[3]，以用户为视角的评估相对短缺，尤其缺少针对数字图书馆交互功能的评估。毋庸置疑，数字图书馆支持的是用户与知识的互动[4]，从这一视角，评估应以用户而非系统、以交互而非界面为焦点[5]。因此，本研究拟从交互的角度探讨数字图书馆的评估，此角度既能了解系统功能的质量，又能揭示用户对数字图书馆不同维度的感知，提供了一种可以整合系统和用户两种途径的新视角。根据李月琳等的研究[6]，在检索过程中，用户与数字图书馆在技术维、信息维与任务维等不同维度上进行交互，从而影响用户与系统的交互绩效。然而，这些维度如何影响用户对数字图书馆交互功能的评估，尚待厘清。数字图书馆的交互功能体现在多个方面，就其信息检索系统的本质而言，搜索和浏览功能[7]是最为重要的交互机制：数字图书馆的搜索界面和结果界面共同支持用户的搜索活动，与此同时，这两种界面还具有支持用户浏览以获取有用信息的功能，用户通过搜索和浏览实现与系统的交互。系统所提供的内容与技术也同时体现在这些界面上，并通过这些界面传递给用户，用户便是在不同的界面与层次上实现与系统的交互，获取有用信息，以支持工作任务的完成。因此，数字图书馆交互功能对用户搜索过程的支持往往决定着一个数字图书馆的发展前景。

基于上述问题，本研究以交互为中心，关注数字图书馆交互功能对用户搜索过程的支持，试图厘清用户与不同层面或维度的交互如何影响其对数字图书馆交互功能的评估，探索数字图书馆交互功能评估的可预测性，以此帮助数字图书馆完善交互评估体系，提升其交互功能的开发与设计。

1 文献回顾

1.1 数字图书馆评估研究

评估是数字图书馆非常重要的研究领域。美国数字图书馆创始计划一期和二期即包含了众多评估项目。此外，一些研究机构也组织了大量的数字图书馆评估项目，催生了一批与项目同名的评价指标，包括DigiQUAL[8]、E-Metrics[9]等。我国的数字图书馆评估研究起步虽晚，但也开发了一些普适性的标准，如WH/T47—2012(图书馆数字资源统计规范)[10]、CALIS数字资源评估指标体系[11]等。上述评估指标体系，既有单独针对电子资源/数字资源或是数字服务的指标，也有全面考评数字图书馆质量的指标。

Saracevic提出数字图书馆评估的理论框架，该框架由以用户为中心的社会、机构、个人，连接用户与系统的界面，及以系统为中心的工程、处理、内容层面构成[1]。在此基础上，Zhang Y构建了由内容、技术、界面、服务、用户、情境六个方面构成的数字图书馆整体评估指标体系，发现用户首先关注的是内容的可用性、服务的可持续性，其次关心内容和服务对于交互的影响，再次关心使用数字图书馆的绩效[12]。Xie的研究也表明可用性是用户最为关注的问题，其余依次为藏品质量、服务质量、系统运行效率、用户意见征求[13]。

一些学者跳出既有数字图书馆概念界定的藩篱，从结构—功能的视角构建数字图书馆的概念模型，并设计数字图书馆评估指标。DELOS模型[14]、5S模型[15]、DiLEO[16]都是被用于数字图书馆评估的概念模型。DELOS小组将数字图书馆各个利益相关群体关注的问题抽象出来，形成数字图书馆域，包含用户、数据/藏品、系统/技术、使用四个要素，基于此，DELOS小组建立了一套整合性的评价指标体系[14]。5S模型以流—结构—空间—情境—社会(Streams-Structures-Spaces-Scenarios-Societies)为基础，提炼出一个抽象的数字图书馆四元组模型：仓储、元数据目录、服务(索引、搜索、浏览)、社会[15]，研究人员据此构建了数字图书馆质量指标体系[15]和5SQual质量评估工具[17]。DiLEO是数字图书馆评估领域的本体，揭示了数字图书馆评估领域的概念及其关系[16]。Tsakonas基于该本体的研究表明数字图书馆评估活动仍是以系统为中心，研究聚焦于绩效测评、效果及技术卓越性三个方面[3]。

1.2 数字图书馆评估指标

1.2.1 用户和系统之间的交互——可用性

可用性被广泛用于数字图书馆评估。由于可用性测试发生在人工控制的环境中，结果不具有代表性[18]，需要通过结合真实任务[19]、实时交互反馈[20]等加以克服。此外，尽管存在大量的可用性标准，但必须对其进行调整以适应数字图书馆的用户群[21]。目前，数字图书馆可用性评估应当包含哪些要素并无定论。Nielsen[22]提出的可学习性、效率、可记忆性、出错率、满意度的使用率最高。除此以外，易用性[23-24]、有效性[7，12]、一致性[12]也有较高的使用率。可用性的评估通常基于用户对可用性界面的感知，一些学者专门研究数字图书馆用户界面评价，如黄晓斌等从网站结构、页面表现、人机交互、网络性能四个方面构建了界面评价细则[25]。

1.2.2 用户与内容之间的交互——有用性

有用性评估包含对内容本身的评估和对用户与内容交互的评估。内容的评估分为性质、结构和管理三个方面[18]，包括数字对象、元数据、藏品、目录、完备性等[26]。其中，数字对象是唯一的数字图书馆资源类型[12]，采用数字图书馆特定指标，如保真度[27]、可访问性、针对性等[26]进行评估；其他的则采用传统指标测度，如准确性、易理解性、清晰度、可读性等[12]。考察用户与内容交互的指标借鉴了大量用户研究领域的成果，如信息需求、满意度影响因素等[18]。

1.2.3 系统与内容之间的交互——绩效

绩效评估集中在软硬件技术和服务的评估。例如软硬件都适用的易用性、响应时间、成本等[12，28]，专门针对硬件技术的指标，如可靠性[24]、效果[29]、效率[30]等，软件指标如相关性[12]；服务的测评集中于完整度、可靠性、响应性、可达性、有用性几个方面[12]。另外，数字图书馆咨询服务已形成一个专门的领域，如Lankes识别出数字图书馆参考咨询服务的六个指标：满意度、成本、礼仪、准确性、重复用户、意识[31]，White建立了包括使命和目的、结构和责任、核心功能、质量控制四个领域的数字参考咨询框架体系[32]。

1.3 数字图书馆交互研究

用户与系统的交互是数字图书馆的重要内容[2]，然而，这种交互是复杂的，其复杂性是由用户、信息资源、信息对象、任务复杂度共同决定的[18]。Fuhr构建了数字图书馆交互三要素模型(The Interaction Triptych Model)，描述了用户、系统、内容之间的交互。内容与系统之间的交互表现为绩效因素，如查全率、查准率、响应时间等；用户与系统之间的交互表现为可用性因素，如效果、满意度等；用户与内容的交互表现为有用性[18]。GROW数字图书馆项目以交互性作为其概念框架和设计理念，Budhu认为交互发生在信息资源、藏品、情境三个层次，相互性、反馈、及时性等因素是影响交互的核心因素[5]。Zhang X等发现用户的交互受数字图书馆搜索和浏览交互设计的影响，搜索方面过多的零命中、出错反馈、不正确的搜索结果显示等增强了用户的挫败感，导致不良交互绩效[7]。

在使用数字图书馆时，用户通常需要完成特定的任务。在任务情境下，数字图书馆仅是实现任务目标的工具，而个人与数字图书馆的交互活动仅是实现目标的必经过程[33]。Marchionini指出数字图书馆的设计和评估需以用户为中心，其一便是评价用户的信息需求以及由此产生的任务[34]。任务导向的数字图书馆评估，应当考察任务类型、任务阶段、任务绩效等之间的差异，对组织层级的冲击、信息获取系统的类型和进程活动的类型等因素[18]。

基于任务的信息检索是情报科学的重要研究领域之一，Li Y和Belkin提出任务的分面分类框架[35]，为界定和测度与信息搜寻相关的任务提供了理论基础。基于此框架，他们探讨了工作任务和用户交互信息行为之间的关系[36]。李月琳等提出的数字图书馆交互三维模型表明，数字图书馆以技术为支撑向用户提供信息资源，在使用数字图书馆完成目标任务的过程中，用户与数字图书馆在信息、技术和任务三个层面/维度进行交互，用户是交互过程的核心[6]。基于该模型开展的实验研究表明，信息维度的“信息充分性”，技术维度的“栏目组织合理性”“导航清晰性”“界面易用性”，任务维度的“获得任务所需信息的信心程度”能预测用户与数字图书馆的交互绩效[6]。

文献综述表明，以往的研究关注数字图书馆的整体评估，学者们见仁见智，观点不一，然而，研究结果的多样化也造成了共识性缺乏的弊端。这种共识性的缺乏往往影响研究结果的推广应用，削弱了评估研究领域的社会效益。另一方面，指标体系的繁杂也使评估研究变得复杂，且耗时耗力，影响了评估的效率。因而，识别关键的评估指标，简化数字图书馆交互评估体系也是本研究的目的之一。

2 理论框架

本研究借鉴以上学者的成果，总结以往研究中具有一定共识性的评估指标，细化李月琳等提出的三维模型中的各交互维度，明确子维度(见表1)，并以此作为本研究的理论框架，深入探索哪些因素影响用户对数字图书馆交互功能的评估，以揭示可预测用户对数字图书馆交互功能评估的因素，识别影响用户评估数字图书馆交互功能的主要指标，构建有效的数字图书馆交互功能评估模型。

3 研究方法

本研究采用实验研究方法，将卡片分类、设计模拟仿真工作任务、观察及出声思考等方式相结合，探讨用户在不同交互维度上的感知与他们对数字图书馆交互功能评估之间的关系。

3.1 变量与测度

“用户与数字图书馆在不同层面的交互”的测量指标及操作化定义见表1。实验中的问卷设计基于表1对各指标的界定，进一步细化。如“可用性”，进一步细化为“易学性”“易用性”“可记忆性”“一致性”“高效性”等。问卷中的题项通常以简洁易懂的表述呈现，并采用7点Likert量表进行测量。用户对“数字图书馆交互功能评估”的测量是在用户完成搜索后，通过综合评估“系统的搜索和浏览功能设计(即系统的交互功能设计)对其搜索过程的支持程度”来完成，也采用7点Likert量表来测量。

3.2 实验设计

3.2.1 实验系统

本次实验所选取的数字图书馆为中国知网(CNKI)，选择实验参加者平常使用CNKI的学生宿舍作为实验场所。他们使用统一的笔记本电脑完成实验任务，笔记本电脑装有屏幕录像专家v2013，全程记录实验参加者与数字图书馆的交互过程。

3.2.2 实验任务

模拟仿真工作任务情境是交互信息检索实验中备受青睐的设计模式[37]，但也因模拟任务与真实任务存在偏差而遭到质疑[38]。因此，本次实验设计了四个模拟仿真工作任务，同时要求实验参加者携带一个真实工作任务参与实验，以增强研究结果的可靠性。任务主题选自社会热点及学生关心的话题，初始共设计了12个主题，采用方便抽样选取10名来自不同专业的数字图书馆用户，要求其采用卡片排序(Card Sorting)方法，按照检索意愿进行卡片排序，最终选定排在前四位的4个主题：微信与微博营销模式、雾霾的成因与防治、房价居高不下的原因、大学生就业困难的原因。之后，分别编制解决问题(Decision/Solution Task)和智识任务(Intellectual Task)两类[35]模拟仿真工作任务情境。

为避免实验中的学习效应(Learning Effects)，本研究采用4×4拉丁方块(Latin Square)实验设计，对模拟仿真工作任务进行排序。同时，将真实工作任务安排在四项模拟任务之前或之后，并依次轮换。根据实验设计，每一轮实验需招募8名实验参加者参与实验。

3.2.3 实验参加者的招募

为增强研究结果的可靠性，本研究共招募48名(6×8)实验参加者，根据实验设计，实验参加者及任务顺序如表2所示。考虑到不同的学历层次对搜索的影响，实验招募本科生、硕士生、博士生各16名，招募渠道为某高校BBS。48名实验参加者分别来自33个不同专业，男女比例分别为39.6%和60.4%。采用7点Likert量表对实验参加者使用CNKI的基本经验进行调查，发现其中59.6%经常使用数字图书馆，40.4%能够熟练使用CNKI，74.5%认为在CNKI的检索比较成功。可见，实验参加者总体来说具有使用数字图书馆的经验，尤其是使用CNKI的经验。

3.2.4 实验流程

首先，被试者阅读和签署承诺书，填写基本信息问卷。基本信息问卷收集用户的人口统计学变量信息及使用CNKI及其他数字图书馆相关经验的数据。然后，阅读任务1，完成搜索前问卷。该问卷收集与任务维相关的数据。随后在CNKI中进行检索，检索的过程中需要进行出声思考(Thinking Aloud)，实验中提供出声思考指南。完成检索之后填写搜索后问卷，该问卷收集与信息维相关的数据。每一项任务都要填写搜索前问卷和搜索后问卷。在完成所有的模拟仿真工作任务之后，填写整体性评估问卷；真实任务完成之后，也需填写一份整体性评估问卷。整体性评估问卷着重收集技术维及用户评估交互功能的相关数据。最后，在实验完成之后，就实验内容对实验参加者进行简短的访谈并支付实验报酬。每次实验耗时约1.5小时，实验全程采用屏幕录像专家软件摄录。

3.3 数据分析

研究采用SPSS 19.0进行数据分析，通过Pearson分析和Stepwise回归分析探讨用户在不同维度的交互与用户对CNKI交互功能评估之间的关系。齐雪的分析表明，本研究中的模拟仿真工作任务和真实的工作任务并没有显著影响用户的交互绩效及评估结果[39]，因而，本研究在数据分析的过程中对两类任务未作区分。

4 研究结果

4.1 信息维对交互功能评估的影响

Pearson相关分析的结果见表3。信息维的可获得性、准确性、易理解性、保真度、馆藏全面性、完整性、有用性及适用性与用户对CNKI交互功能的评估结果显著相关。

Stepwise多元回归表明适用性、易理解性、准确性及信息的可获得性可以预测用户对系统交互功能的评估。表4和表5分别显示回归模型和回归系数。

模型4的R方为44.7%，调整R方为42.3%，其解释程度较为理想。分析表明，残差成正态分布，满足方差齐性假设；Tolerance指标及VIF值显示满足非共线性假设；Durbin-Watson值(1.621)显示满足相邻观察值的独立性假设。可以得知该回归模型并未违反回归分析应满足的相关假设。因此，该模型是成立的，即信息维的适用性、易理解性、准确性及可获得性显著影响并可预测用户对系统交互功能的评估结果。T检验表明(见表4)，各预测变量的p值均显著(p＜0.05)。通过表5可知，适用性、易理解性及可获得性均可正向预测用户对CNKI交互功能的评估，而准确性则负向预测了用户对交互功能评估的结果，关于这一研究发现，在5.1中有详细阐述。其中，适用性是最为重要的预测指标。

4.2 任务维对交互功能评估的影响

Pearson相关性分析表明，搜索任务困难程度(r(96)=-0.258，p＜0.05)与CNKI对搜索和浏览功能的交互支持程度呈显著负相关。

Stepwise多元回归分析表明，任务维的各子维度中，仅有用户感知的搜索任务困难程度显著影响并可预测交互功能评估结果(见表6和表7)。

表6显示，模型1的R方值为6.7%，调整R方仅为5.7%，该模型解释能力偏弱。通过残差的正态分布及方差齐性检验，以及Durbin-Watson值(1.516)可以看出，该模型符合回归分析应满足的假设，因此搜索任务困难程度可以预测用户对数字图书馆交互功能的评估，且B值为-0.340(见表7)，表明搜索任务的困难程度负向影响用户对交互功能的评估，即用户搜索信息难度越大，对CNKI的交互功能评价越低；越小，则越好。

4.3 技术维对交互功能评估的影响

Pearson相关性分析结果显示(见表8)，导航功能完备、导航条是否容易找到、浏览工具是否容易找到、馆藏列表区分度、符合浏览规律、页面排版布局合理、主题突出、链接丰富有效、易学性、高效性、网站组织有序化及可控性，与用户对数字图书馆交互功能的评估结果显著相关，且均为正向相关。

从表9可以看出，链接丰富有效、网页组织有序化、页面排版布局合理均进入回归模型，模型1～3均显著(p＜0.01)。其中，模型3的解释力最强，链接丰富有效、网页组织有序化及页面排版布局合理解释了变异量的44.2%(R方值)，调整R方值为42.4%，模型的拟合度较好。

表10显示，模型3中不同指标的容差值介于0.677至0.804之间，VIF值未大于评鉴指标值10，表明进入回归方程的自变量间没有线性重合的问题，残差符合正态分布及方差齐性假设。Durbin-Watson值为1.669，该模型满足回归分析的相关假设。模型3的预测变量中，链接丰富有效最为重要。同时，各预测变量T检验结果均显著(p＜0.05)，这些指标正向影响并可预测用户对CNKI交互功能的评估结果。

4.4 各维度对交互功能评估的综合影响

以上部分独立分析了不同维度与用户对数字图书馆交互功能评估之间的关系，本部分综合考量不同维度的子维度与用户对交互功能评估之间的关系。Stepwise多元回归分析的结果如表11和表12所示。

结果显示，按照指标对于变异量解释能力的大小，依次进入回归模型的指标分别是适用性、链接丰富有效、页面排版布局合理、主题突出、搜索任务的困难程度、馆藏列表区分度。表11显示，模型1～6均显著，模型2～6的调整R方均超过了40%。其中模型6的解释能力最强，共解释了62.5%的变异量，该模型的调整R方为59.9%，说明模型的拟合度较优。

容差值及VIF值表明进入回归方程的自变量间没有共线性问题，残差符合正态分布及方差齐性假设，Durbin-Watson值(1.839)表明不存在自相关。由此可以看出，该模型并没有违反回归分析应满足的相关假设。从回归系数来看，各变量的T检验均显著(p＜0.05)，除搜索任务困难程度及馆藏列表区分度外，其余各预测变量均能正向预测用户对CNKI交互功能的评估，而搜索任务困难程度及馆藏列表区分度则负向预测用户对CNKI交互功能的评估。在这些预测变量中，适用性是最为重要的预测变量。

数据分析表明，显著影响用户对数字图书馆交互功能评估的子维度可分为两类：一类是关联性子维度，即通过Pearson关联分析发现的与用户评估结果相关的子维度；另一类是预测性子维度，即通过Stepwise回归分析明确的可预测用户评估数字图书馆交互功能结果的子维度。据此，本研究构建了基于多维度用户交互的数字图书馆交互功能评估理论模型(见图1)。由于“准确性”与“馆藏列表区分度”的关联性分析结果和回归结果不一致，但又对用户对数字图书馆交互功能的评估存在一定程度的影响，故仅将其归入“关联性子维度”。

注：

可有效预测用户交互功能评估的子维度

与用户交互功能评估显著相关的子维度

图1 基于用户多维交互的数字图书馆交互功能评估理论模型

5 讨论与结论

本研究探讨交互维度与用户对数字图书馆交互功能评估之间的关系，构建了基于多维交互视角的数字图书馆交互功能评估理论模型。该模型从繁多的数字图书馆评估指标中明确了交互功能评估的关联性子维度和预测性子维度。前者集中在信息维和技术维，与用户对数字图书馆的交互功能评估结果显著正相关或负相关；后者则分布在不同维度，可预测用户评估数字图书馆交互功能的结果。本研究为评估数字图书馆的交互功能提供了简化的、可操作的理论模型。相较于其他数字图书馆评估模型，如DELOS模型[14]、5S模型[15]、DiLEO[16]这些更多针对数字图书馆综合评估的概念模型，本研究构建的模型更具针对性和可操作性，且聚焦于数字图书馆的交互功能。下面进一步讨论这些交互维度与用户评估数字图书馆交互功能之间的关系。

5.1 信息维、技术维与数字图书馆交互功能的评估

本研究的结果支持了Xie[13]的研究发现，即用户重视数字图书馆的可用性。基于技术维度的回归分析表明，技术维度的回归模型能较好地预测用户对数字图书馆交互功能的评估。另外本研究也同时支持了Zhang Y[12]的研究，表明用户同样重视数字图书馆内容的有用性。在信息维度与技术维度上，回归模型均能有效预测用户对数字图书馆交互功能的评估。由此可见，对用户而言，数字图书馆内容层面的有用性和技术层面的可用性同等重要，信息维和技术维均是影响用户对其交互功能评估的重要方面。这一结果启示我们，数字图书馆具有良好的交互功能且要赢得用户，内容建设和可靠的技术支持缺一不可。

同时，本研究并未发现传统的可用性指标，如易用性、可记忆性、一致性等，显著影响用户对数字图书馆交互功能的评估。这一方面说明，尽管“可用性”的确是人机交互研究的重要方面，但是系统的“可用性”和“交互功能”存在概念上的区别，两者不能使用同样的指标来衡量和评估。另一方面也说明实验中所使用的CNKI已在一定的程度上满足传统的可用性指标，用户对这些指标的关注下降，而对其页面表现及网站结构的相关指标则更为关注。这一点从研究发现的关联性子维度和预测性子维度可见一斑，尤其是预测性子维度，基于技术维度的回归模型中明确的因素均与页面表现和网站结构有关，而在综合维度的回归模型中，与页面表现相关的因素也占了一半。可见，针对数字图书馆的交互研究应超越传统的可用性指标，更多关注页面表现与网站结构两个子维度，以更准确地评估数字图书馆系统的交互功能。

研究发现，信息的适用性和有用性与用户对数字图书馆的交互功能评估的相关性最强，因而，提供适用的信息，增强内容的有用性是数字图书馆内容建设的重要任务，也是提升数字图书馆交互功能的必经之路。回归分析表明，信息的适用性越强、越易于理解、可获得性越强，用户对数字图书馆交互功能的评估结果越好；适用性是最重要的预测变量。这启示我们，在数字图书馆资源建设过程中，更多考虑用户群体特点及其工作任务和情境是十分必要的，只有如此，才能提供满足用户需求的适用信息。

然而，研究发现，尽管信息的准确性与数字图书馆的交互功能评估正向相关，但在回归模型中，准确性却是负向预测用户对数字图书馆交互功能的评估。导致这一结果的原因可能是由于模型中不同因素之间的交互，影响了准确性对数字图书馆交互功能评估的预测；此外，也可能存在一些潜在的、未被发现的因素或中介变量，影响了准确性与数字图书馆交互功能评估之间的关系。例如，用户如果在获得准确信息的过程中付出了过多的交互努力和承受了过重的认知负担，都可能影响用户对系统交互功能的评估，给数字图书馆带来负面的影响。再者，样本中的异常值也可能影响回归的结果。总之，就目前的研究结果，准确性不是一个很好的预测指标，值得进一步探讨。

综合各维度的回归分析发现，技术层面的页面表现是最为突出的子维度，其中的因素包括链接丰富有效、页面排版布局及主题突出，能有效预测用户对数字图书馆交互功能的评估。这一发现对数字图书馆的设计具有实践意义，即在开发和设计数字图书馆的过程中，开发和设计者应着重考虑这几项因素，从而有效提升数字图书馆的交互功能。在综合各维度的回归模型中，馆藏列表区分度负向预测数字图书馆的交互功能，与Pearson相关分析的结果相左，原因极有可能是中介变量的存在、不同因素之间的交互及异常值的存在。因而，馆藏列表区分度也不是一个很好的预测指标。

5.2 任务维与数字图书馆交互功能的评估

本研究将任务作为用户的交互维度之一加以考察，试图探究其对数字图书馆评估的影响，尤其是对交互功能评估的影响。相较于数字图书馆的内容和技术支持，任务对用户与数字图书馆的交互绩效影响较小。虽然在此前的研究中，也发现任务与交互绩效相关，但仅有“获得任务所需相关信息的信心程度”能有效预测用户的交互绩效[6]，本研究印证了这一结果。在数字图书馆的交互功能评估中，相比于信息维和技术维，任务维对预测用户对数字图书馆交互功能的评估表现偏弱。虽考察了任务的诸多维度，但仅有“搜索任务困难度”与数字图书馆的交互功能显著相关，并能有效预测用户对数字图书馆交互功能的评估结果。尽管调整R方偏低，但从不同变量的残差分析来看，回归模型合理，模型F值显著，表明该要素是较好的预测指标。这一结果启示我们，该子维度在开发和设计数字图书馆交互功能时需引起重视，即应增强系统对不同困难程度任务的支持，尤其是高难度搜索任务的支持；适应并支持不同困难程度的搜索任务，可提升数字图书馆的个性化性能。从这一角度看，本研究对推进基于任务的个性化信息检索的研究具有一定意义。

更为重要的是，由于任务只在有限的方面影响用户与数字图书馆的交互绩效及对数字图书馆的评估，因而，在数字图书馆评估及交互信息检索系统评估过程中，我们确实可以摒弃评估实验中采用模拟仿真工作任务情境还是真实工作任务情境的争执[6]，采用任何一类任务或者是混合两类的任务类型。取而代之的应是重视“搜索任务困难度”这一因素，即在评估研究中，尤其是实验研究中，任务设计要考虑不同的工作任务是否引发不同困难程度的搜索任务，如果忽略了这一因素，采用困难程度相当的任务设计，评估的结果是不全面且存在偏差的。因而，本研究的发现为更科学地设计评估实验中的任务类型提供了实证依据。

5.3 研究启示、局限性与未来的研究

本研究基于以往的数字图书馆评估研究，从繁多的评估指标中析出与用户对数字图书馆交互功能评估相关的关联性子维度及预测性子维度，明确了影响用户评估数字图书馆交互功能的重要子维度。这些子维度同时也是数字图书馆在满足基本的可用性要求之后，在设计交互功能时尤其需要重视的要素。本研究所构建的数字图书馆交互评估理论模型简化了数字图书馆交互功能的评估，模型所确定的关联性子维度和预测性子维度可为制定数字图书馆交互功能评估标准和开发数字图书馆交互功能评估工具提供参考。此外，本研究为数字图书馆交互功能的开发和设计提供了实证依据，明确了开发过程中应重点关注的因素，尤其是应重视预测性子维度所昭示的方面，为提升数字图书馆的交互功能提供了明确的方向。同时，本研究将任务这一情境要素融入数字图书馆评估研究中，不仅发现用户感知的搜索任务困难程度显著影响其对数字图书馆交互功能的评估，还为信息检索系统评估研究中如何更科学有效地设计任务提供了借鉴。

本研究具有一定的局限性，数据来源仅取自于实验过程中收集的问卷数据，并未分析视频资料。此外，由于要求每位实验参加者带来一项真实工作任务，这些任务的特性表现不一，而为数据处理的方便，本研究把这48项真实任务当做同一任务(即T5)来看待，这在一定程度上可能会影响研究结果。本研究中数字图书馆交互功能的评估仅以用户的感知作为测评的依据，未来的研究将进一步从系统和用户角度完善交互功能评估的各项指标，继续探讨用户与数字图书馆的交互，分析实验的视频资料，探究用户与数字图书馆交互的关键成功因素，为更精确地评估数字图书馆的交互功能，提升数字图书馆交互功能的设计提供理论支撑和实证基础。

标签：数字图书馆论文; 回归模型论文; 用户研究论文; 交互界面论文; 绩效指标论文; 绩效反馈论文; 预测模型论文; 绩效目标论文; 可用性测试论文; 空间维度论文; 功能设计论文; 图书馆论文; 可用性论文; 维度论文;

从交互维度到交互功能：构建数字图书馆交互评价的理论模型_数字图书馆论文

猜你喜欢