基于Agent的多通道人机交互系统的研究和实现

基于Agent的多通道人机交互系统的研究和实现

王强[1]2004年在《基于Agent的多通道人机交互系统的研究和实现》文中研究指明随着Agent技术的迅速发展,利用Agent编程技术解决实际问题逐渐开始成为可能。同时,在人机交互领域中,通道的增多和人性化要求的提高,导致人机交互软件的规模日益庞大和结构日渐复杂,因此对软件开发人员的要求也就更高。本文正是在这样的背景下,运用Agent技术研究多通道整合人机交互系统。本文中先是简要介绍了Agent技术、人机交互技术和基于Agent的人机交互技术当前发展状况以及课题的背景;然后分析了基于Agent的多通道整合人机交互系统的特点,介绍了该系统的框架模型,从宏观上描述了系统运行的原理和流程;之后,详细说明了系统是如何实现的,包括数据结构、类的定义,每一个Agent的结构设计,Agent之间通信的实现和Agent学习能力的设计等;最后,对本系统的研究过程和系统的优缺点进行了总结,并对本系统的后续工作做了设想,对相关的技术进行了展望。

赵其杰[2]2005年在《服务机器人多通道人机交互感知反馈工作机制及关键技术》文中进行了进一步梳理随着老龄化人口数量的增加和护理成本的提高,用于照顾老年人、残疾人的护理服务机器人和康复机器人已经受到许多研究人员的重视。为了实现服务机器人与用户自然和谐的交流,在服务机器人的诸多关键技术中,信息感知反馈和与人的交互能力就尤为重要。当前的服务机器人信息感知和人机交互能力还比较初步,有待于进一步的提高和完善。本文针对老年人、残疾人等用户与服务机器人交互的特点,系统地研究了人机间信息感知和反馈机制,以及多通道人机交互方法,实现了一种具有多种信息感知与反馈功能的多通道自然人机交互系统。文中首先研究了“视觉-眼动”、“语音-听觉”、机械接触式通道等自然的人机交互效应通道,提出了几种效应通道主-辅协作的工作模式。通过几种效应通道的协作,减少了单个通道的工作负担,提高了交互的可靠性和工作效率。为了提高“视觉-眼动”交互通道对环境光照和用户头部位置变化的适应性。建立了一种适应环境光照变化的图像采集系统和图像二值化的阈值模型,并提出一种对用户头部位置变化影响的补偿策略和控制方法,改善了系统对用户头部位置变化的适应性。提出了一种基于Agent的自然和谐人机交互体系框架,建立了人机交互的用户模型与人机交互协议,根据人机交互协议的格式提出一种任务生命周期管理的任务进行管理方法,并用基于框架(Frame)的信息融合方法对不同交互通道表达的交互信息进行了语义层的交互语义融合。对以“人-界面-机器(人)”为基础的用户临场感进行了研究,提出一种多模式信息感知与反馈的体系和对多种通道反馈的交互语义信息进行融合的方法,增强了用户对系统反馈信息的感知和人机交互的自然和谐性。在建立的服务机器人与用户构成的“人—界面—机器(人)”实验系统中,用认知心理学的试验方法对人机交互界面进行实验研究,确定了适合不同用户(老年人、残疾人等)个性特点的人机交互界面;用人机工效试验方法对几种人机交互效应通道工效参数、以及工作模式作了实验研究,确定了几种效应通道工效参数的范围,验证了多种自然效应通道协作交互方法的有效性。

宋玥[3]2015年在《面向老年人多通道交互技术及应用》文中研究表明随着年龄的增长,人的感知觉和认知能力都会发生变化。尤其是60岁以上老年人的感知觉和认知能力会呈现明显的退行性变化。传统基于鼠标、键盘和图形界面的交互方式受到老年人感知觉能力退化的影响,导致人机交互的效率和准确性降低,难以满足老年人的交互需求。针对老年人的感知觉特点,本文融合老年人熟知的触控、语音的输入和多媒体输出技术,提出一种基于移动计算的多通道人机交互模型。以该模型为依据,通过借鉴现有的多通道数据融合方法,设计一套完整的语音、触控多通道交互融合策略及相关融合算法。其次,采用Java语言在移动终端实现了上述交互模型和算法,并应用于基于Android平台的中国象棋游戏中,验证了模型和算法的可行性和有效性。最后,设计了适用于老年用户人群的人机交互工效学评价方法和方案,并应用于多通道交互中国象棋游戏的评估,完成交互系统的工效性评价。本文取得如下研究成果:(1)提出适用于移动计算设备上面向老年人的语音、触控多通道交互模型。针对该模型设计了一套完整的基于任务的多通道分层融合策略,并逐层设计数据融合算法及输入输出数据结构。(2)采用Java技术在Android软件平台上设计实现交互模型及多通道融合算法,并应用于Android平台的中国象棋游戏。该交互系统能够让用户采用单一或多种通道以串行/并行的方式对象棋游戏进行控制;同时,为老年用户提供了语音、图形等多种交互反馈,为老年人提供认知能力补偿。(3)提出面向老年人的人机交互工效学评估模型,并通过多通道中国象棋系统完成交互测试与工效学评价。交互测试结果表明该多通道交互模型能够使老年用户自然高效地完成交互任务,信息的融合结果也达到了预期的效果;同时,评估结果表明了系统的综合工效性能良好。本课题研究对多通道的数据融合技术以及面向老年人的人机交互设计和实际应用具有重要意义。

俸文[4]2003年在《多通道人机交互技术的研究》文中提出本文对多通道人机交互技术中的几个重要问题进行了研究,其中包括多通道人机系统的模型描述、整合算法、系统构架等。同时也对系统实现中所产生的一些特定于多通道系统的问题进行了研究和解决。通过一个原型系统——多通道军事态势标绘系统的实现深入研究了这项技术及其实现方法,提出了一个面向任务的多通道界面模型描述方法,实现了一个多通道整合算法,并针对该算法的不足进行了改进;同时,本文也提出了一个可移植通用整合功能模板的思想。通过对多通道系统语义的通用描述模型的研究,面向开发人员提供可重用多通道整合模板的支持,这本身就是应用软件系统所追求的目标之一,在多通道技术中实现这个思想有着更大的意义,本文给出了一个具体的实现方法。最后,本文对多通道人机技术的研究方向和前景进行了展望。

穆怡雯[5]2008年在《多通道交互设计方法研究》文中认为随着网络的普及性发展和无线通讯技术的发展,人机交互领域面临着巨大的挑战和机遇,传统的图形界面交互已经产生了本质的变化,人们的需求不再局限于界面的美学形式的创新,现在的用户更多的希望在使用多媒体终端时,有着更便捷、更符合他们的使用习惯,同时又有着比较美观的操作界面。目前的交互形式大多只关注人的视觉和听觉需求,而忽略了人的其他感官要素,一个典型的例子就是目前非常流行的叁维化交互界面和游戏场景,他们短时间内确实能够带来炫目的视觉体验,但虚拟的叁维世界除了视觉和听觉外,在操作形式上仍然多数依赖传统的鼠标,键盘一类的靠手部行动的输入,而不是像真实的叁维世界一样,调动人的多种感官和多样化的操作形式,因而非常容易造成用户的疲劳。因此,能够调动人的多种感官的多通道用户界面的研究成为人们关注的新方向。多通道界面有着交互多元化的操作形式,涉及到众多交叉学科的工作,然而,更多的研究关注在计算机技术领域的创新的解决交互问题的方法上,而对于以交互设计本身为出发点的研究很少,也没有系统的理论总结归纳支持多通道界面的交互设计方法。本文正是关注设计方向上多通道用户界面领域的研究空白,结合交互设计中的设计方法及流程,探索性地研究多通道界面中的交互设计方法。本文在现有的交互设计基础上,通过分析以用户为中心的人机交互的设计思想,对多通道的概念和历史系统研究,并对多通道界面设计中的用户定义和分类,介绍人群细分的方法,基于对用户的知识层次和用户个体差异对于交互中的影响程度对用户模型进行了划分,并分析了输入、输出的设计载体在多通道交互界面中的存在方式。研究性的设计需要具备前瞻性以对未来的设计有指导或参考作用,所以本文以前瞻性的眼光,对多通道交互发展的新领域——实体用户界面(TUI)进行了深入研究,多层面地论述实体用户界面的解析设计办法,通过这样的设计方法,试图消除物理对象和抽象对象在交互计算中的差别以及输入装置和输出装置在交互计算中的差别,希望能真正建立一种无缝的交互界面,在无形的电子世界和有形的物理世界中间架起一座桥梁。最后,基于以上研究,通过软硬件结合的交互方式进行了一套设计,以检验和实践多通道用户设计的流程和方法。

史小龙, 李晓玲, 高虹霓, 韩枫[6]2016年在《全息显控界面中多通道人机交互技术研究》文中认为目的解决传统座舱显控方式信息量大且操控复杂容易造成交互效率低的问题。方法提出了一种在全息显控界面下融合手势及语音的多通道人机交互系统设计方法,根据叁维数字地图全息展示及交互特性,进行了任务划分和整体设计。通过构建全息界面多通道交互系统实验台,完成了基于Kinect的手势及语音模块和交互接口的设计,实现了叁维数字地图全息展示中多通道人机交互的准确控制。结论工效实验表明,该交互方法比传统操控方法的效率提高了约17.5%。

李昌岭, 李伟华[7]2014年在《面向战场的多通道人机交互模型》文中认为现代战场上的信息来源繁多、瞬息万变,这对战场指挥决策提出新的要求,而现有人机交互系统未能向指挥人员提供高效、自然、全面的人机交互。为解决该问题提出一种面向战场指挥决策的多通道多智能体交互模型,针对战场不同的领域,实现"以人为中心"的人机交互,使指挥人员能够自然、无障碍地将交互信息准确传递给系统,具有很好的可靠性和可扩展性。

潘绍松[8]2012年在《面向过程的维修诱导关键技术研究》文中认为民用航空器维修保障是一项技术难度高、劳动强度大的工作,如何降低维修难度、避免维修差错、提高工作效率、压缩维修成本始终为航空公司所关心,因而以此为课题展开研究无论是在理论层面还是在应用层面都具有重大意义。本文以构建面向过程的维修作业系统为目标,以应用增强现实技术为基础,深入研究了在实际构建该系统时所必需的若干关键技术问题。该系统的功能是:以维修任务为中心、以维修过程为线索向现场维修人员提供所需的文字和图像,帮助他们理解维修任务、提高认知能力。现将本文的主要研究内容和创新点总结如下:(1)根据旋转矩阵是SO3流形的事实,文章提出了在2D-3D点对应情形下用流形优化的方法获取对象位姿的新颖算法,算法利用泰勒展开和收缩映射消除了用正交投影模型代替针孔投影模型所引入的理论误差,减小了连续视频对象位姿跟踪中累积误差的传播,实验表明流形优化法得到对象位姿精度和所需的迭代次数均优于正交迭代,在综合数据试验中噪声方差为1时,前者的旋转轴、旋转角的相对误差为0.5%和0.25%,仅为后者相对误差的1/5和1/2;随后文章针对工业对象表面通常缺乏点特征,但具有共面圆特征一类常见工业对象的事实,研究了利用共面圆特征作为对象坐标系,依据绝对二次曲线的射影理论求解对象位姿的新方法,真实对象的试验表明该方法得到的位姿最大相对误差分别只有:旋转轴2.7%,旋转角1.7%,平移1.7%;最后针对特征点3D坐标不易获取的实际问题,文章给出了重构稳定匹配的SIFT特征点3D坐标的方法。(2)动态地跟踪对象位姿是实现连续视频图像注册的前提。本文改进了具有直线边缘轮廓对象位姿跟踪方法,提出了基于共面圆轮廓特征的对象位姿跟踪方法。文章利用前一帧图像的轮廓位置,采用计算轮廓的梯度归一化互相关系数的方式隐式缘搜索直线边缘或椭圆轮廓,建立2D-3D的轮廓对应关系,为提高隐式轮廓搜索的效率文章还采用扩展卡尔曼滤波,一方面预测当前帧图像的对象位姿,另一方面限制直线或共面圆轮廓特征搜索起点和搜索位置。对于直线边缘对象,文章综合采用Tukey估计子和权重直线拟合构造位姿计算目标函数并用SVD法求解,实验表明本文基于直线的位姿跟踪方法的旋转角最大的平均偏差0.29o,绝对偏差为1.90o,跟踪速度大约为10帧/秒,综合性能明显优于基于LM的位姿跟踪算法;对共面圆轮廓图像,文章则采用Sampson距离剔除野值、采用各项异性数据回归通过提高椭圆拟合精度获得高精度对象位姿,实验表明该方法跟踪对象位姿的最大角度误差为1.4o、平移为3.5mm,跟踪速率达10~12帧/秒。实验还表明利用扩展卡尔曼滤波的可以有效地将位姿跟踪速度提高近一倍。(3)标定光学透视式头盔(HMD)是实现信息增强的基础工作,文章改进了Azuma所提出的HMD标定方法,克服了其标定方法中的缺陷。利用前两章共面圆位姿的研究成果,首先在标定过程用相机替代电磁位置跟踪器的HMD的位姿;其次用3D重构的方式确定对象坐标系与世界坐标系间的变换,免除了使用标定工作台确定该变换关系所需的高昂代价;最后将HMD的内、外参数分开标定,且认为外参数固定不变,减轻普通用户标定HMD的负担。标定性能评估实验中HMD标定单眼最大平均误差为2.15像素,说明本文改进的HMD方法是有效的、可行的,假设外参数固定不变是正确的;随即文章还简单地研究了3D模型获取过程中涉及到的位姿变换以及比例因子的问题。(4)维修环境中的指令增强和人机自然交互可以有效地免除维修人员注意力频繁切换的弊端。基于此本文设计与实现了利用菜单式人机自然交互的方式,用于切换虚拟的维修指令,具体内容包括:将维修任务中的指令信息抽象成维修任务菜单和维修任务子菜单、菜单的内容以虚拟成像的方式出现在HMD上、菜单的输入焦点通过对象位姿跟踪和虚拟成像的方式固定在对象表面、输入焦点区域的点击动作则来自于手势识别、最后则采用菜单状态转换有限状态机建立手势输入与菜单内容切换的联系。实验表明该方式的人机交互成功率可达76%,输入速度达8~10帧/秒。(5)文章最后以实现面向过程的维修原型系统为目标,首先研究了如何利用现有的民航维修技术出版物获得指令增强、2D图像增强信息,提出利用RM模型构建3D信息增强以及对象位姿跟踪所需要的信息;然后研究了实现这样的一个原型系统在软件结构和软件实现上所应考虑的问题;最后以APU点火嘴安装为例,实现了一个小型的原型演示系统,以直观的形式演示本文的研究目标以及面向过程的维修在民用航空器维修领域的作用。

李晓[9]2004年在《自适应人机交互界面研究》文中认为Internet、无线设备以及移动计算技术的发展,用户关注信息的范围更加广泛,且用户的信息需求和获取信息的方式也各不相同。然而,one-size-fits-all的用户界面,使得人们不得不需要花费大量的时间和精力去寻找自己需要的信息。 显然,当前最大的挑战不仅仅在于随时随地、以任意形式为用户提供信息,而在于在“恰当”的时间、以“适当”的方式,为用户提供“恰当”的信息。 智能用户界面因其自适应、上下文敏感和对任务的协助,促进了人机交互的有效性和易用性,是当前研究和开发的热点。论文的研究属于智能用户界面的一个方面,其最终目的是使用户界面更有效和易用,让用户有较高的满意度。 自适应人机交互界面能够改变自己的工作状况去适应某个用户或某一项任务,有助于促进人机交互的质量。论文结合了心理学、人工智能和计算机技术,研究了用户多种信息资源需求下,人机交互界面如何动态适应当前用户和当前任务:即如何为用户、任务和对话环境裁剪恰当的内容并提供恰当的交互形式。fl博士学位论文 针对用户信息资源需求的心理特征和当前自适应界面的现状,论文开展了一系列的研究,并取得以下创造性成果: (1)提出了面向用户信息需求心理的四元交互模型。 通过对现有交互模型的深入研究和基于认知心理学理论,分析了用户 信息需求下,人机交互中需要考虑的个体心理特征,进而通过深入分析人 机交互的“刺激一反应”情景,提出了一个面向用户信息需求心理的四元交 互模型,支持自适应人机交互界面的用户模型构建。 (2)给出了基于多使用模式的用户模型内容及其建模实现。 针对用户不同性质的Web活动导致的用户不同的使用模式,提出并构 建了多使用模式用户模型。这是一个长期的、动态的用户模型,区分为相 对静态的组模型和动态个体用户模型两个层次:组模型表达了在信息资源 获取过程中用户具有的共性,个体用户模型继承了其所隶属的用户组的属 性,并同时具有自己独特的私有属性。个体用户模型的属性可能反馈到组 模型,成为组模型的属性。 (3)构造了基于用户多使用模式的资源模型。 针对用户不同使用模式,以及Internet资源的分布和异构特点,明确 提出基于用户多使用模式的资源模型概念,并给出了适应于用户个体特征 的资源的组织结构和资源的生成,有效的解决了用户不同使用模式下自适 应资源的生成。 (4)建立了多使用模式用户模型与MAS技术相结合的自适应机制。 采用Agent在人机交互中体现出来的“隐喻”,以及其特有的学习和自 适应特性,提出了多使用模式用户模型与MAS技术相结合的自适应机制, 给出了自适应人机交互界面的实现,并讨论了Agent的交互特征、Agent 间的协调和Agent与用户的交互。同时还给出了自适应的实现。 最后,通过原型系统的相关实验以及对界面的可用性评估,验证了论文思路的正确性和实现界面的可用性。

杜广龙[10]2013年在《面向多自由度机器人的非受限智能人机交互的研究》文中研究表明随着人类对未知领域(太空或深海等)的探索欲望增加以及某些高危工作的需求,用于人类不可到达和未知环境的远程机器人已得到广泛关注。为了使远程机器人准确安全地完成任务并且实现人类与远程机器人和谐交流的目标,在远程机器人的诸多关键技术中,人机交互、智能辅助和信息感知叁方面尤为重要,成为确保远程机器人能否完成任务的先决条件。本文提出的面向多自由度机器人的智能人机交互模型研究旨在从一个崭新的角度研究如何更自然,更直观有效地与多自由度机器人打交道,让人与机器人的交流犹如人与人交流一样自然流畅,并尽可能地缩短人机之间的交互距离,交互延时,扩大了人机之间的交互带宽。面向多自由度机器人的智能人机交互技术是通过将认知科学、计算机科学、机械科学、人工智能技术、生命科学等多种学科交叉结合起来,对人机交互中的交互行为、交互方式、机器辅助模型和人机协作模型等要素进行研究,充分发挥机器的智能性与自主性、人类的主导性和能动性,实现人机优势互补,互相协作的一门技术。本文的创新性成果包括:一是深入研究面向多自由度机器人交互的发展与趋势,根据面向多自由度机器人的交互特性分析与对比了各种人机交互方式在多自由度机器人交互过程中的优势与不足;二是提出了基于叁维手势的面向多自由度机器人交互模型,相对其他交互方式,该模型能快速实时地对多自由度机器人进行高效率交互;叁是深入研究了多智能体协作模型技术,对智能体的特征、智能体的推理规则和智能体的协作机制进行了详细的描述,提出了异态智能体的协作模型,可以有效地结合人类与机器人的各自优势,达到取长补短的效果;四是提出了多种智能辅助方法,针对多自由度机器人的特点,从多自由度机器人的路径规划方面,安全保障方面、操作辅助方面进行了深入的研究,提出了多种智能辅助模型,确保多自由度机器人在非机构化环境中具有一定的自主性,既能确保自身的安全,又能辅助用户完成高难度作业。五是详细地分析了人与机器在感知方面的特点,比较了人与机器在感知方面各自的优缺点,从而建立了分工与合作模型,划分了不同的感知任务,分工明确,互相协作;六是提出了面向多自由度机器人的智能人机交互模型,对智能人机交互模型中的交互空间进行了深入的分析,在此基础上,提出了面向决策的分层模型,能有效地解决人类和多自由度机器人之间的协调问题。本文作者在博士期间先后参加了多个国家863予项目,并在这些项目中在研究面向机器人的自然人机交互技术以及面向机器人的智能辅助技术方面做了大量的工作,取得了很多重要的成果,包括发表了多篇国际学术论文和申请了多个国家发明专利。本文作者在参与项目的研发和开发的基础上,基于项目的研究成果对面向多自由度机器人的智能人机交互模型进行了深入的研究,并结合实际情况应用于各项科研实体,验证了该模型的有效性。

参考文献:

[1]. 基于Agent的多通道人机交互系统的研究和实现[D]. 王强. 南京理工大学. 2004

[2]. 服务机器人多通道人机交互感知反馈工作机制及关键技术[D]. 赵其杰. 上海大学. 2005

[3]. 面向老年人多通道交互技术及应用[D]. 宋玥. 北京工业大学. 2015

[4]. 多通道人机交互技术的研究[D]. 俸文. 南京理工大学. 2003

[5]. 多通道交互设计方法研究[D]. 穆怡雯. 北京邮电大学. 2008

[6]. 全息显控界面中多通道人机交互技术研究[J]. 史小龙, 李晓玲, 高虹霓, 韩枫. 包装工程. 2016

[7]. 面向战场的多通道人机交互模型[J]. 李昌岭, 李伟华. 火力与指挥控制. 2014

[8]. 面向过程的维修诱导关键技术研究[D]. 潘绍松. 南京航空航天大学. 2012

[9]. 自适应人机交互界面研究[D]. 李晓. 西南师范大学. 2004

[10]. 面向多自由度机器人的非受限智能人机交互的研究[D]. 杜广龙. 华南理工大学. 2013

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

基于Agent的多通道人机交互系统的研究和实现
下载Doc文档

猜你喜欢