编辑推荐
内容简介
《信息检索可视化》从理论和实际应用方面,对信息检索可视化领域最新进展进行了系统的阐述,集中介绍了信息检索可视化的基本原理及其结构、方法和算法,较为系统地比较了多重参考点可视化模型(MRPBM)、基于欧几里得空间特征的可视化模型(ESCBM)、探路者关联网络(PFNET)、多维尺度模型(MDS)、自组织图模型(SOM)等五种主要的信息检索可视化模型,讨论了信息可视化系统的评估及信息可视化系统设计中人的行为,分析了信息可视化中的一些特有的歧义现象,并提出解决办法。通过《信息检索可视化》,读者可以了解和掌握信息检索可视化的现状,获悉主要学者的一些技术、理论发现和前沿进展,信息检索可视化系统实现的一些充分的、有实用价值的细节,以及研究这个领域所必须注意的问题。《信息检索可视化》可作为信息科学、计算机科学及相关学科的研究人员、从业者、系统设计者和分析者、网络管理员、图书管理员、教育者和研究生的参考资料。
更多>>
作者简介
姓名:(美)张进 夏立新
作者简介:
作品:《信息检索可视化》 姓名:(美国)Jin Zhang
作者简介:
作品:《信息检索可视化》 姓名:(美)Jin Zhang 夏立新 陆伟 沈吟东
作者简介:
作品:《信息检索可视化》
目录
译者序
中文版的前言
序
前言
第1章 信息检索与可视化
1.1 可视化
1.1.1 定义
1.1.2 科学可视化和信息可视化
1.2 信息检索
1.2.1 浏览与提问搜索
1.2.2 微观信息与宏观信息
1.2.3 信息空间的空间特性
1.2.4 浏览的空间特性
1.3 可视化的感知与认知
1.3.1 感知
1.3.2 认知
1.4 信息检索的可视化
1.4.1 基本原理
1.4.2 三种信息检索可视化模式
1.4.3 建立一个信息检索可视化模型
1.5 小结
第2章 信息检索基础
2.1 向量空间模型
2.2 词语加权法
2.2.1 停用词
2.2.2 逆文献频率
2.2.3 萨尔顿词语加权法
2.2.4 另一个词语加权法
2.2.5 概率词语加权法
2.3 相似性方法
2.3.1 内积相似性方法
2.3.2 戴斯系数法
2.3.3 加卡德相似性方法
2.3.4 重合系数相似性方法
2.3.5 余弦相似法
2.3.6 距离相似法
2.3.7 集成角度-距离相似性方法
2.3.8 皮尔森参数γ相关性法
2.4 信息检索(评价)模型
2.4.1 基于方向的检索(评价)模型
2.4.2 基于距离的检索(评价)模型
2.4.3 椭圆检索(评价)模型
2.4.4 合取检索(评价)模型
2.4.5 析取检索模型
2.4.6 卡斯尼椭圆检索(评价)模型
2.5 聚类算法
2.5.1 非分级聚类算法
2.5.2 分级聚类算法
2.6 检索结果评价
2.7 小结
第3章 多重参考点可视化模型
3.1 多重参考点
3.2 多重固定参考点模型
3.3 可移动多重参考点模型
3.3.1
书摘
插图:
广泛存在于因特网、OPAC系统、数字图书馆以及其他形式的信息检索系统中的数字信息正在以指数倍增长。每年大约要产生一百万特字节(1TB一1024GB)的数据,其中,99%的是以数字化形式存在(Keim,2001)。这些信息系统中的数据变得越来越复杂,更新速度也越来越快,在日常生活中正在被越来越多的人利用。当具有不同背景、特性、能力、喜好和目的的用户数显著增长时,用户的需求也开始变得更加多样和复杂。因此,迫切需要一种更高效的信息检索手段——这向当前信息检索系统中使用的传统方法与技术提出了挑战。在传统的信息检索系统中,信息检索主要是基于关键词查询,并且,由于用户无法控制内部匹配过程,查询过程是非连续的。传统的信息检索系统还存在一些固有缺陷:内部匹配过程对用户不透明,检索结果以线性列表的形式显示,一次可显示的结果有限,文档间的关系极少用图示展现,检索环境缺乏供用户浏览的交互机制等。这些固有缺陷使得传统的信息检索系统面对信息需求的极度复杂性与海量多维数据束手无策。
当前计算机已拥有高速运算能力和巨大存储容量,进而拥有了强大的图形处理能力。这些技术与成熟的现代信息检索理论和人机交互理论相结合促生了信息可视化技术。为了克服传统信息检索系统固有的缺陷,信息可视化技术应运而生。信息可视化是一个新兴的领域,其主要目的是将信息形象化以方便与用户交互。它通过视窗、图标、菜单和定点装置提供前所未有的交互能力。当今计算机强大的图形处理能力已使得这种复杂的可视化展示成为可能。因此,用于信息组织、表示、解释和检索,并且具有直观性与交互性的新的信息可视化方法能够洞察数据集内部,获取丰富的数据关联和数据内容,挖掘数据特点。这种信息检索可视化方法使得人们能够充分发挥自己的灵活性、创造力和想象力来搜寻信息。对于各种类型用户——无论老少、无论是否有使用经验、无论是否有信息检索专业知识、无论是否懂英语——真正优秀的信息检索可视化技术都应该能够满足其需求。
图像是信息表达与交流的主要工具。在人类文明进程中,它一直贯穿于人类的智力活动中。早期的可视化展示可以追溯到14世纪甚至更早。当时的宇宙图中,地球处于宇宙的中心,由分别代表四种基本元素、七大行星、黄道十二宫和月相的同心圆围绕着(cresques,1978)。基于计算机的可视化应用几乎是随着现代计算机的发明而诞生的。可是,现代图形