文献检索系统设计与分析文献综述

 2022-11-27 16:23:02

文献综述

随着数字图书馆、文档数据库、办公自动化系统和Web的广泛使用,文本信息出现爆炸式的增长,面对这浩瀚的信息海洋,人们常会陷入窘迫的两难境地:一方面是“信息过载”,即收到的或已经下载的信息难以消化,导致用户的查询 访问经常存在着大量无关的信息;另一方面就是“信息迷失”,即用户不知道如何贴切表达真正想要的网上资源的需求,因为目前技术并没有提供合适的表达手段,而且用户也不知道如何去更准确有效的寻找。[1]这在大型企业的信息化进程中得到充分体现。[2]海量的可用信息与用户对信息的驾驭能力形成强烈的反差,最终用户期待出现一些能够协助其理解、寻找所需信息的检索系统。基于文献数据库的文献检索系统可以极大地提高人们检索文献的效率。[3]因此,开发可以辅助人们智能的分析、过滤、获取所需文献信息的工具文献检索系统,是实现及时、准确、方便获取所需文献的有力手段。

文献检索[4](Information Retrieval)是指根据学习和工作的需要获取文献的过程。狭义的检索(Retrieval)是指依据一定的方法,从已经组织好的大量有关文献集合中,查找并获取特定的相关文献的过程。广义的检索包括信息的存储和检索两个过程(Storage and Retrieval)。[5]信息存储是将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的数据库或检索系统,供人们检索和利用。而检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。[6]

从文献检索的发展历史看,经历了手工检索、计算机检索、网络检索到目前的智能检索等多个发展阶段。它起源于19世纪后期,当时主要用于图书馆参考文献咨询和文摘索引工作,使用信息检索的用户较少,随着计算机和网络的出现,促进了信息检索科学的发展,人们越来越依靠信息检索工具来查找所需的信息。

我国计算机文献检索系统的研发开始于上个世纪70年代,由中国科技情报研究所和一些研究机构、情报机构以及高等院校,分别对计算机检索的软件设计、数据库建设、上级检索等环节开展相关的研究与试验。1983年交通部科技情报研究所成功研制了微机单机文献检索系统、微机非文献检索系统及缩微文献检索系统,实现了利用微机检索书目、事实和数据。随着互联网技术的不断发展,越来越多的网络文献检索系统不断涌现,如国外的Google Scholar、Microsoft Libra、CiteSeerX[7],国内的CNKI中国知网、万方数据资源系统、中国科技图书文献中心网(NSTL)和天元数据网等。[8]

近些年来,伴随着个性化服务越来越为人们所需,服务手段也就愈加的要求智能化。智能化已经是文献检索系统的一个重要需求。智能文献检索系统可以有效的解决“信息过载”和“信息迷失”的问题,它能根据用户的需求或意愿代替用户查找所需信息,比起传统的文献检索系统更有效。智能检索是信息检索和人工智能研究的一个交迭领域,人工智能研究在20世纪80年代进入了快速发展期,根据美国1988年的统计,在1987和1988年开发的实用化专家系统分别为50和1400个。[9]同一时期,人工智能研究成果开始引入信息检索领域,智能检索以及人工智能与信息检索间的关系被热烈讨论,Croft[10]在他的智能信息检索方法中讨论了人工智能领域中的专家系统、知识表示和自然语言处理之于信息检索的应用;孔[11]研究了智能检索系统形式模型和模型实例化的方法与技术,提出了智能检索系统形式框架的核心组成有三个基本模型(领域模型、文档模型、用户模型)。在领域模型方面,Dragoni等人在文献[12]中概述了基于本体的信息检索技术以及相应的目前可以作为开发原型或者商业产品的本体工具;李[13]通过建立领域本体库,为文献检索在特定领域提供了语义上的支持,再通过本体与文献数据库的映射得到语义索引文件,弥补了传统检索方法的不足。在文档模型方面,Castells等人[14]探讨了基于本体的信息检索模型,主要包括基于本体的文档标识方案模型和基于向量空间模型的信息检索模型,目的在于提高大型数据库的检索效率;孟等人[15]结合两种模型提出了顺应趋势发展的基于领域本体的文献检索模型,通过对文献进行语义标注,强化了领域概念与文献间的相关度,并利用领域本体对概念及概念间关系的描述,对用户检索式进行扩展,在一定程度上提高了检索效率。此外,由于绝大多数用户在进行期刊文献检索时都普遍存在着个人需求上的模糊性[16],文献[17]和[18]探讨了两种使用模糊理论来实现信息检索的本体模型的方法。在用户建模方面,Brajnik等人[19]开发了结合用户建模技术的专家信息检索系统;周等人[20]提出了基于用户主题偏好的个性化智能检索模型,并将显性相关反馈与隐性相关反馈技术融入其中,形成了完整的检索解决方案;张[21]从用户接口的角度, 论述文献检索系统在用户易用性设计方面所必须把握的几个潜在原则,为文献检索系统智能化做了一些补充。

将文献检索系统落实到实际中,并结合大学期间面临的文献检索问题以及相关知识,本课题拟设计一类文献资料智能检索系统,用于检索本地和网络上的文献资料,其主要功能模块为:管理员登录模块,负责管理员的登录;文献管理模块,根据需要对数据库的文献实现增删改查;用户管理模块,对普通用户个人信息的增删改查;用户登陆模块:实现用户的登录,用户注册模块,针对第一次登录的用户,必须注册成功以后才可以登录系统;用户信息模块,实现个人信息的修改;文献上传模块,登录的用户可以将本地的文献复制到指定的文件夹,方便本地文献的管理;文献检索模块,针对登录的用户,可以综合检索(输入文献名称、作者、摘要、期刊、类别等)网络文献和本地文献;文献下载模块,针对登录的用户,可以检索出来的文献进行下载。

本系统使用语言为Java语言,采用B/S结构,使用SpringMVC Spring MyBatis框架进行开发,开发工具为MyEclispe。Java 是由Sun公司开发的一门高级程序设计语言,具有简单性、面向对象、分布式、健壮性、安全性、平台独立与可移植性、多线程、动态性等特点。B/S是Browser/Server的缩写,是在网络技术发展的基础上,对C/S架构的一种演进。其三层架构是指通过浏览器实现用户工作界面,通过前端实现极少部分事务逻辑,通过服务器端实现主要的事务逻辑,优势在于其简易灵活性,一台可以上网的电脑无需安装任何软件,即可实现随时随地操作。SSM框架目前比较主流的Java EE企业级框架,适用于搭建各种大型的企业级应用系统。MyEclipse,是在eclipse 基础上加上自己的插件开发而成的功能强大的企业级集成开发环境,主要用于Java、Java EE以及移动应用的开发。

参考文献

  1. 李静.基于概念匹配度模型的文献检索系统[D]. 西南交通大学,2009.
  2. 国家统计局统计科研所信息化统计评价研究组.信息化发展指数优化研究报告[J].管理世界,2011, 12:1-4. 2
  3. 宋阳,严平,曹彤.基于 ASP 、SQLServer2000 实现的Web 文献检索系统及其查询优化[J]. 计算机应用与软件,2006 ,10:25 -28.
  4. 杨卫忠.个性化文献检索技术研究[D].西安科技大学,2007.
  5. 舒畅,董光荣.文献检索的系统理论和方法[J]. 大学图书情报刊,1997,01:13-16.
  6. 林馨.文献检索的优化算法[J].数字技术与应用,2014.
  7. 贾鹏.互联网科研文献检索系统设计与实现[D]. 大连理工学,2012.
  8. 李卫,英姿.国内实用网络文献检索系统[J]. 铁路计算机应用,2004,09:32 -33.
  9. 高济,朱森良,何钦铭. 人工智能基础. 北京:高等教育出版社,2002,8
  10. Croft W B. Approaches to intelligent information retrieval[J]. Information Processing amp; Management, 1987,23(4):249-254
  11. 孔敬.智能检索模型研究[J].现代图书情报技术,2005.
  12. Mauro Dragoni,Ceacute;lia da Costa Pereira,Andrea G. B. Tettaman zi. A Conceptual Representation of Documents and Queries for Information Retrieval Systems by Using Light Ontologies[J] . Expert System with Applications, 2012, 39(12) :10376 -10388
  13. 李良元.基于语义的科技文献检索术研究[D],贵州大学,2011 .
  14. Castells P, Fernandez M,Vallet D. An Adaptation of the Vector - Space Model for Ontology - Based Information Retrieval[J] . Knowledge and Data Engineering,2007,19(2) :261 -272
  15. 孟红伟,张志平,张晓丹.基于领域本体的文献智能检索模型研究[J].情报杂志,2013.
  16. 梁震戈,王文君.期刊文献的智能专家模糊检索系统[J].图书情报工作,2002.
  17. Zhai J, Liang Y,Jiang J,Yu Y. Fuzzy Ontology Models Basedon Fuzzy Linguistic Variable for Knowledge Management and Information Retrieval[M] . Intelligent information processingⅥ,2008
  18. Calegari S,Sanchez E. A Fuzzy Ontology Approach to Improve Semantic Information Retrieval [C]. Proceedings of the Third ISWC Workshop on Uncertainty Reasoning for the Semantic Web - URSW,2007
  19. Brajnik G, Guida G, Tosso C. User modeling in intelligent information retrieval[J]. Information Processing amp; Management, 1987,23(4):305-320
  20. 周育忠,王平.基于用户主题偏好的智能检索算法及实现[J].情报科学, 2014 .
  21. 张会田.论文献检索系统的用户易用性设计原则[J].现代情报,2003 .

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题文献,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。