更全的杂志信息网

数字资源检索与利用论文选题方向

发布时间:2024-09-04 19:28:11

数字资源检索与利用论文选题方向

课程介绍―课程目标介绍和应用课题分析方法;分析现代信息存储访问原理,提高信息资源的查询使用效率课程介绍―重要性(1)一个高效率的科研工作人员必须是头脑清醒,思维敏捷,注重信息搜集的人,并且还应具有善于积累,贮存世界科技前沿最新情报信息的能力课程介绍―重要性(2)当前信息存取组织的特征多样性泛滥性知识无关性技术制约性信息访问使用的一般特点知识应用能力弱目标不明确访问查询手段单一课程介绍―重要性(3)在这个信息泛滥的时代,我们正成为信息的奴隶,信息主宰了我们的生活,我们许多人却因为不能有效利用信息而没有成为这个时代的受益者作为科研工作人员这是很不幸的事课程安排第一部分 信息检索与课题分析基本知识介绍信息检索与课题分析基本理论,常识和方法第一部分 基于数据库的信息使用技术介绍基于数据库的信息资源使用与检索技术第二部分 基于网站的信息使用技术介绍通用搜索工具对网站信息搜索原理与使用技巧第三部分 现代图书馆信息服务的利用介绍现代数字化图书馆信息服务特征,以及在科技论文,课题论文写作中的利用参考文献《信息资源检索与利用》电子工业出版社 孙丽芳 主编《数字信息资源检索与利用》 北京大学出版社 肖珑 主编课程要求学习要求认真动脑思考课堂要求将手机打到震动档,接听电话请到教室外面积极参与课堂讨论考试要求递交感兴趣的课题申请表对课题进行恰当的分析制定信息检索方向,方案通过资料阅读分析,形成课题分析综述绪论:信息素养与信息检索概述 信息素养概述什么是信息素养最初定义:利用大量的信息工具及主要信息源使问题得到解答的技术和技能 能够充分地认识到何时需要信息,并能有效地检索,评价和利用信息掌握了各种学习方法,知道怎样组织知识,发现和使用信息这些人具有终身学习的能力因为他们不管碰到什么问题或做什么样的决定时,都能够发现必要的信息 绪论:大学生信息素养的基本内容 信息观念 对信息的看法,认识以及对信息的本质,价值和特征的认识信息意识 人们对信息需求的自我感悟,即人们对信息的捕捉,分析,判断和吸收的自觉程度信息能力 信息的获取,加工处理,消化吸收,利用和创新的能力信息道德 具有正确的信息道德观念,能在信息利用过程中遵循一定的法律法规,尊重著者的知识产权,规范自己的信息行为,合理使用与开发信息资源 绪论:信息资源与检索概论信息概述信息的概念数据,信息与知识任何信息在计算机系统中的表现都是数据数据对具有感知能力的人来说就是信息人通过大脑的反馈,将信息转化为知识例如:电话铃响(数据信号传输,感知为电话铃响这样一个信息,知识:有人Call我)正确看待网络信息,人的知识决定了我们对于信息的感知能力绪论:网络信息资源分类网络信息分类按内容分类注重学科相关按信息出版类型图书,期刊…按信息的媒体形式文本,超文本,多媒体按网络信息服务方式网站,新闻组,论坛,文件服务按信息格式(不同格式有不同的使用方法)TXT,DOC ,PDF, RM, MP3…绪论:网络信息资源组织网络信息资源组织网页文本电子全文多媒体资源其它资源检索平台搜索平台网络访问层数据库

现代信息检索论文: 现代信息检索方法的探讨 要想充分利用这些浩如烟海的文献信息资源,必须借助各种各样的检索工具。同时,因特网信息资源的骤增及其异构性、动态性,不断给信息检索带来新的挑战。信息检索已成为现代社会信息化和各种应用的关键。如何更高层次的模拟、应用人脑的智能原理,从本质上变革信息资源检索方法,已成为现代化信息知识检索理论研究的热点。实践证明,将人工智能技术与信息技术结合,发挥人工智能的作用,是一条成功的经验。下面就知识检索与信息检索的关联和发展,作初步的探讨。 一、布尔检索 利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种方法。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。用这些逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。 下面以“计算机”和“文献检索”两个词来解释三种逻辑算符的含义。①“计算机”AND“文献检索”,表示查找文献内容中既含有“计算机”又含有“文献检索”词的文献。②“计算机”OR“文献检索”,表示查找文献内容中含有“计算机”或含有“文献检索”以及两词都包含的文献。③“计算机”NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。 检索中逻辑算符使用是最频繁的,对逻辑算符使用的技巧决定检索结果的满意程度。用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。另外,对同一个布尔逻辑提问式来说,不同的运算次序会有不同的检索结果。布尔算符使用正确但不能达到应有检索效果的事情是很多的。 二、信息检索 信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索已成为图书馆独立的工具和用户服务项目。 信息检索通常指文本信息检索,包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索。它是基于信息组织形式,如字符串、结构化数据库,应用信息处理方法,如排序数据查找、字符匹配,实现效率不高的检索。信息检索综合应用布尔检索方法和基于超链的检索技术,改进了基本检索功能,但缺点是对精确的提问不能给出精确的回答。从历史上看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。 目前,信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的Web内容;信息检索的用户也由原来的情报专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式提出了更高、更多样化的要求。适应网络化、智能化以及个性化的需要是目前信息检索技术发展的新趋势。 三、知识检索 知识检索的基本思想是,模拟扩展人类关于知识处理与利用的智能行为和认识思维方法,是充分利用在线图书馆和数字图书馆的文献信息资源的有利工具。例如:抽象思维方法,形象思维方法。知识检索具有明显的优势:①实现信息服务向知识服务的转化,向用户提供潜在内容知识,以及分析预测后的超前性领域成果或知识。②提供主动服务方式,自动优化用户需求,主动提供个性化检索。③面向用户,依据用户的需求及其变化,能灵活选择理想的检索策略和技术,并且将繁重的知识信息存取工作从用户移向了计算机。④综合应用各类知识和各种高效的智能技术,全面提高检索效率。 知识检索是综合应用信息管理科学人工智能认知科学及语言学等多学科的先进理论与技术,基于知识和知识组织,融合知识处理和多媒体信息处理等多种方法与技术,充分表达和优化用户需求,能高效存取所有媒体类型的知识源,并能准确精选用户需要的结果。

二十、数学信息资源检索与利用文献检索一班:授课老师:粟劲苍上课时间:周一晚考试时间:2010年5月24号周一晚7:30——9:00考试地点:图书馆北楼405电子阅览室。文献检索二班:授课老师:刘进军上课时间:周三晚考试时间:2010年5月26号周三晚7:30——9:00考试地点:图书馆北楼405电子阅览室。

数字资源检索与利用论文选题

系 专业 班 学号 姓名 ┉┉┉┉┉┉┉┉┉┉┉密┉┉┉┉┉┉┉┉┉┉封┉┉┉┉┉┉┉┉┉┉线┉┉┉┉┉┉┉┉┉┉ 试卷类型:A苏州科技学院 文献检索 试题 使用专业年级: 考核方式 检索报告 共 页题号 一 二 三 四合计得分《文献检索课》综合实习报告第一部分 检索报告说 明1、按自己所学专业拟定一个综合性论文题目,分析课题,就该题目在本学期所学的中外数据库或网络检索工具中进行查找,写出详细检索报告。2、本报告中的题录格式书写要求:第一作者、题名、文献出处(书刊名、年、卷期、起止页码),网页引用日期等。参照以下格式: 期刊文章:(1)李旭东,宗光华,毕树生等生物工程微操作机器人视觉系统的研究北京航空航天大学学报,2002,28(3):249-252(2)Morse SPFactora in the emergence of infectious Emerg Infect Dis 1995,53(2):117- 图书、学位论文: (1)沈传尧数字资源检索与利用南京:江苏人民出版社, (2)张筑生.微分半动力系统的不变集.北京:北京大学数学系数学研究所,1983.网页江向东互联网环境下的信息处理与图书管理系统解决方案[2000-01-18]、严禁互相抄袭,违者检索报告成绩以零分计。一、课题拟定及分析检索课题(中文) 膜生物反应器与污水处理 (英文) Membrane Bioreactor and Sewage Treatment 课题分析膜生物反应器最早在微生物发酵工业中应用,在废水处理领域中的应用研究始于20世纪60年代的的美国,80年代后由于新型膜材料技术和制造技术的迅速发展,膜 生物反应器的研究与开发逐步成为热点,膜分离技术被誉为21世纪的技术。污水处理 中的膜生物反应器是指将超滤膜组件或微滤膜组件与生物反应器相结合的处理系统。其 特点有:容积负荷高,反应器体积小,污染物去除率高,出水水质好,污泥量极少,泥 龄长有一定的脱氮功能。但膜易污染、单位面积的膜透水量小、膜成本较高、一次性投 资大。主题词(中文) 膜生物反应器 膜组件 污泥回流 污水处理 (英文) membrane bioreactor membrane return sludge sewage treatment 二、中文报刊全文数据库检索从清华同方《中国学术期刊全文库》、《万方数据库资源系统》的期刊或学位论文库、重庆维普《中国科技期刊全文数据库》、人大复印报刊资料等中文全文数据库中选择2种数据库进行全文检索。数据库1: _清华同方《中国学术期刊全文库》 _ 检索方法___标准检索____________ ___ 检索式 _主题=膜生物反应器and污水处理_ 限定条件_2009-2012,核心期刊___ ____检出篇数____114篇__________________题录(1篇)1:_蒋岚岚,胡邦,羊鹏程 膜生物反应器工艺污水处理厂设计进水水质水质的确定 环境__ _污染与防治,2011,33(1):61-69 __ 数据库2: _维普《中文科技期刊全文数据库》__ 检索方法____基本检索_____________________ 检索式_关键词=膜生物反应器and关键词=污水处理 限定条件_2009-2012,核心期刊___________ ___检出篇数_____3篇_______________ _____题录(1篇)1:__洪俊明,尹娟,李伟博 动态膜生物反应器用于污水处理的研究进展 水处理技术,____2012,38(2):1-5___________________________ _______三、外文全文数据库检索从EBSCO、Springer-LINK数据库等外文期刊全文数据库中任选1种数据库进行检索。数据库名称___ _Springer-LINK___ ____ 检索方法_ _ advanced search _ _ 检索式_content= membrane bioreactor 限定条件__2009-2012______________检出篇数___5346__________________题录(1篇)1: Yujiao Sun, Yong Wang and Xia HRelationship between sludge settleability and membrane fouling in a membrane Frontiers of Environmental Science & Engineering in China 2007,1(2):221-225 四、列举2-3个与你专业相关的专业门户网站资源,并做简单描述。中文网站。(至少两个)给水排水网:给水排水网站是国内给排水行业的主要网站之一,由《给水排水》杂志创办。依托于《给水排水》杂志的巨大行业资源优势,为来自全国水务投资、运营、管理,建筑、市政、工业设计,工程咨询、承包、建设,房地产开发商,设备企业等提供了优质的服务。筑龙网:筑龙网是建筑行业电子技术资料下载平台和信息交流平台,并从2003年开始实行网上电子资料下载收费,筑龙网也成为行业内第一个收费网站,并于2004年开始发行下载资料消费卡--筑龙卡。经过近2年的探索和发展,成为一个模式清晰、内容丰富、拥有强大核心竞争力的建筑行业网站。英文网站。(至少一个)International Water Association:国际水协会(IWA)成立于1999年,是由两个成立已有较长历史的协会,即国际水质协会(IAWQ)和国际供水协会(IWSA)合并而成。此前,中国城镇供水协会先后加入了该二协会。使用搜索引擎查询与本课题相关的网页,要求网页标题里包含检索词,文件格式为word、excel或powerP搜索引擎:___百度____________ 检索本课题检索式filetype:doc and title:膜生物反应器与污水处理检出网页数____2_______网页题录(1)篇1 ______________________________________________________________ 五、查找与所选课题相关电子图书和馆藏纸本图书(各两册)。电子图书:彭跃莲膜技术前沿及工程应用北京:中国纺织出版社,2009刘雨,赵庆良生物膜法污水处理技术北京:中国建筑出版社,2000 馆藏纸本图书:蒋克彬,膜生物反应器的应用北京:中国石化出版社,2007邵嘉慧,何义亮,顾国维膜生物反应器北京:化学工业出版社,2012六、综合论述题1、根据以上几方面检索,简要介绍2-3篇(含外文)与你课题密切相关的文献(包括题录、摘要、主要观点或研究方法)结合您的检索实践,以“检索策略对检索效果的影响”为标题,写出检索分析短文一篇, 1000字以上。(学术期刊论文格式)1答:(1) 题录:付翠彦,张光辉,顾平膜生物反应器在污水处理中的研究应用进展水处理技术,2009,35(5):1-6摘要:膜生物反应器是近年来发展起来的传统生物处理单元与膜分离技术有机结合的高效污水处理新技术,具有常规污水处理工艺无法比拟的优势。本文介绍了膜生物反应器的主要类型及在国内外污水处理中的研究应用进展,分析了膜生物反应器应用过程中存在的问题及解决措施,展望了其应用前景及研究方向。主要观点:膜生物反应器(Membrane bioreactor,MBR)是传统生物处理单元与膜分离技术有机结合的新型高效污水处理技术,它取代了活性污泥法中的沉淀和过滤单元,具有处理效率高、出水水质好、占地面积小(只相当于传统处理工艺占地的1/8~1/5)、耐冲击负荷、操作管理简单、易于实现自动控制、污泥停留时间与水力停留时间分离等优点[1],在水污染控制及污水资源化方面有很大的潜在市场。 (2)Lawrence K Wang and Ravinder MTreatment of Industrial Effluents, Municipal Wastes, and Potable Water by Membrane Bioreactors Handbook of Environmental Engineering, 2008, Volume 13, 201-236 Abstract :Membrane bioreactor (MBR) is a biochemical engineering process involving the use of both (a) a suspended growth bioreactor for biochemical reactions (such as fermentation, bio-oxidation, nitrification, and denitrification) and (b) a membrane separator for subsequent solids–liquid In a chemical engineering fermentation process, the solids may be yeasts and the liquid may be an In an environmental engineering process, the solids may be activated sludge and the liquid may be the biologically treated water or 2答: 检索策略对检索效果的影响(苏州科技学院,江苏,苏州)摘要:检索策略,就是在分析检索提问的基础上,确定检索的数据库、检索的用词,并明确检索词之间的逻辑关系和查找步骤的科学安排。在我们检索的过程中,注重检索策略可以提高我们的检索质量,方便我们的检索。检索策略对检索效果有着很大的影响,在检索中要多用检索策略。关键词:检索策略 检索效果 信息查找 检索策略的概念所谓检索策略,就是在分析检索提问的基础上,确定检索的数据库、检索的用词,并明确检索词之间的逻辑关系和查找步骤的科学安排。检索策略的环节1明确课题需求、选择数据库检索过程中的首要环节,就是要明确课题需求,第一步如果搞错了,就谈不上最后检索结果的正确性。(1)分析课题检索的目的(2)明确题所涉及的学科范围和专业面:明确课题所涉及的主要学科范围、相关学科范围、交叉学科范围,并根据数据库的主题收录范围进行选择。(3)对文献的新颖性程度的要求:对文献新颖性要求高,就要选择数据更新周期短、速度快的数据库。(4)用户对检索的查全与查准要求:为满足查全要求,就要普查多种数据库,为快速满足查准要求,应选择主题范围最专指的数据库。2主题分析明确检索需求后,就要对用户课题的具体内容作主题分析,这是正确选用检索词和逻辑算符的的关键,它将决定检索策略的质量并影响检索效果。检索策略对检索效果的影响(1)可以加快检索速度,节省检索时间。(2)正确的检索策略可以让我们更全面的检索信息。(3)正确的检索策略可以让我们更有针对性的检索信息,是检索信息更具精确性。制定检索策略应注意的问题如果对主题不熟悉,可采用关键性的文献以确认检索词汇和厘清概念。宜避免选择太广泛或模糊的词汇检索,且可以储存并重复使用相同的概念和检索策略以节省检索时间。检索时除了利用选定的检索词汇进行检索外,也可利用索引典、标题表或系统自动提供之相关词进行检索,以增加检索结果。总结检索策略在我们检索中有着举足轻重的地位,制定检索策略是一种全面的知识与技能,也是一种经验,掌握了这种技能和经验,在检索的过程中将会获得比较好的检索效果。我们要加强检索策略的训练。从以下几方面着手①对课题的明确程度②对检索课题的分析③对数据库及其系统特性和功能的掌握④编制逻辑检索的技巧,加强检索策略的训练,提高检索效果。检索策略对检索效果有着不可忽略的重要影响,直接决定结果的相关性,正确有效的检索策略可节约我们大量宝贵的时间,真正达到事半功倍。 参考文献:李育嫦文献检索中提高查全率与查准率的方法探讨图书馆学研究11第二部分 文献检索基础知识简答题: 什么叫文献?按文献加工深度不同形成的文献类型有哪几种? 答:文献是用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一定物质载体上的知识。也可以理解为古今一切社会史料的总称。现在通常理解为图书、期刊等各种出版物的总和。 文献按加工深度不同可以分为四个层次,即一次文献(Primary literature)、二次文献(Secondary literature)、三次文献(Tertiary literature)与零次文献(Zero literature)。 2.ISBN答:ISBN:国际标准书号(International Standard Book Number)简称ISBN,是国际通用的图书或独立的出版物(除定期出版的期刊)代码。 查准率答:查准率是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。普遍表示为:查准率=(检索出的相关信息量/检索出的信息总量)x100% 简述检索语言的种类。 答:根据检索语言不同的特征将检索语言进行分类。按文献信息的特征,可分为:描述信息内容特征的语言和描述信息外部特征的语言;按检索工具编排体系,可分为:分类语言和主题词语言;按词汇的类型,可分为:关键词语言、单元词语言、标题词语言和叙词语言。 按其规范的情况,可分为:人工语言 (规范语言)和自然语言(非规范语言);按检索语言的词汇组配方式,可分为:先组式语言和后组式语言。 学术界称作具有评价意义的三大检索工具是哪些,它们收录的文献范围有什么区别。答:学术界称作具有评价意义的三大检索工具是SCI(科学引文索引 )、EI(工程索引 )、ISTP(科技会议录索引 )SCI是自然科学领域基础理论学科方面的重要的期刊文摘索引数据库。利用它可以检索数学、物理学、化学、天文学、生物学、医学、农业科学以及计算机科学、材料科学等学科方面重要的学术成果信息。ISTP由美国科学情报研究所编制,主要收录国际上著名的科技会议文献。它所收录的数据包括农业、环境科学、生物化学、分子生物学、生物技术、医学、工程、计算机科学、化学、物理学等学科。EI主要收录工程技术领域的论文,数据覆盖了核技术、生物工程、交通运输、化学和工艺工程、照明和光学技术、农业工程和食品技术、计算机和数据处理、应用物理、电子和通信、控制工程、土木工程、机械工程、材料工程、石油、宇航、汽车工程等学科领域。

课程介绍―课程目标介绍和应用课题分析方法;分析现代信息存储访问原理,提高信息资源的查询使用效率课程介绍―重要性(1)一个高效率的科研工作人员必须是头脑清醒,思维敏捷,注重信息搜集的人,并且还应具有善于积累,贮存世界科技前沿最新情报信息的能力课程介绍―重要性(2)当前信息存取组织的特征多样性泛滥性知识无关性技术制约性信息访问使用的一般特点知识应用能力弱目标不明确访问查询手段单一课程介绍―重要性(3)在这个信息泛滥的时代,我们正成为信息的奴隶,信息主宰了我们的生活,我们许多人却因为不能有效利用信息而没有成为这个时代的受益者作为科研工作人员这是很不幸的事课程安排第一部分 信息检索与课题分析基本知识介绍信息检索与课题分析基本理论,常识和方法第一部分 基于数据库的信息使用技术介绍基于数据库的信息资源使用与检索技术第二部分 基于网站的信息使用技术介绍通用搜索工具对网站信息搜索原理与使用技巧第三部分 现代图书馆信息服务的利用介绍现代数字化图书馆信息服务特征,以及在科技论文,课题论文写作中的利用参考文献《信息资源检索与利用》电子工业出版社 孙丽芳 主编《数字信息资源检索与利用》 北京大学出版社 肖珑 主编课程要求学习要求认真动脑思考课堂要求将手机打到震动档,接听电话请到教室外面积极参与课堂讨论考试要求递交感兴趣的课题申请表对课题进行恰当的分析制定信息检索方向,方案通过资料阅读分析,形成课题分析综述绪论:信息素养与信息检索概述 信息素养概述什么是信息素养最初定义:利用大量的信息工具及主要信息源使问题得到解答的技术和技能 能够充分地认识到何时需要信息,并能有效地检索,评价和利用信息掌握了各种学习方法,知道怎样组织知识,发现和使用信息这些人具有终身学习的能力因为他们不管碰到什么问题或做什么样的决定时,都能够发现必要的信息 绪论:大学生信息素养的基本内容 信息观念 对信息的看法,认识以及对信息的本质,价值和特征的认识信息意识 人们对信息需求的自我感悟,即人们对信息的捕捉,分析,判断和吸收的自觉程度信息能力 信息的获取,加工处理,消化吸收,利用和创新的能力信息道德 具有正确的信息道德观念,能在信息利用过程中遵循一定的法律法规,尊重著者的知识产权,规范自己的信息行为,合理使用与开发信息资源 绪论:信息资源与检索概论信息概述信息的概念数据,信息与知识任何信息在计算机系统中的表现都是数据数据对具有感知能力的人来说就是信息人通过大脑的反馈,将信息转化为知识例如:电话铃响(数据信号传输,感知为电话铃响这样一个信息,知识:有人Call我)正确看待网络信息,人的知识决定了我们对于信息的感知能力绪论:网络信息资源分类网络信息分类按内容分类注重学科相关按信息出版类型图书,期刊…按信息的媒体形式文本,超文本,多媒体按网络信息服务方式网站,新闻组,论坛,文件服务按信息格式(不同格式有不同的使用方法)TXT,DOC ,PDF, RM, MP3…绪论:网络信息资源组织网络信息资源组织网页文本电子全文多媒体资源其它资源检索平台搜索平台网络访问层数据库

信息资源检索与利用论文选题方向

我给你找了一篇,摘要如下:随着Internet在全世界范围内迅猛发展,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。 全文主要包括六个部分,第一部分为网络信息检索述评,主要是阐述了网络信息检索所涉及到的有关概念,如信息检索技术、网络信息检索的特点及网络信息检索效果评价。第二部分重点讨论了网络信息检索的基本技术。如信息推拉技术、数据挖掘技术、信息过滤技术、自然语言处理技术等等,旨在弄清网络信息检索的技术支撑,为预测网络信息检索的发展趋势作下铺垫。第三部分对网络信息检索的重要工具——搜索引擎进行了阐述,主要从其检索机制入手,分析了不同种类的搜索引擎的检索特点及功能。其独到之处在于对搜索引擎的基本功能进行了比较全面的概括,并对目前流行的搜索引擎进行科学的分类第四部分分析讨论了检索技术的另一分支—基于内容的检索技术第五部分则分析了网络信息搜索工具的局限,主要从文本信息检索和多媒体信息检索两方面进行阐述。好不容易给转成 xt文本,贴在下面:1网络信息资源网络信息资源是指“通过国际Intemet可以利用的各种信息资源”的总称。随着Intemet的迅速发展,网上信息资源也以指数形式增加,网络信息资源作为一种新型的信息资源,发挥着越来越重要的作用,其内容几乎无所不包,涉及政治、经济、文化、科学、娱乐等各个方面;其媒体形式多种多样,包括文本、图形、图像、声音、视频等;其范围覆盖社会科学、自然科学、人文科学和工程技术等各个领域。2信息检索技术信息检索技术是现代信息社会中非常关键的技术之一。信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术,所以信息检索的全称又叫“信息存储与检索”。狭义的信息检索仅指从信息集合中找出所需信息的过程,也就是利用信息系统检索工具查找所需信息的过程。人们获取信息源的方式主要有:①遵循传统的检索方法在浩如烟海的图书馆资料中,通过人工查找索引找到对应的文献索引号再获取文献原文;②联机信息检索。这其中也存在一个发展过程,由检索结果来看,从提供目录、文摘等相关的二次信息检索到可以直接获得电子版的全文;由检索方法来看,从对特定关键词或者如作者、机构等辅助信息作为检索入口的常规检索到以原始文献中任意词检索的全文检索等等。其中,全文检索由于其包含信息的原始性、信息检索的彻底性、所用检索语言的自然性等特点在近年来发展比较迅速,成为深受人们关注的一种非常有效的信息检索技术,它是从大容量文档库中精确定位所需信息的最有效手段l3]。2web信息检索其检索方式有:浏览器方式和搜索引擎方式。(l)浏览器方式(Br,singsystelns)。只要能够进入hitemct就能够通过浏览器,利用HTTP协议提供的WV乃万服务,浏览认触b页面和通过W匕b页面提供的检索方式访问数据库。(2)搜索引擎方式(SearehEngines)。搜索引擎是intemet提供公共信息检索服务的W七b站点,它是以一定的技术和策略在intemet中搜集和发现网络信息,并对网络信息进行理解、提取和处理,建立数据库,同时以认倪b形式提供一个检索界面,供用户输入检索关键词、词组或短语等检索项,代替用户在数据库中查找出与提问相匹配的记录,同时返回结果且按相关度排序输出,从而起到快速查找信息的目的。搜索引擎所处理的信息资源主要包括万维网服务器上的信息,另外还包括电子邮件和新闻组信息。搜索引擎服务的宗旨是为满足用户的信息需要,所以它是面向用户的,采用的方式是交互式的。网络信息检索工具采用主动提交或自动搜索两种方法搜索数据。4网络信息检索效果评价目前,得到普遍认同的检索效果的评价标准主要有以下几个:查全率、查准率、收录范围、输出格式,其中以查全率和查准率最为重要。现代信息科学技术的发展,为人们提供了多种多样的信息获取和传送方法及技术,从“信源”与“用户”的关系来看,可分为两种模式:“信息推送”模式(InformationPush),由“信源”主动将信息推送给“用户”,如电台广播;“信息拉取”模式(InformationPull),由“用户”主动从“信源”中拉取信息,如查询数据库。1信息推送技术“推”模式网络信息服务,是基于网络环境下的一种新的服务形式,即信息服务者在网上利用“Push”技术为特定用户开展信息服务的方式。Push技术之所以成为Intemet上一项新兴的技术,是因为借助该技术使网络信息服务具有主动性,不仅可以直接把用户感兴趣的信息推送给用户,而且可有效地利用网络资源,提高网络吞吐率;再者,Push技术还允许用户与提供信息的服务器之间透明地进行通信,极大地方便了用户。所谓Push技术,又称“推送”技术、Web广播(Webeasting)技术,实质上是一种软件,这种软件可以根据用户定义的准则,自动搜集用户最可能发生兴趣的信息,然后在适当的时候,将其传递至用户指定的“地点”。因而从技术上看,“推”模式网络信息服务就是具有一定智能性的、可以自动提供信息服务的一组计算机软件,该软件不仅能够了解、发现用户的兴趣(可能关心的某些主题的信息),还能够主动从网上搜寻信息,并经过筛选、分类、排序,然后按照每个用户的特定要求,主动推送给用户141。(l)信息推送方式。信息推送方式分两类,即网播方式和智能方式。网播方式有:频道式推送。频道式网播技术是目前普遍采用的一种模式,它将某些页面定义为浏览器中的频道,用户可像选择电视频道那样接受有兴趣的网播信息;邮件式推送,用电子邮件方式主动将所推送信息发布给各用户,如国际会议的通知、产品的广告等:网页式推送。在一个特定网页内将所推送信息发布给各用户,如某企业、某组织、某个人的网页;专用式推送。采用专门的信息发送和接收软件,信源将信息推送给专门用户,如机密的点对点通信。智能推送方式有:操作式推送(客户推送式),由客户数据操作启动信息推送。当某客户对数据进行操作时,把修改后的新数据存入数据库后,即启动信息推送过程,将新数据推送给其他客户;触发式推送(服务器推送式),由ll硕士学位论文MASTER,5THESIS⑧数据库中的触发器启动信息推送过程,将新数据推送给其他客户,当数据发生变化,如出现增加(Insert)、删除(Delete)、修改(update)操作时,触发器启动信息推送过程。(2)信息推送的特征。信息推送的特征有:主动性、针对性、智能性、高效性·灵活性和综合性I5]。主动性。Push技术的核心就是服务方不需要客户方的及时请求而主动地将数据传送到客户方。因而,主动性是“推”模式网络信息服务最基本特征之一。这也是它与基于浏览器的“拉”(Pull)模式的被动服务的鲜明对比。针对性(个性化)。针对性是说,Push技术可以针对用户的特定信息需求进行检索、加工和推送,并根据用户的特定信息需求为其提供个人定制的检索界面。智能性。Push服务器能够根据用户的要求自动搜集用户感兴趣的信息并定期推送给用户。甚至,Push技术中的“客户代理(ClientAgent)”可以定期自动对预定站点进行搜索,收集更新信息送回用户。同时个人信息服务代理和主题搜索代理还可为了提高“推送”的准确性,控制搜索的深度,过滤掉不必要的信息,将认飞b站点的资源列表及其更新状态配以客户代理完成。因而,网络环境下的“推”模式信息服务具有较高的智能性。这也是传统的定题服务(SDI)不能比的。高效性。高效性是网络环境下“推”模式信息服务的又一个重要特征。Push技术的应用可在网络空闲时启动,有效地利用网络带宽,比较适合传送大数据量的多媒体信息。灵活性。灵活性是指用户可以完全根据自己的方便和需要,灵活地设置连接时间,通过E一mail、对话框、音频、视频等方式获取网上特定信息资源。综合性。“推”模式网络信息服务的实现,不仅需要信息技术设备,而且还依赖于搜寻软件、分类标引软件等多种技术的综合[6]。但在当前信息技术的发展阶段,“推”技术还存在很大的缺陷,比如:不能确保信息发送,没有状态跟踪,缺乏群组管理功能等等。因此,国内外的研究者们又提出超级推(BeyondPush)技术的理论。所谓超级推技术是在保留、继承、完善了Push的优点(主动传递和个性化定制),摒弃了Push的诸多缺点之,2硕士学位论文MASTER,5THESIS管后而发展起来的一种新型的Push技术。它的最大特点是在于保证传送。即所有的信息都是在特定的时间送给特定的信息用户,同时保持连续性的用户资料,随时可以知道谁收到了信息,信息是否为该用户定制,用户环境是否适当等等[刀。2信息拉取技术常用的、典型的信息拉取技术,如数据库查询,是由用户主动查询数据库,从数据库中拉取所需信息。其主要优点是:针对性好,用户可针对自己的需求有目的地去查询、搜索所需的信息。Intemet上的信息拉取技术可以说是数据库查询技术的扩展和延伸。在网络上,用户面对的不止是一个数据库,而是拥有海量信息的hitemet环境,因此,各种网络信息拉取(查询)的辅助工具—搜索引擎应运而生了。信息推送与信息拉取两种模式各有其特点,在实际中常常是将两者的结合起来,常用的结合方式为:(1)“先推后拉”式。先及时地推送最新信息(更新的动态信息),再有针对性地拉取所需的信息。这样,便于用户注意信息变化的新情况和趋势,从而动态地选取需要深入了解的信息。(2)“先拉后推”式。用户先拉取所需信息,然后根据用户的兴趣,再有针对性地推送相关的其它信息。(3)“推中有拉”式。在信息推送过程中,允许用户随时中断、定格在所感兴趣的网页上,作进一步的搜索,主动拉取更丰富的信息。(4)“拉中有推”式。在用户拉取信息的搜索过程中,根据用户输入的关键词,信源主动推送相关信息和最新信息。这样既可以及时地、有针对性时为用户服务,又可以减轻网络的负担,并便于扩大用户范围[8]。因此,信息推送与信息拉取相结合是当前Intemet、数据库系统及其它信息系统为用户提供主动信息服务的一个发展方向。3Web挖掘技术随着功temet的发展,W己b已经成为人类社会的公共信息源。在hitemet给人类带来前所未有的信息机遇的同时,又使得人类的信息环境更加复杂,人硕士学位论文MASTER,5THESIS⑧类如何利用信息的问题非但没有如预想的通过信息技术的发展得到圆满的解决,相反,随着信息技术的发展,信息量的激增,造成了个人实际所需信息量与研触b上的海量信息之间的矛盾,因而也就造成了个人利用信息的困难。在这种情况下,虽然出现了叭范b环境下的专门检索工具,但是由于搜索引擎是由传统检索技术发展而来,在当前用户要求不断提高的情况下,传统的搜索技术己经不能够满足人们的需要。为了更加有效地利用网络信息资源,W七b挖掘作为新的知识挖掘的手段,为Web信息的利用提出了新的解决方案叨。3,1姗eb挖掘的内容数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。Web挖掘则是从WWW及其相关的资源和行为中抽取有用的模式和隐含信息。其中WWW及其相关资源是指存在于WWW之上的Web文档及Web服务器上的日志文件以及用户资料,从Web挖掘的概念中应当看出Web挖掘在本质上是一种知识发现的手段,它主要从下面3个方面进行仁时。(1)Web内容挖掘。W七b内容挖掘是从W匕b数据中抽取知识,以实现Web资源的自动检索,提高web数据的利用效率。随着Intemet的进一步延伸,Web数据越来越庞大,种类越来越繁多,数据的形式既有文本数据信息,也有图像、声音、视频等多媒体数据信息,既有来自于数据库的结构化数据,也有用HTML标记的半结构化数据及非结构化的自由文本数据信息。因而,对W己b内容信息挖掘主要从下面两个角度进行〔”]。一是从信息检索的角度,主要研究如何处理文本格式和超级链接文档,这些数据是非结构化或半结构化的。处理非结构化数据时,一般采用词集方法,用一组组词条来表示非结构化的文本,先用信息评价技术对文本进行预处理,然后采取相应的模型进行表示。另外,还可以用最大字序列长度、划分段落、概念分类、机器学习和自然语言统计等方法来表示文本。处理半结构化数据时,可以利用一些相关算法给超级链接分类,寻求认七b页面关系,抽取规则。同处理非结构化数据相比,由于半结构化数据增加了HTM毛标记信息及Web文档内部超链结构,使得表示半结构化数据的方法更加丰富。二是从数据库的角度,主要处理结构化的W匕b数据库,也就是超级链接14⑧蕊誉蕊文档,数据多采用带权图或者对象嵌入模型(OME),或者关系数据库表示,应用一定的算法,寻找出网站页面之间的内在联系,其主要目的是推导出Web站点结构或者把W匕b变成一个数据库,以便进行更好的信息管理和查询。数据库管理一般分成三个方面:一是模型化,研究认触b上的高级查询语言,使其不局限于关键字查询;二是信息的集成与抽取,把每个W七b站点及其包装程序看成是一个认范b数据源,通过W七b数据仓库(data~house)或虚拟W七b数据库实现多种数据来源的集成;三是叭几b站点的创建与重构,通过研究web上的查询语言来实现建立并维护web站点的途径[“]。(2)札b结构挖掘。W匕b结构挖掘,主要指的是通过对W七b文档的分析,从文档之间的组织结构获取有用的模式。W匕b内容挖掘研究的是文档内的关系,W七b结构挖掘关注的则是网站中的超级链接结构之间的关系,找到隐藏在一个个页面之后的链接结构模型,可以用这个模型对W七b页面重新分类,也可以用于寻找相似的网站。W七b结构挖掘处理的数据类型为W七b结构化的数据。结构化数据是描述网页内容组织方式的数据,页内结构可以用超文本标记语言等表示成树型结构,此外页间结构还可以用连接不同网页的超链结构表示。文档间的链接反映了文档信息间的某种联系,如隶属平行关系、引用与被引用关系等。对W七b页面的超级链接进行分类,可以判断与识别页面信息间的属性关系。由于Web页面内部存在或多或少的结构信息,通过研究W亡b页面内部结构,可寻找出与用户选定的页面集合信息相关的其它页面信息模式,以检测W己b站点所展示的信息完整程度。③Web行为挖掘。所谓W己b用户行为挖掘主要是通过对认尼b服务器的日志文件以及用户信息的分析,从而获得有关用户的有用模式。W七b行为挖掘的数据信息主要指网络日志中包括的用户行为模式,它包括检索时间、检索词、检索路径、检索结果以及对哪些检索结果进行了浏览。由于W七b自身的异质、分布、动态、无统一结构等特点,使得在认七b网上进行内容挖掘比较困难,它需要在人工智能和自然语言理解等方面有所突破。所幸的是基于W七b服务器的109日志存在着完整的结构,当信息用户访问web站点时,与访问相关的页面、时间、用户ro等信息,日志中都作了相应的记录,因而对其进行信息l5硕士学位论文MASTER,5THESIS⑥挖掘是可行的,也是有意义的。在技术实践过程中,一般先把日志中的数据映射成诸种关系信息,并对其进行预处理,包括清除与挖掘不相关的信息等。为了提高性能,目前对109日志数据信息挖掘采用的方法有路径分析、关联规则、模式发现、聚类分析等。为了提高精确度,行为挖掘也应用到站点结构信息和页面内容信息等方面。2web挖掘技术在网络信息检索中的应用(l)Web内容挖掘在检索中的应用。W匕b内容挖掘是指从文档内容及其描述中获取知识的过程,由于用传统的信息检索技术对W己b文档的处理不够深入,因此,可以利用叭触b内容挖掘技术来对网络信息检索中的W己b文档处理部分进行进一步的完善,具体而言表现在以下几个方面。①文本总结技术。文本总结技术是指从文档中抽取出关键信息,然后以简洁的形式对W匕b文档的信息进行摘要或表示。这样用户通过浏览这些关键信息,就可以对W七b网页的信息有大致的了解,决定其相关性并对其进行取舍。②文本分类技术。W匕b内容挖掘中的文本分类指的是按照预先定义的主题类别,利用计算机自动为文档集合中的每一个文档进行分类。分类在网络信息检索中的价值在于可以缩小检索范围,大大提高查准率。目前,己经出现了很多文本分类技术,如TFIFF算法等,由于文本挖掘与搜索引擎所处理的文本几乎完全一样,所以可以直接将文本分类技术应用于搜索引擎的自动分类之中,通过对大量页面自动、快速、有效的分类,来提高文档检索的查准率。③文本聚类技术。文本聚类与文本分类的过程J险洽相反,文本聚类指的是将文档集合中的文档分为更小的簇,要求同一簇内的文档之间的相似性尽可能大,而簇与簇之间的关系尽可能小,这些簇相当于分类表中的类目。文本聚类技术不需要预先定义好的主题类别,从而使得搜索引擎的类目能够与所收集的信息相适应。文本聚类技术与人工分类相比,它的分类更加迅速、客观。同时,文本聚类可与文本分类技术相结合,使得信息处理更加方便。可以对检索结果进行分类,并将相似的结果集中在一起。(2)Web结构挖掘在网络信息检索中的应用。W匕b的信息组织方式采用了一种非平面结构,一般来说W己b的信息组织方式是根据内容来进行组织的。但是由于W匕b的这些结构信息比较难以处理,所以搜索引擎一般不处理这些信16硕士学位论文MASTER,S竹正515⑧息,而是将叭触b页面作为平面机构的文本进行处理。但是,在从触b结构挖掘中,通过对研触b文档组织结构的挖掘,搜索引擎可以进一步扩展搜索引擎的检索能力,改善检索效果〔3]。(3)脆b行为挖掘在网络信息检索中的应用。认触b行为挖掘是一种通过挖掘总结出用户的检索行为的模式。用户的检索行为一直是信息检索中重要的研究内容,通过研触b行为挖掘,不仅可以发现多数用户潜在共同的行为模式,而且还可以发现单个用户的个性化行为,对这些模式进行研究,可以更好地对搜索引擎的检索效果进行反馈,以便进一步改进搜索策略,提高检索效果。3web挖掘技术的局限及方向(1)孔b内容挖掘。W七b上的数据不管是用HTML还是XML标记语言表示,都不能完全解决W七b数据的非结构性问题,特别是汉语句子格式繁多,虚词、实词没有绝对的界限,切分词难度大,这些是造成无法对数据进行完全自动标引的根本性问题,因此,从七b内容挖掘技术有必要结合数据仓库等信息技术进行信息存储,并最终实现智能化、自动化的数据表示和标引,以供搜索之用。通常数据的表示和数据的利用形式是相互关联的,因此,设计相应的具有高查全率和查准率的挖掘算法也和数据表示一样是未来的方向之一。另外多媒体数据如何进行识别分类标引,这也是未来的研几b内容挖掘研究的难点和方向。(2)梅b结构数据挖掘。随着Intemet的迅猛发展,网站的内容也越来越丰富,结构也越来越庞杂,用有向图表示巨型网站链接结构将不能满足数据处理的需要,需要设计新的数据结构来表示网站结构。由于用来作对比分析发现问题所在的用户使用信息只有日志流,那么,对用户使用日志流中每一链接关系如何识别、采用什么结构表示、如何抽取有用的模式等等,不仅是认飞b行为挖掘的重要研究内容也是网站结构挖掘的重要研究方向之一。(3),eb用户行为挖掘。由于Iniemet传输协议HTTP的无状态性,客户端、代理服务器端缓存的存在,使用户访问日志分别存在于服务器、代理服务器和客户端,因此,从W七b用户访问日志中研究用户访问规律最大的难点在于如何把分布于不同位置的访问日志经过预处理,形成一个个用户一次的访问期间。通常来讲,对于静态W七b网站,服务器端的日志容易取得,客户端和代l7理服务器用户访问日志不容易取得;其次,由于一个完整的W匕b是由一个个图片和框架页面组成的,而用户访问服务器也有并发性,在确定用户访问内容时,必须从服务器日志中甄选出某个用户实际请求的页面和页面的主要内容。另外,由于目前已经有的数据挖掘算法主要是在大量交易数据基础上发展起来的,在处理海量Web用户访问日志中也需要重新设计算法结构〔41。4信息过滤技术hitemet开放式的环境,为人们检索和利用信息提供了极大的方便,但同时,网络环境也为人们及时准确地检索到所需信息带来了麻烦。这是因为,第一,网络环境中信息的来源复杂多样,随意性大,任何人、任何单位不管其背景和动机如何都可以在网络上发布信息,信息的产生和传播没有经过筛选和审定,因此信息的可靠性、质量和价值成为用户普遍担心的一大问题;第二,目前大多数据搜索工具的检索范围是综合性的,它们的Robots尽可能地把各种网页抓回来,经过简单加工后存放在数据库中备检;第三,搜索引擎直接提供给用户的检索途径大都是基于关键词的布尔逻辑匹配,返回给用户的就是所有包括关键词的文献,这样的检索结果在数量上远远超出了用户的吸收和使用能力,让人感到束手无策。这就是人们经常谈论的“信息过载”、“信息超载”现象。信息过滤技术就是在这样的背景下开始受到人们的重视,它的目的就是让搜索引擎具有更多的“智力”,让搜索引擎能够更加深入、更加细致地参与到用户的整个检索过程中,从关键词的选择、检索范围的确定到检索结果的精炼,帮助用户在浩如烟海的信息中找到和需求真正相关的资料。1信息过滤模型信息过滤其实质仍是一种信息检索技术,因此它仍依托于某一信息检索模型,不同的检索模型有不同的过滤方法。51。(1)利用布尔逻辑模型进行过滤。布尔模型是一种简单的检索模型。在检索中,它以文献中是否包含关键词来作为取舍标准,因此,它不需要对网页数据进行深度的加工。最简单的关键词表可以设计成只有三个字段:关键词、包括关键词的文献号、关键词在相应文献中出现的次数。检索时,用户提交关键词。

网络信息检索方法与应用这个原创。联系看我资料

信息检索技术论文 –基于网格的面向专业内容的Web信息检索1 引言近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1(1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。(2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。(3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。1 集群系统的设计由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。下面主要说明基于专业内容的XML信息集成系统的构造方法:XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。图2 网格中间件的设计图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。内部主要功能模块说明如下:(1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。(2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。(3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。(4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。(5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。文秘杂烩网

数字资源检索与利用论文

二十、数学信息资源检索与利用文献检索一班:授课老师:粟劲苍上课时间:周一晚考试时间:2010年5月24号周一晚7:30——9:00考试地点:图书馆北楼405电子阅览室。文献检索二班:授课老师:刘进军上课时间:周三晚考试时间:2010年5月26号周三晚7:30——9:00考试地点:图书馆北楼405电子阅览室。

能进宁大内网么?能进就好说了,按关键词搜索,然后下载,浏览,复制,粘贴,论文,就是这么简单,当年我们论文基本一星期搞定

系 专业 班 学号 姓名 ┉┉┉┉┉┉┉┉┉┉┉密┉┉┉┉┉┉┉┉┉┉封┉┉┉┉┉┉┉┉┉┉线┉┉┉┉┉┉┉┉┉┉ 试卷类型:A苏州科技学院 文献检索 试题 使用专业年级: 考核方式 检索报告 共 页题号 一 二 三 四合计得分《文献检索课》综合实习报告第一部分 检索报告说 明1、按自己所学专业拟定一个综合性论文题目,分析课题,就该题目在本学期所学的中外数据库或网络检索工具中进行查找,写出详细检索报告。2、本报告中的题录格式书写要求:第一作者、题名、文献出处(书刊名、年、卷期、起止页码),网页引用日期等。参照以下格式: 期刊文章:(1)李旭东,宗光华,毕树生等生物工程微操作机器人视觉系统的研究北京航空航天大学学报,2002,28(3):249-252(2)Morse SPFactora in the emergence of infectious Emerg Infect Dis 1995,53(2):117- 图书、学位论文: (1)沈传尧数字资源检索与利用南京:江苏人民出版社, (2)张筑生.微分半动力系统的不变集.北京:北京大学数学系数学研究所,1983.网页江向东互联网环境下的信息处理与图书管理系统解决方案[2000-01-18]、严禁互相抄袭,违者检索报告成绩以零分计。一、课题拟定及分析检索课题(中文) 膜生物反应器与污水处理 (英文) Membrane Bioreactor and Sewage Treatment 课题分析膜生物反应器最早在微生物发酵工业中应用,在废水处理领域中的应用研究始于20世纪60年代的的美国,80年代后由于新型膜材料技术和制造技术的迅速发展,膜 生物反应器的研究与开发逐步成为热点,膜分离技术被誉为21世纪的技术。污水处理 中的膜生物反应器是指将超滤膜组件或微滤膜组件与生物反应器相结合的处理系统。其 特点有:容积负荷高,反应器体积小,污染物去除率高,出水水质好,污泥量极少,泥 龄长有一定的脱氮功能。但膜易污染、单位面积的膜透水量小、膜成本较高、一次性投 资大。主题词(中文) 膜生物反应器 膜组件 污泥回流 污水处理 (英文) membrane bioreactor membrane return sludge sewage treatment 二、中文报刊全文数据库检索从清华同方《中国学术期刊全文库》、《万方数据库资源系统》的期刊或学位论文库、重庆维普《中国科技期刊全文数据库》、人大复印报刊资料等中文全文数据库中选择2种数据库进行全文检索。数据库1: _清华同方《中国学术期刊全文库》 _ 检索方法___标准检索____________ ___ 检索式 _主题=膜生物反应器and污水处理_ 限定条件_2009-2012,核心期刊___ ____检出篇数____114篇__________________题录(1篇)1:_蒋岚岚,胡邦,羊鹏程 膜生物反应器工艺污水处理厂设计进水水质水质的确定 环境__ _污染与防治,2011,33(1):61-69 __ 数据库2: _维普《中文科技期刊全文数据库》__ 检索方法____基本检索_____________________ 检索式_关键词=膜生物反应器and关键词=污水处理 限定条件_2009-2012,核心期刊___________ ___检出篇数_____3篇_______________ _____题录(1篇)1:__洪俊明,尹娟,李伟博 动态膜生物反应器用于污水处理的研究进展 水处理技术,____2012,38(2):1-5___________________________ _______三、外文全文数据库检索从EBSCO、Springer-LINK数据库等外文期刊全文数据库中任选1种数据库进行检索。数据库名称___ _Springer-LINK___ ____ 检索方法_ _ advanced search _ _ 检索式_content= membrane bioreactor 限定条件__2009-2012______________检出篇数___5346__________________题录(1篇)1: Yujiao Sun, Yong Wang and Xia HRelationship between sludge settleability and membrane fouling in a membrane Frontiers of Environmental Science & Engineering in China 2007,1(2):221-225 四、列举2-3个与你专业相关的专业门户网站资源,并做简单描述。中文网站。(至少两个)给水排水网:给水排水网站是国内给排水行业的主要网站之一,由《给水排水》杂志创办。依托于《给水排水》杂志的巨大行业资源优势,为来自全国水务投资、运营、管理,建筑、市政、工业设计,工程咨询、承包、建设,房地产开发商,设备企业等提供了优质的服务。筑龙网:筑龙网是建筑行业电子技术资料下载平台和信息交流平台,并从2003年开始实行网上电子资料下载收费,筑龙网也成为行业内第一个收费网站,并于2004年开始发行下载资料消费卡--筑龙卡。经过近2年的探索和发展,成为一个模式清晰、内容丰富、拥有强大核心竞争力的建筑行业网站。英文网站。(至少一个)International Water Association:国际水协会(IWA)成立于1999年,是由两个成立已有较长历史的协会,即国际水质协会(IAWQ)和国际供水协会(IWSA)合并而成。此前,中国城镇供水协会先后加入了该二协会。使用搜索引擎查询与本课题相关的网页,要求网页标题里包含检索词,文件格式为word、excel或powerP搜索引擎:___百度____________ 检索本课题检索式filetype:doc and title:膜生物反应器与污水处理检出网页数____2_______网页题录(1)篇1 ______________________________________________________________ 五、查找与所选课题相关电子图书和馆藏纸本图书(各两册)。电子图书:彭跃莲膜技术前沿及工程应用北京:中国纺织出版社,2009刘雨,赵庆良生物膜法污水处理技术北京:中国建筑出版社,2000 馆藏纸本图书:蒋克彬,膜生物反应器的应用北京:中国石化出版社,2007邵嘉慧,何义亮,顾国维膜生物反应器北京:化学工业出版社,2012六、综合论述题1、根据以上几方面检索,简要介绍2-3篇(含外文)与你课题密切相关的文献(包括题录、摘要、主要观点或研究方法)结合您的检索实践,以“检索策略对检索效果的影响”为标题,写出检索分析短文一篇, 1000字以上。(学术期刊论文格式)1答:(1) 题录:付翠彦,张光辉,顾平膜生物反应器在污水处理中的研究应用进展水处理技术,2009,35(5):1-6摘要:膜生物反应器是近年来发展起来的传统生物处理单元与膜分离技术有机结合的高效污水处理新技术,具有常规污水处理工艺无法比拟的优势。本文介绍了膜生物反应器的主要类型及在国内外污水处理中的研究应用进展,分析了膜生物反应器应用过程中存在的问题及解决措施,展望了其应用前景及研究方向。主要观点:膜生物反应器(Membrane bioreactor,MBR)是传统生物处理单元与膜分离技术有机结合的新型高效污水处理技术,它取代了活性污泥法中的沉淀和过滤单元,具有处理效率高、出水水质好、占地面积小(只相当于传统处理工艺占地的1/8~1/5)、耐冲击负荷、操作管理简单、易于实现自动控制、污泥停留时间与水力停留时间分离等优点[1],在水污染控制及污水资源化方面有很大的潜在市场。 (2)Lawrence K Wang and Ravinder MTreatment of Industrial Effluents, Municipal Wastes, and Potable Water by Membrane Bioreactors Handbook of Environmental Engineering, 2008, Volume 13, 201-236 Abstract :Membrane bioreactor (MBR) is a biochemical engineering process involving the use of both (a) a suspended growth bioreactor for biochemical reactions (such as fermentation, bio-oxidation, nitrification, and denitrification) and (b) a membrane separator for subsequent solids–liquid In a chemical engineering fermentation process, the solids may be yeasts and the liquid may be an In an environmental engineering process, the solids may be activated sludge and the liquid may be the biologically treated water or 2答: 检索策略对检索效果的影响(苏州科技学院,江苏,苏州)摘要:检索策略,就是在分析检索提问的基础上,确定检索的数据库、检索的用词,并明确检索词之间的逻辑关系和查找步骤的科学安排。在我们检索的过程中,注重检索策略可以提高我们的检索质量,方便我们的检索。检索策略对检索效果有着很大的影响,在检索中要多用检索策略。关键词:检索策略 检索效果 信息查找 检索策略的概念所谓检索策略,就是在分析检索提问的基础上,确定检索的数据库、检索的用词,并明确检索词之间的逻辑关系和查找步骤的科学安排。检索策略的环节1明确课题需求、选择数据库检索过程中的首要环节,就是要明确课题需求,第一步如果搞错了,就谈不上最后检索结果的正确性。(1)分析课题检索的目的(2)明确题所涉及的学科范围和专业面:明确课题所涉及的主要学科范围、相关学科范围、交叉学科范围,并根据数据库的主题收录范围进行选择。(3)对文献的新颖性程度的要求:对文献新颖性要求高,就要选择数据更新周期短、速度快的数据库。(4)用户对检索的查全与查准要求:为满足查全要求,就要普查多种数据库,为快速满足查准要求,应选择主题范围最专指的数据库。2主题分析明确检索需求后,就要对用户课题的具体内容作主题分析,这是正确选用检索词和逻辑算符的的关键,它将决定检索策略的质量并影响检索效果。检索策略对检索效果的影响(1)可以加快检索速度,节省检索时间。(2)正确的检索策略可以让我们更全面的检索信息。(3)正确的检索策略可以让我们更有针对性的检索信息,是检索信息更具精确性。制定检索策略应注意的问题如果对主题不熟悉,可采用关键性的文献以确认检索词汇和厘清概念。宜避免选择太广泛或模糊的词汇检索,且可以储存并重复使用相同的概念和检索策略以节省检索时间。检索时除了利用选定的检索词汇进行检索外,也可利用索引典、标题表或系统自动提供之相关词进行检索,以增加检索结果。总结检索策略在我们检索中有着举足轻重的地位,制定检索策略是一种全面的知识与技能,也是一种经验,掌握了这种技能和经验,在检索的过程中将会获得比较好的检索效果。我们要加强检索策略的训练。从以下几方面着手①对课题的明确程度②对检索课题的分析③对数据库及其系统特性和功能的掌握④编制逻辑检索的技巧,加强检索策略的训练,提高检索效果。检索策略对检索效果有着不可忽略的重要影响,直接决定结果的相关性,正确有效的检索策略可节约我们大量宝贵的时间,真正达到事半功倍。 参考文献:李育嫦文献检索中提高查全率与查准率的方法探讨图书馆学研究11第二部分 文献检索基础知识简答题: 什么叫文献?按文献加工深度不同形成的文献类型有哪几种? 答:文献是用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一定物质载体上的知识。也可以理解为古今一切社会史料的总称。现在通常理解为图书、期刊等各种出版物的总和。 文献按加工深度不同可以分为四个层次,即一次文献(Primary literature)、二次文献(Secondary literature)、三次文献(Tertiary literature)与零次文献(Zero literature)。 2.ISBN答:ISBN:国际标准书号(International Standard Book Number)简称ISBN,是国际通用的图书或独立的出版物(除定期出版的期刊)代码。 查准率答:查准率是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。普遍表示为:查准率=(检索出的相关信息量/检索出的信息总量)x100% 简述检索语言的种类。 答:根据检索语言不同的特征将检索语言进行分类。按文献信息的特征,可分为:描述信息内容特征的语言和描述信息外部特征的语言;按检索工具编排体系,可分为:分类语言和主题词语言;按词汇的类型,可分为:关键词语言、单元词语言、标题词语言和叙词语言。 按其规范的情况,可分为:人工语言 (规范语言)和自然语言(非规范语言);按检索语言的词汇组配方式,可分为:先组式语言和后组式语言。 学术界称作具有评价意义的三大检索工具是哪些,它们收录的文献范围有什么区别。答:学术界称作具有评价意义的三大检索工具是SCI(科学引文索引 )、EI(工程索引 )、ISTP(科技会议录索引 )SCI是自然科学领域基础理论学科方面的重要的期刊文摘索引数据库。利用它可以检索数学、物理学、化学、天文学、生物学、医学、农业科学以及计算机科学、材料科学等学科方面重要的学术成果信息。ISTP由美国科学情报研究所编制,主要收录国际上著名的科技会议文献。它所收录的数据包括农业、环境科学、生物化学、分子生物学、生物技术、医学、工程、计算机科学、化学、物理学等学科。EI主要收录工程技术领域的论文,数据覆盖了核技术、生物工程、交通运输、化学和工艺工程、照明和光学技术、农业工程和食品技术、计算机和数据处理、应用物理、电子和通信、控制工程、土木工程、机械工程、材料工程、石油、宇航、汽车工程等学科领域。

数字资源检索与利用论文题目

经青岛农业大学海都学院人文艺术系环境艺术设计3班六号楼505宿舍贱彬。。贱伦。。贱迪。贱路。。贱蛋。。,。。一直表示你的作业要求我们也没辙。。。。愁死了。。。

6号楼505全体男生对此问题以无解处理。。

品牌按照使用主体和持续时间,可分为

信息的特征 载体依附性,无线共享性,永不枯竭性开发增值性 应用实效性存在普遍性情报的定义和属性 是运用一定的媒体(载体),越过空间和时间传递给特定用户,解决科研、生产中的具体问题所需要的特定知识和信息。 1、知识性(情报的本质是知识。没有一定的知识内容,就不能成为情报。知识性是情报最重要的属性。) 2、传递性(知识若不进行传递交流,供人们利用 ,就不能构成情报。) 3、效用性(情报为用户服务,用户需要情报,效用性是衡量情报工作的重要标志。)信息源的类型 按信息源存在的形式划分为个人信息源、组织机构信息源、实物型信息源、文献型信息源、电子型信息源五个类型。 信息源定义 信息源:个人为满足其信息需要而获得的信息来源。文献定义 用一定的方式(文字,图像声音)记录在一定载体(纸张磁盘光盘等)上的知识都称之为文献。文献是知识的外在表现形式。 文献的四要素: 信息内容(文献中所表达的思想意识和知识观念。是文献的内涵灵魂之所在,直接体现了文献精神产品的性能,具有知识和情报价值)、信息符号(符号系统是揭示文献信息内容的标识,表达知识情报的手段,记录和传播文献信息内容的媒介)、记录方式(将文献符号系统所代表的信息内容通过特定的人工记录手段和方法,使其附着于一定的文献载体材料上)、载体材料(可供记录信息符号的物质材料,是全部信息载体中一个重要的子系统) 信息源组成的三要素: 信息生产者、信息、信息技术。 主题语言: 叙词、元词、标题词、关键词。 文献的类型 按信息源内容深度划分为零次文献、一次文献、二次文献、三次文献。1、 零次文献:未经出版发行或未进入社会交流的最原始的文献。2、 一次文献:以作者本人取得的成果为依据而创作的论文、报告等经公开发表或出版的各种文献,习惯上成为原始文献。3、 二次文献:二次文献是按照特定目的对一定范围或学科领域的大量分散的、无组织的一次文献进行鉴别、筛选、分析、归纳和加工整理重组而成的系统的有序化的、方便查找使用的浓缩简化产物。4、 三次文献:根据二次文献提供的线索,选用大量一次文献的内容,经过筛选、分析、综合和浓缩而再度出版的文献。 文献型信息的类型:(1)、图书(2)期刊(3)学位论文(4)科技报告(5)专利文献(6)标准文献(7)产品样本(8)会议文献(9)政府出版物狭义信息资源的概念 认为信息资源是指人类社会经济活动中,经过加工处理,有序化,并大量积累起来的,有用信息的集合广义的概念 认为信息资源是指人类社会信息,活动中积累起来的,信息信息,生产者信息技术等信息,活动要素的集合总体来说,信息资源就是人类信息社会活动中大量积累起来的以信息为核心的各类信息活动要素(信息生产者、信息技术、设备、设施、资金等)的集合。信息资源的构成要素,信息生产者 信息,信息技术信息源和信息资源的区别 信息源不等于信息资源,信息源与信息资源既紧密相关又有区别。信息源是信息资源的源,是先于信息资源的,信息源可以不断的转化为信息资源;但信息源不等于信息资源,信息源是蕴含信息的一切事物,信息资源则是可利用的信息的集合,信息资源可以是一种高质量、高纯度的信息源,但信息源不全是信息资源。信息文化的特征 数字化全球化 虚拟性交互性 开放性自治性自律性 自由平等共享 医学信息素养的内涵主要包括: 信息意识、信息知识、信息勇气、信息道德。1、 信息意识:指信息在人脑中的反映即人对各种信息的自觉心理反映,反映人在信息活动过程中对信息的认识、态度、价值趋向和一定需求。2、 信息知识:指与信息有关的理论、知识和方法。3、 信息勇气:指有效利用信息技术和信息资源获取信息、加工处理信息以及创造和交流新信息的能力。4、 信息道德:指在获取信息、使用、创造和传播过程中应该遵守一定的伦理规范。信息检索的类型,文献检索 事实检索 数据检索 信息检索的类型 1、文献检索(是查找特定相关内容的文献,如 查找某一专题或者找某一著作的文献,再从查找的文献中获取相关的信息,只是最重要、最基本的检索。)2、事实检索(是以特定事实为检索对象,检索的结果是有关某一事物的具体答案,因此事实检索是一种确定性检索。)3、数据检索(是以特定的数据为检索对象,检索的结果是经过测试、评价过的各种数据,可直接用于比较分析或定量分析,是一种确定性的检索。) 信息检索系统的组成:一般由计算机硬件、计算机软件及数据库三部分组成。数据库:信息检索系统的信息源,是按一定方式存储磁盘、磁带或光盘上的相互关联的数据集合。 数据库的组成:文档、记录、字段。 数据库的类型:书目数据库、事实数据库、数值数据库、全文数据库、图像数据库 世界上的检索语言有很多种,依其划分方法的不同,划分出不同类型。有表达文献外部特征的检索语言,也有表达文献内容特征的检索语言。信息检索的语言:分类语言、主题语言。(标题词 元词叙词,关键词)分类语言:是运用逻辑分类原理,按文献内容的学科、专业集中文献、从知识分类的角度揭示各类文献在内容上的区别和联系,将性质相同的文献聚集在一起,性质相近的联系在一起,性质不同的予以分开。 信息检索的途径:分类途径、主题途径、关键词途径、著者途径、题名途径、号码途径、其他途径。分类途径 分类途径是按文献内容所需的学科类别来检索文献的途径,通过分类号或类别进行检索。利用分类途径可以了解学科概念之间的隶属、并列、相关等关系,适用于回溯性检索和广义概念(类目概念较大)的检索,能够满足族性检索(按学科集中文献)的要求。查全率高,但查准率低。信息检索技术:布尔逻辑检索、截词检索、位置检索、限定字段检索。信息检索的策略:(1)、分析检索课题,明确目标和要求;(2)、检索系统和数据库的选择;(3)、选择检索途径,确定检索标识;(4)、编制检索表达式,调整检索策略;(5)、获取原始文献。选择检索系统要掌握以下几个原则:专业要对口,报道文献数量多、信息量大,报道速度快、时差短,检索途径多。 查全率:是表示检出的相关文献与全部文献库中实际存储着的相关文献的比例。 查全率=检出的相关文献量/文献库中的相关文献总量*100% 查准率:是表示检出的文献中所需要的相关文献所占的比例。 查准率=检准的相关文献量/检出的所有文献量*100% 提高检索效果的措施:(1)、提高查全率的措施:a、尽量采取主题词与关键词相结合进行检索;b、主题词检索时要进行扩展检索和使用全部副主题词检索;c、分类检索时要进行扩展检索和全部复分检索;d、删除某个不甚重要的概念组面,减少AND运算;e、多用同义词进行“OR”运算检索;f、采用截词检索等。(2)、提高查准率的措施:a、采用规范化的主题词与副主题词组配进行检索,少用或不用自由词;b、采用限定主要概念主题词字段的加权方式检索;c、增加概念组面,用AND运算符进行连接;d、用NOT算符排除无关概念;e、限定检索字段,如文献类型、语种、作者、刊名等;f、运用放宽位置算符等。 搜索引擎:是Internet上具有查询功能的网页的统称,即允许用户递交查询,检索出与查询相关的网页结果列表,并且排序输出。 搜索引擎的类型:(1)、按搜索的内容划分:综合性搜索引擎、专业性搜索引擎。(2)、按搜索的方式划分:目录式搜索引擎、全文搜索引擎、元搜索引擎、智能搜索引擎。 搜索引擎的结构和原理 一个搜索引擎一般由搜索器、索引器、索引数据库、检索器和用户接口等5部分组成。搜索引擎的工作程序可以分为4个步骤:(1)、信息的采集和存储;(2)、索引数据库的建立;(3)、检索界面的建立;(4)、检索结果的相关性处理。

相关百科

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号-2