对计算机网络信息检索的效果评价,也应该从这三个方面进行.质量标准主要通过查全率与查准率进行评价.费用标准即检索费用是指用户为检索课题所投入的费用.时间标准是指花费时间,包括检索准备时间、检索过程时间、获取文献时间等.查全率和查准率是判定检索效果的主要标准,而后两者相对来说要次要些.
查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来.
查全率 = [ 检出相关文献量 / 文献库内相关文献总量 ] × 100%
查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的.
查准率 = [ 检出相关文献量 / 检出文献总量 ] × 100%
影响检索效果的因素
查全率与查准率是评价检索效果的两项重要指标,查全率和查准率与文献的存储与信息检索两个方面是直接相关的,也就是说,与系统的收录范围、索引语言、标引工作和检索工作等有着非常密切的关系.
(1) 影响查全率的因素
影响查全率的因素从文献存储来看,主要有:文献库收录文献不全;索引词汇缺乏控制和专指性;词表结构不完整;词间关系模糊或不正确;标引不详;标引前后不一致;标引人员遗漏了原文的重要概念或用词不当等.此外,从情报检索来看,主要有:检索策略过于简单;选词和进行逻辑组配不当;检索途径和方法太少;检索人员业务不熟练和缺乏耐心;检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等.
(2) 影响查准率的因素
影响查准率的因素主要有:索引词不能准确描述文献主题和检索要求;组配规则不严密;选词及词间关系不正确;标引过于详尽;组配错误;检索时所用检索词(或检索式)专指度不够,检索面宽于检索要求;检索系统不具备逻辑"非"功能和反馈功能;检索式中允许容纳的词数量有限;截词部位不当,检索式中使用逻辑"或"不当等等.
实际上,影响检索效果的因素是非常复杂的.根据国外有关专家所做的实验表明,查全率与查准率是呈互逆关系的.要想做到查全,势必会要对检索范围和限制逐步放宽,则结果是会把很多不相关的文献也带进来,影响了查准率.企图使查全率和查准率都同时提高,不是很容易的.强调一方面,忽视另一方面,也是不妥当的.应当根据具体课题的要求,合理调节查全率和查准率,保证检索效果.