首页 > 文章中心 > 正文

科技查新中检索技巧略谈

科技查新中检索技巧略谈

为避免和减少科技项目重复立项,推进科技成果应用、促进科技进步,科技查新咨询工作已成为科研管理工作中一个必要环节。而查全率和查准率是衡量科技查新质量的两个最主要的指标。为保障查新中的查全率和查准率,从筛选关键词到合理运用逻辑算符、位置算符和截词符等基本运算符到制定规范的检索策略式,成为查新工作中的重中之重。笔者在日常科技查新中总结了提高检索查全率和查准率的一些技巧,并结合实例进行了分析和展示。

1查新检索时必备的硬性标准

笔者参加了第7批教育部部级科技查新工作站查新员培训班,其中,南京理工大学的王敏芳教授,在谈到查新检索的若干关键环节,指出:“在选择检索词时,应选择最能反映查新项目实质内容的检索词,应参考委托人提供的检索词,结合数据库特点,利用检索工具确定能反映查新点的词或词组”。选定的检索词要能准确、全面地反映该查新课题所述的科学技术要点和查新点中的核心内容。比如:项目名称:车联网协同控制体系评估模型的研发。该项目的查新点是:通过建立微缩尺度的三维复杂交通环境、及微缩车,进而研究和验证基于智能感知的车联网协同控制技术,提出一整套车联网体系验证评估的模型架构。委托人提供的检索词有:车联网、协同控制技术、评估模型。如果单纯以委托人提供的检索词来检索的话,检索到的文献非常少,这样的检索词就不能符合“查全”这一标准。笔者在提炼、补充后的检索词有:微缩尺度/微缩车、车联网、交通环境、验证评估、模型。以扩充修改后的检索词编写检索式,检索结果能很全、很准地覆盖该课题所涉及的文献。

2选择检索词的注意点及相关技巧

查新规范中明确规定:检索词应包括规范词、同义词、关键词、自由词,缩写词、上位词、下位词、相关词、国际专利分类号等,注意英美单词的不同拼写方式。这条规范的内容主要强调了“查全”这一点,那么在这个基础上,怎么检到比较精炼、准确的文献结果呢?以下是笔者总结的一些查新检索经验。

2.1检索时用一些具体的技术或技术中的专业术语来提高检索的准确性

平常接触的科技查新课题大多都是一些专业性、技术性非常强的科研项目,而且经常是用一些英文代码或简写,这些代码或简写在跨学科中都有使用,如果以这些检索词来检索的话,检索结果势必会范围太大,针对性不强。比如课题:一种新型核—壳阻燃剂的制备及其阻燃机理的研究。查新委托人给出的检索词有:PVC、阻燃剂、纳米羟基锡酸锌。在预检的过程中,如果以“PVC”和“阻燃剂”来检索,检索到了420多篇文献,冗余太多,但如果再加入“纳米羟基锡酸锌”这个检索词后,就只检索到了4篇文献,又不够全面。笔者随后在委托人所给的查新项目材料的研究内容、目标、方案和技术路线中,进一步筛选出了检索词:锡酸锌、羟基锡酸锌、核—壳结构、阻燃、三聚氰胺、双氰胺和MDFP。以上述检索词,编写检索式后检出了20多篇相关度很高的文献。

2.2从委托人及其课题组所发文献中寻找相关检索词或检索词的同义词

在选择检索词时,一般的方法有查找检索词的同义词、旧称和新称、全称和简称(缩写词);检索词概念扩展、检索词向上、下位类词的扩展、外来词译写的不同、不同拼写形式的英美单词等,但在进行完上述方法后,仍然会有部分漏检。例如,在平时的科技查新工作中,曾接过这样的一个课题:铁镍合金及其表面功能化有机修饰在稠油催化降粘中的应用研究。这是一个查新点相对清晰的课题,在仔细分析科学技术要点后,制定了检索式:SU=(铁系纳米微粒+纳米)*稠油*降粘。检索结果为29篇文献。接下来筛选文献的过程中,发现在这29篇文献中竟然没有出现委托人提供的项目资料里提到的有关课题的经典文献,这说明上述检索式出现了很严重的漏检问题,如果使用该检索式检出文献分析的话,就不能保证查新报告的查全率。随后,笔者根据委托人提供的资料,将该课题组的前期文献调出来后,找到了一个非常关键的检索词即“降黏”,这个检索词是已有检索词“降粘”的异体字写法。为此,重新编写了检索式:SU=(铁系纳米微粒+纳米)*稠油*(降粘+降黏),再次检索结果为39篇文献。并且在检索的结果中找到了几篇非常关键的文献。

2.3从技术同类词或同性词中筛选检索词

对于自然科学的大部分课题或研究,都会涉及技术问题、实验方法、采取的具体方案以及相关技术特征等。在这些内容里经常有并列的方法、问题、特征或特性。筛选出这些并列的技术类或特征类词组和短语,是确保“检全、检准”的一个非常重要的环节。如果筛选时漏掉一部分这样的词,筛选出来的文献就不全。对于一些相关领域文献太多的课题,如果不用这些技术类词语限定,检出来的文献就会冗余太多。比如这样一个课题:高效可降解缓蚀阻垢工业水处理剂的开发与应用。查新点是:以聚天冬氨酸为基体,接枝修饰后对其特性进行分析评价。笔者从技术资料中找到这样一些反映该聚合物特性的词:可降解、缓蚀、阻垢、分散、降噪。然后再根据这些词的普及性来制定出它们之间的逻辑关系,对于该课题来说,可降解性是该类材料的一个普遍称呼,但同时具有缓蚀、阻垢、分散和降噪的特性是该课题的特色。依据上述分析,制定出的检索式为:可降解*(缓蚀+阻垢+处理剂+降噪)*(聚天冬氨酸+基体+接枝共聚物),检索结果为50多条命中的文献,检索到的文献质量较高。

2.4从相关材料中的关键词中寻找技术性术语

当查新员接到一个跨领域的课题时,对于陌生的课题,怎么才能快速、有效地找到检索词,几乎是每个查新员都会遇到的问题。笔者认为,对于这样的课题,首先应该认真研究科技查新委托书中的科学技术要点,与此同时,通过咨询委托人并运用百度、google等搜索引擎,对课题涉及领域的一些基本概念作初步了解,随后结合委托人给出的检索词,编写检索式,进行初步检索。对初步检索结果进行相关度排序后,从结果中筛选出几篇代表性文献,并下载文献。到此时,可以进入下一步更精准的检索阶段,在这一阶段,检索人必须找到一些关键的检索词,这些检索词不一定在委托人给的检索词中。遇到这种情况,查新员可以利用课题初次检索文献来筛选相关关键检索词。这一点不仅对跨领域学科的查新非常重要,对于国内外查新中的外文检索也很重要。还是以上面的课题为例,查新点是:铁镍合金及其表面功能化有机修饰在稠油催化降粘中的应用研究,委托人给出的检索词为:铁镍合金、有机修饰、稠油和催化降粘,结合查新委托书中的科学技术要点,初步检索后,筛选到几篇文献。在仔细比对和研究了这几篇文献的全文后,笔者进一步确定了几个检索词,即:铁系纳米微粒、纳米和降黏。加入这些检索词进一步检索,得到了比较全面而精确的检索结果。

3验证检索结果的两个指标

查新人员在确立检索词和检索式后,首先应该进行初步检索,通过对检索结果的浏览,初步判断检索词和检索式是否合适?检索结果是否达到了查新、查全和查准的要求?好的检索式,检索之后的文献基本涵盖了相关领域最经典和最新的文献。查新人员可以根据下述两个指标来判断查到的文献是否准和全。

3.1依据委托人提供的项目资料和参考文献

委托人提供的项目资料背景知识中,大都会给出相关课题的前期研究背景,国内外研究过程以及目前该领域相关课题组的研究进展情况。在这一部分内容中提到的文献多为经典文献和前沿文献,而且资料中都会标明所引文献的出处或在后面列出项目资料所引的全部参考文献信息。查新员可以利用这部分信息作参照,衡量检索质量。如果检索结果中涵盖了项目资料里的大部分重要文献,就说明该次检索的检索词和检索式是有效的;反之,如果检索结果中没有命中项目资料里的重要文献,就应要求查新员重新选定检索词和检索式。比如这样一个项目背景介绍:“自1994年QD-LED诞生以来,QD-LED的发光亮度及发光效率较早期已有较大幅度的提高,并逐渐展现出越来越诱人的应用前景(相关文献1)”或者“在国内外有关QD-LED的报道中,目前红、绿、蓝3种颜色的最高亮度分别为50000cd/m2(λ=600nm)(相关文献2),218800cd/m2(λ=520nm)(相关文献3)”。在这个项目资料的背景中,相关文献1就应该是一篇比较经典的文献,而相关文献2、3属于该领域比较前沿或者与该课题直接相关的文献。

3.2依据项目组前期成果

大多数查新项目不仅要交代相关课题的国内外研究背景,同时也要交代课题组相关前期基础或者前期成果,包括课题组所发的文章和课题组研究生的学位论文。对于课题组的前期成果,委托人相关资料里一般都会明确提到,或者查新员可以直接询问委托人是否有前期成果,另外,查新员可以用委托人名或课题组相关人员的名字来检索确定是否有课题组前期成果。对于确定有前期成果的,检索结果中必须要包含该类文献。如果初检时并没有发现委托人提到的课题前期成果,就需要查新员重新选择检索词或者编写检索式,必要时需要先调出该课题组的文献,从文献里重新筛选检索词进行检索。

4小结

科技查新是以通过检出文献的客观事实来对项目的新颖性做出结论。它以文献为基础,以文献检索和情报调研为手段,以检出结果为依据,通过综合分析,对查新项目的新颖性进行情报学审查,写出有依据、有分析、有对比、有结论的查新报告。在这个过程中,文献检索占有非常重要的地位,检索词的选择和检索式的编写决定了检出文献的质量,进而影响到查新报告的质量。笔者根据多年的查新经验,总结了科技查新中检索的标准、技巧和检验检索结果的指标。

作者:孙嘉杰 单位:河南大学