检索不到对比文件,问题在哪?

我的公众号原文链接:https://mp.weixin.qq.com/s/8A8X9F6FokuWz_FVBg9eOw

 

昨天在我的群里有人问了这么一个问题。

图片

我相信很多人会这么想:我们构建检索式,就是为了让检索式的命中文献范围能覆盖对比文件,然后我们在浏览过程中就把对比文件揪出来了。基本思路的确是这样,那为什么会找不到对比文件,有几个原因,并不一定是检索式问题。以下非穷举。

图片


1.首先说检索式问题

检索式一般有几个阶段,最基础的有初检、正式检索的检索式构建和检索式调整三个阶段。
初检一般都会去做,比如初期查准,以关键词and关键词尝试检索,或是为了定分类号而做的查准检索。这个阶段本就不是为了一定找到合适对比文件的,这个阶段还是试水和了解现有技术、搜集基本情报为主。说实在的,没有很正常,有就赢麻了。因此如果是这类检索式,不太有纠结的必要。

图片

正式检索一般是在现有技术了解程度足够,且追踪检索、初检等均已完成之后进行的。即我们已经很严肃的在准备找对比文件了。单单从检索式来看,检索式一般包含分类号、关键词、字段、算符、日期范围,有的时候可能包含点别的。很显然,哪个地方出问题,都可能找不到对比文件(废话.jpg)。
分类号通常表达技术领域,有时候也表达技术手段,这里要看自己的目的,关键词也是如此。分类号和关键词的问题容易出在没做好补充和扩展。先说补充,补充一般是发生在浏览过程中,我们发现自己有遗漏的部分,然后搜集整理,用于下一个检索式中补充检索。这个部分很重要,浏览文献不仔细、不耐心,容易漏掉该补充的表达,这些表达是可能命中更多对比文件的。

图片

再说扩展,扩展通常是分类号向上下等级的扩展、关键词进行相同或等同、近似含义等的扩展。一开始为了查准,可能会选择性的舍弃一些我们认为不够准确的,容易导致漏检的表达。查准阶段没检索到,接下来的扩展就比较考验基本功,这个阶段是查准向查全的过渡,没扩展好,漏检概率大,找不到对比文件的概率也大。

图片

关于字段,以下是常用字段,以黑马数据库的字段为例。

图片

字段表达有误这种问题就不解释了。字段中容易导致找不到对比文件的有两个,一个是文献范围的字段,比如标题摘要权要、全文等字段,另一个是分类号类型字段。
先说文献范围的字段。很多人会习惯用摘要字段检索,最多就是标题摘要权要。一方面,这个部分经常是上位表达的,难于依赖扩展去保证命中,另一方面,全文都可能出现需要的对比文件内容,包括背景技术,或者是说明书实施例犄角旮旯的地方。我个人推荐全文检索,噪音的问题想办法解决就行。
再说分类号类型字段。看以下聊天记录应该就明白了。

图片

算符一般说包括布尔算符和同在算符,布尔就是基础的和或非,同在就是同句同段临近。当然也有其他的算符,这里不重点讲。

图片

图片

用布尔是准没错,但凡表达一个检索式,都要用算符连接前后分类号或关键词。针对检索式调整或降噪的时候一般会用到同在,如果找不到对比文件,就是同在算符没用对,比如限制太小了。同在算符一般优先使用同句。临近限缩太大,不是很有把握的话很少去用。
日期范围,老老实实根据现有技术和抵触的定义去设定就行。如果通过对现有技术的了解,知晓了某个重要的历史时期,那么可以特殊的进行设定。
检索式调整一般是说,浏览过程中搜集了可用于补充扩展的表达需要另外的检索式构建,或者说经过检索发现检索式有些逻辑问题,可以换个角度表达逻辑以命中对比文件,或是其他原因。这个就很复杂了,简单说就是吃经验,这个过程检索式问题具体出在哪不一定,但一定是自己分析的问题。

图片


2.再说浏览问题

上文有说到对比文件内容不一定出现在哪。全文都可能出现需要的对比文件内容,包括背景技术,或者是说明书实施例犄角旮旯的地方。上文讲的是可能出现的检索式问题,然后可以用全文字段来解决。
那假如用了全文字段了,一定找的到对比文件吗。以下是尚威大佬在群内分享的故事。

图片

图片

图片

耐心不足、细心不够、一目十行,给到正确的检索式,也找不到对比文件。检索不仅仅是检索式构建和调整的技巧问题。
更别提很多外译内文献,或者外文文献,尤其早期外文文献。不长时间阅读,根本看不出他会是对比文件。没耐心看下去,很容易就错过了。

3.最后说策略问题

检索策略一般在两个时间段出现,第一次出现是在检索之前,比如无效检索,我们分析什么样的对比文件可能打破新创性,这是在假设对比文件,之后根据假设拟定检索策略。
第二次或第N次,是在检索式调整/补充阶段。
不管在哪个阶段,我们都可能看到与预期不一致的对比文件,但分析之后却可能发现适合该文件的可用策略。这类文件也是要保留,并因此会产生适配其的组合证据假设。分析很关键,分析是下手检索的在先工作,分析也给了检索调整的导向。
但分析非常吃经验,纯检索理论提升不了分析能力,得扎实的接触检索实务,尤其是无效检索和侵权检索。

 

黑娃

许利民,思博论坛ID“黑娃”

1)泉州振科技术服务有限公司信息技术总监、景毅检索分析团队负责人、思博论坛版主及检索讲师;

2)知识产权师、检索分析师;

3)擅长无效检索、侵权检索、稳定性检索、公众意见检索、查新检索,有丰富的涉诉无效检索经验,已经手包括化工机械、医疗器械、电商产品、注塑机械等在内的许多领域专利检索;

4)有对企业、代理机构及高校的专利检索培训经验

图片

© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容