Web搜索的类型是什么?
目前,对Web搜索类型的划分尚无统一的标准,常用的基本划分方法有依据搜索的自动化程度进行分类、按搜索策略进行分类和依据搜索对象进行分类等。
- 依据自动化程度分类:根据自动化程度的不同,可以将Web搜索分为自动搜索和人工搜索两种类型。
- 自动搜索:自动搜索主要是指依靠“爬行器”这类软件自动获取Web资源,目前多数搜索系统都采用这种搜索方式。爬行器是指可以在Web漫游,并发现、下载Web页面的计算机程序,采用此类程序的搜索系统,其网络信息资源的获取全部由计算机爬行程序自动完成,系统通过爬行器在网上爬行,将搜索到的页面自动下载加入到本地数据库中,经处理后供用户使用,人工参与成分很少。自动搜索的优势在于自动化程度高、搜索范围广、维护费用少、更强调技术上的创新和提高;缺点是返回信息过多,可能包括大量的无关信息,用户必须从搜索结果中进行筛选,增加了用户负担。
- 人工搜索:采用这类技术的系统依靠专职编辑建立分类目录,并按学科类目组织Web信息资源,支持用户按类目层次来浏览信息,典型代表是目录式的搜索引擎。人工搜索按照既定的类目层次组织Web信息资源,根据编辑人员在访问了某个Web站点后撰写的站点描述,人工形成信息摘要,并根据站点的内容和性质将其归人一个预先分好的类别,也有一些系统接受用户提交的网站网址和网站描述,当目录的编辑人员认可该网站及描述后,就会将之添加到合适的类别中。人工搜索系统大多面向网站,而不是网页,由于加入了人的智力劳动,所以其获得的信息准确性好、导航质量高;缺点是需要大量人工介入、维护量大、信息量少、信息更新不及时。
- 按搜索策略进行分类:根据搜索策略的不同,Web搜索可以分为周期性搜索和增量式搜索两种类型。
- 周期性搜索:周期性搜索是指根据系统搜索要求采集足量的信息后停止搜索,当经过一段时间后这些数据过时,就重新进行搜索,用新采集来的信息代替原有的信息,以使采集到的信息与网络上的信息保持一致。这种搜索方式的优点在于总体上搜索算法相对较为简单,对页面的采集顺序没有特别的要求,但由于待刷新的页面太多,时间开销较大。
- 增量式搜索:增量式搜索仅在需要的时候采集新产生的或者已经发生变化了的页面,对于没有变化的页面则不进行采集。和周期性信息采集相比,增量式搜索能极大地减少了数据的采集量,进而减小了采集的时间和空间开销,是搜索技术当前的研究热点。
- 依据搜索对象分类:根据搜索对象不同,Web搜索可以分为通用搜索、专题搜索、深层搜索和元搜索四种类型。
- 通用搜索:通用搜索通常以网络中所有领域、各种格式的信息资源为搜索对象。这类搜索返回的结果覆盖面广、信息量巨大,但是不能满足用户对于特定领域内信息获取的需要。
- 专题搜索:专题搜索也称为专业搜索、主题搜索、垂直搜索,是为满足用户的特定的信息需求而开发的一种搜索技术,它可以针对某一主题、某一地区、某一类型的信息或某一特定群体的信息进行搜索,只返回符合特定要求的网络信息,而不采集那些与主题无关的信息。
- 深层搜索:深层搜索是一种专门获取隐藏在网络数据库中的信息资源的技术,这些信息资源不是以网页的形式存在的,而是按一定的格式存储在网络数据库中的,因而不能通过超链接技术获取,而必须通过动态网页技术进行访问。
- 元搜索:元搜索是一种以现有搜索系统为基础的搜索方法,它不去直接搜索网络上的信息,而是以现有的多个搜索系统为搜索对象,对现有的搜索系统进行搜索,对结果加以整合,再提供给用户。元搜索系统本身一般不具备存放网页信息的数据库,当用户提交一个查询请求时,它把用户的查询请求转换成其他搜索引擎能够接受的命令格式,并行访问多个搜索引擎,并把结果进行归并处理后返回给用户。
以上是对Web搜索的常见分类方法的介绍,不同类型的Web搜索在实现方式和适用场景上有所差异。
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请您通过400-62-96871或关注我们的公众号与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!







请先 登录后发表评论 ~