问题
问答题
简述搜索引擎系统的基本结构。
答案
参考答案:独立搜索引擎系统的基本结构一般应该包括以下五个不同的功能模块:(1)数据采集。负责按照一定的方式和要求对网络上的WWW 站点等资源进行搜集,并将搜集、发现到的WWW 页面信息经网络传输,存入到搜索引擎的临时数据库中。(1.5 分)(2)数据分析与标引。负责对收集到的网页信息进行分析,从中提取有检索(或查询)价值的内容——网页关键词、网页的分类类别等,并对关键词进行权值计算。(1.5 分)(3)数据组织。负责形成规范的索引数据库或便于浏览的层次型分类目录结构。(1.5分)(4)数据检索。负责帮助用户用一定的方式检索索引数据库或浏览目录结构,获取符合用户需要的WWW 信息。(1.5 分)(5)信息挖掘。主要负责提取用户相关信息,以利用这些信息来提高检索服务的质量。通过对用户注册的个人兴趣信息及以前检索活动/行为的跟踪、分析与学习,信息挖掘模块在个性化服务中起到关键作用。(2 分)