3.2 架构设计

文件检索系统的架构设计如图3-2所示,简单概括如下:文件存储系统中存放了不同类型的文件,后台通过程序提取出文件名和文档内容,使用Lucene对文件名和文档内容进行索引,前端对用户提供查询接口,用户提交关键词之后检索索引库,返回匹配文档至前端页面。

图3-2 文件检索系统的架构设计图

按照图3-2所示的系统架构图,准备一些测试文档作为要检索的文件系统,使用开源工具Tika完成信息抽取,使用Lucene构建索引,使用JSP页面给用户提供查询接口,使用Servlet完成搜索,构建类百度文库的小型文件检索系统。