搜索引擎搜30万条文章秒出倒排索引BM25易语言源码文档搜索引擎,以文档而建立的数据库,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。其特点是能对海量的数据进行有效管理和快速检索。
特点
使用简单,你只需要考虑往里加和往外拿。
动态参数,可以随意添加多个参数并且支持不同的数据类型。
搜索快速,从头条加入的30万条新闻文章,搜索关键词瞬间取出全部相关结果。
停词筛选,过滤无意义词汇减少资源占用。
结果排序,使用BM25(BestMatching25)检索算法,根据搜索词与搜索结果的相关度进行排序。
主要功能
构建表用来管理数据库中的内容。
添加() 向数据库内添加一个新的文档
删除() 根据标题删除对应的文档
取标题() 根据索引ID取出对应的文档标题
取参数() 取出当前文档的子数据
取全部参数() 取当前文档的所有子数据参数名
取全部索引() 取出数据库中的所有文档索引

查询表 快速检索数据库中的内容。
搜索 通过关键词搜索相关文档
取参数() 取出当前文档的子数据
取全部参数() 取当前文档的所有子数据参数名

停词表 管理数据库中的停用词。
添加() 添加一个停用词
删除() 删除一个停用词
取数量() 获取数据库中的停用词总数
取出所有() 取出数据库中所有的停用词

参数集 以参数的形式管理每个文档所携带的子数据。
文本型() 添加或取出文本型参数
整数型() 添加或取出整数型参数
小数型() 添加或取出小数型参数
逻辑型() 添加或取出逻辑型参数
长整数() 添加或取出长整数型参数
字节集() 添加或取出字节集型参数
删除参数() 删除已添加的参数

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系贝贝进行处理。
本站默认解压密码:www.hibbba.com