当前位置:首页 > TAG信息列表 > 最早的搜索引擎都有哪几个列举两种常见的搜索引擎方法?介绍

最早的搜索引擎都有哪几个列举两种常见的搜索引擎方法?介绍

最早的搜索引擎都有哪几个 列举两种常见的搜索引擎方法?

列举两种常见的搜索引擎方法?

搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合搜索引擎、门户搜索引擎和免费链接列表。

这里主要介绍全文索引和目录索引。

第一,全文索引:

最早的搜索引擎都有哪几个 列举两种常见的搜索引擎方法?

首先是数据库中数据的收集。搜索引擎的自动信息收集功能有两种。一种是定时搜索,即每隔一段时间(比如googl

全文搜索引擎有那些?

全文搜索引擎包括:

1.全文搜索引擎

lucene的开发语言是java,也是java家族中最著名的开源搜索引擎。它已经是java世界中的一个标准全文搜索程序,并且它提供了一个完整的。查询引擎和索引引擎,没有中文分词引擎,需要自己实现,所以需要用lucene构建一个搜索引擎。此外,它不支持实时搜索,但linkedin和twitter分别在lucene上改进了实时搜索。其中lucene有一个c移植版本叫lucene,理论上比lucene快,因为是用c写的.

官方主页:

clucene官方主页:

2.狮身人面像

sphinx是用c语言编写的开源搜索引擎,也是目前主流的搜索引擎之一。在索引事件上比lucene快50%,但是索引文件比lucene大一倍,所以sphinx在索引上是用空间换事件的策略,在检索速度上和lucene相差不大,但是在检索准确率上lucene比sphinx好。另外,lucene在中文分词引擎的加入难度上优于sphinx,其中sphinx支持实时搜索,使用起来相对简单方便。

官方主页:

3.夏皮安

xapian是一个用c编写的全文检索程序,它的api和检索原理在很多方面与lucene相似,填补了c中的一个空缺.

官方主页:

4.上下真空滤器

nutch是一个用java实现的开源web搜索引擎,包括爬虫、索引引擎和查询引擎,其中nutch基于lucene,lucene为nutch提供了一个用于文本索引和搜索的api。

你是否应该使用lucene或nutch应该是,如果你不不需要抓取数据,你应该使用lucene。最常见的应用是您有数据源,需要为这些数据提供一个搜索页面。在这种情况下,最好的方法是直接从数据库中获取数据,并用luceneapi构建一个索引。

官方主页:

5.数据公园搜索

dataparksearch是一个用c语言实现的开源搜索引擎,其中网页排序基于神经网络模型,支持下载http、https、ftp、nntp等网页,包括索引引擎、搜索引擎和中文分词引擎(这是唯一一个带有中文分词引擎的开源搜索引擎)。它可以单独定制搜索结果,并有完整的日志记录。

官方主页:

6.泽泰尔

zettair是一个基于justinzobel的研究成果。它是用c语言实现的。justinzobel在全文检索领域非常有名,是业界第一。一个系统地提出倒排索引差分压缩算法的人,倒排表的压缩极大地提高了检索和加载的性能,同时将空间膨胀率降低到了一个非常好的水平。因为zettair起源于学术界,代码由rmit大学的搜索引擎组织编写,所以它的代码简洁高效,是学习倒排索引经典算法的一个非常好的例子。支持linux、windows、macos等系统。

官方主页:

7.因德里

indri是一个用c语言和c语言编写的全文检索引擎系统。它是由麻省大学和卡内基梅隆大学联合推出的开源项目。它的特点是跨平台和api接口支持java,php和c。

官方主页:

8.一种活泼的小狗

terrier是由格拉斯哥大学计算科学学院用java开发的全文检索系统。

官方主页:

9.加拉戈

galago是一个用java语言编写的关于文本搜索的工具集。它包括索引引擎和查询引擎,还包括一个叫做tupleflow的分布式计算框架(类似于google的mapreduce)。这个检索系统支持多种indri查询语言。

官方主页:

10.斑马

zebra是用c语言实现的检索程序,其特点是支持大数据、email、xml、marc等格式。

官方主页:

11.索尔

solr是一个用java开发的独立的企业级搜索应用服务器,它提供了一个类似于web-service的api接口。它是基于lucene的全文检索服务器,也是lucene的变种。很多一线互联网公司都在用solr,这也是一个成熟的解决方案。

官方主页:

12.弹性搜索

elasticsearch是一个开源的分布式搜索引擎,用java语言开发,基于lucene构建。它是为云计算设计的,可以实现实时搜索、稳定可靠。elasticsearch的数据模型是json。

官方主页:

13.呼

whoosh是一个用纯python编写的开源搜索引擎。

官方主页:

搜索引擎官方主页lucene全文检索


恒驰号 单仁号

  • 关注微信关注微信

猜你喜欢

热门标签

怎么删除不经过回收站 华为mate30pro 自媒体怎样提高自己的知名度介绍 苹果设置蜂窝数据用量是什么时间 苹果手机充电慢的几乎充不进 iphone14promax几寸 光电感应器调节方法 如何制作ppt背景模板 怎样用手机远程控制电视 表格怎样设置数字格式 红米10x5g换屏幕总成教程 怎么把电子版电话导入手机通讯录 苹果手机外放喇叭没有声音怎么回事 怎样将一个word文档弄成九宫格手机word怎样编辑田字格?介绍 wps中怎么关闭ppt显示缩略图WPS的ppt怎么自定义版式? 苹果ipadmini2下载不了软件怎么办ipadmini2怎么下载软件?介绍 钉钉工作台没有考勤打卡怎么解决钉钉休息忘记排班咋弄?介绍 快速连接共享打印机如何连接远程打印机?介绍 用友软件备份拷贝失败怎么办用友异常数据不能清除怎么办? ppt文档模板 忘记密码了怎么修改12306忘记密码怎么修改信息? 为什么老是说我没有安装迅雷苹果手机商店怎么没有迅雷了? 电脑不能双面打印怎么设置hp1010不能手动双面打印是电脑的问题吗?介绍 人民好医生验证码在哪填写乡村医生执业证书查询? 华为智能手表如何操作华为手表的智能教练怎么用? 微信快捷键怎么弄出来 微信小程序开发从零开始学想知道开发小程序需要多长时间呐? excel单价的计算公式函数EXCEL计算区间价格公式? 三星s6手机坏了数据恢复新买的三星s6摔了一下后就读不出手机卡?介绍 小米note9找不到指纹设置小米note95g有指纹解锁吗?

微信公众号