6

基于Java的开源 Carrot2 搜索结果聚合聚类引擎 2.0发布了

 3 years ago
source link: https://blog.csdn.net/accesine960/article/details/1282935
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

基于Java的开源 Carrot2 搜索结果聚合聚类引擎 2.0发布了

基于Java的开源 Carrot2 搜索结果聚合聚类引擎 2.0发布了

专注是不断前进的指南针   --- 题记

基于Java的开源 Carrot2 搜索结果聚合聚类引擎 2.0发布了. Carrot2 可以自动的把自然的搜索结果归类(聚合聚类)到相应的语义类别中,这个功能是通过Carrot2一个现成的组件完成的,除此之外Carrot2 还包括了很多其他的搜索结果聚合聚类算法 search results clustering algorithms 非常值得一看 . 今天10b lobster 和我聊起了新闻标题的平移算法, 如果这个算法被Carrot支持的话,应该是一个流行算法了。这个算法在卢亮的blog上曾经提到过。新闻阅读器也准备用这个算法进行新闻分类,提高新闻阅读速度。

Carrot2 2.0 的一个亮点是速度和易用性的提高。在易用性方面Carrot2提供了一个叫Aduna ClusterMap  的可视化组,这个组件被放到了可以单独运行的GUI程序中了,详见:standalone GUI application 。除此之外核心api也得到了简化,这里有 更多信息.

Carrot2 的流行还衍生了一家叫 Carrot Search 的公司,类似jboss ,mysql 相关的运营公司, 他们发布了发布了 Lingo3G ,可以想想出来了,Lingo3G ( 这个名字真酷 lingo  and 3g 呵呵 )-- 提供高性能的文档聚合引擎 ,这个引擎功能十分强进,他提供基于层级的,同义的 , 标签过滤的等功能。相比较 autonomy 还是有些差:

Autonomy的技术内核,是一个被称为IDOL的智能信息处理层。IDOL由动态推理引擎 (DRE)、分类服务器、用户服务器等模块组成,DRE 可实现概念识别、自动摘要、有效识别、自动超链接、自然语言检索等核心操作,分类服务器可实现自动聚类、自动分类、自动目录生成等功能操作,用户服务器则可以实现个人化信息创建、个性化信息提示、个性化信息训练、专家定位等个性化操作。

你是不是和我一样急不可耐了?想看Demo ?Let's Go  

相关阅读:

                原文地址  译文地址

                   新闻阅读器  Carrot2 live demo  这是他们的 项目地址 .

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK