作者|云舒 苑桢
来源|AI先锋官
前不久,被称为中国大模型“五”之一的MiniMax 推出了万亿 MoE 模型 abab6.5。
根据 MiniMax 发布的技术报告,在各类核心能力测试中,abab 6.5接近 GPT-4、 Claude 3 Opus 、Gemini 1.5 Pro 等世界领先的大语言模型。不止如此,MiniMax还基于自研大模型开发了一款生产力产品——海螺AI,目前已经接入abab 6.5。今天,我们就来评测一下,同样是专注于文本处理的AI,海螺AI与月之暗面的Kimi相比,实力到底如何?以及与抖音的AI产品“豆包”相比,它又有哪些独特之处?
首先打开海螺AI的官网(https://hailuoai.com/),点击登陆,就可开始使用了。从产品界面来看,海螺AI能够速读长文、智能搜索、免费查数据、创作文案、图片识别,还支持语音通话。
可以看出,与Kimi、豆包差不多,海螺AI也是面向C端用户的大模型AI助手。
海螺AI一大亮点是支持语音交互,所以小编迫不及待地最先体验了这个功能。点击进入语音通话页面,小编跟语音助手聊了半个小时,它的确像个朋友一样,能陪人聊东聊西。海螺AI还配置30多个声音,供用户选择。小编试用了好几个,大都听起来还算比较自然,没有太过于机械或生硬。而且录制声音的时候,并不需要像数字音频克隆那样,录制大量的段落,只需要读几句诗就可以了,可以说非常方便。小编感受了一下,克隆出来的声音还是比较接近本人的。音色的重合度在9成以上。如今AI拟人化的趋势已经不可阻挡,AI伴侣或AI女友正受到大批年轻人的追捧和跟风。试想一下,如果把自己的女友、男友或喜欢的人声音克隆一下,基本上就相当于有一个时时陪伴聊天的TA了。字节跳动的豆包在AI语音电话上做得也很不错,小编就把海螺AI和它和做了一下对比。主要对比三点:多端支持、自由语音对话、智能体语音对话。首先在端的支持上,豆包的语音电话只能够在手机上使用,而海螺AI支持电脑和手机。在自由对话中,海螺AI和豆包其实整体体验下来区别不大,两者都挺好用的。不过,在打断AI对话这个细节上,豆包做的稍微好一些,它可以让你说完话之后意识到有问题立即点击打断,而海螺只能在AI反应过来说话中才能打断。在智能体语音对话,豆包体验要比海螺AI强,它能够根据智能体的设定来进行对话,但海螺AI依旧是自由对话模式,没有办法把预先的设定加载进去。此外,豆包支持智能体语音对话,有很多种可玩性内容出来:树洞、吵架、猜谜语。整体总结:海螺AI的语音聊天陪伴助手,确实很惊艳。其它的功能与别家大模型没有太大的差距。智能体目前不能支持电脑和语音对话,这可能不方便电脑端用户的体验。
一直以来,长文本也是兵家必争之地。处理长文本的能力越强,AI 助手能做的事情就越多。从介绍上看,“海螺AI”的长文速读能力包括快速提炼论文、财报、纪要、书籍要件的关键信息和归纳总结。小编把同一份文档喂给海螺AI和Kimi,看它俩谁的信息提炼和归纳总结能力强?从上面两张图片可以看出,海螺AI的信息总结、提炼能力不输于Kimi。Kimi总结得更为条分缕析,基本按照文本的框架结构提炼。而海螺AI的文本信息处理得更为灵活。在父母帮助孩子完成家庭作业方面,AI 也是一个非常有用的工具。“海螺AI”支持图像识别。不过,一次只能输入一张图片。小编随机找了一道经典的鸡兔同笼问题,来考一考它和豆包。可以看出同样的题目,海螺AI和豆包给出了两个答案。显然,豆包做错了。这不,五一假期快到了,小编让海螺AI和豆包分别制定一份想去南方旅游的方案。可以看出,海螺AI给出3个方案,秀丽山水风景、古城文化、海滨休闲度假,考虑得更全面细致。而豆包只给出了1个方案,而且是完全不知名的景点。总结:目前海螺AI的语音交互功能要超过Kimi和豆包;长文本处理得不错,同样的文本,Kimi提示说“超出字数限制,只读了前99%”,但是海螺AI就没有遇到这样的问题,而且内容提炼概括的也很到位;在数学能力和文案能力上,海螺AI超过了豆包,但它也有弊端,就是作为一个文本处理AI,无法文生图。