评论
分享

国产AI杀疯了!以小博大对战GPT,或为对抗AI iPhone的最强后援

这个是认证

热点科技

2024-05-21 11:52 上海

48054 0 0

昨日,全球最强端侧多模态模型再次刷新,仅用 8B 参数,击败了 OpenAI 的 GPT-4V 和谷歌的 Gemini Pro,而且,其 OCR 长难图识别刷新 SOTA,图像编码速度暴涨 150 倍,而这个全球最强端侧多模态模型不是国外大厂的出品,而是国内大模型研发实力最头部的公司面壁智能,最新打造出来的面壁小钢炮 MiniCPM-Llama3-V 2.5。

据了解,面壁小钢炮 MiniCPM-Llama3-V 2.5 仅凭 8B 量级的端侧模型,在评测平台 OpenCompass 得分 65.1,与闭源模型 Qwen-VL-Max 或可一战,综合性能直接力压重量级选手 GPT-4V 和 Gemini Pro。在 OCR 综合基准测试中,又取得了 725 分的成绩,大幅远超 GPT-4V,并在大模型的 " 顽疾 " 幻觉能力上也获得了重大改进,还有各种基准测试,数据都远超 GPT-4V 和 Gemini Pro。

简单来说,MiniCPM-Llama3-V 2.5 能看、能读、速度快、更会思考,而且,还用最小的参数撬动了最强性能!那么,抛开这些基准测试,这个小钢炮到底能给我们普通人带来啥?首先,它能支持 30+ 种语言,包括德语、法语、西班牙语、意大利语、俄语等主流语言;其次,它支持难图、长图、长文本的精准识别,比如你在看一个吃瓜长文,总因为 " 太长不看 " 而烦恼,丢给它,它就能快速汇总出关键内容;如果是一张英文版的图文信息,它也能根据你的需求,给出非常精准的汇总;而且,它能够在一张拥有多种要素信息的图片中," 一眼 " 看懂图片的主题内容,并推理出图片的来源信息,再把 " 思考 " 后的信息整理汇总给我们。当它搭载到手机上,将能直接在设备端快速、实时运行,减少数据泄露风险,而且,即使没有网络连接,也能正常工作,还适用于多种设备,或成为真正的 AI" 贴身助理 "。

# AI
本文为凯迪网自媒体“凯迪号”作者上传发布,代表其个人观点与立场,凯迪网仅提供信息发布与储存服务。文章内容之真实性、准确性由用户自行辨别,凯迪网有权利对涉嫌违反相关法律、法规内容进行相应处置。
举报
投喂支持
点赞
发表评论
请先 注册 / 登录后参与评论
推荐阅读