近日,马斯克旗下的人工智能公司xAI推出了首个多模态模型Grok-1.5Vision。该模型不仅能理解文本,还能处理文档、图表、截图和照片中的内容。
据官方介绍,Grok-1.5V在多个领域都表现出色,如多学科推理、文档理解、科学图表处理等。同时,在RealWorldQA基准测试中,Grok-1.5V的表现也优于竞争对手GPT-4V、Claude3Sonnet、Claude3Opus和GeminiPro1.5等主流产品。
此外,xAI还分享了Grok-1.5V的跑分情况,并表示将邀请早期测试者和现有的Grok用户进行测试。目前,Grok-1.5VisionPreview已经上线,感兴趣的用户可以前往官方网站获取更多信息。
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/221047.html