查看原文
其他

星火大模型百日再推新!董事长刘庆峰:明年上半年对标GPT-4(附测评)

杨文 AI先锋官 2023-11-05

作者杨文

编辑六耳

来源AI先锋官



  先锋官有话说:

产品名称:  讯飞星火认知大模型V2.0

总体评价:  ★★★★☆

     易用性:   ★★★★☆

     功能性:   ★★★☆☆

     创新性:   ★★★☆☆

推荐功能:星火助手、多模态能力、代码能力

815日下午,科大讯飞召开“解放生产力,释放想象力”讯飞星火认知大模型V2.0升级发布会。


与以往版本相比,新一代讯飞星火大模型除了在文本生成能力、语言理解、知识问答、逻辑推理、数学能力等维度升级外,还重磅发布代码能力、多模态能力。

发布会上,科大讯飞董事长刘庆峰十分自信地表示:“今天将会迎来中国通用人工智能发展的关键节点,也将会是一个里程碑式的节点”。


在6月份发布会上“遥遥领先”的口号仍在耳边回响,如今又喊出了“里程碑节点”的口号,刘老板可真敢说。


俗话说,光说不练假把式,咱们就来实际测试一下讯飞星火V2.0是真牛还是吹牛。


一、星火助手扎堆上线


讯飞星火为了满足不同用户的需求,提供了一个丰富场景使用的助手中心,用户可以调用这些小助手生成标题、模拟面试、故事创作、论文降重改写、景点推荐等。


例如“新闻记者”小助手,用户只需输入新闻事件,星火小助手就能创作一篇新闻。小编让其写一篇关于“此次讯飞星火认知大模型V2.0升级发布会”的新闻稿件。



导语写得还不错,新闻要素都涉及到了,语言也简洁流畅,但是正文部分都是些片汤话,关于发布会上最新的信息少之又少。


再如“节日祝福视频助手”,用户只要输入想要生成祝福的节日名称,系统就能生成节日祝福文案与视频。


小编也来凑一下热闹:“中秋节到了,扎克伯格给马斯克送上中秋祝福”。星火小助手没用几秒就生成了一组文案:

 


“在这个团圆的日子里,愿你的生活像那圆圆的月亮一样,充满着温馨和幸福。愿你的事业像那明亮的星星一样,闪耀着光芒和希望。愿你的心情像那皎洁的月光一样,清澈明亮。祝你中秋节快乐!”这部分文案写得挺有文采,但开头的“中秋节到了,扎克伯格给马斯克送上中秋祝福”这句话就略显生硬。


另外,星火小助手在文末还贴心地罗列了4句古诗词,尴尬的是,诗句和作者完全对不上号,“但愿人长久,千里共婵娟”出自唐代白居易的《长恨歌》?星火小助手的语文老师哭晕在厕所。


让人眼前一亮是,它可以根据文案生成祝福视频,如果用户不满意还可以变更形象、调整音库、替换背景。



此外,星火小助手还能起名、讲笑话、推荐礼物、充当私人法律顾问等,总之,讯飞星火把是市面上五花八门的应用都集合于此,主打一个“以量取胜”。


二、多模态输入和输出


马斯克和扎克伯格“笼中格斗”这出大戏又出续集,马斯克声称今晚要开着特斯拉FSD到小扎家,如果小扎开门,战斗就开始,全程直播!


小编就让讯飞星火“画一幅扎克伯格和马斯克八角笼格斗的画”,最终生成的效果如下:



星火大模型虽然理解了小编的意图,但是这画是不是太丑了?不仅手部动作处理的乱七八糟,脸部还扭曲得一言难尽,马斯克和小扎看了都得气笑了。


小编又让其画一幅中国名菜“红烧狮子头”的画,这哥们还真是个“吃货”,秒懂,画功也在线。



飞星火不仅可以生成图片,还可以根据上传的图片描述画面。


例如,小编上传了一张小狗的图片,并问道:图片中的小狗是什么品种?讯飞星火给出了正确答案:博美犬。小编让其描述一下图片中的场景,讯飞星火回答:一只小白狗坐在草地上。它正看着镜头,周围有绿色的草和一些灌木丛。



三、代码能力


新一代讯飞星火认知大模型还重磅发布了代码能力,在代码生成、代码补齐、代码解释、代码纠错和代码单 元测试等方面均取得重要进展。


据科大讯飞董事长刘庆峰介绍,讯飞星火V2.0代码能力实现大幅度提升,从业界参考测试集上的效果对比来看,星火V2.0基于Python和C++进行代码写作能力已高度逼近ChatGPT,差距仅为1%和2%。


刘庆峰表示,我们已经定了非常明确的目标,到今年10月24号,各个代码的能力都会超越ChatGPT,明年上半年将正式对标GPT4。


基于其代码能力,科大讯飞还同步发布了iFlyCode,一款能带来显著效能提升的生产力工具产品。


总结:


易用性来看,新一代讯飞星火认知大模型在之前版本上做了更新,页面左侧的“助手中心”和“新建对话”可以相互切换,整体界面比较简洁。别看星火小助手种类繁多,每项功能都有一句话使用介绍,使用起来完全没有难度。


功能性来看,新一代讯飞星火认知大模型上线了几百个小助手,涵盖职场、营销、点评、创作、编程等十多个场景,简直是市面上AI应用的“集大成者”。不过,虽然其功能五花八门,但“多而不精”,让人眼前一亮的功能还是凤毛麟角。


创新性来说,此次的讯飞星火大模型在代码能力和多模态能力方面还是比较出色的。尤其是它支持上传图片,并能根据图片描述场景等。AI生成祝福文案视频这个功能也给人留下较深的印象。



 .END.

扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。



往期文章回顾

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存