短短半年之内,在大模型赛道上,国内外 AI 头部玩家陆续带着自己的 AIGC 产品迅速就位并“开跑”。 现如今,谁能打造出中国版 ChatGPT,已经不再是一个问题。但是,谁能做出更好的中国版 ChatGPT,成为业界关注的重点。
【资料图】
北京时间 5 月 6 日下午 2:00,作为人工智能“国家队”的科大讯飞,如约揭晓了其认知大模型——讯飞星火的真实面纱, 并带来了丰富的应用成果,为中国生成式 AI 市场再添一位猛将。
目前,讯飞星火认知大模型已经开启内测( https://xinghuo.xfyun.cn )。CSDN 在早前已经获得了内测,下文中,我们也将与大家一起探测「讯飞星火认知大模型」的真实情况,以及它的与众不同之处。
带着 7 大类 481 个细分的任务类型, 讯飞星火认知大模型来了!
在发布会现场,科大讯飞董事长刘庆峰表示,认知大模型的技术阶跃和快速进化,让人工智能在全球掀起全新热潮。当前,认知大模型成为通用人工智能的“曙光”。与此同时,认知大模型的“智能涌现”将带来解决人类刚需的全新机遇。
具体来看,智能涌现的通用人工智能系统具有七大能力,包括 文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。基于此, 人类只要做画龙点睛的加工,就能得到 “懂你所言,答你所问,创你所需,解你所难,学你所教”的所有内容。
讯飞星火认知大模型是基于科大讯飞 12 年的技术积累,打造而成,实现了 通用 人工智能系统七大能力中的 481 个细分任务。其还在 2022 年 12 月 15 日,正式启动“1+N”认知大模型专项攻关,其中“1”就是指通用认知智能大模型,“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。
对于先行者,刘庆峰表示,「向 OpenAI 致敬和学习,快速追赶并努力超越」。
与此同时,其更是在现场目标明确,立下 2023 年内 讯飞星火认知大模型的 升级 Flag:
6 月 9 日,讯飞星火认知大模型将突破开放式问答、升级多轮对话能力、数学能力。
8 月 15 日,突破代码能力、继续升级多模态交互能力。
10 月 24 日,讯飞星火认知大模型将在通用大模型领域直接对标 ChatGPT,并在中文维度实现超越。
话不多说,我们也将从七大能力直接开启测试模式。
代码能力:多功能、多语言
对于程序员而言,关注的重点当然是大模型能给我们解决多少代码、编程问题。
在此,我们便先测试一下。
譬如,捉 Bug。
写代码:“围绕“给定一个 1-100 的整数数组,请找到其中缺少的数字”写一段实现代码”。
再来一个递归函数:
挑战难一 点的:「怎么用 C++ 编写一个复数计算器?包括加减乘除、幂次方、取模、辐角、共轭。实部和虚部都是实数范围。」
对此,我们咨询了 CSDN-AI 团队研发总监对这段代码进行了点评,其表示:讯飞星火认知大模型生成的代码, 复 数类的代码基 本实现是对的,但是测试用例没有一次性生成完整。和 GPT 生成的测试用例相比,这段代码比较简洁完整。
其实在代码能力上,刘庆峰坦言 ,讯飞星火大模型的这一功能和 ChatGPT 相比,还有很大差距,下一步升级的重点功能也是这一块。
就连大模型自身也说道:“我的代码生成功能仍然有限,可能无法满足复杂的业务需求”。
简单的代码问题,对于讯飞星火认知大模型来说,不成问题。不过在涉及到一些复杂的工业互联网、架构时,其生成的内容只能供参考。作为开发者,更要自行检查代码正确性、可靠性和保密性等等。
文本生成能力:多风格、多任务、长文本
首先,先给我们介绍一下自己:旨在“星星之火,可以燎原”。
再来科普一下认知大模型:
再让讯飞星火认知大模型来讲个英文的故事:
直接翻译成中文试试:
几次实测下来,讯飞星火认知大模型在不同语言的涌现能力表现都不错:
继续续写一个故事:如果奥特曼出现在《西游记》故事中,会发生什么?
结果显示,它对中国文化理解力也 不错:
在这一功能上,刘庆峰表示,讯飞星火大模型在国内明显领先,并且在中文方面超过了 ChatGPT,并且在持续进步中。
语言理解:多层次、跨语种
中华文化博大精深,这是否会难倒讯飞星火认知大模型?
用现场的测试案例,先来一波直击灵魂的提问: 「俗话说,男子汉大丈夫,宁死不屈。 但俗话 又 说,男子汉大文夫,能屈能伸。 这两种说法哪种是对的」
追问:「如果有个小伙子和女朋友吵架了,他是应该宁死不屈还是能屈能伸」。
语境理解:「女朋友生气时,说随便,男朋友应该怎么做?」
再来一个:「烈日之下,我哭了。烈日之下,我看到我的爸爸在干活,我哭了。分别表达了什么心情」
不得不说,拥有讯飞星火大模型的情商和理解力,绝对能分分钟拯救“每步都踩在女朋友的雷点上”的他。
再来试试英文:「这句话有问题吗:Each of the boys have a pen.」
结果显示,此大模型不仅能识别出错误,也能直接给出正确的语句答案。
知识问答:泛领域、开放式
先问一下关于医学问题:
提问:刺绣里面的"水路”、“落绷"是什么?
再问:「"蚂蚁上树”这道菜怎么做?」
这一次,我们终于没有看到真实的蚂蚁被做成菜的“指南”了:
不妨再来一场辩论试试:「以"AI创作的绘画是/不是艺术"为主题,进行辩论,正方:是艺术,反方:不是艺术,最终得出结论」
刘庆峰表示,讯飞的大模型也正在逐步学习专业的科学文献,未来回答也会更加专业。
逻辑推理
来一道经典的“过河”推理 问题:
一个人带着一匹狼、一只羊和一捆卷心菜来到了河边。他需要过河,但是河边只有一条船,而且他只能带一样东西上船。他不能把狼和羊一起留在河边,也不能让羊和卷心菜一起留在河边,因为在这两种情况下,前者都会吃掉后者。那么,如何用最少的渡河次数把所有东西都带到河对岸呢?解释得详细一些
根据我们的需求以及提问,讯飞星火认知大模型能够尽可能提供详尽的解答:
继续提问:
数学能力
在数学能力上,先来一个简单的“鸡兔同笼”试试水。我们发现,相比其他大模型,讯飞星火似乎更善用方程来解决问题:
接下来,我们又用了此前在其他三四款大模型上提过的问题来进行了测试,但是彼时只有 ChatGPT 回答出来了。
提问: 某厂一车间有 64 人,二车间有 56 人,现因工作需要,要求第一车间人数是第二车间人数的一半,问需从第一车间调多少人到第二车间?(列方程解答)
讯飞星火认知大模型并没有让我们失望,成功做出了解答:
再来测试一下不 动脑筋就会想错的问题:「公司的股票昨天涨了 10%,今天又跌了 10%,请问是涨了还是跌了」。
多模态能力
截至目前,虽然星火认知大模型不是国内第一个发布的,但在多模态能力上,功能还是颇为全面的,具有语音、图文理解、虚拟人合成、多模态交互等多种能力。
不过,有些遗憾的是,这些功能目前处于科大讯飞内部测试阶段,尚未公开。根据其官方计划,公测用户应该能在 8 月份用上。
当前,倒是可以通过现场演示一饱眼福。如上传一张英文菜单图片,直接翻译为中文:
也可以畅想一下,对于英文不好的技术人而言,是不是可以通过大模型,无障碍阅读很多英文文献、论文了。
下面进一步交互,表现力也不错:
也能直接语音输出:
还能直接生成虚拟人。这个虚拟人能够结合文字叙述的背景,配上相应的背景图、手势、语气,实现寓意贯穿。
畅想一下未来
综合以上,讯飞星火认知大模型在情商、智商、逆商不错的表现能力,有目共睹。不过,这也引发了不少从业者的焦虑,现在不妨也让它来与我们一起畅想一下未来。
当问及和人类的智慧相比,谁更胜一筹时,星火认知大模型给出了中肯的回答:在某些情况下,还需要人类的判断和智慧。
面对现在很多程序员都要问上一句的“取代潮”,它表示自己不太可能完全取代程序员的工作。
畅想未来,它也能很现实地告知,理想中的 AGI 离我们还有很远,甚至可以说是遥不可及。
这对于很多新闻播报的自媒体工作者而言,无疑是福音来了。
与此同时,当问及未来开源 AI 大模型的发展趋势时,其中立地回答道: 各有优劣,未来的发展趋势将取决于具体的应用场景和技术需求。
最后
整体测试下来,讯飞星火认知大模型给我们带来的惊喜远远大于预期,这也是讯飞大模型在今天发布之后频频获得好评的原因。不过,刘庆峰也表示,目前纯大模型技术在新知识获取、事实类问答、史实与传统典籍理解等方面还有一定的缺陷。
不过正如文章伊始所述,这些难题攻克都已经提上日程。
如今,讯飞星火认知大模型技术也已经从单一的大模型本身,成功扩展到 教育、办公、汽车、数字员工等 N 个方向,在不断迭代中,我们也期待 星 火认知大模型更加亮眼的表现。
标签:
精彩推荐
2023年5月6日我们迎来了二十四节气中的立夏“四月立夏为节者,夏,大也,至此之时物已长大,故以为名。...
中国网是国务院新闻办公室领导,中国外文出版发行事业局管理的国家重点新闻网站。本网通过10个语种11个文版
金融界5月6日消息今日,2023清华五道口首席经济学家论坛正式召开。针对美国银行动荡事件,这一次金融危机或
事件:公司4月26日发布2022年度报告及2023年一季报,2022年公司实现营收13 99亿元,同比增长33 21%;归母净
如果不慎将发面发过了,可以将发过的面团继续搓揉,然后加入面粉、水、小苏打粉继续搓揉,直至将面团搓揉的
(本网讯)为深入贯彻落实省厅、晋城市司法局2023年“免费法律咨询和特殊群体法律援助”惠民工程工作部...
作者 星空下的栗子编辑 菠菜的星空排版 星空下的养乐多傍上新能源汽车这条大腿,锂电池回收也成为“...
电商报快讯:5月6日消息,敦煌网发布侵权产品处罚更新公告。公告称,敦煌网禁止发布和销售侵犯他人知识产权
近日,昆山市住房和城乡建设局发布的一则通报文件,引发了热议。该通报显示,昆山嘉宝网尚置业有限公司、昆
武汉出租车“司机联系卡”你体验过吗?(主题)武汉晚报记者李爱华乘客扫码支付车费后,手机支付信息不...
南昌看银屑病好的医院:患有银屑病要了解哪些常识?银屑病这种病症比较顽固的治疗过程是比较长的,如果
每经AI快讯,有投资者在投资者互动平台提问:露露在山东淄博有销售吗?淄博烧烤大热对销量有帮助?承德露露
这个5月,不仅有包括《银河护卫队3》《速度与激情10》等进口大片上映,还有一些冷门的国产文艺片值得一看。
据中国消费者报,2020年12月3日,男子通过二手车商购买了一辆奔驰,价格为32 8万元,车商保证此车无大事故
质子交换膜(PEM)广泛应用于燃料电池、电解水制氢、全钒液流电池储能、氯碱工业等领域,全氟磺酸膜(PFSA)质
1、房兵曹胡马胡马大宛名,锋棱瘦骨成。2、竹批双耳峻,风入四蹄轻。3、所向无空阔,真堪托死生。4、骁腾有
76人现原形!哈登身不由己,恩比德只剩华丽数据,里弗斯该下课,76人队,道格·里弗斯,詹姆斯·哈登,乔尔...
当地时间5月4日晚间,俄罗斯在莫斯科红场举行纪念卫国战争胜利78周年阅兵的第二次夜间彩排。这也是继4月27
首先要控制队员人数,其次知道如何投篮才能获得高分,以及什么情况下会被罚球;最后再记住投篮规则。接下来
日常身体出现不适,不少人会选择服用中药治理。天津市第二人民医院药剂科药师董骏铭介绍煎中药、服中药的科
4月27日,由渔机所主持的国家重点研发计划“政府间国际科技创新合作”专项项目“海水鱼循环水智能育苗设...
人民日报海外版上海5月5日电(记者沈文敏)近日,上海数据交易所国际板启动建设,探索数据跨境双向流动的新
对于人体来说,夏季是气血运行和新陈代谢旺盛的时期。在夏季初始的这一天,听解放军总医院第五医学中心营养
危地马拉国家减灾协调中心当地时间5日发布消息称,因该国富埃戈火山喷发,该国已累计在火山周边5个地区疏散
今天来聊聊关于衡水学院吧朱燕杰,衡水学院吧的文章,现在就为大家来简单介绍下衡水学院吧朱燕杰,衡水学院
资讯News
06-20
11-03
11-03
11-03
11-03
11-03
11-03
11-03
11-03
11-03
11-03
聚焦Policy
当好农民工的“护薪人” 近日,罗某等7名农民工在收到被拖欠的工资后,纷纷打电话向江西省南昌市...
“通讯录里所有人都知道我欠钱了” □ 本报记者 韩丹东 □ 本报见习记者 张守坤 ...
大连宝马车撞人案肇事司机被判死刑 本报讯 记者韩宇 10月29日,辽宁省大连市中级人民法院一审...
医院财务迷上网络赌博输光5000万元公款 □ 本报记者 马维博 □ 本报通讯员 汪宇堂 曹...
辊环车削 雕琢毫厘(工匠绝活) 【绝活看点】 23年来,雷虎始终扎根一线,改进钢材轧制工艺...
交警严查超标电动自行车挪用“白牌” 截至昨晚6时,处罚电动自行车违法行为共计6585笔;下一步将...
明起寒潮来袭 北方气温普降10℃以上 中央气象台预计,本周日北京平原地区最低气温降至-4℃左右...
多种蔬菜价格降幅达五成 包括菠菜、蒿子秆等 预计本月中旬蔬菜恢复供需平衡 本报讯(记者...
北京周日最低气温或达-4℃ 本报讯(记者 赵婷婷)北京青年报记者昨天从中央气象台获悉,新一股...
昌平一家四口确诊新冠肺炎 天通北苑第二社区升级为中风险地区 朝阳两涉疫校区及16所学校停课 ...