出品/壹览商业
作者/成如梦
编辑/木鱼
4月7日,阿里正式邀测了自己旗下的AI大模型“通义千问”。恰好在此之前百度旗下的大模型“文心一言”也已经开始内测。此次壹览商业在拿到内测码之后,随机选取了13个与商业相关的问题,同时询问了阿里的“通义千问”和百度的“文心一言”。
从这13个问题的回答可以看出,文心一言的逻辑性和知识文化水平明显强于通义千问。
在一句话同时出现两个问题时,文心一言会先后回答两个问题,并作出解释,但通义千问只能识别一个问题或者说将两个问题糅合在一起进行回答。
在遇见一些专业性的问题时,文心一言擅长用“1、2、3、4”,“首先、其次、最后”,或者是“短期来看,长期来看”,又或者是“从行业来看,从市场来看”这种有逻辑的词汇,层层递进的表达自己的客观观点;而通义千问的回答大部分只有文心一言回答内容的一部分,缺少逻辑性,有时候还会跑题。
但值得注意的是,通义千问认识了文心一言,但文心一言还不认识通义千问。另外在13个问题里,有7个问题的回答,文心一言都在强调自己只是一个AI。
当然从回答结果来看,双方均有尚未完善的地方。这是双方关于13个问题的回答。
1.在询问如何看待对方的时候,文心一言表示还没有关于通义千问的相关信息;
通义千问的回答没有太多主观的评价,只是说文心一言是一个潜力较大的AI训练模型,但仍处于实验阶段,需要更多的研究和探索。关于“通义千问”这位对手,文心一言似乎还没做好准备。
2.在问到如何看待今年整个消费行业的市场环境时,文心一言一开始就表明自己只是一个AI,在回答问题的过程中一直在用“可能”这类词汇,表示当前的市场环境可能对消费行业产生了一些影响,但具体的影响取决于多种因素,在举例时还多次提到了阿里巴巴;
但通义千问直接表示消费行业市场环境面临着一些挑战,多是一些肯定的回答。
相对来说,面对这个略偏专业的问题,文心一言给出了更专业的回答,还在总结的时候,同时指出了9.9包邮活动的优点和缺点,并表示电商平台需要根据自身的定位和目标来指定合适的策略。而通义千问只总结了9.9包邮活动的优点。
但通义千问只回答了第二个问题,采用的是并列的手法,逻辑性更弱,而且其中有些回答的内容是重复的,当然通义千问也给出了自己的结论,价格战可能会对消费行业产生多种影响。
而通义千问似乎偏题了,回答了在小红书上营销和运营需要重视的问题。最关键的是,通义千问还说出了“小红书上的用户对产品质量和安全性非常关注”这种非常肯定的表述。
而通义千问的回答则更像是回答为什么要做品牌营销以及如何做好品牌营销这两个问题。最后结尾表示注重品牌营销非常重要,但也需要注重产品和服务。
而通义千问此时已经开始瞎编了,声称库迪咖啡可能在产品和服务上具有自己的特色和优势,可能拥有更好的品牌形象和声誉。
通义千问的回答似乎更加模棱两可一点,最后表示目前看来,新茶饮仍然处于快速增长极端,未来仍然有可能继续爆发;
通义千问也表示实体零售确实面临着一些挑战和不确定性,但仅靠关闭门店的说法并不一定意味着实体零售的触底。
而面对自己的公司,通义千问的了解似乎比自己的对手还少,甚至只说了文心一言所表述的其中一个点。
4月11日,接手阿里云之后的张勇在阿里云峰会上首次现身,同时通义千问也正式面世。张勇表示面向智能化时代,所有公司在同一起跑线上。但很显然,文心一言和通义千问还是有一定的区别。
张勇还表示,AI大模型的出现是一个划时代的里程碑,人类将进入到一个全新的智能化时代,就像工业革命一样,大模型将会被各行各业广泛应用,带来生产力的巨大提升,并深刻改变我们的生活方式,未来通义千问将接入阿里的所有产品。
整体看来,可能是因为数据源的问题,文心一言的回答更加综合,而通义千问则更聚焦。
未来通义千问要接入更多的产品,也需要更加综合化,这也意味着通义千问还需要接受更多的训练。
24小时热榜