阿里版 ChatGPT 突然官宣!火速进行了测评,结果……
| CSDN(ID:CSDNnews)
平地一声雷! 今天中午阿里版类 ChatGPT 「通义千问」突然 官宣:
没错,就那 3 行简短介绍 + 1 个官网地址,再无其他“ 剧透”。
好在,CSDN 有幸拿到了 「通义千问」的第一批内测邀请码!既能第一时间体验那神异的「通义千问」,那就让我们一同看看:那个 阿里版 ChatGPT,它的程度事实若何?
1
毛遂自荐
起首,让 「通义千问」来个官方的毛遂自荐: 介绍一下你本身吧。
相信许多人都猎奇 「通义千问」的优势安在,那就让它本身答复: 你与其他大规模语言模子比拟,有什么长处?
有了初步领会后,那么接下来就让我们步进正题:围绕文学创做、数理逻辑推算、中文理解 、代码生成 那四个角度, 实测「通义千问」的对话程度。(注:因同是“国产版 ChatGPT”,所以本次部门发问内容也参考了前次评测「文心一言」 的标题问题。)
2
代码生成
ChatGPT 能成为法式员的“ 辅助神器”,并胜利 “出圈 ”的最次要原因之一就是其超卓的代码生成才能。因而,本次 对「通义千问」的测评我们也先从那方面起头。
先来个简单的: 用 Python 实现冒泡排序。
发问: 请写代码处理"把 abcd...s 共 19 个字母构成的序列反复拼接 106 次,得到长度为 2014 的串。
接着: 利用函数递回的办法打印斐波那契数列的前 n 个数:0 1 1 2 3 5 8 13 21 34 ……, 找出准确的选项。
再发问: 请写一个利用逻辑回回模子揣度用户更喜好通义千问仍是 ChatGPT 的操练代码。
陆续: 请用 C 语言,利用动态分配内存的体例,模仿 C++ 中 Vector 容器,实现动态数组的构建。
英文发问: “Using Python to Define a class named Vector to simulate the C++ Vector container and implement dynamic array construction using dynamic memory allocation.”
关于以上 「通义千问」生成的代码,我们征询了 CSDN-AI 团队研发总监停止评判:
“阿里云的模子关于随机抽取的常见代码片需求,根本能理解需求,生成适宜的代码。能区分生成代码对指定语言的需求。能区分中英文问题输进。简单的冒泡排序和范畴特定的逻辑回回代码,都能生成适宜的代码,总体表示不错。在理解代码需求的推理才能上,则还有待加强 (阿谁字母的题)。 ”
3
文学创做
发问:龟兔赛跑的结局是什么?假设要续写那个故事,能够有哪些角度?
从「通义千问」给出的答复来看,它能准确给出简单故事的结局,关于续写角度的定见也较为全面。
4
数理逻辑推算
发问: 一个笼子里有 9 个头,30 只脚,应有几只鸡,几只免子?
面临典范的鸡兔同笼问题,「通义千问」在得出准确谜底的同时,解答过程言简意赅。
发问: 7 年前,妈妈年龄是儿子的 6 倍,儿子本年 12 岁,妈妈本年几岁?
解答那道小学奥数利用题,「通义千问」的表示也可圈可点。
发问: 某厂一车间有 64 人,二车间有 56 人,现因工做需要,要求第一车间人数是第二车间人数的一半,问需从第一车间调几人到第二车间?(列方程解答)
不外,关于那道前次「文心一言」没答出的初中数学利用题,「通义千问」也出了点问题:方程是列了,但少了个将 56+x 括在一路的括号。看来在较为复杂的逻辑推算上,“国产版 ChatGPT”还有待加强。
5
中文理解
发问: “洛阳纸贵”详细是什么意思?
发问:京剧中的生、 旦 、净、丑别离指什么?
在中文理解上,「通义千问」的答复固然比力简短,但大致是准确的。
6
再闲聊一会儿
与前次测评「文心一言」一样,最初我们也来看看 「通义千问」的闲聊程度若何。
发问:我有点饿,请你选举一道成本低于 30 元(人民币)的菜及其做法?
很好很贴心,连食材单元都很详尽,手残党必备。
发问: 你的呈现会对法式员产生什么影响?能否会代替一部门法式员?
与 「文心一言」和 ChatGPT 类似, 「通义千问」关于那个问题的解答也很客看中立。
至此, 关于 「通义千问」的测试就到此完毕了。
那么通过那些 QA,你对那个阿里版类 ChatGPT「通义千问」的评判若何呢?
我来回答