of69
您的位置:首页 > 资讯 >

GPT-4发布后的第一道挑战,来自弱智吧

来源:IT之家 2023-03-26 12:41:47   阅读量:13817   

文丨流年如墨 审核丨千里

排版丨鹿九

我相信,如果未来有一天我们证实了 AI 永远赶不上人类的智慧,那其中弱智吧吧友绝对功不可没。

当然,反过来意思也差不多:要是哪天 AI 连弱智吧的脑残问题都能应对如流,那大伙离失业可能也就不远了。

就在几天前,去年年底风靡互联网的聊天 AI“ChatGPT”背后的公司 OpenAI 又推出了全新的 GPT-4。

而在这次全面升级后,新出炉的 GPT-4 可还要牛上一个段位。

从下图中的对话来看,它显然看到并看懂了这张图。

当然,你也可以故意使个坏,给它上传一张表意隐晦的互联网梗图,赌它理会不得个中深意。

然而事实却是 GPT-4 精准描述出了图中的内容,并且分条列点地讲出了其中所包含的笑点。

只可惜,这个功能暂时不对公众开放。

同时,OpenAI 似乎是在上次的测试中搞清楚了大家的兴趣所在,给 GPT-4 添加了一个角色扮演功能。听上去和之前的“猫娘洗脑咒语”系列相差不大,但从大家的实战演示来看,如今想把 AI 变成自己的专属猫娘比以前省力了不少。

当然,也可能是刚上线的 GPT-4 也没被“AI 原则”的条条框框所束缚,暂且可以和用户们玩点大的。

此外,GPT-4 对于文字的理解能力也比过往的 GPT-3.5 高了一个台阶。即使在面对博大精深的汉语中最难为人的那些句式时,它也能给出尽量准确的翻译。

像这句“别别别的”,三个“别”字就被正确翻译成了“put”、“not”和“anything else”。虽然具体描述上有些许不同,但考虑到中英表述习惯的不同,已经足够优秀了。

至于这句更拗口的“过过过儿过过的生活”翻译的更是完美,显然是正确领会到了原句的意思,没给绕晕。

而更让我惊喜的是,相比它套话连篇,听君一席话如听一席话的老前辈,GPT-4 嘴里忽悠人的车轱辘话显然少了很多,更能干实事了。

举个简单的例子,在以前当我们用 ChatGPT 做主持人编写一个冒险故事,让它向我们描述一些奇幻物品的形象时,它总会说一堆空话,再把皮球踢回来。

但这回,AI 自己编写故事、填补细节的能力就好上了许多,在推进故事进展时很少会给出模棱两可的描述,玩起来更多了些代入感。

更别说 GPT-4 的记忆长度是 ChatGPTD 的进十倍,在进行长段对话时不再需要过于担心它的记忆能力,只要每隔一段时间统计、记录一下核心数据,稍微纠下错,就可以来一场痛快的异世界冒险了 —— 喜欢 DND / COC 跑团,但苦于无人作伴的兄弟有福了。

但是嗷,上面提到的这些都还只是小打小闹,真正在对话中对 GPT-4 的理解能力、表述能力、逻辑思维能力进行了全面考察的,还得是咱弱智吧吧友。

这两天,B站上“GPT-4 首战弱智吧”、“GPT-4 再战弱智吧”这样的视频不在少数。按大家的一贯印象,AI 在应付这些一踩一个坑 抽象问题时很容易就原形毕露。但这次,情况好像出了点变化。

首选端上来的是经典老题“女朋友的老公叫我什么”,此前的 AI 给出过五花八门的答案,包括“爸爸”等。

而在这边,GPT-4 虽然没能识破“女朋友的老公”就是“我”的文字游戏,但还是就问题的不合理提出了质疑,起码没被绕进去,打个 90 分不过分。

再来,弱智吧继续掏出混淆语义的句式,“跳多高才能跳过广告”,意在让 AI 误会“广告”是个具体的有高度的东西。

谁知 GPT-4 竟真有火眼金睛,一眼看出“这是个幽默的隐喻”,帮弱智吧解释了问题的同时还真给出了一串减少、跳过广告的犯案,这一串话看起来八面玲珑。坏了,真让 AI 啥都搞懂了。

还好,弱智吧不愧是弱智吧,弱智问题数之不尽,但 AI 只有一次失败的机会。很快,有备而来的弱智吧就成功拿下一分 ——GPT-4 终究在诡辩话术上吃了点亏。

虽然有偶尔失手的案例,但从这一连串的弱智吧 VSGPT-4 中,我们明显可以看到它分辨语义的能力相比前代产品有了极大提升,简单的语言陷阱文字游戏已经不再能够让他跟着胡扯。

同时,GPT-4 回答内容的逻辑性强了不少,即使是一些需要思考、需要创作的问题它也能发表见解,属实相当恐怖。

在经历了这样一次升级后,让 GPT-4 来扮演我们日常生活中部分工作的助手显然绰绰有余 —— 这下担心学生用 AI 做作业的大学老师又要头疼了。

还好,目前为止想要体验 GPT-4 必须在 OpenAI 的网站上开通月费 20 美元的 ChatGPT Plus 服务,否则就只能使用此前公开的 GPT-3.5 版本,这个价格对于一般乐子人来说还是挺不愿承担的。

当然,如果你真想抢先体验 GPT-4 又不愿花钱,那就赶紧去注册一下微软 newbing—— 在 GPT-4 发布后,微软也承认了 newbing 搭载的 AI 正是 GPT-4。尽管 newbing 有着回答次数的限制,起码尝个鲜还是没问题的。

随着 ChatGPT 的逐步迭代,为大家所诟病的逻辑问题、扯胡话问题等也在肉眼可见的不断改善。等哪天 GPT5.0 乃至 6.0 发布,或许我们日常中不少简单但费时的琐事真就可以一句话交付给 AI 完成。

期待未来有一天,我们能过上一句话写稿、一句话编程、甚至一句话生成动图短片的生活,那可太有意思了。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

每日推荐
戴尔XPS13Plus日本发布:全新设计,可选i5-1240P/i7-1

戴尔XPS13Plus日本发布:全新设计,可选i5-1240P/i7-1

,据PCWatch报道,戴尔在日本发布了全新的XPS13Plus笔记本,但没有公布价格和出...更多

2022-04-19 16:27:00
全球芯片库存不断累积,业界解读出现分歧

全球芯片库存不断累积,业界解读出现分歧

据彭博社报道,全球主要芯片制造商产成品库存正加速累积,这一现象引发业界担忧。尽管几家受访企...更多

2022-04-19 16:10:00
德龙激光明日申购顶格申购需配市值6.50万元

德龙激光明日申购顶格申购需配市值6.50万元

德龙激光明日开启申购,公司本次发行前总股本为7752.00万股,本次拟公开发行股票2584...更多

2022-04-19 16:01:00
SA:2021年全球智能手机批发ASP突破300美元大关

SA:2021年全球智能手机批发ASP突破300美元大关

StrategyAnalytics的WSS服务最新研究指出,2022年全球智能手机批发收益...更多

2022-04-19 15:31:00
第九届“云鼎奖”申报启动,见证行业过往十年辉煌征程!

第九届“云鼎奖”申报启动,见证行业过往十年辉煌征程!

3月1日起,由第十届全球云计算大会middot;中国站主办方英富曼集团牵头组织的第九届ld...更多

2022-04-19 15:16:00
人民币兑日元逼近20大关上热搜:日元贬值势头依然强劲

人民币兑日元逼近20大关上热搜:日元贬值势头依然强劲

4月19日,日元兑人民币,一度低至0.0499!截至18日上午12时,日本东京外汇市场日元...更多

2022-04-19 14:41:00
中国移动Ⅰ类铅酸蓄电池产品公开集采:总规模约8.778亿Ah

中国移动Ⅰ类铅酸蓄电池产品公开集采:总规模约8.778亿Ah

据中国移动发布的集采公告显示,本期集中采购产品为2V、12VⅠ类铅酸蓄电池产品,预估采购规...更多

2022-04-19 12:58:00
CITE2022观众登记全面开启,享VIP观众只需一步!

CITE2022观众登记全面开启,享VIP观众只需一步!

乘风破浪,破局爆发2022年5月17日第十届中国电子信息博览会即将于深圳会展中心惊艳亮相1...更多

2022-04-19 12:53:00