欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

OpenAI直播大秀语音指挥AI自动编程,也就比老罗TNT强亿点点

时间:2023-04-06 09:25:23 | 浏览:336

金磊 梦晨 明敏 发自 凹非寺量子位 报道 | 公众号 QbitAI刚刚,OpenAI又玩出了一个新高度。只输入自然语句,AI就自动做了个小游戏!划重点:不! 用! 你! 编! 程!来,感受一下这个feel。第一步,“小人儿”搞里头,输入一

金磊 梦晨 明敏 发自 凹非寺

量子位 报道 | 公众号 QbitAI

刚刚,OpenAI又玩出了一个新高度。

只输入自然语句,AI就自动做了个小游戏!

划重点:不! 用! 你! 编! 程!

来,感受一下这个feel。

第一步,“小人儿”搞里头,输入一句话就能让它按照方向键左右移动:

Now make it controllable with the left and right arrow keys.

AI在理解了需求之后,自动编程,然后小人儿就真的可以左右移动了。

第二步,“石头”搞里头,同样输入一句话,让它“从天而降”:

Now have it fall from the sky, and wrap around.

第三步,用自然语言简单再制定些规则,若小人儿被石头砸中则终止游戏。

Constantly check if the person and the boulder overlap at all, and if so, you lose.

最后还让AI生成结束提示,其中要包括一句鼓励人的话。

AI挑中的是“Try Again!”

当然,还有规则更复杂的小游戏(例如增加计分等功能),也可以用同样的方式,分分钟生成:

这是魔法吧!现在开发小游戏都靠“打字”了?!

围观直播的观众们,也是发出了同样的感慨,瞧瞧这满屏止不住的弹幕:

有网友甚至直呼道:

编程,已经变成AI自己的游戏了。

这就是OpenAI重磅发布的新品——Codex,一个能自己编程的AI。

AI编程这事并不新鲜了,像GitHub前不久闹得风风火火的Copilot,就是其中一个。

但它背后的技术,其实还是来自于OpenAI。

然而这一次,OpenAI给自己的能力升了个级,来了个新版本。

不仅如此,搞一个小游戏,仅仅是Codex能力的冰山一角罢了。

一起感受一下它更多惊艳的表现吧。

不用打字,直接语音命令它!

给AI打字“提需求”,还是略显麻烦了一些。

能不能直接说话下达命令呢?

这个还真可以有!

OpenAI这次与微软合作出了一个Word插件,便带了这种语音控制的功能。

直接对着AI下命令“把每行开头的空格去掉”,AI通过微软给的接口一顿操作,成功执行:

啪的一下,全文就左对齐了有木有。

而且AI还精准地理解了命令的含义,那些段与段之间的空行并没有改动。

来再复杂一点的。

给AI下达“每数到五行就加粗”命令,也是能轻松hold得住:

这种把任务吩咐下去,就有“人”给你完成的感觉,是不是很像老员工指挥实习生?

总之呢,是比罗永浩前几年发布的TNT系统语音办公要强上那么“亿”点点了。

除了官方的演示,这次内测用户aniakubow,还让AI表演了通过152字描述生成一个网页

可以看出这里Codex是用Javascript操作Document对象来生成网页,可能是训练集里没有直接的HTML代码的缘故吧。

最后,除了现场演示外,OpenAI还在Arxiv上发布了Codex的论文预印版。

论文中,Codex要面对的挑战甚至有刷IOI和ACM难度的竞赛题

Codex用对每道题生成1000种答案这种暴力方法,能做出600多道竞赛题测试集中的3.23%,并且通过全部的测试用例。

这个编程题目测试集是UC伯克利研究人员在5月份刚刚做好的。

当时测试的GPT-2、GPT-3和开源的GPT-Neo可是在竞赛难度上全军覆没,一道都没做出来。

没想到短短两个多月,专为代码而生的Codex就为前辈们洗刷了耻辱。

Codex的“魔法”,是如何实现的?

这么炫酷的能力,莫非还是像GPT-3一样堆数据,大力出奇迹吗?

不全是,这次Codex最大的一个版本是120亿参数,比起GPT-3的1750亿还是小了很多。

要了解具体情况,还要从它的开发历程说起。

最早,OpenAI研究人员拿GPT-3做各种试验,发现GPT-3能从Python注释中生成一些简单的代码。

这可把他们高兴坏了,因为GPT-3根本没特意拿代码训练过,只是看过一些博客和帖子中零星的代码片段。

想想GPT-3在自然语言上的出色表现,要是专门训练一个代码版的GPT-3,那肯定也能再次震惊业界。

于是,他们找到了GitHub,这个拥有最多开源代码的“小伙伴”来合作。

一开始是拿到了179G的Python代码,但其中不乏存在一些篇幅太长的,以及明显是自动生成的那种。

在剔除掉这些“不达标”的代码后,最后留下的代码大小为159G

接下来当然是做预训练,把这些代码都喂给AI (Codex)

不过这里有一个问题:

GitHub上的开源代码难免会有Bug,AI学了一堆有问题的代码可咋办?

其实这倒也好说,预训练之后不是还要微调嘛。

微调的时候,全用编程竞赛里的正确答案,以及PyPI里的靠谱开源代码就可以了。

最后,120亿参数版的Codex,能对28.81%的问题给出正确答案。

这个准确率超过之前的开源代码预训练模型GPT-Neo和GPT-J,还有基于GPT-2的代码补全工具TabNine。

这个成绩虽然不错,不过离能实际应用还是有点远了。

不过,这也难不住OpenAI的研究团队。

他们很快便想到了“突破口”:

人类编程的时候,不也经常先出一个版本,然后反复修改bug嘛~


那就让AI像人一样反复修改,改出100个版本来,从中总能挑出几个正确的来。

用上这种拿“量”堆出来的方法,Codex的最终成绩是:

77.5%

强,但不完全强

Codex令人惊艳的表现,一度让网友们大呼:

要失业了要失业了!

有人直接在公屏上打出:再见了,计算机专业的学子们。

不过大家也不必如此担心,因为在演示过程中,其实就出现了翻车的情况。

在输入“Say Hello World with empathy”后,Codex给出的结果居然还是“Hello World with empathy”。

这也侧面说明了Codex现在还不是完美的。

OpenAI就表示:

即便是参数达到120亿的Codex 12B,它的能力可能也还不如一位编程刚刚入门的学生。

虽然Codex学习上亿行代码,但它更大程度是“记住了”这些代码,并不是真正意义上的懂编程语言。

而且Codex对长字符串的理解也比较困难。

并且随着字符数量的增加,Codex的性能表现下降得非常明显。

要不是合作方微软Azure云买了足够多的碳排放限度,Codex可能还不能和我们见面呢(手动狗头)。

此外,在理解变量和运算较多的注释时,Codex也会犯错:

在这个例子中,120亿参数版的Codex,忘记了对变量w做减法,也没有返回所有数字的乘积。

这些对于还在学习编程的新手程序员而言,非常不友好。

而且由于生成的代码准确性和正确性都还不能保证,因此在安全问题上也存在一定风险。

不仅如此,OpenAI还表示,Codex会生成带有种族歧视的内容。

在社会层面上,OpenAI还提出Codex的出现或许会冲击程序员的就业;如果被滥用,还有网络犯罪方面的隐患。

最后还有一点,就是环境方面的问题。

毕竟它作为大模型,参数量的规模不容小觑。

要不是合作方微软Azure云买了足够多的碳排放限度,Codex可能还不能和我们见面呢(手动狗头)。

如果想要试玩的话,OpenAI还准备了一个Python编程大赛,在这场比赛中Codex会作为你的搭档和你一同解题。

比赛将于北京时间8月13日凌晨一点开始,就是这时间对国内不太友好。


大赛报名地址:
https://openai.com/blog/openai-codex/

参考链接:

[1]https://www.twitch.tv/openai
[2]https://www.youtube.com/watch?v=hP5nOFi5HOw
[3]https://twitter.com/OpenAI/status/1422967522890973185
[4]https://arxiv.org/pdf/2107.03374.pdf


— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

相关资讯

OpenAI直播大秀语音指挥AI自动编程,也就比老罗TNT强亿点点

金磊 梦晨 明敏 发自 凹非寺量子位 报道 | 公众号 QbitAI刚刚,OpenAI又玩出了一个新高度。只输入自然语句,AI就自动做了个小游戏!划重点:不! 用! 你! 编! 程!来,感受一下这个feel。第一步,“小人儿”搞里头,输入一

快评GPT-4:OpenAI不open了,机器视觉不存在了

今天凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。眼花缭乱的技术迭代和全新功能毫无疑问再次带给我们巨大震撼,但在冷静之后,本次发布的一些细节也让我们感到担忧:这家将“open”写在公司名称里的科技企业,似乎正在朝着close的方

OpenAI是一家什么样的企业——OpenAI介绍与成果总结

OpenAI是全球最著名的人工智能研究机构,发布了许多著名的人工智能技术和成果,如大语言模型GPT系列、文本生成图片预训练模型DALL·E系列、语音识别模型Whisper系列等。由于这些模型在各自领域都有相当惊艳的表现,引起了全世界广泛的关

回顾|OpenAI入门(二)-用Blazor构建OpenAI应用

OpenAI与支付公司Stripe合作,将ChatGPT商业化

OpenAI将与支付公司Stripe合作,后者为其ChatGPT等人工智能工具提供支付和订阅服务。Stripe 还将把 OpenAI 的新自然语言技术 GPT-4 融入其产品和服务中。Stripe首席技术官David Singleton表示

OpenAI发布新语音系统「Whisper」,英文识别能力可接近人类水平

OpenAI入门(三)|构建自己的VisualStudioCodeCopilot组件

阿儿法营真有“营”--少儿编程夏令营

悠长的暑假即将开始,让孩子去旅游、去游学、还是参加辅导班?各种计划,各种憧憬,家长想寓教于乐,孩子想尽情玩耍。就在这个暑假,阿儿法营真的有了“营”!家长们不用纠结了,省下飘洋过海去美国麻省理工学院的时间和银子,来阿儿法营玩“魔抓”创意编程,

少儿编程夏令营开营啦

8月5日,由国家超级计算深圳中心、中国计算机学会深圳分部联合云创大数据举办的“小天才学Python少儿编程夏令营”在深圳超算正式开营。30位7—10岁的孩子参与本期夏令营。在5天营期中,导师们将带孩子们认识turtle库、For循环、pen

“小天才学Python少儿编程夏令营”在深圳超算开营

8月5日,由国家超级计算深圳中心、中国计算机学会深圳分部联合云创大数据举办的“小天才学Python少儿编程夏令营”在深圳超算正式开营。30位7-10岁的孩子参与本期夏令营。在5天营期中,导师们将带孩子们认识turtle库、for循环、pen

资本持续加注,编程猫的“硬核实力”有多强?

2018年底有行业声音预测:2018年教育行业迎来寒冬,但也是未来几年中最好的一年。2019年我们明显看到褪去资本热,教育行业进行了大洗牌优胜劣汰。而2020年的开年,新型冠状病毒的肆虐,全国停工居家隔离,给各行各业带来巨大冲击,无疑也给教

编程史上最牛逼的9位程序员大佬,谁才是你心中的No.1?

今天为大家介绍的这九位是对整个编程史影响甚远的程序员,他们每一个都在编程史上留下了自己的痕迹,他们要么是一些技术大神,要么是编程语言创始人,那么在编辑名人堂里,最厉害最牛掰的程序员会是谁呢?1、丹尼斯·里奇:DENNIS RITCHIE丹尼

电子烟、编程课、代餐:资本寒冬里的赛道品牌,你消费过哪一个?

猫头鹰日志(MalltoWin Log)资本大潮的方向,就是消费争夺的坐标。2019 年虽然没有超大风口的惊喜,但我们还是看到局部的暖流活跃其中。2019-10-18“资本注意力大面积转向 to B 行业,SaaS 仍是最有机会的领域,RP

程序员都用什么电脑?适合编程笔记本电脑推荐

适合程序员的笔记本电脑首先应该满足小巧轻便这个需求,然后才是性能因素,一个标准的程序员必定能够随时随地改BUG,所以可以优先考虑苹果MacBook Pro,由于其 MacOS 就是Linux内核,做开发无疑是最佳的选择。当然还有非常多的Wi

GPT-4正式推出,能使用几乎所有编程语言,将陆续对开发者开放API

当地时间 3 月 14 日,OpenAI 宣布正式发布 GPT-4,它拥有图像识别功能、高级推理技能、以及处理 25000 个单词的能力,在单词处理能力上是 ChatGPT 的八倍,并可以用所有流行的编程语言写代码。OpenAI 还表示 G

友情链接

网址导航 SEO域名抢注宝宝起名网妈妈知道币圈热水袋品牌网赣州新闻头条网公司起名取名网蜈蚣养殖技术国际象棋培训网牙科知识科普网勒布朗·詹姆斯球迷网早教加盟网今日日照帕加尼跑车网丽家宝贝母婴剧本杀剧本网宁德新闻资讯网海南椰子种植网莫斯科旅游网
PHP编程知识网-php开源建站系统、PHP程序员网站开发、php编程工具、php菜鸟教程下载、PHP网络编程教学、php网络编程、php工程师、php菜鸟教程数据库、PHP网站开发、PHP精品源码网站、php程序员入门、php零基础入门教程、php源码搭建网站流程、php从入门到精通第2版、php开发简单网站、php制作网站实例、php网站开发实例教程源代码、php中文网破解版、php中文网。
php编程知识 yoceo.cn ©2022-2028版权所有