谷歌神秘项目曝光!能写代码还会改bug的AI,让码农瑟瑟发抖

新智元 2022-11-24 13:18



  新智元报道  

编辑:编辑部
【新智元导读】谷歌神秘项目Pitchfork曝光!这次,会有多少码农被迭代?

做一个程序员,压力有多大?

反正,最近的一个传闻,是让码农们瑟瑟发抖。

传说谷歌正在研发一个秘密的新项目,教AI写代码。

据说,学会之后,AI不仅能写代码,还会修复bug。

写代码这件事,就应该让代码自己来


传闻,谷歌的这个秘密项目,会通过机器学习训练代码,让它们自己编自己,自己修复bug,还能自己更新。

这个项目表明,谷歌向生成式人工智能(generational artificial intelligence)更近了一步。

现在的AI,是愈发无所不能了。它们可以创建图像、视频,还能写代码。

如果这个AI再进化下去,未来还需要写代码的码农吗?

据知情人士透露,这个项目起初是由Alphabet的登月部门——X部门开发的,代号为Pitchfork。

今年夏天,它被转移到了谷歌实验室。

众所周知,谷歌实验室看重的是「长期投资」,包括VR和AR项目。

现在,Pitchfork已经成为了谷歌实验室下「AI开发者援助团队」的一名员工。

根据内部资料,Pitchfork的作用是「教代码自行编写、自行重写」。

它能够学习不同的编程风格,并且根据这些风格写出代码。

现在,这个团队正在探索不同的用例,来帮助开发者。

一名谷歌员工表示,开发Pitchfork的初衷是希望建立一个工具,将谷歌的Python代码库更新到新版本。

在不用雇佣多余软件工程师的情况下,怎么从一个版本过渡到下一个版本呢?

Pitchfork应运而生。

团队负责人Hatalsky表示,随着时间的推移,Pitchfork项目的目标逐渐变成了建立一个通用系统。

从去年年底开始,Pitchfor已经可以降低for X的成本。

AlphaCode:吊打72%程序员


其实,AI编程这件事,早就不新鲜了。

2022年2月,Alphabet的另一家子公司、谷歌的兄弟公司DeepMind,就推出了一个名为「AlphaCode」的系统,可以使用人工智能生成代码。

根据DeepMind的说法,AlphaCode可以与人类匹敌。

DeepMind使用编程竞赛平台Codeforces上托管的10个现有竞赛来测试AlphaCode,总体排名位于前 54.3%,也就是说它击败了46%的参赛者 。

DeepMind声称,在使用编程竞赛平台Codeforces进行检测时,AlphaCode解决了100万个样本中34.2%的问题。

另外在过去6个月参加过比赛的用户中,AlphaCode的数据排到了前28%,可以说「吊打72%人类程序员」!

当时,DeepMind就指出,虽然AlphaCode目前只适用于具有竞争性编程领域,但显然,它未来的能力绝不会止步于此。

它为创造某些工具打开了大门,而这些工具将使编程变得更容易被人们接受,并且有朝一日可以完全实现自动化。

Copilot:程序员的好帮手


再往前,在2021年,GitHub与OpenAI共同推出了一款AI编程神器——GitHub Copilot。

输入代码时,Copilot会自动提示程序中接下来可能出现的代码片段,就像一个经过训练用Python或JavaScript说话的自动补全机器人。

Copilot能够填充必要的代码块,只要它们不是特别复杂或者特别有创造性,这对于相当于手工劳动的编程,可太有用了。

此外,Copilot还优化了多名程序员间的线上协作功能,因此,它是生成式AI早期最成功的项目之一。

2022年6月22日,Copilot正式面向C端上线,定价10美元/月或100美元/年,并向学生用户和流行开源项目的维护者免费提供。

现在,成千上万的开发者都在用Copilot。

在十几种最流行的语言编写代码中——有高达40%是依靠它来生成的。

GitHub预测,开发人员将在五年内使用Copilot编写多达80%的代码。

微软首席技术官Kevin Scott还表示:「我们确信:GitHub Copilot可以应用到数千种不同类型的工作中。」

不过,因为涉嫌侵权,在发布不到5个月后,Copilot已经被愤怒的程序员一举告上法庭,索赔90亿美元。

Codex:AI实时自动编程


OpenAI开创了文本生成的先河。

从2019年,OpenAI开始使用一种名为GPT-2的算法,在业内引发轰动;2021年底,OpenAI推出了GPT-2的升级版GPT-3,可供任何人使用。

GPT-3拥有1750亿个参数,是上一代模型GPT-2的100倍,也一举将此前同类NLP模型的参数纪录提升了10倍。

在图像生成领域,OpenAI在2021年1月官宣了DALL-E,它可以为文本提示生成原始图像。

在2022年4月,DALL-E 2发布,它能够渲染更复杂的图像。

2021年6月30日,通过搭载自家的Codex模型,OpenAI与GitHub联合发布了 「AI代码补全神器」GitHub Copilot。

不过当时,Codex并没有透露过多细节,始终保持着神秘感。

去年8月10日,OpenAI终于推出了改进版本的Codex,还发布了基于自身API的私测版。

与之前的版本相比,Codex的改进版本不仅可以解读简单的自然语言命令,还可以自动创建并完成代码,更加灵活和先进。

例如在OpenAI的太空游戏《space game》中,用户输入自然语言命令「Make it be smallish」,Codex系统便会自动生成控制代码,使图中飞船的尺寸就缩小。

另外,还有一个能自己写软文的神奇工具——Jasper。

「Jasper」是一款AI内容平台,搭载GPT-3的文本生成技术,可帮助人类突破创意障碍,并以10倍的速度自动生成文本供公司使用,用于营销、博客和电子邮件等。

就在10月,Jasper宣布筹集了1.25亿美元的资金,目前估值已达15亿美元,并声称有望在今年带来7500万美元的收入。

从去年到今年,井喷的生成式AI


要说现在业界最火热的词汇,「生成性人工智能」肯定是其中之一。

用技术一点的说法,「生成性人工智能」是指无监督和半监督的机器学习算法,它使计算机能够使用文本、音频和视频文件、图像甚至代码,来创建新内容。

AI根据用户提示生成的艺术作品、文本和代码,一次次让人类惊艳。

Gartner在「2022 年新兴技术和趋势影响雷达报告」中,就将生成式AI列为能带来生产力革命的技术之一。

根据Gartner的预测,到2025年,生成式AI将生成所有数据的10%(现在不到1%),以及面向消费者用例的所有测试数据的20%。

并且,到2025年,50%的药物发现和开发都会使用生成式AI。

投资人工智能的大型生物制药公司

而到2027年,30%的制造商将使用生成式AI来提高产品开发效率。

现在,生成式AI已经引发了硅谷的「淘金热」。

风投公司红杉资本就在最近的一篇博文中,阐述了生成人工智能的潜力,涉及语音合成、视频编辑、生物和化学等领域。

在文章最后,该公司得出结论:在未来,所有的图像,以及一部分文本和算法,都是使用AI生成的。

人类会因为AI而失业吗?


可以预见,随着生成式人工智能井喷,未来也将有更多、更先进的AI编程模型陆续出现,挤压程序员的生存空间。

那么,人类程序员会因为AI技术的发展而失业吗?

一个业界共识是:想要取代人类,「AI程序员」们还有许多问题需要解决。

这主要体现在「商业化前景」和「法规伦理」两个方面。

Foundation Capital的合伙人、Jasper的早期投资者Joanne Chen表示,想要将一家生成式AI工具变成一家有价值的公司仍然很困难。

前不久,「AI编程神器」Kite宣布停止开发,运营仅8年便彻底凉凉。

在发布于Kite官网的最后一期博客中,创始人Adam Smith表示「我们拥有了50万名月活用户,但几乎没有产生任何收入。」

他认为仅仅使开发人员在编写代码时速度提高18%,这对于他们来说也不够轰动,也并不足以使他们花钱购买增值服务。

产品的商业化前景不够明晰,这或许也是许多付费AI辅助软件的通病。

「伦理与版权」则是阻碍生成式AI技术走入人们生活的另一只拦路虎。

本月早些时候,GitHub就被提起集体诉讼,指控使用了Copilot工具使用人工智能复制开源代码,并视软件隐私于不顾。

一些开发人员也抱怨,Copilot所建议的代码看起来像他们自己的工作。

虽然GitHub表示,在极少数情况下,该工具会生成复制的代码,当前版本试图过滤和阻止与GitHub公共存储库中现有代码匹配的建议。但这仍然在一些程序员社区中产生了相当大的焦虑。

Chen还表示,生成式人工智能的热潮可能意味着监管的缺位,并使它们用于「一些令人讨厌或危险的用途」。例如制作传播错误信息的视频等。

因此就谷歌可能推出的Pitchfork来说,虽然该项目尚处于早期阶段,但仍需要考虑如何训练这些模型的棘手伦理问题,例如偏见和潜在的版权问题。

所以,程序员是在自己「杀」自己么?

参考资料:

https://www.deepmind.com/blog/competitive-programming-with-alphacode

https://www.businessinsider.com/google-ai-write-fix-code-developer-assistance-pitchfork-generative-2022-11



推荐阅读