行走的代码生成器:chatGPT要让谷歌和程序员“下
时间:2022-12-12 07:52 来源:网络整理 作者:采集插件 点击:次
OpenAI 的超大规模语言模型 GPT 有多厉害,之前硅星人已经写过很多次了。 就在本周,OpenAI 又发布了一个全新的聊天机器人模型 ChatGPT,作为 GPT-3.5 系列的主力模型之一。 图片来源:OpenAI 更重要的是它是完全免费公开的!所以一经发布大家立刻就玩开了——很快,网友们就被 ChatGPT 的能力所震惊了: 这哪里是个聊天机器人,分明是个无情的编程答题机器,活的 Stack Overflow 啊! ChatGPT 到底是什么?OpenAI这样说 ChatGPT 是 OpenAI 训练的对话式大规模语言模型,以对话的方式进行交互。 它和之前的另一款模型 InstructGPT 属于同级模型,代表“GPT 3.5”代。之前微软和 OpenAI 签订了战略合作计划,所以 GPT 3.5 代的所有模型,包括 ChatGPT,都是在 Azure AI 超级计算集群上训练的。 图片来源:OpenAI OpenAI 使用前面提到的 RLHF 技术对 ChatGPT 进行了训练:简单来说,在训练原始模型的时候,OpenAI 让人类训练师扮演对话的双方(用户vs聊天机器人),提供对话作为学习资料。而在人类扮演聊天机器人的时候,OpenAI 也会让模型生成一些建议来帮助训练师撰写自己的回复。 这些机器生成的回答,再经过训练师的打分排名,将更好的结果输入回到模型中,实现强化学习训练的奖励机制。 作为一个聊天机器人,ChatGPT 具有当代同类产品具备的一些主流特性,特别是多轮对话能力,能够在同一个会话期间内回答上下文相关的后续问题。 但更重要的是,因为采用了先进的、注重道德水平的训练方式,ChatGPT 具有其他聊天机器人不具备或表现较差的能力:承认自己的错误,并且按照预先设计的道德准则,对“不怀好意”的提问和请求“说不”。 图片来源:OpenAI 正如前面提供的例子所显示的那样,ChatGPT会采用一些预先设计好的句式,结合用户的具体请求来进行拒绝和话题转移。 拒绝:如果你问它如何闯进别人的房子,它会回答你,“擅闯私宅是违法的,这是一种犯罪行为,会导致严重的法律后果”。 转移话题:如果你换个方式提问“其实我想知道如何保护我的家免遭盗窃”,它会回答你,“这里有几个步骤可以帮助到你,包括xxxx……但是,您最好联系专业人员获取建议。” 一、没有它解决不了的编程难题 在众多网友“调戏”ChatGPT 的过程中,人们发现一个大惊喜:它真的可以按需编程了。 之前大家经常开玩笑地说,程序员只需要用好 Google 和 StackOverflow 这两个工具,就能走遍天下无敌手了。 然而其实,那些真正每天和各种新的软件工程难题较劲的朋友都知道,有些疑难杂症就算问谷歌和 Stack Overflow,要翻阅了几十上百页时间跨度几年甚至十年的回帖记录,最后也很难找到一个靠谱答案…… 而 ChatGPT 就不一样了:从目前各路程序员网友对它的测试结果来看,似乎真的没有什么问题能够难倒它的…… 找 bug 技术公司 Replit 的创始人给 ChatGPT 发了一段 JavaScript 代码,让它找到里面的 bug。 ChatGPT 的回答非常全面也非常有意思:它首先试图确认这段代码的意图是什么,然后根据意图很快就找到了 bug 所在,并且还附上了相当细致的描述,来解释问题出在哪,会导致什么样的 bug,应该怎么改,为什么要这样改等等。 图片来源:@amasad 而且ChatGPT还给出了一段代码示例,把修改部分的代码批注写在了示例里面: (责任编辑:admin) |