用GPT-4纠错GPT-4！OpenAI推出CriticGPT模型

财联社6月28日讯（编辑周子意）根据OpenAI周四（6月27日）发布的新闻稿，该公司新推出了一个基于GPT-4的模型——CriticGPT，用于捕获ChatGPT代码输出中的错误。

CriticGPT的作用相当于让人们用GPT-4来查找GPT-4的错误。该模型可以对ChatGPT响应结果做出批评评论，从而帮助人工智能训练师在“基于人类反馈的强化学习（RLHF）”过程中发现的错误，为人工智能训练师提供明确的人工智能帮助。

用GPT-4纠错GPT-4！OpenAI推出CriticGPT模型-编程日记

这一新模型的发布意在向投资者传达，OpenAI在RLHF赛道上的领先地位。RLHF的一个关键部分就是收集比较，让人工智能训练师对不同的ChatGPT回答进行评分，并反馈给ChatGPT。

研究发现，当训练师借助CriticGPT来审查ChatGPT输出代码时，他们的表现要比没有得到帮助的人高出60%。并且，在CriticGPT的帮助下，他们的指正比自己单独做的更加全面。

CriticGPT的审查

随着大模型在推理和行为方面的进步，ChatGPT变得更加准确，它的错误也变得更加微妙。这可能会使人工智能训练师很难发现其中不准确的情况，从而使RLHF的比较任务更加困难。

若是如果没有更好的工具，人们很难对这些系统进行评估。而OpenAI指出，CriticGPT模型将有能力评估先进人工智能系统的输出。

OpenAI举了一个例子：用户对ChatGPT下达“用Python编写指定函数”的任务，ChatGPT根据这一指令给出了相关代码。对于ChatGPT给出的代码，CriticGPT点评了其中一条，并给出了效果更好的替代方案。

用GPT-4纠错GPT-4！OpenAI推出CriticGPT模型-编程日记

还有一项数据显示，在OpenAI的实验中，随机训练师在超过60%的时间里更倾向于人类与CriticGPT合作后得出的指正，而不是单纯由人类训练师作出的批评。

不过，OpenAI也指出，CriticGPT的建议并不总是正确的，但与没有人工智能的帮助相比，它还是可以帮助训练师找出模型中的更多问题。

用GPT-4纠错GPT-4！OpenAI推出CriticGPT模型

7月5日WAIC低空经济领域重要会议！蓝鲸新闻主办“AI+未来出行”开放报名！

世界首份！嫦娥六号带回1935.3克月背样品

最新文章

美国太空探索技术公司：正与波兰政府合作寻找“猎鹰9”火箭残骸

小米将推出首款AIPC产品

蓝思科技称与灵伴科技合作为全球AI眼镜出货提供支撑

我国科研新成果：量子直接通信有望进入实际应用

快讯丨4.48万元起售！宏光MINIEV四门版正式上市

唯品会2024年GMV增长承压 2025年特卖电商如何转守为攻？

全球开发者先锋大会多款机器人亮相业界“顶流” 宇树科技携两款机器人参展

DeepSeek一体机、算力超市、智能硬件产业联盟……多项AI产业重磅合作在GDC官宣!

立昂技术(300603.SZ)：引领智能应用加速，释放DeepSeek大模型无限潜能

腾讯元宝超越豆包升至中国区免费APP下载排行榜第二仅次于DeepSeek

标签

关注我们么么哒！

用GPT-4纠错GPT-4！OpenAI推出CriticGPT模型

7月5日WAIC低空经济领域重要会议！蓝鲸新闻主办“AI+未来出行”开放报名！

世界首份！嫦娥六号带回1935.3克月背样品

猜你喜欢

DeepSeek成GDC开幕式关键词，2025年或是智能体元年

上海副市长陈杰：加快推动人工智能垂直领域的规模化应用 聚焦智能终端、自动驾驶等场景

美联储副主席杰斐逊：人工智能工具可能有助于货币政策的传导

全国首个算力生态平台“模速空间算力生态超市”正式揭幕

借助AI创作了首诗《重塑全球格局，还看中国AI》

中国银河给予传媒互联网行业推荐评级：创新突围、星火燎原

市场消息：万亿巨头AI乱斗临近 微软准备迎接GPT-4.5、GPT-5上线

曾错过梁文锋投资，又借DeepSeek大火 硅基流动融资背后：给大模型开发者“递铲子”，是好生意吗？

阿里巴巴吴泳铭：如果实现AGI 有可能影响或者替代现在50%左右的GDP构成

机器人持续进化，机器人ETF易方达（159530）等产品助力便捷布局产业发展机遇

科大讯飞：DeepSeek大模型已上线讯飞开放平台

李强：加快人工智能技术推广，释放人工智能终端产品等消费潜力

最新文章

美国太空探索技术公司：正与波兰政府合作寻找“猎鹰9”火箭残骸

标签

关注我们 么么哒！

关注我们的公众号

上海副市长陈杰：加快推动人工智能垂直领域的规模化应用聚焦智能终端、自动驾驶等场景

市场消息：万亿巨头AI乱斗临近微软准备迎接GPT-4.5、GPT-5上线

曾错过梁文锋投资，又借DeepSeek大火硅基流动融资背后：给大模型开发者“递铲子”，是好生意吗？

关注我们么么哒！