cha

OpenAI 推出 GPT-4 大型语言模型:在诸多测试中比人类表现更好

  IT之家3月15日消息,Open-AI 刚刚公布了其大型语言模型的最新版本 ——GPT-4(API 候补申请点此)。

  GPT-4可以更准确地解决你的难题,GPT-4还可以生成、编辑具有创意性或技术性的文章,在高级推理方面的表现远远超过了其前辈(当前公开版ChatGPT 基于 GPT-3.5)。此外,正如大家所猜测的那样,微软 NewBing 的聊天功能确实基于GPT-4。

  此外,该公司正在与合作伙伴 Be My Eyes 一起测试 GPT-4的图像输入能力(注:Be My Eyes 是一款即将推出的智能手机 App,可以识别场景并对其进行描述,类似于大家常见的 AI 识图的加强版)。

  除了介绍网站,OpenAI 还提供了描述 GPT-4功能的技术性论文,以及详细描述其局限性的系统模型 Card。

  OpenAI 计划通过 ChatGPT 及其商业 API 为用户提供 GPT-4的文本功能支持,但目前还需要等待。IT之家这里需要提醒一下,GPT4目前仅 ChatGPT plus 账号可用,可选 GPT4模式进行对话,每4小时限制发送100条消息。

  据介绍,GPT-4比以前的版本“更大”,这意味着它已经借助比前辈更多的数据进行了训练,并且在模型文件中有更多的权重,从而使得它的运行成本更高。

  就任务而言,GPT-4的表现比前辈更好,它可以遵循自然语言的复杂指令并生成技术或创意内容,而且它可以还更深入地做到这一点:它支持生成和处理多达32768个标记(约25000个文本单词),从而实现比前辈更长的内容创建或文本分析。

  OpenAI 表示,GPT-4错误答案更少,而且也会减少偏离话题的可能,也尽可能不会再谈论禁忌话题,甚至在许多标准化测试中比人类表现得都要更好一些。

  例如,GPT-4在模拟律师考试的成绩在考生中排名前10% 左右,在 SAT 阅读考试中排名前7% 左右,在 SAT 数学考试中排名前11% 左右。相比之下,GPT-3.5在律师考试中的得分一般都是倒数10% 左右。


您可能还会对下面的文章感兴趣:

登录 注册 退出