
OpenAI GPT-4 发布会速记:代码生成、图像描述与复杂推理...
TechFlow Selected 深潮精选

OpenAI GPT-4 发布会速记:代码生成、图像描述与复杂推理...
本文将描述GPT-4 的亮点,以及如何真正充分利用它。
在过去的两年里我们一直专注于交付 GPT-4,首先是重建我们的整个训练堆栈,实际训练模型,然后看看它能做什么,试图找出它的能力和风险并与合作伙伴合作,以便在真实世界的场景中测试它,真正调整它的行为,优化模型使其可用。
一、文本的总结和加工
所以今天我们将向大家展示 GPT-4 的亮点,如何真正充分利用它,把它作为一个好工具和 好伙伴。我首先展示第一个任务。
GPT-4 可以做到但 3.5 没有做到。复制我们 Blog 文章的部分内容,并粘贴到交互界面上(如下图),GPT-3.5 和 GPT-4 具有相同的 API 接口和交互界面,你向模型解释应该做什么。我们把这些模型做得非常容易控制,所以你可以给它提供任何你想要的指令,无论你想要什么。模型将很好地遵守它。在未来,它将在非常可靠地操纵模型方面变得越来越强大,模型将作为助手返回消息。

第一个任务是文章的总结,这是一篇文章变成一个句子,但每个单词都以 G 开头,GPT-3.5 甚 至没有尝试,就放弃了任务(对于 GPT-3.5 如果是非常生硬的文章,也许可以成功)。而 GPT-4 能够很好的完成这个任务。

By GPT-3.5

By GPT-4
因此,我展示了对现有文章的总结,GPT-4 也可以在不同的文章之间灵活地总结归纳共同点,我把昨天新闻上的文章复制到同一个对话中。这是一篇关于 PyneCone 的文章,PyneCone 是一 个 Python Web 应用程序开发框架,GPT-4 会怎么进行总结?“两者都专注于使技术更易于访 问,用户更友好”。如果我们这不够深刻,模型可以随时给出一些反馈。

我现在要求把 GPT-4 博客文章内容变得押韵一些,结果是这样:

二、代码生成
我们有一个开源评估框架(Eval),它将帮助我们进行指导,所有用户可以了解模型功能并将 其提升到一个新的水平。接下来向您展示如何使用 GPT 4 进行构建(代码生成),我们要做的是构建一个 Discord 机器人,我将实时构建它,并展示流程和调试。它的工作是先用伪代码把 东西写出来,然后再实际写代码。这种方法非常有助于将问题分解成更小的部分。这样就不会要求它一次就想出一个超级难的解决方案。这也使得它非常容易理解。(这里有一个问题,这个模型的训练截止到 2021 年,这会导致 GPT-4 智能生成代码时不清楚有什么新的接口和模块,但我们可以通过指令进行调整)

需要注意的一点是,随着时间的推移,Discord API 已经发生了很大的变化,特别是有一个功能在该模型经过训练后发生了很大的变化,GPT-4 不知道使用的是哪个版本的 Discord API。
让我们再试一次,确保我们理解代码在做什么。
现在出现第二个问题,是它不知道我在什么环境中运行。你可以对模型说,我正在使用 Jupyter,我想让它工作修好它,这也没有问题。

三、图像描述
GPT-4 不仅仅是一个语言模型,也是一个视觉模型。事实上,它可以灵活地接受任意图像和文 本的输入,就像文档一样。你可以问任何你喜欢的问题,能详细地描述一下这个图像吗?模型能够抓住这个系统的很多不同部分,进行详细的描述(我们必须做的一件事是我们必须让系统 更快,这是我们正在努力优化的事情之一)。接下来我们将接受观众的请求。这是一个 Discord 应用程序界面的屏幕截图,可以看到 GPT-4 非常详细地描述了界面,谈到所有的对话 内容和时间,观众的发言顺序,并描述了许多通知消息和渠道中的用户。

GPT-4 的一个新特点是上下文长度,32,000 个 tokens 是我们目前支持的上限。该模型能够灵 活地使用长文档,这也是我们仍在优化的东西。如果你真的对长文感兴趣,请告诉我们。我们想看看它能解锁什么样的应用程序。
四、图像-文本-网页生成
我再给你们看一个例子,这里有一个很好的手绘的笑话网站模型。我们尝试让 GPT-4 去自动生 成网站的原型图。GPT-4 实现从图片中提取文字信息并输出到 HTML,我们自己仍在寻找新的方 法来使用它,并将与合作伙伴合作。我们将从那里开始扩展,但请耐心等待,因为我们需要一 些时间才能真正让每个人都能使用它。


五、复杂推理(税务)
GPT 不是税务专业人士,但理解一些密集的内容是很有帮助的,能够辅助解决问题,并在你无 法解决的时候处理事情。现在我告诉它,它是税收 GPT,我贴上了大约 16 页的税法。还有一个关于 Alice 和 Bob 的问题。他们曾经结过婚,这是他们的收入,他们在联合申请。那么第一 个问题,2018 年他们的标准扣除额是多少?


模型快速得到了标准答案,并且可以阅读它的解释。通过要求模型详细说明其推理,我们没有 读过税法,现在也明白这是怎么回事。现在计算他们的总负债,这个模型在心算方面做得很 好,GPT-4 拥有许多非常灵活的原始功能,你们可以在此基础上尝试各种可以增强这些系统的方法。
欢迎加入深潮TechFlow官方社群
Telegram订阅群:https://t.me/TechFlowDaily
Twitter官方账号:https://x.com/TechFlowPost
Twitter英文账号:https://x.com/BlockFlow_News















