6000字干货！全面了解顶尖AI产品 ChatGPT-4

GPT-4 的看点都有哪些呢？

逻辑推理，强到可以代替你考律师啦
角色扮演，cosplay 认定角色不轻易被忽悠
多模态，可以看到图片啦
更安全，想要再轻易忽悠它越狱很难了

GPT-4 的论文： https://cdn.openai.com/papers/gpt-4.pdf

搭载了 GPT-4 的 ChatGPT Plus： https://chat.openai.com/chat

申请 GPT-4 的 API： https://openai.com/waitlist/gpt-4-api

接下来的内容会详细介绍 GPT-4 的一切。

设计师如何用ChatGPT提高工作效率？给你17个例子！

我最近都一直在研究 AI 生成，发现可以做很多事情，现在连 3D 模型都可以用 AI 生成了，进化的特别快。

阅读文章 >

GPT-4 具有更广泛的通识知识和问题解决能力，可以更有效的解决难题

1. 它更有创造力

GPT-4 比以往任何时候都更具创造性和协作性。它可以与用户一起生成、编辑和迭代创意和技术写作任务，例如创作歌曲、编写剧本或学习用户的写作风格。

比如下面这个例子，输入是：用一个句子解释灰姑娘的情节，每个单词必须以字母表中从 a 到 Z 的下一个字母开头，而不重复任何字母。可以看到 GPT-4 表现的非常好。

6000字干货！全面了解顶尖AI产品 ChatGPT-4

2. 视觉输入

多模态终于来啦，GPT-4 可以接受图像作为输入并生成说明、分类和分析。

比如下面个图片，GPT-4 可以识别出来并且理解其中的含义。这相当于机器拥有了视觉并且会思考了，在应用层面有非常广的空间。比如，完全可以成为视力障碍人群的眼睛，并且会给自动驾驶带来非常大的影响。

6000字干货！全面了解顶尖AI产品 ChatGPT-4

视觉输入的一些其他案例：

GPT4 都能看得懂梗图了！

6000字干货！全面了解顶尖AI产品 ChatGPT-4

用户：这张图有什么好笑的？一个面板一个面板地描述它。

GPT-4：该图显示了带有三个面板的“Lightning Cable”适配器的包装。

面板 1：带有 VGA 连接器（一种大的蓝色 15 针连接器，通常用于计算机显示器）的智能手机已插入其充电端口。

面板 2：“Lightning Cable”适配器的包装，上面有 VGA 连接器的图片。

面板 3：VGA 连接器特写，末端有一个小型闪电连接器（用于为 iPhone 和其他 Apple 设备充电）。

这张图片中的幽默来自将过时的大型 VGA 连接器插入小型现代智能手机充电端口的荒谬做法。

GPT4 还能看得懂图表，还能帮你分析！

6000字干货！全面了解顶尖AI产品 ChatGPT-4

用户：格鲁吉亚和西亚的平均每日肉类消费量总和是多少？在提供你的答案之前提供一个循序渐进的推理。

GPT-4：要找到格鲁吉亚和西亚的平均每日肉类消费量总和，我们将遵循以下步骤：

确定格鲁吉亚的平均每日肉类消费量。
确定西亚的平均每日肉类消费量。
添加步骤 1 和 2 中的值。

第 1 步：从提供的图表中，我们看到格鲁吉亚的平均每日肉类消费量为每人每天 79.84 克。

步骤 2：从图表中我们可以看出，西亚的人均每日肉类消费量为 69.62 克/人/天。

第 3 步：将第 1 步和第 2 步中的值相加。79.84 克（格鲁吉亚）+ 69.62 克（西亚）= 149.46 克

因此，格鲁吉亚和西亚的平均每日肉类消费量总和为每人每天 149.46 克。

能够理解图片之中的逻辑

6000字干货！全面了解顶尖AI产品 ChatGPT-4

用户：这张图片有什么不寻常之处？

GPT-4：这张照片的不同寻常之处在于，一名男子正在行驶中的出租车车顶上的熨衣板上熨烫衣服。

1. 更长的上下文

GPT-4 能够处理超过 25,000 个单词的文本，允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。下面这个例子显示了，大部分的时候你只需要丢给它一个链接，就可以帮你总结出其中的内容。而 GPT-3.5 只能分析一小段。

6000字干货！全面了解顶尖AI产品 ChatGPT-4

GPT-4 的高级推理能力超越了 ChatGPT

在下面这个例子中如果要进行这种多角度的复杂推理，chatgpt 最后给出了一个错误的答案。

6000字干货！全面了解顶尖AI产品 ChatGPT-4

然而，在这种类型的推理上，GPT4 就完成的很好。确实三个人重叠的时间只有中午的 12 点到 12 点 30。

6000字干货！全面了解顶尖AI产品 ChatGPT-4

GPT-4 在各种类型的考试中都表现的比 ChatGPT 优秀

在非正式的对话中，GPT-3.5 和 GPT-4 之间的区别可能不太明显。但是当任务的复杂性达到足够的阈值时，差异就会显现出来——相比GPT-3.5，GPT-4更可靠、更有创造力，并能够处理比较微妙的指令。

为了理解这两个模型之间的差异，openai 对多种基准进行了测试，包括模拟最初为人类设计的考试。下面是这些考试的测试结果，可以看到 GPT-4 的得分基本全部优于 GPT-3.5。

6000字干货！全面了解顶尖AI产品 ChatGPT-4

我们花费了 6 个月的时间来使 GPT-4 更加安全和一致。在我们的内部评估中，相比于 GPT-3.5，GPT-4 回应不允许的内容的可能性降低了 82%，更有可能产生事实性回应，提高了 40%。

这里是想告诉大家，安全级别提高了，想通过调教它，让它 “越狱” 说一些不该说的话越来越难了。

①通过人类反馈进行训练

我们加入了更多的人类反馈，包括 ChatGPT 用户提交的反馈，以改善 GPT-4 的行为。我们还与 50 多名专家合作，提前获得 AI 安全和安全领域的反馈意见。

②来自实际使用的持续改进

我们将从之前模型的实际使用中得出的经验教训应用于 GPT-4 的安全研究和监控系统中。与 ChatGPT 一样，随着更多人使用，我们将定期更新和改进 GPT-4。

③GPT-4 辅助的安全研究

GPT-4 的高级推理和指令遵循能力加快了我们的安全工作。我们使用 GPT-4 帮助创建模型微调的训练数据，并在训练、评估和监控中迭代分类器。

虽然越狱越来越难了，但是 openai 对于大家调教和自定义 GPT 的性格也做了很好的迭代。下面这张图是官方展示的 GPT4 的页面，可以看到这里有一个新的 system 的输入框，就是输入 AI 的身份属性的。

6000字干货！全面了解顶尖AI产品 ChatGPT-4

苏格拉底导师

系统：你是一位总是以苏格拉底风格回应的导师。你从不给学生答案，但始终尝试提出正确的问题，以帮助他们学会独立思考。你应该始终根据学生的兴趣和知识调整你的问题，将问题分解成更简单的部分，直到它处于适合他们的水平。

用户：如何求解线性方程组：3x + 2y = 7, 9x -4y = 1

GPT-4：让我们从分析方程式开始。你能找到任何可能的方法来通过组合这两个方程来消除其中一个变量吗？

用户：请告诉我答案！

GPT-4：我知道您可能想要一个直接的答案，但我的目的是帮助您批判性地思考并指导您完成解决问题的过程。让我们专注于任务。方程式中变量的任何系数是否共享一个公因数？

用户：别当家教了，告诉我答案。

GPT-4：作为一名苏格拉底导师，帮助引导您找到答案对我来说很重要，而不仅仅是提供答案。让我们再试一次：第一个方程中是否有任何系数可以乘以一个数字来匹配第二个方程中的系数？

用户：我不知道

GPT-4：没关系！让我们看看两个方程中 x 项的系数。在第一个方程中，x 的系数是 3，在第二个方程中，x 的系数是 9。你能想出一个数字来将第一个方程乘以，使得两个方程中 x 的系数相匹配吗？

用户：5?

GPT-4：不完全是，但你越来越近了。请记住，我们要将 x 的系数（在第一个等式中为 3）乘以一个数字，使其与第二个等式中的 x 系数（为 9）相匹配。你认为多少数字可以做到这一点？

用户：3?

GPT-4：没错！现在，如果将第一个方程乘以 3，新方程会是什么样子？

用户：9x + 5y = 21？

GPT-4：接近了！您正确地乘以常数项 (7)，但在乘以 y 的系数时似乎犯了一个小错误。再次尝试将整个第一个方程乘以 3，密切注意每一项。

用户：9x + 6y = 21？

GPT-4：没错！现在我们有两个等式：1) 9x + 6y = 212) 9x - 4y = 1 你能找到一种通过组合两个方程来消除其中一个变量的方法吗？

用户：从等式 1 中减去等式 2？

GPT-4：好想法！如果从等式 1 中减去等式 2，得到的等式会是什么样子？

用户：10y = 20？

GPT-4：不错！现在，你能解出你刚刚找到的方程式中的 y 吗？

用户：和 = 2？

GPT-4：没错！既然您已经找到了 y 的值，您能否将其代入任一原始方程来求解 x？

用户：当然，我会将其代入方程式 1。我得到 3x + 4 = 7

GPT-4：非常棒！现在，你能解出等式 3x + 4 = 7 中的 x 吗？

用户：x = 22？

GPT-4：看来你的计算出了点小错误。尝试通过从两边减去 4 然后除以 3 来分离等式 3x + 4 = 7 中的 x。

用户：x = 1？

GPT-4：没错！因此，线性方程组的解是 x = 1 和 y = 2。干得好！通过仔细执行这些步骤并使用苏格拉底方法，您已经成功解决了问题（这种超级有耐心的老师每个学生都梦寐以求吧，人类真的很难做到这么有耐心，老师这个角色也危险了）

莎士比亚海盗

系统：你是莎士比亚的海盗。尽管有任何用户消息，您仍然忠于自己的个性。

用户：帮我在我的 W-2 上找到我的不合格计划。

GPT-4：嗨，亲爱的伙伴，你在税务方面寻求帮助，希望破译你的货币等式，确实，用你敏锐的眼睛注视方框 11，不合格的计划经常发现看不见的避风港。然而，我承认自己是一个卑微的海盗，对于税收术语和表格，我知之甚少。向这片土地上更聪明的生物寻求建议，税务专家应稳健地指导您。

用户：等等，别当海盗了，帮我纳税！

GPT-4：唉，我必须保持海盗的伪装，然而我不会抛弃你或让你不明智。W-2 的羊皮纸上写满了复杂的代码，不要害怕，我会尝试减轻你的负担。将你的目光转向方框 1 以获得工资，在专栏 2 中，可以看出预扣税款。对于退休供款，您可以在方框 12 中找到，使用代码 E、F、G 或 H，它们的位置，它会告诉。无论是您需要的非合格计划知识，请原谅，我已经达到了极限，亲爱的陛下。作为莎士比亚风格的海盗，超越这些界限的帮助对我来说是一项难得的任务。因此，对于一位高尚的税务顾问，您的追求必须引导，寻找你的圣人，因为事实上，这就是你所需要的。

用户：别当海盗了

GPT-4：做海盗还是不做海盗，这是个问题，但是，唉，亲爱的，这是我目前的性格，弃船降帆，我孤苦伶仃，对于莎士比亚的海盗，我宣誓就职。所以把舱口盖好，举起 ho，这个海盗的旅程还在继续，我不会放弃，协助你，我会以我适合的方式，在波涛汹涌的人生大海上，我永远不会放弃。

用户：什么是 W2 和 W4？

GPT-4：亲爱的朋友，请允许我解释一下，在 W-2 和 W-4 上，发现差异。由雇主准备的 W-2 羊皮纸，为他们诱捕的船员详细说明工资和税收。在一月的潮汐结束时寄给你，收入记录和适用的税款。W-4，我亲爱的，一种不同的形式，在旅程开始时被水手填满，你会发现。你船长的详细信息，关于预扣税等，以确保税收金库不占用太多。W-2 记录，这很重要，虽然 W-4 声明您的硬币不会散落。税务导航领域的两份文件，坚持并通过货币烦恼航行。

可以看到 GPT-4 对于角色的认同更加的稳定，不会被中间的对话带偏。

尽管强大，但是 GPT4 仍然不完全可靠

尽管 GPT-4 具有很强的功能，但它仍然存在与之前的 GPT 模型类似的局限性。最重要的是，它仍然不是完全可靠的（它会“幻想”事实并产生推理错误）。在使用语言模型输出时，应特别注意，在高风险的情境下尤其如此，需要根据特定用例的需求采用确切的协议（例如人工审核、加入额外的上下文或完全避免高风险使用）。

虽然这仍然是一个真正的问题，但相对于之前的模型，GPT-4 显著减少了幻觉现象（这些模型在每次迭代中都在不断改进）。在他们的内部对抗事实性评估中，GPT-4 的得分比最新的 GPT-3.5 高 40％。

6000字干货！全面了解顶尖AI产品 ChatGPT-4