ChatGPT 是当今世界上知名度最高的聊天机器人之一。 作为一个一直在积极阅读 SEO 和人工智能 (AI) 爱好者的推文的人,ChatGPT 是我每次打开 Twitter 时都会看到的一个名字。
什么是聊天 GPT?
ChatGPT 是 Open.AI 利用机器学习技术构建的聊天机器人,被称为“Generative Pre-trained Transformer 3 (GPT-3)”。 如果这是您第一次听到它——GPT-3 是一种大型语言模型 (LLM)。 它使用机器学习来生成难以与人类书写的文本区分开来的自然语言文本。
繁荣! 一个段落中有很多行话。
要记住的三个名字
术语“大型语言模型“,或 LLM,指的是一种机器学习模型,它在人类语言数据的大型数据集上进行训练,能够生成听起来自然的文本。
生成式预训练 Transformer 3,或 GPT-3,是一个特定的 LLM,由一家名为 OpenAI 的公司开发,在翻译和文本摘要等广泛的语言任务上取得了令人瞩目的成果。
ChatGPT 是 GPT-3 语言模型的变体,专门设计用于在聊天机器人上下文中生成类似人类的文本。
所以,想想:
- LLM 作为帮助机器人读写人类语言的技术
- GPT-3 是一种由私人公司 (OpenAI) 开发的 LLM
- ChatGPT 是使用 GPT-3 在实时聊天中与人类互动的机器人
为什么 ChatGPT 很特别?
ChatGPT 与其他语言模型(有很多!稍后会详细介绍)的区别在于它能够在对话的多个回合中保持上下文。 当您与机器人聊天时,它具有“记忆”并且可以生成与正在讨论的主题相关的类似人类的响应,并且这些响应建立在用户或聊天机器人本身先前所做的陈述之上。
但这还不是全部——该工具不仅可以进行对话,还可以做更多的事情。 它还能够执行范围广泛的语言任务,例如翻译、摘要、编码(是的, 编程 语言也是人类语言),甚至写诗。
ChatGPT 能为您做什么?
从产生想法和内容到提供研究和支持——ChatGPT 是可以帮助个人和组织的宝贵资源 提高生产率 和效率。 无论您是业余博客作者、律师、学校教师,甚至是公司 CEO – ChatGPT 都可以对您的工作产生重大影响。
以下是您可以外包给 ChatGPT 的一些具体任务。
对于博主
- 为您的下一篇博文产生想法并撰写草稿
- 研究和核查博客内容
- 将内容(即评论、开发时间表)转换为表格或项目符号列表
为律师
- 起草法律文件和合同
- 为非专业人士总结复杂的法律概念
- 组织和管理法律文件和案件档案
对于学校教师
- 开发文件sson 计划和教材
- 创建评估和测验
- 为不同水平的学生生成不同的脚本
对于程序员
- 生成代码片段和调试编码错误
- 用书面语言解释您的代码
- 在不同编程语言之间切换函数
对于音乐家
- 生成歌曲创意和旋律
- 写歌词
- 研究并了解最新的行业趋势和技术
对于公司首席执行官
- 组织和管理公司项目和任务
- 总结商业新闻、员工报告和演示文稿
- 与团队成员和其他利益相关者协作(写电子邮件、发短信等)
可用于 ChatGPT 的提示
我主要将 ChatGPT 用作我的教育者和写作助手。 以下是我在工作中经常使用的一些提示。 Fatih Kadir Akın 在 提示.chat 和 这本免费电子书 – 请务必查看是否需要更多。
ChatGPT 并不孤单
虽然 GPT-3 功能强大且广受欢迎,但市场上还有许多其他大型语言模型(见下表)。
大多数这些 LLM 都具有自己独特的能力,并在各种语言任务上取得了很好的成绩。 语言翻译、情感分析和问答是 LLM 工具执行的一些常见语言工作。
市场上其他著名的法学硕士
型号 | 描述 | 规格 | 主要特点 |
---|---|---|---|
LLM | OpenAI开发的长格式语言模型 | 比 GPT-3 更小更简单 | 专注于在特定领域或主题内生成连贯的文本 |
BERT | 谷歌开发的预训练语言模型 | 中等 | 可以针对各种自然语言处理任务进行微调 |
XL网 | 由谷歌和卡内基梅隆大学开发的预训练语言模型 | 大号 | 使用一种称为“排列语言建模”的新颖方法在广泛的任务中取得出色的成绩 |
罗伯塔 | Facebook AI 开发的预训练语言模型 | 大号 | 在更大的数据集上训练的 BERT 变体,并对训练过程进行了一些修改 |
伟业 | 谷歌开发的预训练语言模型 | 中等 | BERT 的轻量级版本,使用技术来减小尺寸和计算要求 |
艾莫 | 艾伦人工智能研究所开发的预训练语言模型 | 大号 | 使用能够从周围文本中捕获含义的深层上下文化单词表示 |
T5 | 谷歌开发的预训练语言模型 | 大号 | 无需特定任务培训即可执行各种自然语言处理任务 |
CTRL | OpenAI 开发的预训练语言模型 | 大号 | 使用一种称为“条件转换器”的新颖方法来生成类似人类的文本 |
变压器-XL | 谷歌开发的预训练语言模型 | 大号 | 使用一种称为“相对位置编码”的新颖方法来模拟文本中的远程依赖关系 |
法学硕士不懂
虽然像 ChatGPT 这样的 LLM 非常擅长生成类似人类的文本, 他们对该主题没有真正的理解、意见或信念 (* 见下面的旁注) 他们正在以与人相同的方式进行讨论。
相反,LLM 能够通过使用机器学习算法分析大量人类语言数据并学习数据中存在的模式和关系来生成文本。 一旦学习了这些模式,LLM 就会使用它们生成与训练数据中的文本相似的新文本。
换句话说,法学硕士并不聪明。 他们只是非常擅长猜测在他们的“作品”中使用的正确词语。
法学硕士(尤其是 ChatGPT)非常擅长猜测
法学硕士所做的是分析他们过去“阅读”过的任何文本,并猜测接下来要写的最佳单词是什么。
例如,为了确定下一个单词来完成像“Wayne Rooney has dribbled pass…”这样的句子,ChatGPT,我目前使用的 LLM,会分析它所训练的语言数据中的模式和关系,以确定单词和在这种情况下最有可能出现的短语。
该模型可能已经从其训练数据中了解到,“过去”、“周围”或“通过”等词通常用于短语“运球传球”之后。 然后它可以使用此信息生成一个新句子,内容如下:
- “韦恩·鲁尼运球过掉了防守者”,或者
- “韦恩鲁尼绕过防守队员”,或者
- “韦恩·鲁尼运球突破了防守者。”
句子只是单词串
这是进一步展示 ChatGPT 预测功能的另一个示例。 以下片段摘自 珀西·杰克逊与闪电窃贼(第 1 册)第一章 作者 Rick Riordan(我儿子最喜欢的小说)。
"Being a half-blood is dangerous. It's scary. Most of the time, it gets you killed in painful, nasty ways."
我要求 ChatGPT 完成该段落。 这是 ChatGPT 给我的两个变体:
版本#1
"But I've always known that I was different. I've always known that I was a target. That's why I've trained myself to be strong. That's why I've learned how to defend myself. I won't let anyone hurt me. I won't let anyone take away the person I am."
版本#2
"I've tried to stay hidden, to keep a low profile. But it's not easy. There are always people watching, waiting for me to slip up. I can't let them catch me. I can't let them hurt me or my family."
在这两个例子中,接下来的三句话继续探讨混血的主题以及随之而来的危险和挑战。
第一个选项侧重于叙述者自己的坚强和自卫的努力,而第二个选项侧重于叙述者隐藏和避免被发现的努力。 这两种选择都建立在混血是危险的并且可能导致伤害的想法之上,但是他们从不同的角度和基调来探讨这个主题。
令人印象深刻,对吗?
法学硕士的缺点和问题
与任何机器学习模型一样,ChatGPT 并不光鲜亮丽。 以下是 ChatGPT 可能出现的一些问题示例:
1.训练数据的偏差
与大多数机器学习模型一样,ChatGPT 在大型数据集上进行训练。 它可能包含数据中存在的偏差。 猴子看,猴子做。 如果训练数据包含由特定人群编写的示例数量不成比例,ChatGPT 可能会生成偏向该人群的文本。
阅读梅丽莎的文章 病毒式人工智能化身应用程序 Lensa 在未经我同意的情况下脱了我的衣服. 与 ChatGPT 无关,但它演示了 AI 可能出现的问题
2.难以理解上下文
ChatGPT 旨在根据输入文本的上下文和含义生成响应。 但是,它有时可能难以理解特定提示或对话的上下文,这可能导致不准确或无意义的响应。
3.处理开放式任务的能力有限
ChatGPT 旨在生成对特定提示或问题的响应。 它可能难以处理开放式任务或未明确定义所需响应的情况。
4.处理不常见或特定领域语言的能力有限
ChatGPT 针对范围广泛的文本进行了训练,但它可能难以理解或生成不常见或特定领域的语言。 如果您将 ChatGPT 用于需要深入了解特定领域或主题的任务,这可能会成为一个问题。
总的来说,ChatGPT 是一个强大而有用的工具,但它并非没有局限性。 在使用 ChatGPT 时牢记这些限制并仔细考虑模型对特定任务的适用性非常重要。
总结
也许 ChatGPT 风靡全球的最大原因是因为它的简单性。 不要相信我的话—— 您可以在这里免费试用. 您不必成为技术向导 – 只需输入几句话,看看它是否发挥其魔力。 在将它发送给你的老板、你的祖母或总统之前,一定要仔细检查它的输出。
和往常一样,请记住:强大的语言建模能力伴随着巨大的责任(希望在此过程中有一些笑声)。
补充笔记
GPT-3的发展
GPT-3的发展可以追溯到最初的研究论文《通过生成式预训练提高语言理解”,由 Alec Radford 及其同事撰写,并于 2018 年 XNUMX 月在 OpenAI 网站上以预印本形式发布。
2019 年 2 月,OpenAI 发布了 GPT-2,这是对原始 GPT 模型的重大改进。 GPT-8 在超过 1.5 亿个网页的数据集上进行了训练,并且具有更大的尺寸(XNUMX 万亿个参数)。
2020 年 3 月,OpenAI 发布了 GPT-3,它是 GPT 模型的更大、更强大的版本。 GPT-175 在数十亿网页的数据集上进行训练,参数大小为 XNUMX 亿,使其成为有史以来最大的语言模型之一。 它能够执行广泛的语言任务,包括翻译、摘要和问答,并且能够生成类似人类的文本 难以与人写的文字区分开来.
关于 Open.AI 公司
OpenAI 是一个位于加利福尼亚州旧金山的研究实验室。 该公司致力于以负责任和安全的方式推进人工智能。 它成立于 2015 年,由科技行业知名人士资助,包括 微软, 伊隆麝香和 彼得·泰尔.
原文链接:https://www.itaoda.cn/blog/1381.html,转载请注明出处。
评论0