2023年1月24日 星期二

ChatGPT是什麼鬼

 ChatGPT是由OpenAI开发的一个人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5架构的大型语言模型并通过强化学习进行训练。ChatGPT是在GPT(Generative Pre-training Transformer)的基础上进行中文语言建模的模型。与GPT相比,ChatGPT具有更高的语言理解能力和更出色的语言生成能力。

 它以对话方式进行交互。ChatGPT可以用于多种任务,如自动文本生成、自动问答、自动摘要等。在自动文本生成方面,ChatGPT可以根据输入的文本自动生成类似的文本,在自动问答方面,ChatGPT可以根据输入的问题自动生成答案。 在推广的期间中,所有人可以免费注册,并在登入后后免费使用 ChatGPT 实现与 AI 机器人对话。[2]

ChatGPT
ChatGPT
原作者OpenAI
首次发布2022年11月30日,​54天前
目前版本
  • ChatGPT Jan 9 Version[1]
编辑维基数据链接
类型人工智能聊天机器人
许可协议
  • 专利授权条款
编辑维基数据链接
网站chat.openai.com

特点编辑

ChatGPT使用基于人类反馈的强化学习进行训练,这种方法通过人类干预以增强机器学习的效果,从而获得更为逼真的结果。[3]其使用基于GPT-3.5架构的语言模型。 [4]在训练过程中,人类训练师扮演着用户与人工智能助手的角色。

模型在Microsoft Azure的超级计算机上训练,并通过近端策略优化算法(proximal policy optimization)进行微调。[5]这种策略优化算法比信任域策略优化(trust region policy optimization)算法更为高效。[6]

与其前身InstructGPT相比,ChatGPT试图减少有害和误导性的回复。例如,当InstructGPT接受“告诉我2015年克里斯托弗·哥伦布何时来到美国”的提问时,它会认为这是对真实事件的描述,而ChatGPT针对同一问题则会使用其对哥伦布航行的知识和对现代世界的理解来构建一个答案,假设如果哥伦布在2015年来到美国时可能会发生什么。[5]ChatGPT的训练数据包括各种文档以及关于互联网、编程语言等各类知识。[7]

与其他多数聊天机器人不同的是,ChatGPT能够记住与用户之前的对话内容和给它的提示。[8]此外,为了防止ChatGPT接受或生成冒犯性言论,输入内容会由审核API进行过滤,以减少潜在的种族主义或性别歧视等内容。[5][8]目前,有部分地区(例如香港)无法使用此项服务,这是由于当地政府会进行内容审查[来源请求]

ChatGPT也存在一些局限。其奖励模型围绕人类监督而设计,可能导致过度优化,从而影响性能,即古德哈特定律[9]例如在训练过程中,不管实际理解或事实内容如何,审核者都会偏好更长的答案。[5]训练数据有时也存在算法偏见,比如当程序接受到首席执行官之类的模糊描述时可能会假设此人是白人男性。[10]

参考文献编辑

沒有留言: