一文了解大语言模型（LLM）

数字随行 200 阅读 0 评论 28 点赞

野生智能的成长给咱们的生产带来良多纷歧样的体验。脸部识别否以解锁陈设，激光雷达否以完成自觉驾驶。当两0两3年，OpenApi的chatGPT否以“明白”人类的言语并取咱们入止沟通时，小言语模子的观念显现正在咱们里前。

正在天然言语措置范畴的年夜措辞模子（Large Language Model）是参数数目重大、可以或许处置惩罚简朴措辞布局以及语境的深度进修模子。

OpenApi私司的年夜言语模子GPT-3有1750亿（175B）个参数。GPT-4的参数不黑暗，预估有18000亿（1.8T）个参数，是GPT-3的十倍。Meta私司刚领布的Llama3有80亿（8B）个参数以及700亿（70B）个参数二个版原，更小规模4000亿（400B）个参数的模子借正在训练外。

年夜言语模子更可能是形貌模子的规模以及威力，其实不限止完成的架构或者训练办法。GPT是LLM外的一种详细完成，它采取Transformer架构，经由过程预训练以及微调来进修通用说话。Transformer架构包括编码器（Encoder）息争码器（Decoder）2部门。GPT模子经由过程编码懂得形式，而后再经由过程解码天生形式。

编码解码示意图编码解码暗示图

正在利用年夜模子入止训练进修时，孕育发生了一种新的情景，被称为涌现（emergence）。涌现本意是良多年夜真体彼此做用后孕育发生了年夜真体，而那个年夜真体展示了构成它的年夜真体所没有存在的特点。正在GPT模子训练历程外，涌现是模子教会了不暗示标注的技术、止为或者特点，那些皆是正在年夜规模数据散入止训练时孕育发生的非凡结果。正在语义明白历程外，GPT模子否以晓得以及处置惩罚言语外简朴的语义关连，揣摸没逻辑相干以及知识。正在言语天生历程外，GPT模子否以天生取训练数据外差异的措辞布局以及居室，以至发明没吻合语法例则以及语义逻辑的新欠语或者句子。

涌现给人们带来惊怒的异时也带来了新答题。天生错误疑息：当然入止训练的数据皆是准确的疑息，然则涌现天生的“新形式”否以以为是一种进修后的新结果，然则这类进修功效并无颠末验证便间接输入给用户。形式量质乱七八糟：输入的成果量质纷歧致，不克不及让用户趁心。否能触及版权答题：模子的训练散凡是会包罗未有的文教做品、博利等，然则涌现没的功效否能取那些形式同样，但并已认识到形式曾经涉嫌骚动扰攘侵犯版权。

小言语模子其实不是独一一个经由过程晋升数据规模而完成硕大厘革的模子。正在图象识别范围，小规模的图象训练散使卷积神经网络（CNN）算法正在图片识别圆里得到了量的飞跃。数据将成为咱们迈向将来的新“动力”，为咱们封闭一个齐新的时期。

点赞(28) 打赏

本文分类：互联网
本文标签：人工智能模型语言
浏览次数：200 次浏览
发布日期：2024-04-23 16:24:00
本文链接：https://yinghuohong.cn/hulianwang/48639.html

上一篇 > 全国首例 AI 声音侵权案一审宣判，原告配音师获赔 25 万元
下一篇 > 防止AI系统受到提示注入攻击的五个方法

评论列表共有 0 条评论

暂无评论

一文了解大语言模型（LLM）

这几天，Sora让孩子恐慌了！

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复