自从OpenAI公司研发的机器人聊天程序ChatGPT在2022年11月30日发布以来,在全世界迅速带起了热潮。ChatGPT是AI大模型驱动的自然语言处理工具,能够基于在预训练阶段所见的模式和统计规律,来生成回答,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。
目前,ChatGPT背后的大模型及其应用已成为AI研究和应用的热点。部分专家和学者提出,数字化的下一阶段是智能化,而AI大模型及其应用是推动数字化转型持续深化的引擎。
AI大模型在数字化转型中的地位和作用还处于持续的探索之中。笔者在之前的文章中,已经描述了数字化转型的基本概念和方法论。那么,在我们建立的知识体系当中,AI大模型应当处于什么位置,当前和未来将会发挥什么作用呢?
1.AI大模型与“以数据为中心的业务变革”
一直以来,我们提到,数字化转型分为“业务活动步骤化”、“步骤环节要素化”、“要素数据规格化”和“以数据为中心的业务变革”四个阶段。业务活动经过前三阶段,逐步形成了规范化的业务运行数据。对于以数据为中心的AI大模型而言,其在数字化转型中的应用理所应当处于“以数据为中心的业务变革”阶段,属于《“以数据为中心的业务变革”之三种范式》中的第三种范式“系统数字化、规则数字化、模型和业务相互驱动”:适合无明确的现有规则或仅依靠现有规则不足以支撑业务运行、主观性强、容错性高的应用场景,由于其技术特点,暂无法满足业务规则专业型强、复杂度高的场景。
对于AI大模型在复杂专业领域的应用,在此举个栗子:
数学家陶哲轩认为ChatGPT是“数学菜鸡”,但在开展研究工作时,仍然很好地利用ChatGPT作为研究助理,包括以下三个步骤:1.明确GPT4的身份是“一个擅长给技巧性建议的数学合作专家”,目标是“提出一些建议”而非解决问题;2.使用Markdown轻量级标记语言而非数学算式来描述数学问题,便于GPT4理解;3.将问题描述中,涉及需要GPT-4自己查找资料的部分转变为引用注释,并在结尾给出网址。相比让GPT-4直接化身数学家去“解决问题”,陶哲轩把它当做一个提供灵感来源的“专家”,给自己提供研究方向的建议,很大程度提高了数学家研究工作的效率。
陶哲轩使用GPT-4的经验是:1.不要让AI直接回答问题,因为这几乎肯定会得到一些看起来专业的废话;2.AI大模型擅长半成品的语义搜索工作,在巧妙的问题内容和格式设计下,可以成为科学家的合作者,提供有价值的策略建议。
在现实中,部分企业领导在缺乏对业务生产线深入调研和理解,并且同样缺乏对大模型技术特点和应用场景理解的基础上,仅被PPT忽悠,就认为AI大模型具有完全替代专业领域工作人员的能力,盲目推动一些高投入的项目上马,其前景可想而知。
2.AI大模型与知识管理
上一节提到,AI大模型擅长半成品的语义搜索工作,在巧妙的问题内容和格式设计下,可以成为业务人员的合作者,提供有价值的策略建议,从而为业务活动创造便利,达到“降本增效”的效果。
看到这一点,不知道一直关注本号的读者有没有联想到什么?对了,就是“知识管理”。在《数字化转型企业需要什么样的知识管理》中,我们提到:业务“数字化”后其运行规则发生的变化称为知识数字化。知识数字化作为业务规则与业务“数字化”之间的桥梁,是数字化转型企业的业务引擎。知识数字化依赖有效的知识管理来实现,知识管理的目标是:1.通过实施管理活动,将企业运行过程中积累的智力成果有效转化为业务运行规则并动态更新;2.将业务规则与业务活动本身紧密耦合,以便在业务活动的任何环节和阶段有效运用规则。这其中涉及两方面内容,一是对业务运行规则也就是知识的积累和管理;二是对知识的应用。
而AI大模型作为业务人员的合作者,拥有大量模型参数,在海量业务数据的训练下,一方面可以自动化实现业务运行规则的有效积累、集成和管理,另一方面在知识数字化、范式化、模板化、模型化的基础上,还实现了知识的按需提供、集成化展示和智能推荐。
从知识管理的角度,AI大模型在数字化转型企业知识数字化、范式化、模板化、模型化的基础上,实现了知识管理的自动化和知识应用的智能化。
3.AI大模型与数据安全
笔者认为,企业在准备深度应用AI大模型之前,首先要考虑清楚一个问题——数据安全。这里读者可能会有疑问:数据安全只是数据治理工作的一部分,在这一场景下为什么要首先考虑?在此先给出结论:企业对自身业务数据安全的考虑,将对AI大模型的建设和应用模式产生决定性影响。
从技术上讲,AI大模型本质上是一个使用海量数据训练而成的深度神经网络模型。其巨大的数据和参数规模,实现了智能的涌现,展现出类似人类的智能。AI大模型在理解能力、推理能力、创作能力上的突破,建立在大量级、高质量的训练数据基础上。据称GPT-3模型使用了不少于45TB的原始数据和570GB的预处理数据,GPT-4模型使用的数据则更多。而企业所需要的垂直领域AI大模型,在多领域、多行业及多样性的海量数据基础上,还要将更多的垂直领域知识、业务规则加入模型的训练数据集,并需要业务领域专家的深度参与。
而用户在使用AI大模型过程中,需要向大模型提供输入以获得期望的输出。这些持续不断的输入反过来为大模型的改进和完善提供了矫正数据和反馈信息,从某种程度上讲需要提供部分企业业务运行的敏感数据、流程和规则信息。如果企业完全不能接受这些信息的外泄,就必须自建AI大模型及其应用,而这需要较高的资源投入。
一方面,如果企业能够接受员工在使用公共AI大模型过程中,向大模型提供企业运行的部分敏感数据,也需要进一步评估提供数据的边界和方式,并在此基础上制定相应的数据安全策略、制度和操作规程,而这些都是全新的领域。
另一方面,如果企业自建AI大模型,需要重点解决的是数据访问的权限问题。简单的说,就是在各岗位职工普遍使用AI大模型作为业务助手的情况下,需要根据岗位的知悉范围,对其能够从企业自建AI大模型中获取的数据边界进行限制,而这对于大模型提出了更高的技术和使用管理要求。
4.总结
在目前AI大模型的行业应用刚刚起步阶段,部分企业领导寄希望大模型能够一招定胜负,解决企业发展的数字化转型问题的想法是不切实际的。目前,由于数据智能的技术局限性,AI大模型在数字化转型中的作用尚未突破《“以数据为中心的业务变革”之三种范式》中第三种范式的边界。但AI大模型在企业知识管理领域,可以在知识数字化、范式化、模板化、模型化的基础上进一步实现知识管理的自动化和知识应用的智能化,进一步促进“降本增效”。而作为数据密集型的应用,AI大模型为传统的数据安全和数据治理也带来了新的课题和挑战。
发表评论 取消回复