时间:2024-07-02
一、大模型掀起赋能千行百业新浪潮
大模型泛指具有大规模参数和计算能力的深度学习模型,由数十亿及以上参数规模的深度神经网络构建而成。大模型通过训练大量语料,可获得类似人类的思考能力,理解文本、代码、图片等信息,实现文本生成、推理问答、科学预测等功能。当前OpenAI公司的GPT-3大模型的参数量为1750亿,GPT-4参数量约为1.8万亿,华为公司盘古大模型3.0的参数量为1000亿,百度文心一言大模型为2600亿。
大模型可分为通用大模型和行业大模型。通用大模型普遍基于大规模、多样化的数据集进行训练,具有更广泛的应用领域和知识覆盖能力,但针对特定行业的专业性和精准度不足。通用大模型大部分闭源,如OpenAI的GPT、百度的文心一言、华为的盘古大模型等。行业大模型基于通用大模型底座,结合行业数据进行二次训练和微调,在特定领域具有更高的专业性。
近年来,大模型深度赋能垂直行业趋势越发凸显,目前已广泛赋能智能制造、智慧能源、智慧钢铁、智慧铁路、智慧金融、智慧医疗、智慧城市、气象预报等应用领域,带动千行百业智能化升级。如冠捷科技应用基于盘古大模型的印刷电路板组装(PCBA)智能质检解决方案,实现缺陷检出率稳定保持在99.9%以上,降低工厂和车间侧模型适配和运维成本超80%,降低人力成本80%。中国国家气象中心应用气象大模型,实现中长期气象预报精度首次超过传统数值方法,速度提升1万倍以上。
二、“大模型+安全”驱动防护手段升级
工业领域网络安全大模型是行业大模型的具体分支。目前国内外网络安全公司普遍使用开源的通用大模型作为基础模型,结合安全业务场景数据进行二次训练和微调,形成相关网络安全大模型产品,参数量多在100亿-700亿之间。基于大模型的语义分析、代码理解、复杂推理等能力,可驱动工业领域网络安全工具、产品和服务智能化升级,对于保障数字化转型过程的网络安全具有巨大潜力和广阔空间。
(一)赋能安全运营,支撑打造智能化自动化运营体系
安全运营指企业通过运营已部署的各类安全产品,综合分析多维安全数据,研判整体安全状况,实现渗透测试、威胁研判、攻击链路还原、脆弱性扫描、响应处置等目标。安全运营对于维护业务连续性和稳定性意义重大。传统安全运营方式有两种。一是人工运营,其应用最为广泛,但完全依赖于技术人员精力和技能。二是以安全编排自动化与响应(SOAR)为核心的自动化运营,通过人工设定运营脚本,按脚本流程调用各类安全设备接口。该方式只适用于重复出现的简单场景,且仍依赖人工。
基于大模型的语义分析和复杂推理能力,通过学习海量安全知识,可拆解复杂任务目标,自动化设计运营工作流程、调用安全工具和API接口,能够满足复杂运营场景需求。如在网站渗透测试场景下,大模型将依次调用资产探测、漏洞扫描、漏洞利用等工具,执行资产架构摸排、脆弱性扫描、控制权限获取等任务,以实现渗透目标、自动输出测试报告。美国微软、谷歌等科技公司,将大模型广泛运用于安全智能运营、攻击路径还原、虚拟专家培育、安全事件响应等领域,为政企合作强化网络安全防护能力创造有利条件。
(二)赋能漏洞挖掘,助力加固产业链供应链安全基石
漏洞挖掘指通过分析、测试等方式发现软件、系统或网络中存在的未知安全漏洞,是识别工业控制产品安全隐患、防范网络威胁的关键手段。漏洞挖掘能力关乎工业领域产业链供应链安全水平。与信息技术产品相比,工业控制产品专业程度高、协议封闭性强、行业差别大,涉及品牌、型号众多,基于白盒的漏洞挖掘通过人工分析开展源代码审计,严重依赖测试人员对代码的理解水平且漏洞挖掘效率低下。
基于大模型的代码理解等能力,结合工业业务场景、通信协议等专业知识,充分学习工业控制产品漏洞特征、代码语义特征,可自动化检测未知漏洞或开展代码审计,实现漏洞补丁识别、二进制代码比对和模糊测试等,大幅提高漏洞挖掘效率和检测准确率。美国发起“人工智能网络挑战赛”(AIxCC),设立2000万美元奖金池,通过技术竞赛探索大模型等人工智能网络安全解决方案,以挖掘和修复关键基础设施领域重要软件的漏洞。鉴于大模型对二进制函数语义特征的保留更加完整,在未知网络协议漏洞挖掘方面的优势将更加显著。
(三)赋能威胁情报,有效提升网络攻防对抗制胜优势
威胁情报是各类有价值的网络威胁信息的集合,是为还原已发生攻击和预测未知攻击所需的一切线索。常见的威胁情报信息有APT组织信息、恶意域名、恶意IP、钓鱼邮箱地址等。威胁情报搜集、分析和利用能力是在工业领域网络安全攻防对抗中制胜的关键因素。在大模型出现之前,人工智能中的自然语言处理技术已对情报预处理起到关键作用,可自动提取情报要点,方便用户检索。
基于大模型的语义分析、深度学习等能力,可显著强化威胁情报检索、归类、要点提取、整合分析水平,更快速、准确地对来源不同、结构各异的海量模糊信息进行智能分析,自动研判、处置或预测安全威胁。美国网络安全和基础设施安全局(CISA)将大模型等人工智能技术应用于“网络威胁情报源关联分析”等业务系统中,提高安全防御水平。美国情报公司Recorded
Future利用大模型收集海量的威胁情报数据,进行特征提取和聚类分析,帮助用户更好地识别安全威胁、预测攻击行为。美国安全公司SentinelOne基于大语言模型推出网络安全威胁搜索工具,简化搜索复杂度,扩大搜索规模,有效提高威胁情报搜集分析效率。
三、融合应用面临技术瓶颈与安全挑战
(一)部分安全应用场景落地难,当前成效较为有限
尽管工业领域网络安全是大模型理想的应用领域,但落地好用有效的安全行业大模型依然道阻且长。一是大模型流量检测速度较低,难以满足实时性要求,且可能提高威胁误报率。因此在实际应用中,威胁特征比对和机器学习小模型分析仍然是主要的流量威胁检测手段。二是大模型在漏洞挖掘领域的应用成效高度依赖于通用大模型底座的代码理解水平,安全行业大模型成效提升较为有限。三是在威胁情报应用场景下,由于威胁情报的质量取决于情报信息本身,而非预处理过程,且安全行业大模型语义分析能力高度依赖于通用大模型底座基础,强化其应用效果存在瓶颈。
(二)安全运营成重点布局领域,技术难题仍待破解
从大模型赋能工业领域网络安全的细分领域来看,目前安全运营是布局最多的领域,具有良好的应用前景,如360、齐安信、绿盟、安恒信息、启明星辰、金睛云华、长亭科技等企业的大模型均布局在该领域。然而,大模型应用于安全运营领域仍面临三大难题。一是缺乏高质量的安全专业数据。安全行业大模型高度依赖训练数据的质量,且部分数据在训练前需结合实际场景人工进行分类和标注,用于训练的安全数据集匮乏是目前亟需攻克的难点。二是大模型训练和推理算力消耗大、成本高。以部分安全公司采用的LLaMA大模型为例,其训练一个65B的模型,所需的GPU多达2048块、耗时长达21天;在用户侧执行单次复杂任务推理时,也需较高的算力资源和时间成本。三是大模型推理结果可信度不稳定。大模型是黑盒模型,其决策过程和判断依据缺乏可解释性,生成答案的可信度无法保证。若直接依赖生成结果开展安全运营,可能导致错误判断和决策。
(三)大模型自身存在脆弱性,或引发网络安全风险
一是大模型“中毒”风险。大模型因应用的开源工具存在安全漏洞、在研发和迭代过程中易引入安全缺陷等,存在算法脆弱性。攻击者可利用这些漏洞,通过“投毒”修改或创建大模型训练数据,可能导致工业生产计划、物料供给、生产监测等输出数据发生错误,轻则致使生产延误,重则引发安全事故。二是应用接口不可用风险。调用应用接口是大模型服务的显著特征。一旦攻击者利用僵尸网络对大模型应用接口发起大量请求,将造成服务器和网络资源紧张,使得正常服务无法响应。三是大规模数据泄露风险。大模型的训练数据通常包含大量的敏感信息或高价值数据,如果这些数据被泄露或滥用,将对数据安全造成严重威胁。四是基础大模型级联风险。一旦基础大模型存在安全漏洞,或训练数据被恶意篡改,相关安全风险将传导至安全行业大模型以及用户细分场景模型,干扰工业领域模型决策,级联效应所引发的后果将不可估量。
四、新形势下推进大模型安全应用的思路
在全球各国加快抢占人工智能制高点、我国制造业数字化智能化转型如火如荼的背景下,亟需把握“人工智能+”机遇,以大模型等人工智能技术赋能工业领域网络安全,有效应对严峻安全形势,护航新型工业化发展。
一是完善政策标准体系,促进大模型安全发展。在推动落实《网络安全法》《数据安全法》等法规文件的基础上,针对大模型带来的新问题新挑战,研究制定配套政策标准,围绕大模型安全测评、大模型训练工业数据安全、大模型服务工业领域网络安全防护等方面,指导行业有序发展。突出重点行业企业网络安全防护主体责任,细化大模型应用场景的防护要求,指导企业提升风险防范应对能力。
二是强化业界协同攻关,推进大模型技术创新。鼓励业界共同构建网络安全行业高水平语料库,推动训练数据规范化共享,解决高质量安全数据缺乏难题,提高大模型在工业领域网络安全场景下的基础分析能力。研究突破运营场景下的大模型推理加速、可信度提升等方法,降低对人工智能加速卡的算力依赖,减小训练数据中不准确信息对模型的影响,持续提高大模型的易用性、准确度和安全水平。
三是加速安全产品迭代,释放大模型应用效能。推进大模型在安全运营、渗透测试、漏洞挖掘等方面与现有人工智能小模型、常规自动化技术有机结合,融合攻击矩阵精准还原网络攻击链路,加快形成并推广应用整体安全解决方案,切实增强工业领域网络安全威胁发现、应急响应和溯源反制等能力,助力工业企业进一步提升智能化安全防护水平。
(作者:郭娴 国家工业信息安全发展研究中心监测应急所所长,正高级工程师。长期从事工业信息安全相关政策标准研究、技术保障能力建设、行业咨询等工作。)
来源:工信安全之窗