AI与电力系统思考

作者:邹德虎

1 电力系统技术的范式

范式指的是大的方法或者思路。电力系统技术的范式一共有三种:机理分析、仿真、统计学习。

1)机理分析是建立确定性的数学模型并进行分析,可以分为两类:第1是把电力系统当作纯粹客观对象进行分析,包括潮流计算、稳定性分析等,主要的数学工具是微分代数方程;第2类是考虑人类的主观选择,包括确定性的优化和控制算法,例如调度计划中使用的混合整数规划,无功优化中使用的内点法非线性优化,以及很多场合都出现的线性规划求解等。

2)仿真是通过数值计算重现电力系统运行过程的技术,可用于方式计算、N-1校核,也可以大规模扩大仿真算例(有点蒙特卡洛的意思),用于预调度、规划等业务。仿真还可以用于半实物硬件在环测试、培训等业务。

3)统计学习可以理解为数据驱动的思路,包括以下几类:第1是状态估计、参数辨识等电力系统的传统统计算法,其实这些算法都可以归结于机器学习的范畴,比如说很多估计算法是对最小二乘目标函数的变形或者加上正则项,这都是机器学习中的常见技术;第2类是传统机器学习,包括决策树、支持向量机、贝叶斯网、聚类等;第3类是2006年以后出现的深度神经网络,也是目前主流的AI技术。再具体而言,深度神经网络技术大致可以分为:感知类AI(例如图像识别,采用卷积神经网络);序列类AI(如LSTM、Transformer架构,适合自然语言处理);强化学习(典型如下围棋的AlphaGo);生成式AI(包括当下最热门的基于Transformer架构的大模型GPT,还有图像、音乐、视频等的生成)。

电力系统作为复杂系统,实用的方法往往都是三者的结合。例如,机理分析建立的模型可以用于仿真和统计学习(状态估计并没有把系统当成一个黑盒);仿真在算力够的情况下可以暴力破解的性质,用于校验算法效果、提供训练集等;统计学习可以估计参数,完善模型。举个例子,地区AVC由于不考虑发电机,是相对简单的。以前都用的是专家规则(例如9区图),但是可以用仿真的方法暴力穷举,从仿真结果中选择一个作为下发的控制策略。由于实用的控制永远都是分层分区的,并不会引起组合爆炸。这就是仿真来解决控制问题的一个思路。

事实上,只要是复杂的产品都是这三者的结合,只不过各有侧重。例如,AlphaGo包括了机理分析(围棋规则的建模);仿真(蒙特卡洛树搜索);统计学习(策略、价值网络)。只不过AlphaGo的重点显然是统计学习部分。

对于电力系统来说,机理分析和仿真一直都是业务的主流,统计学习是近10年才流行起来的。目前讨论AI应用于电力系统的论文很多。但作为系统设计师,一定要注意三大范式都不可偏废,取得平衡之道。

2 发展AI的最终目的

发展AI技术,可以写无数高大上、激动人心的展望。但归根结底,还是要为业务服务。我之前写文章也谈过,现代社会对电力供应的可靠性要求是不断提高的,停电对于很多年轻人来说已经是不可忍受的事情了;现代社会还有碳排放的要求,增加新能源发电,但是新能源会造成电力供应的可靠性下降,这是矛盾的两方面。同时,社会对于电力的价格是非常敏感的,不会允许电力系统大幅度的增加投资。因此,数字化技术是解决上述缺口的主要技术手段。既然发电的不确定性增加,那只能增加负荷侧的控制能力作为对冲。发电侧都是发电商,但负荷侧却是各行各业、千家万户,其控制涉及的信息流完全是海量的增加,经济影响也要复杂的多。

以前自动化技术和数字化技术的发展,电网建立了一些系统,对电力系统的可靠运行发挥了巨大作用。但这些系统的功效并未完全发挥出来,特别是涉及到经济效率的环节。由于AVC/AGC/稳控,以及自动化远程监控的发展,一线运行人员的需求下降了,但是数据采集与通信、基础数据质量、软件开发维护等岗位的人数需求提高了。数字化系统也有边际效用,随着系统越来越多、系统接入的数据越来越多,数据质量总会有不到位的地方,边际效用递减。如果管理不到位会引起恶性循环,数据质量变差导致大家不愿意用,大家不用会导致数据质量更加失控。

现在的AI技术尚不十分成熟,但是未来,我认为其更大的用武之地是配电、营销、设备运维等薄弱环节。对于稳定控制和保护等成熟业务,AI会改进,但只是对现有业务的补充。

3 知识建模与AI

可以把软件开发当成知识建模,知识包括显性知识(可以形成论文、规程、文档等);隐性知识(个人经验,难以传授)。事实上,对于有经验的专家,他的全部能力中,隐性知识其实是占据绝大多数的。

举一些例子,我以前在500kV变电站工作,当时的站长仅仅通过听电流互感器的声音,就发现了某互感器存在问题,这个问题甚至影响了调度的数据。站长还曾经带领我们夜间巡视,通过电晕发现某设备的缺陷,可我当时瞪大了眼睛,啥也看不出来。这些真实的例子都属于个人经验,而且难以传授,至少没法写成作业指导书,照着做就能搞定。

但这些经验其实是很适合AI去做的,声音、图像都适合神经网络去处理,通过多层的神经网络自动发现信号中的特征,这些特征完全不需要文档化。

再比如说,以前的负荷预测算法是基于时间序列的简单算法,负荷预测专责需要在软件预测的基础上进行微调,可是这个微调又是说不清道不明的事情。最近几年AI介入之后,可以考虑大量因素和数据,预测结果已经超过人工预测了。

对于显性知识,其实很多也适合AI去处理。大模型AI可以处理和分析大量文档(例如调度规程、电力系统规范),自动提取关键信息和模式,将零散的显性知识整合成结构化的知识库。这减少了手动整理文档的工作量,并提高了知识的可访问性和可用性。

行业专用大模型一定比通用大模型好做。我发现目前主流的大模型AI,对于计算机、编程的回答非常有水平,但是对于电力系统的知识缺失严重。因为很多行业信息是互联网找不到的,无法训练。行业专用大模型如果能做出并实用化,一定能提高工作效率。

4 AI的可解释性与可靠性

深度神经网络虽然是主流技术,但不一定适用于所有场合。比如说,很多电力系统的关键数据并不多,比如故障时的录波,而深度神经网络一定需要很多数据去训练。我曾经问过南网调度AI比赛一等奖团队的某位开发人员,用的什么算法,回答说是随机森林。巧合的是另外一个公司某团队也用随机森林。我这里并不是鼓吹随机森林,只是在说明,传统机器算法,在电力系统还是有很大的用武之地,是需要继续研究的。

更重要的是,电力系统的可靠性是最重要指标,而很多AI算法是黑箱模型,说不清有效性与可靠性。这就限制了很多AI算法的应用场合,导致这些算法发论文很容易,应用却很困难。

AI的伦理学问题是阻碍AI在工业系统及其他领域大规模应用的重要障碍。伦理学问题不仅包括事故责任承担,还涵盖数据隐私保护、算法偏见等多个方面。在AI系统,尤其是复杂的工业系统中,事故发生时责任归属的确定比传统系统更加复杂。AI系统的决策过程可能涉及到深层次的学习算法和大量的数据输入,这使得追踪决策过程并明确责任归属变得困难。

为了更好的梳理这一问题,我总结了下面不同情况:

1)机理分析和仿真已经可以得到可用数据的场合,AI可用于提高其它指标,但不应直接产生结果。比如,EEAC等算法在算例筛选环节应用机器学习技术,但不影响最终结果。再比如,状态估计和潮流的断面调试,非常适合AI去做。类似的辅助调试还包括降低短路电流的一些方式调整。这些调试并不影响最终结果,最终结果是仿真计算保证的。

2)对于闭环控制系统,鉴于状态估计已经用于控制的间接环节(AVC中的无功优化、AGC中的安全约束调度是基于状态估计断面的,AVC中二级电压控制是SCADA和状态估计数据都用)。因此,用于控制的AI算法,其可解释性应该与状态估计相当。以这个标准来说,线性模型、决策树等算法可用于控制。

3)人类无法得到可用数据的场合,AI可以直接应用。例如考虑非常多因素的负荷预测和新能源预测,这些应用一般都是预测类的,用于未来的调度计划甚至规划。所谓计划总赶不上变化,这种需求的可靠性需求肯定比控制低。

4)最适合AI的角色是辅助决策、助手。包括故障诊断、方案制定、缺陷巡视等,甚至包括文档的AI生成(相当于秘书角色)。因此,AI可用提高人的效率,提高数字化系统的能力。

5 发展AI的关键技术

关键技术的识别能力是专家的标准之一。其实,在媒体中大幅宣传,以及论文、报奖材料中着重强调的,往往都不是真正的关键技术。这个可以用心理学来感受,如果你有了压箱底的技术,你会满世界的嚷嚷,用最快的速度发表吗?当然宣传是必要的,但真正的关键技术往往都尽量保密。

对于AI来说,我个人的理解,算力和训练数据都是重要的。但是,设计制造可以计算的芯片相对容易,但EDA工具,以及软件生态(如CUDA)的门槛可能更高。芯片之间的高带宽、低延时通信也非常重要,这是大规模并行计算的前提。英伟达服务器的一个亮点就是高性能GPU数据互联技术NVSwitch,据说比PCI-E强的多。训练数据的收集、标注、对齐也是重要的关键技术,而且非常消耗人力资源,吃力不讨好。

电力系统对于AI来说是客户。就电力系统本身来说,依然需要加强自动化系统的建设,提高数据的整合能力,尤其是跨越“部门墙”,同时保证数据的准确可靠。这一点我深有体会,我以前在南瑞的时候试图开发出一套新能源预测系统,但90%以上的精力都跟技术没有关系,是为了获取天气预报数据(现在回头看,应该找开源的天气数据,但当时不知道)。最终也没有把事情做成,可见数据的重要性。

6 个人工作和学习

我提倡在个人的工作、学习中使用最新的AI技术。其实,在10多年前AI尚未像现在这么火的时候,我就跟同事建议要学习Python语言了。电力工程师学习编程不是跟程序员抢饭碗,而是获得一种计算思维的锻炼,另外在日常工作中也确实可以提高效率(特别是在一些QC项目、小的创新实践中使用)。比如说,员工可以用大模型AI帮助产生长篇大论的报告,然后提交给领导。领导也可以用大模型AI把长篇大论提炼关键思路。这两个人都节省了时间。不使用AI,却需要审核报告的第三方是最吃亏的。

现代AI生成式技术的发展,可以预期未来的互联网信息将要更大规模的爆发,并吸引人的注意力。很可能到时候的信息太多,不花点代价已经很难找到真实信息了。这里有个小建议:不要通过看视频学习知识,视频确实可以帮助理解,建立形象化思维,但注意力更容易分散,同时视频信息密度不如纸质材料。你通过视频花的时间,通过阅读可能会学的更多。除非是高质量视频,值得反复观看的,比如“经济机器是如何运行的”,以及一些科普视频。

另外,AI技术对于创新工作是有很大借鉴意义的。我今天写了一个段子:“郭德纲对马斯克说:你那火箭,最好要烧煤气,而且是家庭用的煤气。火箭外壳得用不锈钢,那多结实啊。马斯克认真的盯着郭德纲看,点了点头”。这说的是专家深入研究,容易进入局部最优点,而看不到全局最优点的存在。这时候需要一个推力让你离开局部点,这时候“扮演成外行的内行”可能会发挥很大的作用,提的问题看起来会让人觉得不可思议但其实是有效的。费曼教授也有类似的经验,他可能会问别人看起来非常愚蠢的问题,但是突然就抓住核心漏洞,让对方措手不及。这些做法在AI技术都有体现,比如说群体智能算法就有一定的概率去离开当前的最优点,去试探别的方向。

7 展望

我不是AI专家,很难估计当前大模型最终能发展什么高度。但是,很多有名望的人士对于最终产生AGI(人工通用智能)信心十足,甚至不少人产生恐惧心理。我这里提出两个限制条件:1)把人类历史上所有产生的数据都训练完之后,大模型AI的训练怎么继续走下去,还能不能继续提高,类似于谷歌在围棋方面的自我对弈。2)当前用于数据处理的电能消耗已经占人类总电能消耗的5%,考虑到工农业生产和生活需求,我认为数据处理的电能消耗很难超过10%。也就是说,AI的发展很快就会遇到能源瓶颈。这两个问题如果不解决,我认为暂时还不用对AI产生很大的恐惧心理。但未来AI确实会对社会产生极大的影响,是要有所准备的。

对于电力系统的从业者,应该旗帜鲜明的支持AI的发展。首先,AI训练非常耗电,这就增加了卖电收入。其次,当前的AI停留在面向消费者的层次,面向企业的应用还没有特别好的商业模式。电力系统作为传统企业中业务最复杂、数字化程度最高的,是AI深化应用的试金石。电力系统的AI经验,对全社会其它领域,有很大的借鉴价值。