彭博温室气体排放量估算模型:挑战与模型解决方案概览

彭博专业服务

如今,全球各地已有越来越多的政府、个人和企业开始采取温室气体减排行动。对投资者而言,密切关注投资组合中企业的温室气体排放情况正逐渐成为投资流程中的关键一环。然而,各国、各行业的温室气体排放数据披露情况千差万别,还有许多公司根本不披露排放数据。

为填补这一缺口,彭博开发了一个基于机器学习的温室气体排放量估算模型。彭博温室气体模型(Bloomberg GHG Model)针对有充足可得数据的企业估算其温室气体的直接排放量(范围1)和间接排放量(范围2和范围3)。

2010年至2020年披露碳数据

图1:彭博环境社会与治理(ESG)数据总集(涵盖披露ESG数据的公司,目前包括1.19万家全球公司)中披露温室气体排放量数据的公司百分比。

范围1和范围2模型中包括哪些公司?

自2010年以来,模型覆盖的全球公司总计超过5万家。其中有3.9万家为上市公司,剩余1.1万家没有上市。以下图表展示了各指数、各地区和各国家的详细覆盖情况。

各指数的范围1和范围2模型覆盖情况

表1:各指数范围1和范围2数据覆盖情况

范围3模型包括哪些公司?

温室气体范围3排放量的估算模型覆盖了全球逾4000家企业。其中大约90%为上市公司,其余则是非上市企业。

各指数的范围3模型覆盖情况

表2:各指数的范围3模型覆盖情况

我们如何选择用于估算温室气体排放量的适当模型?

估算企业的碳足迹这件事本身就很复杂;更何况,进行估算所需的数据中又有诸多噪点,而且对于那些必须被评估的企业而言,其数据又往往缺失。线性模型具有较高的解释力,但当基础数据包含相互依赖的关系、缺失值和分类信息时,这类模型就很难实现;但上述问题恰恰是生成温室气体排放量估值时所需要面对的。回归树等较复杂的机器学习模型能够自然地学习数据中的复杂关系、处理缺失值和分类数据,并为温室气体排放中的固有噪点建模。

模型采用什么数据?

温室气体排放量估值的质量在很大程度上取决于用于生成这些数据的质量,而这正是彭博所长。彭博温室气体模型使用多个数据集,包括公司地点、规模、财务数据、ESG数据、各行业的收入详情、行业特定的公司数据等。行业特定数据包括比如公用事业公司发电所用的能源(如化石燃料、太阳能、风能)或水泥、钢铁和油气公司的产量数据。模型总计使用了800多个单独功能。

模型输出什么结果?

模型生成所有行业的范围1和范围2排放量估值,并为油气和矿业行业生成范围3估值。每一个估值都配有一个参照可比公司数据的分布值。用户可以选择分布中的不同百分位,从而选择使用比基于分布均值的数据更为激进或更为保守的估算值。 彭博解决方案中还有一个元素是温室气体信心评分 (GHG Confidence Score),用于衡量计算某公司温室气体排放量估算值的可得数据点的深度和相关性。温室气体信心评分是在将特定公司的可得数据点与同一行业中所有公司最相关的数据特性进行对比后得出的。

模型是如何得出估算值的?

我们训练模型学习一家公司的数据特性与拥有类似多组特性的公司温室气体排放分布之间的关系。模型训练包括应用一系列机器学习技术,这些技术能够处理数据中所发现的复杂情况和挑战,并生成分布值。最后,模型能够将这些学习到的关系应用于其他公司。

范围3模型

目前,范围3模型仅限于油气和矿业公司,但随着更多行业被纳入模型,在不久的未来,覆盖范围将会扩大。

这些公司的范围3模型结合了自下而上与自上而下的机器学习模型。

自下而上的模型使用公司的石油、天然气、液态天然气、煤、铁矿石等的销售额和产量数据以及碳排放因子,也就是每单位产品所排放的二氧化碳当量。然后计算在使用或加工这些产品时的间接排放量。自上而下的机器学习模型则建立在自下而上模型之上,通过学习各行业计算所得的范围3排放量、收入与其他关键因子之间的关系来估算碳排放量。

对于这两个行业而言,使用销售额和产量指标效果很好,因为油气和矿业公司最主要的范围3排放都来自下游对其产品的加工和使用环节。

亲身感受彭博终端带来的非凡体验 预约演示