利用ESG数据发掘交易信号

环境、社会和公司治理(ESG)问题在近几年越发受到关注,数据公司也开始发布报告来衡量其影响。而紧随关注度而来的争论也一直持续不断,ESG数据是否有利于投资者对其持有的投资组合中的企业进行评估。当前,已有一些学术研究支持ESG因子能够用作投资的积极指标,因为研究显示,拥有较高可持续性的公司能够带来更好的投资回报。

话虽如此,但若想将ESG数据转换成可用的投资信号并非易事。ESG数据相对松散,且由于缺少强制性和标准化的报告框架而存在潜在偏差。彭博的分析师则考虑通过将机器学习技术应用于彭博广泛的ESG数据集,来克服这项阻碍。

彭博的ESG数据集

彭博从2006年起开始提供全球范围内13,000家企业的年度ESG数据,并从2013年起提供近4,500家企业的每日治理数据。这项研究重点关注数据易于获取的美国上市公司,在研究过程中,我们将其中超过3,000只股票应用于一个假设的ESG投资组合。

机器学习策略

由于专注ESG的投资可以被看作是关注长期表现,该项研究的方法就是通过构建一个机器学习模型,直接将ESG指标与长期回报相关联。使用彭博的ESG数据对数据库中每只股票的年度超额回报进行归类。其中的年度超额回报是根据罗素3000指数进行衡量,分为3个类别:大于15%,小于-25%,以及回报在两者之间的值。

梯度增强树(GBT)模型通常用于根据企业不同的ESG数据预测其超额收益的类型。GBT模型的一个显著优势就是其处理缺失值的内在能力,不需要进行特殊处理。

可解释性

在机器学习的方式产生积极的结果之后,即夏普比率为1.25(基准为0.73),阿尔法系数为8.7%,研究人员还查验了训练模型,观察其是否能够通过解释性测试。驱动模型表现的关键数据特征是通过博弈论中被称为SHAP(SHapley Additive exPlanations)的技术所识别。其结果是建立在这些特征上的简单且能够被完整解释的回归模型,可被用于对比,并可使用这些特征再次对机器学习模型进行训练。

非常用因子

在研究中构建的所有投资组合都进行了Fama/French五因子归因测试。对因子模型而言,最大且最为稳健的Alpha来自于可解释行测试中利用顶部特征所训练的机器学习模型。此外,五因子中仅有两个因子具有统计学意义,且呈现低显著性水平。这意味着ESG数据更有潜力成为一个独立的投资参考,而与常用的因子不相关。

亲身感受彭博终端带来的非凡体验 预约演示