扩展的数据集将如何增强量化分析?

近年来,机器学习和大数据的兴起推动了金融行业的诸多发展,然而实际情况并非市场迎来了另一个新事物那样简单。

回顾互联网时代的科技发展史,电脑算力、存储容量和网络速度的变革为人工智能(AI)及数据技术时代的到来铺平了道路。如今,我们可以通过许多设备来收集和传输海量数据,问题就变成了如何实现数据的打包和交付,而非其存在性和可用性。不过,在学习如何最大化利用相关信息的方面,还需要应对一系列挑战。

除了能从云基础设施中获得诸如高性能、分布式计算等提升,量化基金和其他市场参与者正试图以创新方式来发掘和实现与信息的互动。传统的数据形式可以用细致的技术来分析,而对另类数据集的分析旨在创造新形式的阿尔法收益。这种新兴格局的主要特点是什么?数据提供商将如何迎头赶上?

处理电子信息:挑战与发展

在不远的过去,大批量传输数据曾经是一个逻辑挑战。以平面文件(flat file)为例,需要投入大量工作才能对数据进行提取、处理、标准化并与现代应用程序的架构整合。

从分析层面来说,投资决策的量化基本面分析在过去十年得到了巨大的发展。作为一种结合了基本面和量化分析的工具,许多参考数据集和广泛的另类数据集都被应用于量化基金。此外,它还提供了“重新倒带”的机会,通过网页而非FTP得到原本无法获得的历史数据,从而重温市场历史。随着金融行业和量化基金用复杂的方式来处理此类数据,一些优先任务也凸显了出来。

首先,企业必须购买或搭建推动业务发展的基础架构、工具和内容。成本也是一个关键考量因素,最有效的解决方案将把总体拥有成本也考虑在内。

其次,购买数据以及让数据能在服务于前端至后端所有用户的特定应用架构中发挥高效能将需要很大的资金投入。常出现的痛点包括重复性整合,以及对多重定价来源的管理。

因此,在成本、时间、专业技能都代价不菲的时候,该如何选择呢?

成为解决方案的一部分:BEAP和HAPI

金融服务提供商需要通过咨询协商的方式来了解客户的需求,包括简化技术、用合理的方式来发掘内容,并将解决方案快速与客户所处环境相融合。

彭博企业数据接入站点(BEAP)和2018年9月引入的超媒体API技术就是该解决方案的一部分。BEAP传输标准化的数据,不但机器可以读取,也能直接供研究者使用,可以极大缩短获取数据的时间。

通过将BEAP作为发现的门户,用户可以在网页浏览器上管理目录和发布者等信息。他们还可以检查元数据和下载样本来分析数据集背后的数据结构、元数据和模式。这种文件记录可以帮助客户搭建自己的基础设施平台,将数据、链接、本体、词汇库和元数据进行整合。新的应用程式界面,即超媒体API(也称HAPI),允许客户写入客户端服务器或以网页为基础的应用程序,从而直接和彭博的基础架构进行交流。

随着金融领域专家在数据技术方面取得进展,包括BEAP和HAPI在内的数据分析解决方案正在朝着支持金融行业最新信息革命的方向发展。

亲身感受彭博终端带来的非凡体验 预约演示