作者:资管小生
来源:资管观察(ID:xintuoguancha)
投资的重要基础在于对市场态势有更深刻的认识或者深邃的洞见,从而捕捉更好的投资机会。这种投资的优势建立在很大程度上源于数据的支撑,要么基于现有数据进行获得更不一般的发现或者认知,要么基于别人没有的数据更先人一步知晓未来。对于前者来说,难上加难;对于后者,随着监管的严格和信息披露的规范,投资者之间的信息不对称程度越来越低,市场越来越有效,所有近年来股票指数基金大行其道。不过,近年来另类数据的兴起似乎可以帮助投资者强化数据优势,提升创造α的能力。
什么是另类数据?
另类数据与传统数据相区别,也就是说另类数据并不来源于政府部门公布的数据或者上市机构的定期财务报告,从这个意义上看,投资者机构现在所使用的绝大部分数据都为传统数据。另类数据本身是一个相对的概念,随着另类数据的普及,其稀缺性不强后,就可能成为传统数据;有些数据对于这家投资机构可能是另类数据,但是对另一家投资机构而言可能不是另类数据,因此是否为另类数据也要取决于数据的使用目的。从另类数据特征看,一是另类数据多是非结构化的,在整合和处理方面存在难度。二是另类数据多是未经过验证,数据可靠性本身保证程度不高。三是另类数据所可能应用的范围较低,部分数据仅可能反映了一部分个人或者企业活动。
目前,并没有对于另类数据的权威定义或者分类,一般而言,另类数据主要包括社交网站信息、信用卡交易信息、定位信息、卫星图片等,所涵盖的领域较为广泛。根据摩根大通的分类,按照来源划分,另类数据主要包括个人类数据、商业活动类数据、监测类数据,个人类数据主要包括个人社交、网络搜索、其他网络活动数据;商业活动类数据主要包括商业交易数据、企业活动数据等;监测类数据主要包括卫星数据、定位数据等。
另类数据的兴起主要与社会行为互联网化、数据化以及数据分析技术成熟两个因素具有很大关系。一方面现代社会信息技术日渐发展,诸如网民越来越多,智能手机使用更为普及,商业活动可检测性越来越强,这些都会产生大量数据资源,IDC预测2020年全球数据量增速有望达到44%,我国数据量约占全球的20%,这些数据资产为洞见社会经济活动提供了有益的窗口,成为宝贵的社会财富。另一方面,数据本身并没有什么特别意义,而需要工具从中开发宝藏。现代数据分析技术日渐成熟,大数据模型、人工智能等日渐应用广泛,相当于有了开发数据利器,帮助我们从而发现新的世界。
随着另类数据需求的增大,另类数据行业蓬勃发展,全球另类数据提供商约为500家,自2005年后呈现快速增长态势。这些数据商可提供原始另类数据,对于原始数据进行加工处理,提供数据深度分析和策略咨询等服务,帮助投资机构成功利用另类数据捕捉投资机会。
图1:全球另类数据提供商数量增长趋势
为什么使用另类数据?
自本世纪开始,有关另类数据与资产管理的相关文献逐步增多,诸如关注资产价格与社交网站情绪的相关性等文献的出现,为对冲基金提供了探寻市场投资的新机遇。对冲基金以市场套利、寻求错误定价等为交易策略,获取超额回报。尤其是近年来,对冲基金投资业绩日渐平淡,投资者满意度下降,资金流入压力增多,另类数据为对冲基金提升α提供了新思路,根据LS调查,约80%的对冲基金已经使用了另类数据,约42%的对冲基金已经深度使用了另类数据,不仅如此,近年来公募基金、PE机构都在开始使用另类数据,早在2015年贝莱德就曾指出,若想获得可持续的α,资管机构必须不断使用包括另类数据的在内的大数据。
那么另类数据到底能够为资管机构创造哪些价值呢?其价值最主要体现在发现市场新机遇、强化投研能力。一方面,另类数据提供了资管机构掌握市场动向的机会,可以领先一步,形成市场竞争优势,提前布局,提高创造α的能力。诸如,超市类上市公司一般披露业绩较晚,之前都是根据超市停车场车辆判断购物人群数量,进而推测超市业绩,现在更多使用卫星图像进行分析。再如,美国某机构根据特斯拉工厂的手机信号推断汽车生产数量,提早预判其汽车产量。有利这些另类数据,在可以提早制定投资策略。不过,随着另类数据的更广泛应用,另类数据所能够赋予资管机构的这种领先优势持续时间存在问题,而且有时候另类数据质量可能存在问题,也无法帮助资管机构获取超额收益。另一方面,另类数据能够帮助资管机构更加深入地了解企业、行业和市场,提供了基本面研究的交叉验证和佐证。诸如浑水作为知名做空机构,其在尽调过程中,通常会使用另类数据,进一步验证上市企业对外披露的业绩数据。根据调查,90%以上的对冲基金机构都是将另类数据与原有的研究相结合,提高投研能力,夯实投资策略,提高获取可持续α的能力。
调查数据显示,75%的对冲基金应用另类数据更加深入地分析特定行业或者领域,68%的对冲基金希望另类数据能够为现有研究提供支撑,57%的对冲基金希望通过另类数据形成独特的投资策略。不过,不同规模资管机构对于另类数据的应用侧重点有所区别,诸如管理规模为50亿美元以下的对冲基金更多希望借助另类数据加强行业和投资对象研究,而管理规模为50亿元美元以上的对冲基金则更多希望利用另类数据形成独特的投资策略。
虽然另类数据的广泛应用,对冲基金相关投入在不断增大,统计数据显示资管机构另类数据采购相关支出到2020年可能达到17亿美元。不同资管机构支出规模有所差异,管理规模小于10亿美元的资管机构2020年支出规模预计约为16万美元,管理规模在10-100亿美元的资管机构支出规模预计约为76万美元,管理股民大于100亿美元的资管机构相关支出预计约为400万美元。对冲基金未来另类数据支出增速在10%以上的占比达到89%。可见,虽然对冲基金当前仍面临较大的业绩压力和营收压力,但是对于另类数据的支出依然保持较快增长,也是隐含了对于另类数据价值的认可和期许。
图2:资管机构另类数据采购支出
如何用好另类数据?
另类数据具有较大价值,但是用好另类数据,加强相关风险管理并没有达成一致,这也是资管机构最为担忧之处。
如何选择另类数据?一般而言,资管机构的数据既可以自行累积,也可以通过外采实现,二者各有利弊,调查显示,管理规模越小的对冲基金机构自行累积的占比越高,这可能在于节省支出的考虑,不过自行累积和外部采购相结合仍是当下资管机构首先采取的策略。解决了数据来源的问题,那么接下来就是看下在多种多样的另类数据分类中,该使用何种另类数据了。目前,对冲基金使用频率最高的是信用卡交易等个人交易数据,占比为78%,其次为社交信息,占比为67%,云平台信息和APP使用信息占比分别为59%和56%,定位信息和卫星图片使用量并不高,占比分别为43%和21%,是所有另类数据中应用频率较低的。另类数据使用广泛度与数据质量和应用场景有很大关系,调查数据显示,最精确的另类数据排名前两位的是信用卡数据和网页抓取信息,而最不精确的另类数据排名前两位的是定位信息和卫星信息。
如何建立另类数据管理流程?使用另类数据的难度要大于传统数据,因此资管机构首先需要明确另类数据战略目标。首先是要明确另类数据应用范围,如何配合现有投研体系,而不是眉毛胡子一把抓,另类数据也只是工具,配合做好投资决策,这也是使用另类数据的重要前提。其次是建立另类数据的管理流程,包括数据清洗、数据挖掘和分析、数据可视化、基于另类数据的投资信号和投资策略,从而实现完成的管理流程链条,如果没有可靠的内部管理,另类数据的价值和发挥作用可能大打折扣,甚至可能适得其反。最后,就是做好使用另类数据的人才储备和资源投入。另类数据的复杂性,需要配备专业的数据分析师、数据挖掘师,这部分投入是继数据采购投入之外的,另外很大一块投入。随着另类数据的广泛使用,数据分析师、数据工程师数量呈现爆发式上涨,相关人才缺口不断增大。
图3:另类数据岗位人才数量趋势图
如何管理好另类数据使用风险?另类数据应用还不成熟,不仅体现在技术方法上,还体现在监管和法律法规上。根据对冲基金调研反馈,普遍对于数据保护和数据管理风险感到忧虑。数据保护方面,目前大量另类数据涉及个人信息数据,目前美国、欧盟都在加强对于个人隐私数据的保护,相对另类数据的使用构成抑制。2019年,我国多个公司涉及利用爬虫技术获取个人信息而触及法律底线,充分值得重视,未来资管机构需要充分保障所使用的数据来源依法合规。另一方面,另类数据需要借助复杂的信息科技技术进行处理和建模,这其中存在较高的操作风险和模型风险,操作风险来源于相关人员能力不足或者故意窃取商业数据;而模型风险来源于在数据挖掘、数据建模过程中导致的错误,进而可能形成最终投资决策的偏差。
注:文章为作者独立观点,不代表资产界立场。
题图来自 Pexels,基于 CC0 协议
本文由“资管观察”投稿资产界,并经资产界编辑发布。版权归原作者所有,未经授权,请勿转载,谢谢!