04 算法金融:AI金融的最佳实践路径

算法金融的本质与原理

从本质上看,算法金融是为计算科学、数据科学、人工智能等理论技术和身份识别、贷款审批等具体金融业务场景建立连接通道的一种金融模式。金融业务在智能算法的支持下变得更智能化、智慧化。

从智能算法技术理论到金融行业的实际应用,需要行之有效的方法论。目前,实验室对智能算法的理论研究明显领先于具体应用。从这一角度看,利用算法金融推动金融产品与服务创新,并非仅通过对算法原理进行改造才能实现,利用数据工程化、算法产品化、原理实证化等方式,使金融场景和算法原理无缝对接,也能达成这一目标。

例如在数据工程化方面,金融场景中的数据分析和预测结果的效率、质量,是决定算法金融能否在该场景发挥价值的核心因素。显然,这需要对金融场景中的数据进行有效筛选并找到其背后的联系与规律。

毋庸置疑的是,高质量的训练数据可以提升智能算法的性能,即便算法尚未完善,也能对最终的结果带来实质性影响。将XGBoost(一个开源机器学习项目)算法应用于选股场景,需要借助该算法建立的选股模型来实现。在这个过程中,能否选出和股价关联度较高的数据,并从中提取出影响股价走势的高质量特征因子(包括技术指标、财务指标等),将直接决定最终的选股结果。而想要成功提取出高质量的特征因子,又要求智能算法对股票市场的发展趋势、目标企业的发展状况及发展前景等有深刻认识。

在算法产品化方面,算法开发团队在全面把握数据、场景、算法原理、算法产品的体系架构等多种因素的前提下,将算法和场景充分对接,以设计算法和开放模型的形式对场景进行展现。显然,开发人员需要用量化的状态、空间来表示场景关系,或者用神经网络、数理方程、图论支持的图示等算法表示变化规律。

将一个算法原理应用到差异化的场景中,其应用形式和应用效果也会有所不同。例如概率表示某一事件发生的可能性,在算法金融中,我们可以用概率来预测股票涨幅,也可以用概率来筛选样本数据等。

最近邻域算法(KNN)是一个理论较为成熟的算法,也是较为简单的机器学习算法之一,在信用卡产品营销方面有颇为广阔的应用前景。KNN可以在丰富多元的信用卡交易信息的基础上,预测POS机的位置分布,构建客户的消费轨迹,为信用卡营销人员绘制用户画像,开展精准营销等提供有效指导。另一方面,KNN还可以对股票的走势进行预测,给出弱势、中等、强势股票的分类边界。需要注意的是,KNN中的K值将直接影响分类边界的形状,找到合理的K值非常重要。而K值的确定需要其他的算法,具体使用哪些算法则需要结合数据的具体特征来选择。