1.2 国外研究现状

在过去的20年中,有关市场操纵的文献研究主要包括三部分:对市场操纵行为机理的研究;研究市场操纵行为与市场变量波动间的相关性,应用统计学模型对二者的关系进行数量分析;近几年来,有少量文献从操纵行为的数据特征入手,以传统的市场变量波动作为辅助参考,采用人工智能方法从量化角度对操纵行为建模。

第一部分:对市场操纵行为进行定性分析,研究市场操纵行为特点及对市场的影响,从博弈论角度描述市场操纵行为的演化过程,刻画市场操纵行为机理。Glosten等在1985年设立了以做市商制度为基础的序贯交易模型,即做市商定价理论的信息模型,该模型的特点是用信息成本解释市场价差,而非使用存货成本进行解释。该模型的优势是可以对市场动态进行考量,能充分考虑做市商报价的调动,因而其是近20年解释买卖报价价差问题研究的主流模型。对市场操纵行为的理论性分析始于Allen和Gale,他们对内幕交易和股价操纵进行了初步研究,给出市场操纵的三种基本形态,提出基于交易的操纵行为的博弈模型,指出操纵行为在市场中获利的可能性;此后,1992年Allen等基于信息不对称视角,剖析了是否存在基于交易的操纵行为,从投资者信息不对称角度对交易型市场操纵进行了较好的解释,并在此基础上建立了相应的理论模型,证明了市场操纵存在的可能性;John等分析了内幕交易者利用他们拥有的信息优势进行市场操纵,从而牟取丰厚利益的情况,其研究结论显示在内幕交易中,即提前掌握内幕的利好消息与打压股价行为相对应,以便降低成本,提高收益,操纵者通常高调出售股票,此时不知情的投资者们跟风卖出,股票面临较大的空头势力,股价大幅下跌,当股价跌至内幕交易者的目标价位时,他们将大量做多该股票,随后择机公布利好信息,不知情交易者择机做多该股票,股价上涨,操纵者从中获利;Allen在2006年进一步利用“理性预期模型”(rational expectation model)对机构投资者的市场操纵行为进行研究和实证分析,结果显示机构投资者更容易利用内幕消息在市场中获利,这种行为对市场波动率和市场价格冲击(market price impact)有一定影响;Aggarwal和Wu在Allen和Gale的基础上发现,低流动性的金融产品易被操纵,且操纵行为一定程度上会增加市场波动性、增加短期收益和短期流动性;Aitken等指出,市场操纵会显著增加交易的执行成本,且频繁的市场操纵行为会减小市场买卖价差。

第二部分:研究市场操纵行为与市场变量波动间的相关性,应用统计学模型对二者的关系进行数量建模。这部分的研究使用的统计学模型不尽相同,但研究方法类似:首先,提取衡量操纵行为的各项市场变量的指标样本(如日均收益、日交易量、日价格范围、波动率、流动性、Beta系数等);其次,对市场指标在市场操纵行为出现时是否发生变化进行实证分析(大部分研究均显示部分或全部市场变量在市场操纵发生时呈现异常变化);最后,根据分析结果选取变量进行回归或“分类”建模,方法包括简单直观的基于规则的模型(association rule)、数据挖掘技术中常见的逻辑回归(logistic regression)、决策树(decision tree)、异常挖掘(outlier mining)和传统人工神经网络(artificial neural network)等。Karl等以芬兰证券市场中的收盘价为研究对象,并假设:若当天某交易者做多或做空一个较大的仓位,则该交易者将有动机在股市结束前的特定时段抬高或压低收盘价,以此获益。他们通过构建线性模型进行实证检验,结果显示芬兰市场确实存在股价操纵行为。Qi等使用基于方差的异常挖掘模型,选取日均收益作为变量建模;Luo等在Qi的基础上,选取日均收益、日交易量、日价格范围三种变量进行建模;等选取日均收益、日均交易量变化、日均波动率三种市场变量,运用多维判别分析(multiple discriminant analysis)、逻辑回归、支持向量机(support vector machine)和传统人工神经网络对土耳其市场九年间所发生的222起市场操纵事件进行建模,并对比四种模型的诊断性能,结果显示支持向量机和人工神经网络的性能较好;Mongkolnavin和Tirapat基于泰国债券市场提出一种基于规则的模型作为市场现有监测系统的补充;Diaz等选取日均收益、流动性和日均波动率三种变量,使用C5.0决策树模型和分类回归树(Classification and Regression Trees)两种模型,对美国市场2003—2010年的市场操纵数据进行建模;Hautsch和Huang利用向量自回归模型(VAR),指出市场冲击是交易行为操纵市场价格的理论依据,成熟的操纵者利用限价指令的市场冲击,设计连续化的操纵行为制造市场繁荣假象,误导其他投资者,并从中获利;Mei和Zhou试图建立以行为金融学为基础的模型,以证明“拉高和倾销”(pump and dump)策略的可行性。行为金融学中交易者是具有反射效应的非理性交易者,即面对盈利和风险厌恶相对应,面对亏损与风险偏好相对应,交易者对损失的敏感程度更高,因此其更偏好追涨杀跌;Chiou等采取理论与实证结合的研究方法,以价格操纵事件发生期间市场的波动率为研究对象,通过建立马尔科夫模型和异方差模型,对不同时期的证券市场波动率变化进行对比研究;Chan和Alfred研究了订单型操纵策略,通过研究香港证券交易所的交易数据考察了取消订单和潜在订单的操纵活动,实证结果表明,撤单率和操纵行为之间有强烈相关性,对高频数据的分析相较低频数据更能提高对股票市场交易行为的认识;Maxim等认为市场操纵的根本原因在于投资者用于决策的信息是不对称的,投资者通常会受到虚假信息、流言舆情的误导,通过潜在变量构建了基于SEM的股票市场操纵测度模型;Qili Wang等设计了一个基于RNN的合奏学习(RNN-EL)框架,该框架结合了从交易记录和上市公司特征中衍生的基于贸易的特征,以有效检测股票价格操纵活动,并根据中国证监会(CSRC)报告的起诉操纵案例,构建了一个包含交易数据和特征信息标签样本的专用数据集,进行实证实验,实验结果表明,在检测股票价格操纵方面,该方法在平均29.8%的AUC值方面优于最先进的方法;Punniyamoorthy和Thoppan在早期的线性鉴别函数(LDF)的基础上使用基于鉴别性分析(DA)的模型来识别可能操纵的股票,对印度资本市场5000多只上市证券进行实证测试,监控所有潜在的市场滥用情况,拟议的模型有助于调查人员确定可能操纵证券的入围名单,再对这些证券进行筛选,确定是否可能会接受进一步的详细调查;Kim和Sohn利用韩国股市的实时序列数据提出了一种利用无监督数据挖掘技术检测可疑股票价格操纵的方法:同行组分析,此技术通过将其与对等组进行比较并测量其行为与对等体的行为偏差来检测目标的异常行为,提出了一种改进一般对等组分析的方法,并将同行组成员的权重纳入总结其行为,同时考虑参数随时间更新。

以上这些文献研究对市场操纵行为的监测和建模侧重于市场变量和操纵事件间的线性相关关系,且模型基于一个潜在的假设条件:市场变量的异常波动是衡量市场操纵行为的指标,即市场操纵等价于市场变量的异常波动。这个假设条件源于对市场操纵的实证分析,但实证分析仅可以证明市场变量的异常变化是操纵行为的必要条件,却不能反之证明其充分性。

第三部分:从操纵行为的数据特征入手,以传统的市场变量波动作为辅助参考,采用人工智能方法从量化角度对操纵行为建模。实际上,操纵行为能够引起市场变量的异常变化,传统市场变量虽然在一定程度上能够刻画市场操纵策略的特点,但不足以对市场操纵策略构成因果性解释,即市场变量指标的变异不能直接推出“市场操纵行为”的存在。基于此,少部分学者开始从操纵行为的量化特征入手,设计实时市场操纵监测模型。Lee等率先对市场操纵行为给出了数量化定义,把盘中拉抬和虚假交易中用到的虚假指令(spoofing order)定义为满足三个条件的限价指令:第一,指令价格比当前最佳买价(bid price)高至少6个基点(或者比最佳卖价低6个基点);第二,指令量(order volume)至少是前一交易日日均指令量的两倍;第三,在市场中停留时间超过30分钟。该定义被实际案例证明不够准确,但却是学术界最早出现的关于操纵行为的量化定义,它较全面地描述了大多数简单的操纵行为中虚假指令的数量特性。Yang等使用数据挖掘技术中的“强化学习”(reinforcement learning)模型,对美国高频交易市场的交易行为以及限价指令簿的动态变化进行建模,识别和区分各类交易策略以及隐藏其中的操纵行为,指出汇率、利率、国际油价、政策性变动、经济周期、指数走势、机构性事件(institution event),甚至投资者情绪(investor sentiment)等均可引起市场变量的异常变化,并不一定是市场操纵所导致;Cao和Yao更进一步对市场正常交易和操纵行为的抽象特征进行量化,使用支持向量机、动态规划等技术,建立起实时检测模型。因此,仅根据市场变量对操纵行为建模,具有一定的逻辑错误,无法分析出操纵行为的本质特征。市场变量波动是操纵行为的间接影响因素,只能用于辅助诊断,而直接从间接变量的波动跨越到原始事件的诊断,在逻辑上是难以成立的。有学者对此提供了新的思路和方向,我们的研究团队在此基础上对资本市场的正常交易和各类操纵行为的抽象特征进行研究分析,应用支持向量机、动态规划等数据挖掘技术对操纵行为进行研究,并建立相关的实时监测模型。Golmohammadi等通过监督学习算法,对可疑交易市场操纵问题进行研究。他们以股市中市场操纵例子为研究对象,通过分类回归树、条件推理树等算法对操纵样本进行分类。其实证结果显示,朴素贝叶斯的准确率对F2测量达到53%,在分类操纵案件中展现出优于其他学习方法的实验效果,但美中不足是得到较高准确率的方法都是数据挖掘,这类基于纯粹的数据分析方法,无法对交易者行为与情绪对股价的影响进行充分考量。我们把数据挖掘技术结合行为金融,更好地丰富股价操纵的理论研究。Shi和Sun等提出了一种基于交易数据的广义共谋交易者检测方法,研究了交易网络中的集团,发现操纵股票中的集团数量和权重大于非操纵股票中的集团数量和权重,进一步提出了一种基于集团权重的共谋交易者检测方法,结果表明,该方法能有效区分操纵股票和串通交易者。我们前期针对市场操纵行为的数据特性,利用数据挖掘技术建模进行研究,取得较优异的实证分析结果,但仍局限于利用传统市场变量对操纵行为进行诊断分析。