您好,欢迎光临花生网![请登录] [免费注册] 我的花生地|帮助|服务中心|网站导航|繁体中文
  • 打印
  • 字号

金融高频数据的概念及特征

欢迎发表评论 2012-9-5 08:34   编辑:queena
      经济金融领域研究的“高频数据”、“超高频数据”、“低频数据”主要是根据计量单位来做区分的。金融“高频数据”( high - frequency data)特指日内数据( high- frequency intra - daily data),即主要以小时、分钟或秒为采集频率的数据;“低频数据”通常指以天、周、月、年作为计量单位的数据;而金融“超高频数据”则是对交易过程实时采集的数据( tick-by-tick data),即按照每笔交易的发生逐笔记录的数据。这里需要注意的是,超高频数据并不是抽样数据,而是全样本数据;不是等间隔数据,而是不等间隔且间隔随机的数据。
  从函数的观点来看,金融高频数据以时间t为自变量,ti指时刻i,并假定△ti=ti-ti-1等间隔;而超高频数据则以交易为自变量,ti=t(i)指第i次交易的时刻,△ti=ti-ti-l是两次交易的时间间隔,往往是不等间隔的。
  应该注意到,首先,实际交易时间与模型时间(钟表时间)的这种不一致性在超高频数据中还表现为,在同一市场上,多笔交易同时发生,甚至可以同时以不同的价格成交,即“同一时刻的交易可能会因为交易系统或数据传输等原因从而在不同的时刻发布出去;而不同时刻的交易也可能在同一时刻被合并称同一数据被发布”。从这个角度来讲,以秒来计量时间都已经是非常大的尺度了。其次,金融高频数据和超高频数据的价格都是离散的(price dis-creteness)。这是因为交易所对最小交易价格单位有限制,所以每笔成交价格只能是最小交易价格(tick size)的整数倍。我们通常遇到的时间序列、连续时间金融,其区别主要是自变量(时间)是否离散,因变量(x(t))的取值都是在整个实数域或大于0的部分.而这里的离散价格意味着因变量的取值是离散的。第三,与低频数据相比,金融高频数据的质量往往并不高(大规模数据的基本特征),因为交易数据会因种种原因而缺失,某些交易的确切时间也不见得准确,而且还有微结构噪音等因素干扰。所以,在进行金融高频数据挖掘之前,数据预处理工作仍然是非常重要的环节。而了解清楚市场是如何运作的、数据是如何产生的,无疑对数据预处理有非常大的助益。

我要评论

验证问答 换一个 验证码 换一个



Copyright©广州新博庭网络信息科技股份有限公司 粤ICP备11107430号 All Rights Reserved 版权所有 复制必究

合作联系邮箱: sueiyou@126.com

地址:广州市天河区花城大道667号美林基业大厦1201

回顶部