量化投资学习笔记1
什么是量化投资?
- 量化投资就是策略开发的过程
- 本质:从数据中找规律
- 规律随着时间和市场客观变化会失效
- 可靠的规律特点:长期存在的规律;有理论支撑的规律;符合人性的规律;简单的规律
- 越不成熟的市场,量化投资越有效
量化投资的分类
- 择时策略
- 标的选择策略
- 仓位管理
- 其它:套利、算法交易、高频交易等
数据的分类
- 标的交易数据
- 宏观经济数据
- 财务数据:
- 基本面数据
- 资产负债表(来自企业年度报表等)
- 重要的量化投资数据源
- 高频数据
- 分笔数据
- 时间级别(秒、分、小时)
- 笔数、成交额
- 盘口数据
- 逐笔数据
- 时间
- 价格
- 交易方向(B或S)
- 交易额
- 高频交易策略基本基于逐笔数据制定策略
- 分笔数据
- 舆情数据
- 交易者情绪
- 恐惧与贪婪
- 利用人工智能+爬虫的方式进行科学分析
- 事件数据
- 拆股或高转送
- 例如A股“填权行情”,即高转送之后会有一波上涨
- 管理层变动
- 分析师修改标的预测
- 拆股或高转送
量化投资资料:书籍
- 《海龟交易法则》
- 《解读量化投资:西蒙斯》
- 《量化投资》丁鹏(仅解读基础知识,细节有问题)
- 《宽客人生》
量化投资资料:研报
- 分析师研究报告
- 新财富网每年底会有分析师排名
- 金融工程行业分析师排名
- 券商研报是国内最前沿的研究成果
Why Python?
- 万能
- 学得快、写的快
- life is short, live it (use python)
- 即将成为量化领域的标准配置
关于 Pandas
- python的一个数据分析第三方库
- 作者 Wes McKinney,http://wesmckinney.com,著有《Python for Data Analysis》
- 2012年Pandas开始流行于金融、生物、物理、统计领域
- 专门处理表格型的数据
- 专门处理金融数据
- 快、很多方法使用C实现
- Pandas 的名字来源于 “Panel Data”
数据分类
- 时间序列数据(time series data)
- 例如:某个标的物(石油、股票、黄金、数字货币)从上市开始每天的交易数据
- 横截面数据(cross-section data)
- 例如:某个市场(石油、股票、黄金、数字货币)在某个特定时间的所有股票交易数据
- 面板数据(panel data)
- 例如:某个市场(石油、股票、黄金、数字货币)在某个特定时间段(日、月、季、年)的所有标的的交易数据