什么是量化投资?

  • 量化投资就是策略开发的过程
  • 本质:从数据中找规律
  • 规律随着时间和市场客观变化会失效
  • 可靠的规律特点:长期存在的规律;有理论支撑的规律;符合人性的规律;简单的规律
  • 越不成熟的市场,量化投资越有效

量化投资的分类

  • 择时策略
  • 标的选择策略
  • 仓位管理
  • 其它:套利、算法交易、高频交易等

数据的分类

  • 标的交易数据
  • 宏观经济数据
  • 财务数据:
    • 基本面数据
    • 资产负债表(来自企业年度报表等)
    • 重要的量化投资数据源
  • 高频数据
    • 分笔数据
      • 时间级别(秒、分、小时)
      • 笔数、成交额
      • 盘口数据
    • 逐笔数据
      • 时间
      • 价格
      • 交易方向(B或S)
      • 交易额
      • 高频交易策略基本基于逐笔数据制定策略
  • 舆情数据
    • 交易者情绪
    • 恐惧与贪婪
    • 利用人工智能+爬虫的方式进行科学分析
  • 事件数据
    • 拆股或高转送
      • 例如A股“填权行情”,即高转送之后会有一波上涨
    • 管理层变动
    • 分析师修改标的预测

量化投资资料:书籍

  • 《海龟交易法则》
  • 《解读量化投资:西蒙斯》
  • 《量化投资》丁鹏(仅解读基础知识,细节有问题)
  • 《宽客人生》

量化投资资料:研报

  • 分析师研究报告
    • 新财富网每年底会有分析师排名
    • 金融工程行业分析师排名
    • 券商研报是国内最前沿的研究成果

Why Python?

  • 万能
  • 学得快、写的快
  • life is short, live it (use python)
  • 即将成为量化领域的标准配置

关于 Pandas

  • python的一个数据分析第三方库
  • 作者 Wes McKinney,http://wesmckinney.com,著有《Python for Data Analysis》
  • 2012年Pandas开始流行于金融、生物、物理、统计领域
  • 专门处理表格型的数据
  • 专门处理金融数据
  • 快、很多方法使用C实现
  • Pandas 的名字来源于 “Panel Data”

数据分类

  • 时间序列数据(time series data)
    • 例如:某个标的物(石油、股票、黄金、数字货币)从上市开始每天的交易数据
  • 横截面数据(cross-section data)
    • 例如:某个市场(石油、股票、黄金、数字货币)在某个特定时间的所有股票交易数据
  • 面板数据(panel data)
    • 例如:某个市场(石油、股票、黄金、数字货币)在某个特定时间段(日、月、季、年)的所有标的的交易数据