⚠️ 免责声明:本研究为量化/短期交易方法与可行性的探讨。所有回测均为历史模拟, 不代表未来收益,不构成任何投资建议。真实交易受流动性、冲击成本、税费、心理与执行误差影响, 结果通常比回测更差。量化与短期交易可致重大本金亏损。读者需自行承担一切决策后果。
本报告每一个数字都能在对应 POC notebook 的某个 cell 复现;数据缓存于
data/*.csv,可离线重跑。
写给「有十年工程背景、能写代码、但非金融科班」的你:
一句话:做量化最大的收益,往往是让你下决心「不做」主动量化。
「量化」是个被营销污染的词。按频率和逻辑拆开看,对个人的可行性天差地别:
| 类型 | 持仓周期 | 核心资源需求 | 个人可行性 |
|---|---|---|---|
| 高频交易 (HFT) | 微秒~秒 | 托管机房(co-location)、专线、FPGA、tick数据、做市资格 | ❌ 完全不可行。你的对手是花上亿建低延迟的机构,物理层就输了 |
| 日内/统计套利 | 分钟~日内 | 低延迟、高质量分钟/tick数据、强工程、对冲账户 | ❌ 基本不可行。成本×换手直接判死刑(§4) |
| 趋势/动量(中低频) | 周~月 | 日线数据(免费可得)、回测能力、纪律 | ⚠️ 可学。但难稳定跑赢被动(§3) |
| 均值回归 | 日~周 | 同上 + 对「接飞刀」的风控 | ⚠️ 可学。震荡市有效、趋势市受伤 |
| 因子选股(多因子) | 月~季 | 全市场基本面+量价数据、横截面回测、组合优化 | ⚠️ 门槛在数据。窄标的池=噪声(notebook 01) |
| 被动指数 + 再平衡 | 季~年 | 几乎为零 | ✅ 强烈推荐。零编程、零择时、成本≈0 |
关键认知:频率越高,你越是在和机构拼基础设施(延迟、数据、资金成本),个人毫无胜算; 频率越低,胜负越取决于判断力与纪律,个人才有一线机会——但那时你拼的已经不是「量化」, 而是「便宜、耐心、不犯错」。
| 维度 | 业余可行档 | 认真做的最低配置 | 说明 |
|---|---|---|---|
| 资金 | 任意 | 建议 ≥50万(A股)/ ≥3万美元 | 资金太小,固定成本(数据/时间)摊不平;太大又有冲击成本 |
| 数据 | 免费日线(akshare/yfinance/腾讯) | 付费分钟/tick、基本面、另类数据(¥数千~数万/年) | 免费数据只够做中低频。日内必须买数据,这是第一道现金门槛 |
| 算力 | 一台笔记本 | 同左(中低频根本不吃算力) | 别被「算力」唬住:中低频回测笔记本足够。真正稀缺的是干净数据 |
| 时间 | — | 持续投入,且时间是最大隐性成本 | 见 §6:你的时间按时薪折现,常常已超过策略的预期收益 |
| 知识 | 编程✅ | 编程 + 统计 + 金融 + 交易微观结构 | 「能写代码」只是 1/4。最容易被忽略的是微观结构(成本/滑点/冲击) |
工程师最容易高估自己的地方:以为「能写代码」就够了。 写出信号从来不是难点(notebook 01 用十几行就构造了四类信号)。 难的是统计上分辨真信号与噪声(notebook 03)、以及把成本/微观结构算进去(notebook 02)。 这两块恰恰是金融科班和实盘老手的护城河。
| 平台 | 类型 | 门槛 | 实盘对接 | 费用 |
|---|---|---|---|---|
| 聚宽 JoinQuant | 云回测+模拟 | 低,注册即用 | 仿真为主,实盘需券商 | 基础免费,数据/实盘增值收费 |
| 米筐 RiceQuant | 云回测 | 低 | 机构向实盘 | 个人免费档有限 |
| 掘金量化 | 客户端+实盘 | 中 | 对接多家券商 | 软件免费,数据收费 |
| vnpy | 开源框架 | 高(自己搭) | CTP(期货)/部分券商 | 免费,但运维全自理 |
| QMT / Ptrade | 券商实盘终端 | 高:多数要求资产≥50万开通 | 真·实盘API | 随券商;这是A股个人实盘量化的主通道 |
| Backtrader / 本地 | 开源回测 | 中 | 需自接 | 免费 |
A股实盘的现实门槛:散户做程序化交易,主流路径是券商的 QMT/Ptrade,多数券商要求 金融资产 ≥50万 才开通;否则只能手动或半自动。这是一道硬门槛。
| 平台 | 类型 | 门槛 | 说明 |
|---|---|---|---|
| Interactive Brokers (IBKR) API | 实盘券商 | 低-中 | 全球最主流的个人量化实盘通道,API成熟,费率低 |
| Alpaca | 实盘券商 | 低 | REST API、零佣金、对开发者友好,适合起步 |
| QuantConnect | 云回测+实盘 | 低 | 多资产、自带数据、可一键实盘(LEAN引擎) |
| backtrader / zipline-reloaded / vectorbt | 开源回测 | 中 | 本地回测;vectorbt 向量化快,适合参数扫描 |
美股对个人远比 A股友好:IBKR/Alpaca 开户门槛低、API 成熟、零佣金、无印花税。 本研究的回测引擎与 IBKR/Alpaca 的对接逻辑一致(信号→下单→成交→记账)。
这是整个可行性论证的数学核心。 详见 notebook 02。
| 项目 | A股 | 美股(零佣券商) |
|---|---|---|
| 佣金 | 0.025%/边 | ≈0 |
| 印花税 | 0.05% 卖出单边(2023.8 起现行值) | 无 |
| 过户费 | 0.001%/边 | 无 |
| 滑点(保守) | 0.05%/边 | 0.02%/边 |
| 单次往返合计 | ≈0.202% | ≈0.040% |
这还没算:大单冲击成本、资金费率、盈利的资本利得税。真实只会更贵。
notebook 02 把所有策略画到「年换手 vs 成本拖累」平面,所有点几乎落在一条过原点的射线上—— 没有魔法。换手越高,成本这把刀削收益越快;A股因印花税+更高滑点,同换手下拖累更重。
反过来问:给定换手,光抵消成本需要多少年化超额?
| 年换手 | 频率档 | A股需年化alpha | 美股需年化alpha |
|---|---|---|---|
| 2 | 周/月级 | 0.4% | 0.1% |
| 5 | 双周级 | 1.0% | 0.2% |
| 12 | 月内多次 | 2.4% | 0.5% |
| 50 | 每周 | 10.1% | 2.0% |
| 250 | 准日内 | 50.5% | 10.0% |
这张表就是「短线难」的定量判决:年换手250的准日内策略,A股光成本就要求每年50%以上的 超额收益才不亏。顶级量化机构长期年化也就20-40%且波动巨大——指望个人靠日内稳定跑出50%, 在统计上接近不可能。高频/日内对个人 = No,是算出来的。
以 SPY 双均线(20/60)为例: - 买入持有:年化 11.19%,夏普 0.70 - 双均线·不含成本:年化 5.92%,夏普 0.56 - 双均线·含成本:年化 5.82%,夏普 0.55
注意:这里成本影响不大(换手仅~4.5倍),但即便不含成本,主动择时也跑输了买入持有。 这引出 §6 的核心结论。换成高换手策略,成本会进一步系统性削平收益。
营销话术几乎全建立在以下陷阱上。notebook 03 对每个都做了可视化 demo 证明它有多坑。
在样本内(2014-2019)对双均线参数做网格搜索,挑出夏普最高的(40,120),样本内夏普0.96, 热力图一片漂亮。但搬到样本外(2020-2024):夏普跌到0.75,且跑输同期买入持有(0.83)。 热力图颜色斑驳说明夏普对参数极敏感——所谓「最优」只是拟合了历史噪声。 你试的参数越多,样本内越漂亮、样本外越靠不住。
同一个信号,仅把成交时点提前一天(signal.shift(lag) 的 lag 从1改成0),
净值放大 25530 倍,夏普从 0.33 飙到 9.30——因为 lag=0 等于「在收盘前就知道收盘价」。
现实中它常以代码bug形式出现:用收盘价算信号又用同一收盘价成交、用了未来才公布的财报……
任何「好到不真实」的回测,先怀疑前视偏差。一个 shift 的方向错误足以凭空造出圣杯。
生成 500 个纯随机多空策略作用在真实 SPY 上:夏普均值≈0,但仍有 14 个夏普>0.5 「看起来能交易」——纯属运气。如果某大V/课程只给你看回测最好的那个策略(不告诉你他试了多少个), 你看到的就是这批幸运儿。推论: - 公开的「年化50%策略」≈ 幸存者;失败的99个不会有人晒。 - 实盘业绩榜上的明星基金,也是几千只里幸存下来的——别把运气当能力。
任何一条不过关,这个回测就不可信。
| <50万 | 50万–300万 | >300万 | |
|---|---|---|---|
| 业余 (<5h/周) | 🔴 指数定投+再平衡,别碰主动量化 | 🔴 定投为主,小仓位练手当学费 | 🟡 低频因子/趋势可一试,仍以被动为底仓 |
| 认真 (5–15h/周) | 🔴 主动量化是负EV | 🟡 可做低频系统化,严控换手与成本 | 🟡 可搭半专业流程,仍难稳定超额 |
| 全职 (>30h/周) | 🔴 时间错配 | 🟡 低频量化+另类数据,值得认真投入 | 🟢 唯一相对可行档:全职+资金+工程,但仍九死一生 |
🔴 不值得做 🟡 谨慎、当技能投资 🟢 相对可行(仍高风险)
绿区只有一格:全职 + >300万资金 + 工程能力,且仍是「低频为主、九死一生」。 绝大多数个人落在红/黄区:主动量化大概率是负期望值游戏,最优解是被动定投 + 规则化再平衡。
核心纪律:先用最小资金验证「流程」,而不是用大资金验证「信仰」。
| 判据 | 阈值 |
|---|---|
| 样本外失效 | 实盘/模拟3-6个月,夏普 < 回测的一半 |
| 跑不赢懒人基准 | 连续12个月,扣时间成本后跑不赢指数定投 |
| 时薪为负 | 投入时间×合理时薪 > 策略年化超额金额 |
| 回撤越线 | 实盘回撤 > 回测的1.5倍或你的心理承受线 |
| 成本黑洞 | 实际成本吃掉 >50% 毛收益 |
开始前就把这些写进策略文档。没有预设止损线 = 用亏损慢慢说服自己「再等等」。
data/*.csv。lag=1)防前视;含真实成本版用 §4.1 费率。qr_data.py(取数+复权修正+sanity check)、qr_bt.py(信号+回测+指标),
保证全研究数字同源、可离线复现。报告完。所有论断均由 00–04 notebook 的真实回测数据支撑;任何数字可在对应 cell 复现。