短期/量化投资对个人投资者是否可行 —— 一份工程师视角的冷静研究

⚠️ 免责声明:本研究为量化/短期交易方法与可行性的探讨。所有回测均为历史模拟, 不代表未来收益,不构成任何投资建议。真实交易受流动性、冲击成本、税费、心理与执行误差影响, 结果通常比回测更差。量化与短期交易可致重大本金亏损。读者需自行承担一切决策后果。

本报告每一个数字都能在对应 POC notebook 的某个 cell 复现;数据缓存于 data/*.csv,可离线重跑。


TL;DR(先给结论,再给证据)

写给「有十年工程背景、能写代码、但非金融科班」的你:

  1. 高频/日内交易对个人 = No。 不是态度问题,是数学问题。一个准日内策略(年换手250次), 光是抵消交易成本,A股就需要每年 50.5%、美股 10% 的超额收益(见 §4、notebook 04)。 这超过绝大多数顶级机构的长期水平。个人靠它稳定盈利,统计上接近不可能。
  2. 中低频系统化/因子量化对个人 = 可学,但别幻想。 它是一项高风险技能投资, 预期不是「躺赚」,而是「大概率跑不赢指数定投,但能让你彻底看懂市场、不再被割」。
  3. 对绝大多数读者(业余 + 中小资金)= 最优解是被动定投 + 资产配置 + 规则化再平衡。 把省下的时间投到主业/高时薪技能上——那才是个人最大的、确定性最高的 alpha。
  4. 硬证据:在我们刻意挑选的、过去十年最有利于多头的标的上,用偏乐观的成本假设, 主动择时策略跑赢「买入持有」的比例是 0/24(0%),超额收益中位数 −9.4 个百分点(notebook 04)。

一句话:做量化最大的收益,往往是让你下决心「不做」主动量化。


1. 量化/短期交易到底是什么:哪些个人玩得起

「量化」是个被营销污染的词。按频率逻辑拆开看,对个人的可行性天差地别:

类型 持仓周期 核心资源需求 个人可行性
高频交易 (HFT) 微秒~秒 托管机房(co-location)、专线、FPGA、tick数据、做市资格 ❌ 完全不可行。你的对手是花上亿建低延迟的机构,物理层就输了
日内/统计套利 分钟~日内 低延迟、高质量分钟/tick数据、强工程、对冲账户 ❌ 基本不可行。成本×换手直接判死刑(§4)
趋势/动量(中低频) 周~月 日线数据(免费可得)、回测能力、纪律 ⚠️ 可学。但难稳定跑赢被动(§3)
均值回归 日~周 同上 + 对「接飞刀」的风控 ⚠️ 可学。震荡市有效、趋势市受伤
因子选股(多因子) 月~季 全市场基本面+量价数据、横截面回测、组合优化 ⚠️ 门槛在数据。窄标的池=噪声(notebook 01)
被动指数 + 再平衡 季~年 几乎为零 ✅ 强烈推荐。零编程、零择时、成本≈0

关键认知:频率越高,你越是在和机构拼基础设施(延迟、数据、资金成本),个人毫无胜算; 频率越低,胜负越取决于判断力与纪律,个人才有一线机会——但那时你拼的已经不是「量化」, 而是「便宜、耐心、不犯错」。


2. 门槛盘点:钱、数据、算力、时间、知识

维度 业余可行档 认真做的最低配置 说明
资金 任意 建议 ≥50万(A股)/ ≥3万美元 资金太小,固定成本(数据/时间)摊不平;太大又有冲击成本
数据 免费日线(akshare/yfinance/腾讯) 付费分钟/tick、基本面、另类数据(¥数千~数万/年) 免费数据只够做中低频。日内必须买数据,这是第一道现金门槛
算力 一台笔记本 同左(中低频根本不吃算力) 别被「算力」唬住:中低频回测笔记本足够。真正稀缺的是干净数据
时间 持续投入,且时间是最大隐性成本 见 §6:你的时间按时薪折现,常常已超过策略的预期收益
知识 编程✅ 编程 + 统计 + 金融 + 交易微观结构 「能写代码」只是 1/4。最容易被忽略的是微观结构(成本/滑点/冲击)

工程师最容易高估自己的地方:以为「能写代码」就够了。 写出信号从来不是难点(notebook 01 用十几行就构造了四类信号)。 难的是统计上分辨真信号与噪声(notebook 03)、以及把成本/微观结构算进去(notebook 02)。 这两块恰恰是金融科班和实盘老手的护城河。


3. 可落地平台/工具

3.1 国内 A股

平台 类型 门槛 实盘对接 费用
聚宽 JoinQuant 云回测+模拟 低,注册即用 仿真为主,实盘需券商 基础免费,数据/实盘增值收费
米筐 RiceQuant 云回测 机构向实盘 个人免费档有限
掘金量化 客户端+实盘 对接多家券商 软件免费,数据收费
vnpy 开源框架 (自己搭) CTP(期货)/部分券商 免费,但运维全自理
QMT / Ptrade 券商实盘终端 :多数要求资产≥50万开通 真·实盘API 随券商;这是A股个人实盘量化的主通道
Backtrader / 本地 开源回测 需自接 免费

A股实盘的现实门槛:散户做程序化交易,主流路径是券商的 QMT/Ptrade,多数券商要求 金融资产 ≥50万 才开通;否则只能手动或半自动。这是一道硬门槛。

3.2 美股

平台 类型 门槛 说明
Interactive Brokers (IBKR) API 实盘券商 低-中 全球最主流的个人量化实盘通道,API成熟,费率低
Alpaca 实盘券商 REST API、零佣金、对开发者友好,适合起步
QuantConnect 云回测+实盘 多资产、自带数据、可一键实盘(LEAN引擎)
backtrader / zipline-reloaded / vectorbt 开源回测 本地回测;vectorbt 向量化快,适合参数扫描

美股对个人远比 A股友好:IBKR/Alpaca 开户门槛低、API 成熟、零佣金、无印花税。 本研究的回测引擎与 IBKR/Alpaca 的对接逻辑一致(信号→下单→成交→记账)。


4. 真实成本:成本如何吃掉短期策略的毛收益

这是整个可行性论证的数学核心。 详见 notebook 02。

4.1 真实费率(本研究采用,且偏乐观)

项目 A股 美股(零佣券商)
佣金 0.025%/边 ≈0
印花税 0.05% 卖出单边(2023.8 起现行值)
过户费 0.001%/边
滑点(保守) 0.05%/边 0.02%/边
单次往返合计 ≈0.202% ≈0.040%

这还没算:大单冲击成本、资金费率、盈利的资本利得税。真实只会更贵。

4.2 成本拖累铁律:拖累 ≈ 年换手 × 单次成本

notebook 02 把所有策略画到「年换手 vs 成本拖累」平面,所有点几乎落在一条过原点的射线上—— 没有魔法。换手越高,成本这把刀削收益越快;A股因印花税+更高滑点,同换手下拖累更重。

4.3 盈亏平衡所需的「超额能力」(notebook 04)

反过来问:给定换手,光抵消成本需要多少年化超额?

年换手 频率档 A股需年化alpha 美股需年化alpha
2 周/月级 0.4% 0.1%
5 双周级 1.0% 0.2%
12 月内多次 2.4% 0.5%
50 每周 10.1% 2.0%
250 准日内 50.5% 10.0%

这张表就是「短线难」的定量判决:年换手250的准日内策略,A股光成本就要求每年50%以上的 超额收益才不亏。顶级量化机构长期年化也就20-40%且波动巨大——指望个人靠日内稳定跑出50%, 在统计上接近不可能。高频/日内对个人 = No,是算出来的。

4.4 实证:含成本后还剩多少(notebook 02)

以 SPY 双均线(20/60)为例: - 买入持有:年化 11.19%,夏普 0.70 - 双均线·不含成本:年化 5.92%,夏普 0.56 - 双均线·含成本:年化 5.82%,夏普 0.55

注意:这里成本影响不大(换手仅~4.5倍),但即便不含成本,主动择时也跑输了买入持有。 这引出 §6 的核心结论。换成高换手策略,成本会进一步系统性削平收益。


5. 回测的陷阱(最容易被营销忽悠的部分)

营销话术几乎全建立在以下陷阱上。notebook 03 对每个都做了可视化 demo 证明它有多坑

5.1 过拟合 / 数据窥探

在样本内(2014-2019)对双均线参数做网格搜索,挑出夏普最高的(40,120),样本内夏普0.96, 热力图一片漂亮。但搬到样本外(2020-2024):夏普跌到0.75,且跑输同期买入持有(0.83)。 热力图颜色斑驳说明夏普对参数极敏感——所谓「最优」只是拟合了历史噪声。 你试的参数越多,样本内越漂亮、样本外越靠不住。

5.2 前视偏差(最隐蔽,常是无意的代码bug)

同一个信号,仅把成交时点提前一天signal.shift(lag) 的 lag 从1改成0), 净值放大 25530 倍,夏普从 0.33 飙到 9.30——因为 lag=0 等于「在收盘前就知道收盘价」。 现实中它常以代码bug形式出现:用收盘价算信号又用同一收盘价成交、用了未来才公布的财报…… 任何「好到不真实」的回测,先怀疑前视偏差。一个 shift 的方向错误足以凭空造出圣杯。

5.3 多重检验 / 幸存者偏差

生成 500 个纯随机多空策略作用在真实 SPY 上:夏普均值≈0,但仍有 14 个夏普>0.5 「看起来能交易」——纯属运气。如果某大V/课程只给你看回测最好的那个策略(不告诉你他试了多少个), 你看到的就是这批幸运儿。推论: - 公开的「年化50%策略」≈ 幸存者;失败的99个不会有人晒。 - 实盘业绩榜上的明星基金,也是几千只里幸存下来的——别把运气当能力

5.4 回测可信度检查清单(可直接拿去审别人/自己的回测)

  1. 样本外:有从未参与调参的时段吗?OOS 垮不垮?
  2. 成本:含佣金/印花税/滑点了吗?换手多少?
  3. 前视:交易时点真能拿到这个数据吗?成交时点对齐了吗?
  4. 多重检验:试了多少参数/策略?只报最好的吗?
  5. 幸存者:标的池含退市/失败者吗?还是只挑了事后赢家?
  6. 再现性:固定 seed 了吗?换区间/标的还成立吗?

任何一条不过关,这个回测就不可信。


6. 诚实的结论:分情景建议

6.1 核心硬数据(notebook 04)

6.2 分情景矩阵(资金 × 时间)

<50万 50万–300万 >300万
业余 (<5h/周) 🔴 指数定投+再平衡,别碰主动量化 🔴 定投为主,小仓位练手当学费 🟡 低频因子/趋势可一试,仍以被动为底仓
认真 (5–15h/周) 🔴 主动量化是负EV 🟡 可做低频系统化,严控换手与成本 🟡 可搭半专业流程,仍难稳定超额
全职 (>30h/周) 🔴 时间错配 🟡 低频量化+另类数据,值得认真投入 🟢 唯一相对可行档:全职+资金+工程,但仍九死一生

🔴 不值得做 🟡 谨慎、当技能投资 🟢 相对可行(仍高风险)

绿区只有一格:全职 + >300万资金 + 工程能力,且仍是「低频为主、九死一生」。 绝大多数个人落在红/黄区:主动量化大概率是负期望值游戏,最优解是被动定投 + 规则化再平衡。

6.3 如果你仍想做:第一周最小起步清单(notebook 04 详版)

  1. 环境:跑通本研究 00–03 notebook,确认每个数字能复现。
  2. 基准:先用真钱开一个指数定投账户——这是你日后所有策略的及格线。
  3. 一个策略走全流程:只做最简单的(如双均线),强制含成本、留样本外、固定seed, 用 §5.4 清单逐项自查。
  4. 纸上模拟:接券商模拟盘(IBKR/Alpaca paper 或 QMT/Ptrade 模拟),记录与回测的偏差。
  5. 复盘时薪:算这周时间按时薪折现是多少?策略预期年收益覆盖得了吗?

核心纪律:先用最小资金验证「流程」,而不是用大资金验证「信仰」。

6.4 何时该止损放弃(量化 KILL 判据)

判据 阈值
样本外失效 实盘/模拟3-6个月,夏普 < 回测的一半
跑不赢懒人基准 连续12个月,扣时间成本后跑不赢指数定投
时薪为负 投入时间×合理时薪 > 策略年化超额金额
回撤越线 实盘回撤 > 回测的1.5倍或你的心理承受线
成本黑洞 实际成本吃掉 >50% 毛收益

开始前就把这些写进策略文档。没有预设止损线 = 用亏损慢慢说服自己「再等等」。

6.5 预期胜率 / 可持续性(不画大饼)


7. 数据与方法(可复现性)


报告完。所有论断均由 0004 notebook 的真实回测数据支撑;任何数字可在对应 cell 复现。