import numpy as np, pandas as pd, matplotlib.pyplot as plt
import qr_data as q, qr_bt as bt
bt.setup_chinese_font(); np.random.seed(42)
data=q.load_all(verbose=False)

px=data['QQQ']['close']
IS=px.loc[:'2019-12-31']; OOS=px.loc['2020-01-01':]
fasts=range(5,55,5); slows=range(60,210,10)
heat=pd.DataFrame(index=list(fasts),columns=list(slows),dtype=float)
best=(-9,None)
for f in fasts:
    for s in slows:
        sig=bt.sma_cross_signal(IS,f,s); b=bt.backtest(IS,sig,bt.COST_US)
        sh=bt.perf_stats(b['strat_ret']).get('夏普',np.nan); heat.loc[f,s]=sh
        if sh>best[0]: best=(sh,(f,s))
print('样本内最优参数:',best[1],'样本内夏普=%.2f'%best[0])
fig,ax=plt.subplots(figsize=(10,4.5))
im=ax.imshow(heat.values.astype(float),aspect='auto',cmap='RdYlGn',origin='lower')
ax.set_xticks(range(len(list(slows)))); ax.set_xticklabels(list(slows),fontsize=7)
ax.set_yticks(range(len(list(fasts)))); ax.set_yticklabels(list(fasts),fontsize=7)
ax.set_xlabel('慢线'); ax.set_ylabel('快线'); ax.set_title('QQQ 双均线 样本内(2014-2019)夏普热力图')
plt.colorbar(im); plt.tight_layout(); plt.show()

样本内最优参数: (40, 120) 样本内夏普=0.96

f,s=best[1]
# 用样本内最优参数，分别看 IS 和 OOS 表现
sigIS=bt.sma_cross_signal(IS,f,s); bIS=bt.backtest(IS,sigIS,bt.COST_US)
sigOOS=bt.sma_cross_signal(px,f,s); bOOS_full=bt.backtest(px,sigOOS,bt.COST_US)
bOOS=bOOS_full.loc['2020-01-01':]
rows=[bt.perf_stats(bIS['strat_ret'],f'样本内 最优({f},{s})'),
      bt.perf_stats(bOOS['strat_ret'],f'样本外 同参数'),
      bt.perf_stats(OOS.pct_change(),'样本外 买入持有')]
display=bt.stats_table(rows)[['年化收益','夏普','最大回撤']]
print(display.to_string())
fig,ax=plt.subplots(1,2,figsize=(13,4.5))
ax[0].plot(bIS['equity'],color='green'); ax[0].set_title(f'样本内净值(参数{f},{s}) 夏普{best[0]:.2f}'); ax[0].set_yscale('log')
e=(1+bOOS['strat_ret']).cumprod(); bh=(1+OOS.pct_change()).cumprod()
ax[1].plot(e,color='red',label='同参数 样本外'); ax[1].plot(bh,color='black',label='买入持有')
ax[1].set_title('样本外: 漂亮参数失效'); ax[1].legend(); ax[1].set_yscale('log')
plt.tight_layout(); plt.show()

                  年化收益    夏普     最大回撤
名称                                   
样本内 最优(40,120)  13.61%  0.96  -21.18%
样本外 同参数         14.26%  0.75  -28.56%
样本外 买入持有        19.79%  0.83  -35.12%

px=data['SPY']['close']
# 同一个信号:「当日收盘上涨则持有」。
#   lag=1 => 用【昨日】涨跌决定今日仓位 = 合法的隔夜动量;
#   lag=0 => 用【今日】涨跌决定今日仓位 = 穿越(交易时点根本不知道今日收盘)。
sig=(px.pct_change()>0).astype(float)
b_ok  =bt.backtest(px,sig,bt.COST_ZERO,lag=1)   # 正确对齐
b_leak=bt.backtest(px,sig,bt.COST_ZERO,lag=0)   # 前视泄漏
fig,ax=plt.subplots(1,2,figsize=(13,4.5))
ax[0].plot(b_ok['equity'],label='正确(用昨日信息)',color='black')
ax[0].plot((1+px.pct_change()).cumprod(),label='买入持有',color='gray',ls=':')
ax[0].set_title('SPY 合法隔夜动量(无前视)'); ax[0].legend(); ax[0].set_yscale('log')
ax[1].plot(b_leak['equity'],color='red',label='前视(偷看今日收盘)')
ax[1].plot(b_ok['equity'],color='black',label='正确')
ax[1].set_title('同一信号: 仅 lag 差一天'); ax[1].legend(); ax[1].set_yscale('log')
plt.tight_layout(); plt.show()
print('正确(lag=1)净值   %.2f  夏普 %.2f'%(b_ok['equity'].iloc[-1],bt.perf_stats(b_ok['strat_ret'])['夏普']))
print('前视(lag=0)净值   %.3e  夏普 %.2f  <- 只把成交时点提前一天'%(b_leak['equity'].iloc[-1],bt.perf_stats(b_leak['strat_ret'])['夏普']))
print('放大倍数         %.0fx'%(b_leak['equity'].iloc[-1]/b_ok['equity'].iloc[-1]))

正确(lag=1)净值   1.39  夏普 0.33
前视(lag=0)净值   3.555e+04  夏普 9.30  <- 只把成交时点提前一天
放大倍数         25530x

px=data['SPY']['close']; ret=px.pct_change().fillna(0)
N=500; T=len(px); rng=np.random.default_rng(7)
sharpes=[]; best_eq=None; best_sh=-9
for i in range(N):
    pos=pd.Series(np.where(rng.random(T)<0.5,1.0,-1.0),index=px.index)
    sr=(pos.shift(1).fillna(0)*ret)
    s=bt.perf_stats(sr).get('夏普',np.nan)
    sharpes.append(s)
    if s>best_sh: best_sh=s; best_eq=(1+sr).cumprod()
sharpes=np.array(sharpes)
print(f'{N}个随机策略 夏普: 均值{sharpes.mean():.2f} 最大{sharpes.max():.2f} 最小{sharpes.min():.2f}')
print(f'其中夏普>0.5("看起来可交易")的有 {(sharpes>0.5).sum()} 个，纯属运气')
fig,ax=plt.subplots(1,2,figsize=(13,4.5))
ax[0].hist(sharpes,bins=30,color='steelblue',edgecolor='white')
ax[0].axvline(sharpes.max(),color='red',ls='--',label=f'最佳={sharpes.max():.2f}')
ax[0].axvline(0,color='black',lw=0.8); ax[0].set_title(f'{N}个随机策略的夏普分布'); ax[0].legend(); ax[0].set_xlabel('夏普')
ax[1].plot(best_eq,color='red',label=f'"最佳"随机策略 夏普{best_sh:.2f}')
ax[1].plot((1+ret).cumprod(),color='black',label='SPY买入持有')
ax[1].set_title('只展示最佳的那个: 看起来很能打'); ax[1].legend(); plt.tight_layout(); plt.show()

500个随机策略 夏普: 均值-0.02 最大0.76 最小-0.83
其中夏普>0.5("看起来可交易")的有 14 个，纯属运气

fig,ax=plt.subplots(figsize=(9,4))
for n in [10,50,200,1000]:
    mx=[max(rng.normal(0,sharpes.std(),n)) for _ in range(300)]
    ax.scatter([n]*len(mx),mx,alpha=0.15,s=8)
ax.set_xscale('log'); ax.set_xlabel('尝试的策略个数 N(对数)'); ax.set_ylabel('最佳夏普(随机噪声)')
ax.set_title('试得越多, 越能"挖到"高夏普——哪怕全是噪声'); plt.tight_layout(); plt.show()

03 · 回测陷阱实证¶

陷阱一 · 过拟合（样本内调参，样本外崩盘）¶

陷阱二 · 前视偏差（偷看未来）¶

陷阱三 · 多重检验 / 幸存者偏差（随机也能挑出明星）¶

补充 · 为什么「随机也能赢」：理论上界¶

小结：回测可信度检查清单¶