Agent Model Version Changelog: PPO iTransformer v1
JeTech 운용 후보 모델의 첫 iTransformer v1 preset과 gate 기준을 기록합니다.
요약
ppo_itransformer_v1은 JeTech agent registry 후보 모델을 만들기 위한 첫 iTransformer runtime preset입니다. run name은 모델을 식별하기 위한 최소 정보만 담고, 실제 학습 파라미터와 gate 결과는 run 폴더의 config.json, W&B config, 그리고 업로드된 model sidecar metadata에 남깁니다.
Run identity
| 항목 | 값 |
|---|---|
| Canonical run name | ppo_itransformer_v1_{symbol}_{YYYYMMDD_HHMMSS} |
| Algorithm | PPO, Stable-Baselines3 |
| Backbone | iTransformer feature extractor |
| Version | v1 |
| Current batch symbols | BTC, ETH, SOL, XRP, DOGE |
| Registry artifact scope | gate 통과 모델만 S3 registry 후보로 업로드 |
Runtime preset
| 파라미터 | 값 |
|---|---|
window_size | 128 |
encoder_hidden_size | 64 |
encoder_layers | 2 |
encoder_dropout | 0.1 |
transformer_num_heads | 4 |
transformer_ffn_dim | 128 |
features_dim | 64 |
policy_network | mlp |
value_network | mlp |
policy_hidden_dims | [64, 64] |
value_hidden_dims | [64, 64] |
Training defaults
| 항목 | 값 |
|---|---|
| Synthetic reference period | 5y |
| Reference interval | 1d |
| Episode length | 1000 |
| GAN innovation blend | 0.75 |
| Target rollout batch | 1024 |
| Eval frequency | rollout batch와 동일 |
| Total timesteps | 102400 |
| Current batch script | trading/agents/scripts/train_crypto_batch.sh |
| Batch repeat count | 심볼별 30회 |
n_envs와 n_steps는 실행 환경 CPU 수에 따라 자동 결정됩니다. 현재 배치 로그 기준으로는 n_envs=4, n_steps=256, rollout_batch=1024가 사용됩니다.
Risk and action controls
| 파라미터 | 값 |
|---|---|
target_exposure_deadband | 0.05 |
rebalance_deadband | 0.05 |
cooldown_bars | 2 |
drawdown_stop | 0.40 |
reward_turnover_penalty | 0.0005 |
reward_downside_penalty | 0.05 |
reward_running_drawdown_penalty | 0.005 |
reward_drawdown_increment_penalty | 0.50 |
Real evaluation and gate
학습 중 real eval은 최근 5y, 1d 데이터를 기준으로 평가합니다. 3개월 단위 20개 window의 수익률, MDD, Sharpe는 계속 기록하지만, registry 통과 여부는 아래 단일 기준으로 판단합니다.
| Gate 항목 | 값 |
|---|---|
| Gate mode | 5y_30d_avg_sharpe |
| Pass condition | 5Y 30d Avg Sharpe >= 1.0 |
| Rolling window | 30 daily returns |
| Annualization | 365 periods/year |
| Diagnostic windows | 20 x 3M, 통과 판단이 아닌 리포트용 |
통과한 모델의 .meta.json에는 gate.backtest_5y_rolling_sharpe_avg_30d, gate.min_backtest_5y_rolling_sharpe_avg_30d, gate.research_metrics가 포함됩니다. JeTech Lab의 운용모델 관리 화면은 이 sidecar metadata를 읽어 후보 모델의 5Y 30d Avg Sharpe 컬럼을 표시합니다.
W&B logging
W&B에는 train scalar 전체가 아니라 real eval 중심 지표가 올라갑니다.
real_eval/num_timestepsreal_eval/backtest_5y_rolling_sharpe_avg_30dreal_eval/backtest_5y_return_countreal_eval/mean_strategy_window_returnreal_eval/mean_market_window_returnreal_eval/mean_strategy_window_mddreal_eval/mean_market_window_mddreal_eval/mean_strategy_window_sharpereal_eval/sharpe_window_countreal_eval/sharpe_window_ratio
Change log
| 날짜 | 변경 |
|---|---|
| 2026-05-02 | ppo_itransformer_v1 batch preset 문서화 |
| 2026-05-02 | registry gate를 3개월 window count 기준에서 5Y 30d Avg Sharpe >= 0.5 기준으로 전환 |
| 2026-05-04 | registry gate pass threshold를 5Y 30d Avg Sharpe >= 1.0으로 상향 |
| 2026-05-02 | 후보 모델 테이블 표시 지표를 5Y 30d Avg Sharpe로 통일 |