trader-ml

tika/trader-ml

Fork 0

Commit Graph

Author	SHA1	Message	Date
Tika	ff8d58e1aa	Phase 4c-bis/4d : CNN Image vectorisé + Agent RL PPO + HMM persistence + scripts CNN Image (Phase 4c-bis) : - chart_renderer.py : renderer numpy vectorisé (boucle 64 bougies, pas 12 000 fenêtres) → 1 068 img/s, GIL libéré entre itérations, API réactive pendant l'entraînement - cnn_image_strategy_model.py : torch.set_num_threads(4) pour préserver l'event loop - trading.py : asyncio.create_task() au lieu de background_tasks → hot-reloads non-bloquants Agent RL PPO (Phase 4d) : - src/ml/rl/ : TradingEnv (gymnasium), PPOModel (Actor-Critic MLP, GAE), RLStrategyModel - src/strategies/rl_driven/ : RLDrivenStrategy (interface BaseStrategy complète) - Routes API : POST /train-rl, GET /train-rl/{job_id}, GET /rl-models - docs/RL_STRATEGY_GUIDE.md : documentation complète HMM Persistence : - regime_detector.py : save()/load()/needs_retrain()/is_trained (joblib + JSON meta) - trading.py /ml/status : charge depuis disque si < 24h, re-entraîne + sauvegarde sinon → premier appel ~2s, appels suivants < 100ms Scripts utilitaires : - scripts/compare_strategies.py : backtest comparatif toutes stratégies (tabulate/JSON) - scripts/quick_benchmark.py : comparaison wf_accuracy/precision des modèles ML sauvegardés - reports/ : répertoire pour les rapports JSON générés Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-10 22:40:52 +00:00

Author

SHA1

Message

Date

Tika

ff8d58e1aa

Phase 4c-bis/4d : CNN Image vectorisé + Agent RL PPO + HMM persistence + scripts

CNN Image (Phase 4c-bis) :
- chart_renderer.py : renderer numpy vectorisé (boucle 64 bougies, pas 12 000 fenêtres)
  → 1 068 img/s, GIL libéré entre itérations, API réactive pendant l'entraînement
- cnn_image_strategy_model.py : torch.set_num_threads(4) pour préserver l'event loop
- trading.py : asyncio.create_task() au lieu de background_tasks → hot-reloads non-bloquants

Agent RL PPO (Phase 4d) :
- src/ml/rl/ : TradingEnv (gymnasium), PPOModel (Actor-Critic MLP, GAE), RLStrategyModel
- src/strategies/rl_driven/ : RLDrivenStrategy (interface BaseStrategy complète)
- Routes API : POST /train-rl, GET /train-rl/{job_id}, GET /rl-models
- docs/RL_STRATEGY_GUIDE.md : documentation complète

HMM Persistence :
- regime_detector.py : save()/load()/needs_retrain()/is_trained (joblib + JSON meta)
- trading.py /ml/status : charge depuis disque si < 24h, re-entraîne + sauvegarde sinon
  → premier appel ~2s, appels suivants < 100ms

Scripts utilitaires :
- scripts/compare_strategies.py : backtest comparatif toutes stratégies (tabulate/JSON)
- scripts/quick_benchmark.py : comparaison wf_accuracy/precision des modèles ML sauvegardés
- reports/ : répertoire pour les rapports JSON générés

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>

2026-03-10 22:40:52 +00:00

1 Commits