모델의 능력 차원 상관관계를 탐색하는 연구에 대한 논의.
31B 모델에 대한 targeted SFT 실험에서 특정 능력 차원이 지속적으로 낮은 점수를 기록하고 있습니다. 이를 바탕으로, 대조적인 변형을 훈련하여 차이를 분석하고, 능력 간 인과 관계 그래프를 구축하려는 시도가 진행되고 있습니다. 이 그래프를 활용하여 향후 훈련 순서를 최적화하려는 계획입니다. 연구자들은 기계 해석을 통해 다음 훈련 전략을 결정하는 방법에 대한 아이디어를 공유하고자 합니다.
Discussion on exploring capability dimension interdependencies in model training.
Experiments on targeted SFT for a 31B model indicate that one specific capability dimension consistently scores low. In response, the researcher plans to train contrastive variants to analyze the differences and build a causal dependency graph of how capabilities interact within the model. This graph aims to optimize future training strategies by identifying which dimensions influence each other. The researcher is seeking insights on iterative targeted SFT and contrastive ablation techniques.