제목: Sparceiver: A Sparse Transformer for Mitigating Catastrophic Forgetting through Reducing Gradient Confusion
날짜: 2024년 9월 26일 오후 12시
내용: Sparceiver를 이용한 비독립적 분포 조건에서 Gradient Confusion 최소화 및 모델 적응력 향상 원리와 성능 개선 소개