[논문 전문] : https://onlinelibrary.wiley.com/doi/abs/10.1002/er.7013
[출처] Jinghua Sun, Ankun Gu, Josef Kainz, A solution framework for the experimental data shortage problem of lithium-ion batteries: Generative adversarial network-based data augmentation for battery state estimation, Journal of Energy Chemistry, Volume 103, 2025, Pages 476-497, ISSN 2095-4956, https://doi.org/10.1016/j.jechem.2024.12.010.
※ The picture and content of this article are from the original paper.
All picture and figures used in this article are sourced from publicily available on the internet.
[논문 요약]
A solution framework for the experimental data shortage problem of lithium-ion batteries : Generative adversarial network-based data augmentation for battery state estimation
본 논문은 GAN을 활용하여 배터리 데이터를 생성하고, SOH Estimation에 사용하는 연구입니다.
올해 Publish된 따끈따끈한 논문이기도하고, 저자가 배터리에 AI를 사용하는 부분에 있어 저와 의견을 같이하는 부분들이 많아 한번 정리해보았습니다.
Contents

본 논문은 배터리 데이터 생성을 한다고해서 복잡한 충방전 프로파일에서의 V,I,T를 Generation 하는 연구는 아닙니다.
논문의 제목과 마찬가지로, 결국 SOH를 Estimation 하는것이 최종 목적이기에, 그것을 하기 위해 필요한 데이터 조건을 선별하고 생성하는것이 목적입니다.
저자가 본 논문의 프레임 워크에 명명한 이름은 굉장히 긴데요 W-DC-GAN-GP-TL 입니다;;
(Wasserstein Deep Convolutional - GAN - with Gradient Penalty and Transfer Learning)
GAN 연구하는 사람들이 봤을땐 별건 아닙니다 W-GAN-GP야 워낙 바이블 같이 쓰여지는 기본적인 테크닉이고, GAN의 Generator와 Discriminator에 2D-CNN을 Deep하게 썼다는것, 그리고 이후 Framework에서 Transfer Learning을 쓴다는 단순한 이야기입니다.
본 논문에서는 GAN에 새로운 Loss Term을 추가하는 방식은 아닙니다. DC-GAN 이라는것도 예전부터 쓰이던 방식이고 WGAN-GP는 10년정도 되가는 기술입니다.
저자들은 V,I,T를 각 채널로해서 1D-CNN을 사용한것으로 추정됩니다. (2D-CNN이라는 구체적인 명시 없음.)
즉, 배터리 데이터 -> 1D CNN based WGAN GP 학습 -> 데이터 생성 -> 검증 순의 단조로운 과정입니다.

이 논문의 한가지 아쉬운점은 단순 CCCV 충방전 데이터만 학습하고 Generation 했다는 점입니다.
아무래도 Open Source Dataset을 사용했으며, Transfer Learning을 보기위해선 이종 데이터간 특성이 거의 흡사해야하기에 그런 선택을 한것으로 보입니다만, Data Augmentation이라는것은 단조로운 패턴보다는 복잡한 충방전 복합 패턴에서도 유의미한 배터리의 비선형 특성을 잡아낼수있냐 없냐에 달려있다고 보기 때문입니다.
본 논문의 제목부터 'Framework'을 강조하고, SOH 및 Transfer Learning이라는 부분에 대해 지속 언급하기에 GAN이 주인공이 아니라는 느낌이 강합니다.
사실 CC데이터 정도는 굳이 GAN을 안써도 생성이 가능할뿐만 아니라, 데이터 자체도 open source로 많기에 굳이 Augmentation을 해야하나 싶기도합니다.
다만, 논문의 저자가 의도하는것은 충분히 이해가 됩니다.

PCA나 t-SNE, PDF intensity같은 여러 Metrics 을 활용해서 생성 데이터를 검증하는데요
이제까지 배터리-GAN 연동 연구 결과에서도 여러번 말씀드렸다시피, 가장 중요한것은 '검증'입니다.
t-SNE, PCA 특성상 원본 데이터와 조금만 차이가있을때 가장 좋은결과가 나온다는 단점이 있습니다. 이는 생성한 데이터의 퀄리티가 좋지않아도, 막말로 원본데이터에 Gaussian Noise만 더해서 그려도 결과가 아주 좋은것처럼 나옵니다.
제가 CC충방전 데이터 학습의 한계점을 계속 언급하는 이유는,
GAN이 생성한 데이터 자체가 크게 달라질수가 없기때문입니다. CC는 환경조건(온도, 전류 C-rate)에 따라 전압과 발열량이 대충 딱 정해져있습니다.
즉, Generative AI의 특기인, 이제까지 없지만 물리적인 특성을 반영한 데이터를 생성해내는것이 크게 의미가 없는 데이터셋이라는 것입니다.
예를들어, EV의 회생제동을 포함한 복잡한 주행프로파일 데이터를 학습하고, 학습하지 않은 완전히 새로운 주행프로파일 데이터를 생성해낸다 라는것은 충분히 납득이 갈만합니다. 그 이유는 복잡한 주행프로파일 자체에서 유의미한 패턴과 비선형성을 GAN이 학습해내는게 의미가있기 때문입니다.
하지만, CC충방전 데이터는 아닙니다. 실험 환경조건만 동일하면 유의미한 패턴변화나 비선형성이 크게 없습니다. 즉, GAN이 창의성을 가지고 배울만한 부분도 없을 뿐 아니라, 학습후 데이터를 생성할때도 창의성을 가지면 안됩니다. 그러면 CC충방전이라는 단조로운 패턴과 다른것을 생성해낼것이기 때문입니다.
즉, 여기까지 얘기하면 이전 TS-DC GAN 논문 리뷰를 보신분들은 감이 잡히실텐데요
제가 얘기했던 문제가 검증결과에도 명확히 포함되어 있습니다.

Real Data와 Generated Data가 동일하다?? 이건 Regression할때나 좋은 결과이지 Generative AI를 할때는 완전히 잘못된 Mode Collapse가 발생한것입니다.
Real Data 이미 가지고 있는 실제 데이터와 똑같은 데이터를 생성해내는게 무슨의미가있을까요?
내가 가지고 있지 않은 데이터를 생성해내는것이 Data Augmentation입니다. 그런관점에서 제가 위에서 말씀드린바와 같이 CC 충방전과 같은 단조로운 패턴은 창의성을 가지고 학습하기도 어렵고, 생성한 데이터도 마찬가지여야한다. 즉, 실제 데이터를 그대로 답습하는것이 한계일것이다 라는 얘기와 일맥상통하는 결과가 나오게 됩니다.
본 논문 또한 TL 이라는 아이템을 쓴다는 점에서는 흥미로웠지만,
제가 Reviewer였다면 TS-DCGAN과 같이 Reject 시켰을 논문입니다.
Results
배터리 저널들은 아무래도 도메인이 화학이다보니,
Reviewer들도 정통 컴퓨터공학자나 AI 전문가인 경우는 낮습니다.
그렇기 때문에, 그럴싸해 보이거나, 혹은 AI 엔지니어 사이에서도 Generative AI를 하고 거기서도 GAN을 하는사람 이런식으로 Scope가 명확한 Reviewer가 없으면 이런 허점들을 놓치기가 굉장히 쉽습니다. (배터리 엔지니어가 GAN의 t-SNE 검증법까지 확실하게 검토하기가 어렵죠)
반대로 AI 저널도 마찬가지입니다.
본 논문이 만약에 AI 저널에 Review되었었어도, 아무래도 배터리 저널보다는 저와 같은 의구심을 가지는 분들이 많겠지만
그래도 거기서는 배터리에 대한 이해도가 없기때문에 Accept되었을 확률이 다소 높습니다.
즉, 배터리와 AI를 모두 전문으로 하는 인력들이 필드에 부재하기때문에 발생하는 문제로 보이고,
이는 배터리-AI 뿐만 아니라 융복합 연구가 지향되는 최근 저널들에서는 꽤나 자주 보이는 문제입니다.
적합한 Reviewer와 그들의 꼼꼼한 Review가 필요한 상황입니다.
참조
[1] Jinghua Sun, Ankun Gu, Josef Kainz, A solution framework for the experimental data shortage problem of lithium-ion batteries: Generative adversarial network-based data augmentation for battery state estimation, Journal of Energy Chemistry, Volume 103, 2025, Pages 476-497, ISSN 2095-4956, https://doi.org/10.1016/j.jechem.2024.12.010.
댓글