CAE를 위한 서로게이트(Surrogate) 모델

[CAE를 위한 서로게이트 #9] Uncertainty Quantification (UQ) + Active Learning : CAE 서로게이트 모델의 신뢰도와 효율 향상 전략

딥마인드 2025. 7. 13. 13:05

Uncertainty Quantification (UQ) + Active Learning

CAE(Computer Aided Engineering) 분야에서 딥러닝 기반 서로게이트 모델(Surrogate Model)을 적용할 때, 가장 큰 이슈 중 하나는 예측의 신뢰도입니다.

실제 공학 해석에서는 단순한 예측 정확도보다 불확실성에 대한 해석의사결정에 필요한 신뢰성 확보가 더 중요할 수 있습니다.

이러한 관점에서 **Uncertainty Quantification (UQ)**과 Active Learning은 서로게이트 모델링의 필수 구성 요소로 떠오르고 있습니다.

서로게이트 모델의 불확실성 정량화: 왜 필요한가?

전통적인 딥러닝 모델은 결과를 단일한 값으로 출력하지만, 현실의 공학 문제는 항상 데이터 노이즈, 모델 구조 오차, 훈련 데이터 부족 등으로 인해 불확실성이 존재합니다.
이러한 불확실성을 정량화하면 다음과 같은 이점이 있습니다:

  • 예측에 대한 신뢰 구간 제공
  • 고신뢰 영역과 저신뢰 영역을 구분하여 설계 적용 여부 판단
  • 데이터 수집 및 시뮬레이션 비용 최적화

대표적인 UQ 기법:

 1. Bayesian Neural Network (BNN)

  BNN은 **모델 파라미터(가중치)**를 확률분포로 간주하여 학습합니다.

  • 장점: 전통적인 베이지안 이론 기반, 확률적 출력 가능
  • 단점: 계산 복잡도 높고 학습 시간이 길어 실전 적용 어려움

 2. Monte Carlo (MC) Dropout

  Dropout을 학습뿐만 아니라 추론 시에도 적용하여 여러 번 추론 후 분산을 계산합니다.

  • 장점: 구현이 간단하고 기존 모델에 쉽게 적용 가능
  • 단점: 샘플 수가 적을 경우 정확한 분산 추정 어려움

Active Learning: 불확실성 기반 데이터 효율화 전략

딥러닝 학습에서 모든 데이터를 다 사용하는 것이 항상 효과적인 것은 아닙니다. 특히 시뮬레이션 비용이 높은 CAE에서는 가장 정보가 많은 데이터만 선택적으로 학습하는 전략이 필요합니다.

 주요 전략

  • Uncertainty Sampling: 예측 불확실성이 가장 높은 샘플 우선 선택
  • Query by Committee: 여러 모델 간 의견 차이가 큰 샘플 우선
  • Expected Model Change: 모델 업데이트 영향을 많이 줄 샘플 선택

실무 적용 예: 항공기 날개 설계 최적화에서 불확실성이 높은 설계 지점을 선별하여 고정밀 시뮬레이션 수행 → 전체 데이터 수 60% 이상 절감

UQ + Active Learning vs. 고전 FEM 비교표

항목 딥러닝 기반 UQ + Active Learning 전통 FEM 기반 접근
신뢰도 표현 예측 불확실성 정량화 가능 (분산 등) 결정론적 결과 (신뢰도 정보 없음)
데이터 확보 전략 불확실한 영역 우선 학습 (효율적 샘플링) 균일한 격자 생성 또는 전문가 판단 필요
계산 효율성 고비용 시뮬레이션 최소화 가능 모든 설계점 시뮬레이션 필요
구현 난이도 중간~높음 (추론 과정 복잡) 상대적으로 단순
활용 분야 최적화, 신뢰성 설계, 실시간 예측 등 구조해석, 열해석, 유동해석 전반

잘 작동하지 않는 사례

  • 학습 데이터의 불확실성이 모델 구조 자체의 오류일 경우
  • 예측 변동성이 높은 영역에 데이터가 매우 부족한 경우
  • 비선형성이 극단적으로 높은 경우: 예측 분산이 너무 커져 신뢰도 해석 자체가 무력화

핵심 요약

  • 서로게이트 모델의 적용에서 예측 정확도만큼 중요한 것이 불확실성 평가입니다.
  • Bayesian Neural Network, MC Dropout 등은 예측의 신뢰도를 계량화하는 핵심 기술입니다.
  • Active Learning은 불확실성이 높은 영역을 중심으로 학습을 진행하여 데이터 효율성을 극대화합니다.
  • FEM 방식과의 비교에서, 딥러닝 기반 방식은 신뢰도, 비용 효율성 면에서 큰 장점이 있으나, 구현 복잡성과 데이터의 질에 대한 의존성은 여전히 과제로 남습니다.