소프트웨어 시스템 장애는 ML에 속하지 않는 시스템에서 발생하는 장애이다.
몇가지 예시
의존성 장애 | 시스템이 의존성을 갖는 소프트웨어 패키지 혹은 코드베이스에 중단이 발생해 시스템이 중단되는 경우이다. 서드 파티가 의존성을 유지 관리할 대 흔히 발생하며, 의존성을 유지 관리하는 서드 파티가 더 이상 존재하지 않는 경우 특히 자주 발생한다. |
---|---|
배포 실패 | 배포 오류로 인한 실패이다. 예를 들어, 모델의 현재 버전 대신 실수로 이전 버전 바이너리를 배포하거나 시스템에 특정 파일을 읽거나 쓰는 권한이 없는 경우이다. |
하드웨어 오류 | CPU나 GPU처럼 모델 배포에 사용되는 하드웨어가 제대로 작동하지 않는 경우이다. |
다운타임 또는 충돌 | 시스템 구성 요소가 다른 곳에 있는 서버, 예컨대 AWS나 호스팅 서비스에서 실행되는 경우 해당 서버가 다운되면 시스템도 따라서 다운된다. |
모델에 대한 입력 = X, 출력 = Y
지도 학습에서 훈련 데이터는 결합 분포 P(X, Y)의 샘플 집합으로 볼 수 있으며 ML은 일반적으로 P(Y|X)를 모델링한다. 이 결합 분포 P(X, Y)는 두 가지 방식으로 분해된다.
| 공변량 시프트 Covariate shift | P(X)가 변하지만 P(Y|X)는 동일하게 유지된다. 첫 번째 분해식에 해당한다. | | --- | --- | | 레이블 시프트 Label shift | P(Y)가 변하지만 P(X|Y)는 동일하게 유지된다. 두 번째 분해식에 해당한다. | | 개념 드리프트 Concept drift | P(Y|X)가 변하지만 P(X)는 동일하게 유지된다. 첫 번째 분해식에 해당한다. |