Bootstrap

부트스트랩

  • 부트스트랩이란 무엇입니까? 일종의 리샘플링 방식~에서 가설을 테스트하거나 통계 메트릭을 계산하기 전에 무작위 샘플링을 교체로 적용하는 방법확률변수의 정확한 확률분포를 알 수 없거나 측정된 표본이 불충분할 때 사용한다.

  • 사전적 정의는 다음과 같다.

    데이터로부터 얻은 통계의 표본오차를 확률분포를 가정하지 않고 비모수적으로 평가하는 방법. 이 방법으로 주어진 데이터 세트가 원래 모집단을 대표하는 독립적인 샘플이라고 가정하고, 데이터의 허용 가능한 중첩으로 무작위로 리샘플링하여 여러 데이터 세트를 준비하고 이들로부터 얻은 통계를 계산합니다.

    나무 상자. 계통발생 추정 이론 분야에서 계통수 신뢰도 평가 목적으로 널리 사용됨 (네이버 지식백과) Bootstrap (해양과학용어사전, 2005. 10. 7., 한국해양학회)
  • 즉, 모집단에서 새로운 표본을 추출할 수 없을 때 모집단에서 독립적인 데이터셋을 반복적으로 얻는 것이 아니라 원래 데이터셋(독립된 샘플)에서 관측치를 반복적으로 추출하여 데이터셋을 얻는 기법이다.

  • 여기서 샘플링은 교체 방법을 사용하여 수행되므로 동일한 관찰이 부트스트랩 데이터 세트에 두 번 이상 포함될 수 있습니다.

  • 부트스트래핑은 아래와 같이 수행됩니다.