실행계획법의 기본 원리는 반복화, 랜덤화, 블록화입니다. 이를 통하여 실험의 정도 향상과 실험 환경의 동질성을 확보할 수 있으며, 이러한 원리들은 실험계획에서 통계적인 방법들을 사용할 수 있게 해주는 바탕이 됩니다.

1. 반복화(replication)

특정 조건에서 1회만의 실험으로 얻어진 데이터는 신뢰성이 떨어집니다. 즉, 실험이 정확하게 되었는지를 확신할 수 없게 됩니다. 따라서 각 실험 조건을 반복하여 실험함으로써 데이터의 재현성을 확보하는 것이 일반적입니다.

첫째, 실험오차의 추정을 가능하게 해주며, 이 오차의 추정치는 실험에서 관측된 데이터의 차이가 통계적으로 유연한지를 결정하는 가장 기본적인 단위가 됩니다.

둘째, 만약 실험에서 취해진 어떤 인자의 효과를 추정하기 위하여 표본 평균이 사용된다면 반복은 이 인자의 효과에 대해서 보다 정밀한 추정치를 제공해 줍니다.

일반적으로 실험을 반복하게 되면 오차항의 자유도를 크게 해 줄 수 있어 오차 분산의 정도가 좋게 추정되며, 인자조합의 효과(교호작용)를 분리하여 구할 수 있을 뿐만 아니라, 실험의 재현성과 관리 상태를 검토할 수 있습니다.

한편, 반복이 이루어지지 않는 실험의 경우는 오차에 대한 추정이 불가능해지고 분산분석이 어렵게 됩니다. 이러한 경우를 포화된 모형(saturated model)이라고 하는데 가급적 피하는 것이 좋습니다.

2. 랜덤화(randomization)

실험을 계획할 때에는 통제가 가능한 요인들을 주인자로 채택하고, 통제가 불가능한 요인들은 잡음인자로 처리하여 이 요인들의 효과가 비교. 분석하고자 하는 각 처리(인자 수준의 조합)의 효과에 고르게 나타나게 해야 합니다.

이렇게 잡음인자들의 효과를 평준화하여 특정 처리에 치우침이 생기지 않게 하기 위해서 사용하는 방법이 바로 실험 순서의 랜덤화입니다.

랜덤화란 실험 재료의 배치와 각 실험의 시행 순서가 무작위적으로 결정되는 것을 의미하는데 (엄밀하게 말하면 실험의 각 처리가 동일한 확률로 배당됨을 뜻합니다.) 이와 같은 랜덤화는 통계적 분석을 용이하게 해줍니다. 예를 들면, 일반적으로 분산분석에서 사용하는 F 검정은 특성치 또는 오차에 대하여 정규성과 독립성을 가정하고 있는데 랜덤한 실험은 이러한 분석의 통계적 근거를 제공해줍니다.

3. 블록화(blocking / local control)

실험에서 얻어진 데이터의 정도, 또는 분석력을 높이기 위해서는 잡음으로 처리한 요인들의 효과(오차)가 최소화되도록 해야 하는데, 실험 전체를 단순한 랜덤화에 의해서 평준화하면 오차 변동이 커져서 정도 높은 분석을 할 수 없습니다. 즉, 단순한 랜덤화로는 실험 환경의 동질성을 확보하는 데 한계가 있다는 것입니다.

따라서 실험환경을 시간적 또는 공간적으로 분할하고 층별하여 블록으로 만들면 각 블록 내에서의 데이터의 동질성이 확보되고 실험 환경이 균일해져서 실험의 정도를 높일 수 있습니다. 이때 블록을 하나의 인자로 잡아주게 되면 블록간의 효과를 분리하여 식별할 수 있게 되므로 오차 변동이 그 만큼 작아집니다. 이러한 원리를 층별 또는 소분의 원리라고도 하며, 난괴법이 대표적입니다.


 

 

이외에도 실험의 효율을 높이기 위한 방법으로 다음의 2가지 원리가 많이 사용됩니다.

A) 교락화(Compounding)

일반적으로 실험에서 다루어지는 인자의 수가 많아질수록 각 인자들간의 교호작용을 포함한 모든 요인들의 효과를 알아내기 위해서는 실험 횟수가 상당히 커져서 시간과 비용이 많이 들어가게 됩니다. 그러나 특정 인자의 효과나 교호작용 등이 실험의 목적에 부적합하거나 의미가 없어서 검출할 필요가 없을 때에는 이러한 효과들이 블록의 효과와 겹쳐서 나타나도록 실험을 계획하면 실험의 횟수를 줄일 수 있습니다.

B) 직교화(Orthogonality)

어떤 관측된 변량, 또는 이들의 선형결합이 통계적으로 서로 독립일 때, 이들은 서로 직교한다고 말하는데, 요인간에 직교성을 갖도록 실험을 계획하여 데이터를 구하면 동일한 실험 횟수라도 검출력이 더 놓은 검정을 할 수 있고, 더 정도가 높은 추정을 할 수 있다고 알려져 있습니다.

이러한 성질을 만족하도록 고안된 표가 직교배열표이며, 이 표를 이용하면 기술적으로 무시될 수 있는 교호작용 등을 손쉽게 주효과와 교락시켜 실험의 크기를 크게 줄일 수 있어서 효율적인 실험을 설계할 수 있습니다.

한편, 실험을 통해 얻어진 데이터는 오차가 있을수 도 있습니다. 실험에 취해진 조건 외에도 실험 결과에 영향을 주는 무수히 많은 원인들은 언제나 일정하게 규제하는 것은 불가능하기 때문에 실험을 진행해 감에 따라 수많은 실험 오차들이 쌓이게 되고, 똑같은 실험 조건하에서 얻어진 데이터에도 산포가 발생하게 됩니다. 따라서 실험을 할 때는 이와 같은 오차를 최소화하면서도 이를 적극적으로 수용하는 방법을 모색하게 됩니다.

 


 

자연적으로 우리는 다음과 같은 사항들에 관심을 가지게 되며, 실험계획법은 이러한 요구들에 관련되었습니다.

1. 오차가 수반되는 실험데이터에서 올바른 결론을 이끌어 내기 위한 방법은 무엇인가?

2. 다수의 원인을 동시에 취하여 실험할 경우에 실험 횟수가 많아져서 실험이 복잡해지기 때문에, 실험효율을 보다 높일 수 있는 좋은 방법은 없는가?

 

 


 

 

실험계획법(Experiment Design)은 실험에 대한 계획 방법을 의미 하는 것으로 다음과 같은 사항을 목적으로 하고 있습니다.

1. 데이터를 어떻게 취하며, 또 이것을 어떻게 분석하면 잘못 판단할 염려가 적어지는가? 즉, 정보량의 획득효율을 어떻게 해서 높일 것인가?

2. 데이터를 취할 경우 경비나 판단의 지체에 따른 손실이 발생하는데 데이터에 경비나 시간을 어느 정도로 들이는 것이 유리하겠는가? 즉, 정보의 양을 얼마로 하면 좋겠는가?


 

즉, 실험계획법은 정보량의 획득 효율에 대해 연구하는 학문으로 설계방법, 제조방법, 시험 방법 등에 대해서 여러 가지 방법이나 안이 있을 때 경험이나 다수결, 또는 육감에 의해서 그것을 결정하지 않고, 다소 복잡하더라도 데이터를 내어서 실증적으로 이를 결정하고자 할 때의 정보량의 채택 방법 및 해석 방법을 연구하는 분야입니다. 따라서 통계적 방법의 도입과 활용이 필수적입니다.

따라서 실험계획법이란 보단 넓은 의미에서 해결하려는 문제에 대하여 어떤 방법을 적용하는 것이 가장 최적인가, 또 어떠한 조건으로 실시해야 하는가를 결정짓는 것, 즉 어떠한 조치를 취하면 좋은가를 결정하는 일, 또는 그것을 조사하기 위하여 실험을 어떻게 하면 좋은가를 계획하는 것으로써 통계적 방법의 하나인 여러가지 유의차의 검정, 상관 및 회귀분석 등이 포함됩니다.

보다 좁은 의미에서는 실험계획이란 실험의 목적을 확실히 하여 실험의 성질 (통계적 구조모형)을 명확히 하고, 데이터에 영향을 준다고 생각되는 원인 중 어느 원인이 특히 중요한가, 실험을 어떻게 층별할 것인가, 오차로는 무엇을 취할 것인가, 어느 정도의 차를 검출하고 싶은가, 어느 정도의 오차를 추정할 것인가, 어떠한 순서 (어떻게 랜점화하여)로 몇 회나 실험하면 좋은가 하는 것을 결정하는 것입니다.

통계적으로 말하면 구조모형, 모집단, 귀무가설, 제1종 제2종의 과오, 오차분산의 추정, 효과 추정의 정밀도 등을 실험을 시작하기 전에 미리 기술적, 통계적, 경제적으로 검토하여 결정하는 것입니다. 여기서 제일 중요한 것은 실험하기 전에 어떤 조건의 조삽으로, 어떤 방법, 순서로 실험을 실시하느냐를 계획적으로 결정해 놓아야 한다는 점이 있습니다.

공정, 시스템의 일반적인 모형

 

 

일반적으로 실험은 공정이나 시스템의 수행도를 연구하는 데 이용됩니다. 일반적으로 공정(시스템)의 일반적인 모형은 위의 그림과 같습니다.

 


공정은 입력 요소를 출력 요소로 변환시키는 여러 가지 구성 요인들의 조합으로 나타낼 수 있으며, 한 가지 이상의 관측 가능한 반응 특성을 가지게 됩니다. 공정에 영향을 미치는 무수한 많은 요인들 중 일부는 통제가 가능한 반면 통제가 불가능한 요인들도 있을수 도 있습니다.

이와 같이 통제가 불가능한 요인들을 잡음(Noise)라고 합니다. 실험또한 위와 같은 모형으로 표현할 수 있는 하나의 시스템입니다. 실험 처리의 과정을 거쳐서 데이터의 형태로 얻어지는 출력 요소(반응치)특성치라고 합니다. 우리가 실험을 통해서 달성하고자 하는 목적은 이와 같은 특성치와 이를 생성하는 과정에 관계되는 수많은 요인들에 대하여 다음과 같은 정보를 획득하는 데 있습니다.


 

1. 어떤 요인이 반응 특성치(y)에 유의한 영향을 주는가를 확인하고, 검출된 요인이 반응 특성치에 미치는 영향을 양적으로 파악하는 것

(요인 효과에 대한 검정 및 추정)

2. 유의한 영향을 미친다고 판정된 인자들이 어떤 조건일 때 가장 바람직한 반응 특성치를 얻을 수 있는가를 결정하는 것 (최적 반응 조건의 결정)

3. 반응 특성치(y)에 크게 영향을 미치지 못하는 요인들은 전체적으로 어느 정도 영향을 주고 있는가를

확인하는 것 (오차항의 추정)

여기에는 반응 특성치(y)의 변동을 적게 하면서 통제가 불가능한 변수들(잡음)의 영향을 최소화 할 수 있도록 하는 통제가 가능한 변수(영향변수 x)를 선택하고 그 수준을 결정하는 것이 포함됩니다.

실험이란 옛날부터 있어 왔으나 실험계획이라는 개념이 생겨나기 시작한 것은 19세기 중엽 영국에서의 농업에 관한 실험이 그 발단이였습니다. 그 후에 1923년 Ronald A. Fisher가 난괴법(Randomized block design), 라틴방격법(Latin square design)등의 실험배치 방법을 고안하고, 데이터 해석의 방법으로 분산분석법을 제시하여 실험계획에 통계적인 방법을 도입하였습니다.

 

 

Ronald A. Fisher

 

 

현재는 공업을 중심으로 하여 많은 이론 및 실례가 전개되어 있습니다. 특히, 제조 산업에서 일본과 미국의 초일류 기업들이 신제품 개발과 공정 개선을 위하여 실험계획을 여러 해 동안 사용해 왔고, 그것이 국제 경쟁에서 승리하는 중요한 요인이었다는 것이 알려지면서 실험계획에 대한 관심을 커지고 있습니다.

제조업 프로세스 간트 차트화

우리가 실험이나 조사 또는 시험을 행하는 목적은 어떤 방침이나 방법을 결정함에 있어서 정보를 얻기 위한 것입니다. 기계장치를 어떤 모양으로 설계하면 좋은지, 작업의 방법이나 조합의 방법은 어떻게 해야 하는지, 반응의 조건은 어떻게 해야 하고, 규격이나 공차는 어느 정도로 결정하면 좋은지 등에 관해서 실제로 데이터를 취하여 실증해 보는 것이 실험입니다.

 

+ Recent posts