인자를 하나만 취급하는 실험계획방법을1원배치법이라고 합니다. 예를 들면 어떤 반응 공정을 생각해 볼 때, 반응 공정의 수율에 영향을 미치는 요인으로 촉매, 온도, 습도, 반응시간 등 여러 가지가 있으나 그 중 한 가지만을 인자로 취하여 실험을 하는 방법입니다.
이 경우 한 가지 인자외의 다른 조건들을 일정하게 하든가, 랜덤화를 해야합니다. 즉, 장치는 동일한 것으로 사용해야 한다던지, 또는 다른 원인에 의한 데이터의 치우침(교략)을 방지하기 위해 실험순서를 랜덤하게 실험을 행하는 것입니다.
※ 이러한 1원배치법에는 다음과 같은 특징이 있습니다.
① 수준수와 반복수에는 별로 제한이 없다.
② 반복수가 모든 수준에 대하여 같지 않아도 된다.
③ 결측치가 있어도 그대로 해석할 수 있다.
④ 실험은 모든 특성치를 랜덤한 순서로 행해야 한다.
여기서 실험의 랜덤화에는 실험을 시간적 혹은 공간적으로 랜덤한 순서로 행하는 것이 필요합니다.
1) 시간적인 랜덤화
- 취급한 수준이l이고 반복수가n이라고 하면, 총 실험수 N =ln이나, N회의 실험은 카드나 난수표를 이요하여 랜덤한 순서로 행합니다.
2) 공간적인 랜덤화
- 어떤 시료를 전기로에서 태워서 재를 얻을 경우, 산소 통기량의 영향을 보고 싶을 때, 온도도 영향이 있다고 생각되며, 전기로내의 위치에 따라 온도분포가 달라질 염려가 있으므로 그 전기로 내의 위치에 번호를 매겨 시료를 넣는 공간적인 위치를 랜덤화합니다. 그리고 시간적. 공간적으로 랜덤화하는 경우도 있습니다.
연구실에서 이루어지는 실험의 대부분은 자연법칙이나 학술이론에 관한 연구를 비롯하여 신제품이나 신기술 개발을 위한 탐색을 하거나 공정이나 품질개선을 위한 기초 자료를 작성하려는 목적으로 수행됩니다. 일반적으로 연구실 실험에서는 실험의 랜덤화가 쉽고 인자의 수준 폭이 커도 무방할 때가 많습니다.
한편, 공장현장 실험에서는 생산을 위한 각종 표준의 작성이나 제품의 특성 검토, 품질관리와 공정관리를 위한 자료의 수집 등을 목적으로 합니다. 공장현장 실험의 경우는 생산중에 실험을 하기 때문에 균일한 실험 환경의 조성이 어렵고 랜덤화가 곤란한 경우가 많습니다. 따라서 연구실 실험과 비교하면 다음과 같은 차이점이 있습니다.
①현장에서는 생산을 하고 있으므로, 전공정 및 후공정까지 포함해서 작업의 흐름을 어지럽히지 않도록 생산량과 품질을 유지해야 될 경우가 많습니다. 따라서 실험계획법의 적용에 여러 가지 제약이 따릅니다. 연구실에서는 생산의 흐름과는 일단 분리해서 실험을 하므로 이와 같은 제약은 없습니다.
②현장의 실험에는 생산단위의 설비를 사용함으로 1회의 실험단위가 크고, 실험이 실패할 때 손실이 큽니다. 경우에 따라서는 장치 자체를 손상시킬 경우도 있으며, 인자나 수준의 선정 방법에 따라서는 폐기하거나 재가공을 하지 않으면 안될 제품이 다수 나오는 일도 있습니다.
③현장에서는 인자나 수준을 정할 때,①나②와같은 이유로 제약을 받는 경우가 많고 실험순서의 랜덤화도 곤란할 경우가 종종 있습니다. 연구실에서는 인자나 수준의 선정 방법이 현장에 비해서 자유롭고, 원료, 온도, 시간 등 인자의 수준이나 실온 등의 환경조건을 제어할 수 있는 경우가 많지만 현장에서는 실험환경을 균일하게 하는 것이 어렵고, 따라서 반응특성치에 영향을 주는 인자의 수도 많아지게 됩니다.
이와 같은 실험 환경의 차이로 인하여 연구실에서 얻은 결과가 현장에서 재현성이 없는 경우가 종종 있습니다.
④현장의 실험에서는 현장의 많은 작업자가 참여하게 되고 실험의 계획에 따라 평소의 작업 표준과 다른 작업을 하게 되므로 작업자의 훈련과 실험의 관리에 특별히 주의해야 합니다. 그러나 연구실에서는 실험에 잘 훈련된 소수의 실험자가 실험을 하므로 실험의 관리가 용이합니다.
⑤현장의 실험은 일반적으로 생산부문과 기술부문이 모두 관여될 경우가 많으므로 제조부문과 기술부문, 또는 본사와 공장 등 관련 부서간의 책임과 권한을 명확히 해두어야 하며, 실험 결과에 대해서 가능한 표준화를 시도하는 것이 바람직합니다.
데이터가 분석되고 나면 실험자는 결과에 대한 실질적 결론을 이끌어 내야하고 조치 방안을 추천해야 합니다. 실험자가 데이터를 분석하고 검정한 결과로부터 어떤 결론을 유도할 때에는 실험의 목적, 취해진 가정, 귀무가설 등을 고려해야 하고 그 범위 내에서 검정의 결과가 가지는 기술적 의미를 생각해야 합니다.
특히, 실험에서 취급한 인자 수준의 범위를 넘어서는 수준으로 결과를 확대하여 해석하거나 실험에서 취하고 있는 가정들을 빼놓고 결론을 내리는 것 등을 경계해야 합니다. 데이터 분석의 결과로 최적 실험조건이 선정되면, 이 조건에서 반응특성치에 대한 추정을 실시하고, 확인실험을 실시하여 그 결과가 실제로 재현성이 있는지를 확인해야 합니다.
최적조건의 재현성이 확인되고 나면 다음의 실험계획에 이를 반영한다거나 작업 표준 등의 개정을 통하여 현장에 적용하도록 한다든지 하는 적절한 조치가 뒤따라야 합니다.
일반적으로 실험은 공정을 배우는 매우 중요한 과정이라 할 수 있습니다. 따라서 임시적으로 시스템에 대한 가설을 세우고 이 가설을 조사하기 위해 실험을 수행하고 그 결과에 기초하여 다시 새로운 가설을 세우고 실험하는 것을 반복함으로써 점차적으로 좋은 결과를 주는 방양으로 실험을 옮겨가게 됩니다.
따라서 연속되는 실험에서는 앞 실험에 대한 결과의 조치를 바탕으로 다음 실험이 설계되는 것이 보통입니다.
실험을 통해서 얻어진 데이터를 분석하여 객관적인 정보를 추출하고 어떤 조치를 유도하는 결론을 내기 위해서는 통계적인 방법들을 이용해야 합니다. 만약 실험이 올바르게 설계되었고 그 설계에 따라 과오 없이 수행되었다면 데이터를 분석하는 일은 그렇게 어렵지 않습니다.
데이터의 분석은 가급적 그래프화하여 시각화하는 것이 좋은데 이를 통하여 반응특성치의 변동 상황이나 최적조건의 위치도 짐작할 수 있습니다. 한편, 통계적 분석에 들어가기에 앞서서 데이터가(실험이) 관리상태하에서 얻어졌는지, 그리고 오차가 가정을 만족하는지를 먼저 검토해보는 것이 바람직하며, 데이터를 취하는데 실패하였거나 이상치로 판정되어 결측치가 발생한 경우에 대해서 그 처리 방법에 따라 조치를 취해 주는 것또한 좋습니다. 또한, 이 단계에서는 데이터의 모형의 타당서에 대한 검토도 중요합니다.
일반적으로 데이터 분석에서 많이 사용하는 통계적 기법들은 그래프, 분산분석, 통계적 검정과 추정, 상관분석과 회귀분석 등이 있습니다.
6시스마의 도구로서 널리 이용되고 있는 Minitab이나 사회과학자료분석에 많이 사용되는 SPSS/PC+, SAS 등의 통계 처리 프로그램들은 이러한 분석 방법들을 지원해 주고 있으며, 자료에서 발생된 결측치도 쉽게 처리할 수 있으므로 이러한 도구들을 활용하는 것이 보다 효율적일 것입니다.
데이터의 해석은 각 요인 효과의 크기, 정도의 상세와 효과의 추정, 최적조건 결정의 3 단계로 성립됩니다. 분산분석은 계산 과정이 다소 번거롭기는 하지만 그 계산 없이는 각 요인의 기여율에 대한 계산이 불가능하며, 또 추정 효과에 관한 그래프의 신뢰한계도 계산할 수 없게 되므로 반드시 거쳐야 합니다.
그러나 결론에 이르기 위해서는 분산분석보다는 효과를 도시한 그래프 쪽이 더 중요하며, 그 그래프로부터 수준에 의한 비용의 차이와 요인 효과의 양쪽을 살펴서 최적의 조건을 찾아내는 것이 중요합니다.
이 단계는 실험의 배치와 실험 순서의 랜덤화를 선택하는 단계이며, 사전에 실험 계획에 해당되는 처음 3 단계들이 올바르게 이루어질 경우 비교적 쉽게 수행됩니다.
실험 설계의 선택 과정에는 샘플의 크기(반복 횟수)를 고려하고 적절한 실험 순서를 선택하는 것, 그리고 블록화 또는 랜덤화 조건(또는 제한)들의 포함 여부를 결정하는 것 등이 포함됩니다.
예를 들어 어떤 연구실에서 윤활유의 점도 차이를 조사하는 실험을 실시하였다고 가정합니다. 시중에 판매 중인 3개의 회사의 제품 A, B, C를 각각 3개씩 랜덤하게 취하고, 3명의 연구원(1, 2 ,3)에게 한 종류씩을 배당하여 총 9회 실험을 위의 그림과 같이 실시하였습니다. 이때 실험 결과는 각 연구원의 검사 능력에 영향을 받는다고 합니다.
이 실험에서 각 제품 간 점도차를 검정할 경우를 생각해보았을 때, 이 경우 각 제품간에 점도차가 없다는 귀무가설이 기각되더라도 그 원인이 각 회사에서 판매하는 윤활유간의 점도 차이라고 판단하기는 어렵습니다. 왜냐하면 이것은 연구원의 검사 능력에도 영향을 받기 때문입니다.
즉, 제품간에 나타나는 점도차이와 연구원간에 나타나는 검사 능력의 차이라는 두 효과가 서로 뒤섞여 구분할 수 없게 됩니다. 따라서 이러한 실험 설계는 적절한 방법이 되지 못합니다. 이러한 문제점을 해결하기 위해서는 각 연구원의 검사 능력의 차이가 모든 제품에 고루 영향을 주도록 평준화되어 나타나게 해야 하는데, 각 연구원마다 3가지 종류의 제품을 고르게 검사해보는 방법을 취하면 됩니다. 그러면 위의 그림과 같이 연구원 별로 하나의 블록을 설정하고 각 블록에 검사할 시료들을 동일하게 배당한다면 각 블록 내 환경이 동일해지고 각 블록간의 비교가 가능해집니다.
이 실험에서 각 회가의 제품간의 점도차가 없다는 귀무가설이 기각되었다면 그것은 각 회사에서 판매하는 윤활유간의 점도 차이에 기인한 것으로 판단할 수 있습니다. 이러한 실험 설계는 난괴법에 해당됩니다.
만일, 이와 같은 실험이 각 연구당 하루에 한 번씩 3이레 걸쳐서 이루어지고, 또 검사한 날짜에 따라 검사 결과가 영향을 받는다면 실험 날짜를 하나의 인자로 잡아주어 위의 그림과 같은 실험으로 설계될 수 있습니다.
그러나 이를 잘 살펴보면 첫날에는 B가 1회, C가 2회, 둘째 날에는 A가 2회, B가 1회, 셋째 날에는 각각 1회씩 실험되어 각 실험 날짜에 따라 동일한 빈도로 시료들이 실험되지 않았음을 알 수 있습니다. 이와 같은 실험은 날짜에 따른 효과가 실험 결과에 어느 정도 영향을 줄 수 있어서 적절할지 못합니다.
따라서 실험에서 고려되는 2가지 요인, 즉 연구원과 날짜에 따라 각 회사의 제품들(시료)이 고르게 배당되는 방법이 보다 합리적이라 할 수 있습니다.
위의 그림과 같은 설계는 이러한 요구를 만족시켜주는 실험 날짜와 연구원간의 각 조합에 한번씩 동일한 빈도로 사료(제품)가 배당되고 있음을 확인할 수 있습니다. 이렇게 하면 두 요인의 효과가 전체 실험 처리에 평준화 되어 실험 목적으로 채택한 반응특성치인 제품간의 점도 차이에 영향을 미치지 않게 됩니다. 위의 그림과 같은 실험 설계를 라틴방격 실험이라고 합니다.
이처럼 실험 설계의 선택은 실험 환경과 실험 목적에 따라 가장 적절한 배치 방법을 찾아가는 것이 중요하며, 실험 환경의 균일성이 확보되도록 해야 합니다.
실험에 영향을 미치는 무수히 많은 원인들 중에서 특별히 실험의 목적으로 채택한 원인, 또는 직접 실험의 목적으로 삼지는 않으나 실험의 효율을 올리기 위하여 층별한 원인을 인자(factor)라고 하고, 실험을 하기 위한 인자들의 조건을 인자의 수준(level)이라고 하며, 이 수준으로 취한 값의 개수를 수준수라고 합니다.
실험자는 실험에서 변화되는 요인들과 이러한 요인들이 변화하는 범위, 그리고 실험이 행해지는 명확한 수준들을 선택해야만 합니다.
1. 인자의 선택
실험의 목적에 맞는 요인을 찾아내는 일은 실험을 계획하는 사람의 기술적 지식과 정보, 개인적 경험 및 과거의 데이터 해석으로부터 얻어집니다.
이를 위해서는 실험에 앞서서 특성요인도(cause and effect diagram)를 작성해두는 것이 중요합니다. 이때의 요인들은 아래와 같이 분류할 수 있습니다.
① 실험하는 장소,
② 실험하는 시각과 소요시간,
③ 기계 설비 또는 실험 장치,
④ 재료,
⑤ 작업원 또는 실험자,
⑥ 작업방법 또는 실험 방법,
⑦ 자연 상황(온도, 습도, 기압, 분위기)
실험의 목적이 결정되면 그것을 달성하기 위하여 비용적, 설비적으로 가능한 모든 수단을 생각해보고 실험 목적 달성에 관련된 요인은 모두 인자로 잡아주는 것이 원칙입니다.
인자의 선택에서 중요한 것 중 하나는 불량의 원인이 어디에 있느냐 하는 것과 그것을 바로잡기 위한 수단은 별개의 것일지도 모른다는 사실입니다. 예를 들자면, 원유로부터 고급윤활유를 정제함에 있어서 수율(yield)을 늘리고자 한다면 수율 증가와 관련되는 용제나 첨가제를 인자로 채택하고 그 양을 늘리면 되지만 이와 같은 조치는 아무래도 또 다른 특성인 응고온도의 악화를 가져와서 불량품을 만들기 쉽기 때문에 곤란하다고 하는 생각은 전적으로 잘못된 것입니다.
용제나 첨가제를 채택하고 그 양을 늘려서 확실히 수율이 증가한다면, 그것을 인자로 채택하거나 양을 늘리면 되는것입니다. 그 대신 수율에 영향을 주지 않으면서 응고온도를 개선할 수 있는 새로운 요인을 발견하면 됩니다. 그러므로 수율이라고 하는 특성을 문제 삼으면서 그것에는 별로 효과가 없으나 응고온도를 개선할 수 있는 인자를 실험에 채택하게 되며, 이 경우에는 응고온도라는 새로운 특성치도 실험의 목적에 채택되어야 합니다.
따라서 실험에서 취급해야할 인자의 수는 많아지는 것이 보통입니다. 그러나 과다한 인자의 수는 실험의 정도를 떨어뜨리고 실험의 비용이 너무 커지기 때문에 실험의 목적을 달성할 수 있다고 생각되는 범위 내에서 최소의 인자를 선택해주는 것이 좋습니다.
2. 수준의 선택
인자의 수준과 수준수를 결정함에 있어서 실험자가 생각하고 있는 인자의 관심영역 (또는 흥미 영역: region of interest) 에서만 인자 수준을 잡아주는 것이 원칙입니다. 인자의 관심 영역이란 실험자가 관심을 가지고 있는 인자 수준이 변화할 수 있는 범위를 말합니다. 수준의 선택은 다음의 원칙과 같습니다.
① 기술적으로, 또는 과거의 경험에 의해서 특성치가 명확히 나쁘게 되리라고 예상되거나 앞으로도 실제로 사용되지 않는다고 알려진 수준은 포함되지 않습니다.
② 최적이라고 예상되는 조건이나 조합은 반드시 취급하고 현재 공정에서 사용되고 있는 인자의 조건(수준)도 포함시키는 것이 좋으며, 실험하고 싶은 조건의 조합이 빠짐없이 포함되도록 수준을 정합니다.
③ 무의미한 교호작용의 효과가 나타나지 않도록 각 인자의 수준을 선택합니다. 의미없는 교호작용을 무시하면 그만큼 데이터에 포함되는 미지수가 적게 되므로 검정, 추정의 정밀도가 좋아지고, 직교배열표에 의한 실험의 경우 더 많은 인자를 배당할 수 있거나 실험의 수를 줄일 수 있습니다.
④ 수준수는 보통 2~5 수준이 적절하며, 많아도 6 수준을 넘지 않도록 합니다.
그리고 실험에서 채택된 인자가 계량치일 경우에는 관심 영역의 최대치와 최소치를 수준의 최대치와 최소치로 잡아주고, 수준 간격을 등간격으로 해 주는 것이 좋으며, 2~3 수준 정도 취하면 충분합니다. 일반적으로 수준의 폭을 너무 넓게 잡으면 교호작용이 나오기 쉬우므로 주의해야 합니다.
인자가 계수치일 경우에는 인자가 갖는 종류의 수만큼을 수준수로 취해주는 것이 좋습니다. (예를 들면 인자가 재표일 때 실험에 채택된 그 재료의 가지수) 이때 기술적으로 몇 개로 층별하여 인자로 취하는 것이 정보량을 증가시키고 조치도 쉬워집니다.
인자의 선택과 수준을 효율적으로 결정하기 위해서는 실험자의 공정 지식이 무엇보다도 필요하며, 이러한 공정 지식은 일반적으로 실제적인 경험과 이론적인 이해가 결합된 것이라야 함을 잊어서는 안됩니다.
실험을 실시한 후에 데이터의 형태로 얻어지게 될 반응특성치는 실험의 목적을 달성하는 데 직결된 것이어야 합니다.
예를 들면 진동이나 소음이 낮은 자동차를 개발하고자 실험한다면 반응특성치는 데시벨(dB)의 형태로 얻어지는 진동이나 소음의 정도가 될 것이며, 보다 견고한 도자기를 구워내기 위한 가마의 소성온도를 찾는 실험이라면 각 조건에서 구워낸 도자기의 강도를 측정해야 할 것입니다. 이때 반응 특성치의 측정 방법이나 게이지(gage)의 사용조건 등도 구체적으로 결정되어야 합니다.
해결해야 할 문제가 무엇인지 인식하고 이러한 문제의 해결에 직결되는 실험목적을 설정합니다. 실험의 목적 설정은 그것을 달성하기 위한 반응특성치의 선택과 최적의 실험 방법, 분석 방법 등으로 연결되며, 이를 명확히 하는 것은 실험 과정에 대한 보다 적절한 이해와 문제의 최종 해결(조치)에 상당한 기여를 하게됩니다. 따라서 실험을 통해서 달성하고자 하는 목적을 구체적으로 명확히 결정하는 것이 무엇보다도 중요합니다.
이를테면 값싸고 우수한 자동차의 개발 등과 같이 너무 추상적이고 광범위하게 실험 목적을 설정하면 이에 적절한 반응특성치의 선택이나 실험 방법을 찾기가 어려워집니다. 그러나 진동이나 소음이 보다 적은 자동차의 개발이라든가, 공기저항이 보다 낮은 차형의 개발 등과 같이 보다 구체적인 목적을 설정한다면 이에 따른 반응 특성치나 인자의 선택이 쉬워지고, 실험 방법이나 분석 방법 등을 보다 명확하게 계획할 수 있으며, 그 결과에 따른 작업 표준의 개정 등과 같은 행동의 기준도 명확해집니다.
실험계획법을 사용하기 위해서는 실험에 관계된 모두가 실험의 목적을 이해하고, 정확히 어떤 인자들이 연구되어야 하며, 실험은 어떻게 설계되어야 하는지, 그리고 최소한 어떻게 데이터가 분석되어야 할 것인지 등의 수량적인 분석에 대한 사전 지식과 이해를 필요로 합니다. Montgomery는 실험을 계획하고, 이를 실시하여 취해진 데이터를 분석하고 해석하여 조치를 취하는 일련의 과정에 대하여 위의 그림과 같은 절차들을 제시하였습니다.
1단계에서 3단계까지는 사전 실험계획 단계라고 할 수 있으며, 그 이하의 단계는 실험 설계를 선택하고 실험을 수행하여 그 결과를 분석. 해석하며, 이에 따른 조치를 취하는 단계입니다. 그러나 2단계와 3단계는 동시에 수행되는 것이 보통이나 반응 변수인 특성치를 선정한 후 특성치에 영향을 미치는 인자와 그 수준을 잡아주기도 합니다.