Page 23 - 4466
P. 23
них джерелах кількість діапазонів n визначають як корінь квадратний
з обсягу вибірки n N , проте на практиці майже завжди використо-
вують формулу Стерджеса
n 1 , 3 322 lg N . (3.1)
Довжину діапазону l для j-ої ознаки визначають за формулою
x jmax x jmin (3.2)
l ,
n
де x x , – відповідно найбільше та найменше значення j-ої ознаки в
jmax jmin
обох класах структур; N – сумарна кількість структур в обох класах.
Після цього слід для кожної j-ої ознаки визначити кількість стру-
ктур класу П і класу Н, значення ознаки в яких лежать в межах цих
діапазонів. Ці числа, які показують, скільки разів трапляються зна-
чення ознаки із даного k-го діапазону, називають частотами і позна-
чають символом n . Відношення частоти n до загальної кількості
k
k
спостережень N називають частостями або відносними частотами
(позначають символом m ).
k
Наступним кроком має стати визначення рядів розподілу часто-
стей кожної j-ої ознаки. Для цього застосуємо формули:
n Н n П (3.3)
m Н = kj , m П = kj ,
kj kj
N N
Н П
де m , m – частості j-ої ознаки в k-му діапазоні відповідно для класів
Н
П
kj kj
j j
непродуктивних та продуктивних структур; n kН , n kП — частоти j-ої
ознаки в k-му діапазоні відповідно для класів непродуктивних та про-
дуктивних структур; N , N – кількості відповідно непродуктивних та
Н
П
продуктивних структур.
Коефіцієнт правдоподібності для k-го діапазону j-ої ознаки
kj
обчислюють як відношення частостей в цьому діапазоні і для зручно-
сті подальшого використання слід подати в логарифмічній формі:
m П (3.4)
100 lg kj ,
kj Н
m
kj
23