Съдържание
Графиката на разсейването е важен диагностичен инструмент в арсенала на статистиците, получен чрез конструиране на графа с две променливи и формулиране на функционална хипотеза за неговата връзка. Поради тази причина те обикновено се проектират преди да се извърши регресионен анализ. След това статистикът тества хипотезата чрез регресионен анализ и определя точния знак и величина на връзката. В допълнение, график за регресия помага да се идентифицират несъответстващи данни - стойности, които са необичайно отдалечени от повечето примерни данни. Премахването на несъответстващите данни помага за подобряване на регресионния модел.
инструкции
Графика на разсейване показва корелацията между две променливи (NA / AbleStock.com / Getty Images)-
Потърсете отрицателна връзка между двете променливи в диаграмата за разсейване. Ако ниските стойности на първата променлива съответстват на високи стойности на втората променлива, има отрицателна корелация. В този случай линия, прокарана през данните, ще има отрицателен наклон.
-
Разгледайте диаграмата за положителна връзка между променливите. Ако ниските стойности на първата променлива съответстват на ниските стойности на втората променлива, а високите стойности на първата променлива съответстват на високите стойности на втората, променливите имат положителна корелация. В този случай линия, прокарана през данните, ще има положителен наклон.
-
Проверете диаграмата на разсейване, за да определите дали няма връзка между променливите. Ако данните в графиката са разпределени на случаен принцип, без видима връзка между променливите, то те нямат корелация, или малка и статистически незначителна корелация. В този случай линия, прокарана през данните, е хоризонтална, с наклон, равен на нула.
-
Създайте регресионна линия чрез данните, изследвайте нейната форма и оценете естеството на връзката между двете променливи. Правата линия се интерпретира с линейна връзка, кривата форма предполага квадратична връзка, и линия, която започва сравнително плоска преди издигането или падането изведнъж се интерпретира като експоненциална връзка.
-
Потърсете несъответстващи данни в графиката. Стойности, които са необичайно далеч от набора от данни. Несъответствията се различават в отношението между променливите. Елиминирайте ги, но само ако тяхното присъствие не засяга анализа на връзката между двете променливи.