Метод проектов
<<  Строительство дорог методом стабилизации грунта Гибридологический метод  >>
Метод главных компонент
Метод главных компонент
Снижение размерности признакового пространства
Снижение размерности признакового пространства
Метод главных компонент
Метод главных компонент
Геометрическая демонстрация метода главных компонент
Геометрическая демонстрация метода главных компонент
Проблема интерпретации главных компонент
Проблема интерпретации главных компонент
Эмпирическое исследование: Опрос ВЦИОМ, осень 2007
Эмпирическое исследование: Опрос ВЦИОМ, осень 2007
Исходные данные
Исходные данные
Интерпретация главных компонент
Интерпретация главных компонент
Матрица факторных нагрузок
Матрица факторных нагрузок
Распределение предпочтений – все респонденты
Распределение предпочтений – все респонденты
1. Партийные симпатии
1. Партийные симпатии
2. Доход
2. Доход
3. Образование
3. Образование
4. Заинтересованность политикой
4. Заинтересованность политикой
5. Федеральный округ
5. Федеральный округ
6. Регионы (обратные координаты
6. Регионы (обратные координаты
7. Размер населенного пункта
7. Размер населенного пункта
8. Москва
8. Москва
8. Москва
8. Москва
9. Доверие к Путину
9. Доверие к Путину
Игра: моделирование избирателя
Игра: моделирование избирателя
Игра: моделирование избирателя
Игра: моделирование избирателя
Спасибо за внимание
Спасибо за внимание

Презентация: «Метод главных компонент». Автор: Alexander. Файл: «Метод главных компонент.ppt». Размер zip-архива: 822 КБ.

Метод главных компонент

содержание презентации «Метод главных компонент.ppt»
СлайдТекст
1 Метод главных компонент

Метод главных компонент

Теория и практика на примере выявления политических предпочтений

Филатов А.Ю. Институт систем энергетики им.Л.А.Мелентьева, Иркутский государственный университет

http://polnolunie.baikal.ru/me/mat_ec.htm, http://polnolunie.baikal.ru/me/metrix.htm, http://matec.isu.ru, http://fial_.livejournal.com

2 Снижение размерности признакового пространства

Снижение размерности признакового пространства

Причины: Сжатие объемов хранимой информации. Наглядное представление данных ( p = 1,2,3). Лаконизм моделей, упрощение счета и интерпретации. Увеличение точности выводов, зависящей от n / ( p+1). Борьба с мультиколлинеарностью – взаимозависимостью регрессоров.

Требования к новым показателям: Максимальная информативность. Взаимная некоррелированность. Минимальное искажение геометрической структуры исходных данных.

Ситуации, в которых снижение размерности осуществить легко: Дублирование информации (исключение). Наличие неинформативных переменных (исключение). Наличие однотипных переменных (агрегирование)

3 Метод главных компонент

Метод главных компонент

1. Подготовительный этап 1) Центрирование и нормирование переменных – переход к 2) Вычисление матрицы ковариаций

2. Решение характеристического уравнения 1) Нахождение собственных чисел 2) Нахождение собственного вектора для каждого корня

3. Переход к новым переменным – новые переменные, «главные компоненты»

– Доля дисперсии, вносимая первыми главными компонентами

4 Геометрическая демонстрация метода главных компонент

Геометрическая демонстрация метода главных компонент

Рис.1. Умеренный разброс точек вдоль

Рис.2. Вырожденный случай: отсутствие разброса вдоль

5 Проблема интерпретации главных компонент

Проблема интерпретации главных компонент

Матрица нагрузок главных компонент на исходные переменные:

## Наблюдения – помесячные данные

– Число торговых точек, где распространяется продукция, шт. – Расходы на рекламу, руб. – Доля новинок в ассортименте, % – средний месячный доход на душу населения, руб. – Количество праздников, шт.

Тесно связана с , , .

Тесно связана с , .

6 Эмпирическое исследование: Опрос ВЦИОМ, осень 2007

Эмпирическое исследование: Опрос ВЦИОМ, осень 2007

Дано: 40 понятий Каждый из 1589 респондентов выбирает несколько (в пределах 15), вызывающих у него положительную или отрицательную реакцию

Дополнительные вопросы: Намерение голосовать за ту или иную партию на предстоящих выборах Демографические характеристики (пол, возраст, образование, доход) Заинтересованность политикой Степень влияния на жизнь в стране Регион и тип населенного пункта, где проживает респондент Доверие к Президенту, другим органам власти

Модификация данных: Каждому понятию присвоено значение –1, если оно вызывает у респондента отрицательные чувства, 1, если оно вызывает у респондента положительные чувства, 0, если оно не вызывает никаких чувств.

7 Исходные данные

Исходные данные

Табл.1. Доля респондентов, оценивших понятие как положительное или отрицательное

Понятие

Полож

Отриц

Понятие

Полож

Отриц

01. Нация

0,21

0,08

21. Ссср

0,12

0,08

02. Порядок

0,57

0,01

22. Церковь

0,21

0,02

03. Свобода

0,37

0,03

23. Революция

0,01

0,22

04. Рынок

0,10

0,15

24. Собственность

0,14

0,04

05. Русские

0,34

0,02

25. Успех

0,31

0,00

06. Запад

0,02

0,23

26. Либерализм

0,01

0,14

07. Социализм

0,11

0,11

27. Реформа

0,06

0,14

08. Коммунизм

0,07

0,19

28. Стабильность

0,38

0,00

09. Демократия

0,15

0,09

29. Труд

0,31

0,00

10. Традиция

0,29

0,01

30. Индивидуализм

0,02

0,12

11. Патриотизм

0,34

0,01

31. Нерусские

0,02

0,29

12. Государство

0,26

0,03

32. Равенство

0,18

0,02

13. Конкурентоспособн.

0,05

0,07

33. Коллективизм

0,06

0,09

14. Суверенитет

0,07

0,05

34. Мораль

0,22

0,03

15. Элита

0,02

0,41

35. Права человека

0,32

0,02

16. Партия

0,02

0,16

36. Богатство

0,12

0,01

17. Власть

0,09

0,18

37. Россия

0,28

0,00

18. Справедливость

0,49

0,02

38. Достаток

0,37

0,01

19. Оппозиция

0,01

0,17

39. Прогресс

0,21

0,01

20. Бизнес

0,07

0,13

40. Капитализм

0,15

0,02

8 Интерпретация главных компонент

Интерпретация главных компонент

Рис.3. Собственные числа главных компонент

z(1) – «толерантность» Высокое значение соответствует отсутствию отрицательной реакции на слова «элита», «нерусские», «рынок», «запад», «власть» и «реформа», а также отсут- ствию положительной реакции на слова «справедливость» и «труд». z(2) – «экономическая свобода» Высокое значение соответствует положительной реакции на слова «свобода», «бизнес», «успех», «богатство», «достаток», «прогресс» и «капитализм» и от- рицательной реакции на «социализм», «коммунизм», «СССР», «революцию» и «коллективизм».

9 Матрица факторных нагрузок

Матрица факторных нагрузок

Табл.2. Коэффициенты корреляции главных компонент и исходных переменных

Понятие

z(1)

z(2)

Понятие

z(1)

z(2)

01. Нация

0,11

-0,08

21. Ссср

-0,01

-0,34

02. Порядок

-0,18

0,01

22. Церковь

-0,13

-0,01

03. Свобода

-0,13

0,20

23. Революция

0,13

-0,26

04. Рынок

0,26

0,08

24. Собственность

0,13

0,14

05. Русские

-0,15

0,03

25. Успех

-0,16

0,21

06. Запад

0,21

0,10

26. Либерализм

0,15

-0,01

07. Социализм

-0,13

-0,28

27. Реформа

0,23

-0,02

08. Коммунизм

0,05

-0,32

28. Стабильность

-0,16

0,00

09. Демократия

0,11

0,07

29. Труд

-0,26

-0,08

10. Традиция

-0,06

-0,04

30. Индивидуализм

0,05

0,10

11. Патриотизм

-0,14

-0,15

31. Нерусские

0,25

-0,12

12. Государство

-0,17

-0,03

32. Равенство

-0,18

0,06

13. Конкурентоспособн.

0,07

0,12

33. Коллективизм

0,02

-0,22

14. Суверенитет

-0,08

0,01

34. Мораль

-0,05

-0,07

15. Элита

0,30

0,04

35. Права человека

-0,15

0,12

16. Партия

0,04

-0,14

36. Богатство

-0,15

0,25

17. Власть

0,26

-0,09

37. Россия

-0,03

0,07

18. Справедливость

-0,30

0,02

38. Достаток

0,11

0,25

19. Оппозиция

0,12

-0,06

39. Прогресс

-0,03

0,27

20. Бизнес

0,17

0,27

40. Капитализм

-0,09

0,22

10 Распределение предпочтений – все респонденты

Распределение предпочтений – все респонденты

Рис.4. Распределение предпочтений – все респонденты

11 1. Партийные симпатии

1. Партийные симпатии

Рис.5. Партийные симпатии

Табл.3. Партийные симпатии

Предпочтения

%

z(1)

z(2)

Аграрная

0,63

–0,16

–0,92

2. Ер

45,72

0,05

0,30

3. Кпрф

7,12

–0,76

–1,59

4. Лдпр

4,22

–0,53

0,69

6. Патриоты России

0,25

0,22

–0,10

7. Справедливая Россия

6,17

–0,60

–0,87

8. Свободная Россия

0,69

–0,43

0,31

9. Спс

0,57

–0,47

1,14

10. Яблоко

0,76

–0,56

0,20

11. Республиканская

0,25

–0,16

1,36

13. Демократическая

0,19

–0,25

0,75

14. Не голосовать

17,88

0,23

–0,06

12 2. Доход

2. Доход

Рис.6. Доход

Табл.4. Доход

Доход

Чел.

z(1)

z(2)

Высокий

41

–0,1

–0,16

2. Выше среднего

126

0,82

0,28

3. Средний

989

–0,04

0,19

4. Ниже среднего

383

0,15

–0,48

5. Низкий

79

–0,05

–0,59

13 3. Образование

3. Образование

Рис.7. Образование

Табл.5. Образование

Образование

Чел.

z(1)

z(2)

Начальное

42

–0,24

–1,38

2.

118

–0,03

–0,80

3.

538

–0,06

0,04

4.

545

–0,17

0,12

5.

77

0,34

0,40

6. Высшее

268

0,18

0,11

14 4. Заинтересованность политикой

4. Заинтересованность политикой

Если наложить данные графики на графики партийных предпочтений, обнаружим, что наиболее интересу- ются политикой сторонники КПРФ и СР (низкие значения обоих факто- ров), а наименее – сторонники пра- вых партий (высокое значение вто- рого фактора).

Рис.8. Заинтересованность политикой

Табл.6. Заинтересованность политикой

Заинтерес. политикой

Чел.

z(1)

z(2)

Высокая

112

0,37

–0,34

2.

559

0,02

–0,16

3.

556

–0,15

0,13

4. Совсем не интересна

309

0,02

0,21

5. Затрудн. ответить

52

1,11

–0,21

15 5. Федеральный округ

5. Федеральный округ

Рис.9. Федеральный округ

Табл.7. Федеральный округ

Федеральный округ

Чел.

z(1)

z(2)

Центральный

418

0,32

0,02

2. Северо-Западный

154

0,06

–0,08

3. Южный

253

0,21

–0,18

4. Поволжский

343

–0,24

–0,08

5. Уральский

92

0,31

0,32

6. Сибирский

210

–0,57

0,21

7. Дальневосточный

118

–0,18

0,02

16 6. Регионы (обратные координаты

6. Регионы (обратные координаты

99 – Москва 04 – Алтай 58 – Пензенская обл. 61 – Ростовская обл. 54 – Новосибирская обл. 02 – Башкирия 42 – Кемеровская обл. 69 – Тверская обл. 53 – Новгородская обл. 25 – Приморский край 72 – Тюменская обл. 65 – Сахалинская обл. 30 – Астраханская обл.

Рис.10. Регионы

17 7. Размер населенного пункта

7. Размер населенного пункта

Рис.11. Размер населенного пункта

Табл.8. Размер населенного пункта

Размер насел. пункта

Чел.

z(1)

z(2)

Москва, СП

163

1,54

–0,25

2.

139

–0,44

–0,33

3.

148

0,01

0,14

4.

290

–0,34

0,32

5.

135

0,23

–0,35

6.

171

0,39

0,61

7.

116

–0,18

0,10

8. Село

426

–0,28

–0,17

18 8. Москва

8. Москва

Рис.13. Москва. Партии 2 – ЕР, 3 – КПРФ, 4 – ЛДПР, 7 – СР, 10 – Яблоко, 14 – не голосов.

Рис.12. Москва. 2 кластера: недовольные «экономически продвинутые» и довольные «непродвинутые»

19 8. Москва

8. Москва

Рис.14. Москва. Доход 2 – выше среднего, 5 – бедные

Рис.15. Москва. Доверие к Путину 0 – не доверяют, 1 – доверяют

20 9. Доверие к Путину

9. Доверие к Путину

Готовность к акциям протеста

Модель множественного выбора

Табл.9. Доверие к Путину

Табл.10. Готовность к акциям протеста

Образование (0?1) Не влияет Доверие к власти (0?1) ЕР (+) Жизнь в деревне (0/1) Бедность (0?1) ЛДПР(+) Возраст (в годах) КПРФ (+), СР (+) Пол ЛДПР (М) Степень влияния на жизнь в стране

Доверие к Путину

Чел.

z(1)

z(2)

Готовность к акциям протеста

Чел.

z(1)

z(2)

Да

1252

–0,02

0,11

Да

347

–0,23

–0,36

2. Нет

201

0,02

–0,44

2. Нет

1074

0,08

0,15

3. Затрудн. ответить

134

0,18

–0,39

3. Затрудн. ответить

165

–0,01

–0,25

21 Игра: моделирование избирателя

Игра: моделирование избирателя

Табл.11. Процент голосующих за партии (мужчины / женщины)

Табл.12. Процент голосующих за партии (мужчины)

z(1)

z(2)

Ер

Кпрф

Лдпр

Ср

0

0

73% / 86%

7% / 4%

11% / 2%

9% / 8%

3,4

0

83% / 92%

4% / 2%

7% / 1%

6% / 4%

–3,4

0

56% / 76%

13% / 8%

15% / 3%

14% / 13%

0

3,4

78% / 94%

1% / 1%

17% / 3%

3% / 3%

0

–3,4

45% / 61%

31% / 20%

4% / 1%

19% / 18%

Путин

Влиян.

Бедн.

Село

Возраст

Ер

Кпрф

Лдпр

Ср

1

1

1

1

30

94%

1%

1%

3%

1

1

4

0

30

78%

2%

16%

4%

0

0

1

1

30

61%

15%

13%

11%

0

0

4

0

30

23%

10%

62%

5%

1

1

1

1

60

85%

5%

1%

9%

1

1

4

0

60

74%

8%

8%

10%

0

0

1

1

60

37%

38%

4%

20%

0

0

4

0

60

21%

36%

29%

14%

22 Игра: моделирование избирателя

Игра: моделирование избирателя

Профили репрезентативных избирателей ключевых партий: ЕР (97%): женщина, z(1)=0, z(2)=0, 30 лет, город, обеспеченная, доверяет Путину, доверяет Думе, влияет на жизнь. ЛДПР (88%): мужчина, z(1)=–1,7, z(2)=1,7, 30 лет, город, бедный, не доверяет Путину, доверяет Думе, не влияет на жизнь. КПРФ (33%): мужчина, z(1)=–1,7, z(2)=–1,7, 60 лет, село, бедный, не доверяет Путину, не доверяет Думе, не влияет на жизнь. Не голосует: низкое образование, низкий доход, недоверие, молодежь, город.

Табл.13. Процент голосующих за партии (факт / при наличии «против всех»)

Идеи дальнейших исследований: Позиции партий – сознательное поведение (равновесие Нэша). Изменение экономического положения за последние годы (экон.голосование).

Путин

Ер

Кпрф

Лдпр

Ср

Против всех

Ноябрь, 2007

72% / 56%

11% / 9%

7% / 5%

10% / 8%

/ 22%

50%

61% / 35%

16% / 13%

11% / 8%

12% / 8%

/ 36%

0%

43% / 18%

25% / 16%

19% / 11%

12% / 6%

/ 49%

23 Спасибо за внимание

Спасибо за внимание

«Метод главных компонент»
http://900igr.net/prezentacija/pedagogika/metod-glavnykh-komponent-245769.html
cсылка на страницу
Урок

Педагогика

135 тем
Слайды