№ | Слайд | Текст |
1 |
 |
Метод главных компонентТеория и практика на примере выявления политических предпочтений Филатов А.Ю. Институт систем энергетики им.Л.А.Мелентьева, Иркутский государственный университет http://polnolunie.baikal.ru/me/mat_ec.htm, http://polnolunie.baikal.ru/me/metrix.htm, http://matec.isu.ru, http://fial_.livejournal.com |
2 |
 |
Снижение размерности признакового пространстваПричины: Сжатие объемов хранимой информации. Наглядное представление данных ( p = 1,2,3). Лаконизм моделей, упрощение счета и интерпретации. Увеличение точности выводов, зависящей от n / ( p+1). Борьба с мультиколлинеарностью – взаимозависимостью регрессоров. Требования к новым показателям: Максимальная информативность. Взаимная некоррелированность. Минимальное искажение геометрической структуры исходных данных. Ситуации, в которых снижение размерности осуществить легко: Дублирование информации (исключение). Наличие неинформативных переменных (исключение). Наличие однотипных переменных (агрегирование) |
3 |
 |
Метод главных компонент1. Подготовительный этап 1) Центрирование и нормирование переменных – переход к 2) Вычисление матрицы ковариаций 2. Решение характеристического уравнения 1) Нахождение собственных чисел 2) Нахождение собственного вектора для каждого корня 3. Переход к новым переменным – новые переменные, «главные компоненты» – Доля дисперсии, вносимая первыми главными компонентами |
4 |
 |
Геометрическая демонстрация метода главных компонентРис.1. Умеренный разброс точек вдоль Рис.2. Вырожденный случай: отсутствие разброса вдоль |
5 |
 |
Проблема интерпретации главных компонентМатрица нагрузок главных компонент на исходные переменные: ## Наблюдения – помесячные данные – Число торговых точек, где распространяется продукция, шт. – Расходы на рекламу, руб. – Доля новинок в ассортименте, % – средний месячный доход на душу населения, руб. – Количество праздников, шт. Тесно связана с , , . Тесно связана с , . |
6 |
 |
Эмпирическое исследование: Опрос ВЦИОМ, осень 2007Дано: 40 понятий Каждый из 1589 респондентов выбирает несколько (в пределах 15), вызывающих у него положительную или отрицательную реакцию Дополнительные вопросы: Намерение голосовать за ту или иную партию на предстоящих выборах Демографические характеристики (пол, возраст, образование, доход) Заинтересованность политикой Степень влияния на жизнь в стране Регион и тип населенного пункта, где проживает респондент Доверие к Президенту, другим органам власти Модификация данных: Каждому понятию присвоено значение –1, если оно вызывает у респондента отрицательные чувства, 1, если оно вызывает у респондента положительные чувства, 0, если оно не вызывает никаких чувств. |
7 |
 |
Исходные данныеТабл.1. Доля респондентов, оценивших понятие как положительное или отрицательное Понятие Полож Отриц Понятие Полож Отриц 01. Нация 0,21 0,08 21. Ссср 0,12 0,08 02. Порядок 0,57 0,01 22. Церковь 0,21 0,02 03. Свобода 0,37 0,03 23. Революция 0,01 0,22 04. Рынок 0,10 0,15 24. Собственность 0,14 0,04 05. Русские 0,34 0,02 25. Успех 0,31 0,00 06. Запад 0,02 0,23 26. Либерализм 0,01 0,14 07. Социализм 0,11 0,11 27. Реформа 0,06 0,14 08. Коммунизм 0,07 0,19 28. Стабильность 0,38 0,00 09. Демократия 0,15 0,09 29. Труд 0,31 0,00 10. Традиция 0,29 0,01 30. Индивидуализм 0,02 0,12 11. Патриотизм 0,34 0,01 31. Нерусские 0,02 0,29 12. Государство 0,26 0,03 32. Равенство 0,18 0,02 13. Конкурентоспособн. 0,05 0,07 33. Коллективизм 0,06 0,09 14. Суверенитет 0,07 0,05 34. Мораль 0,22 0,03 15. Элита 0,02 0,41 35. Права человека 0,32 0,02 16. Партия 0,02 0,16 36. Богатство 0,12 0,01 17. Власть 0,09 0,18 37. Россия 0,28 0,00 18. Справедливость 0,49 0,02 38. Достаток 0,37 0,01 19. Оппозиция 0,01 0,17 39. Прогресс 0,21 0,01 20. Бизнес 0,07 0,13 40. Капитализм 0,15 0,02 |
8 |
 |
Интерпретация главных компонентРис.3. Собственные числа главных компонент z(1) – «толерантность» Высокое значение соответствует отсутствию отрицательной реакции на слова «элита», «нерусские», «рынок», «запад», «власть» и «реформа», а также отсут- ствию положительной реакции на слова «справедливость» и «труд». z(2) – «экономическая свобода» Высокое значение соответствует положительной реакции на слова «свобода», «бизнес», «успех», «богатство», «достаток», «прогресс» и «капитализм» и от- рицательной реакции на «социализм», «коммунизм», «СССР», «революцию» и «коллективизм». |
9 |
 |
Матрица факторных нагрузокТабл.2. Коэффициенты корреляции главных компонент и исходных переменных Понятие z(1) z(2) Понятие z(1) z(2) 01. Нация 0,11 -0,08 21. Ссср -0,01 -0,34 02. Порядок -0,18 0,01 22. Церковь -0,13 -0,01 03. Свобода -0,13 0,20 23. Революция 0,13 -0,26 04. Рынок 0,26 0,08 24. Собственность 0,13 0,14 05. Русские -0,15 0,03 25. Успех -0,16 0,21 06. Запад 0,21 0,10 26. Либерализм 0,15 -0,01 07. Социализм -0,13 -0,28 27. Реформа 0,23 -0,02 08. Коммунизм 0,05 -0,32 28. Стабильность -0,16 0,00 09. Демократия 0,11 0,07 29. Труд -0,26 -0,08 10. Традиция -0,06 -0,04 30. Индивидуализм 0,05 0,10 11. Патриотизм -0,14 -0,15 31. Нерусские 0,25 -0,12 12. Государство -0,17 -0,03 32. Равенство -0,18 0,06 13. Конкурентоспособн. 0,07 0,12 33. Коллективизм 0,02 -0,22 14. Суверенитет -0,08 0,01 34. Мораль -0,05 -0,07 15. Элита 0,30 0,04 35. Права человека -0,15 0,12 16. Партия 0,04 -0,14 36. Богатство -0,15 0,25 17. Власть 0,26 -0,09 37. Россия -0,03 0,07 18. Справедливость -0,30 0,02 38. Достаток 0,11 0,25 19. Оппозиция 0,12 -0,06 39. Прогресс -0,03 0,27 20. Бизнес 0,17 0,27 40. Капитализм -0,09 0,22 |
10 |
 |
Распределение предпочтений – все респондентыРис.4. Распределение предпочтений – все респонденты |
11 |
 |
1. Партийные симпатииРис.5. Партийные симпатии Табл.3. Партийные симпатии Предпочтения % z(1) z(2) Аграрная 0,63 –0,16 –0,92 2. Ер 45,72 0,05 0,30 3. Кпрф 7,12 –0,76 –1,59 4. Лдпр 4,22 –0,53 0,69 6. Патриоты России 0,25 0,22 –0,10 7. Справедливая Россия 6,17 –0,60 –0,87 8. Свободная Россия 0,69 –0,43 0,31 9. Спс 0,57 –0,47 1,14 10. Яблоко 0,76 –0,56 0,20 11. Республиканская 0,25 –0,16 1,36 13. Демократическая 0,19 –0,25 0,75 14. Не голосовать 17,88 0,23 –0,06 |
12 |
 |
2. ДоходРис.6. Доход Табл.4. Доход Доход Чел. z(1) z(2) Высокий 41 –0,1 –0,16 2. Выше среднего 126 0,82 0,28 3. Средний 989 –0,04 0,19 4. Ниже среднего 383 0,15 –0,48 5. Низкий 79 –0,05 –0,59 |
13 |
 |
3. ОбразованиеРис.7. Образование Табл.5. Образование Образование Чел. z(1) z(2) Начальное 42 –0,24 –1,38 2. 118 –0,03 –0,80 3. 538 –0,06 0,04 4. 545 –0,17 0,12 5. 77 0,34 0,40 6. Высшее 268 0,18 0,11 |
14 |
 |
4. Заинтересованность политикойЕсли наложить данные графики на графики партийных предпочтений, обнаружим, что наиболее интересу- ются политикой сторонники КПРФ и СР (низкие значения обоих факто- ров), а наименее – сторонники пра- вых партий (высокое значение вто- рого фактора). Рис.8. Заинтересованность политикой Табл.6. Заинтересованность политикой Заинтерес. политикой Чел. z(1) z(2) Высокая 112 0,37 –0,34 2. 559 0,02 –0,16 3. 556 –0,15 0,13 4. Совсем не интересна 309 0,02 0,21 5. Затрудн. ответить 52 1,11 –0,21 |
15 |
 |
5. Федеральный округРис.9. Федеральный округ Табл.7. Федеральный округ Федеральный округ Чел. z(1) z(2) Центральный 418 0,32 0,02 2. Северо-Западный 154 0,06 –0,08 3. Южный 253 0,21 –0,18 4. Поволжский 343 –0,24 –0,08 5. Уральский 92 0,31 0,32 6. Сибирский 210 –0,57 0,21 7. Дальневосточный 118 –0,18 0,02 |
16 |
 |
6. Регионы (обратные координаты99 – Москва 04 – Алтай 58 – Пензенская обл. 61 – Ростовская обл. 54 – Новосибирская обл. 02 – Башкирия 42 – Кемеровская обл. 69 – Тверская обл. 53 – Новгородская обл. 25 – Приморский край 72 – Тюменская обл. 65 – Сахалинская обл. 30 – Астраханская обл. Рис.10. Регионы |
17 |
 |
7. Размер населенного пунктаРис.11. Размер населенного пункта Табл.8. Размер населенного пункта Размер насел. пункта Чел. z(1) z(2) Москва, СП 163 1,54 –0,25 2. 139 –0,44 –0,33 3. 148 0,01 0,14 4. 290 –0,34 0,32 5. 135 0,23 –0,35 6. 171 0,39 0,61 7. 116 –0,18 0,10 8. Село 426 –0,28 –0,17 |
18 |
 |
8. МоскваРис.13. Москва. Партии 2 – ЕР, 3 – КПРФ, 4 – ЛДПР, 7 – СР, 10 – Яблоко, 14 – не голосов. Рис.12. Москва. 2 кластера: недовольные «экономически продвинутые» и довольные «непродвинутые» |
19 |
 |
8. МоскваРис.14. Москва. Доход 2 – выше среднего, 5 – бедные Рис.15. Москва. Доверие к Путину 0 – не доверяют, 1 – доверяют |
20 |
 |
9. Доверие к ПутинуГотовность к акциям протеста Модель множественного выбора Табл.9. Доверие к Путину Табл.10. Готовность к акциям протеста Образование (0?1) Не влияет Доверие к власти (0?1) ЕР (+) Жизнь в деревне (0/1) Бедность (0?1) ЛДПР(+) Возраст (в годах) КПРФ (+), СР (+) Пол ЛДПР (М) Степень влияния на жизнь в стране Доверие к Путину Чел. z(1) z(2) Готовность к акциям протеста Чел. z(1) z(2) Да 1252 –0,02 0,11 Да 347 –0,23 –0,36 2. Нет 201 0,02 –0,44 2. Нет 1074 0,08 0,15 3. Затрудн. ответить 134 0,18 –0,39 3. Затрудн. ответить 165 –0,01 –0,25 |
21 |
 |
Игра: моделирование избирателяТабл.11. Процент голосующих за партии (мужчины / женщины) Табл.12. Процент голосующих за партии (мужчины) z(1) z(2) Ер Кпрф Лдпр Ср 0 0 73% / 86% 7% / 4% 11% / 2% 9% / 8% 3,4 0 83% / 92% 4% / 2% 7% / 1% 6% / 4% –3,4 0 56% / 76% 13% / 8% 15% / 3% 14% / 13% 0 3,4 78% / 94% 1% / 1% 17% / 3% 3% / 3% 0 –3,4 45% / 61% 31% / 20% 4% / 1% 19% / 18% Путин Влиян. Бедн. Село Возраст Ер Кпрф Лдпр Ср 1 1 1 1 30 94% 1% 1% 3% 1 1 4 0 30 78% 2% 16% 4% 0 0 1 1 30 61% 15% 13% 11% 0 0 4 0 30 23% 10% 62% 5% 1 1 1 1 60 85% 5% 1% 9% 1 1 4 0 60 74% 8% 8% 10% 0 0 1 1 60 37% 38% 4% 20% 0 0 4 0 60 21% 36% 29% 14% |
22 |
 |
Игра: моделирование избирателяПрофили репрезентативных избирателей ключевых партий: ЕР (97%): женщина, z(1)=0, z(2)=0, 30 лет, город, обеспеченная, доверяет Путину, доверяет Думе, влияет на жизнь. ЛДПР (88%): мужчина, z(1)=–1,7, z(2)=1,7, 30 лет, город, бедный, не доверяет Путину, доверяет Думе, не влияет на жизнь. КПРФ (33%): мужчина, z(1)=–1,7, z(2)=–1,7, 60 лет, село, бедный, не доверяет Путину, не доверяет Думе, не влияет на жизнь. Не голосует: низкое образование, низкий доход, недоверие, молодежь, город. Табл.13. Процент голосующих за партии (факт / при наличии «против всех») Идеи дальнейших исследований: Позиции партий – сознательное поведение (равновесие Нэша). Изменение экономического положения за последние годы (экон.голосование). Путин Ер Кпрф Лдпр Ср Против всех Ноябрь, 2007 72% / 56% 11% / 9% 7% / 5% 10% / 8% / 22% 50% 61% / 35% 16% / 13% 11% / 8% 12% / 8% / 36% 0% 43% / 18% 25% / 16% 19% / 11% 12% / 6% / 49% |
23 |
 |
Спасибо за внимание |
«Метод главных компонент» |