Говорить президент: як відрізняються виступи Порошенка в Україні та за кордоном
Чому нам не байдуже, що говорять політики й чиновники? Ми сподіваємося, що вони дотримуються принципу "моє слово непорушне", серйозно ставляться до обіцянок і відповідають за те, що кажуть.
Ось чому журналісти, політологи та громадськість скрупульозно вивчають кожен значущий виступ. Раніше в такому аналізі була присутня неабияка частка суб’єктивності, а тлумачення результатів відрізнялися.
З розвитком обчислювальної техніки з’явилися нові методи контент-аналізу (метод тематичної моделі, Wordscore, машинне навчання, технології обробки великих даних), які допомагають більш об’єктивно оцінити тексти. Дійсно, сьогодні дослідники можуть аналізувати великі обсяги текстової інформації й системно визначати їхні властивості.
Ми провели контент-аналіз промов, з якими президент Петро Порошенко виступав із березня 2015 по травень 2016 року. На його офіційному сайті ми вибрали всі виступи англійською мовою до 1 червня 2016-го. Дата першої промови — 16 березня 2015, останньої — 23 травня 2016 року.
Усього ми завантажили тексти 30 виступів. Із цих промов 19 (63%) Порошенко виголосив перед журналістами й політиками інших країн (наприклад, під час закордонних візитів), а 11 — перед українською аудиторією (зокрема, у парламенті).
Аналіз переслідував кілька цілей. По-перше, ми хотіли візуалізувати хмару слів і використали метод латентного розміщення Дирихле, щоби виявити додаткові або неявні теми. По-друге,
обчисливши схожість між виступами за кордоном і в Україні, ми перевірили, чи відрізняються повідомлення Порошенка для української та іноземної аудиторій.
По-третє, ми використали характеристики легкості читання текстів, щоб оцінити, чи доступно президент викладає думки перед публікою. Нарешті, за допомогою програми Wordfish ми визначили політичну позицію президента.
Найпростіший прийом аналізу текстів — візуальне відображення часто вживаних слів у вигляді "хмари".
На малюнку 1 — "мовні дані" із зазначенням 50 слів, які президент використовував найчастіше. Слова визначалися за допомогою терм-документної матриці та моделі LDA, яка дає змогу відслідкувати "неявні групи слів". Наприклад, ця модель допомагає виявити тему співпраці з Німеччиною в гуманітарній сфері на основі ймовірності використання слів "гуманітарний", "Україна", "важливий", "канцлер", "Німеччина", "підтримка", "симпатизувати".
Ми з’ясували, що ці слова визначають топ-5 неявних тем у промові 15 березня 2015-го.
Крім того, у всіх виступах перед закордонними та українськими слухачами є кілька відмінностей. Промови для співвітчизників налічують у середньому 104 речення, а для іноземної аудиторії вдвічі коротші — 54.
Щоби перевірити, чи є подібність між цими виступами, ми використали косинусний коефіцієнт — міру подібності наповнення текстів. Якщо два виступи не подібні, коефіцієнт дорівнює 90° (тобто тексти "перпендикулярні"). Якщо подібність є повною, то кут дорівнює 0° (тобто тексти повністю збігаються).
Наприклад, косинусна відстань між словами "Україна" і "Україна" — 0°, а між словами слова "російський" від "український" — усього 0,7°: це найвища подібність у порівнянні з іншими країнами й регіонами (ЄС, США тощо).
Ми визначили, що косинусна відстань між промовами для української та зарубіжної аудиторій — 0,823 з 90,0.
Це вказує на високий ступінь подібності між ними. Тобто президент послідовно доносить свої повідомлення і до співвітчизників, і до зарубіжних слухачів.
Далі за допомогою індексу легкості читання Флеша-Кінкейда ми з’ясували, наскільки тексти виступів Порошенка є складними. Цей індекс дає можливість визначити рівень освіти, необхідний для сприйняття виступів.
Високе значення індексу вказує на погану читабельність (тобто промову важко зрозуміти). На малюнку 2 показана зміна індексу легкості читання Флеша-Кінкейда (вісь Y) для всіх виступів (вісь X).
Загалом промови виявилися простими для розуміння аудиторією з освітою від 10 до 16 років (10 років — середня освіта, 16 років — вища). Втім, легкість читання виступів Порошенка перед зарубіжними журналістами й політиками гірша, ніж перед українцями. Це означає, що
виступаючи перед зарубіжною аудиторією, український президент орієнтується на більш освічених слухачів.
Загалом найгірша читабельність (індекс Флеша-Кінкейда 16,86) — у тексту виступу 25 квітня на 17-му саміті "Україна-ЄС". Промова від 17 липня 2015-го (президент звинуватив проросійських сепаратистів у тому, що вони збили рейс MH17 "Малайзійських авіаліній") має найвищу читабельність (індекс Флеша-Кінкейда 9,34).
А тепер про ключову відмінність внутрішніх та зовнішніх промов Петра Порошенка. Таку відмінність знайдено в ідеологічному забарвленні його промов.
Політичний спектр зазвичай описують як позиції в діапазоні від лівого крила до правого. За міжнародною класифікацією комунізм і соціалізм прийнято вважати лівими переконаннями, консерватизм — правими.
Wordfish — алгоритм ранжування слів для визначення політичних позицій на основі частотності й текстової інформації. На малюнку 3 — оцінка політичної позиції Порошенка, виходячи з аналізу його виступів для української та зарубіжної аудиторій за допомогою моделі Wordfish.
На вертикальній осі вказана шкала політичних позицій від лівого до правого крила (від позитивного до негативного значень). Нуль означає невизначеність позиції.
На горизонтальній осі відмічений час, коли президент виступав перед публікою. Як бачимо,
політична позиція Порошенка має тенденцію до зміщення вліво, коли він виступає в Україні.
Натомість у деяких промовах перед іноземними журналістами й політиками вона, швидше, відходить вправо. Виступи, що пролунали в Україні 17 липня 2015-го та 30 жовтня 2015-го, зміщуються в праву частину політичного спектра. Перший присвячений знищенню рейсу MH17; другий — висловленню солідарності з Францією у зв’язку з терактом.
Ці події давали президенту можливість зайняти консервативну позицію.
Промова перед українцями 4 червня 2015-го — вираження крайньої лівої позиції.
На основі статистичного аналізу текстів виступів Порошенка можна зробити кілька висновків.
Тексти написані простою мовою, зрозумілою звичайному слухачеві. Однак виступи, адресовані зарубіжній аудиторії, більш складні. Це означає, що промови на міжнародних конференціях або в якості запрошеного оратора розраховані на аудиторію більш високого освітнього рівня.
Меседжі для української та зарубіжної аудиторій схожі.
Втім, у виступах перед українцями риторика Порошенка зміщується в ліву частину політичного спектра, а перед зарубіжними журналістами або політиками — трохи вправо з деякими варіаціями в динаміці за часом. Різниця в політичних позиціях пов’язана також із певними темами й ситуаціями. Наприклад, в економічних і соціальних питаннях президент демонструє ліві позиції, а під час звинувачень у терактах вони зміщуються вправо.
Автори:
Юрій Городниченко, доцент Каліфорнійського університету в Берклі,
Олександр Талавера, доцент Школи менеджменту при Шеффілдському університеті,
Хаофен Сюй, співробітник Шеффілдського університету
Стаття підготовлена VoxUkraine для "Європейської правди"