Исследователи разработали модель машинного обучения, которая измеряет уровень спокойствия в стране путем анализа частоты слов в ее новостных СМИ.
В ходе исследования было проанализировано 723 574 статьи СМИ из 18 стран, которые были классифицированы как: «с высоким уровнем спокойствия», «со средним уровнем спокойствия» или «с низким уровнем спокойствия».
Страны с высоким уровнем мира преимущественно использовали слова, намекающие на оптимизм и повседневную жизнь, в то время как страны с низким уровнем мира склонялись к терминам, связанным с правительством и контролем.
Модель машинного обучения успешно идентифицировала страны со средним уровнем мира, используя обученные лингвистические критерии, демонстрируя свой прогностический потенциал.
Анализируя частоту употребления определенных слов в основных средствах массовой информации любой страны, алгоритм машинного обучения может создать количественный «индекс мира», который отражает уровень мира в этой стране, согласно новому исследованию, опубликованному на этой неделе в журнале открытого доступа PLOS ONE Ларри Либовичем и Питером Т. Коулманом из Колумбийского университета, США, и их коллегами.
Исследователи использовали машинное обучение, чтобы найти в местных новостных СМИ слова, которые наилучшим образом отражают уровень мира в стране. Менее мирные страны сосредотачиваются на государственном и социальном контроле, в то время как в более мирные страны сосредотачивают внимание на личных предпочтениях и повседневной деятельности. Ученые также обнаружили, что в странах с высоким уровнем мира наблюдается более высокий уровень разнообразия терминов, чем в странах с низким уровнем мира.
* Instagram, Facebook признаны экстремистcкими организациями в России