Для того, чтобы нейросети могли определять психологические характеристики, их нужно что? Правильно, обучить.
Первичная выборка для обучения состояла почти из миллиона добровольцев, которые заполнили 7 опросников минимум на 60 вопросов каждый, написали эссе на заданную тему и предоставили ссылку на заполненный аккаунт (один или несколько, в разных социальных сетях). Чтобы поучаствовать в нашем срезе и получить бесплатный доступ к платформе, участники должны были соответствовать ряду требований: быть старше 18 лет, заполнить согласие на обработку данных (без права передачи третьим лицам) и иметь открытый профиль в одной из популярных социальных сетей. Так появился первый срез - на май 2019.
Через год мы промониторили еще столько же аккаунтов (использовали случайную выборку и анкеты добровольцев). Началась пандемия, весь мир - без преувеличения - сидел дома и, разумеется, психологические характеристики сильно изменились.
Дальше это вошло в привычку - мы сделали срез в мае 2021, чтобы посмотреть, как большинство справилось с последствиями пандемии, и подтвердить или опровергнуть ужасающий рост кривых тревожности и депрессивности (привет, ковид и постковид), который фиксировали исследователи по всему миру. Исторически в России подобные замеры не делаются и широким массам не предоставляются, так что это была наша личная инициатива.
И, конечно, в 2022 новый срез мы не могли не сделать. И сами же ждали его с нетерпением.
Профиль каждого пользователя анализировался по 5 блокам:
- Ценности,
- Копинги,
- Психотипы,
- Защиты,
- Черты характера по Большой Пятерке.
Важно отметить, что
мы не храним персональные данные пользователей, весь датасет обезличен и не может быть использован никем, кроме нас, и ни для каких иных целей, кроме самой общей статистики (например, мы не фиксируем даже географию и точный возраст). Все расчеты ИИ делает онлайн - “читает” текст и генерирует отчет и рекомендации. То есть система в принципе не хранит никаких пользовательских данных, она считает, выдает результат и двигается дальше. Тексты не остаются ни внутри системы, ни где-либо еще, соответственно, даже мы сами никогда не соотнесем условного Василия Петровича со строчкой под номером 627182.
Таким образом мы накопили огромный массив обезличенных данных, и считаем своим долгом поделиться ими с широкой аудиторией. Все исследования были выполнены исключительно на базе наших нейросетей, без привлечения сторонних интересантов и их бюджетов.. Сегодня мы рассмотрим изменения психологических характеристик пользователей ВК, и, в течение ближайших недель, поделимся аналогичным исследованием пользователей Твиттера и, возможно, некоей запрещенной сети.
Отметим, что всем людям так или иначе присущи все черты всех анализируемых блоков, мы не можем быть только, например, маньяком с одной-единственной ценностью власти. Однако мы привели имеющиеся данные к 100% для максимальной видимости изменений.