Американские исследователи научились предсказывать одиночество человека по автоматическому анализу его речи. Для этого они собрали интервью 80 пожилых добровольцев и построили модель, которая соотносит различные параметры сказанного (длину текста и, например, эмоциональную наполненность) с количественными и качественными признаками одиночества: тем, как человек сам отвечает на вопрос о своем ощущении, и тем, какие ответы он дает в соответствующих опросниках. Алгоритм научился предсказывать одиноких с точностью до 94 процентов, а с помощью анализа интервью ученые также выделили различия в том, как выражают свои ощущения мужчины и женщины. Статья опубликована в The American Journal of Geriatric Society.
Основным методом диагностики психических расстройств и симптомов до сих пор остается беседа с психиатром или терапевтом: по жалобам пациента на его состояние, навязчивые мысли и прочие признаки врач выносит соответствующий диагноз. Пока другие методы диагностики (например, с помощью нейровизуализации) находятся на стадии исследований, ученые пытаются улучшить и классическую диалектную диагностику.
Один из способов такого улучшения — автоматизация. Пациент по тем или иным причинам (скажем, из-за страха стигматизции) может не сообщать психиатру о каких-то симптомов. В таком случае автоматическая диагностика по речи в действительности может быть полезной: с помощью методов обработки естественного языка исследователи могут определить наиболее вероятный диагноз по речи пациента и вне беседы с психиатром — по словам, которые он употребляет, эмоциональному окрасу и прочим признакам.
Так, автоматически по речи уже научились диагностировать депрессию, предсказывать психоз, а также определять шизофрению на начальных стадиях развития. Варша Бадал (Varsha Badal) из Калифорнийского университета в Сан-Диего и ее коллеги предложили диагностировать по речи еще одно состояние — одиночество.
Ученые сосредоточились на пожилых людях — наиболее уязвимой перед одиночеством группой населения: всего в исследовании приняли участие 80 англоязычных людей в возрасте от 66 до 94 лет. Каждый из них заполнил стандартизированный опросник на определение одиночества, а также поучаствовал в интервью длительностью до 90 минут. В нем экспериментаторы сперва спрашивали у участников, чувствуют ли они себя одинокими, а затем либо просили рассказать, в чем для них проявляется это чувство, либо (при отрицательном ответе) — порассуждать о том, почему одинокими себя могут чувствовать другие люди.
Полученные интервью затем транскрибировали вручную (всего получилось 80 транскриптов общей длиной более 1,2 миллиона слов) и исследовали с помощью доступных алгоритмов обработки естественного языка. В частности, особое внимание исследователи обратили на длину ответов участников, степень их согласия и эмоциональную наполненность. Последние два параметра выделяются на основе слов, которые использует участник: скажем, большое количество конструкций с отрицанием будет указывать на то, что он не согласен с темой разговора, а семантика используемых слов — на испытываемые по поводу темы эмоции (всего использовалось пять стандартных: грусть, радость, страх, отвращение и злость).
Данные затем разделили в пропорции 4:1 на обучающую и тестовую выборку. С помощью первой исследователи обучили алгоритм, который предсказывает одиночество участника по согласию и эмоциональной наполненности в его речи: изначально для этого участников разделили на одиноких и неодиноких в зависимости от их ответа на вопрос «Чувствуете ли вы себя одинокими?». Подробности работы алгоритма ученые не раскрывают, но для него использовались стандартные методы кластеризации и классификации (среди них — метод k-ближайших соседей и random forest).
Первичный анализ интервью показал, что одинокие участники говорили больше (p < 0,01), причем длина интервью коррелировала как с качественной оценкой (ответом на вопрос об одиночестве), так и с количественной (результатом опросника). Женщины оказались более одинокими по качественным оценкам, а мужчины — по количественным. Для одинокой речи была характерна грусть, и ее, в основном, выражали женщины; мужчины же чаще использовали семантически радостные и боязливые конструкции — по-видимому, это и стало причиной того, что по количественным оценкам их одиночество определялось лучше.
При этом алгоритм машинного обучения, который предсказывал одиночество по интервью, с задачей справился успешно: качественные признаки одиночества он распознавал с точностью до 94 процентов, а количественные — с точностью до 76 процентов.
Как показывают исследования, одиночество связано с повышенным риском развития самых разных заболеваний, включая диабет и деменцию. Так как риск этих заболеваний также растет с возрастом, своевременная профилактика может сильно помочь — и в этом смысле новые, автоматизированные способы диагностики очень полезны. Пока подобные алгоритмы не применяют в психиатрической практике, они все равно могут помочь: например, показать специалистам, как именно люди выражают свое одиночество в зависимости от пола, и улучшить тем самым диагностику по беседе.
Вообще, одиночество и возраст довольно сильно связаны: например, когда человек еще молодой, с тем, ощущает ли он себя одиноким, связана его этническая принадлежность, а вот в пожилом возрасте — состояние здоровья.
Иллюстрация к статье:
Обсуждение