Структурное подразделение: Международная лаборатория математических  методов исследования социальных сетей (Трусов А.В.) 

Руководитель работ: Трусов Александр Васильевич - к.ф-м.н., зав. Международной лабораторией математических методов исследования социальных сетей ИПЭИ

Сроки выполнения:  2017 год

Актуальность исследования: В онлайн социальных сетях продолжается накопления больших объемов данных на естественных языках, их исследование требует разработки таких моделей данных, которые позволяют учитывать знания о предметных областях и являются масштабируемыми, позволяют производить интеграцию больших объемов разнородных данных. Особую область исследования составляет обработка текстов на естественных языках. Содержащиеся в них сведения необходимо интегрировать в общие модели, которые во многих случаях строятся как сети: социальные, семантические и мультиразмерные. Для анализа моделей больших данных, представленных в виде сетей, разработаны методы социально-семантического анализа и масштабируемые алгоритмы линейной сложности. Сетевые модели могут давать дополнительные преимущества при при анализе данных, поскольку результаты анализа и соответствующие рекоммендации для принятия решений легче поддаются интерпретации и могут быть представлены и объяснены пользователю в терминах начальных данных. Необходимо усовершенствовать алгоритмы обработки текстов на естественных языках с помощью сетевых моделей. 

Основная цель исследования: Разработка алгоритмов социально-семантического анализа текстов на естественных языках для случая большего объема данных. 

Основные фундаментальные и прикладные задачи, решаемые в рамках исследования: 

  • разработать технологию моделирования корпуса текстов на естественном языке в виде мультиразмерного графа в случае большого объема данных;
  • разработать алгоритмы моделирования и визуализации результатов моделирования.