Структурное подразделение: Международная лаборатория математических методов исследования социальных сетей (Трусов А.В.)
Руководитель работ: Трусов Александр Васильевич - к.ф-м.н., зав. Международной лабораторией математических методов исследования социальных сетей ИПЭИ
Сроки выполнения: 2017 год
Актуальность исследования: В онлайн социальных сетях продолжается накопления больших объемов данных на естественных языках, их исследование требует разработки таких моделей данных, которые позволяют учитывать знания о предметных областях и являются масштабируемыми, позволяют производить интеграцию больших объемов разнородных данных. Особую область исследования составляет обработка текстов на естественных языках. Содержащиеся в них сведения необходимо интегрировать в общие модели, которые во многих случаях строятся как сети: социальные, семантические и мультиразмерные. Для анализа моделей больших данных, представленных в виде сетей, разработаны методы социально-семантического анализа и масштабируемые алгоритмы линейной сложности. Сетевые модели могут давать дополнительные преимущества при при анализе данных, поскольку результаты анализа и соответствующие рекоммендации для принятия решений легче поддаются интерпретации и могут быть представлены и объяснены пользователю в терминах начальных данных. Необходимо усовершенствовать алгоритмы обработки текстов на естественных языках с помощью сетевых моделей.
Основная цель исследования: Разработка алгоритмов социально-семантического анализа текстов на естественных языках для случая большего объема данных.
Основные фундаментальные и прикладные задачи, решаемые в рамках исследования:
- разработать технологию моделирования корпуса текстов на естественном языке в виде мультиразмерного графа в случае большого объема данных;
- разработать алгоритмы моделирования и визуализации результатов моделирования.