Задача: Платежные документы содержат фразы описания товаров и услуг которые продают и покупают.
Нужно эту инфу преобразовать в таблицу ID компании список фраз.
Решение: Используем Томита-парсер NER модель bigARTM кластеризацию чтобы задачу решить.
Секция NLP
Moscow Data Science Major 31.08.2019
Презентации
Соц сети серии мероприятий Data Fest:
Источник: rutube.ru