Новый алгоритм отличит вежливую беседу от диалога с нецензурными фразами
Исследователями Корнельского университета создан алгоритм, назначение которого помочь модерировать сообщения администраторам социальных сетей, содержащих в теме вражду и ненависть. Нейросетью различается вежливая беседа и оскорбительная, причем показатель распознавания, всего на 7% хуже человека. Результаты работы размещены на страницах сайта университета.
В процессе обучения алгоритма, исследователями использованы данные из базы Wikipedia - Talk pages, которая хранит диалоги, принадлежащие администраторам онлайн-библиотек по теме достоверностей статей. Загрузили в нейросеть 1,2 тыс. бесед, которые начинаются репликами вежливого характера, а затем добавляются сообщения язвительного и грубого содержания.
В итоге искусственным интеллектом распознаются такие вежливые фразы как «спасибо за оказанную помощь» или «пожалуйста, найди источники к правке». Высказывания, по характеру похожие на «твои источники не имеют значения», распознаются как грубые. Учеными отмечено, что если диалоги начинаются с прямого обращения «ты», то в результате тема переходит в оскорбления.
Профессор Корнельского университета Кристиан Данеску-Мизил отметил, что миллионы людей каждый день спорят друг с другом в интернете, отследить в реальном времени их невозможно. Система может помочь модераторам сосредоточиться в нужном направлении. Человек интуитивно ощущает, если разговор заходит в тупик, алгоритм это угадывает на 100%.
В процессе обучения алгоритма, исследователями использованы данные из базы Wikipedia - Talk pages, которая хранит диалоги, принадлежащие администраторам онлайн-библиотек по теме достоверностей статей. Загрузили в нейросеть 1,2 тыс. бесед, которые начинаются репликами вежливого характера, а затем добавляются сообщения язвительного и грубого содержания.
В итоге искусственным интеллектом распознаются такие вежливые фразы как «спасибо за оказанную помощь» или «пожалуйста, найди источники к правке». Высказывания, по характеру похожие на «твои источники не имеют значения», распознаются как грубые. Учеными отмечено, что если диалоги начинаются с прямого обращения «ты», то в результате тема переходит в оскорбления.
Профессор Корнельского университета Кристиан Данеску-Мизил отметил, что миллионы людей каждый день спорят друг с другом в интернете, отследить в реальном времени их невозможно. Система может помочь модераторам сосредоточиться в нужном направлении. Человек интуитивно ощущает, если разговор заходит в тупик, алгоритм это угадывает на 100%.