Оксфордские учёные разработали программу, профессионально читающую по губам
Оксфордским учёным в ходе научной работы удалось разработать специальную программу, которая профессионально читает по губам. Как показали эксперименты, с этой задачей программа справляется лучше, нежели обученные для этого люди. Специалисты из Оксфорда работали над созданием своего детища совместно с коллегами из компании DeepMind.
Программа под название Watch, Attend and Spell (WAS), основана на работе распознавания образов и машинного обучения. Система искусственного интеллекта просмотрела более 5 тыс. часов телепередач, и за это время ведущие произнесли порядка 118 тыс. предложений.
После обучения программы, эксперты провели сравнение её работы, с работой профессиональных переводчиков. Проанализировав полученные данные учёные установили, что человек способен распознать 12% слов, а созданная ими программа – 50%.
Читать по губам - это чрезвычайно сложный в освоении навык, и программа WAS значительно облегчит переводчикам работу, к примеру предлагая им варианты на утверждение. Исследователи предложили и иные варианты использования программы: озвучивание немых фильмов, распознавание речи нескольких людей одновременно, и давать указания смартфону в шумной атмосфере. Новая разработка станет отличным помощником в различных отраслях.
Программа под название Watch, Attend and Spell (WAS), основана на работе распознавания образов и машинного обучения. Система искусственного интеллекта просмотрела более 5 тыс. часов телепередач, и за это время ведущие произнесли порядка 118 тыс. предложений.
После обучения программы, эксперты провели сравнение её работы, с работой профессиональных переводчиков. Проанализировав полученные данные учёные установили, что человек способен распознать 12% слов, а созданная ими программа – 50%.
Читать по губам - это чрезвычайно сложный в освоении навык, и программа WAS значительно облегчит переводчикам работу, к примеру предлагая им варианты на утверждение. Исследователи предложили и иные варианты использования программы: озвучивание немых фильмов, распознавание речи нескольких людей одновременно, и давать указания смартфону в шумной атмосфере. Новая разработка станет отличным помощником в различных отраслях.