Mozilla собирает голоса для обучения программ распознавания речи
Представители сообщества Mozilla обратились к пользователям интернета с просьбой стать донорами голосов. Специалистам Mozilla голоса нужны для улучшения технологий по распознаванию речи, а также для развития приложений Alexa, Siri, Google Voice и других голосовых аналогов.
Голосовые помощники имеют большую базу данных с записанной речью. Однако, если в базе не содержится необходимое количество образцов определённого диалекта или акцента, то голосовым помощникам бывает трудно понять людей.
Работая над исправлением недочётов, в прошлом месяце сообщество Mozilla запустило проект Project Common Voice, в рамках которого планируется собрать около 10 тысяч часов записей с голосами людей, говорящих на разговорном английском языке, с широким спектром акцентов.
Чтобы стать участником проекта, нужно зайти на сайт Common Voice и оставить аудиозапись и свои демографические данные. После того, как будет набрано необходимое количество аудиозаписей, Mozilla разместит их в свободном доступе, для того чтобы у любого разработчика технологий распознавания речи была возможность воспользоваться данными для обучения своих систем.
В настоящее время Mozilla принимает записи только на английском языке. Если проект будет иметь успех, то записи будут осуществляться и на других языках.
Голосовые помощники имеют большую базу данных с записанной речью. Однако, если в базе не содержится необходимое количество образцов определённого диалекта или акцента, то голосовым помощникам бывает трудно понять людей.
Работая над исправлением недочётов, в прошлом месяце сообщество Mozilla запустило проект Project Common Voice, в рамках которого планируется собрать около 10 тысяч часов записей с голосами людей, говорящих на разговорном английском языке, с широким спектром акцентов.
Чтобы стать участником проекта, нужно зайти на сайт Common Voice и оставить аудиозапись и свои демографические данные. После того, как будет набрано необходимое количество аудиозаписей, Mozilla разместит их в свободном доступе, для того чтобы у любого разработчика технологий распознавания речи была возможность воспользоваться данными для обучения своих систем.
В настоящее время Mozilla принимает записи только на английском языке. Если проект будет иметь успех, то записи будут осуществляться и на других языках.