Google научит говорить роботов лучше людей
По заверению представителей компании DeepMind, все современные системы, которые синтезируют голос при помощи компьютера, основываются на устаревших технологиях. В противовес им, система WaveNet, разработанная этой компанией (владельцем которой является корпорация Google) позволит синтезировать практически неотличимый от человеческого голоса компьютерный аналог.
Благодаря новой технологии мы вполне можем уже в конце 21 века увидеть роботов, которые будут разговаривать как люди, а может даже лучше. Это вызывает определенную настороженность у футурологов-скептиков, но на то они и скептики, остальные же люди, особенно музыканты, точно оценят эту технологию, ведь она сможет генерировать любые звуки.
Ранее в новостях: специалисты уверены, что NASA специально скрывают инопланетян на Луне
Синтез речи по технологии WaveNet строится на принципе использования нейронных сетей - своеобразном искусственном интеллекте, работа которого примерно напоминает работу человеческого мозга. Для синтеза речи эта технология анализирует звуковые волны, производит сложные математические расчеты и на их основе генерирует речь. Старые технологии для синтеза речи используют заранее записанные фонетические последовательности, что делает речь слишком машинной.
Благодаря новой технологии мы вполне можем уже в конце 21 века увидеть роботов, которые будут разговаривать как люди, а может даже лучше. Это вызывает определенную настороженность у футурологов-скептиков, но на то они и скептики, остальные же люди, особенно музыканты, точно оценят эту технологию, ведь она сможет генерировать любые звуки.
Ранее в новостях: специалисты уверены, что NASA специально скрывают инопланетян на Луне
Синтез речи по технологии WaveNet строится на принципе использования нейронных сетей - своеобразном искусственном интеллекте, работа которого примерно напоминает работу человеческого мозга. Для синтеза речи эта технология анализирует звуковые волны, производит сложные математические расчеты и на их основе генерирует речь. Старые технологии для синтеза речи используют заранее записанные фонетические последовательности, что делает речь слишком машинной.