Anatoly Levenchuk (ailev) wrote in openmeta,
Anatoly Levenchuk
ailev
openmeta

Categories:

Компьютерный синтез голоса с интонациями

Компьютерный синтез голоса стал еще ближе -- послушайте, например, Вокалоид (http://www.vocaloid.com/en/sample.html).

Кто не знает про Вокалоид: это такая фирменная технология от Yamaha, которая на входе берет японский или английский письменный текст и миди, и поет этот текст голосом засэмплированного певца/певицы в соответствии с миди. И все это удовольствие будет стоить каких-нибудь $330 для голосов безвестных вокалистов, которые, думаю, нас вполне удовлетворят. В продаже все эти чудеса с января 2004г.

Нас, конечно, интересует не пение, а речь -- интонационные паттерны (коих metanymous оценивал, насколько я помню, в пару десятков). Петь, оказывается, легче, чем говорить: It is possible to synthesize the spoken word by inputting notes and pitch bend to represent the intonation, but it is not easy to create the complex intonation curve by hand. Please note that VOCALOID is a system for mainly synthesizing songs. Для наших целей, конечно, нужно будет сделать приладу, которая создает сложные интонационные кривые отнюдь не руками. Теперь достаточно взять какой-нибудь кинодвижок, создать аватару с грудью попышнее или торсом помогучей, приделать синхронизацию с голосом -- и вот уже можно генерировать внушения на любую подходящую тему.

Потом начнем разбираться с вербальной/невербальной обратной связью -- эти технологии тоже могут оказаться доступны быстрее, чем мы сейчас думаем.
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 4 comments