Spoločnosť Google vyvinula úplne nový systém prevodu textu na reč. Nazvala ho Tacotron 2 a funguje až neuveriteľne presne.

Systém Tacotron 2 pozostáva z dvoch inteligentných neurónových sietí – z jednej, ktorá konvertuje text na špeciálny spektrogram a z druhej, ktorá graf číta a interpretuje ho do skutočného hlasu. Ten je pritom na nerozoznanie od ľudského a je inteligentnejší než sa môže zdať. Pokiaľ je napríklad nejaké slovo celé napísané veľkými písmenami, hlas ho pri čítaní zdôrazní. Dokáže dokonca aj rozoznávať čiarky vo vetách a správne prečítať chybný text, veď presvedč sa sám.

„That girl did a video about Star Wars lipstick.“

Na prvé počutie dve úplne rovnaké zvukové ukážky. V prvej z nich ale rozpráva skutočný ľudský hlas a v druhej počítačovo generovaný hlas.

Nenechaj si ujsť
Len za 4 hodiny! Umelá inteligencia Googlu sa naučila celú históriu a princípy šachu

Systém vie perfektne čítať aj zložité slová:

„Generative adversarial network or variational auto-encoder.“

„Basilar membrane and otolaryngology are not auto-correlations.“

Tacotron 2 pozná veľmi dobre sémantiku a vďaka nej dokáže zvoliť správnu výslovnosť:

„He has read the whole thing.“

„He reads books.“

„Don’t desert me here in the desert!“

„He thought it was time to present the present.“

Príklad, ako dokáže systém rozoznať chyby a pri výslovnosti ich opraviť:

„Thisss isrealy awhsome.“

Cudzia mu nie je ani čiarka vo vete:

„This is your personal assistant, Google Home.“

„This is your personal assistant Google Home.“

Intonácia zvýraznených slov:

„The buses aren’t the problem, they actually provide a solution“.

„The buses aren’t the PROBLEM, they actually provide a SOLUTION.“

Systém si hravo poradí aj s náročným jazykolamom:

„Peter Piper picked a peck of pickled peppers. How many pickled peppers did Peter Piper pick?“

„She sells sea-shells on the sea-shore. The shells she sells are sea-shells I’m sure.“

Dobrou správou tiež je, že Tacotron 2 nezostane iba v laboratóriu, a teda sa reálne dostane k používateľom. Google už teraz používa v Asistentovi WaveNet sieť pre vytvorenie oveľa realistickejšieho hlasu. Keď bude nový Tacotron 2 dotiahnutý k dokonalosti, zrejme sa taktiež dostane do Asistenta a ďalších podobných systémov.

Pošli nám TIP na článok



Teraz čítajú