Syntéza řeči v C#

Chtěli jste někdy naučit své aplikace mluvit? Pomocí tzv. SAPI to není nic těžkého.

Syntéza řeči (také známá pod názvem Text-to-speech, tedy „text na řeč“) je zjednodušeně generování lidské řeči počítačem. Programu, který toto dovede, se říká syntetizátor. Naším cílem bude si pomocí Speech API (SAPI) integrovaného ve Windows Vista a výš jeden takový syntetizátor vytvořit. Celé toto API sídlí v knihovně System.Speech.dll, ve které najdeme i pět důležitých namespaces:

System.Speech.Audioformat
System.Speech.Recognition
System.Speech.Recognition.SrgsGrammar
System.Speech.Synthesis
System.Speech.Synthesis.TtsEngine

Pro přístup ke schopnostem tohoto API musíme nejdřív do nového projektu (Console, WinForms, WPF, to je jedno) přidat referenci na System.Speech.dll (klikněte pravým tlačítkem na projekt v Solution Exploreru, zvolte Add Reference a na záložce .NET najděte položku System.Speech, volbu potvrďte tlačítkem OK).

Díky tomu se knihovna System.Speech.dll zkopíruje do složky „bin“ našeho projektu a my můžeme pomocí direktivy using přidat vybraný namespace a pracovat s jeho třídami.

„Text na řeč“

Windows Vista i Windows 7 mají SAPI integrované už v sobě, je tedy jasné, že ho samy dokážou využít. Používají ho v nástroji zvaném „Text na řeč“ („Text to speech“) a v základu najdeme v obou těchto systémech předinstalovaný jeden hlas, je jím „Microsoft Anna“. Koneckonců, můžete si s tímto prográmkem pohrát sami. Stačí otevřít Ovládací panely v klasickém zobrazení a poklikat na „Text na řeč“ (pro anglická Windows otevřete Control Panel v classic view a zvolte „Text to speech“).

Další hlasy můžete získat, pokud si stáhnete Microsoft Speech SDK 5.1.

Třída SpeechSynthesizer

Jak název napovídá, tato třída obstarává samotný převod textu na řeč. Rozhodně nejdůležitějšími metodami jsou Speech a SpeechAsync. První z nich vysloví zadaný text synchronně (aplikace bude zablokována, dokud počítač nedomluví) a druhá, SpeechAsync, začne mluvit asynchronně, tedy pomocí dalšího vlákna.

Třída SpeechSynthesizer poskytuje čtyři vlastnosti – Rate, State, Voice a Volume:

Rate – nastavuje rychlost mluvení, nabývá hodnot od -10 do 10.
State – vrátí aktuální stav SpeechSynthesizeru (jestli je připraven nebo právě mluví, atd.).
Voice – vrátí aktuálně používaný hlas jako VoiceInfo objekt.
Volume – nastavuje hlasitost hlasu, nabývá hodnot od 0 do 100.

Podívejme se na samotné použití metod Speak a SpeakAsync. Abychom si ukázali asynchronní povahu druhé metody, můžeme třeba vytvořit dvě instance třídy SpeechSynthesizer a první z nich nechat mluvit asynchronně zároveň s druhou:

SpeechSynthesizer ss1 = new SpeechSynthesizer();
SpeechSynthesizer ss2 = new SpeechSynthesizer();
ss1.SpeakAsync("I hope this article will be helpful.");
ss2.Speak("Hello, how are you doing?");

V namespace System.Speech.Synthesis najdeme kromě této i několik dalších zajímavých tříd. Více informací je například na MSDN.

Ukázková aplikace

Pomocí následující WPF aplikace si můžete funkcionalitu zmíněnou v tomto článku vyzkoušet na vlastní kůži. Na závěr dodám, že jediným podporovaným jazykem pro syntézu je angličtina, ostatním jazykům je jen stěží rozumět.

Aplikaci stáhnete ZDE.

Zdroj: http://www.c-sharpcorner.com/UploadFile/mahesh/SpeechWPF09302008223352PM/SpeechWPF.aspx

Nové články

Stavebnice umělé inteligence 1

Článek popisuje první část stavebnice umělé inteligence. Obsahuje lineární a plošnou optimalizaci. Demo verzi je možné použít pro výuku i zájmovou činnost. Profesionální verze je určena pro vývojáře, kteří chtějí integrovat popsané moduly do svých systémů.

Celý článekJaroslav Teda Google27. května 20247 názorů

Hybridní inteligentní systémy 2

V technické praxi využíváme často kombinaci různých disciplín umělé inteligence a klasických výpočtů. Takovým systémům říkáme hybridní systémy. V tomto článku se zmíním o určitém typu hybridního systému, který je užitečný ve velmi složitých výrobních procesech.

Celý článekJaroslav Teda Google14. září 20231 názor

Jak vést kvalitně tým v IT oboru: Naprogramujte si ty správné manažerské kvality

Vedení týmu v oboru informačních technologií se nijak zvlášť neliší od jiných oborů. Přesto však IT manažeři čelí výzvě v podobě velmi rychlého rozvoje a tím i rostoucími nároky na své lidi. Udržet pozornost, motivaci a efektivitu týmu vyžaduje opravdu pevné manažerské základy a zároveň otevřenost a flexibilitu pro stále nové výzvy.

Celý článekRedakce Google21. ledna 2022

Síla týmů se na home office může vytrácet. Odborníci radí, jak z pracovních omezení vytěžit maximum

Za poslední rok se podoba práce zaměstnanců změnila k nepoznání. Především plošné zavedení home office, které mělo být zpočátku jen dočasným opatřením, je pro mnohé už více než rok každodenní realitou. Co ale dělat, když se při práci z domova ztrácí motivace, zaměstnanci přestávají komunikovat a dříve fungující tým se rozpadá na skupinu solitérů? Odborníci na personalistiku dali dohromady několik rad, jak udržet tým v chodu, i když pracovní podmínky nejsou ideální.

Celý článekTomáš Čada Google16. června 202114 názorů

Syntéza řeči v C#

SHIELD Experience Upgrade 7 – méně hledání a více zábavy
Celá zprávička