Aj hlas môže byť nástrojom diagnostiky
Posledný októbrový štvrtok patril v rožňavskom Kultúrno-kreatívnom centre Kláštor už tradičnému stretnutiu s vedou. V rámci cyklu Vivat scientia! Nech žije veda! sa predstavil Mgr. Robert Sabo, PhD. z Ústavu informatiky SAV, v. v. i. Publiku priblížil, ako umelá inteligencia analyzuje ľudský hlas a čo všetko dokáže odhaliť o našom zdraví či kognitívnych schopnostiach. Publikum zaujali aj praktické príklady z výskumu rozpoznávania reči, sociálnej robotiky aj včasnej diagnostiky Alzheimerovej choroby na základe jemných zmien v hlase.
Reč nie je len nástroj komunikácie, nesie v sebe identitu, emócie a stres. Vedec Robert Sabo, v osobe ktorého sa prepája jazykoveda a informatika predstavil návštevníkom bohatú škálu projektov svojho pracoviska: od automatického prepisu reči pre súdy, cez syntézu hlasov a rozpoznávanie hovoriaceho až po jej využitie prostredníctvom sociálnej robotiky. „V hlase je oveľa viac informácií, než ľudské ucho dokáže postrehnúť. Počítače v ňom vedia nájsť vzorce, ktoré sú pre človeka neviditeľné,“ zdôraznil R. Sabo.
Jednou z najzaujímavejších častí prednášky bola ukážka systému, ktorý umožňuje robotovi viesť prirodzený dialóg, reagovať na emócie či prispôsobiť sa tempu reči. R. Sabo s kolegami skúma, ako môžu sociálni roboti pomôcť pri hodnotení kognitívnych funkcií a to najmä u starších ľudí. Výsledky prekvapili: seniori komunikáciu s robotom často vnímali príjemnejšie ako mladší účastníci. „Starší ľudia nemajú také nároky na technológiu, ak je pre nich interakcia zrozumiteľná a pokojná, prijmú ju veľmi prirodzene,“ vysvetlil.
Publikum sa v prednáške dozvedelo aj o výskume diagnostiky Alzheimerovej choroby z hlasu, ktorý je zastrešený v projektoch EWA a ALOIS. Vďaka nim vznikli rozsiahle databázy rečových prejavov zdravých aj chorých ľudí. Ich analýza ukazuje, že umelá inteligencia dokáže zachytiť jemné odchýlky v hlase už v štádiu miernej kognitívnej poruchy. „Neurónová sieť si všíma to, čo človek nedokáže. Nie obsah, ale spôsob reči, farbu hlasu, pauzy, tempo či mikrozmeny v intonácii,“ doplnil R. Sabo. Úspešnosť modelov navyše dosahuje okolo 90 percent, čo je pri skorom zachytení ochorenia mimoriadne hodnotné.
Prednáška ukázala, že výskum reči už dávno prekročil hranice jazykovedy a informatiky. Získava význam v medicíne, bezpečnosti, vzdelávaní aj v praxi, kde môže prispieť k automatizácii, dostupnej diagnostike a väčšej inkluzívnosti.
Videozáznam z prednášky si môžete pozrieť kliknutím na prehrávač vložený na konci textu.
Text a foto: Katarína Gáliková
Video: Martin Ferenc