Newsy

Próbka głosu pozwoli zdiagnozować chorobę i wykryć niebezpieczeństwo. Nad rozwojem technologii pracuje polska firma

2020-10-19  |  06:00

W ciągu ostatnich lat światowy rynek analizy mowy notuje szybki wzrost. Rozwój algorytmów Big Data i głębokiego uczenia się w połączeniu ze wzrostem mocy obliczeniowej sprawił, że możliwości analizy mowy są znacznie większe. Dla działów sprzedaży, marketingu i usług technologia analizy mowy oznacza wzrost przychodów i wydajności. To także korzyści dla samych użytkowników – technologia po samym głosie może zdiagnozować chorobę, a nawet stwierdzić, czy znajdujemy się w niebezpieczeństwie.

– Technologia analizy mowy oznacza np. wykrywanie różnego rodzaju przestępstw lub nadużyć w dużej liczbie rozmów telefonicznych, takich jak wyciek danych osobowych czy niewłaściwy sposób prowadzenia sprzedaży przez telefon. Drugi typowy przykład to ustalanie, dlaczego dany sprzedawca jest najlepszy, co powoduje jego sukces. To zaś wsparcie dla pozostałych sprzedawców, żeby mogli to robić lepiej – mówi agencji Newseria Innowacje dr hab. Bartosz Ziółko, prezes Techmo.

Technologia rozpoznawania może przełożyć się na dużą korzyść biznesową, przede wszystkim w obsłudze klienta, rezerwacjach telefonicznych czy ankietowaniu respondentów. Analiza mowy umożliwia takim firmom efektywne gromadzenie, porządkowanie i analizowanie dużych ilości danych o klientach i potencjalnych klientach.

– Analityka mowy dotyczy zarówno tonu wypowiedzi, emocji, słów kluczowych, może też pójść w trochę szerszy kontekst, np. jaki jest odbiorca, jaki jest jego profil – wskazuje dr hab. Bartosz Ziółko.

Technologia automatyzuje szereg procesów operacyjnych, w tym nagrywanie rozmów, rozpoznawanie mowy i transkrypcję, wyszukiwanie według słów kluczowych czy zarządzanie jakością rozmów. Za pomocą rozwiązań do analizy mowy wszystkie te procesy są wykonywane z większą szybkością i na wyższym poziomie niż w przypadku jakiegokolwiek systemu analizy danych, który obsługuje człowiek.

– Sprawny operator jest w stanie oglądać prawie 10 monitorów, obraz wideo może być przyspieszony dwukrotnie. Jednak w wypadku analizy mowy to nie jest możliwe. Jedna godzina analizy audio wymaga jednej godziny pracy człowieka, a więc jest to raczej nierealne w praktyce. Biorąc pod uwagę duże call center w Polsce, gdzie około tysiąc osób pracuje jednocześnie, musiałoby być drugie tysiąc osób, które to kontroluje, dlatego tutaj systemy informatyczne są kluczowe – przekonuje prezes Techmo.

Alexa Amazona czy Cortana Microsoftu to tylko przykłady narzędzi aktywowanych głosem. Systemy do analizy mowy, ale też takie, które można sterować poleceniami, są rozbudowane przede wszystkim w języku angielskim. W Polsce jeszcze stosunkowo mało jest nowoczesnych technologii, które bazowałyby na języku polskim – rozpoznawały mowę potoczną czy związki frazeologiczne. Może to zmienić polska firma Techmo.

–  Dla firm amerykańskich, globalnych, polski rynek nie jest aż tak duży, dlatego często nie chcą aż tyle czasu i energii poświęcać na dopracowanie tych narzędzi. Techmo w dużej mierze inwestuje w zrobienie tego typu rozwiązań skutecznych dla języka polskiego – wskazuje dr hab. Bartosz Ziółko.

Techmo umożliwia komunikację między inteligentnymi urządzeniami czy między budynkami a użytkownikami. Maszyny można też nauczyć rozpoznawać choroby i identyfikować ryzyko ich wystąpienia wyłącznie na podstawie głosu. To narzędzie nie do przecenienia w telemedycynie. Naukowcy ustalają takie parametry mowy i oddechu podczas mowy, które są charakterystyczne dla danej choroby, a sztuczna inteligencja jest w stanie je rozpoznać tylko na podstawie próbki głosu.

Co istotne, narzędzia do analizy głosu potrafią ocenić, czy dana osoba znajduje się w niebezpieczeństwie – badają nie tylko tembr głosu, ale też użyte słowa. Na tej podstawie niemal bezbłędnie są w stanie określić, czy nie grozi nam niebezpieczeństwo. Takie technologie stosują już organy policji w kilku krajach, na razie w ramach pilotażu, ale być może narzędzie wejdzie do szerszego użycia.

Techmo oferuje technologię analizy mowy przystosowaną do języka polskiego. Może to zrewolucjonizować rozwój innowacyjnych narzędzi. Skorzystają na tym zwykli użytkownicy, ale także i polskie firmy będą mogły zwiększyć konkurencyjność na globalnym rynku.

– Coraz więcej rzeczy załatwiamy przez telefon głosowo i będzie coraz więcej różnego rodzaju komplikacji, od prostych rzeczy jak np. reklamacje, po różnego rodzaju kontrole pracowników pracujących przez telefon, gdzie pracodawca chce mieć obraz, co np. 200 pracowników de facto zrobiło, jaka jest ich skuteczność, czy zachowywali procedury, które były ustalone. Informacja w ogóle jest coraz cenniejszym dobrem i będzie coraz bardziej oczekiwana w systemach audio – ocenia prezes Techmo.

Czytaj także

Kalendarium

Więcej ważnych informacji

Jedynka Newserii

Jedynka Newserii

Problemy społeczne

Przeciętny Polak spędza w sieci ponad trzy godziny dziennie. Tylko 11 proc. podejmuje próby ograniczenia tego czasu

Polacy średnio spędzają w internecie ponad trzy godziny dziennie. Jednocześnie, według badania na temat higieny cyfrowej, jedynie 14 proc. respondentów kontroluje swój czas ekranowy, a co piąty ogranicza liczbę powiadomień w telefonie czy komputerze. Nadmierne korzystanie z ekranów może wpływać na zaniedbywanie obowiązków i relacji z innymi, a także obniżenie nastroju i samooceny. Kampania Fundacji Orange „Nie przescrolluj życia” zwraca uwagę na potrzebę dbania o higienę cyfrową. Szczególnie okres świątecznego wypoczynku sprzyja takiej refleksji.

Prawo

Pediatrzy: Słodkie e-papierosy nie są przebadane. Państwo musi przejąć inicjatywę w sprawie kontroli ich jakości

Co trzeci uczeń pierwszą styczność z nikotyną miał w wieku 13 lat. Dla 70 proc. pierwszym w życiu wyrobem z nikotyną był e-papieros. Wśród uczniów używających obecnie nikotyny najwięcej, bo 80 proc., używa e-papierosów, najczęściej o słodkich smakach – wynika z badań CBOS. W dodatku z badań wynika, że zakaz sprzedaży takich produktów niepełnoletnim jest skutecznie omijany. Polskie Towarzystwo Pediatryczne, wspierane przez lekarzy innych specjalności, apeluje do premiera o wycofanie ze sprzedaży smakowych e-papierosów z nikotyną i bez niej. Zwłaszcza słodkie substancje smakowe dodawane do e-liquidów dla osiągnięcia atrakcyjnego smaku wciąż nie są wystarczająco przebadane  alarmują toksykolodzy.

Infrastruktura

Prąd z największej prywatnej inwestycji energetycznej w Polsce popłynie w 2027 roku. Polenergia dostała właśnie potężny zastrzyk finansowania

Polenergia S.A. i Bank Gospodarstwa Krajowego podpisały umowę pożyczki ze środków Krajowego Planu Odbudowy (KPO) na budowę morskich farm wiatrowych. Finansowanie wyniesie 750 mln zł i zostanie wykorzystane do budowy dwóch farm o łącznej mocy 1440 MW. Największa prywatna grupa energetyczna w Polsce realizuje ten projekt z norweskim Equinorem. Prace związane z budową fundamentów turbin na Bałtyku mają się rozpocząć w 2026 roku. Projekty offshorowe będą jednym z filarów nowej strategii Polenergii, nad którą spółka właśnie pracuje.

Szkolenia

Akademia Newserii

Akademia Newserii to projekt, w ramach którego najlepsi polscy dziennikarze biznesowi, giełdowi oraz lifestylowi, a  także szkoleniowcy z wieloletnim doświadczeniem dzielą się swoją wiedzą nt. pracy z mediami.