Mówi: | Łukasz Malicki |
Firma: | Random Forest |
Stworzona w Polsce sztuczna inteligencja wyszuka potrzebne informacje w niemal każdym dokumencie. Pomoże prześledzić sprawozdania finansowe czy umowy biznesowe
Pracownicy spędzają ponad 25 proc. czasu na wyszukiwaniu informacji potrzebnych w codziennej pracy, podczas gdy może to za nich robić sztuczna inteligencja. Polska firma stworzyła narzędzie oparte na uczeniu maszynowym do ekstrakcji danych z nieustrukturyzowanych dokumentów. Sztuczna inteligencja może analizować i przetwarzać nawet najbardziej złożone, nieustrukturyzowane teksty, jak dokumenty prawne, sprawozdania finansowe czy umowy biznesowe. Narzędzie bazuje na przetwarzaniu języka naturalnego, dzięki czemu nie tylko adaptuje się do języka, lecz może także odpowiedzieć na zadane pytanie.
– Pracujemy nad tworzeniem narzędzi, które wykorzystują machine learning do tego, żeby automatycznie znajdować poszukiwane treści i informacje w nieustrukturyzowanych dokumentach tekstowych – wskazuje w rozmowie z agencją informacyjną Newseria Innowacje Łukasz Malicki z Random Forest.
Według badania „The Experience of Work: The Role of Technology in Productivity and Engagement” przeprowadzonego przez Economist Intelligence Unit przy wsparciu Citrix Systems pracownicy spędzają blisko 25 proc. czasu na wyszukiwaniu informacji potrzebnych w codziennych obowiązkach. To przede wszystkim przeglądanie i czytanie dokumentów. Polska firma opracowała narzędzia, które pozwalają znacznie skrócić ten czas, a potrzebne frazy znajduje od razu.
– Potrafimy przygotować modele ekstrahowania danych, czyli znajdowania tych danych w taki sposób, żeby znajdowały nie tylko konkretne informacje jak daty, kwoty czy nazwiska, dane personalne, ale także dłuższe fragmenty jak np. wykluczenia w umowach, zakresy obowiązków czy fragmenty, które są potrzebne np. do podpisania jakiejś umowy i jej weryfikacji – tłumaczy Łukasz Malicki.
Narzędzie Random Forest bazuje na języku naturalnym, co znacznie przyspiesza odnalezienie potrzebnych danych. Choć większość użytkowników przyzwyczaiła się do wyszukiwania słów kluczowych, nie jest to intuicyjny sposób zadawania pytań. Zmusza np. do usunięcia słów pytających w celu utworzenia dosłownych ciągów tekstowych, których wyszukiwarka może użyć do zapytania o dane. Wraz z rozwojem cyfrowych asystentów głosowych, takich jak Siri i Alexa, ludzie przyzwyczajają się do prowadzenia rozmów pełnymi i gramatycznie złożonymi zdaniami. Podobnie działa narzędzie polskiej firmy – umożliwia mówienie lub pisanie przy użyciu codziennego języka, a nie słów kluczowych – tak jak przy zwykłej rozmowie.
– Zamiast wyszukiwać czy oprócz wyszukiwania słowa „umowa zlecenie”, szuka także „umowy”, „umowy najmu”, „umów najmu”, „umowę najmu”, czyli po prostu odmienia te słowa przez przypadki i osoby. Przede wszystkim jest też w stanie odpowiedzieć na pytanie, np. czy spółka dokonała fuzji albo jakie są jej przychody z zeszłego roku. Analizuje kontekst całej wypowiedzi i wyciąga informację – podkreśla przedstawiciel Random Forest.
Narzędzie pomaga firmom analizować, interpretować nieustrukturyzowane treści w ogromnych ilościach pełnych dokumentów oraz zarządzać nimi. Oryginalne metody sztucznej inteligencji mogą analizować i przetwarzać nawet najbardziej złożone, nieustrukturyzowane teksty, takie jak dokumenty prawne, sprawozdania finansowe, artykuły naukowe czy umowy biznesowe. Umożliwiają też wynajdowanie podobieństw w różnych dokumentach i identyfikowanie istotnych danych w umowach. W przeciwieństwie do innych rozwiązań do kontekstowej analizy tekstu, które wykorzystują gotowe oprogramowanie, modele SI Random Forest są szkolone pod konkretnego użytkownika.
– To np. projekt, który zrobiliśmy z Grupą Azoty, gdzie w ich dokumentach B+R ekstrahowane były informacje na temat opisu projektu, rezultatów, informacji, czy projekt się zakończył sukcesem, kto brał w nim udział. Takich dokumentów są setki, jeżeli nie tysiące, trzeba zaangażować zaufane osoby, które byłyby w stanie takie dokumenty przeczytać i zrozumieć. Czas pracy takich osób jest bardzo drogi. Implementując rozwiązania machine learningowe, potrafimy ten koszt znacząco zredukować. Inny przykład to ekstrakcja danych z faktur – wymienia Łukasz Malicki.
Obecnie rozwiązanie dedykowane jest dużym firmom. Random Forest w ramach grantu NCBiR tworzy autorskie wyszukiwarki dla osób bez umiejętności programowania i obecnie jest już w połowie projektu.
– Obecnie staramy się uświadomić naszych klientów, w jaki sposób mogą wykorzystać tego typu narzędzia u siebie. Każdy wie, czym jest digitalizacja, że jest to przenoszenie papieru w skan, prawie każdy już wie, co to jest RPA, czyli Robotic Process Automation, rozwiązania, które naśladują pracę człowieka. Natomiast kolejnym elementem jest właśnie zastosowanie tych modeli machine learningowych do ekstrakcji danych z nieustrukturyzowanych dokumentów – podkreśla przedstawiciel Random Forest.
Czytaj także
- 2025-08-05: 1 października ruszy w Polsce system kaucyjny. Część sieci handlowych może nie zdążyć z przygotowaniami przed tym terminem
- 2025-08-08: Dzięki zdalnej weryfikacji tożsamości z wykorzystaniem AI firmy zminimalizowały liczbę oszustw. Rozwiązania wykorzystuje głównie sektor finansowy
- 2025-07-09: GUS chce walczyć z fake newsami. Współpraca z sektorem prywatnym ma pomóc ograniczyć chaos informacyjny
- 2025-06-10: Polska może dołączyć do globalnych liderów sztucznej inteligencji. Jednym z warunków jest wsparcie od sektora publicznego
- 2025-06-12: Nowe technologie mogą wspierać samoleczenie. Szczególnie pomocne są dane zbierane przez aplikacje i urządzenia mobilne
- 2025-08-11: Sztuczna inteligencja może zrewolucjonizować rolnictwo. Pomaga w zbiorach i dzięki niej koszty działania gospodarstw są niższe
- 2025-05-27: SUV-y dominują rynek motoryzacyjny. Hyundai wprowadzi latem do sprzedaży nowy siedmioosobowy model
- 2025-05-28: Interakcja z firmą jest dla klientów równie ważna jak jej produkty. Biznes wykorzystuje do tego AI
- 2025-04-29: Rozwój sztucznej inteligencji drastycznie zwiększa zapotrzebowanie na energię. Rozwiązaniem są zrównoważone centra danych
- 2025-04-14: Nowe technologie podstawą w reformowaniu administracji. Będą też kluczowe w procesie deregulacji
Więcej ważnych informacji
Jedynka Newserii

Nauka

Szacowanie rzeczywistej liczby użytkowników miast dużym wyzwaniem. Statystycy wykorzystują dane z nowoczesnych źródeł
Różnica między liczbą rezydentów a rzeczywistą liczbą osób codziennie przebywających w Warszawie może sięgać nawet niemal pół miliona. Rozbieżności są dostrzegalne przede wszystkim w dużych miastach i ich obszarach funkcjonalnych. Precyzyjne dane populacyjne są tymczasem niezbędne w kształtowaniu usług społecznych i zdrowotnych, edukacyjnych, opiekuńczych, a także w planowaniu inwestycji infrastrukturalnych. W statystyce coraz częściej dane z oficjalnych źródeł, takich jak Zakład Ubezpieczeń Społecznych, są uzupełniane o te pochodzące od operatorów sieci komórkowych czy kart płatniczych.
Farmacja
Nowy pakiet farmaceutyczny ma wyrównać szanse pacjentów w całej Unii. W Polsce na niektóre leki czeka się ponad dwa lata dłużej niż w Niemczech

Jeszcze pod przewodnictwem Polski Rada UE uzgodniła stanowisko w sprawie pakietu farmaceutycznego – największej reformy prawa lekowego od 20 lat. Ma on skrócić różnice w dostępie do terapii między krajami członkowskimi, które dziś sięgają nawet dwóch–trzech lat. W Unii Europejskiej wciąż brakuje terapii na ponad 6 tys. chorób rzadkich, a niedobory obejmują również leki ratujące życie. Nowe przepisy mają zapewnić szybszy dostęp do leków, wzmocnić konkurencyjność branży oraz zabezpieczyć dostawy.
Farmacja
Polscy naukowcy jako pierwsi na świecie stworzyli cyrkularne mRNA metodą chemiczną. To może pomóc w leczeniu genetycznych chorób rzadkich

Zespół badaczy, w skład którego wchodzą przedstawiciele Centrum Nowych Technologii Uniwersytetu Warszawskiego, Uniwersytetu Medycznego w Warszawie i Międzynarodowego Instytutu Biologii Molekularnej i Komórkowej, dokonał bezprecedensowych osiągnięć w zakresie cyrkularyzacji mRNA – cząsteczki dostarczającej lecznicze geny. Jej kolista struktura uzyskana przez naukowców przyczynia się do wydłużenia czasu życia RNA, a co za tym idzie, dłuższej produkcji białek terapeutycznych. Jest to przełomowe dokonanie, które jest ważnym krokiem w projektowaniu nowej generacji leków RNA. W przyszłości mogą wspomóc leczenie genetycznych chorób rzadkich, w tym mukowiscydozy.
Szkolenia

Akademia Newserii
Akademia Newserii to projekt, w ramach którego najlepsi polscy dziennikarze biznesowi, giełdowi oraz lifestylowi, a także szkoleniowcy z wieloletnim doświadczeniem dzielą się swoją wiedzą nt. pracy z mediami.