Mówi: | Łukasz Malicki |
Firma: | Random Forest |
Stworzona w Polsce sztuczna inteligencja wyszuka potrzebne informacje w niemal każdym dokumencie. Pomoże prześledzić sprawozdania finansowe czy umowy biznesowe
Pracownicy spędzają ponad 25 proc. czasu na wyszukiwaniu informacji potrzebnych w codziennej pracy, podczas gdy może to za nich robić sztuczna inteligencja. Polska firma stworzyła narzędzie oparte na uczeniu maszynowym do ekstrakcji danych z nieustrukturyzowanych dokumentów. Sztuczna inteligencja może analizować i przetwarzać nawet najbardziej złożone, nieustrukturyzowane teksty, jak dokumenty prawne, sprawozdania finansowe czy umowy biznesowe. Narzędzie bazuje na przetwarzaniu języka naturalnego, dzięki czemu nie tylko adaptuje się do języka, lecz może także odpowiedzieć na zadane pytanie.
– Pracujemy nad tworzeniem narzędzi, które wykorzystują machine learning do tego, żeby automatycznie znajdować poszukiwane treści i informacje w nieustrukturyzowanych dokumentach tekstowych – wskazuje w rozmowie z agencją informacyjną Newseria Innowacje Łukasz Malicki z Random Forest.
Według badania „The Experience of Work: The Role of Technology in Productivity and Engagement” przeprowadzonego przez Economist Intelligence Unit przy wsparciu Citrix Systems pracownicy spędzają blisko 25 proc. czasu na wyszukiwaniu informacji potrzebnych w codziennych obowiązkach. To przede wszystkim przeglądanie i czytanie dokumentów. Polska firma opracowała narzędzia, które pozwalają znacznie skrócić ten czas, a potrzebne frazy znajduje od razu.
– Potrafimy przygotować modele ekstrahowania danych, czyli znajdowania tych danych w taki sposób, żeby znajdowały nie tylko konkretne informacje jak daty, kwoty czy nazwiska, dane personalne, ale także dłuższe fragmenty jak np. wykluczenia w umowach, zakresy obowiązków czy fragmenty, które są potrzebne np. do podpisania jakiejś umowy i jej weryfikacji – tłumaczy Łukasz Malicki.
Narzędzie Random Forest bazuje na języku naturalnym, co znacznie przyspiesza odnalezienie potrzebnych danych. Choć większość użytkowników przyzwyczaiła się do wyszukiwania słów kluczowych, nie jest to intuicyjny sposób zadawania pytań. Zmusza np. do usunięcia słów pytających w celu utworzenia dosłownych ciągów tekstowych, których wyszukiwarka może użyć do zapytania o dane. Wraz z rozwojem cyfrowych asystentów głosowych, takich jak Siri i Alexa, ludzie przyzwyczajają się do prowadzenia rozmów pełnymi i gramatycznie złożonymi zdaniami. Podobnie działa narzędzie polskiej firmy – umożliwia mówienie lub pisanie przy użyciu codziennego języka, a nie słów kluczowych – tak jak przy zwykłej rozmowie.
– Zamiast wyszukiwać czy oprócz wyszukiwania słowa „umowa zlecenie”, szuka także „umowy”, „umowy najmu”, „umów najmu”, „umowę najmu”, czyli po prostu odmienia te słowa przez przypadki i osoby. Przede wszystkim jest też w stanie odpowiedzieć na pytanie, np. czy spółka dokonała fuzji albo jakie są jej przychody z zeszłego roku. Analizuje kontekst całej wypowiedzi i wyciąga informację – podkreśla przedstawiciel Random Forest.
Narzędzie pomaga firmom analizować, interpretować nieustrukturyzowane treści w ogromnych ilościach pełnych dokumentów oraz zarządzać nimi. Oryginalne metody sztucznej inteligencji mogą analizować i przetwarzać nawet najbardziej złożone, nieustrukturyzowane teksty, takie jak dokumenty prawne, sprawozdania finansowe, artykuły naukowe czy umowy biznesowe. Umożliwiają też wynajdowanie podobieństw w różnych dokumentach i identyfikowanie istotnych danych w umowach. W przeciwieństwie do innych rozwiązań do kontekstowej analizy tekstu, które wykorzystują gotowe oprogramowanie, modele SI Random Forest są szkolone pod konkretnego użytkownika.
– To np. projekt, który zrobiliśmy z Grupą Azoty, gdzie w ich dokumentach B+R ekstrahowane były informacje na temat opisu projektu, rezultatów, informacji, czy projekt się zakończył sukcesem, kto brał w nim udział. Takich dokumentów są setki, jeżeli nie tysiące, trzeba zaangażować zaufane osoby, które byłyby w stanie takie dokumenty przeczytać i zrozumieć. Czas pracy takich osób jest bardzo drogi. Implementując rozwiązania machine learningowe, potrafimy ten koszt znacząco zredukować. Inny przykład to ekstrakcja danych z faktur – wymienia Łukasz Malicki.
Obecnie rozwiązanie dedykowane jest dużym firmom. Random Forest w ramach grantu NCBiR tworzy autorskie wyszukiwarki dla osób bez umiejętności programowania i obecnie jest już w połowie projektu.
– Obecnie staramy się uświadomić naszych klientów, w jaki sposób mogą wykorzystać tego typu narzędzia u siebie. Każdy wie, czym jest digitalizacja, że jest to przenoszenie papieru w skan, prawie każdy już wie, co to jest RPA, czyli Robotic Process Automation, rozwiązania, które naśladują pracę człowieka. Natomiast kolejnym elementem jest właśnie zastosowanie tych modeli machine learningowych do ekstrakcji danych z nieustrukturyzowanych dokumentów – podkreśla przedstawiciel Random Forest.
Czytaj także
- 2024-03-28: Postęp technologiczny rewolucjonizuje pracę specjalistów ds. finansów. Stają się strategicznymi doradcami biznesu
- 2024-03-27: Rozporządzenie Parlamentu Europejskiego ws. sztucznej inteligencji będzie ogromną zmianą na tym rynku. Brakuje wciąż regulacji dotyczącej praw autorskich
- 2024-03-19: Banki przypominają dziś firmy softwarowe. Ich funkcjonowanie coraz bardziej oparte na nowych technologiach
- 2024-03-14: M. Boni: Potrzebujemy planu wdrożenia nowego aktu o sztucznej inteligencji. To może być zadanie polskiej prezydencji w UE
- 2024-04-11: Europie nie udaje się dogonić USA i Chin w rozwoju sztucznej inteligencji. Nie wykorzystujemy skali jednolitego rynku cyfrowego
- 2024-03-12: Wątpliwości dotyczące bezpieczeństwa danych przetwarzanych w różnych urzędach. NIK zapowiada kontrole we wszystkich jednostkach samorządu terytorialnego
- 2024-03-18: Sztuczna inteligencja coraz bliższa ludzkiemu sposobowi przyswajania wiedzy. Naukowcy opracowali model, który uczy się języka tak jak dzieci
- 2024-02-27: „Antyplagiat” z nową funkcją wykrywania treści pisanych przez sztuczną inteligencję. Dyskusja o regulacjach w tym zakresie nabiera tempa
- 2024-02-29: Prace nad unijnym AI Act na finiszu. W kwestii regulacji sztucznej inteligencji USA czy Chiny nie podążą ścieżką Europy
- 2024-03-01: Agenci sztucznej inteligencji pomogą osobom z niepełnosprawnościami korzystać z internetu. Zastosowanie rozwiązania może być jednak dużo szersze
Kalendarium
Więcej ważnych informacji
Jedynka Newserii
Jedynka Newserii
Transport
Chiny przyspieszają inwestycje w odnawialne źródła. Nie przestają jednak rozbudowywać mocy węglowych
Coraz dotkliwsze skutki zmian klimatycznych, ale przede wszystkim chęć zbudowania bezpieczeństwa energetycznego i uniezależnienia się od zewnętrznych dostaw surowców skłoniły rząd w Pekinie do ekspresowych inwestycji w nowe moce odnawialnej energii. W efekcie Chiny wyrastają na globalnego lidera transformacji energetycznej – odpowiadają dziś za największy na świecie przyrost mocy zainstalowanych w fotowoltaice i wiatrakach. Co ciekawe, nie rezygnują jednak przy tym również z inwestycji w energetykę węglową.
Infrastruktura
Polskie rolnictwo potrzebuje inwestycji infrastrukturalnych. Niezbędna jest budowa agroportów i rozwój połączeń kolejowych
Brak inwestycji w porty i kolej ogranicza potencjał eksportu rolnego, oznacza też problem z tranzytem ukraińskiego zboża. Konieczna jest przede wszystkim budowa agroportów. – Mierzymy się z dużą nadwyżką zboża, którą trzeba wywieźć jak najszybciej, żeby zwolnić powierzchnie magazynowe do żniw na kolejny sezon, i w związku z tym potrzebne jest coraz szybsze tempo wywożenia – mówi Stefan Krajewski, wiceminister rolnictwa i rozwoju wsi. Część ekspertów zastanawia się jednak nad długofalowym uzasadnieniem takich inwestycji.
Ochrona środowiska
Ciech od czerwca będzie działać jako Qemetica. Chemiczny gigant ma globalne aspiracje i nową strategię na sześć lat
Globalizacja biznesu, w tym możliwe akwizycje w Europie i poza nią – to jeden z głównych celów nowej strategii Grupy Ciech. Przedstawione plany na sześć lat zakładają także m.in. większe wykorzystanie patentów, współpracę ze start-upami w obszarze czystych technologii i przestawienie biznesu na zielone tory. – Mamy ambitny cel obniżenia emisji CO2 o 45 proc. do 2029 roku – zapowiada prezes spółki Kamil Majczak. Nowej strategii towarzyszy zmiana nazwy, która ma podsumować prowadzoną w ostatnich latach transformację i lepiej podkreślać globalne aspiracje spółki. Ciech oficjalnie zacznie działać jako Qemetica od czerwca br.
Szkolenia
Akademia Newserii
Akademia Newserii to projekt, w ramach którego najlepsi polscy dziennikarze biznesowi, giełdowi oraz lifestylowi, a także szkoleniowcy z wieloletnim doświadczeniem dzielą się swoją wiedzą nt. pracy z mediami.