Komunikaty PR

Duże modele językowe - jak skutecznie z nich korzystać?

2024-07-10 | 14:00

Sztuczna inteligencja nie jest niczym nowym, ale w przestrzeni medialnej głośno zrobiło się o niej wraz z pojawieniem się szeroko dostępnego dużego modelu językowego jakim jest GPT. Możliwości tego, jak i podobnych modeli wywołały ogromne zainteresowanie – także po stronie biznesu, który szuka odpowiedzi jak można wykorzystać LLM (ang. Large Language Models – duże modele językowe) w swoich działaniach.

Niedawny wzrost zainteresowania generatywną sztuczną inteligencją wynika przede wszystkim z gwałtownego i szerokiego zastosowania dużych modeli językowych, takich jak GPT-4. Modele te stały się przedmiotem gorących dyskusji wśród ekspertów; niektórzy postrzegają je jako kolejny etap ewolucji sztucznej inteligencji (AI), podczas gdy inni koncentrują się na ich wadach i ograniczeniach. Już teraz rynek wycenia takie rozwiązania na 6 mld dolarów z perspektywą wzrostu do 30 mld dolarów w 2030 roku.

“Duże modele językowe doskonale nadają się do polepszania jakości interakcji człowiek-system za pomocą języka naturalnego, automatyzacji prostych procesów, przetwarzania informacji tekstowych i generowania kreatywnych treści. Możliwości te sprawiają, że firmy decydują się na inwestycje w takie rozwiązania.” – komentuje Bogusław Kosęda, Data Science Consultant, Endava Poland

Kluczowym aspektem wdrażania LLM jest odpowiednia ewaluacja potrzeb i możliwości. Ilu pracowników będzie korzystać z rozwiązań wykorzystujących LLM, jakie mają być ich zadania, czy LLM ma mieć dostęp do firmowych danych, czy będzie istniał zespół odpowiedzialny za zarządzanie i weryfikację generowanych odpowiedzi? Wykorzystanie dużych modeli językowych budzi wiele pytań i wątpliwości.

Dobór modelu do potrzeb firmy

Wszystko zaczyna się od wytypowania zadań, do których chcemy wykorzystać LLM i doboru odpowiedniego modelu, który może im sprostać. Proste czynności, takie jak generowanie krótkich tekstów, mogą być rozwiązywane za pomocą stosunkowo małych modeli, które można uruchomić nawet na podstawowych urządzeniach takich jak laptop. Bardziej złożone modele wymagają znacznej mocy obliczeniowej do szkolenia się, ale także do samego procesu generowania wyników.

Obecnie najłatwiejszym sposobem dla firm na korzystanie z najbardziej zaawansowanych modeli LLM jest użycie tych wstępnie wytrenowanych i wdrożonych w chmurze. Przykładem może być model Gemini dostarczany przez Google. Co więcej, można wykorzystać rozwiązania, które integrują LLM z systemami firmy, a także koordynują i monitorują ich pracę. Jednymi z najpopularniejszych przykładów takich bibliotek są LangChain i LangSmith.

“Połączenie modelu LLM z danymi firmy daje mu możliwość wyszukiwania i wnioskowania na temat danych specyficznych dla przedsiębiorstwa. Teoretycznie oznacza to, że taki model LLM staje się maszyną do rozwiązywania problemów biznesowych, których rozwiązanie znajduje się już w danych. Dodatkowo, praca modelu LLM na firmowych danych znacznie ogranicza halucynacje, choć nie eliminuje ich całkowicie. Na szczęście narzędzia do łączenia LLM z zewnętrznymi bazami danych posiadają mechanizm śledzenia pochodzenia informacji wykorzystywanych przez LLM do generowania wyników” - wyjaśnia Bogusław Kosęda, Data Science Consultant, Endava Poland

Chociaż każdy z nas może wchodzić w interakcje z modelami LLM za pomocą promptów, poważne aplikacje biznesowe wymagają odpowiednich umiejętności inżynierskich. W tym przypadku umiejętności inżynierii ML (ang. Machine Learning) (w zakresie badań i rozwoju), QA (ang. Quality Assurance) w zakresie testowania oraz umiejętności LLMOps (ang. Large Language Model Operations) w zakresie wdrażania, monitorowania i konserwacji.

Ograniczenia i problemy dużych modeli językowych (LLM)

Duże modele językowe obarczone są też szeregiem ograniczeń, dlatego tak ważny jest odpowiedni nadzór i ewaluacja uzyskanych w pracy z nimi wyników.

Halucynacje - modele mogą generować wyniki, które są błędne, bezsensowne lub nieistotne dla danej wejściowej informacji. Wynika to często z niepokrywających się danych wykorzystanych w procesie uczenia. LLM może udzielać np. porad prawnych z innego systemu prawnego niż z tego od którego pada zapytanie. Problem ten nadal pozostaje nierozwiązany i jest jednym z głównych ograniczeń tej technologii.

Trudność testowania LLM - ze względu na "kreatywność" LLM, przetestowanie wszystkich możliwych danych wejściowych i wyjściowych, które mogą pojawić się w produkcji jest niemożliwe. Dlatego tak ważny jest monitoring metryk i nadzór nad systemami opartymi na LLM.

Etyka - modele LLM mogą generować wyniki obarczone uprzedzeniami. Uprzedzenia te pochodzą z zestawów danych, które zostały przekazane modelowi podczas etapów wstępnego uczenia lub dostrajania.

Koszt - w przypadku największych LLM płacimy za transfer danych do i z modelu. W niektórych przypadkach biznesowych koszty te mogą być znaczne.

Utrzymanie - jeśli dostawca LLM zaktualizuje konkretny model, który był wykorzystywany w danym rozwiązaniu, należy ponownie przeprowadzić proces kontroli jakości i monitorowania - co również może być kosztowne.

Technologia zmienia się na naszych oczach a każdego dnia trafiają do nas informacje o nowych możliwościach czy zastosowaniu dużych modeli językowych, dlatego tak ważne jest odpowiednie przygotowanie i ocena naszych potrzeb względem LLM.

Newseria nie ponosi odpowiedzialności za treści oraz inne materiały (np. infografiki, zdjęcia) przekazywane w „Biurze Prasowym”, których autorami są zarejestrowani użytkownicy tacy jak agencje PR, firmy czy instytucje państwowe.

Ostatnio dodane

komunikaty PR z wybranej przez Ciebie kategorii

Technologie

2025-07-18 | 09:00

Nowy model myjni przemysłowej NOYEN: Dlaczego warto zainwestować w kompaktowe rozwiązanie mycia detali

Nowoczesna myjnia przemysłowa NOYEN Compact 600 – wysoka wydajność i elastyczność w jednym urządzeniu Firma NOYEN wprowadza nowoczesne systemy myjące do cenionej

Technologie

2025-07-07 | 06:00

5G Broadcast: Emitel testuje nowy standard telewizji mobilnej dla Telewizji Puls

Emitel - operator infrastruktury nadawczej - we współpracy z Telewizją Puls rozpoczął w Warszawie testową emisję sygnału w technologii 5G Broadcast. To pierwszy tego

Technologie

2025-05-26 | 14:30

MSV 2025 – przemiany w przemyśle, technologie przyszłości i szeroki zakres tematyczny

Jeśli myślisz, że roboty to wciąż pieśń przyszłości, a rewolucja przemysłowa to temat z podręcznika do historii, to najwyraźniej nie byłeś na MSV w Brnie. Jesienią

Więcej ważnych informacji

Wśród Polaków rośnie zainteresowanie produktami emerytalnymi. Coraz chętniej wpłacają oszczędności na konta IKE i IKZE

Zaspokajanie potrzeb behawioralnych kota pomaga w budowaniu z nim pozytywnych relacji. Kluczem jest poznanie jego typu osobowości

1 października ruszy w Polsce system kaucyjny. Część sieci handlowych może nie zdążyć z przygotowaniami przed tym terminem

Nestlé w Polsce podsumowuje wpływ na krajową gospodarkę. Firma wygenerowała 0,6 proc. polskiego PKB [DEPESZA]

Nie tylko konsumenci starają się kupować bardziej odpowiedzialne. Część firm już stawia na to mocny nacisk

Jedynka Newserii

Wzrost wydobycia ropy naftowej nie wpłynie na spadek cen surowca. Kierowcy jesienią zapłacą więcej za olej napędowy

Nauka

Szacowanie rzeczywistej liczby użytkowników miast dużym wyzwaniem. Statystycy wykorzystują dane z nowoczesnych źródeł

Różnica między liczbą rezydentów a rzeczywistą liczbą osób codziennie przebywających w Warszawie może sięgać nawet niemal pół miliona. Rozbieżności są dostrzegalne przede wszystkim w dużych miastach i ich obszarach funkcjonalnych. Precyzyjne dane populacyjne są tymczasem niezbędne w kształtowaniu usług społecznych i zdrowotnych, edukacyjnych, opiekuńczych, a także w planowaniu inwestycji infrastrukturalnych. W statystyce coraz częściej dane z oficjalnych źródeł, takich jak Zakład Ubezpieczeń Społecznych, są uzupełniane o te pochodzące od operatorów sieci komórkowych czy kart płatniczych.

Mazowsze turystycznie radzi sobie lepiej niż przed pandemią. Odwiedzających przyciąga już nie tylko Warszawa Wrocław najczęściej wskazywanym miejscem na ewentualną przeprowadzkę. To przekłada się na potencjał gospodarczy Polskie miasta szybko się starzeją. Demografia wpływa na wiele ich działań Infrastruktura krytyczna w polskich miastach jest dobrze chroniona. Nadal są jednak słabe punkty Futurystyczne miasto w Arabii Saudyjskiej może nie spełnić pokładanych w nim nadziei. Kształt długiego, wąskiego prostokąta spowoduje perturbacje transportowe

Farmacja

Nowy pakiet farmaceutyczny ma wyrównać szanse pacjentów w całej Unii. W Polsce na niektóre leki czeka się ponad dwa lata dłużej niż w Niemczech

Jeszcze pod przewodnictwem Polski Rada UE uzgodniła stanowisko w sprawie pakietu farmaceutycznego – największej reformy prawa lekowego od 20 lat. Ma on skrócić różnice w dostępie do terapii między krajami członkowskimi, które dziś sięgają nawet dwóch–trzech lat. W Unii Europejskiej wciąż brakuje terapii na ponad 6 tys. chorób rzadkich, a niedobory obejmują również leki ratujące życie. Nowe przepisy mają zapewnić szybszy dostęp do leków, wzmocnić konkurencyjność branży oraz zabezpieczyć dostawy.

Farmacja

Polscy naukowcy jako pierwsi na świecie stworzyli cyrkularne mRNA metodą chemiczną. To może pomóc w leczeniu genetycznych chorób rzadkich

Zespół badaczy, w skład którego wchodzą przedstawiciele Centrum Nowych Technologii Uniwersytetu Warszawskiego, Uniwersytetu Medycznego w Warszawie i Międzynarodowego Instytutu Biologii Molekularnej i Komórkowej, dokonał bezprecedensowych osiągnięć w zakresie cyrkularyzacji mRNA – cząsteczki dostarczającej lecznicze geny. Jej kolista struktura uzyskana przez naukowców przyczynia się do wydłużenia czasu życia RNA, a co za tym idzie, dłuższej produkcji białek terapeutycznych. Jest to przełomowe dokonanie, które jest ważnym krokiem w projektowaniu nowej generacji leków RNA. W przyszłości mogą wspomóc leczenie genetycznych chorób rzadkich, w tym mukowiscydozy.

Szkolenia

Akademia Newserii

Akademia Newserii to projekt, w ramach którego najlepsi polscy dziennikarze biznesowi, giełdowi oraz lifestylowi, a także szkoleniowcy z wieloletnim doświadczeniem dzielą się swoją wiedzą nt. pracy z mediami.