Mówi: | dr hab. inż. Wiesław Cetera |
Firma: | Centrum Rafinacji Informacji |
Algorytmy rafinacji informacji uporządkują i przeanalizują dane ukryte w internecie. W Google jest tylko 10 proc. wszystkich informacji
Internet to potężny zbiór informacji, z którego tylko ok. 10 proc. jest zaindeksowana w wyszukiwarce Google. Do pozostałych starają się dotrzeć badacze z Centrum Rafinacji Informacji, którzy dzięki opracowanej technologii są w stanie zebrać, oczyścić i przeanalizować dane z wielu cyfrowych źródeł. Zebrane informacje pozwalają im nie tylko określić zachodzące aktualnie procesy, lecz także prognozować np. preferencje wyborcze, zmiany gospodarcze czy nastroje społeczne.
Internet rozrósł się do takich rozmiarów, że bez pomocy zaawansowanych programów rafinacyjnych przeprowadzenie miarodajnej analizy jest niemożliwe. Do 2020 roku świat wyprodukuje 44 zettabajtów danych (1 zettabajt to bilion gigabajtów). Korzystanie z wyszukiwarki Google w celu monitorowania bieżących trendów w sieci nie wystarczy, aby przeprowadzić wiarygodne badania naukowe.
– Szukamy źródeł internetowych, szukamy różnego rodzaju repozytoriów, dostępu do bibliotek. W niektórych tematach możemy również posiłkować się mediami społecznościowymi, które są otwarte. Może się pojawić zarzut, dlaczego nie korzystamy z Google? W Google znajduje się nie więcej jak 10 proc. tej rzeczywistości wirtualnej, z którą mamy do czynienia, musimy do tych danych dotrzeć samodzielnie, próbujemy to robić i robimy to chyba dosyć skutecznie – mówi agencji informacyjnej Newseria Innowacje Wiesław Cetera z Centrum Rafinacji Informacji.
W początkowej fazie każdego projektu roboty pobierają informacje z otwartych źródeł. Dane zbierane są w różnej postaci, a następnie sprowadzane są do postaci cyfrowej. W ten sposób powstają tzw. brudne dane. Po ich oczyszczeniu (rafinacji) przystępuje się do analizy poprzez wyszukiwanie najbardziej istotnych słów oraz powiązanych z nimi innych słów (sentymentów), mających wydźwięk pozytywny lub negatywny.
– Wyszukujemy terminy podstawowe, czyli słowa klucze, artefakty czy słowa słupy, następnie szukamy tego, co wokół nich się znajduje, nie przetwarzamy całości, ale szukamy tego co najważniejsze, i na tej podstawie jesteśmy w stanie określić, czy termin związany z tematem naszych badań zmienia się pozytywnie, negatywnie, rozwija się bądź po prostu zanika. Ta dokładność prognoz jest dosyć duża, bo w przeciwieństwie do badań ankietowych nie mamy do czynienia z populacją 200 czy 1000 badanych, ale przetwarzamy terabajty danych – mówi Wiesław Cetera.
W ramach projektu Culturnomics 2.0, naukowcy z Uniwersytetu Harvarda udowodnili, że algorytmy rafinacyjne sprawdzają się do identyfikacji i przewidywania procesów, które mają dopiero nastąpić. Badacze analizowali informacje upubliczniane przez media tradycyjne i cyfrowe w czasie rzeczywistym w celu określenia nadchodzących zmian społeczno-kulturalnych. Wykorzystując tę technologię, trafnie przewidziano m.in. wybuch rewolucji na Bliskim Wschodzie, ustąpienie prezydenta Egiptu Hosniego Mubaraka, a nawet przybliżone miejsce pobytu Osamy bin Ladena.
– Badania rafinacji informacji przede wszystkim można wykorzystać do identyfikowania różnego rodzaju procesów, które zachodzą w przestrzeni gospodarczej i społecznej. To preferencje wyborcze, trendy gospodarcze, udziały w rynku, pomiary marki itd., ale możemy też spróbować odpowiedzieć na pytanie: jak będzie? Jeżeli znajdziemy jakiś odnośnik czy proces, który toczy się obiektywnie, który jest mierzalny i znajdziemy relację między światem wirtualnym a danymi rzeczywistymi, to możemy poprzez po pierwsze korelacje, po drugie analizę regresji, starać się przewidzieć, co będzie w przyszłości – przekonuje ekspert.
Analitycy Research Cosmos szacują, że wartość narzędzi analitycznych Big Data ma sięgnąć 9 mld dol. w 2023 roku, przy średniorocznym tempie wzrostu na poziomie 21,15 proc. Według szacunków Cisco w 2017 roku użytkownicy internetu przesyłali każdego miesiąca 94,55 eksabajty danych, a do 2021 roku wartość ta ma wzrosnąć do 235,66 eksabajtów.
Do pobrania
Czytaj także
- 2024-03-14: Aleksandra Popławska: Trudne tematy jak aborcja zamiatane są pod dywan. Uważam, że wybór jest wolnością i dobrze, aby politycy nam go dali
- 2024-03-15: Powrót Trumpa do władzy może oznaczać kłopoty dla wszelkich sojuszy USA. Winne jest jego transakcyjne myślenie
- 2024-03-05: Kluczowy moment dla prawyborów prezydenckich w USA. O poparciu decydują kwestie gospodarcze i głosy mniejszości
- 2024-03-06: Enej: Współczesne kobiety muszą się mierzyć z nierównością w płacach i dostępie do stanowisk. Często stają przed trudnymi wyborami
- 2024-02-26: Duże zapotrzebowanie na usługi środowiskowe dla seniorów. Instytucje wsparcia są gotowe je uruchamiać, ale brakuje kadr
- 2024-03-07: Polski Czerwony Krzyż: Ponad 8 tys. zgłoszeń zaginionych osób w związku z wojną w Ukrainie. W toku jest ok. 300 postępowań
- 2024-02-19: Krystyna Sokołowska (Miss Polonia 2022): Przygotowywałam się do finału Miss World w Indiach półtora roku. Zgodnie z ideą konkursu skupiłam się na projektach społecznych i charytatywnych
- 2024-02-21: Anonimowość w internecie motywowana jest nie tylko chęcią trollowania. Dla niektórych to bezpieczna przestrzeń do wyrażenia siebie
- 2024-03-01: Agenci sztucznej inteligencji pomogą osobom z niepełnosprawnościami korzystać z internetu. Zastosowanie rozwiązania może być jednak dużo szersze
- 2024-03-01: Kraje afrykańskie w bezprecedensowym kryzysie żywnościowym. Potrzebne wsparcie rozwojowe dla lokalnego rolnictwa
Transmisje online
Kalendarium
Więcej ważnych informacji
Jedynka Newserii
Jedynka Newserii
Bankowość
Banki przypominają dziś firmy softwarowe. Ich funkcjonowanie coraz bardziej oparte na nowych technologiach
Sektor bankowy będzie w nadchodzących kilku latach jednym z największych beneficjentów wykorzystania sztucznej inteligencji i uczenia maszynowego na szeroką skalę – prognozuje SAS. Eksperymentowanie i poszukiwanie rozwiązań w tym obszarze jest zatem niezwykle istotne, aby wykorzystać potencjał w pełni. Właśnie zakończył się Globalny Hackaton ING, w którym wzięło udział ponad 2,6 tys. programistów i koderów z całego świata. – W ING ciągle stawiamy sobie nowe wyzwania i szukamy sposobów na udoskonalanie naszych procesów. Dzięki takim inicjatywom jak ta możemy eksperymentować, tworzyć nowe rozwiązania, wymieniać się wiedzą i inspirować – mówi Sławomir Soszyński, wiceprezes zarządu ING Banku Śląskiego odpowiedzialny za Pion Tech i bezpieczeństwo IT.
Transport
Niska dostępność małych i tanich samochodów elektrycznych blokuje rozwój rynku. W ciągu kilku lat mają się pojawić modele w przystępnej cenie
Tylko 17 proc. samochodów elektrycznych sprzedawanych w Europie to pojazdy kompaktowe z tańszego segmentu B – wynika z raportu organizacji Transport & Environment (T&E). W latach 2018–2023 w segmencie kompaktowym (A i B) wprowadzono jedynie 40 modeli w pełni elektrycznych w porównaniu do 66 modeli dużych i luksusowych (D i E). Koncentracja na dużych samochodach premium sprawia, że średnia cena aut elektrycznych jest wciąż wysoka, a producenci hamują w ten sposób masowe wejście pojazdów elektrycznych na rynek.
Ochrona środowiska
Sprzedaż pomp ciepła spadła o 1/3. Branża liczy na odbicie dzięki aktywnej polityce rządu
Ubiegły rok nie był udany dla branży urządzeń grzewczych – przyznaje Polska Organizacja Rozwoju Technologii Pomp Ciepła (PORT PC). Sprzedaż w tym sektorze spadła o ponad 30 proc., a w przypadku domów jednorodzinnych o około 40 proc. Prezes zarządu tej organizacji liczy na aktywną politykę rządu. Wśród możliwych rozwiązań wymienia m.in. wprowadzenie specjalnej taryfy dla pomp ciepła oraz obniżenie VAT–u na energię elektryczną. Ocenia, że przy sprzyjających okolicznościach sprzedaż pomp ciepła w 2024 roku może wzrosnąć o 20 proc.
Szkolenia
Akademia Newserii
Akademia Newserii to projekt, w ramach którego najlepsi polscy dziennikarze biznesowi, giełdowi oraz lifestylowi, a także szkoleniowcy z wieloletnim doświadczeniem dzielą się swoją wiedzą nt. pracy z mediami.