centrum promocji informatyki
E-MAIL
zapisz się zapisz się zapisz się wypisz się
O NASSZKOLENIAMEDIA O NASPARTNERZYREGULAMINKONTAKT

Warszawa, 23.10.2007 Koordynator: Iwona Kornet

Hurtownia danych (HD) i narzędzia Business Intelligence (BI) stanowią jeden z podstawowych komponentów systemów wspomagających zarządzanie przedsiębiorstwem. Tradycyjne HD są ukierunkowane na przetwarzanie prostych danych tekstowych i numerycznych. Pomimo, że technologia ta rozwija się od ponad dwudziestu lat, nadal duże wyzwanie technologiczne stanowią procesy ETL, optymalizacja zapytań analitycznych i zapewnienie właściwej jakości danych.

Równocześnie rozwijają się zaawansowane HD, umożliwiające analizę danych przestrzenno-czasowych, danych o złożonych strukturach (semistrukturalne, obiektowe, multimedialne) i analizę danych ciągłych. W tego typu zastosowaniach należy rozwiązać nowe problemy naukowo-technologiczne.

Jednym z ważniejszych typów aplikacji BI są aplikacje umożliwiające eksplorację danych. Na rynku znajduje się wiele pakietów programowych oferujących eksplorację danych z plików tekstowych lub baz danych. Zazwyczaj jednak proces eksploracji jest realizowany po stronie "klienta". Ponieważ proces ten jest niezwykle czasochłonny, jednym ze sposobów zwiększających efektywność eksploracji jest przeniesienie go do serwera bazy danych.

Referaty IX edycji konferencji Hurtownie Danych i Business Intelligence będą prezentowały m.in.: problematykę ciągłej analizy danych przestrzennych, zaawansowaną architekturę serwera analitycznego z ujednoliconym dostępem do różnych źródeł danych, problematykę wykorzystania indeksów bitmapowych w HD. Ponadto, przedstawione zostanie rozwiązanie rzeczywistego problemu sterowania siecią wodociągową z wykorzystaniem technik zaawansowanej analizy danych oraz problematyka eksploracji danych zilustrowana rozwiązaniem Oracle. Prezentacje merytoryczne zostaną uzupełnione o prezentację techniczną producenta oprogramowania HD i BI.

Konferencja jest adresowana do wszystkich osób zawodowo zajmujących się projektowaniem i wykorzystaniem hurtowni danych i aplikacji analitycznych. Kierujemy ją przede wszystkim do: kadry zarządzającej (działów IT, finansów, marketingu i analiz), kierowników projektów, projektantów i programistów systemów HD i BI oraz użytkowników końcowych.

PROGRAM

23 października 2007 r.
10:00 Otwarcie konferencji, wprowadzenie w tematykę
Koordynator merytoryczny: Robert Wrembel
(Politechnika Poznańska, Instytut Informatyki)

10:10 Wykład: Przestrzenne hurtownie danych z zapytaniami klasy kNN

Bezopóźnieniowe hurtownie danych (ang. Zero-latency Data Warehouse DW0) dostarczają istotnych danych systemom wspomagania decyzji w czasie "prawie" rzeczywistym. DW0 tworzą usługowe środowiska analityczne w oparciu o trzy podstawowe grupy funkcjonalne: a) ciągła integracja danych - umożliwia zapamiętywanie i ładowanie danych z różnych źródeł operacyjnych w czasie rzeczywistym, b) aktywne silniki decyzyjne - wydają rekomendacje lub nawet automatycznie podejmują taktyczne decyzje sterowane regułami, c) wysoce dostępne środowiska analityczne - zapewniają spójne bieżące analizy w każdym czasie nie zajętym przez okna ładowania wsadowego danych. Projektując mechanizmy regułowe w DW0 uwzględnia się obsługę dwóch rodzajów opóźnień propagacyjnych tj.: a) opóźnienia w zapamiętywaniu zdarzeń rzeczywistych przez systemy źródłowe, b) opóźnienia w ekstrakcji i integrowaniu danych.
Przykładem eliminowania opóźnień są otwarte moduły telemetryczne systemu odczytu zintegrowanego liczników (IMR) współpracujące z bezopóźnieniową przestrzenną hurtownią danych (SDW0) zorientowaną na zapytania klasy kNN. Wstępne badania ukierunkowane były na realizacje zapytań kNN o k najbliższych sąsiadów stacjonarnych w przestrzeni sieciowej, których odległość od punktu zapytania nie przekracza wartości granicznej, k najbliższych par i o pary, między którymi odległość nie przekracza pożądanej wartości granicznej. Kontynuacją tych badań jest SDW0 zorientowana na ciągłe zapytania kNN ((SDW(l/t)) w przestrzeni euklidesowej, które łączą każdy obiekt jednego zbioru obiektów mobilnych z jego k najbliższymi sąsiadami z drugiego zbioru obiektów stacjonarnych. W systemie SDW (l/t) wykorzystano zapytanie Gorder, które bazuje na metodzie łączenia bloków danych przy użyciu pętli zagnieżdżonych. Wiele ciągłych zapytań kNN w SDW(l/t) może być realizowanych równocześnie zarówno dla obiektów statycznych, jak i obiektów mobilnych.

Marcin Gorawski
(Instytut Informatyki Politechniki Śląskiej)

10:50 Wykład: Co dalej z tą eksploracją? Rola i miejsce eksploracji danych w architekturze współczesnych systemów baz danych

Eksploracja danych (ang. data mining) to nowa, prężnie rozwijająca się dziedzina, zajmująca się metodami i algorytmami automatycznego pozyskiwania wiedzy z dużych wolumenów danych. Swą popularność zawdzięcza szerokiej stosowalności metod eksploracji w różnych domenach aplikacyjnych oraz komercyjnemu znaczeniu odkrywanej wiedzy. Odkryta wiedza znajduje zastosowanie w optymalizacji procesów biznesowych, wykrywaniu nieprawidłowości i osobliwości, oraz predykcji przyszłych zdarzeń i zachowań. Historycznie rzecz ujmując, pierwsze systemy eksploracji danych były tworzone w architekturze klient-serwer i stanowiły, z jednej strony, implementację wybranych algorytmów, a z drugiej strony, środowisko wizualizacji analizowanych danych i odkrytej wiedzy. Ostatnie lata przyniosły istotną zmianę. Narzędzia eksploracji danych podążają ścieżką wytyczoną przez narzędzia analizy wielowymiarowej OLAP i są coraz częściej włączane do jądra systemu zarządzania bazą danych jako naturalne rozszerzenie funkcjonalności oferowanej przez system baz danych.
W niniejszym wykładzie zaprezentuję krótkie wprowadzenie do eksploracji danych oraz naszkicuję historię rozwoju dziedziny na przestrzeni ostatnich lat. Główna część wykładu jest poświęcona przedstawieniu dzisiejszej roli i pozycji systemów eksploracji danych we współczesnych systemach baz danych. Jako przykład omówię architekturę systemu Oracle i szczegółowo zaprezentuję moduł Oracle Data Mining, skupiając się na stopniu integracji systemu eksploracji danych z systemem zarządzania bazą danych. Przedstawię także architekturę interfejsów programistycznych dla języków PL/SQL i Java, rozszerzenia języka SQL dla eksploracji danych oraz narzędzia zewnętrzne do wizualizacji danych i odkrywanej wiedzy.

Mikołaj Morzy
(Politechnika Poznańska, Instytut Informatyki)

11:30 Przerwa, poczęstunek
12:10 Wykład: Inteligentny system wspomagania decyzji dla miejskiego systemu wodno-ściekowego

Referat przedstawia inteligentny system wspomagania decyzji dla miejskiego systemu wodno-ściekowego. System ten opracowywany jest etapami. Założono, że zostanie opracowany w postaci systemu ekspertowego zawierającego bazę wiedzy, mechanizm wnioskowania oraz interfejs użytkownika. Będzie on współpracował z bazą danych i systemem pozyskiwania wiedzy. Z jednej strony korzysta on z danych pomiarowych zgromadzonych w bazie danych przesłanych przez system monitoringu sieci. Z drugiej strony będzie wykorzystywał on modele prognostyczne do prognozowania obciążenia sieci wodociągowej, obciążenia sieci kanalizacyjnej, stacji ujęcia i uzdatniania wody oraz oczyszczalni ścieków, które powstały w systemie pozyskiwania wiedzy. System wspomagania decyzji na podstawie opracowanych modeli prognostycznych będzie umożliwiał opracowanie scenariuszy sterowania systemem wodno-ściekowym.

Izabela Rojek
(Instytut Mechaniki Środowiska i Informatyki Stosowanej, Uniwersytet im. K. Wielkiego w Bydgoszczy)

12:50 Prezentacja: Nowe oblicze BI z Comarch Business Intelligence

Na prezentacji przedstawione zostanie nowatorskie podejście do tworzenia zaawansowanych rozwiązań klasy Business Intelligence z wykorzystaniem autorskiego systemu Comarch Business Intelligence. Zaprezentowana zostanie innowacyjna technologia nowej generacji BI, OCEAN GenRap wraz z jej pionierskim, przyjaznym użytkownikowi biznesowemu środowiskiem przeprowadzania analiz i tworzenia raportów.

Błażej Chodarcewicz
(ComArch S.A.)

13:20 Przerwa
13:50 Wykład: Interoperacyjny silnik OLAP: intOLAP

Systemy analitycznego przetwarzania w trybie on-line (OLAP) są częścią składową systemów hurtowni danych (DW). Dostępnych jest wiele komercyjnych silników OLAP np. OLAP-owy serwer Mondrian. Możliwość wykorzystania tego systemu wraz z technologią JPivot na stronach wizualizacji pracującej pod ASP.NET jest znacznie utrudniona. Projektanci systemów DW często pomijają większość z tych rozwiązań z powodu braku interfejsów komunikacyjnych. Stąd podczas rozszerzania funkcjonalności systemów DW pożądaną cechą jest interoperacyjność silników OLAP (intOLAP). Prezentowany silnik intOLAP pozwala na ujednolicanie projektów systemów DW tak, aby komunikacja pomiędzy ich komponentami była znacznie uproszczona i niezależna od bazowej platformy. Przedstawione zostały metody użycia dodatkowych narzędzi wizualizacji opartych o ASP.NET, Apache Tomcat, JPivot, JBoss, Jasper niezależnie od wybranego środowiska bazodanowego w systemie intOLAP.

Michał Gorawski, Sławomir Bańkowski
(Instytut Informatyki Politechniki Śląskiej)

14:30 Wykład: Indeksy bitmapowe w hurtowniach danych - przegląd koncepcji

Jednym z głównych problemów technologicznych w hurtowniach danych jest optymalizacja zapytań analitycznych. Zapytania takie odwołują się do wielu (zwykle kilkunastu lub kilkudziesięciu) tabel i odczytują ogromne ilości danych. Dla zapytań o takiej charakterystyce, standardowe indeksy w postaci B-drzew okazują się nieefektywne ponieważ po pierwsze, nie zapewniają wystarczająco szybkiego dostępu do danych, po drugie, ich rozmiary są zbyt duże, przez co wzrastają koszty ich przetwarzania, przechowywania i utrzymywania. Z tego względu w zastosowaniach hurtowni danych bardzo często stosuje się indeksy bitmapowe. Ich zaletą jest duża efektywność wyszukiwania danych dla kryteriów poszukiwania z operatorem równościowym. Ponadto, dla indeksowanych atrybutów o wąskiej dziedzinie rozmiary indeksów bitmapowych są znacznie mniejsze niż indeksów typu B-drzewo. Niestety, dla kryteriów poszukiwania z operatorami zakresu i dla indeksowanych atrybutów o szerokich dziedzinach indeksy bitmapowe oferują gorszą efektowność. Z tego względu, w praktyce stosuje się różne warianty indeksów bitmapowych i techniki kompresji indeksów. Celem niniejszego referatu jest: (1) przedstawienie podstawowej koncepcji indeksu bitmapowego i jego charakterystyki efektywnościowej; (2) omówienie wariantów indeksów bitmapowych; (3) omówienie technik kompresji indeksów bitmapowych.

Robert Wrembel
(Politechnika Poznańska, Instytut Informatyki)

15:10 Zakończenie konferencji

FIRMY ZAINTERESOWANE UDZIAŁEM W PROGRAMIE KONFERENCJI
- proszę o kontakt - Iwona Kornet

  
e-mailkontakt Na górę strony
Copyright © 2002 Centrum Promocji Informatyki Sp. z o.o. | ul. Miedzyborska 50 | tel. (0-22) 870 69 10, 870 69 78