stan zaawansowania prac

z okazji zmiany promotora musiałem napisać dziekanowi takie coś:

Przewód doktorski p.t. „Metody analizy spójności i zgodności kolekcji dokumentów WWW” został otwarty 2003.06.03 na Wydziale Informatyki i Zarządzania Politechniki Wrocławskiej przez mgr inż. Marka Kopla. Jego promotorem był dr hab. inż. Czesław Daniłowicz, prof. PWr.

Jeszcze w tym samym roku został wygłoszony referat autorstwa Daniłowicz, Kopel, p.t. „Analysis method of coherency and topical relevancy for web document collections” na konferencji ISAT 2003. W referacie została poruszona kwestia spójności kolekcji dokumentów WWW. Zdefiniowano algorytm obliczania spójności, na podstawie hiperlinków, łączących dokumenty w kolekcje. Miarę spójności można potraktować jako narzędzie pozwalające zbadać zgodność tematyczną dokumentów. Przykładowe zastosowanie to badanie relewancji odpowiedzi wyszukiwarki dokumentów WWW poprzez wyznaczenie spójności kolekcji dokumentów z odpowiedzi i dokumentów użytych w zapytaniu do wyszukiwarki.

Myśl ta została kontynuowana i rozwinięta w 2004 w książce p.t. „Intelligent technologies for inconsistent knowledge processing” w rozdziale autorstwa Kopel, Daniłowicz, p.t.”Method of completing the consistency graph of a hyperlinked document collection”. Poza usprawnieniem metody wyznaczania spójności zaproponowano 2 metody poprawienia dokładności obliczanej spójności na podstawie uzupełniania grafu spójności. Uzupełniania grafu spójności kolekcji dokumentów, to dodawanie kolejnych krawędzi, symbolizujących pośrednie hiperlinki między dokumentami, na podstawie ścieżek hiperlinków bezpośrednich.

W tym samym roku na konferencji MiSSI’04 został wygłoszony referat Marka Kopla p.t.” Identyfikacja spamu na podstawie analizy spójności wiadomości”. Główną ideą przedstawioną w referacie była adaptacja metody badania spójności kolekcji dokumentów WWW dla środowiska wiadomości e-mail. Użycie metody w kontekście e-mail’i pozwala wykryć spam. Identyfikacja spamu odbywa się poprzez wyznaczanie spójności kolekcji składających się z podejrzanych wiadomości i wiadomości jawnie oznaczonych jako spam przez użytkownika.

Zasugerowana we wnioskach, wspomnianego wcześniej rozdziału w książce, nowa płaszczyzna badania spójności kolekcji dokumentów WWW była podstawą dla referatu wygłoszonego na konferencji ISAT’04, autorstwa Kopel, Daniłowicz, p.t.„Measuring the importance of concepts and relations between the concepts in a hypertext collection”. Nowa płaszczyzna to informacje semantyczne w sieci WWW, których zastosowanie to obietnica ewolucji WWW w Semantic Web. Zwykle wydobycie informacji semantycznej wymaga zdefiniowanej ontologii, której utrzymanie i używanie może być kłopotliwe. Referat zaprezentował możliwości wygenerowania ontologii istniejącego stanu sieci WWW i na jej podstawie możliwość wyznaczenia relacji typu „ogólny/szczegółowy” i „pokrewny” między dokumentami hipertekstowymi.

Tytułowe metody opracowywane w przewodzie doktorskim to hybrydowe wyznaczanie spójności dokumentów kolekcji WWW wynikającej z ich semantyki (kontekstu ich publikacji, relacji między ich autorami, itp.) oraz zgodności wynikającej z treści dokumentów (ważenie terminów, hiperłącza, itp.). O ile metody badania zgodności są już opracowane, to nadal trwają prace nad wykorzystaniem semantyki dokumentów do analizowania ich spójności. Aktualne badania dotyczą semantyki wynikającej z relacji pomiędzy autorami. Bieżące wyniki tych badań zostały wykorzystane w referacie zaakceptowanym na konferencję AMSTA’07 autorstwa Kopel, Kazienko, p.t. „Application of agent-based personal web of trust to local document ranking”. Badania te to ostatni etap uszczegóławiania ogólnej metody opracowywanej w ramach pracy doktorskiej.

Skomentuj

Please log in using one of these methods to post your comment:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Log Out / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Log Out / Zmień )

Facebook photo

Komentujesz korzystając z konta Facebook. Log Out / Zmień )

Google+ photo

Komentujesz korzystając z konta Google+. Log Out / Zmień )

Connecting to %s


%d bloggers like this: