Archive for the ‘ontology’ Category

żywa ontologia

2008.01.21

właśnie przypadkiem znalazłem sposób wyznaczenia relacji concept-concept w implementacji mojego modelu DAC:

Ted Pedersen – WordNet::Similarity

Szymański: „Wyszukiwanie i rekomendacja informacji w Internecie w oparciu o ontologie”

2007.05.23

klasyfikacja IR:

  • szybko i prosto
  • złożenie i dokładnie

klasyfikacja personalizacji:

  • otwarcie, jawnie (prośba o feedback)
  • w tle

jeśli ontologia jest taksonomią (drzewem), to głębokość (poziom) dokument świadczy o szczegółowości, a rozległość (dopasowanie do sąsiednich węzłów) świadczy o zakresie tematycznym – chyba 🙂

i jeszcze dowiedziałem się o innym WordNecie

foaf z 3 stron

2007.04.05

Analyzing Social Networks on the Semantic Web
L Ding, T Finin, A Joshi – IEEE Intelligent Systems (Trends & Controversies), 2004 – ebiquity.umbc.edu

  • problemy do rozwiązania, aby korzystać z SN on the SW:
    • Knowledge representation – zdecentralizowane ontologie
    • Knowledge management – geste połączenia na poziomie grafu RDF, rzadkie na poziomie dokumentów RDF
    • Social network extraction, integration and analysis – zaszumiona i niepełna wiedzia, problemy z łączeniem (fuse) i wiarygodnością info
    • Provenance and trust aware distributed inference – jak zmniejszyć złożoność rozproszonego wnioskowania?
  • dataset’y:
    • DS-SWOOGLE: 225k valid SWD’ów z 37M rdf’owych trójek (odfiltrowane tylko 10k z jednego site’a)
    • DS-FOAF – ale ponieważ 95% URLi (z 1800 witryn) to „wielkie blogsite’y”, więc rozważany DS-FOAF-VAR tylko z URLami z site’ów o <1k FOAFD (czyli z 1065 witryn): 37k instancji foaf:Person i 4k ‚strict’ FOAFD (1-osobowy)
  • foaf:Person pojawia się w 17 ontologiach (wg SWOOGLE)
  • na foaf:Person można spojrzeć jako na:
    1. definicję ontologiczną w stosunku do jej nad-, pod-klas
    2. jej properties (np. foaf:mbox, foaf:name), które używają jej jako domeny (rdfs:domain)
    3. empiryczną właśność, którą posiadają instancje
  • podsumowując autorzy chcieliby połączyć (nałożyć na siebie):
    • sieć FOAF
    • systemy reputacji (np. PageRank)
    • sieć zaufania
    • indeksy współautorstwa (DBLP)

Dolnośląska Biblioteka Cyfrowa

2007.04.04

szukając prac Ph.D. kolegów trafiłem ponownie (pamiętam się otwierali 🙂 do dbc.wroc.pl…

  • znalazłem pdf’y ich prac: 1 i 2 z ZSI i 3 i 4 z Chemicznego
  • poza pdf i html można źródła oglądać w DJVu (apt-get i działa na Ubuntu też), np. takie nutki z Muzycznej czy budunki PWr z 1910
  • a wyniki wyszukiwań można sobie zasubskrybować przez RSS 2.0

wszystko dzięki platformie dLibra stworzonej przez poznański odpowiednik WCSS 🙂, która ma już trochę wdrożeń
a na koniec najlepsze (jak piszą):

„Wymiana danych odbywa się w oparciu o powszechnie uznane standardy i protokoły takie jak RSS, RDF, MARC, DublinCore czy OAI-PMH.”

czyli mamy polski kawałek Semantic Web, do wykorzystania jako dataset!

agregator FOAF’ów

2007.03.26

How the Semantic Web is Being Used:An Analysis of FOAF Documents

Authors: Li Ding, Lina Zhou, Tim Finin, and Anupam Joshi
Book Title:
Proceedings of the 38th International Conference on System Sciences
Date:
January 03, 2005

  • agregacja FOAF’owych RDF’ów z: blog (1,5 mln) i non-blog sites (5k)
  • analiza tylko non-blog, bo blog’owe są tworzone przez automat, a non-blog ręcznie i świadomie >> różne słownictwo i struktury pokazują co powinno być w standardzie
  • w 2004.06 FOAF 2-gą co do rozwinięcia (populated – użytą w dokumentach) ontologią; I był RDF, a RSS – VI
  • podział na:
    • strict FOAF document (z tylko jedną foaf:Person nie w trójce, czyli nie jako obiekt, np. w foaf:knows)
    • general FOAF document (opisujący wiele osób)
  • łączenie osób (fuse) z różnych RDF’ów na podstawie foaf:mbox >> otrzymujemy owl:sameIndividualAs
  • wzory połączonych komponentów (CC, czyli podgrafów): star, clique, singleton
  • tylko 7% węzłów ma in-links i out-links, a z only-in-links 97,7% są węzłami I rzędu (out-degree = 0)

kolega kolegi

2006.11.19

Chciałem tylko sprawdzić czy FOAF można również nazwać sieć społeczną, czy tylko węzeł w tej sieci. A tu okazało się, że tu takie rzeczy się dzieją… a raczej działy, bo w 2004. Po pierwsze ktoś sworzył sobie w RDF’ie namespace dla tworzenia sieci foaf, a nawet jest dostępny dataset z 7118 foaf docs (i.e. węzłami, jeśli dobrze rozumiem) – a ja się z jakimś enron’em męczę … ;P
Znalazłem też ontologię dla WOT (na pewno się przyda) i dataset They Rule z przepięknym flash’owym interfejsem i m.in. możliwością wyszukiwania ścieżek między firmami i ich dyrektorami.

A tu kilka tools dla RDF, m.in. FOAF Explorer i sha1ify (konwertuje mailto: URIs do SHA-1 – tak sobie radzono, jak nie było OpenID 🙂 )