Sémantický web je koncipovaný do hierarchických vrstiev. Jeho sémantickú časť tvoria v súčasnosti vyvíjajúce sa jazyky: RDF, ktorý poskytuje jednoduchý grafovo referenčný model, RDFS ponúka jednoduchý slovník a Web Ontology Language (OWL) určuje prídavné znalosti. Ontologická vrstva vo forme OWL je momentálne najvyššou z vrstiev ktoré podliehajú výskumu.

Štruktúru sémantického webu je možné vidieť na obrázku nižšie.


schema
Obr. 3 Vrstvy sémantického webu

 • URI, Unicode - uniformné identifikátory zdrojov
 • XML – menné priestory + schéma
 • RDF, RDFS - základný model dát pre web so sémantikou
 • OWL – ontológie
 • Rules : RIF – pravidla a dotazovanie
 • Unifying Logic – logika
 • Proof _ dokazovanie
 • Trust – dôveryhodnosť
 • User interface applications – užívateľské rozhranie, aplikácie
 • Crypto – Digitálne podpisy, šifrovanie

 

Prvé dve základné vrstvy tvoria – Unicode, URI, XML a Namespace. V súčasnej dobe, všetky spomínané vrstvy sú už plne štandardizované. Ďalšie dve vrstvy – RDF/RDFS  a Ontology sú momentálne v procese štandardizácie (Dytrich, 2010).

1.5.1 URI a Unicode

Základnou ideou webu so sémantikou sú tzv. uniformné identifikátory zdrojov (Unified
Resource Identifier, URI), ktoré identifikujú dokumenty, vzťahy medzi nimi či modelované koncepty reálneho sveta. RIF tak isto podľa špecifikácie podporuje použitie URI ako základný prístup k odkazovaniu sa na objekty, relácie a ostatné zložky pravidiel a rovnako ako web so sémantikou (a web všeobecne), je založené na Unicode. URI je teda objekt, najčastejšie v podobe textového reťazca, ktorý identifikuje nejaký zdroj. Zdrojom môže byť čokoľvek, obvykle hovoríme o zdrojoch ako o webovských stránkach, obrázkoch, dokumentoch, no vo všeobecnosti môže ísť aj o ľubovoľný objekt z reálneho sveta.
Príklad URI:

URI sa skladá z viacerých častí. Na začiatku reťazca až po dvojbodku je špecifikovaná tzv. URI schéma, v našom príklade http. Každá URI schéma má definovaný systém prideľovania identifikátorov a ich asociácie so zdrojmi. Za dvojitou lomkou nasleduje názov autority, v tomto prípade www.example.com. Tento názov väčšinou prideľuje lokálna registračná autorita vo forme domény, ďalšie časti URI sú už pod kontrolou správcov daného servera. Cesta /education/universities.html špecifikuje umiestnenie zdroja v rámci autority a jej komponenty sú zvyčajne organizované hierarchicky,  hoci to nie je pravidlom. Požiadavka? where=england spolu s cestou slúži pre bližšiu identifikáciu zdroja v rámci autority. Časť #reviews sa nazýva fragmentový identifikátor a označuje zdroj viazaný na iný, primárny zdroj a jeho využitie je rôzne (Frank et al., 2010).

XML a Namespaces

Štandardom  pre zabezpečenie  úrovni syntaxe je XML. Takisto má využitie vo formáte
výmeny pravidiel na webe, pretože sa ukazuje ako dôležité využívať menné priestory aby sa predišlo konfliktom mien a dal sa jasne vymedzovať rozsah platnosti.  XML, teda eXtensible MarkupLanguage je značkovací jazyk, ktorý bol po prvý krát definovaný a zverejnený konzorciom W3C v roku 1998. Tento jazyk umožňuje anotovať textové dáta značkami nazývanými tagy. Ide o doplnkové informácie, ktoré môžu zohrávať významnú úlohu v budovaní sémanticky obohatených štruktúr. Jeho najdôležitejšou vlastnosťou je jednoduchá rozšíriteľnosť a možnosť vytvárania vlastných značiek, čo nám umožňuje definovať syntax akéhokoľvek reprezentačného jazyka. Formát XML bol navrhnutý tak, aby bol čitateľný nielen strojovo, ale aj ľuďmi, z toho vyplývajú viaceré nároky, ktoré sú naň kladené. XML dokument obsahuje elementy, a to buď párové, ktoré majú začiatočnú aj koncovú značku, alebo nepárové, ktoré sú tvorené iba jednou značkou. Pri strojovom spracovaní XML je vhodné vopred poznať štruktúru dokumentov, s ktorými sa chystáme pracovať. Práve na to slúži definícia štruktúry dokumentu prostredníctvom tzv. DTD alebo Document Type Defnition. Jednoduchý príklad XML súboru:


<?xml version="1.0"?>
<zamestnanci>
<priezvisko>Kovac</priezvisko>
<priezvisko>Kolar</priezvisko>
<priezvisko>Halanda</priezvisko>
</zamestnanci>

 

 

 

 

 

XML dokumenty sú uložené obvykle niekde na súborovom systéme počítača, resp. servera, no ak chceme pracovať s väčším množstvom dát kódovaných, je potrebné uložiť ich do databázy. Keďže v praxi sa čoraz viac vyskytovali konverzie dát z databáz do XML dokumentov a naopak, začali vznikať databázy schopné ukladať dáta priamo vo formáte XML, pri ktorých odpadla nutnosť konverzie. V praxi môže ísť o dva druhy softvérových riešení: buď ide o bežne používané relačné databázové systémy s podporou na ukladanie a čítanie XML dokumentov, alebo ide o tzv. natívne XML databázy (NXD), ktorých základnou úložnou jednotkou je XML dokument, podobne ako pri bežných relačných databázach je základnou jednotkou riadok tabuľky (Frank et al., 2010).

1.5.3 RDF a RDFS

Resource Description Framework (RDF) je základný model dát pre web so sémantikou. Je založený na trojiciach vo forme subjekt –predikát -objekt. Predikáty predstavujú vlastnosti a sú identifikované pomocou URI. Subjekty a objekty môžu byť URI odkazujúce sa na dokumenty na webe, reálne objekty, dátové hodnoty, alebo abstraktné pojmy.

RDFS definuje:

 •  zdroje,
 •  triedy,
 •  vzťahy,
 •  vlastnosti.

Vlastnosti sú špeciálne triedy (rdf: Property)  identifikované URI, s ich využitím môžeme definovať typ podnetu a predmetu. Možno špecifikovať ich doménu (typ a rozsah hodnôt) a pretože sú súčasne aj zdrojmi možno definovať i vlastnosti (Herman, 2010).

RDF a RDFS schémy používajú formát XML na zapisovanie. V Obr. 4 uvádzam RDF a RDFS schémy uložené vo formáte XML.
zdrojovy kod
Obr. 4 RDF a RDFS schémy uložené vo formáte XML (Nagy, 2009).

Tvrdenia je možné reprezentovať pomocou syntakticky nezávislého RDF údajového modelu. Model obsahuje tvrdenia o zdroji, ktoré sú vyjadrené trojicou subjekt – predikát – objekt (alebo subjekt – atribút – hodnota). Opis môže byť naviazaný len na jediný objekt (napr. katalógová karta v knižnici) , v tomto prípade sa hodnoty atribútu zdroja nazývajú vlastnosti. Opisy sa tiež môžu týkať viacerých zdrojov . Hodnoty vlastností sa môžu odkazovať na ďalšie zdroje. Takto je možné popísať ľubovoľné vzťahy medzi viacerými zdrojmi.


vztahy
Obr. 5 Vzťahy medzi viacerými zdrojmi.

Základný RDF údajový model teda pozostáva z troch základných objektov:

 • Subjekt
 • Objekt
 • Predikát

Zdroj predstavuje ľubovoľnú entitu , či už prístupnú online alebo nie (napr. web stránka, elektronický dokument, osoba, predmet...), podmienkou je, že musí byť jednoznačne identifikovateľná prostredníctvom URI. Zdroj v tomto prípade predstavuje subjekt RDF tvrdenia.

Vlastnosť reprezentuje špecifickú charakteristiku, vlastnosť, črtu, atribút alebo vzťah spojený so zdrojom. Hodnota danej vlastnosti daného zdroja. Hodnota predstavuje objekt  tvrdenia.
Keby sme tvrdenie:


Stránky http://www.nieco.sk/ majú autora s menom Tomáš Budaj.

prepísali do RDF reprezentácie s využitím URI, spomenuté objekty by sa naviazali nasledujúcim spôsobom: zdroj by sa dal zapísať ako http://www.nieco.sk/
vlastnosť (autor) by sa dala zapísať ako http://purl.org/dc/elements/1.1/creator
hodnota by sa dala zapísať ako http://www.nieco.sk/osoby/99061
Reprezentácia uvedeného tvrdenia grafom by mala nasledujúcu podobu:Obr.6 Reprezentácia  tvrdenia grafom.


Skupiny tvrdení sú reprezentované príslušnými skupinami uzlov a hrán. V prípade, že by sme o danom zdroji chceli vysloviť aj nasledujúce tvrdenia,

 

 

Obr.7 Viac tvrdení o tom istom zdroji.

na grafe by sa to prejavilo pridaním nových uzlov a hrán . Na identifikáciu vlastností „dátum vytvorenia“ a „jazyk“ boli použité zodpovedajúce URI (Biščo, 2005) .

OWL

OWL jazyk sa vyvinul z jazyka DAML+OILOWL. DAML+OIL bol  štartovným bodom pre reprezentáciu znalostí v prostredí sémantického webu. Je štandardom webu so sémantikou pre zápis ontológií,  založený na deskripčnej logike. Práve s deskripčnou logikou operuje jazyk OWL. Po stránke syntax čerpá z XML a XMLS a je rozšírením RDF a RDF (S). Nástupcom DAML + OIL, ktorý bol následne nahradený jazykom OWL. Predstavuje efektívny jazyk pre reprezentáciu hierarchií tried, vzťahov medzi nimi . Hlavnou prekážkou je možnosť využiť existenčnú logiku a deklarovať vzťahy vyjadrujúce disjunktívne vlastnosti konceptov.Ontológia v jazyku OWL je zapísaná v dokumente, na začiatku ktorého je uvedený zoznam slovníkov (priestorov mien). Tie jednoznačne popisujú značky používané v celom dokumente. Deklarácia priestorov mien je uzavretá v rámci tagu <rdf:RDF>,

 napr:
<rdf:RDF  xmlns:nc = "http://www.nieco.sk/#"
xmlns:osoby = "http://www.nieco.sk/osoby#"
xmlns:owl ="http://www.w3.org/2002/07/owl#"
xmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:xsd ="http://www.w3.org/2001/XMLSchema#">

 Základom každej ontológie sú triedy. Inštancie triedy sa v jazyku OWL nazývajú indivíduá (individuals). V OWL existujú dve preddefinované triedy: owl:Thing a owl:Nothing. Element owl:Thing predstavuje množinu všetkých inštancií, ktoré sa v ontológii vyskytujú (každá trieda definovanej ontológie je podtriedou owl:Thing).  Element owl:Nothing reprezentuje prázdnu množinu (tzn. je podtriedou každej triedy v danej ontológii). Novú triedu je možné zadefinovať nasledujúcim zápisom:riedy jazyka OWL.
<owl:Class rdf:ID="Zelenina"/>
Definícia triedy danej prienikom iných tried je založená na použití elementu owl:intersectionOf [11] .

 

Medzi hlavné komponenty OWL patria:

 • trieda
 • jedinec
 • vlastnosť

Trieda
Trieda je základným hierarchickým prvkom ontológie. Je to usporiadaná štruktúra (množina) prvkov, ktoré spolu nejakým spôsobom súvisia. Tieto prvky sa nazývajú inštanciami alebo indivíduami triedy. Triedu jednoznačne popisuje jej názov (URI) a súbor prvku.

 Existuje niekoľko spôsobov, ako môže byť trieda definovaná:

 • identifikátorom triedy (URI reference)
 • vymenovaním prvkov, ktoré budú tvoriť inštancie triedy
 • obmedzením vlastností
 • zjednotením alebo prienikom viac tried
 • doplnkom definície triedy

Jedinec
Jedinec reprezentuje určitý objekt domény, ktorý patrí určitej triede. Jedná sa o konkrétny výskyt - inštanciu triedy. Jedinec pritom môže patriť jednej alebo viacerých triedam. Je rozdiel medzi jedincom a inštancií. Jedinec je inštanciou nejakej triedy.
Vlastnosti
Sú istým druhom binárnych relácií, vďaka ktorým je možné k triedam pridávať tvrdenia a spojenie medzi jednotlivými objektmi a dátovými typmi (Csóka, 2010) .

Delenie vlastností :

 • objektová
 • dáto - typová
 • anotačná
 • ontologická

Použitá literatúra

Biščo,M., 2005. Ontológie v prostredí sémantického webu RDF - Schéma a jazyk OWL
Dostupné na: < http://www2.fiit.stuba.sk/~kapustik/ZS/Clanky0405/bisco/mbisco_ontologie.html#Sekcia3>


Csóka, P.,2010. Ontológie a OWL.Projekt.
Dostupné na: <http://www2.fiit.stuba.sk/~kapustik/ZS/Clanky0910/csoka/index.html. >


Dytrich, J. 2010. Sémantický web
Dostupné na: <http://www.fit.vutbr.cz/study/courses/VPD/public/0910VPD-Dytrych.pdf>


Frank,J., Dzubian, V., Homola, M. 2010. Sémantický web: Niektoré aktuálne výzvy.
Dostupné na: <http://ii.fmph.uniba.sk/~homola/papers/uikv2010.pdf >


Herman, I.. 2010.Tutorial on the Semantic Web
Dostupné na: http://www.w3.org/People/Ivan/CorePresentations/SWTutorial/Slides.pdf


Horňáková, Z. 2007. Sémantický web
Dostupné na: <http://www.matusmarcin.com/stuff/pisemediplomovku/citanie/DP_Semanticky_Web.pdf>


Husáková, M. 2006.  Představení jazyka OWL 
Dostupné na: http://lide.uhk.cz/fim/ucitel/fshusam2/lekarnicky/zt1/zt1_kap04.html


Nagy,A., 2009. Ontológie a sémantický web
Dostupné na: <http://www2.fiit.stuba.sk/~kapustik/ZS/Clanky0809/nagy/index.html>


Prachar,T., 2007. Logiky pro jazyk OWL a jejich možná neklasická rozšíření
Dostupné na: < http://is.muni.cz/th/39662/fi_b_a2/bp.pdf>


Smrž P., Pitner, T. 2004. Sémantický web a jeho technologie
Dostupné na: <http://www.ics.muni.cz/zpravodaj/articles/307.html. >


Valentová, T. 2011. Nové generácie webu (Bakalárska práca) UKF v Nitre


Veselý, R. 2008. Reprezentácia ontológií relačným modelom a realizácia dopytovania
Dostupné na: < http://www2.fiit.stuba.sk/~kapustik/ZS/Clanky0708/vesely/index.html>