Het NEC Research Insititute heeft in 1999
onderzocht welk deel van het Web vindbaar is via zoekmachines.
De top elf van de zoekrobots bestrijken samen slechts 42 procent
van het Web. Weliswaar zijn zoekmethoden de afgelopen jaren
verbeterd, maar er zijn tevens meer websites bijgekomen. Per
saldo zal het percentage dus eerder afgenomen dan toegenomen
zijn.
In zoekmachines worden daarom steeds geavanceerdere
zoekmethodes geďmplementeerd. De immens populaire zoekmachine
Google maakt bijvoorbeeld gebruik van een zoekmethode waarbij
websites waarnaar veel verwezen wordt, automatisch als autoriteit
aangemerkt worden en daardoor hoger in de resultatenlijst
eindigen. De eerste generatie zoekrobots spoorden enkel webdocumenten
op en plaatsten vervolgens verwijzingen hiernaar in een database
(zie artikel Gevonden worden via zoekmachines, februari 2002).
De tweede generatie maakte reeds gebruik van metadata. Metasearchers
bieden de mogelijkheid om een zoekvraag te stellen zonder
elke zoekrobot afzonderlijk te moeten raadplegen. Een dergelijke
zoekmachine is in feite een intermediair. De zoekvraag wordt
immers doorgespeeld aan de zoekrobots. De vernieuwde zoekmachine
Zoeken.nl is in die zin een metasearcher.
Het belang van metadata wordt echter steeds
duidelijker. Meer en meer zoekmachines maken gebruik van metadata
en van nieuwe technieken, zoals clustering. Deze trend is
een voorbode voor de opvolger van het World Wide Web. De huidige
generatie van het Web wordt gekenmerkt door [...] menselijke
verwerking van informatie (Benschop, 2001). De opvolger van
de eerste generatie is echter meer gericht op de verwerking
van informatie door machines. In 1998 gaf de geestelijk vader
van het World Wide Web, Tim Berners-Lee, reeds aan dat in
zijn visie het semantische web talen moet ontwikkelen waarmee
informatie uitgedrukt kan worden in een voor machines begrijpelijke
taal.
Deze uitwisselbaarheid van informatie biedt
een groot aantal voordelen. De huidige webtaal HTML, is slechts
in staat informatie weer te geven. Het is niet mogelijk metadata
toe te voegen aan informatie. Wel kan metadata toegevoegd
worden aan een pagina als geheel. Het toevoegen van metadata
aan informatie zorgt er echter juist voor dat machines deze
informatie kunnen begrijpen. Een voorbeeld kan dit verduidelijken.
Als in een zoekmachine het woord 'jaguar' ingevoerd wordt,
weet de browser niet of het nu gaat om het exclusieve automerk
Jaguar of om het roofdier. Hetzelfde geldt voor het woord
'windows'. Gaat het nu over het product van Microsoft of over
de Engelse vertaling van het woord venster? Door metadata
te koppelen aan de zoektermen, kan de zoekmachine vaststellen
wat bedoeld wordt en in het vervolg meer relevante informatie
leveren.
Het semantisch web draait met andere woorden
volledig om betekenis. Om het zoeken in de toekomst te vergemakkelijken,
werken wetenschappers momenteel aan ontologieën. Een ontologie
is een klassificatie van begrippen die met elkaar te maken
hebben en geeft tevens aan welke relaties bestaan tussen deze
begrippen. Toekomstige zoekmachines kunnen hierdoor pagina's
vinden met syntactisch verschillende, maar semantisch gelijksoortige
woorden (Benschop, 2001). Quote Media heeft met de lancering
van de vernieuwde zoekmachine Zoeken.nl "een volgende stap
gezet voor zoeken op het internet", aldus Jan-Willem Tusveld,
productmanager van Zoeken.nl. De verwachting is dan ook dat
binnen nu en tien jaar de introductie van het semantische
web een feit is.
Door:
De auteur heeft Communicatie- en Informatiewetenschappen gestudeerd aan de Universiteit van Tilburg. Hiervoor heeft hij Communicatie gestudeerd aan Fontys Hogescholen Tilburg. Robert was voorheen werkzaam bij de Universiteit van Tilburg, leerstoelgroep Economische Psychologie. Zijn specialisatie is nieuwe media.Kijk voor meer informatie op zijn site.
Bronnen: Benschop, A. (2001) De
toekomst van het Semantisch Web | Berners-Lee, T. (1998).
Semantic
Web Road map - Quote lanceert Zoeken.nl in [Communicatienieuws
18 mei 2004] | Berners-Lee, T., Hendler, J. & Lassila, O.
(2001). The Semantic Web. [Scientific American, May issue]
| Benschop, A. (2001) De
toekomst van het zoeken - Quote Media met Zoeken.nl in
[Adformatie 17 mei 2004] - Semantisch web zit onder de motorkap
in [Computable 19 maart 2004]