To blog της Ζαχαρούλας Πετράκη

Πληροφορική – Ρομποτική – Αλιβέρι

Αναζήτηση πληροφοριών στο διαδίκτυο…….

Νοέ 201827

Μηχανή αναζήτησης

Μια μηχανή αναζήτησης είναι μια εφαρμογή που επιτρέπει την αναζήτηση κειμένων και αρχείων στο Διαδίκτυο. Αποτελείται από ένα πρόγραμμα υπολογιστή που βρίσκεται σε έναν ή περισσότερους υπολογιστές στους οποίους δημιουργεί μια βάση δεδομένων με τις πληροφορίες που συλλέγει από το διαδίκτυο, και το διαδραστικό περιβάλλον που εμφανίζεται στον τελικό χρήστη ο οποίος χρησιμοποιεί την εφαρμογή από άλλον υπολογιστή συνδεδεμένο στο διαδίκτυο.

Όλες οι μηχανές αναζήτησης παρόλο τη διαφορετικότητα τους έχουν κάποιες κοινές λειτουργίες.

  1. Οι μηχανές αναζήτησης δεν ερευνούν σε πραγματικό χρόνο τον παγκόσμιο ιστό αλλά μία βάση δεδομένων που περιέχει κάποια αντίγραφα ιστοσελίδων. Οι ιστοσελίδες αυτές επιλέγονται ανάμεσα σε δισεκατομμύρια σελίδες στο ίντερνετ. Για την έρευνα αυτή χρησιμοποιούνται κάποια προγράμματα που ονομάζονται «ρομπότ» ή «αράχνες» (spider, crawler ή webcrawler). Τα προγράμματα αυτά «σερφάρουν» στο Διαδίκτυο σε διάφορες ιστοσελίδες με σκοπό τη συλλογή πληροφοριών με βάση κάποια κριτήρια. Η λειτουργία αυτή πρέπει να γίνεται συνεχώς διότι οι ιστοσελίδες αλλάζουν και η βάση της μηχανής θα πρέπει να ανανεώνονται με νέες πληροφορίες. Μια μηχανή αναζήτησης μπορεί να διαθέτει περισσότερα από ένα «ρομπότ».
  2. Αφού τα «ρομπότ» βρουν τις ιστοσελίδες τις περνούν σε ένα άλλο πρόγραμμα για τοποθέτηση δεικτών. Με το πρόγραμμα αυτό αναγνωρίζεται το κείμενο, οι σύνδεσμοι, και το υπόλοιπο περιεχόμενο της ιστοσελίδας και αποθηκεύεται στα αρχεία της βάσης δεδομένων. Αφού γίνει αυτή η αποθήκευση θα μπορεί να πραγματοποιηθεί αναζήτηση πάνω στη βάση της μηχανής αναζήτησης.
  3. Μία ακόμα λειτουργία των μηχανών αναζήτησης είναι ότι επιτρέπουν στους χρήστες να «ψάχνουν» στη βάση δεδομένων τους μέσα από περιβάλλον που παρέχει πολλαπλές δυνατότητες αναζήτησης. Η λειτουργία αυτή έχει σχέση με αυτό που αντιμετωπίζουν οι χρήστες μέσα από το περιβάλλον της μηχανής αναζήτησης.

Σύμφωνα με την παραπάνω περιγραφή, οι μηχανές αναζήτησης αποτελούνται από τρία μέρη:

  1. Τον spider: Ένα πρόγραμμα το οποίο διατρέχει όλο το web και βρίσκει και διαβάζει όλες τις ιστοσελίδες.
  2. Το ευρετήριο: Είναι μία βάση δεδομένων η οποία περιλαμβάνει αντίγραφα των σελίδων που επισκέφτηκε ο spider.
  3. Τον μηχανισμό αναζήτησης: Ένα λογισμικό που επιτρέπει στους χρήστες να κάνουν έρευνα στο ευρετήριο.

Ο Παγκόσμιος Ιστός-Φύλλο εργασίας 3

Αφήστε μια απάντηση

Καλωσήρθατε στο blog μου.

Περιηγηθείτε στα άρθρα, τις σελίδες και τα μενού μου.

Βρείτε πληροφορίες για θέματα που αφορούν την πληροφορική, τη ρομποτική και το Αλιβέρι.

 

Σαν σήμερα

20/4/1941: Ο στρατηγός Τσολάκογλου υπογράφει το πρωτόκολλο συνθηκολόγησης του ελληνικού στρατού με τις γερμανικές δυνάμεις εισβολής.



Άνοιγμα μενού
Αλλαγή μεγέθους γραμματοσειράς
Αντίθεση
Μετάβαση σε γραμμή εργαλείων