Machine Bias

Γιατί να Εμπιστευτείτε την Techopedia

Τι είναι το Machine Bias?

Το Machine Bias είναι η τάση σε μοντέλα μηχανικής μάθησης να κάνουν ανακριβείς ή άδικες προβλέψεις επειδή υπάρχουν συστηματικά σφάλματα στο μοντέλο ML ή στα δεδομένα που χρησιμοποιούνται για την εκπαίδευση του μοντέλου.

Bias στη μηχανική μάθηση μπορεί να προκληθεί από διάφορους παράγοντες. Μερικές κοινές αιτίες περιλαμβάνουν:

  1. Περιορισμένα δεδομένα εκπαίδευσης.
  2. Η επιλογή ενός μοντέλου μηχανικής μάθησης που δεν είναι κατάλληλο για το πρόβλημα ή δεν έχει αρκετή δυνατότητα για να συλλάβει την πολυπλοκότητα των δεδομένων.
  3. Ανθρώπινες προκαταλήψεις που εισάγονται στις διαδικασίες συλλογής δεδομένων, στις διεργασίες μηχανικής κατηγοριοποίησης ή στα χαρακτηριστικά της μηχανικής επεξεργασίας.

Machine Bias είναι συχνά το αποτέλεσμα ενός επιστήμονα δεδομένων ή μηχανικού που υπερεκτιμά ή υποτιμά τη σημασία μιας συγκεκριμένης υπερ παραμέτρου κατά τη διάρκεια της μηχανικής χαρακτηριστικών και της διαδικασίας αλγοριθμικού συντονισμού. Μια υπερ παράμετρος είναι μια παράμετρος μηχανικής μάθησης της οποίας η τιμή επιλέγεται πριν εκπαιδευτεί ο αλγόριθμος εκμάθησης. Ο συντονισμός είναι η διαδικασία επιλογής των υπερ παραμέτρων που θα ελαχιστοποιήσουν τις συναρτήσεις απώλειας ενός αλγορίθμου εκμάθησης και θα παρέχουν τα πιο ακριβή αποτελέσματα.

Είναι σημαντικό να σημειωθεί ότι το Machine Bias μπορεί να χρησιμοποιηθεί για τη βελτίωση της ερμηνείας ενός μοντέλου ML σε ορισμένες περιπτώσεις. Για παράδειγμα, ένα απλό γραμμικό μοντέλο με υψηλή μεροληψία θα είναι ευκολότερο να κατανοηθεί και να εξηγηθεί από ένα σύνθετο μοντέλο με χαμηλή μεροληψία.

Ωστόσο, όταν ένα μοντέλο μηχανικής μάθησης πρόκειται να κάνει προβλέψεις και αποφάσεις, η μεροληψία μπορεί να κάνει τους αλγόριθμους μηχανικής μάθησης να παράγουν αποτελέσματα μη βέλτιστα που μπορεί να γίνουν επιβλαβή. Αυτό ισχύει ιδιαίτερα στην περίπτωση της πιστοληπτικής ικανότητας, των προσλήψεων, του δικαστικού συστήματος και της υγειονομικής περίθαλψης. Σε αυτές τις περιπτώσεις, η μεροληψία μπορεί να οδηγήσει σε άδικη ή μεροληπτική μεταχείριση ορισμένων ομάδων και να έχει σοβαρές συνέπειες στον πραγματικό κόσμο.

Η Techopedia Εξηγεί το Machine Bias

Η μεροληψία στη μηχανική μάθηση είναι ένα περίπλοκο θέμα επειδή είναι συχνά αλληλένδετη με άλλους παράγοντες όπως η ποιότητα των δεδομένων. Για να διασφαλιστεί ότι ένα μοντέλο ML παραμένει δίκαιο και αμερόληπτο, είναι σημαντικό να αξιολογείται συνεχώς η απόδοση του μοντέλου στην παραγωγή.

Οι αλγόριθμοι μηχανικής μάθησης χρησιμοποιούν αυτά που μαθαίνουν κατά τη διάρκεια της εκπαίδευσης για να κάνουν προβλέψεις σχετικά με τα νέα δεδομένα. Όταν σε ορισμένους τύπους πληροφοριών αποδίδεται λανθασμένα μεγαλύτερη – ή λιγότερη σημασία από αυτή που τους αξίζει – τα αποτελέσματα του αλγορίθμου μπορεί να είναι μεροληπτικά.

Για παράδειγμα, το λογισμικό μηχανικής εκμάθησης χρησιμοποιείται από δικαστικά συστήματα σε ορισμένα μέρη του κόσμου για να προτείνει πόσο καιρό θα πρέπει να φυλακιστεί ένας καταδικασμένος εγκληματίας. Μελέτες έχουν βρει ότι όταν τα δεδομένα σχετικά με τη φυλή, την εκπαίδευση και την οικογενειακή κατάσταση ενός εγκληματία λαμβάνονται υπόψη υπερβολικά, το αλγοριθμικό αποτέλεσμα είναι πιθανό να είναι μεροληπτικό και το λογισμικό θα προτείνει σημαντικά διαφορετικές ποινές για εγκληματίες που έχουν καταδικαστεί για το ίδιο έγκλημα.

Παραδείγματα Μεροληψίας

Machine bias μπορεί να εκδηλωθεί με διάφορους τρόπους, όπως:

  • Προγνωστική μεροληψία: το μοντέλο είναι πιο πιθανό να κάνει ειδικές προβλέψεις για συγκεκριμένες δημογραφικές ομάδες ατόμων.
  • Μεροληψία αντιπροσώπευσης: κατά τη διάρκεια της εκπαίδευσης, ορισμένα δημογραφικά δεδομένα υποεκπροσωπούνται ή αποκλείονται.
  • Μεροληψία μέτρησης: το μοντέλο εκπαιδεύεται χρησιμοποιώντας αναξιόπιστα, ημιτελή ή λοξά δεδομένα.
  • Αλγοριθμική μεροληψία: ο σχεδιασμός του μοντέλου ή ο αλγόριθμος που χρησιμοποιείται για την εκπαίδευσή του είναι εγγενώς προκατειλημμένος λόγω ανθρώπινου λάθους.

Ακολουθούν μερικά παραδείγματα ιστοριών στις ειδήσεις όπου άτομα ή εταιρείες έχουν πληγεί από την τεχνητή νοημοσύνη:

  1. Μια έρευνα του 2016 από την ProPublica διαπίστωσε ότι το COMPAS, ένα σύστημα τεχνητής νοημοσύνης που υιοθετήθηκε από την πολιτεία της Φλόριντα, είχε διπλάσιες πιθανότητες να επισημάνει μαύρους κατηγορούμενους σαν μελλοντικούς επαναδιωκόμενους σε σχέση με τους λευκούς κατηγορούμενους. Αυτό προκάλεσε ανησυχίες σχετικά με τη χρήση της τεχνητής νοημοσύνης από την αστυνομία και την ποινική δικαιοσύνη.
  2. Το 2018, αναφέρθηκε ότι η τεχνολογία αναγνώρισης προσώπου της Amazon, γνωστή ως Rekognition, είχε υψηλότερο ποσοστό ανακρίβειας για γυναίκες με πιο σκούρες αποχρώσεις δέρματος. Αυτό προκάλεσε ανησυχίες σχετικά με τη δυνατότητα χρήσης της τεχνολογίας με τρόπο που θα μπορούσε να βλάψει τις περιθωριοποιημένες κοινότητες.
  3. Το 2020, ένα chatbot που χρησιμοποιήθηκε από την Εθνική Υπηρεσία Υγείας του Ηνωμένου Βασιλείου (NHS) για τη διαλογή ασθενών κατά τη διάρκεια της πανδημίας COVID-19 ανακαλύφθηκε ότι παρείχε εσφαλμένες πληροφορίες και κατεύθυνε τους ανθρώπους να αναζητήσουν θεραπεία σε λάθος μέρη. Αυτό προκάλεσε ανησυχίες σχετικά με την ασφάλεια της χρήσης AI για τη λήψη ιατρικών αποφάσεων.
  4. Το 2021, μια έρευνα της The Markup διαπίστωσε ότι οι δανειστές είχαν 80% περισσότερες πιθανότητες να αρνηθούν στεγαστικά δάνεια σε έγχρωμους ανθρώπους σε σχέση με τους λευκούς με παρόμοια οικονομικά χαρακτηριστικά. Αυτό δημιούργησε ανησυχίες σχετικά με τον τρόπο με τον οποίο χρησιμοποιήθηκαν αλγόριθμοι τεχνητής νοημοσύνης μαύρου κουτιού στις εγκρίσεις στεγαστικών δανείων.
  5. Το 2022, το iTutorGroup, μια συλλογή επιχειρήσεων που παρέχει υπηρεσίες διδασκαλίας αγγλικής γλώσσας σε μαθητές στην Κίνα, βρέθηκε ότι έχει προγραμματίσει το διαδικτυακό λογισμικό πρόσληψης ώστε να απορρίπτει αυτόματα γυναίκες αιτούντες ηλικίας 55 ετών και άνω και άνδρες αιτούντες ηλικίας 60 ετών και άνω. Αυτό προκάλεσε ανησυχίες σχετικά με τις διακρίσεις λόγω ηλικίας και είχε ως αποτέλεσμα την υποβολή αγωγής από την Επιτροπή Ίσων Ευκαιριών Απασχόλησης των ΗΠΑ (EEOC).

Πώς να Αναγνωρίζετε το Machine Bias

Υπάρχουν διάφορες μέθοδοι που μπορούν να χρησιμοποιηθούν για τον εντοπισμό της μεροληψίας της μηχανής σε ένα μοντέλο μηχανικής μάθησης:

  1. Ανάλυση δεδομένων: Τα δεδομένα που χρησιμοποιούνται για την εκπαίδευση του μοντέλου αναλύονται για τον εντοπισμό πιθανών πηγών μεροληψίας, όπως μη ισορροπημένες κλάσεις ή δεδομένα που λείπουν.
  2. Μετρήσεις δικαιοσύνης: Οι μετρήσεις δικαιοσύνης, όπως η δημογραφική ισοτιμία ή οι ίσες ευκαιρίες, χρησιμοποιούνται για την αξιολόγηση των προβλέψεων του μοντέλου για διαφορετικές ομάδες ατόμων.
  3. Αντιπαραστατική ανάλυση: Η αντιπαραστατική ανάλυση χρησιμοποιείται για να αξιολογήσει πώς θα άλλαζαν οι προβλέψεις του μοντέλου εάν ορισμένα χαρακτηριστικά του ήταν διαφορετικά.
  4. Επιθεώρηση μοντέλου: Οι παράμετροι και τα όρια απόφασης του μοντέλου ελέγχονται για τον εντοπισμό μοτίβων που μπορεί να υποδηλώνουν μεροληψία.
  5. Αξιολόγηση απόδοσης: Η απόδοση του μοντέλου αξιολογείται χρησιμοποιώντας ένα ποικίλο σύνολο δεδομένων για τον εντοπισμό διαφορών στην απόδοση μεταξύ διαφορετικών ομάδων.
  6. Προσέγγιση Human in the loop: Οι ειδικοί στον άνθρωπο αξιολογούν τις προβλέψεις του μοντέλου και αναζητούν μεροληπτικά αποτελέσματα.

    Πώς να Αποτρέψετε Machine Bias

    Υπάρχουν πολλές τεχνικές που μπορούν να χρησιμοποιηθούν για την φροντίδα της ανταποκρινόμενης τεχνητής νοημοσύνης και την πρόληψη της μεροληψίας μηχανών σε μοντέλα μηχανικής μάθησης. Συνιστάται η χρήση πολλαπλών μεθόδων και ο συνδυασμός τους κάνοντας τα εξής:

    1. Διαφοροποίηση των δεδομένων εκπαίδευσης.
    2. Χρήση μεθόδων που ενισχύουν τη δικαιοσύνη, όπως δημογραφική ισοτιμία και ίσες ευκαιρίες.
    3. Χρήση αλγορίθμων διόρθωσης της μεροληψίας.
    4. Χρήση τεχνικών ρυθμίσεων όπως η ρύθμιση L1 και L2 για τη μείωση της πολυπλοκότητας του μοντέλου και την προώθηση της γενίκευσης.
    5. Τακτικός έλεγχος και ερμηνεία στις προβλέψεις του μοντέλου για τον εντοπισμό και την αντιμετώπιση της μεροληψίας.
    6. Ενσωμάτωση της ανθρώπινης αξιολόγησης και παρέμβασης στη διαδικασία πρόβλεψης του μοντέλου για να την εξασφάλιση αμερόληπτων αποφάσεων.

      Machine Bias εναντίον Διακύμανσης

      Η μεροληψία και η διακύμανση είναι δύο έννοιες που χρησιμοποιούνται για να περιγράψουν την απόδοση και την ακρίβεια ενός μοντέλου μηχανικής μάθησης. Ένα μοντέλο με χαμηλή μεροληψία και μικρή διακύμανση είναι πιθανό να έχει καλή απόδοση σε νέα δεδομένα, ενώ ένα μοντέλο με υψηλή μεροληψία και μεγάλη διακύμανση είναι πιθανό να έχει κακή απόδοση.

      • Τα σφάλματα μεροληψίας παρουσιάζονται με την προσέγγιση ενός πραγματικού προβλήματος με ένα μοντέλο ML που είναι πολύ απλό. Ένα μοντέλο υψηλής μεροληψίας συχνά υπολείπεται των δεδομένων επειδή το μοντέλο δεν είναι σε θέση να συλλάβει την πολυπλοκότητα του προβλήματος.
      • Η διακύμανση αναφέρεται στο σφάλμα που εισάγεται όταν ένα μοντέλο ML δίνει τόση προσοχή στα δεδομένα εκπαίδευσης που δεν μπορεί να κάνει ακριβείς γενικεύσεις σχετικά με νέα δεδομένα. Ένα μοντέλο υψηλής διακύμανσης συχνά υπερπροσαρμόζει τα δεδομένα.

      Στην πράξη, η εύρεση της βέλτιστης ισορροπίας μεταξύ μεροληψίας και διακύμανσης μπορεί να είναι δύσκολη. Τεχνικές όπως η ρύθμιση και η διασταυρωμένη επικύρωση μπορούν να χρησιμοποιηθούν για τη διαχείριση της μεροληψίας και της διακύμανσης του μοντέλου και για τη βελτίωση της απόδοσής του.

      Margaret Rouse
      Ειδικός Τεχνολογίας
      Margaret Rouse
      Ειδικός Τεχνολογίας

      Η Margaret είναι μια βραβευμένη συγγραφέας και εκπαιδευτικός, γνωστή για την ικανότητά της να εξηγεί σύνθετα τεχνικά θέματα σε μη γνώστες του θέματος με έμφαση στους επιχειρηματίες. Τα τελευταία είκοσι χρόνια, οι ορισμοί της στον τομέα της πληροφορικής δημοσιεύτηκαν από την Que σε μια εγκυκλοπαίδεια με όρους τεχνολογίας και αναφέρονται σε άρθρα στους New York Times, Time Magazine, USA Today, ZDNet, PC Magazine και Discovery Magazine. Εντάχθηκε στηνομάδα της Techopedia το 2011. Η Margaret απολαμβάνει να βοηθάει τους επαγγελματίες πληροφορικής και τις επιχειρήσεις να μάθουν να μιλούν ο ένας τις εξαιρετικά εξειδικευμένες γλώσσες του άλλου.

      thumbnail
      thumbnail
      thumbnail
      thumbnail
      thumbnail
      thumbnail
      thumbnail
      thumbnail